Buscar

Introdução à Econometria

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 249 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 249 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 249 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

2018
EconomEtria i
Prof. Vanderlei Kleinschmidt
Copyright © UNIASSELVI 2018
Elaboração:
Prof. Vanderlei Kleinschmidt
Revisão, Diagramação e Produção:
Centro Universitário Leonardo da Vinci – UNIASSELVI
Ficha catalográfica elaborada na fonte pela Biblioteca Dante Alighieri 
UNIASSELVI – Indaial.
Impresso por:
K64e
 Kleinschmidt, Vanderlei 
 Econometria I. / Vanderlei Kleinschmidt. – Indaial: UNIASSELVI, 2018.
 249 p.; il.
 ISBN 978-85-515-0223-5
 1.Econometria. – Brasil. II. Centro Universitário Leonardo Da Vinci.
CDD 330.015195
III
aprEsEntação
Prezado acadêmico! A Ciência Econômica existe há muitos séculos, 
porém nos últimos 100 anos, ela ganhou um impulso enorme com a 
formalização da Econometria como braço direito dos economistas. Esse é o 
elo que nos auxilia na tarefa de testar as teorias econômicas e que torna a 
economia uma verdadeira ciência. Estudar Econometria é um desafio, por 
isso tomamos muito cuidado ao elaborar o seu material.
As unidades foram estruturadas e preparadas de forma a lhe oferecer 
um conteúdo moderno, atualizado, em linha com o que as principais 
universidades do país utilizam. Ao longo dos seus estudos, você perceberá 
que a Econometria é um conhecimento cumulativo, no sentido de que tudo 
o que você aprender, desde as primeiras páginas, continuará usando até a 
última página desse livro. E não só do livro de Econometria I, durante os 
seus estudos de Econometria II você utilizará recorrentemente os conceitos e 
as habilidades que irá desenvolver a partir de agora.
Na Unidade 1, você terá uma visão geral da Econometria. Verá como 
ela surgiu, entenderá um pouco da sua importância e aprenderá os primeiros 
conceitos. Nessa fase, talvez, você sinta um pouco a necessidade de revisar aquilo 
que você sabe de estatística e matemática. Se isso acontecer, recomendamos 
que o faça, mas não de forma aprofundada, reveja apenas os conceitos que 
tiver maior dificuldade, porque ao longo dessa unidade esses conceitos são 
explicados à luz do processo econométrico. Ao final dessa unidade, você já 
estará estimando os seus primeiros modelos de regressão simples, com apenas 
duas variáveis, e fazendo as primeiras análises de resultados.
A ideia de conhecimento cumulativo ficará bem clara ao iniciar os 
estudos da Unidade 2. Nela você retomará os modelos desenvolvidos na 
Unidade 1, porém ampliando-os com a adição de múltiplas variáveis, e com 
isso terá que recorrer a novas técnicas para estimar os seus modelos. Estamos 
falando da álgebra matricial, que alguns autores relutam em apresentar em 
seus materiais, porém, como poderá constatar, o uso de matrizes torna o 
estudo e a aplicação da Econometria mais intuitiva. Essa unidade é finalizada 
com uma das ferramentas mais importantes que os econometristas usam, 
trata-se das variáveis binárias. Com elas é possível dessazonalizar séries de 
dados, calcular médias, medir quebras estruturais, estimar diferenças entre 
categorias, enfim, adicionar o elemento qualitativo aos modelos quantitativos.
Finalizamos o livro com a Unidade 3, que aborda os três grandes 
problemas que enfrentamos ao estimar os modelos econométricos. Nesse 
caso, o objetivo é apresentar a você, acadêmico, os conceitos relacionados a 
cada um desses problemas, explicando a sua fonte, as consequências, como 
IV
diagnosticar e como superar cada um deles. Você compreenderá que, apesar 
de usarmos um software para fazer a parte pesada e tornar mais simples 
o nosso trabalho, estimar um modelo de regressão requer mais do que 
alguns simples cliques com o mouse. Nós precisamos estar atentos a certos 
problemas, como a heteroscedasticidade e a autocorrelação, que podem jogar 
por terra todo o tempo que empregamos na nossa pesquisa.
O segredo do sucesso de estudar e aprender Econometria reside na 
prática. Não adianta de nada você apenas ler o material desenvolvido e 
assistir aos vídeos. Se não praticar, todo esse tempo dedicado aos estudos terá 
sido em vão. Recomendamos que você utilize os dados disponibilizados no 
material e tente reproduzir os resultados que obtivemos. Isso é extremamente 
importante, porque é impossível aprender Econometria sem praticar!
Guarde bem esse material para consultas futuras, utilize a técnica e as 
habilidades que você irá desenvolver ao longo dos seus estudos, e tente aplicá-
las no seu trabalho e nos estudos das outras disciplinas do curso de Ciências 
Econômicas. Dedique-se aos estudos dessa fantástica área do conhecimento 
econômico e colherá os melhores resultados na sua carreira. 
Bons estudos!
Prof. Vanderlei Kleinschmidt
V
Você já me conhece das outras disciplinas? Não? É calouro? Enfim, tanto 
para você que está chegando agora à UNIASSELVI quanto para você que já é veterano, há 
novidades em nosso material.
Na Educação a Distância, o livro impresso, entregue a todos os acadêmicos desde 2005, é 
o material base da disciplina. A partir de 2017, nossos livros estão de visual novo, com um 
formato mais prático, que cabe na bolsa e facilita a leitura. 
O conteúdo continua na íntegra, mas a estrutura interna foi aperfeiçoada com nova 
diagramação no texto, aproveitando ao máximo o espaço da página, o que também 
contribui para diminuir a extração de árvores para produção de folhas de papel, por exemplo.
Assim, a UNIASSELVI, preocupando-se com o impacto de nossas ações sobre o ambiente, 
apresenta também este livro no formato digital. Assim, você, acadêmico, tem a possibilidade 
de estudá-lo com versatilidade nas telas do celular, tablet ou computador. 
 
Eu mesmo, UNI, ganhei um novo layout, você me verá frequentemente e surgirei para 
apresentar dicas de vídeos e outras fontes de conhecimento que complementam o assunto 
em questão. 
Todos esses ajustes foram pensados a partir de relatos que recebemos nas pesquisas 
institucionais sobre os materiais impressos, para que você, nossa maior prioridade, possa 
continuar seus estudos com um material de qualidade.
Aproveito o momento para convidá-lo para um bate-papo sobre o Exame Nacional de 
Desempenho de Estudantes – ENADE. 
 
Bons estudos!
NOTA
VI
VII
UNIDADE 1 – OS FUNDAMENTOS DA ANÁLISE DE REGRESSÃO ....................................... 1
TÓPICO 1 – INTRODUÇÃO AO ESTUDO ECONOMÉTRICO .................................................. 3
1 INTRODUÇÃO .................................................................................................................................... 3
2 O QUE É ECONOMETRIA? .............................................................................................................. 3
3 O MÉTODO ECONOMÉTRICO ...................................................................................................... 7
LEITURA COMPLEMENTAR .............................................................................................................. 11
RESUMO DO TÓPICO 1 ....................................................................................................................... 13
AUTOATIVIDADE ................................................................................................................................. 14
TÓPICO 2 – MODELO DE REGRESSÃO LINEAR GERAL .......................................................... 15
1 INTRODUÇÃO .................................................................................................................................... 15
2 A MODELAGEM ECONÔMICA E A ORIGEM DOS DADOS ECONOMÉTRICOS .......... 15
3 ANÁLISE DE REGRESSÃO .............................................................................................................. 19
4 O MODELO DE REGRESSÃO LINEAR SIMPLES ...................................................................... 23
5 AS HIPÓTESES DO MODELO DE REGRESSÃO LINEAR .......................................................24
RESUMO DO TÓPICO 2........................................................................................................................ 29
AUTOATIVIDADE ................................................................................................................................. 30
TÓPICO 3 – MÉTODO DOS MÍNIMOS QUADRADOS ORDINÁRIOS ................................. 31
1 INTRODUÇÃO .................................................................................................................................... 31
2 A FUNÇÃO DE REGRESSÃO AMOSTRAL E SUAS CARACTERÍSTICAS .......................... 32
3 ESTIMATIVA DOS PARÂMETROS POR MÍNIMOS QUADRADOS ORDINÁRIOS ....... 33
4 PROPRIEDADES NUMÉRICAS DOS ESTIMADORES ............................................................. 37
5 TESTES ESTATÍSTICOS .................................................................................................................... 38
6 O USO DO GRETL PARA ESTIMAÇÃO E ANÁLISE ECONOMÉTRICA:
 A ANÁLISE DOS RESULTADOS E SUA INTERPRETAÇÃO ................................................... 59
7 OUTROS TÓPICOS RELACIONADOS AO MÉTODO DE MQO ........................................... 73
RESUMO DO TÓPICO 3 ....................................................................................................................... 79
AUTOATIVIDADE ................................................................................................................................ 80
UNIDADE 2 – REGRESSÃO MÚLTIPLA .......................................................................................... 83
TÓPICO 1 – O MODELO DE REGRESSÃO LINEAR EM FORMA MATRICIAL .................... 85
1 INTRODUÇÃO .................................................................................................................................... 85
2 O MODELO DE REGRESSÃO LINEAR GERAL EM FORMA MATRICIAL ......................... 87
3 HIPÓTESES DO MODELO ............................................................................................................... 89
RESUMO DO TÓPICO 1 ....................................................................................................................... 94
AUTOATIVIDADE ................................................................................................................................ 95
TÓPICO 2 – ESTIMAÇÃO E INFERÊNCIA ESTATÍSTICA DOS MODELOS 
DE REGRESSÃO MÚLTIPLOS .........................................................................................................101
1 INTRODUÇÃO ..................................................................................................................................101
2 ESTIMADORES DE MQO ...............................................................................................................102
sumário
VIII
3 ESTIMANDO O MODELO DE REGRESSÃO MÚLTIPLO .....................................................109
4 TESTES ADICIONAIS APLICADOS AOS RESULTADOS DOS
 MODELOS DE REGRESSÃO .........................................................................................................117
RESUMO DO TÓPICO 2 .....................................................................................................................129
AUTOATIVIDADE ..............................................................................................................................130
TÓPICO 3 – USANDO VARIÁVEIS EXPLICATIVAS QUALITATIVAS ..................................133
1 INTRODUÇÃO ..................................................................................................................................133
2 ESTIMANDO UM MODELO DE REGRESSÃO COM VARIÁVEIS QUALITATIVAS .....134
3 OUTRAS APLICAÇÕES COM VARIÁVEIS QUALITATIVAS ...............................................138
LEITURA COMPLEMENTAR ............................................................................................................154
RESUMO DO TÓPICO 3 .....................................................................................................................157
AUTOATIVIDADE ..............................................................................................................................158
UNIDADE 3 – MODELOS DE REGRESSÃO GENERALIZADOS ............................................163
TÓPICO 1 – MULTICOLINEARIDADE ..........................................................................................165
1 INTRODUÇÃO ..................................................................................................................................165
2 CONCEITO DE MULTICOLINEARIDADE ................................................................................166
3 DETECÇÃO DA MULTICOLINEARIDADE ...............................................................................169
4 O QUE FAZER NA PRESENÇA DE MULTICOLINEARIDADE? ...........................................177
LEITURA COMPLEMENTAR ............................................................................................................184
RESUMO DO TÓPICO 1 .....................................................................................................................186
AUTOATIVIDADE ..............................................................................................................................187
TÓPICO 2 – HETEROSCEDASTICIDADE .....................................................................................189
1 INTRODUÇÃO ..................................................................................................................................189
2 A NATUREZA DA HETEROSCEDASTICIDADE ......................................................................190
3 DETECTANDO O PROBLEMA DA HETEROSCEDASTICIDADE .......................................192
4 RESOLVENDO O PROBLEMA DA HETEROSCEDASTICIDADE – O MÉTODO
 DOS MÍNIMOS QUADRADOS GENERALIZADOS ...............................................................201
RESUMO DO TÓPICO 2 .....................................................................................................................211
AUTOATIVIDADE ..............................................................................................................................212
TÓPICO 3 – AUTOCORRELAÇÃO ..................................................................................................213
1 INTRODUÇÃO ..................................................................................................................................213
2 A NATUREZA DA CORRELAÇÃO SERIAL ...............................................................................214
3 DETECTANDO O PROBLEMA DA CORRELAÇÃO SERIAL ................................................217
4 RESOLVENDO O PROBLEMA DA CORRELAÇÃO SERIAL – MÉTODO
 DOS MÍNIMOS QUADRADOS GENERALIZADOS ...............................................................230
RESUMO DO TÓPICO 3 .....................................................................................................................235
AUTOATIVIDADE ..............................................................................................................................236
REFERÊNCIAS ......................................................................................................................................239
1
UNIDADE 1
OS FUNDAMENTOS DA ANÁLISE DE 
REGRESSÃO
OBJETIVOS DE APRENDIZAGEM
PLANO DE ESTUDOS
A partir do estudo desta unidade, você será capaz de:
• definir o conceito e os objetivos da econometria, identificando os passos que 
envolvem o processo de pesquisa e as ferramentas utilizadas para este fim;
• explicar os conceitos básicos da econometria, tais como regressão, variável 
dependente e explanatória, os tipos de dados e suas fontes;
• aplicar o conhecimento desenvolvido para construir um modelo econo-
métrico simples;
• estimaro modelo construído utilizando dados econômicos, analisar os re-
sultados obtidos e com base nas inferências estatísticas, validar ou refutar 
as hipóteses propostas inicialmente.
Esta unidade está dividida em três tópicos. No decorrer da unidade você 
encontrará autoatividades com o objetivo de reforçar o conteúdo apresentado.
TÓPICO 1 – INTRODUÇÃO AO ESTUDO ECONOMÉTRICO
TÓPICO 2 – MODELO DE REGRESSÃO LINEAR GERAL
TÓPICO 3 – MÉTODO DOS MÍNIMOS QUADRADOS ORDINÁRIOS
2
3
TÓPICO 1
UNIDADE 1
INTRODUÇÃO AO ESTUDO ECONOMÉTRICO
1 INTRODUÇÃO
Prezado acadêmico, seja bem-vindo ao maravilhoso mundo da 
econometria. Esperamos que você esteja pronto para a nossa jornada, mas, se 
não tiver certeza disso, não se preocupe, juntos construiremos os fundamentos 
necessários para que você possa usar essa importante ferramenta na sua vida 
acadêmica e profissional.
Até agora você aprendeu os principais conceitos econômicos, estudou os seus 
fundamentos matemáticos e estatísticos, viu a separação dos aspectos microeconômicos 
dos macroeconômicos e foi apresentado a diversas teorias e modelos.
A partir de agora, estudando econometria, você terá a oportunidade de 
colocar em prática e testar a maior parte das teorias aprendidas e as que aprenderá 
até o final do seu curso. Além disso, poderá incorporar aos seus trabalhos acadêmicos 
todas as ferramentas aprendidas neste livro de estudos. Para isso, veremos, de 
forma gradual e seguindo uma sequência lógica e organizada, um conjunto de 
técnicas que, além de modernas, refletem o que as grandes universidades ao redor 
do mundo estão ensinando aos seus graduandos em economia.
A disciplina de econometria, apesar de não ser exclusividade dos cursos 
de ciências econômicas, é, sem sombra de dúvidas, o nosso grande diferencial 
como economistas. Por esse motivo, dominar a técnica econométrica poderá ser o 
seu diferencial nesse mercado cada vez mais competitivo.
Para ajudá-lo nessa empreitada, o primeiro tópico desse livro buscará 
entender o significado de econometria, um pouco da sua história, como ela se insere 
dentro da economia como ciência e como torná-la uma aliada para os seus estudos.
2 O QUE É ECONOMETRIA?
Se tivéssemos que traduzir a palavra econometria de forma literal, diríamos 
que é uma medida econômica ou mensuração econômica, mas a tradução literal 
é muito fria e em nada reflete a dinâmica dessa disciplina. Na prática, pouco 
adianta saber a etimologia da palavra se você não entender o que ela significa de 
fato e não puder compreender a sua importância.
4
UNIDADE 1 | OS FUNDAMENTOS DA ANÁLISE DE REGRESSÃO
4
( )dQ f P=
Para saber o real significado da econometria é necessário recordarmos o 
que aprendemos até agora sobre a economia e uma das coisas mais importantes, 
na própria definição de economia, é entender que ela é uma ciência social.
Por seu aspecto científico, a economia “[...] mais do que outras disciplinas 
– exige uma combinação de aptidões verbais e quantitativas” (TAYLOR, 2007, 
p. 69). Embora alguns pensem o contrário, a economia não é exclusivamente 
para quem gosta de cálculo, nem tampouco está voltada apenas para entender o 
funcionamento do mercado financeiro.
Conseguir explicar a dinâmica das relações econômicas faz do economista 
um profissional diferenciado. Nesse quesito, muito mais do que conseguir efetuar 
um cálculo, é necessário ter a capacidade de síntese no sentido de poder interpretar 
os resultados obtidos. É aí que entra a parte não quantitativa da economia, aquela 
que descrevemos com o uso de palavras.
Devemos ter em mente que o homem, nas suas relações interpessoais, 
tem certas necessidades as quais busca satisfazer. Esse agente econômico, que 
pode ser uma pessoa, o governo ou uma empresa, dispõe de certa quantidade de 
recursos para atender as suas escolhas.
Ocorre que esses recursos nem sempre são suficientes. As necessidades, na 
maioria das vezes são ilimitadas, e aquilo que você quer, as suas escolhas, envolvem 
determinados custos. Assim, como bem sintetiza Krugman e Wells (2007, p. 5), “as 
escolhas individuais estão no cerne da economia”. Ou ainda, como nos ensina Marshall 
(1996, p. 77), “Economia Política ou Economia é um estudo da Humanidade nas 
atividades correntes da vida; examina a ação individual e social em seus aspectos mais 
estreitamente ligados à obtenção e ao uso dos elementos materiais do bem-estar”.
Isso nos traz grandes desafios. Como medimos essas relações? Como 
sabemos em que grau as trocas ocorrem? As escolhas, feitas por um indivíduo, 
afetam a decisão de outros? Caso a resposta seja positiva, em que medida? De que 
maneira podemos descrever essas relações e mensurá-las?
Uma importante ferramenta de análise é a economia matemática. Com 
ela podemos formular melhor a economia, ou seja, traduzir aquelas palavras que 
usamos para descrever certas relações através de equações. Por exemplo, sabemos 
que a demanda de um determinado bem, de maneira bem simplificada, pode ser 
expressa em função do seu preço, como:
5
TÓPICO 1 | INTRODUÇÃO AO ESTUDO ECONOMÉTRICO
5
Em que:
Qd é a quantidade demandada (unidades, quilos, metros etc.), e
P é o preço desse bem.
Nessa relação, esperamos que se o preço for muito alto, as pessoas 
demandem menos unidades do que quando o preço for menor. Exceções a esta 
regra podem ser vistas na microeconomia, mas, como um bom estudante de 
economia, deixaremos para você verificar!
A equação anterior não nos conta a história toda. Para avançarmos em nossa 
análise, precisaremos coletar informações na quantidade e qualidade suficientes, 
e assim teremos condições de averiguar se o comportamento descrito condiz com 
a realidade prática. Na ciência econômica, nós usamos técnicas estatísticas para 
resolver esses problemas econômicos, formulados pela matemática, de forma 
empírica (HOFFMANN, 2002, p. 2). 
E quanto à econometria? Onde ela se encaixa nessa história toda? Se você 
juntar a teoria econômica com a economia matemática e a estatística econômica, 
você terá aquilo que chamamos de econometria. Ela nada mais é do que a junção, 
ou a soma, ou ainda, como diz Gujarati e Porter (2011, p. 26), “[...] econometria é 
um amálgama de teoria econômica, economia matemática, estatística econômica 
e estatística matemática”.
A palavra econometria foi utilizada pela primeira vez em 1933, quando 
saiu a edição de número um da revista Econométrica. Sua definição formal está 
no documento de constituição da Econometric Society, que em uma tradução livre 
diz que é uma sociedade internacional para o avanço da teoria econômica e sua 
relação com a estatística e a matemática (ROOS, 1933, p. 106). 
Desde o seu início, a econometria vem evoluindo dia após dia. Atualmente 
não podemos entender essa disciplina ou ramo da ciência econômica apenas 
analisando os seus aspectos matemáticos. Da mesma forma, apesar de toda 
a sua força e utilidade, a estatística é uma ferramenta empregada no processo 
econométrico, mas não se pode confundi-las como sendo a mesma coisa. Além 
disso, aquilo que entendemos como teoria econômica é ponto de partida para a 
econometria, dando sentido a sua análise, mas não é a econometria em si.
Fica claro que a junção dessas três áreas críticas torna a econometria 
uma ferramenta poderosa para os economistas desenvolverem o seu trabalho 
com qualidade e assertividade. Porém, há um elemento-chave no processo 
econométrico que não pode ser desprezado, a tecnologia, que vem dando um 
impulso sem precedentes ao desenvolvimento tanto da econometria teórica 
quanto da econometria aplicada.
6
UNIDADE 1 | OS FUNDAMENTOS DA ANÁLISE DE REGRESSÃO
6
Você consegue imaginar os economistas, nos anos 1930, fazendo análises 
estatísticas, coletando dados, tabulando e extraindo conclusões, sem um 
microcomputador? Nós que estamos acostumados ao uso dos meios eletrônicostemos dificuldade para imaginar um mundo assim. Pense em um matemático 
calculando derivadas, usando logaritmos, ou obtendo ângulos de figuras 
geométricas com o uso de tabelas específicas criadas para esse fim!
Apesar de ser possível fazer tudo isso, temos que compreender que a 
tecnologia tem um papel central em todas as áreas de estudo e pesquisa, e na 
econometria ela é indissociável. Como veremos adiante, temos programas de 
computador tradicionais, como o SAS ou o Eviews, que têm um custo significativo, 
porém, para quem os usa no campo da pesquisa, o seu retorno compensa o 
investimento. Por outro lado, graças ao GNU e ao Free Software Foundation, temos 
hoje uma série de opções que, além de serem gratuitas, são poderosas ferramentas 
e acessíveis a todos, inclusive a nós, que usaremos muita técnica e tecnologia ao 
longo deste curso.
Toda pesquisa começa por um problema, algo que intriga o pesquisador, 
que precisa de uma resposta. Assim, o objetivo principal da econometria é auxiliar 
o economista a responder aos seus problemas de pesquisa. Em uma investigação 
sobre um determinado evento ou fenômeno, nos deparamos com uma série de 
questões, que muitas vezes começam com a palavra “quanto?”. 
Esses problemas de pesquisa, ou essas questões que precisam ser 
resolvidas, encontram abrigo nas chamadas hipóteses ou pressupostos, que nada 
mais são que respostas prévias às perguntas formuladas anteriormente, as quais 
precisam ser medidas e testadas. Precisamos nos assegurar de que aquilo que 
entendemos como verdadeiro realmente é verdadeiro. Não basta afirmar, tem 
que comprovar!
São exemplos de perguntas, ou problemas, com que nos deparamos em 
nossas pesquisas e para as quais a econometria é nossa grande aliada:
I- Quanto irá variar o consumo se houver um aumento real no salário mínimo?
II- Quantos carros serão vendidos se o IPI for reduzido a zero?
III- Quanto uma mudança em uma determinada variável afeta a outra?
IV- Haverá alguma variação no PIB caso o COPOM decida reduzir a meta da 
SELIC?
V- Qual deve ser o nível de inadimplência caso o país passe por um período de 
recessão?
VI- É possível determinar se houve discricionariedade na condução da política 
monetária por parte do Banco Central entre dois governos distintos?
A resposta a essas e muitas outras questões que surgem durante um 
trabalho de pesquisa é obtida através do emprego de certas técnicas, dentre as 
quais, no caso da ciência econômica, a econometria é, sem sombra de dúvidas, a 
peça-chave.
7
TÓPICO 1 | INTRODUÇÃO AO ESTUDO ECONOMÉTRICO
7
A seguir, veremos os passos que envolvem o processo econométrico 
através de um exemplo clássico, a teoria keynesiana do consumo. Veremos que 
existe uma sequência lógica que precisa ser respeitada para se obter resultados que 
sejam coerentes com a realidade. Ao longo de todo este livro desenvolveremos e 
refinaremos as técnicas apresentadas nesta primeira unidade, e com o tempo nos 
prepararemos para aprender modelos ainda mais robustos e cujas aplicações estão 
em linha com o que se vem empregando no mundo acadêmico e dos negócios.
3 O MÉTODO ECONOMÉTRICO
Grande parte dos livros de econometria descreve o método econométrico 
com um exemplo prático. Não faremos diferente, até mesmo porque é preciso 
que você já comece a se familiarizar com o método e a visualizar as opções para 
aplicar essas poderosas ferramentas na sua vida acadêmica e profissional. O 
exemplo clássico que usaremos é a função consumo keynesiana, que nos dá algo 
a ser investigado ou medido, a propensão marginal a consumir. 
Utilizando a sequência proposta por Gujarati e Porter (2011), Greene 
(2012) e Wooldridge (2016), vamos ver o que Keynes (1996, p. 118) falou sobre a 
relação consumo versus renda:
A lei psicológica fundamental em que podemos basear-nos com inteira 
confiança, tanto a priori, partindo do nosso conhecimento da natureza 
humana, como a partir dos detalhes dos ensinamentos da experiência, 
consiste em que os homens estão dispostos, de modo geral e em média, 
a aumentar o seu consumo à medida que a sua renda cresce, embora 
não em quantia igual ao aumento de sua renda.
Toda pesquisa começa com algo que desperte a atenção do pesquisador e 
que lhe suscite perguntas. Por exemplo, no excerto da obra de Keynes citada, seria 
interessante considerar a possibilidade de se medir essa proporção do aumento 
na renda repassada ao consumo das famílias. O nosso problema de pesquisa 
já está bem claro e delineado, mas essa é apenas a primeira parte do processo 
econométrico e ainda está na fase da teoria econômica. 
Agora usaremos a matemática e a estatística como auxiliares no 
desenvolvimento da nossa pesquisa, e depois, quando tudo estiver bem claro, a 
tecnologia será o nosso “workhorse”, ou numa tradução livre, nosso “cavalo de 
batalha” nessa grande empreitada, e que nos conduzirá, de alguma forma, à vitória.
Usando a matemática para refinar nossa intuição, devemos nomear as 
variáveis e estabelecer as relações em uma forma funcional que seja capaz de 
resumir a hipótese a ser testada. O formato dessa função matemática pode 
ter como fonte a própria teoria subjacente, porém, no nosso caso específico, a 
exposição de Keynes não nos dá uma pista sobre qual seria a relação funcional 
existente entre consumo e renda. 
8
UNIDADE 1 | OS FUNDAMENTOS DA ANÁLISE DE REGRESSÃO
8
Por simplificação, podemos supor que exista uma relação linear. Como 
veremos mais adiante, a linearidade é essencial para as análises que serão 
propostas e torna o nosso trabalho mais fácil. Por enquanto, vamos propor que a 
relação tenha a seguinte forma:
A equação acima parece perfeita para aquilo que estamos propondo, 
porém teremos que testá-la na prática para ver se realmente serve para o nosso 
trabalho. Podemos supor que a propensão marginal a consumir, ou seja, quanto 
varia o consumo dada uma variação na renda, seja menor do que um. Leia 
novamente o excerto de Keynes e você verá isso bem claro. 
Se for verdade que apenas parte do aumento na renda é transferida para 
o consumo, podemos esperar que 0 < β2 < 1. 
Acho que você já deve ter percebido que a equação 1.2 é uma velha 
conhecida nossa. É a equação linear mais elementar, a qual costumamos escrever 
nas aulas de matemática com o formato Y = a + bX, em que a é o intercepto, ou o 
ponto onde a reta formada pela equação toca o eixo vertical do plano cartesiano e 
b é o coeficiente angular, ou, a inclinação dessa reta.
O problema de se usar a equação 1.2 é que ela estabelece uma relação 
exata entre duas variáveis. Na vida real sabemos que isso nem sempre acontece 
de fato. Você é capaz de imaginar uma gama de outras coisas que podem afetar o 
consumo? Uma delas é o consumo no período anterior. Se você faz uma compra 
grande no início do mês e não consome tudo o que comprou, o que sobra diminui 
a quantidade adquirida na próxima compra.
Alguns fatores são puramente subjetivos, outros são bem objetivos e 
quantificáveis, mas no geral todos são capazes de influenciar o consumo, o que 
nos faz concluir que na prática a relação entre consumo e renda não é exata ou 
determinística como em 1.2.
Portanto, precisamos de uma variável que seja capaz de capturar a 
influência de todas essas variáveis, as quais de alguma forma afetam o consumo, 
mas que estamos deixando de fora dessa equação matemática por razões que ainda 
estudaremos neste livro. Chamaremos essa variável de termo de perturbação 
estocástica e representaremos pela letra u. 
Chamamos de perturbação porque ela é capaz de perturbar o 
comportamento da nossa variável consumo e é dita estocástica porque não segue 
um comportamento previsível, é totalmente aleatório, porém, como veremos 
mais adiante, com distribuições de probabilidade conhecidas.
1.2Consumo = β1 + β2 Renda
9
TÓPICO 1 | INTRODUÇÃO AO ESTUDO ECONOMÉTRICO
9
Vamos alteraro modelo 1.2 incluindo esse termo estocástico, o que fará 
com que ele se torne um modelo econométrico:
1.3Consumo = β1 + β2 Consumo + u
Temos uma teoria para ser testada, temos o modelo econométrico que derivou 
de uma função matemática, agora podemos obter os dados e empregar a estatística 
para prepará-los para a estimação ou solução de 1.3. Existem diversas fontes de 
dados, o que você precisa ter em mente é que nem sempre eles são confiáveis, por 
isso precisam de uma análise criteriosa, porque, em algum momento, alguém irá 
ler o resultado da nossa pesquisa e poderá se basear nela para implementar alguma 
política governamental, por exemplo. Por este motivo é importante que você se 
habitue a ser muito cuidadoso e crítico em tudo o que você faz.
Como o excerto da teoria keynesiana não define claramente as variáveis, 
empregaremos uma aproximação, uma “proxy” para cada variável. Veremos 
ao longo do livro que a correta definição das variáveis que entram no modelo 
econométrico é muito importante, pois mitiga o risco de especificarmos um 
modelo de forma incorreta, ou, como é chamado, viés de especificação.
Depois de coletar os dados e montar a nossa base, entra em ação um 
aliado importantíssimo do econometrista, a tecnologia. Estimaremos o modelo 
econométrico, ou seja, resolver a equação 1.3, com o emprego dos dados coletados, 
empregando um software econométrico. Como dissemos anteriormente, hoje em 
dia há uma variedade grande deles à disposição no mercado. Alguns são pagos 
e outros até gratuitos. Greene (2012) relaciona os seguintes programas e seus 
respectivos endereços na internet, os quais reproduzimos no quadro a seguir:
QUADRO 1 – RELAÇÃO DE ALGUNS SOFTWARES ECONOMÉTRICOS DISPONÍVEIS NO MERCADO
Software Endereço eletrônico Fornecedor/desenvolvedor
EViews <www.eviews.com> QMS, Irvine, CA
Gauss <www.aptech.com> Aptech Systems, Kent, WA
LIMDEP <www.limdep.com> Econometric Software, Plainview, NY
MATLAB <www.mathworks.com> Mathworks, Natick, MA
NLOGIT <www.nlogit.com> Econometric Software, Plainview, NY
R <www.r-project.org> The R Project for Statistical Computing
RATS <www.estima.com> Estima, Evanston, IL
SAS <www.sas.com> SAS, Cary, NC
Shazam <www.econometrics.com> Northwest Econometrics Ltd., Gibsons, Canada
Stata <www.stata.com> Stata, College Station, TX
TSP <www.tspintl.com> TSP International, Stanford, CA
FONTE: Greene (2012, p. 37)
10
UNIDADE 1 | OS FUNDAMENTOS DA ANÁLISE DE REGRESSÃO
10
Da listagem fornecida por Greene (2012), é comum as grandes empresas, os 
centros de pesquisa de universidades, os profissionais do mercado financeiro, entre 
outros, escolherem dois ou até mais deles para suas atividades diárias. Todos eles são 
muito bons, mas não há um programa que faça exatamente tudo o que precisamos.
Muitas vezes, o programa tem rotinas prontas que resolvem o nosso 
problema com alguns cliques do mouse. Mas, em aplicações mais avançadas, 
precisamos dominar a linguagem que está por trás do programa e escrever as 
linhas, as rotinas ou o algoritmo que será empregado. Evidentemente que no 
nosso livro de estudos não faremos algo assim tão avançado, até mesmo porque 
isso fugiria do escopo do que está sendo proposto nesse material. Porém, fica 
como advertência que, agora que você está entrando nesse mundo fantástico da 
econometria, mais cedo ou mais tarde você sentirá a necessidade e o desejo de 
avançar ainda mais nos seus estudos e buscar esse conhecimento.
Vamos deixar você escolher o programa que melhor se adapte ao seu gosto, 
ao seu bolso, e ao domínio que você tem da língua inglesa, caso queira pagar pela 
licença de uso de um deles. Ao longo de todo o curso de Econometria I, usaremos 
o Gretl, que não foi relacionado por Greene (2012) e, portanto, não está na listagem.
Gretl é a abreviatura ou acrônimo de Gnu Regression, Econometrics and 
Time-series Library. É um software livre e de código aberto, feito para análise 
estatística e econométrica de dados. Trata-se de uma importante ferramenta a 
serviço dos econometristas, especialmente dos graduandos!
Ele traz como vantagens o fato de ser totalmente gratuito, possuir interface 
em diversas línguas, inclusive o português, e ser multiplataforma, o que permite 
que seja instalado praticamente em todos os computadores vendidos atualmente.
Para obter uma cópia deste programa você deve ir até <http://gretl.
sourceforge.net/pt.html>, clicar na opção “Download” e selecionar o arquivo de 
instalação de acordo com o seu sistema operacional. Como usamos o Windows 
10, da Microsoft, as telas apresentadas a seguir foram produzidas a partir deste 
sistema operacional.
Os procedimentos de instalação são intuitivos e os manuais disponíveis no site 
o ajudarão nessa tarefa, caso tenha alguma dificuldade. Mesmo assim, sugerimos que você 
leia o material produzido por Carlos Henrique Coelho de Andrade, da UFRGS. Ele elaborou um 
manual introdutório ao Gretl, com o “objetivo [de] apresentar, de forma simplificada, algumas das 
funcionalidades presentes no Gretl de forma a auxiliar seu aprendizado tanto por aqueles que nunca 
utilizaram pacotes econométricos quanto aqueles que já possuem certa experiência com esse tipo 
de programa” (ANDRADE, 2013, p. 2). Esse manual está disponível para ser baixado em <https://www.
ufrgs.br/ppge/wp-content/themes/PPGE/page/textos-para-discussao/pcientifica/2013_12.pdf>.
DICAS
11
TÓPICO 1 | INTRODUÇÃO AO ESTUDO ECONOMÉTRICO
11
Após estimar a regressão dada pela equação 1.3, fazemos uma série de 
verificações a fim de garantir que o modelo tenha a especificação adequada e os 
resultados sejam consistentes. Com o modelo devidamente validado, fazemos os 
testes de hipótese, as inferências estatísticas ou usamos o modelo para fins de 
previsão econômica. Se concluirmos que o modelo não é adequado, reiniciamos 
todo o trabalho, alterando a definição das variáveis, coletando mais dados, 
modificando a estrutura deles ou até mesmo redefinindo a forma funcional do 
modelo de regressão, como veremos na prática ao longo dos nossos estudos.
O nascimento da econometria e sua contribuição para a sociedade
Samy Dana
Lousas rabiscadas de equações matemáticas, barulhos de calculadoras e cheiro 
de giz permeiam o ambiente. Para quem não frequenta as aulas de econometria, tal 
cenário pode parecer uma bolha matemática muito distante da realidade. Engana-se 
quem pensa assim. Um dos maiores interesses de um economista é ver se o que foi 
proposto pela teoria se aplica na realidade. Isso, porém, sempre representou um dos 
maiores desafios da Economia. Diferentemente das ciências naturais, o economista 
raramente consegue realizar experimentos controlados, por isso os dados coletados 
em Economia são resultados de muitas relações de interdependência, o que torna 
difícil inferir relações de causa e consequência. Para tentar resolver este problema foi 
desenvolvida a Econometria: braço da Economia responsável por, justamente, estimar 
e testar as relações apresentadas pelos modelos teóricos usando dados da realidade. 
Até a metade do século passado faltava aos pesquisadores um sistema 
comum para formular, analisar e resolver os problemas de teste e estimação. 
Por causa disso, grandes economistas, como John Keynes, rejeitavam o uso 
dos métodos adotados, pois acreditava que isso limitava muito a extensão da 
teoria para o mundo real. Nesse cenário limitado, surge o trabalho de Trygve 
Haavelmo. O economista foi responsável por introduzir de forma consistente o 
uso dos métodos probabilísticos no campo da Econometria e, por consequência, 
por uma grande evolução na Ciência Econômica.
Haavelmo nasceu em Oslo, na Noruega, em 1911. Graduou-se em 
economia pela Universidade de Oslo no ano de 1933. Entrou no Instituto de 
Economia como assistente de Ragnar Frisch, grande econometrista da época e 
laureado com o Nobel em Ciências Econômicasanos depois. O economista também 
estudou estatística no University College London. Em 1941, recebeu o título de 
Ph.D. pelo trabalho “The Probability Approach in Econometrics” (Abordagem 
Probabilística em Econometria, tradução livre), sendo essa a base que, seguida 
por outros de seus trabalhos, serviu para mostrar de forma convincente que o uso 
de probabilidade na formulação e teste das teorias econômicas poderia resolver 
grande parte dos problemas enfrentados pela Econometria da época. 
LEITURA COMPLEMENTAR
12
UNIDADE 1 | OS FUNDAMENTOS DA ANÁLISE DE REGRESSÃO
12
O uso da abordagem probabilística é tão importante porque permite a 
aplicação de métodos de inferência capazes de apontar conclusões confiáveis 
sobre as relações previstas pela teoria. De maneira mais simples, a abordagem 
probabilística possibilita que, com dados da realidade, o pesquisador diga algo 
confiável sobre o todo, algo previsto pela teoria e confirmado pelas evidências 
práticas. Por exemplo, pode-se pegar os dados sobre programas do governo e 
entender se eles funcionam de acordo com o que foi planejado, desse modo há 
possibilidade de aperfeiçoamento do programa. 
Ao mostrar a necessidade do uso da teoria de probabilidade, ele também 
provou a sensatez por trás do novo método. Afinal, acreditar que é possível 
prever tudo sem incorrer em erros no cenário econômico complexo enfrentado 
pelos economistas seria absurdo. O ponto forte da probabilidade é o fato de ela 
ter erros e imprecisões, mas ser viável medir os erros e trabalhar para minimizar 
as imprecisões. 
O norueguês também contribui para a análise de problemas com 
interdependência nas relações econômicas. Basicamente, o problema é que um 
acontecimento econômico, como aumento de preço da gasolina, impacta muitos 
outros preços de várias formas. A gasolina mais cara aumenta o custo da entrega 
de pizza, mas a pizza ficou mais cara também porque a entrega da farinha ficou 
mais custosa. Por isso, é difícil entender o resultado pontual do preço da gasolina. 
Haavelmo explicou que se fosse utilizado um conjunto de relações autônomas, 
algo como relações entre custo da farinha e da pizza, custo da entrega e da pizza, 
e assim por diante, seriam explicadas de uma forma melhor. 
É do interesse do governo e das instituições que atuam na economia 
entender a inflação - como os preços vão aumentar -, a fim de fazer um 
planejamento mais adequado para o futuro. Imagine o seguinte exemplo: uma 
indústria está interessada em comprar uma máquina que custa R$ 1 milhão. Para 
isso, ela precisa saber qual será o melhor momento para efetuar a compra da 
máquina. Se em um ano a máquina custar R$ 1,1 milhão (inflação de 10%) e em 
dois anos a mesma máquina custar R$ 1,5 milhão (inflação de 50%), a empresa 
optará por efetuar a compra em um ano, pois pagará por um preço menor se tiver 
caixa. E a empresa só conseguirá tomar a melhor decisão se conseguir projetar 
bem a inflação. Antes de Haavelmo, isso não seria possível, já que os economistas 
não acreditavam na possibilidade de prever esses dados, afinal, não existia um 
processo preciso e bem estruturado. Depois de seus trabalhos, tais previsões são 
realizadas com grande frequência. São elas que permitem um melhor processo de 
decisão pelas empresas e pelo governo. 
Graças a Trygve Haavelmo, o giz que rabisca as equações na lousa das 
aulas de econometria se tornou capaz de desenhar soluções para problemas reais 
da sociedade.
FONTE: <http://g1.globo.com/economia/blog/samy-dana/post/o-nascimento-da-econometria-e-
sua-contribuicao-para-sociedade.html>. Acesso em: 25 ago. 2018.
13
Neste tópico, você aprendeu que:
• A econometria utiliza a teoria econômica, a matemática, a estatística e a 
computação para, de forma empírica, testar teorias, formular e avaliar políticas 
econômicas e auxiliar as empresas na tomada de decisão.
• O método econométrico segue alguns passos, a saber: a identificação de um 
problema de pesquisa, ou hipótese a ser testada, o refinamento com o uso da 
matemática, a especificação das variáveis, coleta e o tratamento adequado dos 
dados com o auxílio da estatística, a estimação dos parâmetros do modelo 
econométrico com o uso de um software e a análise dos resultados.
• Neste livro de estudos usamos o Gretl, que é um software livre de código 
aberto, muito útil por ter uma interface amigável, em língua portuguesa e de 
utilização intuitiva.
RESUMO DO TÓPICO 1
14
Para fechar este tópico, queremos propor uma atividade para você. 
Como você está iniciando na econometria, vamos começar com calma, sem 
preocupação com o acertar, mas queremos que você se esforce para fazer o 
melhor possível. Ao longo do livro você aprenderá uma série de técnicas que 
lhe permitirá voltar a esse exercício no momento que desejar e testar cada uma 
das ferramentas econométricas que aprender.
Questão única – Com base no conhecimento que você adquiriu até agora ao 
longo do curso de Ciências Econômicas, procure lembrar de alguma teoria ou 
de algum aspecto que lhe chamou atenção e tente, a partir disso, elaborar um 
problema de pesquisa. Ao elaborar o problema, tente propor uma resposta para 
ele, mas não se preocupe se estiver certo ou errado, apenas faça a proposição 
de forma que você consiga identificar uma relação entre duas variáveis apenas. 
Procure defini-las adequadamente e baixe os dados da internet, salvando em 
uma planilha eletrônica que você consiga manipular. Com os dados em mãos, 
monte um gráfico de dispersão, colocando no eixo y a variável que você entende 
que depende da outra variável, a qual você colocará no eixo x. Olhando para 
esse gráfico e tendo em mente o que você já sabe sobre economia, procure 
analisar a sua hipótese e diga se é capaz de confirmá-la ou se terá que refutá-la. 
A que conclusões gerais você chegou com esse exercício? Procure escrever isso 
na forma de relatório, e na medida do possível, limite o conteúdo de forma a 
caber em apenas uma página.
AUTOATIVIDADEAUTOATIVIDADE
15
TÓPICO 2
MODELO DE REGRESSÃO LINEAR GERAL
UNIDADE 1
1 INTRODUÇÃO
Neste tópico, aprenderemos os conceitos básicos da econometria, os quais 
nos acompanharão enquanto estivermos estudando ou trabalhando na área 
econômica. São conceitos universais essenciais para compreender o funcionamento 
e a importância da econometria e sua aplicação prática. Por isso, vamos começar 
devagar, apresentando a análise de regressão, o modelo de regressão linear simples 
para finalmente entrarmos no método dos mínimos quadrados ordinários. 
Antes de vermos cada um desses pontos, devemos nos lembrar de que 
a ciência econômica é repleta de teorias, as quais são sintetizadas em modelos 
econômicos, sendo eles mais ou menos complexos, dependendo da sua 
aplicabilidade. Mas o que é um modelo, afinal de contas? É o que veremos a 
partir de agora.
2 A MODELAGEM ECONÔMICA E A ORIGEM DOS DADOS 
ECONOMÉTRICOS
Como bem define Maddala (2003, p. 3), “um modelo é uma representação 
simplificada do mundo real.” A ideia de simplificar as relações torna mais fácil 
compreender o resultado das interações. Por exemplo, se estamos interessados 
em entender o motivo pelo qual o Comitê de Política Monetária do Banco Central 
(COPOM) altera a meta para a taxa básica de juros, podemos começar nossa 
análise dizendo que a sua decisão está baseada na expectativa que os agentes 
econômicos têm sobre o comportamento futuro dos preços.
O problema é que estimar uma função resposta do Banco Central com 
base apenas no comportamento dos preços torna esse nosso modelo simplista 
demais. Para resolver essa questão poderíamos supor que, mantendo inalteradas 
todas as demais variáveis que afetam a decisão do Bacen, a taxa básica de juros 
da economia brasileira será alterada de acordo com as mudanças nas expectativas 
em relação à inflação futura. Assim, aplicando a condição ceterisparibus, ou seja, 
fixando as demais variáveis, podemos nos concentrar naquilo que realmente nos 
interessa, que é compreender quanto de aumento ou diminuição nos juros nós 
teremos quando a inflação aumenta ou diminui.
UNIDADE 2
UNIDADE 1 | OS FUNDAMENTOS DA ANÁLISE DE REGRESSÃO
16
Poderíamos imaginar também que a safra agrícola brasileira dependerá, 
dentre outros fatores, da quantidade de fertilizantes utilizados nas lavouras. Claro 
que a maioria de nós gosta de consumir produtos naturais, ou seja, sem a adição 
de elementos químicos para alterar sua composição e assim produzir além do que 
produziria em um processo natural. Quando elaboramos um modelo capaz de 
explicar a safra agrícola, usando como explicação a quantidade de fertilizantes, 
estamos estabelecendo uma relação ceteris paribus para as demais variáveis que, 
de alguma forma, impactam na safra. 
Como estudante de economia, você já deve ter feito o exercício de tentar 
enxergar todas as variáveis que afetam ou explicam um determinado fenômeno. 
No caso da safra agrícola, podemos pensar na quantidade de chuva durante o ano, 
medida em milímetros cúbicos, até mesmo na quantidade de sol, pensando em 
horas de luz por dia, no fato de a acidez do solo ter sido corrigida ou não, no método 
de plantio e até mesmo na época do ano em que o agricultor começou a plantação.
E no caso do Banco Central, você consegue enumerar quais são as variáveis 
que afetam a decisão do COPOM ao tomar sua decisão em relação a elevar, manter ou 
reduzir a taxa básica de juros? 
Sugerimos que você dê uma lida na ata da última reunião do COPOM, disponível 
em <https://www.bcb.gov.br/?ATACOPOM>, e veja tudo o que é analisado pelo comitê para 
se chegar a um consenso sobre a decisão a ser tomada. Você perceberá que eles falam 
em cenários, e esses cenários são definidos com o uso de modelos econométricos que 
estudaremos na disciplina de Econometria II.
O Bacen usa modelos complexos, mas a ideia de impor restrições ao modelo 
ajuda a torná-lo simples, porém alguns pressupostos podem ser tão restritivos 
que os tornam irrealistas. Por isso, podemos começar com um modelo simples e 
ir adicionando outras variáveis até termos certeza de que temos o suficiente para 
representarmos a realidade (MADDALA, 2003, p. 4).
Uma forma de construir modelos é começando com uma proposição como 
aquela de Keynes sobre o consumo e a renda, apresentada no Tópico 1. Podemos 
falar em comportamento conjunto, dizer que uma variável provoca alterações 
em outra, ou é causada por outra, ou ainda varia em função de outra variável 
(GREENE, 2012, p. 51). 
Costumamos definir a variável que provoca as alterações como “explicativa” 
enquanto a que sofre a mudança é a “explicada”. O termo “explicativa”, em 
econometria, é sinônimo de explanatória, independente, exógena, previsor ou 
DICAS
TÓPICO 2 | MODELO DE REGRESSÃO LINEAR GERAL
17
regressor. Por outro lado, “explicada” é sinônimo de dependente, alvo, endógena, 
de efeito, variável de controle ou regressando.
As variáveis são construídas a partir de dados coletados geralmente na 
internet, em sites oficiais do governo ou de entidades privadas e de pesquisa 
onde as informações são divulgadas, tais como IBGE, Banco Central, IPEADATA, 
FMI, CNI, entre outros. Eles também podem ser coletados por meio de pesquisa 
de campo, ou seja, monta-se um questionário e o pesquisador vai a campo para 
aplicar e, posteriormente, tabular as informações coletadas. 
Há ainda outras formas de se obter os dados, tais como em experimentos 
controlados em laboratório, o que dificilmente conseguiremos fazer em economia, 
porém é comum em outras áreas da ciência, como a Biologia, a Física, ou até 
mesmo em fábricas, quando querem testar algo novo. Esses dados podem ser de 
três tipos: séries temporais, dados de corte e painel de dados.
Um conjunto de dados é dito de séries temporais quando temos mudanças 
ao longo do tempo. Nós os representamos nos nossos modelos pelo subscrito 
“t”, por exemplo, Yt. Dessa forma, quando falamos na inflação anual do período 
compreendido entre 1994 e 2016, estamos relacionando o acumulado de cada ano 
em uma sequência. Da mesma forma, a variação percentual trimestral do Produto 
Interno Bruto ao longo do ano de 2016 também representa uma série temporal. 
Esses dados podem ser coletados com frequência intradiária (séries financeiras 
como preço de ações, câmbio etc.), diária, mensal, bimestral, trimestral, semestral, 
anual e assim por diante.
Dizemos que esse conjunto de dados faz parte da Macroeconometria, 
porque está relacionado a temas estudados na Macroeconomia, tais como:
a) Qual o efeito causado por mudanças na taxa básica de juros da economia 
brasileira sobre a inflação? Quando esse efeito começa e por quanto tempo ele 
dura?
b) Longos períodos de recessão costumam ter como custo social altas taxas de 
desemprego. Quais os efeitos da baixa produção e do desemprego sobre o 
nível de preços da economia?
Os dados de corte são aqueles obtidos em um determinado momento no 
tempo e representamos com o subscrito “i”, por exemplo, Yi. Esse subscrito indica 
que estamos tratando de indivíduos, que podem ser pessoas, estados, países, 
firmas etc. 
Ao longo da série de dados não há alterações temporais. Esses dados 
de corte são objeto de estudo da Microeconometria e nos ajudam a responder 
questões, como:
a) Qual a relação entre gastos de campanha e número de votos na eleição 
presidencial de 2014?
UNIDADE 1 | OS FUNDAMENTOS DA ANÁLISE DE REGRESSÃO
18
b) A quantidade de alunos em sala de aula, na rede pública de ensino em 2017, é 
capaz de explicar o seu desempenho no ENEM?
c) Profissionais com menos idade, mas com o domínio de mais idiomas 
estrangeiros ganham mais do que profissionais mais velhos que dominam 
apenas um idioma estrangeiro?
Finalmente, o painel de dados, que também está relacionado à 
Microeconometria, junta tanto os dados de séries temporais quanto os dados de 
corte e suas séries são representadas pelos subscritos “i” e “t”, como em Yit. Isso 
significa que estamos nos referindo ao indivíduo “i” no período “t”. Em termos 
práticos, falamos na arrecadação tributária dos estados do Paraná (“i”) em 2014 
(“t”), 2015 e 2016, estado de Santa Catarina em 2014, 2015 e 2016 e Rio Grande do 
Sul em 2014, 2015 e 2016. Aqui os indivíduos “i” são os estados, enquanto o período 
“t” são os anos de 2014 até 2016.
A tabela a seguir apresenta um exemplo de painel de dados. Como você 
pode perceber, nesse caso nós empilhamos as informações individuais ao longo 
do tempo, a fim de construir a base de dados e conseguir estimar os modelos 
econométricos:
TABELA 1 – PAINEL DE DADOS
Observação Ano País PIB(bilhões de US$) Desemprego (%)
Inflação
(% ao ano)
1 2013 Argentina 716,419 7,2 9,77
2 2014 Argentina 743,121 7,2 10,04
3 2015 Argentina 777,945 7,3 10,62
4 2013 Bolívia 50,904 5,8 9,88
5 2014 Bolívia 55,229 5,4 4,52
6 2015 Bolívia 59,195 3,2 5,73
7 2013 Brasil 2.294,243 6,0 6,64
8 2014 Brasil 2.355,586 5,5 5,40
9 2015 Brasil 2.423,306 6,6 6,20
10 2013 Chile 299,632 6,1 3,34
11 2014 Chile 320,54 6,4 3,00
12 2015 Chile 334,76 5,9 1,79
13 2013 Colômbia 471,964 10,9 3,42
14 2014 Colômbia 502,874 10,4 3,17
15 2015 Colômbia 527,565 10,5 2,02
FONTE: <www.imf.org>. Acesso em: 26 ago. 2018.
Empregamos painel de dados quando o número de dados de corte e de 
séries de tempo são insuficientes para fazermos o nosso estudo com qualidade. 
Com eles, podemos responder a perguntas do tipo:
TÓPICO 2 | MODELO DE REGRESSÃO LINEAR GERAL
19
3 ANÁLISE DE REGRESSÃO
Em 1886, Francis Galton publicou um artigo em que estudou as 
semelhanças familiares em estatura, explicando que a estatura média familiar 
gradualmente diminui ou regride à altura média da população como um todo 
(GALTON, 1886, p. 42). Isso ficou conhecido comoregressão à mediocridade. 
A ideia por trás dessa expressão é bem simples e se resume a algumas 
questões que Galton (1886) tentou responder:
1. Por que filhos de pais altos tendem a ser altos também, mas não tão altos quanto 
seus pais?
2. Por que filhos de pais baixos tendem a ser baixos também, mas não tão baixos 
quanto seus pais?
3. Por que pais de filhos altos tendem a ser altos, mas não tão altos quanto os seus 
filhos? 
4. Por que pais de filhos baixos tendem a ser baixos, mas não tão baixos quanto 
os seus filhos?
Essas questões levantadas por Galton e que deram origem à expressão 
“regressão à mediocridade”, também podem ser observadas em outras áreas. Por 
que um atleta de alto nível tem um bom desempenho em uma temporada, mas na 
temporada seguinte seu rendimento cai? Por que um time de futebol brasileiro, 
ao disputar a final do mundial de clubes no fim da temporada, não tem o mesmo 
desempenho físico do início do ano?
Essa ideia de regressão é a que está na origem do termo que usamos hoje 
em dia, porém com um significado um pouco diferente. De um ponto de vista 
mais moderno, Maddala (2003, p. 32) diz que a “análise de regressão refere-se à 
descrição e à quantificação da relação entre uma dada variável (em geral chamada 
de variável explicada ou dependente) e uma outra ou mais outras variáveis (em 
geral chamadas de variáveis explicativas ou independentes)”.
a) Como o estoque de capital das cinquenta maiores empresas do Brasil 
impactaram nos seus investimentos brutos nos últimos três anos?
b) De que forma a estrutura de mercado impacta na decisão de inovar das 
indústrias brasileiras?
c) Qual o impacto dos grandes eventos esportivos (olimpíadas e copa do mundo), 
sobre o crescimento econômico dos países sede, após a crise de 2008? 
O termo regressão e o significado de análise de regressão são assuntos a 
serem discutidos com mais detalhe na sequência. Ao desenvolvermos o modelo 
de regressão linear geral, iniciaremos a parte técnica dos nossos estudos, o que irá 
demandar bastante atenção de sua parte. Sugerimos que você leia mais de uma 
vez o conteúdo e faça todas as aplicações práticas usando o software econométrico 
que você escolheu.
UNIDADE 1 | OS FUNDAMENTOS DA ANÁLISE DE REGRESSÃO
20
Geralmente denotamos por Yi a variável dependente e por Xi a variável 
explicativa e podemos, com o auxílio da matemática, formular essa relação da 
seguinte maneira:
Yi = f (Xi) 2.1
f (Xi) = b + mXi 2.2
Yi = b + mXi 2.3
Em que f (Xi) é uma função de Xi, que estabelece a relação existente entre 
a variável explicativa e a explicada, e assume qualquer formato. Ela pode ser 
um polinômio de segundo grau, ou de terceiro, pode ser uma função recíproca, 
logarítmica, enfim, terá o formato que se ajusta melhor aos dados coletados 
relativos às variáveis.
Como nem sempre sabemos qual a especificação exata da função 2.1, 
recorremos à teoria econômica que na maioria das vezes nos dá uma pista para 
seguirmos. Outras vezes recorremos aos próprios dados, plotando um gráfico 
de dispersão e observamos o formato da distribuição dos dados. Dependendo 
da figura formada ou do caminho seguido pelas informações, podemos chegar à 
conclusão sobre qual a melhor equação a ser usada.
No caso da função consumo keynesiana, podemos esperar que a relação 
entre consumo e renda se dê de forma linear. Assim, representamos a função da 
seguinte forma:
Substituindo 2.2 em 2.1, temos a expressão:
A função linear em 2.3 nada mais é do que um polinômio de grau 
zero. Ela tem como características uma variável dependente Yi, explicada por 
uma constante b, e um coeficiente angular m, que é multiplicado pela variável 
explicativa Xi. Note, também, que estamos supondo uma relação de causalidade 
direta, matemática ou determinística entre as variáveis Yi e Xi. 
Em 2.3, b geralmente não tem um significado econômico relevante. 
Algumas vezes até tem, mas isso veremos com o tempo ao longo desse livro. 
O que chama a atenção é que, quando o coeficiente angular m é igual a zero, Yi 
assume o valor de b. 
Por outro lado, m é de extrema importância e é nesse parâmetro que 
geralmente concentramos toda a nossa atenção. A leitura que fazemos dele é 
TÓPICO 2 | MODELO DE REGRESSÃO LINEAR GERAL
21
Yi = 85,6742 + 0,516Xi 2.4
Yi = b + mXi + ui
□ = 85,6742 + 0,516Xi ± 6
2.5
direta, ou seja, se Xi variar uma unidade, Yi irá variar exatamente m. Expresso de 
outra forma, podemos entender essa variação como ∆Yi/∆Xi = m.
Supondo que Yi, na equação 2.3, represente a altura dos filhos e Xi, a altura 
dos pais, ambos em centímetros, e suponha que a constante b e o coeficiente angular 
m assumam os seguintes valores:
Em 2.4, para um pai que tenha 180 cm de altura, podemos esperar que o 
filho tenha 178,55 cm (Y180 cm = 85,6742 + 0,516 x 180 = 178,55 cm). Porém, sabemos 
que essa relação de altura entre pais e filhos, na prática, não pode ser determinada 
com exatidão por nenhuma fórmula matemática, pois há outros fatores que podem 
afetar o crescimento. Por exemplo, há medicamentos específicos usados em 
determinados tratamentos médicos que prejudicam o crescimento, a quantidade 
de exercícios físicos, o tempo de exposição ao sol, a genética, entre outros, que 
influenciam diretamente no crescimento das crianças.
Se trabalharmos com o conceito de probabilidade, podemos melhorar nossa 
capacidade de prever a altura dos filhos. Vamos reescrever a equação 2.4 para incluir 
o termo comportamental u, que terá valor de ± 6 cm, com probabilidade de 50%:
Substituindo Xi por 180 cm, teremos Y180cm = 184,55 cm, com probabilidade 
de 50% e Y180cm = 172,55 cm com probabilidade de 50% (faça esse cálculo para 
confirmar). O problema dessa variável ui é que normalmente só conhecemos a 
sua distribuição de probabilidade. 
Podemos supor que ui tenha distribuição normal padrão, com média 
igual a zero e variância constante igual a 1. Se for este o caso, Yi, ou a altura dos 
filhos, poderá assumir qualquer valor e assim teremos que nos indagar sobre a 
relevância da equação 2.5 em termos práticos.
Se tivéssemos a nossa disposição os dados da altura de todos os pais do 
mundo inteiro, saberíamos que alguns pais com 185 cm de altura têm filhos com 
estatura ligeiramente acima dessa marca ou ligeiramente abaixo dela. Alguns até 
superam em muitos centímetros para mais ou para menos. Assim, a relevância da 
equação 2.5 é permitir que estimemos a altura média dos filhos de pais com 185 
cm de estatura, ou ainda, nos dar a ideia de quanto um filho deverá ter de altura, 
em média, se os pais tiverem altura em torno de Xi. Devemos ter em mente que o 
valor exato da altura dependerá de outros fatores e que geralmente teremos uma 
ótima estimativa, mas acertar o valor correto é outra história.
UNIDADE 1 | OS FUNDAMENTOS DA ANÁLISE DE REGRESSÃO
22
Essa é uma maneira de regredir à altura média da população, como 
definiu Galton (1886), e por isso chamamos a função 2.5 de Função de Regressão 
Populacional. O termo populacional é empregado porque estamos supondo que 
temos acesso a toda a população de dados. Imagine você medindo a altura de 
todos os pais e filhos de todos os 7,6 bilhões de pessoas que vivem no mundo. 
Obviamente é inviável, por isso na prática estimamos uma Função de Regressão 
Amostral e inferimos estatisticamente os resultados, a fim de tentar prever da 
melhor forma possível os verdadeiros b e m da população.
Ao tentar explicar a altura dos filhos a partir da altura dos pais, se fixarmos 
esta última variável em categorias e obtivermos amostras da primeira, poderemos 
ilustrar melhor esse comportamento, como fizemos no Gráfico 1 a seguir:
GRÁFICO 1 – DISPERSÃO DA ALTURA DOS FILHOS E DOS PAIS EM CM
200
195
190
185
180
175
170
165
160
160 165 170 175180 185 190 195
A
lt
u
ra
 d
o
s 
fil
h
o
s 
e
m
 c
m
Altura dos pais em cm
FONTE: O autor
No eixo vertical está a nossa variável dependente, enquanto no eixo 
horizontal encontra-se a variável que a explica. Esse exemplo é hipotético e 
tem como objetivo apenas ilustrar e consolidar alguns conceitos importantes. 
Por exemplo, ao se fixar os dados da variável explicativa, pode-se obter 
diversas amostras da variável dependente e distribuir esses valores, criando as 
subpopulações amostrais.
Se tirarmos uma média dessas subpopulações amostrais e traçarmos 
uma reta ligando esses pontos médios, teremos aquilo que chamamos de reta 
de regressão ou curva de regressão. “Em termos geométricos, uma curva de 
TÓPICO 2 | MODELO DE REGRESSÃO LINEAR GERAL
23
regressão populacional é apenas o local geométrico das médias condicionais da 
variável dependente para os valores fixados da(s) variável(is) explanatória(s)” 
(GUJARATI; PORTER, 2011, p. 61). 
Isso deixa claro que essa reta conecta os valores médios condicionais 
E(Y|Xi) da variável dependente, e que essa média condicional aumenta conforme 
aumentam os valores da variável explicativa, demonstrando que há uma relação 
positiva entre as variáveis como haveria de se esperar.
Apenas para lembrar, o valor médio esperado “E” ou esperança 
matemática pode ser definida como:
1 1 2 2 1
n
n n i ii
...E(X) X P(X ) X P(X ) X P(X ) X P(X )
=
= + + + =Σ 2.6
Em que Xi é a observação i da variável X, P(Xi)é a função de 
probabilidade de X. Como exemplo, suponha que X = (3,5,7,9), assim, 
1 1 1 1E(X)=3 +5 +7 +9
4 4 4 4
       
       
       
, o que equivale a 41 14 6iiE(X) X== =Σ .
4 O MODELO DE REGRESSÃO LINEAR SIMPLES
Um modelo de regressão linear simples tem um formato parecido com a 
equação 2.5, em que uma variável Y é explicada em termos de outra variável, a 
qual representamos por X. Esse modelo é usado para responder questões acerca 
da população, porém como o acesso a toda a população é muito custoso em termos 
de tempo e recursos financeiros, via de regra procuramos obter uma estimativa 
dos parâmetros e a partir daí fazemos inferências sobre a população.
Vamos voltar à equação 2.5 para reescrevê-la da seguinte forma:
Yi = β1 + β2Xi + ui 2.7
A equação 2.7 é conhecida como modelo de regressão linear simples e 
vamos nos dedicar a entender melhor a sua funcionalidade. Como você pôde 
perceber, as variáveis dependente e explicativa são exatamente as mesmas usadas 
anteriormente, enquanto os coeficientes mudaram, para que possamos começar a 
usar a terminologia padrão ou universal da econometria.
Aqui queremos chamar a sua atenção para uma variável em especial, o 
termo de erro ou perturbação estocástica ui. Além de ela perturbar uma relação 
estável entre as demais variáveis, também tem papel central na análise de 
UNIDADE 1 | OS FUNDAMENTOS DA ANÁLISE DE REGRESSÃO
24
regressão. A sua função básica é representar todas as demais variáveis que de 
alguma forma possam afetar a variável dependente, mas que, por certas razões, 
não estamos considerando no estudo.
Por que precisamos incluir esse termo de erro na nossa equação? São 
diversos os motivos que nos levam a fazer isso. Um deles é o fato de que nem 
sempre conseguimos capturar todas as relações existentes com o modelo que 
escolhemos. Isso ocorre porque a teoria subjacente pode deixar algo em aberto, 
ou não ser precisa quanto às especificações.
Talvez até sejamos capazes de relacionar todas as variáveis que explicam 
um determinado fenômeno, mas obter os dados necessários para estudar essas 
relações nem sempre é possível. Outras vezes algumas das variáveis relacionadas 
não são relevantes ao ponto de serem utilizadas no estudo. Assim, capturamos o 
seu efeito através desse termo de erro estocástico.
Há ainda os erros de mensuração, uma vez que é mais fácil definir quais 
variáveis entram no modelo do que definir como são medidas ou obtidas. Um 
modelo que busca explicar o consumo das famílias em função da renda e da sua 
riqueza tornará difícil a tarefa de determinar ou medir a riqueza, que tem um 
caráter bem subjetivo e pouco preciso.
Assim, em 2.7 temos uma parte que é determinística, formada por β1 + 
β2Xi, e outra que é totalmente aleatória, ui, e usamos esse modelo para estimar os 
parâmetros desconhecidos, β1 e β2, e com base nesses resultados somos capazes 
até mesmo de fazer previsões sobre o comportamento esperado da nossa variável-
alvo: Yi.
Em geral, se ∆ui = 0, então ∆Yi = β2∆Xi, e com isso as mudanças na variável 
dependente são explicadas por β2 multiplicada pelas variações em Xi, ou seja, a 
inclinação da reta de regressão formada a partir da equação 2.7.
5 AS HIPÓTESES DO MODELO DE REGRESSÃO LINEAR
Os manuais de econometria apresentam um conjunto de hipóteses que 
explica como o modelo de regressão linear é capaz de capturar as relações entre 
as diversas variáveis que entram no modelo. Se o nosso objetivo é apenas calcular 
os parâmetros do modelo, ou seja, os βs em 2.7, basta coletar os dados e estimar 
aqueles parâmetros usando um bom software econométrico. Porém, se o nosso 
objetivo for ir além da estimativa pura, e sempre queremos ir além, precisaremos 
estabelecer algumas regras, ou hipóteses que carregaremos conosco enquanto 
estudarmos e aplicarmos na prática o método econométrico. 
A seguir, enumeramos essas hipóteses. Chamamos a sua atenção para 
o fato de usarmos o subscrito i, indicando que essa variável assume valores 
diferentes para cada indivíduo ao longo da sequência de dados.
TÓPICO 2 | MODELO DE REGRESSÃO LINEAR GERAL
25
a) Hipótese 1
O modelo de regressão especifica uma relação linear entre a variável 
dependente e a explicativa. Essa linearidade se dá nos parâmetros como em Yi = 
β1 + β2Xi + ui. 
Uma função é dita linear nas variáveis quando essas não são divididas 
por outras variáveis ou quando não são elevadas à potência diferente de 1. Neste 
caso, Yi = β1 + β2Xi2 + ui e 1 2
i
i i
i
X
Y u
Z
β β= + + são exemplos de modelos que não são 
lineares nas variáveis, porque elas são elevadas à potência diferente de 1, como 
no primeiro caso, ou são divididas por outra variável, como no segundo caso.
No entanto, esse tipo de função, que não é linear nas variáveis, não viola a 
hipótese 1 do modelo de regressão linear. Isso decorre do fato de que a linearidade 
que nos interessa é nos parâmetros. Com isso, modelos do tipo Yi = β1 + βi2Xi + ui ou 
do tipo 21
1
i i iY X u
β
β
β
= + + violam a hipótese 1, no sentido de que o parâmetro β2 
no primeiro exemplo é elevado à potência diferente de 1 e no segundo exemplo, 
ele é dividido pelo parâmetro 1.
Gujarati e Porter (2011, p. 63) resumem bem a relação entre linearidade 
nos parâmetros versus linearidade nas variáveis. Podemos ter um modelo de 
regressão que seja linear nos parâmetros, mas não necessariamente linear nas 
variáveis. Por outro lado, podemos ter um modelo de regressão que não seja 
linear nos parâmetros, e ele pode ser linear nas variáveis ou não. Em síntese, o 
que nos interessa são os modelos de regressão que são lineares nos parâmetros, 
e não nos importamos se são ou não lineares nas variáveis, pelo menos não neste 
momento. 
b) Hipótese 2 
A variável X é não estocástica e seus valores são fixos em amostras 
repetidas. Isso significa que conhecemos os valores de X, que não são gerados ao 
acaso.
Por exemplo, pais com 180 cm de altura geram filhos mais altos ou mais 
baixos do que eles. Para sabermos a probabilidade de os filhos serem maiores ou 
menores, tomamos várias amostras de filhos cujos pais têm a altura de 180 cm. 
Em outras palavras, repetimos a amostra várias vezes, mas condicionamos ou 
fixamos a altura dos pais parapodermos coletar os dados. No entanto, apesar de 
fixarmos os valores nas amostras repetidas, os valores individuais de X devem 
variar, pois se cada valor de Xi for igual ao outro, a sua média X será igual aos 
Xi individuais, e com isso não conseguiremos calcular o coeficiente β2, como 
veremos adiante.
UNIDADE 1 | OS FUNDAMENTOS DA ANÁLISE DE REGRESSÃO
26
A reta de regressão é dada por E(Y|Xi) = β1 + β2Xi. Substituindo em 2.7, 
temos:
c) Hipótese 3
A média condicional do termo de erro é igual a zero. Em termos algébricos, 
estamos dizendo que E(ui|Xi) = 0. Podemos ilustrar essa hipótese por meio da 
figura a seguir:
FIGURA 1 – DISTRIBUIÇÃO CONDICIONAL DOS TERMOS DE ERRO
FRP: Yi = β1 + β2Xi
X1 X2 X3 X4
Y
X
+ui
-ui
FONTE: Gujarati e Porter (2011, p. 85)
Para que a média condicional do termo de erro seja zero, precisamos 
retomar à equação 2.7:
Yi = β1 + β2Xi + ui 2.8
Yi = Yi – E(Y|Xi) 2.9
Resolvendo a equação para ui, temos:
TÓPICO 2 | MODELO DE REGRESSÃO LINEAR GERAL
27
var(ui|Xi) = E[ui – E(ui|Xi)]2 2.10
var(ui|Xi) = E(ui2|Xi) 2.11
Volte novamente à Figura 1. Veja que para qualquer valor de Xi há diversos 
pontos acima e abaixo do valor médio, o qual se situa sobre a reta de regressão, 
expressa por Yi = β1 + β2Xi, que, já sabemos, equivale a E(Y|Xi). A distância entre 
os diversos valores de Y e o valor médio é chamado de termo de erro e aqui 
representamos por E(ui|Xi). 
Perceba, ainda, que os valores de ui acima da reta de regressão são 
positivos, pois neste caso Yi – E(Y|Xi) > 0. Por outro lado, os valores de ui abaixo 
da reta de regressão são negativos, pois Yi – E(Y|Xi) < 0. Podemos finalmente 
concluir que, se tirarmos a média dos diversos ui obteremos o valor zero, pois os 
valores positivos encontrados anulam os valores negativos.
Você pode verificar isso com um exemplo simples. Seja Y = (3, 5, 7, 9), 
como vimos anteriormente, E(Y) = 6, e se fizermos Y – E(Y) teremos Y – E(Y) = [(3 
– 6) + (5 – 6) + (7 – 6) + (9 – 6)] = 0. 
d) Hipótese 4
Os erros ui são homoscedásticos e não apresentam autocorrelação. A 
homoscedasticidade tem um sentido de espalhamento simétrico da dispersão em 
torno do valor médio. Isso significa que, para cada Xi, corresponde um conjunto 
de valores observados de Y. 
Sabemos que o termo de erro é medido pela distância entre o valor médio 
de Yi relativo a cada Xi. Ter erros homoscedásticos significa que não importa o 
valor de Xi, a distribuição de probabilidade dos erros é simétrica e constante, como 
em uma curva de Gauss, ou “curva de sino”, se você preferir, visto na Figura 1.
Como sabemos, a média dos erros é igual a zero, ou seja, E(ui|Xi) = 0, a 
hipótese de homoscedasticidade implica que a variância condicional do termo de 
erro deve ser constante:
Sabemos que E(ui|Xi) = E(ui2|Xi), isso nos leva a:
Também sabemos que o quadrado de um número negativo tem por 
resultado um valor positivo. Dessa forma, a variância condicional do termo de 
erro é um número positivo e constante. Em termos algébricos, temos:
UNIDADE 1 | OS FUNDAMENTOS DA ANÁLISE DE REGRESSÃO
28
var(ui|Xi) = o2 2.12
cov(ui, uj|Xi, Xj) = E{[ui – E(ui)]|Xi}{[uj – E(uj)]|Xj} 2.13
cov (ui, uj|Xi, Xj) = E(ui|Xi(uj|Xj) 2.14
cov (ui, uj|Xi, Xj) = 0 2.15
E se a variância não for constante? Neste caso teremos o problema da 
heteroscedasticidade, que será objeto de estudo mais adiante, na Unidade 3.
O outro ponto dessa hipótese diz respeito à ausência de autocorrelação 
entre os termos de erro. Isso significa que a convariância condicional entre os 
termos deve ser nula:
Já sabemos que E(ui|Xj) = 0, e isso também é válido para E(uj|Xj) = 0. Com 
isso, temos:
Em termos práticos, a covariância condicional igual a zero significa que 
um termo de erro condicionado a Xi não pode influenciar o outro termo de erro 
condicionado a Xj. Devido a sua complexidade, exploraremos mais esse conceito 
adiante, na Unidade 3.
Gujarati e Porter (2011) apresentam ainda outras hipóteses, tais como a 
ausência de covariância entre ui e Xi, ou seja, E(ui Xi), a necessidade de a nossa 
amostra ser grande o suficiente para que o número de observações seja maior do 
que a quantidade de parâmetros a serem estimados e a necessidade de o modelo 
estar corretamente especificado.
As hipóteses que enumeramos são suficientes, por enquanto, para 
avançarmos em nossos estudos. Em breve apresentaremos outras hipóteses, 
à medida que necessitarmos de técnicas mais apuradas na solução dos nossos 
problemas. Por exemplo, quando estivermos analisando um modelo de regressão 
múltiplo, precisaremos que as variáveis X não sejam colineares. Mas isso ficará 
para outro momento, primeiro precisamos saber como estimar os parâmetros do 
modelo de regressão, e para isso aplicaremos o método de mínimos quadrados 
ordinários. 
29
RESUMO DO TÓPICO 2
Nesse tópico, você aprendeu que: 
• Existem os conceitos básicos da econometria, tais como variável dependente 
e explicativa, os tipos de dados usados no processo econométrico (dados de 
corte, séries temporais e painel de dados).
• O termo “regressão”, cunhado por Francis Galton em 1886, tinha um sentido 
de regressão à mediocridade. Atualmente tem um sentido de análise da relação 
quantitativa existente entre duas variáveis, a dependente e a explicativa.
• Estudamos o modelo de regressão linear simples, que diferentemente do 
modelo matemático determinístico apresenta uma forma estocástica com a 
inclusão do termo de erro, uma variável aleatória que captura o sentido ceteris 
paribus na econometria.
• As hipóteses do modelo clássico de regressão linear devem ser observadas 
se quisermos ir além da estimação pontual dos parâmetros do modelo de 
regressão.
30
1 Sobre os principais conceitos da econometria, relacione a coluna da direita 
com a da esquerda:
AUTOATIVIDADE
( A ) Variável dependente ( ) Tem a capacidade de influenciar outras 
variáveis.
( B ) Variável explicativa ( ) A arrecadação tributária do Paraná, Santa Catarina 
e Rio Grande do Sul em 2004, 2008 e 2012.
( C ) Séries temporais ( ) O IDH de todos os municípios brasileiros em 2010.
( D ) Dados de corte ( ) Aquela que é explicada por outras variáveis.
( E ) Painel de dados ( ) O rendimento da poupança nos últimos 24 meses.
2 Suponha que estimamos uma regressão cujo resultado é Yi = 1.200 + 0,73Xi, 
em que Yi representa o consumo de um determinado grupo de famílias e Xi a 
renda recebida por essas famílias: 
a) Qual deve ser o consumo estimado para uma família sem renda? 
b) Qual deve ser a renda de uma família que tem um consumo de $ 5.000? 
3 Uma das hipóteses do modelo de regressão linear é que a linearidade deve 
ocorrer nos parâmetros. Sendo assim, responda “V” quando se tratar de 
uma função linear nos parâmetros e “F” quando a função não for linear nos 
parâmetros: 
a) ( ) Yi = β1 + β2Xi + ui 
b) ( ) Yi = β1 + β2X5 + ui
c) ( ) Yi = β1 + (β1 X β2) Xi + ui
d) ( ) i i
i
Y u
X
β β= + +1 2
1
4 Considerando as seguintes sequências de eventos aleatórios: Y = {3, 7, 12, 17} 
e X = {5, 9, 15, 19}, calcule:
a) A média de Y, representada por i iYY == Σ4 114 e a média de X, representada 
por i ixX == Σ4 114 .
b) A soma dos desvios de Y e X em relação a sua média: Yi i iu YY= = −Σ4 1 e 
Xi i i
u XX= = −Σ4 1 .
c) A variância de Y, dada por i iVar(Y) (Y Y)== −Σ4 2114 e a variância de X, dada 
por i iVar(X) (X X)== −Σ4 2114 .
31
TÓPICO 3
MÉTODO DOS MÍNIMOS QUADRADOS ORDINÁRIOS
UNIDADE 1
1 INTRODUÇÃO
No tópico anterior, estudamos o modelo clássico de regressão linear. 
Aprendemos alguns conceitos e vimos as hipóteses relevantes que estão por trás 
de praticamente toda análise de regressão. O único problema é que o que vimos 
anteriormente se refere a

Outros materiais