Buscar

Econometria_Capitulos 1 a 4

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 76 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 76 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 76 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

ECONOMETRIA
Prof. Patricia Maria Bortolon, D. Sc.
Introdução
Teoria 
Econômica
Matemática
Fenômenos 
Econômicos
Inferência 
Estatística
Teoria 
Econômica
Teoria 
Microeconômica
Preço
Demanda
Mas quanto????
Teoria 
Econômica
Economia 
Matemática
• Formula equações sem levar em conta se a teoria 
pode ser medida ou verificada
Estatística 
Econômica
• Coleta, processamento e apresentação dos dados
Estatística 
Matemática
• Ferramentas específicas para lidar com dados que 
não foram gerados por experimentos controlados
O método Econométrico
1. Exposição da teoria ou hipótese
– Keynes: o aumento da renda eleva o consumo, mas não em 
proporção igual ao aumento dessa renda.
– Propensão marginal a consumir (PMC) > 0, mas < 1
2. Especificação do modelo matemático da teoria
– Um economista matemático poderia sugerir:
Y
X
Despesa de 
consumo
Renda
β1
β2= PMC
consumo
Inclinação = PMC
renda
O método Econométrico
3. Especificação do modelo estatístico ou econométrico
– Se obtivéssemos dados de 500 famílias (consumo e renda) e 
plotássemos os pontos no gráfico, todos cairiam em cima da 
reta?
– Não. Por que?
– Porque provavelmente outros fatores afetam a decisão de 
consumo (tamanho da família, cultura, religião etc...)
– A função definida pelo economista matemático é 
determinística
– Para dar conta das relações inexatas o econometrista 
escreve:
Modelo
Econométrico
Distúrbio
Termo de erro
Var. aleatória (estocástica)
Representa todos os fatores
que afetam o consumo
mas não são levados
em conta explicitamente
O método Econométrico
4. Obtenção dos dados
Y
X
u
O método Econométrico
5. Estimação dos parâmetros do modelo econométrico
– Vai dar conteúdo empírico à função consumo
– Análise de regressão
– Aumento de US$1 no período amostrado, provoca em 
média, um aumento no consumo de US$0,70
– Por que dizemos “em média”? Porque a relação é inexata.
^ indica se tratar de uma estimativa
O método Econométrico
6. Testes de hipóteses
– Keynes: esperava que PMC fosse + e < 1
– Mas, 0,70 é estatisticamente menor que 1?
– 0,70 está suficientemente abaixo de 1, ou é um resultado devido ao 
acaso?
7. Projeção ou previsão
– Uma redução de impostos => aumento da renda das famílias => quanto 
aumentará o consumo?
8. Uso do modelo para fins de controle ou de política
– Se certo nível de consumo garante certo nível de desemprego a relação 
calculada pode ser usada no sentido inverso para descobrir qual o nível 
de renda necessário. Políticas podem ser estabelecidas para atingir esse 
nível de geração de renda.
Capítulo 1
A natureza da análise de regressão
Fonte: GUJARATI; D. N. Econometria Básica: 4ª Edição. 
Rio de Janeiro. Elsevier- Campus, 2006
Origem Histórica
• Altura de filhos de pais altos e de pais baixos tendem 
para a altura média da população
• Lei da regressão universal de Galton
• Confirmada por Karl Pearson
• “regressão a mediocridade”
Interpretação moderna da regressão
• Descobrir como a altura média dos filhos varia, dada a 
altura dos pais
• Estudo do comportamento de uma variável dependente 
em relação a uma ou mais variáveis explanatórias, para 
estimar ou prever o valor (médio) da população da 
primeira em termos dos valores conhecidos ou fixados 
(em amostras repetidas) das segundas.
Ver figura 1.1 e exemplos da página 14 a 16
Relações Estatísticas x Determinísticas
• Determinística (ou funcional)
– Lei da gravitação de Newton
• Estatísticas
– Rendimento das lavouras = f (temperatura, pluviosidade, luz solar, 
fertilizantes)
– Um agrônomo consegue prever com exatidão o rendimento se ele 
conhecer os valores das variáves à direita da equação?
– Não. Por que?
• Erros de medição
• Influência de outros fatores
– Há uma variabilidade “intrínseca” ou aleatória
Regressão x Causação
• Kendall e Stuart: as ideias de causação devem se 
originar de alguma teoria
• Rendimento causa chuva ou chuva causa rendimento?
• O que o faz acreditar na segunda?
– Senso comum
– Não poder controlar a pluviosidade por meio de uma variação 
no rendimento da lavoura
• Relação estatística não implica logicamente causação
• A causação irá depender de considerações a priori ou 
teóricas
Regressão x Correlação
• Correlação
– Não há diferença entre variável dependente e explanatória
– As duas variáveis são aleatória
– Correlação entre notas de estatística e matemática
• Regressão
– Há uma assimetria no tratamento das variáveis
• Dependente: estatística, aleatória, estocástica, tem distribuição de 
probabilidade
• Independente: tem valores fixos em amostras repetidas (ex: alturas)
Mede a força ou grau
de associação linear
entre duas variáveis
Tentamos prever o 
valor médio de uma 
variável com base nos valores
fixos de outras variáveis
Terminologia e Notação
• Ver quadro da pag. 18
• Análise de regressão simples:
• Análise de regressão múltipla:
Terminologia e Notação
• Variável aleatória: (ou estocástica) – aquela que pode 
assumir qualquer valor, + ou - , dentro de um conjunto 
de valores com uma dada probabilidade.
Y Variável dependente
Xk Variável explicativa (X1, X2, ... , Xk)
N
No. total de observações na população
T
n
No. total de observações na amostra
t
i
Subscrito – dados de corte transversal, coletados em 
um ponto no tempo
t
Subscrito – dados de séries temporais, coletados ao 
longo de um intervalo de tempo
Tipos de Dados
• Séries Temporais
– A variável assume valores em diferentes momentos do tempo
– Cotações intra-diárias de ações, receitas mensais, lucros 
anuais
– Estacionária: quando a média e a variância não variam 
sistematicamente ao longo do tempo
• Corte Transversal
– Variáveis coletadas em um mesmo momento no tempo
– Lucro líquido das empresas siderúrgicas em 2010
– Heterogeneidade pode ser um problema (ver tab. 1.1 e fig. 
1.6)
Tipos de Dados
• Dados combinados
– Ver tab. 1.2 do exercício 1.1
– O IPC de cada país no período 73-97 é uma série temporal
– Os dados dos 7 países em cada ano é um corte transversal
• Dados em painel (longitudinais ou de micropainel)
– Uma mesma unidade em corte transversal é pesquisada ao 
longo do tempo
Fontes de Dados
• Economática
• Thomson Reuters
• CVM
• BM&FBovespa
• IBGE
• Banco Central
• Sites de empresas
Exatidão dos Dados
• A maioria dos dados não são experimentais por 
natureza, há possibilidade de erros de observação, 
intencionais ou não
• Mesmo em dados experimentais: erros de medição
• Questionários: 40% de resposta – viés de seletividade
“Os resultados de sua pesquisa terão a mesma 
qualidade dos dados coletados”
Escalas de Medição das Variáveis
• Escala nominal
– Sexo, estado civil
– Para associar observações a categorias específicas
• Escala ordinal
– Classe de renda, nível educacional
– É possível ordenar
• Escala de intervalo
– É possível ordenar e comparar
– Os intervalos são iguais
– Ex.: latitude e longitude
• Escala de razão
– A razão (X1/X2) e a distância (X1 – X2) são significativas
– É possível ordenar
– É possível comparar
– Tem um zero real
Stevens (1946)
Stevens (1946)
Capítulo 2 – Análise de Regressão com 
Duas Variáveis
Algumas ideias básicas
Fonte: GUJARATI; D. N. Econometria Básica: 4ª Edição. 
Rio de Janeiro. Elsevier- Campus, 2006
Tabela 2.1
• Grupos de renda => valores fixos de X
• Y varia para cada valor fixo de X
• O valor médio de Y aumenta com o aumento da renda
– Para arenda mensal de $80 => consumo médio de $65
– São 10 valores médios para as 10 classes de renda
Valores esperados condicionais
E(Y | X)
Tabela 2.1
• Valor esperado incondicional
– E(Y) = soma dos 60 dados de consumo dividido por 60
– Incondicional pois não leva em consideração os diferentes 
níveis de renda
“Qual o valor esperado das despesas de consumo semanais médias 
de uma família?”
“Qual o valor esperado das despesas de consumo semanais de uma 
família cuja renda mensal é, digamos, de $140?”
$ 121,20
$ 101
LRP
• LRP = Linha de Regressão Populacional
Uma curva de regressão populacional é o lugar geométrico das 
médias condicionais da variável dependente para os valores 
fixados da variável explanatória.
Ver fig. 2.2
Conceito de Regressão Populacional
Cada média condicional E(Y | Xi) é uma função de Xi, 
onde Xi é um dado valor de X.
E(Y | Xi) = f(Xi) :função de esperança condicional FEC
:função de regressão populacional FRP
Qual a forma assumida pela função f(Xi)?
Conceito de Regressão Populacional
Qual a forma assumida pela função f(Xi)?
intercepto
coeficiente angular
Parâmetros desconhecidos, mas fixos
Função de regressão populacional
Modelo de regressão populacional
Regressão linear populacional
O significado do termo LINEAR
São lineares nos 
parâmetros
O significado do termo LINEAR
O significado do termo LINEAR
• A linearidade relevante para a teoria da regressão é a 
nos parâmetros
Linear nos 
parâmetros?
Linear nas variáveis?
Sim Não
Sim MRL MRL
Não MRNL MRNL
Especificação estocástica da FRP
• O que podemos dizer sobre os gastos de consumo de 
uma dada família e um dado nível de renda?
Yi = E(Y|Xi) + ui
ui = Yi – E(Y|Xi)
- Desvio de um Yi individual em torno de seu valor
esperado
- Distúrbio estocástico
- Termo de erro estocástico
(1)
Especificação estocástica da FRP
Yi = E(Y|Xi) + ui (1)
Gasto médio de consumo
de todas as famílias com
a mesma renda
= elemento sistemático ou
determinístico
Elemento aleatório ou não
sistemático = representa (é uma
proxy) de todas as variáveis
omitidas ou negligenciadas que
podem afetar Y mas não foram
incluídas nos modelos de 
Regressão.
Especificação estocástica da FRP
Yi = E(Y|Xi) + ui
E(Yi|Xi) = E[E(Y|Xi)] + E(ui|Xi)
=> E(ui|Xi) = 0
=
A pressuposição de que a linha de regressão passa pelas médias
condicionais de Y => que os valores médios condicionais de ui
(condicionais a um dado X) são iguais a zero.
O significado do termo de erro estocástico
• Caráter vago da teoria
– ui é um substituto para todas as variáveis excluídas ou 
omitidas do modelo
• Falta de dados disponíveis
– Ex.: no caso do consumo, a riqueza das famílias
• Variáveis essenciais x variáveis periféricas (com pouca 
influência)
• Caráter intrinsicamente aleatório do comportamento 
humano
• Variáveis proxy pouco adequadas
– Ex.: endividamento, valor de mercado
O significado do termo de erro estocástico
• Princípio da parcimônia
– Navalha de Occam: o modelo de regressão deve ser o mais 
simples possível
• Forma funcional equivocada
– Quando é possível inferir a forma funcional a partir de um 
gráfico => só no modelo de regressão linear simples
Função de Regressão Amostral
Estimador de β2
Estimador de β1
Estimador de E(Y|Xi)
Estimador = estatística (amostral) = estimativa
Forma Estocástica da FRA
Estimador de ui
Capítulo 3 – Modelo de Regressão de 
Duas Variáveis
O Problema da Estimação
Fonte: GUJARATI; D. N. Econometria Básica: 4ª Edição. 
Rio de Janeiro. Elsevier- Campus, 2006
Método dos Mínimos Quadrados 
Ordinários - MQO
• Recordemos a FRP de duas variáveis:
𝑌𝑖 = 𝛽1 + 𝛽2𝑋𝑖 + 𝑢𝑖
• Como esta não pode ser observada diretamente, temos 
que estimá-la a partir da FRA:
𝑌𝑖 = 𝛽1 + 𝛽2𝑋𝑖 + 𝑢𝑖
= 𝑌𝑖 + 𝑢𝑖
• Podemos escrevê-la da seguinte forma:
 𝑢𝑖 = 𝑌𝑖 − 𝑌𝑖
= 𝑌𝑖 − 𝛽1 + 𝛽2𝑋𝑖
• E agora?
Método dos Mínimos Quadrados 
Ordinários - MQO
• 1ª. sugestão: escolher a FRA tal que 𝑢𝑖 = 𝑌𝑖 − 𝑌𝑖
– Problema: a soma algébrica pode resultar em valor muito 
pequeno ou zero, mesmo que os pontos estejam muito 
dispersos em torno da reta ajustada (ver fig. 3.1)
• 2ª. sugestão: usar 𝑢𝑖
2 = 𝑌𝑖 − 𝑌𝑖
2
= 𝑌𝑖 − 𝛽1 + 𝛽2𝑋𝑖
2
 𝑢𝑖
2 = 𝑓 𝛽1, 𝛽2
Método dos Mínimos Quadrados 
Ordinários - MQO
 𝑢𝑖
2 = 𝑌𝑖 − 𝛽1 − 𝛽2𝑋𝑖
2
𝜕 𝑢𝑖
2
𝜕 𝛽1
= −2 𝑌𝑖 − 𝛽1 − 𝛽2𝑋𝑖 = 0
𝜕 𝑢𝑖
2
𝜕 𝛽2
= −2 𝑌𝑖 − 𝛽1 − 𝛽2𝑋𝑖 𝑋𝑖 = 0
(1)
(2)
(1) e (2) são as Equações Normais
Método dos Mínimos Quadrados 
Ordinários - MQO
• Resolvendo o sistema de equações:
 𝛽2 =
 𝑋𝑖 − 𝑋 𝑌𝑖 − 𝑌
 𝑋𝑖 − 𝑋 2
=
 𝑥𝑖𝑦𝑖
 𝑥𝑖
2
 𝛽1 = 𝑌 − 𝛽2 𝑋
MQO – Propriedades Numéricas
Obs.: não dependem da forma como os dados são gerados
I. São calculados a partir de quantidades observáveis 
(isto é, amostrais)
II. São estimadores pontuais
III. Obtidos os estimadores, a linha de regressão pode ser 
facilmente obtida. A linha de regressão tem as 
seguintes propriedades:
Propriedades da Linha de Regressão
1. Passa pelas médias amostrais 𝑋 e 𝑌 e pode ser escrita 
como 𝑌 = 𝛽1 + 𝛽2 𝑋
2. O valor médio dos Y estimados é igual ao valor médio 
dos Y observados
 𝑌𝑖 = 𝛽1 + 𝛽2𝑋𝑖
 𝑌𝑖 = 𝑌 − 𝛽2 𝑋 1 +
 𝛽2𝑋𝑖
 𝑌𝑖 = 𝑌 − 𝛽2 𝑋𝑖 − 𝛽2 𝑋 aplicando o somatório 
e dividindo por n
 𝑌𝑖
𝑛
=
 𝑌
𝑛
− 𝛽2 𝑋𝑖 − 𝑋
 𝑌 = 𝑌
Propriedades da Linha de Regressão
3. O valor médio dos resíduos é igual a zero
Da primeira equação normal:
−2 𝑌𝑖 − 𝛽1 − 𝛽2𝑋𝑖 = 0
−2 𝑢𝑖 = 0 𝑢 = 0
Por causa disso a FRA pode ser escrita na forma de 
desvios em relação à média:
1º - aplicando somatório em 𝑌𝑖 = 𝛽1 + 𝛽2𝑋𝑖 + 𝑢𝑖 (1)
 𝑌𝑖
𝑖
= 𝑛 𝛽1 + 𝛽2 𝑋𝑖 + 𝑢𝑖
0
Propriedades da Linha de Regressão
2º - dividindo por n
 𝑌 = 𝛽1 + 𝛽2 𝑋 (2)
3º. – fazendo (1) em (2)
𝑌𝑖 − 𝑌 = 𝛽2 𝑋𝑖 − 𝑋 + 𝑢𝑖 ou
𝑦𝑖 = 𝛽2𝑥𝑖 + 𝑢𝑖 <= formato de desvio 𝛽1 não aparece
FRA: 𝑦𝑖 = 𝛽2𝑥𝑖 + 𝑢𝑖
Propriedades da Linha de Regressão
4º - 𝑢𝑖 não são correlacionados com 𝑌𝑖
A partir do formato de desvio: 
 𝑦𝑖 = 𝛽2𝑥𝑖 (x 𝑢𝑖) e somatório
 𝑦𝑖 𝑢𝑖 = 𝛽2 𝑥𝑖 𝑦𝑖 − 𝛽2𝑥𝑖
 𝑦𝑖 𝑢𝑖 = 𝛽2 𝑥𝑖𝑦𝑖 − 𝛽2
2 𝑥𝑖
2 mas 𝛽2 =
 𝑥𝑖𝑦𝑖
 𝑥𝑖
2
 𝑦𝑖 𝑢𝑖 = 𝛽2
2 𝑥𝑖
2 − 𝛽2
2 𝑥𝑖
2
 𝑦𝑖 𝑢𝑖 = 0 𝑌𝑖 − 𝑌 𝑢𝑖 = 0 é a covariância de 𝑌𝑖 com 
 𝑢𝑖
Propriedades da Linha de Regressão
4º - 𝑢𝑖 não são correlacionados com 𝑋𝑖, isto é, 𝑢𝑖𝑋𝑖 = 0
Da 2ª. Equação normal:
−2 𝑌𝑖 − 𝛽1 − 𝛽2𝑋𝑖 𝑋𝑖 = 0
 𝑢𝑖
Premissas subjacentes ao MQO
• Necessárias para que possamos fazer inferências
MLRC – Modelo de Regressão Linear Clássico
Premissa 1: o modelo de regressão é linear nos 
parâmetros
Premissa 2: os valores de X são fixos em amostras 
repetidas, ou seja, X é não estocástico. Nossa análise de 
regressão é condicional aos valores de X.
Premissa 3: o valor médio do termo de erro ui é zero. 
E(ui|Xi) = 0
Os fatores implícitos que afetam ui não afetam 
sistematicamente o valor médio de Y.
Premissas subjacentes ao MQO
MLRC – Modelo de Regressão Linear Clássico
Se E(ui|Xi) = γ temos um problema de identificação:
E(Yi|Xi) = β1 + β2Xi + ui
E[E(Yi|Xi)] = E(β1|Xi)+ E(β2Xi|Xi)+ E(ui|Xi)
E(Yi|Xi) = β1 + β2Xi + γ
E(Yi|Xi) = (β1 + γ) + β2Xi
E(Yi|Xi) = β’1 + β2Xi 
Ao estimar esse modelo obtemos infinitas soluções para 
β1 e γPremissas subjacentes ao MQO
MLRC – Modelo de Regressão Linear Clássico
Premissa 4: homocedasticidade de ui
Var(ui|Xi) = E[ui – E(ui|Xi)]
2
Var(ui|Xi) = σ
2
Se for heterocedástico => 𝑉𝑎𝑟 𝑢𝑖 𝑋𝑖 = 𝜎𝑖
2
As variâncias condicionais de Yi também são 
homocedásticas.
Var(Yi|Xi) = σ
2
Premissas subjacentes ao MQO
MLRC – Modelo de Regressão Linear Clássico
Premissa 5: não há autocorrelação entre os termos de 
erro
𝑐𝑜𝑣 𝑢𝑖 , 𝑢𝑗 = 0 ∀ 𝑖 ≠ 𝑗
Premissa 6: covariância entre ui e Xi é igual a zero
𝑐𝑜𝑣 𝑢𝑖 , 𝑋𝑖 = 0 𝐸 𝑢𝑖𝑋𝑖 = 0
– Se X é não estocástico essa premissa é satisfeita automaticamente, uma vez 
que nesse caso a covariâcia entre o erro e X é necessariamente zero.
– Importante para que se possa avaliar o efeito isolado de X sobre Y.
– Importante porque se X forem aleatórios ainda assim a teoria da regressão 
será aplicável desde que os X não sejam correlacionados com os termos de 
erro.
Premissas subjacentes ao MQO
MLRC – Modelo de Regressão Linear Clássico
Premissa 7: n deve ser maior que o número de 
parâmetros a serem estimados
Premissa 8: variabilidade dos valores de X – “as 
variáveis precisam variar”
 𝛽2 =
 𝑥𝑖𝑦𝑖
 𝑥𝑖
2
Premissa 9: o modelo de regressão está especificado na 
forma correta (ver eq. 3.2.7 e 3.2.8 e fig. 3.7)
Premissa 10: (para modelos com mais de 2 variáveis) não 
há relações lineares perfeitas entre as variáveis 
explanatórias
Precisão ou erros-padrão das estimativas 
MQO
𝑣𝑎𝑟 𝛽2 =
𝜎2
 𝑥𝑖
2 𝑣𝑎𝑟 𝛽1 =
 𝑋𝑖
2
𝑛 𝑥𝑖
2 𝜎
2
Onde 𝜎2 é a variância homocedástica de ui
Obs.:
‒ Quanto maior a variação nos valores de Xi maior a 
precisão da estimativa de 𝛽2
‒ Com o aumento de n também aumenta a precisão
Precisão ou erros-padrão das estimativas 
MQO
Se 𝜎2 é desconhecido pode ser estimado por
 𝜎2 =
 𝑢𝑖
2
𝑛 − 2
 𝑢𝑖
2= SQR = soma dos quadrados dos resíduos
 𝜎 =
 𝑢𝑖
2
𝑛 − 2
É o erro padrão da estimativa, é o desvio padrão dos 
valores de Y em relação à linha de regressão. Uma 
medida da “qualidade do ajustamento”.
Teorema de Gauss-Markov
• 𝛽2 é dito o melhor estimador linear não tendencioso de 
β2 se:
1. É linear, por exemplo, em Y
2. É não tendencioso => E( 𝛽2) = β2
3. É eficiente, ou seja, entre todos os estimadores lineares é o 
de menor variância (ver fig. 3.8)
Ver propriedades dos estimadores na pag. 723
Qualidade do ajustamento
• r2 no caso de regressão com duas variáveis
• R2 no caso de regressão múltipla = coeficiente de determinação
Xi
Y
X
Yi
STQ = (Yi - Y)
2
SQR = (Yi - Yi )
2

SQReg = (Yi - Y)
2

_
_
_
Y

Y
Y
_
Y

Qualidade do Ajustamento
𝑌𝑖 = 𝑌𝑖 + 𝑢𝑖
(𝑌𝑖 − 𝑌)
2= ( 𝑌𝑖 − 𝑌)
2+(𝑌𝑖 − 𝑌𝑖)
2
𝑆𝑇𝑄 = 𝑆𝑄𝐸 + 𝑆𝑄𝑅 ÷ 𝑆𝑇𝑄
1 =
𝑆𝑄𝐸
𝑆𝑇𝑄
+
𝑆𝑄𝑅
𝑆𝑇𝑄
1 = 𝑟2 +
𝑆𝑄𝑅
𝑆𝑇𝑄
𝑟2 =
𝑆𝑄𝐸
𝑆𝑇𝑄
=
 ( 𝑌𝑖 − 𝑌)
2
 (𝑌𝑖 − 𝑌)2
=
 (𝑌𝑖 − 𝑌𝑖)
2
 (𝑌𝑖 − 𝑌)2
=
 𝑢𝑖
2
 (𝑌𝑖 − 𝑌)2
Qualidade do Ajustamento
𝑟2 = 1 −
𝑆𝑄𝑅
𝑆𝑇𝑄
• Mede a proporção ou percentual da variação total de Y
explicada pelo modelo de regressão
• No modelo de regressão linear simples, o R2 é igual ao 
quadrado do coeficiente de correlação entre X e Y
𝑟2 = 𝑟𝑥𝑦
2
Coeficiente de determinação amostral
Qualidade do Ajustamento
• No modelo de regressão linear simples, o R2 é igual ao 
quadrado do coeficiente de correlação entre X e Y
𝑟2 = 𝑟𝑥𝑦
2
0 ≤ 𝑟2 ≤ 1
Ajuste perfeito
 𝑌𝑖 = 𝑌𝑖
Sem relação linear
entre Y e X
 𝑌𝑖 = 𝑌
Coeficiente de Correlação Amostral - r
1. Pode ser + ou –
2. −1 ≤ r ≤ 1
3. Simétrica 𝑟𝑥𝑦 = 𝑟𝑦𝑥
4. Independe da escala 
𝑟𝑥𝑦 = 𝑟𝑥∗𝑦∗ onde 𝑋𝑖
∗ = 𝑎𝑋𝑖 + 𝑐 e 𝑌𝑖
∗ = 𝑏𝑌𝑖 + 𝑑
5. Se X e Y são independentes rxy = 0
mas rxy = 0 não implica independência
5. Não implica relação de causa e efeito
6. Não tem sentido para descrever relações não lineares
Capítulo 4 – Modelo Normal de 
Regressão Linear Clássico
MNRLC
Fonte: GUJARATI; D. N. Econometria Básica: 4ª Edição. 
Rio de Janeiro. Elsevier- Campus, 2006
Até aqui...
• Com o auxílio do método MQO conseguimos estimar 
β1, β2, σ
2.
• Sob as premissas do MRLC vimos que os estimadores 
desses parâmetros 𝛽1, 𝛽2 e 𝜎
2 apresentam propriedades 
estatísticas desejáveis tais como não tendenciosidade, 
variância mínima etc...
• Falta agora fazer os testes de hipóteses necessários às 
inferências sobre a FRP.
• Quão longe 𝛽1, 𝛽2 e 𝜎
2 estão dos parâmetros 
populacionais β1, β2, σ
2?
• Para isso precisamos descobrir as distribuições de 
probabilidade de 𝛽1, 𝛽2 e 𝜎
2.
 𝛽2 =
 𝑥𝑖𝑦𝑖
 𝑥𝑖
2
Do numerador:
 𝑥𝑖𝑦𝑖 = 𝑥𝑖 𝑌𝑖 − 𝑌 = 𝑥𝑖𝑌𝑖 − 𝑌 𝑥𝑖
= 𝑥𝑖𝑌𝑖 − 𝑌 𝑋𝑖 − 𝑋
= 𝑥𝑖𝑌𝑖
Daí: 𝛽2 =
 𝑥𝑖𝑦𝑖
 𝑥𝑖
2 =
 𝑥𝑖𝑌𝑖
 𝑥𝑖
2 = 𝑘. 𝑌𝑖
• Como pressupomos que X é não estocástico, nossa 
análise de regressão é condicionada aos valores fixos de 
Xi.
• 𝛽2 é uma função linear de Yi
𝑌𝑖 = 𝛽1 + 𝛽2𝑋𝑖 + 𝑢𝑖
 𝛽2 = 𝑘 𝛽1 + 𝛽2𝑋𝑖 + 𝑢𝑖
• Mas Xi é não estocástico, então a variação de 𝛽2 vai 
depender da variação de ui
• Como o MQO não faz qualquer pressuposição sobre a 
natureza probabilística de ui, não nos ajuda a fazer 
inferências a respeito da FRP a partir da FRA.
A premissa de normalidade de ui
• Normalidade de ui => MNRLC
𝑢𝑖~𝑁 0, 𝜎
2
Média: E(ui) = 0
Variância: 𝐸 𝑢𝑖 − 𝐸(𝑢𝑖)
2 = 𝐸 𝑢𝑖
2 = 𝜎2
Covariância: 𝑐𝑜𝑣 𝑢𝑖 , 𝑢𝑗 : 𝐸 𝑢𝑖 , 𝑢𝑗 = 0 ∀𝑖 ≠ 𝑗
𝑢𝑖 e 𝑢𝑗 se distribuem independentemente
𝑢𝑖~𝑁𝐼𝐷 0, 𝜎
2
Distribuído de maneira normal e independente
Por que a premissa de normalidade?
1. Porque como 𝛽1 e 𝛽2 são funções lineares de 𝑢𝑖 se 𝑢𝑖
estiver normalmente distribuído 𝛽1 e 𝛽2 também 
estarão.
• Esperamos que 𝑢𝑖 seja resultado da influência de variáveis 
omitidas ou negligenciadas e que esse efeito seja pequeno e 
aleatório.
• Pelo Teorema do Limite Central a soma de um grande 
número de variáveis aleatórias, independentes e com 
distribuição idêntica, tende à distribuição normal.
• Propriedade da distribuição Normal: qualquer função linear 
de variáveis com distribuição normal também é normalmente 
distribuída.
Por que a premissa de normalidade?
2. A distribuição normal é simples, envolve 2 parâmetros
3. Para amostras menores que 100 elementos a premissa 
de normalidade é fundamental. Permite recorrer aos 
testes t, F e χ2.
• Se o tamanho da amostra for suficientemente grande 
podemos relaxar a premissa de normalidade;
• Para amostras pequenas cabe verificar se a premissa é 
adequada.
Propriedades dos estimadores de MQO sob a 
premissa de normalidade
1. São não tendenciosos.
2. São eficientes – têm variância mínima.
3. São consistentes – à medida que n aumenta 
indefinidamente, os estimadores convergem para os 
verdadeiros valores da população.
4. 𝛽1~𝑁(𝛽1, 𝜎 𝛽1
2 ) onde 𝜎 𝛽1
2 =
 𝑋𝑖
2
𝑛 𝑥𝑖
2 𝜎
2
5. 𝛽2~𝑁(𝛽2, 𝜎 𝛽2
2 ) onde 𝜎 𝛽2
2 =
𝜎2
 𝑥𝑖
2
6. (𝑛 − 2)
 𝜎2
𝜎2
~χ𝑛−2
2
Propriedades dos estimadores de MQO sob a 
premissa de normalidade
7. A distribuição de ( 𝛽1 , 𝛽2) é independente de 𝜎
2.
8. 𝛽1 e 𝛽2 têm a variância mínima dentro de toda a classe 
de estimadores não tendenciosos, sejam lineares ou 
não lineares – são BUE.

Outros materiais