aula 11 28 09 e 04 10 2018 mOdulo iv regressao de duas variaveis estimacao de intervalos e testes de hipoteses

•

UFF

0

Maria Julia Gamboa

19/10/2018

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Econometria

6.470 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

MÓDULO IV- REGRESSÃO DE 
DUAS VARIÁVEIS: ESTIMAÇÃO 
DE INTERVALOS E TESTE DE 
HIPÓTESES
AULAS 11 
dia 28-09 e 04-10- 2018
DISCIPLINA:ECONOMETRIA 1 
PROFª: Graciela Profeta
4- MÓDULO IV-
4.4.– ANÁLISE DE REGRESSÃO E ANÁLISE DE VARIÂNCIA
Estudaremos a análise de regressão do ponto de vista da
análise de variância;
Recorrendo à seguinte identidade já conhecida:
σ𝒚𝒊
𝟐 = σෝ𝒚𝒊
𝟐 + σ ෝ𝒖𝒊
𝟐 → (101) σ𝒚𝒊
𝟐 = ෡𝜷𝟐
𝟐 σ𝒙𝒊
𝟐 + σ ෝ𝒖𝒊
𝟐 (101’)
O estudo desses elementos da STQ é conhecido como
Análise de Variância (ANOVA) do ponto de vista da
regressão;
STQ SQE SQR
4- MÓDULO IV-
4.4.– ANÁLISE DE REGRESSÃO E ANÁLISE DE VARIÂNCIA
Vale lembrar que a qualquer soma de quadrados
esta associado o seu gl. Assim para:
i) STQ tem-se n-1 gl;
ii) SQR tem-se n-2 gl; e,
iii) SQE tem-se 1 gl
Organizando as somas dos quadrados e os gl,
temos:
4- MÓDULO IV-
4.4.– ANÁLISE DE REGRESSÃO E ANÁLISE DE VARIÂNCIA
Considerando a tabela ANOVA, temos:
𝐹 =
𝑀𝑆𝑄 𝑑𝑒 𝑆𝑄𝐸
𝑀𝑆𝑄 𝑑𝑒 𝑆𝑄𝑅
→ 𝐹 =
ൗ
෡𝛽2
2 σ 𝑥𝑖
2
1
൘
σ ෝ𝑢𝑖
2
(𝑛−2)
→ 𝑭 =
෡𝜷𝟐
𝟐 σ 𝒙𝒊
𝟐
ෝ𝝈𝟐
(102)
4.4.– ANÁLISE DE REGRESSÃO E ANÁLISE DE VARIÂNCIA
Sabemos que 𝑢𝑖 são normalmente distribuídos e se 𝐻𝑜: 𝛽2 =
0, então a eq (102) segue a distribuição F com 1 gl no
numerador e (n-2) gl no denominador.
 Demostrando: 𝐹 =
෡𝛽2
2 σ 𝑥𝑖
2
ෝ𝜎2
Sabemos que 𝑍~𝑁(0,1), considerando o teorema 5.3 que
diz que: se 𝑍1, 𝑍2, … , 𝑍𝑛, são V.A. com distribuição normal e
independente, tais que 𝑍𝑖~𝑁 0,1 , isto é, uma variável
normal padronizada, então: σ𝑍𝑖
2 = 𝑍1
2 + 𝑍2
2 +⋯+ 𝑍𝑛
2, segue
a distribuição de 𝜒2 com n gl.
4.4.– ANÁLISE DE REGRESSÃO E ANÁLISE DE VARIÂNCIA
 Simbolicamente, σ𝑍𝑖
2~𝜒𝑛
2; temos:
𝑍1
2 =
෡𝛽2−𝛽2
2
σ 𝑥𝑖
2
𝜎2
, onde 𝑍1
2 ~ 𝜒1
2, 1 𝑔𝑙
𝑍2 = 𝑛 − 2
ෝ𝜎2
𝜎2
→ 𝑍2 =
σ ෝ𝑢𝑖
2
𝜎2
, onde 𝑍2 ~ 𝜒(𝑛−2)
2
Além disso, 𝑍2 se distribui de forma independente de 𝑍1
2.
Logo,
𝐹 =
ൗ𝑍1
2
1
ൗ
𝑍2
(𝑛−2)
→ 𝐹 =
෡𝛽2−𝛽2
2
σ 𝑥𝑖
2
𝜎2
1
σ ෝ𝑢𝑖
2
𝜎2
(𝑛−2)
→ 𝑭 =
෡𝜷𝟐
𝟐 σ 𝒙𝒊
𝟐
൘σ ෝ𝒖𝒊
𝟐
(𝒏−𝟐)
(103)
Como 𝛽2 = 0, temos
4.4.– ANÁLISE DE REGRESSÃO E ANÁLISE DE VARIÂNCIA
 Para que serve a razão F (eq. 103)?
 Observe que:
𝐸 መ𝛽2
2σ𝑥𝑖
2 = 𝜎2 + 𝛽2
2 σ𝑥𝑖
2 (104)
𝐸
σ ෝ𝑢𝑖
2
𝑛−2
= 𝐸 ො𝜎2 = 𝜎2 (105)
Portanto, se 𝑯𝟎: 𝜷𝟐 = 𝟎 as eq. (104) e(105) são iguais a 𝝈
𝟐.
Neste caso, pode-se afirmar que X não influência Y. Assim,
toda variação em Y decorre dos distúrbios aleatórios, 𝒖𝒊
Onde 𝛽2 e 𝜎 do lado direito das 
equações (104) e (105) são os 
verdadeiros parâmetros.
4.4.– ANÁLISE DE REGRESSÃO E ANÁLISE DE VARIÂNCIA
Por outro lado, se 𝛽2 ≠ 0, então (104) e (105) serão
diferentes e parte da variação de Y é explicada por
X.
Portanto, a razão F (eq. 103) proporciona um teste
da 𝑯𝒐: 𝜷𝟐 = 𝟎
 Para tanto, basta calcular F a partir da eq. (103) e
compará-lo ao seu valor tabelado (Tabela F)ao
nível de significância escolhido.
4.4.– ANÁLISE DE REGRESSÃO E ANÁLISE DE VARIÂNCIA
 Exemplo: Considere novamente o exemplo do consumo e da
renda. Temos que:
𝐹 =
𝑀𝑆𝑄 𝑑𝑒 𝑆𝑄𝐸
𝑀𝑆𝑄 𝑑𝑒 𝑆𝑄𝑅
→ 𝐹 =
8.552,73
42,159
→ 𝐹 = 202,87
4.4.– ANÁLISE DE REGRESSÃO E ANÁLISE DE VARIÂNCIA
Considerando 1 e 8 gl o valor p do teste F é 0,0000001
(obtido apenas em tabela eletrônica). Logo, como o valor
p é muito baixo, 𝑹𝑯𝟎 (𝜷𝟐 = 𝟎) . Neste caso, X afeta o
consumo (Y)
Conforme o Teorema 5.7, uma variável 𝑡 (𝑡 𝑑𝑒 𝑠𝑡𝑢𝑑𝑒𝑛𝑡) com
K gl tem distribuição F com 𝐾1 = 1 gl no numerador e 𝐾2 =
𝐾 gl no denominador. Então:
𝐹1,𝑘 = 𝑡𝑘
2
4.4.– ANÁLISE DE REGRESSÃO E ANÁLISE DE VARIÂNCIA
Então, no exemplo do consumo e da renda, o 𝑡 = 14,24,
usando 𝑡 =
෡𝛽2−𝛽2
𝑒𝑝 (෡𝛽2)
, dado 8 gl, temos que:
𝐹1,8 = 𝑡8
2 → 𝐹1,8 = (14,24)
2→ 𝐹1,8 = 202,87
Assim, podemos testar 𝑯𝟎 tanto pelo teste t quanto pelo
teste F.
Contudo, o teste t é mais adequado ao contexto de
regressão simples, enquanto o teste F tem sua maior
aplicabilidade ao contexto de regressão múltipla.
4- MÓDULO IV-
4.5– APLICAÇÃO DA ANÁLISE DE REGRESSÃO: O PROBLEMA DA PREVISÃO
Com base nos dados amostrais, conforme Tabela abaixo,
obtivemos a seguinte regressão:
෠𝑌𝑡 = 24,4545 + 0,5091𝑋𝑖 (106), onde ෠𝑌𝑡 é o
estimador do verdadeiro E(𝑌𝑖) correspondentes
a dado X.
 Que uso podemos dar a essa regressão
Histórica?
Previsão! Isto é, prever as despesas de
consumo futuras (Y) correspondentes a
algum nível de renda (X)
4.5– APLICAÇÃO DA ANÁLISE DE REGRESSÃO: O PROBLEMA DA PREVISÃO
 Há dois tipos de previsão:
1º ) Previsão do valor médio condicionado de Y correspondente
a um X selecionado, digamos 𝑋0
que chamamos de previsão média,
conforme figura ao lado.
 2º) Previsão de um valor
individual de Y correspondente
ao 𝑋0, que chamamos
de previsão individual.
4.5– APLICAÇÃO DA ANÁLISE DE REGRESSÃO: O PROBLEMA DA PREVISÃO
4.5.1- Previsão Média
Suponha que 𝑋0 = 100 e desejamos prever 𝐸 𝑌 𝑋0 = 100 .
Pode-se mostrar que a regressão histórica (eq. 106)
proporciona a estimativa pontual dessa previsão média do
seguinte modo:
෠𝑌𝑡 = 24,4545 + 0,5091𝑋𝑖→ ෠𝑌0 = 24,4545 + 0,5091 100 →
෠𝑌0 = 75,3645 (107)
 Como ෠𝑌0 é um estimador, é provável que este seja
diferente do seu verdadeiro valor. Assim, a diferença entre
os dois valores, dará o erro de previsão ou a projeção.
෠𝑌𝑡 = 24,4545 + 0,5091𝑋𝑖 (106), 
4.5– APLICAÇÃO DA ANÁLISE DE REGRESSÃO: O PROBLEMA DA PREVISÃO
4.5.1- Previsão Média
 Para avaliar tal projeção (tal erro) é necessário verificar a
distribuição amostral de ෠𝑌0.
É possível mostrar que ෠𝑌0 = መ𝛽1 + መ𝛽2𝑋0 → ෠𝑌0 = 75,3645 (eq. 107)
tem distribuição com média (𝛽1 + 𝛽2𝑋0) e variância dada
por:
𝒗𝒂𝒓 ෡𝒀𝟎 = 𝝈
𝟐 𝟏
𝒏
+
𝑿𝟎−ഥ𝑿
𝟐
σ 𝒙𝒊
𝟐 (108)
Para quem desejar conferir a demonstração, ver apêndice
5A
4.5– APLICAÇÃO DA ANÁLISE DE REGRESSÃO: O PROBLEMA DA PREVISÃO
 4.5.1- Previsão Média
 Substituindo 𝜎2 pelo seu estimador não tendencioso, isto é: ො𝜎2,
temos:
𝒕 =
෡𝒀𝟎−(𝜷𝟏+𝜷𝟐𝑿𝟎)
𝒆𝒑(෡𝒀𝟎)
(113)
onde 𝑡 segue distribuição 𝑡 com n-2 gl.
Portanto, a distribuição 𝒕 pode ser usada para obter intervalos
de confiança para a verdadeira 𝑬(𝒀𝟎|𝑿𝟎) e testar hipóteses da
maneira habitual, tal como:
𝑣𝑎𝑟 ෠𝑌0 = 𝜎
2
1
𝑛
+
𝑋0 − ത𝑋
2
σ𝑥𝑖
2
4.5– APLICAÇÃO DA ANÁLISE DE REGRESSÃO: O PROBLEMA DA PREVISÃO
 4.5.1- Previsão Média
𝑃𝑟 መ𝛽1 + መ𝛽2𝑋0 − 𝑡 Τ𝛼 2𝑒𝑝 ෠𝑌0 ≤ 𝛽1 + 𝛽2𝑋0 ≤ መ𝛽1 + መ𝛽2𝑋0 + 𝑡 Τ𝛼 2𝑒𝑝 ෠𝑌0 = 1 − 𝛼 (114)
Onde o erro-padrão de ෠𝑌0 é obtido a partir da raiz quadrada de
𝒗𝒂𝒓 ෡𝒀𝟎 = 𝝈
𝟐
𝟏
𝒏
+
𝑿𝟎 − ഥ𝑿
𝟐
σ𝒙𝒊
𝟐
 Considerando a tabela a seguir, temos:
4.5– APLICAÇÃO DA ANÁLISE DE REGRESSÃO: O PROBLEMA DA PREVISÃO
Temos:
𝒗𝒂𝒓 ෡𝒀𝟎 = 𝟒𝟐, 𝟏𝟓𝟗
𝟏
𝟏𝟎
+
(𝟏𝟎𝟎−𝟏𝟕𝟎)𝟐
𝟑𝟑𝟎𝟎𝟎
→ 𝒗𝒂𝒓 ෡𝒀𝟎 = 𝟏𝟎, 𝟒𝟕𝟓𝟗 e 𝒆𝒑 ෡𝒀𝟎 = 𝟑, 𝟐𝟑𝟔
𝒗𝒂𝒓 ෡𝒀𝟎 = 𝝈
𝟐
𝟏
𝒏
+
𝑿𝟎 − ഥ𝑿
𝟐
σ𝒙𝒊
𝟐
Y estimado
4.5– APLICAÇÃO DA ANÁLISE DE REGRESSÃO: O PROBLEMA DA PREVISÃO
 4.5.1- Previsão Média
 Logo, o IC com 95% de probabilidade da verdadeira
𝐸(𝑌|𝑋0) é dada por:
75,3645 − 2,306 3,2366 ≤ 𝐸 𝑌0 𝑋 = 100 ≤ 75,3645 + 2,306 3,2366
Ou
65,9010 ≤ 𝐸 𝑌0 𝑋 = 100 ≤ 82,8381 (115)
Assim, dado 𝑋0 = 100, em amostras repetidas, 95 de cada
100 IC como o apresentado em (115) incluirão o verdadeiro
valor médio ( ෠𝑌0 = 75,3645 ).
𝑃𝑟 መ𝛽1 + መ𝛽2𝑋0 − 𝑡 Τ𝛼 2𝑒𝑝 ෠𝑌0 ≤ 𝛽1 + 𝛽2𝑋0 ≤ መ𝛽1 + መ𝛽2𝑋0 + 𝑡 Τ𝛼 2𝑒𝑝 ෠𝑌0= 1 − 𝛼
෠𝑌𝑡 = 24,4545 + 0,5091𝑋𝑖
4.5– APLICAÇÃO DA ANÁLISE DE REGRESSÃO: O PROBLEMA DA PREVISÃO
 4.5.1- Previsão Média
 A melhor estimativa individual do verdadeiro valor médio,
é, obviamente, a estimativa pontual igual a 75,3645
Se obtivermos IC a 95% como o apresentado em (115)
para cada valor de X (tabela anterior) obteremos o IC ou
banda de confiança como mostra a Figura a seguir.
4- MÓDULO IV-
4.5– APLICAÇÃO DA ANÁLISE DE REGRESSÃO: O PROBLEMA DA PREVISÃO
4.5– APLICAÇÃO DA ANÁLISE DE REGRESSÃO: O PROBLEMA DA PREVISÃO
4.5.2- Previsão Individual
 Se o interesse estar em prever um valor individual de Y, digamos
𝑌0, correspondente a um valor dado de X, seja 𝑋0, então, um
estimador BLUE para este caso também é dado por:
෠𝑌0 = መ𝛽1 + መ𝛽2𝑋0 → ෠𝑌0 = 75,3645 (107’)
Contudo, sua variância agora é dada por:
𝑣𝑎𝑟 𝑌0 − ෠𝑌0 = 𝐸 𝑌0 − ෠𝑌0
2
]
𝑣𝑎𝑟 𝑌0 − ෠𝑌0 = 𝜎
2 1 +
1
𝑛
+
(𝑋0− ത𝑋)
2
σ 𝑥𝑖
2 (116)
4.5– APLICAÇÃO DA ANÁLISE DE REGRESSÃO: O PROBLEMA DA PREVISÃO
 4.5.2- Previsão Individual
Substituindo 𝜎2 por ො𝜎2, temos:
𝑡 =
𝑌0− ෠𝑌0
𝑒𝑝(𝑌0−෠𝑌0)
(119) que também segue a distribuição 𝑡
Portanto a distribuição 𝑡 pode ser empregada para
fazer inferência sobre o verdadeiro 𝑌0.
4.5– APLICAÇÃO DA ANÁLISE DE REGRESSÃO: O PROBLEMA DA PREVISÃO
 4.5.2- Previsão Individual
 Recorrendo novamente ao exemplo do consumo e da renda,
vimos que a previsão pontual de 𝑌0 = 75,3645, a mesma de ෠𝑌0, e
a sua variância é de 52,6349.
𝑣𝑎𝑟 𝑌0 − ෠𝑌0 = 𝜎
2 1 +
1
𝑛
+
( 𝑋0 − ത𝑋 )
2
σ𝑥𝑖
2
𝑣𝑎𝑟 𝑌0 − ෠𝑌0 = 42,159 1 +
1
10
+
( 100 − 170)2
33000
→ 52,6349
Assim, o Intervalo de Confiança com 95% de confiança por 𝑌0
correspondente a 𝑋0 = 100 é:

4.5– APLICAÇÃO DA ANÁLISE DE REGRESSÃO: O PROBLEMA DA PREVISÃO
 4.5.2- Previsão Individual
𝟓𝟖, 𝟔𝟑𝟒𝟓 ≤ 𝒀𝟎|𝑿𝟎 = 𝟏𝟎𝟎 ≤ 𝟗𝟐, 𝟎𝟗𝟒𝟓 (120)
Considerando o IC dado em (120) e o dado por (115), observa-
se que o IC para 𝑌0 individual (120) é mais largo que aquele
obtido para o valor médio de 𝑌0 (115)
Assim, calculando IC como o dado
em (120) condicionados aos valores da tabela
ao lado, obtemos a banda de confiança de 95%
Para valores individuais de Y correspondentes
àqueles valores de X. Como mostra a Figura a
seguir:
𝟔𝟓, 𝟗𝟎𝟏𝟎 ≤ 𝑬 𝒀𝟎 𝑿 = 𝟏𝟎𝟎 ≤ 𝟖𝟐, 𝟖𝟑𝟖𝟏 (115) →
previsão pela média
4- MÓDULO IV-
4.5– APLICAÇÃO DA ANÁLISE DE REGRESSÃO: O PROBLEMA DA PREVISÃO
Á medida que 𝑋0 se 
afasta de ത𝑋 a banda 
se torna mais larga
4.6– A APRESENTAÇÃO DOS RESULTADOS DA ANÁLISE DE REGRESSÃO
 Há várias formas de se apresentar resultados de uma
regressão!
Usaremos a seguinte forma que ilustraremos a partir do
exemplo do consumo e da renda
(121)
Interpretação!
4.6– A APRESENTAÇÃO DOS RESULTADOS DA ANÁLISE DE REGRESSÃO
OBS 1: dado 𝐻0 = 𝛽1 = 0, tem-se 𝑡 =
෡𝛽1
𝑒𝑝(෡𝛽1)
→ 𝑡 =
24,4545
6,4138
→ 𝑡 = 3,812
OBS2: dado 𝐻0 = 𝛽2 = 0, tem-se 𝑡 =
෡𝛽2
𝑒𝑝(෡𝛽2)
→ 𝑡 =
0,5091
0,0357
→ 𝑡 = 14,261
(121)
4.7– AVALIAÇÃO DOS RESULTADOS DA ANÁLISE DE REGRESSÃO
 Qual é a “qualidade” do modelo ajustado?
Temos que definir critérios para responder a esta questão:
i) Os sinais dos coeficientes estimados ( መ𝛽1, መ𝛽2) estão de acordo
com a teoria?;
ii) A teoria diz que a relação deve ser estatisticamente
significativa?
iii) Até que ponto o modelo de regressão definido explica ou não
as variações na variável dependente? Geralmente, usa-se o 𝑟2.
iv) O modelo especificado satisfaz as premissas do MRLC.
4- MÓDULO IV-
4.7– AVALIAÇÃO DOS RESULTADOS DA ANÁLISE DE REGRESSÃO
Neste exemplo do consumo e da renda, pela
simplicidade do modelo, não examinaremos todas
as premissas do MRLC, contudo vamos verificar a
premissa da normalidade do termo de erro 𝑢𝑖.
Isto porque, para usarmos os testes 𝑡 𝑒 𝐹 , é
necessário que o termo de erro siga uma
distribuição normal.
4.7– AVALIAÇÃO DOS RESULTADOS DA ANÁLISE DE REGRESSÃO
 4.7.1- Teste de normalidade
Usaremos três abordagens: a) histogramas dos resíduos; b)
representação da probabilidade normal, um artifício
gráfico; e, c) teste Jarque-Bera;
A) Histograma dos resíduos: trata-se de um gráfico usado
para conhecer algo da forma da função de densidade de
probabilidade de uma variável aleatória.
Como a apresentada na Figura a seguir
4- MÓDULO IV-
4.7– AVALIAÇÃO DOS RESULTADOS DA ANÁLISE DE REGRESSÃO
4.7.1- Teste de normalidade
Observe que se a 
projeção de uma 
curva normal 
(formato de sino) se 
verificar, tem-se 
forte indício de uma 
distribuição normal 
para os resíduos
4.7– AVALIAÇÃO DOS RESULTADOS DA ANÁLISE DE REGRESSÃO
 B) Gráfico de probabilidade normal: A decisão quanto a
distribuição normal deve considerar o formato do gráfico.
Assim, se o gráfico se
Apresentar como uma linha reta,
A variável (ො𝑢𝑖) provém de uma
distribuição normal
Esse é o gráfico do resíduo da 
regressão consumo-renda
4.7– AVALIAÇÃO DOS RESULTADOS DA ANÁLISE DE REGRESSÃO
 C) Teste de normalidade de Jarque-Bera (JB): Trata-se de um
teste assintótico ou de grande amostra. Também parte dos
resíduos de MQO.
Esse teste calcula 1º a assimetria (S)→ 𝑺 =
𝑬 ( 𝑿−𝝁 )𝟑
𝝈𝟑
e a curtose
(K)→ 𝑲 =
𝑬 ( 𝑿−𝝁 )𝟒
𝑬 ( 𝑿−𝝁 )𝟐
𝟐 dos resíduos de MQO e usa o seguinte teste
estatístico:
𝐉𝑩 = 𝒏
𝑺𝟐
𝟔
+
(𝑲−𝟑)𝟐
𝟐𝟒
(122)
4.7– AVALIAÇÃO DOS RESULTADOS DA ANÁLISE DE REGRESSÃO
C) Teste de normalidade Jarque-Bera (JB):
Para uma variável normalmente distribuída, temos que S=0 e
K=3.
Portanto, o teste JB de normalidade é um teste de hipótese
conjunta de que S e K são iguais a 0 (zero) e 3 (três),
respectivamente. Neste caso, espera-se que JB = 0
Considerando 𝑯𝟎 = 𝒐𝒔 𝒓𝒆𝒔í𝒅𝒖𝒐𝒔 𝒔ã𝒐 𝒏𝒐𝒓𝒎𝒂𝒍𝒎𝒆𝒏𝒕𝒆 𝒅𝒊𝒔𝒕𝒓𝒊𝒃𝒖í𝒅𝒐𝒔 ,
JB demostraram que, assintoticamente (n grande), a estatística
JB segue a distribuição de 𝜒2 com (n-2) gl.
𝐉𝑩 = 𝒏
𝑺𝟐
𝟔
+
(𝑲 − 𝟑)𝟐
𝟐𝟒
4.7– AVALIAÇÃO DOS RESULTADOS DA ANÁLISE DE REGRESSÃO
C) Teste de normalidade Jarque-Bera (JB):
Assim, se o valor p calculado para a estatística JB for
suficientemente pequeno (𝑝 < 0,10) então 𝑅𝐻0.
EA 5 (período passado chamei de EA6 (enviado no
conexão iduff).
O exercício deve ser entregue na aula do dia 11-10-2018.