Baixe o app para aproveitar ainda mais
Prévia do material em texto
MÓDULO IV- REGRESSÃO DE DUAS VARIÁVEIS: ESTIMAÇÃO DE INTERVALOS E TESTE DE HIPÓTESES AULAS 11 dia 28-09 e 04-10- 2018 DISCIPLINA:ECONOMETRIA 1 PROFª: Graciela Profeta 4- MÓDULO IV- 4.4.– ANÁLISE DE REGRESSÃO E ANÁLISE DE VARIÂNCIA Estudaremos a análise de regressão do ponto de vista da análise de variância; Recorrendo à seguinte identidade já conhecida: σ𝒚𝒊 𝟐 = σෝ𝒚𝒊 𝟐 + σ ෝ𝒖𝒊 𝟐 → (101) σ𝒚𝒊 𝟐 = 𝜷𝟐 𝟐 σ𝒙𝒊 𝟐 + σ ෝ𝒖𝒊 𝟐 (101’) O estudo desses elementos da STQ é conhecido como Análise de Variância (ANOVA) do ponto de vista da regressão; STQ SQE SQR 4- MÓDULO IV- 4.4.– ANÁLISE DE REGRESSÃO E ANÁLISE DE VARIÂNCIA Vale lembrar que a qualquer soma de quadrados esta associado o seu gl. Assim para: i) STQ tem-se n-1 gl; ii) SQR tem-se n-2 gl; e, iii) SQE tem-se 1 gl Organizando as somas dos quadrados e os gl, temos: 4- MÓDULO IV- 4.4.– ANÁLISE DE REGRESSÃO E ANÁLISE DE VARIÂNCIA Considerando a tabela ANOVA, temos: 𝐹 = 𝑀𝑆𝑄 𝑑𝑒 𝑆𝑄𝐸 𝑀𝑆𝑄 𝑑𝑒 𝑆𝑄𝑅 → 𝐹 = ൗ 𝛽2 2 σ 𝑥𝑖 2 1 ൘ σ ෝ𝑢𝑖 2 (𝑛−2) → 𝑭 = 𝜷𝟐 𝟐 σ 𝒙𝒊 𝟐 ෝ𝝈𝟐 (102) 4.4.– ANÁLISE DE REGRESSÃO E ANÁLISE DE VARIÂNCIA Sabemos que 𝑢𝑖 são normalmente distribuídos e se 𝐻𝑜: 𝛽2 = 0, então a eq (102) segue a distribuição F com 1 gl no numerador e (n-2) gl no denominador. Demostrando: 𝐹 = 𝛽2 2 σ 𝑥𝑖 2 ෝ𝜎2 Sabemos que 𝑍~𝑁(0,1), considerando o teorema 5.3 que diz que: se 𝑍1, 𝑍2, … , 𝑍𝑛, são V.A. com distribuição normal e independente, tais que 𝑍𝑖~𝑁 0,1 , isto é, uma variável normal padronizada, então: σ𝑍𝑖 2 = 𝑍1 2 + 𝑍2 2 +⋯+ 𝑍𝑛 2, segue a distribuição de 𝜒2 com n gl. 4.4.– ANÁLISE DE REGRESSÃO E ANÁLISE DE VARIÂNCIA Simbolicamente, σ𝑍𝑖 2~𝜒𝑛 2; temos: 𝑍1 2 = 𝛽2−𝛽2 2 σ 𝑥𝑖 2 𝜎2 , onde 𝑍1 2 ~ 𝜒1 2, 1 𝑔𝑙 𝑍2 = 𝑛 − 2 ෝ𝜎2 𝜎2 → 𝑍2 = σ ෝ𝑢𝑖 2 𝜎2 , onde 𝑍2 ~ 𝜒(𝑛−2) 2 Além disso, 𝑍2 se distribui de forma independente de 𝑍1 2. Logo, 𝐹 = ൗ𝑍1 2 1 ൗ 𝑍2 (𝑛−2) → 𝐹 = 𝛽2−𝛽2 2 σ 𝑥𝑖 2 𝜎2 1 σ ෝ𝑢𝑖 2 𝜎2 (𝑛−2) → 𝑭 = 𝜷𝟐 𝟐 σ 𝒙𝒊 𝟐 ൘σ ෝ𝒖𝒊 𝟐 (𝒏−𝟐) (103) Como 𝛽2 = 0, temos 4.4.– ANÁLISE DE REGRESSÃO E ANÁLISE DE VARIÂNCIA Para que serve a razão F (eq. 103)? Observe que: 𝐸 መ𝛽2 2σ𝑥𝑖 2 = 𝜎2 + 𝛽2 2 σ𝑥𝑖 2 (104) 𝐸 σ ෝ𝑢𝑖 2 𝑛−2 = 𝐸 ො𝜎2 = 𝜎2 (105) Portanto, se 𝑯𝟎: 𝜷𝟐 = 𝟎 as eq. (104) e(105) são iguais a 𝝈 𝟐. Neste caso, pode-se afirmar que X não influência Y. Assim, toda variação em Y decorre dos distúrbios aleatórios, 𝒖𝒊 Onde 𝛽2 e 𝜎 do lado direito das equações (104) e (105) são os verdadeiros parâmetros. 4.4.– ANÁLISE DE REGRESSÃO E ANÁLISE DE VARIÂNCIA Por outro lado, se 𝛽2 ≠ 0, então (104) e (105) serão diferentes e parte da variação de Y é explicada por X. Portanto, a razão F (eq. 103) proporciona um teste da 𝑯𝒐: 𝜷𝟐 = 𝟎 Para tanto, basta calcular F a partir da eq. (103) e compará-lo ao seu valor tabelado (Tabela F)ao nível de significância escolhido. 4.4.– ANÁLISE DE REGRESSÃO E ANÁLISE DE VARIÂNCIA Exemplo: Considere novamente o exemplo do consumo e da renda. Temos que: 𝐹 = 𝑀𝑆𝑄 𝑑𝑒 𝑆𝑄𝐸 𝑀𝑆𝑄 𝑑𝑒 𝑆𝑄𝑅 → 𝐹 = 8.552,73 42,159 → 𝐹 = 202,87 4.4.– ANÁLISE DE REGRESSÃO E ANÁLISE DE VARIÂNCIA Considerando 1 e 8 gl o valor p do teste F é 0,0000001 (obtido apenas em tabela eletrônica). Logo, como o valor p é muito baixo, 𝑹𝑯𝟎 (𝜷𝟐 = 𝟎) . Neste caso, X afeta o consumo (Y) Conforme o Teorema 5.7, uma variável 𝑡 (𝑡 𝑑𝑒 𝑠𝑡𝑢𝑑𝑒𝑛𝑡) com K gl tem distribuição F com 𝐾1 = 1 gl no numerador e 𝐾2 = 𝐾 gl no denominador. Então: 𝐹1,𝑘 = 𝑡𝑘 2 4.4.– ANÁLISE DE REGRESSÃO E ANÁLISE DE VARIÂNCIA Então, no exemplo do consumo e da renda, o 𝑡 = 14,24, usando 𝑡 = 𝛽2−𝛽2 𝑒𝑝 (𝛽2) , dado 8 gl, temos que: 𝐹1,8 = 𝑡8 2 → 𝐹1,8 = (14,24) 2→ 𝐹1,8 = 202,87 Assim, podemos testar 𝑯𝟎 tanto pelo teste t quanto pelo teste F. Contudo, o teste t é mais adequado ao contexto de regressão simples, enquanto o teste F tem sua maior aplicabilidade ao contexto de regressão múltipla. 4- MÓDULO IV- 4.5– APLICAÇÃO DA ANÁLISE DE REGRESSÃO: O PROBLEMA DA PREVISÃO Com base nos dados amostrais, conforme Tabela abaixo, obtivemos a seguinte regressão: 𝑌𝑡 = 24,4545 + 0,5091𝑋𝑖 (106), onde 𝑌𝑡 é o estimador do verdadeiro E(𝑌𝑖) correspondentes a dado X. Que uso podemos dar a essa regressão Histórica? Previsão! Isto é, prever as despesas de consumo futuras (Y) correspondentes a algum nível de renda (X) 4.5– APLICAÇÃO DA ANÁLISE DE REGRESSÃO: O PROBLEMA DA PREVISÃO Há dois tipos de previsão: 1º ) Previsão do valor médio condicionado de Y correspondente a um X selecionado, digamos 𝑋0 que chamamos de previsão média, conforme figura ao lado. 2º) Previsão de um valor individual de Y correspondente ao 𝑋0, que chamamos de previsão individual. 4.5– APLICAÇÃO DA ANÁLISE DE REGRESSÃO: O PROBLEMA DA PREVISÃO 4.5.1- Previsão Média Suponha que 𝑋0 = 100 e desejamos prever 𝐸 𝑌 𝑋0 = 100 . Pode-se mostrar que a regressão histórica (eq. 106) proporciona a estimativa pontual dessa previsão média do seguinte modo: 𝑌𝑡 = 24,4545 + 0,5091𝑋𝑖→ 𝑌0 = 24,4545 + 0,5091 100 → 𝑌0 = 75,3645 (107) Como 𝑌0 é um estimador, é provável que este seja diferente do seu verdadeiro valor. Assim, a diferença entre os dois valores, dará o erro de previsão ou a projeção. 𝑌𝑡 = 24,4545 + 0,5091𝑋𝑖 (106), 4.5– APLICAÇÃO DA ANÁLISE DE REGRESSÃO: O PROBLEMA DA PREVISÃO 4.5.1- Previsão Média Para avaliar tal projeção (tal erro) é necessário verificar a distribuição amostral de 𝑌0. É possível mostrar que 𝑌0 = መ𝛽1 + መ𝛽2𝑋0 → 𝑌0 = 75,3645 (eq. 107) tem distribuição com média (𝛽1 + 𝛽2𝑋0) e variância dada por: 𝒗𝒂𝒓 𝒀𝟎 = 𝝈 𝟐 𝟏 𝒏 + 𝑿𝟎−ഥ𝑿 𝟐 σ 𝒙𝒊 𝟐 (108) Para quem desejar conferir a demonstração, ver apêndice 5A 4.5– APLICAÇÃO DA ANÁLISE DE REGRESSÃO: O PROBLEMA DA PREVISÃO 4.5.1- Previsão Média Substituindo 𝜎2 pelo seu estimador não tendencioso, isto é: ො𝜎2, temos: 𝒕 = 𝒀𝟎−(𝜷𝟏+𝜷𝟐𝑿𝟎) 𝒆𝒑(𝒀𝟎) (113) onde 𝑡 segue distribuição 𝑡 com n-2 gl. Portanto, a distribuição 𝒕 pode ser usada para obter intervalos de confiança para a verdadeira 𝑬(𝒀𝟎|𝑿𝟎) e testar hipóteses da maneira habitual, tal como: 𝑣𝑎𝑟 𝑌0 = 𝜎 2 1 𝑛 + 𝑋0 − ത𝑋 2 σ𝑥𝑖 2 4.5– APLICAÇÃO DA ANÁLISE DE REGRESSÃO: O PROBLEMA DA PREVISÃO 4.5.1- Previsão Média 𝑃𝑟 መ𝛽1 + መ𝛽2𝑋0 − 𝑡 Τ𝛼 2𝑒𝑝 𝑌0 ≤ 𝛽1 + 𝛽2𝑋0 ≤ መ𝛽1 + መ𝛽2𝑋0 + 𝑡 Τ𝛼 2𝑒𝑝 𝑌0 = 1 − 𝛼 (114) Onde o erro-padrão de 𝑌0 é obtido a partir da raiz quadrada de 𝒗𝒂𝒓 𝒀𝟎 = 𝝈 𝟐 𝟏 𝒏 + 𝑿𝟎 − ഥ𝑿 𝟐 σ𝒙𝒊 𝟐 Considerando a tabela a seguir, temos: 4.5– APLICAÇÃO DA ANÁLISE DE REGRESSÃO: O PROBLEMA DA PREVISÃO Temos: 𝒗𝒂𝒓 𝒀𝟎 = 𝟒𝟐, 𝟏𝟓𝟗 𝟏 𝟏𝟎 + (𝟏𝟎𝟎−𝟏𝟕𝟎)𝟐 𝟑𝟑𝟎𝟎𝟎 → 𝒗𝒂𝒓 𝒀𝟎 = 𝟏𝟎, 𝟒𝟕𝟓𝟗 e 𝒆𝒑 𝒀𝟎 = 𝟑, 𝟐𝟑𝟔 𝒗𝒂𝒓 𝒀𝟎 = 𝝈 𝟐 𝟏 𝒏 + 𝑿𝟎 − ഥ𝑿 𝟐 σ𝒙𝒊 𝟐 Y estimado 4.5– APLICAÇÃO DA ANÁLISE DE REGRESSÃO: O PROBLEMA DA PREVISÃO 4.5.1- Previsão Média Logo, o IC com 95% de probabilidade da verdadeira 𝐸(𝑌|𝑋0) é dada por: 75,3645 − 2,306 3,2366 ≤ 𝐸 𝑌0 𝑋 = 100 ≤ 75,3645 + 2,306 3,2366 Ou 65,9010 ≤ 𝐸 𝑌0 𝑋 = 100 ≤ 82,8381 (115) Assim, dado 𝑋0 = 100, em amostras repetidas, 95 de cada 100 IC como o apresentado em (115) incluirão o verdadeiro valor médio ( 𝑌0 = 75,3645 ). 𝑃𝑟 መ𝛽1 + መ𝛽2𝑋0 − 𝑡 Τ𝛼 2𝑒𝑝 𝑌0 ≤ 𝛽1 + 𝛽2𝑋0 ≤ መ𝛽1 + መ𝛽2𝑋0 + 𝑡 Τ𝛼 2𝑒𝑝 𝑌0= 1 − 𝛼 𝑌𝑡 = 24,4545 + 0,5091𝑋𝑖 4.5– APLICAÇÃO DA ANÁLISE DE REGRESSÃO: O PROBLEMA DA PREVISÃO 4.5.1- Previsão Média A melhor estimativa individual do verdadeiro valor médio, é, obviamente, a estimativa pontual igual a 75,3645 Se obtivermos IC a 95% como o apresentado em (115) para cada valor de X (tabela anterior) obteremos o IC ou banda de confiança como mostra a Figura a seguir. 4- MÓDULO IV- 4.5– APLICAÇÃO DA ANÁLISE DE REGRESSÃO: O PROBLEMA DA PREVISÃO 4.5– APLICAÇÃO DA ANÁLISE DE REGRESSÃO: O PROBLEMA DA PREVISÃO 4.5.2- Previsão Individual Se o interesse estar em prever um valor individual de Y, digamos 𝑌0, correspondente a um valor dado de X, seja 𝑋0, então, um estimador BLUE para este caso também é dado por: 𝑌0 = መ𝛽1 + መ𝛽2𝑋0 → 𝑌0 = 75,3645 (107’) Contudo, sua variância agora é dada por: 𝑣𝑎𝑟 𝑌0 − 𝑌0 = 𝐸 𝑌0 − 𝑌0 2 ] 𝑣𝑎𝑟 𝑌0 − 𝑌0 = 𝜎 2 1 + 1 𝑛 + (𝑋0− ത𝑋) 2 σ 𝑥𝑖 2 (116) 4.5– APLICAÇÃO DA ANÁLISE DE REGRESSÃO: O PROBLEMA DA PREVISÃO 4.5.2- Previsão Individual Substituindo 𝜎2 por ො𝜎2, temos: 𝑡 = 𝑌0− 𝑌0 𝑒𝑝(𝑌0−𝑌0) (119) que também segue a distribuição 𝑡 Portanto a distribuição 𝑡 pode ser empregada para fazer inferência sobre o verdadeiro 𝑌0. 4.5– APLICAÇÃO DA ANÁLISE DE REGRESSÃO: O PROBLEMA DA PREVISÃO 4.5.2- Previsão Individual Recorrendo novamente ao exemplo do consumo e da renda, vimos que a previsão pontual de 𝑌0 = 75,3645, a mesma de 𝑌0, e a sua variância é de 52,6349. 𝑣𝑎𝑟 𝑌0 − 𝑌0 = 𝜎 2 1 + 1 𝑛 + ( 𝑋0 − ത𝑋 ) 2 σ𝑥𝑖 2 𝑣𝑎𝑟 𝑌0 − 𝑌0 = 42,159 1 + 1 10 + ( 100 − 170)2 33000 → 52,6349 Assim, o Intervalo de Confiança com 95% de confiança por 𝑌0 correspondente a 𝑋0 = 100 é: 4.5– APLICAÇÃO DA ANÁLISE DE REGRESSÃO: O PROBLEMA DA PREVISÃO 4.5.2- Previsão Individual 𝟓𝟖, 𝟔𝟑𝟒𝟓 ≤ 𝒀𝟎|𝑿𝟎 = 𝟏𝟎𝟎 ≤ 𝟗𝟐, 𝟎𝟗𝟒𝟓 (120) Considerando o IC dado em (120) e o dado por (115), observa- se que o IC para 𝑌0 individual (120) é mais largo que aquele obtido para o valor médio de 𝑌0 (115) Assim, calculando IC como o dado em (120) condicionados aos valores da tabela ao lado, obtemos a banda de confiança de 95% Para valores individuais de Y correspondentes àqueles valores de X. Como mostra a Figura a seguir: 𝟔𝟓, 𝟗𝟎𝟏𝟎 ≤ 𝑬 𝒀𝟎 𝑿 = 𝟏𝟎𝟎 ≤ 𝟖𝟐, 𝟖𝟑𝟖𝟏 (115) → previsão pela média 4- MÓDULO IV- 4.5– APLICAÇÃO DA ANÁLISE DE REGRESSÃO: O PROBLEMA DA PREVISÃO Á medida que 𝑋0 se afasta de ത𝑋 a banda se torna mais larga 4.6– A APRESENTAÇÃO DOS RESULTADOS DA ANÁLISE DE REGRESSÃO Há várias formas de se apresentar resultados de uma regressão! Usaremos a seguinte forma que ilustraremos a partir do exemplo do consumo e da renda (121) Interpretação! 4.6– A APRESENTAÇÃO DOS RESULTADOS DA ANÁLISE DE REGRESSÃO OBS 1: dado 𝐻0 = 𝛽1 = 0, tem-se 𝑡 = 𝛽1 𝑒𝑝(𝛽1) → 𝑡 = 24,4545 6,4138 → 𝑡 = 3,812 OBS2: dado 𝐻0 = 𝛽2 = 0, tem-se 𝑡 = 𝛽2 𝑒𝑝(𝛽2) → 𝑡 = 0,5091 0,0357 → 𝑡 = 14,261 (121) 4.7– AVALIAÇÃO DOS RESULTADOS DA ANÁLISE DE REGRESSÃO Qual é a “qualidade” do modelo ajustado? Temos que definir critérios para responder a esta questão: i) Os sinais dos coeficientes estimados ( መ𝛽1, መ𝛽2) estão de acordo com a teoria?; ii) A teoria diz que a relação deve ser estatisticamente significativa? iii) Até que ponto o modelo de regressão definido explica ou não as variações na variável dependente? Geralmente, usa-se o 𝑟2. iv) O modelo especificado satisfaz as premissas do MRLC. 4- MÓDULO IV- 4.7– AVALIAÇÃO DOS RESULTADOS DA ANÁLISE DE REGRESSÃO Neste exemplo do consumo e da renda, pela simplicidade do modelo, não examinaremos todas as premissas do MRLC, contudo vamos verificar a premissa da normalidade do termo de erro 𝑢𝑖. Isto porque, para usarmos os testes 𝑡 𝑒 𝐹 , é necessário que o termo de erro siga uma distribuição normal. 4.7– AVALIAÇÃO DOS RESULTADOS DA ANÁLISE DE REGRESSÃO 4.7.1- Teste de normalidade Usaremos três abordagens: a) histogramas dos resíduos; b) representação da probabilidade normal, um artifício gráfico; e, c) teste Jarque-Bera; A) Histograma dos resíduos: trata-se de um gráfico usado para conhecer algo da forma da função de densidade de probabilidade de uma variável aleatória. Como a apresentada na Figura a seguir 4- MÓDULO IV- 4.7– AVALIAÇÃO DOS RESULTADOS DA ANÁLISE DE REGRESSÃO 4.7.1- Teste de normalidade Observe que se a projeção de uma curva normal (formato de sino) se verificar, tem-se forte indício de uma distribuição normal para os resíduos 4.7– AVALIAÇÃO DOS RESULTADOS DA ANÁLISE DE REGRESSÃO B) Gráfico de probabilidade normal: A decisão quanto a distribuição normal deve considerar o formato do gráfico. Assim, se o gráfico se Apresentar como uma linha reta, A variável (ො𝑢𝑖) provém de uma distribuição normal Esse é o gráfico do resíduo da regressão consumo-renda 4.7– AVALIAÇÃO DOS RESULTADOS DA ANÁLISE DE REGRESSÃO C) Teste de normalidade de Jarque-Bera (JB): Trata-se de um teste assintótico ou de grande amostra. Também parte dos resíduos de MQO. Esse teste calcula 1º a assimetria (S)→ 𝑺 = 𝑬 ( 𝑿−𝝁 )𝟑 𝝈𝟑 e a curtose (K)→ 𝑲 = 𝑬 ( 𝑿−𝝁 )𝟒 𝑬 ( 𝑿−𝝁 )𝟐 𝟐 dos resíduos de MQO e usa o seguinte teste estatístico: 𝐉𝑩 = 𝒏 𝑺𝟐 𝟔 + (𝑲−𝟑)𝟐 𝟐𝟒 (122) 4.7– AVALIAÇÃO DOS RESULTADOS DA ANÁLISE DE REGRESSÃO C) Teste de normalidade Jarque-Bera (JB): Para uma variável normalmente distribuída, temos que S=0 e K=3. Portanto, o teste JB de normalidade é um teste de hipótese conjunta de que S e K são iguais a 0 (zero) e 3 (três), respectivamente. Neste caso, espera-se que JB = 0 Considerando 𝑯𝟎 = 𝒐𝒔 𝒓𝒆𝒔í𝒅𝒖𝒐𝒔 𝒔ã𝒐 𝒏𝒐𝒓𝒎𝒂𝒍𝒎𝒆𝒏𝒕𝒆 𝒅𝒊𝒔𝒕𝒓𝒊𝒃𝒖í𝒅𝒐𝒔 , JB demostraram que, assintoticamente (n grande), a estatística JB segue a distribuição de 𝜒2 com (n-2) gl. 𝐉𝑩 = 𝒏 𝑺𝟐 𝟔 + (𝑲 − 𝟑)𝟐 𝟐𝟒 4.7– AVALIAÇÃO DOS RESULTADOS DA ANÁLISE DE REGRESSÃO C) Teste de normalidade Jarque-Bera (JB): Assim, se o valor p calculado para a estatística JB for suficientemente pequeno (𝑝 < 0,10) então 𝑅𝐻0. EA 5 (período passado chamei de EA6 (enviado no conexão iduff). O exercício deve ser entregue na aula do dia 11-10-2018.
Compartilhar