Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Aula 12 – Econometria Profa. Dra. Margarida Garcia de Figueiredo margaridagf@ufmt.br mgfiguei@gmail.com 07/08/2014 2 Violação da Pressuposição 7: MULTICOLINEARIDADE NATUREZA DA MULTICOLINEARIDADE A MULTICOLINEARIDADE É MESMO UM PROBLEMA? MÉTODOS DE DETECÇÃO MEDIDAS PRÁTICAS PARA AMENIZAR O PROBLEMA 3 Violação da Pressuposição 7: MULTICOLINEARIDADE NATUREZA DA MULTICOLINEARIDADE A MULTICOLINEARIDADE É MESMO UM PROBLEMA? MÉTODOS DE DETECÇÃO MEDIDAS PRÁTICAS PARA AMENIZAR O PROBLEMA 4 A NATUREZA DA MULTICOLINEARIDADE Multicolinearidade diz respeito à existência de relação linear entre os regressores (X1, X2, …, Xk) do modelo, tornando difícil ou impossível separar seus efeitos individuais sobre a variável dependente (Y) Diferentes graus de colinearidade: Baixa Colinearidade Colinearidade Muito alta Ausência de Colinearidade Colinearidade Perfeita Casos Extremos 5 A NATUREZA DA MULTICOLINEARIDADE Objetivo da análise de regressão: estudar o efeito individual de cada variável X sobre o comportamento da variável Y Premissa Básica: Ausência de colineridade 𝑌 = 𝛽0 + 𝜷𝟏𝑋1 + 𝜷𝟐𝑋2 + 𝜀 X1 X2 6 A NATUREZA DA MULTICOLINEARIDADE Diferentes níveis de colinearidade: Colinearidade Baixa Colinearidade Moderada Colinearidade Muito Alta 𝑌 = 𝛽0 + 𝜷𝟏𝑋1 + 𝜷𝟐𝑋2 + 𝜀 7 A NATUREZA DA MULTICOLINEARIDADE Estimação na presença de multicolinearidade: Colinearidade Perfeita Colinearidade Imperfeita, mas elevada Os coeficientes da regressão são indeterminados e seus erros-padrão são infinitos Os estimadores continuam sendo não- tendenciosos, consistentes e eficientes, ou seja, continuam sendo considerados BLUE 8 Violação da Pressuposição 7: MULTICOLINEARIDADE NATUREZA DA MULTICOLINEARIDADE A MULTICOLINEARIDADE É MESMO UM PROBLEMA? MÉTODOS DE DETECÇÃO MEDIDAS PRÁTICAS PARA AMENIZAR O PROBLEMA 9 A MULTICOLINEARIDADE É MESMO UM PROBLEMA? Mesmo que a multicolinearidade seja muito alta, os estimadores de MQO ainda guardarão a propriedade de melhores estimadores lineares não-tendenciosos (BLUE) O fato de a colinearidade não destruir a propriedade de variância mínima na classe de todos os estimadores lineares não-tendenciosos, não significa que a variância de um estimador de MQO seja necessariamente pequena em qualquer amostra dada. A multicolinearidade é essencialmente um fenômeno amostral: mesmo que duas ou mais variáveis X não estejam linearmente relacionadas em uma população, elas podem estar assim relacionadas em dada amostra. 10 CONSEQUÊNCIAS PRÁTICAS DA MULTICOLINEARIDADE 1. Embora sejam os melhores estimadores lineares não-tendenciosos, os estimadores de MQO na presença de alta colinearidade têm variância grande. 2. A razão t de um ou mais coeficientes tende a ser estatisticamente insignificante. 3. Embora a razão t de um ou mais coeficientes seja estatisticamente insignificante, o valor de R2 pode ser muito alto. 4. Os estimadores de MQO e seus erros-padrão podem ser sensíveis a pequenas alterações nos dados. A MULTICOLINEARIDADE É MESMO UM PROBLEMA? 11 De modo geral, a multicolinearidade vai estar presente no modelo, em pelo menos algum grau. Se o grau for bem baixo, ela não será considerada um problema. Porém, quando estiver presente em grau bastante elevado, as consequências práticas decorrentes desta multicolinearidade elevada poderão comprometer os resultados do modelo. A MULTICOLINEARIDADE É MESMO UM PROBLEMA? 12 Violação da Pressuposição 7: MULTICOLINEARIDADE NATUREZA DA MULTICOLINEARIDADE A MULTICOLINEARIDADE É MESMO UM PROBLEMA? MÉTODOS DE DETECÇÃO MEDIDAS PRÁTICAS PARA AMENIZAR O PROBLEMA 13 DETECÇÃO DA MULTICOLINEARIDADE A esse respeito, devemos ter em mente a seguinte advertência: 1. A multicolinearidade é uma questão de grau, e não de tipo. A distinção a ser feita não é quanto à presença ou ausência de multicolinearidade, mas sim entre seus vários graus. 2. Sabemos que a multicolinearidade é uma característica da amostra e não da população. Portanto, não fazemos testes de multicolinearidade, mas sim, medimos seu grau em qualquer amostra específica. Na realidade, o que temos são algumas regras práticas para detecção da multicolinearidade. Vejamos algumas delas a seguir: 14 DETECÇÃO DA MULTICOLINEARIDADE REGRAS PRÁTICAS PARA DETECÇÃO DA MULTICOLINEARIDADE: 1. R2 alto, mas poucas razões t significativas 2. Regressões Auxiliares 2.1. Teste F 2.2. Regra prática de Klien 2.3. Fator de Inflação da Variância (FIV) 3. Correlações Parciais 15 REGRAS PARA DETECÇÃO DA MULTICOLINEARIDADE 1. R2 alto, mas poucas razões t significativas Este é um sintoma “clássico” de multicolinearidade. Quando verificamos um valor elevado para o R2, na maioria dos casos o teste F indicará que o modelo é estatisticamente significativo de maneira global. Entretanto, se os testes t mostrarem que nenhum ou muito poucos dos coeficientes são estatisticamente diferentes de zero, trata-se de um sintoma bastante característico da multicolinearidade. Apesar de as variáveis explanatórias X exercerem significativa influência sobre o comportamento da variável dependente Y, devido à colinearidade entre os regressores, não conseguimos isolar o efeito individual de cada um. 16 REGRAS PARA DETECÇÃO DA MULTICOLINEARIDADE 2. Regressões Auxiliares Uma forma de se verificar qual das variáveis X se relaciona às demais seria estimar regressões de cada Xi contra os demais X e calcular os respectivos R2, que designamos aqui como R2i. X1 = f(X2, X3, X4, …, Xk) X2 = f(X1, X3, X4, …, Xk) X3 = f(X1, X2, X4, …, Xk) etc. Cada uma dessas regressões é chamada de regressão auxiliar 17 REGRAS PARA DETECÇÃO DA MULTICOLINEARIDADE 2.1 Regressões auxiliares – Teste F Teste F para verificar se a variável Xi é realmente colinear em relação às demais: )1/()1( )2/( 2 2 knR kR F i i i Consultar a tabela para (k-2) e (n-k+1) graus de liberdade Se Fcalc > Ftab Considera-se que o Xi em pauta é de fato colinear em relação aos demais e, portanto, poderá eventualmente ser excluído do modelo 18 REGRAS PARA DETECÇÃO DA MULTICOLINEARIDADE 2.2. Regressões Auxiliares - Regra prática de Klien Ao invés de utilizar o teste F, pode-se adotar uma regra prática, proposta por Klien, de que a multicolinearidade não é prejudicial quando: R2Y.X1,X2,…,Xk > R 2 Xi.X1,X2,…,Xk Neste caso, calcula as regressões auxiliares e compara o R2 de cada uma delas com o R2 da regressão principal (de Y contra as variáveis X) 19 REGRAS PARA DETECÇÃO DA MULTICOLINEARIDADE 2.3. Regressões Auxiliares - Fator de Inflação da Variância (FIV) Outro método de detecção é a análise do Fator de Inflação da Variância (FIV), ou no inglês Variance Inflation Factor (VIF). Neste caso, faz-se a estimação de Xi = f(X1, X2,…, Xk) e obtém-se o R2i , para cada variável. O FIV será: )1( 1 2 R FIV i i 20 REGRAS PARA DETECÇÃO DA MULTICOLINEARIDADE 2.3. Regressões Auxiliares - Fator de Inflação da Variância (FIV) 1. Se FIV = 1: ausência de multicolinearidade. 2. O Gretl estabelece uma comparação de FIV com 10, ou seja, valores de FIV > 10 indicariam presença de alta multicolinearidade entre as variáveis. 3. Santana (2003) recomenda o valor de FIV > 5. 4. Greene (2002) cita autores os quais recomendam atenção para FIV > 20. 21 REGRAS PARA DETECÇÃO DA MULTICOLINEARIDADE 3. Correlações Parciais - Matriz de correlações parciaisSuponha um modelo com seis variáveis explicativas 22 REGRAS PARA DETECÇÃO DA MULTICOLINEARIDADE 3. Correlações Parciais - Matriz de correlações parciais Matriz de correlações parciais Análise da matriz de correlações parciais entre as variáveis do modelo. 23 REGRAS PARA DETECÇÃO DA MULTICOLINEARIDADE 3. Correlações Parciais - Matriz de correlações parciais 24 REGRAS PARA DETECÇÃO DA MULTICOLINEARIDADE 3. Correlações Parciais - Matriz de correlações parciais Y X1 X2 X3 X4 X5 X6 Y 1 0,9709 0,9836 0,5025 0,4573 0,9604 0,9713 X1 1 0,9916 0,6206 0,4647 0,9792 0,9911 X2 1 0,6043 0,4464 0,9911 0,9953 X3 1 -0,1774 0,6866 0,6683 X4 1 0,3644 0,4172 X5 1 0,9940 X6 1 Correlações entre pares de regressores acima de 0,8 sugerem problema sério de multicolinearidade. 25 Violação da Pressuposição 7: MULTICOLINEARIDADE NATUREZA DA MULTICOLINEARIDADE A MULTICOLINEARIDADE É MESMO UM PROBLEMA? MÉTODOS DE DETECÇÃO MEDIDAS PRÁTICAS PARA AMENIZAR O PROBLEMA 26 MEDIDAS CORRETIVAS Para tentar solucionar o problema da multicolinearidade, podemos utilizar algumas regras práticas, cujo sucesso depende da gravidade do problema em pauta. 1. Retirada de variáveis problemáticas: Quando nos deparamos com uma forte colinearidade, uma das coisas “mais simples” a serem feitas é a retirada de uma das variáveis colineares. Neste caso, as regressões auxiliares ajudam na escolha entre as variáveis possíveis de serem eliminadas do modelo. Atenção: ao utilizar este método de correção, muitas vezes introduzimos um viés de especificação (do tipo omissão de variável relevante) no modelo. 27 MEDIDAS CORRETIVAS 2. Aumento da amostra: Quando for possível, uma sugestão seria tentar aumentar o tamanho da amostra. Isto é o mesmo que reduzir a micronumerosidade, de modo a ganhar observações que tendem a não estar observando uma elevada correlação com as demais variáveis. 3. Transformar as variáveis problemáticas: Uma terceira opção é transformar as variáveis problemáticas, fazendo razões entre elas (Xi/Xj). A limitação deste procedimento é que se perde a relação direta, ficando apenas com parâmetros que refletem relações para a razão. 28 EXEMPLO PRÁTICO: Estudar os fatores que interferem no número de pessoas empregadas Os dados apresentados na Tabela 1 foram coletados por Longley (1967), e se tornaram um instrumento para ilustrar vários problemas econométricos, incluindo a multicolineridade. Anos Y X1 X2 X3 X4 X5 X6 1947 60.323 830 234.289 2.356 1.590 107.608 1 1948 61.122 885 259.426 2.325 1.456 108.632 2 1949 60.171 882 258.054 3.682 1.616 109.773 3 1950 61.187 895 284.599 3.351 1.650 110.929 4 1951 63.221 962 328.975 2.099 3.099 112.075 5 1952 63.639 981 346.999 1.932 3.594 113.270 6 1953 64.989 990 365.385 1.870 3.547 115.094 7 1954 63.761 1.000 363.112 3.578 3.350 116.219 8 1955 66.019 1.012 397.469 2.904 3.048 117.388 9 1956 67.857 1.046 419.180 2.822 2.857 118.734 10 1957 68.169 1.084 442.769 2.936 2.798 120.445 11 1958 66.513 1.108 444.546 4.681 2.637 121.950 12 1959 68.655 1.126 482.704 3.813 2.552 123.366 13 1960 69.564 1.142 502.601 3.931 2.514 125.368 14 1961 69.331 1.157 518.173 4.806 2.572 127.852 15 1962 70.551 1.169 554.894 4.007 2.827 130.081 16 29 Em que: Y = número de pessoas empregadas, em milhares; X1 = deflator implícito dos preços no PNB; X2 = PNB, em milhões de US$; X3 = número de desempregados, em milhares de pessoas; X4 = número de pessoas nas forças armadas; X5 = população não institucionalizada com mais de 14 anos; X6 = variável de tendência. EXEMPLO PRÁTICO: Estudar os fatores que interferem no número de pessoas empregadas 30 Seguindo a Regra Prática de Klien, o que poderíamos concluir a respeito da multicolinearidade? Estime o Fator de Inflação da Variância (FIV) para cada variável explanatória e comente sobre o grau de multicolinearidade em cada caso. EXEMPLO PRÁTICO: Estudar os fatores que interferem no número de pessoas empregadas 31 O primeiro passo será estimar o modelo normalmente, utilizando o Eviews ou o GretL Depois, estimar todas as regressões auxiliares, as quais permitirão aplicar a Regra Prática de Klien, comparando os valores de R2 de cada regressão auxiliar com o R2 da regressão original. Calcular o FIV para cada variável explicativa, e concluir a respeito do grau de multicolinearidade em cada caso. Finalmente, analisar a matriz de correlações parciais. EXEMPLO PRÁTICO: Estudar os fatores que interferem no número de pessoas empregadas 32 EXEMPLO PRÁTICO: Estudar os fatores que interferem no número de pessoas empregadas Regressão Original 33 EXEMPLO PRÁTICO: Estudar os fatores que interferem no número de pessoas empregadas Regressão Auxiliar 34 EXEMPLO PRÁTICO: Estudar os fatores que interferem no número de pessoas empregadas Regressão Auxiliar 35 EXEMPLO PRÁTICO: Estudar os fatores que interferem no número de pessoas empregadas Regressão Auxiliar 36 EXEMPLO PRÁTICO: Estudar os fatores que interferem no número de pessoas empregadas Regressão Auxiliar 37 EXEMPLO PRÁTICO: Estudar os fatores que interferem no número de pessoas empregadas Regressão Auxiliar 38 EXEMPLO PRÁTICO: Estudar os fatores que interferem no número de pessoas empregadas Regressão Auxiliar 39 EXEMPLO PRÁTICO: Estudar os fatores que interferem no número de pessoas empregadas Variável Ri 2 Comparação (Klien) FIV X1 0,992622 Menor 135,54 X2 0,999441 Maior 1.788,91 X3 0,970255 Menor 33,62 X4 0,721365 Menor 3,58 X5 0,997495 Maior 399,20 X6 0,998682 Maior 758,73 R2 do modelo original = 0,995479 )1( 1 2 R FIV i i Analisando o FIV, a variável X4 é a única que não apresenta elevado grau de multicolinearidade em relação às demais variáveis. 40 EXEMPLO PRÁTICO: Estudar os fatores que interferem no número de pessoas empregadas IMPEMENTAÇÃO NO GRETL Janela da equação estimada 41 EXEMPLO PRÁTICO: Estudar os fatores que interferem no número de pessoas empregadas IMPEMENTAÇÃO NO GRETL 42 Matriz de correlações parciais EXEMPLO PRÁTICO: Estudar os fatores que interferem no número de pessoas empregadas IMPEMENTAÇÃO NO GRETL 43 Y X1 X2 X3 X4 X5 X6 Y 1 0,9709 0,9836 0,5025 0,4573 0,9604 0,9713 X1 1 0,9916 0,6206 0,4647 0,9792 0,9911 X2 1 0,6043 0,4464 0,9911 0,9953 X3 1 -0,1774 0,6866 0,6683 X4 1 0,3644 0,4172 X5 1 0,9940 X6 1 Correlações entre pares de regressores acima de 0,8 sugerem problema sério de multicolinearidade. EXEMPLO PRÁTICO: Estudar os fatores que interferem no número de pessoas empregadas Matriz de correlações parciais
Compartilhar