Baixe o app para aproveitar ainda mais
Prévia do material em texto
Tópico 5– Exercícios Bibliografia: WOOLDRIDGE, J.M. Introdução à Econometria: uma abordagem moderna. 4ª ed. São Paulo: Pioneira Thomson Learning, 22015. (cap. 1 e cap. 8). Exercícios 1. Suponha que na sua universidade lhe seja pedido para encontrar o relacionamento entre horas semanais gastas estudando (estudo) e horas semanais gastas trabalhando (trabalho). Faz sentido caracterizar o problema como de dedução, se o estudo “induz” ao trabalho ou o trabalho “induz” ao estudo? Explique. Não faz sentido tratar a questão em termos de causalidade. Por exemplo, os economistas poderiam assumir que os estudantes escolhem uma combinação de estudo e trabalho (além de outras atividades, como por exemplo, lazer e sono), com base em comportamentos racionais, como a maximização da utilidade (com restrição de 168 horas por semana). Podemos então, usar métodos estatísticos (incluindo análise de regressão) para medir a associação entre estudar e trabalhar. Mas, não estaríamos afirmando que uma variável “causa” outra. São ambas as variáveis de escolha do aluno. Exercícios 2. Suponha que você é solicitado a conduzir um estudo para determinar se salas de aula com menor número de alunos conduzem a um melhor desempenho do estudante de quarto ano. a) Se você pudesse conduzir qualquer experimento que quisesse, o que você faria? Seja específico. Poderíamos atribuir aleatoriamente alunos em salas de aulas de diferentes tamanhos, independentemente das características do aluno, como habilidade e antecedentes familiares. Exercícios b) De modo mais realista, suponha que você possa reunir dados observacionais de vários milhares de estudantes de quarto ano de determinado Estado. Você pode obter o tamanho, em número de alunos, de suas salas de aula e um total de pontos do teste padronizado feito no final do quarto ano. Por que se pode esperar uma correlação negativa entre o tamanho da sala de aula e os pontos de teste padronizados? Uma correlação negativa significa que um tamanho de classe maior está associado a menor desempenho. Podemos encontrar uma correlação negativa porque o tamanho da classe maior realmente prejudica o desempenho. No entanto, com dados observacionais, existem outras razões pelas quais podemos encontrar uma relação negativa. Por exemplo, crianças de famílias com renda maior podem ser mais propensas a frequentar escolas com tamanhos de turmas menores, essas crianças, geralmente, obtêm melhores resultados em testes padronizados. Outra possibilidade é que, dentro de uma escola, um diretor pode atribuir aos melhores alunos turmas menores. Exercícios c) Uma correlação negativa necessariamente mostrará que salas de aulas com menor número de alunos conduzem a um melhor desempenho. Explique. Dado o potencial de confundir, alguns fatores listados em (b), encontrar uma correlação negativa não seria uma forte evidência de que tamanhos menores de classe realmente conduzem a um melhor desempenho. Torna-se necessário encontrar um forma de controlar os fatores de “confusão”, e esse é o tema da análise de regressão múltipla. Exercício 1. Considera que, um modelo de corte transversal: 𝑌𝑖 = 𝛼 + 𝛽𝑋𝑖 + 𝛾𝑍𝑖 + 𝜀𝑖 Em particular, você está preocupado com os dados que podem apresentar heterocedasticidade. a) Explique o que é heteroscedasticidade e porque é provável de ocorrer neste tipo de modelo. Formalize a heteroscedasticidade. b) Quais as características da heteroscedasticidade? c) Diga qual será o efeito sobre as estimativas de MQO. Exercício a) Explique o que é heteroscedasticidade e porque é provável de ocorrer neste tipo de modelo. Formalize a heteroscedasticidade. Uma das hipóteses importante do modelo clássico de regressão linear é que: a variância de cada termo de erro u, condicional aos valores selecionados das variáveis explicativas é constante igual a 𝜎2, essa é a hipótese de homocedasticidade. Assumindo variâncias iguais temos: 𝐸 𝑢2 = 𝜎2. É provável de ocorrer neste tipo de modelo porque são dados de corte transversal. Formalização da heteroscedasticidade: 𝑉𝑎𝑟 𝑢𝑖 𝑥𝑖 = 𝐸 𝑢𝑖 2 = 𝜎𝑖 2 Exercício b) Quais as características da heteroscedasticidade? 1. Heteroscedasticidade não causa viés ou inconsistência nos estimadores de MQO, ao passo que algo como a omissão de uma variável importante teria esse efeito. 2. R2 e R2 ajustado também não é afetada pela presença de heterocedasticidade. 3. Como os erros-padrão dos estimadores MQO são baseados diretamente nessas variâncias, eles não são mais válidos para construirmos intervalos de confiança e estatísticas t. As estatísticas t habituais dos estimadores MQO não tem distribuições t na presença de heterocedasticidade e o problema não será resolvido com o uso de amostras de tamanho grande Se o 𝑉𝑎𝑟 (𝑢|𝑥1…𝑥𝑘) não for constante, os estimadores MQO não mais serão BLUE. Exercício c) Diga qual será o efeito sobre as estimativas de MQO. As estimativas dos MQO não sofrem, mas os seus erros não são mais válidos e os procedimentos de inferências não serão válidos. Exercício 1. Explique, detalhadamente, os testes de heterocedasticidade de Breush-Pagan e de White. Teste de Breusch-Pagan: 1. Estimar o modelo original por MQO. Obtenha os quadrados dos resíduos de MQO, ො𝑢2 (um para cada observação). 2. Execute a regressão: ො𝑢2 = 𝛿𝑜 + 𝛿1𝑥𝑖 +⋯+ 𝛿𝑘𝑥𝑘 + 𝑒𝑟𝑟𝑜. Isso significa testar 𝐻0 = 𝛿1 = 𝛿2 = ⋯ = 𝛿𝐾 = 0 → modelo é homocedástico. 3. Depois de regredir o quadrado dos resíduos para todos os 𝑥, podemos usar o 𝑅2 dessa regressão para formar os testes F e LM. Exercício Teste de White: 1. Estime o modelo MQO em que 𝑦 é a variável dependente e obtenha os resíduos (𝑢) e os valores estimados de 𝑦. 2. Calcule o quadrado dos resíduos de ො𝑢2 e os valores ajustados ො𝑦2. 3. Estime o modelo em que ො𝑢2 é a variável dependente e 𝑦 e 𝑦2sejam as variáveis independentes para obter o R2 . 4. Utilize o 𝑅2 dessa regressão para formar os testes F e LM e calcule o p- valor. 5. Se o p-valor ficar abaixo do nível de significância selecionados, então rejeitamos a hipótese nula de homoscedasticidade. Exercícios 1. O método MQP é preferido ao MQO quando uma variável importante for omitida do modelo? Explique. FALSO. O método MQP é preferível ao método de MQO quando detectada a presença de heterocedasticidade no modelo de MQO. MQO visa minimizar a soma dos quadrados dos resíduos para o coeficiente beta e é o melhor estimador linear não enviesado desde que atendidas algumas hipóteses, dentre elas, a de homocedasticidade. Na presença de heterocedasticidade, o estimador de MQO continua não enviesado, mas ineficiente. Para corrigir o problema da variância residual não constante, lança-se mão do MQP que consiste em transformar (ponderar) a equação de modo a garantir erros homocedásticos. A partir dessa equação transformada, estima-se o MQO. Exercícios 2. Considere um modelo linear para explicar o consumo mensal de cerveja: 𝑐𝑒𝑟𝑣𝑒𝑗𝑎 = 𝛽0 + 𝛽1𝑟𝑒𝑛𝑑𝑎 + 𝛽2𝑝𝑟𝑒ç𝑜 + 𝛽3𝑒𝑑𝑢𝑐 + 𝛽4𝑓𝑒𝑚 + 𝑢 𝐸 𝑢 𝑟𝑒𝑛𝑑𝑎, 𝑝𝑟𝑒ç𝑜, 𝑒𝑑𝑢𝑐, 𝑓𝑒𝑚 = 0 e 𝑉𝑎𝑟 𝑢 𝑟𝑒𝑛𝑑𝑎, 𝑝𝑟𝑒ç𝑜, 𝑒𝑑𝑢𝑐, 𝑓𝑒𝑚 = 𝜎2𝑟𝑒𝑛𝑑𝑎2 Mostre como você iria remover o problema da heteroscedasticidade e produzir um termo de erro com variância constante. ℎ 𝑥 = 𝑟𝑒𝑛𝑑𝑎2 → ℎ(𝑥) = 𝑟𝑒𝑛𝑑𝑎 A equação transformada é obtida dividindo a equação original por 𝑟𝑒𝑛𝑑𝑎: 𝑐𝑒𝑟𝑣𝑒𝑗𝑎 𝑟𝑒𝑛𝑑𝑎 = 𝛽0 𝑟𝑒𝑛𝑑𝑎 + 𝛽1 + 𝛽2𝑝𝑟𝑒ç𝑜 𝑟𝑒𝑛𝑑𝑎 + 𝛽3𝑒𝑑𝑢𝑐 𝑟𝑒𝑛𝑑𝑎 + 𝛽4𝑓𝑒𝑚 𝑟𝑒𝑛𝑑𝑎 + 𝑢 𝑟𝑒𝑛𝑑𝑎 Exercícios 1. Uma das justificativas dos programas de treinamento de pessoal é que eles melhoram a produtividade dos trabalhadores. Suponhaque você seja questionado se mais treinamentos tornam os profissionais mais produtivos. No entanto, uma vez de ter dados de trabalhadores individuais você tem acesso aos dados de empresas industriais. Particularmente, de cada empresa, você tem informação sobre o número de horas de treinamento por trabalhador (treinamento) e o número de itens sem defeito produzido por trabalhador, por hora (produção). a) Parece provável que a decisão de uma empresa em trinar seus empregados será independente das características dos trabalhadores? Quais são algumas dessas características, mensuráveis e não mensuráveis, dos trabalhadores? b) Cite um fator, exceto característica dos trabalhadores, que pode afetar a produtividade do trabalhador. c) Se você encontrar uma correção positiva entre treinamento e produção, você terá estabelecido de forma convincente que o treinamento pessoal torna os trabalhadores mais produtivos? Explique. Exercícios a) Parece provável que a decisão de uma empresa em trinar seus empregados será independente das características dos trabalhadores? Quais são algumas dessas características, mensuráveis e não mensuráveis, dos trabalhadores? É provável que as empresas escolham o treinamento de trabalho, dependendo das características dos trabalhadores. Algumas características observadas são anos de escolaridade, anos de força de trabalho e experiência em um determinado trabalho. As empresas podem até discriminar com base na idade, gênero ou raça. Talvez as empresas optem por oferecer treinamento a trabalhadores mais ou menos capazes, onde "capacidade" pode ser difícil de quantificar, mas onde um gerente tem alguma ideia sobre as habilidades relativas de diferentes funcionários. Além disso, diferentes tipos de trabalhadores podem ser atraídos para as empresas que oferecem um maior treinamento, e isso pode não ser evidente para empregar. Exercícios b) Cite um fator, exceto característica dos trabalhadores, que pode afetar a produtividade do trabalhador. A quantidade de capital e tecnologia disponível para os trabalhadores também afetaria o resultado. Assim, duas empresas com exatamente o mesmo tipo de funcionários geralmente teriam resultados diferentes se usarem diferentes quantidades de capital ou tecnologia. A qualidade dos gerentes também teria efeito. Exercícios c) Se você encontrar uma correção positiva entre treinamento e produção, você terá estabelecido de forma convincente que o treinamento pessoal torna os trabalhadores mais produtivos? Explique. Não, a menos que a quantidade de treinamento seja atribuída aleatoriamente. Os muitos fatores listados anteriormente podem contribuir para encontrar uma correlação positiva entre o resultado e o treinamento, mesmo que o treinamento do trabalho não melhore a produtividade do trabalhador. Exercícios 2. Quais das seguintes alternativas são consequências da heterocesdaticidade: a) Os estimadores MQO, መ𝛽𝑗, são inconsistentes; Falso. O pressuposto da heterocedasticidade não afeta a consistência, logo os መ𝛽𝑗 , são consistentes. O estimador de MQO continua não enviesado, mas ineficiente. b) A estatística F usual não mais tem uma distribuição F; Verdadeiro. Na presença de heterocedasticidade, as estatísticas usuais para testar hipóteses sob as hipóteses de Gauss-Markov (t, F, LM) não são válidas. c) Os estimadores MQO não são mais BLUE. Verdadeiro. A heterocedasticidade causa inferência estatística com base nas estatísticas t e F usuais. Essas estatísticas ficam inválidas, mesmo em grandes amostras. Como a heterocedasticidade é a violação dos pressupostos de Gauss-Markov, o MQO não é mais BLUE. Exercícios 3. Relacione e explique os itens abaixo (use fórmulas se necessário): a) Inferência robusta em relação à heterocedasticidade após a estimação de MQO. É possível ajustar os erros-padrão, estatísticas t, F e LM de forma a torná-las válidas na presença de heteroscedasticidade de forma desconhecida. Isso significa que é possível descrever novas estatísticas que funcionam independentemente do tipo de heteroscedasticidade presente na população. Exercícios Se usamos o processo de estimação por mínimos quadrados e ignoramos a heterocedasticidade quando ela está presente, usamos esta estimativa para obter o erro-padrão de 𝑏1, 𝑞𝑢𝑎𝑛𝑑𝑜, na realidade, deveríamos uma estimativa de: 𝑉𝑎𝑟 መ𝛽1 = σ𝑖=1 𝑛 𝑥𝑖 − ҧ𝑥 2𝜎𝑖 2 𝑆𝑄𝑇𝑥 2 No entanto o estimador de mínimos quadrados não é mais o melhor estimador linear não tendencioso. A utilização de erros-padrão incorretos significa que as estimativas de intervalo e os teste de hipóteses não são mais válidos. Considerando ො𝑢𝑖 representar o os resíduos do MQO da regressão inicial de 𝑦 sobre 𝑥. tem-se que: 𝑉𝑎𝑟 መ𝛽1 = σ𝑖=1 𝑛 𝑥𝑖 − ҧ𝑥 2 ො𝑢𝑖 2 𝑆𝑄𝑇𝑥 2 Que é calculado após a regressão MQO. Estatística robusta em relação à heteroscedasticidade t. Exercícios Estatística LM robusta em relação à heterocedasticidade 𝑦𝑖 = 𝛽𝑜 + 𝛽1𝑥𝑖 +⋯+ 𝛽𝑘𝑥𝑘 + 𝑢𝑖 Suponha que queiramos testar: 𝐻0: 𝛽1 = 0, 𝛽2 = 0) 1. Estimamos o modelo restrito (modelo sem 𝑥1 e 𝑥2) para obter os resíduos 𝑢. 2. Faça a regressão de cada uma das variáveis independentes excluídas, conforme a hipótese nula, sobre todas as variáveis independentes incluídas; se houver q variáveis excluídas, isso levará a 𝑞 conjuntos de resíduos ǁ𝑟1, ǁ𝑟2, … , ǁ𝑟𝑞 . A cada vez, guardamos os resíduos. 3. Encontre os produtos entre cada ǁ𝑟𝑗 e 𝑢 (para todas as observações). 4. Faça a regressão de 1 sobre ǁ𝑟1𝑢, ǁ𝑟2𝑢,… , ǁ𝑟𝑞𝑢, sem um intercepto (definimos uma variável dependente com valor um para todas as observações. 5. A estatística l robusta é 𝑛 − 𝑆𝑄𝑅, em que 𝑆𝑄𝑅1 é exatamente a soma dos quadrados dos resíduos desta última regressão. Sob 𝐻0 , a estatística LM é distribuída aproximadamente como 𝜒𝑞 2. Uma vez que a estatística 𝐿𝑀 robusta tenha sido obtida, a regra de rejeição e o cálculo dos 𝑝 − 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 são as mesmas da estatística 𝐿𝑀 usual. Exercícios b) Mínimos quadrados ponderados e Mínimos quadrados generalizados. Na presença de heterocedasticidade, o estimador de MQO continua não enviesado, mas ineficiente. Para corrigir o problema da variância residual não constante, lança-se mão do MQP que consiste em transformar (ponderar) a equação de modo a garantir erros homocedásticos. A partir dessa equação transformada, estima-se o MQO. Mínimos Quadrados Ponderados é maximizado se sabemos como é 𝑉𝑎𝑟(𝑢𝑖|𝑥𝑖) . Na maioria dos casos não saberemos a forma da heterocedasticidade. Podemos modelar a função ℎ e utilizar os dados para estimar os parâmetros desconhecidos nesse modelo→ estimativas de cada ℎ𝑖, indicada por ℎ𝑖. Usar o ℎ𝑖 em lugar de ℎ𝑖 na transformação 𝑀𝑄𝐺 produz um estimador denominado: MQG factível, MQG estimado ou MQGE. Exercícios c) MQG factível. A forma mais típica é quando você não sabe a forma da heterocedasticidade. Procedimento MQG para corrigir a hetercedasticidade: 1. Execute a regressão de 𝑦 em 𝑥1, 𝑥2, … , 𝑥𝑘e obtenha os resíduos, ො𝑢. 2. Criar log (ො𝑢2) primeiramente elevando ao quadrado os resíduos MQO e depois calculando seu log natural. 3. Execute a regressão de log (ො𝑢2) sobre 𝑥1, 𝑥2, … , 𝑥𝑘 e obtenha os valores estimados, ො𝑔. 4. Calcule o exponencial dos valores estimados a partir ො𝑢 = 𝑒𝑥𝑝 ො𝑔 . 5. Estime a equação: 𝑦𝑖 = 𝛽𝑜 + 𝛽1𝑥𝑖 +⋯+ 𝛽𝑘𝑥𝑘 + 𝑢𝑖 Pelos MQP, usando pesos 1/ℎ (ℎ𝑖 = 𝑒𝑥𝑝( ො𝑔𝑖)). Exercícios 4. Considere o modelo a seguir que busca encontrar os impactos da lei anti-crime sobre a taxa de criminalidade em 46 cidades. A variável dependente é, portanto, o logaritmo da taxa de criminalidade em 1987 (log(txcrim87)). A taxa de criminalidade também está disponívelpara o ano de 1982 e pode ser usada como variável independente adicional na tentativa de controlar as variáveis não observáveis das cidades que afetem o crime e possam estar correlacionadas com os dispêndios atuais com a imposição de uma lei anti-crime (log(lei87)). Desemp87 indica a taxa de desemprego em 1987. A tabela a seguir contém os resultados: Exercícios Variável Dependente: txcrim87 Nota: p-valor entre parênteses. Variáveis independentes (1) (2) Desemp87 -0,029 (0,062) 0,009 (0,070) Log(lei87) 0,203 (0,173) -0,140 (0,109) Log(txcrim82) - 1,194 (0,032) Intercepto 3,34 (1,25) 0,076 (0,821) Observações R2 46 0,570 46 0,680 Exercícios a) Qual a interpretação dos coeficientes estimados? A lei tem efeito sobre a taxa de criminalidade? E o desemprego? As variáveis taxa de Desemprego87 e Log(lei) não são significativas ao nível de 5%. Quando não acrescentamos a taxa de criminalidade defasada de 1982 as variáveis não apresentam sinais esperados sobre a taxa de criminalidade do período de 1987. Pela teoria econômica, cidades com maior taxa de desemprego tendem a aumentar a taxa de criminalidade do período, e quanto maior o dispêndio coma imposição da lei menor seria a taxa de criminalidade. Então sem acrescentar a variável dependente defasada de 1982, o efeito da taxa de desemprego na taxa de criminalidade de 1987 será negativo. Por sua vez, o efeito do dispêndio com a imposição da lei apresenta um efeito positivo na taxa de criminalidade de 1987, significando que a cada aumento de 1% de aumento no gasto com imposição da lei a taxa de criminalidade irá aumentar 0,203%. Exercícios b) Interprete o coeficiente de Log(lei87) na coluna 2. Idem para Desemp87. Após a acrescentar o log da taxa de criminalidade defasada de 1982, as variáveis taxa de Desemprego87 e Log(lei) continuaram não significativas ao nível de 5%, contudo seus efeitos sobre a taxa de criminalidade de 1987 têm sinais esperados. A cada aumento de 1% na taxa de desemprego de 1987 a taxa de criminalidade de 1987 aumenta 0,009%, e a cada aumento de 1% no gasto com a imposição da lei a taxa de criminalidade de 1987 diminui em 0,14%.. Exercícios c) Qual a razão para se incluir log(txcrim82)? Acrescentando a taxa de criminalidade defasa de 1982 podemos perceber que ela é significativa ao nível de 5%, tendo como interpretação que cada aumento de 1% na taxa de criminalidade de 1982 aumentou 1,19% a taxa de criminalidade de 1987. Adicionando a variável dependente defasada podemos controlar fatores não observáveis, quando analisamos o efeito ceteris paribus da taxa de desemprego de 1987 e gastos com a imposição da lei sobre a taxa de criminalidade de 1987.
Compartilhar