Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Prova #3 Econometria I Professor Thiago Fonseca Morello 1 Nome___________________________________________ RA________________ Turno_____________ 2 Instruções para resolução da prova 3 1. O tempo para resolução é de 2 horas: não será concedido tempo adicional; 4 2. Não ultrapassar o espaço reservado, no caderno de respostas (este documento) para a resolução de cada 5 questão: todo o texto escrito fora do espaço reservado será desconsiderado; 6 3. Será fornecido papel para rascunho em quantidade suficiente. Por favor, utilizar o rascunho para chegar 7 a respostas consistentes e concisas e reservar tempo para transcrevê-las neste caderno de respostas. Uma 8 hora e meia para elaborar as respostas (22,5 min. por questão) e meia hora para transcrever é 9 uma alocação adequada do tempo disponível. 10 (1) [2,5 pontos] A tabela 1 abaixo resulta de um estudo acerca do mercado informal de trabalho no Egito. 11 Considerando testes de significância individual unicaudais com regiões críticas determinadas pelo sinal da 12 estimativa pontual, preencha a quarta coluna com a seguinte simbologia: 13 Explicativa significativa a 1% ou menos: escrever o número “1” 14 Explicativa significativa a 5% mas não significativa a 1%: escrever o número “5” 15 Explicativa significativa a 10% mas não significativa a 5% e nem a 1%: escrever o número “10” 16 Explicativa não significativa a 10% ou a 5% ou a 1%: escrever a letra “N” 17 Tabela 1 Resultados da estimação, variável dependente: remuneração horária 18 Estimativa pontual Estatística t Simbologia para a significância estatística Intercepto -0,207 -3,14 log(experience) 0,168 8,84 Primary education 0,017 0,35 Preparatory education 0,091 1,38 Intermediate education 0,087 2,12 Tertiary/university education 0,223 4,21 Female -0,397 -9,02 Alexandria and Suez Canal Cities -0,048 -1,50 Urban Lower Egypt -0,148 -4,63 Urban Upper Egypt -0,092 -3,17 Rural Lower Egypt -0,144 -4,97 Rural Upper Egypt -0,129 -3,91 Marital status 0,102 4,25 Número total de explicativas 12 N 6847 Fonte: Radchenko, N. Heterogeneity in Informal Salaried Employment: Evidence from the Egyptian Labor Market Survey. World 19 Development Vol. 62, pp. 169–188, 2014. 20 Nota: há um suplemento ao final da prova. Utilize-o para obter os valores críticos dos testes de 21 significância individual atentando para a compatibilidade dos graus de liberdade com os dados da 22 tabela 1. 23 2 R: os valores críticos para os testes t unicaudais são: (i) -2,33 ou 2,33 para um nível de significância de 24 1%, (ii) -1,65 ou 1,65 para um nível de significância de 5%, (iii) -1,28 ou 1,28 para um nível de 25 significância de 10%, conforme a figura 1 aponta. As respostas corretas podem ser encontradas na tabela 26 abaixo. 27 Estimativa pontual Estatística t Simbologia para a significância estatística Intercepto -0,207 -3,14 1 log(experience) 0,168 8,84 1 Primary education 0,017 0,35 N Preparatory education 0,091 1,38 10 Intermediate education 0,087 2,12 5 Tertiary/university education 0,223 4,21 1 Female -0,397 -9,02 1 Alexandria and Suez Canal Cities -0,048 -1,50 10 Urban Lower Egypt -0,148 -4,63 1 Urban Upper Egypt -0,092 -3,17 1 Rural Lower Egypt -0,144 -4,97 1 Rural Upper Egypt -0,129 -3,91 1 Marital status 0,102 4,25 1 Número total de explicativas 12 N 6847 28 (2) [2,5 pontos] A tabela 2 abaixo contém resultados de um estudo empírico acerca do efeito do programa 29 Indiano “Integrated Child Development Scheme (ICDS)” sobre o nível de saúde de crianças indianas de zero 30 a dois anos de idade e de gênero masculino. A variável dependente (Y) é o escore Z para o déficit de altura. 31 Tabela 2 Variável dependente: escore Z; crianças de zero a dois anos e de gênero masculino 32 Estimativa pontual Desvio padrão Estatística t Alimentação suplementar diária 0,24 0,19 1,26 Check-up mensal de saúde -0,07 0,20 -0,35 Vacinação -0,09 0,14 -0,64 Cuidados especiais na primeira infância 0,07 0,28 0,25 Número total de explicativas 27 N 5615 R2 0,11 3 Estatística F (significância global) 25,57 Fonte: Jain, M. India’s Struggle Against Malnutrition—Is the ICDS Program the Answer? World Development Vol. 67, pp. 72–33 89, 2015. 34 As variáveis explicativas mensuram o grau em que as crianças da amostra foram contempladas com serviços 35 de proteção contra a desnutrição, providos pelo programa ICDS. Há 23 variáveis de controle adicionais, 36 omitidas da tabela acima. O intercepto também foi omitido. 37 Obtenha (i) os resultados dos testes de significância individual para as explicativas que constam na tabela 2 38 e (ii) o resultado do teste de significância global. Considere que o resultado do teste de significância 39 conjunta para as variáveis da tabela 2 é equivalente ao resultado do teste F de significância global. 40 Assim fazendo, responda: há discordância ou concordância entre os resultados dos testes de significância 41 individual, de um lado, e do teste de significância conjunta, de outro, no que tange à contribuição das 42 explicativas da tabela 2 para a explicação da variável dependente e por quê? Em sua resposta, reporte os 43 resultados das duas modalidades de testes de hipóteses e procure explicar a razão da discordância ou 44 concordância fundamentando seu argumento nos objetivos e limitações de cada modalidade de teste 45 (significância individual e significância conjunta). 46 Atenção: os valores críticos devem corresponder ao nível de significância de 5%. Os testes de 47 significância individual devem ser unicaudais com regiões críticas definidas pelos sinais das 48 estimativas pontuais. Utilize os gráficos das distribuições t e F com graus de liberdade compatíveis ao 49 final desta prova. 50 R: 51 1.Testes de significância individual: o valor crítico dos testes de significância individual para as 52 explicativas discriminadas na tabela é de 1,65, segundo a figura 1. Desta maneira, as regiões críticas a 53 serem consideradas são (-∞,-1,65] para explicativas associadas à estimativas pontuais negativas e [1,65, 54 ∞) para explicativas associadas à estimativas pontuais positivas. Nenhuma das estatísticas t observadas 55 pertence à respectiva região crítica, e, pois, nenhuma das explicativas é individualmente significativa. 56 2.Testes de significância global: o valor crítico do teste é 1,49 e, pois, a região crítica corresponde a [1,49, 57 ∞), conforme a figura 2. O valor observado da estatística F pertence à região crítica e, portanto, pode-se 58 rejeitar a hipótese de ausência de significância global. 59 3.Discordância entre os testes: assumindo, conforme requer o enunciado, que o resultado do teste de 60 significância global pode ser tomado como equivalente ao resultado do teste de significância conjunta para 61 as explicativas explicitadas na tabela 2, fica claro que há discordância entre os testes de significância 62 individual e conjunta. Tal discordância se expressa da seguinte maneira. De acordo com os testes de 63 significância individual, cujo resultado é apresentado no item 1, conclui-se que as explicativas da tabela 2 64 não têm influências individuais estatisticamente relevantes sobre Y. Já, de acordo com o teste de 65 significância conjunta, as explicativas têm significância conjunta, representando uma contribuição 66 relevante para a explicação de Y. As explicativas da tabela 2, portanto, exercem influência não significativa 67 quando tomadas individualmente, mas, porém, quando as influências individuais são tomadas em conjunto, 68 considerando a composição delas, as explicativas se afiguram estatisticamente significativas. 69 4. Razões da discordância (explicação):em primeiro lugar cabe afirmar que o teste de significância 70 conjunta para as explicativas da tabela não é equivalente a uma sequencia de testes de significância 71 individual que cubra todas as explicativas da tabela. De fato, há uma diferença substantiva, i.e., conceitual, 72 4 entre as duas modalidades de teste (significâncias individuais e significância conjunta), de modo que é 73 possível que haja discordância entre elas, no sentido dado ao termo no item anterior. Provavelmente, há 74 multicolinearidade na amostra, advinda do fato de que as explicativas da tabela 2 são medidas para o 75 mesmo aspecto (grau de contemplação do programa ICDS). Sob multicolinearidade, a identificação dos 76 efeitos individuais destas variáveis é dificultada, tornando-se imprecisa, o que repercute em testes de 77 significância individual com tendência a não rejeitar a hipótese nula (ver seção 4.2 da nota de aula 10). 78 Como a estatística F dos testes de significância global e conjunta é menos suscetível a esta fonte de 79 imprecisão, ela permite constatar uma influência conjunta relevante, mesmo sob multicolinearidade. 80 81 (3) [2,5 pontos] Visando aplicar a decomposição de Oaxaca ao mercado de trabalho do Estado de São 82 Paulo, um pesquisador estimou quatro regressões. Cada uma delas se refere a um subgrupo amostral 83 definido em função de gênero e etnia, conforme a tabela 3 abaixo detalha. Antes de proceder ao cálculo dos 84 componentes discriminatórios dos diferenciais salariais, o pesquisador decidiu realizar uma série de testes de 85 hipóteses. Entre eles, o de a significância conjunta (restrições de exclusão) das três medidas de setor de 86 atividade, d_indu, d_serv e d_apub. Trata-se, portanto, do teste definido pelas seguintes hipóteses: 87 H0: βd_indu = 0, βd_serv = 0, βd_apub = 0 vs. H1: βd_indu ≠ 0 ou βd_serv ≠ 0 ou βd_apub ≠ 0 88 Os valores da estatística F e de seus respectivos graus de liberdade, para as regressões referentes a cada um 89 dos quatro subgrupos amostrais, podem ser encontrados na tabela 3. 90 Tabela 3 Resultados dos testes de significância conjunta para as três medidas setoriais por 91 subgrupos amostrais de gênero e etnia 92 Resultado do teste / subgrupo amostral Gênero: masculino Etnia: branca Gênero: masculino Etnia: não branca Gênero: feminino Etnia: branca Gênero: feminino Etnia: não branca F 30,004 19,186 1,8952 3,2582 Graus de liberdade do denominador de F 3683 2543 3414 2062 Valor crítico (preencher) Significativo (S/N) (preencher) 93 Preencha as duas últimas linhas da tabela 3. Considere para isso um nível de significância de 1%. Os 94 valores críticos podem ser encontrados ao final da prova, no gráfico da distribuição F compatível com os 95 graus de liberdade do numerador e do denominador informados pelo enunciado e pela tabela 3. Na última 96 linha, marque “S” caso o valor da estatística F seja desfavorável, a um nível de significância de 1%, à 97 hipótese nula e marque “N” se o valor da estatística F for favorável à hipótese nula. 98 Nota: colunas com valores críticos equivocados receberão nota zero, esteja ou não correta a resposta 99 quanto à decisão do teste informada na última linha. 100 R: Os graus de liberdade do numerador correspondem ao número de explicativas excluídas pela hipótese 101 nula, três (3), no caso. Já os graus de liberdade do denominador variam entre os extremos 2.062 e 3.683. O 102 gráfico apropriado, é portanto, o da figura 3. Deste modo, o valor crítico para as regressões referentes a 103 5 todos os subgrupos amostrais é de 3.79. Para os subgrupos com valores superiores a 3.79, portanto, o que é 104 o caso dos dois subgrupos do gênero masculino, a hipótese nula deve ser rejeitada, e, portanto, as medidas 105 setoriais são conjuntamente significativas para estes dois primeiros subgrupos. Deve-se, pois, marcar “S” 106 nas duas primeiras colunas da última linha. Para os subgrupos com valores inferiores a 3.79, caso dos 107 subgrupos do gênero feminino, a hipótese nula não deve ser rejeitada. Deve-se, pois, marcar “N” nas duas 108 últimas colunas da última linha. 109 110 (4) [2,5 pontos] Um aluno de Iniciação Científica interessado no tema de desnutrição infantil estimou por 111 Mínimos Quadrados Ordinários (MQO) uma Função de Regressão Populacional (FRP) explicando uma 112 medida de déficit de altura em função de múltiplas características das crianças, das famílias e dos 113 domicílios. Adicionalmente, como exercício para compreender melhor o Método de Máxima 114 Verossimilhança (MV), o aluno empregou tal método para estimar a FRP de interesse. Como resultado, 115 obteve estimativas pontuais para os parâmetros (intercepto e coeficientes) exatamente iguais às obtidas por 116 MQO. Quanto a isso, responda: porque a equivalência entre os métodos de MQO e MV, no que tange às 117 estimativas pontuais, não é mera coincidência? Justifique sua resposta considerando o procedimento de 118 estimação de uma FRP linear múltipla por máxima verossimilhança. Assuma que os dados utilizados pelo 119 aluno verificam todas as hipóteses do Modelo Clássico de Regressão Linear (MCRL). 120 R: A equivalência constatada não é mera coincidência, mas sim um resultado que se estende para todos os 121 conjuntos de dados que verificam as hipóteses do MCRL. De fato, sob a validade de todas as hipóteses do 122 MCRL, os estimadores de MV são equivalentes aos estimadores de MQO. Para ver isso, basta considerar o 123 procedimento de estimação de uma FRP linear múltipla detalhado na seção 2 da nota de aula 11. 124 Em primeiro lugar, a função objetivo do problema que dá fundamento ao método de MV, conforme 125 explicado na seção 2.1 da nota de aula 11, é dada por: 126 ݈݃ ܮ(ߚ|ܺ,ܻ)௬| = ݈݃൫݂(ݕ| ܺ;ߚ)൯ே ୀଵ Trata-se da função de log-verossimilhança. 127 Em segundo lugar, o problema de MV é: 128 ݉áݔఉ൛݈݃ܮ(ߚ|ܺ,ܻ)௬|ൟ = ݉áݔఉ ൝݈݃൫݂(ݕ | ݔ;ߚ)൯ே ୀଵ ൡ Assumindo as hipóteses de homocedasticidade (MCRL 5), ausência de autocorrelação (MCRL 6) e de 129 função de distribuição de probabilidades normal para as perturbações (MCRL 7), tem-se que: 130 ݂(ݕ| ܺ; ߚ) = 1 √2ߨߪଶ ݁ݔ − 12ቆݕ − ݔ′ߚߪ ቇଶ൩ Desta maneira, o problema de MV passa a: 131 ݉áݔఉ ൝ܰ ݈݃ ൬ 1 √2ߨߪଶ൰ − 12ߪିଶ(ݕ − ݔ′ߚ)ଶே ୀଵ ൡ 6 Dado que a parcela ܰ ݈݃ ቀ ଵ √ଶగఙమ ቁ e o fator ଵ ଶ ߪିଶ são constantes para o problema de maximização, pois 132 não são funções de β, eles podem ser desconsiderados e, pois, chega-se ao seguinte problema, o qual é 133 análogo ao problema de MQO: 134 ݉݅݊ఉ ൝(ݕ − ݔ′ߚ)ଶே ୀଵ ൡ Como os problemas de MV e MQO coincidem, quando o objetivo é estimar uma FRP linear múltipla, os 135 estimadores dos parâmetros, sugeridos por ambos os métodos, são equivalentes e, pois, as estimativas 136 pontuais coincidem. 137 Outra maneira de chegar à conclusão de que os estimadores de MV e MQO são equivalentes sob a validade 138 das hipóteses do MCRL é considerar o teorema de Gauss-Markov. Dele resulta que o estimador de MQO é 139 o estimador linear não-viesado com menor matriz de variância-covariância. Como o método de MV se 140 caracteriza por proporcionar estimadores cuja matriz de variância-covariância atinge o menor valor 141 possível com o aumento irrestrito da amostra (i.e, têm a propriedade de eficiência assintótica), então, 142 obrigatoriamente, os estimadores de MV e de MQO têm de coincidir sob a validade de todas as hipóteses do 143 MCRL. 144 145 7 146 Suplemento: funções de distribuição de probabilidades para os testes de significância individual e 147 conjunta 148 Figura 1 Distribuição t de Student com 6834 ou 5587 graus de liberdade 149 150 Lendo a figura 1 acima 151 As letras A, B e C indicam polígonos compreendidosentre a curva da distribuição t de Student e segmentos 152 específicos do eixo horizontal, quais sejam: [-4;-2.33], para o polígono A, [-2.33;-1.65] para B e [-1.65;-153 1.28] para C. As áreas dos polígonos são equivalentes a probabilidades acumuladas cujos valores são: 1% 154 para A, 4% para B e 5% para C. E analogamente para o segmento positivo do eixo horizontal. 155 Figura 2 Distribuição F com 27 graus de liberdade no numerador e 5587 graus de liberdade no 156 denominador 157 158 159 8 160 Lendo a figura 2 161 As letras A, B e C indicam polígonos compreendidos entre a curva da distribuição F de Snedecor e 162 segmentos específicos do eixo horizontal, quais sejam: [1.36;1.49], para o polígono A, [1.49;1.74] para B e 163 [1.74;2] para C. As áreas dos polígonos são equivalentes a probabilidades acumuladas cujos valores são: 5% 164 para A, 4% para B e 1% para C. 165 Figura 3 Distribuição F com 3 graus de liberdade no numerador e de 2602 a 3683 graus de 166 liberdade no denominador 167 168 Lendo a figura 3 acima 169 As letras A, B e C indicam polígonos compreendidos entre a curva da distribuição F de Snedecor e 170 segmentos específicos do eixo horizontal, quais sejam: [2.09;2.61], para o polígono A, [2.61;3.79] para B e 171 [3.79;4] para C. As áreas dos polígonos são equivalentes a probabilidades acumuladas cujos valores são: 5% 172 para A, 4% para B e 1% para C. 173 174 175 176 177 178 179 180 181 9 182
Compartilhar