Buscar

prova_3_noturno_gabarito

Prévia do material em texto

1 
 
Prova #3 Econometria I Professor Thiago Fonseca Morello 1 
Nome___________________________________________ RA________________ Turno_____________ 2 
Instruções para resolução da prova 3 
1. O tempo para resolução é de 2 horas: não será concedido tempo adicional; 4 
2. Não ultrapassar o espaço reservado, no caderno de respostas (este documento) para a resolução de cada 5 
questão: todo o texto escrito fora do espaço reservado será desconsiderado; 6 
3. Será fornecido papel para rascunho em quantidade suficiente. Por favor, utilizar o rascunho para chegar 7 
a respostas consistentes e concisas e reservar tempo para transcrevê-las neste caderno de respostas. Uma 8 
hora e meia para elaborar as respostas (22,5 min. por questão) e meia hora para transcrever é 9 
uma alocação adequada do tempo disponível. 10 
(1) [2,5 pontos] A tabela 1 abaixo resulta de um estudo acerca do mercado informal de trabalho no Egito. 11 
Considerando testes de significância individual unicaudais com regiões críticas determinadas pelo sinal da 12 
estimativa pontual, preencha a quarta coluna com a seguinte simbologia: 13 
 Explicativa significativa a 1% ou menos: escrever o número “1” 14 
 Explicativa significativa a 5% mas não significativa a 1%: escrever o número “5” 15 
 Explicativa significativa a 10% mas não significativa a 5% e nem a 1%: escrever o número “10” 16 
 Explicativa não significativa a 10% ou a 5% ou a 1%: escrever a letra “N” 17 
Tabela 1 Resultados da estimação, variável dependente: remuneração horária 18 
 Estimativa pontual Estatística t 
Simbologia para a 
significância estatística 
Intercepto -0,207 -3,14 
log(experience) 0,168 8,84 
Primary education 0,017 0,35 
Preparatory education 0,091 1,38 
Intermediate education 0,087 2,12 
Tertiary/university education 0,223 4,21 
Female -0,397 -9,02 
Alexandria and Suez Canal Cities -0,048 -1,50 
Urban Lower Egypt -0,148 -4,63 
Urban Upper Egypt -0,092 -3,17 
Rural Lower Egypt -0,144 -4,97 
Rural Upper Egypt -0,129 -3,91 
Marital status 0,102 4,25 
Número total de explicativas 12 
N 6847 
Fonte: Radchenko, N. Heterogeneity in Informal Salaried Employment: Evidence from the Egyptian Labor Market Survey. World 19 
Development Vol. 62, pp. 169–188, 2014. 20 
Nota: há um suplemento ao final da prova. Utilize-o para obter os valores críticos dos testes de 21 
significância individual atentando para a compatibilidade dos graus de liberdade com os dados da 22 
tabela 1. 23 
2 
 
R: os valores críticos para os testes t unicaudais são: (i) -2,33 ou 2,33 para um nível de significância de 24 
1%, (ii) -1,65 ou 1,65 para um nível de significância de 5%, (iii) -1,28 ou 1,28 para um nível de 25 
significância de 10%, conforme a figura 1 aponta. As respostas corretas podem ser encontradas na tabela 26 
abaixo. 27 
 Estimativa pontual Estatística t 
Simbologia para a 
significância estatística 
Intercepto -0,207 -3,14 1 
log(experience) 0,168 8,84 1 
Primary education 0,017 0,35 N 
Preparatory education 0,091 1,38 10 
Intermediate education 0,087 2,12 5 
Tertiary/university education 0,223 4,21 1 
Female -0,397 -9,02 1 
Alexandria and Suez Canal Cities -0,048 -1,50 10 
Urban Lower Egypt -0,148 -4,63 1 
Urban Upper Egypt -0,092 -3,17 1 
Rural Lower Egypt -0,144 -4,97 1 
Rural Upper Egypt -0,129 -3,91 1 
Marital status 0,102 4,25 1 
Número total de explicativas 12 
N 6847 
 28 
 (2) [2,5 pontos] A tabela 2 abaixo contém resultados de um estudo empírico acerca do efeito do programa 29 
Indiano “Integrated Child Development Scheme (ICDS)” sobre o nível de saúde de crianças indianas de zero 30 
a dois anos de idade e de gênero masculino. A variável dependente (Y) é o escore Z para o déficit de altura. 31 
Tabela 2 Variável dependente: escore Z; crianças de zero a dois anos e de gênero masculino 32 
 
Estimativa 
pontual 
Desvio 
padrão 
Estatística 
t 
Alimentação suplementar diária 0,24 0,19 1,26 
Check-up mensal de saúde -0,07 0,20 -0,35 
Vacinação -0,09 0,14 -0,64 
Cuidados especiais na primeira 
infância 0,07 0,28 0,25 
Número total de explicativas 27 
N 5615 
R2 0,11 
3 
 
Estatística F (significância global) 25,57 
Fonte: Jain, M. India’s Struggle Against Malnutrition—Is the ICDS Program the Answer? World Development Vol. 67, pp. 72–33 
89, 2015. 34 
As variáveis explicativas mensuram o grau em que as crianças da amostra foram contempladas com serviços 35 
de proteção contra a desnutrição, providos pelo programa ICDS. Há 23 variáveis de controle adicionais, 36 
omitidas da tabela acima. O intercepto também foi omitido. 37 
Obtenha (i) os resultados dos testes de significância individual para as explicativas que constam na tabela 2 38 
e (ii) o resultado do teste de significância global. Considere que o resultado do teste de significância 39 
conjunta para as variáveis da tabela 2 é equivalente ao resultado do teste F de significância global. 40 
Assim fazendo, responda: há discordância ou concordância entre os resultados dos testes de significância 41 
individual, de um lado, e do teste de significância conjunta, de outro, no que tange à contribuição das 42 
explicativas da tabela 2 para a explicação da variável dependente e por quê? Em sua resposta, reporte os 43 
resultados das duas modalidades de testes de hipóteses e procure explicar a razão da discordância ou 44 
concordância fundamentando seu argumento nos objetivos e limitações de cada modalidade de teste 45 
(significância individual e significância conjunta). 46 
Atenção: os valores críticos devem corresponder ao nível de significância de 5%. Os testes de 47 
significância individual devem ser unicaudais com regiões críticas definidas pelos sinais das 48 
estimativas pontuais. Utilize os gráficos das distribuições t e F com graus de liberdade compatíveis ao 49 
final desta prova. 50 
R: 51 
1.Testes de significância individual: o valor crítico dos testes de significância individual para as 52 
explicativas discriminadas na tabela é de 1,65, segundo a figura 1. Desta maneira, as regiões críticas a 53 
serem consideradas são (-∞,-1,65] para explicativas associadas à estimativas pontuais negativas e [1,65, 54 
∞) para explicativas associadas à estimativas pontuais positivas. Nenhuma das estatísticas t observadas 55 
pertence à respectiva região crítica, e, pois, nenhuma das explicativas é individualmente significativa. 56 
2.Testes de significância global: o valor crítico do teste é 1,49 e, pois, a região crítica corresponde a [1,49, 57 
∞), conforme a figura 2. O valor observado da estatística F pertence à região crítica e, portanto, pode-se 58 
rejeitar a hipótese de ausência de significância global. 59 
3.Discordância entre os testes: assumindo, conforme requer o enunciado, que o resultado do teste de 60 
significância global pode ser tomado como equivalente ao resultado do teste de significância conjunta para 61 
as explicativas explicitadas na tabela 2, fica claro que há discordância entre os testes de significância 62 
individual e conjunta. Tal discordância se expressa da seguinte maneira. De acordo com os testes de 63 
significância individual, cujo resultado é apresentado no item 1, conclui-se que as explicativas da tabela 2 64 
não têm influências individuais estatisticamente relevantes sobre Y. Já, de acordo com o teste de 65 
significância conjunta, as explicativas têm significância conjunta, representando uma contribuição 66 
relevante para a explicação de Y. As explicativas da tabela 2, portanto, exercem influência não significativa 67 
quando tomadas individualmente, mas, porém, quando as influências individuais são tomadas em conjunto, 68 
considerando a composição delas, as explicativas se afiguram estatisticamente significativas. 69 
4. Razões da discordância (explicação):em primeiro lugar cabe afirmar que o teste de significância 70 
conjunta para as explicativas da tabela não é equivalente a uma sequencia de testes de significância 71 
individual que cubra todas as explicativas da tabela. De fato, há uma diferença substantiva, i.e., conceitual, 72 
4 
 
entre as duas modalidades de teste (significâncias individuais e significância conjunta), de modo que é 73 
possível que haja discordância entre elas, no sentido dado ao termo no item anterior. Provavelmente, há 74 
multicolinearidade na amostra, advinda do fato de que as explicativas da tabela 2 são medidas para o 75 
mesmo aspecto (grau de contemplação do programa ICDS). Sob multicolinearidade, a identificação dos 76 
efeitos individuais destas variáveis é dificultada, tornando-se imprecisa, o que repercute em testes de 77 
significância individual com tendência a não rejeitar a hipótese nula (ver seção 4.2 da nota de aula 10). 78 
Como a estatística F dos testes de significância global e conjunta é menos suscetível a esta fonte de 79 
imprecisão, ela permite constatar uma influência conjunta relevante, mesmo sob multicolinearidade. 80 
 81 
(3) [2,5 pontos] Visando aplicar a decomposição de Oaxaca ao mercado de trabalho do Estado de São 82 
Paulo, um pesquisador estimou quatro regressões. Cada uma delas se refere a um subgrupo amostral 83 
definido em função de gênero e etnia, conforme a tabela 3 abaixo detalha. Antes de proceder ao cálculo dos 84 
componentes discriminatórios dos diferenciais salariais, o pesquisador decidiu realizar uma série de testes de 85 
hipóteses. Entre eles, o de a significância conjunta (restrições de exclusão) das três medidas de setor de 86 
atividade, d_indu, d_serv e d_apub. Trata-se, portanto, do teste definido pelas seguintes hipóteses: 87 
H0: βd_indu = 0, βd_serv = 0, βd_apub = 0 vs. H1: βd_indu ≠ 0 ou βd_serv ≠ 0 ou βd_apub ≠ 0 88 
Os valores da estatística F e de seus respectivos graus de liberdade, para as regressões referentes a cada um 89 
dos quatro subgrupos amostrais, podem ser encontrados na tabela 3. 90 
Tabela 3 Resultados dos testes de significância conjunta para as três medidas setoriais por 91 
subgrupos amostrais de gênero e etnia 92 
Resultado do teste / 
subgrupo amostral 
Gênero: 
masculino 
Etnia: 
branca 
Gênero: 
masculino 
Etnia: não 
branca 
Gênero: 
feminino 
Etnia: 
branca 
Gênero: 
feminino 
Etnia: não 
branca 
F 30,004 19,186 1,8952 3,2582 
Graus de liberdade do 
denominador de F 3683 2543 3414 2062 
Valor crítico 
(preencher) 
Significativo (S/N) 
(preencher) 
 93 
Preencha as duas últimas linhas da tabela 3. Considere para isso um nível de significância de 1%. Os 94 
valores críticos podem ser encontrados ao final da prova, no gráfico da distribuição F compatível com os 95 
graus de liberdade do numerador e do denominador informados pelo enunciado e pela tabela 3. Na última 96 
linha, marque “S” caso o valor da estatística F seja desfavorável, a um nível de significância de 1%, à 97 
hipótese nula e marque “N” se o valor da estatística F for favorável à hipótese nula. 98 
Nota: colunas com valores críticos equivocados receberão nota zero, esteja ou não correta a resposta 99 
quanto à decisão do teste informada na última linha. 100 
R: Os graus de liberdade do numerador correspondem ao número de explicativas excluídas pela hipótese 101 
nula, três (3), no caso. Já os graus de liberdade do denominador variam entre os extremos 2.062 e 3.683. O 102 
gráfico apropriado, é portanto, o da figura 3. Deste modo, o valor crítico para as regressões referentes a 103 
5 
 
todos os subgrupos amostrais é de 3.79. Para os subgrupos com valores superiores a 3.79, portanto, o que é 104 
o caso dos dois subgrupos do gênero masculino, a hipótese nula deve ser rejeitada, e, portanto, as medidas 105 
setoriais são conjuntamente significativas para estes dois primeiros subgrupos. Deve-se, pois, marcar “S” 106 
nas duas primeiras colunas da última linha. Para os subgrupos com valores inferiores a 3.79, caso dos 107 
subgrupos do gênero feminino, a hipótese nula não deve ser rejeitada. Deve-se, pois, marcar “N” nas duas 108 
últimas colunas da última linha. 109 
 110 
(4) [2,5 pontos] Um aluno de Iniciação Científica interessado no tema de desnutrição infantil estimou por 111 
Mínimos Quadrados Ordinários (MQO) uma Função de Regressão Populacional (FRP) explicando uma 112 
medida de déficit de altura em função de múltiplas características das crianças, das famílias e dos 113 
domicílios. Adicionalmente, como exercício para compreender melhor o Método de Máxima 114 
Verossimilhança (MV), o aluno empregou tal método para estimar a FRP de interesse. Como resultado, 115 
obteve estimativas pontuais para os parâmetros (intercepto e coeficientes) exatamente iguais às obtidas por 116 
MQO. Quanto a isso, responda: porque a equivalência entre os métodos de MQO e MV, no que tange às 117 
estimativas pontuais, não é mera coincidência? Justifique sua resposta considerando o procedimento de 118 
estimação de uma FRP linear múltipla por máxima verossimilhança. Assuma que os dados utilizados pelo 119 
aluno verificam todas as hipóteses do Modelo Clássico de Regressão Linear (MCRL). 120 
R: A equivalência constatada não é mera coincidência, mas sim um resultado que se estende para todos os 121 
conjuntos de dados que verificam as hipóteses do MCRL. De fato, sob a validade de todas as hipóteses do 122 
MCRL, os estimadores de MV são equivalentes aos estimadores de MQO. Para ver isso, basta considerar o 123 
procedimento de estimação de uma FRP linear múltipla detalhado na seção 2 da nota de aula 11. 124 
Em primeiro lugar, a função objetivo do problema que dá fundamento ao método de MV, conforme 125 
explicado na seção 2.1 da nota de aula 11, é dada por: 126 
݈݋݃ ܮ(ߚ|ܺ,ܻ)௬|௑ = ෍݈݋݃൫݂(ݕ௜|	ܺ;ߚ)൯ே
௜ୀଵ
 
Trata-se da função de log-verossimilhança. 127 
Em segundo lugar, o problema de MV é: 128 
݉áݔఉ൛݈݋݃ܮ(ߚ|ܺ,ܻ)௬|௑ൟ = ݉áݔఉ ൝෍݈݋݃൫݂(ݕ௜ |	ݔ௜;ߚ)൯ே
௜ୀଵ
ൡ 
Assumindo as hipóteses de homocedasticidade (MCRL 5), ausência de autocorrelação (MCRL 6) e de 129 
função de distribuição de probabilidades normal para as perturbações (MCRL 7), tem-se que: 130 
݂(ݕ௜|	ܺ; ߚ) = 1
√2ߨߪଶ ݁ݔ݌ ൥− 12ቆݕ௜ − ݔ௜′ߚߪ ቇଶ൩ 
Desta maneira, o problema de MV passa a: 131 
݉áݔఉ ൝ܰ ݈݋݃ ൬ 1
√2ߨߪଶ൰ − 12ߪିଶ෍(ݕ௜ − ݔ௜′ߚ)ଶே
௜ୀଵ
ൡ 
6 
 
Dado que a parcela ܰ ݈݋݃ ቀ ଵ
√ଶగఙమ
ቁ e o fator ଵ
ଶ
ߪିଶ	 são constantes para o problema de maximização, pois 132 
não são funções de β, eles podem ser desconsiderados e, pois, chega-se ao seguinte problema, o qual é 133 
análogo ao problema de MQO: 134 
݉݅݊ఉ ൝෍(ݕ௜ − ݔ௜′ߚ)ଶே
௜ୀଵ
ൡ 
Como os problemas de MV e MQO coincidem, quando o objetivo é estimar uma FRP linear múltipla, os 135 
estimadores dos parâmetros, sugeridos por ambos os métodos, são equivalentes e, pois, as estimativas 136 
pontuais coincidem. 137 
Outra maneira de chegar à conclusão de que os estimadores de MV e MQO são equivalentes sob a validade 138 
das hipóteses do MCRL é considerar o teorema de Gauss-Markov. Dele resulta que o estimador de MQO é 139 
o estimador linear não-viesado com menor matriz de variância-covariância. Como o método de MV se 140 
caracteriza por proporcionar estimadores cuja matriz de variância-covariância atinge o menor valor 141 
possível com o aumento irrestrito da amostra (i.e, têm a propriedade de eficiência assintótica), então, 142 
obrigatoriamente, os estimadores de MV e de MQO têm de coincidir sob a validade de todas as hipóteses do 143 
MCRL. 144 
 145 
7 
 
 146 
Suplemento: funções de distribuição de probabilidades para os testes de significância individual e 147 
conjunta 148 
Figura 1 Distribuição t de Student com 6834 ou 5587 graus de liberdade 149 
 150 
Lendo a figura 1 acima 151 
As letras A, B e C indicam polígonos compreendidosentre a curva da distribuição t de Student e segmentos 152 
específicos do eixo horizontal, quais sejam: [-4;-2.33], para o polígono A, [-2.33;-1.65] para B e [-1.65;-153 
1.28] para C. As áreas dos polígonos são equivalentes a probabilidades acumuladas cujos valores são: 1% 154 
para A, 4% para B e 5% para C. E analogamente para o segmento positivo do eixo horizontal. 155 
Figura 2 Distribuição F com 27 graus de liberdade no numerador e 5587 graus de liberdade no 156 
denominador 157 
 158 
 159 
8 
 
 160 
Lendo a figura 2 161 
As letras A, B e C indicam polígonos compreendidos entre a curva da distribuição F de Snedecor e 162 
segmentos específicos do eixo horizontal, quais sejam: [1.36;1.49], para o polígono A, [1.49;1.74] para B e 163 
[1.74;2] para C. As áreas dos polígonos são equivalentes a probabilidades acumuladas cujos valores são: 5% 164 
para A, 4% para B e 1% para C. 165 
Figura 3 Distribuição F com 3 graus de liberdade no numerador e de 2602 a 3683 graus de 166 
liberdade no denominador 167 
 168 
Lendo a figura 3 acima 169 
As letras A, B e C indicam polígonos compreendidos entre a curva da distribuição F de Snedecor e 170 
segmentos específicos do eixo horizontal, quais sejam: [2.09;2.61], para o polígono A, [2.61;3.79] para B e 171 
[3.79;4] para C. As áreas dos polígonos são equivalentes a probabilidades acumuladas cujos valores são: 5% 172 
para A, 4% para B e 1% para C. 173 
 174 
 175 
 176 
 177 
 178 
 179 
 180 
 181 
9 
 
 182

Continue navegando

Outros materiais