Baixe o app para aproveitar ainda mais
Prévia do material em texto
10 Estatística Capítulo 1 Prova de 2008 Questão 1 Julgue as alternativas que se seguem. Se X e Y são duas variáveis aleatórias: Ⓞ V(Y | X) = E(Y² | X) – [E(Y | X)]². ① Se E(Y) = E(X) = E(YX) = 0, então E(Y | X) = 0. ② V(Y) > V(Y | X) se Y e X forem linearmente dependentes. ③ Se E(Y | X) = b0 + b1X, então E(Y) = b0. ④ Se E(Y | X) = b0 + b1X +b2Z e Y = b0 + b1X +b2Z + u, em que u é uma variável aleatória, então E(u | X) = 0. Resolução: (0) Verdadeira. Propriedade enunciada na Revisão de Conceitos. (1) Falsa. A afirmação E(Y) = E(X) = E(YX) = 0 implica que Cov(Y, X) = 0, ou seja, Y e X são não correlacionados. Isso implicará independência (que por sua vez implica E(Y | X) = E(Y) – prova dada na Revisão de Conceitos) somente se Y e X forem normais. E aí teríamos E(Y | X) = E(Y) = 0 pois afirma-se no início que E(Y) = 0. (2) Verdadeira. Se Y e X são linearmente dependentes, ou seja: Y = aX + b + ε, a ≠ 0 onde, E(ε | X) = 0 E(εX) = 0 Var(ε | X) = Var(ε) Então: Var (Y ) = Var (aX + b + ε ) Var (Y ) = a2Var ( X ) + Var (ε ) Var (Y | X ) = Var (aX + b + ε | X ) 0 ( | ) ² ( | ) ( | )Var Y X a Var X X Var X Var (Y | X ) = Var (ε | X ) = Var (ε ) ou seja, Var(X | X) = 0, pois quando condicionamos em X, este se torna fixo, isto é, como uma constante. Capítulo 1 | Probabilidade 11 Logo: Var(Y) > Var(Y | X) (3) Falsa. L. E. I . E (Y | X ) = b0 + b1 X ⇒E[E(Y|X)]=E(Y)=b0+b1E(X) (4) Falsa. Y = b0 + b1X +b2Z + u E(Y | X) = b0 + b1X + b2E(Z | X) + E(u | X) = b0 + b1X + b2Z E(u | X) = b2(Z – E(Z | X)) Questão 8 Sejam X, Y e Z variáveis aleatórias não negativas. Julgue as afirmativas: Ⓞ Se X > Y, então, E(X | Z) > E(Y | Z). ① (cov(X, Y))² ≤ var(X)var(Y). ② Se Z = X + Y, então, corr(Z, X) = corr(Y, X). ③ Se W1 e W2 são variáveis aleatórias de Bernoulli, independentes, com P(W1)=P(W2)= p, Z é uma variável aleatória com distribuição binomial em que Z = W1 + W2. ④ Se F(Y) = 1 – e-y, y ≥ 0, P(Y > 3| Y > 1) = P(Y > 2). Resolução: (0) Falsa. Note que: E ( X | Z ) = ∫xf (x | z )dx E (Y | Z ) = ∫yf ( y | z )dy Mesmo que X > Y, Z pode assumir algum valor específico z tal que f (y | z) = f (x | z) = 0, o que implica que E(X | Z = z) = E(Y | Z = z) = 0. Assim, a afirmativa E(X | Z) > E(Y | Z) não é válida para todo z. (1) Verdadeira. Sabemos que: −1 ≤ ρXY ≤ 1 −1 ≤ Cov (X,Y ) ≤ 1 σ xσ y 12 Estatística Elevando ao quadrado teremos: 2 2 2 2 [ ( , )]² 1 [ ( , )]² x y x y Cov X Y Cov X Y (2) Falsa. Se: Z = X + Y Então: E(Z) = E(X) + E(Y) ZX = X2 + XY E(ZX) = E(X2) + E(XY) Logo: Cov(Z, X) = E(ZX) – [E(Z)E(X)] = E[(X + Y)X] – E[(X + Y)E(X)] = E(X2 + XY) – E(X + Y)E(X) = E(X2) + E(XY)– [E(X) + E(Y)]E(X) = E(X2) + E(XY)– [E(X)]2 – E(X)E(Y) = Cov(X, Y) + Var(X) De forma que: 2 ( , ) ( , ) ( ) ( , ) ( , ) ( , ) z x z x z x y x z x y z x y x z z Cov Z X Cov X Y Var X Corr Z X Cov X Y Corr X Y (3) Verdadeira. Veja o capítulo referente às Principais Distribuições de Probabilidade. (4) Verdadeira. ( 3, 1) ( 3 | 1) ( 1) P Y Y P Y Y P Y Mas P(Y>3,Y>1)=P(Y>3)+P(Y>1)-P(Y>1)=P(Y>3). Assim: 3 2 1 ( 3) 1 (3) ( 3 | 1) 1 (2) ( 2) ( 1) 1 (1) P Y F e P Y Y e F P Y P Y F e Questão 12 Duas variáveis aleatórias X e Y são conjuntamente distribuídas de acordo com a função de densidade: 24 , 0 1 0 1 ; ( , ) 0, . xy xy se x e y x f x y casocontrário Calcule P(0 < Y < ¼ | X = ½). Multiplique o resultado por 100 e despreze os decimais. Resolução: Primeiro devemos obter a densidade condicional f (y | x), pois calcularemos uma probabilidade condicional. Primeiramente, f (x): 1 1 0 0 ( ) 24 12 ² 12 1 ² ( , ) 24 ( | ) ( ) 12 (1 )² 2 ,0 1,0 1 ; (1 )²( | ) 0, . . x x f x xydy x y x x f y x xy f y x f x x x y x y x xf y x c c Para x=1/2: 8 ,0 1/ 2; ( | 1 / 2) 0, . . y y f y x c c Assim: 1/4 1/4 0 0 4 1 (0 1/ 4 | 1 / 2) 8 4 ² 16 4 P Y X ydy y e, multiplicando por 100, obtemos 25. Questão 13 Uma seguradora verificou que, se um motorista acidentou o carro no ano de 2005, a probabilidade de que ele repita o acidente em 2006 é de 60%; e que se ele não acidentou o carro em 2005, a probabilidade de que isso aconteça em 2006 é de 30%. Assuma que as probabilidades sejam estáveis ao longo do tempo. Pergunta-se: Tendo o motorista se acidentado em 2005, qual a probabilidade de que ele venha a se acidentar novamente em 2007? Multiplique o resultado por 100. Resolução: Chame de A de “acidente” e NA de “não houve acidente”. Dado que o acidente ocorre em 2005, todos os eventos possíveis serão: A06 – A07 NA06 – A07 A06 – NA07 NA06 – NA07 onde, por exemplo, A06 representa que houve acidente em 2006. A probabilidade pedida se refere aos dois primeiros eventos, assim: PR(A07 | A05) = PR(A06 e A07 | A05) + PR(NA06 e A07 | A05) Analisando cada um dos termos do lado direito: Como as probabilidades são estáveis ao longo do tempo – por exemplo – Pr(A07 | A06 e A05) = Pr(A07 | A06) –, então o fato de ter ocorrido acidente em 2005 não afeta a probabilidade de ocorrer acidente em 2007, dado que ocorreu em 2006. Assim: Pr(A07 | A06 e A05) = Pr(A07 | A06), e usando na expressão abaixo: 07 06Pr( | ) 05 06 07 05 06 07 05 06 05 05 05 06 07 06 07 06 06 05 05 Pr( ) Pr( ) Pr( | ) Pr( 06 07 | 05) Pr( ) Pr( ) Pr( ) Pr( | ) Pr( 06 07 | 05) Pr( | ) Pr( | ) Pr( ) A A A e A e A A e A A A e A A e A A A A A e A A A A e A A A A A A A O mesmo raciocínio é válido para Pr(NA06 e A07 | A05) e, portanto: Pr (NA06 e A07 | A05) = Pr ( A07 e NA06 e A05 ) = Pr ( A05 e NA06 ) Pr ( A07 | NA06 e A05 ) Pr ( A05 ) Pr ( A05 ) = Pr ( A05 e NA06 ) Pr ( A07 | NA06 ) = Pr (NA06 | A05 )Pr ( A07 | NA06 ) Pr ( A05 ) Substituindo de volta na expressão acima: Pr (A07 | A05) = Pr (A06 | A05)⋅ Pr (A07 | A06) + Pr (NA06 | A05)⋅ Pr (A07 | NA06) ×100 = 0.6 ⋅0.6 + 0.4 ⋅0.3 = 0.36 + 0.12 = 0.48 ⇒ 48 Observação: Montando a árvore do jogo, conforme figura abaixo, a linha em negrito é a probabilidade pedida no enunciado, que será: 0.62 + 0.4 ⋅ 0.3 = 0.48 Questão 14 Empresas, em certa região, contam com duas linhas de financiamento: uma com taxa de 5%a.a. e outra com taxa de 20%a.a., dependendo do histórico de crédito. Sabe-se que 1/3 das empresas pagam juros de 5%. Destas, metade é familiar. No grupo de empresas que paga 20%, metade é familiar. Pergunta-se: Qual a taxa de juros média (em %a.a.) paga pelas empresas familiares naquela região? (desconsidere os decimais). Resolução: Note que a média deve ser feita entre as firmas familiares. Para a taxa de juros de 5%, 1/3 do total das empresas paga esta taxa de juros, e, destas, 1/2 é familiar. Logo, estas firmas familiares, que pagam 5%, representam 1/6 do total. Para a taxa de juros de 20%, 2/3 do total das empresas pagam esta taxa de juros, e, destas, 1/2 é familiar. Logo, estas firmas familiares, que pagam 20%, representam 2/6 do total. Para restringirmos o universo das empresas familiares, devemos norma-lizar os pesos, ou seja, para o cálculo da média, o primeiro grupo terá o peso de (1/6)/(1/6 + 2/6) = 1/3. O segundo grupo terá peso (2/6)/(1/6 + 2/6) = 2/3. Assim, a média será: 1001 2 0.05 0.4 0.05 0.2 0.15 15. 3 3 3 x ou seja, a probabilidade das firmas pagarem 5% de juros é 1/3. Chamando F de empresas familiares,teremos: Pr( | 5%)Pr(5%) 1 1 1 1 1 Pr(5% | ) . ( ) 2 3 Pr( ) 6 Pr( ) F F P F F F que é a probabilidade de uma firma pagar 5%, dado que é do grupo familiar, obtida a partir das outras probabilidades mostradas no enunciado, sendo que Pr(F) é a probabilidade de uma firma ser familiar. Podemos, analogamente, obter também: Pr( | 20%)Pr(20%) 1 2 1 1 1 Pr(20% | ) . ( ) 2 3 Pr( ) 3 Pr( ) F F P F F F que é a probabilidade de uma firma pagar 20%, dado que é do grupo familiar, obtida a partir das outras probabilidades mostradas no enunciado. As probabi-lidades (mesmo as condicionais) devem somar 1, ou seja: Pr (5% | F ) + Pr (20% | F ) = 1 1 1 1 1 1 6 Pr( ) 3 Pr( ) 1 1 1 Pr( ) 6 3 2 F F F Para obter a taxa de juros média paga pelas empresas familiares, temos que tomar a média apenas entre tais empresas: 1001 / 6 2 / 6 .0,05 0,15 15. 1 / 2 1 / 2 x Prova de 2009 Questão 2 Sobre a Teoria das Probabilidades, indique as alternativas corretas e falsas: Ⓞ Sejam 3 eventos A, B e C. Então, podemos demonstrar que P(A | B) = P(C | B)P(A | B ∩ C) + P( C | B)P(A | B ∩ C ), assumindo que todos os eventos têm probabilidade positiva. ① Se dois eventos A e B são independentes, os eventos A e B não serão necessariamente independentes. ② Se A, B e C são três eventos, tais que A e B são disjuntos, A e C são independentes e B e C são independentes, e supondo-se que 4P(A) = 2P(B) = P(C) e P(A ∪ B ∪ C) = 5P(A), pode-se dizer que P(A) = 1/6. ③ Se uma família tem exatamente n crianças (n ≥ 2), e assumindo-se que a probabilidade de que qualquer criança seja menina é igual a 1/2 e todos os nascimentos são independentes, pode-se afirmar que, dado que a família tem, no mínimo, uma menina, a probabilidade da mesma ter, no mínimo, um menino, é igual a (1 – (0,5)n–1)/(1 – (0,5)n). ④ Se A, B e C são eventos com probabilidade não nula, definidos em um espaço amostral S, então P(A ∩ C | B ∩ C) = P(A ∩ B | C) / P(B | C). Resolução: O item (3) está resolvido no capítulo Principais Distribuições de Probabilidade. (0) Verdadeira. Note que o lado direito de P(A | B) = P(C | B)P(A | B ∩ C) + P( C | B)P(A | B ∩ C ), pode ser escrito como: P (C | B)P (A | B ∩ C) + P ( | B)P (A | B ∩ ) = C C P (C ∩ B) P (A ∩ B ∩ C) P ( ∩ B) P (A ∩ B ∩ ) = + C C P (B) P (B ∩ C) P (B) P (B ∩ ) C P (A ∩ B ∩ C) P (A ∩ B ∩ ) = + C P (B) P (B) Note que (A ∩ B ∩ C) e (A ∩ B ∩ C ) são disjuntos e sua união é igual a (A ∩ B). Logo, P(A ∩ B) = P[(A ∩ B ∩ C) ∪ (A ∩ B ∩ C )] = P(A ∩ B ∩ C) + P(A ∩ B ∩ C ) Substituindo esta expressão, teremos: ( ) ( | ) ( ) P A B P A B P B então, provamos que o lado direito da expressão apresentada no item se iguala ao lado esquerdo. (1) Falsa. Proposição enunciada e provada na Revisão de Conceitos. (2) Verdadeira. Note que: P(A ∪ B ∪ C) = P(A) + P(B) + P(C) – P(A ∩ C) – P(B ∩ C) Faça um diagrama de Venn e note que, como A e B são disjuntos, não é necessário descontar a dupla contagem quando somamos as probabilidades de cada evento. Assim: P(A ∪ B ∪ C) = P(A) + P(B) + P(C) – P(A)P(C) – P(B)P(C) 5P(A) = P(A) + 2P(A) + 4P(A) – P(A)4P(A) – 2P(A)4P(A) P(A)[2 – 12 P(A)] = 0 P(A) = 1/6 ou P(A) = 0 Então, podemos dizer que P(A) = 1/6. (4) Verdadeira. Pela definição de probabilidade condicional: P( A ∩ C | B ∩ C) = P( A ∩ B ∩ C) = P( A ∩ B | C) P(C) = P ( A ∩ B | C ) . P( B ∩ C) P( B | C) P(C) P( B | C) Questão 3 Considere duas variáveis aleatórias X e Y. Suponha que X seja distribuída de acordo com a seguinte função de densidade: 1, 0 1; ( ) 0, . x se x f x casocontrário Suponha ainda que | 1/ , 0 1; ( | ) 0, . y x x se x f y x casocontrário Calcule E(Y). Multiplique o resultado por 100. Resolução: Para calcular E(Y), vamos usar a Lei das Expectativas Iteradas (LEI): 11 1 00 0 0 11 1 00 0 ( ( | )) ( ) 1 ² 1 ( ( | )) 1 2 ² 1 ² 1 100 25 2 2 4 4 X Y Y yx X Y y x x E E Y X E y E E Y X y dy dx dx x x x x x dx dx x Questão 4 A roleta é um jogo bastante popular em cassinos. Uma roleta típica possui 18 valores ver-melhos, 18 verdes e 2 pretos. Suponha que para entrar no jogo um apostador deva pagar R$2 a cada rodada, ganhando 0,50 caso o resultado da jogada seja vermelho, R$1 caso o resultado seja verde, R$10 caso seja preto. Qual é o lucro líquido do apostador após 100 jogadas? Multiplique por 76 e some 100 ao resultado. Resolução: Anulada. Possivelmente por dois motivos: 1) A questão deveria mencionar o lucro líquido esperado. O lucro líquido é uma variável aleatória que depende, fundamentalmente, dos resultados oferecidos pela roleta. Então, só poderíamos- determinar uma função de probabilidade para o lucro esperado. 2) A respostada questão (obtida sob a hipótese de que se pede o lucro líquido esperado) é negativa, o que não permite a marcação correta no cartão de respostas. O lucro líquido esperado a cada rodada é obtido pelo ganho esperado a cada rodada menos o investido para jogar em cada rodada. Calculando-se o ganho esperado para cada rodada, que depende da probabilidade da ocorrência de cada cor em cada rodada, temos: E(G) = R$ 0,5P(Vermelho) + R$ 0,5P(Verde) + $0,5P(preto)= 18 18 2 ( ) 0,5 1 2 $1, 237. 38 38 38 E G R Considerando que seu investimento em cada rodada é de R$2, o seu lucro líquido esperado será R$ 2 – R$ 1,237 = – R$ 0,763. Ou seja, na verdade, um prejuízo esperado. Após 100 rodadas, o seu lucro esperado será de – R$ 76,3. Multiplicando-se este resultado por 76, temos R$ 76,3 . 76 = – R$ 5.800. So-mando-se 100 ao resultado, obtêm-se – R$ 5.700. Questão 5 Sobre variáveis aleatórias, indique se as afirmativas são corretas ou falsas: Ⓞ Se X é uma variável aleatória contínua com fdp dada por f(x) = x/12 se 1 < x< 5 e f(x) = 0 para outros valores, então a densidade de Y = 2X – 3 é g(y) = (y + 3)/24 se – 1 < y < 7 e g(y) = 0 para outros valores. ① Se X e Y tiverem um coeficiente de correlação igual a ρ(X,Y), e definindo Z = aX + b e W = cY + d, então ρ(X,Y) = ρ(Z,W) somente se a > 0 e c > 0. ② Se X possui uma distribuição Normal, com média µ e variância σ², então Z = aX + b possui distribuição Normal com média aµ e variância (a)² σ². ③ Se a função de distribuição de probabilidade conjunta para duas variáveis aleatórias X e Y é definida como f(x, y) = 0,01; 0 ≤ x, y ≤ 10 e f(x, y) = 0 para qualquer outro valor, então, X e Y são variáveis aleatórias independentes. ④ Se duas variáveis aleatórias X e Y têm covariância nula, então elas são independentes. Resolução: (0) Falsa. Para obtermos a densidade de Y, utilizaremos, primeiramente, a densidade acumulada: 3 ( 3)/22 11 ( ) Pr( ) Pr(2 3 ) 3 Pr 2 ² ( 3)² / 4 1 12 24 24 24 ² 6 9 4 ² 6 5 96 96 Y y y F y Y y X y y X x x y dx y y y y Diferenciando para obter a função de densidade de probabilidade de y: g ( y ) = dFy ( y) = 2y + 6 = y + 3 dy 96 48 Aplicando os extremos que x pode assumir, para saber os extremos que y pode assumir: se x = 1, então y = 2x – 3 = 2 . 1 – 3 = –1, e se x = 5, então y = 7. Logo: 3 , 1 7 ( ) 48 0, y se y g y casocontrário Observação: Outra forma de se fazer é usar a seguinte propriedade: Se X for uma v.a. contínua, com densidade f (x) > 0, a < x < b, então Y = h(X) tem densidade expressa por: 1( ) ( ( )) dx g y f h y dy dado que h seja monotônica e diferenciável para todo x. Assim, comoY = 2X – 3, então h–1 (y) será: y = 2x − 3 2x = y + 3 h−1 ( y ) = x = 3 2 y Além disso: 1 2 dx dy 22 Estatística Substituindo h–1 (y) e dx dy na expressão da propriedade acima, teremos: 3 1 ( ) 2 2 ( 3) / 2 1 ( ) 12 2 ( 3) 1 ( ) 24 2 ( 3) ( ) 48 y g y f y g y y g y y g y Aplicando os limites de x para obter os limites de y, obtemos a mesma expressão anterior. (1) Falsa. Note que: ( , ) ( , ) ( , ) ( ) ( ) ( , ) ( , ) ² ( ) ² ( ) | || | ( ) ( ) ( , ) ( , ), 0; ( , ) ( , )| | ( , ), 0. x y x y x y Z W aX b cY d Cov aX b cY d Var aX b Var cY d acCov X Y acCov X Y a Var X c Var Y a c Var X Var Y Cov X Y X Y se ac acCov X Y Cov X Yac X Y se ac Assim, p(x,y) = p(z,w), se ac > 0, ou seja, quando a > 0 e c > 0 ou a < 0 e c < 0. Observação: Essa propriedade foi enunciada e provada na revisão de concei- tos. Bastava fixar c=d=0 e verificar que é válida quando ab>0. Esta desigualdade ocorre quando a>0 e c>0 ou quando a<0 e c<0. (2) Falsa. A média de Z será E(Z) = aE(X) + b = aµ + b. Capítulo 1 | Probabilidade 23 (3) Verdadeira. A densidade marginal de X e Y é: 10 0 10 0 ( ) 0.01 0.1 ( ) 0.01 0.1 ( , ) ( ) ( ) 0.1 0.1 X Y X Y f x dy f y dx f x y f x f y (4) Falsa. O inverso é válido. A ida só seria válida se X e Y tiverem distribuição Normal bivariada. Veja o capítulo de Principais Distribuições de Probabilidade. Capítulo 2 Prova de 2008 Questão 2 Julgue as afirmativas: Ⓞ Se x é uma variável aleatória Gaussiana com média e variância ² , então 2 ( ) 4 X Z segue uma distribuição Qui-quadrado com 4 graus de liberdade. ①. Se X segue uma distribuição Qui-quadrado com n graus de liberdade, então E(X) = n e V(X) = 2n. ② Uma distribuição uniforme no intervalo [0,10] tem variância igual a 25/3. ③ Sejam X1, X2 ..., Xn, n variáveis aleatórias independentes com distribuição Normal com média μ e variância σ². Seja / X Z s n , em que 1 1 n ii X x n e 2 1 1 n ii s x x n , então, Z segue uma distribuição Normal com média 0 e variância 1 para qualquer valor de n. ④ Sejam X1 e X2 duas variáveis aleatórias independentes, com distribuição qui-quadrado com n1 e n2 graus de liberdade, respectivamente. Então 1 1 2 2 / / x n z x n segue uma distribuição com n1 e n2 graus de liberdade. Capítulo 2 | Principais Distribuições de Probabilidade 81 Resolução: (0) Falsa. Veja que Z é a soma de 4 variáveis normais padronizadas ao qua- drado exatamente iguais, o que poderia nos levar a pensar, erradamente, que seria uma χ24 . Mas, conforme enunciado na Revisão de Conceitos (parte de Equivalências), para que a soma de normais padronizadas ao quadrado seja uma Qui-quadrado, necessitamos afirmar que tais variáveis aleatórias normais sejam independentes, o que é impossível, pois todas são exatamente iguais e, portanto, completamente dependentes. Observação: Outra forma de ver a questão é que o correto seria afirmar apenas que: 2 2 1 ( ) 4 Z X (1) Verdadeira. Conforme enunciado na Revisão de Conceitos (Distribuição Qui-Quadrada), se 2 nX , então E(X) = n e Var(X) = 2n. (2) Verdadeira. Podemos aplicar a fórmula da variância da uniforme diretamente, conforme já mostrada na Revisão de Conceitos: [ , ] [0,10]X U a b U ( )² 100 25 ( ) 12 12 3 b a Var X . (3) Falsa. Note que o correto seria que: / X Z n segue uma Normal padronizada. Mas o enunciado cita que / X Z S n , ou seja, usa o desvio padrão amostral (S2) e não o populacional (σ2). Logo, Z segue uma distribuição tn–1. Z só se aproximará para uma Normal quando n for para infinito. Outro erro é que deveríamos ter n ≥ 2, pois para n = 1 não é possível cal- cular S. (4) Verdadeira. Esta é uma equivalência exata entre distribuições Qui-quadra- do e F, mostrada na Revisão de Conceitos. 82 Estatística Prova de 2009 Questão 2 Sobre a Teoria das Probabilidades, indique as alternativas corretas e falsas: Ⓞ Sejam 3 eventos A, B e C. Então podemos demonstrar que P(A | B) = P(C | B)P(A | B ∩ C) + P( C | B)P(A | B ∩ C ), assumindo que todos os eventos têm probabilidade positiva. ① Se dois eventos, A e B, são independentes, os eventos A e B não serão necessariamente independentes. Se A, B e C são três eventos tais que A e B são disjuntos, A e C são independentes e B e C são independentes, e, supondo-se que 4P(A) = 2P(B) = P(C) e P(A ∪ B ∪ C) = 5P(A), pode-se dizer que P(A) = 1/6. Ⓞ Se uma família tem exatamente n crianças (n ≥ 2), e assumindo-se que a probabili-dade de que qualquer criança seja menina é igual a 1/2, e todos os nascimentos são independentes, pode-se afirmar que, dado que a família tem, no mínimo, uma menina, a probabilidade de ela ter, no mínimo, um menino, é igual a (1 –(0,5)n – 1) / (1 – (0,5)n). ① Se A, B e C são eventos com probabilidade não nula, definidos em um espaço amostral S, então P(A ∩ C | B ∩ C) = P(A ∩ B | C) / P(B | C). Resolução: Os itens (0), (1), (2) e (4) estão resolvidos no Capítulo Probabilidade. (3) Verdadeira. Vamos chamar de: A: número de meninos maior ou igual a 1 ② número de meninas maior ou igual a 1 Então: Ac: número de meninos igual a 0. Bc: número de meninas igual a 0. Então, pede-se: ( ) ( | ) ( ) P A B P A B P B Note que o item se trata de uma distribuição binomial, pois temos n nas-cimentos (experimentos) independentes, onde podem ocorrer dois resultados: nascer menino ou menina. O denominador da expressão acima é fácil de calcular:- P (B) = 1− P ( Bc ) = 1− 0 n (0.5)0 (0.5)n = 1− (0.5)n. Capítulo 2 | Principais Distribuições de Probabilidade 83 Em relação ao numerador, note que, pela Lei De Morgan (enunciada na Revisão de Conceitos do capítulo de Probabilidade): (A ∩ B) = (Ac ∪ Bc)c Logo: P(A ∩ B) = P(Ac ∪ Bc)c = 1 – P(Ac ∪ Bc)c P(A ∩ B) = 1 – P(Ac) – P(Bc) + P(Ac ∩ Bc). O que é a probabilidade do último termo: (Ac ∩ Bc)? É o número de meni- nos e meninas ser igual a zero. Tal evento é um conjunto vazio, pois o número de meninos mais o número de meninas que a família tem é igual a n ≥ 2 e, portanto, nunca ambos podem ser iguais a zero. Logo: P(Ac ∪ Bc) = P(Ø) = 0. Assim, como P(Bc) = 1 – P(B) = (0.5)n (ver cálculo feito acima), podemos, de forma análoga, calcular P(Ac) = (0.5)n. Substituindo na expressão acima: P(A ∩ B) = 1 – P(Ac) – Pr(Bc) ④ 1 – (0.5)n – (0.5)n ④ 1 – 2(0.5)n ④ 1 – 2(0.5)(0.5)n – 1 ④ 1 – (0.5)n – 1. Assim: Pr (A | B) = 1 − (0.5)n−1 1 − (0.5)n Questão 6 Seja Yi, i = 1, ... , n, uma variável aleatória tal que Yi = 1, com probabilidade p e Yi = 0, com probabilidade 1-p. Defina 1 n ii X Y . Responda se cada uma das afirmativas abaixo é verdadeira ou falsa: Ⓞ Yi, i = 1, ... , n, possui distribuição Poisson com média p. ① X possui distribuição binomial com parâmetros n e p. ② V(Yi) = V(X) = p. V(X) significa variância de X. ③ Se n e p permanecer fixo, então (1 ) X np np p converge para distribuição Normal com média 0 e variância 1. (3) ( ²) ²E Y p . 84 Estatística Resolução: Ⓞ Falsa. Não atende às condições da binomial se aproximar para uma Poisson, conforme enunciadas na Revisão de Conceitos: np constante e n ou n , p 0, np λ. Ⓞ Verdadeira. A variável aleatória Yi é uma Bernoulli. A soma de Bernoullis independentes, com a mesma probabilidade p, é uma binomial, conforme enunciado na Revisão de Conceitos. Em questões de anos anteriores, quandose mencionava que Yi era uma v.a. de Bernoulli, então subentendia-se que tais variáveis deveriam ser independentes entre si. Ⓞ Falsa. Var(X) = np(1 – p) e Var(Yi) = p(1 – p). ④ Verdadeira. É a aproximação da binomial para a Normal (Ver Revisão de Conceitos – na parte de Aproximações entre Distribuições). ④ Falsa. E(Y2) = 12 . p + 02 . (1 – p) = p. Questão 7 Sejam X1, X2, ..., Xn variáveis aleatórias independentes e normalmente distribuídas com média μ e variância 1. Defina as variáveis aleatórias 1 1 n ii X n X e 2 1 n ii Z X . É correto afirmar que: Se R = X1, quando X1 >0, P(R ≤ 1) = Φ(1 – μ) / (1 – Φ(0 – μ)), em que Φ(c) é a função de distribuição de uma variável aleatória Normal Padrão. (3) Z é uma variável aleatória com distribuição χ2 com n graus de liberdade. Se W = exp(X), E(W) = μ + σ2/2. = nX é uma variável aleatória normalmente distribuída com média nμ e variância n. ④ A variável aleatória i i Y W z n , em que ( )i iY X possui distribuição F com n1 e n2 graus de liberdade, em que n1 = 2 e n2 = 2n. Capítulo 2 | Principais Distribuições de Probabilidade 85 Resolução: (5) Falso. Note que estamos calculando uma probabilidade condicional, pois R é uma Normal truncada em X1 > 0: P(R ≤ 1) =P(X1 –1|X1 >0) P(X1 – µ ≤ 1 – µ | X1 – µ > µ) P(Z ≤ 1 – µ | Z > – µ) P(– µ < Z ≤1 – µ) / P(Z > – µ) [Φ(1 – µ) – Φ(– µ)] / (1 – Φ (µ)) [Φ(1 – µ) + Φ(µ) – 1] / Φ(µ) Ⓞ Falso. Seria correto para: 2 2 1 i i i i X Z X ou seja, para a soma de n normais padronizadas. (2) Falso. E(W) = exp(μ + σ2/2), onde W é lognormal. ① Verdadeiro. nX = Σi Xi é apenas uma soma (ou combinação linear) de variáveis- aleatórias normais independentes. Logo, será também Normal, com parâmetros: ' ( ) 1 i i i i i X s independentes i i i i i E nX E X X n Var nX Var X Var X n (4) Falso. Pois Z não é uma Qui-quadrado (ver item 1). Capítulo 3 Prova de 2008 Questão 3 Sejam X1, X2, ..., Xn n variáveis independentes, igualmente distribuídas, com distribuição Poisson dada por , 0,1,2,... ( ) ! 0, . x x e x p x x casocontrário . Julgue as afirmativas: ①. Pela Lei dos Grandes Números 1 1 n ii T X n aproxima-se da distribuição Normal quando n tende para o infinito. ②. Suponha que n > 5. 5 1 6 1 1 5 5 n i ii i T X X n é um estimador consistente de E(Xi). ② 2 1 1 1 1n n i ii i T X X n n é um estimador tendencioso de ² . ② Pelo Teorema Central do Limite, 1 1 n ii T X n é um estimador consistente de V(Xi). ④ 1 1 n ii T X n é o estimador de máxima verossimilhança do parâmetro λ. Resolução: Os itens (1) a (4) estão resolvidos no capítulo Inferência Estatística. (4) Falsa. É pelo TLC que a média se aproxima da Normal quando n tende para o infinito, ou seja: T ≈ N(λ, λ / n). 120 Estatística Prova de 2009 Questão 8 Verifique se as afirmativas abaixo são verdadeiras: Ⓞ Em uma pesquisa de opinião a proporção de pessoas favoráveis a uma determinada medida governamental é dada por p̂ = ∑ Xi /n. O menor valor de n para o qual a desigualdade de Tchebycheff resultará em uma garantia que P(| p̂ – p| ≥ 0,01) ≤ 0,01 é 200.000. ① Quando o número de graus de liberdade δ cresce, a distribuição 2 aproxima-se de uma distribuição normal com média δ e desvio padrão 2δ. ② Um intervalo de confiança de 99% para a média µ de uma população, calculado para uma amostra aleatória, como [2,75;8,25], pode ser interpretado como: a probabilidade de µ estar no intervalo calculado é de 99%. (5) Seja X1, X2, ..., Xn uma amostra aleatória simples proveniente de uma população com distribuição de Pareto, cuja função de densidade é dada por f(x) = θ (1 + x)–(θ + 1), 0 < x < , θ > 1. Então o estimados de máxima verossimilhança para θ é log(1 )i n x . Ⓞ Se existente, todo estimador de máxima verossimilhança calculado para uma amostra aleatória possui distribuição Normal em grandes amostras. Resolução: (0) Falsa. Lembrando que a variância da proporção é: 1 1 1 ² (1 ) ˆ( ) ² ² ² n i i p p Var p Var X n n n n n Logo: 1 ˆ ² P p k kn Assim: 1 0.01 ² 10 0.01 1 1000 (1 ) 1 1000 (1 )(1000)² k k k n n p p n n p p onde p é a probabilidade de uma pessoa ser favorável a uma determinada medida governamental. Para termos n = 200000 dependerá de p. Assumindo que p = 12, valor que torna a variância máxima (cenário mais conservador), temos que 1 1 1000000 (1 )(1000) 10000000 250000. 2 2 4 n p p ② Falsa. O TLC não vale para aproximar a 2 para a normal, visto que ela é o quadrado de normais padronizadas. A aproximação que podemos afirmar é que: Para 30 , a v.a. 2 (2 1) (0,1)Y N , onde 2Y . Capítulo 4 Prova de 2008 Questão 3 Sejam X1, X2, ..., Xn n variáveis independentes, igualmente distribuídas, com distribuição Poisson dada por , 0,1,2,... ( ) ! 0, . x x e x p x x casocontrário . Julgue as afirmativas: ②. Pela Lei dos Grandes Números 1 1 n ii T X n aproxima-se da distribuição Normal quando n tende para o infinito. ③. Suponha que n > 5. 5 1 6 1 1 5 5 n i ii i T X X n é um estimador consistente de E(Xi). ② 2 1 1 1 1n n i ii i T X X n n é um estimador tendencioso de ² . ② Pelo Teorema Central do Limite, 1 1 n ii T X n é um estimador consistente de V(Xi). ④ 1 1 n ii T X n é o estimador de máxima verossimilhança do parâmetro λ. Resolução: O item (0) está resolvido no capítulo Principais Teoremas de Probabilidade. (1) Falsa. 5 5 ( ) 2 5 5 n E T n Utilizando a propriedade enunciada na Revisão de Conceitos (estimador consistente): lim E(T) ≠ 2λ E: 5 5 ( ) 25 5 ² 5 5 n Var T n n Assim, lim ( ) lim 5 5 5 Var T n Logo, o limite da esperança de T não converge para a média (λ) nem a variância de T não converge para zero. Então, T não é estimador consistente. (2) Verdadeira. 2 2 1 1 ( ) ( ) i i i i E T E X E X n n E T E X E X Assim, 2( ) ² 1 ² 1 E T Var X E X E X n n onde, na segunda linha, utilizamos o fato de que Var( X ) = σ2 / n = λ / n e E( X ) = ① = λ. Assim, E(T) ≠ λ2. Observação: A rigor, este item seria falso, pois dever-se-ia garantir que n > 1. Para n = 1, teríamos que E(T) = λ2. Este seria um contraexemplo do que seria um estimador não viesado. ② Falsa. É pela LGN, enunciada na Revisão de Conceitos do capítulo dos Principais Teoremas de Probabilidade. ② Verdadeira. Montando a função de máxima verossimilhança: ! log log ! log log ! log log ! i i xn i i xn i i n i i i n n i i i i e L x e L x x x n x x Maximizando esta função, obtemos como CPO: log 0 n i i n i i x d L n d x T n Questão 4 A respeito de testes de hipótese, é correto afirmar: Ⓞ Potência de um teste é a probabilidade de se rejeitar a hipótese nula quando esta for falsa. ① O nível de significância de um teste é a probabilidade de se cometer um erro tipo 1. ② O teste F de significância conjunta dos parâmetros em um modelo de regressão linearé unilateral. ④ Se uma variável é significativa ao nível de 1%, então ela é significativa ao nível de 5%. ④ p-valor = 1 – P(H0 falsa), em que P(A) é a probabilidade do evento A ocorrer. Resolução: (4) Verdadeiro. Ver Revisão de Conceitos – função poder (teste de hipóteses). (5) Verdadeiro. Ver Revisão de Conceitos – erro tipo I (teste de hipóteses). (6) Falso. O teste F de significância conjunta é sempre bilateral. (7) Verdadeiro. Ao nível de significância de 5%, estamos sendo menos exigen-tes, ou seja, menos precisos. = Falso. Conforme Revisão de Conceitos (teste de hipóteses), o p-valor é a probabilidade, sob a hipótese nula, de que a estatística de teste assuma um valor que dê a mesma ou mais evidência contra a hipótese nula do que o valor assumido por ela no presente teste. Prova de 2009 Questão 8 Verifique se as afirmativas abaixo são verdadeiras: Ⓞ Em uma pesquisa de opinião a proporção de pessoas favoráveis a uma determinada medida governamental é dada por p̂ = ∑ Xi /n. O menor valor de n para o qual a desigualdade de Tchebycheff resultará em uma garantia que P(| p̂ – p| ≥ 0,01) ≤ 0,01 é 200.000. ①. Quando o número de graus de liberdade δ cresce, a distribuição 2 aproxima-se de uma distribuição normal com média δ e desvio padrão 2δ. ②. Um intervalo de confiança de 99% para a média µ de uma população, calculado para uma amostra aleatória, como [2,75;8,25], pode ser interpretado como: a probabilidade de µ estar no intervalo calculado é de 99%. ③. Seja X1, X2, ..., Xn uma amostra aleatória simples proveniente de uma população com distribuição de Pareto, cuja função de densidade é dada por f(x) = θ (1 + x)–(θ + 1), 0 < x < , θ > 1. Então o estimados de máxima verossimilhança para θ é log(1 )i n x . Ⓞ Se existente, todo estimador de máxima verossimilhança calculado para uma amostra aleatória possui distribuição Normal em grandes amostras. Resolução: Os itens (0) e (1) estão resolvidos no capítulo Principais Teoremas de Probabilidade. = Falsa. Ver Revisão de Conceitos – intervalo de confiança. = Verdadeira. Devemos montar a função de máxima verossimilhança: 1 1 1 ( 1) 1 ( 1) 1 , ,..., ,..., ; ( ; ) (1 ) (1 ) n n n ii n ii n ii L x x f x x f x x f x Assim, devemos resolver o problema de maximização. Para isso, façamos uma transformação monótona sobre a função verossimilhança, por exemplo, passando o logaritmo: ( 1) 1 1 ( 1) 1 ( 1) 1 1 1 ln , ,..., ln (1 ) ln ln (1 ) ln ln (1 ) ln 1 ln(1 ) ln 1 ln(1 ) nn n ii nn ii n n i i n n i i n n i i L x x f x f x x x x Maximizando tal função: 1 max ln 1 ln(1 ) n n i i x A CPO será: 1 1 1 1 ˆ ln(1 ) 0 ˆ 1 ln(1 ) 0 ˆ ˆ ln(1 ) n n in i n in i n i i n x n x n x que é a expressão pedida no item. ③ Verdadeira. Conforme Revisão de Conceitos (EMV), uma das propriedades dos EMVs é o fato de que eles têm distribuição assintótica Normal. Questão 9 Avalie se as afirmações abaixo são verdadeiras ou falsas: ④ Para uma amostra de tamanho fixo, ao aumentar a probabilidade do erro tipo 1 aumentamos também o poder do teste. (2) O valor p é o menor nível de significância para o qual o valor observado da estatística teste é significativo. (3) Se a estatística teste é z = 2,75 e o valor crítico é z = 2,326, consequentemente o valor p é maior do que o nível de significância em um teste bicaudal e bilateral. z O poder de um teste de hipóteses é a probabilidade de rejeitar corretamente uma hipótese nula falsa. (4) Para um teste de hipótese de média com variância conhecida e igual a 4 para uma amostra aleatória de tamanho 16 e uma região crítica dada por [4,5, ∞[, o poder do teste para Ha: µ=5 é 0,84 (arredondando para duas casas decimais). Resolução: 1 Verdadeira. Se aumentarmos α, P(Erro I) aumenta, mas diminui a P(Erro II). É o clássico problema da coberta curta, ou seja, se a puxarmos para cobrir a cabeça, descobrimos os pés e vice-versa. A única forma de reduzirmos tal problema seria aumentar a coberta. Ou seja, se aumentarmos a amostra, a variância amostral se reduz (caudas mais finas) e a P(Erro II) pode ser reduzida, sem alterar a P(Erro I). 2 Falsa. Mesmo problema que foi visto em Questão sobre o p-valor, em provas da Anpec, em anos anteriores. Essa é uma interpretação que auxilia no entendimento do p-valor, mas está errada. Uma interpretação correta foi dada no item 4, questão 4, na prova da Anpec de 2008, por exemplo. 3 Falsa. Não se sabe qual é a hipótese nula, de modo que é impossível determinar o p-valor do teste. 4 Verdadeira. Ver Revisão de Conceitos – função poder (teste de hipóteses). 5 Anulada, possivelmente porque esqueceram de informar que X tem distribuição Normal. Além disso, o uso do TLC aqui é inapropriado, devido ao pequeno tamanho da amostra. Supondo que X seja normal, a questão pode ser resolvida como segue: o poder do teste é a probabilidade de se rejeitar H0, dado que ela é falsa, ou seja, dado que Ha é válida. Supondo que Ha é válida, então µ = 5. Assim, devemos calcular: 5 4.5 5 Pr 4.5 Pr Pr( 1) Pr( 1) 0.8413 2 / 4 2 / 4 X X z z que seria o poder do teste. Logo, o item seria verdadeiro. Capítulo 5 Prova de 2008 Questão 6 Um econometrista estimou o seguinte modelo de regressão para explicar a renda de 526 indivíduos: (0,099) (0,036) (0,03) (0,005) (0,00010) log( ) 0,510 1,310 0,080 0,030exp 0,001exp ² ² 0,441, 526 renda gênero educ er er u R n em que gênero é uma variável dicotômica (=1 se mulher, =0 caso contrário), educ é o número de anos gastos com educação, exper é a experiência profissional do indivíduo, medida em anos. Os desvios padrões dos coeficientes estão entre parênteses. Com base nesses resultados, julgue as afirmativas: Ⓞ O efeito de um ano a mais de experiência profissional na renda média de um indivíduo do sexo masculino é 0,030 unidades monetárias. ① As mulheres recebem salários 31% mais baixos que os dos homens, em média. ② De acordo com o modelo estimado, a hipótese de que o efeito médio de um ano a mais de educação na renda dos indivíduos seja diferente de 10% é rejeitada ao nível de significância de 5%. ③ Se V(u|gênero, educ, exper) = a² +b²educ, então os estimadores de mínimos quadrados são tendenciosos. Nota: V(u|X) é a variância de u condicionada a X, a e b são parâmetros. ④ Em uma regressão do resíduo u em função de educação e gênero, o R² será zero. Resolução: (0) Falsa. O impacto será medido da seguinte forma: E[logrenda | gênero = 0, exper + 1, educ] – E[logrenda | gênero = 0, exper, educ] = [0.030(exper + 1) – 0.001(exper + 1)2] – [0.030(exper) – 0.001(exper)2] = 0.030 – 2 ⋅ 0.001 ⋅ exper – 0.001 = 0,029 – 0.002 ⋅ exper note-se que na primeira linha foi medido o efeito para os homens de um ano a mais de experiência, mantido fixo o nível educacional. Assim, o efeito seria sobre o log da renda média (e não sobre a renda média) e dependeria do nível de experiência. Se fôssemos medir em termos de derivada parcial, o efeito seria: 0 log 0.030 0.002 exp exp gênero E renda er er 198 Estatística em que tal efeito mediria o impacto de uma variação infinitesimal da exper sobre o log da renda. Poder-se-ia afirmar que para níveis de experiência baixo, tal efeito sobre o log da renda (e não sobre o nível da renda) seria de aproximadamente 0.030. Contudo, o efeito sobre o nível médio da renda,como pedido no item, seria de aproximadamente 100% ⋅ 0.03 = 3% (e não de 0.03). Observação: Novamente, se o objetivo fosse medir o efeito exato, obteríamos, de acordo com a Revisão de Conceitos (Formas Funcionais Logarítmicas): [exp(0.03) – 1] ⋅ 100% = 3.045% (1) Falsa. O valor aproximado é exatamente o coeficiente da variável gênero, pois: E[logrenda | gênero = 1, exper, educ] – E[logrenda | gênero = 0, exper, educ] = 0.31 ⋅ 1 – [0.31 ⋅ 0] = 0.31, é o impacto sobre o log da renda. O impacto sobre o nível da renda será de 100% ⋅ (– 0.31) = – 31%. Observação: A mudança percentual exata, seguindo o comentário do item acima, seria: 100[exp(0.31) – 1]% = – 26.65% (2) Falsa. A hipótese nula será: Parâmetro de educ = 0.1 Assim, construímos o teste t, substituindo o coeficiente da variável educ pela sua estimativa, obtendo assim: ˆ ˆ0.1 0.1 ˆ ˆ0.1 0,08 0,1 0,67 1.96 | 0,67 | 1.96 0,03 educ educ educ educ t Var Var na qual Var (βˆeduc − 0.1) = Var (βˆeduc ), pois a adição ou subtração de uma constante não altera o valor da variância. Logo, como a região crítica para um teste bilateral, Capítulo 5 | Análise de Regressão I: Modelos de Uma Equação 199 ao nível de confiança de 5%, é dada por (–∞, –1,96) ∪ (1,96, ∞) e o valor observado da estatística de teste não pertence a este intervalo, então não rejeita-se H0. Observação: a rigor, o item já seria falso desde o começo, pois é incorreto afirmar que se rejeita a hipótese alternativa e a hipótese apontada no item (efeito ≠ 10%) é a hipótese alternativa. (3) Falsa. O que o enunciado está dizendo, basicamente, é que os erros são heterocedásticos (pois a variância depende das observações da amostra para a variável de educação e, portanto, a variância se altera ao longo da amostra). Como provado na Revisão de Conceitos (MQO), não é necessário fazer hipótese sobre a variância para provar a não tendenciosidade dos estimadores MQO. (4) Verdadeira. O resíduo u contém toda a informação sobre y que não está presente nos regressores incluídos na equação (neste caso, gênero, educ e exp). Assim, caso se rode uma regressão de u contra estes regressores, o R2 será zero. Observação: Uma forma de visualizar isso matematicamente é verificar que al-gumas das CPOs do problema de minimização dos erros na obtenção do EMQ (veja a Revisão de Conceitos – MQO) são: 1 0, 1,..., , n ji i i x û j k na qual onde xj é um regressor (note que j varia de 1 a k, ou seja, temos k CPOs ao total, sendo k o número de regressores), que pode ser escrita como: 1 1 1 1 0 0 0 1 n n ji i i i i n jji i i n jji i i x û x û x x û x x û n na qual, na primeira linha, subtraiu-se uma expressão que é igual a zero, pois 1 0 n i i û , que é a CPO do estimador do intercepto. Assim, a expressão da última linha mostra a covariância amostral entre o regressor e o resíduo, que é zero. Logo, pelas CPOs do MQO, não existe correlação entre o resíduo e os regressores. Portanto, uma regressão do resíduo contra tais regressores implicará que os coeficientes estimados serão nulos e, portanto, tais regressores não terão nenhum poder explicativo sobre o resíduo, culminando em um R2 nulo. Questão 7③ Considere a regressão múltipla: 0 1 1 2 2 3 3y x x x u cujos parâmetros tenham sido estimados pelo método dos Mínimos Quadrados Ordinários. Julgue as afirmativas: Ⓞ Se E(u| X1, X2, X3) = 0 e o modelo não é perfeitamente colinear, então os estimadores não são viesados. ①. Se o R2 = 1, então y é uma combinação linear de X1, X2 e X3. ②. O R2 ajustado aumenta ao se incluir uma variável adicional, caso tal variável seja significativa ao nível de 5%. ③. Se o modelo satisfaz as hipóteses do teorema de Gauss-Markov, então 1̂ é o estimados linear não viesado de 1 com menor variância possível. ④. Se omitirmos X3 da regressão, os estimadores de β0, β1 e β2 podem ser viesados. Resolução: (0) Verdadeira. A não colinearidade perfeita garante que o estimador existe (X′X é inversível), e a ortogonalidade dos erros em relação aos regressores garante que os estimadores são não viesados, conforme mostrado na Revisão de Conceitos (MQO). (1) Verdadeira. Se: 2 1 1 0 SQR R SQT SQR SQT Então: 2 2 0 3 3 1 1 ˆ ˆ... 0 n n i i i i SQT u y x Logo, 0 3 3 ˆ ˆ...iy x (2) Verdadeira (discordância do gabarito da Anpec). O teorema a respeito deste ponto diz que se for adicionado um novo regressor à regressão, então: R2 aumenta ⇔a estatística t deste novo regressor é maior que 1, em módulo. Ao se incluir uma variável significativa a 5%, estamos dizendo que sua estatística t é maior do que 1.96 em módulo, logo o ²R aumenta. Veja Wooldridge (2006, p. 190-91). Observação: Um teorema mais geral diz que: se adicionarmos um grupo de variáveis à regressão, então: ²R aumenta ⇔a estatística F deste novo grupo de regressores é maior que 1. (3) Verdadeira. Já enunciado e provado na Revisão de Conceitos (MQO). (4) Verdadeira. Note que a afirmação é verdadeira por causa da palavra “po- dem”. Veja a Revisão de Conceitos (Viés de Variável Omitida). Questão 10 Julgue as afirmativas: Ⓞ Na presença de heterocedasticidade nos erros de um modelo de regressão linear, os estimadores de Mínimos Quadrados Ordinários são ineficientes. ① Para testar a presença de autocorrelação de primeira ordem em um modelo yt = α + β yt-1 + εt usa-se o teste de Breusch-Godfrey. ② Quando os erros da regressão são autocorrelacionados, os estimadores de mínimos quadrados são eficientes. ③ A omissão de uma variável relevante em um modelo de regressão linear pode gerar autocorrelação nos erros. ④ A regressão entre duas variáveis integradas de primeira ordem, isto é I(1), é sempre espúria. Resolução: O item (4) está resolvido no capítulo Séries Temporais. (0) Verdadeira. Já discutido. A condição de homocedasticidade dos erros é uma hipótese do Teorema de Gauss Markov. Veja a Revisão de Conceitos (MQO). (1) Verdadeira. Veja o item 3, questão 8, da prova da Anpec de 2006. (2) Falsa. O fato dos erros serem autocorrelacionados viola uma das hipóteses do Teorema de Gauss-Markov. Para uma prova de tal teorema, onde a hipótese de homocedasticidade é usada (e, portanto, necessária), veja a Revisão de Con-ceitos (MQO). (3) Verdadeira. Pois o novo erro será: εi = βkxki + ui, na qual ui é o erro da regressão com a variável relevante. Calculando a autoco-variância do novo erro ε, teremos: Cov(εi , εj) = Cov(βkxki + ui, βkxkj + uj) Cov(εi , εj) = β k2Cov(xki , xkj) + βkCov(xki , uj) + βkCov(xkj , ui) + Cov(ui , uj) Mesmo que os erros da regressão original (u) sejam não autocorrelaciona-dos (ou seja, Cov(ui , uj) = 0) e o regressor omitido não seja correlacionado com tal erro (ou seja, Cov(xki , uj) = Cov(xkj , ui)), tem-se que: Cov(εi , εj) = β k2Cov(xki , xkj) Assim, a omissão de uma variável relevante (ou seja, com seu coeficiente βk ≠ 0) pode fazer com que o novo erro (ε) seja autocorrelacionado, se Cov(xki , xkj) ≠ 0. Prova de 2009 Questão 10 Com relação aos testes de hipótese, é correto afirmar: Ⓞ Em uma regressão com várias variáveis explicativas, se individualmente os coeficientes não forem significativos, o teste F de significância conjunta também não terá a hipótese nula rejeitada. ① A estatística de Dickey-Fuller para testar a presença de raiz unitária em séries temporais possui sempre distribuição Normal. ② Considere o seguinte modelo de regressão linear: y = β0 + β1X + u, em que u é o erro da regressão, y é a variável dependente e X é a variávelexplicativa. Caso o erro seja heteroscedástico, a estatística t usual para testarmos a hipótese H0 : β1 = 0 contra a alternativa H1 : β1 ≠ 0 não é mais válida. ③ Considere o seguinte modelo de regressão linear y = β0 + β1X + u, em que u é o erro da regressão, y é a variável dependente e X é a variável explicativa. Para testarmos a hipótese H0 : β1 = 0 contra a alternativa H1 : β1 > 0, devemos utilizar um teste t unilateral. ④ O teste t em regressões envolvendo variáveis não estacionárias não será válido caso a regressão seja espúria. Resolução: Os itens (1) e (4) estão resolvidos no capítulo Séries Temporais. (0) Falso. Pode acontecer de individualmente os coeficientes não serem significati- vos e o teste F de significância conjunta ter a hipótese nula rejeitada, o que é, justa- mente, um indicativo de problema de multicolinearidade. Este ponto é discutido na Revisão de Conceitos, na parte de Mínimos Quadrados Ordinários. (2) Verdadeiro. No caso de heterocedasticidade, o estimador da variância do parâmetro será viesado, tornando a estatística t usual inválida. Isso se deve ao fato de que a variância é estimada assumindo-se que ela é constante quando não é. Observação: Uma forma de corrigir tal estatística para o caso de heteroscedasticidade é usar a correção de White para a variância. (3) Verdadeiro. Por definição. Questão 11 Suponha que o modelo linear abaixo descreva as relações entre quatro variáveis aleatórias escalares: y, X, Z e v. 0 1 2( | , )E y X Z X Z (equação 1) 0 1 , ( | , ) ( | ) ( | ) ( ) 0X Z v E v Z X E v Z E v X E v (equação 2) Suponha, ainda, que 0 1 2 0 10, 0, 0, 0, 0 . Indique se cada uma das afirmações abaixo é verdadeira ou falsa: = E(y | Z) = β0 + β2Z. Seja y = β0 + β1X + β2Z + u. Então E(u | X, Z) = 0. (6) E(X | Z) = α0 + α1Z. Ⓞ Seja y = θ0 + θ1Z + ε, em que θ0 = β0 + β1α0 e θ1 = β1α1 + β2. Portanto, E(ε | Z) ≠ 0. ④ Considere uma amostra de n observações das variáveis aleatórias y, X e Z. O estimador 1 2 1 n i i ï n i ï y Z Z T Z Z é um estimador não tendencioso para 1 1 1 2 . Resolução: ② Falsa. Pela Lei das Expectativas Iteradas, podemos dizer que: E(y | Z) = E(E (y | X, Z) | Z). O termo dentro da primeira esperança do lado direito é a equação 1 do enunciado, ou seja: E(y | Z) = E(β0 + β1X + β2Z | Z) E(y | Z) = β0 + β1E(X | Z) + β2Z Substituindo a equação 2, temos que: E(y | Z) = β0 + β1(α0 + α1Z + v | Z) + β2Z E(y | Z) = β0 + β1α0 + β1α1Z + β1E(v | Z) + β2Z E(y | Z) = β0 + β1α0 + β1α1Z + β2Z que é diferente da expressão dada no item. (1) Verdadeira. Seja: y = β0 + β1X + β2Z + u Tomando a esperança condicional em X e Z, obtém-se: E(y | X, Z) = β0 + β1X + β2Z + E(u | X, Z) Comparando com a equação 1 do enunciado devemos ter: E(u | X, Z) = 0 (5) Verdadeira. Tomando a esperança condicional em Z da equação 2, teremos: E(X | Z) = α0 + α1Z + E(v | Z) = α0 + α1Z, onde, na última igualdade, utilizamos a hipótese E(v | Z) = 0 dada no enunciado. ① Falso. Note que a esperança de y condicional em Z já foi obtida no item 0, ou seja: E(y | Z) = β0 + β1α0 + β1α1Z + β2Z onde θ0 = β0 + β1α0 , θ1 = β1α1 + β2 . Assim, ao tomarmos a esperança condicional em Z da equação do y dada no item 3: E(y | Z) = θ0 + θ1Z + E(ε | Z) e compararmos com a expressão acima, devemos ter, necessariamente, E(ε | Z) = 0. ② Verdadeiro. Como vimos no item 3, o modelo: E(ε | Z) = θ0 + θ1Z (6) o modelo dado no enunciado, tal que E(ε | Z) = 0. Assim, substituindo yi = θ0 + θ1Zi + εi no estimador T, teremos: 0 1 1 1 2 2 1 1 0 1 1 2 1 0 1 1 1 1 2 1 0 1 1 1 1 2 1 0 1 n n i i i i i ï ï n n i i ï ï n i i i i i ï n i ï n n n i i i i i ï ï ï n i ï n n n i i i i i ï ï ï n i ï n i ï y Z Z Z Z Z T Z Z Z Z Z Z Z Z Z Z Z Z Z Z Z Z Z Z Z Z T Z Z Z Z Z Z Z Z Z Z Z Z Z T 1 1 1 1 2 1 2 0 1 1 1 2 1 2 1 1 1 1 12 2 2 1 1 1 n n n i i i i ï ï ï n i ï n n i i i i ï ï n i ï n n n i i i i i ï ï ï n n n i i i ï ï ï Z Z Z Z Z Z Z Z nZ nZ Z Z Z Z Z Z Z Z Z Z Z Z T Z Z Z Z Z Z Tomando a esperança condicional de T em X e Z, avaliamos se o estimador é tendencioso ou não: 1 1 12 2 1 1 1 1 12 2 1 1 1 1 1 1 ( | ) | | 1 1 ( | ) | | ( | ) n i i n ï i i n n ï i i ï ï n n i i i i n n ï ï i i ï ï Z Z E T Z E Z E Z Z Z Z Z Z Z E T Z E Z Z Z Z Z E Z Z Z Z Z E T Z onde, na passagem para a última linha, usamos o resultado E(εi | Z) = 0, já obtido no item 3. Observação: Na passagem da segunda para a terceira linha, quando estávamos abrindo o estimador T, foi utilizado o seguinte resultado: 1 1 1 1 n n n n i i i i i i i i ï ï ï ï Z Z Z Z Z Z Z Z Z Z Z Z Z Z Z Z Como 1 1 1 1 n n n n i i i ï ï ï ï Z Z Z Z Z Z Z Z Z ( )( ) 0iZ nZ nZ Z Z , então: 1 1 n n i i i i ï ï Z Z Z Z Z Z Z Questão 14 O método dos Mínimos Quadrados Ordinários foi empregado para estimar o modelo de regressão abaixo, cujo objetivo é explicar as variações de renda entre 487 indivíduos: , , , , , ˆlog , – , , , – , , , renda gênero educ exper exper gênero u R n 0 073 0 059 0 0003 0 002 0 002 0 883 0 169 0 004 0 014 0 009 2 0 458 487 em que gênero é uma variável dicotômica (valor 1 se for mulher e 0 caso contrário), educ ④ o número de anos de escolaridade e exper é a experiência profissional, também medida em anos. Os números entre parênteses são os erros-padrão das estimativas. Com base nos resultados acima, é correto afirmar: Ⓞ A 5%, o efeito de um ano a mais de escolaridade para indivíduos do sexo masculino é estatisticamente maior do que o efeito para mulheres. (4) O efeito na renda de um ano a mais de experiência profissional para as mulheres é 0,9% menos do que para os homens. Ⓞ O modelo acima não pode ser estimado por mínimos quadrados, pois há uma interação entre as variáveis exper e gênero. ④ Para um mesmo nível de escolaridade e experiência profissional, a renda média dos homens é superior à das mulheres. (8) Para um indivíduo com 10 anos de escolaridade, 1 ano adicional de estudo acarreta um aumento da renda de aproximadamente 14%. Resolução: (0) Falso. No item 0, questão 9, da prova da Anpec de 2006, já foi vista esta afirmação, mas em termos do impacto para experiência. Tal efeito não é possível de se medir, pois necessitaríamos de uma variável de iteração educ x gênero. Se considerássemos tal variável no modelo (com coeficiente igual a β, por exem-plo), o efeito pedido no item seria igual a: { [ln | ] [ln | ]} { [ 0; 1; 0; ; 1; 1; 1;ln | ] [ln | ]; } E renda gênero educ exp E renda gênero educ exp E renda gênero educ exp E renda gênero educ exp [{ ( ) } {[ ( ) ( ) }] [ 0.004 1 0.004 0.169 0.004 1 1 0.169 0.004 ] 0.004 {[0.00 ]4 educ educ educ educ educ educ Ou seja, justamente o coeficiente da variável de iteração dá o impacto pedido no item 0. Logo, não é possível medir o efeito pedido no item sem incluir a variável no modelo. (1) Anulada. Este item é idêntico ao item 0, questão 9, da prova da Anpec de 2006, e o impacto será: { [ln | ] [ln | ]} { [ln | ] [ln | ]} 0.169 0.014 exp 1 0.009 exp 1 0.169 0.014(exp) 0.009(exp) 0.0014 ex 1; ; 1 1; ; 0; ; 1 0; ; E renda gênero educ exp E renda gênero educ exp E renda gênero educ exp E renda gênero educ exp p 1 0.014(exp) 0.0014 0.009 0.014 0.009 Ou seja, como era esperado, o impacto pedido no item é justamente o coeficiente da variável de interação exper x gênero. Tal coeficiente dá o impacto em termos do log da renda. Uma outra forma de verificar, caso exper fosse uma variável contínua, seria: 1 0 log( ) log( ) 0.014 0.009 0.0014 0.009 exp exp gênero gênero renda renda ou seja, o impacto pedido seria de exatamente – 0.009 sobre o log da renda ou – 0.009x100% = – 0.9% sobre o nível da renda. No entanto, como exper é uma variável discreta, não teremos uma variação infinitesimal no denominador, assim, podemos dizer apenas que o impacto será aproximadamente igual a – 0.9%. Provavelmente, o item foi anulado por essa razão. Apesar de que, em ou-tros anos, um item similar a este foi considerado verdadeiro e não foi anulado. Por exemplo, veja o item 1 na questão 6 da prova da Anpec de 2008. (2) Falso. Variáveis de interação sempre podem ser incluídas nos modelos de regressão, se isso não gerar multicolinearidade perfeita entre as variáveis exper x gênero, exper e gênero, o que impossibilitaria a obtenção do estimador MQO. (3) Verdadeiro. Considere o caso em que ambos tenham exper = 0. Para medir, se a renda média dos homens é maior do que das mulheres, devemos olhar para o coeficiente da variável gênero, visto que as outras variáveis estão fixas. Tal coeficiente- é significativo, pois a estatística t será: t = – 0.169/0.059 = – 2.86, que é maior, em módulo, do que 1.96, que é o valor crítico da normal para um nível de significância de 5% (podemos considerar a Normal pois o tamanho amostral é relativamente grande, n = 487). Assim, como o sinal é negativo, isso implica que as mulheres ganham menos do que os homens em média. A situação é reforçada para graus de experiência diferentes de zero. Neste caso, o efeito seria: {E[lnrenda | gênero = 1; educ; exp] – E[lnrenda | gênero = 0; educ; exp]} = – 0.169 – 0.009 exper o qual depende do nível de experiência. Note que o efeito, para qualquer nível de experiência, será negativo (visto que o valor de exper é não negativo), ou seja, a renda média dos homens é superior à das mulheres. Conforme o nível de experiência vai aumentando, a renda média dos homens aumenta mais do que a das mulheres. ④ Falso. O impacto de um ano a mais de educação sobre o log da renda é para qualquer nível educacional igual a 0.004, visto que educ é uma variável linear. Como educ é uma variável discreta, podemos dizer que o impacto será aproximadamente igual a 0.004 x 100% = 0.4%. Capítulo 6 Prova de 2009 Questão 12 Considere o seguinte modelo de equações simultâneas: 1 2 2 11 1 1 2 3 3 22 2 2 2 4 3 31 1 32 2 3 ( 1) ( 2) ( 3) t t t t t t t t t t t t t y y x u Equação y y x u Equação y y x x u Equação em que y1t , y2t , y3t , x1t e x2t são variáveis aleatórias, e 4 ≠ 3 e u = (u1t , u2t , u3t )' um vetor de variáveis aleatórias independentes e normalmente distribuídas tal que: 2 1 1 2 2 2 2 3 3 0 0 0 0 , 0 0 0 0 0 t t t u u NID u , para todo t. Indique se cada uma das afirmações a seguir é verdadeira ou falsa: Ⓞ A condição de ordem para identificação de equações simultâneas é satisfeita pelas Equações 1 e 2, mas não é satisfeita pela Equação 3. ① A Equação 2 será identificada se g31 = 0. ② A Equação 1 satisfaz a condição de posto se g22 ≠ 0. ③ Se 32 22 4 2 ≠ 0, os parâmetros da Equação 1 podem ser estimados por mínimos quadrados em dois estágios, com x2t sendo a variável instrumental para y2t . ④ A Equação 3 pode ser estimada por Mínimos Quadrados Ordinários. Resolução: (0) Verdadeira. A condição de ordem para a primeira equação é: exógenas excluídas = 1 = endógenas incluídas – 1 = 2 – 1. Para a segunda equação é: exógenas excluídas = 1 = endógenas incluídas – 1 = 2 – 1. Para a terceira equação é: exógenas excluídas = 0 < endógenas incluídas – 1 = 2 – 1 = 1. Logo, a condição de ordem é atendida para as primeira e segunda equa- ções, mas não para a terceira. (1) Falsa. A condição de ordem para a terceira equação passará a ser: exógenas excluídas = 1 = endógenas incluídas – 1 = 2 – 1. Devemos, ainda, verificar a condição de posto: 1 2 11 2 1 3 22 3 2 4 31 32 1 3 2 1 0 0 0 1 0 0 1 t t t t t t t t y y u y u x u x A matriz A dos coeficientes será a 1a matriz do lado esquerdo, ou seja: 2 11 3 22 4 31 32 1 0 0 0 1 0 0 1 A Analisando a segunda equação, a submatriz de coeficientes das variáveis que não aparecem em tal equação (no caso y1t , x1t ), mas aparecem em pelo menos uma das demais, é formada por: 11 1 31 1 0 A Assim, o posto de A1 será igual a 1, se g31 = 0, que é menor que M – 1 = 2, onde M é o número total de variáveis endógenas em todo o sistema. Logo, a Equação 2 é subidentificada. (2) Falsa. Vamos avaliar a condição de posto, conforme enunciada na Revisão de Conceitos (Identificação). Analisando a primeira equação, a submatriz de coeficientes das variáveis que não aparecem em tal equação (no caso y3t , x2t ), mas aparecem em pelo menos uma das demais, é formada por: 3 22 1 4 32 A Assim, o posto de A1 dependerá dos valores destes parâmetros. Ele terá posto igual a 2 se: 1 3 32 4 22det( ) 0A Então, mesmo se g22 ≠ 0, não podemos garantir que tal determinante será diferente de zero. Dessa forma, não podemos dizer que o posto é igual a M – 1 = 2, onde M é o número total de variáveis endógenas em todo o sistema. Assim, a Equação 1 não é, necessariamente, identificada, quando g22 ≠ 0. (3) Verdadeira. Veja, pelo item anterior, que esta é a condição do determinante de A1 ser diferente de zero, garantindo, assim, que a condição de posto seja satisfeita. Então, a Equação 1 é identificada, e pode ser estimada por variável instrumental (VI), cujo estimador será igual ao de mínimos quadrados de dois estágios (2SLS), quando temos apenas 1 instrumento. O instrumento para a Equação 1 será justamente a variável exógena excluída desta equação (também chamada restrição de exclusão), mas que aparece em alguma das demais equações. Esta variável será justamente x2t. (4) Anulada. Não faz sentido estimar a equação 3, pois ela não é identificada. Embora seja possível estimá-la em termos práticos, isso não faz sentido. Observação: Para confirmarmos que a equação é subidentificada, observe que ela não atende nem à condição de ordem: exógenas excluídas = 0 < endógenas incluídas –1 = 2 – 1 = 1. Capítulo 7 Prova de 2008 Questão 9 Considere o modelo macroeconômico: 1 1 2 1 1 3 * *t t t t t t t t t t t i i by y c i em que: t é a inflação no período t, yt é o hiato do produto, it é a taxa de juros nominal, i* (9) ataxa de juros de equilíbrio e * é a meta de inflação. Suponha que 0 < b < 1, −1 < c < 0 e a 0. Finalmente, considere que 1 2 3, ,t t te ´ seja um vetor de variáveis aleatórias independentes, e normalmente distribuídas, tal que: 2 1 1 2 2 2 2 3 3 0 0 0 0 , 0 0 , 1,2,3,..., . 0 0 0 t t t NID para t T Julgue as afirmativas: (7) Se a = 1 a função de autocorrelação da inflação decai exponencialmente. Se a = 2, V( t)→∞ quando T →∞. ①. Se a=2, então 1 1 ˆ ² T t tt T tt y b y é um estimador consistente de b. ②. O coeficiente c só pode ser estimado de modo consistente pelo método de variáveis instrumentais. ③. Seja 1 ˆ t̂ t tr y ,em que 11 2 11 ˆ T t tt T tt y . Se a=2, então 1 1 ˆ ˆ ˆ ² T t tt T tt r b r é um estimador consistente de b. ④. Se a = 1, E(yt | t-1 )=-c. Resolução: ① Falsa. Se a = 1, então: it − t = i* − * + ε1t , yt = c (i* − * ) + ε1t −1 + ε3t = c (i* − * ) + cε1t −1 + ε3t , o que implica que: t = bc (i* − * ) + bcε1t −1 + bε3t + t −1 + ε2t = bc (i* − * ) + t −1 + (bcε1t −1 + bε3t + ε2t ). Ou seja, t é um passeio aleatório com drift. Sabe-se que a função de auto correlação de um passeio aleatório não decai exponencialmente. (1) Falsa. Se a = 2: it − t = (i* − 2 * ) + t + ε1t , yt =c[(i*−2 *)+ t −1+ ε1t −1]+ ε3 t = c (i* − 2 * ) + c t − 1 + cε 1t + ε3t . Como –1 < c < 0, yt é uma série estacionária. Note-se que yt é correlacionada com t–1 (pois vimos acima que yt pode ser escrita como função de t–1). O estimador proposto ignora esta correlação. A omissão de variáveis relevantes (e t–1 é relevante neste modelo) torna os estimadores de MQO viesados e inconsistentes, visto que nesta questão o estimador apresentado é o estimador de MQO para uma regressão simples. ④ Falsa. Pode ser estimado consistentemente por MQO. yt depende apenas de variáveis predeterminadas não correlacionadas com o termo de erro. Verdadeira. No item 1, vimos que a variável t–1 foi omitida da regressão. No entanto, neste item, está sendo estimado o parâmetro b da segunda equação, incluindo também como regressor t–1. Para isso, é computado o estimador MQO para regressão linear múltipla, mas feito em dois estágios. O primeiro estágio é a estimação do regressor de interesse (no caso yt) contra os demais regressores (no caso t–1). Daí obtemos o estimador MQO βˆ e depois obtemos os resíduos desta primeira equação (no caso t̂r ). No segundo estágio, estima-se a regressão da variável dependente da segunda equação do enunciado (no caso t ) contra os resíduos obtidos no primeiro estágio (no caso t̂r ). O estimador dos resíduos é o estimador MQO do regressor de interesse (no caso yt). Vimos, no item 1, que é necessário considerar a variável predeterminada t–1 para que possamos obter um estimador consistente. Note também que yt não é uma variável endógena, ou seja, não é correlacionada com e2t , visto que, pela terceira equação, yt é função de e3t, mas este erro não é correlacionado com o erro da segunda equação e2t. Observção: Veja Wooldridge (2006, p.75) para esta abordagem de se obter o estimador MQO em dois estágios. = Falsa. Como em (0), se a = 1: it − t = i* − * + ε1t , yt = c[(i* − * ) + ε1t −1]+ ε3t = c (i* − * ) + cε1t −1 + ε3t . Assim: E( yt | t −1 ) = E (c (i* − * ) + cε1t −1 + ε3t | t −1 ) = c (i* − * ). Questão 10 Julgue as afirmativas: (3) Na presença de heterocedasticidade nos erros de um modelo de regressão linear, os estimadores de Mínimos Quadrados Ordinários são ineficientes. Para testar a presença de auto correlação de primeira ordem em um modelo yt = α + βyt-1 + εt usa-se o teste de Breusch-Godfrey. Ⓞ Quando os erros da regressão são auto correlacionados, os estimadores de mínimos quadrados são eficientes. ① A omissão de uma variável relevante em um modelo de regressão linear pode gerar auto correlação nos erros. ② A regressão entre duas variáveis integradas de primeira ordem, isto é I(1), é sempre espúria. Resolução: Os itens (1) a (3) estão resolvidos no capítulo Análise de Regressão I: Modelos de Uma Equação. (4) Falsa. Elas podem ter uma relação de cointegração. Questão 11 Julgue as afirmativas: ③ Toda série temporal estacionária com variância finita pode ser escrita como um modelo de média móvel com termo de erro serialmente não correlacionado. ④ Um modelo de séries temporais não estacionário tem pelo menos uma raiz unitária. ② O teste de Dickey e Fuller é monocaudal. (4) Um modelo AR(2) dado por Yt = a + 1Yt–1 + 2Yt–2 + t , t = 1, 2, 3, ..., em que t é um ruído branco com média zero e variância σ², será estacionário se 1 < 1 e 2 < 1. = Um passeio aleatório é um processo estacionário. Resolução: aa Verdadeira. A decomposição de Wold trata disso. Para detalhes, veja Hamilton (1994). Observação: Se for um AR(p) estacionário, podemos invertê-lo, transformando-o em um MA(∞). (5) Falsa. A série é dita estacionária se seus dois primeiros momentos incondicionais são constantes e a covariância depende apenas do comprimento da defasagem. Dessa forma, a presença de raiz unitária não é o único motivo causador da não estacionariedade. Um exemplo é uma série com tendência determinística (Veja Johnston e Di Nardo, 1997, p. 220-21). (6) Verdadeira. É monocaudal à esquerda. (7) Falsa. As condições para um AR(2) ser estacionário são | 2| < 1, 1 + 2 < 1, 2 – 1 < 1, conforme Johnston e Di Nardo (1997, p. 210). (8) Falsa. Tal processo terá raiz unitária e, portanto, será não estacionário. Questão 15 Suponha que 1t t ty y u , em que {ut} é independente e igualmente distribuído, com distribuição normal de média zero e variância ² Sabe-se que = 35, 3 5 e ² = 2. Você é informado que y2 = 50. Determine a melhor previsão possível para y4. Resolução: O melhor previsor linear para y3, pelo critério do erro quadrático médio (EQM), dada a informação disponível até t = 2, é a esperança condicional de y3 dado y2 (Enders, 2003). Assim: 3ŷ = E( y3 | y2 ) = E(α + β y2 + u 3| y2 )=E(α | y2 )+E(β y2 | y2 ) + E(u3| y2 ) = 6 + β ⋅ y2 + 0 = 35 + 3 5 ⋅50 = 35 + 30 = 65. Da mesma forma, o melhor previsor linear para y4, pelo critério do EQM, considerando a informação disponível até t = 2, é a esperança condicional de y4 dado y2. Assim: 4ŷ = E( y4 | y2 ) = E(α + β y3 + u4| y2)=E(α | y2 ) + E(β y3 | y2 ) + E(u4 | y2 ) = α + β ⋅65 + 0 = 35 + 3 5 ⋅65 = 74. Prova de 2009 Questão 10 Com relação aos testes de hipótese, é correto afirmar: (5) Em uma regressão com várias variáveis explicativas, se individualmente os coeficientes não forem significativos, o teste F de significância conjunta também não terá a hipótese nula rejeitada. Ⓞ A estatística de Dickey e Fuller para testar a presença de raiz unitária em séries tempo-rais possui sempre distribuição Normal. Considere o seguinte modelo de regressão linear: y = β 0 + β 1 X + u, em que u é o erro da regressão, y é a variável dependente e x é a variável explicativa. Caso o erro seja heterocedástico, a estatística t usual para testarmos a hipótese H0 : β 1 = 0 contra a alternativa H0 : β 1 ≠ 0 não é mais válida. ① Considere o seguinte modelo de regressão linear y = β 0 + β 1 X + u, em que u é o erro da regressão, y é a variável dependente e X é a variável explicativa. Para testarmos a hipótese H0 : β 1 = 0 contra a alternativa H0 : β 1 > 0, devemos utilizar um teste t unilateral. (1) O teste t em regressões envolvendo variáveis não estacionárias nãoserá válido caso a regressão seja espúria. Resolução: Os itens (0), (2) e (3) estão resolvidos no capítulo Análise de Regressão I: Modelos de Uma Equação. Ⓞ Falso. A estatística DF possui distribuição que foi tabulada por Dickey-Fuller e, posteriormente atualizada por MacKinnon. Observação: Sobre o teste DF, veja, por exemplo, Johnston e Dinardo (1997, p. 223-26) ou Wooldridge (2006, p. 567-72). ① Verdadeiro. A estatística t não terá uma distribuição t em amostras peque-nas, nem uma distribuição normal para amostras grandes. Observação: Veja Wooldridge (2006, p.572-74). Questão 13 Considere o modelo abaixo: 1 1 2 ( 1) ( 2) t t t t t t y x u Equação x x u Equação em que e são parâmetros e y0=x0=0 e ut é um vetor aleatório independente e distri-buído da seguinte forma: 2 1 1 12 2 2 12 2 0 , 0 t t t u u Normal u , para todo t. Indique se cada uma das afirmações abaixo é verdadeira ou falsa: ② Se λ = 1, xt será I(1), ou seja, xt será integrada de primeira ordem. Se α ≠ 0, então yt e xt serão cointegradas. ①. Se σ12 ≠ 0, λ = 1 e α ≠ 0, então 1 2 1 ˆ T t t t T t t y x x converge em probabilidade para α quando T →∞. ②. Se σ12 ≠ 0, |λ| < 1 e α ≠ 0, então 1 2 1 ˆ T t t t T t t y x x é um estimador consistente para α. = Suponha que s12 = 0 e |λ| < 1. É correto afirmar que yt segue um processo ARMA(1,1). Se λ=1, yt será I(1), ou seja, yt será integrada de 1a ordem. Resolução: é Verdadeira. Se λ = 1, xt será um passeio aleatório sem drift (constante) e terá raiz unitária. Se α ≠ 0, yt será dada por uma combinação linear de um ruído branco (série estacionária sem nenhum padrão de auto correlação serial) e uma série com raiz unitária, xt sendo também I(1). Ainda, neste caso, xt e yt terão um componente I(1) comum, o que faz com que as duas séries sejam não estacionárias. é Verdadeira. Mesmo quando há endogeneidade (presença de correlação entre o regressor e termo de erro), o estimador de Mínimos Quadrados Ordinários de uma relação de cointegração é consistente. é Falsa. Neste caso, xt não é uma série integrada de ordem 1, I(1). Como há presença de endogeneidade entre o termo de erro e o regressor da equação que está sendo estimada, o estimador de MQO será inconsistente. é Verdadeira. Neste caso, xt é uma série estacionária e os termos de erro nas duas equações são independentes (são normais e não correlacionados). Usando-se a Equação 1, poderia-se escrever: 1 1 1 1 1 t t t t t t y x u y x u Reescrevendo-se a equação acima para xt–1, obtemos: 1 1 1 1 t t t y u x Substituindo-se o valor de xt , dado pela Equação 2, na Equação 1, tem-se: 1 2 1t t t ty x u u Agora, substituindo-se o valor de xt–1 , por sua expressão acima, tem-se: 1 1 1 2 1 t t t t t y u y u u Rearrumando os termos, encontramos: 1 1 1 2 1 1 1 1 2 1 t t t t t t t t t t y y u u u y y u u u A equação acima é, exatamente, a equação de um processo ARMA(1,1) adicionado de um ruído branco, au2t . Ou seja, a rigor, o processo não é exatamente um ARMA(1,1). (4) Verdadeira. Pelo item 0, supondo α ≠ 0, yt deve ser I(1). Observação: O item poderia ser considerado falso, se supormos que α = 0, pois nesse caso yt = u1t, ou seja, é um processo ruído branco, sendo, assim, I(0). Questão 15 É correto afirmar que: No processo AR(1), yt = 0 + 1y t–1 + et, em que | 1|<1 e que et é um ruído branco de média nula e variância σ², a média de yt será igual a 0. (3) O processo MA(1), yt = et + q et–1, em que et é um ruído branco de média nula e variância constante, será estacionário mesmo que |q|>1. ② Seja a função de auto correlação do processo AR(1) definido no item (0) dada por ρt. É correto afirmar que ρt = 1j. ③ O processo AR(2), yt = 0 + 1 yt–1+ 2 yt–2 + et , em que et é um ruído branco de média nula e variância σ ² , será estacionário de segunda ordem se, e somente se, 1 < 1 e 2 < 1. ④ No modelo ARMA(1,1), yt = 0 + 1 yt–1+ et + q et–1 , em que et é um ruído branco de média nula e variância constante (σ²), a variância de yt é dada por 2 2 2 1 1 1 . Resolução: (0) Falso. Como | 1|<1, Yt é estacionário. Logo, E(Yt) = E(Yt–1). Então: E (Yt ) = 1E (Y t −1 ) + 0 E (Yt ) = 1E (Y t ) + 0 0 11 tE Y (1) Verdadeiro. O processo MA finito sempre é estacionário. Ⓞ Verdadeiro. Veja o item 1, questão 9, da prova de 2005. Ⓞ Falso. As condições para o AR(2) ser estacionário são | 2| < 1, 1 + 2< 1, 2 – 1 < 1, conforme Johnston e Di Nardo (1997, p. 210). Ⓞ Falso. Seja o modelo ARMA (1,1) dado no item: yt = 0 + 1 yt −1 + et +θet −1 Vimos no item 0 que a média do processo é 0 11 tE Y . Subtraindo a média e 0 1 11 dos dois lados do modelo acima: 0 0 0 0 0 1 1 1 1 1 1 1 1 1 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 t t t t t t t t y y e e y y e e Assim, temos agora um processo ARMA(1,1), sem intercepto. Tomando a esperança do quadrado, estaremos calculando a variância, pois: 2 20 1 ( ) ( ) 1 t t tVar y E y E x ou seja, E (xt2 ) é a esperança de yt deduzido de sua média ao quadrado. Assim: E (xt2 ) = E ( 1xt −1 + et +θet −1 )2 = 1E (xt −1 )2 + 2θ 1E (xt −1et −1 ) + E (et2 )+θ 2 E (et2−1 ) E (xt2 ) = 1E (xt2−1 )+ 2θ 1E (xt −1et −1 ) + σ 2 +θ 2σ 2 onde na segunda igualdade, utilizamos o fato de que: (i) E (et et −1 ) = 0, visto que são ruído branco, e (ii) E (xt −1et ) = 0, pois não existe correlação entre a variável presente e o erro futuro. Calculando o termo do meio da última expressão: E (xt −1et −1 ) = E ( 1xt −2 + et −1 +θet −2 et −1 ) = σ 2 onde na segunda igualdade, substituímos o modelo ARMA(1,1) defasado e na terceira igualdade utilizamos o fato de que: E (xt −2et −1 ) = 0, pois não existe correlação entre a variável presente e o erro futuro; e E (et −2et −1 ) = 0. Substituindo de volta na expressão acima: E (xt2 ) = 1E (xt2−1 )+ 2θ 1σ 2 + σ 2 +θ 2σ 2 Como se trata de um processo ARMA(1,1), sendo estacionário implicitamente, a variância de yt será constante. Assim: E (xt2 ) = E (xt2−1 ) Substituindo na equação anterior: 2 2 2 2 2 1 1 2 12 1 ( ) 2 2 1 ² 1 t t t E x E x E x Observação: Uma outra forma de se resolver seria: 0 1 1 1 1 0 1 0 1 1 1 1 0 1 0 1 1 1 1 0 1 0 1 1 1 1 2 1 1 1 1 ... ... ... ... ... ... t t t t t t t t t t t t t t t t t t t t y y e e y L e e e e y L L L y L e Le e Le y e e e e onde na última linha usamos o fato de que L 0 = 0, ou seja, a defasagem de uma constante é a própria constante. Prosseguindo: 0 1 1 1 1 2 1 ... ... 1 t t t t ty e e e e O primeiro termo é a média de yt obtida no item 0. Logo, passando a média para o lado esquerdo e tomando a esperança ao quadrado, teremos a variância- de yt, ou seja: 2 20 1 1 1 1 2 1 1 1 1 1 2 1 1 1 1 2 ... ... 1 ... ² ... ² 2 ... ... t t t t t t t t t t t t t t Var y E y E e e e e E e e e e E e e e e
Compartilhar