Baixe o app para aproveitar ainda mais
Prévia do material em texto
4 Inferência Estatística REVISÃO DE CONCEITOS Apresentamos a seguir uma breve Revisão de Conceitos deste tópico. É importante ressaltar que a revisão aqui apresentada não é exaustiva, mas tem a função apenas de servir de suporte para a demonstração de algumas soluções. Por isso, recomendamos, antes da resolução, o estudo das referências citadas no fim do livro. Estimador Consistente Definição. Um estimador do parâmetro θ, baseado em uma amostra aleatória de tamanho n, é dito consistente se: ou ainda: Proposição. Um estimador é consistente se: ou onde EQM( n)=Var( n)+viés²( n), e o viés( n)= E[ n]– θ. Estimadores de Máxima Verossimilhança (EMV) Propriedades dos EMVs. (i) podem ser viesados (em geral são); (ii) são consistentes; (iii) são assintoticamente não viesados; (iv) têm distribuição assintótica normal; (v) são assintoticamente eficientes; (vi) princípio da invariância: eles são invariantes, ou seja, suponha que seja um estimador de MV de θ. Assim, uma estimativa de MV de g(θ) é g( ), para qualquer função g(.). Estimadores da Variância Populacional Propriedade. é um estimador viesado de σ2 e é um estimador não viesado de σ2. Prova: Seja o estimador: Reformulando-o: Tomando sua esperança, temos: e sabemos que E(Xi – µ)2 = Var(Xi) = σ2 e . Assim: Logo, tal estimador é viesado. Se fosse S2 não seria tendencioso. Pois: onde . Tomando a esperança: . Proposição. σˆ2 é um estimador consistente. Assim: Seja S2 um estimador de σ2, que é não viesado. Não provaremos aqui, mas pode ser demonstrado que: Como σˆ2 S2, então: E, portanto: Assim, mostramos que σˆ2 é assintoticamente não viesado e sua variância é assintoticamente nula. Portanto, apesar de σˆ2 ser viesado, ele é um estimador consistente. Intervalo de confiança Definição. O Intervalo de Confiança (IC) para um parâmetro µ com nível de confiança de 1 – a, quando conhecemos a variância populacional (σ2), pode ser expresso como: A “probabilidade” deste IC pode ser escrita como: onde za/2 corresponde ao valor da tabela da normal padronizada cuja área acima dele é igual a a/2 e, pela simetria da distribuição, a área abaixo de –za/2 é igual também a a/2. Assim, a área entre estes dois valores é igual a 1 – a. Importante: µ não é uma variável aleatória, mas um parâmetro. A interpretação correta da expressão acima é para o caso de zα/2 = 1.96 e α = 0.05: se construíssemos uma quantidade grande de intervalos de confiança da forma , todos com amostras de tamanho n, então 95% deles conteriam o parâmetro µ. Ou, ainda, se repetíssemos a amostragem de n observações um número muito grande de vezes (infinito), em 95% dessas repetições o IC conteria o valor verdadeiro da média populacional. A rigor, não podemos dizer que essa seria a probabilidade de que o intervalo, já construído, contenha µ. Pois, se ele já foi construído, ele contém ou não contém µ, e, assim, a probabilidade deste evento seria um ou zero, respectivamente. Teste de Hipóteses Definição (P-Valor). O p-valor é a probabilidade, sob a hipótese nula, de que a estatística de teste assuma um valor que dê a mesma ou mais evidência contra a hipótese nula do que o valor assumido por ela no presente teste. Definição (Erro do tipo I) O erro do tipo I é o evento de rejeitar a hipótese nula quando esta é verdadeira. A probabilidade α de se cometer tal erro é: α = P(Erro do tipo I) = P(rejeitar H0 | H0 é verdadeira) Esse α é o nível de significância e é definido a priori, ou seja, é arbitrário. Observação: Em testes de hipóteses simples, α é justamente a probabilidade do Erro tipo I. Mas em testes de hipóteses compostas é o máximo de tal probabilidade. Definição (Erro do tipo II) O erro do tipo II é o evento de não rejeitar a hipótese nula quando ela é falsa. Definição (Função poder) A função poder (ou potência) de um teste é a probabilidade de se rejeitar corretamente a hipótese nula quando esta é falsa. Ou seja, Poder = 1-Pr(Erro Tipo II). Assim, supondo que a hipótese nula seja: µ = µ0 a função poder depende do valor que µ assuma, quando µ ≠ µ0. Proposição. Um teste de hipóteses é dito não viesado se: 1 – β > α Poder do teste > P(Erro I) = significância, ou seja, α + β < 1 PROVA DE 2006 Questão 4 Com relação a testes de hipóteses, julgue as afirmativas: Ⓞ Em um teste de hipóteses, comete-se um erro do tipo I quando se rejeita uma hipótese nula verdadeira. ① O poder de um teste de hipóteses é medido pela probabilidade de se cometer o erro tipo II. ② A soma das probabilidades dos erros tipo I e tipo II é igual a 1. ③ Quanto maior for o nível de significância de um teste de hipóteses, maior será o valor-p a ele associado. ④ Se o valor-p de um teste de hipóteses for igual 0,015, a hipótese nula será rejeitada a 5%, mas não a 1%. Resolução: (0) Verdadeira. Ver Revisão de Conceitos – erro tipo I na parte de Teste de Hipóteses. (1) Falsa. Potência = 1– P(Erro tipo II) = 1– β. Ver Revisão de Conceitos – Função Poder. (2) Falsa. Conforme a Revisão de Conceitos, um teste de hipóteses é dito não viesado se: 1 – β > α. Poder do teste > P(Erro I) = significância, ou seja, α + β < 1. Assim, não necessariamente, a soma destes parâmetros é igual a um. (3) Falsa. O nível de confiança é determinado pelo construtor do teste. O p-valor é determinado por uma função da amostra obtida. (4) Verdadeira. Apesar de ser impreciso, podemos interpretar tal p-valor como sendo 1,5% o menor nível de significância máximo pelo qual a hipótese nula seria rejeitada. Questão 5 São corretas as afirmativas: Ⓞ O teorema de Tchebychev é útil para se calcular o limite inferior para a probabilidade de uma variável aleatória com distribuição desconhecida quando se tem apenas a variância da população. ① Um estimador não tendencioso pode não ser consistente. ② Um estimador consistente pode não ser eficiente. ③ Sejam Y1,...,Yn variáveis aleatórias independentes com média µ e variância finita. Pela Lei dos Grandes Números, E(m) = m, em que m = . ④ Sejam Y1,...,Yn variáveis aleatórias independentes com média µ e variância finita. Pelo Teorema do Limite Central, a distribuição da média amostral m converge para uma distribuição Normal. Resolução: Os itens (0), (3) e (4) estão resolvidos no capítulo Principais Teoremas de Probabilidade. (1) Verdadeira. A propriedade de não viés não tem uma associação direta com a propriedade de consistência. Um teorema útil, enunciado na Revisão de Conceitos, para mostrar que um estimador ˆθ é consistente, é verificar se: O máximo que podemos dizer é que um estimador não tendencioso satisfaz a primeira condição acima, mas não podemos dizer que tal estimador atenderá necessariamente a segunda condição. (2) Verdadeira. Da mesma forma que no item 1, a propriedade de consistência não tem uma associação direta com a propriedade de eficiência. Ou seja, um estimador pode ser consistente, mas não apresentar a menor variância possível na classe de estimadores que está sendo comparado. PROVA DE 2007 Questão 2 Considere uma amostra aleatória de n variáveis x1, x2, ..., xn, normalmente distribuídas com média µ e variância σ². Sejam e . É correto afirmar que: Ⓞ x e s2 são estimadores de máxima verossimilhança de µ e σ², respectivamente. ① x e s2 são não viesados. ② x e s2 são consistentes. ③ Apenas x é consistente. ④ Apenas x é não viesado. Resolução: (0) Verdadeiro. Seja X uma v.a populacional cuja distribuição é uma normal, e dada uma amostra desta v.a. de tamanho n, podemos obter os valores dos parâmetros da normal (μ e σ²) que maximizam a função de verossimilhança. Ela é dada por: Para simplificar, vamos maximizar uma transformação monotônica crescente desta função, que não altere o máximo: Obtendo as CPOs: Assim, este último estimador da variância é viesado, enquanto o da média é não viesado. (1) Falso. s2 é viesado, como foi provado na Revisão de Conceitos. (2) Verdadeiro. Ver Revisão de Conceitos – estimador consistente e estimador da variância populacional para uma prova de que o estimador da variância enunciadonesta questão é consistente, apesar de viesado. Agora, segue uma prova de que o estimador é consistente: Foi provado no item (0) de 2003.2 que é não viesado, logo: O outro requisito para ser consistente é que o limite da variância seja nulo. Sabemos que . Logo, seu limite será: Portanto, é um estimador consistente da média populacional. (3) Falso. Veja item anterior. (4) Verdadeiro. Veja item 1. Questão 11 Julgue as afirmativas: Ⓞ O valor p de um teste de hipótese é a probabilidade de a hipótese nula ser rejeitada. ① O poder de um teste de hipótese é a probabilidade de se rejeitar corretamente uma hipótese nula falsa. ② Considere n variáveis aleatórias independentes. Pela Lei dos Grandes Números, quando n cresce, a média amostral converge em distribuição para uma variável aleatória Qui-quadrada. ③ Pela desigualdade de Chebyshev, a probabilidade mínima de que o valor de uma variável aleatória X esteja contido no intervalo µ ± σh é 1-1/h². ④ Se duas variáveis aleatórias X e Y têm covariância nula, então elas são independentes. Resolução: Os itens (2), (3) e (4) estão resolvidos no capítulo Principais Teoremas de Probabilidade. (0) Falsa. Conforme visto na Revisão de Conceitos (teste de hipóteses), o p-valor é a probabilidade, sob a hipótese nula, de que a estatística de teste assuma um valor que dê a mesma ou mais evidência contra a hipótese nula do que o valor assumido por ela no presente teste. (1) Verdadeira. Conforme visto na Revisão de Conceitos, poder de um teste é igual a 1 – β, onde β = P(Erro do tipo II), ou seja, rejeitar corretamente uma hipótese nula falsa. PROVA DE 2008 Questão 3 Sejam X1, X2, ..., Xn, n variáveis aleatórias independentes, igualmente distribuídas, com distribuição Poisson dada por . Julgue as afirmativas: Ⓞ Pela Lei dos Grandes Números aproxima-se da distribuição normal quando n tende para o infinito. ① Suponha que n > 5. é um estimador consistente de E(Xi). ② é um estimador tendencioso de λ2. ③ Pelo Teorema Central do Limite, é um estimador consistente de V(Xi). ④ é o estimador de máxima verossimilhança do parâmetro λ. Resolução: O item (0) está resolvido no capítulo Principais Teoremas de Probabilidade. (1) Falsa. Utilizando a propriedade enunciada na Revisão de Conceitos (estimador consistente): lim E(T) ≠ 2λ E: . Assim, . Logo, o limite da esperança de T não converge para a média (λ) nem a variância de T não converge para zero. Então, T não é estimador consistente. (2) Verdadeira. Assim, onde, na segunda linha, utilizamos o fato de que Var(X) = σ2 / n = λ / n e E(X) = µ = λ. Assim, E(T) ≠ λ2. Observação: A rigor, este item seria falso, pois dever-se-ia garantir que n > 1. Para n = 1, teríamos que E(T) = λ2. Este seria um contraexemplo do que seria um estimador não viesado. (3) Falsa. É pela LGN, enunciada na Revisão de Conceitos do capítulo dos Principais Teoremas de Probabilidade. (4) Verdadeira. Montando a função de máxima verossimilhança: Maximizando esta função, obtemos como CPO: Questão 4 A respeito de testes de hipótese, é correto afirmar: Ⓞ Potência de um teste é a probabilidade de se rejeitar a hipótese nula quando esta for falsa. ① O nível de significância de um teste é a probabilidade de se cometer um erro tipo 1. ② O teste F de significância conjunta dos parâmetros em um modelo de regressão linear é unilateral. ③ Se uma variável é significativa ao nível de 1%, então ela é significativa ao nível de 5%. ④ p-valor = 1 – P(H0 falsa), em que P(A) é a probabilidade do evento A ocorrer. Resolução: (0) Verdadeiro. Ver Revisão de Conceitos – função poder (teste de hipóteses). (1) Verdadeiro. Ver Revisão de Conceitos – erro tipo I (teste de hipóteses). (2) Falso. O teste F de significância conjunta é sempre bilateral. (3) Verdadeiro. Ao nível de significância de 5%, estamos sendo menos exigentes, ou seja, menos precisos. (4) Falso. Conforme Revisão de Conceitos (teste de hipóteses), o p-valor é a probabilidade, sob a hipótese nula, de que a estatística de teste assuma um valor que dê a mesma ou mais evidência contra a hipótese nula do que o valor assumido por ela no presente teste. PROVA DE 2009 Questão 8 Verifique se as afirmativas abaixo são verdadeiras: Ⓞ Em uma pesquisa de opinião a proporção de pessoas favoráveis a uma determinada medida governamental é dada por = ∑ Xi /n. O menor valor de n para o qual a desigualdade de Tchebycheff resultará em uma garantia que P(| – p| ≥ 0,01) ≤ 0,01 é 200.000. ① Quando o número de graus de liberdade δ cresce, a distribuição χ aproxima-se de uma distribuição normal com média δ e desvio padrão 2δ. ② Um intervalo de confiança de 99% para a média µ de uma população, calculado para uma amostra aleatória, como [2,75;8,25], pode ser interpretado como: a probabilidade de µ estar no intervalo calculado é de 99%. ③ Seja X1, X2, ..., Xn uma amostra aleatória simples proveniente de uma população com distribuição de Pareto cuja função de densidade é dada por f(x) = q (1 + x)–(q + 1), 0 < x < ∞, q > 1. Então o estimador de máxima verossimilhança para q é . ④ Se existente, todo estimador de máxima verossimilhança calculado para uma amostra aleatória possui distribuição Normal em grandes amostras. Resolução: Os itens (0) e (1) estão resolvidos no capítulo Principais Teoremas de Probabilidade. (2) Falsa. Ver Revisão de Conceitos – intervalo de confiança. (3) Verdadeira. Devemos montar a função de máxima verossimilhança: Assim, devemos resolver o problema de maximização. Para isso, façamos uma transformação monótona sobre a função verossimilhança, por exemplo, passando o logaritmo: Maximizando tal função: A CPO será: que é a expressão pedida no item. (4) Verdadeira. Conforme Revisão de Conceitos (EMV), uma das propriedades dos EMVs é o fato de que eles têm distribuição assintótica Normal. Questão 9 Avalie se as afirmações abaixo são verdadeiras ou falsas: Ⓞ Para uma amostra de tamanho fixo, ao aumentar a probabilidade do erro tipo 1 aumentamos também o poder do teste. ① O valor p é o menor nível de significância para o qual o valor observado da estatística teste é significativo. ② Se a estatística teste é z = 2,75 e o valor crítico é z = 2,326, consequentemente o valor p é maior do que o nível de significância em um teste bicaudal e bilateral. ③ O poder de um teste de hipóteses é a probabilidade de rejeitar corretamente uma hipótese nula falsa. ④ Para um teste de hipótese de média com variância conhecida e igual a 4 para uma amostra aleatória de tamanho 16 e uma região crítica dada por [4,5, ∞[, o poder do teste para Ha: µ=5 é 0,84 (arredondando para duas casas decimais). Resolução: (0) Verdadeira. Se aumentarmos α, P(Erro I) aumenta, mas diminui a P(Erro II). É o clássico problema da coberta curta, ou seja, se a puxarmos para cobrir a cabeça, descobrimos os pés e vice-versa. A única forma de reduzirmos tal problema seria aumentar a coberta. Ou seja, se aumentarmos a amostra, a variância amostral se reduz (caudas mais finas) e a P(Erro II) pode ser reduzida, sem alterar a P(Erro I). (1) Falsa. Mesmo problema que foi visto em Questão sobre o p-valor, em provas da Anpec, em anos anteriores. Essa é uma interpretação que auxilia no entendimento do p-valor, mas está errada. Uma interpretação correta foi dada no item 4, questão 4, na prova da Anpec de 2008, por exemplo. (2) Falsa. Não se sabe qual é a hipótese nula, de modo que é impossível determinar o p-valor do teste. (3) Verdadeira. Ver Revisão de Conceitos – função poder (teste de hipóteses). (4) Anulada, possivelmente porque esqueceram de informar que X tem distribuição Normal. Além disso, o uso do TLC aqui é inapropriado, devido ao pequeno tamanho da amostra. Supondo que X seja normal, a questão pode ser resolvida como segue: o poder do teste é a probabilidade de se rejeitar H0, dado que ela é falsa, ou seja, dado que Ha é válida. Supondo que Ha é válida, então µ = 5. Assim, devemos calcular: que seria o poder do teste. Logo, o item seria verdadeiro. PROVA DE 2010 Questão 4 Responda se verdadeiroou falso: Ⓞ A diferença entre as medianas de uma distribuição F(a, b) e de uma distribuição χ diminui à medida que b → ∞. ① O Teorema Central do Limite justifica a afirmação: “Seja T uma variável aleatória, tal que T~tk–1, em que t representa uma distribuição t de Student, com k – 1 graus de liberdade, em que k é fixo. Então T converge em distribuição para uma Normal Padrão”. ② Sejam e . Ambos estimadores podem ser demonstrados consistentes para σ2, supondo uma amostra aleatória de X~N(µ, σ2). ③ Uma moeda justa foi jogada 300 vezes e observou-se cara em 188 destas. A Lei dos Grandes Números justifica a afirmação: P(cara na 301a jogada|188 caras em 300 jogadas)<0,5. ④ Se um estimador convergir em média quadrática para o parâmetro, ele será consistente (convergirá em probabilidade para o parâmetro). Resolução: Os itens (1) e (3) estão resolvidos no capítulo Principais Teoremas de Probabilidade. O item (0) está resolvido no capítulo Principais Distribuições de Probabilidade. (2) Falso. Para foi provado que tal estimador, apesar de viesado, é consistente (ver Revisão de Conceitos – estimadores da variância populacional). Agora, para , note que: na qual usamos o fato de que Var(xi) = σ2 e E(xi) = µ, na quarta linha (Se X, que representa a variável, tem uma distribuição populacional, então cada observação de sua amostra aleatória também terá a mesma distribuição e momentos.) Assim, utilizando a propriedade enunciada no item 4 a seguir: ou seja, tal estimador é assintoticamente viesado e, portanto, já podemos dizer que é inconsistente. (4) Verdadeiro. Conforme visto na Revisão de Conceitos, um estimador é consistente se: QM ( n) = 0 onde EQM ( n) = Var( n) + vies2 ( n), EQM é o Erro Quadrático Médio. Ou seja, convergência em média quadrática significa que o limite do EQM é zero. E isso implica que o estimador é consistente (ou seja, converge em probabilidade para o parâmetro populacional verdadeiro). Observação: Cuidado, consistência do EQM implica consistência do n. E na maioria dos casos o inverso vale, mas não em todos. Assim, consistência do estimador (convergência em probabilidade) pode não implicar consistência do EQM (convergência em média quadrática). Questão 5 São corretas as afirmativas: Ⓞ Considere dois estimadores não tendenciosos, 1 e 2, de um parâmetro θ. 1 é eficiente relativamente a 2 se var( 1) < var( 2). ① Um estimador de um parâmetro θ é consistente se converge em probabilidade para θ. ② Um estimador de um parâmetro θ é consistente se, e somente se, é não viesado e a variância de converge para 0 à medida que o tamanho da amostra tende a infinito. ③ Suponha que X1, X2,..., X10 sejam variáveis aleatórias independentes e identicamente distribuídas e que . Defina . Então P(1 < X < 3) = 0,55. ④ Suponha que X1, X2,..., Xn sejam variáveis aleatórias independentes e identicamente distribuídas e que Xi~Poisson(λ), i. Seja . À medida que n → ∞, aproxima-se de uma distribuição Normal padrão. Resolução: (0) Verdadeira. Quando dois estimadores são não tendenciosos, basta compararmos suas variâncias para verificar qual é mais eficiente. Observação: No caso mais geral, para quaisquer dos estimadores, utilizamos o EQM. Quando ambos são não viesados, o EQM se reduz à variância do estimador. (1) Verdadeira. Ver Revisão de Conceitos – definição de estimador consistente. (2) Falsa. Veja o item 4, questão 4, deste mesmo ano ou então a Revisão de Conceitos – estimador consistente. Questão 6 Suponha que Y1 e Y2 sejam variáveis aleatórias independentes, com média µ e variâncias V(Y1) = 75 e V(Y2) = 25. O valor de µ é desconhecido, e é proposto estimar µ por uma média ponderada de Y1 e Y2, isto é, por: αY1 + (1 – α)Y2 Qual o valor de α produz o estimador com a menor variância possível na classe dos estimadores não viesados? Multiplique o resultado por 100. Resolução: Primeiramente, note que o estimador (que denotaremos por T) satisfaz à condição de pertencer à classe de estimadores não viesados, ou seja: T = αY1 + (1 – α)Y2 E(T) = αE(Y1) + (1 – α)E(Y2) = αµ + (1 – α) µ = µ. Sua variância será: Var(T) = Var(αY1 + (1 – α)Y2) = α2Var(Y1) + (1 – α)2Var(Y2) = α275 + (1 – α)225 na qual utilizamos o fato de Y1 e Y2 serem independentes na segunda linha. Assim, devemos escolher α, que minimiza tal variância, ou seja, resolver o seguinte problema: A CPO será: Multiplicando o resultado por 100 obtemos a resposta final, 25. PROVA DE 2011 Questão 1 Considere as seguintes afirmativas acerca de um teste de hipótese: Ⓞ O erro tipo I é definido como a probabilidade de não rejeitar a hipótese nula quando a hipótese nula é falsa. ① O poder do teste é definido como a probabilidade de não rejeitar a hipótese nula quando a hipótese nula é verdadeira. ② O erro tipo II é definido como a probabilidade de não rejeitar a hipótese nula quando a hipótese alternativa é verdadeira. ③ O p-valor de um teste é a probabilidade, sob a hipótese nula, de obter um valor da estatística pelo menos tão extremo quanto o valor observado. ④ Se um intervalo de confiança de 95% para a média amostral, calculado a partir de uma amostra aleatória, excluir o valor 0, pode-se rejeitar a hipótese de que a média populacional seja igual a 0 ao nível de significância de 5%. Resolução: (0) Falsa. O Erro do tipo I é um evento (e não uma probabilidade) definido como rejeitar a hipótese nula quando esta for verdadeira. (1) Falsa. Ver Revisão de Conceitos – função poder. (2) Falsa. Da mesma forma que no item 0, o erro do tipo II é um evento definido como não rejeitar a hipótese nula quando a alternativa for verdadeira (ou seja, quando a nula for falsa). (3) Verdadeira. Esta é a definição exata do p-valor, como consta na página 348 do Bussab e Morettin (2010). (4) Verdadeira. Como exemplo, vejamos que um intervalo de confiança para a média populacional (m) ao nível de confiança de 95%, supondo-se que a distribuição de X é normal, é construído através da expressão onde z2.5% é o valor crítico de uma normal para um nível de confiança de 95%. Fazendo alguns algebrismos na expressao acima, obtemos: O valor do meio é a estatística de teste, escrita sob a hipotese nula, quando queremos realizar algum teste de hipótese sobre a média populacional, para um nível de significância de 5%. Assim, como no caso do item, se quisermos testar: H0 : m = 0 Ha : m ≠ 0 devemos calcular a estatística do teste acima (novamente, usando como valor de m o seu valor sob a hipotese nula): E aí verificamos se tal estatística situa-se entre – z2.5% e z2.5%, que é a região de aceitação da hipótese nula, ou fora deste intervalo, que é a região de rejeição. Estar na região de rejeição, ou seja, fora da região de aceitação é a mesma coisa de estar fora do IC como definido na primeira expressão. Ou seja, é como se o valor m = 0 estivesse fora do . Observação 1: No exemplo acima, supomos um teste bilateral (e também um IC bilateral). Mas no caso de um teste unilateral, por exemplo: O IC seria: O teste de hipótese seria: Como ele diz que o IC exclui o valor da hipótese nula m = 0 , então vale a conclusão também de que a estatística calculada: não se encontra na região de aceitação, ou seja, abaixo de z5%. Observação 2: Os exemplos foram feitos para um teste de hipótese para a média populacional, supondo que σ2 (variância populacional) é conhecida. Mas as mesmas conclusões seriam obtidas se σ2 fosse desconhecida. Neste caso, deveríamos apenas substituir σ2 pela variância amostral e utilizar os valores críticos da distribuição t – student no lugar dos valores críticos da normal (z). Questão 4 São corretas as afirmativas: Ⓞ Suponha que X1, X2,…, Xn sejam variáveis aleatórias independentes e identicamente distribuídas e que Xi ~ N(μ, σ2). Então /n é um estimador eficiente de µ. ① Suponha que X1, X2,…, Xn sejam variáveis aleatórias independentes e identicamente distribuídas e Xi ~ N(μ, σ2). Então, se definirmos /n, . ② Se um estimador de um parâmetro θ é não viesado e a variância de converge para 0 à medidaque o tamanho da amostra tende a infinito, então é consistente. ③ Suponha que X1, X2,…, Xn sejam variáveis aleatórias independentes e identicamente distribuídas e que Xi ~ Poisson(λ),i. Seja /n. Pela lei dos grandes números, à medida que n→∞, converge para λ. ④ Suponha que X1, X2,…, Xn sejam variáveis aleatórias independentes e identicamente distribuídas e que Xi ~ χv2(λ), i. Seja /n. À medida que n→∞, aproxima-se de uma distribuição normal padrão. Resolução: Os itens (1) a (4) estão resolvidos no capítulo Principais Teoremas de Probabilidade. (0) Verdadeiro. Por definição, o estimador é eficiente para um parâmetro θ quando E( ) = θ e a variância de atinge o limite mínimo da desigualdade de Cramér-Rao. é eficiente para m, nesse caso. Larson (1982, p. 373) trata desta e de outras propriedades desejáveis de estimadores. Questão 6 Sejam X1, X2,…, Xn variáveis aleatórias independentes e normalmente distribuídas, com média 0 e variância σ². Ⓞ Se σ = 1, a variável Y = (X12 + X22)/(2X32) possui uma distribuição F com n1 e n2 graus de liberdade, para n1 = 1 e n2 = 2. ① A variável possui uma distribuição t com 2 graus de liberdade. ② Defina Z = (X12 + X22)/σ². Então E(Z – 2)3 = 0. ③ Suponha que σ = 1 e que H seja uma variável aleatória independente de X1 e que P(H = 1) = P(H = –1) = 0,5. Então Y = HX1 ~ N(0, 1). ④ Sabemos que Pr(Z > 5165,615) = 0,05. Em que Z é uma variável aleatória com distribuição χ 25000. Suponha que n = 5001. Defina e S2 = (Xi – )2/(n – 1). Se S² = 5,3, pode-se rejeitar a hipótese nula de que σ² = 5 ao nível de significância de 5%. Resolução: Os itens (1) a (3) estão resolvidos no capítulo Principais Distribuições. (4) Verdadeiro. A hipótese nula será: H0 : σ2 = 5. A estatística para se testar uma hipótese sobre a variância é dada por: Substituindo os valores, o valor da estatística é dado por: Se considerarmos um teste unilateral, ou seja: H1 : σ2 > 5, então a região crítica a um nível de significância de 5% será: [5165.615,∞) segundo os dados do enunciado. Como o valor da estatística foi de 5300, então situa-se dentro desta região e, portanto, rejeita- se H0, ao nível de significância de 5%. Observação 1: Se considerarmos um teste bilateral, ou seja: H1 : σ2 ≠ 5 Então, pelo valor dado no item, podemos construir uma região crítica a um nível de significância de 10%, que será: [0, Zinf] [5165.615,∞) onde desconhecemos o valor crítico Zinf. Então, rejeitamos H0 a 10%. Mas o valor crítico Zsup = 5165.615 não é o correto para um teste bilateral a um nível de significância de 5%. Neste caso, deveríamos ter: P(Z > Zsup) = 0.025 E tal valor será, com certeza, maior do que 5165.615, pois a área a direita deve ser menor. Neste caso, com os dados do item, não podemos concluir se tal hipótese é rejeitada ou não. Assim, o item poderia ter sido anulado. Observação 2: Apenas por curiosidade, para que P(Z > Zsup) = 0.02 o valor de Zsup deve ser igual a 5198. Portanto, rejeitaríamos mesmo assim H0. Mas o aluno não é obrigado a saber esta informação. PROVA DE 2012 Questão 1 Julgue as afirmativas: Ⓞ O erro tipo I é definido como a probabilidade de rejeitar a hipótese nula quando a hipótese nula é verdadeira. ① O erro tipo II é definido como a probabilidade de rejeitar a hipótese nula quando a hipótese nula é verdadeira. ② O nível de significância de um teste é a probabilidade de rejeitar a hipótese nula quando a hipótese alternativa é verdadeira. ③ Se o p-valor de um teste é maior do que o nível de significância adotado, rejeita-se a hipótese nula. ④ Suponha que o objetivo seja testar a hipótese nula de que a média populacional µ é igual a 0. Se esta hipótese é rejeitada num teste monocaudal contra a hipótese alternativa de que µ > 0, ela também será rejeitada num teste bicaudal contra a hipótese alternativa de que µ ≠ 0, adotando-se o mesmo nível de significância. Resolução: (0) Falso. Erro é um evento, não uma probabilidade. Assim, erro do tipo I é definido como o evento de se rejeitar a hipótese nula quando a hipótese nula é verdadeira. (1) Falso. O erro do tipo II é o evento de se aceitar a hipótese nula quando ela é falsa. (2) Falso. O nível de significância de um teste é a probabilidade de ocorrência do erro tipo I, no caso de testes de hipóteses simples, e é o máximo dessa probabilidade, no caso de testes de hipóteses compostas. Assim, o nível de significância pode ser definido como o máximo da probabilidade de se rejeitar a hipótese nula quando a hipótese nula é verdadeira. (3) Falso. O valor p é o mais baixo nível de significância em que a hipótese nula pode ser rejeitada. Assim, se o nível de significância adotado é menor que o p-valor do teste, aceita-se a hipótese nula. (4) Falso. A um mesmo nível de significância, o módulo do valor crítico de um teste bicaudal é maior que de um teste monocaudal. O fato de o valor calculado da estatística de teste ter sido maior para o valor crítico no teste monocaudal (rejeitando-se, portanto, a hipótese nula) não implica necessariamente que ele será maior que o valor crítico do teste bicaudal. Assim, não podemos afirmar que a hipótese nula será rejeitada nesse novo teste. Questão 2 Suponha que as notas de matemática dos alunos em um exame nacional aplicado a todas as escolas do ensino médio sejam normalmente distribuídas com média 500 e variância 1000. Um cursinho faz uma propaganda afirmando que pode melhorar as notas dos alunos em 30 pontos caso eles frequentem um curso noturno que resolve as questões dos exames anteriores. O órgão de defesa do consumidor quer testar se este curso noturno é de fato efetivo. O estatístico deste órgão de defesa do consumidor formula o seguinte problema: seja M a nota que o aluno i obtém após frequentar o curso noturno, suponha que M é normalmente distribuída com média desconhecida µM e variância igual a 1000. O teste de hipótese que ele gostaria de fazer é o seguinte: H0: µM = 500 vs µM > 500. [Para a resolução desta questão talvez lhe seja útil saber que se Z tem distribuição normal padrão, então Pr(|Z| > 1,645) = 0,10 e Pr(|Z|>1,96) = 0,05.] Com base nos dados do problema, julgue as seguintes afirmativas: Ⓞ O órgão de defesa do consumidor irá conduzir o estudo usando uma amostra aleatória de 40 alunos que frequentaram este curso noturno. Se µM = 530, a distribuição do teste escore médio deste grupo de 40 alunos é uma distribuição normal com média 530 e variância 1000. ① Após terminarem o curso, os 40 alunos fazem o exame nacional e obtêm na média uma nota de 520 em matemática. Neste caso, a estatística do teste sugerido pelo estatístico é , e podemos afirmar que temos evidência para rejeitar a hipótese nula do teste proposto pelo estatístico ao nível de 5% de significância. ② Após terminarem o curso, os 40 alunos fazem o exame nacional. Usando as notas destes 40 alunos no exame, calculamos o p-valor do teste sugerido pelo estatístico e obtemos o p-valor de 0,081. Neste caso, podemos rejeitar a hipótese nula ao nível de 5% de significância. ③ Mantendo o nível de significância fixo, para diminuir o poder do teste, o estatístico pode aumentar o tamanho da amostra. ④ Mantendo o tamanho da amostra fixo, se o estatístico quiser aumentar o poder do teste, deve aumentar o nível de significância do teste. Resolução: (0) Falso. A distribuição do score médio amostral, , possui esperança e variância . Assim, segue distribuição normal com média 530 e variância 25. (1) Falso. A estatística do teste sugerido pelo estatístico está errada. O valor calculado correto da estatística é: . Como esse é um teste unilateral à direita, o intervalo de confiança a 5% de significância é . Assim, rejeita- se a hipótese nula a esse nível de significância. (2) Falso. O p-valor é o mais baixo nível de significância em que a hipótese nula pode ser rejeitada (Gujarati). Assim, sendo o nível de significância 5% menor que o p-valor do teste, 8,1%, aceita-se a hipótese nula. (3) Falso. Aumentar o tamanho da amostra aumenta o poder do teste, pois aumenta a quantidade de informaçõesdisponível. (4) Verdadeiro. O poder do teste é definido como a probabilidade de se rejeitar corretamente a hipótese nula, ou seja, rejeitá-la quando ela é falsa. Desta forma, podemos escrever a função poder como 1 – P(Erro do tipo II). Assim, pode-se aumentar o poder do teste aumentando a probabilidade do erro do tipo I, ou seja, rejeitar a hipótese nula quando ela é verdadeira. Questão 9 Julgue as seguintes afirmativas: Ⓞ Seja variáveis aleatórias independentes e identicamente distribuídas tais que . Se , então . ① Seja uma sequência de variáveis aleatórias. Esta sequência de variáveis aleatórias converge em probabilidade para uma constante µ se e somente se esta sequência de variável aleatória converge em distribuição para µ. ② Seja uma amostra aleatória com média e variância . Podemos afirmar que com , converge para uma distribuição normal com média µ e variância . ③ Seja variáveis aleatórias independentes e identicamente distribuídas com média µ e variância . Seja em que . Neste caso, é um estimador consistente para . ④ Se Y é uma variável aleatória tal que , então podemos afirmar que para . Resolução: Os itens (0), (1) e (4) estão resolvidos no capítulo Principais Teoremas de Probabilidade. (2) Falso. Como a média , a variável aleatória apresenta média . Observação: Além da explicação acima, aplicando o TLC poderíamos dizer que: , e, para um n suficientemente grande, poderíamos dizer que W segue aproximadamente uma normal com média e variância , mas não dizer que W converge exatamente em distribuição para uma normal. (3) Verdadeiro. S2 é consistente, apesar de viesado, pois converge em probabilidade para o valor original da variância. Observação: Foi provado na Revisão de Conceitos que este estimador tem média: , cujo limite é quando n tende para infinito. Sua variância foi mostrada ser igual a: Capitulo 4 - Inferência Estatística Revisão de conceitos Prova de 2006 Questão 4 Questão 5 Prova de 2007 Questão 2 Questão 11 Prova de 2008 Questão 3 Questão 4 Prova de 2009 Questão 8 Questão 9 Prova de 2010 Questão 4 Questão 5 Questão 6 Prova de 2011 Questão 1 Questão 4 Questão 6 Prova de 2012 Questão 1 Questão 2 Questão 9
Compartilhar