Baixe o app para aproveitar ainda mais
Prévia do material em texto
Métodos Estatísticos II − 2o. Semestre de 2011 Revisão para a AP2 Profa. Ana Maria Farias (UFF) Nas duas últimas provas presenciais (AP2 e AP3) serão dadas questões sobre Inferência Estatística, envolvendo construção de intervalos de confiança e testes de hipóteses. As seguintes fórmulas são apre- sentadas nas provas: _____________________________________________________ Resultados importantes e fórmulas Distribuições Amostrais X ∼ N ¡ μ;σ2 ¢ =⇒ ⎧ ⎪⎪⎪⎪⎪⎪⎪⎪⎨ ⎪⎪⎪⎪⎪⎪⎪⎪⎩ X − μ σ√ n ∼ N(0; 1) (1) X − μ S√ n ∼ t(n− 1) (2) X ∼ Bernoulli(p) =⇒ X = bP ≈ N µp; p(1− p) n ¶ (amostra grande) (3) S2 = 1 n− 1 nP i=1 ¡ Xi −X ¢2 = 1 n− 1 ∙ nP i=1 X2i − nX 2 ¸ = 1 n− 1 " nP i=1 X2i − ( P Xi) 2 n # Regiões críticas Teste de hipótese Bilateral Unilateral à direita Unilateral à esquerda X < μ0 − zα/2 σ√ n ou X > μ0 + zα/2 σ√ n X > μ0 + zα σ√ n X < μ0 − zα σ√ n X < μ0 − tn−1;α/2 S√ n ou X > μ0 + tn−1;α/2 S√ n X > μ0 + tn−1;α S√ n X < μ0 − tn−1;α S√ nbP < p0 − zα/2qp0(1−p0)n ou bP > p0 + zα/2qp0(1−p0)n bP > p0 + zαqp0(1−p0)n bP < p0 − zαqp0(1−p0)n _____________________________________________________ Nos resultados (1) e (2), o parâmetro de interesse é a média populacional. O resultado (1) deve ser usado para populações normais com variância conhecida, enquanto o resultado (2) se aplica a populações normais com variância desconhecida. No resultado (3), o parâmetro de interesse é a proporção populacional. Como ele é consequência do Teorema Limite Central, é necessário que a amostra seja grande (n > 30). Vamos ver agora como usar esses resultados na resolução de questões. 1 1 Questões sobre intervalos de confiança 1.1 Forma geral Vamos denotar por bθ o estimador do parâmetro de interesse. No nosso caso, bθ pode ser a média amostral X ou a proporção amostral bP. A forma geral do intervalo de confiança éhbθ − �;bθ + �i onde o erro amostral � é definido como � = k ·EP (bθ) 1.2 Erro padrão O erro padrão do estimador, EP (bθ), é obtido diretamente das fórmulas dadas - ele é o desvio padrão da distribuição amostral: EP (X) = σ√ n caso (1) - população normal com variância conhecida EP (X) = S√ n caso (2) - população normal com variância desconhecida EP ( bP ) = rp(1− p) n caso (3) - estimação da proporção populacional No caso (3), é necessário substituir p por algum valor. Se não for dada qualquer informação, use a proporção amostral encontrada, ou então, p = 0, 5 que dá o maior intervalo de confiança possível. 1.3 Abscissa da distribuição amostral Com relação à constante k, para intervalos de confiança com nível de confiança 1− α, ela é a abscissa da distribuição amostral que deixa área α/2 acima dela (veja a Figura.1). Nos casos (1) e (3), a distribuição amostral é normal; assim, você deve usar a tabela da normal. No caso (2), a distribuição amostral é a t de Student com n− 1 graus de liberdade. Figura 1: Abscissa para construção de intervalos de confiança com 1− α de confiança Se o nível de confiança é de 80% e o tamanho da amostra é n = 18, por exemplo, nos casos (1) e (3) você deve procurar na tabela da normal o valor k tal que tab(k) = 0, 40. No caso (2), você tem que olhar a tabela da t de Student na linha correspondente a 17 graus de liberdade (n − 1 = 17) e a coluna correspondete a 10%. Lembre-se: o nível de confiança é a área central da distribuição. Em cada cauda fica α/2. Note que se 1− α = 0, 80, então α = 0, 2. 2 2 Questões sobre teste de hipóteses 2.1 Definição das hipóteses nula e alternativa Na solução de problemas envolvendo testes de hipóteses, é fundamental que você defina corretamente as hipóteses nula e alternativa. É a hipótese alternativa que determina a região crítica do teste. Como visto no livro texto, para determinar H0 e H1, você tem que “traduzir”as afirmações do problema para desigualdades. A desigualdade que não envolve o sinal de = será a hipótese alternativa e a hipótese nula é sempre do tipo θ = θ0. 2.1.1 Exemplos 1. O tempo médio é, no máximo, 15 minutos. Traduzindo afirmativa dada: μ ≤ 15 complementar: μ > 15 H0 : μ = 15 H1 : μ > 15 2. Há, em média, pelo menos 15 clientes. afirmativa dada: μ ≥ 15 complementar: μ < 15 H0 : μ = 15 H1 : μ < 15 3. O tempo médio tem que ser menor que 15 minutos. afirmativa dada: μ < 15 complementar: μ ≥ 15 H0 : μ = 15 H1 : μ < 15 4. O faturamento médio tem que ser maior que 15 unidades monetárias. afirmativa dada: μ > 15 complementar: μ ≤ 15 H0 : μ = 15 H1 : μ > 15 5. O comprimento médio tem que ser 15 cm. afirmativa dada: μ = 15 complementar: μ 6= 15 H0 : μ = 15 H1 : μ 6= 15 3 6. A proporção de clientes tem que ser pelo menos 60%. afirmativa dada: p ≥ 0, 60 complementar: p < 0, 60 H0 : p = 0, 60 H1 : p < 0, 60 7. A proporção de defeituosos tem que ser no máximo 5%. afirmativa dada: p ≤ 0, 05 complementar: p > 0, 05 H0 : p = 0, 05 H1 : p > 0, 05 8. A proporção de votos favoráveis tem que ser maior que 75%. afirmativa dada: p > 0, 75 complementar: p ≤ 0, 75 H0 : p = 0, 75 H1 : p > 0, 75 2.2 Estatística de teste 2.2.1 Teste sobre a média de uma população normal Há dois casos possíveis: variância populacional conhecida e variância populacional desconhecida. Se a hipótese nula é H0 : μ = μ0, as estatísticas de teste são Z0 = X − μ0 σ√ n = √ n X − μ0 σ para o caso de se conhecer σ e T0 = X − μ0 S√ n = √ n X − μ0 S no caso de não se conhecer σ. 2.2.2 Teste sobre uma proporção (amostras grandes) Se a hipótese nula é H0 : p = p0, a estatística de teste é Z0 = bP − p0r p0(1− p0) n = √ n bP − p0p p0(1− p0) 4 Figura 2: Cálculo da abscissa para definição da região crítica 5 2.3 Definição da região crítica A região crítica é construída comparando-se o valor da estatística de teste sob H0 com a abscissa da distribuição amostral correspondente. Se o valor observado da estatística de teste cai na região crítica, rejeita-se a hipótese nula. Na Figura 2 ilustra-se a abscissa que deve ser procurada na tabela da distribuição amostral (normal ou t−Student) para as três possibildiades de hipótese alternativa. Quando a estatística de teste segue a distribuição normal, para o teste unilateral à direita, temos que encontrar, na tabela da normal padrão, a abscissa k tal que tab(k) = 0, 5− α. Essa mesma abscissa, com sinal negativo, é a solução para o teste unilatera à esquerda. E no caso da teste bilateral, temos que encontrar a abscissa k da normal padrão tal que.tab(k) = 0, 5− α/2. Quando a estatística de teste segue a distribuição t−Student, o procedimento é absolutamente análogo, só que em vez de usarmos a tabela da normal padrão, temos que usar agora a tabela da t de Student com n− 1 graus de liberdade. 2.4 Cálculo do valor P e do erro tipo II Vamos agora nos concentrar no caso de teste de hipótese para a média de uma população normal com variância conhecida. Nesse caso, a estatística de teste é dada na equação (1). O valor P é a probabilidade de se obter um valor da estatística tão ou mais extremo do que o valor observado. “Tão ou mais extremo” é sempre no sentido de se rejeitar a hipótese nula. Suponhamos que o valor observado da estatística de teste seja z0 = 1, 92 para um teste unilateral à direita. Então, P = Pr(Z > 1, 92). Esse mesmo valor de z0 num teste bilateral resulta em P = 2× Pr(Z > 1, 92). Para calcular o erro tipo II, temos que expressar a região crítica em termos de X (e não em termos da estatística padronizada). A região crítica Z0 > k pode ser escrita em termos de X da seguinte forma: Z0 > k ⇔ X − μ0 σ√ n > k ⇔ X > μ0 + k × σ√ n É com essa expressão equivalente que trabalhamos para calcular erros do tipo II. 6
Compartilhar