Baixe o app para aproveitar ainda mais
Prévia do material em texto
Centro de Ciências e Tecnologia Agroalimentar - Campus Pombal Disciplina: Estatística Básica - 2013 Aula 11 Professor: Carlos Sérgio UNIDADE 7 - TESTES DE HIPÓTESES (NOTAS DE AULA) 1 Hipótese Nula e Hipótese Alternativa Consideraremos aqui problemas estatísticos envolvendo um parâmetro θ cujo valor é descon- hecido mas deve cair dentro de um certo domínio Ω (isto é, Ω é o conjunto de todos os possíveis valores de θ). Vamos supor que Ω possa ser particionado em 2 (dois) subconjuntos distintos Ω0 e Ω1, e que o pesquisador deva decidir se o valor desconhecido de θ cai em Ω0 ou em Ω1. Seja H0 a hipótese de que θ ∈ Ω0 e H1 a hipótese de que θ ∈ Ω1, isto é: H0 : θ ∈ Ω0 H1 : θ ∈ Ω1 Como Ω0 e Ω1 são disjuntos (Ω0 ∪ Ω1 = Ω), somente uma das hipóteses é verdadeira. O pesquisador deve decidir se aceita H0 ou se aceita H1. Um problema desse tipo é chamado um problema de teste de hipóteses. • H0 é denominada hipótese nula, e • H1 é denominada hipótese alternativa 2 Região Crítica do teste Antes de decidir se aceita ou não a hipótese nula, observa-se uma amostra aleatóriaX1, X2, . . . , Xn. Seja S o espaço amostral, isto é, o conjunto de todos os possíveis resultados da amostra. Especifica-se um procedimento de teste que consiste em dividir o espaço amostral em dois subconjuntos: • Um deles consiste dos valores da amostra para o qual ele rejeita H0, • Outro contém os valores para o qual se rejeita H1. O subconjunto para o qual H0 será rejeitada é chamada região crítica do teste. O comple- mento da região crítica contém todos os possíveis valores para qual H0 será aceita. 1 3 Erros do Tipo I e erros do Tipo II Quando estabelecemos um procedimento do teste, podemos incorrer em dois tipos de erros: • O de rejeitar H0 quando ela é de fato verdadeira. Este erro é denominado erro do tipo I. A probabilidade (α) deste tipo de erro ocorrer é controlada pelo pesquisador e é denominada nível de signicância do teste. • O de aceitar H0 quando ela é falsa. Este erro é denominado erro do tipo II. A probabilidade deste erro ocorrer é representada por β Tabela 1: Representação dos erros do tipo I e II. H0 é verdadeira H0 é falsa aceita H0 1− α (coef. de confiança) β rejeita H0 α (nível de significância) 1− β (poder do Teste) 4 Teste da hipótese para média populacional µ 4.1 σ conhecido H0 : µ = µ0 H1 : µ 6= µ0 ou µ < µ0 ou µ > µ0 1 - Retira-se uma amostra de tamanho "n"e calcula-se x̄. 2 - Calcula-se o valor da estatística Z = x̄− µ0 σ/ √ n 3 - Sob a hipótese nula, tem-se que Z possui uma distribuição normal padrão. Portanto, Rejeita-se H0 se | Z |> Zα/2 (isto é, se Z < −Zα/2 ou Z > Zα/2) Aceita-se H0 se | Z |< Zα/2 (isto é, se −Zα/2 ≤ Z ≤ Zα/2 ) em que α é o nível de significância do teste. 2 Exemplo: O salário médio dos empregados das indústrias siderúrgicas é de 2,5 salários míni- mos, com um desvio padrão de 0,5 salários mínimos. Se uma firma particular emprega 49 operários com um salário médio de 2,3 salários mínimos, podemos afirmar que essa indústria paga salários inferiores, ao nível de 5%? 4.2 σ desconhecido H0 : µ = µ0 H1 : µ 6= µ0 ou µ < µ0 ou µ > µ0 Calcula-se a estatística t = x̄− µ0 S/ √ n Sob a hipótese nula, tem-se que t possui uma distribuição t-Student com n − 1 graus de liber- dade. Portanto, Rejeita-se H0 se | t |> tα/2;(n−1) Aceita-se H0 se | t |≤ tα/2;(n−1) Observação Se os testes tiverem uma hipótese alternativa unilateral (isto é, se H1 : µ > µ0 ou H1 : µ < µ0) o teste deverá rejeitar unilateralmente (isto é, se t > tα;(n−1) ou t < −tα;(n−1), respectivamente) Exemplo: Um fabricante afirma que seus cigarros contém não mais que 30 mg de nicotina. Uma amostra de 25 cigarros fornece média de 31,5 mg e desvio padrão de 3 mg. Ao nível de 5%, os dados refutam ou não a afirmação do fabricante? 5 Teste para Proporção Suponha que se deseje testar a hipótese: H0 : p = p0 H1 : p 6= p0 ou p < p0 ou p > p0 Calcula-se a estatística Z = p̂− p0√ p0(1−p0) n Rejeita-se H0 se | Z |> zα/2 Aceita-se H0 se | Z |≤ zα/2 3 Exemplo: De um grande lote de CD’s produzidos tiramos uma amostra de 240 CD’s e obser- vamos que 6 apresentavam problemas. Com esse resultado, pode-se concluir que a proporção de CD’s com problemas no lote é inferior a 3%? (use 5% de significância). 6 Teste de hipótese para variância Suponha que uma variável seja normalmente distribuída com uma variância desconhecida e se deseje efetuar o seguinte teste de hipóteses: H0 : σ2 = σ20 H1 : σ2 6= σ20 ou σ2 < σ20 ou σ2 > σ20 Calcula-se a estatística X2 = (n− 1)s2 σ20 Rejeita-se H0 se X2 < χ21−α/2,[n−1] ou X 2 > χ2α/2,[n−1] Aceita-se H0 se χ21−α/2,[n−1] ≤ X 2 ≤ χ2α/2,[n−1] Observações 1 - Se a hipótese alternativa fosse H1 : σ2 > σ20 H0 seria rejeitada se X2 > χ2α,[n−1] 2 - Se a hipótese alternativa fosse H1 : σ2 < σ20 H0 seria rejeitada se X2 < χ21−α,[n−1] Exemplo: Uma das maneiras de manter sob controle a qualidade de um produto é controlar a sua variabilidade. Uma máquina de encher pacotes de café está regulada para enchê-los com média de 500 g e desvio padrão de 10 g. Colheu-se uma amostra de 16 pacotes e observou-se uma variância s2 = 169g2. Supondo que o peso de cada pacote segue uma distribuição normal, você diria que a máquina está desregulada com relação à variância? Solução: Deseja-se testar: H0 : σ2 = 100 H1 : σ2 6= 100 A estatística a ser calculada é: 4 X2 = (n− 1)s2 σ20 = (15)(169) 100 = 25, 35 e o procedimento do teste é: Aceita-se H0 se χ21−α/2,[n−1] ≤ X 2 ≤ χ2α/2,[n−1] isto é, Aceita-se H0 se 6, 262 ≤ X2 ≤ 27, 488, e Rejeita-se H0 seX2 < 27, 488 ou X2 > 27, 488 Portanto, aceita-se H0, e concluímos que a máquina não está desregulada quanto à variância. 7 Teste da hipótese da igualdade de duas médias Suponha que se tenha H0 : µ1 = µ2 H1 : µ1 6= µ2 ou µ1 > µ2 ou µ1 < µ2 7.1 σ21 e σ 2 2 conhecidas calcula-se a estatística Z = x̄1 − x̄2√ σ21 n1 + σ 2 2 n2 Sabe-se que, sob a hipótese H0, a variável Z possui uma distribuição normal padrão. Portanto, o procedimento do teste consiste em: Rejeita-se H0 se | Z |> Zα/2 Aceita-se H0 se | Z |≤ Zα/2 7.2 σ21 e σ 2 2 desconhecidas Suponha que a hipótese de igualdade de variâncias não seja rejeitada. Então podemos supor que σ21 = σ 2 2 , mas esta variância comum não é conhecida. Para efetuar o teste de igualdade de médias, neste caso, procedemos da seguinte maneira: 5 t = x̄1−x̄2√ 1 n1 + 1 n2√ (n1−1)S21+(n2−1)S22 n1+n2−2 Esta estatística possui uma distribuição t-Student com n1 +n2−2 graus de liberdade. Portanto. Rejeita-se H0 se | t |> tα/2;n1+n2−2 Aceita-se H0 se | t |≤≤ tα/2;n1+n2−2 8 Teste de hipótese da diferença entre proporções Suponha que se tenha H0 : p1 = p2 H1 : p1 6= p2 ou p1 > p2 ou p1 < p2 Como µp̂1−p̂2 = p1 − p2 = 0 (sob H0) e σ2p̂A−p̂B = p1q1 n1 + p2q2n2 = pq ( 1 n1 + 1n2 ) (sob H0) em que P = n1p̂1 + n2p̂2 n1 + n2 é adotado como estimativa de p. Calcula-se Z = p̂1 − p̂2 σp̂1−p̂2 e aceita-se H0 se | Z |≤ Zα/2 9 Teste da razão de variâncias Suponha que se deseje testar: H0 : σ21 = σ 2 2 H1 : σ21 6= σ22 ou, equivalentemente, H0 : σ21 σ22 = 1 H1 : σ21 σ22 6= 1 6 O procedimento do teste é: Calcula-se a estatística f = s21 s22 Vimos que, sob a hipótese H0, a estatística f possui uma distribuição F com n1 − 1 e n2 − 1 graus de liberdade. Portanto, Aceita-se H0 ao nível de significância α se 1 Fα/2,[n2−1],[n1−1] ≤ f ≤ Fα/2,[n1−1],[n2−1] Rejeita-se H0 ao nível de significância de α se f < 1 Fα/2,[n2−1],[n1−1] ou f > Fα/2,[n1−1],[n2−1] Exemplo: Uma das maneiras de medir o grau de satisfação dos empregados de uma mesma categoria quanto à política salarial é por meio do desvio padrão de seus salários. A fábrica A diz ser mais coerente na política salarial do que a fábrica B. Para verificar essa afirmação, sorteou-se uma amostra de 10 funcionários não especializados de A, e 15 de B, obtendo-se as variâncias s2A = 1000 reais e s 2 B = 1600 reais. Qual seria a sua conclusão ao nível de 5%? Solução: A hipótese a ser testada é: H0 : σ2A = σ 2 B H1 : σ2A < σ2 B Temos que: f = s2A s2B = 1000 1600 = 0, 625 Devemos aceitar H0 ao nível de significância α = 0, 05 se f ≥ 1 F0,05,[14],[9] ou seja, se f ≥ 0, 33 Como este é o caso, aceitamos H0 ao nível de significância de 0,05, e concluímos que a fábrica A não é mais coerente na política salarial do que a fábrica B.. 7 Exercícios 1. Sabe-se que o consumo mensal per capita de determinado produto tem distribuição normal, com desvio padrão de 2 kg. A diretoria da empresa que fabrica esse produto resolveu que retiraria o produto da linha de produção se a média de consumo per capita fosse menor do que 8 kg, caso contrário, continuaria a fabricá-lo. Foi realizado uma pesquisa de mercado, tomando-se uma amostra aleatória de 25 pessoas e verificou-se um consumo total de 180 kg do produto. Construa um teste de hipótese adequado para verificar a hipótese acima a um nível de significância de 2,5% e diga qual deve ser a decisão a ser adotada pela empresa? 2. Ao final de 90 dias de uma dieta alimentar envolvendo 25 pessoas, constatou-se o seguinte ganho médio de peso de 40g, e desvio padrão de 1,378g. Supondo que o ganho de peso médio dessas pessoas é de 45g, teste a hipótese para α = 5%, se esse valor é o mesmo. 3. Um processo de fabricação de arame de aço dá um produto com resistência média de 200 psi. O desvio padrão é de 20 psi. O engenheiro de controle de qualidade deseja elaborar um teste que indique se houve ou não variação na média do processo, usando uma amostra de 25 arames obteve-se uma média de 285 psi. Use um nível de significância de 5%. 4. Suponha que alguém tenha sugerido de experiências passadas que 60% das larvas de mosquito num certo lago deveriam ser da espécie Aedes detritus. Foram encontrados 60 desse tipo de uma amostra de 80. Os dados suportam esta hipóteste? Use α = 5% 5. As condições de mortalidade de uma região são tais que a proporção de nascidos que sobre- vivem até 60 anos é de 0,6. Testar essa hipótese ao nível de 2%, se em 1000 nascimentos amostrados aleatoriamente, verificou-se 530 sobreviventes até 60 anos. 6. Observou-se a produção mensal de uma indústria durante alguns anos e verificou-se que ela obedecia a uma distribuição normal com variância igual a 300 u2. Foi adotada então uma nova técnica de produção e durante um período de 24 meses observou-se a produção mensal. Após este período constatou-se que a variância foi de 400 u2. Há motivos para se acreditar que houve alteração na variância ao nível de 10%? 7. Uma amostra de dez elementos extraída de uma população suposta normal forneceu variân- cia igual a 12,4. Pergunta-se: esse resultado é suficiente para se concluir, ao nível α = 5% de significância, que a variância dessa população é inferior a 25? 8. Para verificar se a variabilidade das espessuras de um tipo de disco metálico é inferior a 3 mm, considerou-se uma amostra de 25 desses discos e obteve-se uma estimativa para o desvio- padrão de 1,8 mm. Com este resultado, qual seria a conclusão a respeito da variabilidade das espessuras? (use α = 5%) 9. Uma amostra de 10 lâmpadas elétricas, da marca A, apresentou a vida média de 1400 horas e uma amostra de 20 lâmpadas elétricas, da marca B, apresentou a vida média de 1200 horas. Suponha que os desvios padrões populacionais dos tempos de vida das lâmpadas das duas marcas sejam conhecidos e iguais a 120 e 100, respectivamente. Teste, ao nível de significância de 1%, a hipótese que as duas marcas produzem lâmpadas com o mesmo tempo médio de vida. 10. Sendo Testar a igualdade das duas média usando α = 5% 8 Amostra 1 n1 = 60 x̄1 = 5, 71 σ21 = 43 Amostra 2 n2 = 35 x̄2 = 4, 12 σ22 = 28 11. Duas fábricas devem ser comparadas em relação ao tempo gasto por seus trabalhadores para executar determinada tarefa. Na fábrica A são considerados 15 trabalhadores e são obtidos um tempo médio estimado de 12 min e um desvio padrão de 2 min. Na fábrica B são considerados 20 trabalhadores e o tempo médio obtido é de 10 min e o desvio padrão é de 3 min. Sabendo-se que o tempo de execução da tarefa tem a mesma variabilidade nas duas fábricas, pode-se considerar que os trabalhadores da fábrica B são mais rápidos que os da A?(use α = 0, 05) 12. Duas técnicas de vendas são aplicadas por dois grupos de vendedores: a técnica A, por 12 vendedores, e a técnica B, por 15 vendedores. Espera-se que a técnica B produza melhores resultados que a técnica A. No final de um mês, os vendedores de A venderam uma média de 68 ítens, com uma variância de 50, enquanto que os vendedores de B venderam uma média de 76 ítens com uma variância de 75. Testar, ao nível de significância de 5%, se a técnica B é realmente melhor que a técnica A. 13. Uma amostra de 370 azulejos tirados da produção de um dado dia acusou 19 azulejos com defeito. Numa amostra de 165 azulejos da produção do dia seguinte havia 15 azulejos com defeito. Há razões estatísticas válidas para se afirmar que nesse segundo dia a produção tenha piorado? (Use nível de 5% de significância). 14. Uma empresa de pesquisa de opinião seleciona, aleatóriamente, 300 eleitores de São Paulo e 400 do Rio de Janeiro, e pergunta a cada um se votará ou não num determinado candidato nas próximas eleições. 75 eleitores de SP e 120 do RJ responderam afirmativo. Há diferença entre as proporções de eleitores favoráveis ao candidato naqueles dois Estados? (use α = 0, 01) 15. Dois programas de treinamento de funcionários foram efetuados. Os 21 funcionários treina- dos no programa antigo apresentaram uma variância de 146 pontos em sua taxa de erro. No novo programa, 11 funcionários apresentaram uma variância de 200. Sendo α = 10%, pode-se concluir que a variância é diferente para os dois programas? 16. O fabricante I de um tipo especial de aço afirma que, em relação à resistência à tração, seu produto é mais homogênio que o do fabricante II. Para verificar essa afirmação foi considerada uma amostra de 11 cabos de aço do fabricante I e uma de 15 do II. As estimativas dos desvios padrões obtidas foram, respectivamente, 5 kg/cm e 8 kg/cm. Com esses resultados, qual seria a conclusão a respeito da afirmação do fabricante I? (Use nível de 2,5% de significância). 17. A Hudson Valley Boaling Company distribui um tipo de cerveja sem álcool em garrafas que indicam o conteúdo de 32 oz. O Bureau of Weights anel Measures seleciona aleatoriamente 26 dessas garrafas, mede seu conteúdo e obtém uma média amostral de 31,8 oz, com desvio- padrão de 0,75 oz. Ao nível de 0,01 de significância, teste a afirmação do Instituto de que a companhia está ludibriando os consumidores. Deve-se formalizar uma queixa? 18. Estão em teste dois processos para fechar latas de comestíveis. Em duas seqüências de 1000 latas, o processo 1 gera 50 rejeições, enquanto o processo 2 acusa 200 rejeições. Pode ao nível de 5%, concluir que os dois processos sejam diferentes? 9 19. Em uma pesquisa de opinião, 32 dentre 80 homens declararam apreciar certa revista, acon- tecendo o mesmo com 26 dentre 50 mulheres. Ao nível de 5% de significância os homens e as mulheres apreciam igualmente a revista? 20. A variabilidade de dois produtos similares deve ser comparada. Coletam-se 15 observações do produto 1 e 18 do produto 2. A amostra de produto 1 apresenta S1 = 15, e a amostra de produto 2 apresenta S2 = 18. Teste a hipótese de que as variâncias sejam as mesmas (considere α = 0, 10). 21. Um fornecedor de matéria-prima afirma que o teor de impureza de seu produto é 2,5%. 152 amostras são analisadas, sendo 8 delas classificadas como impuras. Conclua a respeito da hipótese do fornecedor (use α = 0, 05). 22. Um fabricante garante que 90% das peças que fornece a um cliente estão de acordo com as especificações exigidas. O exame de uma amostra aleatória de 200 destas peças revelou 25 fora das especificações. Verifique se aos níveis de 5% e 1% de significância se há exagero na afirmativa do fabricante. 23. Diversas políticas, em relação às filiais de uma rede de supermercados, estão associadas ao gasto médio dos clientes em cada compra. Deseja-se compararestes parâmetros de duas novas filiais, através de duas amostras de 50 clientes, selecionados ao acaso, de cada uma das novas filiais. As médias obtidas foram 62 e 71 unidades monetárias. Supondo que os desvios padrões sejam idênticos e iguais a 20 um, teste a hipótese de que o gasto médio dos clientes não é o mesmo nas duas filiais. Utilize uma significância de 5%? 24. Em dois anos consecutivos foi feito um levantamento de mercado sobre a preferência dos consumidores por um determinado produto. No primeiro ano o produto era anunciado com frequência semanal nos veículos de comunicação e no segundo ano com frequência mensal. No levantamento foram utilizados duas amostras independentes de 400 consumidores cada. No primeiro ano o percentual de compradores ficou em 33% e no segundo ano em 29%. Considerando o nível de significância de 5%, teste a hipótese de que a frequência do anúncio tem influência na manutenção da fatia de mercado. 25. Uma agência de empregos alega que os candidatos por elas colocados nos últimos 6 meses têm salários de R$ 9.000,00 anuais, em média. Uma agência governamental extraiu uma amostra aleatória daquele grupo, encontrando um salário médio de R8.000,00, com desvio- padrão de R$ 1.000,00 com base em 30 empregados. Teste a afirmação da agência, contra a alternativa de que o salário médio é inferior a R$ 9.000,00, ao nível de significância de 0,05. 26. Um pesquisador deseja saber se a média da ingestão calórica diária em população rural de um país desenvolvido é menor do que 2000 calorias, valor considerado como ideal. Es- tudando 500 pessoas, obteve média de 1985 e desvio padrão de 210. Realize o teste de hipótese.(use α = 3%) 27. Um pesquisador quis determinar os efeitos de um programa orientado de exercícios de longa duração em uma empresa. Os dados foram coletados de 13 pessoas que participavam vol- untariamente do programa de exercícios e que praticavam atividade física por uma média de 13 anos. O grupo controle foi formado por 17 pessoas. A variável resposta medida foi o número de vezes que as pessoas se erguiam em 30 segundos. O grupo de exercícios teve uma média de 21.0 e um desvio padrão de 4.9. O grupo controle teve média de 12.1 e desvio 10 padrão de 5.6. Assumindo que as duas populações têm distribuição normal e que as variân- cias populacionais são iguais, realize o teste de hipóteses de que as médias são iguais. (use α = 5%) 28. Estudos sobre mortalidade de homens com idade superior a 65 anos de uma cidade mostram que 4% deles morrem dentro de um ano. Num grupo de 1000 indivíduos selecionados dessa população, 60 morreram no período de um ano. Suspeita-se de que houve um aumento da mortalidade anual nessa população. (use α = 5%) 29. Um restaurante compra frangos abatidos inteiros com peso médio de 3 quilos há vários anos de um fornecedor. Outro fornecedor propõe ao gerente do restaurante vender frangos com peso médio maior que 3 quilos ao mesmo preço do fornecedor antigo. Antes de mudar de fornecedor, o gerente do restaurante decidiu comprar 25 frangos do novo fornecedor e pesá- los. Encontrou um peso médio de 3,2 quilos com um desvio padrão de 0,4 quilos. (use α = 2, 5%) 30. Uma fábrica de automóveis anuncia que seus carros consomem, em média, 11 litros por 100 km, com desvio padrão de 0,8 litro. Uma revista resolve testar essas afirmação e analisa 35 automóveis dessa marca, obtendo 11,3 litros por 100 km como consumo médio (considerar distribuição normal). O que a revista pode concluir sobre o anuncio da fábrica, ao nível de 10%? 31. Um especialista em marketing de uma fábrica de massas acredita que 40% dos amantes de massas preferem lasanha. Se nove de 20 amantes de massas escolhem lasanha em vez de outras massas, o que podemos concluir sobre a afirmação? Use um nível de significância de 0,05. 32. Examinaram-se 2 classes de 14 e 15 alunos de um mesmo período de um curso. Na primeira, o grau médio foi de 7,4 com desvio padrão de 0,8. Na segunda, a média foi de 7,8, com desvio padrão de 0,7. Há uma diferença significativa entre os aproveitamentos das 2 classes ao nível de 5%? 33. Em um estudo para estimar a proporção de residentes em certa cidade e seus arredores que é a favor da construção de uma usina nuclear, descobriu-se que 63 de cem moradores da área urbana são a favor, enquanto somente 59 de 125 moradores dos arredores são a favor. Há uma diferença significante entre a proporção de moradores da área urbana e dos arredores que são a favor da construção da usina? (use α = 1%) 34. Deseja-se testar ao nível de 5% se duas populações têm as mesmas variâncias. Os dados obtidos nas amostras são: n1 = 10, s21 = 5, 22, n2 = 21 e s 2 2 = 16, 9. Qual a conclusão fornecida pelos dados? 35. A vida média das lâmpadas elétricas produzidas por uma empresa era de 1120 horas. Uma amostra de 8 lâmpadas extraída recentemente apresentou a vida média de 1070 horas, com desvio padrão de 125 horas. Testar a hipótese de que a vida média das lâmpadas não se alterou ao nível de 1%. 36. Uma amostra aleatória de cem registros de mortes nos Estados Unidos durante o ano pas- sado mostrou uma expectativa de vida é de 71,8 anos. Assumindo um desvio padrão de 8,9 anos, isso parece indicar que a média da expectativa de vida hoje é maior do que 70 anos? Use um nível de significância de 0,05. 11 Hipótese Nula e Hipótese Alternativa Região Crítica do teste Erros do Tipo I e erros do Tipo II Teste da hipótese de que a média populacional tem um valor específico Teste para Proporção Teste da hipótese para variância Teste da hipótese da igualdade de duas médias Teste da hipótese da diferença entre proporções Teste da razão de variâncias
Compartilhar