Baixe o app para aproveitar ainda mais
Prévia do material em texto
AULA 04 Teste de Hipóteses Sumário 1 - INTRODUÇÃO ............................................................................................................................................. 3 2 - FORMULANDO AS HIPÓTESES (NULA E ALTERNATIVA) .................................................................... 4 3 - ESTATÍSTICA DE TESTE E SEU VALOR CRÍTICO .................................................................................. 7 4 - MÉTODO DO VALOR-P PARA TESTAR AS HIPÓTESES ........................................................................ 9 5 – REALIZAÇÃO DO TESTE DE HIPÓTESES ............................................................................................ 11 5.1 - Teste de hipóteses para proporção populacional (p) .................................................................. 11 5.2 - Teste de hipótese para média populacional (µµµµ) ........................................................................... 13 5.3 - Teste de hipótese e intervalo de confiança para variância populacional .................................. 15 6 – EXEMPLOS RESOLVIDOS ...................................................................................................................... 17 7 - EXERCÍCIOS PROPOSTOS ..................................................................................................................... 20 Aula 4 – Teste de Hipóteses PUC Minas prof. José Aguinaldo − 3 − 1 - Introdução Muitos problemas exigem uma decisão entre rejeitar ou aceitar uma afirmação sobre algum parâmetro da população. Como exemplo, suponha que um fabricante de bateria para celular afirma que sua bateria dura, em média, mais de 300 minutos em conversação. Porém, esta afirmação é apenas do fabricante, pode ser que na prática isto não seja verdade. Como vamos testar esta afirmação do fabricante? Como podemos saber se ele está ou não afirmando corretamente? Neste exemplo, a afirmação do fabricante é chamada de hipótese e procedimento utilizado para testar a validade da hipótese é denominado de teste de hipótese. A hipótese estatística, portanto, é uma afirmação formulada à respeito de um parâmetro da população e o teste de hipóteses é um procedimento formal utilizado na estatística para testar a validade da hipótese formulada. O procedimento do teste de hipótese se apóia no uso de informação em uma amostra aleatória da população de interesse. Se essa informação for consistente com a hipótese, então podemos concluir que a hipótese é verdadeira1, no entanto, se essa informação não for consistente com a hipótese concluiremos que a hipótese é falsa. Só para clarear melhor o que foi dito, suponha que um órgão fiscalizador selecione uma amostra aleatória de 20 baterias, teste cada uma até descarregar e calcule a média amostral do tempo de conversação. Supondo que esta média foi 310 minutos ( 310=x ), responda: • É razoável admitir que o resultado observado seja consistente com a especificação do fabricante? • Podemos ou não acreditar que as baterias deste fabricante duram, em média, mais 300 minutos em conversação? E se a média amostral tivesse dado 400 minutos ( 400=x ), qual seria a sua resposta para as duas perguntas acima? EXEMPLO 1 – Suponha que um pesquisador esteja interessado em estudar o comportamento das famílias na frente da TV em um bairro. Basicamente, ele está interessado no tempo médio (µµµµ) que as famílias no bairro gastam vendo TV por dia e a proporção de famílias (p) no bairro que assistem ao programa XYZ. Para conduzir este estudo, uma amostra de 200 famílias foi selecionada aleatoriamente. Bairro Algumas hipóteses � O pesquisador acredita que as famílias do bairro assistem, em média, 5 horas de TV por dia. Ou seja, a hipótese dele é que µµµµ = 5 horas. A amostra está indicando uma média amostral superior a 5 horas por dia, mas isto é evidência suficiente contra a hipótese dos pesquisadores? Ou seja, há evidências para acreditar ou não que µµµµ = 5 horas? � O pesquisador acredita que a mais de ¾ das famílias no bairro assistem ao programa XYZ. Ou seja, a hipótese dele é que p > 75%. A amostra está indicando uma proporção amostral maior do que 75% ( pˆ = 77,5%), mas isto é evidência suficiente à favor da hipótese do pesquisador? Ou seja, há evidências para acreditar ou não que p > 75%? 1 Na realidade, não podemos concluir se a hipótese testada é verdadeira ou falsa de fato. Para que isto aconteça teríamos que usar TODOS os dados da população. É razoável imaginar que ao concluir que a hipótese seja verdadeira ou falsa, podemos estar errados em nossa conclusão. Mais a frente, iremos ver dois possíveis erros que podem ocorrer em um teste de hipótese. Amostra aleatória de n = 200 famílias • Média amostral: n x x i∑ = = 5,5 horas Das 200 famílias, 155 famílias disseram que assistem XYZ, o que corresponde a pˆ = 77,5%. • Proporção amostral: %)77,5ou ( 775,0 200 155 ˆ ==p p proporção de famílias no bairro que assistem ao programa XYZ µµµµ = Tempo médio que as famílias no bairro gastam vendo TV por dia Lembre-se: A média populacional (µ) e a proporção populacional (p) são chamadas de parâmetros: Aula 4 – Teste de Hipóteses PUC Minas prof. José Aguinaldo − 4 − 2 - Formulando as hipóteses (nula e alternativa) Hipótese nula e a Hipótese alternativa No exemplo 1, a hipótese de que as famílias gastam, em média 5 horas vendo TV é chamada de hipótese nula e é denotada pelo símbolo H0. A hipótese nula é sempre aquela que diz respeito a nenhuma diferença e é formulada em termos do sinal de igualdade (=), referindo-se a situação de nenhuma diferença. No exemplo das famílias, a hipótese nula seria assim expressa: H0: µ = 5 horas Se o resultado de uma amostra leva a rejeição da hipótese nula, alguma outra hipótese deverá ser aceita. No sentido de estar preparado para esta possibilidade, sempre que uma hipótese nula foi enunciada, uma hipótese alternativa deve também ser especificada. A hipótese alternativa é denotada pelo símbolo H1 e representa o oposto da hipótese nula, H0. Ela é sempre formulada em termos dos sinais de desigualdade (≠, > ou <). No exemplo das famílias, a hipótese alternativa seria assim expressa: H1: µ ≠ 5 horas Resumindo, as hipóteses a serem testadas no exemplo do tempo que as famílias vendo TV seriam: H0: µ = 5 horas ou H0: µ = 5 horas vs H1: µ ≠ 5 horas H1: µ ≠ 5 horas Hipótese nula (H0) Hipótese alternativa (H1 ou Ha) É a hipótese “aceita” até que os dados da amostra provem o contrário. Ela é formulada em termos do sinal de igualdade =. É a hipótese aceita quando os dados da amostra mostram evidências suficientes para rejeitar a hipótese H0. Ela é formulada em termos das desigualdades ≠, > ou <. Embora as informações usadas para testar as hipóteses sejam disponíveis a partir de uma amostra, as hipóteses nula e alternativas formuladas são expressas em termos dos parâmetros populacionais. Ou seja, as hipóteses abaixo estão escritas de forma ERRADA, pois x não é parâmetro e sim uma estatística amostral.. H0: x = 5 horas vs H1: x ≠ 5 horas ERRADO A hipótese nula H0 é tomada como referência, nós devemos acreditar nela até que se prova ao contrário. Ou seja, a hipótese alternativa H1, sé será “aceita” se os resultados da amostra forem suficientes para tal conclusão, caso contrário, nós devemos permanecer com ahipótese nula H0. EXEMPLO 2 – Formule as hipóteses nula e alternativa nos problemas abaixo: a) Um pesquisador está interessado na proporção das famílias de uma região que vivem abaixo da linha da pobreza. No último Censo realizado, essa proporção foi de 20%. • Se o interesse é testar se atualmente a proporção diminuiu em relação ao último Censo, então as hipóteses a serem testadas seriam: H0: p = 20% vs H1: p < 20% (teste unilateral esquerdo) • Se o interesse é testar se atualmente a proporção aumentou em relação ao último Censo, então as hipóteses a serem testadas seriam: H0: p = 20% vs H1: p > 20% (teste unilateral direito) • Se o interesse é testar se atualmente a proporção é igual à do último Censo, então as hipóteses a serem testadas seriam: H0: p = 20% vs H1: p ≠≠≠≠ 20% (teste bilateral) Aula 4 – Teste de Hipóteses PUC Minas prof. José Aguinaldo − 5 − b) Padrões técnicos exigem um nível máximo de 70 dB em CPDs (Central de Processamento de Dados). Um pesquisador deseja testar se o nível médio de ruídos nos CPDs do Brasil é menor que o especificado. Formule as hipóteses nula e alternativa a serem testadas. :H :H 1 0 c) Historicamente, a taxa de complicações cirúrgicas é de 15%. Um pesquisador afirma que desenvolveu um novo procedimento que reduz essa taxa. Formule as hipóteses nula e alternativa para testar a afirmação do pesquisador. d) O supervisor afirma que o desvio-padrão do tempo de montagem é igual a 3,5 minutos. Formule as hipóteses nula e alternativa para testar a afirmação do supervisor. e) Um instituto de pesquisa afirma que no mínimo 48% dos eleitores votarão no candidato ‘A’. Formule as hipóteses nula e alternativa para testar a afirmação do instituto. Tipos de erros em um teste de hipótese Há sempre um grau de incerteza na decisão tomada a respeito de uma hipótese estatística (rejeitar ou não a hipótese nula H0), pois estamos trabalhando com situações onde envolve variabilidades nos dados. DECISÃO DO TESTE SITUAÇÃO REAL (desconhecida por nós) (decisão tomada por nós) H0 verdadeira H0 falsa Rejeita H0 Erro Tipo I P(erro tipo I) = αααα Decisão correta Aceita H0 Decisão correta Erro Tipo II P(erro tipo II) = ββββ ERRO TIPO I → Rejeitar a hipótese nula quando ela é verdadeira de fato A probabilidade de se cometer o erro tipo I é denotada por α (alfa) também denominada de nível de significância do teste. α = P(erro tipo I) = P(rejeitar H0, quando H0 é verdadeira) ERRO TIPO II → Não rejeitar a hipótese nula quando ela é falsa de fato A probabilidade de se cometer o Erro tipo II é denotada por β (beta) β = P(erro tipo II) = P(não rejeitar H0, quando H0 é falsa) Aula 4 – Teste de Hipóteses PUC Minas prof. José Aguinaldo − 6 − EXEMPLO 3 – Um grupo de pesquisadores afirma que o novo motor projetado por eles tem um desempenho melhor em relação ao motor atual (que é de 12 km/l). Formule as hipóteses nula e alternativa para testar a afirmação do grupo de pesquisadores e descreva os dois tipos de erros que podem ocorrer no teste das hipóteses. H0: µ = 12 km/l (motor novo não é mais eficiente) H1: µ > 12 km/l (motor novo é mais eficiente) onde µ = consumo médio do novo motor Erro tipo I – Ocorre ao rejeitar H0: µ = 12 km/l, quando de fato ela é verdadeira. Ou seja, seria concluir que o “novo” motor é mais eficiente quando de fato ele não é. Erro tipo II – Ocorre ao rejeitar H0: µ = 12 km/l, quando de fato ela é falsa. Ou seja, seria concluir que o “novo” motor não é mais eficiente quando de fato ele é. Do ponto de vista dos consumidores, o erro tipo I é o mais grave. Colocar no mercado um motor que não é tão eficiente quanto o prometido é uma situação considerada muito grave. Qual situação ideal? Seria se não existisse nenhum dos dois erros (ou seja, α = 0 e β = 0), mas isso é impossível. Com tamanho da amostra (n) fixo, pode-se provar que diminuindo o erro α aumenta-se o erro β e vice-versa. Como controlar os valores de αααα e ββββ? O que é feito na prática é fixar o valor do erro α em valores bem pequeno tipo: αααα = 0,01 (1%), αααα = 0,05 (5%) ou αααα = 0,10 (10%). A escolha do nível de significância do teste (α) é arbitrária e vai depender da seriedade do erro tipo I imposta pelo problema analisado. Nas áreas médicas, o α deve ser muito pequeno (tipo α = 0,01 ou menor), enquanto que nas áreas sociais o α costuma ser da ordem de 5% a 10%. EXEMPLO 4 – Considere que o motor atual de um carro atinge um consumo médio de 12 km/litro. Um grupo de pesquisadores desenvolveu um novo motor projetado para melhorar o consumo em relação ao motor atual, mantendo o desvio-padrão do consumo em σ = 3,5 km/litro. Para avaliar a eficiência do novo motor, nove motores novos foram selecionados aleatoriamente, submetidos aos testes e média amostral ( x ) do consumo foi calculada. a) Formule adequadamente as hipóteses nula e alternativa para testar se os motores novos têm um desemenho melhor2 do que os motores atuais. b) Acreditando que um grande valor da média amostral ( x ) é evidência contra a hipótese nula (H0), os pesquisadores adotaram o seguinte critério de decisão: CRITÉRIO: Rejeitar H0: µ = 12 km/litro (em favor de H1) se x > 12,8 km/litro. Calcule a probabilidade de os pesquisadores estarem errados ao tomar a decisão de rejeitar a hipótese nula H0 com o critério acima, c) Admitindo um risco de, no máximo, 5% de estar errado ao rejeitar hipótese nula H0, qual critério de rejeição que os pesquisadores deveriam adotar? 2 Note que para “melhorar” o consumo devemos ter um uma quantidade de km/litro maior, significando que o motor anda mais a cada litro de gasolina (em outras palavras, é mais eficiente, consome menos). Exemplo, carro A faz 12 km/l e o carro B faz 9 km/l, portanto o carro A consome menos (é mais eficiente) Aula 4 – Teste de Hipóteses PUC Minas prof. José Aguinaldo − 7 − EXEMPLO 5 – Em um julgamento jurídico, o júri tem que decidir sobre a culpa ou inocência de um réu (ou ré). Considerando o fato de que o sistema jurídico admite que toda pessoa é inocente até que se prove o contrário, formule adequadamente as hipóteses a serem testadas e descreva os dois tipos de erro que podem ocorrer no teste. EXEMPLO 6 – Historicamente, a taxa de complicações cirúrgicas é de 15%. Um pesquisador afirma que desenvolveu um novo procedimento que reduz essa taxa. Formule as hipóteses nula e alternativa para testar a afirmação do pesquisador e descreva os dois tipos de erros que podem ocorrer no teste. EXEMPLO 7 – Em um artigo de publicidade afirmou em 2007 que mais de 60% das brasileiras tinjam o cabelo. Formule adequadamente as hipóteses nula e alternativa para testar a afirmação do artigo e descreva os dois tipos de erros que podem ocorrer no teste. 3 - Estatística de teste e seu valor crítico Estatística de teste Para se tomar a decisão de rejeitar ou não a hipótese nula, H0, é necessário que tenhamos uma amostra aleatória e um resultado desta amostra que nos ajuda a tomar a decisão. Este resultado será a nossa estatística de teste. Uma estatística de teste, portanto, é um valor calculado a partir dos dados amostrais usada para se determinar se há evidência significativa contra a hipótese nula H0. A estatística de teste que será usada vai depender dos parâmetros usados nas hipóteses testadas. • Teste de hipótese para proporçãopopulacional (p) H0: p = p0 vs H1: p ≠ p0 (≠, < ou >) Estatística de teste: pˆ (proporção amostral) ou seu escore z abaixo n qp pp z 00 0ˆ − = onde z tem distribuição normal padrão • Teste de hipótese para média populacional (µµµµ) H0: µ = µ0 vs H1: µ ≠ µ0 (≠, < ou >) Estatística de teste: x (média amostral) ou seu escore z ( ou t) abaixo Situação 1: σ conhecido n x z σ µ0− = onde z tem distribuição normal padrão Situação 2: σ desconhecido ns x t 0 µ− = onde t tem distribuição t-student • Teste de hipótese para variância populacional (σσσσ2) H0: σ2 = σ20 vs H1: σ2 ≠ σ20 (≠, < ou >) Estatística de teste: s2 (variância amostral) ou seu valor abaixo ( ) 2 0 21 σ χ sn −= onde χ tem distribuição qui-quadrado Aula 4 – Teste de Hipóteses PUC Minas prof. José Aguinaldo − 8 − As distribuições citadas acima só podem ser usadas se algumas condições forem satisfeitas: • No caso da proporção populacional (p), será usada a distribuição normal padrão para a estatística de teste, se as condições para aproximação normal forem válidas para distribuição Binomial: n⋅⋅⋅⋅p0 ≥ 5 e n⋅⋅⋅⋅q0 ≥ 5 • No caso da média populacional (µµµµ), será usada a distribuição normal padrão ou distribuição t de Student para a estatística de teste, se as condições sejam satisfeitas: população normal ou amostra grande (n ≥ 30) • No caso da variância populacional (σσσσ2), será usada a distribuição qui-quadrado para a estatística de teste, se as condições sejam satisfeitas: população aproximadamente normal. Valor crítico da estatística de teste Para saber se o resultado de sua estatística de teste é uma evidência contra a hipótese nula, devemos saber quais os valores da estatística de teste nos leva a rejeitar a hipótese nula. Estes valores formam a região de rejeição (ou região crítica). Os limites desta região são os valores críticos. Os valores críticos dependem das hipóteses formuladas, da distribuição de probabilidade usada e do nível de significância do teste (α). Em teste bilateral, a região de rejeição está nas duas caudas da curva (ver figura 1). Em um teste unilateral direito, a região de rejeição está na cauda direita (figura 2) e no teste unilateral esquerdo, a região está na cauda esquerda (figuras 3 e 4). FIGURA 1 - Usando a distribuição normal-padrão Se α = 0,05, os valores críticos são zα/2 = ± 1,96. Se α = 0,10, os valores críticos são zα/2 = ± 1,65. α/2 α/2 \\\ +zα/20 -zα/2 FIGURA 2 - Usando a distribuição normal-padrão Se α = 0,05, o valor crítico é zα = + 1,65. Se α = 0,10, o valor crítico é zα = + 1,28. α +zα/2 0 FIGURA 3 - Usando a distribuição normal-padrão Se α = 0,05, o valor crítico é zα = - 1,65. Se α = 0,10, o valor crítico é zα = - 1,28. α 0 -zα FIGURA 4 - Usando a distribuição t-student com n = 12 Se α = 0,05, o valor crítico é tα = - 1,796. Se α = 0,01, o valor crítico é tα = - 2,718. α 0 -tα Aula 4 – Teste de Hipóteses PUC Minas prof. José Aguinaldo − 9 − EXEMPLO 8 – Determine os valores críticos em cada situação abaixo: Situação 1: Usar distribuição normal-padrão, teste bilateral e α = 0,02; Situação 2: Usar distribuição normal-padrão, teste unilateral esquerdo e α = 0,20; Situação 3: Usar distribuição normal-padrão, teste unilateral direito e α = 0,08; Situação 4: Usar distribuição t-student, teste bilateral, n = 20 e α = 0,02; Situação 5: Usar distribuição t-student, teste unilateral esquerdo, n = 35 e α = 0,10; Situação 6: Usar distribuição t-student, teste unilateral direito, n = 10 e α = 0,20. 4 - Método do valor-p para testar as hipóteses O método tradicional ou clássico de teste de hipótese usa como critério de decisão a região de rejeição (ou região crítica). Porém, com o aumento do uso dos computadores, este método está sendo deixado de lado e uma maior ênfase está sendo dada ao método do valor-p. O valor-p pode ser definido como a probabilidade de se obter um resultado igual ou mais extremo do aquele observado, supondo que a hipótese nula, H0, é verdadeira. Pequenos valores do valor-p indicariam que o resultado observado é pouco provável de acontecer, sendo, portanto mais indicado rejeitar a H0 e ir a favor de H1. No exemplo dos motores (exemplo 3), se a média amostral for x = 12,7 km/l, o valor-p seria Valor-p = ( ) ( ) 0359,01,80ZP 95,3 12-14,1ZP14,1XP =≥= ≥=≥ Quando menor for o valor-p maior é a evidência contra a hipótese nula H0 e quando maior for o valor-p, menor é a evidência contra a hipótese nula H0. Critério usando o valor-p (Vp) Se valor-p ≤ α → Rejeita H0 Se valor-p > α → Não rejeita H0 (ou seja, “aceita” H0) Então, o valor-p = 0,0359 obtido acima, sendo menor que o α = 0,05, nos leva a rejeitar a hipótese nula H0 em favor da hipótese alternativa H1: µ > 12 km/l. O valor-p é o menor nível de significância a partir do qual a hipótese nula H0 pode ser rejeitada levando em conta a amostra estudada. Qual seria o valor-p supondo que no exemplo 4 a média amostral: a) fosse = 12,7 km/litro? b) fosse x =15,6 km/litro? EXEMPLO 09 – Considerando as informações abaixo, calcule o valor-p. Você rejeitaria ou não a hipótese nula H0? < = 10µ H 10µ H 1 0 n = 16, σ = 2 e média amostral x = 7 Indica que apenas 3,59% das amostras de nove motores terão média amostral igual ou superior a 14,1 km/l. Aula 4 – Teste de Hipóteses PUC Minas prof. José Aguinaldo − 10 − Vantagem de se usar o valor-p i). Permite verificar qual resultado mostra uma evidência mais forte contra a hipótese nula. Por exemplo, suponha que o valor-p do resultado 1x foi Vp1 = 0,085 e do resultado 2x foi Vp2 = 0,005, podemos então concluir que o resultado 2x mostra uma evidência muito mais forte contra a hipótese nula do que o outro resultado (pelo fato de Vp2 ser muito menor que o Vp1). ii). Como a escolha do nível de significância α é arbitraria, é comum calcular o valor-p e deixar a cargo do pesquisador a decisão de rejeitar ou não a hipótese nula H0. RESUMINDO: O que precisamos em um teste de hipótese? Pelo exposto acima vemos que no teste de hipótese devemos: •••• Formular a hipótese nula (H0) e alternativa (H1). •••• Decidir qual estatística de teste irá usar •••• Fixar o nível de significância (α) do teste. •••• Coletar dados de uma amostra e calcular uma estatística de teste apropriada ao problema •••• Usar um dos critérios de decisão abaixo . Usando a abordagem clássica (baseada na região de rejeição). Ou, . Usando o valor-p Se valor-p ≤ α então você deve rejeitar H0 Se valor-p > α então você não deve rejeitar H0 Teste de hipóteses Dados amostrais Hipóteses H0 e H1 Conclusão •••• Rejeita H0 ou •••• Não rejeita H0 Aula 4 – Teste de Hipóteses PUC Minas prof. José Aguinaldo − 11 − 5 – Realização do teste de hipóteses 5.1 - Teste de hipóteses para proporção populacional (p) Estatística de teste Hipótese nula e alternativa valor-p Região de rejeição n qp pp zo 00 0ˆ − = SUPOSIÇÃO: As condições n⋅⋅⋅⋅p0 ≥≥≥≥ 5 e n⋅⋅⋅⋅q0 ≥≥≥≥ 5 devem ser satisfeitas para o uso daaproximação normal H0: p = p0 H1: p < p0 Vp = P(Z ≤ zo) Rejeita H0 se zo ≤ -zα Teste unilateral esquerdo H0: p = p0 H1: p > p0 Vp = P(Z ≥ zo) Rejeita H0 se zo ≥ +zα Teste unilateral direito H0: p = p0 H1: p ≠ p0 Vp = 2⋅P(Z ≥ | zo |) Rejeita H0 se | zo | ≥ +zα/2 ou Rejeita H0 se zo ≤ -zα/2 ou zo ≥ +zα/2 Teste bilateral Os valores críticos acima são obtidos da distribuição normal padrão Teste unilateral esquerdo Teste unilateral direito Teste bilateral EXEMPLO 10 – Um pesquisador está interessado na proporção populacional (p) de famílias que vivem abaixo da linha da pobreza. Uma hipótese do pesquisador é que esta proporção aumentou em relação ao último censo (que era de 20%). Um estudo feito com uma amostra de 200 famílias escolhidas aleatoriamente verificou-se que 46 famílias vivem abaixo da linha da pobreza. a) Use os dados da amostra para testar a hipótese do pesquisador. Use um nível de significância de 5%. b) Você acredita na hipótese do pesquisador? c) Calcule também o valor-p e use-o também para testar as hipóteses. A conclusão foi a mesma? d) E se em vez de 46 famílias vivendo abaixo do nível de pobreza, tivéssemos 50 famílias, qual seria o valor-p do teste de hipótese? E se fosse 60 famílias? Destes dois valores observados (50 ou 60) mostra maior evidência contra a hipótese nula? Amostra aleatória de n elementos p = proporção populacional População de N elementos N população na interesse de ticacaracterís a com elementos de número =p A proporção populacional p é o nosso parâmetro de interesse e gostaríamos de estimá-lo com base em uma amostra de n elementos x1, x2, ..., xn n amostra na interesse de ticacaracterís a a com elementos de número pˆ = Não rejeitar H0 Rej. H0 -zα α 0 Rej. H0 Não rejeitar H0 +zα α 0 0 Não rejeitar H0 Rej. H0 Rej. H0 +zα/2 α/2 -zα/2 α/2 Aula 4 – Teste de Hipóteses PUC Minas prof. José Aguinaldo − 12 − EXEMPLO 11 - Um relatório de uma companhia afirma que 45% dos poços artesianos perfurados têm água salobra. Há muitas controvérsias sobre essa afirmação, alguns dizem que a porcentagem é maior e outros dizem que é menor. Para tirar as dúvidas, 400 poços foram sorteados e foi observada água salobra em 148 deles. a) Ao nível de significância de 3%, teste a afirmação da companhia. Você acredita na afirmação da companhia? b) Calcule também o valor-p e use-o para concluir o teste de hipótese. c) Construa um intervalo de 97% de confiança para a “verdadeira” proporção p de poços artesianos com água salobra. Use esse intervalo para testar as hipóteses formuladas em ‘a’. A conclusão foi a mesma? EXEMPLO 12 – Uma moeda foi lançada 80 vezes para cima e foram obtidas 56 caras. Teste se a moeda é viciada ao nível de 0,02 de significância. resp: a) H0: p = 50% vs H1: p ≠≠≠≠ 50% z0 = 3,58 Vp = 0,000344 EXEMPLO 13 – Em um teste de hipótese para a proporção populacional, pode-se usar como região crítica os valores da proporção amostral ( pˆ ). Para o teste unilateral esquerdo: Região de rejeição: Rejeita H0: p = p0 se cpˆ pˆ ≤ Para o teste unilateral direito: Região de rejeição: Rejeita H0: p = p0 se cpˆ pˆ ≥ Para o teste bilateral: Região de rejeição: Rejeita H0: p = p0 se c1pˆ pˆ ≤ ou c2pˆ pˆ ≥ Voltando ao exemplo 13, dê a região de rejeição em função da proporção amostral ( pˆ ). EXEMPLO 14 - Uma amostra de 300 peças do fabricante WEY resultou em 25 peças defeituosas. a) Teste se a proporção p de peças fabricadas com defeitos é igual a 10%. Use um nível de 0,05 de significância. b) Construa um intervalo de 95% para a proporção p de peças defeituosas do fabricante XYZ. EXEMPLO 15 - Uma pesquisa de opinião foi realizada com uma amostra aleatória de 300 pessoas em uma pequena cidade. A cada pessoa foi feita a seguinte pergunta: "Você está satisfeito com a administração do atual prefeito de sua cidade?". As respostas estão na tabela abaixo: Satisfeito? Nº de pessoas Uma manchete de um jornal afirmou que mais da metade das pessoas da cidade estão satisfeitas com a administração do prefeito. Teste, ao nível de 0,05 de significância a afirmação do jornal. Qual é a sua conclusão? Sim 162 Não 65 Indeciso 73 Total 300 Aula 4 – Teste de Hipóteses PUC Minas prof. José Aguinaldo − 13 − 5.2 - Teste de hipótese para média populacional (µµµµ) Usar os dados da amostra para testar se a média µµµµ de alguma característica na população pode ser igual a um valor µµµµ0 ou diferente (ou maior ou menor dependendo do objetivo do problema) 1ª SITUAÇÃO: Desvio-padrão σσσσ é conhecido Estatística de teste Hipótese nula e alternativa valor-p Região de rejeição n x zo σ µ0− = Suposição: População é Normal ou n > 30 (grandes amostras) H0: µ = µ0 H1: µ < µ0 Vp = P(Z ≤ zo) Rejeita H0 se zo ≤ -zα Teste unilateral esquerdo H0: µ = µ0 H1: p > µ0 Vp = P(Z ≥ zo) Rejeita H0 se zo ≥ +zα Teste unilateral direito H0: µ = µ0 H1: µ ≠ µ0 Vp = 2⋅P(Z ≥ | zo |) Rejeita H0 se | zo | ≥ +zα/2 ou Rejeita H0 se zo ≤ -zα/2 ou zo ≥ +zα/2 Teste bilateral Os valores críticos acima são obtidos da distribuição normal padrão 2ª SITUAÇÃO: Desvio-padrão σσσσ é desconhecido Estatística de teste Hipótese nula e alternativa valor-p Região de rejeição ns x to 0µ− = Suposição: População é Normal ou n > 30 (grandes amostras) H0: µ = µ0 H1: µ < µ0 Vp = P(T ≤ to) Rejeita H0 se to ≤ -tα Teste unilateral esquerdo H0: µ = µ0 H1: p > µ0 Vp = P(T ≥ to) Rejeita H0 se to ≥ +tα Teste unilateral direito H0: µ = µ0 H1: µ ≠ µ0 Vp = 2⋅P(T ≥ | to |) Rejeita H0 se | to | ≥ +tα/2 ou Rejeita H0 se to ≤ -tα/2 ou to ≥ +tα/2 Teste bilateral Obs: Os valores críticos são obtidos da distribuição t de Student com n – 1 graus de liberdade Teste unilateral esquerdo Teste unilateral direito Teste bilateral Amostra de n elementos x1, x2, ..., xn n x x i∑ = (média da amostra) 22 )1( )( −⋅ − = ∑∑ nn xxn s ii (desvio-padrão da amostra) µµµµ = média populacional σσσσ = desvio-padrão populacional População de N elementos Não rejeitar H0 Rej. H0 -zα α 0 Rej. H0 Não rejeitar H0 +zα α 0 0 Não rejeitar H0 Rej. H0 Rej. H0 +zα/2 α/2 -zα/2 α/2 Aula 4 – Teste de Hipóteses PUC Minas prof. José Aguinaldo − 14 − EXEMPLO 16 - Um fabricante de lâmpadas especifica que suas lâmpadas têm uma vida média de, no mínimo, 1600 horas. Uma associação de defesa do consumidor seleciona uma amostra de 100 lâmpadas para testar a afirmação do fabricante. Para cada lâmpada da amostra foi registrado o tempo de vida, obtendo uma média amostral 1570 horas. Baseado em dados históricos, asssuma que o desvio-padrão do tempo de vida das lâmpadas é σ = 120 horas. a) Ao nível de 5% de significância, teste a afirmação do fabricante. Você acredita na especificação feita pelo fabricante? b) Calcule também o valor-p e use-o para concluir o teste de hipótese. c) Construa um intervalo de 95% de confiança para o “verdadeiro” tempo médio de vida das lâmpadas. EXEMPLO 17 – Um pesquisador está interessado em estudar o comportamento das famílias na frente da TVem um bairro com um total de 6000 famílias. Basicamente, ele está interessado na média populacional (µµµµ) do tempo que as famílias gastam vendo TV por dia. Um estudo feito com uma amostra de 200 famílias escolhidas aleatoriamente resultou em uma média amostral de 5,5 horas. De estudos passados, o pesquisador sabe que o desvio-padrão populacional do tempo é σ = 1,5 hora. a) Use os dados da amostra para testar a hipótese de que o tempo médio µ gasto vendo TV é igual a 5 horas por dia. Use um nível de 5% de significância. b) Você acredita que as famílias da região assistem TV, em média, 5 horas por dia? EXEMPLO 18 - Considere um automóvel com um motor que atualmente atinge uma eficiência média de 12 km/litro. Um grupo de pesquisa desenvolveu um novo motor projetado para aumentar a eficiência em relação ao motor atual mantendo o desvio-padrão da eficiência em σ = 3,5 km/litro. Para avaliar o novo motor, 9 motores foram selecionados aleatoriamente e submetidos aos testes. A eficiência média dos motores amostrados foi de 14,1 km/litro. a) Com esses dados amostrais, há evidências de que o “novo” motor seja mais eficiente que o “atual” motor? Use um nível de 1% de significância. b) Você acredita que o novo motor é mais eficiente? c) Calcule também o valor-p e use-o para concluir o teste de hipótese. d) Construa um intervalo de 99% de confiança para a “verdadeira” eficiência média de combustível (µ) dos novos motores. EXEMPLO 19 - Um fabricante de lâmpadas especifica que suas lâmpadas têm uma vida média superior a 1600 horas. Para testar a sua afirmação, o fabricante selecionou uma amostra de 20 lâmpadas durante um dia de produção e verificou o tempo de vida de cada uma delas, obtendo uma média amostral de 1610 horas e um desvio-padrão amostral de 120 horas. Assuma que os tempos de vida das lâmpadas têm distribuição normal. a) Ao nível de 0,01 de significância, teste a afirmação do fabricante. Você acredita na especificação feita pelo fabricante? b) Calcule também o valor-p e use-o para concluir o teste de hipótese. EXEMPLO 20 – Uma companhia de cigarros anuncia que o índice médio de nicotina dos seus cigarros é menor que 25 mg por cigarro. Um laboratório realiza seis análises desse índice, obtendo-se os seguintes valores (em mg) de nicotina. 27 24 21 25 26 22 Pode-se aceitar, no nível de 5%, a afirmação do fabricante? Assuma que o índice de nicotina segue a distribuição normal;. EXEMPLO 21 – Os dados abaixo se referem ao tempo de uso (em minutos) do laboratório de informática durante um fim de semana para uma amostra aleatória de 12 alunos. 37 36 31 25 29 32 24 30 21 42 30 41 Há evidência de que o tempo médio de uso do laboratório seja superior a 25 minutos (valor obtido no último ano)? Use um teste de hipótese com 0,01 de significância. Resp: x = 31,50 min s = 6,54 min H0: µ = 25 min vs H1: µ > 25 min t0 = 3,44 Vp = 0,003 Critério: Rejeita H0: µ = 25 min (em favor de H1) se t0 ≥ 2,718 Conclusão: Rejeita H0 pois ... Aula 4 – Teste de Hipóteses PUC Minas prof. José Aguinaldo − 15 − 5.3 - Teste de hipótese e intervalo de confiança para variância populacional Objetivo: Usar os dados da amostra para: • Estimar o desvio-padrão populacional σσσσ usando o intervalo de confiança, ou • Testar se o desvio-padrão populacional σσσσ pode ser igual a um valor σσσσ0 ou diferente (ou maior ou menor dependendo do objetivo do problema). Estimação da variância σσσσ2 ou do desvio-padrão populacional σσσσ Suposição: A população de onde a amostra foi retirada tem distribuição normal Estimativa pontual da variância populacional σσσσ2 σσσσ 2 ≈≈≈≈ s2 (a variância populacional σσσσ2 é aproximadamente igual a variância amostral s2)3 Intervalo de 100(1- αααα)% de confiança para: A variância populacional σσσσ2 O desvio-padrão populacional σσσσ ED snsn χ σ χ 2 2 2 )1()1( ⋅− ≤≤ ⋅− ED snsn χ σ χ 22 )1()1( ⋅− ≤≤ ⋅− Teste de hipótese para variância σσσσ2 ou do desvio-padrão populacional σσσσ Estatística de teste Hipótese nula e alternativa valor-p Critério de rejeição de H0 )1( 2 0 2 0 σ χ sn ⋅−= Suposição: A população de onde a amostra foi retirada tem distribuição normal H0: σσσσ = σσσσ0 H1: σσσσ < σσσσ0 Vp = P(χχχχ ≤ χχχχ0) Rejeita H0 se χχχχ0 ≤ χχχχE Teste unilateral esquerdo H0: σσσσ = σσσσ0 H1: σσσσ > σσσσ0 Vp = P(χχχχ ≥≥≥≥ χχχχ0) Rejeita H0 se χχχχ0 ≥ χχχχD Teste unilateral direito H0: σσσσ = σσσσ0 H1: σσσσ ≠≠≠≠ σσσσ0 Vp = 2⋅⋅⋅⋅P(⋅⋅⋅⋅) Rejeita H0 se χχχχ0 ≤ χχχχE ou χχχχ0 ≥ χχχχD Teste bilateral Obs: No teste bilateral, se χo está na cauda esquerda, então P(⋅) = P(χ ≤ χ0), caso contrário P(⋅) = P(χ ≥ χ0) teste unilateral esquerdo teste unilateral direito teste bilateral Os valores Eχ e Dχ são obtidos da distribuição Qui-quadrado com n-1 graus de liberdade. 3 Pode-se demonstrar que s2 é uma estimativa não-viciada de σ2, por outro lado, o s (desvio-padrão amostral) é uma estimativa viciada para o σσσσ (desvio-padrão populacional). Mas, como este viés é pequeno para grandes amostras, é comum usar o s como estimativa pontual de σσσσ. Não rejeitar H0 Rej. H0 0 χχχχE αααα Rej. H0 Não rejeitar H0 0 χχχχD αααα Não Rej. H0 Rej. H0 Rej. H0 0 χχχχE χχχχD αααα/2 αααα/2 Amostra de n elementos x1, x2, ..., xn 22 )1( )( −⋅ − = ∑∑ nn xxn s ii (desvio-padrão da amostra) σσσσ = desvio-padrão populacional População de N elementos Aula 4 – Teste de Hipóteses PUC Minas prof. José Aguinaldo − 16 − Distribuição Qui-quadrado Características da distribuição Qui-quadrado EXEMPLO 22 – Determine os valores de Eχ e Dχ da distribuição Qui-quadrado nos dois casos abaixo: a) n = 20 e nível de confiança de 95% em um intervalo de confiança Distribuição Qui-quadrado gl n −−−− 1 ... 0,975 ... 0,025 ... ... ... ... ... ... ... 19 ... 8,907 ... 2,145 ... ... ... ... ... ... ... b) n = 10 e nível de significância de α = 5% em um teste de hipótese unilateral direito. Resposta: χD = 16,919 EXEMPLO 23 – Em uma rede de transmissão de energia elétrica, é de se esperar que ocorram pequenas flutuações na tensão (voltagem) da rede. O desvio-padrão das voltagens apresentadas nas residências atualmente está em torno de 12 volts, porém os usuários estão reclamando dessa alta variação da tensão da rede. Para tentar resolver o problema, a empresa instalou novos transformadores com o objetivo de reduzir o valor do desvio-padrão da tensão e obter, com isto, uma voltagem mais estável. Após a instalação dos novos transformadores, foram obtidas 30 medições da tensão obtendo um desvio-padrão amostral de 8 volts. Pela experiência, podemos assumir que a tensão segue a distribuição normal. a) Há evidências de que o desvio-padrão populacional σ reduziu após a instalação dos novos transformadores? Use um nível de significância de 0,05. b) Construa um intervalo de 95% de confiança para o desvio-padrão populacional σ, após a instalação dos novos transformadores. Livros indicados para leitura • TRIOLA, Mario F. Introdução à estatística. Editora: LTC - Livros Técnicos e Científicos.• Levine; M., David; Stephan; F., David; Krehbiel; C., Timothy; Berenson; L., Mark. Estatística - Teoria e Aplicações Usando o Microsoft Excel em Português. Editora: LTC - Livros Técnicos e Científicos. • ANDERSON, David Ray; SWEENEY, Dennis J.; WILLIAMS, Thomas Arthur. Estatística aplicada à administração e economia. Editora: Thomson Learning, 6050403020100 0,16 0,12 0,08 0,04 0,00 f( x ) • Só assume valores positivos • É uma distribuição assimétrica à direita, mas a medida que o tamanho da amostra vai aumentando, ela vai se tornando mais simétrica • É uma distribuição diferente para cada grau de liberdade (gl = n − 1), tal como vimos na distribuição t-Student. gl = 5 gl = 15 gl = 30 Respostas: χE = 8,907 e χD = 32,852 Aula 4 – Teste de Hipóteses PUC Minas prof. José Aguinaldo − 17 − 6 – Exemplos resolvidos EXEMPLO 24 – Resolução do EXEMPLO 4. Solução ------------------------------------------------------------------------------------------------------------------------------------ a) H0: µ = 12 km/l (motor novo não é melhor que o atual) H1: µ > 12 km/l (motor novo é melhor que o atual) b) A distribuição de probabilidade4 de X é σµ n ;Normal~X → Supondo H0 verdadeiro, temos 9 5,3 ;12Normal~X A distribuição de probabilidade acima é distribuição de referência do teste, ela nos diz quais resultados são mais prováveis e quais são as mais improváveis. Com essa distribuição podemos calcular a probabilidade de rejeitar a hipótese nula H0 com o critério adotado pelos pesquisadores ( )8,12XP > = − > 95,3 128,12ZP = ( )69,0ZP > = 0,245 A probabilidade acima nos revela que, mesmo H0: µ = 12 sendo verdadeira, iremos rejeitá-la 24,5% das vezes. Em outras palavras, 24,5% das vezes estaremos errados em rejeitar a H0: µ = 12 (usando uma linguagem menos técnica, 24,5% das vezes, estaremos errados ao concluir que os novos motores são mais eficientes do que os atuais). c) Se o percentual de erro obtido na letra “a” for considerado alto, podemos obter um critério que nos proporcione uma taxa de erro aceitável. Se 5% for um risco tolerável, o critério de rejeição adotado será: Pela tabela normal padrão, o valor zc da curva normal ao lado seria igual a zc = 1,64, Então 64,1 95,3 12k = − → … → 93,13 9 5,364,112k = += Novo critério de rejeição (com o erro tolerado de 5%) Rejeitar a hipótese H0 se x > 13,93 km/litro 4 Estamos admitindo que a eficiência do motor segue a distribuição normal. No caso de uma amostra grande (n ≥ 30), então o teorema central do limite (TCL) garante que ( )n ;Normal~X σµ independente se a população segue ou não a distribuição normal. 12 12,8 x 0 0,69 z sob H0: µ = 12 15 k = ? x 0 zc= ? z sob H0: µ = 12 0,05 Aula 4 – Teste de Hipóteses PUC Minas prof. José Aguinaldo − 18 − EXEMPLO 25 - Calcule o valor-p (Vp) para os resultados do EXEMPLO 3 ( x = 12,7 km/litro e x =15,6 km/litro). Qual dos dois resultados mostra uma evidência mais forte contra a hipótese nula Ho? Solução ------------------------------------------------------------------------------------------------------------------------------------ • x = 12,7 km/litro � ( )7,12>XP = − > 95,3 127,12ZP = ( )60,0>ZP = 0,2742 A chance de errar ao rejeitar a hipótese nula é de 27,4% • x = 15,6 km/litro � ( )6,15XP > = − > 95,3 126,15ZP = ( )09,3ZP > = 0,0010 A chance de errar ao rejeitar a hipótese nula é de 0,1% EXEMPLO 26 - Um fabricante de lâmpadas especifica que suas lâmpadas têm uma vida média de no mínimo 1600 horas. Para testar a sua afirmação, o fabricante selecionou uma amostra de 100 lâmpadas durante um dia de produção e verificou o tempo de vida de cada uma delas, obtendo uma média amostral de 1570 horas e um desvio-padrão amostral 120 horas. Assuma que os tempos de vida das lâmpadas têm distribuição normal. a) Ao nível de 5% de significância, teste a afirmação do fabricante. b) Calcule também o valor-p e use-o para concluir o teste de hipótese. c) Valores de x que levam a rejeição da hipótese nula H0. Solução ------------------------------------------------------------------------------------------------------------------------------- a) Ao nível de 5% de significância, teste a afirmação do fabricante. Teste de hipótese para média populacional (µ) com σ conhecido O que queremos: Testar a afirmação do fabricante (µ ≥ 1600 horas) O que temos: n = 100 lâmpadas; x =1570 horas; s = 120 horas; α = 0,05 • Hipóteses a serem testadas ou <µ ≥µ horas : horas : 1600 1600 1H Ho • Valor observado da Estatística de teste x =1570 horas → 5,2 100120 16001570 0 −= − = − = ns x z o µ (então zo = -2,50) • Especificar a região critica (ou região de rejeição) Região crítica (região de rejeição ou critério de rejeição): Rejeitar H0 se zo ≤ -1,65 • Conclusão do teste Como zo (-2,50) é menor que -1,65, então há evidências amostrais para rejeitar a Ho em favor de H1. Pelos resultados apresentados, não acredito que o fabricante esteja especificando corretamente o tempo médio de vida de suas lâmpadas. -zαααα 0 z Não rejeita Ho Rejeita Ho αααα = 0,05 Olhando a tabela normal padronizada e considerando α = 0,05 (5%) temos que zα = -1,65 z 0,05 ... ↑ -1,6 ← 0,05 ... Hipótese nula: Tempo médio de vida é no mínimo 1600 hs Hipótese alternativa: Tempo médio de vida é menor que 1600 hs Aula 4 – Teste de Hipóteses PUC Minas prof. José Aguinaldo − 19 − b) Calcule também o valor-p e use-o para concluir o teste de hipótese. Valor-P= (0,62%) 00621,0)5,2()( =−≤=≤ ZPzZP o (obtido usando a tabela normal padronizada) Conclusão: Como o valor-p (0,62%) foi menor que α (5%) podemos rejeitar Ho em favor de H1. A probabilidade de estarmos errados ao rejeitar Ho é considerada muito pequena (apenas 0,62%). c) Valores de x que levam a rejeição da hipótese nula H0. Em (a) vimos que o critério de rejeição foi: Rejeitar Ho: µ ≥ 1600 se zo ≤ -1,65 Para responder a questão acima, basta achar os valores de x de forma que z ≤ -1,65 65,1 ns x z o −≤ µ− = → 65,1 100120 1600x −≤− → 2,158010012065,11600x =⋅−≤ horas Região de rejeição em função das médias amostrais x →→→→ Rejeita Ho: µ ≥ 1600 se 2,1580x ≤ horas Aula 4 – Teste de Hipóteses PUC Minas prof. José Aguinaldo − 20 − 7 - Exercícios propostos 1) Defina os termos abaixo: a) Hipótese estatística b) Teste de hipótese c) Região crítica d) Erro tipo I e) Erro tipo II f) α e β g) Nível de significância h) Valor-p 2) Se você tem os dados de toda a população de seu interesse, há necessidade de se realizar o teste de hipótese para testar afirmação sobre algum parâmetro da população? 3) Leia as duas afirmações abaixo e diga se concorda ou não. Justifique. a) Se uma hipótese nula é rejeitada com nível de significância de α = 5%, também será rejeitada com o nível de significância de α = 1%. b) Se uma hipótese nula é rejeitada comnível de significância de α = 1%, também será rejeitada com o nível de significância de α = 5%. 4) Um aluno sugeriu que no teste de hipótese pode-se eliminar o erro tipo I fazendo αααα = 0. Considerando um teste bilateral, quais os valores críticos (-zαααα/2 e zαααα/2)? Se αααα = 0, quando a hipótese nula será rejeitada? [Teste de hipótese para proporção populacional p] 5) (Anderson, pag 349) Uma revista reivindicou que 25% de seus leitores são estudantes universitários. Uma amostra aleatória de 200 eleitores mostrou que 35 eram universitários. Use um nível de significância de 0,10 para testar Ho: p = 0,25 vs H1: p ≠≠≠≠ 0,25 . 6) O gerente de controle de qualidade da Telektronic Company considera a fabricação de secretárias eletrônicas como “fora de controle” quando a taxa geral de defeitos excede 4%. O teste de uma amostra de 150 secretárias eletrônicas acusou 9 defeituosas, o que corresponde a uma porcentagem de 6% de defeitos. O gerente de produção alega tratar-se de uma diferença casual, e que a produção realmente está sob controle, não sendo necessária qualquer medida corretiva. Teste a afirmação do gerente de produção, ao nível de 0,05 de significância. Há necessidade de medidas corretivas? 7) (Levine, pag 334) Uma pesquisa conduzida pela agência de empregos Watson Wyatt Worldwide revelou que 223 dentre as 295 empresas pesquisadas utilizam suas redes internas de computadores (intranet) como o principal veículo para disponibilizar os serviços de recursos humanos para seus empregados. O artigo também informa que durante o ano de 1998 se acreditava que 50% das empresas disponibilizavam tais serviços através de suas intranets. (Fonte: “Work Week”, The Wall Street Journal, 07 de março de 2000 p. A1) a) Ao nível de 0,05 de significância, existem evidências de que a proporção noticiada se modificou em relação ao seu valor anterior de 50%? b) Calcule seu valor-p e interprete o seu significado. 8) (Levine, pag 334) Existem evidências de que menos da metade dos trabalhadores empregados nos Estados Unidos possuem acesso à Internet no local de trabalho? Em uma pesquisa conduzida com 1000 trabalhadores pela Employeesavings.com, em agosto de 2000, 440 deles indicaram que acesso à Internet no local de trabalho. (Fonte: Tejada, C., “Work Week”, The Wall Street Journal, 29 de agosto de 2000 p. A1) a) Ao nível de 0,05 de significância, existem evidências de que, em agosto de 2000, menos da metade dos trabalhadores empregados nos Estados Unidos possuíam acesso à Internet no local de trabalho? b) Calcule seu valor-p e interprete o seu significado. Aula 4 – Teste de Hipóteses PUC Minas prof. José Aguinaldo − 21 − 9) (Levine, pag 334) Existe um crescimento no número de empresas cujas diretorias estejam estabelecendo padrões de ética, através do desenvolvimento de um código de ética para a empresa? Em 1991, acreditava-se que 41% possuíam seus próprios padrões de ética. Em uma pesquisa conduzida pela Conference Board, em 1999, 97 dentre 124 empresas indicaram que possuíam seus próprios códigos de ética. (Fonte: “Business Bulletin”, The Wall Street Journal, 19 de agosto de 1999 p. A1). Ao nível de 1% de significância teste, usando apenas o valor-p, a hipótese de que: a) A proporção de empresas se modificou em relação ao valor anterior de 41%, ou seja, Ho: p = 41% vs H1: p ≠ 41%. b) A proporção de empresas é maior que o valor anterior de 41%. c) A proporção de empresas se é menor que o valor anterior de 41%. 10) (Anderson, pag 349) Um estudo realizado pelo Consumer Reports mostrou que 64% dos clientes de supermercados acreditam que as marcas do supermercado são tão boas quanto as marcas locais em termos de qualidade de produto. Para investigar se este resultado se aplica ao seu próprio produto, o fabricante de um ketchup de marca local perguntou a 100 clientes de supermercados se eles acreditavam que a marca do supermercado era tão boa quanto a marca do seu ketchup. Se 52 dos clientes amostrados indicaram que a marca do supermercado era tão boa quanto a marca local, teste se menos de 64% dos clientes enxergam a marca do supermercado tão boa quanto a marca do ketchup usando um nível de 5% de significância. 11) (Levine, pag 334) De acordo com um artigo, cresceu o apoio para os sindicatos de trabalhadores. Em 1995, a Labor Research Association divulgou que 49% dos eleitores norte- americanos acreditavam que os sindicatos de trabalhadores tinham um efeito positivo nos Estados Unidos. Em uma pesquisa de opinião realizada em 1999, com 993 potenciais eleitores norte-americanos, 557 demonstraram acreditar que os sindicatos de trabalhadores tinham um efeito positivo nos Estados Unidos. Existem evidências de que cresceu o apoio para os sindicatos de trabalhadores de 1995 a 1999? (Fonte: Burkins, G., “Work Week”, The Wall Street Journal, 20 de abril de 1999, p. A1) (Obs: Apresente as hipóteses, o valor-p (apenas) e a conclusão) 12) Vamos testar se uma moeda é honesta (probabilidade de sair cara é p = 0,50). a) Selecione uma moeda e lance-a n vezes para cima de forma que ela dê várias voltas. Vamos usar n = 100 lançamentos. Calcule pˆ = proporção de vezes que saiu cara. b) Teste se p = 50%. Ou seja, teste Ho: p = 50% vs H1: p ≠ 50%. Use α = 5%. Podemos considerar a moeda honesta? (Obs: Apresente as hipóteses, o valor-p (apenas) e a conclusão) c) Construa agora um intervalo de 95% de confiança para p (“verdadeira” probabilidade de sair cara). Usando o intervalo de confiança construído, teste as hipóteses Ho: p = 50% vs Ha: p ≠ 50%. Podemos considerar a moeda honesta? 13) O funcionário José da empresa FOX selecionou uma amostra de 50 encomendas (n = 50) e anotou o tempo (em minutos) que foi gasto para embalar cada uma delas e despachá-la. Os dados estão na tabela abaixo: Tempo de preparo de encomendas Tempo de preparo Quantidade de encomendas (fi) 5 |-- 10 14 10 |-- 15 20 15 |-- 20 11 20 |-- 25 5 Total n = 50 a) Calcule a proporção de encomendas amostradas ( pˆ ) que gastaram menos de 15 minutos para ser preparadas. resp: 68% b) Supondo que a empresa FOX afirma que 75% das encomendas são ser embaladas e despachadas em menos de 15 minutos. Teste a afirmação da empresa ao nível de 1% de significância. Você acredita na afirmação da empresa? Aula 4 – Teste de Hipóteses PUC Minas prof. José Aguinaldo − 22 − [Teste de hipóteses para média populacional µµµµ com σσσσ conhecido] 14) Os alunos do 3º ano do ensino médio de uma escola têm uma idade média de µµµµ anos com desvio-padrão de σσσσ = 2 anos. Com um amostra de n = 36 alunos foi obtido uma média amostral de x = 17,8 anos. Teste as hipóteses Ho: µµµµ ≤≤≤≤ 17 anos vs Ha: µµµµ > 17 anos ao nível de 5% de significância. (Obs: Mostrar: as hipóteses, região de rejeição e conclusão) 15) (Anderson, pag 339) Uma linha de produção opera com um peso médio de enchimento de 16 ml por recipiente. Valores acima ou abaixo dessa média são problemas sérios e a linha de produção deve ser paralisada se qualquer um dos dois ocorrer. De dados passados sabe-se que o desvio-padrão do peso de enchimento é de σσσσ = 0,8 ml. Um inspetor de controle de qualidade inspeciona uma amostra n = 30 itens a cada duas horas e nesse momento toma a decisão de paralisar ou não a linha de produção para calibragem. O desejo é usar o teste de hipótese para testar se peso médio é igual a 16 ml a) Formule as hipóteses a serem testadas e descreva erro tipo I e o erro tipo II que podem ocorrer no teste de hipóteses; b) Se média da amostra coletada foi de x = 16,32 ml, teste as hipóteses ao nível de 5% de significância. (Obs: Mostre as hipóteses, região derejeição e conclusão) c) Qual a região de rejeição em função de x (médias amostrais). Usando essa região de rejeição diga qual atitude que o inspetor deveria tomar (paralisar ou não a linha de produção) para as seguintes médias amostras: 15,5 ml, 16,4 e 15,8 ml. 16) (Levine, pag 330) Uma característica de interesse em um processo de enchimento de saquinhos de chá, é o peso do chá em cada saquinho. O rótulo do chá de certa empresa indica uma média 5,5 gramas de chá por saquinho. Se os saquinhos estiverem preenchidos abaixo do peso, surgem dois problemas. Primeiro, os clientes podem não conseguir preparar o chá tão forte quanto desejam. Segundo, a empresa pode estar violando as leis de peso e medidas. Por outro lado, se a quantidade média de chá em cada saquinho, exceder a descrição no rótulo, a empresa está desperdiçando o produto. Conseguir uma medida exata de chá em cada saquinho é problemático, em razão da variação da temperatura e da umidade dentro da fábrica, de diferenças nas densidades do chá e da operação extremamente rápida da máquina (aproximadamente 170 saquinhos por minuto). A empresa deseja verificar se o peso médio de chá por saquinho é diferente de 5,5 gramas, para isto durante um turno de trabalho foi coletada uma amostra aleatória de 50 saquinhos de chá obtendo uma média de x = 5,6 gramas. Por experiências passadas podemos assumir que o desvio-padrão dos pesos é conhecido e igual a σσσσ = 0,11 grama. (Obs: Mostrar: as hipóteses, região de rejeição e conclusão). a) Teste a hipótese de que o peso médio de chá nos saquinhos é diferente de 5,5 gramas ao nível de 5% de significância. b) Há motivos de preocupação para a empresa? 17) (Anderson, pag 339) Uma linha de montagem de automóveis opera a um tempo médio de conclusão de 2,2 minutos. Devido ao efeito do tempo de conclusão tanto na operação de montagem precedente como na subseqüente, é importante manter o tempo médio de conclusão em 2,2 minutos. Uma amostra aleatória de 45 montagens mostra um tempo médio amostral de x = 3,39 minutos para a conclusão das montagens. Assuma que o desvio-padrão do tempo de montagem seja σσσσ = 0,20 minutos. a) Construa um intervalo de 98% de confiança para o “verdadeiro” tempo médio de conclusão das montagens. b) Usando o intervalo de confiança construído em ‘a’ e um nível de significância de 0,02, teste se a operação está cumprindo seu tempo médio de conclusão de 2,2 minutos. Aula 4 – Teste de Hipóteses PUC Minas prof. José Aguinaldo − 23 − 18) (Levine, pag 324) A política de uma agência bancária determina que os caixas eletrônicos devam ser abastecidos com dinheiro suficiente para satisfazer as retiradas dos clientes ao longo de todo o final de semana. O prestígio junto aos clientes depende de como os serviços satisfazem as necessidades destes clientes. Em uma agência, o gerente espera-se que µ = média de retirada dos caixas eletrônicos, por transação dos clientes nos finais de semana seja US$160,00. Suponha que uma amostra aleatória de 36 transações de clientes seja examinada e seja observada uma média amostral de US$ 172,00. Ao nível de 5% de significância, existem evidências de que a média µ seja maior que US$ 160,00. Admita que o gerente saiba (por experiências passadas) que o desvio-padrão das transações seja σσσσ =US$ 30,00. (Obs: Apresente as hipóteses, o valor-p (apenas) e a conclusão) 19) Um novo programa de dieta afirma que os participantes perderão em média pelo menos k quilos durante a primeira semana do programa. Uma amostra aleatória de 40 pessoas participando no programa mostrou uma perda de peso médio de x = 7 quilos. Vamos assumir que o desvio-padrão dos pesos é σσσσ = 3,3 quilos. Um teste foi realizado para testar as hipóteses Ho: µµµµ ≥≥≥≥ k vs H1: µµµµ < k. a) Se o valor-P do teste foi igual a 0,02401 qual o valor de k (ou seja, o peso mínimo que os participantes perderão de acordo com a afirmação do programa de dieta). b) Usando o valor-P e o k encontrado em ‘a’, podemos acreditar no programa de dieta? [Teste de hipótese para média populacional µµµµ com σσσσ desconhecido] 20) Os alunos do 3º ano do ensino médio de uma escola têm uma idade média de µµµµ anos. Com um amostra de n = 20 alunos foi obtido uma média amostral de x = 17,8 anos e desvio- padrão amostral de s = 2 anos. Teste as hipóteses Ho: µµµµ ≤≤≤≤ 17 anos vs H1: µµµµ > 17 anos ao nível de 5% de significância. Assuma que a idade tem distribuição aproximadamente normal. (Obs: Mostrar: as hipóteses, região de rejeição e conclusão) 21) (Anderson, pag 339) Historicamente, as chamadas telefônicas noturnas de longa distância de uma determinada cidade têm duração média de 15,2 minutos por chamada. Em uma amostra aleatória de 35 chamadas, o tempo médio de chamada foi de x = 14,3 minutos por chamada, com um desvio-padrão de s = 5 minutos. Ao nível de 2% de significância teste, usando apenas o valor-p, a hipótese de que: a) A duração média foi inferior a 15,2 minutos, ou seja, Ho: µ ≥ 15,2 vs H1: µ < 15,2. b) A duração média foi superior a 15,2 minutos. c) A duração média foi diferente de 15,2 minutos. 22) (Anderson, pag 332) Uma empresa paga atualmente a seus operários um salário médio de US$ 15,00 a hora. A empresa está planejando construir uma nova fábrica e está considerando diversos locais. A disponibilidade de mão-de-obra a uma taxa menor US$ 15,00 por hora é um grande fator na decisão do local. Para uma locação, uma amostra de 40 trabalhadores mostrou um salário horário médio atual de x = US$ 14,00 e um desvio-padrão da amostra de s = US$ 2,40. Com um nível de significância de 1%, os dados da amostra indicam que o local tem uma taxa de salário médio significativamente menor que a taxa de US$ 15,00 por hora? (Obs: Mostrar: as hipóteses, região de rejeição e conclusão) 23) O tempo médio entre falhas de um rádio da Telektronic Company para aviões de pequeno porte é de 420 horas. Após terem sido modificados 35 aparelhos de rádio, em uma tentativa de melhorar sua confiabilidade, os testes acusaram um tempo médio amostral entre falhas de x = 385 h, com um desvio-padrão de s = 24 h. Ao nível de 5%, teste a afirmação de que as modificações melhoraram a confiabilidade. (Note que a confiabilidade melhorada deveria resultar em um tempo médio entre falhas mais longo). (Obs: Mostrar: as hipóteses, região de rejeição e conclusão) Aula 4 – Teste de Hipóteses PUC Minas prof. José Aguinaldo − 24 − 24) A despesa com a transferência do pátio de armazenagem para Consolidated Package Delivery Service (CPDS) só se justifica se ficar provado que o percurso médio diário é inferior a 340 km. Em uma amostra de teste com 12 caminhões de entrega, obtiveram-se a média de 320 km e o desvio-padrão de 65 km. Suponha que o percurso tenha distribuição aproximadamente normal. a) Formule as hipóteses para testar se o percurso médio é inferior a 340 km. i) Se você toma a decisão de rejeitar a hipótese nula, qual tipo de erro que você poderia estar cometendo? ii) Se você toma a decisão de não rejeitar a hipótese nula, qual tipo de erro que você poderia estar cometendo? b) Teste as hipótese formuladas em ‘a’, ao nível de 0,01 de significância. (Obs: Apresente as hipóteses, região de rejeição e a conclusão). c) O pátio de armazenagem deve ser transferido? 25) O Bank of New England está preocupado com o acúmulo de débito de clientes que utilizam cartões de crédito. A diretoria decidiu instituir um sistema dispendioso de monitoramento se a média para todos os clientes do banco for superior a US$ 2000,00. O banco selecionou aleatoriamente 50 portadores de cartões de crédito e determinou o valor de seus débitos. Para essa amostra, a média foi de US$2177,00 e o desvio-padrão US$ 1257. a) Ao nível de 2,5% de significância, teste a afirmação de que o débito médio é superior a US$ 2000,00. (Obs: Apresente as hipóteses, região de rejeição e a conclusão) b) Com base no resultado, deve-se implantar o sistema de monitoramento? 26) Um pesquisador deseja testar se o tempo médio em anos de permanência dos engenheiros recém-formados no primeiro emprego (µµµµ) é igual a 2 anos. Para uma amostra de 15 engenheiros o tempo médio amostral foi x = 2,7 anos e o desvio-padrão amostral foi s = 1,4 anos. Assuma que o tempo de permanência tem distribuição aproximadamente normal. a) Construa e interprete o intervalo de 99% de confiança para µ. b) Usando o intervalo construído em ‘a’, teste as hipóteses Ho: µ = 2 anos vs Ha: µ ≠ 2 anos usando um nível de 1% de significância. 27) A empresa GOL, um dos fabricantes de bolas, selecionou uma amostra de 9 bolas e pesou cada uma delas obtendo os pesos 450, 456, 444, 445, 454, 453, 455, 458, 454 gramas. Uma das preocupações da empresa é estar fabricando bolas com peso médio acima de 450 gramas. Assuma que o peso das bolas tem distribuição aproximadamente normal. a) Teste se o peso médio das bolas fabricadas pela GOL é maior que 450 gramas ao nível de 2,5% de significância? (Obs: Apresente as hipóteses, região de rejeição e a conclusão). b) Você acredita que as bolas fabricadas pela GOL pesam, em média, mais que 450 gramas? 28) (Anderson, pag 344) A família média americana gasta US$ 90 por dia (American Demographics, agosto 1997). Considere uma amostra de 25 famílias em Corning, Nova York, mostrou um gasto médio diário da amostra de US$ 84,50 com um desvio-padrão da amostra de US$ 14,50. Assuma que o gasto diário tem distribuição aproximadamente normal. a) Teste as hipóteses Ho: µ = 90 versus H1: µ ≠ 90 para ver se a média da população em Corning, Nova York, difere da média dos Estados Unidos. Use um nível de significância de 0,05. Qual é a sua conclusão? (Obs: Apresente as hipóteses, região de rejeição e a conclusão) b) O que você poderia dizer sobre o valor-p? Aula 4 – Teste de Hipóteses PUC Minas prof. José Aguinaldo − 25 − 29) (Triola, 9a edição pag 266) Abaixo temos a largura máxima de amostras de crânios de homens egípcios de 4000 a.C e 150 d.C (com base em dados de Ancient Races of the Thebaid de Thomson e Randall-Maciver). 4000 a.C 131 119 138 125 129 126 131 132 126 128 128 131 1n = 1x = 1s = 150 a.C 136 130 126 126 139 141 137 138 133 131 134 129 2n = 2x = 2s = Mudanças nos tamanhos das cabeças ao longo do tempo sugerem o cruzamento com pessoas de outras regiões. Teste se houve mudanças nos tamanhos das cabeças ao longo do tempo ao nível de 0,05 de significância. Ou seja, teste as hipóteses abaixo: H0: µµµµ1 - µµµµ1 = 0 versus H1: µµµµ1 - µµµµ1 ≠≠≠≠ 0 Onde µµµµ1 = “largura média homens egípcios de 4000 a.C” µµµµ2 = “largura média homens egípcios de 150 a.C” Estatística de teste ( ) ( ) 2 2 2 1 2 1 2121 n s n s xx t + µ−µ−− = usar distribuição t-Student com graus de liberdade g.l = mínimo(n1-1; n2-1) [Usando a saída do Minitab] 30) Um estudo foi desenvolvido para avaliar o salário de empregadas domésticas na cidade de São Paulo. Foram sorteadas e entrevistadas 200 trabalhadoras e registrado o salário de cada uma delas. Abaixo está a saída do Minitab, use-o para responder: a) Qual a média e o desvio-padrão dos salários das 200 trabalhadoras amostradas? b) Quais as hipóteses formuladas (Ho e H1)? c) Teste se a média salarial é menor que 3 salários mínimos (SM) ao nível de 2% de significância. O quer você usou para o teste? d) Você acredita que o salário médio das empregadas seja menor que três salários mínimos? Test of mu = 3 vs mu < 3 98% Upper N Mean StDev SE Mean Bound T P 200 2,87500 1,00340 0,07095 3,02168 -1,76 0,040 31) A empresa GOL, um dos fabricantes de bolas, selecionou uma amostra de 9 bolas e pesou cada uma. Os dados obtidos foram usados no Minitab para testar se o peso médio está acima de 450 gramas. Observe a saída do Minitab abaixo e responda: a) Qual a média e o desvio-padrão da amostra de bola? b) Quais as hipóteses formuladas (Ho e H1)? c) Teste se o peso médio das bolas fabricadas pela GOL é maior que 450 gramas ao nível de 3% de significância. O que você usou para o teste? d) Você acredita que as bolas fabricadas pela GOL pesam, em média, mais que 450 gramas? Test of mu = 450 vs mu > 450 95% Lower Variable N Mean StDev SE Mean Bound T P peso 9 452,111 4,833 1,611 449,115 1,31 0,113 Aula 4 – Teste de Hipóteses PUC Minas prof. José Aguinaldo − 26 − 32) Um estudo foi desenvolvido para avaliar se as empregadas domésticas na cidade de São Paulo ganham vale transportes. Foram sorteadas e entrevistadas 200 trabalhadoras e 7 (sete) delas ganhavam vale-transportes. Teste se menos de 6% das empregadas domésticas ganham vale-transportes ao nível de 3% de significância. Abaixo está a saída usando o Minitab. a) Quais as hipóteses formuladas? b) Qual o proporção amostral das empregadas que recebem vale transportes? c) Você acredita que menos de 6% das empregadas domésticas em São Paulo estejam ganhando vale transportes? Test of p = 0,06 vs p < 0,06 98,0% Upper Variable X N Sample p Bound Z-Value P-Value ValeTranspor 7 200 0,035000 0,061689 -1,49 0,068 33) Uma empresa que fabrica pisos cerâmicos suspeita que suas duas principais fábricas produzem diferentes porcentagens de pisos "classe A". Para verificar esta suspeita foram selecionadas amostras de 300 pisos da produção de uma semana de cada uma das fábricas e calculado a porcentagem de pisos "classe A". Teste a suspeita da empresa (p1 - p2 ≠≠≠≠ 0) ao nível de 5% de significância. As hipóteses são: Ho: p1 - p2 = 0 H1: p1 - p2 ≠ 0 onde p1 e p2 = proporção de pisos “classe A” fabricados pela fábrica 1 e fábrica 2 respectivamente. a) Use a saída do Minitab para conclusão do problema. b) Apresente também o intervalo de 95% de confiança para a “verdadeira” diferença p1 - p2 e interprete-o c) Você acredita que há diferenças na produção de pisos "classe A" nas duas fábricas? Sample X N Sample p 1 213 300 0,710000 2 189 300 0,630000 Difference = p (1) - p (2) Estimate for difference: 0,08 95% CI for difference: (0,00502444; 0,154976) Test for difference = 0 (vs not = 0): Z = 2,08 P-Value = 0,037 Aula 4 – Teste de Hipóteses PUC Minas prof. José Aguinaldo − 27 − 34) O Sr. João é dono de uma loja de artigos para animais e gostaria de estudar as características dos clientes de sua loja. Em particular, ele decidiu coletar algumas informações de uma amostra de 36 clientes que entraram em sua loja durante uma semana. As informações coletadas foram: 1. Sexo: ___Masculino ___Feminino 2. Quantia gasta com artigos para o animal? _______ dólares 3. Animais ? Na família tem: 1. Somente um cachorro 2. Somente um gato 3. Mais de um cachorro e/ou gato 4. Não quis responder Os dados obtidos estão logo abaixo. O Sr. João é seu grande amigo e, quando soube que você havia feito a disciplina de Estatística etinha sido aprovado(a) com louvor, pediu a sua ajuda para resolver alguns “problemas” estatísticos. (OBS: Sugiro vocês digitarem os dados abaixo no Minitab e usá-lo para responder as questões a seguir) FONTE: Dados hipotéticos a) Calcule para o Sr. João a média ( x ) e o desvio-padrão (s) dos gastos com artigos para animais. b) Construa para o Sr. João a tabela de freqüência para a variável “Animais”. Tabela – Na família tem: Animais Quantidade de clientes % Somente um cachorro Somente um gato Mais de um cachorro e/ou gato Não quis responder Total c) O Sr. João deseja estimar o gasto médio de seus clientes com artigos para animais. Construa e interprete um intervalo de 95% de confiança para µµµµ = gasto médio dos clientes da loja com artigos para animais. Na construção do intervalo, houve necessidades de assumir a distribuição normal para os gastos? Justifique sua resposta. d) O Sr. João deseja estimar a proporção de clientes que tem somente um cachorro. Construa e interprete um intervalo de 95% de confiança para p = proporção de clientes com somente um cachorro em casa. Obs: Não se esqueça de verificar se as condições são satisfeitas, antes de sair construindo o intervalo de confiança. e) O Sr. João acredita que o gasto médio de seus clientes seja superior a R$ 20,00 reais. Faça o teste de hipótese apropriado usando um nível de significância de 0,05. O que você diria para o seu amigo? f) O Sr. João acredita que metade dos seus clientes tem somente um cachorro em casa. Faça o teste de hipótese apropriado usando um nível de significância de 0,10. Qual a sua conclusão? g) O Sr. João acredita que a maioria dos seus clientes é do sexo feminino. Faça o teste de hipótese apropriado usando um nível de significância de 0,05. Qual a sua conclusão? h) O Sr. João acredita que a o desvio-padrão dos gastos seja de 15 reais. Use o teste de hipótese para testar a hipótese do Sr. João usando um nível de significância a de α = 0,05.
Compartilhar