Baixe o app para aproveitar ainda mais
Prévia do material em texto
ES T A T ÍS T IC A AP L IC A D A Conceitos de Testes de Hipóteses Teste de hipótese para a média Teste de hipótese para a média usando valores de p Exercícios Ideia do teste de hipóteses • Em um julgamento, até que se prove o contrário, a hipótese é de que o réu é inocente (Ho). • Ao final, o júri o proclama inocente ou culpado de acordo com as evidências apresentadas pelas partes (defesa e acusação). Os possíveis erros associados ao julgamento são: • Tipo I: Condenar um inocente • Tipo II: Libertar um culpado Pela natureza da repercussão do erro, devemos nos preocupar com o erro de culpar um inocente. Teste de hipóteses • Para que serve? Tomada de decisão • Exemplo: O controle de qualidade de uma linha de produção precisa verificar se o processo está sob controle analisando se houve aumento no diâmetro das peças produzidas, que deve ser de 12,0 cm, em média. Para isso, mediu o diâmetro de 25 peças e obteve um diâmetro médio de 12,5 cm. Sabendo-se pelas especificações do fabricante que o diâmetro das peças apresenta variabilidade de 1,0 cm e que o diâmetro das peças possui distribuição aproximadamente normal, qual seria a conclusão do controle de qualidade? Como saber se o valor de 12,5 cm (média da amostra) representa uma flutuação aleatória ou se esse aumento no diâmetro médio é real (significativo)? Princípio do Teste de hipóteses • “Ao ser feita determinada afirmação sobre uma população, mais especificamente sobre um parâmetro dessa população, é natural desejar saber se os resultados experimentais provenientes de uma amostra contrariam, ou não, tal afirmação.” População (parâmetros) Amostra (estimadores) • Um teste de hipótese é um processo que usa estatísticas amostrais para testar uma afirmação sobre o valor de um parâmetro populacional. Teste de hipóteses • Exemplo: As máquinas que enchem as latas de uma marca de bebida são configuradas para preencher todas as latas com volume médio de 350 ml, mas o processo apresenta variabilidade de 7 ml. O diretor da fábrica desconfia que está ocorrendo desperdício de líquido. Para averiguação, foi coletada uma amostra de 36 latas durante o processo de enchimento e mediu-se o conteúdo X (em ml) delas, obtendo-se um valor médio igual a 351,5 ml. Verifique se a suspeita do diretor se confirma, usando o nível de 95% de confiança. Teste de hipóteses • 1º passo: Como formular as hipóteses? a) As hipóteses sempre se referem aos parâmetros (, , 2, p) da população em estudo; b) A hipótese inicial (H0) sempre envolve uma igualdade (=, ≥ ou ≤); c) A hipótese alternativa (H1) sempre complementa a inicial (≠, < ou >); d) Para efeito de cálculo, a formulação feita inicialmente (H0) é a hipótese aceita como verdadeira até prova em contrário, sendo o ponto de partida para a análise. H0: 350 (não há desperdício) H1: > 350 (há desperdício) Teste de hipóteses • 2º passo: Escolher e calcular a estatística do teste para 𝜇 𝑡 = ത𝑋−𝜇 𝑠 𝑛 𝑧 = ത𝑋−𝜇 𝜎 𝑛 CASO 2: variância 𝜎2 DESconhecida Se não tivermos a variância populacional 𝜎2, então temos que usar a variância 𝑠2 da amostra (ou o desvio padrão s): Distribuição t – Student com (n-1) graus de liberdade CASO 1: variância 𝜎2 conhecida Se a população X de interesse possui média 𝜇 e variância 𝜎2, já vimos que: Distribuição normal ത𝑋~𝑁 𝜇, 𝜎2 𝑛 Teste de hipóteses • 3º passo: Obter o valor crítico, de acordo com o nível de significância do teste; • 4º passo: Verificar se o valor observado na amostra está dentro ou fora da região crítica e concluir: • Caso a estatística observada na amostra esteja dentro da zona de rejeição, a hipótese nula é rejeitada (assim, a variação observada na amostra é significativa). • Caso o ponto observado na amostra esteja fora da zona de rejeição, a hipótese nula não é rejeitada (assim, a variação observada na amostra é fruto do acaso). Teste de hipóteses • Até aqui, temos: H0: 350 (não há desperdício) H1: > 350 (há desperdício) H0: = 350 H1: > 350 Formulação equivalente, mais simples () Informações da amostra: X = conteúdo de líquido (mL) n = 36 e തx =351,5 mL Informações da população: σ = 7 mL (d.p. do processo), além das hipóteses Nível de confiança (1-α) = 95% Então α = 5% (significância) Com 95% de confiança, o resultado da amostra está dentro ou fora da região de rejeição? Região de não rejeição de Ho Região de rejeição de Ho 0 = 350 X % críticox _ _ (1 - α) % confiança H0 H1 Teste de hipóteses • Então… H0: = 350 H1: > 350 () Conclusão: Não rejeitamos H0, isto é, NÃO existem evidências estatísticas de que há desperdício de líquido ao nível de significância de 5% (equivalente a 95% de confiança). Assim sendo, o “desperdício” observado na amostra representa uma flutuação aleatória. zobs = 1,286xobs = 351,5 ??? _ 36 7 3505,351 − = − = obsz n X Z CASO 1 X_ críticox Região de rejeição de Ho 0 = 350 5% _ 95% H0 0 Z 5% Rejeição de Ho Zcritico = 1,645 95% H0 Teste de hipóteses • Tipos de testes e suas regiões críticas /2/2 Região crítica: Rejeita-se H0 para valores “pequenos” ou “grandes” Região crítica: Rejeita-se H0 para valores “grandes” Região crítica: Rejeita-se H0 para valores “pequenos” H0: < o H1: > o Teste unilateral à direita Teste unilateral à esquerda H0: > o H1: < o Teste bilateral H0: = o H1: ≠ o H0 H0 H0 H1 H1 H1H1 Teste de hipóteses • Outra abordagem para concluir o teste: valor p (ou p-value): probabilidade de significância É a probabilidade de errar ao rejeitar H0 com a amostra observada ou É o menor nível de significância com o qual se rejeitaria H0 5 % 0 zcrit:1,645 zobs = 1,286 H0 Zobs=1,286 0 9,92% 5 % 0 zcrit:1,645 H0 • se valor p < α, rejeitamos H0 • se valor p > α, NÃO rejeitamos H0 Um valor p pequeno significa que a probabilidade de obter um valor da estatística de teste como o observado é muito improvável. Teste de hipóteses • Erros tipo I e tipo II: • Se 𝛼 for o nível de significância escolhido para o teste, então a probabilidade de um erro tipo I nunca é maior do que 𝛼. • Erro tipo I: rejeitar a hipótese H0 quando a mesma for verdadeira. • Erro tipo II: falhar na rejeição à hipótese H0 quando a mesma for falsa. Exercícios 1) Uma linha de produção opera com um peso médio de enchimento de 16 ml por recipiente. O sobreenchimento e o subenchimento são problemas sérios e a linha de produção pode ser paralisada se qualquer um dos dois ocorrer. De dados passados, sabe-se que o desvio padrão é 0,8 ml. Um inspetor de controle de qualidade amostra 30 itens a cada 2 horas e nesses momento toma a decisão de paralisar a linha de produção para calibragem o não. Se a média amostral obtida for 15,82 ml, que atitude você recomendaria para um 𝛼 = 0,05? zobs = -1,23; zcrítico = -1,96; Conclusão: não rejeitamos H0 (ou seja, µ =16). Exercícios 2) Em corridas de carros, o pit stop é aonde um veículo vai para trocar pneus, abastecer, efetuar reparos e outros ajustes mecânicos. A eficiência de uma equipe que realiza esses ajustes pode afetar o resultado de uma corrida. Uma equipe afirma que seu tempo médio no pit stop (para 4 trocas de pneus e abastecimento) é menor que 13 segundos. Uma amostra aleatória de 32 tempos de pit stop tem uma média amostral de 12,9 segundos. Suponha que o desvio padrão populacional é de 0,19 segundos. Há evidência suficiente para concordar com a afirmação para 𝛼 = 0,01? Use um valor p. zobs = -2,98; valor p = 0,0014; Conclusão: rejeitamos H0 (ou seja, µ <13). Exercícios 3) Em uma linha de produção de um tipo de fitas metálicas, a largura média é de 50,0 mm. Para verificar se uma modificação no processo de fabricação dessas fitas produz alguma alteração na média, obteve-se, a partir de 10 medidas da largura após a modificação no processo, uma largura média de 50,7 mm e um coeficiente de variação de 2,2%. Podemos concluirque, com a modificação, a largura média das fitas não se alterou, ao nível de 5% de significância? tobs = 1,984; tcrítico1 = -2,262 e tcrítico2 = 2,262; Conclusão: não rejeitamos H0 (ou seja, µ = 50) Exercícios 4) De acordo com um estudo, o custo médio de uma cirurgia bariátrica (perda de peso) é de U$ 21.500. Você acha que essa informação está incorreta. Você seleciona aleatoriamente 25 pacientes que realizaram a cirurgia e descobre que o custo médio de suas cirurgias é de U$ 20.695. De estudos anteriores, o desvio padrão populacional é conhecido, U$ 2.250, e a população é normalmente distribuída. Há evidências suficientes para concordar com sua afirmação para 𝛼 = 0,05? Use um valor p. zobs = -1,79; valor p = 0,0734; Conclusão: não rejeitamos H0 (ou seja, µ =U$21.500). Exercícios 5) Um fabricante de conservas anuncia que o conteúdo líquido das latas de seu produto é, em média, de 2000 gramas, com desvio padrão de 40 gramas. A fiscalização de pesos e medidas investigou uma amostra aleatória de 64 latas, verificando média de 1990 gramas. Fixando o nível de significância de 0,05, deverá o fabricante ser multado por efetuar venda abaixo do especificado? 6) Um projeto de investimento está sendo avaliado pelo método pay-back. Uma situação envolvendo cenários futuros ou os seguintes tempos de retorno do investimento (em anos): 2,8 – 4,3 – 3,7 – 6,4 – 3,2 – 4,1 – 4,4 – 4,6 – 5,2 – 3,9. Teste ao nível de significância de 5%, a hipótese de que o tempo médio de retorno seja superior a 4 anos. zobs = -2,0; zcrítico = -1,64; Conclusão: rejeitamos H0 (ou seja, µ < 2000). tobs = 0,81; tcrítico = 1,833; Conclusão: não rejeitamos H0 (ou seja, µ ≤ 4). Exercícios 7) Um fabricante de lâmpadas fluorescentes garante que a vida útil média de certo modelo que ele produz é de pelo menos 10000 horas. Para testar essa garantia você registra a vida útil, em horas de uma amostra aleatória de 32 lâmpadas desse modelo obtendo uma média de 9500 horas. O desvio padrão da vida útil do produto, pelas especificações de seus componentes, vale 1000 horas. Quais devem ser as hipóteses a serem testadas? Qual a conclusão do teste ao nível de 1% de significância? Conclua pela abordagem do valor p. zobs = -2,83; valor p = 0,0023; Conclusão: rejeitamos H0 (ou seja, µ<10000). Exercícios 8) Em um anúncio, uma rede de pizzaria afirma que a média de seu tempo de entrega é menor que 30 minutos. Uma seleção aleatória de 36 tempos de entrega tem média de 28,5 minutos. Pelo histórico da empresa que faz o delivery o desvio padrão é de 3,5 minutos. Há evidência suficiente para apoiar a afirmação usando o nível de significância de 5%? Use a abordagem do valor p para concluir o teste. 9) Uma indústria afirma que o nível do pH da água em um rio próximo é de 6,8. Você seleciona aleatoriamente 39 amostras de água e mede o pH de cada uma. A média amostral e o desvio padrão são de 6,7 e 0,35, respectivamente. Há evidência suficiente para rejeitar a afirmação da indústria considerando nível de significância 𝛼 = 0,05? zobs = -2,57; valor p = 0,0051; Conclusão: rejeitamos H0 (ou seja, µ<30). tobs = -1,78; tcrítico1 = -2,024 e tcrítico2 = 2,024; Conclusão: não rejeitamos H0 (ou seja, µ=6,8). Exercícios 10) Um de seus distribuidores reporta uma média de 150 vendas por dia para a direção. Você suspeita que essa média não seja correta e então realiza uma auditoria selecionando aleatoriamente informações de 41 dias, analisando o número de vendas de cada dia daquele distribuidor. Dessa análise foi obtida uma média de 143 vendas com desvio padrão de 15 vendas. Ao nível de 5% de significância há evidência para duvidar da média reportada pelo distribuidor? tobs = -2,99; tcrítico1 = -2,021 e tcrítico2 = 2,021; Conclusão: rejeitamos H0 (ou seja, µ≠150).
Compartilhar