Baixe o app para aproveitar ainda mais
Prévia do material em texto
Universidade Federal do Rio Grande do Norte Centro de Tecnologia - CT Departamento de Engenharia de Produção ESTATÍSTICA PARA ENGENHARIA DE PRODUÇÃO Prof. Luciano Queiroz Natal/RN 20/03/14 Sumário Inferência estatística Teste de hipótese Como calcular as probabilidades de se cometer os erros 𝜶 𝒆 𝜷 ? Como estabelecer uma regra de decisão que leve à rejeição da hipótese nula? Os conceitos e cálculos serão ilustrados com um exemplo dos conteúdos de duas sacolas com aparências idênticas. Calculando 𝜶 𝒆 𝜷 Há duas sacolas idênticas, sacola A e sacola B. Cada uma tem vinte cupons, e os valores dos cupons diferem bastante de acordo com a sacola. Os valores e as respectivas frequências são mostrados na Tabela 1.2 e na Figura 1.4. Exemplo da Sacola Exemplo da Sacola Suponha que você concordou em participar de um jogo no qual você recebe a quantia total da sacola, isto é, ganha R$1.890 se for a sacola B ou paga R$560 se for a sacola A. É claro que ninguém quer a sacola A. Apenas uma sacola será mostrada a você, e com base em uma amostra do conteúdo da sacola, você terá que decidir se quer ficar com essa sacola ou se você prefere a outra sacola. Sem olhar o conteúdo da sacola, uma amostra de tamanho um (n = 1) será retirada. A seleção do cupom será feita após misturar bem o conteúdo da sacola, para garantir igual probabilidade para todos os vinte cupons. Exemplo da Sacola Com base no procedimento acima, você deverá tomar uma decisão baseada nas seguintes hipóteses: H0: A sacola da qual você retirou o cupom é a sacola A. H1: A sacola da qual você retirou o cupom é a sacola B. Observação: Escolhe-se a sacola A para a hipótese nula porque é a sacola indesejada. Exemplo da Sacola Quais são os dois tipos de erros que se pode cometer ao se decidir por uma dessas duas hipóteses? Erro do tipo I = rejeitar H0 quando H0 é verdadeira = você decide que a sacola mostrada é a sacola B, quando na verdade é a sacola A. Erro do tipo II = não rejeitar H0 quando H1 é verdadeira = você decide que a sacola mostrada é a sacola A, quando na verdade é a sacola B. Exemplo da Sacola Como se pode montar um procedimento de decisão, com base em apenas uma observação, que auxiliará na escolha de H0 ou em sua rejeição? Considere, primeiro, as situações óbvias e que não levam a cometer erro algum. Se o cupom selecionado for de -R$1.000, então a sacola mostrada é a sacola A, pois é a única que contém tal valor. Portanto, não se rejeita H0. Da mesma forma, se o cupom selecionado for de R$1.000, a sacola mostrada é a sacola B, e rejeita-se H0. Exemplo da Sacola Para pensar! Suponha que o valor do cupom selecionado fosse de R$60? Essa observação o levaria a crer que a sacola mostrada é a A ou a B? Por que? Como você responderia essas perguntas se o valor do cupom fosse de R$10? Na discussão anterior, uma regra de decisão está sendo formada. Em estatística uma regra de decisão tem um significado próprio. Exemplo da Sacola Definição 1.9: Uma regra de decisão é uma regra formal que, baseando- se nos dados observados, indica quando rejeitar a hipótese nula. Normalmente a regra de decisão especifica um conjunto de valores que são incompatíveis com H0. Definição Observe no exemplo das sacolas como se poderia estabelecer uma regra de decisão para auxiliar na escolha das hipóteses em questão. A escolha será feita com base em quão provável é um evento de ser observado. Em outras palavras, precisa-se estabelecer quais são as probabilidades de sair cada valor dos cupons, de forma que a seleção seja feita de forma completamente aleatória sem privilegiar nenhum cupom. As probabilidades por sacolas são mostradas na Tabela a seguir. Regra de decisão Regra de decisão Chama-se a atenção para algumas características das distribuições de probabilidades para as sacolas na Tabela 1.3. Os cupons com valores de R$30 e R$40 têm a mesma probabilidade de seleção, independentemente da sacola. Já os cupons de R$10, R$20, R$50 e R$60 dão alguma evidência das suas procedências. Por exemplo, se o cupom de R$10 ou R$20 forem selecionados, as probabilidades de serem da sacola A são muito maiores. Portanto, dever-se-ia concluir que a sacola mostrada é a A. Regra de decisão Usando o mesmo raciocínio, se os cupons selecionados forem os de R$50 ou R$60 dever-se-ia concluir que a sacola mostrada é a B, uma vez que as probabilidades de seleção desses valores na sacola B são bem maiores que na sacola A. No cenário acima, os valores mais altos dos cupons sugerem que a sacola mostrada é a sacola B, pois a seleção desses valores na sacola B é bem mais provável que na sacola A. Em estatística os valores que levam à rejeição de H0 são chamados extremos. Regra de decisão Definição 1.10: Direção extrema é a direção dos valores que estabelece a menor plausibilidade para sustentar a hipótese nula. Definição Rejeitar H0 se os valores observados forem ≥ R$60. Para toda regra de decisão há um valor crítico que, a partir do qual, se estabelece uma correspondente região de rejeição, ver Figura 1.5. Regra de Decisão 1 Regra de decisão 1 No exemplo das sacolas, considerando a regra de decisão 1, a região de rejeição compreenderia os cupons com valores iguais a R$60 e a R$1.000, e o correspondente valor crítico seria de R$60. Como já foi discutido, é possível que um erro seja cometido ao se utilizar uma regra de decisão. Calcula-se a seguir as probabilidades de se cometer os erros do tipo I e II quando a regra de decisão 1 é escolhida. H0: A sacola da qual você retirou o cupom é a sacola A. H1: A sacola da qual você retirou o cupom é a sacola B. Regra de Decisão 1 Como o erro do tipo I pode ocorrer apenas quando H0 é verdadeira, observam-se os valores na Figura 1.6 (a). 𝛼 = a probabilidade de rejeitar H0 quando H0 é verdadeira = a probabilidade de selecionar um cupom de R$60 ou de R$1.000 da sacola A = 0,05. Regra de Decisão 1 Como o erro do tipo II pode ocorrer apenas quando H1 é verdadeira, observam-se os valores na Figura 1.6 (b). 𝛽 = a probabilidade de não rejeitar H0 quando H1 é verdadeira = a probabilidade de selecionar um cupom de -R$1.000 ou de R$10 ou de R$20 ou de R$30 ou de R$40 ou de R$50 da sacola B = 0,60. Regra de Decisão 1 O nível de significância 𝛼 = 0,05 é um valor pequeno, em contraste, 𝛽 = 0,60 é um valor bastante grande. Você está satisfeito(a) com esses níveis 𝜶 𝒆 𝜷? Você não gostaria que ambos fossem ainda menores? Há várias regras de decisão, e é claro que a e b dependerão da regra utilizada. Existe uma relação entre 𝜶 𝒆 𝜷. Mostra-se a seguir mais duas regras para melhor compreensão de como 𝜶 𝒆 𝜷 estão relacionados. Como se pode observar na regra de decisão 1, 𝛽 tinha um valor bastante expressivo devido à pequena área de rejeição. A seguir aumentar-se-á a área de rejeição para se ter uma postura menos estrita. Regra de Decisão 1 Rejeitar H0 se os valores observados forem ≥ R$50. 𝛼 = a probabilidade de rejeitar H0 quando H0 é verdadeira = a probabilidade de selecionar um cupom de R$50 ou de R$60 ou de R$1.000 da sacola A = 0,10. Regra de Decisão 2 Rejeitar H0 se os valores observados forem ≥ R$50. 𝛽 = a probabilidade de não rejeitar H0 quando H1 é verdadeira = a probabilidade de selecionar um cupom de R$-1.000 ou de R$10 ou de R$20 ou de R$30 ou de R$40 da sacola B = 0,30. Regra de Decisão 2 Rejeitar H0 se os valores observados forem ≥ R$50. Assim, aumentando a região de rejeição, a probabilidade de se cometer o erro do tipo I, a, aumentoue a probabilidade do erro do tipo II, b, diminuiu. Regra de Decisão 2 Rejeitar H0 se os valores observados forem ≥ R$40. ∝ = a probabilidade de rejeitar H0 quando H0 é verdadeira = a probabilidade de selecionar um cupom de R$40 ou de R$50 ou de R$60 ou de R$1.000 da sacola A= 0,20. Regra de Decisão 3 Rejeitar H0 se os valores observados forem ≥ R$40. 𝛽 = a probabilidade de não rejeitar H0 quando H1 é verdadeira = a probabilidade de selecionar um cupom de R$-1.000 ou de R$10 ou de R$20 ou de R$30 da sacola B = 0,20. Regra de Decisão 3 Rejeitar H0 se os valores observados forem ≥ R$40. Pela segunda vez, um novo aumento da região de rejeição levou a um aumento da probabilidade do erro do tipo I e uma consequente diminuição da probabilidade do erro do tipo II. Regra de Decisão 3 Resumo Para um valor fixo de 𝛼, o melhor teste será aquele que tem o menor valor de 𝛽. Equivalentemente, para um valor fixo de 𝛼, o melhor teste será aquele que possui o maior poder. O poder do teste também depende do nível de significância 𝛼 do teste. Para um tamanho de amostra fixo, quanto maior o valor de 𝛼, o valor de 𝛽 tende a diminuir e, assim, o poder do teste tende a aumentar. Em geral, os pesquisadores preferem um teste que tenha poder mais elevado dentre os testes com o mesmo 𝛼. Existe, portanto, uma relação entre 𝛼 e 1- 𝛽. Observação Dessa forma, deve ficar claro que as probabilidades dos erros se movimentam em sentidos contrários. Portanto, não é possível diminuir ao mesmo tempo as probabilidades de se cometer os dois tipos de erro. Em suma, terá que haver um comprometimento. Relação 𝜶 e 𝜷 Vimos que se pode rejeitar ou não uma hipótese usando um nível de significância 𝛼 , um valor crítico e uma correspondente região de rejeição, que é a abordagem clássica. A seguir, será apresentada outra maneira equivalente e bastante comum, na literatura científica, de se obter o mesmo resultado final. Observação: A abordagem mostrada aqui foi a de calcular o nível de significância 𝛼 e 𝛽 , depois de estabelecido um valor crítico. Outra maneira de se fazer seria exatamente o oposto, isto é, dado um nível de significância 𝛼 estabelecer o valor crítico correspondente. Uma vez determinado o valor crítico calcula-se então 𝛽. Valor P Suponha que um cupom foi selecionado. A questão é: se H0 é de fato verdadeira (a sacola mostrada é a A) quão provável é a seleção do cupom observado? Que tal calcular-se quão provável é a seleção do cupom observado ou valores mais extremos, o que daria ainda mais evidências contra H0? No exemplo das sacolas, valores mais altos dão indícios contra H0, por conseguinte, nesta situação os valores altos são os valores extremos. Calcula-se, portanto, as probabilidades de se observar o valor selecionado ou ainda valores mais altos, usando a suposição de que H0 é verdadeira. Valor P Definição 1.13: O valor-p é a probabilidade de encontrar o valor observado na amostra ou valores mais extremos, assumindo que a hipótese nula, H0, é verdadeira. Observação: Quanto menor for o valor-p, mais forte será a evidência fornecida pela amostra contra H0. Por outro lado, quanto maior for o valor-p, menor será a evidência contra H0. Definição Valor-p, valor observado = R$30 e 𝛼 = 0,10. Suponha que o cupom selecionado seja o de R$30. O valor-p será a probabilidade de observar valores maiores ou iguais a R$30 na sacola A (assumindo H0 verdadeira). Olhando o gráfico de frequências, constata- se que seis cupons têm valores ≥ R$30. Isso leva a um valor-p = 6/20 = 0,30, que é maior que o nível de significância de 0,10. Observa-se também que o valor selecionado não está dentro da região de rejeição associada ao 𝛼 = 0,10. Portanto, valor-p > 𝛼 leva a não rejeição de H0. Exemplo da sacola Exemplo da sacola Valor-p, valor observado = R$60 e 𝛼 = 0,10 Suponha agora que o cupom selecionado seja o de R$60. O valor-p será a probabilidade de observar valores maiores ou iguais a R$60 na sacola A (assumindo H0 verdadeira). Olhando o gráfico de frequências, constata-se que um cupom tem valor ≥ R$60. Isso leva a um valor-p = 1/20 = 0,05, que é menor que o nível de significância de 0,10. Observa-se dessa vez que o valor selecionado está dentro da região de rejeição associada ao a = 0,10. Portanto, valor-p < 𝛼 leva à rejeição de H0. Exemplo da sacola Exemplo da sacola Seguindo o mesmo procedimento resume-se na Tabela as informações da abordagem clássica e a abordagem do valor-p para diferentes valores observados. Exemplo da sacola Se valor-p ≤ 𝛼 -> rejeita-se H0 e os dados SÃO estatisticamente significantes. Se valor-p > 𝛼 -> não se rejeita H0 e os dados NÃO SÃO estatisticamente significantes. Relação entre valor-p e 𝜶 É de fundamental importância diferenciar entre ANTES de se observar os dados e estabelecer uma regra de decisão, e DEPOIS de se observar os dados e tomar uma decisão. Antes de se observar os dados pode-se estabelecer uma regra de decisão e calcular o respectivo nível de significância 𝛼 . Quando a regra de decisão 1 foi utilizada, o 𝛼 correspondente era de 0,10. O 𝛼 = 0,10 será a probabilidade de se cometer um erro segundo o processo utilizado. Depois que se observar a amostra, a decisão do pesquisador pode estar certa ou pode estar errada. Logo, a probabilidade de se ter cometido um erro, uma vez observada a amostra, é igual a zero ou igual a 1. Observação importante De acordo com um estudo conduzido pela American College of Sports Medicine Journal e Science in Sports and Exercise, homens que se exercitam enquanto ingerem suplemento de cromo não ficam mais fortes que os homens que não tomam esse suplemento. Dezesseis homens foram monitorados durante o estudo. Metade deles recebeu o suplemento de cromo e a outra metade recebeu um placebo (substância sem efeito). No final do programa de treinamento ambos os grupos ficaram mais fortes, mas não houve diferença estatística entre os ganhos de força para os dois grupos. Considere as seguintes hipóteses: H0: Não há diferença de ganho de força entre os dois grupos. H1: O grupo que recebeu o suplemento de cromo tem um ganho de força maior. Baseado no estudo acima, qual hipótese foi escolhida? O valor-p para testar as hipóteses acima foi pequeno o suficiente? Justifique a sua resposta. Exercício 1.4 Exercício 1.5 A Tabela 1.6 abaixo resume as hipóteses, e os resultados para três diferentes estudos. (a) Para qual dos três estudos há mais suporte para sustentar a hipótese nula? (b) Suponha que o estudo A tenha concluído pela hipótese de que o tempo médio de vida é < 54 meses, mas a hipótese verdadeira é de que o tempo médio de vida é ≥ 54 meses. Na linguagem estatística (“estatisquês”) qual seria esse tipo de erro (I ou II)? (c) Se o resultado do estudo C não fosse estatisticamente significante, que hipótese você teria escolhido? Exercício 1.5
Compartilhar