Baixe o app para aproveitar ainda mais
Prévia do material em texto
I WÊ-I«0 solução do exercício m%ÿ , ' 14 Dísttibuição %2T-Í Este exercício continua a partir de onde paramos no último exercício. Veja os três passos finais do teste de hipótese. 0 que você conclui?i!:m Z.7Òerc.L<Lío SoJLu.çji0 (parte- 2) H;s Algo Está+-¥ÁAcontecendo... -i! N1 Passo 4: Ache o valor p da estatística de teste. Use a distribuição Z = (X - 355)/0,5, a quantidade média de xarope na amostra e lembre-se de que, desta vez, você quer saber se sua estatística de teste está dentro da cauda superior da distribuição, já que é aí que fica a região crítica. m: I-II WKf""WSI m :: l « Cf. - 35S)/Í>.5 * (iSb.í - 3SSV0.S àsí; íu. 111» mf " Pensei quey o sucesso dele com as meninas seguiria uma distribuição binomial p = 0,8. Estava totalmente enganada... I * i.s/o.s lí : 1 E-mmm-- 3 comÍ!t RA»*I iigpiiiM mmr i.' L0 por P(Z ? 3), pois a r&jcâc» crítica /tea ca<t<to superior. tonsultando a proíaíilibdesÿ obtemos :; 1in:::: K» Passo 5: Observe se o resultado da amostra está dentro da região crítica. Lembre-se de que você está testando com um nível de significância de 1%. 0 valor p OflOii é menor que oÿoiÿ o nível de siÿnificincia. Isso significa que o resultado b mostn estí dentro b retiio crítico. !;St 5 mI RRS í i mri,1h WÊM F : \ Passo 6: Tome sua decisão. Existem evidências suficientes para rejeitar a hipótese nula com um nível de significância de 1%? m •i. i mtomo o resultUo b amostro- estí dextro b reqiòo crítica, existem evidencias suficientes nipótese alternativa de que m 7 355 ml.k para rejeitar a kipótese nula. Memos aceitar a mm!: & i- ?. 1ll-i !?.í 1 PONTOS DE BALA% Às vezes, as coisas não acontecem do jeito que você esperava.. Ao criar uma situação usando uma determinada distribuição de probabilidade, você tem boa ideia de como provavelmente as coisas vão ser a longo prazo. Mas o que acontece se houver diferenças entre o que você espera e o que você obtém? Como saber se suas discrepâncias se resumem a flutuações normais ou se são um sinal de um problema existente por trás do seu modelo de probabilidade? Neste capítulo, vamos mostrar como distribuição c2 para analisar seus resultados e identificar resultados suspeitos. ; pr Um erro de tipo I é aquele em que você rejeita a hipótese nula quando ela é, na verdade, correta. A probabilidade de obter um erro de tipo I é á, o nível de significância do teste. a Um erro de tipo II é aquele em que você aceita a hipótese nula quando ela está errada. A probabilidade de obter um erro de tipo II é representada por p. B Para achar p, sua hipótese alternativa deve ter um valor específico. Em seguida, você pode achar o intervalo de valores fora da região crítica do seu teste e achar a probabilidade de obter este intervalo de valores com Hr !i umaE \J- iif I i i;' usar a li .IMí 1í-niírui 566 Capitulo 13 este é um novo capitulo 567 r*s •K-.f' usando tostes cia hipóteseo mais novo remédio para o ronco? i .VVOCê ESTá FICANDO DEPRIMIDO COM SEU RONCO? NTÃO VOCÊ PRECISA DO NOVO SNORECULL, k Não tenho certeza de que essas afirmações são verdadeiras. Se fossem, eu teria mais pacientes curados. O0I S l.mM 8 A médica do Hospital da Terra da Estatística tem prescrito SnoreCull para seus pacientes, mas está decepcionada com os resultados. Ela decide então realizar seu próprio teste com o remédio. Ela colhe uma amostra aleatória de 15 pacientes e os coloca em tratamento com o uso de SnoreCull durante duas semanas. Após este período, ela os chama de volta para ver se o ronco cessou. Veja os resultados: Mv.v M2 SEMANAS, SNORECULL CURA 90% \ * flV Mí DAS PESSOAS COM PROBLEMAS DE RONCO. :U2k s Medico- /ÍXv- ... «SNOíô1 >*I I I«ÿi I M IfiKã W % (l é 5Ci iCX._Jll H SrSBsrf1TABLE15, I* SimCurado? Não9m flpp* Frequência 11 4'âj;p w; S*# P-2S 'UiSis onte seu lápisLIVRE-SE DO RONCO COM O NOVO SNORECULL r- % Se o remédio cura 90% das pessoas, quantas pessoas da amostra de 15 pacientes você acha que seriam curadas? Em sua opinião, que tipo de distribuição ela segue? 0 novo remédio milagroso da Terra da Estatística O principal fabricante de remédios da Terra da Estatística inventou uma nova fórmula para curar o ronco. Pessoas frustradas que sofrem deste mal estão procurando seus médicos na esperança de obter alívio para o período noturno. O fabricante de remédio afirma que sua nova droga milagrosa cura 90% das pessoas dentro de duas semanas, o que é uma ótima notícia para aqueles que apresentam problemas de ronco. A questão é que nem todos estão convencidos.i:« ji I I usando testes tie hipótesesolução do aponte seu lápis Aponte seu lápisr- <® Solução 5e o remédio cura 90% das pessoas, quantas pessoas da amostra de 15 pacientes você acha que seriam curadas? Em sua opinião, que tipo de distribuição ela segue? Quer dizer que o fabricante do remédio está mertindo sobre seu produto? O remédio nao deveria ter curado mais pacientes? 0 O fi °\o% k lí é e, por cssoÿ vod espenria $ue /Y pessoas -fosse»i cunbs. Somnte li pessoas b mostra tolkíb form cunbs, o que é imito mis Uíxo pe o resultak espenk. ZXiste un numero especifico k testes e a nédica estí interessab no número k sucessos e, por isso, o número íe sucessos secÿue um distrikuicHo Unomio.,1. Se /X é o número k sucessos, entoo £ v 8(/5, Ofl). O fabricante do remédio pode não estar mentindo propositalmente, mas suas afirmações podem ser enganosas. E possível que os testes do fabricante tenham apresentado falhas, e isso pode ter resultado nas afirmações enganosas que foram feitas sobre o SnoreCull. É possível que, sem querer, eles tenham realizado testes tendenciosos ou com falhas, o que resultou em previsões incorretas sobre a população. Se a taxa de sucesso do SnoreCull é realmente menor que 90%, isso explicaria por que somente 11 pessoas da amostra foram curadas. 'ÿv Então qual é o problema? Veja a distribuição de probabilidades para quantas pessoas o fabricante diz que deveriam ser curadas com o remédio contra o ronco. tsti i 'dot pess&s dava» iLW Mas é rea!mente -- possível ter certeza de que o fabricante do remédio cometeu uma falha? Talvez a médica tenha tido um pouco de azar. O Ok acorto com , fakricoÿ to teynéi-iO' míite \>Uor represei ymttspessoas mlmente tm/ks pdo 5nmiM.ll. X II X Na verdade, é possiivel que as afirmações do fabricante do remédio sejam corretas. Em vez de ser uma falha cometida peio fabricante do remédio, é sempre possível que os pacientes da amostra colhida pela médica não tenham sido representativos para a população como um todo. E sempre possível que o remédio para o ronco reaimente cure 90% dos pacientes, mas, por acaso, a médica simplesmente terr. uma proporção mais alta de pessoas em sua amostra que nãosão curadas pelo remédio. Em outras palavras, sua amostra pode ser tendenciosa de alguma forma, ou tudo simplesmente pode-se resumir a um número pequeno de pacientes na amostra. 0. ss1413 15 x12 i1110 O número de pessoas curadas pelo SnoreCull na amostra colhida pela médica é, na verdade, muito mais baixo do que o esperado. Dadas as afirmações feitas pelo fabricante, você esperaria que 14 pessoas fossem curadas, mas, em vez disso, somente 11 obtiveram sucesso. Qual o motivo da discrepância? DO OTCE&E&&0Jf:v1é»i Em sua opinião, como podemos resolver isso? Comopodemos determinar se devemos confiar nas afirmações do fabricante do remédio ou aceitar as dúvidas da médica? J I usando testes de hipóteseo processo para testaras hipóteses Seis passos para testar as hipótesesResolvendo o conflito bem lá do alto Veja os passos que estão envolvidos no teste de hipótese. Vamos examinar cada um deles em detalhe nas próximas páginas.Então como resolver o conflito entre a médica e o fabricante do remédio? Vamos analisar, bem lá do alto, o que precisamos fazer. Podemos resolvero conflito entre o fabricante do remédio e a médica testando as afirmações do fabricante. Em outras palavras, vamos aceitar a palavra do fabricante inicialmente, mas, se houver fortes evidências contra ela, vamos ficar do lado da médica. Veja o que faremos: ? ! Esto. é a afirmcpo yue—-ÿ A Decida sobre a hipótese que você vai testarvmos testar. : : ! $NOR&* freàsawsescolker * MW* estatística fyue Sáwa pan testo-r a afimacao. I li, I Escolha a estatística do seu teste —•1 mii > I ¥Icÿ.sÿ;LL Vy Precisamos de um tetermc*ado nível de certeza wfirmaçãoExamine a a © Determine a região crítica para sua decisãoí . »s f/0 Wedsaws saber a raridade dos Q Ache o valor p da estatística do teste resultadosÿ considerando as akmacàes Observe se o resultado da amostra está sé/fà i/erdadeiraj. I I mrUi#****** »mru M$àc> do£tAtí te reyÚMo iHm»FORM mi IMP m \ j*, i • dentro da região crítica M seoÿLfo*, iremos se ele esta dentro dos limites de certeia.iáênciasExamine as evi © Tome sua decisão /. ::e :ui tóa p/rfaj Mentis sio Míessírits cm réiòtw aU ****** to remétoo e wiUc isso : i ii J c°n Me, AM -temos. Isso é jeitooksemtoc-se enriMe tos resdttios oktitos peh ,1; mekts aso o hlriaAte to remêtoo estejt coneto. Tome uma decisão ii! Por que toda essaformalidade? E óbvio que algo está acontecendo. i ’Ml o o Y* Jjpl f- \-\-szr\r ip! ~ " . ) À3Êàm ui Si V! Precisamos ter certeza de que estamos testando adequadamente a afirmação do fabricante do remédio antes que a rejeitemos. Dessa maneira, saberemos que estamos tomando uma decisão imparcial para os dois lados, e estaremos testando a afirmação de forma justa. O que não queremos fazer é rejeitar a afirmação se houver evidências insuficientes contra ela, e isto significa que precisamos de alguma forma para decidir o que são evidências suficientes. ! !• ! f “Âii;1 m mI: Impendendo das evidências aceite ou rejeite as afirmações do fabricante do remédio. ill X i i i mr WIri!i De um modo geral, este processo é chamado de teste de hipótese, pois você toma uma hipótese ou afirmação e a testa com base nas evidências. Vamos examinar o processo geral usado para isso.:!!; Iii;: :v você está aqui * 527 /i: 526 Caoítulo 13 1•i I usando tastes a® hipótesehipóteses nulas a alternativas Vÿce está *iu! Então qual é a alternativa?Passo 1: Pecida sobre a hipótese Decida sobre a hipóteseque você vai testar Eecciha a estatística do ‘íeõte Vimos a afirmação que vamos testar, a hipótese nula, mas e se ela não for verdadeira? Qual é a alternativa? Vamos começar com o primeiro passo do teste das hipóteses e analisar a afirmação que queremos testar. Essa afirmação é chamada de hipótese. Determine z regláo cri&ca ftgra sua decisão_ Aciítí o valor p ds estatística <5© teste A perspectiva da médicaCiibsarvo sa o resciltado deotr.ostra está denfiro <ía rafisão crítica_A afirmação do fabricante do remédio A visão da médica é de que as afirmações do fabricante do remédio são boas de mais para serem verdadeiras. Ela não acredita que 90% dos pacientes sejam curados. Ela acha bem mais provável que a taxa de cura seja na verdade menor que 90%. A contrapartida da hipótese nula é chamada de hipótese alternativa. Ela é representada por H e é a afirmação que vamos aceitar caso haja fortes evidências para rejeitar H0. Temo sue decisão Segundo o fabricante, o SnoreCull cura 90% dos pacientes dentro de duas semanas. Precisamos aceitar essa posição, a não ser que haja evidências suficientemente fortes para o contrário. A afirmação que estamos testando é chamada de hipótese nula. Ela é representada por H0, e é a afirmação que vamos aceitar, a não ser que haja evidências fortes contra ela. Sou a hipótese alternativa. Se H o decepcionar, você tera de aceitar que é melhor ficar comigo. / Sou a hipótese nula. Sou a posição aceita como padrão. Se você acha que estou errada, dê-me evidências. A hipótese alternativa é a afimacào 4/e vou vai auitar se rejeitar 'A hipótese mia é a afí'mado yu vou vai tes-tw. í a alímmo > HH:\ao que vouvai auitar a do ser yue Aaja fortesevU-htias contra ela. 1O A hipótese alternativa para o SnoreCull Então qual é a hipótese nula para o SnoreCull? A hipótese alternativa para o SnoreCull é a afirmação que você vai aceitar se a afirmação do fabricante do remédio for falsa. Se houver evidências suficientemente fortes contra o fabricante, é provável que a médica esteja certa. A médica acredita que o SnoreCull cure menos de 90% das pessoas. Isso significa que a hipótese alternativa é que p < 90%. A hipótese nula para o SnoreCull é a afirmação do fabricante do remédio: que ele cura 90% dos pacientes. Esta é a afirmação que vamos aceitar, a não ser que encontremos fortes evidências contra ela. Precisamos testar se pelo menos 90% dos pacientes são curados pelo remédio. Isso significa que a hipótese nula é p = 90%. ísta è a dtemtivahipótesepara oteste <h Swreíuli p < 0.9 Agora que temos as hipóteses nula e alternativa para o teste de hipótese do SnoreCull, podemos ir para o passo 2./ Você tem de considerar que eu curo 90% das pessoas, a não ser que consiga obter boas evidências do contrario. m iI ¥m ihliCUlL 1 TABIET5' Sc IC1 & Í| :•' -KSNCRI«G5 • v f?99wtijT'.a JOCíSí strtíii %ron JS ___ /í'1 nenhuma pergunta idiota usando iesias hipótesei!I Fasso Z: Escolha a estatística do seu teste Decida sobre a hipótese que você vai testarnã° existem •,irtas Idiotas VPC©está' nuI j3ô£cí*;rjííH5s região JSffítics par® sacs il&CfS&S Agora que você determinou exatamente o que vai testar, é preciso achar uma forma de testá-lo. Isso pode ser feito com uma estatística de teste. A estatística de teste é aquela que você usa para testar sua hipótese. E a estatística que é mais relevante para o teste. ~P - 0 tamanho da amostra não é muito pequeno para esse teste de hipótese? Embora o tamanho da amostra seja pequeno, ainda assim podemos realizar testes de hipótese. Tudo se resume a qual estatística você usa no teste — evamos ver isso na próxima página. - Por que estamos considerando que a hipótese nula seja verdadeira e depois procuramos evidências de que ela seja falsa? Ao realizar um teste de hipótese, você, na verdade, testa as afirmações da hipótese nula. Você supõe que ela seja verdadeira e depois a rejeita se houver evidências suficientes contra ela. É como julgar um prisioneiro perante um júri. Você só o condena se houver evidências suficientemente fortes contra ele. ~P •A hipótese nula e a hipótese alternativa têm de ser exaustivas? Elas têm de abranger todos os resultados possíveis? Não, não é necessário. Como exemplo, nossa hipótese nula é p = 0,9 e nossa hipótese alternativa é p < 0,9. Nenhuma delas considera que p seja maior que 0,9. Achs {.- vaso:- í2SÉ£tf.feÉK:« tio | Ob&arvs 33 o 5‘wswlísáu amo$tr& «síó cfonsre c)z _ Tome sass siocfsâo Qual é a estatística de teste referente ao SnoreCull?!ill !?] T: Em nosso teste de hipótese, queremos testar se o SnoreCull cura 90%das pessoas ou mais. Para testar isso, podemos olhar a distribuição de probabilidades de acordo com o fabricante do remédio e ver se o número de sucessos na amostra é significativo. Se usarmos X para representar o número de pessoas curadas na amostra, isto significa que podemos usar X como nossa estatística de teste. Existem 15 pessoas na amostra e a probabilidade de sucesso segundo o fabricante do remédio é de 0,9. Como X segue uma distribuição binomial, isto significa que a estatística de teste é na verdade: Já - Então, os testes de hipótese são usados para provar se as afirmações são verdadeiras ou não?'Uíc: : R:Os testes de hipótese não dão uma prova absoluta. Eles permitem ver a raridade dos resultados observados, considerando-se que sua hipótese nula seja verdadeira. Se seus resultados foremextremamente improváveis de terem acontecido, este fato serve como evidência de que a hipótese nula é falsa. •í.í li!! !! y é a estatística te teste para te kípótese. i?j ~ B(15, 0.9)ÿ””-7X o AOSSO testefck tekaiws essa estatística te teste iVi.fé ê considera que a hipótese idências suficientes contra ela, você a rejeita e aceita a hipótese alternativa. Ao testar hipóteses la seja verdadeira voce . Se houver '! / Estou confusa. Por que estamos dizendo que a probabilidade de sucesso é 0,9? Com certeza, ainda não "V a conhecemos. f ; h: evi O Onu . M j: 7 1 f.mi* ; ;iMi:v Escolhemos a estatística de teste de acordo com H, a hipótese nula. Precisamos testar se existem evidências suficientes contra a hipótese nula, e fazemos isso considerando primeiro que H0 seja verdadeira. Em seguida, procuramos evidências que contradigam HQ. No caso do teste de hipótese do SnoreCull, consideramos que a probabilidade de seja 0,9 a não ser que haja fortes evidências contra isso. Para isso, analisamos a probabilidade de obtermos os resultados que obtivemos, considerando que a probabilidade de sucesso seja 0,9. Em outras palavras, tomamos os resultados da amostra e examinamos a probabilidade de obter aquele resultado. Isso é feito achando uma região crítica. * ! 1 1I «*.: ! ’ ;í I1! sucessoI!>:ÿ Ni i: ;•: li1i i!!; í j í i 531évocê está aoui v530 Ganituio 13 I wn achando regiões críticas usando testas de hipótese Para achar a região crítica, decida primeiro sobre o nível de significância Passo 3: determine a região crítica Decida sobre ahipótese que você vai testar Escolha a estatística do seu teste ! A região crítica de um teste de hipótese é o conjunto de valores que apresentam as evidências mais extremas contra a hipótese nula. Vamos ver como funciona dando outra olhada na amostra da médica. Se 90% das pessoas, ou mais, tivessem sido curadas, isso estaria de acordo com as afirmações feitas pelo fabricante do remédio. À medida que o número de pessoas curadas diminui, mais improvável é que as. afirmações do fabricante sejam verdadeiras. Veja a distribuição de probabilidades: VPCe ÉjÉBIestá Para acharmos a região crítica do teste de hipótese, primeiro é necessário decidir sobre o nível de significância. O nível de significância de um teste é uma forma de medir a improbabilidade que você deseja dar aos seus resultados da amostra antes de rejeitar a hipótese nula Ho. Assim como o nível de confiança referente a um intervalo de confiança, o nível de significância é dado na forma de porcentagem. Como exemplo, suponha que queiramos testar as afirmações do fabricante do remédio com um nível de significância de 5%. listo significa que escolhemos a região crítica de forma que a probabilidade de que menos de c pacientes sejam curados é menor que 0,05. Estes são os 5% mais baixos da distribuição de probabilidades. Ache o valor p da ç>3taí:síica «te leste Obíiorve se o tesulimía tia amoaíro ssêâ á&»*ro dc região critica_ Tome oí»a decísãí.1 Se W% tos curotos TZretu. ° 5 * AÚmro te poentes cuntos ufo 5Aoredutl toír teatro to- retíòo cntctf» vmos rejeitor o hipótese AUJIO. tywto muos pessoos soo untos mis provivel é que os ofimocàes to Urícorte to remtio estèyw errotos. 1 Se Ho •for vertoteiroÿ teiws %% te certeio te que o Aiínero te cocientescurotos voi coír te/\tro tesso reqiòo. d •; -j íCritical region1513 14121110' <- 5% 95%ím que ponto podemos rejeitar as afinviapões do fabricante do remédio? O nível de significância normalmente í representado pela letra grega a.Quanto menor a, mais improváveis precisam ser os resultados da sua amostra para que você possa rejeitar HQuanto menos houver na amostra pessoas que tenham sido curadas com sucesso pelo SnoreCull, mais fortes são as evidências contra as afirmações do fabricante do remédio. A questão é em que ponto as evidências se tornam tão fortes que possamos rejeitar com confiança a hipótese nula. Em que ponto podemos rejeitar a afirmação de que o SnoreCull cura 90% dos pacientes? Precisamos achar uma maneira de indicar em que ponto podemos razoavelmente rejeitar a hipótese nula. Isto pode ser feito especificando-se uma região crítica. Se o número de pacientes curados cair dentro da região crítica, poderemos dizer que existem evidências suficientes para rejeitar a hipótese nula. Se o número de pacientes curados cair fora da região crítica, vamos aceitar que não há evidências suficientes para rejeitar a hipótese nula, e vamos aceitar as afirmações do fabricante do remédio. Vamos chamar de c o ponto de corte da região crítica, ou seja, o valor crítico. o" I li Então que nível de significância devemos usar?;i I: • -*>•/ Estatística Vital!i);ÿ *!; Vamos usar um nível de significância de 5% em nosso teste de hipótese. Isso significa que, se o número de pacientes curado?. na amostra estiver nos 5% mais baixos da distribuição de probabilidades, vamos rejeitar as afirmações do fabricante do remédio. Se o número de pacientes curados estiver nas 95% mais altos da distribuição de probabilidades, vamos decidir que não existem evidências suficientes para rejeitar a hipótese nula e aceitar as afirmações do fabricante do remédio. 7m UHL deí-L* l •: 0 rível te sioÿificor.cio é represertoto por a.imo meeiro te tiier o inproíoUlitote que você tesejo que seus resu/totos teAkm OAtes que vou rejeite H0. ! t ::ÿ!h\":. ;iil: Então como escolhemos a região crítica? Se o ! Minere kpesseu curttits peio aiY kK-fro h reach aí-tCu, *******WnetKte k rt-metoo, ou *j» HUterÿtCn é CM plo* e l 0 h pessoas ewn*í fd* ré*t* ». esttutó Jtítm k P !ií L; PoAtO te corte ou voUr crítico iÉ Se usarmos X para representar o número de pacientes curados, definimos a região crítica como sendo os valores tais que I.1 : ;I Posso.I • <. Ofl-?. i Vií P(X < c) < o:f ! !'| I: ondec a = 5%§ 533você está aqui532 Capítulo 13 I W- V usando testas de hipóteseregiões críticas a fundo •: Quando você está criando uma região crítica para seu teste, outra coisa da qual é preciso estar ciente é se você está realizando um teste unicaudal ou bicaudal. Vamos observar a diferença entre os dois e o impacto que isso tem na região crítica. Passo 4: Ache o valor p Decida sobre ahipótese que vocè vai testarKegipes Crítícas Vistas cie fert9k•v Agora que estudamos regiões críticas, podemos ir para o Passo 4 e achar o valor p. O valorp é a probabilidade de obter um valor até e inclusive aquele da sua amostra em direção à sua região crítica. É uma maneira de tomar sua amostra e ver se o resultado cai dentro da região crítica para seu teste de hipótese. Em outras palavras, usamos o valor p para dizer se podemos rejeitar ou não a hipótese nula. Escolha a estatística do seu teste:ÿ * Determine a região critica para sua decisão$'8; Vpce Ache o valor p da ' estatisticade teste . :*está cird a !i Testes imícaudaisíI aÿul Observo s* o rsaalíado da smosíra está deniro c*c ragiiãp criitto.a_I: * *Um teste unicaudal é aquele em que aregião crítica cai em uma extremidade do conjunto possível cie valores do seu teste. Você escolhe o nível do teste —representado por a — e se certifica de que a região crítica reflita isso como uma probabilidade correspondente. A cauda pode estar em qualquer uma das extremidades do conjunto de valores possíveis. A extremidade que você depende da sua hipótese alternativa Hr Se sua hipótese alternativa incluir um sinal de <, use a cauda inferior, onde a região crítica está na extremidade mais baixa dos dados. Se sua hipótese alternativa incluir um sinal de >, use a cauda superior, onde a região crítica está na extremidade mais alta dos dados. Estamos usando um teste unicaudal para o teste de hipótese do SnoreCull com a região crítica na cauda inferior, já que a nossa hipótese alternativa é que p < 0,9.a:s: Tows» decisão3- *<ÿ l 100% - a Como achamos o valor p?a* mi* fotetar. Isso depende da nossa região crítica e da nossa estatística de teste. No caso do teste do SnoreCull, 11 pessoas foram curadas e nossa região crítica é a cauda inferior da distribuição. Isto significa que o nosso valor p é P(X < 11), onde X é a distribuição do número de pessoas curadas na amostra. Como o nível de significância do nosso teste é 5%, isto significa que, se P(X < 11) for menor que 0,05, então o valor 11 cairá dentro da região crítica e poderemos rejeitar a hipótese nula. Sí u í «) < °-Pÿ iií0 ftrí** i>í£ Teoÿo crítCcii e petenvs rejetitor H. ÁauC êstmos i&w* a i À miw crítico m e$-tí A<* couU wo Aufd a. rí S:- fv*í 1st. usa > II estí ó-extto UMrJi a100% - a ca ii;.l. . í‘i !íâ: M-V'\ >0.05 0.95 onte seu lápis!' r-«HI: il;•;?• Sabemos, do passo 2, que X - B(l 5, 0,9). Qual é P(X < 1 1 )?liste i reste Ucoufoho>\ó-e a recjàc crítico- é MiKMi STH couJ-o-s. ! I Testes bicaudais. EH Um teste bicaudal é aquele em que a região crítica é dividida nas duas extremidades do conjunto de valores. Você escolhe o nível do teste a e se certifica de que a região crítica total reflita isso como probabilidade correspondente dividindo-a em duas partes. Ambas as extremidades contêm a/2 de forma que o total seja a. E possível saber se você deve usar um teste bicaudal observando a hipótese alternativa Hr Se H, contiver um sinal de *, é preciso usar um teste bicaudal já que você está procurando alguma mudança no parâmetro, em vez de um aumento ou uma diminuição. Teríamos usado um teste bicaudal para o nosso SnoreCull se nossa hipótese alternativa tivesse sido p*0,9. Teria sido necessário verificar se um número significativamente maior ou menor que 90% dos pacientes foi curado. .. i *í'í C2|! C1! • -M- a/2uma 100% - aa/2m«II n il:5 ' ! ;i. ri. ;7. I%rI ;Ml : 'f! ' 4 m B 6i você está aqui > 535II 534 Capitulo 13l!.i I •Vf • usando testas da hipótesesolução do aponte seu lápis sjponte seu lápis Solução - % Passo 5: 0 resultado da amostra está m região crítica? Decida sobre a hipótese que você vai testarSabemos, do passo 2, que X ~ B(15, 0,9). Qual é P(X < 11)? O valor 11 está dentro ou fora da região crítica? Escolha a estatística do seu teste P(ÿ < II) ’ i - tfj< > iz) Determine a regiãocrítica para sua decisão Agora que achamos o valor p, podemos usá-lo para saber se o resultado da nossa amostra cai dentro c.a região crítica. Em caso positivo, teremos evidências suficientes para rejeitar as afirmações do fabricante do remédio. Nossa região crítica é a cauda inferior da dis tribuição de probabilidades, e estamos usando um nível de significância de 5%. Isto significa que podemos rejeitar a hipótese nula se o nosso valor p for menor que 0,05. Como nosso valor p é 0,0555, isto significa que o número de pessoas curadas pelo SnoreCull na amostra não cai dentro da região crítica. * I - C'ljo.i'xo.f- f “Í.jofxo.i' r ISÍ„X0.Ixa.<f r orf) t/ 'ÿtÿsó los° resto- Off. Ache o valor p da estatística de testeT i - (OMS r o.iM r o.mt r o.zos°i) Vÿce Observe se o resultado da amostra está dentro da região crítica estár / - 0.WS - aÿul |Tome assa; gfecksSor 0.0555 Achamos o valor p 0 wjior p é oflíb. de estí uto pouco ‘foro- h reÿCo-o crítico €Sf( iPara achar o valor p do nosso teste de hipótese, tivemos que achar P(X < 11). Isto significa que o valor p é 0,0555. e a refio erítio.. 4 -44- Sempre calculo valores p da mesma forma? E se a minha região crítica estivesse na cauda superior? r o O 5% 95% Passo 6: tome sua decisão'•TSK-.-. Decida sobre a hipótese que vocè vai testarAgora chegamos ao último passo do teste de hipótese. Podemos decidir se devemos aceitar a hipótese nula ou rejeitá-la em favor da hipótese alternativa. O valor p do teste de hipótese cai um pouco fora da região crítica do teste. Isto significa que não existem evidências suficientes para rejeitar a hipótese nula. Em outras palavras: Escolha a estatística do seu testeLJ Determine a região crítica para sua decisão O valor p é a probabilidade de obter os resultados na amostra, ou de algo mais extremo, na direção da região crítica. Em nosso teste de hipótese do SnoreCull, a região crídca è a cauda inferior da distribuição de probabilidades. Para saber se as 11 pessoas curadas do ronco estão na região crítica, calculamos P(X < 11), já que esta é a probabilidade de obter um resultado pelo menos tão extremo quanto os resultados da nossa amostra na direção da cauda inferior. „ t Atvator se #i II pessoos turttis estio A» reofio Achc o valor p da estatística de teste Observe se o resultado da amostra está dentro da região críticaY<?ce está ' niú Aceitamos as afirmações; do fabricante do remédic Venci! aSnotòL. l•> i mI >4 0.950.05 I II•$$É,í# 1É yi#*19®' Se nossa região crídca estivesse na cauda superior da distribuição de probabilidades, seria necessário achar P(X > 11). Teríamos contado mais resultados extremos maiores que 11, já que estes estariam mais próximos da região crídca. I V. Si ?=> Sn#::í%I i você está aqui > 537536 Capitulo 13 I P usando testes c/a hipótese* revisando o teste de hfpótess 3 iiB ' PONTOS DE BALAíntão o que acabamos de fazer?i: li; Em um teste de hipótese, você toma uma afirmação e a testa em relação a evidências estatísticas. A afirmação que você está testando é chamada de teste de hipótese nula. Ela é representada por H e é a afirmação aceita a não ser que haja fortes evidências estatísticas contra ela. A hipótese alternativa é a afirmação que vamos aceitar caso haja evidências suficientemente fortes contra Hr Ela é representada por Hr A estatística de teste é aquela que você usa para testar sua hipótese. Ela é a estatística mais relevante para o teste. Você a escolhe considerando que H seja verdadeiro. O nível de significância é representado por á. É uma maneira de dizer a improbabilidade que você deseja que seus resultados tenham antes de rejeitar H0. H A região crítica é o conjunto de valores que apresentam as evidências mais extremas contra o teste da hipótese nula. Você escolhe sua região crítica considerando o nível de significância e quantas caudas você deve usar. B Um teste unicaudal é aquele em que sua região crítica fica na extremidade superior ou inferior dos dados. Um teste bicaudal é aquele dividido nas duas extremidades. Você escolhe sua cauda analisando sua hipótese alternativa. O valor p é a probabilidade de obter o resultado da sua amostra ou um resultado mais extremo na direção da sua região crítica. n Se o valor p cair na região crítica, você tem razões suficientes para rejeitar sua hipótese nula. Se seu valor p cair fora da região crítica, você tem evidências insuficientes. Vamos resumir o que acabamos de fazer. Primeiro, tomamos as afirmações do fabricante do remédio, sobre as quais a médica tinha uma certa suspeita. Usamos essas afirmações como base para o teste de hipótese. Formamos uma hipótese nula de que a probabilidade de cura de um paciente seja 0,9 e, em seguida, aplicamos isso ao número de pessoas da amostra colhida pela médica. Depois, resolvemos realizar um teste com nível de 5%, usando a taxa de sucesso da amostra colhida pela médica. Analisamos a probabilidade de 11 pessoas ou menos serem curadas e verificamos para saber se essa probabilidade era menor que 5%, ou seja, 0,05. Em outras palavras, analisamos a probabilidade de obter um resultado neste extremo, ou além dele. Por último, descobrimos que, no nível de 5%, não há evidências suficientemente fortes para rejeitarmos as afirmações do fabricante do remédio. U:8: •;5 HI iV.5; §! I% ú |:j i : M Mas estes resultados não são o que a médica procura. Não podemos testar com um nível diferente? I • oO _ n£L9 existem . I eígUirtcLSIdiotasIr' "P•Que nível de significância devo normalmente usar para fazer um teste? Tudo depende de quão fortes você deseja que as evidências sejam antes de rejeitar a hipótese nula. Quanto mais fortes forem as evidências, menor deve ser seu nível de significância. O nível significância mais comum é 5%, embora, às vezes, você encontre testes com um nível de 1%. Um teste com um nível de 1% significa que são necessárias evidências mais fortes do que para um teste com nível de 5%. P:li •O nível de significância tem algo em comum com o nível de confiança dos intervalos de confiança? Uma vez fixado o nível de significância do teste, não é possível mudá-lo. O teste deve ser totalmente imparcial. Isso significa que você decide o nível que o teste deve ter com base no nível de evidências necessário antes que você olhe as evidências que realmente tem. Se você considerasse a quantidade de evidências existentes antes de decidir sobre o nível do teste, isso poderia influenciar qualquer decisão tomada. É possível que você sinta uma tentação em decidir sobre o nível de teste específico só para obter o resultado que deseja. Isso tornaria o resultado do teste tendencioso e você poderia tomar a decisão errada. ? i R:Sim, eles têm muito em comum. Ao criar um intervalo de confiança para um parâmetro da população, você deseja ter um certo grau de confiança de que o parâmetro da população esteja entre dois limites. Como exemplo, se você tiver um nível de confiança de 95%, isso significa que a probabilidade de que o parâmetro da população caia entre os dois limites é de 0,95. O nível de confiança reflete a probabilidade de que os valores estejam fora de um determinado limite. Como exemplo, um nível de significância de 5% significa que sua região crítica deve ter uma probabilidade de 0,05. 'i li. I i il5; fi| ; 1 ? I !| 0 0 fSr;ÿ ! 1li Continuo emdúvida. O que aconteceria se eu colhesse uma amostra maior? !Í I í i; | ! Vk ' À!ii / 539você está aqui >9%538 Capítulo 13rf /£i I .1 « uma nova amostra para o iesta de hipótese usando testes de hipótese E $e o tamanho da amostra for maior? Imãs de Geladeira de Hipótese//: É hora de fazer outro teste de hipótese. Existem vários passos que deve seguir para realizar o teste de hipótese, mas será que você conseguese lembrar de qual é a ordem? Coloque os imãs na ordem correta. Até então, a médica realizou seu teste usando uma amostra com apenas 15 pessoas e, com base nisso, houve evidências insuficientes para rejeitar as afirmações do fabricante do remédio. É possível que o tamanho da amostra não tenha sido grande o suficiente para obter o resultado preciso. A médica poderia obter resultados mais confiáveis utilizando uma amostra maior. Veja os resultados obtidos no novo teste realizado pela médica: você Tome sua decisão l Sim MãoCurados? 2DFrequência 80 Escolha a estatis:ica do seu teste § Quero realizar um novo teste de hipótese usando esses novos resultados. ,o O Decida scbre a hipótese que você vai testar §: mkGBi Queremos determinar se os novos dados vão fazeralguma diferença no resultado do teste. Vamos realizar outro teste de hipótese, desta vez com uma amostra maior. *11-ÿ•in¬ decisão I BBBIí ¥ ny*àd . * > Determine a região critica da sua r •* . Ache o valorPOI>Ee DOCERE&RO P da estatística de teste If9 %ÉMÉwm Qual é a hipótese nula desse novo problema?Qual é a hipótese alternativa? Veja se a estatística de teste está dent daíí;: : ""C r®gião Critica ft ii 540 Capítulo 13 você está aqui b 541 Hi usando tostes de hipóteseI! Solução do Imãs de Geiadeita de Hipótese Solução dos Imãs e Geladeira de Vamos realizar outro teste de hipótesei ístf'!;:! Escolbs f. astafteçlcs cio e<a« testeA médica ainda está um pouco desconfiada sobre as afirmações feitas pelo fabricante do remédio. Vamos realizar um teste de hipótese baseado nos novos dados. Hipótese critica cia une tí*c?sâí>l .Acha o valor p íIZ;egto&isfjc» tie testeli- É hora de fazer outro teste de hipótese. Existem vários passos que você deve seguir para realizar o teste de hipótese, mas será que você consegue se lembrar de qual é a ordem? Coloque os imãs na ordem correta. ! Vsja sa a estatística cio tes&e •;.»í»Sír tíwtêro «ss região aríti-caPasso 1; Pecida sobre a hipóteseí.ÿ•I VC'iwo JJtiCi dôcísSo Precisamos começar achando a hipótese nula e a hipótese alternativa para o teste do SnoreCull. Como lembrete, a hipótese nula é a afirmação que estamos testando e a hipótese alternativa é a que vamos aceitar caso haja evidências suficientes contra a hipótese nula. Então quais são as hipóteses nula e alternativa? você vai testar fcill Decida sobre a hlpoteÿÿÿiÿjl lUl, , , . - < W Escolha a estatística do seu teste 0 problema continua o mesmo i I No último teste, tomamos as afirmações feitas pelo fabricante do remédio e as usamos como base para a hipótese nula. Estamos testando as mesmas afirmações e, portanto, a hipótese nula continua sendo a mesma. Temos que : & li decisão Vi-iii; da suacritica *a regiãoDetermine' H0: p = 0,91m .* Ache o valor p da estatística de teste A hipótese alternativa é a mesma também. Se houver fortes evidências contra as afirmações feitas pelo fabricante do remédio, vamos aceitar que o remédio cure menos de 90% dos pacientes. Isto nos dá uma hipótese alternativa de:Ve ja se a estatística de teste está dentroM da região critica H,: p < 0,9" -- -.-r ( Então você ainda não acredita em mim? Esta achando que pode me testar de novo? Pode vir!IdecisãoTome suam\ o SNOB®1» Ií: i;i I I, I522 7 wi %tf í V : ; i ; Im % í!í i' V.' I IlljM3:R •i1£'ii!jl 5i <ím 5j&você está aqui >i . VI-Capikilo 13BI 542 I -?T escolha o dado do teste usando testes de hipótese Passo Z: Escolha a estatística de teste Decida sobre ahipótese que você vai testar €7Cerc.íc.ic> Para entender melhor os testes de hipótese, é preciso saber como sãodistribuídos diferentes parâmetros e variáveis. Quais distribuições vocêusaria para achar as probabilidades para as seguintes situações? bico--, timos tofas eks faterComerte AOlivro. 5e do souber o que hierscapítulos. B(n, p). Qual distribuição de probabilidade você poderia usar para fazer essase n for grande, np > 5 e nq > 5 ? Escolha a estatística do seu testeComo antes, o próximo passo é escolher a estatística de teste. Em outras palavras, precisamos de alguma estatística que possamos usar para testar a hipótese. No teste de hipótese anterior, realizamos o teste observando o número de sucessos na amostra e a significância dos resultados. Usamos a distribuição binomial para achar a probabilidade de obter um resultado pelo menos tão extremo quanto o valor que obtivemos na amostra. Em outras palavras, usamos um estatística de teste em que X ~ B(15, 0,9) para testar se P(X < 11) era menor que 0,05, o nível significância. Dessa vez, o número de pessoas na amostra é 100. Estamos testando a mesma afirmação de que a probabilidade de obter sucesso na cura de alguém é 0,9. Isso significa que a nossa nova estatística de teste é X ~ B(100, 0,9). Dsiarmhta a região critica da sua daclsác Acho o valor p tia estatística d* testa revise osVoja r.Q a estatística de teste está dentro da região crítica_ 1.X-Tome sua decisão aproximação 2.X- N(p, ó2). Você conhece o valor de y e ó2. Qual é a distribuição de X?Está brincando? Se tivermos que calcular probabilidades usando a distribuição binomial, vamos ficar aqui para sempre. ¥ Podemos usar outra distribuição de probabiilidade em vez da binomial. Usar a distribuição binomial para este tipo de problema consumiria muito tempo, já que teríamos que calcular várias probabilidades. Infelizmente, existe outra maneira. Em vez de usar a distribuição binomial, podemos usar outro tipo de distribuição. i 3.X- N(p, ó2), você conhece p masnão conhece o valor de ó2. O tamanho da amostra égrande. Qual é a distribuição de X com base nos dados que você tem? W- ifr: .1 «Sf» ••••• 4. X - N(p, ó2), você conhece p mas não conhece o valor de ó2. O tamanho da amostra épequeno. Qual é a distribuição de X com base nos dados que você tem?Qual distribuição de probabilidade você poderia usar para aproximar X - B(100, 0,9)? «£. 5 «stmmk i j y r A - .. W m você está aqui > 545 usando testes ch hipótese solução do exercido f Use a normal para aproximar a binomial na nossa estatística de teste Ii :\\ Para entender melhor os testes de hipótese, é preciso saber como são distribuídos diferentes parâmetros e variáveis. Quais distribuições você usaria para achar as probabilidades para as seguintes situações? Dica: vimos todas elas anteriormente no livro. Se não souber o que fazer, revise os capítulos. ?!: Pi : g?0£rc.í<LCC> SoJLu-çJyoi! Continuamos precisando achar uma estatística de teste que possamos usar em nosso teste de hipótese e, como o número na amostra é grande, significa que usar a distribuição binomial consumirá muito tempo e será complicado. Há 100 pessoas na amostra e a proporção de sucessos de acordo com o fabricante do remédio é 0,9. Em outras palavras, o número cie sucesso segue uma distribuição binomial, onde n= 100 e p = 0,9. Como n é grande, e np e nq são maiores que 5, podemos usar X ~ N(np, npq) como estatística de teste, onde X é o número de pacientes que obteve sucesso de cura. Em outras palavras, podemos usar i i; i m\ ?!II íí B 1 •' - ~B(n, p). Qual distribuição de probabilidade você poderia usar para fazer essa aproximação se n for grande, np > 5 e nq > 5 ? Se A é yWe, eÿtò-o podemos o-proximr p p) uSA-rudo a distribuido Aomo-l. tomo áp) * y e iodp) • Aÿ, isto siopifaco- <yue podemos usor p /XAÿ>, Apg)- Para issotcomermos que Ap 7 s e Ag 7 Sí 1.X'r•í •!: Ir A £ X - N(90 9) teso porque9 íj/Wé, ;\p 7 $ e Ag éBiíliiM para aproximar qualquer probabilidade que possamos precisar. Padronizando, obtemos .ín ~ N(p, cr2). Você conhece o valor de p e o2. Qual é a distribuição de X? Se soubemos o vo-fat de o1, p «ÿ /X/4, OVA). 2.X / _ Ami estmos pUro>\i'mdo p v jj(10, 1). Z = X - 90 VT •• = X - 90 l 3 I I•;i I Isso significa que para nossa estatística de deste podemos usar 3. X ~ X - N(p, a2), você conhece p mas não conhece o valor de a2. O tamanho da amostra é grande. Qual é a distribuição de X com base nos dados que você tem? estimí-h uso-ÿdo sl. Port<p\to> p * iijt% SVA). Z - N(0, 1)Z = X - 90 7i t* 3P £ o tuítnero de tuTO-ê-OS Se Alo soubemos o vo-lor de o1, podemos15 pfaíeAtes im Aosso to-soÿ %o.i*; Entendi. Então nossa estatística de teste é a variável que usamos para o T nosso teste. . Rtii'iif Q 0 '!ÿ* * &í iI:ir5 r 4. X -N(p, a2), você conhece p mas não conhece o valor de a2. 0 tamanho da amostra é pequeno. Qual é a distribuição de X com base nos dados que você tem? Se AM soubermos o vo-lor de o1, podemos estimo.-h usiÿdo sl. Se o tmÿko do- mostro- é pequeno) precismos usor a distribuição-t T * tin - l) orJ-e T -• p - S/Íà ! Usamos a estatística de teste para calcular as probabilidades que você pode usar como evidência. Isto significa que usamos Z como nossa estatística de teste, pois podemos facilmente usá-la para consultar as probabilidades de saber a improbabilidade dos resultados da nossa amostra com base nas afirmações do fabricante do remédio. Substituímos nosso valor de 80 em lugar de X e, por isso, podemos usá-lo para achar a probabilidade de 80 ou menos pessoas serem curadas. í i \\ I! miI! mmííi il! I; ,i:!.!U1 í &você está aqui >i! 546 Capítulo 13 I usando testes de hipóteseache outra região critica Decida sobre a hipótese que você vai testarPasso 3: Ache a região crítica Você acha que conseguiria resolver os passos restantes do teste dehipótese? Veja se você consegue achar o seguinte:Escolha a estatística do seu teste tZ7Ce.rc.ic.Cc?Agora que temos uma estatística de teste para o nosso teste, podemos criar uma região crítica. Como nossa hipótese alternativa é p < 0,9, significa que a nossa região crítica está na cauda inferior, exatamente como antes. A região crítica também depende do nível de significância do teste. Vamos escolher o mesmo nível de significância de antes; logo, vamos testar com um nível de 5%. Determine a região critica da sua decisão Ache o valor p ds estatística d» toste Passo 4: Ache o valor p A região crítica está na cauda inferior da distribuição. 80 pessoas foram curadas e Z = (X - 90)/3. Use isso para achar o valor p. V-sijs» so a estatístico da toste está dentro da região crítica _ Tome sua decisão i \ \ Z - N(0, 1) 5% c Como nossa estatística de teste segue uma distribuição normal padrão, podemos usar as tabelas de probabilidades para achar o valor crítico, c. O valor crítico é o limite em que temos evidências suficientemente fortes para rejeitar a hipótese nula ou não. Como nosso nível de significância é de 5%, isso significa que o nosso valor crítico c é o valor em que P(Z < c) = 0,05. Se consultarmos a probabilidade 0,05 nas tabelas, obteremos um valor de -1,64 para c. Em outras palavras, Passo 5: Veja se a estatística de teste está dentro da região crítica Lembre-se de que o nível de significância para o teste de hipótese é 5%. ! P(Z < -1,64) = 0,05 h Isso significa que, se nossa estatística de teste for menor que -1,64, teremos evidências fortes o suficiente para rejeitar a hipótese nula. ;• Passo 6: Tome sua decisão Você aceita ou rejeita a hipótese nula :om base nas evidências? : • \!!l \tur Wo?, existemm'ÿAccfli suiccíertes pm!| Z - N(0, 1)1- rejector a hipótese Wí,1* II!iH I-1.64I m você está aqui »> 549K/1Q n-anfinlrs •? *3 I ÍK! li¬ ft usando testes de hipótesesolução do exercido K : . 0 SnoreOull não passou MO testsm1 Você acha que conseguiria resolver os passos restantes do teste de hipótese? Veja se você consegue achar o seguinte:m tc7Cerc.í<LCo So/uco-o : Dessa vez, ao realizarmos o teste de hipótese com o SnoreCull, houve evidências suficientes para rejeitar a hipótese nula. Em outras palavras, podemos rejeitar as afirmações feitas pelo fabricante do remédio. m l!ill Passo 4: Ache o valor p A região crítica está na cauda inferior da distribuição. 80 pessoas foram curadas e Z = (X - 90)/3. Use isso para achar o valor p. Vonos conecor ockoxdo o escore podròo de HO. i* LHO - <\o)ti * -\0H t -3,33 O volor pidodo por P(Z <. i) • P(Z <. -3,33). toxsuLtoy<do ai toíefas de prokokilidodesÿ oUenos !!! !•n ; : ! Falhou... £1 OO ti!KI Ii.i} i í %$N0I#1 TABLETS' V' TO w M m i I fri ULTIMATEvolor p * 0,0001 WWsr!)ÿ §m |Á: FOB SN#I\{ Passo 5: Veja se a estatística de teste está dentro da região crítica Lembre-se de que o nível de significância para o teste de hipótese é 5%.iiií / Não deveríamos ter simplesmente aceitado a opinião da médica logo de início? í; K A estotístico de -teste estí *a reofío crítico, se o wÁor p é nexor que o,os. tono o wlor p é iofol a O,OOOH, isto sLOfifico que a estotístico de teste estí dentro do. reÿiòc crítico. v; O*ÿ- O ' r'í); = Hi Testes de hipótese exigem evidências. No caso de um teste de hipótese, você aceita uma afirmação e depois a testa. Você só a rejeita se houver evidências suficientes contra ela. Isso significa que os testes são imparciais, pois você só toma uma decisão com base em haver ou não evidências suficientes. Se tivéssemos simplesmente aceitado a opinião da médica logo de início, não teríamos considerado adequadamente as evidências. Teríamos tomado uma decisão sem considerar se os resultados poderiam ter sido explicados por mera coincidência. Da forma que foi feito, temos evidências suficientes para mostrar que os resultados da amostra são extremoso suficiente para justificar a rejeição da hipótese nula. Os resultados são estatisticamente significativos, pois são improváveis de terem acontecido por acaso. Então isso garante que as afirmações dofabricante do remédio estão erradas? i!I;? ' i. ?ir: £ Passo 6: Tome sua decisão Você aceita ou rejeita a hipótese nula com base nas evidências? £ J1 • i: - tono o estotístico de teste estí dextro do reÿiòo crítico poro o teste de kipótese, síÿxífCco que tenos evidèxcios suficientes poro rejeitor o kipótese xuh con un MW de siÿxCficixcio de $°/o.JI I ; : I !i. m L : I I.r it*: «1você está aqui *>550 Capitulo 13m I nossa hipótese ainda pode estar errada usando testes de hipótese onte seu lápis _Erros podem acontecer Um prisioneiro está sendo julgado por um crime evocê faz parte do júri. A tarefa do júri é considerar queo prisioneiro é inocente, mas, se houver evidênciassuficientes contra ele, é preciso condená-lc. Até então, vimos como podemos usar os resultados de i.ma amostra como evidências em um teste de hipótese. Se as evidências forem suficientemente fortes, podemos usá-las para jusdficar a rejeição da hipótese nula. Descobrimos que há fortes evidências de que as afirmações do fabricante do remédio estejam erradas, mas isso é garantido? 1. No julgamento, qual é a hipótese nula? J Claro que sim. Fizemosum teste de hipótese e o usamos para provar que o fabricante do remédio está mentindo. O o 2. Qual é a hipótese alternativa? Embora as evidências sejam fortes, não podemos garantir com absoluta certeza que as afirmações do fabricante do remédio estejam erradas. Embora seja improvável, é possível que tenhamos tomado a decisão errada. Podemos examinar as evidências através de uma hipótese e podemos especificar o grau de certeza que temos antes de rejeitar a hipótese nula, mas isso não prova com absoluta certeza que a nossa decisão está correta. A questão é: como saber? Realizar um teste de hipótese é como julgar um prisioneiro perante o júri. O júri considera que o prisioneiro seja inocente a. não ser que haja evidências fortes contra ele, mas, mesmo considerando as evidências, ainda é possível que o júri tome decisões erradas. Tente fazer o exercício da próxima página e você vai entende como isso acontece. í" ! II 3. De que forma o júri pode dar um veredicto correto? 2i não existem -i eíguntcis Idiotas 4. De que forma o júri pode dar um veredicto incorreto?- Como podemos tomar a decisão errada se estamos realizando um teste de hipótese? Os testes de hipótese não são feitos para que tenhamos certeza de que não estamos cometendo um erro? Ao realizar um teste de hipótese, você só pode tomar uma decisão com base nas evidências que tem. Suas evidências são baseadas nos dados da amostra e, portanto, se a amostra for tendenciosa, é possível que você tome a decisão errada com base em dados tendenciosos. •Ouvi faiar em aigo chamado teste de significância. 0 que é isso? Algumas pessoas chamam os testes de hipótese de testes de significância. Isto é porque você faz um teste com um certo nível de significância. í' í ?• I !f :I- f • m 552 Capítulo 13 você está acuii > 553 I! c 1 usando tssfas ete hipótesesolução do aponta s&u lápis| •! fV -1 = Solução E o queo julgamento de um prisioneiro tem a ver com testes de hipótese? i Um prisioneiro está sendo julgado por um crime e você faz parte do júri. A tarefa do júri é considerar que o prisioneiro é inocente, mas, se houver evidências suficientes contra ele, é preciso condená-lo. !Si oOi IJ. i: ; i i 1. No julgamento, qual é a hipótese nula? A hipótese nula ê de que o prisioneiroiinocenteÿ pois isso é o que temos de considerar até que se prove o contrario. m%WP Os erros que podemos cometer ao realizar um teste de hipótese são o mesmo tipo de erros que podemos cometer ao julgar um prisioneiro. Testes de hipótese são basicamente testes em que você toma uma afirmação e a julga analisando as evidências contra ela. Se houver evidências suficientes contra ela, você a rejeita, mas, se houver evidências insuficientes contra ela, você a aceita. Você pode aceitar ou rejeitar corretamente a hipótese nula, mas mesmo considerando as evidências ainda é possível cometer um erro. Você pode rejeitar uma hipótese nula válida ou aceitá-la quando ela é, na verdade, falsa. Os estatísticos têm nomes especiais para esses tipos de erros. Um erro de tipo Ié quando você rejeita erroneamente uma hipótese nula verdadeira e um erro de tipoIIé quando você aceita erroneamente uma hipótese nula falsa. Apotência de um teste de hipótese é a probabilidade, de que você rejeite corretamente uma hipótese nula falsa. Éf mJ*I m i I!' mi : íí.: : I.i;: ; :I : 2. Qual é a hipótese alternativa? A hipótese alternativa é que o prisioneir provas suficientes de que o prisioneiro nà culpado e condena-lo. o é culpado. ím outras pahvras, se houver nao é inocente) vamos aceitar que ele sèpI; mm: •: ; ! jí !5 ; 3. De que forma o júri pode dar um veredicto correto? Memos Ur um veredicto correto se: 0 prisioneiro for inocente e o julgarmos 0 prisioneiro for culpad • i Decisão com base no teste de hipótese i‘;í : Aceitar H0 Rejeitar H0inocente. julaprmos culpado. Situação real H0 verdadeiro Erro de tipo v7o e o H0 falso Erro de tipo II!:ÿ. \ I ;i-r i f isto lhe ti a potência to seu teste tetes sào tipos te erro ? li; ; f P00Ef> 00 (Eí>EE>í>0 4. De que forma o júri pode dar um veredicto incorreto? Memos Ur um veredicto incorreto se: 0 prisioneiro for inocente e o julgarmos culpado. 0 prisioneiro for culpado e o juhprmos inocente. :: : i ©' i !ii fli Em sua opinião, como poderíamos achar a probabilidade de cometer um erro do tipo 1? E como poderíamos achar a probabilidade de cometer um erro do tipo II? ir ' ;ÿ h;|!| ii |í \ú -!i: sfsvocê está aqui >554 Capítulo 13tíf u I !; usando testes de hipóteseerros de tipo / e tipo U í os erros de tipo II?Vamos cowepar com os erros de tipo I Um erro de tipo II é aquele que você obtém quando aceita a hipótese nula e ela está, na verdade, errada. E como julgar um prisioneiro e considerá-lo inocente quando ele é, na verdade, culpado. Um erro de tipo I é o que você obtém quando rejeita a hipótese nula quando esta está na verdade correta. É como julgar um prisioneiro e culpá-lo quando ele é, na verdade, inocente. ‘fÀw mm está correto-. Hw erro k tipo íí é quo-ÿ-o /od *0 * vecUte*, elo- esto- emU- U, Mas èu sbujjjr. .Ínocenteÿ & JT.S so?*[I--? tvEEntão qual é a probabilidade de obter um erro de tipo I? Se você obtiver um erro de tipo I, significa que a hipótese nula deve ter sido rejeitada. Para que a hipótese nula tenha sido rejeitada, os resultados da sua amostra devem estar dentro da região crítica. :) A probabilidade de obter um erro de tipo II é normalmente representada pela letra grega (3. P(erro de tipo II) = p/“\/ \ E como achamos p?h Se você obtiver m erro k tipo I, SM estatístico. k teste kve estar a$uikhtro k retyoo crítica, / Achar a probabilidade de um erro de tipo II é mais difícil que achar a probabilidade de obter um erro de tipo I. Veja os passos envolvidos e, na próxima página, vamos mostrar a você como resolvê-los.í\ i ' Verifique se você tem um valor específico para HrSem isso, você não pode calcular a probabilidade de obter um erro de tipo II. Ache o intervalo de valores fora da região crítica do seu teste. Se sua estatística de teste foi padronizada, o intervalo de valores deve despadronizado. Ache a probabilidade de obter este intervalo de valores, considerando que Hj seja verdadeira. Em outras palavras, achamos a probabilidade de obter o intervalo de valores fora da região crítica, mas, dessa vez, usando a estatística de teste descrita por H, em vez de H0 ' A probabilidadede obter um erro de tipo I é a probabilidade de que seus resultados estejam dentro da região crítica. Como a região crítica é definida pelo nível de significância do teste, isso significa que, se o nível de significância do seu teste for a, a probabilidade de obter um erro de tipo I também deve ser a. Em outras palavras, í ser P(erro de tipo I) = a onde a é o nível de significância do teste. : Q 2 557você está aqui >556 Caoítulo 13 IF ti calculando erros de tipo I e erros de tipo II usando iesies de hipótese j$i ; Precisamos achar o intervalo de valoresUí Achando erros para o SnoreCullli!i • Agora que a hipótese alternativa Hj dá um valor específico para p, podemos seguir para o próximo passo. Precisamos achar os valores de X que estão fora da região crítica do teste de hipótese. Vimos na página 548 que a região crítica do teste é dada por Z < -1,64 — emoutras palavras, P(Z < -1,64) = 0,05. Isso significa que os valores que ficam fora da região crítica são dados por Z > -1,64. Vamos ver se conseguimos achar a probabilidade de obter erros do tipo I e do dpo II para p teste de hipótese do SnoreCull. Como lembrete, nossa estatística de teste padronizada é iaí a Mi :ís Z = X - 90I 3rj: ‘•r-: íir onde X é o número de pessoas curadas na amostra. O nível de significância do teste é 5%. / a; . Vamos cowepar com o erro de tipo 1 tiI- teses volores estòo kxtro k reqjúc crítico.. Z- N(0, 1)' !|i Um erro de tipo I é aquele que você obtém quando rejeita a hipótese nula quando ela é, na verdade, verdadeira. A probabilidade de obter este tipo de erro é a mesma do nível de significância do teste e, portanto, isso significa que A*Kí, ci iidem estoo h teoÿo aítin- íii ; ; í _ Isto t\os éi a proboiUiMe te P(erro de tipo I) = 0,05 téf&W » Upótese wk Ui oM <\o% hi p«5on5 iiio cmhs) tk é verMUn. -1.64: Despadronizando, obtemos!;S! X - 90 >-1.64!!! í o erro de tipo II?;sill 3ii'í Um erro de tipo II é aquele que você obtém quando aceita a hipótese nula quando a hipótese alternativa é verdadeira. Só podemos calculá-lo se H especificar um único valor. Por isso, vamos usar uma hipótese alternativa de p = 0,8, já que esta é a proporção de sucessos na amostra colhida pela médica. Isto significa que nossa hipótese passa a ser iiis X - 90 >-1.64 x 3í; X> -4.92 + 90 X> 85.08I. • r oj m val Vili VOW0S táW Hi: p te Ur. 0 < Ofi. ti potews tohhtj_ aroMiliM* t* ei** k LzC' II n Wtf wkx especiiM pm D hipótese Uteruitiÿ. !! Em outras palavras, teríamos aceitado a hipótese nula se 85,08 pessoas ou mais tivessem sido curadas pelo SnoreCull. A última coisa que precisamos fazer é calcular P(X > 85,08), considerando que H seja verdadeira. Dessa maneira, conseguiremos calcular a probabilidade de aceitar a hipótese nula quando, na verdade, PI, é verdadeira. Como estamos usando a distribuição normal para aproximar X, precisamos usar uma distribuição de probabilidade X ~ N(np, npq), onde n = 100 e p = 0,8. Isto nos dá l\ H„: p = 0,9 H,: p = 0,8 • I f!\ • ’ 1 r..I ?! O motivo pelo qual Hj deve especificar o valor exato para p é para que possamos calcular as probabilidades usando-o. Se usássemos uma hipótese alternativa de p < 0,9, não conseguiríamos usá-lo para calcular a probabilidade de obter um erro de tipo II. ;•!EI! Para consultoros proMíiiMes uso/ui-o o testríUícoo te prokoíCjííMes poro o hipótese olt&Mtivo pretisows te um voler exoto poro p. \ :i: V iS • X ~ N(80, 16);; MaXÊ i: % íjii ) Se você tiver de calcular a probabilidade de obter um erro de tipo II na prova, será fornecido Hj. Isso significa que você não vai ter de decidir sozinho sobre a hipótese alternativa. Se tiver de calcular este tipo de erro, ela será fornecida para você. Isso significa que, se pudermos calcular P(X > 85,08), onde X ~ N(80, 16), teremos achado a probabilidade de obter um erro de tipo II. Este cálculo é feito da mesma forma que calculamos outras probabilidades de distribuição normal, achando o escore padrão e consultando o valor nas tabelas de probabilidade normal padronizadas. ! i-í LU(:ÿ »! ;!í;i •I?fi líig ii<i ?. & í: |' você está aqui >I 558 Capítulo 13Is I mais sobre erros de tipo fi usando testes de hipótèse Ache P(erro de tipo II) Apresentando a potência Podemos achar a probabilidade de obter um erro de tipo II calculando P(X > 85,08) onde X- N(80, 16). Vamos começar achando o padrão de 85,08. Até então, vimos a probabilidade de obter diferentes tipos de nosso teste de hipótese. Porém, resta-nos estudar a potência. A potência de um teste de hipótese é a probabilidade de que rejeitemos H0 quando H0 é falsa. Em outras palavras, é a probabilidade de que tomemos uma decisão correta para rejeitar H0. erro emescore — ísto. é •form usual k taltufar o estore piMo\basita subtrair o zalor esp&Uo e kzikr peloksyio-pahfo.z = 85.08 - 80VT6 = 5.08 a Porece complicado. Espero que não seja tão difícil achá-la quanto P(erro de tipo II). 4 = 1.27 a o Isso significa que, para achar P(X > 85,08), precisamos usaT as tabelas de probabilidade padronizadas para achar P(Z > 1,27). T-31 Uma vez achada P(erro de tipo II), calcular a potência de um teste de hipótese é fácil. Rejeitar H0 quando H0 é falsa é, na verdade, o contrário de cometer um erro de tipo II. Isto significa que P(Z*1.27) = 1- P(Z< 1.27) = 1 - 0.8980 = 0.102 f{ Isto li\e d a proMílíMe k aceitar (1 hipótese rufa k que Wc ks pessoas são turaks quark ra zerkk, isso se aplica a $0% hs pessoas. 9 Potência = 1 - pEm outras palavras, t:P(erro de tipo II) = 0,102 onde P é a probabilidade de cometer um erro de tipo II. nã9 existem •- i ergunííts IdiPtas Então qual é a potência do SnoreOulI? •Preciso usar a distribuição normal sempre que eu quise* achar a probabilidade de obter um erro de tipo II? A distribuição de probabilidade que você utiliza depende da sua estatística de teste. Neste caso, nossa estatística de teste seguiu uma distribuição normal e, portanto, esta é a distribuição que utilizamos para achar P(erro de tipo II). Se a nossa estatística de teste tivesse seguido, por exemplo, uma distribuição de Poisson, teríamos usado uma distribuição de Poisson. "P - Por que achar P(erro de tipo II) é tão mais difícil que achar P(erro de tipo I)? Descobrimos que a probabilidade de obter um erro de tipo II é 0,102. Isso significa que podemos achar a potência do teste de hipótese do SnoreCull calculando É por causa da forma em que eles são definidos. O erro de tipo I é aquele que você obtém ao rejeitar erroneamente a hipótese nula. A probabilidade de obter esse tipo de erro é igual a á, 0 nível de significância do teste. O erro de tipo II é aquele que você obtém ao aceitar a hipótese nula quando, na verdade, a hipótese alternativa é verdadeira. Para achar a probabilidade de obter esse tipo de erro, é preciso começar achando 0 intervalo de valores na sua amostra que significaria que você aceita a hipótese nula. Uma vez encontrados esses valores, é preciso calcular a probabilidade de obtê-los considerando que a H seja verdadeira. % Power = 1 - P(erro de tipo ÍI) = 1-0,102 = 0,898 Em outras palavras, a potência do teste de hipótese do SnoreCull é 0,898. Isso significa que a probabilidade de que tomemos uma decisão v correta para rejeitar a hipótese nula é 0,898. Wr :rfm Míí 560 Capítulo 13 você está acwi i* 561 S usando testes da hipóteseo snorecull é uma fraude! ÍÍ5ɧSA médica está feliz Uma indústria farmacêutica e um fabricante de xarope para tosse estão tendo uma disputa. A fábrica diz que a quantidade de xarope contida em seus frascos segue uma distribuição X ~ N(355, 25), onde X é a quantidade de xarope no frasco medida em mL. A indústria farmacêutica realizou testes em uma grande amostra e descobriu que a quantidade média de xarope em 100 frascos é de 356,5 mL. Teste a hipótese de que a médiada fábrica esteja correta com um nível de significância de 1% em comparação com uma hipótese alternativa de que a quantidade média de xarope em um frasco seja maior que 355 mL. Vamos conduzi-lo através deste exercício em duas partes. Veja os três primeiros passos. Ikr.i g7cerc.ic.C0Neste capítulo, você estudou dois testes de hipótese e provou que há evidências suficientes para rejeitar as afirmações feitas pelo fabricante do remédio. Você conseguiu mostrar que, base na amostra colhida pela médica, há evidências suficientes de que o SnoreCull não cura 90% dos pacientes, conforme defendido pelo fabricante do remédio. (pmtft i) com f. 1 ’ i l i i\ VV??!.. /1' íi f5 Passo 1: Decida sobre a hipótese que você vai testar. Qual é a hipótese nula? Qual é a hipótese alternativa?ISf$lLTABLES' y WJ * V W*r:ULTIMAÿl ' MícaI SHOWN0 : 61 Passo 2: Escolha sua estatística de teste.r _I)íca; SM kipótese tii respeite»iW&t e) por isso, yuo-l é a tisfribuito-o J? Como vote pote p&troAiiar isso? I i Achei as afirmações muito boas para serem verdade e você provou que há um forte embasamento estatístico para mostrar que estou certa. Vou dormir mais tranquila hoje à noite sabendo disso. ; i 0 o s••r í - -O • !!.| |! Il Mas não acaba aí s-;k S Passo 3: Determine a região crítica da sua decisão. A região crítica está dentro da cauda inferior ou superior da distribuição? Qual é o nível de significância? Qual é o valor crítico? fc, e- ÂIContinue lendo e vamos mostrar a você quais outros tipos de testes de hipótese você pode usar. Nos vemos no Cassino do Fat Dan... //ÿ J)\ *\U %-•I %X[ m yo - i !Íí|líí £ i;. você está aqui >i-562 Capítulo 13 .,y£- I -1 solução do solution usando testes da hipóteJê -m }Uma indústria farmacêutica e um fatricante de xarope para tosse estão tendo uma disputa. A fábrica diz que a quantidade de xarope contida em seus frascos segue uma distribuição X ~ N(355, 25), onde X é a quantidade de xarope no frasco medida em mL. A indústria farmacêutica realizou testes em uma grande amostra e descobriu que a quantidade média de xarope em 100 frascos é de 356,5 rrL. Teste a hipótese de que a média da fábrica esteja correta com um nível de significância de 1% em comparação com uma hipótese alternativa de que a quantidade média de xarope em um frasco seja maior que 355 mL. Vamos conduzi-lo através deste exercício em duas partes. Veja os três primeiros passos. Este exercício continua a partir de onde paramos no último exercício. Veja os três passos finais do teste de hipótese. O que você conclui? m tZ?Jer<LÍ<LC0 (píUte 2) Passo 4: Ache o valor p da estatística de teste. Use a distribuição Z = (X- 355)/0,5, a quantidade média de xarope na amostra e lembre-se de que, desta vez, você quer saber se sua estatística de teste está dentro da cauda superior da distribuição, já que é aí que fica a região crítica. tíTcerc-ícic? 5(p/uc.õ>o (paite d) Passo 1: Decida sobre a hipótese que você vai testar. Qual é a hipótese nula? Qual é a hipótese alternativa? testw se d médio- de xorope AOS foscos e 355 ml como O tiírico- dii. Isto f\OS dí: Ho: fi » 355 Hr. /<. 7 355 Passo 2: Escolha sua estatística de teste. Passo 5: Observe se o resultado da amostra está dentro da região crítica. Lembre-se de que você está testando com um nível de significância de 1%. 7 * jX/t* O1/A), porto-rtoÿ isso siop-ifoo- que Ad kipótese AÿXd, 7 * l$/IOO) ou 7 - VÍ355) 0.1$). Mroriundo isso, oktemos lt 7 - 355 VÕZ1 * t - 1SS 0.5 Passo 6: Tome sua decisão. Existem evidências suficientes para rejeitar a hipótese nula um nível de significância de 1%? com Passo 3: Determine a região crítica da sua decisão. A região crítica está dentro da cauda inferior ou superior da distribuição? Qual é o nível de significância? Qual é o valor crítico? A kipótese o-ltewtiro- é m ? 3$$, o yue sitjrifico aue d reoio-o crítico- estí dentro h coudo superior. Queremos testorÿ com um uivei de siopiiico-ncio de /%, £, por isso) d refilo crítico- £ defini'do- por Kl 7 c) * osoi \ksondo ai tiíehs de proMlido-des, isto nos dí c • lf>i. ím outro-s p&jb/ro-S) d recaio crítico-ido-do- porl7 tslí. : J'.' £ •• V. & %.**c>2 > OZB í ti fí;í 564 Chapter 13 'GA ~l'z 565você está squi >
Compartilhar