Baixe o app para aproveitar ainda mais
Prévia do material em texto
reinaldoreinaldo@@ele.ele.pucpuc--riorio..brbr ing.jdhernandes@gmail.coming.jdhernandes@gmail.com street@ele.pucstreet@ele.puc--rioi.br jjampinho@gmail.comrioi.br jjampinho@gmail.com roxanajc@ele.pucroxanajc@ele.puc--rio.brrio.br 1 PROBESTPROBEST Aula 10Aula 10 Reinaldo Castro Souza, Reinaldo Castro Souza, PhDPhD Alexandre Alexandre StreetStreet Roxana C. Roxana C. ContrerasContreras José Daniel Hernández Vásquez, Monitor José Daniel Hernández Vásquez, Monitor José Aguinaldo M.Pinho, AuxiliarJosé Aguinaldo M.Pinho, Auxiliar 2013.22013.2 reinaldoreinaldo@@ele.ele.pucpuc--riorio..brbr 2 Testes de HipótesesTestes de Hipóteses Muitos problemas práticos exigem que a gente decida aceitar ou rejeitar alguma afirmação a respeito de um parâmetro de interesse. Esta afirmação é chamada de hipótese estatística e o procedimento de tomada de decisão é um teste de hipóteses. Muitos problemas reais podem ser formulados naturalmente como testes de hipóteses. Existe uma conexão muito próxima entre Intervalos de Confiança e Testes de Hipóteses. reinaldoreinaldo@@ele.ele.pucpuc--riorio..brbr 3 Testes de HipótesesTestes de Hipóteses Objetivo geral Inferir sobre os parâmetros desconhecidos de uma população usando uma amostra (de tamanho possivelmente reduzido). Testar hipóteses é um problema que envolve a tomada de uma decisão. Eventualmente, após “recolhermos” (ou processarmos) a informação contida numa amostra, devemos chegar a uma conclusão sobre parâmetros não observáveis relacionados à população que gerou aquela amostra. reinaldoreinaldo@@ele.ele.pucpuc--riorio..brbr 4 Testes de HipótesesTestes de Hipóteses Qual o teste ideal? É aquele que sempre toma a decisão correta. É claro que isso é uma abstração, e não existe na realidade. Na prática ... Procuraremos limitar a probabilidade de um certo tipo de erro, mas não se pode descartá- lo totalmente. reinaldoreinaldo@@ele.ele.pucpuc--riorio..brbr 5 Testes de HipótesesTestes de Hipóteses O Teste de Hipóteses é um procedimento em que procuramos testar uma hipótese inicial contra uma alternativa. A primeira hipótese (hipótese inicial) é denominada hipótese nula e representada por H0. A segunda hipótese é chamada hipótese alternativa e representada por Ha ou H1. Em geral a hipótese alternativa representa uma conjectura nova a ser testada, e a hipótese nula representa a situação usual, o "status quo". reinaldoreinaldo@@ele.ele.pucpuc--riorio..brbr 6 Testes de HipótesesTestes de Hipóteses A partir dos dados observados, como podemos decidir sobre qual hipótese (nula ou alternativa) deverá ser rejeitada? A rejeição da hipótese nula implica na aceitação da hipótese alternativa e vice-versa. Não é possível aceitar (ou rejeitar) ambas as hipóteses simultaneamente. reinaldoreinaldo@@ele.ele.pucpuc--riorio..brbr 7 Testes de HipótesesTestes de Hipóteses O que é um teste de hipóteses? É qualquer regra usada para nos levar à decisão sobre qual hipótese devemos aceitar. Podemos criar um número infinito de testes de hipóteses, o problema é identificar quais são os bons testes, e tentar obter um "algoritmo" para criar bons testes em diversas situações. Aqui estaremos concentrados em obter testes de hipóteses para a média de distribuições. reinaldoreinaldo@@ele.ele.pucpuc--riorio..brbr 8 Construção de um Teste de Construção de um Teste de HipótesesHipóteses Teste Rejeitar H0 se T(x), uma função apropriada dos Xi’s da amostra, está numa região especificada R. Do contrário, se T(x) não está na região R, não rejeitamos a hipótese nula. A região R é chamada de região de rejeição ou região crítica. reinaldoreinaldo@@ele.ele.pucpuc--riorio..brbr 9 Erros do Tipo I e IIErros do Tipo I e II A partir do que foi observado na amostra podemos tomar a decisão de aceitar ou rejeitar H0 e esta decisão não é necessariamente correta, como mostra a tabela a seguir. Decisão tomada Estado da realidade Aceitar H0 (Rejeitar H1) Rejeitar H0 (Aceitar H1) H0 é verdadeira (H1 é falsa) DECISÃO CORRETA Erro do tipo I (a) H1 é verdadeira (H0 é falsa) Erro do tipo II (b) DECISÃO CORRETA reinaldoreinaldo@@ele.ele.pucpuc--riorio..brbr 10 Erros do Tipo I e IIErros do Tipo I e II A eficiência do teste pode ser medida através das probabilidades dos erros de tipo I e II. Idealmente gostaríamos que a probabilidade de incorrermos em qualquer tipo de erro fosse zero, mas isto não é possível . Para um tamanho de amostra fixo também não é possível fixarmos ambos os erros de tipo I e II. reinaldoreinaldo@@ele.ele.pucpuc--riorio..brbr 11 Erros do Tipo I e IIErros do Tipo I e II a = Probabilidade de erro do tipo I a = Pr{ rejeitar H0 | H0 é verdadeira } a = Pr{ T(x) na região crítica | H0 é verdadeira } a é chamado de tamanho do teste ou nível de significância do teste. b = Probabilidade de erro do tipo II b = Pr{ aceitar H0 | H0 é falsa } b = Pr{ T(x) fora da região crítica| H0 é falsa } reinaldoreinaldo@@ele.ele.pucpuc--riorio..brbr 12 Potência de um TestePotência de um Teste Potência do teste (ou poder do teste) 1- b = 1- Probabilidade de erro do tipo II 1- b = Pr{ rejeitar H0 | H0 é falsa } Ou seja, a potência do teste é a probabilidade de uma decisão correta! Idealmente, a potência de um teste seria sempre alta, mas isso não é sempre verdade. reinaldoreinaldo@@ele.ele.pucpuc--riorio..brbr 13 Função Função PotênciaPotência Define-se a função potência como: K(K(qq) = Pr{ rejeitar H) = Pr{ rejeitar H00 | o valor do parâmetro é | o valor do parâmetro é qq}} O que é uma “boa” função potência?O que é uma “boa” função potência? Se q está na região da hipótese nula, a função potência deve ser pequena (pois não queremos rejeitar H0 quando ela é verdadeira). Ao contrário, se q estiver na região onde a hipótese alternativa é válida, gostaríamos que a função potência fosse alta. reinaldoreinaldo@@ele.ele.pucpuc--riorio..brbr 14 Função Característica de Função Característica de Operação (OCC)Operação (OCC) É definida como: J(q) = 1 – K(q) = Pr{ aceitar H0 | o valor do parâmetro é q } Note que, ambas K(q) e J(q) são probabilidades, e portanto limitadas ao intervalo [0,1]. A OCC é muito utilizada em Controle de Qualidade, mas não falaremos mais dela aqui neste curso. reinaldoreinaldo@@ele.ele.pucpuc--riorio..brbr 15 Testes de Hipóteses Testes de Hipóteses -- intuiçãointuição Suponha que temos uma amostra de tamanho 25 de uma Normal com variância conhecida 100 e desejamos testar as seguintes hipóteses: O que a nossa intuição nos diz? A média amostral, , é um bom estimador de , e portanto deve trazer evidência sobre qual hipótese (H0 ou H1) é verdadeira. Imagine que observamos = 50000. Dados os parâmetros (n = 25 e variância 100), este parece um número bem exagerado, e então H0 deve ser falsa. Logo, a nossa intuição parece apontar para a seguinte regra de decisão: 2: 2: 1 0 = H H X X reinaldoreinaldo@@ele.ele.pucpuc--riorio..brbr 16 Testes de Hipóteses Testes de Hipóteses -- intuiçãointuição Devemos rejeitar H0 se é grande. Ou seja, a região crítica tem a forma: A questão que surge agora é: como escolher a constante k? Uma possibilidade é arbitrar o máximo erro do tipo I, ou seja, a maior probabilidade de rejeitar H0 quando H0 é verdadeira. X kXR = reinaldoreinaldo@@ele.ele.pucpuc--riorio..brbr 17 Testes de Hipóteses Testes de Hipóteses -- intuiçãointuição Mas, esta probabilidade pode ser escrita em termos da função potência. Suponha que FIXAMOS a, a probabilidade do erro do tipo I, isto é: Por exemplo: = = === == 2 2 1 25/100 2 25/100 2 Pr2Pr Verdadeiro é HHRejeitar Pr 00 k kX kX a a k z (da N(0,1)) 1% 6.65 2.33 5% 5.29 1.64 10% 4.56 1.28 k na tabela ao lado é o valor a partir do qual rejeita-se a hipótese nula reinaldoreinaldo@@ele.ele.pucpuc--riorio..brbr 18 Testes de Hipóteses Testes de Hipóteses -- intuiçãointuição Vamos ver a função potência em cada um dos casos anteriores Funções Potência para Diversos Valores de Alfa 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% 2.0 0 2.5 0 3.0 0 3.5 0 4.0 0 4.5 0 5.0 0 5.5 0 6.0 0 6.5 0 7.0 0 7.5 0 8.0 0 8.5 0 9.0 0 9.5 0 10 .00 10 .50 11 .00 11 .50 12 .00 12 .50 k(mu) - alfa = 1% k(mu) - alfa = 5% k(mu) - alfa = 10% reinaldoreinaldo@@ele.ele.pucpuc--riorio..brbr 19 Testes de Hipóteses Testes de Hipóteses -- intuiçãointuição Conclusões Se a é muito pequeno (erro do tipo I muito pequeno, p.ex., 1%), a região de rejeição “exige” um valor de k muito grande para rejeitar a hipótese nula neste caso, e a função potência “demora muito” a crescer. À medida que passamos a aceitar erros do tipo I maiores (por ex, 5% ou 10%, a função potência já começa a rejeitar a hipótese nula “com mais facilidade”, pois o valor de k diminui. reinaldoreinaldo@@ele.ele.pucpuc--riorio..brbr 20 Testes de Hipóteses Testes de Hipóteses -- intuiçãointuição Conclusões A título de exemplo, se o valor de fosse 5 (e a hipótese nula decididamente falsa!), as probabilidades de rejeição usando as funções potência do exemplo seriam 20.4%,44.8% e 58.7% respectivamente. reinaldoreinaldo@@ele.ele.pucpuc--riorio..brbr 21 Testes de Hipóteses uniTestes de Hipóteses uni--caudaiscaudais E agora, o que acontece se estendemos o nosso teste de hipótese para: A resposta é: basicamente nada! Por que? Considere a função potência para valores de dentro da hipótese nula – estes valores estarão abaixo do a especificado. O próximo gráfico mostra esta idéia para a função potência com k = 5.29 (isto é, a = 5%) 2: 2: 1 0 H H reinaldoreinaldo@@ele.ele.pucpuc--riorio..brbr 22 Testes de Hipóteses uniTestes de Hipóteses uni--caudaiscaudais reinaldoreinaldo@@ele.ele.pucpuc--riorio..brbr 23 Testes de Hipóteses uniTestes de Hipóteses uni--caudaiscaudais Generalização Suponha que desejamos testar as seguintes hipóteses: O teste tem exatamente a forma descrita antes, em que a região de rejeição é: 01 00 : : H H kXR = reinaldoreinaldo@@ele.ele.pucpuc--riorio..brbr 24 Testes de Hipóteses uniTestes de Hipóteses uni--caudaiscaudais Como escolher k? Através do erro do tipo I (a), previamente especificado, que leva às seguintes “receitas de bolo”: Rejeitar H0 se: n zXz n X aa 0 0 conhecido n s zXz ns X aa 0 0 desconhecido e usando a hipótese de uma amostra grande, o que possibilita o uso da Normal reinaldoreinaldo@@ele.ele.pucpuc--riorio..brbr 25 Testes de Hipóteses uniTestes de Hipóteses uni--caudaiscaudais O nível de significância de um teste (a) é definido como a maior probabilidade de rejeição de H0 quando H0 é verdadeira. Ou seja, o nível de significância é o maior erro do tipo I cometido pelo teste. No exemplo anterior, a é apenas o valor da função potência em = 2. reinaldoreinaldo@@ele.ele.pucpuc--riorio..brbr 26 Testes de Hipóteses uniTestes de Hipóteses uni--caudaiscaudais Suponha que agora desejamos testar as seguintes hipóteses: Pelos mesmos argumentos que no teste anterior, faz sentido rejeitar a hipótese nula quando a média amostral for “pequena”. O que é um valor “pequeno”? Vai depender do nível de significância especificado para o teste, ou seja, do erro máximo do tipo I. 01 00 : : H H reinaldoreinaldo@@ele.ele.pucpuc--riorio..brbr 27 Testes de Hipóteses uniTestes de Hipóteses uni--caudaiscaudais “Receita de Bolo” Rejeitar H0 se: n zXz n X aa .0 0 conhecido n s zXz ns X .0 0 aa desconhecido Estes testes são válidos para amostras Normais com variância conhecida ou para amostras não necessariamente Normais de tamanho GRANDE e desconhecido. Note que estamos usando za , que é um ponto obtido da tabela N(0,1). reinaldoreinaldo@@ele.ele.pucpuc--riorio..brbr 28 Testes de Hipóteses uniTestes de Hipóteses uni--caudaiscaudais Exemplo Uma empresa produz café em pó em embalagens de 1 kg. O gerente de produção deseja saber se as embalagens realmente possuem em média 1 kg do produto e decidiu realizar um teste. Ele retirou uma amostra de 50 embalagens e obteve uma um peso médio de 0,985 kg de produto. Informações anteriores a respeito da quantidade de produto por embalagem indicaram um desvio- padrão de 0,075 kg. O gerente deseja saber, com um nível de significância de 1% se o conteúdo de cada embalagem é de, no mínimo, 1 kg. reinaldoreinaldo@@ele.ele.pucpuc--riorio..brbr 29 Teste de Hipóteses uniTeste de Hipóteses uni--caudaiscaudais Solução: As hipóteses nula e alternativa para o teste são: 1: 1:0 aH H Para Para aa = 1%, o valor de z= 1%, o valor de zaa é (a partir da tabela é (a partir da tabela normal) de 2.33. A região de rejeição é:normal) de 2.33. A região de rejeição é: 975.0 50 0.075 2.33-1 . se Rejeitar 00 = X n zXH a Como a média amostral (0,985) não é menor que Como a média amostral (0,985) não é menor que 0.975, a hipótese nula 0.975, a hipótese nula não podenão pode ser rejeitada.ser rejeitada. Se Se não fosse conhecido, deveríamos utilizar o não fosse conhecido, deveríamos utilizar o desviodesvio--padrão da amostra padrão da amostra ss.. reinaldoreinaldo@@ele.ele.pucpuc--riorio..brbr 30 A região crítica do teste anterior é: A função potência deste teste é então: Teste de Hipóteses uniTeste de Hipóteses uni--caudaiscaudais 975.0 se Rejeitar 0 XH ) ) ) ) ) = = = = = = == == 975.028.94 075.0 975.0 50 075.0 975.0 50 075.0 975.0 50Pr 075.0 975.0 50 075.0 50Pr975.0Pr é média aHRejeitar Pr 0 Z X X K reinaldoreinaldo@@ele.ele.pucpuc--riorio..brbr 31 Teste de Hipóteses uniTeste de Hipóteses uni--caudaiscaudais Pela magnitude dos números envolvidos (tamanho da amostra grande e desvio padrão pequeno) é intuitivo perceber que qualquer pequena variação na média amostral levará a grandes oscilações da função potência, o que pode ser confirmado no próximo gráfico. Função Potência - Alfa = 1% 0% 5% 10% 15% 20% 25% 30% 35% 40% 45% 50% 55% 60% 65% 70% 75% 80% 85% 90% 95% 100% 0. 90 0 0. 91 0 0. 92 0 0. 93 0 0. 94 0 0. 95 0 0. 96 0 0.97 0 0. 98 0 0. 99 0 1. 00 0 1. 01 0 1. 02 0 1. 03 0 1. 04 0 1. 05 0 1. 06 0 1. 07 0 1. 08 0 1. 09 0 1. 10 0 reinaldoreinaldo@@ele.ele.pucpuc--riorio..brbr 32 VValoralor dede p (“p value”)p (“p value”) Muitos softwares estatísticos calculam e exibem o “p-value”, que é a probabilidade de que a estatística de teste tenha valor pelo menos tão extremo (muito grande ou muito pequeno) quanto o valor encontrado na amostra. O “valor-p” (p-value) indica o menor nível de significância que levaria à rejeição da hipótese nula. Por exemplo, se o p-value é 0.04, a hipótese H0 seria rejeitada com nível 5%, mas não com nível 1%. reinaldoreinaldo@@ele.ele.pucpuc--riorio..brbr 33 Testes de Hipóteses uniTestes de Hipóteses uni--caudaiscaudais Uma outra forma para realizar o teste de hipótese é através do “p value”. A hipótese nula é rejeitada se essa probabilidade (“p value”) for menor que o nível de significância definido para o teste a value"p" se Rejeitar 0 H reinaldoreinaldo@@ele.ele.pucpuc--riorio..brbr 34 Teste de hipótese biTeste de hipótese bi--caudalcaudal Agora vamos desenvolver um teste de hipótese bi-caudal, para uma amostra grande (n 30) e da população conhecido 0 00 : : = aH H OO nívelnível dede significânciasignificância aa éé taltal que,que, sese aa hipótesehipótese nulanula forfor falsa,falsa, queremosqueremos terter umauma probabilidadeprobabilidade máximamáxima aa dede aceitáaceitá--la,la, istoisto é,é, queremosqueremos cometercometer umauma probabilidadeprobabilidade especificadaespecificada dede erroerro dodo tipotipo II.. reinaldoreinaldo@@ele.ele.pucpuc--riorio..brbr 35 Teste de hipótese biTeste de hipótese bi--caudalcaudal Mas, intuitivamente, qual a “cara” da região crítica? Devemos rejeitar H0 quando estivermos “longe” de 0, ou seja, quando o módulo da média amostral estiver muito distante de 0. Suponha inicialmente que a hipótese nula seja verdadeira. Para uma amostra grande, podemos considerar a distribuição da média amostral como praticamente Normal (pelo teorema central do limite). reinaldoreinaldo@@ele.ele.pucpuc--riorio..brbr 36 Teste de hipótese biTeste de hipótese bi--caudalcaudal Agora, dado um nível de significância a, devemos considerar dois valores de Z Um, abaixo do qual há uma probabilidade a/2 da média de uma amostra estar localizada (– za/2) Outro, acima do qual há uma probabilidade a/2 da média de uma amostra estar localizada (za/2) A regra de rejeição é: 2/2/ 0 0 ou se Rejeitar aa zZz n X ZH = reinaldoreinaldo@@ele.ele.pucpuc--riorio..brbr 37 Teste de hipótese biTeste de hipótese bi--caudalcaudal Ou seja, em termos da média amostral, a região crítica pode ser descrita como: Isto é, rejeita-se a hipótese nula se a média amostral estiver “longe” de 0. Note que, analogamente ao teste uni-caudal, a é o nível de significância do teste, isto é, o maior erro do tipo I. n zX n zXH aa 2/02/00 seou se Rejeitar monica@monica@ele.pucele.puc--rio.brrio.br 38 Teste de hipótese biTeste de hipótese bi--caudalcaudal Mas, como aqui rejeita-se a hipótese nula dos dois lados, o ponto usado da Normal é za/2 e não za (que era usado nos testes uni- caudais), de tal forma que Pr(Z > za/2 ) = a/2. “Receita de Bolo” – pontos percentuais da distribuição N(0,1) para testes bi-caudais a z 1% 2.576 5% 1.960 10% 1.645 Testes Bi-caudais reinaldoreinaldo@@ele.ele.pucpuc--riorio..brbr 39 Teste de hipótese biTeste de hipótese bi--caudalcaudal Exemplo Um fabricante de autopeças utiliza esferas de aço na fabricação de rolamentos. Essas esferas devem ter um diâmetro de 12 mm, caso contrário os rolamentos não atingem as especificações exigidas. Uma amostra de 30 rolamentos escolhidos ao acaso forneceu um diâmetro médio de 11,45 mm e um desvio-padrão de 1 mm. PodePode--se dizer que o diâmetro médio dos se dizer que o diâmetro médio dos rolamentos utilizados é igual a 12 mm com um rolamentos utilizados é igual a 12 mm com um nível de significância de 5%?nível de significância de 5%? reinaldoreinaldo@@ele.ele.pucpuc--riorio..brbr 40 Teste de hipótese biTeste de hipótese bi--caudalcaudal Solução: este é um teste de hipótese bi-caudal, com a = 0.05, onde: 12: 12:0 = aH H Para Para aa = 0,05, z = 0,05, z aa/2/2 = 1,96= 1,96 Para = 11,45mm, temos:Para = 11,45mm, temos: E portanto podemos rejeitar a hipótese nula. Note que E portanto podemos rejeitar a hipótese nula. Note que rejeitar a hipótese nula para Z < rejeitar a hipótese nula para Z < -- 1,96 é completamente 1,96 é completamente equivalente à rejeitáequivalente à rejeitá--la para: la para: 01.3 30/1 1245.11 / = = = n X Z 30 1 96.112 X X reinaldoreinaldo@@ele.ele.pucpuc--riorio..brbr 41 Teste de hipótese biTeste de hipótese bi--caudalcaudal A região crítica neste exemplo é: A função potência é, neste caso (verifique!): O gráfico desta função potência é mostrado na próxima página. Note que a potência (probabilidade de rejeitar a hipótese nula) cresce à medida que nos afastamos de = 12 e, em = 12, o valor da função potência é exatamente o erro do tipo I, estipulado em 5%. 36.12ou 64.11:se Hrejeitar é, Isto 30 1 96.112 seou 30 1 96.112 se Rejeitar 0 0 XX XXH ) ) ) = 96.112 1 30 196.112 1 30 K reinaldoreinaldo@@ele.ele.pucpuc--riorio..brbr 42 Teste de hipótese biTeste de hipótese bi--caudalcaudal Função Potência - Teste bi-caudal 0% 5% 10% 15% 20% 25% 30% 35% 40% 45% 50% 55% 60% 65% 70% 75% 80% 85% 90% 95% 100% 10 .0 0 10 .1 0 10 .2 0 10 .3 0 10 .4 0 10 .5 0 10 .6 0 10 .7 0 10 .8 0 10 .9 0 11 .0 0 11 .1 0 11 .2 0 11 .3 0 11 .4 0 11 .5 0 11 .6 0 11 .7 0 11 .8 0 11 .9 0 12 .0 0 12 .1 0 12 .2 0 12 .3 0 12 .4 0 12 .5 0 12 .6 0 12 .7 0 12 .8 0 12 .9 0 13 .0 0 reinaldoreinaldo@@ele.ele.pucpuc--riorio..brbr 43 Teste de hipótese Teste de hipótese –– amostra amostra pequenapequena Até o momento, consideramos o caso de uma amostra grande (n 30) Para n < 30 existem as seguintes possibilidades: A população é Normal e é conhecido: utilizamos o mesmo procedimento que para o caso de n 30, com conhecido (use a distribuição Normal) A população é normalmente distribuída e não é conhecido: utilizamos o mesmo procedimento que para o caso de n 30, utilizando s como estimador de e a distribuição t ao invés da Normal A população não é normalmente distribuída: aumentamos o tamanho da amostra pois não é possível usar uma aproximação Normal. reinaldoreinaldo@@ele.ele.pucpuc--riorio..brbr 44 Teste de hipótese Teste de hipótese –– amostra amostra pequenapequena Exemplo Uma revista decidiu realizar uma pesquisa sobre a qualidade de serviço em grandes aeroportos ao redor do mundo. O nível de serviço de um aeroporto é considerado superior se a nota obtida é igual ou superior a 7. Para o aeroporto de Heathrow, em Londres, foram entrevistadas 12 pessoas que atribuíram as seguintes notas: 7, 8, 10, 8, 6, 9, 6, 7, 7, 8, 9, e 8. Determine, com um nível de significância de 5%, se o serviço do aeroportode Heathrow pode ser considerado superior. Suponha que a população é normalmente distribuída. reinaldoreinaldo@@ele.ele.pucpuc--riorio..brbr 45 Teste de hipótese Teste de hipótese –– amostra amostra pequenapequena Solução: As hipóteses nula e alternativa para o teste são: 7: 7:0 aH H Com uma população normal, n < 30 e desconhecido, utilizaremos s e a distribuição t com 11 graus de liberdade para o teste. A média da amostra é 7,75 e s = 1,215 O valor de ta para o teste é 1,796 A regra de rejeição é: 796,114,2 12215,1 775,7 se Rejeita 00 == = = aa ttt ns x tH Logo, existe evidência para rejeitar a hipótese nula!Logo, existe evidência para rejeitar a hipótese nula! reinaldoreinaldo@@ele.ele.pucpuc--riorio..brbr 46 Teste de hipótese Teste de hipótese –– amostra amostra pequenapequena Exemplo Historicamente, a comissão média paga por pessoas físicas para operações em bolsa de valores através de internet numa corretora é R$15. Neste mês você fez uma pesquisa com 16 clientes da corretora e notou que a comissão média foi de R$ 10 e o desvio padrão R$ 6. Com nível de significância 10%, há evidência para afirmar que a comissão neste mês foi mais baixa que historicamente? E com nível de significância 5%? Suponha que os valores pagos são Normalmente distribuídos. reinaldoreinaldo@@ele.ele.pucpuc--riorio..brbr 47 Teste de hipótese Teste de hipótese –– amostra amostra pequenapequena Desejamos testar as hipóteses: A região crítica tem a forma: rejeitar H0 se a média amostral é pequena, e como o tamanho da amostra é pequeno devemos usar a distribuição t de Student. 15: 15: 1 0 = H H )5.115 se Rejeitar 16 6 .-15 se Rejeitar :sejaOu . se Rejeitar ,150 ,10 ,100 a a a tXH tXH n s tXH n n reinaldoreinaldo@@ele.ele.pucpuc--riorio..brbr 48 Teste de hipótese Teste de hipótese –– amostra amostra pequenapequena Do Excel: Para o teste com nível 5% usamos t15,0.05 = INVT(0.10,15) = 1.753 Para o teste com nível 1% usamos t15,0.01 = INVT(0.02,15) = 2.602 Região crítica a 5%: )5.115 se Rejeitar 16 6 .-15 se Rejeitar :sejaOu . se Rejeitar ,150 ,10 ,100 a a a tXH tXH n s tXH n n reinaldoreinaldo@@ele.ele.pucpuc--riorio..brbr 49 Teste de hipótese Teste de hipótese –– exercício 1 exercício 1 (para casa)(para casa) Uma amostra de 50 botas usadas por soldados em uma operação numa região de deserto apresentou uma vida média de 1,24 anos e desvio padrão de 0,55 anos. Por outro lado, em situações normais o tempo médio de vida nominal destas botas é 1,40 anos.. Podemos afirmar, do nível de significância de 5% que a utilização destas botas no deserto diminui o seu tempo de vida? Resposta: Rejeita H0 ao nível de significância de 5%. ]645,1[]057,2[ 0 == ZZComo 0Z0Z reinaldoreinaldo@@ele.ele.pucpuc--riorio..brbr 50 Teste de hipótese Teste de hipótese –– exercício 2 exercício 2 (para casa)(para casa) Uma amostra de 9 medidas de participação de manganês numa liga de ferro-manganês apresentou média de 84% e desvio padrão de 1,2%. Assumindo que a distribuição populacional da participação do manganês na liga é NORMAL com média 80. Teste ao nível de 5% que esta participação de manganês é superior a 80%. Resposta: Rejeita H0 ao nível de significância de 5%. ]86,1[]10[ 0 == tTComo reinaldoreinaldo@@ele.ele.pucpuc--riorio..brbr 51 Teste de hipótese Teste de hipótese –– exercício 3 exercício 3 (para casa)(para casa) A performance nominal de uma ferramenta de corte é de 2000 peças cortadas por vida útil. Uma amostra de 6 destas ferramentas apresentou performance em suas vidas úteis de 2010, 1980, 1920, 2005, 1975 e 1950 peças cortadas. Teste, ao nível de significância de 1% se esta performance nominal é inferior a 2000 peças cortadas. Resposta: Aceita H0 ao nível de significância de 1%. ]365,3[]921,1[ 0 == tTComo reinaldoreinaldo@@ele.ele.pucpuc--riorio..brbr 52 Teste de hipótese Teste de hipótese –– exercício 4 exercício 4 (para casa)(para casa) Uma amostra aleatória de 100 pneus produzida por uma fábrica apresentou duração média de 32.000 km com desvio padrão de 2000 km. . Teste se o tempo médio de vida dos pneus é de 30.000 km conforme afirma o fabricante, os níveis de 1% e 10%. Resposta: Rejeita H0 ao nível de significância de 1%. Rejeita H0 ao nível de significância de 10%. ]578,2[]10[ 0 == ZZComo ]645,1[]10[ 0 == ZZComo reinaldo@reinaldo@ele.pucele.puc--rio.brrio.br 53 Revisão Revisão –– Teste de média para Teste de média para grandes amostras (n≥30)grandes amostras (n≥30) Suposições: Xi ~ N (µ, 2 ) Então, para X = (Xi,...,Xn) a.a. (n) Hipótese nula: dodesconhecié n Nx conhecidoé n Nx s 2 2 2 2 ;~ ;~ 00 : =H reinaldo@reinaldo@ele.pucele.puc--rio.brrio.br 54 Revisão Revisão –– Teste de média para Teste de média para grandes amostras (n≥30)grandes amostras (n≥30) Estatística do teste: Hipóteses alternativas: Regiões criticas para os 3 casos; ao nível de significância de (1-α). Verificamos o valor de Z nas regiões criticas: )1,0(~)1,0(~ 00 N n s x ZouN n x Z = = )()()( ::: 010101 UnicaudalUnicaudalBicaudal HHH reinaldo@reinaldo@ele.pucele.puc--rio.brrio.br 55 Revisão Revisão –– Teste de média para Teste de média para grandes amostras (n≥30)grandes amostras (n≥30) 1 1 -- αα 1 1 -- αα 1 1 -- αα reinaldo@reinaldo@ele.pucele.puc--rio.brrio.br 56 O comprimento de parafusos produzidos por uma máquina tem média nominal do fabricante de 1,5020 cm. Uma amostra de 100 parafusos (desta máquina), forneceu uma média amostral de 1,5032 cm e desvio padrão de 0,0050 cm. Verificar, aos níveis de 5% e 1% se a média nominal se mantém. Exemplo 1:Exemplo 1: reinaldo@reinaldo@ele.pucele.puc--rio.brrio.br 57 Solução Exemplo 1:Solução Exemplo 1: Suposições: v.a. comprimento dos parafusos: Xi ~ N (µ, 2 ) Desvio padrão nominal conhecido: = 0,005 Estatística do teste: 5020,1:5020,1: 10 = HH n x Z 0= reinaldo@reinaldo@ele.pucele.puc--rio.brrio.br 58 Solução Exemplo 1:Solução Exemplo 1: Substituindo: Regiões críticas: Como: Z = 2,4 > 1,96, então, Rejeita H0 ao nível de 5% Z = 2,4 < 2,57, então, Aceita H0 ao nível de 1% 4,2 105 5020,15032,1 4 = = x Z %1=a %5=a reinaldo@reinaldo@ele.pucele.puc--rio.brrio.br 59 Exemplo 2:Exemplo 2: Uma substancia contém 25% de certo elemento em sua composição. Uma amostra de 50 destas substancia foram analisadas para estimar o percentual deste elemento. Tem sido encontrado uma média de 25,2% e um desvio padrão amostral de 1%. Pode-se então dizer que a participação deste elemento na substancia é superior aos 25% nominais? (ao nível de 5%) reinaldo@reinaldo@ele.pucele.puc--rio.brrio.br 60 Solução exemplo 2:Solução exemplo 2: Suposições: v.a. participação do elemento: Xi ~ N (µ, 2 ) Dados: Estatística do teste: )1,0(~0 N n s x Z = )(%25:%25: 50%1%2,25 10 unilateralHH nsx = === reinaldo@reinaldo@ele.pucele.puc--rio.brrio.br 61 Solução exemplo 2:Solução exemplo 2: Estatística do teste: Decisão: 41,1 50 1 252,25 = =Z 1,645%5=a Como Z=1,41 < 1,645 Então, Aceita H0 ao nível de 5% reinaldo@reinaldo@ele.pucele.puc--rio.brrio.br 62 Teste de diferencia de Teste de diferencia de médiasmédias Seja as v.a. X e y independentes X ~ N (µx, x2 ) e Y ~ N (µY, Y2 ) Se X e Y são independentes, então a v.a. D = X-Y é tal que: Se X= a.a. (nX) de X e Y = a.a. (nY) de Y, então: ) 22;~ YXYXND ) ) nn Y Y X X YX Nyx 22 ;~ (*) reinaldo@reinaldo@ele.pucele.puc--rio.brrio.br 63 Teste de diferencia de Teste de diferencia de médiasmédias Caso as variâncias x2 e Y2 não sejam conhecidas, então: ) ) 11 ;~ 22 n S n S Y Y X X YX Nyx reinaldo@reinaldo@ele.pucele.puc--rio.brrio.br 64 Teste de diferencia de Teste de diferencia de médiasmédias Teste de Hipóteses: A estatística do teste seria, usando a expressão (*) do slide 11, seria: YX YXYX YX H HContraH H = : :: : 1 10 1 )1,0(~ )()( 22 N nn yx Z Y Y x x Yx = reinaldo@reinaldo@ele.pucele.puc--rio.brrio.br 65 Teste de diferencia de Teste de diferencia de médiasmédias E, sob a hipótese nula (µX = µY): Observação: Caso as variâncias sejam desconhecidas o denominador seria: )1,0(~ )( 22 N nn yx Z Y Y x x = 11 22 Y Y x x nn SS reinaldo@reinaldo@ele.pucele.puc--rio.brrio.br 66 Exemplo 3:Exemplo 3: Duas máquinas A e B produzem parafusos teoricamente idênticos. Uma amostra de tamanho 100 da máquina A apresentar média 2,0413 cm e desvio padrão 0,0064 cm. Outra amostra de tamanho 200 da máquina B apresentou média 2,0433 cm e desvio padrão 0,0058 cm. Esta diferencia das médias produzidas pelas duas máquinas e significante ao nível de α = 1%? reinaldo@reinaldo@ele.pucele.puc--rio.brrio.br 67 Solução exemplo 3:Solução exemplo 3: Suposições: Dados: Quer-se testar: 100 100 = = B A n n BA BA H H = : : 1 0 ) )s s AA A BB B Nx Nx 2 2 ;~ ;~ reinaldo@reinaldo@ele.pucele.puc--rio.brrio.br 68 Solução exemplo 3:Solução exemplo 3: Estatística do teste: Decisão: 62,2 199 )0058,0( 99 )064,0( 0433,24413,2 19999 2222 = = = ss BA BA xx Z Como -2,62 < -2,57 Então, H0 é rejeitada!! o nível de 1% %1=a reinaldo@reinaldo@ele.pucele.puc--rio.brrio.br 69 Teste de Hipótese para a Variância de Teste de Hipótese para a Variância de uma População Normal uma População Normal Suposição: Seja X ~ N (µ, 2 ) Queremos testar a seguinte hipótese nula simples: Conta as possíveis alternativas: 2 0 2 0 : =H 2 0 2 2 0 2 2 0 2 1 : H reinaldo@reinaldo@ele.pucele.puc--rio.brrio.br 70 Seja X̰ = (X1, X2,..., Xn ) uma aa (n) da v.a. X͂. Estatística do Teste : א* dada por: Onde S² é a variância amostral estimada por: Regra de Decisão: ) 2 0 2 * .1 c Sn = ) )1 1 2 2 = = n XX S n i i n X X n i i == 1 ) )1~ 20* nverdH cc reinaldo@reinaldo@ele.pucele.puc--rio.brrio.br 71 Exemplo: Decisão ao nível de α %: Região de Aceitação H0 Região de Rejeição H0 20212020 :: = HContraH ) % 2 a ) % 2 a reinaldo@reinaldo@ele.pucele.puc--rio.brrio.br 72 Decisão ao nível de α %: Região de Aceitação H0 Região de Rejeição H0 Obs.: Caso então: ) %a Região de Rejeição H0 Região de Aceitação de H0 20 2 1 : H 20212020 :: = HcontraH ) %a reinaldo@reinaldo@ele.pucele.puc--rio.brrio.br 73 Teste de variância de duas Teste de variância de duas populações Normais (Teste F)populações Normais (Teste F) Teste para verificar se as variâncias de duas populações normais são iguais. Deve ser usado antes de testar se as médias são iguais. Suposições: X ~ N (µx, x2 ) e Y ~ N (µY, Y2 ) X e Y são independentes e X= a.a. (nX) de X e Y = a.a. (nY) reinaldo@reinaldo@ele.pucele.puc--rio.brrio.br 74 Teste de variância de duas Teste de variância de duas populações Normais(Teste F)populações Normais(Teste F) Teste de Hipóteses: Se SX2 e SY2 são as variâncias amostrais de X e Y, então, a estatística: Decisão )(:: 22 1 22 0 = ouHContraH YXYX 1;1);(~)/( 0 == YYXXYX nnFVerdHf s s X Xf 2 2 = reinaldo@reinaldo@ele.pucele.puc--rio.brrio.br 75 Exemplo 4:Exemplo 4: Tem-se duas amostras A e B com valores e tamanho nA=nB =10 Teste a hipótese de nível α = 5%: A 50,8 51,0 49,5 52,1 51,8 47,4 51,5 48,2 49,0 48,0 B 49,3 48,9 49,2 50,0 48,8 49,5 49,2 49,6 48,8 47,5 221220 :: BABA HContraH = reinaldo@reinaldo@ele.pucele.puc--rio.brrio.br 76 Solução exemplo 4:Solução exemplo 4: Suposições: Estimando as médias e variâncias de A e B, obtem-se: Estatística do teste: 451,0;08,49;97,2;93,49 22 ==== BBAA SXSX ) ) 2 2 ;~ ;~ BB AA NB NA 59,6 451,0 97,2 2 2 === s s X Xf reinaldo@reinaldo@ele.pucele.puc--rio.brrio.br 77 Solução exemplo 4:Solução exemplo 4: Decisão: Observação: )9;9(~)/( 0 == YXFVerdaderaHf 1 / 4,03 4,03 (da Tabela F) 2,5%2,5% Como f = 6,59 > 4,03 Então, H0 é rejeitada!! o nível de 5% ),( 1),( 1 YX YX F F a a reinaldoreinaldo@@ele.ele.pucpuc--riorio..brbr 78 Teste de hipótese Teste de hipótese –– exercício 5(para casa)exercício 5(para casa) Quer-se testar dois métodos de aprendizados de estatística entre estudantes de pós-graduação. Para tal, foram selecionados aleatoriamente dois grupos de 50 alunos e ambos foram submetidos ao teste de avaliação. O grupo “A” apresentou nota média de 120 pontos e um desvio padrão de 12 pontos, enquanto o grupo “B” apresentou média de 112 pontos de 9 pontos. Se MU(A) é a média verdadeira do desempenho do grupo “A” e MU(B) do grupo “B”, teste aos níveis de 1% e 5% que MU(A)-MU(B) contra a alternativa MU(A)≠MU(B). Resposta: Rejeita H0 ao nível de significância de 1%. Rejeita H0 ao nível de significância de 5%. ]578,2[]73,3[ 0 == ZZComo ]96,1[]73,3[ 0 == ZZComo reinaldoreinaldo@@ele.ele.pucpuc--riorio..brbr 79 Teste de hipótese Teste de hipótese –– exercício 6(para casa)exercício 6(para casa) Uma indústria desenvolveu e implantou um novo programa de prevenção de acidentes. Para tal foram coletados de oito filiais desta indústria o número de horas perdidas na empresa devido a acidente de trabalho durante 1 ano, conforme tabela abaixo: Resposta: Aceita H0 ao nível de significância de 1%. Aceita H0 ao nível de significância de 5%. ]624,2[]295,0[ 0 == tTComo ]761,1[]295,0[ 0 == tTComo Filial 1 2 3 4 5 6 7 8 Antes do programa 38,5 69,2 15,3 9,7 120,9 47,6 78,8 52,1 Depois do programa 28,7 62,2 28,9 0 93,5 49,6 86,5 40,2 reinaldoreinaldo@@ele.ele.pucpuc--riorio..brbr 80 Teste de hipótese Teste de hipótese –– exercício 7(para casa)exercício 7(para casa) Tem-se dois aparelhos para medir a pressão arterial de pacientes. Para testá-los, mediu-se com dois aparelhos as pressões de 10 pacientes, obtendo-se: Resposta: Aceita H0 ao nível de significânciade 1%. Aceita H0 ao nível de significância de 5%. Paciente 1 2 3 4 5 6 7 8 9 10 Pressão "A" 13,6 11,5 14,2 14,0 12,3 14,7 13,3 15,0 13,8 14,8 Pressão "B" 14,1 11,7 14,1 14,5 12,7 14,6 13,5 15,2 13,5 15,1 ]878,2[]346,0[ 0 == tTComo ]101,2[]346,0[ 0 == tTComo reinaldoreinaldo@@ele.ele.pucpuc--riorio..brbr 81 Teste de hipótese Teste de hipótese –– exercício exercício 88(para casa)(para casa) O peso de sacos de trigo comercializado por uma fábrica é especificado como uma v.a. Normal com Variância Nominal de 1,5 Kg². Pegou-se uma amostra de 10 sacos e a Variância Estimada nesta amostra foi de 3 Kg². Podemos dizer aos níveis de 1% e 5% que a Variância Nominal aumentou? Ou seja, testar a hipótese: Resposta: Aceita H0 ao nível de significância de 1%. Rejeita H0 ao nível de significância de 5%. ]7,21)9([]18[ 2 99,0 2 == ccComo ]92,16)9([]18[ 2 95,0 2 == ccComo reinaldo@reinaldo@ele.pucele.puc--rio.brrio.br 82 TABELA DISTRIBUIÇÃO FTABELA DISTRIBUIÇÃO F reinaldo@reinaldo@ele.pucele.puc--rio.brrio.br 83 TABELA DISTRIBUIÇÃO FTABELA DISTRIBUIÇÃO F reinaldo@reinaldo@ele.pucele.puc--rio.brrio.br 84 TABELA DISTRIBUIÇÃO FTABELA DISTRIBUIÇÃO F 85 0Z z z) z z) z z) z z) 0.00 0.5000 0.62 0.7324 1.24 0.8925 1.86 0.9686 0.02 0.5080 0.64 0.7389 1.26 0.8962 1.88 0.9699 0.04 0.5160 0.66 0.7454 1.28 0.8997 1.90 0.9713 0.06 0.5239 0.68 0.7517 1.30 0.9032 1.92 0.9726 0.08 0.5319 0.70 0.7580 1.32 0.9066 1.94 0.9738 0.10 0.5398 0.72 0.7642 1.34 0.9099 1.96 0.9750 0.12 0.5478 0.74 0.7704 1.36 0.9131 1.98 0.9761 0.14 0.5557 0.76 0.7764 1.38 0.9162 2.00 0.9772 0.16 0.5636 0.78 0.7823 1.40 0.9192 2.02 0.9783 0.18 0.5714 0.80 0.7881 1.42 0.9222 2.04 0.9793 0.20 0.5793 0.82 0.7939 1.44 0.9251 2.06 0.9803 0.22 0.5871 0.84 0.7995 1.46 0.9279 2.08 0.9812 0.24 0.5948 0.86 0.8051 1.48 0.9306 2.10 0.9821 0.26 0.6026 0.88 0.8106 1.50 0.9332 2.12 0.9830 0.28 0.6103 0.90 0.8159 1.52 0.9357 2.14 0.9838 0.30 0.6179 0.92 0.8212 1.54 0.9382 2.16 0.9846 0.32 0.6255 0.94 0.8264 1.56 0.9406 2.18 0.9854 0.34 0.6331 0.96 0.8315 1.58 0.9429 2.20 0.9861 0.36 0.6406 0.98 0.8365 1.60 0.9452 2.22 0.9868 0.38 0.6480 1.00 0.8413 1.62 0.9474 2.24 0.9875 0.40 0.6554 1.02 0.8461 1.64 0.9495 2.26 0.9881 0.42 0.6628 1.04 0.8508 1.66 0.9515 2.28 0.9887 0.44 0.6700 1.06 0.8554 1.68 0.9535 2.30 0.9893 0.46 0.6772 1.08 0.8599 1.70 0.9554 2.32 0.9898 0.48 0.6844 1.10 0.8643 1.72 0.9573 2.34 0.9904 0.50 0.6915 1.12 0.8686 1.74 0.9591 2.36 0.9909 0.52 0.6985 1.14 0.8729 1.76 0.9608 2.38 0.9913 0.54 0.7054 1.16 0.8770 1.78 0.9625 2.40 0.9918 0.56 0.7123 1.18 0.8810 1.80 0.9641 2.42 0.9922 0.58 0.7190 1.20 0.8849 1.82 0.9656 2.44 0.9927 0.60 0.7257 1.22 0.8888 1.84 0.9671 2.46 0.9931 σZ μ X monicamonica@@ele.ele.pucpuc--riorio..brbr 86 monica@monica@ele.pucele.puc--rio.brrio.br 87 monica@monica@ele.pucele.puc--rio.brrio.br 88
Compartilhar