Baixe o app para aproveitar ainda mais
Prévia do material em texto
23/05/2016 1 TESTES DE HIPÓTESES Introdução • Os processos que habilitam a decidir se aceitam ou rejeitam as hipóteses formuladas, ou determinar se a amostra observada difere, de modo significativo, dos resultados esperados, são denominados de Testes de Hipóteses ou Testes de Significância. 23/05/2016 2 • HIPÓTESE NULA - É aquela Hipótese Estatística, prefixada, formulada sobre o parâmetro populacional estudado, com o único propósito de ser rejeitada ou invalidada. É representada por Ho. • HIPÓTESE ALTERNATIVA - São quaisquer hipóteses que difiram da Hipótese Nula. Utilizaremos uma hipótese alternativa, representada por H1. Erros do tipo I e tipo II Decisões possíveis Estados possíveis Ho verdadeira Ho falsa Aceitação de Ho Decisão correta Erro do tipo II Rejeição de Ho Erro do tipo I Decisão correta 23/05/2016 3 Nível de significância • Ao testar uma hipótese estabelecida, a probabilidade máxima com a qual se sujeitaria a correr o risco de um erro do tipo I é denominada de Nível de Significância do Teste. Essa probabilidade, representada freqüentemente por αααα, é geralmente especificada antes da extração de quaisquer amostras, de modo que os resultados obtidos não influenciem na escolha. Tipos de testes de hipóteses • Consideremos θθθθ o parâmetro estudado e θθθθo o valor inicialmente suposto para θθθθ. • Se nas hipótese formuladas forem do tipo: • O teste de hipóteses é denominado de TESTE BILATERAL – Ho � θ = θo – H1 � θ ≠ θo • O teste é denominado de TESTE UNILATERAL Á DIREITA – Ho � θ = θo – H1 � θ > θo • O teste é denominado de TESTE UNILATERAL Á ESQUERDA – Ho � θ = θo – H1 � θ < θo 23/05/2016 4 Etapas de um teste de hipóteses • a) Formular as hipóteses H0 e H1. • b) Escolher a variável de teste. • c) Arbitrar o nível de significância. • d) Determinar a regiões de aceitação e rejeição de H0 a partir do nível de significância arbitrado em (c). • e) Aceitar ou rejeitar H0 em função da estatística de teste e das regiões de aceitação e rejeição determinadas na letra (d). Teste da média populacional • No caso do teste da média µ de uma população, as hipóteses são: • H0 : µ = µ0 • H1: > < ≠ direito) unilateral (teste esquerdo) unilateral (teste bilateral) (teste 0 0 0 µµ µµ µµ 23/05/2016 5 Teste da média populacional • VARIÂNCIA POPULACIONAL CONHECIDA • Nas hipóteses acima, µ0 é valor de µ sob a hipótese nula H0. A variável de teste é a variável normal padronizada associada a (se amostragem é com reposição) • se a amostragem é sem reposição • a hipótese H0 será rejeitada num nível de significância α se Zx < −Z ou Zx >Z (teste bilateral), Zx< −Z (teste unilateral esquerdo) ou Zx>Z (teste unilateral direito). n XZ X σ µ0− = 1 0 − − − = N nN n XZ X σ µ Exemplo • Supõe-se que o preço de determinado artigo nos pontos de venda de certa localidade tem distribuição normal com média igual a R$105,00 e desvio padrão igual a R$10,00. Suspeita-se que, devido ao aumento da demanda, o preço do referido artigo tenha aumentado na região. Para verificar se isto ocorreu, um pesquisador analisou os preços deste artigo em 40 pontos de venda da localidade, escolhidos aleatoriamente, constatando que nos pontos de venda pesquisados o preço médio do artigo é R$110,00. Qual é a conclusão do pesquisador, admitindo-se um nível de significância de 5%? 23/05/2016 6 Solução a) Hipóteses H0: µ = 105 H1: µ > 105 A hipótese nula H0 considera que o aumento da demanda não provocou aumento do preço enquanto que a hipótese alternativa H1 admite que o aumento da demanda provocou aumento do preço porque o preço médio do artigo na amostra de 40 pontos de venda é R110,00 maior que R$105,00. b) Escolha da variável teste Não tendo sido informado o tamanho da população (número de ponto de venda na localidade) admite-se amostragem com reposição ou amostragem sem reposição de uma população infinita ou população finita muito maior que a amostra. Como n = 40 > 30, a variável teste é a variável normal padronizada XZ sendo seu valor dado por n x z X σ µ0− = onde ,110=x 1050 =µ e σ = 10. Com estes dados tem-se que 16,3 40 10 105110 = − =Xz Solução a) Regra de decisão Sendo o teste unilateral direito e α = 0,05, o valor crítico da variável XZ é tal XZ que 05,0)( 05,0 => zZP X como ilustra o gráfico a seguir onde o nível de significância é representado pela área sombreada. Figura 5.10 Pelo gráfico acima tem-se que .45,0)0( 05,0 =<< zZP X Pela tabela do apêndice 1 tem-se que .64,105,0 =z Então a regra de decisão é: aceitar H0 se 64,1≤Xz e rejeitar H0 se .64,1>Xz b) Conclusão Como 16,305,0 =z > 1,64 rejeita-se H0 num nível de significância de 5%, admitindo-se então que o aumento da demanda provocou aumento do preço do artigo na localidade. 23/05/2016 7 Teste da média populacional • VARIÂNCIA POPULACIONAL DESCONHECIDA • Nas hipóteses acima, µ0 é valor de µ sob a hipótese nula H0. A variável de teste é a variável T DE Student com gl=n-1 associada a (se amostragem é com reposição) • se a amostragem é sem reposição • a hipótese H0 será rejeitada num nível de significância α se Tx < −T ou Tx >T (teste bilateral), Tx< −T (teste unilateral esquerdo) ou Tx>T (teste unilateral direito). n S XT 0µ−= 1 0 − − − = N nN n S XT µ Exemplo • O tempo gasto na montagem de determinado equipamento é 85 minutos. Os operários foram submetidos a um processo de reciclagem com o objetivo de melhorar a produtividade. Para verificar se isso ocorreu, o pesquisador observou o tempo gasto na montagem de 10 unidades deste equipamento, escolhidas ao acaso na linha de produção, obtendo os seguintes valores, em minutos: 81, 84, 82, 78, 77, 83, 79, 79, 76, 85. Considerando-se um nível de significância de 5%, pode-se afirmar que após a reciclagem dos operários houve aumento da produtividade? 23/05/2016 8 Solução a) Hipóteses H0: µ = 85 H1: µ < 85 A hipótese nula H0 considera que a produtividade dos operários não aumentou enquanto que a hipótese alternativa H1 admite que a produtividade dos operários aumentou porque acredita-se que com a reciclagem o tempo médio gasto na montagem do equipamento será menor que 85 minutos. b) Escolha da variável teste Não tendo sido informado o tamanho da população (número de ponto de venda na localidade) admite-se amostragem com reposição ou amostragem sem reposição de uma população infinita ou população finita muito maior que a amostra. Sendo desconhecido o desvio padrão populacional σ, a variável teste é a variável XT sendo seu valor dado por n s x t X 0µ− = onde Solução 23/05/2016 9 Solução 2) Testes de hipóteses para σ² (variância). Teste de Hipóteses Estatística de teste. 2 2 2 )1( σ χ Sn −= é uma variável aleatória qui-quadrado com n-1 graus de liberdade Tabela da Distribuição Qui - quadrado 23/05/2016 10 2) Testes de hipóteses para σ² (variância). Teste de Hipóteses Observação quanto aos gráficos: a)Teste bilateral ou bicaudal b)Teste lateral à direita c)Teste lateral à esquerda Exemplo • A média da vida útil para uma amostra de n = 10 lâmpadas é x = 4000 horas, com um desvio padrão de s = 200 horas. Supõe-se que a vida útil das lâmpadas, em geral, seja normalmente distribuída. Suponha que, antes de ser coletada a amostra, foi feita a hipótese de que o desvio padrão não era maior do que σ = 150. Com base nos resultados amostrais, teste tal hipótese ao nível de significância de 1%. 23/05/201611 Solução Hipóteses Ho: σ² ≤ 22500 (σ² = 150²) Ha: σ² > 22500 Variável teste χ² = = = 16 Da tabela da Distribuição Quiquadrado, obtemos o valor de χ²(α = 1% ; gl = 10- 1 = 9) = 21,67. Conclusão: Como χ²calculado =16 < χ²tabelado = 21,67, aceita-se Ho, ao nível de significância de 1%. Ou seja, o desvio padrão não é maior que σ = 150. 3) Testes de hipóteses para proporção. Teste de Hipóteses a proporção amostral para amostras grandes (n≥30), seleção com substituição. n xip ∑= ^ )1,0(~)1( )1( ;~ N n PZ n Np P pipi pi pipi pi − − = − 23/05/2016 12 Teste de Hipóteses a) H0: pi = pi 0 Teste Bilateral H1: pi ≠ pi 0 -zα/2 zα/20 b) H0: pi = pi 0 Teste unilateral à esquerda H1: pi < pi 0 -zα 0 c) Ho: pi = pi 0 Teste unilateral à direita H1: pi > pi 0 Teste de Hipóteses zα0 23/05/2016 13 Exemplo • Uma máquina está regulada quando produz 3% de peças defeituosas. Uma amostra aleatória de 80 peças selecionadas ao acaso apresentou 3 peças defeituosas. Teste ao nível de 2% a hipótese de que a máquina está regulada. Solução 23/05/2016 14 Solução (cont.) Definimos, assim, uma região de aceitação (RA) e uma região crítica (RC) para a hipótese nula, Ho: Conclusão: O valor Zc = 0,393 situa-se à esquerda do valor de Zα = 2,055 obtido na tabela. Portanto está na região de aceitação da hipótese nula. Assim, aceita-se Ho, ou seja, p = 0,03, ao nível de significância de 2% a máquina está regulada. Teste de hipóteses da diferença entre duas medias populacionais • O procedimento associado com o teste da diferença entre duas medias é similar ao utilizado no teste de um valor hipotético da media populacional, exceto que se utiliza o erro padrão da diferença entre medias como base para se determinar o valor da estatística de teste associada com os resultados das amostras. <− >− ≠− =− 0: 0: 0: 0: 211 211 211 210 µµ µµ µµ µµ H H H H 23/05/2016 15 Populações normais com variâncias conhecidas Observação: Quando as variâncias populacionais forem desconhecidas, mas (n 1 + n2) ? 30, usamos as suas estimativas não tendenciosas (variâncias amostrais 21s e 22s ), no cálculo da estatística de teste tz : ( ) 2 2 2 1 2 1 21 n s n s xx zt + − = 2 2 2 1 2 1 2121 )(( nn xx z σσ µµ + −−− = Populações normais com variâncias equivalentes e desconhecidas Quando as variâncias de duas populações Normais forem desconhecidas, mas iguais e (n 1 + n 2) < 30, usamos uma media ponderada das variâncias amostrais 21s e 2 2s , no cálculo da estatística de teste tt : A distribuição t é utilizada com um número de graus de liberdade igual a gl = n 221 −+n ( ) ( ) ( ) 2 1111 21 2 22 2 11 21 21 −+ −+− + − = nn snsn nn xx t t 23/05/2016 16 Populações normais com variâncias desiguais e desconhecidas Teste de hipóteses da diferença entre duas medias populacionais com observações emparelhadas • Fazemos testes de comparação de médias para dados emparelhados (amostras pareadas), obtidas de populações Normais, quando os resultados das duas amostras são relacionados dois a dois, de acordo com algum critério que fornece uma influência entre os vários pares e sobre os valores de cada par. • Para cada par definido, o valor da primeira amostra está claramente associado ao respectivo valor da segunda amostra. 23/05/2016 17 Teste de hipóteses da diferença entre duas medias populacionais com observações emparelhadas Para observações emparelhadas, ou amostras pareadas, o teste apropriado para a diferença entre duas médias consiste em determinar primeiro a diferença “d” entre cada par de valores, e então testar a hipótese nula de que a média das diferenças na população é zero. Então, do ponto de vista de cálculo, o teste é aplicado a uma única amostra de valores d. A média e o desvio padrão da amostra de valores “d” são obtidos pelas fórmulas: n d d ∑= 2 2 d n d S d −= ∑ Teste de hipóteses da diferença entre duas medias populacionais com observações emparelhadas A estimativa do erro padrão da diferença média entre observações emparelhadas é obtida pela fórmula: Uma vez que o erro padrão da diferença média é calculado com base nas diferenças observadas em amostras emparelhadas (logo σ é desconhecido) e uma vez que os valores de d geralmente podem ser admitidos como tendo distribuição Normal, as distribuições t são apropriadas para testar a hipótese nula de que 0=dµ . A distribuição t nesse caso terá um número de graus de liberdade igual a: gl = n-1 A estatística de teste, então, será dada por: Observe que, se n?30 utilizamos z t (distribuição normal) no lugar de tt 1 ˆ − = n Sd dσ d d t o d t σ µ ˆ − = 23/05/2016 18 Exemplo Dez cobaias foram submetidas ao tratamento de engorda com certa ração. Os pesos em gramas, antes e após o teste são dados a seguir (supõe-se que provenham de distribuições normais). A 1% de significância, podemos concluir que o uso da ração contribuiu para o aumento do peso médio dos animais? Cobaia 1 2 3 4 5 6 7 8 9 10 Antes 635 704 662 560 603 745 698 575 633 669 Depois 640 712 681 558 610 740 707 585 635 682 Solução • Trata-se de uma situação em que queremos comparar as MÉDIAS DE DUAS distribuições normais, supondo que se trata da MESMA população, mas em dois momentos diferentes: antes e após um tratamento de engorda. • Aplicar um TESTE DE DIFERENÇAS ENTRE MÉDIAS POPULACIONAIS, PARA DADOS PAREADOS (MESMA POPULAÇÃO: ANTES E DEPOIS). 23/05/2016 19 Solução a) b) Através dos valores das amostras antes e depois, calcular a diferença di entre cada par de valores, onde di = Xantes - Xdepois. Para o conjunto sob análise teremos: Cobaia 1 2 3 4 5 6 7 8 9 10 Antes 635 704 662 560 603 745 698 575 633 669 Depois 640 712 681 558 610 740 707 585 635 682 di -5 -8 -19 2 -7 5 -9 -10 -2 -13 di2 25 64 361 4 49 25 81 100 4 169 Solução Para o presente problema: 23/05/2016 20 Solução c) d) • • Para valores maiores de -2,82 aceitaremos H0 (ou seja a dieta não faz efeito, a diferença entre as médias é nula). Se tn-1 for menor do que - 2,82 rejeitaremos H0 (a média DEPOIS aumentou demais em relação à média ANTES da dieta para que a diferença seja devida apenas ao acaso. Claro que há uma chance de 1% de que venhamos a rejeitar H0 sendo ela verdadeira. Solução e) Conforme foi visto anteriormente, se o valor da variável de teste fosse MENOR do que -2,82 a hipótese H0 seria rejeitada: Assim, REJEITAMOS H0 a 1% de significância. Assim, concluímos com 99% de confiança (ou uma chance de erro de 1%) que a dieta contribuiu para o aumento do peso médio dos animais. 23/05/2016 21 Teste da igualdade de variâncias Em muitas aplicações deseja-se verificar se duas populações têm variâncias iguais (populações homocedásticas) ou variâncias diferentes (populações heterocedásticas). Suponha que uma variável normalmente distribuída tenha variância 21σ numa população 1 e 2 2σ noutra população 2. Por uma questão de referência, considera-se índice 1 para a maior variância e índice 2 para a menor. Em algumas aplicações deseja-se saber se 21σ > 22σ . As hipóteses do teste são: H0: 21σ = 2 2σ (Populações homocedásticas) H1: 21σ > 2 2σ(Populações heterocedásticas) O teste se baseia na razão de variâncias amostrais 2 2 2 1 S S Teste da igualdade de variâncias sendo esta a variável de teste neste caso sendo 21s e 2 2s as estimativas de 2 1σ e 2 2σ , respectivamente. A hipótese H0 é rejeitada num nível de significância α se 1,1; 21 −−> nnc FF α e aceita em caso contrário, sendo 1,1; 21 −−> nnc FF α o valor crítico da variável teste. 23/05/2016 22 Exemplo • Um produtor de café dispõe de duas máquinas de para ensacar o produto. O produtor desconfia que a variação do peso líquido na primeira máquina é maior que na segunda. Para verificar se isto está ocorrendo, pesam- se 61 sacas da primeira máquina e 41 sacas da segunda, escolhidas aleatoriamente e constata-se que as variâncias dos pesos nas duas amostras são 25 kg2 e 8 kg2, respectivamente. Considerando-se um nível de significância de 5%, pode-se afirmar que a variação do peso líquido na primeira máquina é maior que na segunda máquina? Solução Hipóteses Sejam 21σ e 22σ as variâncias do peso líquido na primeira e na segunda máquinas, respectivamente. As hipótese do teste são H0: 22 2 1 σσ = H1: 22 2 1 σσ > Pela hipótese nula H0 a variação do peso líquido na primeira máquina é a mesma nas duas máquinas enquanto que pela hipótese alternativa H1 a variação do peso líquido na primeira máquina é maior que na segunda. b) Escolha da variável teste A variável teste tem distribuição F com 11 −n graus de liberdade no numerador e 12 −n graus de liberdade no denominador e seu valor é 2 2 2 1 s s Fc = sendo 2521 =s e .821 =s Então o valor da variável teste para esta amostra é 8 25 =cF ∴ 12,3=cF 23/05/2016 23 Solução c) Regra de decisão Sendo α = 0,05, 60111 =−= nν e 40111 =−= nν , onde n1 é o número de sacas escolhidas aleatoriamente da primeira máquina e n2 é o número de sacas escolhidas aleatoriamente da segunda máquina, o valor crítico da variável teste, 40;60;0 5,0F , é tal que 05,0)( 40;60;05,0 => FFP c , sendo esta situação ilustrada no gráfico a seguir onde a área sombreada representa o nível de significância. Figura 5.15 Observando-se o gráfico acima tem-se pela tabela do apêndice 4 que .64,140;60;05,0 =F Então a regra de decisão é: aceitar H0 se 64,1≤cF e rejeitá-la em caso contrário. d) Decisão Como 12,3=cF > 1,64, rejeita-se H0 no nível de significância de 5%. Conclui-se então que a variação do peso líquido das sacas na máquina 1 é maior que a variação do peso líquido na máquina 2.
Compartilhar