Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 TESTES DE HIPÓTESES Introdução • Os processos que habilitam a decidir se aceitam ou rejeitam as hipóteses formuladas, ou determinar se a amostra observada difere, de modo significativo, dos resultados esperados, são denominados de Testes de Hipóteses ou Testes de Significância. 2 • HIPÓTESE NULA - É aquela Hipótese Estatística, prefixada, formulada sobre o parâmetro populacional estudado, com o único propósito de ser rejeitada ou invalidada. É representada por Ho. • HIPÓTESE ALTERNATIVA - São quaisquer hipóteses que difiram da Hipótese Nula. Utilizaremos uma hipótese alternativa, representada por H1. Erros do tipo I e tipo II Decisões possíveis Estados possíveis Ho verdadeira Ho falsa Aceitação de Ho Decisão correta Erro do tipo II Rejeição de Ho Erro do tipo I Decisão correta 3 Nível de significância • Ao testar uma hipótese estabelecida, a probabilidade máxima com a qual se sujeitaria a correr o risco de um erro do tipo I é denominada de Nível de Significância do Teste. Essa probabilidade, representada freqüentemente por , é geralmente especificada antes da extração de quaisquer amostras, de modo que os resultados obtidos não influenciem na escolha. Tipos de testes de hipóteses • Consideremos o parâmetro estudado e o o valor inicialmente suposto para . • Se nas hipótese formuladas forem do tipo: • O teste de hipóteses é denominado de TESTE BILATERAL – Ho = o – H1 o • O teste é denominado de TESTE UNILATERAL Á DIREITA – Ho = o – H1 o • O teste é denominado de TESTE UNILATERAL Á ESQUERDA – Ho = o – H1 o 4 Etapas de um teste de hipóteses • a) Formular as hipóteses H0 e H1. • b) Escolher a variável de teste. • c) Arbitrar o nível de significância. • d) Determinar a regiões de aceitação e rejeição de H0 a partir do nível de significância arbitrado em (c). • e) Aceitar ou rejeitar H0 em função da estatística de teste e das regiões de aceitação e rejeição determinadas na letra (d). Teste da média populacional • No caso do teste da média de uma população, as hipóteses são: • H0 : = 0 • H1: direito) unilateral (teste esquerdo) unilateral (teste bilateral) (teste 0 0 0 5 Teste da média populacional • VARIÂNCIA POPULACIONAL CONHECIDA • Nas hipóteses acima, 0 é valor de sob a hipótese nula H0. A variável de teste é a variável normal padronizada associada a (se amostragem é com reposição) • se a amostragem é sem reposição • a hipótese H0 será rejeitada num nível de significância se Zx < Z ou Zx >Z (teste bilateral), Zx<Z (teste unilateral esquerdo) ou Zx>Z (teste unilateral direito). n X Z X 0 1 0 N nN n X ZX Exemplo • Supõe-se que o preço de determinado artigo nos pontos de venda de certa localidade tem distribuição normal com média igual a R$105,00 e desvio padrão igual a R$10,00. Suspeita-se que, devido ao aumento da demanda, o preço do referido artigo tenha aumentado na região. Para verificar se isto ocorreu, um pesquisador analisou os preços deste artigo em 40 pontos de venda da localidade, escolhidos aleatoriamente, constatando que nos pontos de venda pesquisados o preço médio do artigo é R$110,00. Qual é a conclusão do pesquisador, admitindo-se um nível de significância de 5%? 6 Solução a) Hipóteses H0: = 105 H1: > 105 A hipótese nula H0 considera que o aumento da demanda não provocou aumento do preço enquanto que a hipótese alternativa H1 admite que o aumento da demanda provocou aumento do preço porque o preço médio do artigo na amostra de 40 pontos de venda é R110,00 maior que R$105,00. b) Escolha da variável teste Não tendo sido informado o tamanho da população (número de ponto de venda na localidade) admite-se amostragem com reposição ou amostragem sem reposição de uma população infinita ou população finita muito maior que a amostra. Como n = 40 > 30, a variável teste é a variável normal padronizada XZ sendo seu valor dado por n x zX 0 onde ,110x 1050 e = 10. Com estes dados tem-se que 16,3 40 10 105110 Xz Solução a) Regra de decisão Sendo o teste unilateral direito e = 0,05, o valor crítico da variável X Z é tal X Z que 05,0)( 05,0 zZP X como ilustra o gráfico a seguir onde o nível de significância é representado pela área sombreada. Figura 5.10 Pelo gráfico acima tem-se que .45,0)0( 05,0 zZP X Pela tabela do apêndice 1 tem-se que .64,105,0 z Então a regra de decisão é: aceitar H0 se 64,1Xz e rejeitar H0 se .64,1Xz b) Conclusão Como 16,305,0 z > 1,64 rejeita-se H0 num nível de significância de 5%, admitindo-se então que o aumento da demanda provocou aumento do preço do artigo na localidade. 7 Teste da média populacional • VARIÂNCIA POPULACIONAL DESCONHECIDA • Nas hipóteses acima, 0 é valor de sob a hipótese nula H0. A variável de teste é a variável T DE Student com gl=n-1 associada a (se amostragem é com reposição) • se a amostragem é sem reposição • a hipótese H0 será rejeitada num nível de significância se Tx < T ou Tx >T (teste bilateral), Tx<T (teste unilateral esquerdo) ou Tx>T (teste unilateral direito). n S X T 0 1 0 N nN n S X T Exemplo • O tempo gasto na montagem de determinado equipamento é 85 minutos. Os operários foram submetidos a um processo de reciclagem com o objetivo de melhorar a produtividade. Para verificar se isso ocorreu, o pesquisador observou o tempo gasto na montagem de 10 unidades deste equipamento, escolhidas ao acaso na linha de produção, obtendo os seguintes valores, em minutos: 81, 84, 82, 78, 77, 83, 79, 79, 76, 85. Considerando-se um nível de significância de 5%, pode-se afirmar que após a reciclagem dos operários houve aumento da produtividade? 8 Solução a) Hipóteses H0: = 85 H1: < 85 A hipótese nula H0 considera que a produtividade dos operários não aumentou enquanto que a hipótese alternativa H1 admite que a produtividade dos operários aumentou porque acredita-se que com a reciclagem o tempo médio gasto na montagem do equipamento será menor que 85 minutos. b) Escolha da variável teste Não tendo sido informado o tamanho da população (número de ponto de venda na localidade) admite-se amostragem com reposição ou amostragem sem reposição de uma população infinita ou população finita muito maior que a amostra. Sendo desconhecido o desvio padrão populacional , a variável teste é a variável XT sendo seu valor dado por n s x t X 0 onde Solução 9 Solução 3) Testes de hipóteses para proporção. Teste de Hipóteses a proporção amostral para amostras grandes (n≥30), seleção com substituição. n xip ^ )1,0(~ )1( )1( ;~ N n PZ n Np P 10 Teste de Hipóteses a) H0: π = π 0 Teste Bilateral H1: π ≠ π 0 -z/2 z/20 b) H0: π = π 0 Teste unilateral à esquerda H1: π < π 0 -z 0 c) Ho: π = π 0 Teste unilateral à direita H1: π > π 0 Teste de Hipóteses z0 11 Exemplo • Uma máquina está regulada quando produz 3% de peças defeituosas. Uma amostra aleatória de 80 peças selecionadas ao acaso apresentou 3 peças defeituosas. Teste ao nível de 2% a hipótese de que a máquina está regulada. Solução 12 Solução (cont.) Conclusão: O valor Zc = 0,393 situa-se à esquerda do valor de Zα = 2,055 obtido na tabela. Portanto está na região de aceitação da hipótese nula. Assim, aceita-se Ho, ou seja, p = 0,03, aonível de significância de 2% a máquina está regulada. 2) Testes de hipóteses para σ² (variância). Teste de Hipóteses Estatística de teste. 2 2 2 )1( Sn é uma variável aleatória qui-quadrado com n-1 graus de liberdade Tabela da Distribuição Qui - quadrado 13 2) Testes de hipóteses para σ² (variância). Teste de Hipóteses Observação quanto aos gráficos: a)Teste bilateral ou bicaudal b)Teste lateral à direita c)Teste lateral à esquerda Exemplo • A média da vida útil para uma amostra de n = 10 lâmpadas é x = 4000 horas, com um desvio padrão de s = 200 horas. Supõe-se que a vida útil das lâmpadas, em geral, seja normalmente distribuída. Suponha que, antes de ser coletada a amostra, foi feita a hipótese de que o desvio padrão não era maior do que σ = 150. Com base nos resultados amostrais, teste tal hipótese ao nível de significância de 1%. 14 Solução Teste de hipóteses da diferença entre duas medias populacionais • O procedimento associado com o teste da diferença entre duas medias é similar ao utilizado no teste de um valor hipotético da media populacional, exceto que se utiliza o erro padrão da diferença entre medias como base para se determinar o valor da estatística de teste associada com os resultados das amostras. 0: 0: 0: 0: 211 211 211 210 H H H H 15 Populações normais com variâncias conhecidas 2 2 2 1 2 1 2121 )()( nn xx z Observação: Quando as variâncias populacionais forem desconhecidas, mas (n1+n2)≥30, usam-se as suas estimativas não tendenciosas (variâncias amostras s1 2 e s2 2, no cálculo da estatística de teste zt: Exemplo 16 Solução Populações normais com variâncias equivalentes e desconhecidas 17 Exemplo Solução 18 Teste de hipóteses da diferença entre duas medias populacionais com observações emparelhadas • Fazemos testes de comparação de médias para dados emparelhados (amostras pareadas), obtidas de populações Normais, quando os resultados das duas amostras são relacionados dois a dois, de acordo com algum critério que fornece uma influência entre os vários pares e sobre os valores de cada par. • Para cada par definido, o valor da primeira amostra está claramente associado ao respectivo valor da segunda amostra. Teste de hipóteses da diferença entre duas medias populacionais com observações emparelhadas Para observações emparelhadas, ou amostras pareadas, o teste apropriado para a diferença entre duas médias consiste em determinar primeiro a diferença “d” entre cada par de valores, e então testar a hipótese nula de que a média das diferenças na população é zero. Então, do ponto de vista de cálculo, o teste é aplicado a uma única amostra de valores d. A média e o desvio padrão da amostra de valores “d” são obtidos pelas fórmulas: n d d 2 2 d n d Sd 19 Teste de hipóteses da diferença entre duas medias populacionais com observações emparelhadas Exemplo Dez cobaias foram submetidas ao tratamento de engorda com certa ração. Os pesos em gramas, antes e após o teste são dados a seguir (supõe-se que provenham de distribuições normais). A 1% de significância, podemos concluir que o uso da ração contribuiu para o aumento do peso médio dos animais? Cobaia 1 2 3 4 5 6 7 8 9 10 Antes 635 704 662 560 603 745 698 575 633 669 Depois 640 712 681 558 610 740 707 585 635 682 20 Solução • Trata-se de uma situação em que queremos comparar as MÉDIAS DE DUAS distribuições normais, supondo que se trata da MESMA população, mas em dois momentos diferentes: antes e após um tratamento de engorda. • Aplicar um TESTE DE DIFERENÇAS ENTRE MÉDIAS POPULACIONAIS, PARA DADOS PAREADOS (MESMA POPULAÇÃO: ANTES E DEPOIS). Solução a) b) Através dos valores das amostras antes e depois, calcular a diferença di entre cada par de valores, onde di = Xantes - Xdepois. Para o conjunto sob análise teremos: Cobaia 1 2 3 4 5 6 7 8 9 10 Antes 635 704 662 560 603 745 698 575 633 669 Depois 640 712 681 558 610 740 707 585 635 682 di -5 -8 -19 2 -7 5 -9 -10 -2 -13 di 2 25 64 361 4 49 25 81 100 4 169 21 Solução Para o presente problema: Solução c) d) • • Para valores maiores de -2,82 aceitaremos H0 (ou seja a dieta não faz efeito, a diferença entre as médias é nula). Se tn-1 for menor do que - 2,82 rejeitaremos H0 (a média DEPOIS aumentou demais em relação à média ANTES da dieta para que a diferença seja devida apenas ao acaso. Claro que há uma chance de 1% de que venhamos a rejeitar H0 sendo ela verdadeira. 22 Solução e) Conforme foi visto anteriormente, se o valor da variável de teste fosse MENOR do que -2,82 a hipótese H0 seria rejeitada: Assim, REJEITAMOS H0 a 1% de significância. Assim, concluímos com 99% de confiança (ou uma chance de erro de 1%) que a dieta contribuiu para o aumento do peso médio dos animais. Teste da igualdade de variâncias Em muitas aplicações deseja-se verificar se duas populações têm variâncias iguais(populações homocedásticas) ou variâncias diferentes (populações heterocedásticas). Suponha que uma variável normalmente distribuída tenha variância 21 numa população 1 e 2 2 noutra população 2. Por uma questão de referência, considera-se índice 1 para a maior variância e índice 2 para a menor. Em algumas aplicações deseja-se saber se 21 > 2 2 . As hipóteses do teste são: H0: 2 1 = 2 2 (Populações homocedásticas) H1: 21 > 2 2 (Populações heterocedásticas) O teste se baseia na razão de variâncias amostrais 2 2 2 1 S S 23 Teste da igualdade de variâncias sendo esta a variável de teste neste caso sendo 2 1s e 2 2s as estimativas de 2 1 e 2 2 , respectivamente. A hipótese H0 é rejeitada num nível de significância se 1,1; 21 nnc FF e aceita em caso contrário, sendo 1,1; 21 nnc FF o valor crítico da variável teste. Exemplo • Um produtor de café dispõe de duas máquinas para ensacar o produto. O produtor desconfia que a variação do peso líquido na primeira máquina é maior que na segunda. Para verificar se isto está ocorrendo, pesam- se 61 sacas da primeira máquina e 41 sacas da segunda, escolhidas aleatoriamente e constata-se que as variâncias dos pesos nas duas amostras são 25 kg e 8 kg, respectivamente. Considerando-se um nível de significância de 5%, pode-se afirmar que a variação do peso líquido na primeira máquina é maior que na segunda máquina? 24 Solução Hipóteses Sejam 2 1 e 2 2 as variâncias do peso líquido na primeira e na segunda máquinas, respectivamente. As hipótese do teste são H0: 2 2 2 1 H1: 2 2 2 1 Pela hipótese nula H0 a variação do peso líquido na primeira máquina é a mesma nas duas máquinas enquanto que pela hipótese alternativa H1 a variação do peso líquido na primeira máquina é maior que na segunda. b) Escolha da variável teste A variável teste tem distribuição F com 11 n graus de liberdade no numerador e 12 n graus de liberdade no denominador e seu valor é 2 2 2 1 s s Fc sendo 2521 s e .8 2 1 s Então o valor da variável teste para esta amostra é 8 25 cF 12,3cF Solução c) Regra de decisão Sendo =0,05, 60111 n e 40111 n , onde n1 é o número de sacas escolhidas aleatoriamente da primeira máquina e n2 é o número de sacas escolhidas aleatoriamente da segunda máquina, o valor crítico da variável teste, 40;60;0 5,0F, é tal que 05,0)( 40;60;05,0 FFP c , sendo esta situação ilustrada no gráfico a seguir onde a área sombreada representa o nível de significância. Figura 5.15 Observando-se o gráfico acima tem-se pela tabela do apêndice 4 que .64,140;60;05,0 F Então a regra de decisão é: aceitar H0 se 64,1cF e rejeitá-la em caso contrário. d) Decisão Como 12,3cF >1,64, rejeita-se H0 no nível de significância de 5%. Conclui-se então que a variação do peso líquido das sacas na máquina 1 é maior que a variação do peso líquido na máquina 2.
Compartilhar