Baixe o app para aproveitar ainda mais
Prévia do material em texto
- 1 - Uanderson Rebula de Oliveira Estatística Aplicada É possível testar afirmativas acerca de populações? CAPÍTULO 6 TESTE DE HIPÓTESE - 2 - Uanderson Rebula de Oliveira Estatística Aplicada Conceitos introdutórios TESTE DE HIPÓTESE é um procedimento usado para testar se a afirmação acerca de uma população é verdadeira ou não, com base em dados amostrais. Uma hipótese é uma suposição quanto ao valor de um parâmetro populacional. O teste de hipótese é tão somente uma regra de decisão para ACEITAR ou REJEITAR uma hipótese qualquer (uma suposição, uma afirmação), com base nos elementos amostrais. EXEMPLO. A FIAT afirma que o consumo de combustível do Pálio Fire é, em média, de 18 km/L. Uma revista decide testar essa afirmação e analisa 50 veículos obtendo uma média de 17 km/L, que é diferente da informada pelo fabricante. 9 O resultado de 17km/L não garante que a afirmação do fabricante seja falsa, pois você está se baseando em dados amostrais. Para haver esta garantia só realizando um censo (toda a população), o que é teoricamente impossível. 9 O que devemos avaliar, com auxílio do Teste de Hipótese, é se a afirmação é verdadeira ou não, com base nos dados amostrais. Organização das hipóteses, Erros de decisão, Nível de significância e Tipos de testes Organização das hipóteses. Com base no exemplo, podemos formular duas hipóteses: “Nula” e “Alternativa”. Na Hipótese Nula , diremos que a média populacional é igual aquela que se supõe verdadeira; e na Hipótese Alternativa, que nasce de uma desconfiança, diremos que a média populacional não será igual àquela tida como verdadeira. Ora, quando um valor A não é igual a um valor B, haverá três possibilidades: 1ª) A ≠ B ou 2ª) A > B ou 3ª) A < B. Estamos falando, obviamente, da Hipótese Alternativa (Ha). Então, resumindo, temos: Hipótese Nula: H0 → sugere que a afirmação é verdadeira. Hipótese Alternativa: Ha → sugere que a afirmação é falsa. No exemplo, temos que: H0 : µ = 18 km/L Ha : µ < 18 km/L As hipóteses Nula e Alternativa sempre serão confrontadas. De todo o exposto, já podemos tirar algumas conclusões: H0 será sempre de igualdade: H0 : µ = 18 km/L ...e é aquela que será testada. Ha será sempre de desigualdade: Ha : µ ≠ 18 km/L Ha: µ < 18 km/L Ha : µ > 18 km/L Nota: O que definirá se Ha trará um sinal ≠ ou > ou < será o resultado obtido na amostra. Erros de decisão. Uma vez realizado o teste com a Hipótese Nula (H0), poderão advir dois resultados: H0 é verdadeira, sendo, portanto, ACEITA. Decisão correta H0 é falsa, devendo, pois, ser REJEITADA. → (ao rejeitar H0, obviamente aceitamos a Hipótese Alternativa Ha). Entretanto, ao realizar um teste, o pesquisador pode errar de duas formas: H0 é verdadeira, mas será REJEITADA. → Chamamos de ERRO TIPO I. (é o mesmo que condenar um inocente! O réu disse a verdade, mas seus argumentos foram rejeitados). Erros de decisão H0 é falsa, mas será ACEITA. → Chamamos de ERRO TIPO II. (é o mesmo que inocentar um culpado! O réu mentia, mas seus argumentos foram aceitos). Nível de significância α. Note que o erro Tipo I é pior pois condenar um inocente é algo terrível, e este erro o pesquisador deve evitar a todo o custo! Porém, há sempre uma probabilidade de cometê-lo. Esta probabilidade é chamada de Nível de Significância α (alfa). Portanto: O NÍVEL DE SIGNIFICÂNCIA α é a PROBABILIDADE de se cometer um ERRO TIPO I, devendo ser sempre a menor possível. Normalmente, usamos um Nível de Significância de 10% (0,10); 5% (0,05); ou 1% (0,01). Mas pode-se usar qualquer α. Tipos de Testes. Usamos a curva normal (ou t) para realizar os testes, sendo três tipos possíveis, e o que será usado depende do sinal presente na hipótese alternativa Ha. Teste Unilateral à esquerda Teste Unilateral à direita Teste Bilateral H0 : µ = 18 km/L Ha : µ < 18 km/L α → 5% Este teste será usado quando se tem um valor mínimo aceitável. Sinal usado em Ha: <. H0 : µ = 18 km/L Ha : µ > 18 km/L α → 5% Este teste será usado quando se tem um valor máximo aceitável. Sinal usado em Ha: >. H0 : µ = 18 km/L Ha : µ ≠ 18 km/L α → 5% Será usado quando se tem um valor dentro de um intervalo aceitável. Sinal usado em Ha: ≠. TOMANDO A DECISÃO: A Região de rejeição (demonstrada no gráficos) é o conjunto de todos os valores da estatística de teste que nos fazem rejeitar a Hipótese Nula (H0). Se a estatística de teste cair nesta região, diremos que a afirmativa do fabricante é falsa, o que fará com que rejeitemos a Hipótese Nula (H0). Mas, se a estatística de teste cair na Região de aceitação, diremos que a afirmativa é verdadeira. O termo “estatística de teste” é feito por meio de cálculos que serão apresentados a seguir. O nível de significância α → 5% (demonstrado nos gráficos) é apenas um exemplo, pois podemos usar também outros níveis. Região de rejeição α → 0,05 (0,5-0,05=0,45) → Z=-1,65 18km/L Região de aceitação 0,95 Região de rejeição α → 0,05 Z=+1,65 → (0,5-0,05=0,45) 0,95 18km/L Região de aceitação Região de rejeição α → 0,025 2 Z=-1,96 Z=+1,96 → (0,95/2 = 0,4750) 0,95 18km/L Região de aceitação Região de rejeição α →0,025 2 - 3 - Uanderson Rebula de Oliveira Estatística Aplicada Teste de Hipótese para média (amostras grandes n > 30) (Distribuição Normal z) Usamos a Distribuição Normal (z) para realizar o teste de hipótese para amostra maior que 30. Quando o desvio padrão é conhecido, mesmo com amostra menor que 30, também podemos usar a Normal. Embora tenha 3 tipos de testes, na prática aplicamos um ou outro, nunca os três conjuntamente. Mostraremos a aplicação dos três testes em problemas diferentes. A estatística de teste usada para média é: (n > 30) n s xz μ−= x = média amostral z = Estatística de teste µ = média Hipotética (H0) s = desvio padrão n = tamanho da amostra EXEMPLO 1. TESTE UNILATERAL À ESQUERDA. A FIAT afirma que o consumo de combustível do Pálio Fire é, em média, de 18 km/L. Uma revista decide testar essa afirmação e analisa 50 veículos da mesma marca, obtendo uma média de 17 km/L com desvio padrão de 3km/L. Testar a hipótese, contra a alternativa de que o consumo é menor que 18km/L, com Nível de Significância de 6%. 1º passo: Formular as hipóteses: H0 : µ = 18 km/L Ha : µ < 18 km/L 2º passo: Definir o tipo de teste a ser usado: Como a média amostral foi 17km/L, temos um valor mínimo aceitável. O sinal é <, logo, usamos o unilateral à esquerda. 3º passo: Encontrar escore z que estabelece os limites de Rejeição/Aceitação: α=6% (0,06) | 0,5 – 0,06 = 0,44 → z = -1,56 Ao procurar 0,44 na tabela Normal, encontramos z = - 1,56 (como o teste é “unilateral à esquerda”, o escore z será negativo). 4º passo: Desenhar as Regiões de Rejeição e de Aceitação, em função do escore z (nível α) : 5º passo: Calcular a estatística de teste: n s xz μ−=50 3 1817z −= = -2,35 6º passo: Verifique se a estatística de teste z caiu na Região de rejeição: 7º e último passo: Tomada de decisão: Note que a estatística de teste z caiu na Região de rejeição. Então, você deverá REJEITAR A HIPÓTESE NULA (Ho). Ou seja, não se pode aceitar que o consumo médio de combustível do Pálio Fire 1.0 é de 18 km/L, contra a hipótese de que seja menor que este valor, com uma probabilidade de erro de 6%. EXEMPLO 2. TESTE UNILATERAL À DIREITA A FIAT afirma que o consumo de combustível do Pálio Fire é, em média, de 18 km/L. Uma revista decide testar a afirmação e analisa 35 veículos da mesma marca, obtendo uma média de 18,5 km/L com desvio padrão de 2,5 km/L.. Testar a hipótese, contra a alternativa de que o consumo é maior que 18km/L, com Nível de Significância de 4%. 1º passo: Formular as hipóteses: H0 : µ = 18 km/L Ha : µ > 18 km/L 2º passo: Definir o tipo de teste a ser usado: Como a média amostral foi 18,5km/L, temos um valor máximo aceitável. O sinal é >, logo, usamos o unilateral à direita. 3º passo: Encontrar escore z que estabelece os limites de Rejeição/Aceitação: α=4%(0,04) | 0,5 – 0,04 = 0,46 → z = +1,75 Ao procurar 0,46 na tabela Normal, encontramos z = +1,75 (como o teste é “unilateral à direita”, z será positivo). 4º passo: Desenhar as Regiões de Rejeição e de Aceitação, em função do escore z (nível α) : 5º passo: Calcular a estatística de teste: n s xz μ−= 35 52 18518z , , −= = +1,18 6º passo: Verifique se a estatística de teste z caiu na Região de rejeição: 7º e último passo: Tomada de decisão: Note que a estatística de teste z não caiu na Região de Rejeição. Então, você deverá ACEITAR A HIPÓTESE NULA (Ho). Ou seja, pode-se aceitar que o consumo médio de combustível do Pálio Fire 1.0 é de 18 km/L, contra a hipótese de que seja maior que este valor, com uma probabilidade de erro de 4%. Região de rejeição α → 0,06 -1,56 18km/L Região de aceitação 0,94 Região de rejeição α → 0,04 z=+1,75 0,96 18km/L Região de aceitação Região de rejeição α → 0,06 -2,35 -1,56 18km/L Região de aceitação 0,94 -3z -2z -1z 0 +1z +2z +3z estatística de teste (obtido no 5º passo) Região de rejeição α → 0,04 z=+1,75 0,96 18km/L Região de aceitação z=+1,18 -3z -2z -1z 0 +1z +2z +3z estatística de teste (obtido no 5º passo) - 4 - Uanderson Rebula de Oliveira Estatística Aplicada EXEMPLO 3. TESTE BILATERAL. A FIAT afirma que o consumo de combustível do Pálio Fire é, em média, de 18 km/L. Uma revista decide testar a afirmação e analisa 42 veículos da mesma marca, obtendo uma média de 16,8 km/L com desvio padrão de 2 km/L. Testar a hipótese, contra a alternativa de que o consumo não é de 18km/L, com Nível de Significância de 10%. 1º passo: Formular as hipóteses: H0 : µ = 18 km/L Ha : µ ≠ 18 km/L 2º passo: Definir o tipo de teste a ser usado: A idéia não é testar se é menor ou maior. Queremos testar um intervalo aceitável. O sinal é ≠, logo, usamos o Bilateral. 3º passo: Encontrar escore z que estabelece os limites de Rejeição/Aceitação: α=10% | 0,90/2 = 0,45 → z = -1,65 e +1,65 Ao procurar 0,45 na tabela Normal, encontramos z = ±1,65 (como o teste é “Bilateral”, usamos z positivo e negativo). 4º passo: Desenhar as Regiões de Rejeição e de Aceitação, em função do escore z (nível α) : 5º passo: Calcular a estatística de teste: n s xz μ−= 42 2 18816z −= , = -3,88 6º passo: Verifique se a estatística de teste z caiu na Região de rejeição: 7º e último passo: Tomada de decisão: Note que a estatística de teste z caiu na Região de Rejeição. Então, você deverá REJEITAR A HIPÓTESE NULA (Ho). Ou seja, não se pode aceitar que o consumo médio de combustível do Pálio Fire 1.0 é de 18 km/L, contra a hipótese de que seja diferente deste valor, com uma probabilidade de erro de 10%. Teste de Hipótese para média (amostras pequenas n ≤ 30) (Distribuição t de Student) Usamos a Distribuição t de Student (t) para realizar o teste de hipótese para amostra menor ou igual a 30. A estatística de teste usada para média é: (n ≤ 30) n s xt μ−= x = média amostral µ = média Hipotética (H0) s = desvio padrão n = tamanho da amostra t = Estatística de teste t Student Efetuar o Teste usando a Distribuição t de Student é similar a efetuar o Teste com a Normal z. Difere- se apenas no 3º passo, onde usamos n - 1 graus de liberdade e a tabela t para encontrar o limite de Rejeição/Aceitação. EXEMPLO 4. A FIAT afirma que o consumo de combustível do Pálio Fire é, em média, de 18 km/L. Uma revista decide testar essa afirmação e analisa 22 veículos da mesma marca, obtendo uma média de 17,4 km/L com desvio padrão de 1,7km/L. Testar a hipótese de que o consumo é menor que 18km/L, com Nível de Significância de 5%. 1º passo: Formular as hipóteses: H0 : µ = 18 km/L Ha : µ < 18 km/L 2º passo: Definir o tipo de teste a ser usado: Como a média amostral foi 17,4km/L, temos um valor mínimo aceitável. O sinal é <, logo, usamos o unilateral à esquerda. 3º passo: Encontrar t que estabelece os limites de Rejeição/Aceitação: gl=n-1→ 22–1=21 → -1,721 | α=5% (0,05) Analise a tabela t de Student na próxima página: Usando Unilateral, α=0,05 com g.l.= 21, encontramos t = 1,721. (como o teste é “unilateral à esquerda”, t será negativo). 4º passo: Desenhar as Regiões de Rejeição e de Aceitação, em função de t (nível α) : 5º passo: Calcular a estatística de teste: n s xt μ−= 22 71 18417t , , −= = -1,65 6º passo: Verifique se a estatística de teste t caiu na Região de rejeição: 7º e último passo: Tomada de decisão: Note que a estatística de teste z não caiu na Região de rejeição. Então, você deverá ACEITAR A HIPÓTESE NULA (Ho). Ou seja, pode-se aceitar que o consumo médio de combustível do Pálio Fire 1.0 é de 18 km/L, contra a hipótese de que seja menor que este valor, com uma probabilidade de erro de 5%. Região de rejeição α → 0,05 2 Z=-1,65 Z=+1,65 (0,90/2 = 0,45) 0,90 18km/L Região de aceitação Região de rejeição α →0,05 2 Região de rejeição α → 0,05 -1,721 18km/L Região de aceitação 0,95 Região de rejeição α → 0,05 -1,721 18km/L Região de aceitação 0,95 -3z -2z -1z 0 +1z +2z +3z -1,65 A única diferença da t para z está no 3º passo. z=-3,88 -3z -2z -1z 0 +1z +2z +3z Região de rejeição α → 0,05 2 Z=-1,65 Z=+1,65 0,90 18km/L Região de aceitação Região de rejeição α →0,05 2 estatística de teste (obtido no 5º passo) - 5 - Uanderson Rebula de Oliveira Estatística Aplicada TABELA DISTRIBUIÇÃO t DE STUDENT (PARCIAL) Confiança, c 50% 80% 90% 95% 98% 99% Unilateral, α 0,25 0,10 0,05 0,025 0,01 0,005 Bilateral, α 0,50 0,20 0,10 0,05 0,02 0,01 g.l. 1 1,000 3,078 6,314 12,71 31,82 63,66 2 0,816 1,886 2,920 4,303 6,965 9,925 3 0,765 1,638 2,353 3,182 4,541 5,841 4 0,741 1,533 2,132 2,776 3,747 4,604 5 0,727 1,476 2,0152,571 3,365 4,032 6 0,718 1,440 1,943 2,447 3,143 3,707 7 0,711 1,415 1,895 2,365 2,998 3,499 8 0,706 1,397 1,860 2,306 2,896 3,355 9 0,703 1,383 1,833 2,262 2,821 3,250 10 0,700 1,372 1,812 2,228 2,764 3,169 11 0,697 1,363 1,796 2,201 2,718 3,106 12 0,695 1,356 1,782 2,179 2,681 3,055 13 0,694 1,350 1,771 2,160 2,650 3,012 14 0,692 1,345 1,761 2,145 2,624 2,977 15 0,691 1,341 1,753 2,131 2,602 2,947 16 0,690 1,337 1,746 2,120 2,583 2,921 17 0,689 1,333 1,740 2,110 2,567 2,898 18 0,688 1,330 1,734 2,101 2,552 2,878 19 0,688 1,328 1,729 2,093 2,539 2,861 20 0,687 1,325 1,725 2,086 2,528 2,845 21 0,686 1,323 1,721 2,080 2,518 2,831 22 0,686 1,321 1,717 2,074 2,508 2,819 23 0,685 1,319 1,714 2,069 2,500 2,807 24 0,685 1,318 1,711 2,064 2,492 2,797 25 0,684 1,316 1,708 2,060 2,485 2,787 26 0,684 1,315 1,706 2,056 2,479 2,779 27 0,684 1,314 1,703 2,052 2,473 2,771 28 0,683 1,313 1,701 2,048 2,467 2,763 29 0,683 1,311 1,699 2,045 2,462 2,756 0,674 1,282 1,645 1,960 2,326 2,576 Teste de Hipótese para Proporções P (Distribuição Normal) Quando lidamos com Proporções, a população é constituída por elementos de dois tipos, isto é, cada elemento pode ser interpretado como Sucesso e Fracasso, além dos eventos ser independentes. Nestas condições, a variável aleatória segue uma distribuição Binomial. De acordo com Teorema do Limite Central, para amostra suficientemente grande (n > 30), a distribuição Binomial aproxima-se a uma distribuição Normal. Daí é imediato verificar que a proporção amostral p também aproxima-se da distribuição normal. Ocorre que, da mesma forma que o Teste de Hipótese para média, frequentemente estamos interessados em Testar Hipóteses para proporções populacionais. A estatística de teste usada para Proporções é: n 0p10p 0ppz )( − −= p = proporção amostral p0 = proporção Hipotética (H0) n = tamanho da amostra z = Estatística de teste z (Normal) EXEMPLO 5. Inspeciona-se uma amostra de 200 peças de uma grande remessa, encontrando-se 8% de peças defeituosas (200 x 0,08 = 16 peças defeituosas). O fornecedor garante que não haverá mais de 6% de peças defeituosas em toda a remessa. Testar a hipótese de que a proporção de peças defeituosas é maior que 6%, com Nível de Significância de 5%. 1º passo: Formular as hipóteses: H0 : p0 = 6% Ha : p > 6% 2º passo: Definir o tipo de teste a ser usado: Como a proporção amostral foi 8%, temos um valor máximo aceitável. O sinal é >, logo, usamos unilateral à direita. 3º passo: Encontrar escore z que estabelece os limites de Rejeição/Aceitação: α=5% | 0,5 – 0,05= 0,45 → z=+1,65 Ao procurar 0,45 na tabela Normal, encontramos z = +1,65 (como o teste é “unilateral à direita”, usamos z positivo). 4º passo: Desenhar as Regiões de Rejeição e de Aceitação, em função do escore z (nível α) 5º passo: Calcular a estatística de teste z: n 0p10p 0ppz )( − −= 200 0601060 060080z ),(, ,, − −= = +1,19 Níveis de Significância, α Região de rejeição α → 0,05 z=+1,65 0,95 Região de aceitação Calculadora: 0,02 ÷ ( ( 0,06x0,94) ÷ 200) = 1,19 - 6 - Uanderson Rebula de Oliveira Estatística Aplicada 6º passo: Verifique se a estatística de teste z caiu na Região de rejeição: 7º e último passo: Tomada de decisão: Note que a estatística de teste z não caiu na Região de Rejeição. Então, você deverá ACEITAR A HIPÓTESE NULA (Ho). Ou seja, pode-se aceitar que a proporção de peças defeituosas seja de 6%, contra a hipótese de que seja maior que este valor, com uma probabilidade de erro de 5%. Teste de Hipótese para o Desvio padrão (Distribuição χ 2) Usamos a Distribuição χ 2 (qui-quadrado) para realizar o teste de hipótese para o desvio padrão. (qualquer tamanho amostral) A estatística de teste usada para o desvio padrão é: 2 0 2 2 S S)1n )( ()( •−=χ n = tamanho da amostra S = desvio padrão amostral S0 = desvio padrão Hipotético (H0) χ2=Estatística teste (qui-quadrado) Efetuar o Teste usando a Distribuição χ2 é similar a efetuar o Teste com t. Difere-se apenas no 3º passo, onde usamos n - 1 graus de liberdade e a tabela χ2 para encontrar o limite de Rejeição/Aceitação. EXEMPLO 6. TESTE BILATERAL. A FIAT afirma que o consumo de combustível do Pálio Fire é, em média, de 18 km/L., com desvio padrão de 1,2 km/L Uma revista decide testar essa afirmação e analisa 20 veículos da mesma marca, obtendo uma média de 17,4 km/L com desvio padrão de 1,7km/L. Testar a hipótese de que o desvio padrão não é de 1,2 km/L, com Nível Significância 10%. 1º passo: Formular as hipóteses: H0 : S0 = 1,2 km/L Ha : S ≠ 1,2 km/L 2º passo: Definir o tipo de teste a ser usado: A idéia não é testar se é menor ou maior. Queremos testar um intervalo aceitável. O sinal é ≠, logo, usamos o Bilateral. 3º passo: encontrar os valores χ2L e χ2R com nível de significância α =10% (90% de confiança), quando o tamanho da amostra for 20. 1º - Ache o grau de liberdade – g.l. Como n = 20, os graus de liberdade são: g.l. = n – 1 20 – 1 = 19 2º - encontrar as áreas de χ2L e χ2R Em razão da confiança c ser 90%, temos: χ2L = 1 + c 2 χ2L = 1 + 0,90 = 0,950 2 χ2R = 1 - c 2 χ2R = 1 - 0,90 = 0,050 2 3º - encontrar os limites de Rejeição e Aceitação na tabela χ2 Parte da tabela χ2 é exibida abaixo. Usando g.l.=19 e as áreas 0,95 e 0,05 encontramos os valores críticos, como destacado: 4º passo: Calcular a estatística de teste χ2 2 0 2 2 S S)1n )( ()( •−=χ 2 2 2 21 )71120 ),( ,()( •−=χ = 38,13 5º passo:Tomada de decisão: Observe que 38,13 caiu na Região de rejeição. Portanto, deve-se REJEITAR A HIPÓTESE NULA χ2L χ2R Por meio da tabela você pode ver os limites de Rejeição/Aceitação: χ2L = 10,1170 e χ 2R = 30,1435. 0,90 χ2L = 10,1170 χ2R = 30,1435 Região de rejeição 0,05 Região de rejeição 0,05 Região de aceitação 38,13 Região de rejeição α → 0,05 z=+1,65 0,95 Região de aceitação z=+1,19 -3z -2z -1z 0 +1z +2z +3z Estatística de teste (obtida no 5º passo) - 7 - Uanderson Rebula de Oliveira Estatística Aplicada Para testes unilaterais à esquerda, usamos χ2L como limite de Rejeição. Para testes unilaterais à direita, usamos χ2R como limite de Rejeição. Para unilateral à esquerda (χ2L ) use sempre 1 – α Para unilateral à direita (χ2R) use sempre α - 8 - Uanderson Rebula de Oliveira Estatística Aplicada EXEMPLO. TESTE UNILATERAL À ESQUERDA. Encontre χ2L quando o tamanho da amostra for 23, com nível de significância 10% g.l. = n – 1 → 23 – 1 = 22 1 – α → 1 – 0,10 = 0,90 Usando g.l. = 22 com α = 0,90, encontramos 14,0415 na tabela χ2 Nota: para testes χ2L use sempre 1 – α EXEMPLO. TESTE UNILATERAL À DIREITA. Encontre χ2R quando o tamanho da amostra for 41,com nível de significância 5% g.l. = n – 1 → 41 – 1 = 40 α → 0,05 Usando g.l. = 40 com α = 0,05, encontramos 55,7585 na tabela χ2 Nota: para testes χ2R use sempre α χ2R = 55,7585 Região de rejeição 0,05 Região de aceitação 0,95 χ2L = 14,0415 Região de rejeição 0,10 Região de aceitação 0,90 Z Último dígito 0 1 2 3 4 5 6 7 8 9 TABELA DE DISTRIBUIÇÃO NORMAL PADRÃO
Compartilhar