Baixe o app para aproveitar ainda mais
Prévia do material em texto
168 Unidade III Unidade III 7 ESTIMATIVA DE PARÂMETROS 7.1 Introdução O método de “estimação de parâmetros” é utilizado para se obter estimadores em casos específicos, por exemplo, quando fazemos alguma hipótese sobre algum parâmetro relativo à distribuição da população. Esse processo utiliza dados da amostra para fazer a estimativa de valores de parâmetros populacionais. Observação Estimativa é o valor numérico assumido pelo estimador, ou seja, valor aproximado do parâmetro, calculado com base na amostra. Veja a situação a seguir que exemplifica bem o que vem a ser esses conceitos e suas aplicações: Um candidato está pensando na possibilidade de se candidatar a prefeito na sua cidade. Ele acredita ter uma popularidade suficientemente grande, uma vez que seu pai foi vereador por muitos anos na região. Porém, não tem ideia de como quantificar essa popularidade que acredita ter e gostaria de conhecer suas reais chances numa eleição, antes de lançar sua candidatura. Essa é uma situação bastante comum, se tratando de política. Muito bem, sendo assim, foi aconselhado então a consultar um estatístico para que se informe melhor sobre como funcionam as pesquisas eleitorais. O estatístico então lhe informa que é impossível, a partir de uma amostra apenas de eleitores, prever com exatidão qual será o resultado de uma eleição. O que poderá ser feito, diz ele, é tentar minimizar o erro que possa estar envolvido nessa estimativa. Porém, para que o erro de estimativa diminua, o tamanho da amostra deverá aumentar e, dessa forma, o custo também aumentará proporcionalmente. Alerta também que será preciso informar o grau de confiança no resultado encontrado, uma vez que sempre existe a probabilidade do erro ser maior do que esperávamos. Podemos, porém, fazer também com que essa probabilidade seja a menor possível. Depois de toda essa a explanação feita, o candidato se conscientizou de que o estatístico tem um papel fundamental na realização de uma pesquisa eleitoral, seja na determinação do seu custo, seja no cálculo do erro da estimativa. Dessa forma, o candidato pode se informar melhor do que esperar de uma pesquisa eleitoral, inclusive o grau de confiança que ele poderia ter no resultado obtido com a pesquisa. Percebeu, caro aluno, como a estatística está sempre nos auxiliando e socorrendo nas diversas circunstâncias que enfrentamos? Isso pode estender-se a uma pesquisa de mercado, à publicidade etc. 169 PROBABILIDADE E ESTATÍSTICA 7.2 Parâmetro e estatística da amostra Entre os estimadores mais comuns, estão: • média amostral x; • desvio padrão amostral S. Parâmetros: • média populacional μ; • desvio padrão populacional σ. Lembrete Observe que a média amostral e o desvio padrão amostral são estimadores da média populacional e do desvio padrão populacional. Em geral, encontramos na bibliografia as seguintes denominações para as estimativas: • a estimativa é dita pontual quando a estatística amostral (x ou S) dá origem a uma única estimativa do parâmetro da população (μ ou σ); • a estimativa é dita intervalar quando, a partir da estatística amostral (x ou S), obtém-se um intervalo de valores possíveis no qual se admite, com certa probabilidade, estar contido o parâmetro populacional (μ ou σ). 7.2.1 Obtenção dos principais parâmetros estatísticos Estimadores: • x: média amostral; • S: desvio padrão amostral. Parâmetros: • σ = Desvio padrão da população; • μ = média da população. 170 Unidade III 7.3 Distribuição amostral Considere todas as amostras possíveis de tamanho n que podem ser retiradas de uma população de tamanho N (com ou sem reposição). Para cada amostra é possível calcular uma grandeza estatística, como a média, mediana, variância, desvio padrão etc.; que irá sofrer uma variação de uma amostra para outra. Assim, obtém-se uma distribuição da grandeza calculada de cada amostra possível de ser extraída, denominada distribuição amostral. Lembrete As grandezas estatísticas mencionadas, bem como noções de distribuição amostral e probabilidades, foram estudadas anteriormente. Você não está seguro do quanto se recorda a respeito do que foi estudado? Revise! Isso facilitará muito seu estudo nesta disciplina Observação Se, por exemplo, a grandeza estatística em questão for a média amostral (x), a distribuição será denominada Distribuição amostral de médias. Para cada distribuição amostral, é possível calcular a média, a mediana, a variância, o desvio padrão etc. 7.4 Teorema do Limite Central Para entender o Teorema do limite central é preciso ter claro o que é uma distribuição amostral e o que é uma distribuição amostral de médias das amostras. Assim: • Distribuição amostral pode ser definida como a distribuição de probabilidade de uma estatística qualquer da amostra, formada a partir de repetidas amostras de tamanho n coletadas de uma população. • Distribuição amostral de médias das amostras é quando a estatística da amostra é sua média. Propriedades das distribuições amostrais de médias das amostras • a média das médias das amostras μx é considerada igual à média populacional μ; 171 PROBABILIDADE E ESTATÍSTICA • o desvio padrão das médias das amostras σx é igual à razão do desvio padrão populacional σ pela raiz quadrada de N. σ σx N = Observação O desvio padrão da distribuição amostral de médias das amostras é chamado de erro padrão da média. Vale a pena retomar: Padronização da variável aleatória: se a média é diferente de zero ou o desvio padrão é diferente de 1 (ou ambas as situações), é necessário converter os valores para os valores padronizados na distribuição normal padrão. z x= −( )µ σ μ x 0 z Figura 44 - Diagrama da curva normal Exemplo de aplicação 1. Imagine que um consultor esteja investigando o tempo que os trabalhadores de uma fábrica levam para montar determinada peça A. Suponha também que análises da linha de produção tenham calculado um tempo médio de 75 segundos e desvio padrão de 6 segundos. Considere agora, que o consultor queira saber qual a probabilidade de um trabalhador levar um tempo entre 75 e 81 segundos para montar uma peça, ou seja, P(75 ≤ X ≤ 81). Como já vimos na distribuição normal de probabilidades, devemos padronizar as variáveis x, para que possamos utilizar a tabela de áreas para a curva normal padronizada. Ou seja, transformar as variáveis aleatórias x em variáveis normais padronizadas z, como será feito a seguir: 172 Unidade III Solução: Dados: • μ = 75 segundos • σ = 6 segundos • z x= − µ σ • z1 75 75 6 = − • z1 0 6 = • z1 0= • z2 81 75 6 = − • z2 6 6 = • z2 = 1 Logo, temos a probabilidade P(0 ≤ Z ≤ 1), que é ilustrada a seguir e cujo valor é determinado consultando a tabela de distribuição normal padronizada Z: A média é diferente de zero e o desvio padrão é diferente de 1, logo, temos a probabilidade P(0 ≤ Z ≤ 1). Então, precisamos corrigir os valores para valores padronizados, determinados na tabela de distribuição normal padrão Z, incluída a seguir: Tabela 49 – Distribuição normal padronizada z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09 0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359 0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753 0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141 0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517 0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879 0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224 0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549 0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852 0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133 0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389 1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621 173 PROBABILIDADEE ESTATÍSTICA Pela tabela, para z = 1 e nível de significância de 0%, encontramos o valor da área indicada de 0,3413, conforme a tabela a seguir: Tabela 50 z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09 0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359 0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753 0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141 0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517 0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879 0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224 0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549 0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852 0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133 0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389 1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621 1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830 1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015 1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177 1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319 1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441 1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545 1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633 1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706 1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767 2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817 2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857 2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890 Esse valor significa a probabilidade: P(75 ≤ X ≤ 81) = P(0 ≤ Z ≤ 1) = 0, 3413 x100 = 34,13% 174 Unidade III 0 z = 1 A = 0,3413 Figura 45 - Diagrama da curva normal para o exercício 1 Logo, 34,13% dos trabalhadores levarão um tempo dentro do intervalo de 75 e 81 segundos. Conforme o tamanho da amostra aumenta, a distribuição das médias amostrais tende para uma distribuição normal, independente do tipo de distribuição da população. Nesse caso, a média das médias das amostras poderá ser considerada como a média da população. Porém, o desvio padrão será: σ σ x N _ = Observação Para amostras de tamanho N > 30, a distribuição das médias amostrais pode ser aproximada por uma distribuição normal. A aproximação torna-se mais confiável conforme aumenta o tamanho da amostra N. Se a população tem distribuição normal, as médias amostrais terão distribuição normal para qualquer tamanho amostral N. 2. A média das contas telefônicas dos moradores de Cincinnati é US$64 e seu desvio padrão é US$9. Amostras aleatórias de 36 contas telefônicas são retiradas dessa população e a média de cada uma delas é determinada. Obtenha a média e o erro padrão da média da distribuição amostral (LARSON & FARBER, 2007, p. 189). Solução: Como a amostra possui 36 elementos (maior do que 30, vide observação anterior) , a média da distribuição amostral é igual à média da população, enquanto o erro padrão da média é igual ao desvio padrão populacional dividido por N . Assim: µ x _ = μ = 64 175 PROBABILIDADE E ESTATÍSTICA E: σ σ σ x x N_ _ , = = 15 3. As alturas das árvores de Ipê Roxo são normalmente distribuídas e possuem uma média de 90 pés e um desvio padrão de 3,5 pés. Amostras de tamanho 4 são retiradas aleatoriamente dessa população de ipês e a média de cada uma delas. Obtenha a média e o erro padrão da média da distribuição amostral. Solução: A média da distribuição amostral é igual à média da população, enquanto o erro padrão da média é igual ao desvio padrão populacional dividido por n . Assim: µ µ x _ = = 90 pés σ σ σ σ x x x N = = = 3 5 4 175 , , pés. Estimativa Intervalar O intervalo de confiança para a média populacional pode ser calculado a partir da equação a seguir: α α α 2 2 + = Onde: a = nível de significância. 0 + zc- zc 1 - aα 2 α 2 Figura 46 - Diagrama de simetria da curva normal 176 Unidade III Onde: • - Zc e + Zc são valores críticos obtidos à partir da tabela de distribuição normal padronizada Z; • 1 - a = nível de confiança do intervalo; • P(- Zc < Z < + Zc ) = (1 - a). Sendo: • (1 - a) = probabilidade de que o intervalo contenha o parâmetro populacional estimado; • a = probabilidade de que o intervalo não contenha o parâmetro populacional estimado. Observação Os valores mais utilizados para a (nível de significância) são 5% e 1%. No entanto, isso não é regra, esses valores podem variar conforme a necessidade da pesquisa. • Para nível de significância a = 5% 0 - zc =1,96 + zc =1,96 1 2 95 2 47 5 0 475 − = = =α , % , 1 2 95 2 47 5 0 475 − = = =α , % ,1 95− =α % Figura 47 - Diagrama de simetria da curva normal, para nível de significância de 5% A tabela a seguir mostra a distribuição normal padrão para níveis de significância variando de 0% a 9%. 177 PROBABILIDADE E ESTATÍSTICA Tabela 51 z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09 0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359 0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753 0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141 0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517 0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879 0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224 0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549 0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852 0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133 0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389 1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621 1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830 1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015 1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177 1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319 1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441 1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545 1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633 1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706 1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767 2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817 2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857 2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890 Lembrete Procure no corpo da tabela o valor 0, 4750, siga a linha e a coluna correspondente e obterá zc = 1,96. P(- 1,96 < Z < + 1,96) = 95% c = 1 - a = 95% (nível de confiança do intervalo). • Para nível de significância a = 1% 178 Unidade III 0 - zc = 2,575 + zc = 2,575 1 - a 99%1 2 99 2 49 5 0 495 − = = =α , % , 1 2 99 2 49 5 0 495 − = = =α , % , Figura 48 - Diagrama de simetria da curva normal, para nível de significância de 1% Observação O valor obtido é uma aproximação, como é possível constatar na tabela. No entanto, se for o caso de um cálculo mais rigoroso, é necessário estabelecer a média aritmética em relação aos valores encontrados para Z em torno de 0,4950. zc = + =2 57 2 58 2 2 575 , , , P(- 2,575 < Z < + 2,575) = 99% c = 1 - a = 99% (nível de confiança do intervalo). O valor obtido é uma aproximação, como é possível constatar na tabela seguinte. Tabela 52 z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09 0.00.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359 0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753 0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141 0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517 0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879 0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224 0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549 0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852 1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706 179 PROBABILIDADE E ESTATÍSTICA z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09 1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767 2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817 2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857 2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890 2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916 2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936 2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952 2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964 2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974 2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981 2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986 3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990 Observação Procure no corpo da tabela o valor 0,4950 e siga a linha e a coluna correspondente para obter zc = 2,8. 7.5 Intervalo de confiança para a média populacional Para amostras grandes, temos: P( -ZC < Z < +ZC ) = (1 - a) Atenção: Tratando-se de distribuição amostral do estimador X normal, ou seja, amostras extraídas de população normal ou aproximadamente normal, se o tamanho da amostra for suficientemente grande, a distribuição amostral de médias será representada por: z x P Z x Z P x Z x x c x x c c x = −( ) − < − < = − − µ σ µ σ α σ _ _ ( ) . 1 __ _ _ _. ( )< < + = −µ σ α x c x x Z 1 180 Unidade III µ σx xe correspondem à média e desvio padrão da distribuição amostral de médias. Fique atento! Podemos listar as diferentes situações a seguir: • Se o desvio padrão populacional for conhecido: P x Z n x Z n _ _ . . ( )− < < + = −α α σ µ σ α 2 2 1 • Amostragem de população infinita ou amostragem de população finita com reposição: P x Z x Zc x x c x _ _ _ _ _. . ( )− < < + = −σ µ σ α1 • Se o desvio padrão populacional for desconhecido e n ≥ 30: Normalmente, o desvio padrão da população σ, não é conhecido. É necessário, então, em substituição a σ, usar a estimativa do desvio padrão S obtida da amostra, com a condição de que n ≥ 30. Observação Caso n < 30, essa aproximação não será suficiente, devendo ser feita uma correção usando-se a variável t de Student, no lugar da padronizada z, que iremos estudar a seguir. 0 - zc = -1,96 + zc = 1,96 g(z) 1 2 95 2 47 5 0 475 − = = =α , % , 1 2 95 2 47 5 0 475 − = = =α , % , Figura 49 - Diagrama de distribuição t de Student Se o desvio padrão populacional for desconhecido e n < 30, poderemos estimar o desvio padrão populacional por meio do desvio padrão amostral, ou seja, no lugar de σ (desvio-padrão populacional), utilizamos S (desvio-padrão amostral), porém, como a amostra tem tamanho n < 30, no lugar de Z (distribuição normal), utilizamos a distribuição t Student. 181 PROBABILIDADE E ESTATÍSTICA Logo, para o caso de amostras pequenas: distribuição t student. Conforme já vimos, para distribuição normal: z x x x = −( )µ σ Sendo a amostragem extraída de uma população infinita ou de uma população finita, porém com reposição, utiliza-se o desvio padrão amostral como estimador do desvio padrão populacional. • S é estimador de σ. Além disso, como foi visto anteriormente, nas propriedades das distribuições amostrais de médias das amostras: • a média das médias das amostras μx é considerada igual à média populacional μ; • o desvio padrão das médias das amostras σx é igual à razão do desvio padrão populacional σ pela raiz quadrada de N. σ σx N = Dessa forma, obtemos: z x n z x s n = −( ) = −( ) µ σ µ A variável definida como tc é denominada variável com distribuição t de student, com Ø graus de liberdade. t x s n c = −( )µ O grau de liberdade é definido como: g.l = n - 1 182 Unidade III P t x s n t P x t s n x t s n c c c c − < −( ) < = −( ) − < < + = − µ α µ 1 1. . αα( ) Para que você possa visualizar um pouco melhor as teorias anteriores, vamos associá-la a alguns exemplos de aplicação. Exemplo de aplicação 1. Foi testada uma amostra de 20 lâmpadas selecionadas ao acaso, que resultaram numa vida média de 48,2 meses e desvio padrão de 5,4 meses. Determine um intervalo de confiança de 95% em torno da verdadeira média da população (população infinita). Solução: Dados: • x = 48,2 • n = 20 (< 30) • S = 5,4 • g.l. = n - 1 = 20 -1 = 19 • 1- a = 0,95 Como a amostra possui tamanho n<30, devemos substituir o Z (distribuição normal) pela a distribuição t student. Portanto, consultando a tabela seguinte, de distribuição t student, temos: a = 0,05 e g.l. = 19 O valor tabelado encontrado é: tc = 2,09 183 PROBABILIDADE E ESTATÍSTICA 0 - tc = -2,09 + tc = 2,09 g(t) 95%α 2 5 2 2 5 0 025= = =, % , α 2 5 2 2 5 0 025= = =, % , Figura 50 - Diagrama de distribuição t de Student, referente ao exercício 1 Tabela 53 - Tabela t (de student) gl/P 0,90 0,80 0,70 0,60 0,50 0,40 0,30 0,20 0,10 0,05 0,02 0,01 0,001 01 0,158 0,325 0,510 0,727 1,000 1,376 1,963 3,078 6,314 12,706 31,821 63,657 636,619 02 0,142 0,289 0,445 0,617 0,816 1,061 1,386 1,886 2,920 4,303 6,965 9,925 31,598 03 0,137 0,277 0,424 0,584 0,765 0,978 1,250 1,638 2,353 3,182 4,541 5,541 12,924 04 0,134 0,271 0,414 0,569 0,741 0,941 1,190 1,533 2,132 2,776 3,747 4,604 8,610 05 0,132 0,267 0,408 0,559 0,727 0,920 1,156 1,476 2,015 2,571 3,365 4,032 6,869 06 0,131 0,265 0,404 0,553 0,718 0,906 1,134 1,440 1,943 2,447 3,143 3,707 5,959 07 0,130 0,263 0,402 0,549 0,711 0,896 1,119 1,415 1,895 2,365 2,365 3,499 5,408 08 0,130 0,262 0,399 0,546 0,706 0,889 1,108 1,397 1,860 2,306 2,896 3,355 5,041 09 0,129 0,261 0,398 0,543 0,703 0,883 1,100 1,383 1,833 2,262 2,821 3,250 4,781 10 0,129 0,260 0,397 0,542 0,700 0,879 1,093 1,372 1,812 2,228 2,764 3,169 4,587 11 0,129 0,260 0,396 0,540 0,697 0,876 1,088 1,363 1,796 2,201 2,718 3,106 4,437 12 0,128 0,259 0,395 0,539 0,695 0,873 1,083 1,356 1,782 2,179 2,681 3,055 4,318 13 0,128 0,259 0,394 0,538 0,694 0,870 1,079 1,350 1,771 2,160 2,650 3,012 4,221 14 0,128 0,258 0,393 0,537 0,692 0,868 1,076 1,345 1,761 2,145 2,624 2,977 4,140 15 0,128 0,258 0,393 0,536 0,691 0,866 1,074 1,341 1,753 2,131 2,602 2,947 4,073 16 0,128 0,258 0,392 0,535 0,690 0,865 1,071 1,337 1,746 2,120 2,583 2,921 4,015 17 0,128 0,257 0,392 0,534 0,689 0,863 1,069 1,333 1,740 2,110 2,567 2,898 3,965 18 0,127 0,257 0,392 0,534 0,688 0,862 1,067 1,330 1,734 2,101 2,552 2,878 3,922 19 0,127 0,257 0,391 0,533 0,688 0,861 1,066 1,328 1,729 2,093 2,539 2,861 3,883 20 0,127 0,257 0,391 0,533 0,687 0,860 1,064 1,325 1,725 2,086 2,528 2,845 3,850 Utilizando a linha de graus de liberdade 19 e a coluna referente a 5%, obtém-se tc = 2,093 ≈ 2,09. P x t s n x t s n P c c− < < + = −( ) − < < + . . , , . , , , µ α µ 1 48 2 2 09 5 4 20 48 2 2 09.. , , 5 4 20 1 0 05 = −( ) 184 Unidade III P (45,68 ≤ μ ≤ 50,72) = 95% Portanto, com 95% de confiança, podemos admitir que a verdadeira média populacional esteja contida no intervalo 45,68 ≤ μ ≤ 50,72.2. Uma amostra de 10 medidas do diâmetro de uma esfera acusa média de 4,38 e desvio padrão de 0,06. Determine os limites de confiança de 99% para o diâmetro efetivo (população infinita). Solução: Dados: • x = 4,38; • n = 10 (< 30); • S = 0,06; • g.l. = n - 1 = 10 -1 = 9; • 1 - a = 0,99. Consultando a tabela de distribuição t-student (tabela a seguir) com: a = 0,01 e g.l. = 9, o valor tabelado encontrado é: tc = 3,25 Tabela 54 - Tabela t (de student) gl/P 0,90 0,80 0,70 0,60 0,50 0,40 0,30 0,20 0,10 0,05 0,02 0,01 0,001 01 0,158 0,325 0,510 0,727 1,000 1,376 1,963 3,078 6,314 12,706 31,821 63,657 636,619 02 0,142 0,289 0,445 0,617 0,816 1,061 1,386 1,886 2,920 4,303 6,965 9,925 31,598 03 0,137 0,277 0,424 0,584 0,765 0,978 1,250 1,638 2,353 3,182 4,541 5,541 12,924 04 0,134 0,271 0,414 0,569 0,741 0,941 1,190 1,533 2,132 2,776 3,747 4,604 8,610 05 0,132 0,267 0,408 0,559 0,727 0,920 1,156 1,476 2,015 2,571 3,365 4,032 6,869 06 0,131 0,265 0,404 0,553 0,718 0,906 1,134 1,440 1,943 2,447 3,143 3,707 5,959 07 0,130 0,263 0,402 0,549 0,711 0,896 1,119 1,415 1,895 2,365 2,365 3,499 5,408 08 0,130 0,262 0,399 0,546 0,706 0,889 1,108 1,397 1,860 2,306 2,896 3,355 5,041 09 0,129 0,261 0,398 0,543 0,703 0,883 1,100 1,383 1,833 2,262 2,821 3,250 4,781 10 0,129 0,260 0,397 0,542 0,700 0,879 1,093 1,372 1,812 2,228 2,764 3,169 4,587 11 0,129 0,260 0,396 0,540 0,697 0,876 1,088 1,363 1,796 2,201 2,718 3,106 4,437 185 PROBABILIDADE E ESTATÍSTICA Utilizando a linha de graus de liberdade 9 e a coluna referente a 1%, obtém-se tc = 3,25. 0 - tc = -3,25 + tc = 3,25 g(t) 99%α 2 1 2 0 5 0 005= = =, % , α 2 1 2 0 5 0 005= = =, % , Figura 51 - Diagrama de distribuição t de Student referente ao exercício 2 P x t s n x t s n P c c− < < + = −( ) − < < + . . , , . , , , µ α µ 1 4 38 3 25 0 06 10 4 38 3 255 0 06 10 1 0 01. , , ( , , ) % = −( ) ≤ ≤ =P 4 31 4 44 99µ Resposta: Portanto, com 99% de confiança, podemos admitir que a verdadeira média populacional esteja contida no intervalo 4,31 ≤ μ ≤ 4,44. Saiba mais Leia sobre a interessante origem do método t de Student e a razão de sua denominação em: GOSSET, W. S. História (biografias). Disponível em: http://www.pucrs.br/ famat/statweb/historia/daestatistica/biografias/Gosset.htm. Acesso em: 26 jun. 2011. 7.6 Intervalo de confiança para a variância e o desvio padrão A construção do intervalo de confiança para a variância é feita utilizando-se a distribuição de x2 (lê-se “qui-quadrado”), sendo definido por: 186 Unidade III P n s n s( ). ( ).− ≤ ≤ − = −( ) − 1 1 1 2 2 2 2 2 1 2 2χ σ χ α α α Sendo o valor de x2 tabelado: χ α χ α α α 2 2 1 2 2 1 2 2 1 1 com n e com n ; ( ) ; ( ) − − − − Veja o exemplo a seguir: Dada a seguinte amostra, construa o intervalo de confiança para o desvio padrão, com grau de confiança de 90%. 9, 8, 12, 7, 9, 6, 11, 6, 10, 9 Solução: x x n x x s x x n s i i = = + + + + + + + + + = = −( ) − = ∑ ∑ 9 8 12 7 9 6 11 6 10 9 10 8 7 1 2 2 2 2 , x x n x x s x x n s i i = = + + + + + + + + + = = −( ) − = ∑ ∑ 9 8 12 7 9 6 11 6 10 9 10 8 7 1 2 2 2 2 , χ2 tabelado, será: • χ α α 2 2 2 10 2 5 1 10 1 9com e n= = − = − =( ) χα 2 2 16 919= , 187 PROBABILIDADE E ESTATÍSTICA • χ α α 1 2 2 1 2 1 0 1 2 1 0 05 0 95 1 10 1 9 − − = − = − = − = − =com e n, , , ( ) χ α 1 2 2 3 325 − = , Tabela 55 - P ( χ2 com n graus de liberdade > valor tabelado) = a a GL 0,999 0,995 0,99 0,975 0,95 0,9 0,75 0,5 0,25 0,1 0,05 0,025 0,01 0,005 1 0,000 0,000 0,000 0,001 0,004 0,016 0,102 0,455 1,323 2,706 3,841 5,024 6,635 7,879 2 0,002 0,010 0,020 0,051 0,103 0,211 0,575 1,386 2,773 4,605 5,991 7,378 9,210 10,597 3 0,024 0,072 0,115 0,216 0,352 0,584 1,213 2,366 4,108 6,251 7,815 9,348 11,345 12,838 4 0,091 0,207 0,297 0,484 0,711 1,064 1,923 3,357 5,385 7,779 9,488 11,143 13,277 14,860 5 0,210 0,412 0,554 0,831 1,145 1,610 2,675 4,351 6,626 9,236 11,070 12,833 15,086 16,750 6 0,381 0,676 0,872 1,237 1,635 2,204 3,455 5,348 7,841 10,645 12,592 14,449 16,812 18,548 7 0,598 0,989 1,239 1,690 2,167 2,833 4,255 6,346 9,037 12,017 14,067 16,013 18,475 20,278 8 0,857 1,344 1,646 2,180 2,733 3,490 5,071 7,344 10,219 13,362 15,507 17,535 20,090 21,955 9 1,152 1,735 2,088 2,700 3,325 4,168 5,899 8,343 11,389 14,684 16,919 19,023 21,666 23,589 10 1,479 2,156 2,558 3,247 3,940 4,865 6,737 9,342 12,549 15,987 18,307 20,483 23,209 25,188 11 1,834 2,603 3,053 3,816 4,575 5,578 7,584 10,341 13,701 17,275 19,675 21,920 24,725 26,757 12 2,214 3,074 3,571 4,404 5,226 6,304 8,438 11,340 14,845 18,549 21,026 23,337 26,217 28,300 13 2,617 3,565 4,107 5,009 5,892 7,042 9,299 12,340 15,984 19,812 22,362 24,736 27,688 29,819 14 3,041 4,075 4,660 5,629 6,571 7,790 10,165 13,339 17,117 21,064 23,685 26,119 29,141 31,319 15 3,483 4,601 5,229 6,262 7,261 8,547 11,037 14,339 18,245 22,307 24,996 27,488 30,578 32,801 16 3,942 5,142 5,812 6,908 7,962 9,312 11,912 15,338 19,369 23,542 26,296 28,845 32,000 34,267 17 4,416 5,697 6,408 7,564 8,672 10,085 12,792 16,338 20,489 24,769 27,587 30,191 33,409 35,718 18 4,905 6,265 7,015 8,231 9,390 10,865 13,675 17,338 21,605 25,989 28,869 31,526 34,805 37,156 19 5,407 6,844 7,633 8,907 10,117 11,651 14,562 18,338 22,718 27,204 30,144 32,852 36,191 38,582 20 5,921 7,434 8,260 9,591 10,851 12,443 15,452 19,337 23,828 28,412 31,410 34,170 37,566 39,997 21 6,447 8,034 8,897 10,283 11,591 13,240 16,344 20,337 24,935 29,615 32,671 35,479 38,932 41,401 22 6,983 8,643 9,542 10,982 12,338 14,041 17,240 21,337 26,039 30,813 33,924 36,781 40,289 42,796 23 7,529 9,260 10,196 11,689 13,091 14,848 18,137 22,337 27,141 32,007 35,172 38,076 41,638 44,181 24 8,085 9,886 10,856 12,401 13,848 15,659 19,037 23,337 28,241 33,196 36,415 39,364 42,980 45,559 25 8,649 10,520 11,524 13,120 14,611 16,473 19,939 24,337 29,339 34,382 37,652 40,646 44,314 46,928 188 Unidade III P n s n s P ( ). ( ). ( ). − ≤ ≤ − = −( ) − − 1 1 1 10 1 2 16 2 2 2 2 2 1 2 2χ σ χ α α α ,, ( ). , , . , . , 919 10 1 2 3 325 1 0 1 9 2 16 919 9 2 3 325 2 2 ≤ ≤ − = −( ) ≤ ≤ σ σP = ≤ ≤( ) = ≤ ≤( ) = 0 9 1 064 5 414 90 1 032 2 327 90 2 , , , % , , % P P σ σ Resposta: O desvio-padrão populacional está situado no intervalo 1,032 e 2,327, com uma confiança de 90%. Conclusão Como acabamos de estudar, um Intervalo de Confiança (IC) é um intervalo estimado a respeito de um parâmetro estatístico. É interessante porque em vez de fazermos a estimativa do parâmetro por apenas um valor, é dado um intervalo de estimativas prováveis. O quanto serão prováveis essas estimativas, ou seja, o quanto podemos confiar nelas, é determinado pelo coeficiente de confiança. Vimos também que quanto maior a probabilidade do intervalo conter o parâmetro em questão, maior será o intervalo. Intervalos de confiança são, portanto, utilizados para indicar a confiabilidade de uma estimativa. Exemplo de aplicação 1. Um conjunto composto por 40 animais em experiência foi alimentado com uma dieta especial durante certo tempo, e verificou-se que a média de ganho de peso foi de 29g. Encontrar os limites de confiança para a média, ao nível de confiança de 99%, sabendo-se que o desvio padrão referente a pesquisas anteriores com outra dieta foi de 2g. Solução: Dados: • x = 29 g • n = 40 189 PROBABILIDADE E ESTATÍSTICA • σ = 2 g • 1 - a = 0,99 Portanto, a = 0,010 Consultando a tabela de z crítico (tabela de distribuição normal padronizada Z), de acordo com o nível de confiança 99% ou 0,99: 0 -zc = -2,575 +zc = 2,575 1 - a = 99%1 2 99 2 49 5 0 495 − = = =α , % , 1 2 99 2 49 5 0 495 − = = =α , % , Figura 52 - Diagrama de distribuição normal, referente ao exercício 1 Lembrete Procure no corpo da tabela o valor 0,4950 e siga a linha e a coluna correspondente para obterzc . Observação O valor obtido é estabelecido pela média aritmética em relação aos valores encontrados para Z em torno de 0,4950. zc = + =2 57 2 58 2 2 575 , , , P(- 2,575 < Z < + 2,575) = 99% c = 1 - a = 99% (nível de confiança do intervalo). 190 Unidade III P x Z n x Z n P c c _ _ . . ( ) , . , . − < < + = − − < < + σ µ σ α µ 1 29 2 575 2 40 29 2 575 2 440 0 99 = , P P 29 2 575 2 6 325 29 2 575 2 6 325 0 99 29 0 814 2 − < < + = − < < , . , , . , , , µ µ 99 0 814 0 99 28 186 29 814 0 99 +( ) = < <( ) = , , , , ,P µ Resposta: Portanto, com 99% de confiança, é possível admitir que a verdadeira média populacional esteja contida no intervalo: P( 28,186 ≤ μ ≤ 29,814) 2. Numa indústria, foi coletada uma amostra de 20 peças e a média dos diâmetros encontrada foi de 15mm com desvio padrão de 2mm. Construir o intervalo de confiança para o diâmetro médio de toda a produção de peças desse diâmetro, ao nível de 95% de confiança. Dados: • x = 15mm; • n = 20; • S = 2 mm; • 1 - a = 0,99 Portanto, a = 0,05 Sendo a amostra extraída de uma população em que o desvio padrão populacional σ é desconhecido, temos: g.l. = n - 1 = 20 -1 =19 Consultando a Tabela de distribuição t student com: 191 PROBABILIDADE E ESTATÍSTICA a = 0,05 e g.l. = 19, o valor tabelado encontrado é: tc = 3,25 Tabela 56 - Tabela t (de student) gl/P 0,90 0,80 0,70 0,60 0,50 0,40 0,30 0,20 0,10 0,05 0,02 0,01 0,001 01 0,158 0,325 0,510 0,727 1,000 1,376 1,963 3,078 6,314 12,706 31,821 63,657 636,619 02 0,142 0,289 0,445 0,617 0,816 1,061 1,386 1,886 2,920 4,303 6,965 9,925 31,598 03 0,137 0,277 0,424 0,584 0,765 0,978 1,250 1,638 2,353 3,182 4,541 5,541 12,924 12 0,128 0,259 0,395 0,539 0,695 0,873 1,083 1,356 1,782 2,179 2,681 3,055 4,318 13 0,128 0,259 0,394 0,538 0,694 0,870 1,079 1,350 1,771 2,160 2,650 3,012 4,221 14 0,128 0,258 0,393 0,537 0,692 0,868 1,076 1,345 1,761 2,145 2,624 2,977 4,140 15 0,128 0,258 0,393 0,536 0,691 0,866 1,074 1,341 1,753 2,131 2,602 2,947 4,073 16 0,128 0,258 0,392 0,535 0,690 0,865 1,071 1,337 1,746 2,120 2,583 2,921 4,015 17 0,128 0,257 0,392 0,534 0,689 0,863 1,069 1,333 1,740 2,110 2,567 2,898 3,965 18 0,127 0,257 0,392 0,534 0,688 0,862 1,067 1,330 1,734 2,101 2,552 2,878 3,922 19 0,127 0,257 0,391 0,533 0,688 0,861 1,066 1,328 1,729 2,093 2,539 2,861 3,883 20 0,127 0,257 0,391 0,533 0,687 0,860 1,064 1,325 1,725 2,086 2,528 2,845 3,850 21 0,127 0,257 0,391 0,532 0,686 0,859 1,063 1,323 1,721 2,080 2,518 2,831 3,819 Utilizando a linha de graus de liberdade 19 e a coluna referente a 5%, obtém-se tc = 2,093. 0 - tc = -2,093 + tc = 2,093 g(t) 95% α 2 5 2 2 5 0 025= = =, % , α 2 5 2 2 5 0 025= = =, % , Figura 53 - Diagrama de distribuição t de Student referente ao exercício 2 192 Unidade III P P 15 2 093 2 20 15 2 093 2 20 1 0 05 15 2 093 2 4 47 − < < + = −( ) − , . , . , , . , µ 22 15 2 093 2 4 472 1 0 05 15 0 936 15 0 936 < < + = −( ) − < < +( ) = µ µ , . , , , ,P 00 95, P(14,064 ≤ μ ≤ 15,936) = 95% Resposta: Portanto, com 95% de confiança, podemos admitir que a verdadeira média populacional esteja contida no intervalo 14,064 ≤ μ ≤ 15,936. P(14,064 ≤ μ ≤ 15,936) = 95% 3. A amostra a seguir refere-se às vendas em kg de uma amostra de produtos hortigranjeiros de certo estabelecimento. Construa um intervalo de confiança para o desvio padrão populacional das vendas, com nível de confiança de 90%. Sejam as vendas: X: 2, 2, 4, 4, 5, 7, 8, 8, 8, 9, 9 Solução: Para construir um intervalo de confiança para o desvio padrão, devemos primeiro determinar a média aritmética das vendas. Determinação da média aritmética das vendas: x x n x x Kg i= = + + + + + + + + + + = ∑ 2 2 4 4 5 7 8 8 8 9 9 11 6 0, Em seguida, devemos determinar o desvio padrão amostral das vendas, uma vez que o desvio padrão populacional é desconhecido. Determinação do desvio padrão amostral das vendas: 193 PROBABILIDADE E ESTATÍSTICA s x x n i2 2 1 = −( ) − ∑ Devemos também calcular as diferenças ao quadrado de cada valor em relação à média aritmética, como a seguir: Tabela 57 xi (xi - x)2 2 (2 - 6)2 = 16 2 (2 - 6)2 = 16 4 (4 - 6)2 = 4 4 (4 - 6)2 = 4 5 (5 - 6)2 = 1 7 (7 - 6)2 = 1 8 (8 - 6)2 = 4 8 (8 - 6)2 = 4 9 (9 - 6)2 = 9 9 (9 - 6)2 = 9 ∑(xi - x) 2 = 68 Substituindo o resultado da somatória na fórmula a seguir, temos: s x x n s s i2 2 2 2 1 68 11 1 6 8 = −( ) − = − = ∑ , χ2 tabelado, consultando a tabela de distribuição qui-quadrado, será: • χ α χ α α 2 2 2 2 2 10 2 5 1 10 1 9 16 919 com e n= = − = − = = ( ) , • χ χ α α α 1 2 2 1 2 1 01 2 1 0 05 0 95 1 2 2 1 10 1 9 3 325 − − = − = − = − − = − = = com e n, , , ( ) , 194 Unidade III Da tabela, obtemos: Tabela 58 - P ( χ2 com n graus de liberdade > valor tabelado) = a a GL 0,999 0,995 0,99 0,975 0,95 0,9 0,75 0,5 0,25 0,1 0,05 0,025 0,01 0,005 1 0,000 0,000 0,000 0,001 0,004 0,016 0,102 0,455 1,323 2,706 3,841 5,024 6,635 7,879 2 0,002 0,010 0,020 0,051 0,103 0,211 0,575 1,386 2,773 4,605 5,991 7,378 9,210 10,597 3 0,024 0,072 0,115 0,216 0,352 0,584 1,213 2,366 4,108 6,251 7,815 9,348 11,345 12,838 4 0,091 0,207 0,297 0,484 0,711 1,064 1,923 3,357 5,385 7,779 9,488 11,143 13,277 14,860 5 0,210 0,412 0,554 0,831 1,145 1,610 2,675 4,351 6,626 9,236 11,070 12,833 15,086 16,750 6 0,381 0,676 0,872 1,237 1,635 2,204 3,455 5,348 7,841 10,645 12,592 14,449 16,812 18,548 7 0,598 0,989 1,239 1,690 2,167 2,833 4,255 6,346 9,037 12,017 14,067 16,013 18,475 20,278 8 0,857 1,344 1,646 2,180 2,733 3,490 5,071 7,344 10,219 13,362 15,507 17,535 20,090 21,955 9 1,152 1,735 2,088 2,700 3,325 4,168 5,899 8,343 11,389 14,684 16,919 19,023 21,666 23,589 10 1,479 2,156 2,558 3,247 3,940 4,865 6,737 9,342 12,549 15,987 18,307 20,483 23,209 25,188 11 1,834 2,603 3,053 3,816 4,575 5,578 7,584 10,341 13,701 17,275 19,675 21,920 24,725 26,757 12 2,214 3,074 3,571 4,404 5,226 6,304 8,438 11,340 14,845 18,549 21,026 23,337 26,217 28,300 13 2,617 3,565 4,107 5,009 5,892 7,042 9,299 12,340 15,984 19,812 22,362 24,736 27,688 29,819 14 3,041 4,075 4,660 5,629 6,571 7,790 10,165 13,339 17,117 21,064 23,685 26,119 29,141 31,319 15 3,483 4,601 5,229 6,262 7,261 8,547 11,037 14,339 18,245 22,307 24,996 27,488 30,578 32,801 16 3,942 5,142 5,812 6,908 7,962 9,312 11,912 15,338 19,369 23,542 26,296 28,845 32,000 34,267 17 4,416 5,697 6,408 7,564 8,672 10,085 12,792 16,338 20,489 24,769 27,587 30,191 33,409 35,718 18 4,905 6,265 7,015 8,231 9,390 10,865 13,675 17,338 21,605 25,989 28,869 31,526 34,805 37,156 19 5,407 6,844 7,633 8,907 10,117 11,651 14,562 18,338 22,718 27,204 30,144 32,852 36,191 38,582 20 5,921 7,434 8,260 9,591 10,851 12,443 15,452 19,337 23,828 28,412 31,410 34,170 37,566 39,997 21 6,447 8,034 8,897 10,283 11,591 13,240 16,344 20,337 24,935 29,615 32,671 35,479 38,932 41,401 22 6,983 8,643 9,542 10,982 12,338 14,041 17,240 21,337 26,039 30,813 33,924 36,781 40,289 42,796 23 7,529 9,260 10,196 11,689 13,091 14,848 18,137 22,337 27,141 32,007 35,172 38,076 41,638 44,181 24 8,085 9,886 10,856 12,401 13,848 15,659 19,037 23,337 28,241 33,196 36,415 39,364 42,980 45,559 25 8,649 10,520 11,524 13,120 14,611 16,473 19,939 24,337 29,339 34,382 37,652 40,646 44,314 46,928 P n s n s P ( ). ( ). ( ). , − ≤ ≤ − = −( ) − − 1 1 1 11 1 6 8 2 2 2 2 2 1 2 2χ σ χ α α α 116 919 11 1 6 8 3 325 1 0 1 10 6 8 16 919 1 2 2 , ( ). , , , . , , ≤ ≤ − = −( ) ≤ ≤ σ σP 00 6 8 3 325 0 9 68 16 919 68 3 325 0 9 4 019 2 . , , , , , , , = ≤ ≤ = ≤ P P σ σσ σ σ 2 2 20 451 0 9 4 019 20 451 90 2 005 4 522 90 ≤( ) = ≤ ≤( ) = ≤ ≤( ) = , , , , % , , % P P 195 PROBABILIDADE E ESTATÍSTICA P n s n s P ( ). ( ). ( ). , − ≤ ≤ − = −( ) − − 1 1 1 11 1 6 8 2 2 2 2 2 1 2 2χ σχ α α α 116 919 11 1 6 8 3 325 1 0 1 10 6 8 16 919 1 2 2 , ( ). , , , . , , ≤ ≤ − = −( ) ≤ ≤ σ σP 00 6 8 3 325 0 9 68 16 919 68 3 325 0 9 4 019 2 . , , , , , , , = ≤ ≤ = ≤ P P σ σσ σ σ 2 2 20 451 0 9 4 019 20 451 90 2 005 4 522 90 ≤( ) = ≤ ≤( ) = ≤ ≤( ) = , , , , % , , % P P Resposta: O desvio- padrão populacional está situado no intervalo 2,005 e 4,522, com uma confiança de 90%. 4. Considere que uma amostra de cinco pacientes apresentou a seguinte pressão mínima sanguínea (em mm/Hg) após a administração de um anestésico: 1,4; 1,8; 2,1; 2,7; 3,0. Determine o intervalo de confiança para a pressão mínima média de toda população de pacientes, com um nível de confiança de 95%. Solução Dados: • n = 5; • 1 - a = 0,95. Portanto, a = 0,05 Determinação da média aritmética: x x n x x i= = + + + + = ∑ 14 18 2 1 2 7 3 5 , , , , , /2 2mm Hg Sendo a amostragem extraída da população em que o desvio padrão populacional σ é desconhecido, temos: 196 Unidade III Dados: Tabela 59 xi (xi - x)2 1,4 (1,4 - 2,2)2 = 0,64 1,8 (1,8 - 2,2)2 = 0,16 2,1 (2,1 - 2,2)2 = 0,01 2,7 (2,7 - 2,2)2 = 0,25 3,0 (3,0 - 2,2)2 = 0,64 ∑(xi - x) 2 = 1,7 Como já vimos: s x x n s s s i2 2 2 2 2 1 17 5 1 0 425 0 652 = −( ) − = − = = ∑ , , , Cálculo de g.l: g.l. = n - 1 Logo, g.l. = 5 – 1 g.l. = 4 1 - a = 0,95 Consultando a tabela de distribuição t student, o valor tabelado encontrado é: tc = 2,776 197 PROBABILIDADE E ESTATÍSTICA Tabela 60 - Tabela t (de student) gl/P 0,90 0,80 0,70 0,60 0,50 0,40 0,30 0,20 0,10 0,05 0,02 0,01 0,001 01 0,158 0,325 0,510 0,727 1,000 1,376 1,963 3,078 6,314 12,706 31,821 63,657 636,619 02 0,142 0,289 0,445 0,617 0,816 1,061 1,386 1,886 2,920 4,303 6,965 9,925 31,598 03 0,137 0,277 0,424 0,584 0,765 0,978 1,250 1,638 2,353 3,182 4,541 5,541 12,924 04 0,134 0,271 0,414 0,569 0,741 0,941 1,190 1,533 2,132 2,776 3,747 4,604 8,610 05 0,132 0,267 0,408 0,559 0,727 0,920 1,156 1,476 2,015 2,571 3,365 4,032 6,869 06 0,131 0,265 0,404 0,553 0,718 0,906 1,134 1,440 1,943 2,447 3,143 3,707 5,959 07 0,130 0,263 0,402 0,549 0,711 0,896 1,119 1,415 1,895 2,365 2,365 3,499 5,408 08 0,130 0,262 0,399 0,546 0,706 0,889 1,108 1,397 1,860 2,306 2,896 3,355 5,041 09 0,129 0,261 0,398 0,543 0,703 0,883 1,100 1,383 1,833 2,262 2,821 3,250 4,781 10 0,129 0,260 0,397 0,542 0,700 0,879 1,093 1,372 1,812 2,228 2,764 3,169 4,587 11 0,129 0,260 0,396 0,540 0,697 0,876 1,088 1,363 1,796 2,201 2,718 3,106 4,437 0 - tc = -2,776 + tc = 2,776 g(t) 95% α 2 5 2 2 5 0 025= = =, % , α 2 5 2 2 5 0 025= = =, % , Figura 54 - Diagrama de distribuição t Student referente ao exercício 4 P x t s n x t s n P c c− < < + = −( ) − < < + . . , , . , , , µ α µ 1 2 2 2 776 0 652 5 2 2 2 7766 0 652 5 1 0 05 2 2 2 776 0 652 2 236 2 2 2 776 . , , , , . , , , , . = −( ) − < < +P µ 00 652 2 236 1 0 05 2 2 0 809 2 2 0 809 0 95 , , , , , , , , = −( ) − < < +( ) =P µ P(1,391 ≤ μ ≤ 3,009) = 95% 198 Unidade III Resposta: Portanto, com 95% de confiança, podemos admitir que a verdadeira média da pressão mínima sanguínea em mm/Hg populacional esteja contida no intervalo 1,391 ≤ μ ≤ 3,009. P(1,391 ≤ μ ≤ 3,009) = 95% 5. O reitor de uma universidade deseja estimar a idade média dos estudantes aprovados no último vestibular. Em uma amostra aleatória de 20 estudantes, a idade média encontrada foi de 25 anos. A partir de estudos passados, sabe-se que o desvio padrão é de 1,4 anos e que a população está normalmente distribuída. Construa um intervalo de confiança de 90% da idade média da população. Solução: Dados: • n = 20 • x = 25 • σ = 1,4 • 1 - a = 0,90 Portanto, a = 0,10 Consultando a tabela de z crítico (tabela distribuição normal padronizada Z), de acordo com o nível de confiança 90% ou 0,90: 0 -zc = -1,645 +zc = 1,645 1 - a = 90%1 2 90 2 45 0 45 − = = =α % , 1 2 90 2 45 0 45 − = = =α % , Figura 55 - Diagrama de distribuição normal referente ao exercício 5 199 PROBABILIDADE E ESTATÍSTICA Lembrete Procure no corpo da tabela o valor 0,450 e siga a linha e a coluna correspondente para obter os valores em torno desse para zc. Tabela 61 z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09 0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359 0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753 0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141 0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517 0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879 0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224 0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549 0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852 0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133 0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389 1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621 1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830 1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015 1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177 1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319 1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441 1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545 1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633 Assim, o valor obtido é estabelecido pela média aritmética em relação aos valores encontrados para Z em torno de 0,4950. zc = + =164 165 2 1645 , , , P(- 1,645 < Z < + 1,645) = 90% c = 1 - a = 90% (nível de confiança do intervalo). P x Z n x Z n P c c _ _ . . ( ) , . , , − < < + = − − < < + σ µ σ α µ 1 25 1645 14 20 25 1645.. , , , . , , , . , , 14 20 0 90 25 1645 14 4 472 29 1645 14 4 472 = − < < + P µ = − < < +( ) = < <( ) = 0 90 25 0 515 25 0 515 0 90 24 485 25 515 0 , , , , , , , P P µ µ 990 200 Unidade III P x Z n x Z n P c c _ _ . . ( ) , . , , − < < + = − − < < + σ µ σ α µ 1 25 1645 14 20 25 1645.. , , , . , , , . , , 14 20 0 90 25 1645 14 4 472 29 1645 14 4 472 = − < < + P µ = − < < +( ) = < <( ) = 0 90 25 0 515 25 0 515 0 90 24 485 25 515 0 , , , , , , , P P µ µ 990 Resposta: Portanto, com 90% de confiança, é possível admitir que a verdadeira média populacional esteja contida no intervalo: P( 24,485 ≤ μ ≤ 25,515) Saiba mais O estudante que desejar aprofundar-se na seara da estatística, como importante ferramenta para outras atividades profissionais, poderá obter mais informações, além das que as que serão possíveis disponibilizar nesse curso (em razão de tempo), no endereço: http://wps.prenhall.com/br_ mcclave_10/115/29579/7572475.cw/index.html. Acesso em: 28 fev. 2012. 8 TESTES 8.1 Testes de hipóteses Prezado aluno, considerado atualmente um dos principais assuntos da estatística, a inferência estatística é dividida em dois tópicos: a estimação de parâmetros, que você acabou de estudar, e os testes de hipóteses. Esses métodos estatísticos foram desenvolvidos com as primeiras técnicas de inferência, as quais faziam diversas hipóteses sobre a natureza da população da qual se extraíam os dados. Uma vez que os valores relacionados com a população são denominados parâmetros, essas técnicas estatísticas foram denominadas de paramétricas. Saiba mais O jornalista Santos (2003), da Folha.com, disponibilizou sites com índices econômicos, estatísticas e dados demográficos que podem ser utilizados em projetos de pesquisa. Acesse: http://www1.folha.uol.com.br/folha/informatica/ult124u14297.shtml201 PROBABILIDADE E ESTATÍSTICA Testes de hipóteses são, portanto, definidos como suposições feitas sobre os parâmetros de uma população em estudo. Essas hipóteses ou suposições podem ou não ser verdadeiras. Veja, a seguir, como elas são interpretadas: 8.1.1 Hipóteses nulas e alternativas a) Hipótese nula (Ho): é qualquer hipótese a ser testada, ou seja, a ser validada pelo teste. b) Hipótese alternativa (H1): é qualquer hipótese diferente da nula, complementar à Ho. O teste tem por finalidade colocar a hipótese nula em contradição com a hipótese alternativa. Assim, o teste poderá aceitar ou rejeitar a hipótese nula. A hipótese alternativa (H1), que é contrária à (Ho), será aceita se a hipótese nula (Ho) for rejeitada. Vamos supor que a média populacional μ seja o parâmetro que você deseja testar. As hipóteses nula (Ho) e alternativa (H1) são geralmente representadas como a seguir: 1º Tipo a) Ho: μ = μo H1: μ ≠ μo Quando efetuamos esse teste, o gráfico será sempre como a seguir: bilateral, com duas regiões de rejeição ou regiões críticas. Os valores que delimitam as áreas de aceitação e rejeição de todos os gráficos nos testes de hipóteses são obtidos das tabelas correspondentes de cada estudo. RC RC RA Figura 56 - Gráfico de distribuição bilateral, com duas áreas de rejeição Sendo: RA a região de aceitação (da hipótese nula (Ho)) e RC é a região crítica ou região de rejeição. Essas regiões, de aceitação e rejeição, são delimitadas por um valor tabelado obtido da Tabela da distribuição normal ou da Tabela da Distribuição t-Student, como veremos mais à frente. 202 Unidade III 2º Tipo b) Ho: μ ≤ μo H1: μ > μo RC RA Figura 57 - Gráfico de distribuição, com área de rejeição à direita 3º Tipo c) Ho: μ ≥ μo H1: μ < μo RC RA Figura 58 - Gráfico de distribuição, com área de rejeição à esquerda Observação Veja que, na hipótese nula (Ho), sempre temos uma igualdade (=) e na hipótese alternativa (H1), uma desigualdade (≤, ≥ ou ≠). As hipóteses testadas em a (1o tipo) envolvem um teste bilateral, enquanto em b e c (2o e 30 tipos), testes unilaterais. Isso é justificado pelo fato de que nas hipóteses testadas no 1o tipo há duas regiões de rejeição (os dois extremos do gráfico); portanto, será bilateral ou bicaudal. Por outro lado, nos 2o e 3o tipos só há uma região de rejeição; portanto, o teste será unilateral ou unicaudal. 203 PROBABILIDADE E ESTATÍSTICA Lembrete Os valores tabelados que delimitam as regiões de aceitação e rejeição do gráfico são retirados das tabelas de distribuição normal ou t-Student, como já foi explicado anteriormente. 8.1.2 Teste de hipótese para a média de uma população, amostra grande e pequena Para decidir o valor tabelado que será utilizado como fronteira entre as regiões de rejeição e aceitação, analise a tabela a seguir: Tabela 62 Tamanho da amostra Se a variância populacional (σ 2 ) Uso a distribuição GRANDE (n ≥ 30) conhecida Normal GRANDE (n ≥ 30) desconhecida Normal PEQUENA (n < 30) conhecida Normal PEQUENA (n < 30) desconhecida T de Student Importante! Observe que só se utiliza a distribuição t de Student quando as amostras são pequenas, ou seja, o número de elementos for inferior a 30 e a variância populacional for desconhecida. Caso a amostra seja grande (a partir de 30 elementos), não importará ser conhecida ou não a variância populacional, e será usada a tabela da distribuição normal para encontrar o valor Z. Portanto, na maior parte dos casos usaremos a distribuição normal, pois necessita que uma das condições seja atendida: amostra grande (n ≥ 30) ou variância populacional conhecida. Lembrete Por outro lado, para usar a distribuição t de Student, duas condições terão de acontecer ao mesmo tempo: amostra pequena (n < 30) e variância populacional desconhecida. Para procedermos ao teste, temos que conhecer o valor tabelado Z da distribuição normal ou de t da distribuição t de Student. Além dos valores tabelados, que irão delimitar as áreas de aceitação e rejeição, temos que encontrar os valores calculados (ZCALC ou tCALC) para efetuar o teste, que serão nossas estatísticas de testes. São esses valores que serão analisados se estão na área de aceitação ou de rejeição do gráfico, delimitados pelos valores tabelados, para aceitarmos ou não a hipótese a ser testada. 204 Unidade III 1. Se o desvio padrão populacional (σ) for conhecido, a estatística de teste será: Z x n calc = − µ σ ou, se a amostra for grande (n ≥ 30) e não soubermos o valor do desvio padrão populacional (σ), usaremos o desvio padrão amostral (S), e a estatística teste será: Z x s n calc = − µ 2. No caso de a amostra ser pequena (n < 30) e o desvio padrão populacional desconhecido, usaremos a Distribuição t de Student, e a estatística de teste será: t x s n calc = − µ Vamos supor que usaremos a distribuição normal padrão (Z): Para o teste bilateral: RC RC RA Figura 59 - Gráfico de distribuição bilateral, com duas áreas de rejeição Se: • Zcalc estiver na região RA (região de aceitação), ou seja, Se - Ztab < Zcalc <Ztab , aceita-se Ho • Caso ZCALC < - ZTAB, ou ZTAB < ZCALC, rejeita-se Ho 205 PROBABILIDADE E ESTATÍSTICA a) Teste unilateral à direita RC RA Figura 60 - Gráfico de distribuição, com área de rejeição à direita • Se ZCALC < ZTAB, aceita-se Ho • Se ZTAB < ZCALC, rejeita-se Ho b) Para quando o teste for unilateral à esquerda RC RA Figura 61 - Gráfico de distribuição, com área de rejeição à esquerda • Se - ZTAB < ZCALC, aceita-se Ho • Se ZCALC < ZTAB, rejeita-se Ho Observação Você usará o mesmo raciocínio para os casos em que se tratar de distribuição t-Student, com a diferença de que compararemos tcalc. com ttab., ao invés de ZCALC. com ZTAB. Para ajudá-lo(a) na análise da teoria, observe a resolução de exercícios de teste de hipóteses. 206 Unidade III Vamos aplicá-lo em alguns exemplos: 1o Estabelecer a hipótese Nula (H0) e a hipótese alternativa (H1) de acordo com o enunciado do problema. 2o Também de acordo com os dados do enunciado do problema, definir a distribuição que deve ser utilizada (distribuição normal ou t-Student). 3o Consulte a tabela normal padrão ou a tabela t-Student para encontrar o valor de ZTAB ou tTAB. 4o Desenhe a curva, plotando no eixo das abscissas o valor tabelado, que será o limite entre a área de aceitação (RA) e a(s) área(s) de rejeição (RC-Região Crítica). 5o Calcule a estatística de teste (ZCALC ou tCALC), utilizando uma das fórmulas dadas anteriormente. 6o Compare o valor calculado com o valor tabelado e conclua se deverá ser aceita ou rejeitada a hipótese nula. Observação Agora que você já tem um roteiro para seguir na execução dos testes de hipóteses, deverá ficar bem mais fácil a sua realização. Mas, antes de passarmos para os exemplos, vamos praticar um pouco o uso das tabelas com os principais níveis de significância (a) que geralmente são adotados, como listados a seguir. A) I Na Tabela da Distribuição Normal Para o teste bilateral: a) Se a = 1%, teremos a/2 = 0,5% = 0,005 (para cada lado da curva) e a área de aceitação será de 99% (0,99), sendo 0,495 à esquerda e 0,495 à direita do ponto máximo da curva. Lembrete A distribuição normal é simétrica! Consultando a tabela normal, temos 0,4949 para uma abscissa de 2,57 e 0,4951 para uma abscissa de 2,58. 207 PROBABILIDADE E ESTATÍSTICA Tabela 63 z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09 0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359 0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753 0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141 0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517 0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879 0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224 0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.25490.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852 1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4698 0.4699 0.4706 1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767 2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817 2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857 2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890 2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916 2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936 2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952 2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964 2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974 2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981 2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986 3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990 Logo, por interpolação, a abscissa correspondente à área de 0,495 será a média das duas abscissas, ou seja, 2,575. Para facilitar, adotaremos, no teste bilateral, quando a = 1%, ZTAB = 2,58. Vejamos o gráfico da curva normal: 0,005 -ZTAB = -2,58 +ZTAB = +2,58 0,005 Áreas de aceitação 0,495 0,495 Figura 62 - Gráfico de distribuição normal, com duas áreas de rejeição Nesse caso, Ho só será aceita caso o valor de ZCALC estiver entre -2,58 e 2,58. 208 Unidade III b) Se a = 5%, teremos a/2 = 2,5% = 0,025 (para cada lado) e a área de aceitação será de 95% (0,95), sendo 0,475 à esquerda e 0,475 à direita. Verificamos, na tabela normal, que uma área de 0,475 corresponde à abscissa 1,96. Logo, no teste bilateral, quando a = 5%, então Z TAB =1,96. Vejamos o gráfico da curva normal: 0,025 -ZTAB = -1,96 +ZTAB = +1,96 0,025 Áreas de aceitação 0,475 0,475 Figura 63 - Gráfico de distribuição normal, com duas áreas de rejeição Aceitaremos H0 se: -1,96 < ZCALC < 1,96. c) O mesmo desenvolvimento será adotado para a = 10%, a/2 = 5% = 0,05 (para cada lado). Área de aceitação igual a 0,90, sendo 0,45 à esquerda e 0,45 à direita. Na Tabela Normal, uma área de 0,4495 corresponde à abscissa 1,64 e uma área de 0,4505 corresponde à abscissa de 1,65. Portanto, com precisão, a abscissa seria 1,645. Mas, para facilitar, vamos adotar no teste bilateral, quando a = 10%, ZTAB = 1,65. Vejamos o gráfico da curva normal: 0,05 -ZTAB = -1,65 +ZTAB = +1,65 0,05 Áreas de aceitação 0,45 0,45 Figura 64 - Gráfico de distribuição normal, com duas áreas de rejeição Aceitaremos H0 se: -1,65 < ZCALC < 1,65. Para o teste unilateral (vamos considerar apenas o teste à direita, sabendo que vale o mesmo raciocínio para o teste à esquerda, bastando inverter os lados). d) Se a = 1% (0,01), a área de aceitação será de 99% (0,99) à esquerda. Mas, até a metade da curva (lembre-se de que a distribuição normal é simétrica), temos 50% (0,5) de área. Logo, queremos a abscissa correspondente a uma área de 0,49. Consultando, na tabela normal, o valor mais próximo é de 0,4901, correspondente a uma abscissa de 2,33. Assim, no teste unilateral à direita, quando a = 1%, teremos ZTAB = 2,33, e no teste unilateral à esquerda para o mesmo a, - ZTAB = -2,33. Veja o gráfico da curva normal: 209 PROBABILIDADE E ESTATÍSTICA +ZTAB = +2,33 0,01 Áreas de aceitação 0,50 0,49 Figura 65 - Gráfico de distribuição normal, com área de rejeição à direita e) Se a = 5% (0,05), teremos área de aceitação = 0,95 à esquerda. Consultaremos, na tabela normal, a área de 0,45 (0,95 - 0,50), que corresponde à abscissa de 1,65. Portanto, no teste unilateral à direita, quando a = 5%, então ZTAB = 1,65, e no teste unilateral à esquerda para o mesmo a, -ZTAB = -1,65. Vejamos o gráfico da curva normal: +ZTAB = +1,65 0,05 Áreas de aceitação 0,50 0,45 Figura 66 - Gráfico de distribuição normal, com área de rejeição à direita f) Se a = 10% (0,10), área de aceitação = 0,90 à esquerda. Na tabela normal, o valor mais próximo de 0,40 (0,90 – 0,50) é de 0,3997, que corresponde à abscissa de 1,28. Portanto, no teste unilateral à direita, para a = 10%, ZTAB = 1,28 e no teste unilateral à esquerda, -ZTAB = -1,28. Vendo o gráfico da curva normal: +ZTAB = +1,28 0,10 Áreas de aceitação 0,50 0,40 Figura 67 - Gráfico de distribuição normal, com área de rejeição à direita 210 Unidade III B) II Tabela da distribuição t-Student Nesse teste, temos que utilizar dois parâmetros para a consulta da tabela t-Student: a (alfa), que é o nível de significância, e (g.l.), que é o número de graus de liberdade dado por: n (número de elementos da amostra) menos 1 unidade, ou seja: g.l. = n – 1. Temos que avaliar também o tipo de tabela, que pode ser: bilateral ou unilateral. Aqui, usaremos a tabela bilateral, como pode ser notado no desenho da curva na própria tabela. Assim, no teste bilateral, o a da tabela será o próprio a utilizado no teste. Mas, para o teste unilateral, teremos que procurar, nessa tabela, o dobro do a. a) Teste bilateral: suponha uma amostra de 25 elementos (n = 25). Portanto, g.l. = 25 – 1, g.l. = 24. Para um a = 5%, vemos na tabela que a célula interseção de a = 0,05 e g.l. = 24 nos fornece 2,064. Portanto: tTAB = 2,064 para a = 5% e n = 25. Tabela 64 - Tabel t (de Student) gl/P 0,90 0,80 0,70 0,60 0,50 0,40 0,30 0,20 0,10 0,05 0,02 0,01 0,001 01 0,158 0,325 0,510 0,727 1,000 1,376 1,963 3,078 6,314 12,706 31,821 63,657 636,619 02 0,142 0,289 0,445 0,617 0,816 1,061 1,386 1,886 2,920 4,303 6,965 9,925 31,598 03 0,137 0,277 0,424 0,584 0,765 0,978 1,250 1,638 2,353 3,182 4,541 5,541 12,924 04 0,134 0,271 0,414 0,569 0,741 0,941 1,190 1,533 2,132 2,776 3,747 4,604 8,610 05 0,132 0,267 0,408 0,559 0,727 0,920 1,156 1,476 2,015 2,571 3,365 4,032 6,869 20 0,127 0,257 0,391 0,533 0,687 0,860 1,064 1,325 1,725 2,086 2,528 2,845 3,850 21 0,127 0,257 0,391 0,532 0,686 0,859 1,063 1,323 1,721 2,080 2,518 2,831 3,819 22 0,127 0,256 0,390 0,532 0,686 0,858 1,061 1,321 1,717 2,074 2,508 2,819 3,792 23 0,127 0,256 0,390 0,532 0,685 0,858 1,060 1,319 1,714 2,069 2,500 2,807 3,767 24 0,127 0,256 0,390 0,531 0,685 0,857 1,059 1,318 1,711 2,064 2,492 2,797 3,745 25 0,127 0,256 0,390 0,531 0,684 0,856 1,058 1,316 1,708 2,060 2,485 2,787 3,726 26 0,127 0,256 0,390 0,531 0,684 0,856 1,058 1,315 1,706 2,056 2,479 2,779 3,707 27 0,127 0,256 0,389 0,531 0,684 0,856 1,057 1,314 1,703 2,052 2,473 2,771 3,690 Observe o gráfico: 0,025 0,025 2,064 Figura 68 - Gráfico de distribuição t de Student, teste bilateral 211 PROBABILIDADE E ESTATÍSTICA Observe que para um teste unilateral com o mesmo tamanho de amostra e o mesmo a: não será possível obter diretamente a interseção de a = 0,05 com g.l.= 24, pois o valor fornecido é para um teste bilateral. Nesse caso, busca-se a interseção de g.l. = 24 com a = 0,10. Lembrete Não se esqueça de que, na tabela (bilateral), a = 0,05 corresponde a 0,025 de cada lado. Por essa razão, será adotado a = 0,10, que corresponderá a 0,05 de cada lado. Assim, a célula interseção de a = 0,10 com g.l.= 24 fornecerá tTAB = 1,711. Veja o gráfico: 0,05 1,711 Figura 69 - Gráfico de distribuição t de Student, teste unilateral Exemplo de aplicação Exercícios resolvidos de teste para a média populacional utilizando a distribuição normal 1. A nota média em um curso de graduação era da ordem de 61 pontos. Atualmente existem monitores à disposição dos alunos para orientação nas disciplinas de maior dificuldade. Deseja-se saber se a nota média do curso aumentou após a introdução da monitoria. Para isso, selecionaram-se 40 alunos do curso atual, e a média de notas encontradas foi de 66 pontos, com um desvio padrão de 3 pontos. Ao nível de significância de 5%, pode-se concluir que a nota média aumentou? Solução: Dados: μ = 61 pontos N = 40 x = 66 pontos 212 Unidade III S = 3 pontos a = 5% Primeiramente, você deverá calcular a estatísticade teste: Cálculo da estatística de teste Z x s n Z Z Z Z calc calc calc calc calc = − = − = = = µ 66 61 3 40 5 3 6 32 5 0 47 10 6 , , , 44 → estatística de teste Após o cálculo da estatística teste, devemos formular as hipóteses a serem testadas: Ho: μ = 61 pontos H1: μ ≠ 61 pontos Valores tabelados: serão obtidos a partir da tabela de distribuição normal, com a = 5% e teste bilateral (bicaudal). 0 - zc = -1,96 + zc = 1,96 1 a = 95% 1 2 95 2 47 5 0 475 − = = =α , % , 1 2 95 2 47 5 0 475 − = = =α , % , Figura 70 - Diagrama de distribuição Normal, para nível de significância de 5% (ou seja, confiança de 90%) 213 PROBABILIDADE E ESTATÍSTICA Tabela 65 z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09 0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359 0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753 0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141 0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517 0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879 0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224 0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549 0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852 0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133 0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389 1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621 1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830 1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015 1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177 1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319 1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441 1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545 1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633 1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706 1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767 2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817 2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857 2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890 Procure no corpo da tabela o valor 0,4750, siga a linha e a coluna correspondente e obterá: Ztab = ±196, R R Área de aceitação - zTAB = -1,96 + zTAB = +1,96 Figura 71 - Distribuição normal, para nível de significância de 5% (teste bilateral) 214 Unidade III As regiões abaixo de -1,96 e acima de +1,96 são de rejeição e a região entre -1,96 e +1,96 é de aceitação. Como Zcalc = 10,64 está acima de + 1,96, está na área de rejeição, portanto rejeita-se Ho. Deve-se efetuar, portanto, um novo teste: Ho: μ = 61 pontos H1: μ ≥ 61 pontos Valor tabelado: será obtido a partir da tabela de distribuição normal, com a = 5% e teste unilateral (unicaudal). Lembrete: utilize o valor de a dobrado, ou seja: a = 10%. 0 - ztab = -1,645 1 - a = 90% 1 2 90 2 45 0 45 − = = =α % , Figura 72 - Diagrama de distribuição normal, para nível de significância de 5% (ou seja, confiança de 90%) Tabela 66 z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09 0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359 0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753 0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141 0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517 1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177 1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319 1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441 1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545 1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633 1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706 215 PROBABILIDADE E ESTATÍSTICA Lembrete Procure, no corpo da tabela, o valor 0,450, siga a linha e a coluna correspondente para valores de z aproximados. No entanto, se for o caso de um cálculo mais rigoroso, é necessário estabelecer a média aritmética em relação aos valores encontrados para Z em torno de 0,450. ztab = + =164 165 2 1645 , , , No entanto, na situação de exercício, vamos utilizar: Z ou tab = − + 165 165 , , Como a região de aceitação está à direita, utilizaremos o valor positivo de ZTAB = +1,65. R Área de aceitação - zTAB = -1,65 Figura 73 - Diagrama de distribuição normal, teste unilateral para nível de significância de 5% Uma vez que Zcalc = 10,64, está, portanto, na região de aceitação, aceita-se H1, então: H1: μ = > 61 pontos. Como μ = 61 pontos, já havia sido rejeitado no primeiro teste, então o que está sendo aceito agora é só μ > 61 pontos. Resposta: Como a hipótese aceita é de μ > 61 pontos, ao nível de significância de 5%, pode-se concluir que a nota média aumentou. 216 Unidade III 2. O peso médio de embalagens de suco de uva em uma linha de produção está sendo investigado. O padrão prevê um conteúdo médio de 1000 ml por embalagem. Sabe-se que o desvio padrão é de 10 ml e que a variável tem distribuição normal. Ao nível de 1% de significância com 4 unidades amostrais, e sendo o conteúdo médio da embalagem de 1012 ml, o que se pode concluir quanto ao padrão estar sendo respeitado? Solução: Dados: μ = 1000 ml σ = 10 ml N = 4 x = 1012 ml a = 1% Cálculo da estatística de teste Z x n Z Z Z Z calc calc calc calc calc = − = − = = = µ σ 1012 1000 10 4 12 10 2 12 5 2 4, → estatística teste Após o cálculo da estatística teste, devemos formular as hipóteses a serem testadas: Ho: μ = 1000 ml H1: μ ≠ 1000 ml Valores tabelados: serão obtidos a partir da tabela de distribuição normal, com a = 1% e teste bilateral (bicaudal) → Ztab = Ztab = ±± 2,58 2,58 217 PROBABILIDADE E ESTATÍSTICA Lembrete O procedimento é similar ao do exercício anterior. Caso você tenha dúvidas, retome a unidade I. R R Área de aceitação - zTAB = -2,58 + zTAB = +2,58 Figura 74 - Diagrama de distribuição normal, teste bilateral para nível de significância de 1% As regiões abaixo de -2,58 e acima de +2,58 são de rejeição e a região entre -2,58 e +2,58 é de aceitação. Como Zcalc = 2,4 está entre –2,58 e +2,58, considerada região de aceitação, aceita-se Ho: μ = 1000 ml. Resposta: Uma vez que o padrão prevê um conteúdo médio de 1000 ml por embalagem, ao nível de 1%, podemos aceitar que o padrão está sendo respeitado. 3. A média de ganho de peso de crianças amamentadas com leite materno é de 25 g, com um desvio padrão de 5 g durante certo período observado nos primeiros meses de vida. Para uma amostra de 35 crianças observadas durante o mesmo período, alimentadas com leite de vaca, observou-se um ganho de peso médio de 30 g. Podemos afirmar, ao nível de 1%, que a amamentação com leite materno contribui mais para o ganho de peso nos primeiros meses de vida? Solução: Dados: μ = 25 g σ = 5 g N = 35 x = 30 a = 1% 218 Unidade III Cálculo da estatística teste Z x n Z Z Z Z calc calc calc calc calc = − = − = = = µ σ 30 25 5 35 5 5 5 92 5 0 84 5 95 , , , → estatística de teste Após o cálculo da estatística de teste, devemos formular as hipóteses a serem testadas: Ho: μ = 30 g H1: μ ≠ 30 g Valores tabelados: serão obtidos a partir da tabela de distribuição normal. Lembrete O procedimento é similar ao dos exercícios anteriores. Caso você tenha dúvidas, retome a unidade I. Com a = 1% e teste bilateral (bicaudal) → Ztab = Ztab = ++ 2,58 2,58 R R Área de aceitação - zTAB = -2,58 + zTAB = +2,58 Figura 75 - Diagrama de distribuiçãonormal, teste bilateral para nível de significância de 1% 219 PROBABILIDADE E ESTATÍSTICA As regiões abaixo de -2,58 e acima de +2,58 são de rejeição e a região entre - 2,58 e + 2,58 é de aceitação. Como Zcalc = 5,95 está acima de +2,58, ou seja, está na área de rejeição, rejeita-se Ho. Deve-se efetuar, portanto, um novo teste: Ho: μ = 30 g H1: μ ≥ 30 g Valor tabelado: será obtido a partir da tabela de distribuição normal. com a = 1% e teste unilateral (unicaudal). Lembrete Como o teste unilateral só foi utilizado uma vez neste estudo, o cálculo de z tabelado será feito de forma mais detalhada. Assim, não se esqueça de utilizar o valor de a dobrado: a = 2%. 0 - ztab = -2,33 1 - a = 98% 1 2 98 2 49 0 49 − = = =α % , Figura 76 - Diagrama de distribuição normal, para nível de significância de 1%, Teste Unilateral 220 Unidade III Tabela 33 z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09 0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359 0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753 0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141 0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517 0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879 0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224 0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549 0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852 0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133 0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389 1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621 1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830 1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015 1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177 1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319 1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441 1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545 1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633 1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706 1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767 2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817 2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857 2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890 2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916 2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936 2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952 Lembrete Procure no corpo da tabela o valor 0,490, siga a linha e a coluna correspondente para valores de z aproximados. No entanto, na situação de exercício, vamos utilizar: Z ou tab = − + 2 33 2 33 , , 221 PROBABILIDADE E ESTATÍSTICA Como a região de aceitação está à direita e a de rejeição à esquerda, utilizaremos o valor negativo de Ztab = - 2,33. R Área de aceitação - zTAB = -2,33 Figura 77 - Diagrama de distribuição normal, teste unilateral para nível de significância de 1% Uma vez que Zcalc = 5,95 está na região de aceitação, pois é maior que 2,33, rejeita-se H1. Então, a hipótese a ser aceita seria o 2o tipo, ou seja, H: μ > 30 g. Hipótese aceita: H1: μ > 30 g. Como μ = 30 gramas, já havia sido rejeitada no primeiro teste, então o que está sendo aceito agora é só μ > 30 g. Resposta: Como a hipótese aceita é de μ > 30 g, ao nível de significância de 1%, pode-se concluir que o ganho de peso com o leite de vaca é inferior nesse período, sendo superior o ganho de peso com leite materno. 4. Para verificar a eficácia de uma nova droga contra determinada doença, foram injetadas doses em 15 ratos, e a média de ratos que adoeceram foi igual a 20, com desvio padrão de 6. Com a droga antiga, a média de ratos doentes era em torno de 23. Podemos afirmar ao nível de 1% que a nova droga trouxe resultados melhores na prevenção da doença? Solução: Dados: μ =23 ratos N = 15 x = 20 ratos S = 6 pontos a = 1% Observação: Como se trata de amostra pequena (N < 30) e desvio padrão populacional (σ) desconhecido, deve-se aplicar o teste t de Student para a média populacional. 222 Unidade III Cálculo da estatística de teste: t x s n t t t t calc calc calc calc calc = − = − = − = − = − µ 20 23 6 15 3 6 15 3 6 3 87 3 1 , ,, , 55 194tcalc = − Após o cálculo da estatística teste, devemos formular as hipóteses a serem testadas: Ho: μ = 23 ratos doentes H1: μ ≠ 23 ratos doentes Valores tabelados: serão obtidos a partir da tabela de distribuição t de Student, com a = 1%, teste bilateral (bicaudal) e g.l. = N -1 = 15 – 1 = 14. 223 PROBABILIDADE E ESTATÍSTICA Tabela 67 gl/P 0,90 0,80 0,70 0,60 0,50 0,40 0,30 0,20 0,10 0,05 0,02 0,01 0,001 01 0,158 0,325 0,510 0,727 1,000 1,376 1,963 3,078 6,314 12,706 31,821 63,657 636,619 02 0,142 0,289 0,445 0,617 0,816 1,061 1,386 1,886 2,920 4,303 6,965 9,925 31,598 03 0,137 0,277 0,424 0,584 0,765 0,978 1,250 1,638 2,353 3,182 4,541 5,541 12,924 04 0,134 0,271 0,414 0,569 0,741 0,941 1,190 1,533 2,132 2,776 3,747 4,604 8,610 05 0,132 0,267 0,408 0,559 0,727 0,920 1,156 1,476 2,015 2,571 3,365 4,032 6,869 06 0,131 0,265 0,404 0,553 0,718 0,906 1,134 1,440 1,943 2,447 3,143 3,707 5,959 07 0,130 0,263 0,402 0,549 0,711 0,896 1,119 1,415 1,895 2,365 2,365 3,499 5,408 08 0,130 0,262 0,399 0,546 0,706 0,889 1,108 1,397 1,860 2,306 2,896 3,355 5,041 09 0,129 0,261 0,398 0,543 0,703 0,883 1,100 1,383 1,833 2,262 2,821 3,250 4,781 10 0,129 0,260 0,397 0,542 0,700 0,879 1,093 1,372 1,812 2,228 2,764 3,169 4,587 11 0,129 0,260 0,396 0,540 0,697 0,876 1,088 1,363 1,796 2,201 2,718 3,106 4,437 12 0,128 0,259 0,395 0,539 0,695 0,873 1,083 1,356 1,782 2,179 2,681 3,055 4,318 13 0,128 0,259 0,394 0,538 0,694 0,870 1,079 1,350 1,771 2,160 2,650 3,012 4,221 14 0,128 0,258 0,393 0,537 0,692 0,868 1,076 1,345 1,761 2,145 2,624 2,977 4,140 15 0,128 0,258 0,393 0,536 0,691 0,866 1,074 1,341 1,753 2,131 2,602 2,947 4,073 Utilizando a linha de graus de liberdade 14 e a coluna referente a 1%, obtém-se ttab = 2,977. 0 - ttab = -2,977 + ttab = 2,977 99% g(t) α 2 1 2 0 5 0 005= = =, % , α 2 1 2 0 5 0 005= = =, % , Figura 78 - Diagrama de distribuição t de Student ttab = + 2,977 ttab = -2,977 224 Unidade III RCRC ttab = -2,977 ttab = 2,977 RA Figura 79 - Diagrama de distribuição, teste bilateral Resposta: Como a estatística de teste (tcalc = 1,94) está na região de aceitação do gráfico, aceita-se: Ho: μ = 23 ratos doentes, o que significa que a média de ratos doentes não se modificou; logo, a droga não trouxe resultados melhores na prevenção da doença. Conclusão A droga não foi eficiente. 5. O tempo médio, por operário, para executar uma tarefa tem sido 100 minutos, com um desvio padrão de 15 minutos. Introduziu-se uma modificação para diminuir esse tempo e, após certo período, sorteou-se uma amostra de 16 operários, medindo-se o tempo de execução de cada um. O tempo médio da amostra foi de 85 minutos. Esses resultados trazem evidências estatísticas da melhora desejada ao nível de 5%? Solução: Dados: μ = 100 minutos N = 16 x = 85 minutos σ = 15 minutos a = 5% Primeiramente, deveremos calcular a estatística de teste: 225 PROBABILIDADE E ESTATÍSTICA Cálculo da estatística de teste Z x n Z Z Z Z calc calc calc calc calc = − = − = − = − = µ σ 85 100 15 16 15 15 4 15 3 75, −− →4 estatística de teste Após o cálculo da estatística teste, devemos formular as hipóteses a serem testadas: Ho: μ = 100 minutos H1: μ ≠ 100 minutos Valores tabelados: serão obtidos a partir da tabela de distribuição
Compartilhar