Baixe o app para aproveitar ainda mais
Prévia do material em texto
130 CAPÍTULO 8. ESTIMAÇÃO POR INTERVALOS 1. Conceitos O comportamento de um pesquisador é obter uma amostra que seja representativa da população na qual ele tem interesse. No entanto podemos sempre esperar alguma diferença entre uma amostra aleatória ou não e a população da qual ela foi extraída. A média da amostra x nem sempre coincide com a média da população . O mesmo podemos dizer com respeito ao desvio padrão S da amostra e o desvio padrão da população. Apesar dos melhores esforços do pesquisador sempre ocorre um erro, conhecido por erro amostral. A estimativa de parâmetros populacionais por intervalos leva em conta uma estimativa pontual à qual se adiciona um erro de estimação para mais e para menos, criando assim uma amplitude com limite inferior e superior para o parâmetro populacional estimado. Suponhamos que se deseja estudar o comportamento das alturas dos alunos do sexo masculino de todas as turmas dos Cursos de Engenharia e de todas as Faculdades do Estado de São Paulo. Obter as alturas de todos os alunos é inviável não só pelo elevado custo, mas, também pelo trabalho exaustivo para se coletar todos esses dados. Devemos, pois, determinar uma amostra que seja representativa dessa população. Suponhamos uma variável X normalmente distribuída e se a distribuição é normal, seus parâmetros são a média populacional 𝜇 e o desvio padrão populacional 𝜎. Se coletarmos i amostras (i = 1, 2, 3,..., n) aleatoriamente de X tendo cada amostra n elementos e sendo as amostras 𝑋1, 𝑋2, 𝑋3, … , 𝑋𝑛, obtidas aleatoriamente e independentes, então podemos esperar que nessa longa série a média ix ( média das médias) tenderá para a média populacional 𝜇 principalmente quando n for grande. Sabemos ainda que a média amostral é dada por: �̅� = 1 𝑛 (𝑋1 + 𝑋2 + 𝑋3 + ⋯ + 𝑋𝑛) e como a média �̅� é uma variável aleatória, ela tem sua esperança e variância dadas por: 𝐸(�̅�) = 1 𝑛 (𝐸(𝑋1) + 𝐸(𝑋2) + 𝐸(𝑋3) + ⋯ + 𝐸(𝑋𝑛))= 1 𝑛 (𝜇 + 𝜇 + 𝜇 + ⋯ + 𝜇) = 𝑛𝜇 𝑛 = 𝜇 Var(�̅�) = 1 𝑛2 𝑉𝑎𝑟(𝑋1 + 𝑋2 + 𝑋3 + ⋯ + 𝑋𝑛)= 1 𝑛2 [𝑉𝑎𝑟(𝑋1) + 𝑉𝑎𝑟(𝑋2) + 𝑉𝑎𝑟(𝑋3) + ⋯ + 𝑉𝑎𝑟(𝑋𝑛)]= 1 𝑛2 (𝜎2+𝜎2 + 𝜎2 + ⋯ + 𝜎2) = 𝑛𝜎2 𝑛2 = 𝜎2 𝑛 e tem desvio padrão ( ) xX n . Exemplo 1: Tomemos como exemplo uma população de 5 alunos da disciplina de estatística que foram submetidos a uma prova de 5 questões. Segue a distribuição dos acertos dos alunos A,B,C,D e E, sendo 1,2,3,4,5ix a quantidade de questões certas. Determinemos a média populacional e desvio padrão da população. Resolução: Para obtermos esses valores montamos a tabela. alunos xi fi xi fi || xxi || xxi fi 2( )ix x fi A 2 1 2 1 1 1 B 3 1 3 0 0 0 C 1 1 1 2 2 4 D 5 1 5 2 2 4 E 4 1 4 1 1 1 15 10 131 Logo a Média é 15 3 5 i ix f x n e Variância 2 ( )X 2 ( ) i i x x f n 10 2 5 e seu Desvio Padrão 2 1,4142 Selecionemos agora todas as amostra possíveis de 2 acertos com repetição, isto é, 5 2 =25 duplas e determinemos a média populacional e desvio padrão , para todas as amostras. Resolução: Para obtermos esses valores montamos a tabela. Amostra 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Acertos 1,1 1,2 1,3 1,4 1,5 2,1 2,2 2,3 2,4 2,5 3,1 3,2 3,3 3,4 Média ix 1 1,5 2 2,5 3 1,5 2 2,5 3 3,5 2 2,5 3 3,5 Amostra 15 16 17 18 19 20 21 22 23 24 25 Acertos 3,5 4,1 4,2 4,3 4,4 4,5 5,1 5,2 5,3 5,4 5,5 Média ix 4 2,5 3 3,5 4 4,5 3 3,5 4 4,5 5 Construindo a distribuição das médias de todas as amostras segue ix fi ix fi | |i xx | |i xx fi | |i xx fi 1,0 1 1 2,0 2,0 4,0 1,5 2 3 1,5 3,0 4,5 2,0 3 6 1,0 3,0 3,0 2,5 4 10 0,5 2,0 1,0 3,0 5 15 0 0 0 3,5 4 14 0,5 2,0 1,0 4,0 3 12 1,0 3,0 3,0 4,5 2 9 1,5 3,0 4,5 5,0 1 5 2,0 2,0 4,0 75 25 Logo a média das amostras é 75 3, 25 i xx que coincide com a média da população e o desvio padrão 25 1 25 x . Observação 1: A distribuição amostral da média tende para uma distribuição normal. Observação 2: A média da distribuição amostral das médias é igual a média da população. Observação 3: O desvio padrão da distribuição amostral das médias é menor que o desvio padrão da população. Observação 4: Se uma distribuição é normal, então a distribuição amostral da média é também normal. 132 Observação 5: Raramente um pesquisador coleta de uma população uma quantidade grande de amostras como fizemos no exemplo 1, como isso não ocorre podemos calcular o desvio padrão da distribuição amostral das médias dividindo o desvio padrão da população pela raiz quadrada do tamanho da amostra, assim 2 ( ) 1 2 xX n . Exemplo 2: Sejam a média da população =100 e o desvio padrão 20 e seja o tamanho das amostras iguais a 25 elementos. Determinar o desvio padrão da distribuição amostral das médias. Sabemos que ( ) xX n = 20 20 4. 525 Denominamos de erro padrão da média amostral a ( ) xX n . Teorema Central do limite Na medida em que aumenta o tamanho n da amostra, a distribuição amostral da média de uma amostra aleatória extraída de qualquer população, tende para uma distribuição normal com média e desvio padrão x n . Exemplo 3: Uma variável aleatória X tem distribuição normal com média 50 e desvio padrão 12. Calcular a probabilidade de que uma amostra de 64 elementos selecionados aleatoriamente tenha média maior que 53? Resolução: Sabemos que a distribuição amostral da média tem 50xx e x 12 12 1,5 864n . Usando a variável normal padronizada segue: 53 50 3 2 1,5 1,5x x x z ,logo ( 53) ( 2) 0,5 (0 2) 0,5 0,47725 0,02275 2,275%.p x p z p z 2. Intervalos de Confiança É o processo de estimar um parâmetro desconhecido, construindo um intervalo de confiança com uma probabilidade (1−∝) (nível de confiança ) que contenha o verdadeiro parâmetro. O nível de confiança pode ser obtido até 99%. Conhecendo-se uma amostra de uma população, é sempre possível obtermos a média da amostra, por meio da fórmula i ix f x n , porém, como dissemos no início é inviável obter a média da população não só pelo elevado custo, mas, também pelo trabalho exaustivo para se coletar todos esses dados. Para isso, determinamos um intervalo para o valor de , com probabilidade de ( 1 ) de certeza que a média da população se encontre nesse intervalo. Devemos construir um intervalo de confiança da forma: (um erro de amostragem)x .Qual deve ser a amplitude de tolerância para este erro? O estudo de estimação intervalar para as médias populacionais é condicionado por duas situações: 1º caso: Quando o desvio padrão ou a variância populacional é conhecido. 2º caso: Quando não se conhece o desvio padrão ou variância populacional. 133 Antes de iniciarmos estas considerações convém visualizarmos o significado dos intervalos de confiança para a média populacional . Gráfico do Intervalo de Confiança, sendo µ o parâmetro populacional; (1 – α) é o nível de certeza da estimativa ou probabilidade do intervalo conter o parâmetro populacional. Fig.1 2.1 Aplicação das tabelas Z e t. A utilização das tabelas que representam a probabilidade depende do tamanho da amostrae do conhecimento da variância populacional, o que por sua vez condiciona a estatística de teste. No quadro abaixo resumimos a utilização das duas tabelas: Variância Populacional σ 2 Amostra n Estatística de teste Se o valor de σ é conhecido Use o estimador σ n> 30 elementos X Z n n≤ 30 elementos Se o valor de σ é desconhecido Use o estimador S como aproximação de σ n> 30 elementos X Z s n n≤30 elementos X t s n 2.2 Formulando a Estimação Intervalar A estimação intervalar tem como ponto de partida uma estimação pontual do parâmetro a ser estimado. Observação 6: Se X é uma variável normal de média e desvio padrão , então a distribuição normal padronizada é obtida por meio da mudança de variável . x z Se X é uma variável normal de média e desvio padrão n , então a distribuição normal padronizada tem mudança de variável ( ) X Z n 134 Na prática, se quer garantir com certo grau de certeza (1 – α) que a abscissa padronizada Z do parâmetro estimado esteja dentro do intervalo desejado, que vai de −𝑍𝛼/2 a 𝑍𝛼/2 . Desta forma poderemos escrever uma expressão que traduza esta abordagem do cálculo da probabilidade e que esta variável padronizada Z caia no intervalo, −𝑍𝛼/2 a 𝑍𝛼/2, então 2 2[ ] (1 )p Z Z Z A variável padronizada Z, que representa o afastamento da estimativa pontual x para o parâmetro µ em quantidades de desvios padrão, pode ser escrita como: ( ) ( ) x X Z n daí escrevemos que, 2 2[ ] (1 ) X p Z Z n Devido ao fato que desejamos estimar o parâmetro populacional µ vamos modi-ficar a expressão acima a fim de isolar µ. Multiplicando a desigualdade por n 2 2 (1 )p Z X Z n n , 2 2( )p Z X Z n n (subtraindo X , segue) 2 2( ) (multiplicando por (-1)p X Z X Z n n 2 2( )p X Z X Z n n 1 , ou ainda 2 2 (1 )p X Z X Z n n (I) Desta forma a média µ da população poderá ser estimada com o nível de certeza e a probabilidade desejada. 3. Intervalo de confiança para a média da população, com a média da amostra x e o desvio padrão conhecido. Exemplo 4: Quando o desvio padrão populacional é conhecido. Se as alturas dos alunos do sexo masculino da disciplina de estatística dessa Faculdade têm distribuição normal e que numa amostra de 100 alunos foi encontrada a média x 175 cm e desvio padrão S =15 cm, determinar o intervalo de confiança para a média ao nível 90%. Solução: Do enunciado podemos escrever: 100 ; 175 ; 15 ; 10%n x S Observação 7: Neste caso podemos substituir por S pois, a amostra tem mais de 30 elementos. Na tabela da distribuição normal encontramos 2Z = 1,65 135 Fig. 2 Substituindo esse valor na expressão ( I ), segue 15 15 (175 .1,65 175 .1,65) 100 100 p = (175 2,475 175 2,475) 90%p (172,525 177,475) 90%p Podemos afirmar com 90% de confiança que a altura média dos alunos é um valor que está no intervalo entre 172,525cm e 177,475cm. Exemplo 5: Seja X a duração de vida de uma nova bateria de celular. Foram testadas 100 baterias fornecendo uma duração de vida média de x 500h e desvio padrão =5 h e que se deseja obter um intervalo de confiança ao nível de 95% para a média . Solução: Do enunciado podemos escrever: 100 ; 500 ; 5 ; 5%n x Na tabela da distribuição normal encontramos 2Z = 1,96 Fig. 3 Substituindo esse valor na expressão ( I ), segue 5 5 (500 .1,96 500 .1,96) 100 100 p = (499,2 500,98) 95%p Podemos afirmar com 95% de confiança que a duração de vida média é um valor que está no intervalo entre 499,2 h e 500,98 h. Exemplo 6: De uma população normal com variância 2 igual a 36 e média x 16, foi retirada uma amostra de 40 elementos. Pede-se determinar um Intervalo de Confiança para a média populacional com um nível de confiança de 95%. Solução: -1,96 1,96 1,65 1,65 45% 45% 0, 475 0, 475 136 Do enunciado obtém-se o desvio padrão amostral 9486,0 40 362 nx e consultando-se a tabela Z para uma área de 0,475 teremos na tabela (página 106) da distribuição normal 2 0,475 1,96Z Z Fig. 4 Substituindo esse valor na expressão ( I ), segue 16 (1,96 0,9486) 16 (1,96 0,9486) 95%p e, portanto, podemos escrever que 14,14 17,85 95%p Podemos afirmar com 95% de confiança que a média da população está entre 14,14 e 17,85, ou corremos o risco de 5% que a verdadeira média possa estar abaixo de 14,14 ou acima de 17,85. 4. Intervalo de confiança para a média da população, com a média da amostra x e o desvio padrão desconhecido. 1º caso: Estudaremos em primeiro lugar amostras com mais de 30 elementos. Para estimarmos o parâmetro (média populacional) de uma população da qual não se conhece o desvio padrão, portanto não se conhece a variância, justifica-se a substituição pura do desvio padrão da população σ pelo da amostra S quando a amostra tiver mais de 30 elementos e assim, utiliza-se a tabela Z normal. Exemplo 7: Seja uma população normal de parâmetros desconhecidos, da qual tiramos uma amostra de tamanho 60 com média 46,15x e desvio-padrão 31,23s .Estimar o IC (Intervalo de confiança) para a média da população com um nível de certeza de 93%. Solução: O desvio padrão da média amostral é dado por: 0,3 60 31,23 60 )31,23( 22 n s s x Determinando a posição de 2Z . Sendo que 1 corresponde à área de 93% (probabilidade do intervalo conter o parâmetro procurado) e que, (1 ) 2 46,5% área embaixo da curva normal segue, portanto que 82,15,46 Z . Fig.5 1,96 1,96 0, 475 0, 475 137 Substituindo na fórmula: (II) 2 2 (1 )x xp X Z s X Z s , tem-se 46,15 1,82 3 46,15 1,82 3 0,93.p Portanto o Intervalo de Confiança para a média da População com um nível e confiança de 93% é 40,69 51,61 0,93.p Em notação matemática escrevemos: ( ;93%) 40,69;51,61IC , ou seja, o Intervalo de Confiança ao nível de 93% para a Média da População é 61,51;69,40 . Exemplo 8: As notas de matemática dos alunos do primeiro semestre estão indicadas na tabela 6 7,5 8 8,5 6,5 7,5 8 7,5 9,5 6 7 7 7 9 7 9,5 7 6 7 7 8 8,5 7,5 5,5 7,5 7 5,5 7 7 8 6,5 7,5 9 6,5 8,5 7,5 6,5 9,5 8,5 8 Determinar o intervalo de confiança para a média ao nível de 95%. Solução: Devemos determinar x e S. Usamos para isso a tabela. xi fi fac xi fi || xxi || xxi fi 2( )ix x fi 5,5 2 2 11 1,95 3,90 7,605 6,0 3 5 18 1,45 4,35 6,3075 6,5 4 9 26 0,95 3,80 3,6100 7,0 10 19 70 0,45 4,50 2,0250 7,5 7 26 52,5 0,05 0,35 0,0175 8,0 5 31 40 0,55 2,75 1,5125 8,5 4 35 34 1,05 4,20 4,4100 9,0 2 37 18 1,55 3,10 4,8050 9,5 3 40 28,5 2,05 6,15 12,6075 298 42,9000 1,82 1,82 0, 465 0, 465 138 Média: 45,7 40 298 n fx x ii Desvio Padrão: 05,10488,1 39 9,42 1 . 2 n fxx S ii X Para o nível de 95%, tem-se: (1 ) 2 47,5% e 47,5 1,96Z Fig. 6 Substituindo em (II) segue: 1,05 1,057,45 1,96 7,45 1,96 0,95. 40 40 p 7,45 0,32539 7,45 0,32539p 7,12461 7,77539 0,95.p Podemos afirmar com 95% de confiança que a média das notas de matemática é um valor que está no intervalo entre 7,12461 a 7,77539. Exemplo 9: O gerente do magazine WP deseja estimar com 95% de probabilidade (confiança) qual tenha sido a média dos saldos de caixa do ano anterior no fechamento diário das operações. Colhe amostras de 50 saldos (uma para cada dia de cada semana do ano anterior). O gerente seguiu as seguintes etapas: Agrupou as observações em classes por tratar-se de uma amostra grande, superior a 30 observações. As observações de saldos de caixa foram as seguintes ( em R$ x 100 ) Saldos de Caixa dados brutos. 2,3 1,7 1,9 1,6 2,8 3,1 4,0 5,3 1,0 0,9 0,8 0,7 0,4 0,95 1,32 1,64 1,27 2,52 2,1 3,4 3,8 2,15 0,85 4,6 1,29 2,13 2,47 2,58 1,95 2,4 0,74 3,82 2,0 1,24 4,3 2,16 1,47 5,0 0,45 2,61 2,1 2,75 3,81 1,83 7,8 4,7 3,12 3,0 Determinou-se o número de classes necessárias e sua amplitude para agrupar os dados utilizando- se o método da Raiz. 1,96 1,96 0, 475 0, 475 139 748 nK e a amplitude será então min 5,3 0,4 0,7 7 Xmáx X h k Desta maneira obteve-se a tabela com seus respectivos dados. Classes ix if )( ii fx || xxi || xxi fi 2( )ix x fi 0,4|—1,1 0,75 9 6,75 1,54 13,86 21,3444 1,1|— 1,8 1,45 8 11,6 0,84 6,72 5,6448 1,8|— 2,5 2,15 14 30,1 0,14 1,96 0,2744 2,5|— 3,2 2,85 5 14,25 0,56 2,80 1,5680 3,2 |— 3,9 3,55 6 21,3 1,26 7,56 9,5256 3,9 |— 4,6 4,25 2 8,5 1,96 3,92 7,6832 4,6 |—| 5,3 4,95 4 19,8 2,66 10,64 28,3024 48 112,3 74,3428 A média da amostra é ( ) 2, 29 i ix f x n e o desvio padrão 2 . 74,3428 1,257681 1 48 1 i ix x f S n Temos os seguintes estimadores: 2 2,5% ou %5 e 2,29x 257,1s e portanto, 2(1, 257) 0,181432 48 xs 2 0,475 1,96Z Z , consultando-se a tabela Z. Logo 2 2( ) ( ) 95%x xp X Z s X Z s 2,29 1,96 0,18143 2,29 1,96 0,18143 0,95p 1,9344 2,6453 0,95p Pode-se dizer que a média da população dos saldos de caixa do ano anterior estará contida entre os valores 1,9344 e 2,6453 com uma grau de confiabilidade de 95%, ou corre-se o risco de erro de 5% que a média populacional seja um valor abaixo de 1,9344 ou acima de 2,6453 ( R$ x 100). Outra pergunta de interesse poderia ser: “Qual o erro de Estimação ao nível de 5%”? O erro amostral é dado pela diferença entre a média da amostra e a média da população : x , mas como x x Z s , então xZ s x , e portanto o erro amostral pode ser definido por xZ s . Assim, no exemplo anterior o erro ao nível de 5% será: 1,96 0,18143 0,3556 , ou R$ 356,00. 140 2º caso: Se a amostra tem menos de 30 elementos 5. Intervalos de Confiança para a média populacional a partir de pequenas amostras. Se a amostra for pequena (menor que 30 observações) a priori não se pode utilizar o desvio padrão da amostra como sendo o da população, pois se demonstra matematicamente que o desvio padrão da amostra é um estimador “viesado” do desvio padrão populacional e, portanto não é válido para tal finalidade. Lembre-se que a substituição pura e simples de 𝝈 por S, somente se justifica para grandes amostras. Entretanto serão raros os casos onde se queiram inferir resultados populacionais a partir de amostras que tenham menos de 30 elementos, mas caso isto aconteça poderemos utilizar a tabela t- Student. O criador da distribuição t-Student foi W.S. Gossett, empregado de uma cervejaria Guinness irlandesa no princípio do século XX. A empresa não gostava que seus empregados publicassem trabalhos em seu próprio nome, de modo que Gossett adotou o pseudônimo de Student em seus trabalhos. 1º caso: Intervalo de Confiança para Média da população com variância conhecida. O procedimento é análogo ao adotado para a determinação dos intervalos de confiança para médias populacionais a partir de grandes amostras. A diferença ocorre apenas na distribuição amostral da média das pequenas amostras que possui distribuição 1 2 1 n Z t n . Esta distribuição com 1 ; 2nt tem (n – 1) graus de liberdade e 2 de significância. Estes valores de probabilidade se encontram já calculados na tabela t de Student que apresentamos parcialmente a seguir. Uso da tabela (página 141): Exemplo: 10 A tabela t de Student é bicaudal. 1) Se o nível de confiança é 95%, procura-se na tabela, 1) 5% e se o número de elementos é n=22, toma-se n-1=21 graus de liberdade, assim o valor de 1; 2nt = 21;0,025 2,080t . 2) Se 5% , 10 1 9,n n então 1; 2nt = 9;2,5 2,262t 3) Se 5% , 10 1 9,n n então 1; 2nt = 9;2,5% 1,833t 4) Se 2% , 10 1 9,n n então 1; 2nt = 9;1% 2,821.t 5) Se 2% , 20 1 19,n n então 1; 2nt = 19;1% 2,539.t 6) Se 10% , 25 1 24,n n então 1; 2nt = 24;5% 1,711.t 141 ѵ p 90% 80% 70% 60% 50% 40% 30% 20% 10% 5% 4% 3% 2% 1% 1 0,158 0,325 0,510 0,727 1,000 1,376 1,963 3,078 6,314 12,706 15,895 21,205 31,821 63,657 2 0,142 0,289 0,445 0,617 0,816 1,061 1,386 1,886 2,920 4,303 4,849 5,643 6,965 9,925 3 0,137 0,277 0,424 0,584 0,765 0,978 1,250 1,638 2,353 3,182 3,482 3,896 4,541 5,841 4 0,134 0,271 0,414 0,569 0,741 0,941 1,190 1,533 2,132 2,776 2,999 3,298 3,747 4,604 5 0,132 0,267 0,408 0,559 0,727 0,920 1,156 1,476 2,015 2,571 2,757 3,003 3,365 4,032 6 0,131 0,265 0,404 0,553 0,718 0,906 1,134 1,440 1,943 2,447 2,612 2,829 3,143 3,707 7 0,130 0,263 0,402 0,549 0,711 0,896 1,119 1,415 1,895 2,365 2,517 2,715 2,998 3,499 8 0,130 0,262 0,399 0,546 0,706 0,889 1,108 1,397 1,860 2,306 2,449 2,634 2,896 3,355 9 0,129 0,261 0,398 0,543 0,703 0,883 1,100 1,383 1,833 2,262 2,398 2,574 2,821 3,250 10 0,129 0,260 0,397 0,542 0,700 0,879 1,093 1,372 1,812 2,228 2,359 2,527 2,764 3,169 11 0,129 0,260 0,396 0,540 0,697 0,876 1,088 1,363 1,796 2,201 2,328 2,491 2,718 3,106 12 0,128 0,259 0,395 0,539 0,695 0,873 1,083 1,356 1,782 2,179 2,303 2,461 2,681 3,055 13 0,128 0,259 0,394 0,538 0,694 0,870 1,079 1,350 1,771 2,160 2,282 2,436 2,650 3,012 14 0,128 0,258 0,393 0,537 0,692 0,868 1,076 1,345 1,761 2,145 2,264 2,415 2,624 2,977 15 0,128 0,258 0,393 0,5360,691 0,866 1,074 1,341 1,753 2,131 2,249 2,397 2,602 2,947 16 0,128 0,258 0,392 0,535 0,690 0,865 1,071 1,337 1,746 2,120 2,235 2,382 2,583 2,921 17 0,128 0,257 0,392 0,534 0,689 0,863 1,069 1,333 1,740 2,110 2,224 2,368 2,567 2,898 18 0,127 0,257 0,392 0,534 0,688 0,862 1,067 1,330 1,734 2,101 2,214 2,356 2,552 2,878 19 0,127 0,257 0,391 0,533 0,688 0,861 1,066 1,328 1,729 2,093 2,205 2,346 2,539 2,861 20 0,127 0,257 0,391 0,533 0,687 0,860 1,064 1,325 1,725 2,086 2,197 2,336 2,528 2,845 21 0,127 0,257 0,391 0,532 0,686 0,859 1,063 1,323 1,721 2,080 2,189 2,328 2,518 2,831 22 0,127 0,256 0,390 0,532 0,686 0,858 1,061 1,321 1,717 2,074 2,183 2,320 2,508 2,819 23 0,127 0,256 0,390 0,532 0,685 0,858 1,060 1,319 1,714 2,069 2,177 2,313 2,500 2,807 24 0,127 0,256 0,390 0,531 0,685 0,857 1,059 1,318 1,711 2,064 2,172 2,307 2,492 2,797 25 0,127 0,256 0,390 0,531 0,684 0,856 1,058 1,316 1,708 2,060 2,167 2,301 2,485 2,787 26 0,127 0,256 0,390 0,531 0,684 0,856 1,058 1,315 1,706 2,056 2,162 2,296 2,479 2,779 27 0,127 0,256 0,389 0,531 0,684 0,855 1,057 1,314 1,703 2,052 2,158 2,291 2,473 2,771 28 0,127 0,256 0,389 0,530 0,683 0,855 1,056 1,313 1,701 2,048 2,154 2,286 2,467 2,763 29 0,127 0,256 0,389 0,530 0,683 0,854 1,055 1,311 1,699 2,045 2,150 2,282 2,462 2,756 30 0,127 0,256 0,389 0,530 0,683 0,854 1,055 1,310 1,697 2,042 2,147 2,278 2,457 2,750 35 0,127 0,255 0,388 0,529 0,682 0,852 1,052 1,306 1,690 2,030 2,133 2,262 2,438 2,724 40 0,126 0,255 0,388 0,529 0,681 0,851 1,050 1,303 1,684 2,021 2,123 2,250 2,423 2,704 50 0,126 0,255 0,388 0,528 0,679 0,849 1,047 1,299 1,676 2,009 2,109 2,234 2,403 2,678 60 0,126 0,254 0,387 0,527 0,679 0,848 1,045 1,296 1,671 2,000 2,099 2,223 2,390 2,660 120 0,126 0,254 0,386 0,526 0,677 0,845 1,041 1,289 1,658 1,980 2,076 2,196 2,358 2,617 ∞ 0,126 0,253 0,385 0,524 0,674 0,842 1,036 1,282 1,645 1,960 2,054 2,170 2,326 2,576 Tabela - Distribuição de Student Bicaudal p(-t c < t < t c )= 1-p f(t) -t t tc c0 142 Ressalta-se que quando n>30 e tende ao infinito, a probabilidade na distribuição t se iguala àquela da distribuição Z. De fato se consultarmos as duas tabelas poderemos verificar que para o mesmo grau de significância, por exemplo, 5% teremos um valor de afastamentos em número de desvios padrão muito parecidos ou seja (1,646 para t e 1,64 para Z). Assim, justifica-se a aplicação da tabela t quando a amostra tem número igual ou menor que 30 elementos. Note-se ainda que no caso da tabela t a consulta é feita para 1; 2nt , então, por exemplo, se n = 10 teremos n – 1 = 9 graus de liberdade e sendo 1 =95% o grau de significância alfa de 5% deverá ser, neste caso, dividido por dois (lembre-se que a menor das probabilidades apresentadas no título de cada coluna é a área em uma cauda; a probabilidade maior é a área em ambas as caudas). A consulta à tabela 1; 2 9;0,025 2,262nt t . Portanto, o intervalo de confiança para a média 𝜇 pode ser construído com boa aproximação adotando-se S como estimativa para 𝜎 na expressão X ZX 2 . Quanto menor é a amostra, mais necessária se torna a introdução de uma correção, a qual consiste em usar a variável t –Student, ao invés da variável Z normal padronizada. Chamando de n s X tn 1 , de modo que s Z s n X n s X tn ... 21 é expressão da variável t –Student . Assim o intervalo de confiança para médias populacionais a partir de pequenas amostras fica representado por: 1 1 (1 )n n s s p x t x t n n Exemplo 11: Uma das preocupações de um analista financeiro deve ser a de poder comparar uma empresa, ao seu setor de atividade econômica, já que é sabido que a análise vertical e horizontal não consegue produzir a comparação com o meio externo à empresa. Suponhamos uma amostra de tamanho n = 20 de empresas de um mesmo setor de atividade econômica. Amostra dos índices de LG das 20 empresas. Liquidez Geral 1,84 0,99 0,94 0,59 4,33 2,8 0,06 0,25 1,87 2,38 1,03 1,8 1,81 0,17 0,78 2,18 1,48 0,87 0,78 7,75 Pede-se, calcular um Intervalo de Confiança para a média da população com 95% de certeza. Calculados os elementos da Estatística Descritiva da amostra necessários para a estimação da média populacional, obteve-se: 1,735x e 1,7440741s . A média e o desvio padrão são elementos únicos que caracterizam a distribuição de probabilidades da amostra. Desta forma parte-se desta característica da amostra, para se estimar o parâmetro populacional. O desvio padrão amostral é 389986,0 20 744074178,1 n s s x 143 Consultando-se a tabela t-Student temos, 1; 2 19;0,025 2,093nt t Substituindo-se os elementos encontrados na expressão abaixo o intervalo de confiança será: 1 1 (1 )n n s s p x t x t n n 1,735 2,093 0,389986 1,735 2,093 0,389986 95%p 1,735 0,81624 1,735 0,81624 95%p 0,91876 2,55124 95%p Pode-se notar que o erro de estimação é consideravelmente alto, 81,62% o que reforça a idéia que conclusões ou decisões tomadas a partir de inferências com pequenas amostras devem ser interpretadas com muita cautela. Exemplo 12: Uma empresa fabrica motores elétricos movidos a energia solar utilizados para bombeamento de água em áreas agrícolas e colheu uma amostra de 25 motores e após vários testes, verificou que a vida média das células fotoelétricas é de 1327 horas e desvio padrão de 182 horas. Pede-se determinar um IC com 95% de certeza para a vida útil populacional das células de energia. Solução: Como a amostra tem n<30 utiliza-se a tabela t. 40,36 25 182 n s s x e 1; 2 24;0,025 2,064nt t Desta forma o intervalo de confiança será: 1 1 (1 )n n s s p x t x t n n 1327 2,064 36,40 1327 2,064 36,40 95%p 1327 75,12 1327 75,12 95%p ou seja , 1251,87 1402,12 95%p A vida útil média da população das células de energia estará entre 1251,87 e 1402,12 horas com 95% de certeza ou corre-se o risco de 5% de que a verdadeira média populacional esteja fora desse intervalo. 144 Exercícios de Aplicação 24: 1) Uma empresa fabricante de filtros de água colheu uma amostra de 50 produtos e detectou que a sua vida média era de 630 horas com desvio padrão de 46 horas. Pede-se determinar um IC para a vida média populacional dos misturadores ao nível de 95%. 2) Um administrador financeiro quer estimar com 95% de certeza um IC para a média de horas de serviço dos funcionários no ano em curso. Para isto colheu uma amostra aleatória das horas trabalhadas de 48 funcionários tendo tabulado os resultados: 39 27 35 24 28 29 35 24 19 17 24 15 28 31 33 19 38 24 26 28 29 35 24 27 35 36 32 31 30 29 28 27 26 25 24 26 24 23 21 34 35 36 36 34 38 37 30 31 Pede-se: a) agrupar as variáveis por classe (método da raiz). b) calcular a média e o desvio padrão amostral. c) construir um IC ao nível de 95% para amédia de horas na população. d) qual o erro amostral da estimativa? i) Amplitude da Amostra: R = xmax-xmin = ii) Número de Classes: K =[ n ] = iii) Amplitude da Classe: r = R/K = 145 classes xi fi fac xi fi || xxi || xxi fi 2( ) i x x fi 146 3) Num processo de ordenha, uma amostra da quantidade de leite de 15 animais revelou média de 30 litros com desvio padrão de 4,3 litros. Pede-se estimar um IC com 95% de certeza para a média de produção populacional da fazenda. 4) Uma fábrica de bombons de chocolate quer estimar o peso médio populacional de seus produtos que são fabricados de forma artesanal. Para isto colhe uma amostra de 10 caixas o obtém peso médio de 436 gramas com desvio padrão de 58 gramas. Pede-se estimar um IC ao nível de certeza de 95%. 147 5) Uma grande rede de hotéis quer estimar o tempo médio para limpeza dos 246 quartos que possui em uma de suas unidades. Para isto colhe uma amostra do tempo gasto com a arrumação e limpeza de 48 quartos e obtém 43 minutos com desvio-padrão de 12 minutos. Pede-se estimar ao nível de 95% de certeza; 1) a média de tempo gasto para a limpeza dos quartos; 2) se o valor médio de mão de obra é R$ 12,00 por hora, estimar o custo total diário mínimo e máximo despedidos.
Compartilhar