Baixe o app para aproveitar ainda mais
Prévia do material em texto
INFERÊNCIA ESTATÍSTICA 1 CAPÍTULO I 1 - DISTRIBUIÇÃO AMOSTRAL DE PROBABILIDADE A Distribuição Amostral de Probabilidade é um estudo das relações existentes entre uma população e as amostras dela extraídas. É útil em: - estimação de parâmetros populacionais; - determinação das causas de diferenças observadas entre amostras. Constitui o que chamamos de inferência estatística que consiste em inferir conclusões importantes sobre uma população a partir da análise de resultados observados em amostras aleatórias. Como toda conclusão deduzida a partir da amostragem é acompanhada de um grau de incerteza ou risco, o problema fundamental da inferência estatística é medir este grau de incerteza ou risco das generalizações. Parâmetro: medida numérica que descreve uma população. Genericamente representado por θ. Exemplos: média (μ), variância (σ2 ). Estatística ou estimador: medida numérica que descreve uma amostra. Genericamente representado por . Exemplos: média ( x ), variância ( s 2 ). Estimativa: valor numérico de um estimador. Uma distribuição amostral é a distribuição de probabilidade de um estimador (ou estatística) da amostra formada quando amostras de tamanho n são colhidas várias vezes de uma população. Por exemplo, se o estimador da amostra for a sua média, a distribuição será uma distribuição amostral de médias das amostras (Figura 1). Figura 1: Distribuição Amostral da média A Distribuição Amostral é uma distribuição de probabilidade que indica até que ponto uma estatística amostral tende a variar devido a variações casuais na amostragem aleatória. Uma vez que a estatística amostral é uma variável aleatória, estaremos interessados não apenas no seu modelo probabilístico, mas também na sua média ou valor esperado e sua variância. 2 1.1 - DISTRIBUIÇÃO AMOSTRAL DAS MÉDIAS Considerando uma população X com parâmetros e . Se tirar uma amostra aleatória de tamanho n e calcular a sua média tem-se um valor 1x . Tirando uma segunda amostra temos uma nova média )x( 2 em geral diferente de 1x , e assim, para cada diferente amostra de tamanho n tem-se um diferente valor da média amostral, X. Tem-se, portanto, que a média amostral, é uma variável que muda de valor, de amostra em amostra. Tem, portanto, sentido falar da distribuição de médias amostrais, uma vez que X é uma variável aleatória. Para facilitar o entendimento um exemplo será apresentado abaixo. Exemplo Seja uma população constituída por cinco funcionários de uma pequena lanchonete com os seguintes salários mínimos 2 , 3 , 4 , 4 , 5, respectivamente. O salário do funcionário da lanchonete é definido como a variável aleatória X. Então, determine: a) a distribuição de probabilidade X. b) a média (), a variância (2) e o desvio padrão () da v.a. X. c) todas as amostras possíveis de tamanho n=2, com reposição, da população dos salários e apresente a média. Faça a distribuição amostral da média (dist. de probabilidade da média). d) a média (E( x )), a variância (Var( x )) e o desvio padrão (DP( x )) da v.a. média amostral. f) o gráfico da distribuição da amostral média. Resolução a) a distribuição de probabilidade de X. Distribuição de probabilidade dos salários dos funcionários da lanchonete. X 2 3 4 5 ∑ f(x) 1/5 1/5 2/5 1/5 1 b) = 3,6 ; 2 = 1,04 ; = 1,02 c) Todas as amostras possíveis de tamanho n=2, com reposição, da população dos salários. (X1 , X2) = {(2 , 2) ; (2 , 3) ; (2 , 4) ; (2 , 4) ; (2 , 5) ; (3 , 2) ; (3 , 3) ; (3 , 4) ; (3 , 4) ; (3 , 5) ; (4 , 2) ; (4 , 3) ; (4 , 4) ; (4 , 4) ; (4 , 5) ; (4 , 2) ; (4 , 3) ; (4 , 4) ; (4 , 4); (4 ,5); (5 , 2) ; (5 , 3) ; (5 , 4) ; (5 , 4) ; (5 , 5)}. Média das amostras X : { 1x =2; 2x =2,5; 3x =3; 4x =3; 5x =3,5; 6x =2,5; 7x =3; 8x =3,5; 9x =3,5; 10x =4; 11x =3; 12x =3,5; 13x =4; 14x =4; 15x =4,5; 16x =3; 17x =3,5; 18x =4; 19x =4; 20x =4,5; 21x =3,5; 22x =4; 23x =4,5; 24x =4,5; 25x =5} Distribuição de probabilidade da média dos salários dos funcionários da lanchonete. X 2 2,5 3 3,5 4 4,5 5 ∑ f(x) 1/25 2/25 5/25 6/25 6/25 4/25 1/25 1 d) a média (E( x )), a variância (Var( x )) e o desvio padrão (DP( x )) da v.a. média amostral. X 2 2,5 3 3,5 4 4,5 5 ∑ f( x ) 1/25 2/25 5/25 6/25 6/25 4/25 1/25 1,00 X ∙f( x ) 2/25 5/25 15/25 21/25 24/25 18/25 5/25 90/25=3,60 2 X ∙f( x ) 4/25 12,5/25 45/25 73,5/25 96/25 81/25 25/25 337/25=13,48 3 Então, média da distribuição amostral da média é n i i ,)x(fX)X(E 1 563 variância da distribuição amostral da média é 520634813 222 ,,,)]X(E[)X(E)X(Var desvio padrão da distribuição amostral da média ou erro padrão 720520 ,,XDP Assim, é provado que a média das médias amostrais é igual à média populacional. E que a variância da distribuição das médias é igual à variância populacional dividida pelo tamanho da amostra. f) o gráfico da distribuição da amostral média. Teorema 1: Seja X uma variável aleatória com média µ e variância σ2, e seja (X1,X2,X3,..., Xn) uma amostra aleatória. Então, XE e n XVar 2 em que: XE : média da distribuição amostral da média XVar : variância da distribuição amostral da média XDP : desvio padrão da distribuição amostral da média ou erro padrão n: tamanho da amostra Teorema Central do Limite: Para amostras aleatórias (X1 , X2 , X3 , ... , Xn), retiradas de uma população com média µ e variância σ2, a distribuição amostral da média aproxima-se de uma distribuição normal com média µ e variância n 2 , quando n é grande, ou seja, n 2 ;N~X . Corolário1: Se (X1 , X2 , X3 , ... , Xn) for uma amostra aleatória da população X com média (µ) e variância (σ2), n)XX(X n 1 , então n X Z Z~N(0 ; 1) Caso deseja-se calcular o erro amostral da média (e), basta fazer a diferença entre a estatística X e o parâmetro µ, isto é, 4 Xe Corolário2: A distribuição do erro amostral da média aproxima-se de uma distribuição normal com média zero e variância n 2 , isto é, n X Z n e Z Z~N(0 ; 1) Exemplo: Sabe-se que a distribuição do quociente de inteligência (QI), das crianças da escola X, é Normal com média populacional de 102 pontos e variância populacional igual a 100 pontos 2 . Se 15 alunos desta escola forem selecionados ao acaso, determine: a) a média e o desvio padrão da distribuição amostral do QI médio. 102 XE 582 15 1002 , n XDP b) a probabilidade de estas crianças apresentarem um QI médio inferior a 98 pontos. 15 100 102;N~X ?XP 98 551 15 10 10298 , n X Z %,,,ZPXP 0660606055198 c) a probabilidade de estas crianças apresentarem um QI médio superior a 107 pontos. ?XP 107 941 15 10 102107 , n X Z %,,,ZP,ZPXP 62202619009738119411941107 ou %,,,ZP,ZPXP 622026190941941107 d) a probabilidade de estas crianças apresentarem um QI médio entre 99 a 104 pontos. ?XP 10499 161 15 10 10299 ,Z e 770 15 10 102104 ,Z 16177077016110499 ,ZP,ZP,Z,PXP %,,,,XP 636565633012302077935010499 5 1.2 - DISTRIBUIÇÃO AMOSTRAL DA DIFERENÇA DE DUAS MÉDIAS Sejam duas populações X1 e X2 (normais) com parâmetros 1 , 2 1 e 2 2 , respectivamente. Retirando todas as possíveis amostras (independentes) das duas populações e considerando todas as combinações possíveis dessas amostras das duas populações, podemos obter uma distribuição das diferenças das médias 21 XX , chamadas Distribuição Amostral das Diferenças das Médias. Sendo 1 2 1 11 n ;N~X e 2 2 2 22 n ;N~X , a média e a variância de 21 XX , denotadas respectivamente por 21 XXE e 21 XXVar são dadas por: - média da distribuição amostral da diferença de duas médias 2121 )XX(E - variância da distribuição amostral da diferença de duas médias é obtida por: 2 2 2 1 2 1 21 nn )XX(Var Dessa forma, tem-se: 2 2 2 1 2 1 2121 n n ;N~XX A variável normal padronizada será: 2 2 2 1 2 1 2121 nn XX Z Caso X1 e X2 não tenham distribuição normal, os resultados continuam sendo válidos para n1 e n2 suficientemente grandes. Exemplo A distribuição dos salários (salários mínimo) de operários de uma grande fábrica é Normal. O salário médio populacional do sexo masculino é igual a 6,5 e variância populacional de 1,69. E para as mulheres o salário médio é de 5,5 e variância populacional de 2,25. Se 25 homens e 30 mulheres forem recém-contratados, determine: a) média e o desvio padrão da distribuição amostral da diferença das duas médias salariais entre os sexos. 0155562121 ,,,)XX(E 3780 30 252 25 691 2 2 2 1 2 1 21 , ,, nn )XX(DP b) a probabilidade dos salários médios diferir entre os sexos no máximo em 1,5 salários mínimos. 30 252 25 691 5506 ,, ;,,N~XX FM ?,XXP FM 51 321 30 252 25 691 555651 2 2 2 1 2 1 2121 , ,, ,,, nn XX Z 90,66% 906580 1,32ZP 51 ,,XXP FM 6 1.3 - DISTRIBUIÇÃO AMOSTRAL DA PROPORÇÃO Seja X uma população e que a probabilidade da ocorrência de um evento é p, enquanto a não- ocorrência é q, isto é, q=1-p. Pode-se constatar que esta população tem distribuição Binomial, logo com média np e variância npq. Considerando todas as amostras possíveis de tamanho n extraída desta população para cada amostra, tem-se a distribuição amostral da proporção denotado por pˆ , obtida por n x pˆ em que n: tamanho da amostra x: número de elementos da amostra que apresentam a característica em estudo. Então, a média da distribuição amostral da proporção é dada por p n np xE nn x EpˆE 1 e variância da distribuição amostral da proporção é obtida por n pq npq n xVar nn x VarpˆVar 22 11 Assim, para n suficientemente grande, pode-se considerar a distribuição amostral de pˆ aproximada da distribuição Normal, isto é n pq ,pN~pˆ . Tendo em vista o Teorema Central do Limite tem-se que: n pq ppˆ Z Z~N (0, 1) Exemplo: Sabe-se que 20% dos estudantes do Ensino Médio da cidade Y são fumantes. Se 150 estudantes forem selecionados ao acaso, determine: a) a média e desvio padrão da distribuição amostral da proporção de alunos fumantes. 20,ppˆE 03270 150 8020 , ,, n pq pˆDP b) a probabilidade de mais 25% dos alunos serem fumantes. 150 0,8 0,2. 0,2; N~pˆ ?,pˆP 250 531 150 8020 20250 , ,, ,, n pq ppˆ Z 6,30%0,06301 531 531 531 ,ZP,ZP,pˆP 7 CAPÍTULO II 2. INTERVALOS DE CONFIANÇA A estimativa de um parâmetro por pontos (pontual) não possui uma medida do possível erro cometido na estimação. Uma maneira de expressar a precisão da estimação é estabelecer limites, que com certa probabilidade incluam o verdadeiro valor do parâmetro da população. Esses limites são chamados “limites de confiança”: determinam um intervalo de confiança no qual deverá estar o verdadeiro valor do parâmetro. Logo, a estimativa por intervalo consiste na fixação de dois valores tais que (1-) seja a probabilidade de que o intervalo, por eles determinado, contenha o verdadeiro valor do parâmetro, em que: : nível de significância (1-) : coeficiente de confiança ou nível de confiabilidade Logo, a partir de informações da amostra, devemos calcular os limites de um intervalo, valores críticos, que em (1-)% dos casos inclua o valor do parâmetro a estimar e em % dos casos não inclua o valor do parâmetro. 2.1. INTERVALO DE CONFIANÇA PARA A MÉDIA 2.1.1. QUANDO A VARIÂNCIA POPULACIONAL 2 FOR CONHECIDA: Deseja-se estimar a média da população X conhecendo o valor da variância 2, ou seja X:N (? , 2). Com a utilização das distribuições amostrais, n , Nx 2 , Procedimentos para a construção do intervalo de confiança (IC): Retira-se da população uma amostra casual simples de n elementos. Calcula-se a média da amostra x . Calcula-se o desvio padrão da média amostral nn 2 x . Fixa-se o nível de significância e determina-se o valor de Z correspondente. 2 )-zP(z e 2 )zP(z seja, ou )zz(P 22 8 Usando uma notação simplificada para o intervalo de confiança para a média populacional, temos: IC[; (1-)100%] = oex em que n ze 2 isto é IC[ , 1-] = n zx; n zx 22 , ou n zx n zx 22 , com (1-) de confiabilidade. Exemplo: Uma máquina automática de refrescos é regulada de modo que a quantidade suprida de cada vez tenha distribuição aproximadamente normal com desvio padrão de 1,3 dl. Determinar o intervalo de 96% de confiança para a quantidade média de todos os refrescos servidos sabendo que uma amostra de 30 copos de refresco acusou conteúdo médio de 21,0 ,dl. Solução: n = 30 0,21x = 1,3 (desvio padrão populacional conhecido) (1-) = 0,96 (1-/2) = 0,98 z0,98= 2,05 Logo: IC[; (1-)100%] = oex = n zx 2 IC[; 96%] = 30 31 05221 30 31 05221 , ,; , , IC[; 96%] = 21,49 5120 ;, ou 20,51 < < 21,49 Conclusão: Estima-se que a quantidade média dos refrescos servidos pela máquina está entre 20,51 dl e 21,49 dl com uma confiança de 96%. 2.1.2. INTERVALO DE CONFIANÇA PARA A MÉDIA QUANDO A VARIÂNCIA POPULACIONAL 2 FOR DESCONHECIDA:O procedimento padrão é o mesmo que o adotado para anteriormente. - Retira-se uma amostra de n elementos da população. - Calcula-se a média da amostra n i ix n x 1 1 . - Calcula-se a variância amostral: 2 1 1 22 n 1 - 1 1 n i n i ii xx n s 9 A variável x x Z tem distribuição normal. Quando não conhecemos a variância 2, devemos usar seu estimador s 2 e tem-se: n s n s sxDP x 2. A variável definida como xs x t é denominada variável com distribuição t de Student com graus de liberdade, em que = n-K (n é o número de informações independentes da amostra e K número de parâmetros da população a serem estimados além do parâmetro inerente ao estudo). Quando n é grande, s 2 se aproxima bastante de 2, o que faz com que a variável t se aproxime da variável normal Z. * Observe que xs é o estimador de x (estimador do erro padrão). Usando uma notação simplificada para o intervalo de confiança para a média populacional, temos: IC[ , (1-)100%] = n tx; n tx 22 ou n tx n tx 22 , com (1-) de confiabilidade Exemplo: Certo estudo deseja estimar o número médio de óbitos do sexo masculino por dependência alcoólica na região X. O quadro abaixo apresenta o número de óbitos dessa região de 1995 a 2007. 19 25 32 21 30 27 22 18 31 18 23 26 20 Admitindo que o número de mortes tem distribuição Normal. Determine: a) o intervalo de 95% de confiança para o número médio de óbitos do sexo masculino por dependência alcoólica na região X. n=13 x 24 s=4,92 (1-)=0,95 /2=0,025 1-13 ;025,0t 2,179 IC[; 95%] = n s tx , 12 ; 0250 IC[; 95%] = 13 924 179224 , , = 97224 , IC[; 95%] = 26,97 0321 ;, mortes Conclui-se com 95% de certeza que o número médio populacional de mortes do sexo masculino por dependência alcoólica na região X está entre 21,03 e 26,97. b) o erro máximo se aumentar o nível de confiança para 98%. 663 13 924 681212 010 , , , n s te ;,o mortes 10 2.1.3. INTERVALO DE CONFIANÇA PARA A MÉDIA COM GRANDES AMOSTRAS É importante saber que a população submetida a amostragem tem distribuição Normal, ou ao menos aproximadamente Normal, caso não a tenha essas técnicas não podem ser utilizadas. Então, para grandes amostras aplica-se o Teorema Central do Limite, ou seja para n suficientemente grande (n≥30) os dados têm distribuição aproximadamente Normal. Portanto, o intervalo de confiança é dado por: IC[; (1-)100%] = oex IC[; (1-)100%] = n s zx 2 Exemplo: Um estudo selecionou 90 estudantes do Colégio X para estimar o escore médio a resistência à distração aplicada pelo teste WISC-III. O índice médio e o desvio padrão amostral a resistência à distração é de 91,36 e 23,78 pontos, respectivamente. Determine: a) o intervalo de 90% de confiança para o escore médio populacional dos alunos do Colégio X. 3691,x s= 23,78 n = 90 (1-) = 0,90 = 0,10 /2 = 0,05 z0,05= 1,65 IC[; 90%] = n s zx 2 IC[; 90%] = 90 7823 6513691 , ,, = 1443691 ,, IC[; 90%] = 95,50 2287 ;, pontos Conclusão: Pode-se afirma, em nível de 90% de confiança, que o escore médio a resistência à distração dos estudantes do colégio X está entre 87,22 e 95,50 pontos. b) o erro máximo se aumentar o nível de confiança para 94%. 714 90 7823 881 2 , , , n s zeo pontos 2.2. INTERVALO DE CONFIANÇA PARA A DIFERENÇA DE MÉDIA 2.2.1. QUANDO AS VARIÂNCIAS POPULACIONAIS FOREM CONHECIDAS A construção do Intervalo de confiança (IC) é semelhante a realizada para a média quando conhecemos a variância populacional. Deve-se observar a distribuição para a diferença das médias. Sejam duas amostra de tamanho n1 e n2 retiradas respectivamente de populações com distribuições normais independentes X1 e X2 com média 1 e 2 e desvios padrões 1 e 2. O IC para a diferença das médias (1 - 2) será; IC[1 - 2 , (1-)100%] = 2 2 2 1 2 1 2 21021 nn z)xx(e)xx( ou 2 2 2 1 2 1 2 2121 2 2 2 1 2 1 2 21 ( nn z)xx() nn z)xx( com (1-) de confiabilidade. 11 Exemplo: 1. Um grupo de pesquisadores deseja verificar a diferença entre o escore médio da memória imediata dos adolescentes e adultos, sabendo que a variância populacional do escore dos adolescentes é 1,6 pontos 2 e dos adultos é 2,0 pontos 2 . Foram selecionados 60 adolescentes e 50 adultos e obtiveram o seguinte escore médio 7,5 e 6,3 pontos, respectivamente. Considerando Normal a distribuição do escore obtido no teste de memória imediata, determine: a) o intervalo de 95,4% de confiança para diferença dos escores médios. IC[1-2 ; 95,4%]= 2 2 2 1 2 1 023021 nn z)xx( , IC[1-2 ; 95,4%]= 50 02 60 61 023657 ,, ,),,( IC[1-2 ; 95,4%]= 52021 ,, IC[1-2 ; 95,4%]= 721 ; 680 ,, pontos Conclui-se que, em nível de 95,4%, pode-se afirmar que a diferença entre o escore médio da memória imediata dos adolescentes e adultos está entre 0,68 e 1,72 pontos. 2.2.2. QUANDO AS VARIÂNCIAS POPULACIONAIS FOREM DESCONHECIDAS Para o caso de pequenas amostras, considerando pequenas se (n1+n2)< 30, é utilizada a distribuição t de Student. O intervalo de confiança é dado por: IC[1-2 ; (1-)] = 2121 2 22 2 11 2 21021 11 2 11 nnnn snsn t)xx(e)xx( Exemplo: Para um particular produto A, a média de vendas por estabelecimento no último ano, em uma amostra de 10 estabelecimentos foi de 3.425,00 reais e desvio padrão amostral de 200 reais. Para um segundo produto B, a média de vendas por estabelecimento, em uma amostra de tamanho 12, foi de 3.250,00 reais e desvio padrão amostral de 175 reais. Supondo-se que as amostras tenham sido retiradas de populações normais, estimar a diferença entre o nível médio de vendas por estabelecimento no último ano, utilizando um intervalo de confiança de 90%. s 2 A= 200,00 s 2 B= 175 1- = 90% n =10 n = 12 ( Ax - Bx ) = 175,00 Ax = 50 Bx = 60 t10%/2= 1,725 2121 2 22 2 11 2 11 2 11 nnnn snsn te /o 87137 12 1 10 1 21210 175112200110 7251 22 ,,eo IC[1-2 ; 90%]= 312,87 ; 133787137175021 ,,e)xx( reais Conclusão: Pode-se afirmar, em nível de 90% de confiança, que a diferença entre a venda média dos dois produtos está entre R$ 37,13 e R$ 312,87. 122.2.3. GRANDES AMOSTRAS Para o caso em que as amostras forem suficientemente grandes, (n1+n2) 30, a distribuição aproxima-se da distribuição normal e o intervalo de confiança para a diferença das médias é dado por: IC[1-2 , (1-)100%]= 2 2 2 1 2 1 2 21 n s n s z)xx( Exemplo: Certo estudo deseja-se estimar a diferença entre as jornadas excessivas de trabalho dos motoristas de caminhão de um grupo que se envolveu em acidentes e outro que não se envolveu. Foram entrevistados 80 motoristas que se envolveram em acidentes, constatando que o tempo médio de trabalho é de 12,5 horas e variância amostral de 5,3 horas 2 , enquanto que o tempo médio de trabalho de 100 motoristas não envolvidos em acidentes foi de 8,6 horas e variância amostral de 3,9 horas 2 . Determine: a) o intervalo de 95% confiança do tempo médio da jornada de trabalhos dos motoristas. n1=80 1x =12,5 s1=5,3 n2=100 2x =8,6 s2=3,9 IC[1-2 ; 95%]= 2 2 2 1 2 1 025021021 n s n s z)xx(e)xx( , IC[1-2 ; 95%]= 100 93 80 35 96168512 ,, ,),,( IC[1-2 ; 95%]= 65093 ,, IC[1-2 ; 95%]= 554 ; 253 ,, horas Conclusão: Pode-se afirmar com 95% de certeza que o tempo médio da jornada de trabalhos dos motoristas está entre 3,25 e 4,55 horas. b) o erro máximo se aumentar o nível de confiança para 97%. 2 2 2 1 2 1 0150 n s n s ze ,o 700 100 93 80 35 172 , ,, ,eo hora 13 2.3. INTERVALO DE CONFIANÇA PARA PROPORÇÃO Seja uma amostra de tamanho n ≥ 100. Deseja-se construir um intervalo de confiança para a proporção populacional p o procedimento é semelhante aos anteriores, como descrito abaixo: - Calcula-se a proporção da amostra n x pˆ , em que x é o número de ocorrência do experimento. - Como desconhecemos a verdadeira proporção, determina-se o desvio padrão para a distribuição amostral da proporção utilizando sua estimativa n qˆpˆ spˆDP pˆ . - Fixa-se o nível de significância e determina-se o valor de z correspondente. - 1 z n qˆpˆ ppˆ P , que desenvolvido determina o intervalo de confiança para a proporção, isto é: IC[ p , (1-)100%] = n qˆpˆ zpˆ; n qˆpˆ zpˆepˆ 22 0 ou n qˆpˆ zpˆ n qˆpˆ zpˆ 22 p , com (1-) de confiabilidade. Exemplo: Para se estimar a porcentagem de alunos de um curso favoráveis à modificação do currículo escolar, tomou-se uma amostra de 100 alunos, dos quais 80 foram favoráveis à mudança. a) Determine o erro da estimativa admitindo-se 96% de confiança. n=100 80 100 80 ,pˆ 1-= 0,96 n qˆpˆ ze 2 0 0820 100 2080 0520 , ,, ,e O erro cometido na estimativa é de 0,082 b) Para a situação anterior, determine a estimação intervalar para a verdadeira porcentagem de alunos favoráveis à mudança. IC[ p , 96%] = 08200,8 082080082080 ,;,,,, IC[ p , 96%] = 88200 71800 ,;, ou 0,7180 < p < 0,8820 ou 71,80% < p < 88,20% Pode-se afirmar com 96% de confiabilidade que a proporção dos alunos da faculdade favoráveis à mudança curricular está entre 71,80% e 88,20%. 14 CAPÍTULO III 3. TESTE DE HIPÓTESE Frequentemente devemos tomar decisões sobre populações com base em informações amostrais das mesmas (decisões estatísticas). Na tomada de decisões é útil formular hipóteses ou suposições sobre as populações em estudo. Tais hipóteses, que podem ser verdadeiras ou não, chamam-se hipóteses estatísticas e, em geral, consistem de afirmações sobre as distribuições de probabilidade das populações, como por exemplo: a) A altura média da população brasileira é 1,65m? b) A proporção de brasileiros com a doença X é 40% (p = 0,40); c) A idade dos alunos da UEM tem uma distribuição normal? Testes de Hipóteses: é uma regra de decisão para aceitar ou rejeitar uma hipótese estatística com base nos elementos da amostra determinar se amostras observadas diferem significativamente dos resultados esperados Os Testes de Hipóteses podem ser de dois tipos: i) Não Paramétricos: quando formulamos hipóteses com respeito à natureza da distribuição da população. Estes testes não dependem dos parâmetros populacionais, nem de suas respectivas estimativas itens (c) e (d). ii) Paramétricos: quando formulamos hipóteses com respeito ao valor de um parâmetro populacional, itens (a) e (b). Neste tópico, vamos tratar somente dos testes paramétricos, pois se referem às hipóteses sobre parâmetros populacionais, isto é, feita uma determinada afirmação (ou suposição) sobre o parâmetro de uma população, desejamos inferir se os resultados de uma amostra desta população contrariam ou não tal afirmação. Os testes de hipótese representam uma regra de decisão que permite aceitar ou rejeitar uma hipótese formulada. Têm-se, então, as duas seguintes hipóteses iniciais: 1) Hipótese nula ( H0): é aquela que será testada. Representa o oposto da suposição do pesquisador e deve ser formulada em termos de igualdade. 2) Hipótese alternativa (H1): representa a suposição que o pesquisador quer provar. As hipóteses estatísticas para o parâmetro (média (μ), proporção (p) e diferença de média (μ1-μ2)), podem ser formuladas como segue: - Teste Bilateral (TB): quando utilizamos ambas as “caudas” da distribuição normal padronizada H H 0 0 1 0 : : - Teste Unilateral à Direita (TUD): quando utilizamos a “cauda” direita da distribuição normal padronizada. H H 0 0 1 0 : : - Teste Unilateral à Esquerda (TUE): quando utilizamos a “cauda” esquerda da distribuição normal padronizada H H 0 0 1 0 : : 15 O objetivo de se testar uma hipótese nula é tomar uma decisão, se possível correta. Devemos não rejeitar ou rejeitar H0, que é a hipótese usada como referência. Suponhamos que exista essa hipótese, a qual será considerada válida até prova em contrário, referente a um dado parâmetro da população. Essa hipótese será testada com base em resultados amostrais, podendo ser aceita ou rejeitada. Para melhor entendermos a regra de decisão adotada, é interessante estudarmos os tipo de erros que podemos cometer e as respectivas probabilidades de cometermos esses erros. Podemos cometer dois tipos de erros, ou seja: Erro Tipo I – ou de primeira espécie, constitui-se em rejeitar H0, quando H0 é verdadeira. A probabilidade desse erro será simbolizada por ( nível de significância), isto é = P( cometer erro tipo I) = P(rejeitar H0 H0 é verdadeiro) Erro Tipo II ou de segunda espécie, constitui-se em não rejeitar H0, quando H0 é falso. A probabilidade de cometer esse erro será simbolizada por , isto é = P( cometer erro Tipo II) = P( aceitar H0 H0 é falso) Esquematicamente, o quadro abaixo mostra as diversas situações que podem ocorrer num teste de hipótese: DECISÃO (Teste) REALIDADE H0 é verdadeira H0 é falsa Não rejeitar H0 Decisão correta Erro tipo II Rejeitar H0 Erro tipo I Decisão correta Procedimentogeral do teste de Hipótese A construção de um teste de hipótese, para um parâmetro populacional, consiste em: a) dado uma variável X de uma população normal e uma hipótese sobre determinado parâmetro dessa população (por exemplo, afirmamos que esse valor é um número 0); b) colhe-se uma amostra aleatória de ”n” elementos dessa população, e através dela deseja-se inferir o parâmetro para aceitar ou rejeitar tal hipótese. Passo para construção de um teste de hipótese paramétrico: A sequencia que pode ser usada sistematicamente para qualquer teste de hipótese. Passo 1: Enuncie H0 e H1 - deve ser feito no início da pesquisa, antes de se realizar a experiência amostral. caso (a) Testes bilateral 01 00 θθ:H θθ:H caso (b) Teste unilateral a direita 01 00 θθ:H θθ:H Caso (c) Teste unilateral a esquerda 01 00 θθ:H θθ:H Passo 2: Use a teoria estatística e as informações para decidir qual estatística (estimador) será usada no julgamento de H0 (“Z” ou “t-Student” ). Passo 3: Construa a região crítica (RA= Região de Aceitação de H0 e RC= Região crítica ou região de Rejeição de Ho , conforme o tipo de teste. Fixar o nível de significância () e determinar os respectivos valores na distribuição normal padronizado (Z ou Z/2 ) ou na distribuição t-Studente (t ou t/2). 16 Passo 4: Use as informações fornecidas pela amostra para encontrar o valor da estatística que definirá a decisão Passo 5: Conclusão. 3.1. TESTES PARA A MÉDIA DE UMA POPULAÇÃO Este teste é utilizado para validar um método ou produto por comparação com um valor conhecido. 3.1.1. PROCEDIMENTO DO TESTE Passo 1: Hipóteses Estatísticas caso (a) Testes bilateral H H 0 0 1 0 : : caso (b) Teste unilateral a direita H H 0 0 1 0 : : Caso (c) Teste unilateral a esquerda H H 0 0 1 0 : : Passo 2: Estatística Teste i) Para variância populacional conhecida: Como )n(N~X 2 ; para qualquer tamanho de amostra (n), a estatística (ou variável) do teste é: n X zcal 0 2i) Para variância populacional desconhecida: Com 2 é desconhecido deve-se estimá-lo. Assim a variável do teste é “t” com n-1 graus de liberdade. ns μX t 0cal 3i) Para grandes amostras Pelo teorema Central do Limite tem-se )n(N~X 2 ; para n suficientemente grande (n≥30) se a distribuição amostral se aproxima da distribuição Normal. Nestas condições a estatística do teste será: ns μX z 0cal Passo 3: Região de Rejeição ou Região Crítica Fixar o limite do erro tipo I, , e determinar a região crítica. A decisão de rejeitar ou não H0, ou seja decidir se a diferença )X( é ou não significativa, é tomada com base na região de rejeição H0 que 17 é construída de modo que a probabilidade de rejeitar H0 dado que H0 é verdadeiro, é α, em que α é o nível de significância do teste. A construção da região de rejeição (RR) depende também do tipo de teste que será realizado. i) Para variância 2 conhecida ou desconhecida com n≥30: Teste Bilateral: RR corresponde aos valores de z tais que 2zzcal ou 2zzcal . Teste Unilateral à Direita: RR corresponde ao valor de z tal que zzcal . Teste Unilateral à Esquerda: RR corresponde ao valor de z tal que zzcal . 2i) Para 2 desconhecida Teste Bilateral: RR corresponde aos valores de t tais que 2cal tt ou 2cal tt . Teste Unilateral à Direita: RR corresponde ao valor de t tal que ttcal . Teste Unilateral à Esquerda: RR corresponde ao valor de t tal que ttcal . Passo 4: Decisão Se o valor da estatística do teste zcal ou tcal pertencer à região de rejeição(RR), rejeita-se a hipótese H0 em nível α de significância. Caso contrario, não se pode rejeitá-la, ou seja pertencer à região de aceitação (RA) não se pode rejeitar H0. Passo 5: Conclusão 18 Exemplo 1: Um grupo de pesquisadores estabeleceu que os cigarros contêm em média 30 miligramas ou mais de nicotina e existe a certeza de se produzir câncer no pulmão. Um fumante está disposto a se arriscar se a média populacional de nicotina for menor que 30 miligramas e desvio padrão populacional igual 8. Ensaios sobre 100 cigarros da marca A mostraram uma média de 26 miligramas de nicotina. Sabendo que os dados têm distribuição Normal. Determine a decisão que o fumante deve tomar, com um nível de significância de 2%. Como, 0 = 30, = 8, n = 100, 26x , e = 2%, tem-se: Passo 1: Hipóteses 30 30 1 0 :H :H ou H0: O conteúdo médio de nicotina nos cigarros é de 30 miligramas e o fumante não se arrisca a fumar. H1: O conteúdo médio de nicotina nos cigarros é significativamente inferior a 30 miligramas e o fumante se arrisca a fumar. Passo 2: Estatística do teste Uma vez que é conhecido, a estatística do teste é: 5 100 8 30260 n X zcal Passo 3: Região de rejeição ou crítica Teste é unilateral à esquerda e = 0,02. Da tabela tem-se 06,2z e assim: Passo 4: Decisão Como zzcal , rejeita-se H0 em um nível de significância de 2%. Passo 5: Conclusão: Com 98% de certeza, há evidências de que o conteúdo médio de nicotina nos cigarros seja inferior a 30 miligramas. Portanto o fumante se arrisca a fumar. 19 Exemplo 2: Alguns pesquisadores estão desconfiados de que a média das receitas municipais per capita das cidades pequenas (menos de 20.000 habitantes) é maior do que a das receitas do estado, que é de 1229 unidades. Para comprovar ou não esta hipótese, foi sorteada dez cidades pequenas e obteve os seguintes resultados: 1230 582 576 2093 2621 1045 1439 717 1838 1359 Sabendo que os dados têm distribuição Normal. Com nível de 5% de significância, verifique se esta desconfiança procede. Como, 0 = 1229 ; n = 10 ; 1350x ; s = 675,8 e = 5%, tem-se: Passo 1: Hipóteses 1229 1229 1 0 :H :H ou H0: A média das receitas municipais per capita das cidades pequenas é de 1229 unidades. H1: A média das receitas municipais per capita das cidades pequenas é significativamente superior a 1229 unidades. Passo 2: Estatística do teste Uma vez que é desconhecido e n < 30, a estatística do teste é: 570 10 8675 12291350 0 , ,ns X tcal Passo 3: Região rejeição ou crítica O teste é unilateral à direita, os graus de liberdade são dados por: gl=n-1=10-1=9 e sendo = 0,05, da tabela tem-se t = 1,83. Passo 4: Decisão Como ttcal , não se rejeita H0 em um nível de significância de 5%. Passo 5: Conclusão: Com 95% de certeza, há evidências de que a média das receitas municipais per capita das cidades pequenas seja igual a 1229 unidades. 20 Exemplo 3: Um grupo de pesquisadores acredita que o motorista de caminhão depois de se envolverem em acidente por ter dormido ao volante, trabalha em média 8 horas por dia. Então, esses pesquisadores entrevistaram 60 motoristas que já se envolverem em acidente por ter dormido ao volante, obtendo a média de trabalho de12,5 horas e desvio padrão amostral de 3,5 horas. Considerando um nível de significância de 4%, verifique se a jornada de trabalho dos motoristas de caminhão difere 8 horas. Como, 0 = 8, n = 60, 5,12x s=3,5 e = 4%, tem-se: Passo 1: Hipóteses 8 8 1 0 :H :H ou H0: A jornada de trabalho dos motoristas de caminhão é 8 hs. H1: A jornada de trabalho dos motoristas de caminhão difere 8 hs. Passo 2: Estatística do teste Uma vez que é desconhecido e os dados não apresentam distribuição Normal, mas o tamanho da amostra é suficientemente grande, utilizando o Teorema Central do Limite a estatística do teste é: 969 60 53 85120 , , , ns X zcal Passo 3: Região rejeição ou crítica Teste é bilateral e = 0,04. Da tabela tem-se 06,2z 2 e assim: Passo 4: Decisão Como 2cal zz , rejeita-se H0 em um nível de significância de 4%. Passo 5: Conclusão: Com 96% de certeza, há evidências de que a jornada de trabalho dos motoristas de caminhão difere 8 hs. 21 3.2. TESTE PARA PROPORÇÃO Quando a finalidade da amostragem é julgar a validade de uma alegação acerca de uma proporção populacional, é apropriado um teste de uma amostra. A metodologia depende do número de observações amostrais: grande ou pequeno. Para amostras 100 ou mais observações, a distribuição Normal é aceitável; para tamanhos amostrais menores, deve-se usar a distribuição Binomial. Neste estudo será apresentado o teste para grandes amostras. Os testes de grandes amostras tanto para média como para proporções são bastante parecidos. A única distinção entre os dois é maneira de obter o desvio padrão da distribuição amostral da proporção em que n qp )p(DP ooo A seguir tem-se registrado o procedimento para fazer um teste de hipótese para uma proporção com grandes amostras. Passo 1: Hipóteses Teste bilateral T. unilateral à direita T. unilateral à esquerda caso (a) 01 00 pp:H pp:H caso (b) 01 00 p p:H pp:H caso (c) 01 00 pp:H pp:H Passo 2: Estatística do teste Para n 30, com o auxilio do teorema Central do Limite o )p(N~pˆ n qp ; 000 , logo a estatística do teste é dada por: n qp ppˆ Zcal 00 0 Passo 3: Região de rejeição Fixar o limite do erro e determinar a região de rejeição ou crítica. Teste Bilateral: RR corresponde aos valores de z tais que 2cal zz ou 2cal zz . Teste Unilateral à Direita: RR corresponde ao valor de z tal que zzcal . Teste Unilateral à Esquerda: RR corresponde ao valor de z tal que zzcal . Passo 4: Decisão A decisão é tomada com base na região de rejeição de H0, em que α é a probabilidade de 22 rejeitar H0 dado que H0 é verdadeiro. Lembrando que α é o nível de significância do teste. Se o valor da estatística do teste zcal pertencer à região de rejeição, rejeita-se a hipótese H0 em nível α de significância. Caso contrario, não se pode rejeitá-la, ou seja pertence à região de aceitação não se pode rejeitar H0. Exemplo O consumidor de certo produto acusou o fabricante, dizendo que mais de 20% das unidades fabricadas apresentam defeito. Para confirmar sua acusação, ele usou uma amostra de tamanho 500, em que 27% das peças eram defeituosas. Verifique se o consumidor tem razão, utilizando um nível de significância de 10%. pˆ =0,27 ; 0,80q e 20,0p 00 ; e = 10% Como, n = 500 então ),(N~pˆ 500 0,800,20 ; 200 , tem-se: Passo 1: Hipóteses 200 200 1 0 ,p:H ,p:H ou H0: A proporção das unidades fabricadas que apresentam defeito é 20%. H1: A proporção das unidades fabricadas que apresentam defeito é significativamente superior a 20% Passo 2: Estatística teste A estatística do teste é: 913 500 8020 200270 00 0 , ,, ,, n qp ppˆ zcal Passo 3: Região de rejeição O Teste é unilateral à direita e sendo = 0,10, da tabela tem-se 281,z . Assim: Passo 4: Decisão Como zzcal , não se rejeita H0 ao nível de significância de 10%, Passo 5: Conclusão Com 90% de certeza, há evidências de que a proporção das unidades fabricadas que apresentam defeitos seja significativamente de 20%. 23 3.3. TESTE PARA DUAS VARIÂNCIAS O teste para diferença de duas variâncias é utilizado para comparar as variabilidades entre duas populações independentes, ou seja verificar se as dispersões dos valores de duas populações diferem significativamente por meio das variâncias. Para a realização deste teste é necessário a distribuição Fisher de Snedecor. Caracterizado pelos graus de liberdade associados às quantidades presentes no numerador e no denominador de F. A variável definida como 2 2 2 1 ssF é denominada variável com distribuição de F de Snedecor com ν1 e ν2 graus de liberdade. Para usar a tabela F de Snedecor, deve-se conhecer: o nível de significância desejado e os graus de liberdade das duas populações (ν1= n1-1; ν2=n2-1). Por exemplo, têm-se duas populações independentes com tamanho de amostra n1=13 e n2=21, com nível de significância igual a 10%, determine o valor de 2F e 21F : 282121 ; 1-13 ; 0,051n ; 1-n ; 210 ; ; 2 2121 ,FFF , Em geral, apenas tem tabelas da distribuição F Snedecor correspondentes à cauda à direita. Deste modo deve-se usar a seguinte artifício: 3940 542 111 1-13 ; 1-21 ; 05012 2 1 21 ; ; 2 , ,FF F , ;; 3.8.1 - PROCEDIMENTO DO TESTE Passo 1: Hipóteses Estatísticas Teste bilateral T. unilateral à direita T. unilateral à esquerda 2 2 2 11 2 2 2 10 :H :H 2 2 2 11 2 2 2 10 :H :H 2 2 2 11 2 2 2 10 :H :H Passo 2: Estatística do Teste Se as populações têm distribuição Normal, a estatística teste é obtida por 2 2 2 1 calF s s Passo 3: Região de Rejeição Teste bilateral T. unilateral à direita T. unilateral à esquerda Passo 4: Decisão Se Fcal pertencer à região de rejeição (RR), rejeita-se a hipótese H0 em nível α de significância. 24 Se Fcal pertencer à região de aceitação (RA), não se rejeita a hipótese H0 em nível α de significância. Exemplo Dois programas de treinamento de funcionários foram efetuados. Com o programa antigo foram treinados 16 funcionários apresentando uma variância de 146 erros 2 e média de 25 erros. No programa novo foram treinados 13 funcionários com variância de 200 erros 2 e média de 32 erros. Verifique se as variâncias da taxa de erros dos funcionários diferem entre os programas de treinamento, com 10% de nível de significância. Como, 14621 s ; n1 = 16 2002 s ; n2 = 13 e = 10%, tem-se: Passo 1: Hipóteses Estatísticas 2 2 2 11 2 2 2 10 :H :H Passo 2: Estatística do Teste 730 200 146 F 2 2 2 1 cal , s s Passo 3: Região de Rejeição 622113 ; 1-16 ; 0,051n ; 1-n ; 210 ; ; 2 2121 ,FFF, 400 482 111 1-16 ; 1-13 ; 05012 2 1 21 ; ; 2 , ,FF F , ;; Passo 4: Decisão Como Fcal pertence à região de aceitação, não se rejeita a hipótese H0 em nível 10% de significância. Passo 5:Conclusão Com 90% de confiança, há evidências que as variâncias da taxa de erros com os programas de treinamentos são significativamente iguais. 25 3.4. TESTES PARA DUAS MÉDIAS Nos testes de médias são utilizados o valor da variância populacional ou um estimador (s 2 ), para a comparação das duas médias é necessário analisar o que ocorre com as variâncias das duas populações, em algumas situações podem ser conhecidas, em outras podem ser desconhecidas e iguais ou desconhecidas e diferentes. Para aplicar os testes de duas médias, exige-se a independência das duas amostras. Estes testes são utilizados, por exemplo, para comparar dois métodos de ensino, dois métodos analíticos, duas marcas, duas cidades, diferença entre sexos e dentre outros. 3.4.1 - PROCEDIMENTO DO TESTE Passo 1: Hipóteses Estatísticas Teste bilateral 0 0 211 210 211 210 :H :H ou :H :H Teste Unilateral à Direita 0 0 211 210 211 210 :H :H ou :H :H Teste Unilateral à Esquerda 0 0 211 210 211 210 :H :H ou :H :H Passo 2: Estatística do Teste i) Para variâncias populacionais 2 1 e 2 2 conhecidas: Como 2 2 2 1 2 1 2121 nn ;N~XX , a estatística (ou variável) do teste é dada por: 2 2 2 1 2 1 2121 nn )()XX( Zcal Note pela hipótese que Ho 021 , então Z será: 2 2 2 1 2 1 21 0 nn )XX( Zcal 2i) Para variâncias populacionais 2 1 e 2 2 desconhecidas e iguais: Quando 2 1 e 2 2 são desconhecidas e iguais, com n1+n2<30, devem-se estimá-los. Assim a variável do teste é t com n1+n2-2 graus de liberdade é: 26 2121 2 22 2 11 2121 11 2 11 nnnn snsn xx tcal Note pela hipótese que Ho 021 , então tcal será: 2121 2 22 2 11 21 11 2 11 0 nnnn snsn xx tcal 3i) Para variâncias populacionais 2 1 e 2 2 desconhecidas e diferentes: Quando 2 1 e 2 2 são desconhecidas e diferentes, com n1+n2<30, devem-se estimá-los. Assim a variável do teste é t com n1+n2-2 graus de liberdade é dada por: 2 2 2 1 2 1 2121 n s n s )()XX( tcal Note pela hipótese que Ho 021 , então tcal será: 2 2 2 1 2 1 21 0 n s n s )XX( tcal 4i) Para grandes amostras Pelo teorema Central do Limite tem-se )n(N~X 2 ; para n suficientemente grande (n1+n2≥30) se a população não tiver distribuição Normal. Nestas condições a estatística do teste será: 2 2 2 1 2 1 21 0 n s n s )XX( Zcal Passo 3: Região de Rejeição Fixar o limite do erro e determinar a região crítica. i) Para variância 2 1 e 2 2 conhecidas ou desconhecidas com n1+n2≥30: 27 2i) Para variância 2 1 e 2 2 desconhecida com n1+n2<30: Passo 4: Decisão Se o valor da estatística do teste zcal ou tcal pertencer à região de rejeição, rejeita-se a hipótese H0 em nível α de significância. Caso contrario, não se pode rejeitá-la, ou seja se zcal ou tcal pertencer à região de aceitação não se pode rejeitar H0. Exemplo 1 Uma escola de informática deseja verificar se a velocidade média de digitação difere entre o método tradicional e método cego. De outros estudos o desvio padrão populacional do método tradicional é 5,2 e outro método é 4,3. Para isso foram selecionados dois grupos de pessoas e ensinado um método para cada grupo. Os resultados (palavras/min.) estão no quadro abaixo e apresentam distribuição aproximadamente Normal. Alunos 1 2 3 4 5 6 7 8 9 10 11 12 1 Método tradicional 33 40 39 36 31 40 30 34 38 42 35 46 2 Método cego 32 42 44 37 35 40 33 37 36 43 38 45 Verifique se a velocidade média de digitação do método tradicional difere método cego, com nível de 2% de significância. Como, 251 , ; 371 x ; n1 = 12 ; 342 , ; 5382 ,x ; n2 = 12 e = 2%, tem-se: Passo 1: Hipóteses 211 210 :H :H Passo 2: Estatística do Teste 770 12 34 12 25 53837 22 2 2 2 1 2 1 21 , ,, , nn )XX( Zcal 28 Passo 3: Região de Rejeição Passo 4: Decisão Como zcal pertence à região de aceitação, não se rejeita H0 em nível 2% de significância. Passo 5: Conclusão Com nível de 2% de significância, há evidencias que as médias de velocidade de digitação não diferem significativamente entre os métodos estudados. Exemplo 2 Dois programas de treinamento de funcionários foram efetuados. Com o programa antigo foram treinados 16 funcionários apresentando uma variância de 146 erros 2 e média de 28 erros. No programa novo foram treinados 13 funcionários com variância de 200 erros 2 e média de 32 erros. Verifique se as médias da taxa de erros dos funcionários diferem entre os programas de treinamento, com 10% de nível de significância. Como, 28x1 ; 146s21 ; n1 = 16 ; 32x2 ; 200s22 ; n2 = 13 e = 10%, tem-se: Passo 1: Hipóteses 211 210 :H :H Passo 2: Estatística do Teste Como já foi verificado que as variâncias são iguais no exemplo do tópico 3.3, então estatística do teste é obtida por: 13 1 16 1 21316 200113146116 3228 11 2 11 2121 2 22 2 11 21 nnnn snsn xx tcal 820,tcal Passo 3: Região de Rejeição 703121316 5 ,t ;% 29 Passo 4: Decisão Como zcal pertence à região de aceitação, não se rejeita a hipótese H0 em nível 10% de significância. Passo 5: Conclusão Com 90% de certeza, há evidencias que as médias da taxa de erros dos funcionários não diferem significativamente entre os programas de treinamento. Exemplo 3 O tempo de produção de uma determina peça em duas fábricas mostrou que: - na fábrica A, numa amostra de 16 funcionários, demora em média 13 minutos para produzir uma peça, com desvio padrão de 2 minutos; - na fábrica B, em uma amostra de 10 funcionários, demora em média 11 minutos para produzir a mesma peça, e desviopadrão de 4 minutos. Verifique se a média do tempo de produção das peças da fábrica B é menor que a fábrica A, com nível de 5% de significância. Como, 13Ax ; 2As ; nA = 16 ; 11Bx ; 4Bs ; nB = 10 e = 5%, tem-se: Passo 1: Hipóteses 1 0 AB AB :H :H Passo 2: Estatística do Teste Como as variâncias são significativamente diferentes, então estatística do teste é obtida por: 471 10 4 16 2 1311 2222 , )()( n s n s )XX( t B B A A AB cal Passo 3: Região de Rejeição 71112-1016 5 ,t ;% Passo 4: Decisão Como zcal pertence à região de aceitação, não se rejeita H0 em nível 5% de significância. Passo 5: Conclusão Com 95% de certeza, há evidencias que as médias do tempo de produção das peças não diferem significativamente entre as fábricas. 30 Exemplo 4 Um estudo da diferença entre os salários dos professores do ensino fundamental dos colégios particulares e públicos, obteve que : - uma amostra de 100 professores particulares apontou média salarial de 1.130,00 R$ com desvio padrão de 225,00 R$; - uma amostra de 120 professores do ensino público apresentou uma média salarial de 880,00 R$ com desvio padrão de 130,00 R$. Verifique se o salário médio dos professores dos colégios particulares é significativamente maior que dos professores do ensino público, com α=2%. Como, 13011 .x ; 2251 s ; n1 = 100 ; 8802 x ; 1302 s ; n2 = 120 e = 2%, tem-se: Passo 1: Hipóteses 211 210 :H :H Passo 2: Estatística do Teste 839 120 130 100 225 8801301 22 2 2 2 1 2 1 21 , . n s n s )XX( Zcal Passo 3: Região de Rejeição Passo 4: Decisão Como zcal pertence à região de rejeição, rejeita-se a hipótese H0 em nível 2% de significância. Passo 5: Conclusão Com 98% de confiança, há evidencias que o salário médio dos professores dos colégios particulares é significativamente maior que dos professores do ensino público.
Compartilhar