Baixe o app para aproveitar ainda mais
Prévia do material em texto
UNIVERSIDADE FEDERAL FLUMINENSE PÓLO UNIVERSITÁRIO DE VOLTA REDONDA DEPARTAMENTO DE ENGENHARIA DE PRODUÇÃO Estatística II CAROLINA CONDÉ MARQUES ORIENTADORA: ELIANE DA SILVA CHRISTO Volta Redonda 2010 2 Í�DICE Capítulo 1 Inferência Estatística .................................................................................. 2 Capítulo 2 Distribuição de Amostragem da Média .................................................... 3 Capítulo 3 Estimador ou Estatística ............................................................................ 6 Capítulo 4 Estimação Pontual ...................................................................................... 6 Capítulo 5 Estimação Intervalar .................................................................................. 7 Intervalo de Confiança para Média quando a Variância é conhecida, IC para Média quando a Variância é desconhecida, IC para Proporção Populacional, Determinação do tamanho necessário da Amostra para estimar a Média, Determinação do tamanho necessário da Amostra para estimar a Proporção, IC para Variância Populacional, IC para Diferença de duas Médias, IC para Diferença de duas Proporções, Exercícios Capítulo 6 Teste de Hipótese .......................................................................................22 Teste da Média Populacional para Variância conhecida, Teste da Média Populacional para Variância desconhecida, Teste da Proporção Populacional, Teste da Igualdade de Variâncias, Teste da Variância (usando Distribuição Quiquadrado), Teste da Diferença entre duas Médias usando Distribuição Normal Padronizada e usando Distribuição t de Student, Exercícios Capítulo 7 Teste Quiquadrado ....................................................................................37 Teste de Aderência, Teste de Independência, Teste de Homogeneidade, Exercícios Capítulo 8 Análise de Variância – A�OVA ...............................................................46 Estimativa dos Tratamentos entre a Variância da População, Estimativa dos Tratamentos dentro da Variância da População, Comparando Estimativas da Variância, Tabela ANOVA, Exercícios Capítulo 9 Regressão Linear .......................................................................................51 Método dos Mínimos Quadrados, Coeficiente de Determinação, Coeficiente de Correlação, Exercícios Apêndices........................................................................................................................58 Tabela da Distribuição Normal-Padrão, Tabela da Distribuição t, Tabela da Distribuição Quiquadrado, Tabela da Distribuição F Bibliografia ....................................................................................................................66 3 Capítulo 1 - I�FERÊ�CIA ESTATÍSTICA Aprendendo o desconhecido a partir do conhecido A Estatística Inferencial compreende as técnicas por meio das quais são tomadas decisões sobre uma população, decisões baseadas unicamente na observação de uma amostra. Devido ao fato de que tais decisões são tomadas em condições de incerteza, requer-se, na estatística inferencial, o uso de conceitos de probabilidade. - Parâmetros da população: medidas características da população - Estatísticas da amostra: medidas características de uma amostra Em estudos anteriores foram apresentados vários modelos probabilísticos utilizados em problemas reais como a distribuição normal, binomial por exemplo. Estes modelos probabilísticos dependem de grandezas que foram consideradas conhecidas, os parâmetros. No modelo normal os parâmetros são a média e a variância enquanto no modelo binomial o parâmetro é a probabilidade de sucesso. Nos problemas reais estes parâmetros devem ser determinados antes da construção do modelo. Como os parâmetros muitas vezes não são observáveis (por exemplo, se a população for muito grande exigindo um trabalho exaustivo e de custo elevado, ou se os ensaios forem destrutivos) as informações sobre os mesmos podem ser obtidas através de valores das variáveis em questão, uma vez que estes são observáveis. Cada um dos valores possíveis de uma variável é denominado observação da mesma, estatística. Portanto, a solução é tentar obter os parâmetros a partir de uma amostra de n (n < N) observações das variáveis. Pode-se assim, obter possíveis valores do parâmetro e verificar hipóteses se os mesmos são verdadeiros ou não. Ao contrário da população, as observações são variáveis aleatórias e variam de amostra para outra. Assim, pode-se falar de população das médias amostrais ou distribuição das médias amostrais. Resumo Inferência estatística: tirar conclusões a respeito da população, baseando-se em uma amostra da mesma. 4 Capítulo 2 - DISTRIBUIÇÃO DE AMOSTRAGEM DA MÉDIA Parâmetro (medida que descreve certa característica dos elementos da população) Simbologia Fórmula para o cálculo Média µ 1 2 1 ... 1 nn i i X X X X X � � = + + + = = ∑ Variância 2σ 2 1 1 ( ) � i i X � µ = −∑ Desvio-padrão σ 2 1 1 ( ) � i i X � µ = −∑ Tabela 2.1 – Distribuição de Amostragem da Média (Parâmetro) Estatística (medida que descreve certa característica dos elementos da amostra) Simbologia Fórmula para o cálculo Média X 1 2 1 ... 1 nn i i X X X X n n = + + + = ∑ Variância 2S 2 1 1 ( ) 1 n i i X X n = − − ∑ Desvio-padrão S 2 1 1 ( ) 1 n i i X X n = − − ∑ Tabela 2.2 - Distribuição de Amostragem da Média (Estatística) A distribuição de amostragem da média é a distribuição de probabilidade para os possíveis valores da média da amostra X baseados em um particular tamanho da amostra. Para qualquer tamanho dado n de amostra tomada de uma população com média µ , o valor da amostra X irá variar de amostra para amostra. A distribuição de amostragem da média é descrita através da determinação do valor esperado E( X ), ou média da distribuição e através do desvio padrão da distribuição das médias σ , usualmente chamado de erro padrão da média. Em geral, o valor esperado e o erro padrão da média são descritos como: E( X ) = µ ; σ x = σ √� 5 Exemplo: Suponha que a média de uma população bastante grande seja µ = 50,0 e o desvio padrão σ = 12,0. Determinamos a distribuição de amostragem das médias das amostras de tamanho n = 36, em termos de valor esperado da seguinte forma: E( X ) = µ = 50,0 σ x = σ √� = ��,� √�� = ��,�� = 2,0 Observações: 1) Ao fazer amostras de uma população finita (amostragem sem reposição), deve-se incluir um fator de correção finita na fórmula do erro padrão da média: σ x = σ √� ������ 2) Se o desvio padrão da população for desconhecido, o erro padrão da média pode ser estimado, usando-se o desvio padrão da amostra como um estimador do desvio padrão da população: sx = √� A fórmula para o erro padrão estimado da média quando se inclui o fator de correção finita é: sx = √� ������ O erro padrão da média fornece a base principal para a inferência estatística no que diz respeito a uma população com média desconhecida. Um teorema em estatística que conduz o uso do erro padrão da média é o seguinte: Teorema do Limite Central: À medida que se aumenta o tamanho da amostra, a distribuição de amostragemda média se aproxima da forma da distribuição normal, qualquer que seja a forma da distribuição da população. Na prática, a distribuição de amostragem da média pode ser considerada como aproximadamente normal sempre que o tamanho da amostra for n ≥ 30. Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. p. 127 6 Seja X uma população de média µ a variância σ ² ,ou seja, N(µ ;σ ²). Seja (x1, x2, ..., xn) uma amostra aleatória então x1, x2, ..., xn são independentes. Então: µ x = E( X ) = µ ; σ x = σ ² √� Então se X ~ N(µ ;σ ²) , temos X ~ N( µ ; σ ² √� ) Variável �ormal Padronizada: Zx = X � µ σ √� Exemplo: Um auditor toma uma amostra aleatória de tamanho n = 36 de uma população de 1000 contas a receber. Não se conhece o desvio padrão da população, mas o desvio padrão da amostra é S = $ 43,00. Se o verdadeiro valor da média da população de contas a receber é µ = $ 260,00, qual a probabilidade de que a média da amostra seja menor ou igual a $ 250,00? Solução a distribuição de amostragem é descrita pela média e pelo erro padrão: E( X ) = µ = $ 260,00 Sx = √� = �� √�� = �� � = 7,17 �ota: S é usado como estimador de σ já que n = 36 (> 30) Zx = X � µ�√� = ���,������,�� �,�� = � ��,�� �,�� = - 1,39 Portanto, P ( X ≤ 250,00) = P(Z ≤ -1,39) E P(Z ≤ -1,39) = 0,5000 - P(-1,39 ≤ Z ≤ 0) = 0,5000 – 0,4177 = 0,0823 Logo, a probabilidade de que a média seja menor ou igual a $ 250,00 é igual a 8,23%. 7 Capítulo 3 - ESTIMADOR OU ESTATÍSTICA Dada uma amostra aleatória, estimador ou estatística é qualquer variável aleatória função dos elementos amostrais. Observe: θ : Parâmetro θ : estimador ou estatística (ex: X , S, Sx , ...) Estimativa: é o valor numérico de um estimador. Qualidade de um estimador: Sejam os estimadores θ1 e θ2 de um mesmo parâmetro. Qual o melhor estimador? Para resolver esse problema leva-se em consideração alguns conceitos sobre qualidade de um estimador, já que nunca pode-se conhecer o valor do parâmetro θ e sendo assim não se pode afirmar que θ1 é “mais correto” que θ2 , ou vice versa. 1) ESTIMADOR JUSTO ou NÃO VIESADO Diz-se que θ é justo se o seu valor esperado for θ E(θ) = θ Exemplo: E( X ) = µ 2) ESTIMADOR EFICIENTE Variância mínima Um estimador θ1 será mais eficiente que θ2 se e somente se: σ ²( θ1) < σ ²( θ2) Capítulo 4 - ESTIMAÇÃO PO�TUAL Na estimação por ponto calcula-se um único valor (estimativa) para o parâmetro populacional. Assim, temos: X = 1 2 1 ... 1 nn i i X X X X n n = + + + = ∑ é uma estimativa pontual de µ S² = 2 1 1 ( ) 1 n i i X X n = − − ∑ é uma estimativa pontual de σ ², ou seja S² é um estimador de qualidade de σ ². 8 Capítulo 5 - ESTIMAÇÃO I�TERVALAR Os métodos de estimação por intervalo que serão estudados são baseados no pressuposto de que possa ser usada a distribuição normal de probabilidade. Tal pressuposição é garantida sempre que: A) População normalmente distribuída e σ conhecido, mesmo que n < 30 B) n ≥ 30 (Teorema do Limite Central), independente de σ ser conhecido ou não. Um Intervalo de Confiança para a média é um intervalo estimado, construído com respeito à média da amostra, pelo qual pode ser especificada a probabilidade de o intervalo incluir o valor da média da população. O grau de confiança associado a um intervalo de confiança indica a percentagem de tais intervalos que incluiriam o parâmetro que se está estimando. X ± Zxσ x ou X ± ZxSx 1 - α grau de confiança α grau de significância 5.1 - Intervalo de Confiança para Média populacional µ quando a Variância σ² é conhecida Neste caso sabe-se da distribuição amostral da média que a média amostral X tem distribuição normal µ e desvio padrão �√� Assim a variável associada a X é a normal padronizada Zx = X � µ�√� E o intervalo de confiança: P ( X - Zα/2 σ√� < µ < X + Zα/2 σ√� ) = 1 - α 9 Exemplo: Para uma dada semana, foi tomada uma amostra aleatória de 30 empregados horistas selecionados de um grande número de empregados de uma fábrica, a qual apresentou um salário médio de X = $ 180,00 com um desvio padrão da população de σ = $ 14,00. Estime o salário médio para todos os empregados horistas da fábrica admitindo-se um grau de confiança de 95%. Solução �1 − � = 0,95� = 0,05�/2 = 0,025 " Logo, obtemos da tabela da Distribuição Normal – Padrão (Apêndice) Zα/2 = 1,96. Temos então, X ± Zα/2σ x = X ± 1,96σ x P ( X - Zα/2 σ√� < µ < X + Zα/2 σ√� ) = 1 - α P ( 180,00 – 1,96��,��√�� < µ < 180,00 + 1,96��,��√�� ) = 0,95 P (180,00 – 1,96(2,56) < µ < 180,00 + 1,96(2,56) ) = 0,95 P ( 174,98 < µ < 185,02 ) = 0,95 Conclusão: podemos dizer que o nível do salário médio para todos os empregados está entre $ 174,98 e $ 185,02, com um grau de confiança de 95% nesta estimativa. Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. p. 129 5.2 - Intervalo de Confiança para Média populacional µ quando a Variância σ ² é desconhecida Neste caso deve-se estimar a variância populacional σ ². Então S2, a variância amostral, é um estimador de qualidade de σ ² S² = � � Σ ( X – X )² Sendo o tamanho da amostra menos que 30, ou seja n ≤ 30, define-se a variável padronizada tx = X � µ#√� Esta variável tem uma distribuição de probabilidade t de Student com ν = n – 1 graus de liberdade. 10 �ota: quanto maior o grau de liberdade, mais a distribuição se aproxima da distribuição normal. E temos o intervalo de confiança: P ( X - tα/2 $√� < µ < X + tα/2 $√� ) = 1 - α Exemplo: A vida média de operação para uma amostra de n = 10 lâmpadas é X = 4000 horas com o desvio padrão da amostra S = 200 horas. Supõe-se que o tempo de operação das lâmpadas, em geral, tenha distribuição aproximadamente normal . Estime a vida média de operação para a população de lâmpadas da qual foi extraída a amostra, usando um intervalo de confiança de 95%. Solução �1 − � = 0,95� = 0,05�/2 = 0,025 " ; graus de liberdade g.l. ν = n – 1 = 10 - 1 = 9 Logo, obtemos da tabela da Distribuição t (Apêndice), o valor de tα/2 = 2,262. �ota: como desconhecemos o desvio padrão da população σ , sabendo apenas o desvio padrão amostral S e n < 30, usamos a variável t de Student. Temos então, X ± tα/2 Sx = X ± 2,262 Sx P ( X - tα/2 $√� < µ < X + tα/2 $√� ) = 1 - α P (4000 – 2,262 ���√�� < µ < 4000 + 2,262 ���√�� ) = 0,95 P ( 4000 – 2,26(63,24) < µ < 4000 + 2,26(63,24) ) = 0,95 P (3857 < µ < 4142 ) = 0,95 Conclusão: a vida média para a população de lâmpadas está no intervalo de 3857 à 4142 horas. Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. p. 130 11 Resumo Estimação por Intervalo da Média da População População Tamanho da amostra σ conhecido σ desconhecido Normalmente distribuída Grande (n ≥ 30) X ± Zα/2σ x X ± Zα/2Sx * Pequeno (n < 30) X ± Zα/2σ x X ± tα/2Sx Tabela 5.1 – Estimação por Intervalo da Média da População * Z é utilizado como uma aproximação de t. 5.3 - Intervalo de Confiança para a Proporção populacional A distribuição de probabilidade aplicável à proporções é a distribuição de probabilidade binomial. Contudo, a construção de um intervalo de confiança para uma proporção populacional desconhecida, usandoa distribuição binomial, acarreta cálculos extenuantes. Assim, utiliza-se a distribuição normal como aproximação da binomial para a construção de intervalos de confiança para as proporções. Suponha uma certa população com proporção p de objetos defeituosos. Neste caso, o estimador não tendencioso de p é a proporção amostral f. Para grandes amostras (n ≥ 30), a proporção amostral f tem distribuição aproximadamente normal e a variável normal padronizada é: Zx = %�& '()*')� Sendo o erro padrão estimado da proporção é: sf = %(��%)� Desse modo, o intervalo de confiança fica sendo: P (f - Zα/2 %(��%)� ≤ p ≤ f + Zα/2 %(��%)� ) = 1 - α Exemplo: Um administrador de uma universidade coleta dados sobre uma amostra aleatória de âmbito nacional de 230 alunos de curso de Engenharia e encontra que 54 de 12 tais estudantes têm diploma técnico. Usando um intervalo de confiança de 90%, estimar a proporção nacional de estudantes que possuem diploma técnico. Solução �1 − � = 0,90� = 0,10�/2 = 0,05 " ; logo Zα/2 = 1,65 Temos então, f ± Zα/2 sf = f ± 1,65 sf f = �� ��� = 0,235 Ou seja, a proporção amostral de alunos que têm diploma técnico é igual a 23,5%. Sendo o erro padrão sf = %(��%)� = (�,���)(�,���)��� = 0,028 Temos o intervalo de confiança associado: P ( 0,235 – (1,65)(0,028) ≤ p ≤ 0,235 + (1,65)(0,028) ) = 0,90 P ( 0,235 – 0,046 ≤ p ≤ 0,235 + 0,046 ) = 0,90 P ( 0,189 ≤ p ≤ 0,281 ) = 0,90 Conclusão: a proporção de estudantes no país que estudam Engenharia e já possuem diploma técnico está no intervalo entre 18,9% à 28,1%. Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. p. 149 5.4 - Determinação do Tamanho necessário da Amostra para estimar a Média Suponhamos que se conhece o tamanho desejado do intervalo de confiança bem como o grau de confiança a ele associado. Se σ é conhecido, sendo baseado no uso da distribuição normal: Zα/2 = X � µ�√� Então, o tamanho necessário da amostra é: n = ,²σ ² -² 13 Onde: Z é o valor usado para o grau de confiança específico (Tabela da Distribuição Normal Padrão – Apêndice) σ é o desvio padrão da população e = X − µ é o fator de erro permitido no intervalo No caso da amostragem sem reposição de uma população finita de tamanho N, tem-se que: Zα/2 = X � µ �√� .*�.*) E sendo e = X − µ o erro de estimativa, explicitando-se n, tem-se que: n = /²�²� (���)0²1/²�² �ota: Ao determinar o tamanho da amostra, qualquer resultado fracionário é sempre arredondado. Exemplo: Um analista do departamento pessoal deseja estimar o número médio de horas de treinamento anual para os funcionários da empresa, com um fator de erro de 3,0 horas (para mais e para menos) e com 90% de confiança. Baseado em dados de outras divisões, ele estima o desvio padrão das horas de treinamento em σ = 20,00 horas. Qual o tamanho mínimo necessário da amostra? Solução n = ,²σ ² 0² = �,��² ��,��²�² = 121 Conclusão: o tamanho mínimo da amostra deve ser 121 horas de treinamento. Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. P. 129 14 5.5 - Determinação do Tamanho necessário da Amostra para estimar a Proporção Considere uma população com uma proporção p de objetos que apresentam certas características de interesse. Para um intervalo de confiança de 100(1-α)% construído a partir de uma grande amostra (n ≥ 30) extraída com uma proporção f de objetos com a característica considerada, extraída com reposição, tem-se que: Zα/2 = %�& '()*')� onde f – p = e é o erro de estimativa. Explicitando-se n, tem-se: n = /² %(��%) 0² Exemplo: Com objetivo de estimar a proporção de itens defeituosos numa produção, um Engenheiro de Produção deseja extrair uma amostra de itens. Uma amostra piloto de 40 itens apresentou 4 defeituosos. Qual deve ser o tamanho da amostra definitiva para que o erro de estimação seja no máximo 3% a um nível de confiança de 95%? Solução f = ��� = 0,1; e = 0,03 �1 − � = 0,95� = 0,05�/2 = 0,025 " ; logo Zα/2 = 1,96 n = /² %(��%) 0² = �,2�² �,�(���,�)�,��² = 384,16 Conclusão: o tamanho da amostra deve ser 385. 5.6 - Intervalo de Confiança para Variância populacional Se uma variável aleatória x admite distribuição normal de probabilidades com média µ e variância σ² 3² (4 − 1)5² 15 Tem distribuição Quiquadrado χ²(n – 1) O Intervalo de Confiança escrito em função da variável χ²(n – 1) assume a forma: P( χ²(1 – α/2) ≤ χ² ≤ χ²(α/2) ) = 1 – α Substituindo-se o valor do χ² no intervalo, obtém-se: P( χ²1 – α/2 ≤ ² (���) �² ≤ χ²α/2 ) = 1 – α P( �6² (��7/�) ≤ �²3² (4−1) ≤ �6²(7/�) ) = 1 – α P ( 3² (4−1)6²(��7/�) ≤ σ² ≤ 3² (4−1)6²(7/�) ) = 1 – α Exemplo: Uma máquina produz uma grande quantidade de peças e o número de peças defeituosas da produção se distribui normalmente com variância σ²(x) = 16. Com o objetivo de diminuir a variabilidade do processo, foi providenciada uma reforma na máquina. Uma amostra aleatória de 51 peças produzidas após a reforma forneceu variância 14. Construa um intervalo de confiança de 98% para a nova variância populacional. Solução n = 51 peças, logo gl (grau de liberdade) = n – 1 = 50 Variância amostral s² = 14 1 – α = 98% ; α = 0,02 ; α/2 = 0,01 Da Tabela de Distribuição Quiquadrado (Apêndice), temos: χ²(1 – α/2) = χ²(0,99) = 76,2 χ² (α/2) = χ²(0,01) = 29,7 Teremos então o seguinte intervalo de confiança para a variância: P ( 3² (4−1)6²(��7/�) ≤ σ² ≤ 3² (4−1)6²(7/�) ) = 1 – α P ( 14(51 – 1)��,� ≤ σ² ≤ 14(51 – 1)�2,� ) = 0,98 P ( 9,186 ≤ σ² ≤ 23,569) = 0,98 Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração, Ciências Contábeis. p. 149 16 5.7 Intervalo de Confiança para Diferença de duas Médias Consideramos duas populações normais, ou seja, N (µ1 ; σ²1) e N (µ2 ; σ²2) independentes e com σ²1 e σ²2 conhecidas. Assim, ao selecionarmos amostras das duas populações de tamanho n1 e n2, pelo Teorema do Limite Central, sabemos: X 1 ~ N( µ1; �₁²�₁ ) e X ₂ ~ N( µ₂; �₂²�₂ ) Logo, X ₁ - X ₂ ~ (µ₁ - µ₂; �₁²�₁ - �₂² �₂ ) Assim, o Intervalo de confiança: P( ( X ₁ - X ₂) - Zα/2 �₁²�₁ + �₂²�₂ < (µ₁ - µ₂) < ( X ₁ - X ₂) + Zα/2 �₁²�₁ + �₂²�₂ ) = 1 – α Observação: Caso σ₁² e σ₂² não sejam conhecidos, e a amostra n < 30, devemos aproximar o valor da variância populacional pela variância amostral s₁² e s₂² e substituir a variável Normal Padronizada, Z, pela variável t de Student. Exemplo: Duas populações normais independentes, com distribuições x1 e x2, apresentam σ(x1) = 5 e σ(x2) = 2. Uma amostra aleatória de 12 elementos da primeira população apresentou x1 = 34. Uma amostra aleatória de 8 elementos da segunda população apresentou x2 = 9,4. Calcule o intervalo de confiança de 98% para a diferença µ₁ - µ₂. Solução P( ( X ₁ - X ₂) - Zα/2 �₁²�₁ + �₂²�₂ < (µ₁ - µ₂) < ( X ₁ - X ₂) + Zα/2 �₁²�₁ + �₂²�₂ ) = 1 – α P [ (34 – 9,4) – Zα/2 �²�� + �²= < (µ₁ - µ₂) < (34 – 9,4) + Zα/2 �²�� + �²= ] = 0,98 �1 − � = 0,98� = 0,02�/2 = 0,01 " ; logo, temos Zα/2 = 2,325 P [ 24,6 – 2,325(1,607) < (µ₁ - µ₂) < 24,6 + 2,325(1,607) ] = 0,98 Assim, o intervalo de confiança para a diferença µ₁ - µ₂ será: P [ 20,864 < (µ₁ - µ₂) < 28,336 ] = 0,98 Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia,Administração, Ciências Contábeis. p.140, 141 17 5.8 Intervalo de Confiança para a diferença entre duas Proporções A distribuição amostral da proporção em duas populações pode ser amostrada, considerando-se amostras de tamanho n1 da primeira população e amostras de tamanho n2 da segunda população. Obtém-se: µ (f₁) = p₁ µ (f₂) = p₂ σ²(f₁) = %₁?₁�₁ σ²(f₂) = %₂?₂ �₂ q₁ = (1- f₁) q₂ = (1- f₂) Se x = f₁ - f₂ , então temos: µ (x) = µ (f₁) - µ (f₂) = p₁ - p₂ e σ²(x) = σ²(f₁) + σ²(f₂) = %₁?₁�₁ + %₂?₂ �₂ , portanto σ(x) = f₁q₁n₁ + f₂q₂n₂ Aplicando-se a mudança de variável de x para Z: Z = C� D � = (E₁ � E₂) � (F₁ � F₂) G₁H₁�₁ 1 G₂H₂�₂ Logo, o Intervalo de Confiança: P [ (f₁ - f₂) - Zα/2 E₁I₁J₁ + E₂I₂J₂ < p₁ - p₂ < (f₁ - f₂) + Zα/2 E₁I₁J₁ + E₂I₂J₂ ] = 1 – α Exemplo: Duas máquinas produzem o mesmo tipo de peça, que são misturadas para embalagem posterior. Uma amostra de 40 peças da primeira máquina apresentou 1 peça defeituosa, enquanto uma amostra de 36 peças da segunda máquina apresentou 2 peças defeituosas. Calcule, ao nível de 98%, um intervalo de confiança para a diferença das proporções de peças defeituosas na produção dessas máquinas. Solução f₁ = ��� = 0,025 f₂ = � �� = 0,055 q₁ = (1 – f₁) = 0,975 q₂ = (1- f₂) = 0,945 n₁ = 40 n₂ = 36 18 �1 − � = 0,98� = 0,02�/2 = 0,01 " ; logo, temos Zα/2 = 2,325 Portanto, o intervalo de confiança será: P [ (f₁ - f₂) - Zα/2 E₁I₁J₁ + E₂I₂J₂ < (p₁ - p₂) < (f₁ - f₂) + Zα/2 E₁I₁J₁ + E₂I₂J₂ ] = 1 – α P [ - 0,03 – 2,325 (0,0453) < (p₁ - p₂) < - 0,03 + 2, 325 (0,0453) ] = 0,98 P [ - 0,135 < (p₁ - p₂) < 0,0753 ] = 0,98 Conclusão: A diferença das proporções de peças defeituosas na produção dessas máquinas varia de -13,5% à 7,53%. Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração, Ciências Contábeis. p.145 Exercícios 5.1) Deseja-se estimar a média do valor de vendas, por estabelecimento varejista, durante o último ano, de um determinado produto. O número de estabelecimentos varejistas é bastante grande. Determinar o intervalo de confiança de 95% dado que os valores de venda,são considerados normalmente distribuídos, sendo X = $ 3425, σ = $ 200, e n = 25. Resposta: $3346,60 à $3503,40 5.2) O diâmetro médio de uma amostra de n = 12 bastões cilíndricos incluídos em um carregamento é de 2,350 mm com desvio padrão de 0,050mm. A distribuição dos diâmetros de todos os bastões incluídos no carregamento é aproximadamente normal. Determinar o intervalo de confiança de 99% para estimar o diâmetro médio de todos os bastões incluídos no carregamento. Resposta: 2,307 à 2,393 mm Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. p. 140 5.3) Procurando dimensionar a ajuda de custo para seus 50 vendedores, uma empresa acompanhou os gastos de 15 vendedores e verificou despesa média de 20 u.m. Se a empresa acredita que o desvio padrão para o gasto é 2 u.m., determine um intervalo de confiança de 98% para o gasto médio dos vendedores desta empresa. 19 Resposta: 18,98 à 21,02 u.m. Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração, Ciências Contábeis. p. 114 5.4) Uma amostra de 5 elementos selecionados de uma população normal de 200 elementos apresentou os valores: 120, 98, 106, 145, 92. Calcule o intervalo de confiança de 95% para a média da população. Resposta: 85,94 à 138,46 Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração, Ciências Contábeis. p. 121 5.5) Uma empresa de pesquisa de mercado faz contato com uma amostra de 100 homens em uma grande comunidade e verifica que uma proporção de 0,40 na amostra prefere lâminas de barbear da marca YY em vez de qualquer outra marca. Determine o intervalo de confiança de 95% para proporção de todos os homens na comunidade que preferem a lâmina de barbear YY. Resposta: 0,30 à 0,50; ou 30% à 50% 5.6) Para uma amostra de 30 empregados de uma grande empresa, o salário médio horário foi X ₁ = $ 7,50 com s₁ = $ 1,00. Em uma segunda grande empresa, o salário médio horário para uma amostra de 40 empregados foi X ₂ = $ 7,05 com s₂ = $ 1,20. Estimar a diferença dos salários médios horários das duas empresas, usando um intervalo de confiança de 90%. Resposta: $ 0,02 à $ 0,88 por hora Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. p. 152 5.7) Um pequeno fabricante comprou um lote de 200 pequenas peças eletrônicas de um saldo de estoques de uma grande firma. Para uma amostra aleatória de 50 destas peças, constatou-se que 5 eram defeituosas. Estimar a proporção de todas as peças que são defeituosas no carregamento, utilizando um intervalo de confiança de 95%. Resposta: 0,03 à 0,17; ou 3% à 17% Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. p. 152 20 5.8) Um guarda de trânsito vistoriou 200 carros em um bairro de certa cidade e constatou que 25 motoristas não estavam usando o cinto de segurança no momento da vistoria. Determine um intervalo de confiança de 95% para a proporção de motoristas que usam regularmente o cinto de segurança neste bairro. Resposta: 0,8292 à 0,9208; ou 82,92% à 9,08% Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração, Ciências Contábeis. p. 132 5.9) O departamento de controle de qualidade amostrou aleatoriamente 60 lâmpadas produzidas antes e depois de um ajuste nas máquinas de sua linha de produção, obtendo antes do ajuste 4 defeituosas e depois 3 defeituosas. Ao nível de confiança de 95%, pode-se afirmar que a diferença das proporções de lâmpadas defeituosas produzidas após o ajuste antes do ajuste apresentam diferença significativa? Resposta: Não. (- 0,100 < p₁ - p₂ < 0,067) Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração, Ciências Contábeis. p. 146 5.10) Para um produto particular, a média de vendas por estabelecimento no último ano, em uma amostra de n = 10 estabelecimentos foi X = $ 3425 com s = $ 200. Supõe-se que as vendas por estabelecimento sejam normalmente distribuídas. Estimar (a) variância e (b) o desvio padrão das vendas deste produto em todos os estabelecimentos, no ultimo ano, utilizando um intervalo de confiança de 90%. Resposta: (a) 21278 < σ² < 108271 ; (b) 145,9 < σ < 329,0 Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. p. 153, 154 5.11) Deseja-se conhecer a permanência média de pacientes em um hospital, a fim de estudar uma possível obra de ampliação do mesmo. Dispõe-se de dados referentes à permanência expressos em dias de 600 pacientes, obtendo-se os seguintes resultados X = 12,3 dias, s = 8 dias. Pede-se: (a) Encontre o intervalo de confiança de 95% para a permanência média. (b) Qual a probabilidade de risco de µ > 13? Resposta: (a) 11,6599 à 12,9401 dias; (b) 0,01618; ou 1,62% 5.12) Em um parque existe uma população muito grande de esquilos. De uma amostra aleatória de 40 destes esquilos achou-se que 4 estão infectados com o bacilo da peste. 21 Pede-se: (a) Determine um intervalo de confiança de 95% para a verdadeira proporção de esquilos infectados na população. (b) de que tamanho deveria ser tomada a amostra para estimar a dita proporção com um erro não maior que 5% com um nívelde confiança de 99%? Resposta: (a) 0,007 à 0,192; ou 0,7% à 19,2%; (b) 238 5.13) As caixas de cereal produzidos em uma fábrica devem ter um conteúdo de 16 o. Um inspetor tomou uma amostra que forneceu os seguintes pesos em o: 15,7; 15,7; 16,3; 15,8; 16,1; 15,9; 16,2; 15,9; 15,8; 15,66 Diga se é razoável que o inspetor, utilizando um coeficiente de confiança de 95% ordene que o fabricante seja multado. Resposta: 15,746 a 16,065 o. O inspetor não deve multar o fabricante já que o valor esperado está dentro do intervalo de confiança das amostras analisadas. 5.14) Uma amostra de 800 eleitores indicou uma preferência de 25% para um determinado candidato. Pede-se: (a) Determine um intervalo de 98% de confiança para a proporção de todos os eleitores que têm preferência por esse candidato. (b) determine o tamanho necessário da amostra para se obter um intervalo de confiança de 98% para a proporção na população com uma amplitude de ± 2%. Resposta: (a) 0,214 à 0,286; ou 21,4% à 28,6% (b) 2537 5.15) Uma fundição produz blocos para motor de caminhões. Os blocos têm furos para as camisas e deseja-se verificar qual é o diâmetro médio no processo do furo. A empresa retirou uma amostra de 36 blocos e mediu os diâmetros de 36 furos (1 a cada bloco). A amostra acusou média de 98,0 mm e desvio padrão de 4,0 mm. Construa um intervalo de confiança de 99%. Se o processo deveria ter média de 100 mm, há evidência (com o mesmo nível de confiança) de que a média do processo não está no valor ideal? Explique. Resposta: 96,2828 a 99,7171 mm. A média está por baixo do valor ideal com uma confiança de 99%. 5.16) Duas máquinas são usadas para encher garrafas de plástico com detergente para lavagem de pratos. Os desvios-padrão do volume de enchimento são conhecidos como sendo 1 = 0,10σ onça fluida e 2 = 0,15σ onça fluida para as duas máquinas, respectivamente. Duas amostras aleatórias de n1 = 12 garrafas da máquina 1 e n2 = 10 garrafas da máquina 2 são selecionadas. Os volumes médios de enchimento nas amostras são 1 = 30,87X onças fluidas e 2 = 30,68X onças fluidas. Suponha 22 normalidade. Construa um intervalo bilateral de confiança de 90% para a diferença nas médias do volume de enchimento. Interprete esse intervalo. Resposta: 0,099 < (µ₁ - µ₂) < 0,281 5.17) Uma amostra aleatória de dez recém nascidos em uma maternidade deu os seguintes valores de peso, em quilogramas, no momento do nascimento: 2,8; 3,2; 4,1; 3,5; 3,4; 3,0; 3,2; 3,2; 2,7; 2,3 Suponha que o peso de recém nascidos é uma variável aleatória normal X. (a) Supondo que o desvio padrão de X seja conhecido e igual a 0,5 kg, determine um intervalo de confiança de 95% para o valo da média dos pesos de recém nascidos nessa maternidade. (a) Se o desvio padrão de X é um valor desconhecido, determine um intervalo de confiança de 95% para esse valor médio. (b) Repita os itens (a) e (b) para um intervalo de confiança de 99%. (c) Compare os intervalos obtidos nos itens anteriores e verifique se o intervalo aumenta ou diminui (i) quando o desvio padrão é desconhecido e (ii) quando o nível de confiança aumenta. Resposta: (a) 2,8201 à 3,4399 kg ; (b) 2,7723 à 3,4877 Kg ; (c) 2,72 à 3,53 Kg ; 2,62 à 3,63 Kg; (d) O IC aumenta quando o desvio padrão é desconhecido e também quando o nível de confiança aumenta. 5.18) Os seguintes números são as notas de 15 estudantes do curso de Estatística II: 6,5; 4,0; 5,0; 6,0; 7,5; 3,5; 8,0; 4,5; 7,0; 5,5; 4,0; 5,5; 8,5; 6,5; 5,5 Supondo que a população de notas está normalmente distribuída, construa um intervalo de confiança de 95% para a variância σ² e desvio padrão σ. Resposta: 1,2187 < σ² < 5,6542; 1,1040 < σ < 2,3779 23 Capítulo 6 - TESTE DE HIPÓTESE Quando quisermos avaliar um parâmetro populacional, sobre o qual não possuímos nenhuma informação com respeito a seu valor, não resta outra alternativa a não ser estimá-lo através do intervalo de confiança. No entanto, se tivermos alguma informação com respeito ao valor do parâmetro que desejamos avaliar, podemos testar esta informação no sentido de aceita-la como verdadeira ou rejeitá-la. - Ho Hipótese nula: informação à respeito do valor do parâmetro que queremos avaliar - Ha Hipótese alternativa: afirmação à respeito do valor do parâmetro que aceitamos como verdadeiro caso Ho seja rejeitada. Portanto, o Teste de Hipótese é uma regra de decisão que permite aceitar ou rejeitar como verdadeira uma hipótese nula Ho, com base na evidência amostral Isto significa que utilizaremos uma amostra desta população para verificar se a amostra confirma ou não o valor do parâmetro informado pela hipótese Ho. Na realização de um teste de hipótese, dois erros podem ser cometidos: ERRO TIPO I: é aquele que se comete ao rejeitar uma hipótese que é correta. A probabilidade desse erro é simbolizada por α e é definido pelo nível de significância exigido no teste. ERRO TIPO II: é o erro que se comete ao aceitar uma hipótese que é incorreta. A probabilidade desse erro é simbolizada por β. A medida que diminui α o β é aumentado e vice-versa, por isso é difícil controlar os dois erros simultaneamente. Na prática, é comum usar apenas α e teremos os testes de significância. Construção de um Teste de Hipótese a) Formular as hipóteses Ho e Ha b) Escolher a variável teste c) Arbitrar o nível de significância α d) Determinar as regiões de aceitação e rejeição de Ho e) Conclusão: aceitar ou rejeitar Ho 24 6.1 - Teste da Média Populacional para σ² conhecida No caso de um teste da média de uma população, com a variância conhecida, as hipóteses são: Ho: µ = µo Ha: µ ≠ µo (Teste bilateral) µ < µo (Teste unilateral esquerdo) µ > µo (Teste unilateral direito) A variável teste é a normal padronizada: Zx = X � µ� √� com reposição Zx= X � µ � √� K*�K*) sem reposição Exemplo: Uma amostra aleatória de 40 elementos retirados de uma população normal com desvio padrão σ = 3 apresentou um valor médio igual à X = 60. Teste, ao nível de significância de 5%, a hipótese de que a média populacional seja igual a 59. Solução Hipóteses Ho: µ = 59 Ha: µ > 59 Utilizamos a variável Normal Padronizada Z, já que o desvio padrão é conhecido. Assim, calculando Zc, temos: Zc = X � µ� √� = ����2L √MN = 2,108 Ao nível de 5% de significância, ou seja, sendo α = 0,05 , obtemos na tabela da Distribuição Normal – Padrão (Apêndice), o valor de Zα = 1,64. 25 Definimos assim uma região de aceitação (RA) e uma região crítica (RC) para a hipótese nula, Ho: Figura 6.1 - Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração, Ciências Contábeis. p. 159 Conclusão: o valor de Zc = 2,108 > Zα = 1,64 , está na região crítica para a hipótese nula, Ho. Portanto, ao nível de significância de 5%, rejeita-se Ho, ou seja, a média populacional é superior a 59. Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração, Ciências Contábeis. p. 159, 160 6.2 - Teste da Média Populacional para σ² desconhecida A distribuição t de Student é apropriada para o uso como estatística de teste de hipótese quando a amostra é pequena (n < 30), a população está normalmente distribuída e σ é desconhecido. As hipóteses são: Ho: µ = µo Ha: µ ≠ µo (Teste bilateral) µ < µo (Teste unilateral esquerdo) µ > µo (Teste unilateral direito) A variável teste padronizada:tx = X � µO √� com reposição tx = X � µ O √� K*�K*) sem reposição com ν = n – 1 graus de liberdade. 26 Exemplo: Uma amostra de 12 elementos retirados ao acaso de uma população normal apresentou X = 100 e Sx = 5. Teste ao nível de significância de 5%, a hipótese de que a média populacional seja 102. Solução Hipóteses Ho: µ = 102 Ha: µ < 102 Utilizamos a variável t já que a amostra é pequena (n = 12), a população é normalmente distribuída e o desvio padrão é desconhecido. Assim, calculando tc, temos: tc = X � µO √� = �������P√)Q = - 1,39 Ao nível de 5% de significância, ou seja, sendo α = 0,05 , obtemos da tabela de Distribuição t de Student (Apêndice), o valor de tα = - 1,79. Definimos, portanto, as regiões de aceitação (RA) e região crítica (RC) para a hipótese nula Ho: Figura 6.2 - Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração, Ciências Contábeis. p. 160 Conclusão: o valor de tc = - 1,39 > tα = - 1,79, está na região de aceitação para a hipótese Ho. Portanto, ao nível de significância de 5%, aceita-se Ho, ou seja, aceita-se a hipótese de que a média populacional seja 102 . Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração, Ciências Contábeis. p. 160 27 6.3 - Teste da Proporção Populacional As hipóteses são: Ho: p = p0 Ha: p ≠ p0 (Teste bilateral) p < po (Teste unilateral esquerdo) p > po (Teste unilateral direito) onde p0 é o valor de p sob a hipótese Ho. Sob a hipótese nula a proporção amostral f, no caso de grandes amostras (n ≥ 30) tem distribuição aproximadamente normal com média µ e desvio padrão sf = %(��%)� A estatística teste é a variável normal padronizada associada a f: Zx = %�& '()*')� com reposição Exemplo: Uma máquina está regulada quando produz 3% de peças defeituosas. Uma amostra aleatória de 80 peças selecionadas ao acaso apresentou 3 peças defeituosas. Teste ao nível de 2% a hipótese de que a máquina está regulada. Solução A hipótese a ser testada é que a máquina está regulada, ou seja p = 0,03. A probabilidade obtida a partir das amostras é: f = � =� = 0,0375 Hipóteses Ho: p = 0,03 Ha: p > 0,03 Calculamos o valor da variável teste Zc: Zc = %�& '()*')� = �,������,�� N,NL(N,RS)TN = 0,393 Ao nível de significância de 2%, obtemos da tabela da Distribuição Normal – Padrão o valor de Zα = 2,055. 28 Definimos, assim, uma região de aceitação (RA) e uma região crítica (RC) para a hipótese nula, Ho: Figura 6.3 - Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração, Ciências Contábeis. p. 164 Conclusão: O valor Zc = 0,393 situa-se à esquerda do valor de Zα = 2,055 obtido na tabela. Portanto está na região de aceitação da hipótese nula. Assim, aceita-se Ho, ou seja, p = 0,03, ao nível de significância de 2% a máquina está regulada. Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração, Ciências Contábeis. p. 163, 164 6.4 - Teste de Igualdade de Variâncias Em muitas aplicações deseja-se verificar se duas populações têm variâncias iguais (populações homocedásticas) ou variâncias diferentes (populações heterocedásticas). Suponha que uma variável normalmente distribuída, tenha variância σ1² numa população 1 e σ2² em outra população 2. �ota: Por uma questão de referência, considera-se índice 1 para a maior variância e índice 2 para a menor. Em algumas aplicações deseja-se saber se σ1² > σ2². As hipóteses são Ho: σ1² = σ2² (Homocedasticidade) Ha: σ1² > σ2² (Heterocedasticidade) A distribuição F é a distribuição de probabilidade apropriada para a razão das variâncias de duas amostras tomadas independentemente de populações normalmente distribuídas. Portanto, teste se baseia na razão de variâncias amostrais: Fc = U₁²U₂² com (n₁ - 1) graus de liberdade no numerador e (n₂ - 1) graus de liberdade no denominador, para uma amostra de tamanho n₁ da população 1 e n₂ da população 2 e sendo S1 2 e S2 2 as estimativas de σ1² e σ2² respectivamente. 29 A hipótese Ho será rejeitada num nível de significância α se Fc > Fα,(n1 - 1),(n2 - 2) e aceita caso contrário. *sendo Fc o valor calculado através das variâncias amostrais e Fα,(n1 - 1),(n2 - 2) o valor obtido da tabela da Distribuição F (Apêndice). Exemplo: É projetado um novo processo de moldagem para reduzir a variabilidade dos diâmetro de fundição. Para uma amostra de n1 = 10 fundições com o processo antigo, teve-se s1 = 5,8 mm. Para uma amostra de n2 = 8 fundições com o novo processo, teve- se s2 = 4,2 mm. Considerando-se α = 5%, pode-se afirmar que a variação do processo antigo é maior que no novo processo? Solução Processo antigo: n1 = 10; s1 = 5,8 mm; s1 2 = 33,64 Novo processo: n2 = 8; s2 = 4,2 mm; s2 2 = 17,64 Hipóteses Ho: σ1² = σ2² Ha: σ1² > σ2² Variável Teste: Fc = ₁² ₂² = ��,����,�� = 1,91 Regra de decisão α = 5% gl 1: ν1 = n1 – 1 = 10 – 1 = 9; gl2: ν2 = n2 – 1 = 8 – 1 = 7 logo, Ftabelado = 3,68 Conclusão: Fc = 1,91 < Ftabelado= 3,68, portanto aceita-se Ho. Ou seja, a um nível de significância de 5%, não existe diferença na variabilidade dos dois processos. 6.5 - Teste da Variância (usando a Distribuição Quiquadrado) Para uma população normalmente distribuída, a razão ² (���) �² segue uma distribuição de probabilidade χ², existindo uma Distribuição Quiquadrado diferente de acordo com (n – 1) graus de liberdade. 30 Portanto, a estatística usada para testar um valor hipotético da variância da população χ² = ² (���) �² Exemplo: A média da vida útil para uma amostra de n = 10 lâmpadas é x = 4000 horas, com um desvio padrão de s = 200 horas. Supõe-se que a vida útil das lâmpadas, em geral, seja normalmente distribuída. Suponha que, antes de ser coletada a amostra, foi feita a hipótese de que o desvio padrão não era maior do que σ = 150. Com base nos resultados amostrais, teste tal hipótese ao nível de significância de 1%. Solução Hipóteses Ho: σ² ≤ 22500 (σ² = 150²) Ha: σ² > 22500 Variável teste χ² = ² (���) �² = ���² (����) ���² = 16 Da tabela da Distribuição Quiquadrado, obtemos o valor de χ²(α = 1% ; gl = 10- 1 = 9) = 21,67. Conclusão: Como χ²calculado =16 < χ²tabelado = 21,67, aceita-se Ho, ao nível de significância de 1%. Ou seja, o desvio padrão não é maior que σ = 150. 6.6 - Teste da Diferença entre duas Médias (usando Distribuição �ormal - Padronizada) O melhor estimador para µ1 e µ2 é X 1 e X 2, respectivamente. A distribuição amostral de X 1 e X 2 é normal e Zc = V X �� X �W� ( µ� � µ�) �₁²�₁ 1�₂²�₂ As hipóteses são Ho: µ1 = µ2 Ha: µ1 ≠ µ2 31 Figura 6.4 Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração, Ciências Contábeis. p. 139 O teste da diferença entre duas médias é, portanto, um teste bilateral e assim temos uma região de aceitação (- Zα/2 < Zc < Zα/2) e duas regiões críticas ( Zc < - Zα/2 e Zc > Zα/2). Tomamos a decisão comparando-se esses valores de Zc e Zα/2. Exemplo: A média de salários semanais de umaamostra de n1 = 30 empregados em uma grande indústria é X 1 = 180,00 , com desvio padrão amostral de s1 = 14,00. Para uma outra grande empresa, uma amostra de n2 = 40 empregados apresentou média X 2 = 170,00 , com desvio padrão de s2 = 10,00. Teste a hipótese de que não existe diferença entre os valores dos salários semanais médios nas duas firmas, usando nível de significância de 5%. Solução Hipóteses Ho: µ1 = µ2 Ha: µ1 ≠ µ2 Sendo, X 1 = 180,00 X 2 = 170,00 s1 = 14,00 s2 = 10,00 n1 = 30 n2 = 40 Nota: como n1 e n2 são suficientemente grandes, o desvio padrão amostral se aproxima do desvio padrão populacional. Zc = V X �� X �W �₁²�₁ 1�₂²�₂ = �=����� )M²LN 1 )N²MN = 3,327 α = 5%, logo temos da tabela Normal – Padrão (Apêndice): Zα/2 = 1,96 Conclusão: Como Zc = 3,327 > Zα/2, rejeita-se Ho num nível de significância de 5%. Ou seja, as duas firmas apresentam diferença entre os valores médios dos salários semanais. Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. P. 176 32 6.7 - Teste da Diferença entre duas Médias (usando Distribuição t de Student) No caso anterior, se σ² não for conhecido ou os tamanhos das amostras (n1 e n2) for menor que 30, use aproximação de σ²(x) por s²(x), utilizando a distribuição t de Student. tc = X X ₁� X ₂Y�(µ₁ � µ₂) O₁²�₁1O₂²�₂ Assim como no caso anterior, sendo este um teste bilateral, temos uma região de aceitação (- tα/2 < tc < tα/2) e duas regiões críticas ( tc < - tα/2 e tc > tα/2). Tomamos a decisão comparando-se esses valores de tc e tα/2. Exemplo: Para uma amostra aleatória de n1 = 10 lâmpadas, a vida útil média foi X 1 = 4000 horas, com s1 = 200. Para outra marca de lâmpadas, cuja vida útil também supõe-se ser normalmente distribuída, uma amostra n2 = 8, apresentou média X 2 = 4300 horas, e desvio padrão amostral s2 = 250. Teste a hipótese de que não existe diferença entre a média de vida útil das duas marcas de lâmpadas, usando nível de significância de 1%. Solução Hipóteses Ho: µ1 = µ2 Ha: µ1 ≠ µ2 Sendo, X 1 = 4000 X 2 = 4300 s1 = 200 s2 = 250 n1 = 10 n2 = 8 tc = V X �� X �W O₁²�₁1O₂²�₂ = ��������� QNN²)N 1QPN²T = - 2,76 A tabela da Distribuição t (Apêndice) nos fornece t (α/2 = 0,005 ; gl = 16) = 2,921 Obs: graus de liberdade gl = n1 + n2 – 2 = 10 + 8 -2 =16 Conclusão: Como tc encontra-se na região de aceitação (- tα/2 < tc = - 2,76 < tα/2). Conclui-se que, aceita-se Ho, ao nível de significância de 1%. Ou seja, a média da vida útil das duas marcas de lâmpadas são iguais. Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. P. 177 33 Exercícios 6.1) O fabricante de um novo automóvel compacto afirma que o consumo médio de gasolina é de 35 milhas por galão, em estrada. Em 40 provas, o carro fez uma média de 34,5 milhas por galão com um desvio padrão de 2,3 milhas por galão. Pode-se afirmar que o fabricante está mentindo, ao nível de significância de 5%? Resposta: Não se pode afirmar que o fabricante está mentindo. Aceita-se Ho Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. P. 173 6.2) O valor médio de vendas por estabelecimento varejista, durante o último ano, de um particular produto, foi de X = $ 3425 para uma amostra de n = 25 estabelecimentos. Com base em dados de vendas de outros produtos similares, supõe-se que a distribuição das vendas seja normal e que o valor do desvio padrão da população seja σ = $ 200. Foi afirmado que o verdadeiro valor de vendas por estabelecimento é no mínimo de $ 3500. Testar esta afirmação ao nível de significância de (a) 5% e (b) 1%. Resposta: (a) Rejeita Ho; (b) Aceita Ho Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. P. 172 6.3) Uma população normal apresenta historicamente o valor médio de 60 unidades. Um analista, duvidando que este valor persista na atualidade, levantou uma amostra aleatória de 20 elementos, obtendo valor médio de 55 unidades com desvio padrão de 2 unidades. Teste ao nível de significância de 5% a hipótese de que a média histórica é verdadeira. Resposta: Rejeita-se Ho Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração, Ciências Contábeis. p.161 6.4) Um projeto de investimento está sendo avaliado pelo método pay-back. Uma simulação envolvendo vários cenários futuros forneceu os seguintes tempos de retorno do investimento (em anos): 2,8; 4,3; 3,7; 6,4; 3,2; 4,1; 4,4; 4,6; 5,2; 3,9. Teste ao nível de 10% a hipótese de que o tempo médio de retorno seja de 4 anos. Resposta: Aceita-se Ho Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração, Ciências Contábeis. p.162 34 6.5) A proporção de mulheres que ocupam cargo administrativo nas empresas é tradicionalmente de 15%. Um levantamento efetuado entre 200 administradores revelou que 40 eram mulheres. Teste ao nível de significância de 5% a hipótese de que a proporção de mulheres que ocupam cargo administrativo não tenha aumentado. Resposta: Rejeita-se Ho, a proporção de mulheres aumentou. Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração, Ciências Contábeis. p.165 6.6) Uma agência de viagens tem um tradicional plano de férias que é oferecido a todos os possíveis clientes que procuram a agência. O índice de respostas positivas é historicamente 20%. Este ano, uma amostra aleatória de 50 potenciais clientes mostrou que 15 adquiriram o plano de férias. Teste ao nível de 6% a hipótese de que o percentual de respostas positivas não tenha aumentado este ano. Resposta: Rejeita-se Ho, o número de respostas favoráveis aumentou. Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração, Ciências Contábeis. p.166 6.7) Deseja-se testar a diferença entre duas médias da renda de duas comunidades. Para uma amostra de n₁ = 30 famílias na primeira comunidade, a renda média anual é $15500 com desvio padrão amostral de s₁ = 1800. Para uma amostra de n₂ = 40 famílias na segunda comunidade, a renda média anual é $14600 e s₂ = 2400. Teste a hipótese ao nível de significância de 1%. Resposta: Aceita-se Ho, as duas comunidades apresentam montante médio de renda iguais. 6.8) Com objetivo de testar a eficiência de dois métodos de aprendizagem, eles foram aplicados durante um ano em duas escolas da mesma organização. Ao final do curso, selecionou-se uma amostra aleatória de 10 alunos de cada escola e a mesma tarefa foi proposta a estes alunos. No primeiro grupo, o tempo médio para concluir a tarefa foi 2h46min, enquanto no segundo grupo a média foi de 2h31min, com desvio padrão de 23min e 16min respectivamente. Supondo que a distribuição do tempo de realização das tarefas são normais, é possível afirmar que o segundo método é mais eficiente que o primeiro ao nível de significância de 5%? Resposta: Aceita-se Ho. Os métodos têm a mesma eficiência. Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração, Ciências Contábeis. p.172 35 6.9) Um órgão de defesa do consumidor testa regulamente o peso de botijões de gás para uso doméstico. Eles devem apresentar um peso médio líquido de 13kg, com desvio padrão não superior a 250g. Uma amostra aleatória realizada no depósito de uma companhia engarrafadora de gás revelou entre 26 botijões um desvio padrãode 305g. Testar a hipótese de os botijões estarem dentro das especificações, contra a alternativa de os botijões estarem fora de especificação, ao nível de 5%. Resposta: Aceita-se Ho. Ao nível de significância de 5%, o produto está dentro da especificação. Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração, Ciências Contábeis. p.182, 183 6.10) Uma amostra aleatória de 20 elementos selecionados de uma população normal apresentou s²(x) = 1,3. Teste ao nível de significância de 5% a hipótese σ²(x) = 4, contra a alternativa σ²(x) < 4. Resposta: Rejeita Ho, a variância da população é menor que 4. Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração, Ciências Contábeis. p.180 6.11) O peso dos camundongos em um laboratório é uma variável que se distribui normalmente com média 25,0 g e desvio padrão igual a 0,8 g. Uma alimentação balanceada é dada aos camundongos durante certo período. Supõe-se que a alimentação não muda a variância dos pesos. Uma amostra de 25 camundongos é selecionada e verifica-se que o peso médio dessa amostra é igual a 25,2 g. testar a hipótese de que houve aumento do peso médio ao nível de significância de 5%. Resposta: Aceita Ho, os pesos se mantiveram igual a um nível de significância de 5%. 6.12) O rótulo de uma garrafa indica que ela contém 1,5 litros de um refrigerante. Um órgão de fiscalização deseja testar esta afirmação e multar o fabricante se constatar que o valor médio da quantidade de refrigerante for inferior a 1,5 litros. Com esta finalidade, o órgão faz uma amostra aleatória de 30 garrafas e obtém uma média amostral de 1,482 litros e um desvio padrão amostral de 0,025 litros. Verificar se a afirmação do fabricante pode ser rejeitada ao nível de 10% e de 5%. Resposta: Rejeita-se a afirmação do fabricante a um nível de significância de 10% e de 5%. 6.13) O fabricante de uma droga medicinal reivindicou que ela era 90% eficaz em curar uma alergia, em um período de 8 horas. Se a droga é aplicada a 200 doentes curando a 170 deles, pode-se considerar correta a reivindicação do fabricante? 36 Resposta: Rejeita Ho, a afirmação do fabricante não é correta a um nível de significância de 5%. 6.14) Acredita-se que duas marcas de cigarros, a e b, são semelhantes quanto ao conteúdo de nicotina. Um laboratório fez 5 determinações do conteúdo de nicotina(em miligramas) para cada marca, com os seguintes resultados: Marca A: 31; 35; 28; 34; 33 Marca B: 27; 26; 30; 28;25 Com base nestas observações, pode-se manter a hipótese de que as duas marcas apresentam igual conteúdo de nicotina? Considere que a variância populacional é igual a variância amostral. Resposta: Rejeita Ho, as duas marcas não apresentam o mesmo conteúdo de nicotina a um nível de 5%. 6.15) Examinaram-se duas classes constituídas de 40 e de 50 alunos, respectivamente. Na primeira, o grau médio foi 74, com desvio padrão 8, enquanto, na segunda, a média foi 78, com desvio padrão 7. Há uma diferença significativa entre os aproveitamentos das duas classes, no nível de significância de (a) 5% e (b) 1%? Resposta: (a) Rejeita Ho, há diferença significativa entre os aproveitamentos das duas classes com um nível de significância de 5% e a segunda classe é, provavelmente, melhor. (b) Não há diferença significativa entre as classes num nível de significância de 1%. 6.16) Para testar o efeito de um novo medicamento no tratamento da diabete ele é ministrado a 9 pacientes cujos conteúdos de açúcar no sangue, em jejum, forma determinados antes e depois de algum tempo de iniciado o tratamento. Obteve-se os seguintes resultados, em mg/ 100ml: Paciente 1 2 3 4 5 6 7 8 9 Antes 120 110 118 128 126 124 132 139 125 Depois 116 112 114 120 130 123 124 130 118 Tabela 6.1 – Pacientes antes e depois do tratamento Pode-se concluir, com base nesta experiência, a um nível de significância de 5%, que o medicamento é eficaz na redução do açúcar no sangue? Resposta: Rejeita Ho, as médias de açúcar são diferentes antes e depois, a um nível de significância de 5%. Conclui-se que o medicamento é eficaz na redução do açúcar no sangue. 37 6.17) Uma máquina que empacota bolsas de café automaticamente está regulada para empacotar bolsas cujos pesos estão distribuídos normalmente com média µ e variância 400. A máquina foi regulada para µ = 500 gramas. Decide-se escolher uma amostra de 16 bolsas a cada 30 minutos com o objetivo de verificar se a produção está controlada ou não , isto é, se µ = 500 gramas ou não. Se uma dessas amostras tem média 492 gramas, deve-se deter a produção para verificar se a máquina está corretamente regulada? Resposta: Aceita Ho, a produção não seria interrompida. Conclui-se que a máquina esteja corretamente regulada. 6.18) Criou-se dois grupos de animais, com 50 animais em cada grupo, com duas dietas diferentes. Ao final de 5 meses o peso médio do grupo 1 foi 149,2 gramas, com um desvio padrão de 8 gramas; o segundo grupo apresentou um peso médio de 152,3 gramas, com desvio padrão de 10 gramas. Devemos aceitar a hipótese de que uma dieta é melhor que a outra? Resposta: A segunda dieta é melhor que a primeira, a um nível de significância de 5%. 38 Capítulo 7 - TESTE QUIQUADRADO O Teste Quiquadrado como um procedimento de Teste de Hipótese Os procedimentos correspondem a três testes que utilizam a Distribuição Quiquadrado e se relacionam todos com a comparação de freqüências, obtidas em amostras, de certas categorias, com freqüências esperadas baseadas, em cada caso, em hipóteses particulares. Deste modo, os procedimentos são Testes de Hipótese e, portanto, possuem relação com a análise dos resultados de uma amostra. - Teste de Aderência - Teste de Independência - Teste de Homogeneidade 7.1 - Teste de Aderência O teste de Aderência é um teste não paramétrico que é utilizado para verificar se uma variável apresenta determinada distribuição de probabilidade (Distribuição Normal, Binomial, Poison). As hipóteses são: Ho: os resultados ocorrem com as freqüências previstas pelo modelo probabilístico. Ha: os resultados ocorrem com freqüências diferentes das previstas pelo modelo. Sendo observada uma amostra de n valores da variável em estudo, a variável teste é o valor quiquadrado para testar a diferença entre padrões obtidos e esperados de freqüência: χ²c = Z (%[ � %0)² %0 onde fo e fe são as freqüências observadas e esperadas, respectivamente. Obtemos χ²crítico da tabela da Distribuição do Quiquadrado (Apêndice) observando o nível de significância α e os graus de liberdade, ν = k - m - 1, sendo k = número de categorias dos dados e m = número dos valores de parâmetros estimados com base na amostra. Regra de decisão: A hipótese Ho é rejeitada num nível de significância α se χ²calculado > χ²crítico e aceita caso contrário. Exemplo: Um distribuidor regional de sistemas de ar condicionado dividiu sua região em quatro territórios. A um presumível comprador da agência de distribuição informou- 39 se que as instalações do sistema estariam mais ou menos igualmente distribuídas entre os quatro territórios. O presumível comprador toma uma amostra aleatória de 40 instalações realizadas no ano anterior, com base nos arquivos da companhia, e verifica que a quantidade instalada em cada uma das quatro áreas é a apresentada na primeira linha da tabela (fo), enquanto a hipótese de que as instalações estão distribuídas de igual maneira, é dada na segunda linha, a distribuição uniforme esperada (fe).Território Total A B C D Freqüência observada fo 6 12 14 8 40 Freqüência esperada fe 10 10 10 10 40 Tabela 7.1 – Instalações do sistema nos diferentes territórios Pode-se afirmar que as freqüências estão igualmente distribuídas entre os quatro territórios a um nível de significância de 5%? Solução Hipóteses Ho: a quantidade de instalações está igualmente distribuída entre os quatro territórios; Ha: a quantidade de instalações não está igualmente distribuída entre os quatro territórios. Calcula-se o valor do quiquadrado: χc² = Z (%[ � %0)² %0 = (� ���)² �� + (�� ���)² �� + (�� ���)² �� + (= ���)² �� = �� �� = 4,0 Sendo o nível de significância proposto, α = 5%, e calculando-se os graus de liberdade, obtemos da tabela da Distribuição do Quiquadrado (apêndice) o valor de χ²crítico. gl: ν = k – m – 1 = 4 – 0 – 1 = 3 �ota: a hipótese nula é de que as frequências são igualmente distribuídas, nenhuma estimação de parâmetro é envolvida, e m = 0. χ2crítico (ν = 3; α = 0,05) = 7,81 Conclusão: Como χ²calculado = 4,0 < 7,81, aceita-se Ho num nível de significância de 5%. Ou seja, pode-se afirmar que as freqüências estão igualmente distribuídas entre os quatro territórios. Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. P. 195, 196, 197 40 7.2 - Teste de Independência Os Testes de Independência envolvem duas variáveis, e o que se testa é a hipótese de que as duas variáveis são estatisticamente independentes. A independência implica que o conhecimento da categoria na qual se classifica uma observação com respeito a uma variável não afeta a probabilidade de estar em uma das diversas categorias das outras variáveis. As hipóteses são: Ho: as duas variáveis são independentes Ha: as duas variáveis não são dependentes Como intervêm duas variáveis, as freqüências observadas são colocadas em uma Tabela de Contingência. As dimensões de tal tabela são definidas pela expressão r x k, onde r indica o número de linhas e k indica o número de colunas. A variável teste será: χc² = Z (%[ � %0)² %0 sendo fo e fe são as freqüências observadas e esperadas, respectivamente. onde a freqüência esperada é equivalente à fe = Σ \ Σ ] � �ota: recomenda-se fazer uma tabela de contingência para frequências esperadas Com ν = (r – 1)(k – 1) graus de liberdade e o nível de significância α proposto, encontramos o valor de χcrítico² na tabela da Distribuição do Quiquadrado (Apêndice). Regra de decisão: Rejeita-se Ho, ao nível de significância α se χcalculado² > χcrítico² e aceita-se caso contrário para (r – 1)(k – 1) graus de liberdade. Exemplo: A tabela seguinte apresenta a reação dos estudantes à expansão do programa de atletismo do colégio, segundo o nível do curso, em que a “divisão inferior” indica estudante de primeiro ou segundo ano e “divisão superior” indica estudante de terceiro ou de ultimo ano. Reação Nível do Curso Total Divisão inferior Divisão superior A favor 20 19 39 Contra 10 16 26 Total 30 35 65 Tabela 7.2 – Frequência observada da reação dos estudantes à expansão do programa de atletismo Testar a hipótese de que o nível do curso e a reação à expansão do programa de atletismo são variáveis independentes, utilizando nível de significância de 5%. 41 Solução Ho: o nível do curso e a reação à expansão do programa de atletismo são independentes. Ha: o nível do curso e a reação à expansão do programa de atletismo não são independentes. Calculando-se a freqüência esperada através de fe = Σ \ Σ ] � por exemplo: fe = (�2)(��) �� = 18, e assim consecutivamente, constrói-se a tabela da freqüência esperada: Reação Nível do Curso Total Divisão inferior Divisão superior A favor 18 21 39 Contra 12 14 26 Total 30 35 65 Tabela 7.3 – Frequência esperada da reação dos estudantes à expansão do programa de atletismo Calcula-se então o valor do quiquadrado: χ²calculado = Z (%[ � %0)² %0 = (����=)² �= + (�2 ���)²�� + (�����)²�� + (�����)²�� = 1,03 Sendo o nível de significância α = 5%, e graus de liberdade: ν = (r – 1)(k – 1) = (2 – 1)(2 – 1) = 1; obtemos da tabela da Distribuição do Quiquadrado (Apêndice), o valor de χ²crítico χ²crítico = ( ν = 1; α = 0,05) = 3,84 Conclusão: Portanto, sendo χ²calculado = 1,03 < 3,84, à um nível de significância de 5%, aceita-se Ho. Ou seja, as duas variáveis, nível do curso e reação à expansão do programa de atletismo, são independentes. Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. p. 211, 212 7.3 - Teste de Homogeneidade O Teste de Homogeneidade corresponde ao teste das diferenças entre K proporções amostrais. O teste quiquadrado pode ser utilizado para testar a diferença entre K proporções amostrais, utilizando para a análise das freqüências uma estrutura tabular de 2 x K. A hipótese nula é a de que não existe diferença entre as diversas proporções populacionais (ou, que as diferentes proporções amostrais poderiam ter sido extraídas, ao acaso, da mesma população). 42 Observe as hipóteses: Ho: π1 = π2 = π3 = ... = πk (sendo π a probabilidade de cada proporção amostral) Ha: nem todas as probabilidades são iguais As informações são contidas na Tabela de Contingência. As dimensões de tal tabela são definidas pela expressão r x k, onde r indica o número de linhas e k indica o numero de colunas. A variável teste será: χ² = Z (%[ � %0)² %0 onde a freqüência esperada é equivalente à fe = Σ \ Σ ] � , e n é o total geral, ou seja, o total do somatório de todas as linhas da tabela de contingência (que por sua vez, é igual ao somatório de todas as colunas). �ota: recomenda-se fazer uma tabela de contingência para frequências esperadas Com ν = (r – 1)(k – 1) graus de liberdade e o nível de significância α proposto, encontramos o valor de χcrítico² na tabela da Distribuição do Quiquadrado (Apêndice) Regra de decisão: Rejeita-se Ho, ao nível de significância α se χcalculado² > χcrítico² e aceita-se caso contrário para (r – 1)(k – 1) graus de liberdade. Exemplo: Foi realizada uma pesquisa de opinião dentre os votantes de 4 municípios para comparar as proporções de votantes a favor do candidato A para o governo do estado. Foi selecionada uma amostra aleatória de 300 pessoas em cada município, obtendo-se os resultados apresentados na tabela a seguir: Municípios Eleitores 1 2 3 4 Total a favor de A 126 103 109 98 436 outro candidato 174 197 191 202 764 Total 300 300 300 300 1200 Tabela 7.4 – Frequência observada da pesquisa de opinião dentre os votantes de cada município Considerando os dados da amostra pode-se dizer que há evidência de que a proporção de votantes a favor do candidato A nos 4 municípios, num nível de significância de 5%, é diferente? 43 Solução Hipóteses: Ho: π1 = π2 = π3 = π4 (sendo π a proporção de votantes no candidato A em cada município) Ha: nem todas as cidades tem a mesma proporção de votantes no cadidato A Calculando-se a freqüência esperada através de fe = Σ \ Σ ] � por exemplo: fe = (���)(���) ���� = 109, e assim consecutivamente, constrói-se a tabela da freqüência esperada: Municípios Eleitores 1 2 3 4 Total a favor de A 109 109 109 109 436 outro candidato 191 191 191 191 764 Total 300 300 300 300 1200 Tabela 7.5 – Frequência esperada da pesquisa de opinião dentre os votantes de cada município Calcula-se então o valor do quiquadrado: χ²calculado = Z (%[ � %0)² %0 = (������2)² ��2 + (��� ���2)²��2 + (��2���2)²��2 + (2= ���2)²��2+ (��� ��2�)² �2� + (�2� ��2�)² �2� + (�2� ��2�)² �2� + (��� ��2�)² �2� = 6,43 Sendo o nível de significância proposto α = 5% e os graus de liberdade: ν = (r – 1)(k – 1) = (2 – 1)(4 – 1) = 3 χ²crítico (α = 0,05; ν = 3) = 7,81 Conclusão: Portanto, sendo χ²calculado = 6,43 < 7,81, aceita-se Ho, num nível de significância de 5%. Ou seja, a proporção de votantes no candidato A é a mesma para os quatro municípios. Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. p. 213, 214 Exercícios 7.1) Em 200 lançamentos de uma moeda, foram observadas 115 caras e 85 coroas. Teste a hipótese de que a moeda é legal utilizando um nível de significância de (a) 5% e (b) 1%. Resposta: Rejeita-se a hipótese de que a moeda é legal a um nível de significância de 5%. Não se tem o mesmo resultado a um nível de significância de 1%. 44 7.2) A tabela abaixo apresenta as freqüências observadas, ao lançar-se um dado 120 vezes. Testar a hipótese de o dado ser honesto. Face 1 2 3 4 5 6 Freqüência observada 25 17 15 23 24 16 Tabela 7.5 – Frequência observada no lançamento de um dado Resposta: Aceita Ho, o dado é honesto a um nível de significância de 5%. 7.3) Historicamente, um fabricante de televisores vende 40% de aparelhos com telas pequenas, 40% com telas médias e 20% de aparelhos com telas grandes. Com o fim de estabelecer programas apropriados de produção para o próximo mês, toma uma amostra aleatória de 100 vendas durante o atual período e encontra que 55 dos televisores adquiridos eram pequenos, 35 do tamanho médio e 10 grandes. Teste a hipótese de que o padrão histórico de vendas prevalece, usando nível de significância de 1%. Resposta: χc² = 11,25. Rejeita-se Ho. Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. P. 197 7.4) Em geral, 20% dos clientes em potencial visitados pelo vendedor de uma firma fazem uma compra. Durante o período de testes, um novo vendedor faz 30 visitas à possíveis clientes e realiza três vendas. Teste a hipótese nula de que este padrão de vendas não difere do padrão histórico, usando nível de significância de 5% Resposta: χc² = 1,30. Aceita-se Ho. Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. P. 198 7.5) Foi realizado um estudo sobre os clientes de determinada loja e comparou-se a relação entre duas variáveis, idade e sexo. Dada a tabela abaixo, com a freqüência observada, teste a hipótese de independência entre as duas variáveis ao nível de significância de 1%. Idade Sexo Total Masculino Feminino Menos de 30 60 50 110 30 e mais 80 10 90 Total 140 60 200 Tabela 7.6 – Frequência observada de idade e sexo de clientes Resposta: χc² = 27,8. Rejeita-se a hipótese nula de independência a um nível de significância de 1%. Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. P. 199, 20 45 7.6) Um gerente de um departamento de pessoal estima que uma proporção de π = 0,40 dos empregados de uma grande empresa participará de um novo programa de investimento em ações. São feitos contatos com uma amostra aleatória de n = 50 empregados, sendo que 10 deles indicam sua intenção de participar. Teste , através do uso do quiquadrado o valor hipotético da proporção da população, ao nível de significância de 5% Resposta: Rejeita-se Ho 7.7) Nas experiências que Mendel realizou com ervilhas, ele observou 315 redondas e amarelas, 108 redondas e verdes, 101 enrugadas e amarelas e 32 enrugadas e verdes. De acordo com a sua teoria da hereditariedade, os números deveriam estar na proporção 9:3:3:1. Há evidência para se duvidar de sua teoria, ao nível de significância de (a) 1% e (b) 5%? Resposta: (a) Aceita Ho; (b) Aceita Ho 7.8) Em um determinado dia, o gerente de um supermercado observou o número de clientes que escolheram cada um dos 8 caixas disponíveis na saída. Os resultados estão dados na tabela a seguir: CAIXA I II III IV V VI VII VIII TOTAL Freqüência 80 100 130 145 120 110 60 55 800 Tabela 7.7 – Frequência observada da escolha entre os caixas de um supermercado Diga se o gerente pode afirmar que existe preferência por um dos caixas num nível de significância igual a 0,05. Resposta: Rejeita Ho, existe evidência de que há preferência por um dos caixas. 7.9) Uma amostra de peças forneceu a seguinte tabela de contingência sobre a qualidade da peça por linha de produção. O gerente afirma que a qualidade da peça independe da linha de produção, realize um teste de hipótese para verificar se o gerente está certo. Linha Qualidade Aceitável Qualidade Defeituosa Primeira 368 32 Segunda 285 15 Terceira 176 24 Tabela 7.8 – Frequência observada da qualidade da peça por linha de produção Resposta: Os dados mostram evidência de que o gerente não está certo na sua afirmação a um nível de significância de 5%. 46 7.10) Dois pesquisadores selecionaram amostras de uma mesma cidade com o objetivo de estimar o número de pessoas que correspondem aos grupos classificados segundo o salário familiar por mês: A, B, C (os intervalos em reais são os mesmos para cada grupo). Os resultados obtidos foram: Pesquisador Grupo Total A B C P1 20 100 150 270 P2 30 80 150 260 Total 50 180 300 530 Tabela 7.9 – Frequência observada do número de pessoas em cada grupo de salário familiar Os dados apresentam evidência de que as amostras de um dos pesquisadores são suspeitas? Resposta: Pode-se dizer que, a um nível de significância de 5% os dois pesquisadores selecionaram as amostras corretamente. 7.11) Ao fazer um certo cruzamento, um geneticista esperava uma segregação de 4 A para 1 B. Em uma amostra ao acaso de 500 ele observou 380 A e 120 B. Os dados verificam a relação esperada? Use nível de significância de 1%. Resposta: A um nível de significância de 1% os dados verificam a relação esperada. 7.12) Determinado veículo utilitário está sofrendo pesadas críticas de seus proprietários, com relação à grande freqüência de defeitos no pneu traseiro esquerdo. Preocupado com sua imagem, e procurando defender-se de eventuais pedido de indenização, o fabricante do veículo resolveu coletar informações sobre 152 ocorrências de defeitos, classificando-as por posição do pneu. Os resultados estão na tabela a seguir. Usando nível de significância de 5%, há razão para acreditar que a probabilidade de defeito é diferente para algumas posições? Posição do pneu Dianteiro esquerdo Dianteiro direito Traseiro esquerdo Traseiro direito Total Freqüência 35 32 57 28 152 Tabela 7.10 – Frequência observada de defeitos por posição de pneu Resposta: Há uma evidência de que as freqüências de ocorrência dos defeitos dependem da posição do pneu a um nível de significância de 5% 47 Capítulo 8 - A�ÁLISE DE VARIÂ�CIA A Análise de Variância ou A�OVA é empregada para testar a igualdade entre k médias de uma mesma população. �ota: Utilizada para médias amostrais obtidas de populações normalmente distribuídas. Todavia, descobriu-se que o procedimento de teste não é grandemente afetado por violações da hipótese de normalidade, quando as populações são unimodais e os tamanhos das amostras são aproximadamente iguais. Assumimos que uma amostra aleatória simples de tamanho ni tenha sido selecionada de cada uma das k populações ou tratamentos. 8.1 - Estimativa dos Tratamentos – Entre a variância da população A estimativa dos tratamentos entre a variância da população σ² é chamada de quadrado da média devido ao tratamento, e é denotada por MSTR (Mean Square
Compartilhar