Baixe o app para aproveitar ainda mais
Prévia do material em texto
Unidade 7: Teste de hipótese de proporções e de diferença de médias 7.1 Primeiras Palavras Na unidade 6, aprendemos a elaborar e executar testes de hipóteses para os parâmetros populacionais �, �� e σ. Vimos também como é possível melhorar os testes por meio da determinação do tamanho da amostra. Para isso tivemos que aprender sobre os riscos tipo I e tipo II, denominados por nós de erro α e erro β. Nesta unidade, avançaremos nos estudos sobre a técnica de teste de hipótese, trabalhando com problemas que envolvem o parâmetro populacional fração ou proporção. Trabalharemos com a estatística �̂, proporção amostral, e a estatística ��, que é a freqüência amostral. Lembremos que � �̂ = � e que a esperança matemática de �� é ���� = ��. Trabalharemos, também, nesta unidade com problemas relacionados com a diferença de médias. Verificaremos que sobre isso há dois tipos de problemas: problemas de dados não emparelhados e problemas com dados emparelhados. 7.2 Problematizando o tema Lembram-se que na unidade 6, quando fizemos a problematizarão do tema, dissemos que as decisões sobre a qualidade de um produto ou sobre o desempenho de um processo são tomadas com base na experiência do técnico ou engenheiro? Fizemos, então, a introdução de um problema que abordou a decisão sobre a qualidade de um lote de produção submetido por um fornecedor. Assim, um fornecedor submete um lote de produtos ou componentes para um fabricante e este faz uma inspeção para verificar se o lote está de acordo com o especificado. A empresa compradora adota critérios, combinados com o fornecedor, de aceitação ou de rejeição do lote. A decisão de aceitar ou rejeitar um lote deriva-se de procedimentos amostrais e da estatística ��. Por exemplo, toma- se uma amostra de 250 unidades de um lote de 5000 peças e caso a amostra tenha 2 ou mais unidades defeituosas, o lote será rejeitado. Não se esqueça que um produto pode possuir várias características de qualidade (altura, cor, peso, espessura, diâmetro, pressão, viscosidade, pH, dentre outras propriedades) e caso uma delas esteja fora da especificação o produto (unidade amostrada) é classificado como fora da especificação. Podemos aplicar esse mesmo raciocínio a problemas de processo: você retira periodicamente amostras do processo e, com base nos resultados amostrais, toma a decisão de fazer correções ou não no processo. Outra situação a ser abordada nesta unidade é aquela que envolve medidas antes a após o processamento. Isso ocorre em tratamentos superficiais para evitar corrosões em peças metálicas. Outro exemplo, que seria o ideal em restaurantes por quilo, é pesar o prato antes e após você colocar a comida. Assim, o peso seria corretamente determinado (porém, isso demandaria muito esforço do restaurante). 7.3 Testes de hipóteses Trabalhos na unidade 6 com testes de hipóteses da média, variância e do desvio padrão populacional. Nesta unidade, iremos trabalhar com a proporção populacional. Os testes de hipóteses que apresentaremos sobre a proporção serão feitos sobre parâmetros populacionais de uma única população. Em seguida, trabalharemos com problemas que envolvem duas populações em testes de diferenças de médias. Os conceitos vistos nas unidades anteriores serão muito importantes nesta unidade, assim como foram na unidade 6. 7.3.1 De proporções Consideremos o mesmo problema da unidade 6: Suponhamos que um fabricante fabrique molas de compressão utilizadas na montagem de componentes usados em subsistemas de automóveis. Tomemos a altura da mola, dada em milímetros, e o diâmetro externo da mola como características a serem inspecionadas. As molas são fornecidas em lotes de 10 caixas com 500 unidades em cada uma. Amostras aleatórias são extraídas a cada lote recebido de tamanho � = 250. Para acelerar a inspeção, foi desenvolvido um calibrador passa-não passa (inspeção por atributo) que separa as peças boas das ruins para as duas características em análise. Caso uma delas esteja fora das especificações, o lote será rejeitado. O fornecedor enviou um lote suspeito de má qualidade. O engenheiro de processo do comprador resolveu fazer um teste de hipótese para verificar se o lote tem mais que 2% de peças fora das especificações. Assim, ele elaborou um procedimento para o seguinte teste: ��: p = 2% ��: p> 2% O procedimento elaborado pelo engenheiro tem a seguinte regra: • Inspeciona-se 250 peças; • Mede-se a altura e o diâmetro externo da mola, • Caso encontre 7 ou mais peças defeituosas, o lote deverá ser rejeitado. Aplicando essa regra, a pergunta é: qual será o erro tipo I do teste de hipótese? Sabemos que a distribuição de �̂, quando �� ≥ 5, tende a uma normal. O mesmo ocorre para a distribuição da estatística ��. Sabendo disso, vamos aplicar os mesmos ferramentais estatísticos utilizados na unidade 6. Lá na unidade 6, os testes de hipóteses eram calculados por meio da comparação de uma estatística derivada da amostra com um valor tabelado. Para o caso de uma distribuição normal, temos o ���������� e � �!"����, que nós abreviamos para ���� e � �!. Vimos, também, que há dois tipos de testes: os bilaterais e os unilaterais. Para os testes bilaterais, a hipótese de partida, ��, é aceita quando −� �! ≤ ���� ≤ � �!. Para testes unilaterais a direita, a hipótese �� será aceita quando ���� ≤ � �!. Quando o teste é unilateral a esquerda, a hipótese de partida será aceita quando −� �! ≤ ����. Esses testes têm suas respectivas hipóteses que estão representadas abaixo: • Bilateral: o ��: � = �� o ��: � ≠ �� • Unilateral a direita: o ��: � = �� o ��: � > �� • Unilateral a esquerda: o ��: � = �� o ��: � < �� A estatística de teste, como já foi mostrada na unidade 6, é dada por: ���� = �̂ − ���)* Sabemos que �)* = +) �,) - , usaremos o valor da proporção populacional, �, utilizada no teste de hipótese. Lembre que na estimativa de intervalo de confiança usamos �̂, que é dada por: �̂ = �� �. , onde �� é a freqüência amostral e � é o tamanho da amostra. Fazemos isso quando não conhecemos o valor da proporção populacional, �. Assim, a estatística de teste é calculada como segue: ���� = �̂ − ��+� 1 − � � O valor do � �! depende do teste: • Bilateral: −�0 �⁄ e �0 �⁄ ; • Unilateral a direita: �0; • Unilateral a esquerda: −�0 Podemos substituir a estatística �̂ pela estatística ��, pois � = ��. Assim, podemos reescrever as hipóteses acima da seguinte maneira: • Bilateral: o ��: � = �� o ��: � ≠ �� • Unilateral à direita: o ��: � = �� o ��: � > �� • Unilateral à esquerda: o ��: � = �� o ��: � < �� Podemos reescrever a hipótese do nosso problema de outro modo, como segue: • ��: � = 5 (5 é 345673 78 �� = 250 × 0,02 • ��: � > 5 No nosso problema devemos aplicar um teste estatístico unilateral, como mostraremos a seguir: ���� = �� − ���:� Sabemos que o desvio padrão da freqüência amostral é: �:� = ;�� 1 − � Assim, obtemos a fórmula da estatística de teste: ���� = �� − ��;�� 1 − � O engenheiro especificou como critério de rejeição da hipótese de partida a amostra ter 7 ou mais defeituosos. Isso equivale a 2,8% de defeituosos na amostra. A pergunta que temos que responder é qual o valor do erro tipo I. Em termos probabilísticos, a pergunta pode ser formulada como: <��� ≥ 7 ? Então temos: ? = <��� ≥ 7 = < @ �� − ��;��̂ 1 − �̂ ≥ 7 − ��;��̂ 1 − �̂ A Substituindo os valores na fórmula, temos: ? = <��� ≥ 7 = < @���� ≥ 7 − 5;250 × 0,02 × 1 − 0,02 A Poderíamos aplicar a fórmula do ����, sem fazer as passagens acima. ? = <��� ≥ 7 = < ���� ≥ 0,904 = 1 − D 0,904 = 1 − 0,817 Portanto, o risco do tipo I será: ? = 1 − 0,817 = 0,18318,3% A conclusão que chegamos é que esse risco é alto. Normalmente utilizamos um risco do tipo I para um ? = 5% ou menos. Para um risco do tipo I de 5%, o critério de rejeição da hipótese de partida será dado por: �0 = �� − ��;�� 1 − � Isolando ��, temos a fórmula para o cálculo da freqüência máxima de peças defeituosas na amostra para que o lote seja aceito. �� = �� + �0;�� 1 − � Para o nosso exemplo, temos: �� = 5 + �I%;250 × 0,02 × 1 − 0,02 Como �I% = 1,64, calcularemos o valor de ��: �� = 5 + 1,64;250 × 0,02 × 1 − 0,02 Assim, definimos o critério para aceitar ��: �� = 5 + 3,63 ≅ 9 Para aceitar o lote como bom, a amostra de 250 unidades deve ter, no máximo, 9 unidades defeituosas. Se alterarmos o tamanho da amostra, o critério será alterado. Pense nisso! Outra aplicação Para facilitar o desenvolvimento do assunto, vamos continuar com o mesmo exemplo. Suponhamos que o gerente da planta deseja reduzir os custos de avaliação da qualidade e ele sugere reduzir para 200 unidades o tamanho da amostra das molas de compressão a ser inspecionado. Para o mesmo risco tipo I (que é de 5%), qual seria a quantidade máxima de peças defeituosas no lote? Vamos aplicar a fórmula para ��: �� = �� + �0;�� 1 − � Só que neste caso �� = �� = 200 × 0,02 = 4. Assim, temos: �� = 4 + 1,64;200 × 0,02 × 1 − 0,02 = 7,25 ≅ 7 Observe que o critério novo admite menos peças defeituosas na amostra. Isso ocorreu devido à redução do tamanho da amostra. Uma pergunta que poderíamos fazer é: qual o risco β para esse tamanho de amostra (200 unidades)? Como já mostramos na unidade 6, a fórmula para determinar o tamanho da amostra é dado por: � = ��0;�� 1 − �� + �L;�� 1 − �� � �� − �� � Na fórmula do tamanho da amostra, nós predefinimos o risco β. O risco β é dado pela fórmula abaixo (revise a unidade 6 em caso de dúvida): M = <��� ≤ ��̂N = < @� ≤ �� − ���;��� 1 − �� A Vamos recordar cada termo das duas equações acima: • �0: valor da distribuição normal padrão para um dado α; • �0: valor da distribuição normal padrão para um dado β; • ��: parâmetro populacional da hipótese de partida; • ��: parâmetro populacional da hipótese alternativa; • ��: freqüência amostral; • ��̂N: unidades, freqüência amostral crítica, abaixo do qual, se aceita ��. A fórmula de cálculo do β desta unidade diferencia-se a da unidade 6 pelo fato de que aqui se usa a estatística �� ao invés da estatística �̂. Preste bem a atenção nesta diferença. Na realidade é a mesma distribuição, só que usamos a freqüência amostral ao invés da fração de itens defeituosos no lote. Atribuiremos valores aos parâmetros da fórmula do cálculo de β e � para o problema em análise, que são os seguintes: • �0: adotaremos α=5%, assim �I% = 1,64; • �O: adotaremos β=7%, �P% = 1,48; • ��: 2%; • ��: 5%; • ��: 7 unidades; M = <��� ≤ 7 = < @� ≤ �� − ���;��� 1 − �� A Substituindo os parâmetros pelos seus valores: M = <��� ≤ 7 = < @� ≤ 7 − 200 × 0,05;200 × 0,05 × 1 − 0,05 A = 0,165 O erro β é de 16,5%, que é alto. Agora vamos determinar o tamanho da amostra para os valores dos parâmetros indicados: � = �1,64;0,02 1 − 0,02 + 1,48;0,05 1 − 0,05 � 0,05 − 0,02 � ≅ 340 Precisaríamos de uma amostra de 340 unidades para um erro tipo I de 5% e um erro tipo II de 7%, tamanho esse bem superior as 200 amostras que associa a ela um erro β=16,5%. Outra aplicação Para o mesmo problema que estamos analisando, um novo fornecedor das molas garante que os seus lotes tem menos de 3% de peças defeituosas. O engenheiro da qualidade decidiu realizar um teste de hipótese cujo erro ? = 1% foi especificado como ideal. Assim, caso o engenheiro assuma que seja verdadeira a hipótese de que os lotes tenham menos de 3%, o erro dessa afirmativa não será menor que 1%. Portanto, para esse problema os testes de hipóteses serão os seguintes: ��: � = 3% ��: � < 3% Uma amostra de 200 unidades foi extraída de um lote de 10 mil unidades, e foi encontrada na amostra 4 peças defeituosas. Sabemos que para um erro α=1% � �!= -2,33. Como a hipótese alternativa é para valores menores que a hipótese de partida, nós iremos trabalhar com o valor crítico negativo. O valor da estatística calculada a partir da amostra é dado por: ���� = 4 200. − 0,03+0,03 × 1 − 0,03 200 = −1,24 Como o ���� > � �!, o engenheiro rejeitou a hipótese de que o novo fornecedor tenha lotes com menos de 3% defeituosos. Nesse problema, o engenheiro indevidamente não controlou o erro tipo II. Por conta disso, o fornecedor questionou o procedimento adotado, deste modo o engenheiro decidiu especificar em 5% o erro β e um erro de estimativa de 2% para em seguida determinar o tamanho da amostra. Assumiremos nesse caso que o valor verdadeiro seja 1%. Aplicando a fórmula do tamanho da amostra, temos: � = �2,33;0,03 1 − 0,03 + 1,64;0,01 1 − 0,01 � 0,03 − 0,01 � = 786 Para atender aos limites impostos para os erros tipo I e tipo II seria necessária uma amostra de 786 unidades. Com esse exemplo, terminamos esta seção que tratou dos testes de hipóteses para proporções e freqüências. Na próxima seção, apresentaremos mais alguns testes de hipóteses, agora para diferenças entre médias. 7.3.2 Diferenças entre médias Vimos, na unidade 5, estimativas de intervalo de confiança para a diferença entre médias para variáveis que se distribuem segundo uma normal. Os conceitos vistos naquela unidade serão aplicados aqui para a elaboração dos testes de hipóteses. Vamos resgatar o que vimos na unidade 5, no item 5.5.4. Quando iniciamos esse item, supomos que existiam dois fornecedores de chapas de aço e que a característica de qualidade era a espessura da chapa. Dois lotes foram submetidos, um do fornecedor atual e outro do novo fornecedor. A pergunta era: há diferença em termos de valores médios entre os dois lotes? O teste de hipótese para esse problema é formulado da seguinte maneira: ��: �� = �� ��: �� ≠ �� Sendo �� a média dos lotes submetidos pelo primeiro fornecedor, que é o fornecedor atual, e �� é a média populacional da espessura de chapa fornecido pelo segundo fornecedor, que é o novo fornecedor. Para efeito didático, iremos reescrever as hipóteses acima da segunda forma: ��: �� − �� = 0 ��: �� − �� ≠ 0 Estamos assumindo como hipótese de partida que as médias dos dois processos são iguais. A hipótese alternativa é que as médias são diferentes. Portanto, esse é um teste bilateral. Já vimos que � QR� − QR� = � QR� − � QR� e que S QR� − QR� =S QR� + S QR� . Sabemos, também, que as variâncias das médias amostrais são sempre somadas e dadas por: S QR� = ����� S QR� = �� ��� Para desvios padrões conhecidos (�� e ��) de uma população normal, a variância da diferença entre médias é dada por: S QR� − QR� = ����� + �� ��� Sendo �� e �� o tamanho das amostras das populações 1 e 2. Deste modo, o desvio padrão será dado por: �TRU,TRV = W����� + �� ��� A) Critério do teste de hipótese para σ conhecido Para o desvio padrão conhecido, a estatística calculada a partir da amostra que será comparada com o corresponde valor tabelado é dada pela seguinte fórmula: ���� = QR� − QR� − �� − �� �TRU,TRV = Q R� − QR� − ∆�TRU,TRV Na fórmula com uma diferença ∆ que pode ser diferente de zero. No nosso problema o objetivo é comparar se as médias populacionais são iguais, portanto iremos trabalhar com ∆= 0. Assim, teremos: ���� = QR� − QR� W����� + ����� O parâmetro de comparação � �!) é obtido da distribuição normal padrão. A hipótese de partida será aceita de −� �! ≤���� ≤ � �!. Apresentando esse critério em termos do erro tipo I temo: −�0 �⁄ ≤ ���� ≤ �0 �⁄ . É o mesmocritério utilizado para o teste da média. Aplicação Do primeiro lote temos as seguintes estatísticas: QR = 21,274 e Y = 0,0897. O desvio padrão populacional é conhecido e é de 0,10 mm. O lote do novo fornecedor teve as seguintes estatísticas: QR = 21,370 e Y = 0,14. O desvio padrão populacional é conhecido e é de 0,12 mm (o valor da média amostral do lote do novo fornecedor, é diferente do encontrado na unidade 5, cujo valor foi 21,970). De cada lote foi extraída uma amostra de 30 unidades. Para um erro α=1%, iremos testar a hipótese de igualdade entre as médias. ��: �� = �� ��: �� ≠ �� Vamos começar calculando o ����: ���� = 21,274 − 21,370 +0,10�30 + 0,12�30 = −3,37 Para � �! = �0 �⁄ , o valor encontrado utilizando o Excel foi ��,I% = −2,58. Portanto, rejeitamos a hipótese de igualdade entre as médias dos processos do fornecedor atual e a do novo fornecedor para a espessura de chapas metálicas. Intervalo de confiança no teste de hipótese Nós chegaríamos ao mesmo resultado fazendo a estimativa do intervalo de confiança, como veremos a seguir. Estudamos na unidade 5 que o intervalo de confiança para a diferença entre médias é dado por: < Z QR� − QR� − �0 �. W����� + �� ��� ≤ �� − �� ≤ QR� − QR� + �0 �. W����� + �� ���[ = 1 − ? Substituindo na fórmula os valores dados nesta unidade para o nosso problema: < Z 21,274 − 21,370 − 2,58W0,10�30 + 0,12�30 ≤ �� − �� ≤ 21,274 − 21,370 + 2,58W0,10�30 + 0,12�30 [ = 1 − 0,01 Encontramos o seguinte resultado da estimativa do intervalo de confiança para a diferença entre as médias: <\−0,170 ≤ �� − �� ≤ −0,022] = 1 − 0,01 100% Para um intervalo de confiança de 99%, a diferença entre as médias populacionais dos dois processos está entre -0,170 a - 0,022 mm. Portanto, o processo do segundo fornecedor (novo fornecedor) está ajustado para produzir chapas com espessuras maiores que o atual fornecedor. A hipótese de partida é rejeitada, pois o intervalo de confiança não contém zero. B) Critério do teste de hipótese para σ desconhecido Em geral, nós não conhecemos o desvio padrão populacional; nestes casos, teremos que usar o desvio padrão amostral. Como vimos nas unidades 5 e 6, quando desconhecemos o desvio padrão populacional devemos utilizar a estatística 5. A estatística obtida a partir da amostra para a diferença entre médias será dada por: 5��� = QR� − QR� YTRU,TRV O parâmetro tabelado da distribuição 5 − ^5_78�5, para testes de hipóteses bilaterais é determinado por: 5��� = 5-U`-V,�;0 �. Entretanto, há uma ressalva quando ao uso da estatística 5. Como vimos na unidade 5, os graus de liberdade de 5 para pequenas amostras provenientes de duas populações com distribuições de probabilidade normal e com sigmas iguais, é �� + �� − 2. Nesses casos o desvio padrão estimado é dado por: YTRU,TRV = Y)W 1�� + 1�� Sendo a variância ponderada dada por: Y)� = �� − 1 Y�� + � − 1 Y���� + �� − 2 Para esses casos, o valor da estatística calculada a partir da amostra é dado por: 5��� = QR� − QR� Y)+ 1�� + 1�� A hipótese �� será aceita quando: −5-U`-V,�;0 �. ≤ 5bcd ≤ 5-U`-V,�;0 �. Vimos, na unidade 5, que para amostras com sigma desconhecidos e diferentes, teremos que fazer um cálculo adicional para determinar os graus de liberdade da distribuição t. Para determinar os graus de liberdade, θ, utilizamos a seguinte fórmula: D = eY� ��� + Y����fY������ + 1 + Y������ + 1 − 2 Para a situação quando sigmas são desconhecidos e diferentes, a fórmula anterior é um cálculo preciso. Entretanto, quando o tamanho da amostra é grande (vamos pensar como grande um � ≥ 50 , os graus de liberdade podem ser determinados por �� + �� − 2, que é o modo que utilizamos para sigma desconhecidos e iguais. Assim, vimos que a fórmula do cálculo dos graus de liberdade da distribuição 5 pode ser simplifica. Nestes casos, o desvio padrão da diferença entre médias será dado por: YTRU,TRV = WY���� + Y� ��� Para essa condição, a hipótese �� será aceita quando: −5g;0 �. ≤ 5��� ≤ 5g;0 �. Aplicação Para o mesmo exemplo, vamos supor que os desvios padrões populacionais são iguais e desconhecidos. O desvio padrão ponderado será: Y)� = 30 − 1 × 0,0897� + 30 − 1 × 0,140�30 + 30 − 2 = 0,0138 Revise a unidade 5, pois lá fizemos esse mesmo cálculo, lembra-se?. O desvio padrão obtido é: Y) = 0,118 5��� = QR� − QR� Y)+ 1�� + 1�� = 21,274 − 21,37 0,118+ 130 + 130 = −3,15 Observe que o valor da estatística 5 foi menor em módulo que o valor da estatística �. Iremos agora achar o valor do 5 tabelado indo até o Excel ou a alguma tabela estatística encontrada nas referências bibliográficas. 5 �! = 5-U`-V,�;0 �. = 5h�`h�,�;�,�� �⁄ = 3,05 Obtemos o valor acima no Excel. Lembre-se que o valor acima do 5 �! é negativo quando estamos trabalhando com a calda do lado esquerdo, similar ao � da distribuição da normal. Assim, o valor tabelado será -3,05 e +3,05. Como o 5��� está fora desse intervalo, rejeitamos novamente a hipótese ��. Vamos agora resolver o mesmo problema, assumindo que os desvios padrões são desconhecidos e diferentes. Para essas situações, como já vimos, o desvio padrão é determinado por: YTRU,TRV = WY���� + Y� ��� Temos então o seguinte resultado: YTRU,TRV = W0,0897�30 + 0,140�30 = 0,0304 Assim, temos o valor da estatística 5: 5��� = 21,274 − 21,37 0,0304 = −3,16 Os graus de liberdade são dados por: D = eY� ��� + Y����fY������ + 1 + Y������ + 1 − 2 ≅ 51 Assim, temos o seguinte valor de 5: 5I�;�,I% ≅ 2,93. Para essa condição, a hipótese �� será aceita quando: −5g;0 �. ≤ 5��� ≤ 5g;0 �. . Como o valor do 5��� é -3,16, portanto, fora do intervalo de aceitação da hipótese de partida. Assim, rejeitamos novamente ��. Para as três situações possíveis, rejeitamos a hipótese de igualdade entre as médias. Teste unilateral Todos os testes que realizamos até aqui são bilaterais e representados do seguinte modo: ��: �� − �� = ∆ ��: �� − �� ≠ ∆ Como ∆= 0, formulamos a hipótese do seguinte modo: ��: �� − �� = 0 ��: �� − �� ≠ 0 Que foram representadas, de modo alternativo, como segue: ��: �� = �� ��: �� ≠ �� Cujo valor da estatística � ou 5 é dado por: ���� = QR� − QR� − �� − �� �TRU,TRV = Q R� − QR� − 0�TRU,TRV = Q R� − QR� �TRU,TRV 5 dado por: 5��� = QR� − QR� YTRU,TRV Os testes de hipóteses unilaterais para diferenças entre médias é similar ao que vimos na unidade 6. Os testes de hipóteses unilaterais podem ser um dos seguintes: ��: �� = �� ��: �� > �� Ou ��: �� = �� ��: �� < �� As estatísticas são calculadas como nos testes bilaterais, o que mudam são os valores dos parâmetros de teste, pois α não será dividido por 2. Assim, o valor tabelado será obtido por �0 ou 5-,�;0 ou 5g;0. Para o primeiro caso de teste unilateral, a hipótese de partida será aceita de 5��� < 5 �! ou ���� < � �!. Para o segundo caso, a hipótese de partida será aceita se −5��� > −5 �! ou −���� >−� �!. Aplicação Para o exemplo que estudamos até aqui, vamos testar a hipótese de que a média da espessura de chapa fornecida pelo fornecedor 1 é menor que a do fornecedor 2. Podemos escrever essa hipótese da seguinte forma: ��: �� − �� = 0 ��: �� − �� < 0 Poderíamos escrever também da seguinte maneira: ��: �� = �� ��: �� < �� Assumindo que os desvios padrões são desconhecidos e diferentes, temos a seguinte estatística: 5��� = QR� − QR� YTRU,TRV = Q R� − QR� YTRU,TRV = Q R� − QR� WY���� + Y���� Como, YTRU,TRV = W0,0897�30 + 0,140�30 = 0,0304 Assim, temos que: 5��� = 21,274 − 21,370,0304 = −3,16 Igual ao resultado para sigmas iguais e desconhecidos. O valor do parâmetro de teste obtido nas tabelasde estatística ou no Excel é o seguinte: 5 �! = 5g;0 = 5I�;�% = −2,68 O valor tabelado é negativo porque estamos trabalhando com a calda a esquerda da distribuição de 5. Isso é identificado pelo teste de hipótese da alternativa ��, que no nosso caso é ��: �� < ��. Caso fosse ao contrário ��: �� > �� , utilizaríamos o valor tabelado positivo. Como −5��� < −5 �!, rejeitamos a hipótese de partida (��). Assim, temos evidência estatística de que o processo do fornecedor 1 tem média para a espessura da chapa menor que o processo do fornecedor 2. Diferença de médias para proporção O mesmo raciocínio desenvolvido para diferenças de médias pode ser aplicado para diferenças de proporção. Lembre que uma proporção ou fração apesar de ser uma variável qualitativa pode ser aproximada pela distribuição normal. Isso só pode ser feito quando �� ≥ 5. As propriedades estatísticas aplicadas a média também são aplicadas a proporções. Assim, devemos somar as variâncias e subtrair ou somar as esperanças matemáticas, dependendo do caso. Vamos imaginar a seguinte situação. Uma empresa pesquisa um novo equipamento para a produção de artefatos de borracha para vários segmentos industriais, de automóveis a construção civil. Há duas opções de processo: processo A e um processo B. O processo i é o que já existe na fábrica, já o processo j tem uma nova concepção e um custo de implementação. A decisão é se vale ou não investir em uma nova tecnologia. Essa decisão vai depender do rendimento do processo, caso ele seja mais eficiente que o atual o investimento será feito. Para esse problema, foram formuladas as seguintes hipóteses: ��: �k = �l ��: �k > �l A hipótese é assim elaborada, pois o maior prejuízo à empresa é aceitar a hipótese alternativa, de que o novo processo é mais eficiente quando na realidade ele não é. Há um histórico razoável sobre o atual processo, no qual tem- se a fração de peças defeituosas para amostras de 80 unidades. A figura 7.1 mostra a ocorrência de peças defeituosas de cem amostras. Observe que a distribuição de freqüência aproxima-se de uma normal. Figura 7.1: Ocorrência de defeituosas de cem amostras de 80 unidades. A fração média de defeituosas do processo atual é para uma amostra de 80 unidades. Sabendo desses resultados, o gerente de processo decidiu estabelecer o seguinte procedimento de teste para decidir ou não a troca de equipamentos: 1. Tomar uma amostra aleatória de 80 unidades do processo i e estimar a fração de defeituosas; 2. Tomar uma amostra piloto de 100 unidades do processo j; 3. Aplicar o teste de hipótese formulado. Resultados: • Processo A: foram encontrados 9 defeituosas na amostra de 80 unidades inspecionadas. �̂k = mn� = 0,1125. • Processo B: 9 defeituosas em 100 unidades inspecionadas. Assim, �̂k � m ��� Figura 7.1: Ocorrência de defeituosas de cem amostras de 80 A fração média de defeituosas do processo atual é �̅�k � 0,125 para uma amostra de 80 unidades. Sabendo desses resultados, o gerente de processo decidiu estabelecer o teste para decidir ou não a troca de Tomar uma amostra aleatória de 80 unidades do e estimar a fração de defeituosas; Tomar uma amostra piloto de 100 unidades do processo Aplicar o teste de hipótese formulado. Processo A: foram encontrados 9 defeituosas na amostra de 80 unidades inspecionadas. Assim, defeituosas em 100 unidades ��� � 0,090. Y�)p,)q = �k 1 − �k �k + �l 1 − �l �l Como desconhecemos a proporção populacional, usaremos as estimativas: Y)p,)q = W�̂k 1 − �̂k �k + �̂l 1 − �̂l �l Podemos reescrever as hipóteses formuladas do modo abaixo, como já vimos nesta unidade: ��: �k − �l = 0 ��: �k − �l > 0 Y)p,)q = W0,1125 1 − 0,1125 80 + 0,09 1 − 0,09 100 = 0,04547 A estatística obtida a partir da amostra é obtida pelo uso da distribuição normal padrão: ���� = �̂k − �̂l − �k − �l +�̂k 1 − �̂k �k + �̂l 1 − �̂l �l Desenvolvendo ainda a estatística segundo as hipóteses formuladas, temos a seguinte fórmula da estatística a ser utilizada no teste de hipóteses: ���� = �̂k − �̂l +�̂k 1 − �̂k �k + �̂l 1 − �̂l �l Então, aplicando a equação acima obteremos o seguinte resultado: ���� = 0,1125 − 0,090 0,04547 = 0,02250,04547 = 0,4949 Assumindo para o problema um risco tipo I de α=1% e como as hipóteses de decisão baseiam-se em um teste unilateral, nós obtivemos o seguinte valor de teste: � �! = �0 = ��% = 2,33. Como ���� < � �! devemos rejeitar a hipótese alternativa, ��, não trocar o equipamento (ou seja, aceitar a hipótese de partida ��. Uma questão que poderíamos levantar é o porquê do não uso de �̅�k = 0,125. De fato essa estimativa é mais precisa, pois foram tomadas 100 amostras de 80 unidades. Vamos usar essa estimativa neste teste de hipótese e ver se a decisão irá mudar. ���� = 0,125 − 0,090 0,04676 = 0,7486 O � �! = 2,33, continuamos a rejeitar a hipótese alternativa. Para mesmo tamanho de amostras, poderíamos formular as hipóteses para a freqüência ou ocorrência do evento, no caso peças não conformes. Se tomássemos amostras de tamanhos iguais, por exemplo 100 unidades, poderíamos formular as seguintes hipóteses: ��: �k − �l = 0 ��: �k − �l > 0 O desvio padrão da freqüência amostral, como já vimos, é dado por: �:� = ;�� 1 − � Usando a propriedade da soma de variâncias, teremos para as hipóteses formuladas a seguinte variância conjunta dos processos dos fornecedores i 8 j: ��:�p,:�q = ��k 1 − �k + ��l 1 − �l Como desconhecemos os parâmetros das populações, a variância será obtida pela proporção estimada, mostrada a seguir: Y�:�p,:�q = ��̂k 1 − �̂k + ��̂l 1 − �̂l Por condição imposta pelo teste de hipótese, os tamanhos das amostras são iguais. Podemos então reescrever a fórmula do desvio padrão estimado da diferença entre duas proporções do seguinte modo: Y:�p,:�q = ;�\�̂k 1 − �̂k + �̂l 1 − �̂l ] A estatística de teste é calculada da seguinte forma: ���� = ���k − ��l − �k − �l ;�\�̂k 1 − �̂k + �̂l 1 − �̂l ] Os critérios de decisão são os mesmos vistos da diferença de médias e de proporções, vistos nesta unidade e também vistos na unidade 6 para a média e desvio padrão. Aplicação Para o mesmo problema, porém com amostras de mesmos tamanhos e iguais a 100. As freqüências observadas foram as seguintes: ��k = 12 e ��l = 9. A estatística obtida a partir da amostra nos dá o seguinte resultado: ���� = 12 − 9 − 0;100\0,1125 1 − 0,1125 + 0,09 1 − 0,09 ] = 0,704 Para � �! = ��% = 2,33, e como o valor calculado é menor que o tabelado, nós aceitamos a hipótese de partida, idêntica decisão quando usamos a proporção � como parâmetro de teste. Para testes bilaterais, o procedimento é o mesmo feito para diferenças entre médias. 7.4 Considerações finais Nesta unidade, você aprendeu a elaborar testes de hipóteses para proporções e para diferenças entre médias. Nos testes para diferenças entre médias, incluímos também testes para diferenças entre proporções. Esses conhecimentos ajudarão você a aplicar métodos científicos em problemas de engenharia. 7.5 Estudos complementares Para melhorar a sua compreensão sobre o uso de testes de hipóteses, recomendamos a leitura da bibliografia recomendada.
Compartilhar