Buscar

7 - Teste de hipótese de proporções e de diferença de médias

Prévia do material em texto

Unidade 7: Teste de hipótese de proporções e de 
diferença de médias 
 
7.1 Primeiras Palavras 
Na unidade 6, aprendemos a elaborar e executar testes de 
hipóteses para os parâmetros populacionais �, �� e σ. Vimos 
também como é possível melhorar os testes por meio da 
determinação do tamanho da amostra. Para isso tivemos que 
aprender sobre os riscos tipo I e tipo II, denominados por nós 
de erro α e erro β. 
Nesta unidade, avançaremos nos estudos sobre a técnica de 
teste de hipótese, trabalhando com problemas que envolvem o 
parâmetro populacional fração ou proporção. Trabalharemos 
com a estatística �̂, proporção amostral, e a estatística ��, que é 
a freqüência amostral. Lembremos que �	�̂
 = � e que a 
esperança matemática de �� é ����
 = ��. 
Trabalharemos, também, nesta unidade com problemas 
relacionados com a diferença de médias. Verificaremos que 
sobre isso há dois tipos de problemas: problemas de dados 
não emparelhados e problemas com dados emparelhados. 
 
7.2 Problematizando o tema 
Lembram-se que na unidade 6, quando fizemos a 
problematizarão do tema, dissemos que as decisões sobre a 
qualidade de um produto ou sobre o desempenho de um 
processo são tomadas com base na experiência do técnico ou 
engenheiro? Fizemos, então, a introdução de um problema que 
abordou a decisão sobre a qualidade de um lote de produção 
submetido por um fornecedor. Assim, um fornecedor submete 
um lote de produtos ou componentes para um fabricante e este 
faz uma inspeção para verificar se o lote está de acordo com o 
especificado. A empresa compradora adota critérios, 
combinados com o fornecedor, de aceitação ou de rejeição do 
lote. A decisão de aceitar ou rejeitar um lote deriva-se de 
procedimentos amostrais e da estatística ��. Por exemplo, toma-
se uma amostra de 250 unidades de um lote de 5000 peças e 
caso a amostra tenha 2 ou mais unidades defeituosas, o lote 
será rejeitado. Não se esqueça que um produto pode possuir 
várias características de qualidade (altura, cor, peso, 
espessura, diâmetro, pressão, viscosidade, pH, dentre outras 
propriedades) e caso uma delas esteja fora da especificação o 
produto (unidade amostrada) é classificado como fora da 
especificação. 
Podemos aplicar esse mesmo raciocínio a problemas de 
processo: você retira periodicamente amostras do processo e, 
com base nos resultados amostrais, toma a decisão de fazer 
correções ou não no processo. 
Outra situação a ser abordada nesta unidade é aquela que 
envolve medidas antes a após o processamento. Isso ocorre 
em tratamentos superficiais para evitar corrosões em peças 
metálicas. Outro exemplo, que seria o ideal em restaurantes 
por quilo, é pesar o prato antes e após você colocar a comida. 
Assim, o peso seria corretamente determinado (porém, isso 
demandaria muito esforço do restaurante). 
 
7.3 Testes de hipóteses 
Trabalhos na unidade 6 com testes de hipóteses da média, 
variância e do desvio padrão populacional. Nesta unidade, 
iremos trabalhar com a proporção populacional. Os testes de 
hipóteses que apresentaremos sobre a proporção serão feitos 
sobre parâmetros populacionais de uma única população. Em 
seguida, trabalharemos com problemas que envolvem duas 
populações em testes de diferenças de médias. 
Os conceitos vistos nas unidades anteriores serão muito 
importantes nesta unidade, assim como foram na unidade 6. 
 
7.3.1 De proporções 
Consideremos o mesmo problema da unidade 6: Suponhamos 
que um fabricante fabrique molas de compressão utilizadas na 
montagem de componentes usados em subsistemas de 
automóveis. Tomemos a altura da mola, dada em milímetros, e 
o diâmetro externo da mola como características a serem 
inspecionadas. As molas são fornecidas em lotes de 10 caixas 
com 500 unidades em cada uma. Amostras aleatórias são 
extraídas a cada lote recebido de tamanho � = 250. Para 
acelerar a inspeção, foi desenvolvido um calibrador passa-não 
passa (inspeção por atributo) que separa as peças boas das 
ruins para as duas características em análise. Caso uma delas 
esteja fora das especificações, o lote será rejeitado. 
O fornecedor enviou um lote suspeito de má qualidade. O 
engenheiro de processo do comprador resolveu fazer um teste 
de hipótese para verificar se o lote tem mais que 2% de peças 
fora das especificações. 
Assim, ele elaborou um procedimento para o seguinte teste: 
��: p = 2% ��: p> 2% 
O procedimento elaborado pelo engenheiro tem a seguinte 
regra: 
• Inspeciona-se 250 peças; 
• Mede-se a altura e o diâmetro externo da mola, 
• Caso encontre 7 ou mais peças defeituosas, o lote 
deverá ser rejeitado. 
Aplicando essa regra, a pergunta é: qual será o erro tipo I do 
teste de hipótese? 
Sabemos que a distribuição de �̂, quando �� ≥ 5, tende a uma 
normal. O mesmo ocorre para a distribuição da estatística ��. 
Sabendo disso, vamos aplicar os mesmos ferramentais 
estatísticos utilizados na unidade 6. 
Lá na unidade 6, os testes de hipóteses eram calculados por 
meio da comparação de uma estatística derivada da amostra 
com um valor tabelado. Para o caso de uma distribuição 
normal, temos o ���������� e � �!"����, que nós abreviamos 
para ���� e � �!. 
Vimos, também, que há dois tipos de testes: os bilaterais e os 
unilaterais. Para os testes bilaterais, a hipótese de partida, ��, 
é aceita quando −� �! ≤ ���� ≤ � �!. 
Para testes unilaterais a direita, a hipótese �� será aceita 
quando ���� ≤ � �!. Quando o teste é unilateral a esquerda, a 
hipótese de partida será aceita quando −� �! ≤ ����. 
Esses testes têm suas respectivas hipóteses que estão 
representadas abaixo: 
• Bilateral: 
o ��: � = �� 
o ��: � ≠ �� 
• Unilateral a direita: 
o ��: � = �� 
o ��: � > �� 
• Unilateral a esquerda: 
o ��: � = �� 
o ��: � < �� 
 
A estatística de teste, como já foi mostrada na unidade 6, é 
dada por: 
���� = �̂ − ���)* 
Sabemos que �)* = +)	�,)
- , usaremos o valor da proporção 
populacional, �, utilizada no teste de hipótese. Lembre que na 
estimativa de intervalo de confiança usamos �̂, que é dada 
por: �̂ = �� �. , onde �� é a freqüência amostral e � é o tamanho 
da amostra. Fazemos isso quando não conhecemos o valor da 
proporção populacional, �. 
Assim, a estatística de teste é calculada como segue: 
���� = �̂ − ��+�	1 − �
�
 
O valor do � �! depende do teste: 
• Bilateral: −�0 �⁄ e �0 �⁄ ; 
• Unilateral a direita: �0; 
• Unilateral a esquerda: −�0 
Podemos substituir a estatística �̂ pela estatística ��, pois � = ��. Assim, podemos reescrever as hipóteses acima da 
seguinte maneira: 
• Bilateral: 
o ��: � = �� 
o ��: � ≠ �� 
• Unilateral à direita: 
o ��: � = �� 
o ��: � > �� 
• Unilateral à esquerda: 
o ��: � = �� 
o ��: � < �� 
Podemos reescrever a hipótese do nosso problema de outro 
modo, como segue: 
• ��: � = 5 (5 é 345673 78 �� = 250 × 0,02
 
• ��: � > 5 
No nosso problema devemos aplicar um teste estatístico 
unilateral, como mostraremos a seguir: 
���� = �� − ���:� 
Sabemos que o desvio padrão da freqüência amostral é: 
�:� = ;��	1 − �
 
Assim, obtemos a fórmula da estatística de teste: 
���� = �� − ��;��	1 − �
 
O engenheiro especificou como critério de rejeição da hipótese 
de partida a amostra ter 7 ou mais defeituosos. Isso equivale a 
2,8% de defeituosos na amostra. A pergunta que temos que 
responder é qual o valor do erro tipo I. Em termos 
probabilísticos, a pergunta pode ser formulada como: <��� ≥ 7
? 
Então temos: 
? = <��� ≥ 7
 = < @ �� − ��;��̂	1 − �̂
 ≥ 7 − ��;��̂	1 − �̂
A 
 Substituindo os valores na fórmula, temos: 
? = <��� ≥ 7
 = < @���� ≥ 7 − 5;250 × 0,02 × 	1 − 0,02
A 
Poderíamos aplicar a fórmula do ����, sem fazer as passagens 
acima. 
? = <��� ≥ 7
 = <	���� ≥ 0,904
 = 1 − D	0,904
 = 1 − 0,817 
Portanto, o risco do tipo I será: 
? = 1 − 0,817 = 0,18318,3%
 
A conclusão que chegamos é que esse risco é alto. 
Normalmente utilizamos um risco do tipo I para um ? = 5% ou 
menos. Para um risco do tipo I de 5%, o critério de rejeição da 
hipótese de partida será dado por: 
�0 = �� − ��;��	1 − �
 
Isolando ��, temos a fórmula para o cálculo da freqüência 
máxima de peças defeituosas na amostra para que o lote seja 
aceito. 
�� = �� + �0;��	1 − �
 
Para o nosso exemplo, temos: 
�� = 5 + �I%;250 × 0,02 × 	1 − 0,02
 
Como �I% = 1,64, calcularemos o valor de ��: 
�� = 5 + 1,64;250 × 0,02 × 	1 − 0,02
 
Assim, definimos o critério para aceitar ��: 
�� = 5 + 3,63 ≅ 9 
Para aceitar o lote como bom, a amostra de 250 unidades deve 
ter, no máximo, 9 unidades defeituosas. Se alterarmos o 
tamanho da amostra, o critério será alterado. Pense nisso! 
Outra aplicação 
Para facilitar o desenvolvimento do assunto, vamos continuar 
com o mesmo exemplo. Suponhamos que o gerente da planta 
deseja reduzir os custos de avaliação da qualidade e ele 
sugere reduzir para 200 unidades o tamanho da amostra das 
molas de compressão a ser inspecionado. Para o mesmo risco 
tipo I (que é de 5%), qual seria a quantidade máxima de peças 
defeituosas no lote? 
Vamos aplicar a fórmula para ��: 
�� = �� + �0;��	1 − �
 
Só que neste caso �� = �� = 200 × 0,02 = 4. Assim, temos: 
�� = 4 + 1,64;200 × 0,02 × 	1 − 0,02
 = 7,25 ≅ 7 
Observe que o critério novo admite menos peças defeituosas 
na amostra. Isso ocorreu devido à redução do tamanho da 
amostra. 
Uma pergunta que poderíamos fazer é: qual o risco β para 
esse tamanho de amostra (200 unidades)? 
Como já mostramos na unidade 6, a fórmula para determinar o 
tamanho da amostra é dado por: 
� = ��0;��	1 − ��
 + �L;��	1 − ��
�	�� − ��
� 
Na fórmula do tamanho da amostra, nós predefinimos o risco β. 
O risco β é dado pela fórmula abaixo (revise a unidade 6 em 
caso de dúvida): 
M = <��� ≤ ��̂N
 = < @� ≤ �� − ���;���	1 − ��
A 
Vamos recordar cada termo das duas equações acima: 
• �0: valor da distribuição normal padrão para um dado α; 
• �0: valor da distribuição normal padrão para um dado β; 
• ��: parâmetro populacional da hipótese de partida; 
• ��: parâmetro populacional da hipótese alternativa; 
• ��: freqüência amostral; 
• ��̂N: unidades, freqüência amostral crítica, abaixo do 
qual, se aceita ��. 
 
A fórmula de cálculo do β desta unidade diferencia-se a da 
unidade 6 pelo fato de que aqui se usa a estatística �� ao invés 
da estatística �̂. Preste bem a atenção nesta diferença. Na 
realidade é a mesma distribuição, só que usamos a freqüência 
amostral ao invés da fração de itens defeituosos no lote. 
 
Atribuiremos valores aos parâmetros da fórmula do cálculo de 
β e � para o problema em análise, que são os seguintes: 
• �0: adotaremos α=5%, assim �I% = 1,64; 
• �O: adotaremos β=7%, �P% = 1,48; 
• ��: 2%; 
• ��: 5%; 
• ��: 7 unidades; 
M = <��� ≤ 7
 = < @� ≤ �� − ���;���	1 − ��
A 
Substituindo os parâmetros pelos seus valores: 
M = <��� ≤ 7
 = < @� ≤ 7 − 200 × 0,05;200 × 0,05 × 	1 − 0,05
A = 0,165 
O erro β é de 16,5%, que é alto. Agora vamos determinar o 
tamanho da amostra para os valores dos parâmetros indicados: 
� = �1,64;0,02	1 − 0,02
 + 1,48;0,05	1 − 0,05
�	0,05 − 0,02
� ≅ 340 
Precisaríamos de uma amostra de 340 unidades para um erro 
tipo I de 5% e um erro tipo II de 7%, tamanho esse bem 
superior as 200 amostras que associa a ela um erro β=16,5%. 
Outra aplicação 
Para o mesmo problema que estamos analisando, um novo 
fornecedor das molas garante que os seus lotes tem menos de 
3% de peças defeituosas. O engenheiro da qualidade decidiu 
realizar um teste de hipótese cujo erro ? = 1% foi especificado 
como ideal. Assim, caso o engenheiro assuma que seja 
verdadeira a hipótese de que os lotes tenham menos de 3%, o 
erro dessa afirmativa não será menor que 1%. 
Portanto, para esse problema os testes de hipóteses serão os 
seguintes: 
��: � = 3% ��: � < 3% 
Uma amostra de 200 unidades foi extraída de um lote de 10 mil 
unidades, e foi encontrada na amostra 4 peças defeituosas. 
Sabemos que para um erro α=1% � �!= -2,33. Como a 
hipótese alternativa é para valores menores que a hipótese de 
partida, nós iremos trabalhar com o valor crítico negativo. 
O valor da estatística calculada a partir da amostra é dado por: 
���� = 4 200. − 0,03+0,03 × 	1 − 0,03
200
= −1,24 
Como o ���� > � �!, o engenheiro rejeitou a hipótese de que o 
novo fornecedor tenha lotes com menos de 3% defeituosos. 
Nesse problema, o engenheiro indevidamente não controlou o 
erro tipo II. Por conta disso, o fornecedor questionou o 
procedimento adotado, deste modo o engenheiro decidiu 
especificar em 5% o erro β e um erro de estimativa de 2% para 
em seguida determinar o tamanho da amostra. Assumiremos 
nesse caso que o valor verdadeiro seja 1%. Aplicando a 
fórmula do tamanho da amostra, temos: 
� = �2,33;0,03	1 − 0,03
 + 1,64;0,01	1 − 0,01
�	0,03 − 0,01
� = 786 
Para atender aos limites impostos para os erros tipo I e tipo II 
seria necessária uma amostra de 786 unidades. 
Com esse exemplo, terminamos esta seção que tratou dos 
testes de hipóteses para proporções e freqüências. Na próxima 
seção, apresentaremos mais alguns testes de hipóteses, agora 
para diferenças entre médias. 
 
7.3.2 Diferenças entre médias 
Vimos, na unidade 5, estimativas de intervalo de confiança 
para a diferença entre médias para variáveis que se distribuem 
segundo uma normal. Os conceitos vistos naquela unidade 
serão aplicados aqui para a elaboração dos testes de 
hipóteses. 
Vamos resgatar o que vimos na unidade 5, no item 5.5.4. 
Quando iniciamos esse item, supomos que existiam dois 
fornecedores de chapas de aço e que a característica de 
qualidade era a espessura da chapa. Dois lotes foram 
submetidos, um do fornecedor atual e outro do novo 
fornecedor. A pergunta era: há diferença em termos de valores 
médios entre os dois lotes? 
O teste de hipótese para esse problema é formulado da 
seguinte maneira: 
��: �� = �� ��: �� ≠ �� 
Sendo �� a média dos lotes submetidos pelo primeiro 
fornecedor, que é o fornecedor atual, e �� é a média 
populacional da espessura de chapa fornecido pelo segundo 
fornecedor, que é o novo fornecedor. 
Para efeito didático, iremos reescrever as hipóteses acima da 
segunda forma: 
��: �� − �� = 0 ��: �� − �� ≠ 0 
Estamos assumindo como hipótese de partida que as médias 
dos dois processos são iguais. A hipótese alternativa é que as 
médias são diferentes. Portanto, esse é um teste bilateral. 
Já vimos que �	QR� − QR�
 = �	QR�
 − �	QR�
 e que S	QR� − QR�
 =S	QR�
 + S	QR�
. Sabemos, também, que as variâncias das 
médias amostrais são sempre somadas e dadas por: 
S	QR�
 = ����� S	QR�
 = ��
��� 
Para desvios padrões conhecidos (�� e ��) de uma população 
normal, a variância da diferença entre médias é dada por: 
S	QR� − QR�
 = ����� + ��
��� 
Sendo �� e �� o tamanho das amostras das populações 1 e 2. 
Deste modo, o desvio padrão será dado por: 
�TRU,TRV = W����� + ��
��� 
A) Critério do teste de hipótese para σ conhecido 
Para o desvio padrão conhecido, a estatística calculada a partir 
da amostra que será comparada com o corresponde valor 
tabelado é dada pela seguinte fórmula: 
���� = 	QR� − QR�
 − 	�� − ��
�TRU,TRV = 	Q
R� − QR�
 − ∆�TRU,TRV 
Na fórmula com uma diferença ∆ que pode ser diferente de 
zero. No nosso problema o objetivo é comparar se as médias 
populacionais são iguais, portanto iremos trabalhar com ∆= 0. 
Assim, teremos: 
���� = QR� − QR� W����� + �����
 
O parâmetro de comparação 	� �!) é obtido da distribuição 
normal padrão. A hipótese de partida será aceita de −� �! ≤���� ≤ � �!. Apresentando esse critério em termos do erro tipo I 
temo: −�0 �⁄ ≤ ���� ≤ �0 �⁄ . É o mesmocritério utilizado para o 
teste da média. 
Aplicação 
Do primeiro lote temos as seguintes estatísticas: QR = 21,274 e Y = 0,0897. O desvio padrão populacional é conhecido e é de 
0,10 mm. 
O lote do novo fornecedor teve as seguintes estatísticas: QR = 21,370 e Y = 0,14. O desvio padrão populacional é 
conhecido e é de 0,12 mm (o valor da média amostral do lote 
do novo fornecedor, é diferente do encontrado na unidade 5, 
cujo valor foi 21,970). 
De cada lote foi extraída uma amostra de 30 unidades. Para 
um erro α=1%, iremos testar a hipótese de igualdade entre as 
médias. 
��: �� = �� ��: �� ≠ �� 
Vamos começar calculando o ����: 
���� = 21,274 − 21,370 +0,10�30 + 0,12�30
= −3,37 
Para � �! = �0 �⁄ , o valor encontrado utilizando o Excel foi ��,I% = −2,58. 
Portanto, rejeitamos a hipótese de igualdade entre as médias 
dos processos do fornecedor atual e a do novo fornecedor para 
a espessura de chapas metálicas. 
Intervalo de confiança no teste de hipótese 
Nós chegaríamos ao mesmo resultado fazendo a estimativa do 
intervalo de confiança, como veremos a seguir. 
Estudamos na unidade 5 que o intervalo de confiança para a 
diferença entre médias é dado por: 
< Z	QR� − QR�
 − �0 �. W����� + ��
��� ≤ �� − ��
≤ 	QR� − QR�
 + �0 �. W����� + ��
���[ = 1 − ? 
Substituindo na fórmula os valores dados nesta unidade para o 
nosso problema: 
< Z	21,274 − 21,370
 − 2,58W0,10�30 + 0,12�30 ≤ �� − ��
≤ 	21,274 − 21,370
 + 2,58W0,10�30 + 0,12�30 [
= 1 − 0,01 
Encontramos o seguinte resultado da estimativa do intervalo de 
confiança para a diferença entre as médias: 
<\−0,170 ≤ �� − �� ≤ −0,022] = 	1 − 0,01
100% 
Para um intervalo de confiança de 99%, a diferença entre as 
médias populacionais dos dois processos está entre -0,170 a -
0,022 mm. Portanto, o processo do segundo fornecedor (novo 
fornecedor) está ajustado para produzir chapas com 
espessuras maiores que o atual fornecedor. 
A hipótese de partida é rejeitada, pois o intervalo de confiança 
não contém zero. 
 
B) Critério do teste de hipótese para σ desconhecido 
Em geral, nós não conhecemos o desvio padrão populacional; 
nestes casos, teremos que usar o desvio padrão amostral. 
Como vimos nas unidades 5 e 6, quando desconhecemos o 
desvio padrão populacional devemos utilizar a estatística 5. 
A estatística obtida a partir da amostra para a diferença entre 
médias será dada por: 
5��� = QR� − QR� YTRU,TRV 
O parâmetro tabelado da distribuição 5 − ^5_78�5, para testes 
de hipóteses bilaterais é determinado por: 
5��� = 5-U`-V,�;0 �. 
Entretanto, há uma ressalva quando ao uso da estatística 5. 
Como vimos na unidade 5, os graus de liberdade de 5 para 
pequenas amostras provenientes de duas populações com 
distribuições de probabilidade normal e com sigmas iguais, é �� + �� − 2. Nesses casos o desvio padrão estimado é dado 
por: 
YTRU,TRV = Y)W 1�� + 1�� 
Sendo a variância ponderada dada por: 
Y)� = 	�� − 1
Y�� + 	� − 1
Y���� + �� − 2 
Para esses casos, o valor da estatística calculada a partir da 
amostra é dado por: 
5��� = QR� − QR� Y)+ 1�� + 1��
 
A hipótese �� será aceita quando: 
−5-U`-V,�;0 �. ≤ 5bcd ≤ 5-U`-V,�;0 �. 
Vimos, na unidade 5, que para amostras com sigma 
desconhecidos e diferentes, teremos que fazer um cálculo 
adicional para determinar os graus de liberdade da distribuição 
t. Para determinar os graus de liberdade, θ, utilizamos a 
seguinte fórmula: 
D = eY�
��� + Y����fY������ + 1 +
Y������ + 1
− 2 
Para a situação quando sigmas são desconhecidos e 
diferentes, a fórmula anterior é um cálculo preciso. Entretanto, 
quando o tamanho da amostra é grande (vamos pensar como 
grande um � ≥ 50
 , os graus de liberdade podem ser 
determinados por �� + �� − 2, que é o modo que utilizamos 
para sigma desconhecidos e iguais. 
Assim, vimos que a fórmula do cálculo dos graus de liberdade 
da distribuição 5 pode ser simplifica. Nestes casos, o desvio 
padrão da diferença entre médias será dado por: 
YTRU,TRV = WY���� + Y�
��� 
Para essa condição, a hipótese �� será aceita quando: 
−5g;0 �. ≤ 5��� ≤ 5g;0 �. 
Aplicação 
Para o mesmo exemplo, vamos supor que os desvios padrões 
populacionais são iguais e desconhecidos. O desvio padrão 
ponderado será: 
Y)� = 	30 − 1
 × 0,0897� + 	30 − 1
 × 0,140�30 + 30 − 2 = 0,0138 
Revise a unidade 5, pois lá fizemos esse mesmo cálculo, 
lembra-se?. 
O desvio padrão obtido é: 
Y) = 0,118 
5��� = QR� − QR� Y)+ 1�� + 1��
= 21,274 − 21,37 0,118+ 130 + 130
= −3,15 
Observe que o valor da estatística 5 foi menor em módulo que o 
valor da estatística �. Iremos agora achar o valor do 5 tabelado 
indo até o Excel ou a alguma tabela estatística encontrada nas 
referências bibliográficas. 
5 �! = 5-U`-V,�;0 �. = 5h�`h�,�;�,�� �⁄ = 3,05 
Obtemos o valor acima no Excel. Lembre-se que o valor acima 
do 5 �! é negativo quando estamos trabalhando com a calda do 
lado esquerdo, similar ao � da distribuição da normal. Assim, o 
valor tabelado será -3,05 e +3,05. 
Como o 5��� está fora desse intervalo, rejeitamos novamente a 
hipótese ��. 
Vamos agora resolver o mesmo problema, assumindo que 
os desvios padrões são desconhecidos e diferentes. 
Para essas situações, como já vimos, o desvio padrão é 
determinado por: 
YTRU,TRV = WY���� + Y�
��� 
Temos então o seguinte resultado: 
YTRU,TRV = W0,0897�30 + 0,140�30 = 0,0304 
Assim, temos o valor da estatística 5: 
5��� = 21,274 − 21,37 0,0304 = −3,16 
Os graus de liberdade são dados por: 
D = eY�
��� + Y����fY������ + 1 +
Y������ + 1
− 2 ≅ 51 
Assim, temos o seguinte valor de 5: 5I�;�,I% ≅ 2,93. 
Para essa condição, a hipótese �� será aceita quando: −5g;0 �. ≤ 5��� ≤ 5g;0 �. . Como o valor do 5��� é -3,16, portanto, 
fora do intervalo de aceitação da hipótese de partida. Assim, 
rejeitamos novamente ��. 
Para as três situações possíveis, rejeitamos a hipótese de 
igualdade entre as médias. 
Teste unilateral 
Todos os testes que realizamos até aqui são bilaterais e 
representados do seguinte modo: 
��: �� − �� = ∆ ��: �� − �� ≠ ∆ 
Como ∆= 0, formulamos a hipótese do seguinte modo: 
��: �� − �� = 0 ��: �� − �� ≠ 0 
Que foram representadas, de modo alternativo, como segue: 
��: �� = �� ��: �� ≠ �� 
Cujo valor da estatística � ou 5 é dado por: 
���� = 	QR� − QR�
 − 	�� − ��
�TRU,TRV = 	Q
R� − QR�
 − 0�TRU,TRV = 	Q
R� − QR�
�TRU,TRV 
5 dado por: 
5��� = QR� − QR� YTRU,TRV 
 
Os testes de hipóteses unilaterais para diferenças entre médias 
é similar ao que vimos na unidade 6. Os testes de hipóteses 
unilaterais podem ser um dos seguintes: 
��: �� = �� ��: �� > �� 
Ou 
��: �� = �� ��: �� < �� 
As estatísticas são calculadas como nos testes bilaterais, o que 
mudam são os valores dos parâmetros de teste, pois α não 
será dividido por 2. Assim, o valor tabelado será obtido por �0 
ou 5-,�;0 ou 5g;0. 
Para o primeiro caso de teste unilateral, a hipótese de partida 
será aceita de 5��� < 5 �! ou ���� < � �!. Para o segundo caso, 
a hipótese de partida será aceita se −5��� > −5 �! ou −���� >−� �!. 
Aplicação 
Para o exemplo que estudamos até aqui, vamos testar a 
hipótese de que a média da espessura de chapa fornecida pelo 
fornecedor 1 é menor que a do fornecedor 2. Podemos 
escrever essa hipótese da seguinte forma: 
��: �� − �� = 0 ��: �� − �� < 0 
Poderíamos escrever também da seguinte maneira: 
��: �� = �� ��: �� < �� 
 
Assumindo que os desvios padrões são desconhecidos e 
diferentes, temos a seguinte estatística: 
5��� = QR� − QR� YTRU,TRV = Q
R� − QR� YTRU,TRV = Q
R� − QR�
WY���� + Y����
 
Como, 
YTRU,TRV = W0,0897�30 + 0,140�30 = 0,0304 
Assim, temos que: 
5��� = 21,274 − 21,370,0304 = −3,16 
Igual ao resultado para sigmas iguais e desconhecidos. 
O valor do parâmetro de teste obtido nas tabelasde estatística 
ou no Excel é o seguinte: 
5 �! = 5g;0 = 5I�;�% = −2,68 
O valor tabelado é negativo porque estamos trabalhando com a 
calda a esquerda da distribuição de 5. Isso é identificado pelo 
teste de hipótese da alternativa ��, que no nosso caso é ��: �� < ��. Caso fosse ao contrário 	��: �� > ��
, utilizaríamos 
o valor tabelado positivo. 
Como −5��� < −5 �!, rejeitamos a hipótese de partida (��). 
Assim, temos evidência estatística de que o processo do 
fornecedor 1 tem média para a espessura da chapa menor que 
o processo do fornecedor 2. 
Diferença de médias para proporção 
O mesmo raciocínio desenvolvido para diferenças de médias 
pode ser aplicado para diferenças de proporção. Lembre que 
uma proporção ou fração apesar de ser uma variável qualitativa 
pode ser aproximada pela distribuição normal. Isso só pode ser 
feito quando �� ≥ 5. As propriedades estatísticas aplicadas a 
média também são aplicadas a proporções. Assim, devemos 
somar as variâncias e subtrair ou somar as esperanças 
matemáticas, dependendo do caso. 
Vamos imaginar a seguinte situação. Uma empresa pesquisa 
um novo equipamento para a produção de artefatos de 
borracha para vários segmentos industriais, de automóveis a 
construção civil. Há duas opções de processo: processo A e 
um processo B. O processo i é o que já existe na fábrica, já o 
processo j tem uma nova concepção e um custo de 
implementação. A decisão é se vale ou não investir em uma 
nova tecnologia. Essa decisão vai depender do rendimento do 
processo, caso ele seja mais eficiente que o atual o 
investimento será feito. 
Para esse problema, foram formuladas as seguintes hipóteses: 
��: �k = �l ��: �k > �l 
A hipótese é assim elaborada, pois o maior prejuízo à empresa 
é aceitar a hipótese alternativa, de que o novo processo é mais 
eficiente quando na realidade ele não é. 
Há um histórico razoável sobre o atual processo, no qual tem-
se a fração de peças defeituosas para amostras de 80 
unidades. A figura 7.1 mostra a ocorrência de peças 
defeituosas de cem amostras. Observe que a distribuição de 
freqüência aproxima-se de uma normal. 
Figura 7.1: Ocorrência de defeituosas de cem amostras de 80 
unidades. 
A fração média de defeituosas do processo atual é 
para uma amostra de 80 unidades. Sabendo desses 
resultados, o gerente de processo decidiu estabelecer o 
seguinte procedimento de teste para decidir ou não a troca de 
equipamentos: 
1. Tomar uma amostra aleatória de 80 unidades do 
processo i e estimar a fração de defeituosas;
2. Tomar uma amostra piloto de 100 unidades do processo j; 
3. Aplicar o teste de hipótese formulado.
Resultados: 
• Processo A: foram encontrados 9 defeituosas na 
amostra de 80 unidades inspecionadas.
�̂k = mn� = 0,1125. 
• Processo B: 9 defeituosas em 100 unidades 
inspecionadas. Assim, �̂k �
m
���
 
 
Figura 7.1: Ocorrência de defeituosas de cem amostras de 80 
A fração média de defeituosas do processo atual é �̅�k � 0,125 
para uma amostra de 80 unidades. Sabendo desses 
resultados, o gerente de processo decidiu estabelecer o 
teste para decidir ou não a troca de 
Tomar uma amostra aleatória de 80 unidades do 
e estimar a fração de defeituosas; 
Tomar uma amostra piloto de 100 unidades do processo 
Aplicar o teste de hipótese formulado. 
Processo A: foram encontrados 9 defeituosas na 
amostra de 80 unidades inspecionadas. Assim, 
defeituosas em 100 unidades 
���
� 0,090. 
Y�)p,)q = �k	1 − �k
�k + �l	1 − �l
�l 
Como desconhecemos a proporção populacional, usaremos as 
estimativas: 
Y)p,)q = W�̂k	1 − �̂k
�k + �̂l	1 − �̂l
�l 
Podemos reescrever as hipóteses formuladas do modo abaixo, 
como já vimos nesta unidade: 
��: �k − �l = 0 ��: �k − �l > 0 
Y)p,)q = W0,1125	1 − 0,1125
80 + 0,09	1 − 0,09
100 = 0,04547 
A estatística obtida a partir da amostra é obtida pelo uso da 
distribuição normal padrão: 
���� = 	�̂k − �̂l
 − 	�k − �l
+�̂k	1 − �̂k
�k + �̂l	1 − �̂l
�l
 
Desenvolvendo ainda a estatística segundo as hipóteses 
formuladas, temos a seguinte fórmula da estatística a ser 
utilizada no teste de hipóteses: 
���� = 	�̂k − �̂l
+�̂k	1 − �̂k
�k + �̂l	1 − �̂l
�l
 
Então, aplicando a equação acima obteremos o seguinte 
resultado: 
���� = 	0,1125 − 0,090
0,04547 = 0,02250,04547 = 0,4949 
Assumindo para o problema um risco tipo I de α=1% e como as 
hipóteses de decisão baseiam-se em um teste unilateral, nós 
obtivemos o seguinte valor de teste: � �! = �0 = ��% = 2,33. 
Como ���� < � �! devemos rejeitar a hipótese alternativa, ��, 
não trocar o equipamento (ou seja, aceitar a hipótese de 
partida ��. 
Uma questão que poderíamos levantar é o porquê do não uso 
de �̅�k = 0,125. De fato essa estimativa é mais precisa, pois 
foram tomadas 100 amostras de 80 unidades. 
Vamos usar essa estimativa neste teste de hipótese e ver se a 
decisão irá mudar. 
���� = 	0,125 − 0,090
0,04676 = 0,7486 
O � �! = 2,33, continuamos a rejeitar a hipótese alternativa. 
Para mesmo tamanho de amostras, poderíamos formular as 
hipóteses para a freqüência ou ocorrência do evento, no caso 
peças não conformes. Se tomássemos amostras de tamanhos 
iguais, por exemplo 100 unidades, poderíamos formular as 
seguintes hipóteses: 
��: �k − �l = 0 ��: �k − �l > 0 
O desvio padrão da freqüência amostral, como já vimos, é dado 
por: 
�:� = ;��	1 − �
 
Usando a propriedade da soma de variâncias, teremos para as 
hipóteses formuladas a seguinte variância conjunta dos 
processos dos fornecedores i 8 j: 
��:�p,:�q = ��k	1 − �k
 + ��l	1 − �l
 
Como desconhecemos os parâmetros das populações, a 
variância será obtida pela proporção estimada, mostrada a 
seguir: 
Y�:�p,:�q = ��̂k	1 − �̂k
 + ��̂l	1 − �̂l
 
Por condição imposta pelo teste de hipótese, os tamanhos das 
amostras são iguais. Podemos então reescrever a fórmula do 
desvio padrão estimado da diferença entre duas proporções do 
seguinte modo: 
Y:�p,:�q = ;�\�̂k	1 − �̂k
 + �̂l	1 − �̂l
] 
A estatística de teste é calculada da seguinte forma: 
���� = ���k − ��l
 − 	�k − �l
;�\�̂k	1 − �̂k
 + �̂l	1 − �̂l
] 
Os critérios de decisão são os mesmos vistos da diferença de 
médias e de proporções, vistos nesta unidade e também vistos 
na unidade 6 para a média e desvio padrão. 
 
Aplicação 
Para o mesmo problema, porém com amostras de mesmos 
tamanhos e iguais a 100. As freqüências observadas foram as 
seguintes: ��k = 12 e ��l = 9. 
A estatística obtida a partir da amostra nos dá o seguinte 
resultado: 
���� = 	12 − 9
 − 0;100\0,1125	1 − 0,1125
 + 0,09	1 − 0,09
] = 0,704 
Para � �! = ��% = 2,33, e como o valor calculado é menor que 
o tabelado, nós aceitamos a hipótese de partida, idêntica 
decisão quando usamos a proporção � como parâmetro de 
teste. 
 
Para testes bilaterais, o procedimento é o mesmo feito para 
diferenças entre médias. 
 
7.4 Considerações finais 
Nesta unidade, você aprendeu a elaborar testes de hipóteses 
para proporções e para diferenças entre médias. Nos testes 
para diferenças entre médias, incluímos também testes para 
diferenças entre proporções. Esses conhecimentos ajudarão 
você a aplicar métodos científicos em problemas de 
engenharia. 
 
7.5 Estudos complementares 
Para melhorar a sua compreensão sobre o uso de testes de 
hipóteses, recomendamos a leitura da bibliografia 
recomendada.

Continue navegando