Buscar

8 Testes de Hipóteses e Análise de Variância

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 22 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 22 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 22 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Disciplina: Análise de dados
Aula 8: Testes de Hipóteses e Análise de Variância
Apresentação
Na Aula 6, vimos alguns fundamentos referentes aos testes de hipóteses. Agora, você verá como realizá-los a partir de
informações obtidas por meio de uma ou mais amostras.
Abordaremos a identi�cação das hipóteses nula e alternativa; especi�cação do nível de con�ança; determinação da
estatística de teste e conclusão do teste. Realizaremos um teste de hipótese para a média populacional com desvio-padrão
conhecido e outro com variância desconhecida.
E, também, descreveremos como realizamos testes para testar a igualdade de três ou mais médias populacionais por meio
da ANOVA (Análise de Variância) de um fator.
Objetivos
Aplicar testes de hipótese para a média com uma amostra.
Utilizar a tabela ANOVA (Análise de Variância) para testar a igualdade de três (ou mais) médias populacionais.
Testes de hipóteses
Na Aula 6, já falamos um pouco sobre testes de hipóteses apresentando alguns fundamentos que nos permitem compreender
para que servem e para qual tipo de situação podem ser utilizados.
As de�nições de hipótese e de teste de hipóteses foram apresentadas da seguinte forma:
Em Estatística, uma hipótese é uma a�rmação sobre um ou mais parâmetros populacionais
de uma distribuição de probabilidades de uma variável aleatória X.
Um teste de hipóteses é de�nido como o procedimento ou a regra de decisão que nos
possibilita escolher pela aceitação ou rejeição de uma hipótese, com base em informações
contidas em uma amostra.
O que apresentamos foi apenas uma prévia do que iremos fazer nesta aula. Há testes de hipóteses para diversas situações.
Alguns são realizados com apenas uma amostra, outros se utilizam de duas ou mais amostras. Uns testam hipóteses que
envolvem médias, outros miram proporções, desvios ou outros parâmetros populacionais.
Para cada tipo de teste há um procedimento diferente, mas os fundamentos são muito semelhantes. A compreensão de um tipo
de teste certamente lhe permitirá entender outros que são aplicados em situações distintas.
Não há como abordar, aqui, todos os tipos de testes existentes, mas iremos apresentar três tipos diferentes que se baseiam em
obter conclusões acerca da média de uma população ou das médias de duas ou mais populações.
Antes de apresentar de forma detalhada os testes desta aula,
vamos relembrar alguns pontos importantes para a realização
deles?
Lembre-se que, primeiro, precisamos de�nir as hipóteses que serão testadas: hipótese nula ( ) e hipótese alternativa ( ).
Vamos retomar um exemplo apresentado na Aula 6.
H0 H1

Fonte: Wokandapix <https://pixabay.com/pt/users/wokandapix-614097/?utm_source=link-attribution&utm_medium=referral&utm_campaign=image&utm_content=3075420> /
Pixabay.
https://pixabay.com/pt/users/wokandapix-614097/?utm_source=link-attribution&utm_medium=referral&utm_campaign=image&utm_content=3075420
Exemplo 1
O supervisor de Qualidade de uma indústria metalúrgica deseja avaliar se o lote de parafusos recebidos de determinado
fornecedor tem realmente a resistência especi�cada, que é de 72kgf (valor nominal especi�cado pelo fabricante), em média. Para
isso, selecionou uma amostra de 25 desses parafusos e testou-os, chegando a uma média de resistência de 69kgf.
Será que o resultado obtido é su�ciente para contestar a informação do fornecedor? Ou a diferença entre a média da amostra
(69kgf) e o valor especi�cado (72kgf) é devido à variação amostral?
As hipóteses que de�nimos, nesse caso, foram:
: μ = 72kgfH0 ou : μ ≠ 72kgfH1
É comum de�nirmos hipótese nula por meio de uma igualdade que envolve o parâmetro testado. E a hipótese alternativa é
aquela que consideramos no caso de rejeição da primeira. O termo nula é usado para indicar que não ocorre nenhuma mudança
ou nenhum efeito.
Da forma como de�nimos a hipótese alternativa, o teste é considerado bilateral. Mas, hipótese alternativa também poderia ser
de�nida como:
: μ > 72kgfH1 ou : μ < 72kgfH1
O que nos levaria a classi�car o teste como unilateral. A primeira opção de�ne um teste unilateral à direita e a segunda, um teste
unilateral à esquerda.
Vale ressaltar, mesmo que a amostra tenha apresentado uma média menor que 69kgf, a primeira opção apresentada acima pode
ser considerada, pois a de�nição das hipóteses geralmente ocorre antes do levantamento amostral.
Numa análise precipitada, poderíamos concluir pela rejeição de já que a amostra apresentou uma média diferente de 72 kgf.
Contudo, é preciso considerar que mesmo que o valor médio do lote seja de 72kgf é muito provável que a amostra selecionada
não apresente o mesmo valor como média. Para qualquer amostra selecionada é perfeitamente normal haver o que chamamos
de variação amostral.
Da mesma forma, um lote cuja média (populacional) seja diferente de 72kgf pode apresentar uma amostra com média igual a
esse valor, o que nos levaria a cometer um erro na conclusão de nosso teste.
Mas, qualquer que seja a conclusão de um teste de hipótese (aceitação ou rejeição da hipótese nula), devemos considerar que
sempre haverá a probabilidade de cometermos erro, podendo ser do Tipo I ou Tipo II.
A Tabela 1, a seguir, apresenta todas as situações possíveis referentes à nossa tomada de decisão.
H0
Tabela 1: Tipos de erro em um teste de hipóteses
Aceitar Rejeitar 
 verdadeira Decisão correta Erro Tipo I
 falsa Erro Tipo II Decisão correta
H0 H0
H0
H0
A probabilidade de cometermos o erro tipo I (rejeitar quando ela é verdadeira) denominada nível de signi�cância do teste
costuma ser denotada por (lê-se “alfa”).
Os níveis de signi�cância mais utilizados são 0,01; 0,05 e 0,1. Mas, dependendo da aplicação podem ser utilizados outros valores.
A de�nição do valor do nível de signi�cância é feita por quem realiza o teste, de acordo com os seus objetivos.
H0
α
Até aqui, nenhuma novidade. Tudo isso já foi abordado. Mas, a questão que �ca é: Como
podemos concluir a respeito da aceitação ou rejeição da hipótese nula? É o que
começaremos a ver a seguir.
Testes de hipóteses para a média populacional com desvio-
padrão conhecido
Situações como a retratada no Exemplo 1 exigem um teste que, para ser realizado, necessita de uma amostra e de sua média
para avaliar se a média populacional assume ou não um valor especí�co. Para realizá-lo, basta selecionar uma amostra para obter
sua média. Trata-se, nesse caso, de um teste de uma amostra para a média populacional.
Considere uma variável aleatória que representa alguma população de interesse e que tenha distribuição normal com média
desconhecida e desvio-padrão conhecido . Caso não tenha distribuição normal é necessário que as condições do Teorema
Central do Limite se veri�quem.
Considere, também, que estejamos interessados em testar as hipóteses:
X
μ σ X
: μ =H0 μ0 : μ =H1 μ0
Em que é uma constante especí�ca.
Seja , ,…, uma amostra aleatória, de tamanho , em que cada observação tem distribuição normal com média
desconhecida e desvio-padrão conhecido . Para testar , usamos a estatística:
μ0
X1 X2 Xn n Xi
μ σ H0
=Z0
−X̄̄̄ μ0
σ
n√
/
Sob , isto é, se for verdadeira, então e a distribuição de é . Sendo assim:H0 H0 E ( ) =X̄̄̄ μ0 Z0 N (0, 1)
P (− < < ) = 1 − αZ α
2/ Z0 Z α 2/
Que equivale a:
P ( < − ) =Z0 Z α
2/
α
2 e P ( < − ) =Z0 Z α 2/
α
2
Quando se considera verdadeira, não é esperado que e nem que . Portanto, essas duas
desigualdades de�nem o que chamamos de regiões de rejeição de , conforme mostrado na Figura 1. Já o intervalo:
H0 < −Z0 Z α
2/ >Z0 Z α 2/
H0
− < <Z α
2/
Z0 Z α
2/
de�ne a região de aceitação de .H0
 Figura 1 – Regiões de aceitação e rejeição de para um teste bilateral para média populacional com desvio-padrão
conhecido. Fonte: Elaboração do autor.
H0
Os pontos críticos e serão obtidos pela distribuição normal padronizada, cujos valores são apresentados na Tabela
2. Para um nível de signi�cância , o valor crítico será dado por:
−Z α
2/ Z α 2/
α = 0, 05 Z α
2/
= = = 1, 96Z α
2/ Z 0,05 2/ Z0,025
Pois, o valor de�ne, comomostra a Tabela 2, uma região de 47,5% (0,4750) dos valores da distribuição. Portanto,
apenas 2,5% da distribuição estão acima de .
Z = 1, 96
= 1, 96Z α
2/
Tabela 2 – Tabela da Distribuição Normal Padronizada
Área sob o gráfico de 0 a z
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549
0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852
0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974
2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981
2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986
3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990
3,1 0,4990 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993
3,2 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995
3,3 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997
3,4 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998
3,5 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998
3,6 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,7 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,8 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,9 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000
4,0 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000
 Fonte: Rob Lambert <https://unsplash.com/photos/9Q_pLLP_jmA?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText> / Unsplash.
Exemplo 2
Um engenheiro deseja testar se o ponto de uma liga é de 900°C. Para isso, observou uma amostra de 36 unidades desse tipo de
liga, chegando a uma média de 895°C. Sabe-se que o desvio-padrão desse tipo de processo é de 12°C. Considerando um nível de
signi�cância , a qual conclusão chegou o engenheiro?
Os valores dados são:
α = 0, 05
= 900°Cμ0
n = 36
= 895°CX̄̄̄
σ = 12°C
As hipóteses que podemos considerar, nesse caso, são:
: μ = 900°CH0
: μ ≠ 900°CH1
Por tratar-se de um teste bilateral, os pontos críticos e serão dados, respectivamente, por:−Z α
2/
Z α
2/
https://unsplash.com/photos/9Q_pLLP_jmA?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText
− = − = − = −1, 96Z α
2/ Z 0,05 2/ Z0,025
= = = 1, 96Z α
2/ Z 0,05 2/ Z0,025
Os pontos críticos acima são valores da distribuição normal padrão, que está representada na Tabela 2. Consideraremos,
portanto, como região de aceitação o intervalo de –1,96 a 1,96.
A estatística de teste será dada por:
= = = = −2, 5Z0
−X̄̄̄ μ0
σ
n√
/
395°C−900°C
12°C
36√
/
−5°C
2°C
Como:
< −1, 96Z0
Então, concluímos pela rejeição de . Logo, ao nível de 0,05 de signi�cância, o engenheiro não pode concluir que o ponto de
fusão dessa liga seja de 900°C.
O teste realizado no Exemplo 2 é bilateral. O engenheiro, no entanto, poderia estar interessado em testar se o ponto de fusão é
menor que 900°C. Nesse caso, o teste seria classi�cado como unilateral à esquerda e a hipótese alternativa seria de�nida como:
H0
: μ < 900°CH1
A região de rejeição, para testes unilaterais à esquerda, é tal que:
< −Z0 Zα
Caso o interesse do engenheiro fosse testar se o ponto de fusão é maior que 900°C, isto é:
: μ > 900°CH1
O teste seria classi�cado como unilateral à direita. Nesse caso, a região de rejeição é de�nida pelo intervalo:
>Z0 Zα
As Figuras 2 e 3 mostram as regiões de aceitação e rejeição de testes unilaterais, respectivamente, à esquerda e à direita.
 Figura 2: Regiões de aceitação e rejeição de para um teste unilateral à esquerda para média populacional com
desvio-padrão conhecido.
H0
 Figura 3: Regiões de aceitação e rejeição de para um teste unilateral à direita para média populacional com desvio-
padrão conhecido.
0
Testes de hipóteses para a média populacional com desvio-
padrão conhecido
Na seção anterior, consideramos que o desvio-padrão populacional é conhecido. No entanto, na prática, quando realizamos um
teste de hipóteses, esse parâmetro raramente é conhecido. Nesses casos, devemos substitui-lo pelo desvio-padrão amostral .
Mas não é só isso, pois é preciso veri�car a distribuição da estatística de teste e o tamanho da amostra.
Para grandes amostras ( ), a estatística de teste passará a ser dada por:
σ
s
n > 30
=Z0
−X̄̄̄ μ0
s
n√
/
Sua distribuição pode ser considerada uma normal padrão, isto é, . Portanto, praticamente não haverá alteração na
realização do teste, a não ser pela substituição de por . Veja no exemplo a seguir.
N (0, 1)
σ s
 Fonte: Alexandre Debiève <https://unsplash.com/photos/FO7JIlwjOtU?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText> / Unsplash.
Exemplo 3
Para testar se a duração média de certo componente eletrônico é superior a 1.000 horas, o supervisor de Qualidade de uma
empresa observou uma amostra de 100 desses componentes e chegou a uma média de 1.005 horas com desvio-padrão de 40
horas. Ao nível de 0,05 de signi�cância, qual foi a conclusão do supervisor?
O desvio-padrão populacional é desconhecido, mas o tamanho da amostra maior que 30. Então, podemos realizar o teste de
forma semelhante ao que foi apresentado na seção anterior.
Os valores dados são:
σ
= 1. 000hμ0
n = 100
= 1. 005hX̄̄̄
s = 40h
As hipóteses que podemos considerar, nesse caso, são:
: μ = 1. 000hH0
: μ > 1. 000hH1
Por tratar-se de um teste unilateral, o ponto crítico será dado por:Zα
= = 1, 645Zα Z0,05
O ponto crítico acima é a média entre os valores e associados, respetivamente, aos valores de
probabilidade 0,4495 e 0,4505, na Tabela 2.
A estatística de teste será dada por:
Z = 1, 64 Z = 1, 65
https://unsplash.com/photos/FO7JIlwjOtU?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText
= = = = 1, 25Z0
−X̄̄̄ μ0
s
n√
/
1.005h−1.000h
40h
100√
/
5h
4
Como:
< 1, 645Z0
Então, concluímos pela aceitação de . Logo, ao nível de 0,05 de signi�cância, o supervisor não conseguiu concluir que o tempo
médio de duração desse tipo de componente seja superior a 1.000 horas (ele deve aceitar que ).
Quando o desvio-padrãopopulacional é desconhecido e a amostra é pequena ( ), a estatística de teste passa a ser:
H0
μ = 1. 000h
σ n ≤ 30
=T0
−X̄̄̄ μ0
s
n√
/
Tendo distribuição (valor da distribuição de student para uma probabilidade com graus de liberdade). Os valores
dessa distribuição são apresentados na Tabela 3. Vale ressaltar que, para testes bilaterais, a estatística de teste tem
distribuição .
tα;n−1 t t n − 1
T0
t ;n−1α 2/
Tabela 3 – Pontos percentuais da distribuição de student
g.l.
0,40 0,25 0,10 0,05 0,025 0,01 0,005 0,0025 0,001 0,0005
α
1 0,325 1,00 3,078 6,314 12,706 31,821 63,657 127,321 318,309 636,619
2 0,289 0,816 1,886 2,920 4,303 6,965 9,925 14,089 22,327 31,599
3 0,277 0,765 1,638 2,353 3,182 4,541 5,841 7,453 10,215 12,924
4 0,271 0,741 1,533 2,132 2,776 3,747 4,604 5,598 7,173 8,610
5 0,267 0,727 1,476 2,015 2,571 3,365 4,032 4,773 5,893 6,869
6 0,265 0,718 1,440 1,943 2,447 3,143 3,707 4,317 5,208 5,959
7 0,263 0,711 1,415 1,895 2,365 2,998 3,499 4,029 4,785 5,408
8 0,262 0,706 1,397 1,860 2,306 2,896 3,355 3,833 4,501 5,041
9 0,261 0,703 1,383 1,833 2,262 2,821 3,250 3,690 4,297 4,781
10 0,260 0,700 1,372 1,812 2,228 2,764 3,169 3,581 4,144 4,587
11 0,260 0,697 1,363 1,796 2,201 2,718 3,106 3,497 4,025 4,437
12 0,259 0,695 1,356 1,782 2,179 2,681 3,055 3,428 3,930 4,318
13 0,259 0,694 1,350 1,771 2,160 2,650 3,012 3,372 3,852 4,221
14 0,258 0,692 1,345 1,761 2,145 2,624 2,977 3,326 3,787 4,140
15 0,258 0,691 1,341 1,753 2,131 2,602 2,947 3,286 3,733 4,073
16 0,258 0,690 1,337 1,746 2,120 2,583 2,921 3,252 3,686 4,015
17 0,257 0,689 1,333 1,740 2,110 2,567 2,898 3,222 3,646 3,965
18 0,257 0,688 1,330 1,734 2,101 2,552 2,878 3,197 3,610 3,922
19 0,257 0,688 1,328 1,729 2,093 2,539 2,861 3,174 3,579 3,883
20 0,257 0,687 1,325 1,725 2,086 2,528 2,845 3,153 3,552 3,850
21 0,257 0,686 1,323 1,721 2,080 2,518 2,831 3,135 3,527 3,819
22 0,256 0,686 1,321 1,717 2,074 2,508 2,819 3,119 3,505 3,792
23 0,256 0,685 1,319 3,714 2,069 2,500 2,807 3,104 3,485 3,768
24 0,256 0,685 1,318 1,711 2,064 2,492 2,797 3,091 3,467 3,745
25 0,256 0,684 1,316 1,708 2,060 2,485 2,787 3,078 3,450 3,725
26 0,256 0,684 1,315 1,706 2,056 2,479 2,779 3,067 3,435 3,707
27 0,256 0,684 1,314 1,703 2,052 2,473 2,771 3,057 3,421 3,690
28 0,256 0,683 1,313 1,701 2,048 2,467 2,763 3,047 3,408 3,674
29 0,256 0,683 1,311 1,699 2,045 2,462 2,756 3,038 3,396 3,659
t
30 0,256 0,683 1,310 1,697 2,042 2,457 2,750 3,030 3,385 3,646
40 0,255 0,681 1,303 1,684 2,021 2,423 2,704 2,971 3,307 3,551
50 0,255 0,679 1,299 1,676 2,009 2,403 2,678 2,937 3,261 3,496
60 0,254 0,679 1,296 1,671 2,000 2,390 2,660 2,915 3,232 3,460
70 0,254 0,678 1,294 1,667 1,994 2,381 2,648 2,899 3,211 3,435
∞ 0,253 0,674 1,282 1,645 1,960 2,326 2,576 2,807 3,090 3,291
 Fonte: Crystal Kwok <https://unsplash.com/photos/xD5SWy7hMbw?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText> / Unsplash.
Exemplo 4
O setor de produção de uma empresa estima que a perda média de certo insumo seja de 26kg por cada tonelada processada.
Para testar essa informação, uma amostra de tamanho 25 foi observada e chegou-se a uma média de 27,8kg/ton com desvio-
padrão de 4,5kg/ton.
Considerando um nível de signi�cância de 10%, pode-se concluir que a a�rmação do setor de produção esteja correta?
Os valores dados são:
= 26μ0 Kg ton/
n = 25
= 27, 8X̄̄̄ Kg ton/
s = 4, 5 Kg ton/
As hipóteses que podemos considerar, nesse caso, são:
: μ = 26H0 Kg ton/
: μ = 26H1 Kg ton/
https://unsplash.com/photos/xD5SWy7hMbw?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText
Trata-se, portanto, de um teste bilateral.
Como o desvio-padrão populacional é desconhecido e a amostra é pequena ( ), então a estatística de teste será dada
por:
σ n ≤ 30
= = = = 2T0
−X μ0
s
n√
/
27,8−26
4,5
25√
/
1,8
0,9
E seu valor crítico para será:α = 0, 10
= = = 1, 711t ;n−1α 2/ t ;25−10,10 2/ t0,05;24
Como está na região de rejeição de , pois , então concluímos que a perda média desse insumo é diferente da
alegada pelo setor de produção.
Caso estivéssemos interessados em veri�car se a perda média do insumo é superior ao valor alegado (26 kg/ton), então teríamos
as seguintes hipóteses:
T0 H0 > 1, 711T0
: μ = 26H0 Kg ton/
: μ > 26H1 Kg ton/
E o teste seria considerado unilateral. Nesse caso, o valor crítico seria dado por:
= = = 1, 318tα;n−1 t0,10;25−1 t0,10;24
E continuaríamos a rejeitar a hipótese nula .
Na seção a seguir, veremos um método que nos permite testar a igualdade entre médias de três ou mais populações.
H0
Testes de hipóteses para a média populacional com três ou mais
amostras: ANOVA
Um teste bastante utilizado para comparar médias de diferentes populações é conhecido por Análise de Variância. Por meio dele
conseguimos determinar se há ou não diferença entre os valores de tais médias (relativas a um mesmo fator). Para uma melhor
ideia do cenário em que esse teste é aplicado, considere a situação apresentada no exemplo a seguir.

Fonte: Andreas160578 <https://pixabay.com/pt/users/andreas160578-2383079/?utm_source=link-
attribution&utm_medium=referral&utm_campaign=image&utm_content=2157211> / Pixabay.
Exemplo 5
Três marcas de gasolina aditivada, , e , estão sendo testadas quanto aos seus rendimentos médios. Para cada uma delas,
foi coletada uma amostra de 8 elementos, obtidos sob as mesmas condições.
Rendimentos (em km/litro)
Observação Gasolina A Gasolina B Gasolina C
1 9,7 9,4 9,6
2 9,5 9,3 9,4
3 9,9 9,5 9,9
4 9,6 9,7 9,8
5 9,5 9,1 9,7
6 9,8 9,8 9,4
7 9,9 9,4 9,5
8 9,7 9,5 9,4
Médias 9,70 9,46 9,59
Variâncias 0,03 0,05 0,04
O que se pretende, nesse tipo de teste, é determinar se as variações ocorridas nas amostras são reais (causadas por diferenças
signi�cativas nas populações observadas) ou aleatórias (decorrentes apenas da variabilidade amostral).
Considera-se que se as diferenças são pequenas, então são decorrentes de mera variação amostral. Mas, se por outro lado, tais
diferenças são grandes, então concluímos que as diferenças são geradas por causas reais, isto é, as amostras são provenientes
de populações cujas médias não são todas iguais.
A B C
Observe que esses são os mesmos fundamentos do teste que abordamos anteriormente.
Os pressupostos para aplicação da análise de variância são:
https://pixabay.com/pt/users/andreas160578-2383079/?utm_source=link-attribution&utm_medium=referral&utm_campaign=image&utm_content=2157211
As amostras devem ser aleatórias e independentes;
as populações devem ter distribuição normal com variâncias iguais.
No entanto, na prática, essas condições não necessitam ser satisfeitas de forma rigorosa. Os resultados são satisfatórios se a
distribuição não for acentuadamente assimétrica e se as variâncias forem próximas. Observe que os dados apresentados no
Exemplo 5 satisfazem tais condições.
As hipóteses, nesse caso, são:
: as médias populacionais são todas iguais ( )
: as médias populacionais não são todas iguais, isto é, há pelo menos uma diferente das demais.
Cada amostra representa uma população, que nesse caso, chamamos de tratamento.
A estatística de teste utilizada na análise de variância é conhecida por estatística e é dada por:
H0 = =μ1 μ2 μ3
H1
F
F =
variância entre amostras
variância dentro das amostras
A variância entre amostras mede as diferenças relacionadas ao tratamento a que cada amostra está submetida e é denotada por
, média entre quadrados.
A variância dentro das amostras avalia as diferenças entre os valores de uma mesma amostra e é denotada por , média
dos quadrados internos.
Portanto, podemos escrever:
MSB
MSW
F =
MSB
MSW
Se e forem próximos, isto é, se há pouca ou nenhuma diferença entre as médias, então a estatística de teste 
será próxima de 1. No entanto, se uma dessas médias for signi�cativamente diferente das demais, será maior que 
e será maior que 1.
À medida que o valor de cresce, há mais chances de rejeitar . Para concluirmos pela aceitação ou rejeição dessa
hipótese, precisamos compararo valor de com o valor crítico fornecido pela Tabela da Distribuição . Se for
maior que o valor crítico , então rejeitamos a hipótese nula .
MSB MSW MSB
MSB MSW
MSB
MSB H0
MSB Fc MSB MSB
F0 H0
Dica
Essa tabela, para um nível de signi�cância , pode ser encontrada aqui
<https://edisciplinas.usp.br/plugin�le.php/3333945/mod_resource/content/1/Distribuicao%20F%205%25.pdf> .
α = 0, 05
Veremos adiante como realizar esse teste utilizando o Excel, o que torna desnecessário o uso da referida tabela.
O Excel dispõe de um recurso denominado ANOVA, a maneira mais comum que utilizamos para nos referir à análise de variância.
Normalmente, esse teste é realizado pela montagem de uma tabela que leva esse nome. Ele é uma abreviação da expressão, em
inglês, que designa esse teste: analysis of variance.
A tabela ANOVA tem a seguinte disposição:
https://edisciplinas.usp.br/pluginfile.php/3333945/mod_resource/content/1/Distribuicao%20F%205%25.pdf
Variação Soma dos quadrados Graus de liberdade Média dos quadrados F
Entre
Interna
Os termos apresentados na tabela ANOVA são:
SSB g. l.N M =SB
SSB
g.l.N
MSB
MSW
SSW g. l.D M =SW
SSW
g.l.D
É a soma dos quadrados
entre as amostras.
SSB
É a soma dos quadrados
internos das amostras.
SSW
São os graus de liberdade
dados por 𝑘−1, em que 𝑘 é o
número de amostras.
g. l.N
São os graus de liberdade
dados por 𝑁−1, em que 𝑁 é a
soma dos tamanhos das
amostras.
g. l.D
É a variância entre as
amostras.
MSB
É a variância interna das
amostras.
MSW
Para obter a tabela ANOVA, via Excel, é preciso, primeiro habilitar as “Ferramentas de Análise” no menu “Dados”. Para isso, clique
no menu “Opções”. A Figura 4 mostra a janela que se abrirá.
 Figura 4: Janela de opções para instalação de suplementos do Excel.
Nela, selecione, à esquerda, a opção “Suplementos” e, em seguida, clique em “Ferramentas de Análise”. Dê “OK” e uma nova janela
se abrirá, como mostra a Figura 5. Nela, habilite a opção “Ferramentas de Análise” e clique em “Ir”. Pronto! A ferramenta que
precisamos já está instalada.
 Figura 5: Janela de opções para instalação de
suplementos do Excel.
Para certi�car-se, no menu, clique em “Dados” e veri�que se na barra de ferramentas aparece a opção “Análise de dados” (vide
Figura 6).
 Figura 6: Menu “Dados” com a opção “Análise de Dados”.
Voltando aos dados do Exemplo 5, vamos construir uma tabela ANOVA utilizando o Excel. Após digitar os valores referentes às
amostras de consumos dos três tipos de gasolina, em uma planilha do Excel, clique, no menu, em “Dados” e, em seguida, na
opção “Análise de Dados”.
Na janela que se abrirá, “Análise de dados”, selecione a primeira opção “ANOVA: fator único” e clique em “OK”. Na nova janela,
clique no campo “Intervalo de entrada” e selecione o intervalo no qual os valores estão digitados, como mostra a Figura 7.
 Figura 7: Ferramenta “ANOVA: fator único”.
Vamos considerar um nível de signi�cância para esse teste. Observe que você pode digitar o nível que desejar. Em
seguida, clique em “OK”. Uma nova planilha será criada com a tabela ANOVA, conforme mostrado na Figura 8.
α = 0, 05
 Figura 8: Resumo dos dados e Tabela ANOVA para os dados do Exemplo 5.
Pelos resultados apresentados, temos:
F = 3, 011111 e = 3, 4668Fc
Como , então, aceitamos a hipótese nula , ou seja, não há evidências que nos permitam concluir que há diferença
entre os rendimentos das gasolinas , e .
F < Fc H0
A B C
Atividade
1. Sobre o nível de signi�cância de um teste de hipóteses é correto a�rmar que:
a) É a probabilidade de cometer qualquer tipo de erro na conclusão do teste.
b) Representa a probabilidade de aceitar a hipótese nula quando ela é verdadeira.
c) Indica a chance de cometer um erro do tipo II, isto é, aceitar a hipótese nula quando ela é falsa.
d) É a probabilidade de cometer um erro do tipo I, isto é, rejeitar a hipótese nula quando ela é verdadeira.
e) A confiança que podemos ter no teste.
2. Uma empresa de e-commerce alega que o tempo entre a autorização do pagamento de um pedido e a sua entrega, na mesma
região, tem média igual a 25,6 horas. Para testar essa alegação, um auditor observou uma amostra de 25 entregas dessa loja e
chegou a uma média de 26,8 horas com desvio-padrão de 4,8 horas. Considerando um nível de signi�cância de 5%, há evidências
para contestar a alegação da empresa?
3. Quatro instituições bancárias estão sendo avaliadas quanto aos tempos de espera de seus clientes para a realização de
serviços de caixa. Amostras foram selecionadas e, a partir dos dados coletados, chegou-se à seguinte tabela ANOVA para um
nível de signi�cância de 5%:
ANOVA
Fonte da variação SQ gl MQ F valor-P F crítico
Entre grupos 1,84375 3 0,614583 0,01897 0,996363 2,946685
Dentro dos grupos 907,125 28 32,39732
Total 908,9688 31
Com base nos resultados e considerando o nível de signi�cância dado, a que conclusão podemos chegar?
Referências
BUSSAB, Wilton de O.; MORETTIN, Pedro A. Estatística básica. 5. ed. São Paulo: Saraiva, 2002.
HINES, W. W.; MONTGOMERY, D. C.; GOLDSMAN, D. M.; BORROR, C. M. Probabilidade e estatística na engenharia. Rio de Janeiro:
LTC, 2006.
LARSON, R.; FARBER, B. Estatística aplicada. 4. ed. São Paulo: Pearson Prentice Hall, 2010.
LEVINE, David M.; STEPHAN, David F.; SZABAT, Kathryn A. Estatística: teoria e aplicações usando Microsoft Excel em português. 7.
ed. Rio de Janeiro: LTC, 2016.
MAGALHÃES, Marcos N.; LIMA, Antonio C. P de. Noções de probabilidade e estatística. 6. ed. São Paulo: Editora da Universidade
de São Paulo, 2004.
MONTGOMERY, Douglas C. Introdução ao controle estatístico de qualidade. 7. ed. Rio de Janeiro: LTC, 2016.
TRIOLA, Mario F. Introdução à estatística: atualização da tecnologia. Rio de Janeiro: LTC, 2015.
Próxima aula
Correlação linear;
Regressão linear.
Explore mais
Pesquise na internet, sites, vídeos e artigos relacionados ao conteúdo visto. Em caso de dúvidas, converse com seu professor
online por meio dos recursos disponíveis no ambiente de aprendizagem.
Leia os textos:
Teste de hipóteses <http://www.leg.ufpr.br/~paulojus/CE210/ce210/node3.html> ;
Teste de hipóteses <http://www.ufscar.br/jcfogo/Estat_2/arquivos/Teste_Hipotese.pdf> .
http://www.leg.ufpr.br/~paulojus/CE210/ce210/node3.html
http://www.ufscar.br/jcfogo/Estat_2/arquivos/Teste_Hipotese.pdf

Continue navegando