Testes De Hipóteses

•

UFF

0

Thiago Queiroz

01/11/2018

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 23 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 23 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 23 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Estatística II

3.261 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

23/05/2016
1
TESTES DE HIPÓTESES
Introdução
• Os processos que habilitam a decidir se 
aceitam ou rejeitam as hipóteses 
formuladas, ou determinar se a amostra 
observada difere, de modo significativo, 
dos resultados esperados, são 
denominados de Testes de Hipóteses ou 
Testes de Significância.
23/05/2016
2
• HIPÓTESE NULA - É aquela Hipótese 
Estatística, prefixada, formulada sobre o 
parâmetro populacional estudado, com o 
único propósito de ser rejeitada ou 
invalidada. É representada por Ho.
• HIPÓTESE ALTERNATIVA - São 
quaisquer hipóteses que difiram da 
Hipótese Nula. Utilizaremos uma hipótese 
alternativa, representada por H1.
Erros do tipo I e tipo II
Decisões possíveis
Estados possíveis
Ho verdadeira Ho falsa
Aceitação de Ho Decisão correta Erro do tipo II
Rejeição de Ho Erro do tipo I Decisão correta
23/05/2016
3
Nível de significância
• Ao testar uma hipótese estabelecida, a 
probabilidade máxima com a qual se sujeitaria a 
correr o risco de um erro do tipo I é denominada 
de Nível de Significância do Teste. Essa 
probabilidade, representada freqüentemente por 
αααα, é geralmente especificada antes da 
extração de quaisquer amostras, de modo que 
os resultados obtidos não influenciem na 
escolha.
Tipos de testes de hipóteses
• Consideremos θθθθ o parâmetro estudado e θθθθo o valor inicialmente suposto 
para θθθθ.
• Se nas hipótese formuladas forem do tipo:
• O teste de hipóteses é denominado de TESTE BILATERAL
– Ho � θ = θo
– H1 � θ ≠ θo
• O teste é denominado de TESTE UNILATERAL Á DIREITA
– Ho � θ = θo
– H1 � θ > θo
• O teste é denominado de TESTE UNILATERAL Á ESQUERDA
– Ho � θ = θo
– H1 � θ < θo
23/05/2016
4
Etapas de um teste de hipóteses
• a) Formular as hipóteses H0 e H1.
• b) Escolher a variável de teste.
• c) Arbitrar o nível de significância.
• d) Determinar a regiões de aceitação e rejeição 
de H0 a partir do nível de significância arbitrado 
em (c).
• e) Aceitar ou rejeitar H0 em função da 
estatística de teste e das regiões de aceitação e 
rejeição determinadas na letra (d).
Teste da média populacional
• No caso do teste da média µ de uma 
população, as hipóteses são:
• H0 : µ = µ0
• H1: 





>
<
≠
direito) unilateral (teste 
esquerdo) unilateral (teste 
bilateral) (teste 
0
0
0
µµ
µµ
µµ
23/05/2016
5
Teste da média populacional
• VARIÂNCIA POPULACIONAL 
CONHECIDA
• Nas hipóteses acima, µ0 é valor 
de µ sob a hipótese nula H0. A 
variável de teste é a variável 
normal padronizada associada a 
(se amostragem é com reposição)
• se a amostragem é sem reposição
• a hipótese H0 será rejeitada num 
nível de significância α se Zx < −Z 
ou Zx >Z (teste bilateral), Zx< −Z
(teste unilateral esquerdo) ou 
Zx>Z (teste unilateral direito).
n
XZ X σ
µ0−
=
1
0
−
−
−
=
N
nN
n
XZ X σ
µ
Exemplo
• Supõe-se que o preço de determinado artigo nos pontos 
de venda de certa localidade tem distribuição normal 
com média igual a R$105,00 e desvio padrão igual a 
R$10,00. Suspeita-se que, devido ao aumento da 
demanda, o preço do referido artigo tenha aumentado 
na região. Para verificar se isto ocorreu, um pesquisador 
analisou os preços deste artigo em 40 pontos de venda 
da localidade, escolhidos aleatoriamente, constatando 
que nos pontos de venda pesquisados o preço médio 
do artigo é R$110,00. Qual é a conclusão do 
pesquisador, admitindo-se um nível de significância de 
5%?
23/05/2016
6
Solução
a) Hipóteses 
H0: µ = 105 
H1: µ > 105 
 A hipótese nula H0 considera que o aumento da demanda não provocou aumento do preço 
enquanto que a hipótese alternativa H1 admite que o aumento da demanda provocou aumento do 
preço porque o preço médio do artigo na amostra de 40 pontos de venda é R110,00 maior que 
R$105,00. 
 
b) Escolha da variável teste 
Não tendo sido informado o tamanho da população (número de ponto de venda na 
localidade) admite-se amostragem com reposição ou amostragem sem reposição de uma população 
infinita ou população finita muito maior que a amostra. Como n = 40 > 30, a variável teste é a 
variável normal padronizada XZ sendo seu valor dado por 
n
x
z X σ
µ0−
= 
onde ,110=x 1050 =µ e σ = 10. Com estes dados tem-se que 
16,3
40
10
105110
=
−
=Xz 
Solução
a) Regra de decisão 
Sendo o teste unilateral direito e α = 0,05, o valor crítico da variável XZ é tal XZ que 
05,0)( 05,0 => zZP X como ilustra o gráfico a seguir onde o nível de significância é representado 
pela área sombreada. 
 
Figura 5.10 
Pelo gráfico acima tem-se que .45,0)0( 05,0 =<< zZP X Pela tabela do apêndice 1 tem-se que 
.64,105,0 =z Então a regra de decisão é: aceitar H0 se 64,1≤Xz e rejeitar H0 se .64,1>Xz 
 
b) Conclusão 
Como 16,305,0 =z > 1,64 rejeita-se H0 num nível de significância de 5%, admitindo-se 
então que o aumento da demanda provocou aumento do preço do artigo na localidade. 
23/05/2016
7
Teste da média populacional
• VARIÂNCIA POPULACIONAL 
DESCONHECIDA
• Nas hipóteses acima, µ0 é valor 
de µ sob a hipótese nula H0. A 
variável de teste é a variável T DE 
Student com gl=n-1 associada a 
(se amostragem é com reposição)
• se a amostragem é sem reposição
• a hipótese H0 será rejeitada num 
nível de significância α se Tx < −T 
ou Tx >T (teste bilateral), Tx< −T
(teste unilateral esquerdo) ou 
Tx>T (teste unilateral direito).
n
S
XT 0µ−=
1
0
−
−
−
=
N
nN
n
S
XT µ
Exemplo
• O tempo gasto na montagem de determinado 
equipamento é 85 minutos. Os operários foram 
submetidos a um processo de reciclagem com o objetivo 
de melhorar a produtividade. Para verificar se isso 
ocorreu, o pesquisador observou o tempo gasto na 
montagem de 10 unidades deste equipamento, 
escolhidas ao acaso na linha de produção, obtendo os 
seguintes valores, em minutos: 81, 84, 82, 78, 77, 83, 
79, 79, 76, 85. Considerando-se um nível de 
significância de 5%, pode-se afirmar que após a 
reciclagem dos operários houve aumento da 
produtividade?
23/05/2016
8
Solução
a) Hipóteses 
H0: µ = 85 
H1: µ < 85 
 A hipótese nula H0 considera que a produtividade dos operários não aumentou enquanto que 
a hipótese alternativa H1 admite que a produtividade dos operários aumentou porque acredita-se 
que com a reciclagem o tempo médio gasto na montagem do equipamento será menor que 85 
minutos. 
 
b) Escolha da variável teste 
Não tendo sido informado o tamanho da população (número de ponto de venda na 
localidade) admite-se amostragem com reposição ou amostragem sem reposição de uma população 
infinita ou população finita muito maior que a amostra. Sendo desconhecido o desvio padrão 
populacional σ, a variável teste é a variável XT sendo seu valor dado por 
n
s
x
t X
0µ−
= 
onde 
Solução
23/05/2016
9
Solução
2) Testes de hipóteses para σ² (variância).
Teste de Hipóteses
Estatística de teste.
2
2
2 )1(
σ
χ Sn −=
é uma variável aleatória qui-quadrado com n-1 graus de liberdade
Tabela da Distribuição Qui - quadrado
23/05/2016
10
2) Testes de hipóteses para σ² (variância).
Teste de Hipóteses
Observação quanto aos gráficos:
a)Teste bilateral ou bicaudal
b)Teste lateral à direita
c)Teste lateral à esquerda
Exemplo
• A média da vida útil para uma amostra de n = 10 
lâmpadas é x = 4000 horas, com um desvio 
padrão de s = 200 horas. Supõe-se que a vida 
útil das lâmpadas, em geral, seja normalmente 
distribuída. Suponha que, antes de ser coletada 
a amostra, foi feita a hipótese de que o desvio 
padrão não era maior do que σ = 150. Com 
base nos resultados amostrais, teste tal 
hipótese ao nível de significância de 1%.
23/05/201611
Solução
Hipóteses Ho: σ² ≤ 22500 (σ² = 150²) 
 Ha: σ² > 22500 
Variável teste χ² = = = 16 
Da tabela da Distribuição Quiquadrado, obtemos o valor de χ²(α = 1% ; gl = 10- 1 = 9) = 21,67. 
Conclusão: Como χ²calculado =16 < χ²tabelado = 21,67, aceita-se Ho, ao nível de 
significância de 1%. Ou seja, o desvio padrão não é maior que σ = 150. 
3) Testes de hipóteses para proporção.
Teste de Hipóteses
a proporção amostral para amostras grandes (n≥30),
seleção com substituição.
n
xip ∑=
^
)1,0(~)1(
)1(
;~
N
n
PZ
n
Np
P
pipi
pi
pipi
pi
−
−
=





 −
23/05/2016
12
Teste de Hipóteses
a) H0: pi = pi 0 Teste Bilateral
H1: pi ≠ pi 0
-zα/2 zα/20
b) H0: pi = pi 0 Teste unilateral à esquerda
H1: pi < pi 0
-zα 0
c) Ho: pi = pi 0 Teste unilateral à direita
H1: pi > pi 0
Teste de Hipóteses
zα0
23/05/2016
13
Exemplo
• Uma máquina está regulada quando 
produz 3% de peças defeituosas. Uma 
amostra aleatória de 80 peças 
selecionadas ao acaso apresentou 3 
peças defeituosas. Teste ao nível de 2% a 
hipótese de que a máquina está regulada.
Solução
23/05/2016
14
Solução (cont.)
Definimos, assim, uma região de aceitação (RA) e uma região crítica (RC) para a 
hipótese nula, Ho: 
 
Conclusão: O valor Zc = 0,393 situa-se à esquerda do valor de Zα = 2,055 obtido na 
tabela. Portanto está na região de aceitação da hipótese nula. Assim, aceita-se Ho, ou 
seja, p = 0,03, ao nível de significância de 2% a máquina está regulada. 
Teste de hipóteses da diferença 
entre duas medias populacionais
• O procedimento associado com o teste da diferença 
entre duas medias é similar ao utilizado no teste de um 
valor hipotético da media populacional, exceto que se 
utiliza o erro padrão da diferença entre medias como 
base para se determinar o valor da estatística de teste 
associada com os resultados das amostras.





<−
>−
≠−
=−
0:
0:
0:
0:
211
211
211
210
µµ
µµ
µµ
µµ
H
H
H
H
23/05/2016
15
Populações normais com 
variâncias conhecidas
Observação: Quando as variâncias populacionais forem desconhecidas, mas (n 1 + n2) ? 30, usamos as suas 
estimativas não tendenciosas (variâncias amostrais 21s e 22s ), no cálculo da estatística de teste tz : 
 
 
 
 
 
 
( )
2
2
2
1
2
1
21
n
s
n
s
xx
zt
+
−
= 
2
2
2
1
2
1
2121 )((
nn
xx
z
σσ
µµ
+
−−−
=
Populações normais com variâncias 
equivalentes e desconhecidas
Quando as variâncias de duas populações Normais forem desconhecidas, mas iguais e (n 1 + n 2) < 30, usamos
uma media ponderada das variâncias amostrais 21s e 
2
2s , no cálculo da estatística de teste tt : 
 
 
 
 
 
 
 
 
 A distribuição t é utilizada com um número de graus de liberdade igual a gl = n 221 −+n 
( )
( ) ( )
2
1111
21
2
22
2
11
21
21
−+
−+−






+
−
=
nn
snsn
nn
xx
t t 
23/05/2016
16
Populações normais com variâncias 
desiguais e desconhecidas
Teste de hipóteses da diferença entre duas medias 
populacionais com observações emparelhadas
• Fazemos testes de comparação de médias para 
dados emparelhados (amostras pareadas), 
obtidas de populações Normais, quando os 
resultados das duas amostras são relacionados 
dois a dois, de acordo com algum critério que 
fornece uma influência entre os vários pares e 
sobre os valores de cada par. 
• Para cada par definido, o valor da primeira 
amostra está claramente associado ao 
respectivo valor da segunda amostra. 
23/05/2016
17
Teste de hipóteses da diferença entre duas medias 
populacionais com observações emparelhadas
Para observações emparelhadas, ou amostras pareadas, o teste apropriado para a diferença entre duas médias 
consiste em determinar primeiro a diferença “d” entre cada par de valores, e então testar a hipótese nula de 
que a média das diferenças na população é zero. Então, do ponto de vista de cálculo, o teste é aplicado a uma 
única amostra de valores d. 
 A média e o desvio padrão da amostra de valores “d” são obtidos pelas fórmulas: 
 
 
 
 
 
 
 
n
d
d ∑= 2
2
d
n
d
S d −=
∑
 
Teste de hipóteses da diferença entre duas medias 
populacionais com observações emparelhadas
A estimativa do erro padrão da diferença média entre observações emparelhadas é obtida pela fórmula: 
 
 
 
 
 
 
 Uma vez que o erro padrão da diferença média é calculado com base nas diferenças observadas em 
amostras emparelhadas (logo σ é desconhecido) e uma vez que os valores de d geralmente podem ser 
admitidos como tendo distribuição Normal, as distribuições t são apropriadas para testar a hipótese nula de 
que 0=dµ . A distribuição t nesse caso terá um número de graus de liberdade igual a: gl = n-1 
 A estatística de teste, então, será dada por: 
 
 
 
 
 
 
 Observe que, se n?30 utilizamos z t (distribuição normal) no lugar de tt 
1
ˆ
−
=
n
Sd
dσ 
d
d
t
o
d
t
σ
µ
ˆ
−
= 
23/05/2016
18
Exemplo
Dez cobaias foram submetidas ao tratamento de engorda com certa ração. 
Os pesos em gramas, antes e após o teste são dados a seguir (supõe-se que 
provenham de distribuições normais). A 1% de significância, podemos 
concluir que o uso da ração contribuiu para o aumento do peso médio dos 
animais?
Cobaia 1 2 3 4 5 6 7 8 9 10 
Antes 635 704 662 560 603 745 698 575 633 669 
Depois 640 712 681 558 610 740 707 585 635 682 
 
Solução
• Trata-se de uma situação em que queremos 
comparar as MÉDIAS DE DUAS distribuições 
normais, supondo que se trata da MESMA 
população, mas em dois momentos diferentes: 
antes e após um tratamento de engorda. 
• Aplicar um TESTE DE DIFERENÇAS ENTRE 
MÉDIAS POPULACIONAIS, PARA DADOS 
PAREADOS (MESMA POPULAÇÃO: ANTES E 
DEPOIS). 
23/05/2016
19
Solução
a)
b) Através dos valores das amostras antes e depois, calcular a diferença di entre cada 
par de valores, onde 
di = Xantes - Xdepois. 
Para o conjunto sob análise teremos: 
 
Cobaia 1 2 3 4 5 6 7 8 9 10 
Antes 635 704 662 560 603 745 698 575 633 669 
Depois 640 712 681 558 610 740 707 585 635 682 
di -5 -8 -19 2 -7 5 -9 -10 -2 -13 
di2 25 64 361 4 49 25 81 100 4 169 
 
Solução
Para o presente problema: 
 
 
23/05/2016
20
Solução
c)
d)
•
• Para valores maiores de -2,82 
aceitaremos H0 (ou seja a dieta não 
faz efeito, a diferença entre as médias 
é nula). Se tn-1 for menor do que -
2,82 rejeitaremos H0 (a média 
DEPOIS aumentou demais em relação 
à média ANTES da dieta para que a 
diferença seja devida apenas ao 
acaso. Claro que há uma chance de 
1% de que venhamos a rejeitar H0 
sendo ela verdadeira. 
Solução
e)
Conforme foi visto anteriormente, se o valor da variável de teste fosse MENOR do que 
-2,82 a hipótese H0 seria rejeitada: 
 
Assim, REJEITAMOS H0 a 1% de significância. 
Assim, concluímos com 99% de confiança (ou uma chance de erro de 1%) que a dieta 
contribuiu para o aumento do peso médio dos animais. 
23/05/2016
21
Teste da igualdade de variâncias
Em muitas aplicações deseja-se verificar se duas populações têm variâncias iguais (populações 
homocedásticas) ou variâncias diferentes (populações heterocedásticas). Suponha que uma variável 
normalmente distribuída tenha variância 21σ numa população 1 e 
2
2σ noutra população 2. Por uma 
questão de referência, considera-se índice 1 para a maior variância e índice 2 para a menor. Em 
algumas aplicações deseja-se saber se 21σ > 22σ . 
As hipóteses do teste são: 
H0: 21σ = 
2
2σ (Populações homocedásticas) 
H1: 21σ > 
2
2σ(Populações heterocedásticas) 
O teste se baseia na razão de variâncias amostrais 
2
2
2
1
S
S
 
Teste da igualdade de variâncias
sendo esta a variável de teste neste caso
sendo 21s e 
2
2s as estimativas de 
2
1σ e 
2
2σ , respectivamente. 
A hipótese H0 é rejeitada num nível de significância α se 1,1; 21 −−> nnc FF α e aceita em caso contrário, 
sendo 1,1; 21 −−> nnc FF α o valor crítico da variável teste. 
23/05/2016
22
Exemplo
• Um produtor de café dispõe de duas máquinas de para 
ensacar o produto. O produtor desconfia que a variação 
do peso líquido na primeira máquina é maior que na 
segunda. Para verificar se isto está ocorrendo, pesam-
se 61 sacas da primeira máquina e 41 sacas da 
segunda, escolhidas aleatoriamente e constata-se que 
as variâncias dos pesos nas duas amostras são 25 kg2 
e 8 kg2, respectivamente. Considerando-se um nível de 
significância de 5%, pode-se afirmar que a variação do 
peso líquido na primeira máquina é maior que na 
segunda máquina? 
Solução
Hipóteses 
 Sejam 21σ e 22σ as variâncias do peso líquido na primeira e na segunda máquinas, 
respectivamente. As hipótese do teste são 
H0: 22
2
1 σσ = 
H1: 22
2
1 σσ > 
Pela hipótese nula H0 a variação do peso líquido na primeira máquina é a mesma nas 
duas máquinas enquanto que pela hipótese alternativa H1 a variação do peso líquido na primeira 
máquina é maior que na segunda. 
 
b) Escolha da variável teste 
 A variável teste tem distribuição F com 11 −n graus de liberdade no numerador e 
12 −n graus de liberdade no denominador e seu valor é 
2
2
2
1
s
s
Fc = 
sendo 2521 =s e .821 =s Então o valor da variável teste para esta amostra é 
8
25
=cF ∴ 12,3=cF 
23/05/2016
23
Solução
c) Regra de decisão 
 Sendo α = 0,05, 60111 =−= nν e 40111 =−= nν , onde n1 é o número de sacas escolhidas 
aleatoriamente da primeira máquina e n2 é o número de sacas escolhidas aleatoriamente da segunda 
máquina, o valor crítico da variável teste, 40;60;0 5,0F , é tal que 05,0)( 40;60;05,0 => FFP c , sendo esta 
situação ilustrada no gráfico a seguir onde a área sombreada representa o nível de significância. 
 
Figura 5.15 
Observando-se o gráfico acima tem-se pela tabela do apêndice 4 que .64,140;60;05,0 =F
Então a regra de decisão é: aceitar H0 se 64,1≤cF e rejeitá-la em caso contrário. 
 
d) Decisão 
 Como 12,3=cF > 1,64, rejeita-se H0 no nível de significância de 5%. Conclui-se então que 
a variação do peso líquido das sacas na máquina 1 é maior que a variação do peso líquido na 
máquina 2.