Microsoft_PowerPoint_-_aula2inferencia_[Modo_de_Compatibilidade]

•

UNESP

Guilherme Correia

27/11/2012

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 12 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 12 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 12 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Estatística Aplicada

23.928 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

1
Inferência EstatísticaInferência Estatística
20122012
2
Problemas de inferência
Inferir significa fazer afirmações sobre algo 
desconhecido.
A inferência estatística tem como objetivo fazer 
afirmações sobre uma característica de uma 
população a partir do conhecimento de dados de 
uma parte desta população (isto é, uma amostra de 
n observações).
A população é representada por uma distribuição 
de probabilidade com parâmetro(s) cujo(s) valor(es) 
é (são) desconhecido(s).
Fazemos inferências sobre o(s) parâmetro(s).
3
Problemas de inferência
Se θ é o parâmetro da distribuição de uma v. a. X e 
X1,...,Xn é uma amostra desta distribuição, temos três 
problemas típicos:
1. Estimação pontual
Apresentar um valor para θ, que é uma função 
da amostra X1,...,Xn (“cálculo” de θ), chamada de 
estimador de θ.
Espera-se que o estimador tenha boas 
propriedades: (i) em média esteja próximo de θ, (ii) 
o estimador se aproxima de θ quando n aumenta.
4
Propriedades dos estimadores
Não –viciado
Um estimador =H(X1,...,Xn) é um estimador não viciado de θ se:θˆ
( ) Θ∈∀= θθθ ;ˆE
Exemplo 1: Se X1,..., Xn é uma amostra aleatória de tamanho n de
X~N(µ;4). Mostrar que a média amostral é um estimador não-viciado
de µ.
Consistência
Um estimador =H(X1,...,Xn) é um estimador consistente de θ se,
para todo ε >0.
nθˆ
( ) 0|ˆ|lim =>−
∞→
εθθP
n
5
( )
( ) 0ˆlim)(
ˆlim)(
=
=
∞→
∞→
n
n
n
n
Varii
Ei
θ
θθ
É equivalente
Exemplo 2: Considere o exemplo 1, mostre que a média amostral é um
estimador consistente de µ.
Eficiência 
Dois estimadores 1ˆθ e 2ˆθ , não viciados de θ. Dizemos 
que 1ˆθ é mais eficiente que 2ˆθ se: 
 
)ˆ()ˆ( 21 θθ VarVar <
6
Exemplo 3: Considere o exemplo 1. Sejam X=1ˆθ
12
ˆ X=θ , dois estimadores não viciados de
Demonstrar que 1ˆθ é mais eficiente que 2ˆθ . 
 
 
4)ˆ(
4)ˆ(
2
1
=
=
θ
θ
Var
n
Var
1),ˆ()ˆ( 21 >∀< nVarVar θθ
2
7
Problemas de inferência
2. Estimação intervalar
Apresentar um intervalo de possíveis valores para θ, 
chamado de intervalo de confiança. Os limites do 
intervalo são funções da amostra X1,...,Xn (são 
aleatórios).
A probabilidade de que o intervalo contenha θ deve 
ser alta.
A amplitude do intervalo deve ser tão pequena
quanto possível (intervalo mais preciso).
8
Definição[Intervalo de Confiança] Seja X1,...,Xn uma amostra 
aleatória de uma população com a característica X~f(x,θ). Seja 
T1=L(X1,...,Xn) e T2=U(X1,...,Xn) duas estatísticas tais que T1< T2 e que 
.1)( 21 αθ −=<< TTP 
O intervalo (T1, T2) é chamado de intervalo de 100(1-α)% de 
confiança para θ. 
 
Notação: IC(θ,1-α)= (T1, T2), onde T1 e T2 são os limite inferior 
superior respectivamente e 1-α é o coeficiente (ou nível) de 
confiança 
9
2. Intervalo de confiança para uma média populacional
Suponha que nXX L,1 é uma amostra aleatória de tamanho n, de uma 
população normal com média µ (desconhecida) e variância σ2
(conhecida). Vimos que a média amostral X , tem distribuição normal 
com média µ e variância σ2/n. Isto é 
 
)1,0(~ N
n
XZ
σ
µ−
=
Logo, fixando um nível de confiança (1-αααα), pode-se determinar
zαααα/2 de tal forma:.
ααα −=≤≤− 1)(
22
zZzP
Ou que é equivalente
α
σ
µ
αα −=≤
−≤− 1)
/
(
22
z
n
X
zP
10
876876 EE
n
zX
n
zXz
n
X
z
σµσ
σ
µ
αααα
2222 /
+≤≤−⇔≤−≤−
( )EXEX
n
zX
n
zXIC +−=






×+×−=− ;;)1,(
22
σσ
αµ αα
Logo,O intervalo de 100 (1-αααα)% de confiança para µµµµ é dado por:.
α
σµσ αα −=






×+≤≤×− 1
22 n
zX
n
zXP
11
Exemplo 1: Em uma industria de cerveja, a quantidade de cerveja
inserida em latas tem-se comportado como uma distribuição
normal com média 350 ml e desvio padrão 3 ml. Após alguns
problemas na linha de produção, suspeita-se que houve alteração
na média. Uma amostra de 20 latas acusou uma média 346 ml.
Obtenha um intervalo de 95% para a quantidade média µ de
cerveja inserida em latas, supondo que não tenha ocorrido
alteração na variabilidade.
Seja X: quantidade de cerveja inserida em latas após alguns problemas
)9,(~)9,(~
n
NXNX µµ ⇒
.95,0-1346;,20 === αxn
Do problema temos:
12
Já que 1-α=0,95, temos da tabela normal padrão z0,025.=1,96.






×+×−=
n
X
n
XIC σσµ 96,1;96,1)95,0,(
( )
( )31,347;69,344
31,1346;31,1346
20
396,1346;
20
396,1346)95,0,(
=
+−=





×+×−=µIC
3
13
3. Intervalo de confiança para uma média populacional
para amostras grandes
Suponha que nXX L,1 é uma amostra aleatória de tamanho n, de uma 
população com média µ (desconhecida) e variância σ2 (conhecida). 
Vimos que a média amostral X , tem distribuição aproximadamente 
normal com média µ e variância σ2/n, quando n é suficientemente 
grande. Isto é 
 
.),1,0(~
/ .
∞→
−
= nN
n
XZ
aproxσ
µ
Um intervalo de 100 (1-αααα)% de confiança para µµµµ é dado por:.








×+×−=−
n
zX
n
zXIC σσαµ αα
22
;)1,(
14
Exemplo 3: A associação dos proprietários de indústrias
metalúrgicas está muito preocupado com o tempo perdido com
acidentes de trabalho, cuja média, nos últimos tempos, tem
sido de ordem de 60 horas/homem por ano e desvio padrão de
20 horas/homem. Testou-se um programa de prevenção de
acidentes, após o qual foi tomada uma amostra de 30
industrias e medido o número de horas/homem perdidas por
acidente, que foi de 50 horas em média. Obtenha um intervalo
de 95% de confiança para o tempo médio perdido em acidentes
de trabalho após o novo programa de prevenção, supondo que
não houve mudança na variabilidade.
Do problema temos:
.95,0-1;20;05;30 ==== ασxn
Seja X: tempo perdido em acidentes de trabalho após o novo programa
de prevenção
15
Um intervalo de 95% de confiança para µµµµ é dado por:.






×+×−=
n
zX
n
zXIC σσµ αα
22
;)95,0,(
Já que 1-α=0,95, temos da tabela normal padrão z0,025.=1,96.






×+×−=
n
X
n
XIC σσµ 96,1;96,1)95,0,(
( )
( )27,53;46,73
27,350;3,2750
36
1096,150;
36
1096,150)95,0,(
=
+−=





×+×−=µIC
16
4. Intervalo de confiança para uma média populacional quando σσσσ é 
desconhecido
A distribuição t-Student
Supondo que a característica de interesse da população é
normal, a variável aleatória
)1(
n
S
XT µ−=
tem distribuição de probabilidade conhecida com distribuição t
de Student com n-1 graus de liberdade.
( )
1
;
1
2
1
1 −
−
==
∑
∑ =
=
n
XX
SX
n
XOnde
n
i
in
i
i
17
Notação; T~t(k), indica que v.a tem distribuição t-Student com k
graus de liberdade.
Propriedades: se T~t(k)
)1,0(~)(
2,
2
)(;0)()(
NTkii
k
k
kTVarTEi
⇒∞→
>
−
==
Uso Da Tabela Distribuição t-Student
αα =≥ )( , ktTP
18
Considerando a variável dada em (1), pode-se mostrar que um
intervalo de 100(1-αααα)% de confiança para µµµµ é dado por:
( )EXEX
n
S
tX
n
S
tXIC
E
n
E
n +−=










×+×−=−
−−
;;)1,( 1,2/1,2/
4342143421
αααµ
Exemplo 4: Um administrador de uma cadeia de supermercados
deseja estimar as vendas médias semanais (µ) da cadeia de
supermercado, para isto selecionou uma amostra aleatória de 10
supermercados entre todos que formam a cadeia, que produziu
os seguintes resultados, em milhares de dólares:
36,4 35,7 37,2 36,5 34,9 35,2 36,3 35,8 36,6 36,9 
Construir um intervalo de confiança para µ, com nível de confiança
de 95%, assumindo que as vendas tem distribuição normal
4
19
( )
2325,0;7352,0
1
;5,36
10
1
210
1
10
1
==
−
∑ −
==∑= =
= n
S
n
XX
SXX i
i
i
i
Já que, n=10 (1-αααα)=0,95,→→→→ αααα=0,05, temos: t0,025, 9=2,262
53,0)2325,0)(262,2( ==E
( ) ( )03,37;97,3553,05,36;53,05,36)95,0,( =+−==µIC
( )EXEXIC +−== ;)95,0,(µ
( )EXEX
n
S
tX
n
S
tXIC
E
n
E
n +−=










×+×−=
−−
;;)95,0,( 1,2/1,2/
4342143421
ααµ
20
Foram coletados dados de viscosidade de um líquido produzido em
batelada. Resultados de 40 amostras encontram-se abaixo.
Apresente um IC de 95% para a viscosidade média.
Exemplo (p. 28 em Montgomery et al., 2004)
Dados: 13,3 14,5 15,3 15,3 14,3 14,8 15,2 14,5 14,6 14,1 
14,3 16,1 13,1 15,5 12,6 14,6 14,3 15,4 15,2 16,8 14,9 13,7 
15,2 14,5 15,3 15,6 15,8 13,3 14,1 15,4 15,2 15,2 15,9 16,5 
14,815,1 17,0 14,9 14,8 14,0.
( ) .948,0875,14
140
1
 e 875,14
40
1 40
1
2
40
1
=−
−
=== ∑∑
=
=
i i
i
i XsXX
Solução. Inicialmente calculamos
Pelo enunciado, n = 40 e 1 - α =
0,95, de modo que α = 0,05. Da
tabela (Tábua III) com 40 g.l.
(39 g.l. não estão na Tábua III)
e p = 5%, obtemos tα/2 = 2,021.
21
Exemplo (p. 28 em Montgomery et al., 2004)
Logo, o erro máximo é igual
303,0
40
948,0021,21,2/ === −
n
s
tE nα
e o IC de 95% para a média da população é dado por
15,18]. ;57,14[]303,0875,14 ;303,0875,14[];[];[ =+−=+−= EXEXUL
22
Exemplo (p. 28 em Montgomery et al., 2004)
Solução em R. 
Leitura dos dados: (visc = scan("Ex02_47.txt"))
Estatística descritiva: summary(visc)
Min. 1st Qu. Median Mean 3rd Qu. Max. 
12.60 14.30 14.90 14.88 15.33 17.00 
Análise exploratória:
par(mfrow = c(2,2))
stripchart(visc, pch = 20, cex = 
1.5, method = "stack", xlab = 
"Viscosidade")
hist(visc, xlab = "Viscosidade", 
ylab = "Densidade", main = "", freq 
= FALSE)
lines(density(visc), col = "blue")
boxplot(visc, xlab = "Viscosidade", 
pch = "*", horizontal = TRUE)
qqnorm(visc, main = "", pch = 20, 
xlab = "Quantis teóricos", ylab = 
"Quantis amostrais")
qqline(visc)
23
Determinação do tamanho da amostra para estimação de µ
Erro máximo na estimação de µ:
.2/
n
zE σα=
.2
2
2/
2
E
z
n
σα ×
=
zα/2 é obtido da tabela normal após a escolha do coeficiente de 
confiança (1 - α).
Se o desvio padrão (σ) for conhecido, podemos especificar o erro 
máximo (E) e em seguida calcular n:
Se o desvio padrão (σ) não for conhecido, podemos utilizar o 
desvio padrão obtido de uma amostra piloto com n0 observações:
,2
2
02/
2
E
sz
n
×
≅
α sendo que s02 é a variância amostral da amostra piloto.
24
Em uma siderúrgica estuda-se a resistência média das barras de aço
utilizadas na construção civil. Qual o tamanho amostral necessário para
garantir que um erro máximo de 8 kg seja superado com probabilidade
igual a 0,01? O desvio padrão da resistência para este tipo de barra é
de 25 kg.
Solução.Do enunciado tem-se σ = 25 kg, E = 8 kg e
Exemplo
,01,01)(P01,0)(P1 −=+≤≤−⇒=+≤≤−− EXEXEXEX µµ
ou seja, α = 0,01 (o coeficiente de confiança do IC é 1 - α = 99%).
Consultando a tabela
normal encontramos
zα/2 = 2,575.
.65
8
25575,2
 
 Portanto,
2
22
2
2
2/
2
=
×
=
×
=
E
z
n
σα
5
25
5. Intervalo de confiança para uma proporção populacional
Suponha que tem-se uma população dicotômica, constituída 
apenas por elementos de dois tipos , isto é, cada elemento pode 
ser classificado com sucesso ou fracasso, suponha que 
probabilidade de sucesso é p e de fracasso é q=1-p, e desta 
população se retira uma amostra aleatória, X1…, Xn de n 
observações. Vimos 
 
)1,0(~
)1(
ˆ
N
n
pp
ppZ
−
−
=
Para um nível de confiança fixado em 100(1-α)%,um intervalo para p,
para uma amostra suficientemente grande.








−
×+
−
×−=−
n
pp
zp
n
pp
zppIC )1(ˆ;)1(ˆ)1,( 2/2/ ααα
26
Abordagem otimista
)porsubstituir p-(p-p)p( ˆ1ˆ1
Abordagem conservativa
1/4 porsubstituir -p)p(1
)1()ˆ1(ˆˆ;)ˆ1(ˆˆ)1,( 2/2/ a
n
pp
zp
n
pp
zppIC 






−
×+
−
×−=− ααα
)1(
4
1
ˆ;
4
1
ˆ)1,( 2/2/2/ b
n
zzp
n
zppIC 





××+×−=− αααα
27
Um estudo foi realizado para determinar a proporção de componentes de um
certo tipo que resistem durante um certo período a condições de uso mais
rigorosas do que as especificadas. Em uma amostra de 200 componentes
selecionados ao acaso, 160 resistiram. Apresente um intervalo de 95% de
confiança para a proporção de componentes que resistem.
Como 1-α = 0,95, obtemos da
tabela normal padrão z0,025 =
1,96.
[ ].855,0;745,0 
200
)8,01(8,096,18,0;
200
)8,01(8,096,18,0IC
=






−
×+
−
×−≅
[ ].869,0;731,0
2004
196,18,0 ;
2004
196,18,0IC =





×
×+
×
×−≅
Abordagem conservativa:
Exemplo
Solução. Estimativa pontual de p: %).80(8,0
200
160
==p
Abordagem otimista:
28
Determinação do tamanho da amostra para estimação de p
Erro máximo de estimação de p é dado por :
n
pp
zE )1(
2
−
×= α
( )
2
2/
2 )1(
E
ppz
n
−
=⇒
α
Quando não se tem informação de p: ( )
2
2/
2 25,0
E
z
n
α
=⇒
29
Exemplo 6: Suponha que a fábrica de papel no Brasil, deseja estimar a
proporção de funcionários com uma renda inferior a R$ 200,00.
Estudos anteriores indicam que esta proporção é de 20%.
(a) Que tamanho de amostra se requer para assegurar uma confiança
de 95% e o erro máximo de estimação desta proporção seja de
5%?
(b) Em quanto variara o tamanho da amostra se o erro máximo
permissível é reduzido a 1%.?
Dos dados temos p=0,20 e 1-α=0,95. Da tabela normal padrão
z0,025.=1,96.
( ) 24686,245
05,0
8,02,0)96,1(
2
2
≈=
×
=⇒ n
(a) O erro máximo de estimação E=0,05.
30
Uma equipe pretende estimar a proporção de avarias ocorridas no transporte
de um produto. Estudos anteriores indicam que esta proporção não ultrapassa
20%. Que tamanho de amostra é necessário para assegurar com uma confiança
de 99% que o erro de estimação desta proporção seja no máximo igual a 0,05?
Solução. Do enunciado obtemos p ≤ 0,20, 1 – α = 0,99 e E = 0,05. Da
tabela normal padrão, z0,005 = 2,575.
Exemplo
Proteção em relação à situação
mais desfavorável: p* = 0,20.
Finalmente,
.4254,424 
05,0
)2,01(2,0575,2
 
)1(
2
2
2
**2
2/
=⇒=
−××
=
−×
=
n
E
ppz
n α
6
31
Problemas de inferência
3. Teste de hipóteses
Uma hipótese estatística (H) é uma afirmação sobre 
o valor de θ. Pode ser verdadeira ou falsa.
Se θ é a probabilidade de sucesso no modelo 
binomial, H: θ = ½, H: θ ≠ ½ e H: θ > ¾ são 
exemplos de hipóteses. 
Com base na amostra X1,...,Xn, formulamos uma 
regra de decisão que permita concluir pela rejeição
ou não rejeição (aceitação) de H. A decisão pode 
ser correta ou errada.
32
H0: µ = 60
e H1: µ ≠ 60
Exemplo. Uma indústria adquire de um certo fabricante pinos cuja
resistência média à ruptura é especificada em 60 unid. (valor nominal da
especificação). Em um determinado dia a indústria recebeu um grande
lote de pinos e a equipe técnica da indústria deseja verificar se o lote
atende às especificações.
Teste de hipóteses
H0: O lote atende às especificações
H1: O lote não atende às especificações
A v. a. X (resistência à ruptura) é tal que X ~ N (µ, 25). O problema
pode ser resolvido testando as hipóteses
(hipótese simples: um único valor)
(hipótese composta: mais de um valor)
(Hipótese nula)
(Hipótese alternativa)
33
Definição. Uma hipótese estatística é uma afirmação sobre o(s)
parâmetro(s) da distribuição de probabilidade de uma característica (v.
a. X) da população.
Definição. Um teste de uma hipótese estatística é um procedimento ou
regra de decisão que nos possibilita decidir por H0 ou H1 com base na
amostra X1,...,Xn.
Exemplo. A equipe técnica da indústria decidiu retirar uma amostra aleatória de 
tamanho n = 16 do lote recebido. A resistência de cada pino foi medida e foi 
calculada a a resistência média X (estimador de µ), que será utilizada para 
realizar o teste (estatística de teste). Podemos afirmar que 
 
.
16
25
,~ 




µNX
Para quais valores de X a equipe técnica deve rejeitar H0 e portanto 
rejeitar o lote? 
 
Teste de hipóteses
34
Definição. Região crítica (Rc) ou região de rejeição é o conjunto de
valores assumidos pela estatística de teste para os quais a hipótese
nula é rejeitada. Seu complementar é a região de aceitação (Ra).
Exemplo. Se o lote está fora de especificação , isto é, se H1: µ ≠ 60
for verdadeira, espera-se que a média amostral seja inferior ou
superior a 60 unid.
A equipe técnica decidiu adotar a seguinte regra: 
 rejeitar Ho se X for maior do que 62,5 unid. ou menor do que 57,5 unid. 
As duas regiões são 
{ }5,57ou5,62 <>= XXRc
{ }5,625,57 ≤≤= XRa : região de aceitação de H0.
: região de rejeição de H0 e
35
Procedimento (teste):
.H se)-(aceita rejeita se não,Se
;H se-ejeita,Se
0
0
c
c
Rx
rRx
∉
∈
36
Tipos de erros
Erro tipo I: rejeitar H0 quando H0 é verdadeira.
Erro tipo II: não rejeitar H0 quando H0 é falsa.
Exemplo.As hipóteses são
H0: O lote atende às especificações;
H1: O lote não atende às especificações.
Erro tipo I: rejeitar o lote sendo que ele está de acordo com as
especificações.
Erro tipo II: não rejeitar o lote sendo que ele não está de acordo com as
especificações.
 
Situação real e desconhecida 
Decisão Ho verdadeira Ho falsa 
Não rejeitar Ho Decisão correta Erro tipo II 
Rejeitar Ho Erro tipo I Decisão correta 
 
Quadro resumo:
7
37
P(Erro tipo I) = α (nível de significância).
).verdadeiraH ;HRejeitar (P 00=α
).a verdadeirH ;Hrejeitar Não(P
)falsa H ;Hrejeitar Não(P)IItipoErro(P
10
00
=
== β
)falsa é H ;HRejeitar (P1 00=− β : poder do teste.
Nível de significância e poder
38
Exemplo. As hipóteses são H0: µ = 60 e H1: µ ≠ 60. Logo,
).60:H ;5,57ou5,62( 0 =<>= µα XXP
).16/25 ,60(~então,eirafor verdad HSe 0 NX
.0455,002275,002275,0)00,2P()00,2P(
16/25
605,57
16/25
60P
16/25
605,62
16/25
60P
)60:H ;5,57P()60:H ;5,62P( 00
=+=−<+>=





 −
<
−
+




 −
>
−
=
=<+=>=
ZZ
XX
XX µµα
Obs. Se X1, X2, ..., Xn é uma amostra de uma distribuição N(µ, σ2), 
então a média amostral tem distribuição N(µ, σ2/n).
Calculamos o nível de significância:
39
Cálculo de α:
40
).60:H ;5,625,57P()a verdadeirH ;H rejeitar Não(P 110 ≠≤≤== µβ X
).5,63:H;5,625,57P( 1 =≤≤= µβ X
Como exemplo de cálculo de β, selecionamos H1: µ = 63,5. Logo, 






16
25
;5,63~ NX e 
 
Cálculo de β:
41
.2119,0
0000,02119,0
 )80,4P()80,0P(
)5,63;5,57P()5,63;5,62P(
)5,63:H;5,625,57P( 1
=
−=
−≤−−≤=
=≤−=≤=
=≤≤=
ZZ
XX
X
µµ
µβ
Efetuando o cálculo obtemos 
 
Cálculo de β:
Logo, se µ = 63,5, o poder do teste é igual a 1 – 0,2119 = 0,7881.
42
Função poder
8
43
Testes bilaterais e unilaterais
Se as hipóteses nula e alternativa são
,:H
;:H
01
00
µµ
µµ
≠
=
em que µo é uma constante conhecida (valor de teste), o teste é
chamado de bilateral.
Podemos ter também as hipóteses
.:H
;:H
01
00
µµ
µµ
<
=
teste unilateral à esquerda.
.:H
;:H
01
00
µµ
µµ
>
=
teste unilateral à direita.
Sugestão. Expressar H0 em forma de igualdade.
44
Um fabricante de um certo componente afirma que o tempo médio de
vida dos componentes produzidos é de 1000 horas. Engenheiros de
produto têm interesse em verificar se uma modificação do processo de
fabricação aumenta a duração dos componentes.
Hipóteses:
horas, 1000:H
horas; 1000:H
1
0
>
=
µ
µ
sendo µ o tempo médio de duração dos componentes.
Exemplo
45
Procedimento básico de testes de hipóteses
O procedimento de teste de hipóteses relativo ao parâmetro θ de uma
população é decomposto em quatro passos:
(i) Formulação das hipóteses:
.ouou:H
;:H
0001
00
θθθθθθ
θθ
≠><
=
(ii) Identificação da estatística de teste e caracterização da sua
distribuição.
(iii) Escolha do nível de significância do teste (α = 5%, 1% ou 
0,5% são comuns) e obtenção da região crítica.
(iv) Cálculo da estatística de teste e tomada de decisão (H0
deve ser rejeitada ou não?).
46
Considere uma amostra aleatória de tamanho n de uma população 
normal com média µ (desconhecida) e variância σ2 (conhecida). 
Iniciamos pelo teste unilateral à esquerda: 
 
Teste de hipóteses para uma média populacional
.:H
;:H
(i)
01
00
µµ
µµ
<
=
(ii) A estatística de teste é a média amostral X (estimador pontual de 
µ). Se a distribuição da população é norm al ou se amostra é grande (n ≥
30, mesmo que a distribuição da população não seja normal) a 
distribuição de X é ( )nN /, 2σµ , aproxim adamente. Se H 0 for 
verdadeira, então
 
).1,0(~)( 0 NXnZ
σ
µ−
=
47
(iii) Rejeitamos H0 em favor de H1 se a média amostral X é 
“pequena” em relação µ0. A região crítica é obtida selecionando um k 
tal que Rc = { X < k }, sendo que ):;( 00 µµ=< HkXP = α. Ou seja, sob H0 
α
σ
µ
σ
µ
σ
µ
=




 −
<=




 −
<
−
n
kZP
n
k
n
XP
///
000
.0
0
0






×+<=⇒
×+=⇒=
−
⇒
n
zXR
n
zkz
n
k
c
σµ
σµ
σ
µ
α
αα
(iv) Conclusão: se 






×+<=∈
n
zXRx c
σµ α0 , rejeita-se H0 ; caso contrário 
não se rejeita H0. 
 
Obs. zα < 0.
Teste de hipóteses para uma média populacional
48
Exemplo
Um comprador de tijolos suspeita de uma diminuição na resistência.
De experiências anteriores, sabe-se que a resistência média ao
desmoronamento de tais tijolos é igual a 200 kg, com um desvio
padrão de 10 kg. Uma amostra de 100 tijolos, escolhidos ao acaso,
forneceu uma média de 195 kg. Ao nível de significância de 5%, pode-
se afirmar que a resistência média ao desmoronamento diminuiu?
.kg200:H
;kg200:H
são interesse de hipóteses As (i)
1
0
<
=
µ
µ
(ii) A estatística de teste é a média amostral X . Já que n = 100 ≥ 30, 
tem-se que sob H0, X ~ 




100
100
,200N
, aproximadamente.
 
(iii) A região crítica pode ser obtida selecionando k de maneira que Rc 
= { X < k }, sendo que ):;( 00 µµ=< HkXP = α = 0,05. Ou seja, sob H0, 
9
49
36,19864,120005,0
1
200
100/10
200
100/10
200
=⇒−=−⇒==




 −
<=




 −≤− kkkZPkXP α
{ }.36,198<=⇒ XRc
(iv) Do enunciado a média amostral vale 195. Logo, { }36,198195 <=∈= XRx c . Rejeita-se H0 ao nível de 5% de significância. 
 
Conclusão. De acordo com os dados coletados e adotando um nível 
de significância de 5%, concluímos que resistência média ao 
desmoronamento diminuiu.
Exemplo
50
Método alternativo
Um método alternativo prático: trabalhar diretamente na escala Z.
.:Hcontra :H)( 0100 µµµµ <=i
(ii) Estatística de teste:
).1,0()(
~
0sob
0 NXnZ
Hσ
µ−
=
(iii) Região crítica para um nível de significância α escolhido:
{ }.αzZRc <=
(iv) se { }αzZRz c <=∈ , rejeita-
se H0; caso contrário, não se 
rejeita H0. 
 
51
.200:Hcontra 200:H(i) 10 <= µµ
(ii) Estatística de teste: ).1,0()200(
~
0
NXnZ
Hsobσ
−
=
(iii) Região crítica para um nível de significância α = 0,05:
{ }.64,1−<= zRc
(iv) Calculamos cRz ∈−=−= 510 )200195(100 . Rejeita-se H0 a um nível de 
significância de 5%. 
 
Exemplo
52
Procedimento geral
Hipóteses:
434214342143421
Bilateral
01
direita À
01
esquerda À
01
000000
:H:H:H
:H:H:H
(i)
µµµµµµ
µµµµµµ
≠><
===
(ii) Estatística de teste:
(a) Variância da população é conhecida:
).1,0()(
~
0
0 NXnZ
Hsobσ
µ−
=
(b) Variância da população é desconhecida (s é o desvio
padrão amostral):
).1()(
~
0
0
−
−
= nt
s
XnT
Hsob
µ Distribuição t de Student com 
n-1 graus de liberdade (g.l.).
53
Distribuições normal e t de Student
54
(iii) Região crítica para um nível de significância α escolhido:
{ }cZR Zc −<=)(
{ }cTR Tc −<=)(
{ }cZR Zc >=)(
{ }cTR Tc >=)(
{ }cZR Zc >=)(
{ }cTR Tc >=)(
(iv) Se Z ∈ RC ou T ∈ RC , rejeita-se Ho; caso contrário, não se rejeita H0. 
 
H1: µ < µ0 H1: µ > µ0 H1: µ ≠ µ0
Procedimento geral
Obs. Nas regiões críticas com Z e T o valor de c não é o mesmo.
10
55
Dados históricos coletados em uma linha de produção de um certo item
indicam 115 kg como massa média. A fim de testar a hipótese de que a
média de itens recentemente produzidos se manteve, retirou-se, ao
acaso, uma amostra de 20 itens, obtendo-se média igual a 118 kg e
desvio padrão 20 kg. Utilize α = 0,05.
.kg115:H
;kg115:H
são interesse de hipóteses As (i)
1
0
≠
=
µ
µ
).1()115(
~
0
−
−
= nt
S
XnT
Hsob
(ii) Estatística de teste:
Aproximamos a distribuição da média das 20 notas por uma distribuição
normal com média µ e variância σ2 / n.
Exemplo
56
(iii) Região crítica para um nível de significância α = 0,05 e com n – 1 =
19 g.l.:
{ }.093,2>= TRc
(iv) Calculamos cRT ∉=−= 67,020 )115118(20 . Não se rejeita H0 a um nível de 
de significância de 5%. A diferença não é significativa. 
 
Conclusão. De acordo com os dados coletados, a um nível de 
significância de 5% concluímos que a massa média dos itens 
produzidos se manteve.
Exemplo
57
Teste de hipóteses para uma proporção populacional
O procedimento para testes de hipóteses sobre a proporção
populacional (p) semelhante ao utilizado para testes sobre uma média
populacional.
434214342143421
Bilateral
:H
direita À
:H
esquerda À
:H:H:H:H
(i)
010101
000000
pppppp
pppppp
≠><
===
Problema. Testar a hipótese que a proporção de sucessos de um ensaio
de Bernoulli é igual a um valor especificado p0. Isto é, testar um dos
seguintes pares de hipóteses:
58
(ii) Estatística de teste:
mente,aproximada ),1,0()1(
)(
~
000
0 N
pp
ppnZ
Hsob−
−
=
sendo que
n
X
n
p
n
i
i∑
=
==
1sucessos de Número
é a proporção amostral de sucessos e Xi = 1, se o resultado for 
sucesso; Xi = 0, se o resultado for insucesso.
:estimador pontual de p.
Teste de hipóteses para uma proporção populacional
59
Um estudo é realizado para determinar a presença de pequenas
anomalias em chapas metálicas de uma certa dimensão. Segundo o
fabricante, a proporção de chapas com anomalias é inferior a 25%. Foram
inspecionadas 50 chapas escolhidas ao acaso e sete delas apresentaram
algum tipo de anomalia. Estes dados justificam a afirmação do fabricante?
Adote um nível de significância igual a 0,05.
Exemplo
.25,0:H
;25,0:H
:Hipóteses )(
1
0
<
=
p
p
i
(ii) Estatística de teste:
mente.aproximada ),1,0()25,01(25,0
)25,0(50
~
0
NpZ
Hsob−
−
=
60
(iii) Região crítica para um nível de significância α = 0,05:
{ }.64,1−<= zRc
(iv) Temos n = 50. Calculamos 14,050
7
==p
 e cRz ∈−=
−×
−
= 796,1)25,01(025
)25,014,0(50
. 
Rejeita-se H0 ao nível de 5% de significância. 
 
Exemplo
Conclusão. Adotando um nível de significância de 5% concluímos a 
partir dos dados que a proporção de chapas produzidas com anomalias 
é inferior a 25%.
11
61
Suponha se tenha uma amostral aleatória de tamanho n de uma 
população normal com média µ e variância σ2 (ambas 
desconhecidas), e tem-se interesse em verificar as seguintes 
hipóteses estatísticas: 
 
Teste de hipóteses para uma variância populacional
44 344 2144 344 2144 344 21
BilateralDireitoUEsquerdoU
HHH
HouHouH
i
0
22
1
.
0
22
1
.
0
22
1
0
22
00
2
0
22
00
2
0
22
0
:::
:)(:)(:
)(
σσσσσσ
σσσσσσσσ
≠><
=≤=≥=
(ii) A estatística de teste
)1(22
0
2
~
)1(
0
−
−
= n
Hsob
SnW χ
σ
62
(iii) A região crítica para um nível de significância fixado
{ }2 1,12 1 −−− ≤= nnRc αχχ { }2 1,2 1 −− ≥= nnRc αχχ { }2 1,2/2 1
2
1,2/1
2
1
−−
−−−
≥
≤=
nn
nn ouRc
α
α
χχ
χχ
(iv) Se a ETobs∈ RC., rejeita-se Ho em caso contrário não se rejeita H0. 
 
63
Uma amostra aleatória de 25 observações foi sorteada de uma
população normal forneceu variância igual 18,3. Esse resultado é
suficiente para podermos concluir, ao nível de 10% de significância,
que a variância dessa população é inferior a 25..
Exemplo
25:
25:
:são interesse de hipóteses As )(
2
1
2
0
<
=
σ
σ
H
H
i
(ii) A estatística de teste
)1(2
2
~25
)1(
0
−
−
= n
Hsob
SnW χ
64
(iii) A região crítica para um nível de significância fixado α=0,10,
n=25.
{ }7,15225 ≤= χRc
RcSnWobs ∉=
−
=
−
= 56,17
25
)4,18)(125(
25
)1( 2
Ao nível de 10% de significância, não se pode rejeitar Ho
65
Nível descritivo
De acordo com o procedimento descrito anteriormente para o
teste de hipóteses, no final toma-se uma decisão de rejeição ou de
não-rejeição da hipótese nula. Esta dicotomia é, na realidade,
artificial. De fato
• a fixação de um nível de significância é arbitrária e
• os dados amostrais podem contradizer a hipótese nula em
maior ou menor grau.
O nível descritivo denotado por α*( ou P-value) constitui uma 
medida do grau com que os dados amostrais contradizem a 
hipótese nula. Sua definição é a seguinte: o nível descritivo
corresponde à probabilidade da estatística de teste tomar um 
valor igual ou mais extremo do que aquela que, de fato, é 
observado. Alternativamente, pode-se definir o nível descritivo 
como o menor nível de significância para o qual a estatística de 
teste determina a rejeição da hipótese nula H0. 
 
66
Exemplo
No exemplo da lámina 34, a estatística de teste observada é,
Zobs= -1,7963 (recorde-se que o nível de significância do teste era
α=0,05 e o correspondente valor crítico z0,05=-1,64).
Da definição do nível descritivo temos:
( ) 0362,0|7963,1 0* =−≤= HZPα
Nesse exemplo, se o nível de significância fosse fixado em
qualquer valor igual ou superior a 3,62%, a conclusão seria pela
rejeição de H0 ao passo que valores inferiores a 3,62% conduziriam
à aceitação da hipótese nula.
0
0
H se-rejeita 
H se-rejeita se Não
⇒<
⇒≥
αα
αα
*
*
Se
Se
12
67 68
Para os testes de hipóteses na qual a distribuição normal é a
estatística do teste, o nível descritivo nesta caso é dado por:





Φ−
Φ
Φ−
=
direito l UnilateraTeste)(1
esquerdo l UnilateraTeste)(
bilateral teste|))(|1(2
*
obs
obs
obs
z
z
z
α