Buscar

Teste de Hipótese (1)

Prévia do material em texto

1
Quintiliano Schroden
Inferência ParamInferência Paraméétricatrica
(Parte II)(Parte II)
Testes de HipTestes de Hipóótesesteses
Comentários Iniciais
� Uma hipótese estatística é uma afirmativa a respeito de um 
parâmetro de uma distribuição de probabilidade.
� Hipótese que a produtividade é diferente de 2,5 peças/hora. 
Formalmente isso é escrito como:
� Ho (hipótese nula) e H1 (hipótese alternativa). 
Anteriormente, a alternativa formulada é bilateral, mas 
também podem ser estabelecidas alternativas unilaterais, 
tais como:
peças/horaH
peçashoraH
5,2 :
5,2 :
1
0
≠
=
µ
µ
peças/horaH
horapeçasH
5,2 :
/5,2 :
1
0
<
=
µ
µ
Erro do tipo I: A hipótese nula é realmente verdadeira, 
mas optou-se por rejeitá-la.
Nível de significância , 
Probabilidade máxima de se cometer um erro do tipo I.
Erros e nível de significância
Verdade real de H0
H0 verdadeira H0 falsa
Não
rejeitar H0
Rejeitar H0
Decisão
correta
Decisão
correta
Erro do 
tipo II
Erro do 
tipo ID
ec
is
ão
2
Teste monocaudal
direito
Teste bicaudal
Teste monocaudal
esquerdo
Ha é mais provável.
Ha é mais provável.
Ha é mais provável.
Ha
Ha
valor
valor
valorHa
Passos para realizar um Teste de Hipóteses:
Definição da Hipótese
� O primeiro passo é o estabelecimento das hipóteses: 
hipótese nula e hipótese alternativa 
� Hipótese Nula (Ho): É um valor suposto para um 
parâmetro. Se os resultados da amostra não forem 
muito diferentes de Ho, ela não poderá ser rejeitada.
� Hipótese Alternativa(Ha) : É uma hipótese que 
contraria a hipótese nula, complementar de Ho, Essa 
hipótese somente será aceita se for rejeitada Ho. 
Passos para realizar um Teste de Hipótese
Calcular a estatística do Teste
� É o valor calculado a partir da amostra, que será usado 
na tomada de decisão. Uma maneira de tomar-se uma 
decisão é comparar o valor tabelado com a estatística 
do teste.
� Para o caso de testes de médias, a estatística do teste é a 
variável padronizada Z:
)n(
)X(
Zcal
σ
µ−=
Estatística 
do teste
Variabilidade 
das médias
3
Passos para realizar um Teste de Hipótese
Região Crítica
� A região crítica é a região onde Ho é rejeitada. A área 
da região crítica é igual ao nível de significância (αααα), que 
estabelece a probabilidade de rejeitar Ho quando ela é
verdadeira.
� Por exemplo, se utilizarmos o nível de significância de 
5%, a probabilidade de rejeitar Ho quando ela é
verdadeira é igual a 5% (erro tipo I). Na prática, os 
valores usuais de alfa são αααα = 0,01 ou 0,05 ou 0,10.
Passos para realizar um Teste de Hipótese
� Unilateral à esquerda:
Ho: µ = 50
H1:: µ > 50
� Unilateral à direita: 
Ho: : µ = 50
H1: : µ <50
� Bilateral:
� Ho: : µ = 50
� H1:: µ ≠ 50
 
Passos para realizar um Teste de Hipótese
Regra de Decisão: 
� Se o valor da estatística do teste cair na região crítica, 
rejeita-se Ho. Ao rejeitar a hipótese nula (Ho) existe 
uma forte evidência de sua falsidade.
� Ao contrário, quando aceitamos, dizemos que não 
houve evidência amostral significativa no sentido de 
permitir a rejeição de Ho. 
4
Passos para realizar um Teste de Hipótese
Conclusão
� Aceitar Ho, implica que a hipótese nula não pode ser 
rejeitada!
� Rejeitar Ho implica que temos evidências estatísticas 
para rejeitá-la com um risco conhecido : αααα.
Teste de hipótese para média
Ho H1 R. CRITICA 
µ=µo µ<µo 
µ>µo 
oµµ ≠ 
z<-zα 
z>zα 
z<-zα/2 e z>zα/2 
 
Estatística a ser utilizada => 
n
X
Z O
/σ
µ−=
a) População infinita, normal ou aproximadamente normal, 
variância populacional conhecida (amostra grande ou 
pequena)
Registros dos últimos anos de calouros de uma certa 
escola atestam que sua média num teste de QI foi 115 
e desvio padrão de 20. Para saber se uma nova turma 
de calouros é típica desta escola, retirou-se uma 
amostra aleatória de 50 alunos desta nova classe, 
encontrado-se média de 118. Com uma confiança de 
95%, teste a hipótese de que esta nova turma apresenta 
a mesma característica das classes precedentes, com 
relação ao QI. Com um nível de 5% de significância.
5
Teste de hipótese para média
Estatística a ser utilizada => 
b) População infinita, normal ou aproximadamente normal, 
variância populacional desconhecida e amostra pequena. 
Ho H1 R. CRITICA 
 
µ=µo 
µ<µo 
µ>µo 
µ µ≠ o 
t<-tα 
t>tα 
t<-tα/2 e t>tα/2 
 
nS
X
t O
/
µ−
= com v = n-1 
O tempo médio gasto para profissionais da 
área de Ciências Contábeis, realizarem um 
determinado procedimento tem sido de 50 
minutos. Um novo procedimento está sendo 
implementado. Neste novo procedimento 
retirou-se uma amostra de 12 pessoas, com um 
tempo médio de 42 minutos e um desvio 
padrão de 11,9 minutos. Teste a hipótese de 
que a média populacional no novo 
procedimento é menor do que 50. Com um 
nível de 5% de significância.
Teste de hipótese - diferença entre médias
Estatística a ser utilizada => 
a) População infinita, normal ou aproximadamente normal, 
variância populacional conhecida (amostras grandes ou 
pequenas)
Ho H1 R. CRITICA 
µ µ1 2− = dO µ1-µ2<do 
µ1-µ2>do 
µ µ1 2− ≠ do 
z<-zα 
z>zα 
z<-zα/2 e z>zα/2 
 
Z
X X
n n
=
− − −
+
( ) ( )
/ /
1 2 1 2
1
2
1 2
2
2
µ µ
σ σ
6
Retiradas amostras de aparelhos usados de duas marcas, 
encontrou-se os resultados apresentados no quadro a 
seguir. Verifique se as duas marcas tem durabilidade 
iguais ou se são diferentes. Com um nível de 5% de 
significância.
100100tamanho amostra
8090desvio padrão pop.
11401160Média
BAMarcas
Teste de hipótese - diferença entre médias
Estatística a ser utilizada => 
b)Populações aproximadamente normais, amostras 
pequenas, variâncias populacionais desconhecidas e 
Homogêneas.
Ho H1 R. CRITICA 
 
µ µ1 2− = dO 
µ1-µ2<do 
µ1-µ2>do 
od≠− 21 µµ 
t<-tα 
t>tα 
t<-tα/2 e t>tα/2 
 
1
1 2 1 2
1 2
1 2
2 2
1 2 2
1 2
( ) ( )
2
1 / 1 /
( 1) ( 1)
2
p
p
X X
t v n n
s n n
n s n s
S
n n
µ µ− − −= = + −
+
− + −
=
+ −
Um treinamento na área de comunicação de um 
conglomerado é ministrado a 12 profissionais pelo 
método convencional. Um segundo grupo de 10 
profissionais recebeu o mesmo treinamento por um 
método programado. Os resultados de notas dos dois 
métodos são apresentados no quadro a seguir. 
Determine se há diferença entre os dois métodos, 
assumindo que as populações são normais e com 
variâncias homogêneas. Com um nível de 5% de 
significância.
54desvio padrão
8185média
ProgramadoConvencionalMétodo 
7
Teste de hipótese - diferença entre médias
Estatística a ser utilizada => 
c) Populações aproximadamente normais, amostras 
pequenas, variâncias populacionais desconhecidas e 
estatisticamente Heterogêneas.
Ho H1 R. CRITICA 
 
µ µ1 2− = dO 
µ1-µ2<do 
µ1-µ2>do 
od≠− 21 µµ 
t<-tα 
t>tα 
t<-tα/2 e t>tα/2 
 
2 2 2
1 2 1 2 1 1 2 2
2 2 2 22 2
1 1 2 21 1 2 2
1 2
( ) ( ) ( / / )
( / ) ( / )/ /
1 1
X X s n s n
t GL
s n s ns n s n
n n
µ µ− − − += =
+ +
− −
Para estudar o efeito da certificação ambiental no 
valor de empresas amostras de empresas da mesma 
área, com e sem certificação ambiental.Obteve-se os 
seguintes resultados. Considere as populações com 
variâncias heterogêneas, teste a hipótese de que os 
dois padrões de empresas apresentam médias de 
valor diferentes. Com um nível de 5% de significância
218n
3,71,7desvio padrão
13,324,0média
Sem certificação 
ambiental
Com certificação 
ambientalMétodo 
Teste de hipótese – uma proporção
Estatística a ser utilizada => 
Ho H1 R. CRITICA 
p=po p < po 
p > po 
 p po≠ 
z<-zα 
z>zα 
z<-zα/2 e z>zα/2 
 
nqp
pp
Z
/
ˆ
00
0−=
8
Um investidor, deseja saber se a proporção de 
empresas que apresentam alto potencial para 
investimento é menor que 10%. Ele realiza uma 
amostragem de 122 empresas e encontrou 11 com 
alto potencial. Verifique a hipótese do investidor. 
Com um nível de 5% de significância.
Teste de hipótese – diferença entre proporções
Estatística a ser utilizada: 
Ho H1 R. CRITICA 
p1-p2=po p1-p2<po 
p1-p2>po 
p p po1 2− ≠ 
z<-zαz>zα 
z<-zα/2 e z>zα/2 
 
)/1/1(
)()ˆˆ(
21
2121
nnqp
pppp
Z
+
−−−
=
pq −=1
21
2211 ˆˆ
nn
pnpn
p
+
+=
Uma questão de teste é considerada boa se permitir 
discriminar entre estudantes preparados e estudantes 
não preparados. A primeira questão de um teste foi 
respondida corretamente por 62 dentre 80 alunos 
preparados, e por 23 dentre 50 alunos não preparados. 
Com um nível de 5% de significância, teste a 
afirmação de que esta questão foi respondida 
corretamente por uma proporção maior de estudantes 
preparados. 
9
Teste de hipótese – razão entre 
variâncias
Fcalc > F(5%, v1, v2)
R. CRITICAHaH0
2 2
1 2σ σ≠2 2
1 2σ σ=
Estatística a ser utilizada:
2
2
maior
calc
menor
S
F
S
=
Teste de hipótese – teste de qui-
quadrado para independência
Não há
independência
há independentes
R. CRITICAHaH0
2 2
( , )calc GLαχ χ>
Estatística a ser utilizada:
( )2
2 ,
( * ) /
( 1)*( 1)
i i
i
o e
calc
e
e
f f
f
f totallinha totalcoluna total
GL l c p
χ
−
=
=
= − − −
∑
EXERCICIO
A tabela de contingência a seguir mostra os 
resultados de uma amostra aleatória de 2000 
vitimas de fraude no telemarketing classificados 
por idade e tipo de fraude. As fraudes foram 
cometidas com sweepstakes falsos ou ofertas de 
cartão de crédito. Ao nível de significância igual 
a 1% você pode concluir que a idade das vitimas 
está relacionada ao tipo de fraudes?
10
200022031023027037033024030Total
100020307018024026018020Cartões de 
crédito
100020028016090130706010Sweepstake
Total> 8070 a 
79
60 a 
69
50 a 
59
40 a 
49
30 a 
39
20 a 
29
< 20
Idade das vitimasTipos de 
fraudes
Teste de hipótese – teste de qui-
quadrado para aderência
Não há
aderência
há aderência
R. CRITICAHaH0
( )2
2 ,
*
( 1)
i i
i
i
o e
calc
e
e i
f f
f
f n p
GL k p
χ
−
=
=
= − −
∑
Estatística a ser utilizada:
2 2
( , )calc GLαχ χ>
EXERCICIO
A distribuição alegada das idades das vitimas de 
fraudes no telemarketing é mostrada na 
tabela. Os resultados de um levantamento de 
mil vitimas selecionados aleatoriamente 
também estão na tabela. Usando 1% de 
significância teste o ajustamento da 
distribuição alegada. O que você pode 
concluir?
11
1000100%Total
1022%>70
4013%60 a 69
15016%50 a 59
27019%40 a 49
30016%30 a 39
20013%20 a 29
301%< 20
Resultado do 
levantamento
Dist. AlegadaIdades
EXERCICIO
Dirigentes alegam que a distribuição do número 
de gols por partida em um campeonato 
amador é uma Poisson. Os resultados de um 
levantamento de vinte e seis partidas 
selecionados aleatoriamente estão na tabela 
abaixo. Usando 5% de significância teste o 
ajustamento da distribuição alegada. O que 
você pode concluir?
1,00
P(x=k)
2626Total
34
23
42
91
80
feResultado do 
levantamento 
(fo)
Nº de gols

Continue navegando