Aula Teste de Hipóteses

•

UFPE

Gabriel Harrison

21.08.2017

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 47 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 47 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 47 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Inferência II

30 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Teste de Hipótese para a Proporção 
Populacional. 
 
 
 
 É uma conjectura sobre um parâmetro 
populacional 
 Por exemplo, a proporção p é um 
 parâmetro populacional. 
 
 A hipótese deve ser estabelecida antes da 
análise. 
 Um teste é dito ser paramétrico, se a partir do conhecimento 
de um particular parâmetro , a distribuição de probabilidade 
da variável X fica completamente definida. 
A moeda é honesta ou é 
viciada? 
Qual é a proporção de 
votos que o candidato A 
tem nas eleições? 
Qual é a probabilidade de 
"cara“ no lançamento de 
uma moeda? 
Qual é a proporção de 
adultos que tiveram 
dor de cabeça nas 
últimas 24 horas? 
O candidato A vencerá as 
eleições ? 
Pelo menos 10% dos 
adultos tiveram dor de 
cabeça nas últimas 24 
horas? 
Em estimação o objetivo é “estimar” o valor 
desconhecido da proporção p de “indivíduos” em 
uma população com determinada característica. 
A estimativa é baseada no número x de “indivíduos” 
com a característica de interesse, numa amostra 
aleatória de tamanho n. 
Se o objetivo for saber se o valor observado x 
nessa amostra, dá ou não suporte a uma 
afirmativa sobre o valor de p , trata-se de testar 
uma hipótese. 
Queremos então testar a 
hipótese nula H0: a moeda é honesta 
contra a 
hipótese alternativa H1: a moeda não é honesta 
Exemplo 1: Queremos avaliar se uma moeda é 
não viciada. 
Na linguagem estatística, essas hipóteses podem 
ser escritas como: 
H0: p = 0,5 
H1: p  0,5 
com p sendo a probabilidade de aparecer “cara” na 
moeda. 
De uma maneira geral, uma hipótese estatística é 
uma afirmação ou conjectura sobre um parâmetro de 
uma distribuição de uma variável aleatória 
H0 : Hipótese nula: afirmação ou conjectura sobre 
p geralmente relacionada a um valor de referência, 
ou a uma especificação padrão ou histórica. É 
sempre a hipótese que queremos rejeitar. 
H1 : Hipótese alternativa: afirmação ou conjectura 
sobre p que esperamos ser verdadeira. 
No caso especial de teste de hipóteses sobre a 
proporção populacional p, temos: 
No nosso exemplo, se considerarmos 12 
lançamentos independentes da moeda e 
denotarmos por X o número de caras nesses 
lançamentos, então o parâmetro é a proporção 
de caras p e , já sabemos que 
X ~ Binomial (12; p ) 
Note que o número de lançamentos está fixado 
(n=12), portanto fazer conjecturas sobre p é 
similar a fazer conjecturas sobre o número 
esperado de sucessos (esperança de X). 
Se observarmos 5 caras em 12 lançamentos 
independentes da moeda, o que podemos concluir? 
E se observarmos 4 caras? 
 “Se, em 12 lançamentos da moeda, observarmos 
0,1, 2, 3, 9, 10, 11 ou 12 caras, então rejeitamos a 
hipótese nula H0 de que a moeda é honesta; 
caso contrário, não rejeitamos a hipótese H0.” 
Podemos considerar uma regra de decisão, como 
por exemplo, 
Ou 10 caras? 
Ou 12 caras? 
No exemplo, o conjunto de valores de X que levam à 
rejeição da hipótese nula H0 é {0, 1, 2, 3, 9, 10, 11, 
12}, o qual denominamos de região crítica (RC) ou 
região de rejeição de H0, ou seja, 
RC = {0, 1, 2, 3, 9 , 10, 11, 12} : região crítica ou 
 região de rejeição 
RCc = {4, 5, 6, 7, 8} : região de não rejeição de H0 
Testar uma hipótese estatística é estabelecer uma 
regra que nos permita, com base na informação de 
uma amostra, decidir pela rejeição ou não de H0. 
Regra de decisão (teste): 
 Seja x o valor observado na amostra da variável X, então 
 
 x  RC  rejeitamos H0 
 x  RC  não rejeitamos H0 
No exemplo da moeda, suponha que observamos 4 
caras, isto é, x = 4. 
Como 4  RC  não rejeitamos H0 (não temos 
evidência suficiente de que a moeda seja viciada). 
 
Será que nossa conclusão está correta? 
Ao decidir pela rejeição ou não da hipótese nula H0, 
podemos cometer dois tipos de erro. 
 
 
(afirmar que uma moeda não é honesta quando, na 
verdade ela é). 
 
 Rejeitar H0 quando H0 é verdadeira 
 
Erro tipo I: 
 
 
 
Erro tipo II: 
 
 
 Não rejeitar H0 quando H0 é falsa 
(afirmar que uma moeda é honesta quando, na 
verdade ela é viciada). 
Prob(erro I) = P(rejeitar H0 | H0 é verdadeira) =  
 
 : nível de significância do teste 
 
 
 
Prob(erro II) = P(não rejeitar H0 | H0 é falsa) =  
 
Ao valor (1 -  ) denominamos poder do teste 
Em geral, só podemos controlar um dos erros 
(fixando sua probabilidade de ocorrência). 
 
No exemplo da moeda, 
 RC = {0,1,2,3,9,10,11,12} 
 
  = P( erro I) = P( rejeitar H0 | H0 verdadeira ) 
= P(X  RC | p=0,5) 
 = P(X=0 | p=0,5) + ... + P(X=3 | p=0,5) + P(X=9 | p=0,5)+ 
 ... + P(X=12 | p=0,5) 
 = 0,000244 + 0,00293 + 0,016113 + 0,053711 + 0,053711 + 
 0,016113 + 0,00293 + 0,000244 
 = 0,1458 
 
 Verdadeiro valor de p 
Decisão p = 0,5 (H0 é verd.) p  0,5 (H1 é verd.) 
Não rejeitar 
H0 
Decisão correta 
1 -  = 0,8542 
Erro II 
 
Rejeitar H0 Erro I 
 = 0,1458 
Decisão correta 
1 -  
 
 
Se alterarmos a regra de decisão para RC = {0, 1, 2, 10, 11, 
12}, isto é, concluiremos que a moeda é viciada se o 
número de caras for 0, 1, 2, 10, 11 ou 12, o que acontece 
com o nível de significância do teste  (probabilidade de 
erro tipo I )? 
 = P( erro I) = P( rejeitar Ho | Ho verdadeira )=P( X  RC |p=0,5) 
 = P(X=0 | p=0,5) + ... + P(X=2 | p=0,5) + P(X=10 | p=0,5)+ 
 ... + P(X=12 | p=0,5) 
 = 0,000244 + 0,00293 + 0,016113 + 0,016113 + 0,00293 + 
 0,000244 
 = 0,0384 
 
RC  
 {0, 1, 2, 3, 9, 10, 11, 12} 
{0, 1, 2, 10, 11, 12} 
{0, 1, 11, 12} 
0,1458 
0,0384 
0,0063 
 
Os valores de nível de significância  
usualmente adotados são entre 1% e 10%. 
RC   
Até agora, o procedimento foi 
 escolher RC  determinar  
 
 
Alternativamente, podemos 
 fixar   determinar RC 
Exemplo 2: Suponha que um medicamento 
existente no mercado produza o efeito desejado em 
60% dos casos nos quais o mesmo é aplicado. 
Um laboratório produz um novo medicamento e 
afirma que ele é melhor do que o existente. 
 
Objetivo: Verificar estatisticamente se a 
afirmação do laboratório é verdadeira. 
Aplicou-se o medicamento em n = 10 pacientes. 
Sendo X o nº de pacientes, dentre os 10, para os 
quais o novo medicamento produz o efeito desejado, 
temos que, 
 
 X ~ B (10; p), 
 
com p sendo a proporção de pacientes para os 
quais o novo medicamento é eficaz. 
H0: p = 0,6 
H1: p > 0,6 
(1) Hipóteses estatísticas: 
 que correspondem a 
H0: o novo medicamento é similar ao existente 
 H1: o novo medicamento é melhor, mais efetivo 
 Pela tabela da binomial (10; 0,6), 
 para k = 9, P(X  9) = 0,0463 
 
(2) Fixemos o nível de significância em 5% ( = 0,05). 
(3) A região crítica deve ter a forma: 
RC = { X  k } 
O valor de k deve ser tal que 
 P(erro I) = P(X  RC | p = 0,6) = P(X  k) = , 
Portanto, RC = {X  9}, garante um erro tipo I de no 
máximo 5% (na realidade,  = 0,0463). 
 
para k = 8, P(X  8) = 0,1672 
No exemplo 2 as hipóteses nula e alternativa são: 
H0: p = 0,6 e H1: p  0,6 
isto é, desejamos detectar desvios em p apenas em 
uma direção, ou seja, desvios à “direita” de 0,6. 
Neste caso, dizemos que a hipótese alternativa é 
unilateral. 
No exemplo 1 (da moeda),como as hipóteses são 
H0: p = 0,5 e H1: p  0,5 
 dizemos que a hipótese alternativa é bilateral 
(detectaríamos desvios em torno de p = 0,5 em 
qualquer direção). 
Exemplo 3: A proporção de complicações, associada 
a um determinado procedimento cirúrgico é de 15%. 
Com o objetivo de reduzir essa proporção, um 
pesquisador desenvolveu um novo procedimento e o 
aplicou a uma amostra de 60 pacientes. 
Seja X o número de pacientes com complicações 
entre 60 pacientes. Então, 
X ~ B(n=60; p), 
 
sendo p a proporção atual de pacientes com 
complicações (após o novo procedimento). 
 H0: a proporção de complicações não se alterou 
 (a afirmação do pesquisador está incorreta). 
 H1: a proporção de complicações diminuiu 
 (afirmação do pesquisador está correta). 
 
 Equivalentemente, 
H0: p = 0,15 
H1: p < 0,15 
 (2) Vamos fixar  = 0,05. 
(1) As hipóteses de interesse são 
 (3) A região crítica deve ter a forma: 
 
RC = { X  k } 
O valor de k deve ser tal que P(erro I) = , ou seja, 
 P(X  k | p = 0,15) = 0,05. 
RC = { X  4} 
Pela tabela da binomial(60; 0,15), 
Na realidade temos  = 0,0424. 
 
 (5) Decisão e conclusão 
  decidimos por não rejeitar H0, ao 
 nível de significância de 4,24%. 
(4) Buscar a evidência na amostra para concluir: 
 
 Se observamos 6 pacientes entre os 60 
 tratados, qual é a conclusão? 
6  RC 
Concluímos que não temos evidência suficiente 
para afirmar que a proporção de pacientes com 
complicações (após o novo procedimento) é 
inferior a 15%, isto é, não há evidência suficiente 
de que a afirmação do pesquisador seja correta. 
Exemplo 4: Um industrial afirma que seu processo 
de fabricação produz 90% de peças dentro das 
especificações. O IPEM deseja investigar se este 
processo de fabricação ainda está sob controle. 
H0: p = 0,9 
H1: p < 0,9 
Sendo p a proporção de peças dentro das 
especificações, as hipóteses de interesse são: 
Ou seja, 
 H0: o processo está sob controle 
 H1: o processo não está sob controle 
Selecionamos uma amostra aleatória de 15 itens e 
observamos o número de itens satisfatórios (X), 
X ~ B(15, p). então 
Região crítica: RC= { X  k } 
 para  = 6% 
Logo, 
temos k = 11 e RC = {X  11}. 
 Para  = 1% temos k = 9 e RC = {X  9}. 
 
Crítica: arbitrariedade na escolha da RC (ou do 
 nível de significância). 
b) se  = 1%  
a) se  = 6%  
Se observamos X = 10 peças satisfatórias, então 
Rejeitamos H0 ao nível de significância de 6%. 
10  RC 
Não rejeitamos H0 ao nível de significância de 1%. 
10  RC 
Sugestão: determinar o nível de significância 
associado à evidência experimental, que é 
denominado nível descritivo. 
Nesse exemplo, a região crítica é da forma 
 RC = { X  k } 
O nível descritivo é calculado para xobs = 10, 
P = P (X  10 | p = 0,9) = 0,0127 
“Essa probabilidade P mede a força da evidência 
contida nos dados, contra a hipótese nula H1.” 
Como saber se essa evidência é suficiente para 
rejeitar H0? 
Se o valor de P é “pequeno”, então é pouco 
provável observarmos valores iguais ou mais 
extremos que o da amostra, supondo a hipótese nula 
H0 verdadeira. Logo, há indícios que a hipótese nula 
não seja verdadeira e, tendemos a rejeitá-la. 
Assim, 
 P “pequeno”  rejeitamos H0 
 P “não pequeno”  não rejeitamos H0 
Quão “pequeno” deve ser o valor de P para 
rejeitarmos H0 ? 
Para valores “não tão pequenos” de P , não fica 
evidente que a hipótese nula Ho seja falsa, portanto, 
tendemos a não rejeitá-la. 
P    rejeitamos H0 
P >   não rejeitamos H0 
No exemplo, P = 0,0127. 
Adotando  = 0,05, temos P <  e, portanto, 
rejeitamos H0 ou seja, concluímos que o processo 
não está sob controle. 
 Se P  , dizemos que a amostra forneceu 
evidência suficiente para rejeitar a hipótese nula H. 
Lembrando que a idéia inicial de P era considerar 
um nível de significância associado à evidência 
amostral, então devemos compará-lo com o nível de 
significância  fixado, de modo que, 
Observações: 
• Quanto menor o valor de P maior é a evidência 
contra a hipótese nula H0, contida nos dados. 
• Quanto menor o nível de significância  fixado, 
mais forte deve ser a evidência contra a hipótese 
nula, para que ela seja rejeitada. 
• Quando a hipótese nula é rejeitada para o nível de 
significância  fixado, diz-se também que a amostra 
é significante ao nível de significância . 
Exemplo 5: Pelo Anuário do IBGE de 2000, a 
proporção de analfabetos em uma cidade era de 
15%. 
Em 2010, entre 200 entrevistados dessa cidade, 27 
eram analfabetos. 
Esses dados suportam a tese de diminuição do 
analfabetismo na cidade de 2000 para 2010? 
 (1) Estabelecer hipóteses 
Sendo p a proporção populacional de analfabetos 
na cidade em 2010, as hipóteses de interesse são: 
H0 : p = 0,15 
H1 : p < 0,15 
Seja X o número de analfabetos entre os 200 
cidadãos entrevistados em 2010. 
X ~ B(200, p). 
(2) Fixar nível de significância 
(3) Observar a evidência na amostra 
Por exemplo,  = 5% ( = 0,05). 
 Foram observados 27 analfabetos  xobs = 27 
(4) Determinar o nível descritivo 
P = P (X  27 | p = 0,15) 
E(X) = np = 2000,15 = 30 
Var(X) = np(1-p) = 2000,150,85 = 25,5 
DP(X) = 25,5 = 5,05 
Usando a aproximação normal: 
Cálculo exato (pela binomial): 
P = P(X  27 | p = 0,15) = 0,3164 
 
P = P( X  27 | p = 0,15) 
 P { Z  (27- 30)/5,05 } = P( Z  -0,59) = 0,2776 
(5) Decisão e conclusão 
Como P >  , decidimos por não rejeitar a 
hipótese nula H0. 
Portanto, ao nível de significância de 5%, não há 
evidências suficiente para concluir que o índice 
de analfabetismo na cidade diminuiu de 2000 
para 2010. 
Nos exemplos anteriores, as hipóteses alternativas 
eram unilaterais (H1: p  p0 ou H1: p  p0 ). Nesses 
casos, o nível descritivo mede a probabilidade de se 
observar valores iguais ou mais extremos do que o 
encontrado na amostra (X  xobs ou X  xobs ), ou 
equivalentemente, o desvio do valor amostral à direita 
ou à esquerda do valor esperado sob a hipótese nula. 
Quando a hipótese alternativa é bilateral (H1: p  p0), 
o nível descritivo mede o quanto o valor amostral 
pode se distanciar do valor esperado em ambas as 
direções. 
Exemplo 4: Se em 100 arremessos independentes de 
uma moeda observarmos 65 caras, podemos afirmar 
que a moeda é viciada ? 
Sendo p a probabilidade de “cara” da moeda, as 
hipóteses de interesse são 
H0: p = 0,5 
H1: p  0,5 
 (1) Estabelecer hipóteses 
ou seja, a moeda é honesta (H0) ou é viciada(H1). 
(2) Fixar nível de significância 
Por exemplo,  = 5% ( = 0,05). 
(3) Observar a evidência na amostra 
Seja X o número de caras obtidas em 100 arremessos. 
xobs = 65 caras 
(4) Determinar o nível descritivo 
Se a moeda fosse honesta, o número esperado de 
caras nos 100 arremessos seria 50. Observamos 
um desvio de |65 – 50| = 15 unidades em relação 
ao número esperado de caras. 
Se a moeda é honesta, 
E(X) = np = 1000,5 = 50 
Var(X) = np(1-p) = 1000,50,5 = 25 
DP(X) = 25 = 5 
então, P = 2 P( X  65 | p = 0,5) 
P = P(X  65 ou X  35 | p = 0,5) 
 (por simetria) = 2 P( X  65 | p = 0,5) 
 2 P { Z  (65-50)/5 } = 2 P(Z  3) = 0,0027, 
com Z representando a distribuição Normal(0,1). 
Isso nos leva a duvidar da honestidade da moeda. 
Logo, a conclusão abaixo procede. 
(5) Decisãoe conclusão 
Como P <  , decidimos por rejeitar a hipótese 
nula H0. Ou seja, concluímos que há evidências 
suficiente para se afirmar que a moeda é viciada, 
ao nível de significância de 5%. 
Como o valor de P é pequeno, um número de caras 
tão afastado da média como o que foi observado, 
dificilmente ocorre quando arremessamos uma 
moeda não viciada 100 vezes. 
(1) Estabelecer as hipóteses: 
 H0: p = p0 contra uma das alternativas 
 H1: p  p0 , H1 : p  p0 ou H1 : p  p0 . 
(2) Escolher um nível de significância . 
(3) Selecionar uma amostra aleatória simples e 
determinar o número xobs de “indivíduos” na 
amostra portadores do atributo desejado. 
 (4) Determinar o nível descritivo P 
 (5) Decidir, comparando P com o nível de 
 significância , e concluir. 
 Se P    rejeitamos H0 
 Se P >   não rejeitamos H0 
Se H1: p  p0 , P = P (X  xobs | p = p0). 
Se H1 : p  p0 , P = P (X  xobs | p = p0). 
Se H1 : p  p0 , P = 2 P (X  xobs | p = p0) (se xobs  np0) 
ou 2 P (X  xobs | p = p0) (se xobs  np0) 
Para n grande, use a aproximação normal. 
OBRIGADA!!!!