Baixe o app para aproveitar ainda mais
Prévia do material em texto
Testes de Hipóteses Prof. Carlos Amorim Testes de Hipóteses • Um Teste de Hipóteses é um procedimento que conduz a uma tomada de decisão, com base na informação fornecida pelos dados de uma amostra, sobre a aceitação ou a rejeição (não aceitação) de determinada hipótese(não aceitação) de determinada hipótese estatística que se coloca sobre uma população. Hipótese Estatística • É uma suposição quanto ao valor de um parâmetro populacional ou quanto à natureza da distribuição de probabilidade de uma variável populacional. • Tipos: – Hipótese nula: H0 (hipótese a ser testada) – Hipótese alternativa: H1 Ex: A altura média da população brasileira é 1,65 m. Hipótese: m65,1=µ Hipótese Estatística Ex: As hipóteses podem ser hipóteses simples se especificam mH 65,1:0 =µ mH 65,1:0 =µ mH 65,1:0 =µ mH 65,1:1 ≠µ mH 65,1:1 >µ mH 65,1:1 <µ a) b) c) As hipóteses podem ser hipóteses simples se especificam completamente o valor dos parâmetros, ou, caso contrário, são hipóteses compostas. Ex: Hipótese simples: Hipóteses compostas: 65,1=µ 65,1≠µ 65,1<µ 65,1>µ Tipos de Teste • Os testes de hipótese podem ser: – Bilaterais: mH 65,1:0 =µ mH 65,1:1 ≠µ – Unilaterais à esquerda: – Unilaterais à direita: mH 65,1:0 =µ mH 65,1:1 <µ mH 65,1:0 =µ mH 65,1:1 >µ Estatística - teste Considere uma amostra da população com f.d.p. , em que é um parâmetro desconhecido, sobre o qual pretendemos fazer um teste de hipóteses e uma amostra particular retirada dessa população. ),...,,( 21 nXXX )|( θXf θ ),...,,( 21 nxxx O resultado do teste de hipóteses consiste na rejeição ou não rejeição da hipótese nula , de acordo com uma regra de decisão baseada numa estatística, ,designada por estatística- teste. ),...,,( 21 nXXXTT = 0H Definição: Regra de decisão Um teste de hipóteses estabelece uma regra que permite determinar um conjunto RC tal que: Se pertencer a RC, rejeita-se),...,,( 21 nxxxTt = ;0H Se não pertencer a RC, não se rejeita),...,,( 21 nxxxTt = ;0H O conjunto RC chama-se região crítica ou região de rejeição. O complementar do conjunto RC chama-se região de aceitação. A definição dessas regiões depende do tipo de teste efetuado e do nível de significância considerado. Tipos de erros • Há dois tipos possíveis de erro ao testar uma hipótese estatística: – Erro do Tipo I: consiste em rejeitar quando é verdadeira. 0H 0Hquando é verdadeira. – Erro do Tipo II: consiste em não rejeitar quando é falsa. 0H 0H 0H Decisão H0 verdadeira H0 falsa Rejeitar H0 Não rejeitar H0 Erro tipo I Decisão correta Erro tipo IIDecisão correta Tipos de erros • Nível de significância: • Probabilidade de cometer o erro do tipo II: =α P(cometer erro tipo I) = P(rejeitar H0 | H0 é verdadeira) =β P(cometer erro tipo II) = P(não rejeitar H | H é falsa) • Potência do Teste: =β P(cometer erro tipo II) = P(não rejeitar H0 | H0 é falsa) =− β1 P(rejeitar H0 | H0 é falsa) Na prática, na maioria das aplicações de teste de hipótese, nós especificamos o nível de significância ( ).α Teste de Hipóteses • Ex: )16,(~ µNX 20:0 =µH 20:1 >µH Região de rejeição (crítica) para H0. Região de aceitação Para H0. α %5= 20:1 >µH n = 16 (tamanho da amostra) ~X n N 2 , σ µ Por hipótese: 20=µ )1,20(~ NX cX X20 64,21 Regra de decisão: Rejeitar quando 0H 0H 64,21≤X 64,21>X Não rejeitar quando Etapas para realização dos testes de hipóteses 1) Especificar as hipóteses e ; 2) Fixar o limite do erro , e identificar a variável do teste (estatística – teste); 3) Com o auxílio das tabelas estatísticas, considerando o 0H 1H α ),...,,( 21 nXXXTT = 3) Com o auxílio das tabelas estatísticas, considerando o nível de significância e a variável do teste, determinar a RC (região crítica); 4) Com os elementos amostrais, calcular o valor da variável do teste ; 5) Concluir pela rejeição ou não de pela comparação do valor obtido na 4ª etapa com a RC. ( )α ),...,,( 21 nxxxTt = 0H Teste de hipótese para a média com variância conhecida 1) Estabelecer as hipóteses: 00 : µµ =H 01 : µµ ≠H (a) (b)µµ > uma das alternativas 2) Fixar o nível de significância e identificar a variável do teste: .α (b) (c) 0µµ > 0µµ < uma das alternativas Nível de significância = ~ / 0 n X Z σ µ− = ( )1,0NEstatística – teste: Teste de hipótese para a média com variância conhecida 3) Determinar a região crítica (RC) com o auxílio da tabela da N(0,1). (a) (b) (c) 2/α2/α α α 4) Calcular o valor da variável do teste: n X Zcal / 0 σ µ− = Região Crítica cz Z0 2/α Z0 Z0 2/α cz− cz cz− Teste de hipótese para a média com variância conhecida 5) Conclusões: ccalc zzz ≤≤−(a) Se , não se pode rejeitar .0H ccal zz −<Se ou , rejeita-se .0Hccal zz > (b) (c) ccal zz <Se , não se pode rejeitar .0H Se , rejeita-se .0Hccal zz > ccal zz −< Se , não se pode rejeitar .0H Se , rejeita-se .0H ccal zz −> Teste de hipótese para a média com variância conhecida Ex1: Uma máquina de ensacar determinado produto, quando bem regulada, fornece o produto em sacos cujos pesos têm distribuição normal com média e desvio padrão . Com basekg600 =µ kg2,0=σmédia e desvio padrão . Com base em uma amostra de 25 sacos (peso médio dos sacos 59,90 kg) teste a hipótese da máquina está bem regulada, ou seja, , com nível de significância de 5%. kg600 =µ kg2,0=σ kg600 =µ Teste de hipótese para a média com variância conhecida Ex1: 1) 2) 60:0 =µH %5=α 60:1 ≠µH 4) n X Zcal / 0 σ µ− = 25/2,0 6090,59 − = 5,2−= 2) 3) %5=α ~ / 0 n X Z σ µ− = ( )1,0NEstatística – teste: cz Z0 %5,2%5,2 cz− %5,47 %5,47)0( =<< czZP 96,1=cz 5) Como então rejeitamos, ao nível de significância de 5%, a hipótese , em favor da hipótese . Isso significa que a máquina deve ser regulada. 96,15,2 −<− 60:0 =µH 60:1 ≠µH Teste de hipótese para a média com variância desconhecida 1) Estabelecer as hipóteses: 00 : µµ =H 01 : µµ ≠H (a) (b)µµ > uma das alternativas 2) Fixar o nível de significância e identificar a variável do teste: .α (b) (c) 0µµ > 0µµ < uma das alternativas Nível de significância = ~ /ˆ 0 n X σ µ− ( )1−ntEstatística – teste: Teste de hipótese para a média com variância desconhecida 3) Determinar a região crítica (RC) com o auxílio da tabela “t”. (a) (b) (c) 2/α2/α α α ( )1−nt ( )1−nt ( )1−nt 4) Calcular o valor da variável do teste: n X tcal /ˆ 0 σ µ− = Região Crítica ct t0 2/α t0 t0 2/α ct− ct ct− ( ) 1 ˆ 1 2 − − == ∑ = n XX S n i i σ, Teste de hipótese para a média com variância desconhecida 5) Conclusões: ccalc ttt ≤≤−(a) Se , não se pode rejeitar .0H ccal tt −<Se ou , rejeita-se .0Hccal tt > (b) (c) ccal tt <Se , não se pode rejeitar .0H Se , rejeita-se .0Hccal tt > ccal tt −< Se , não se pode rejeitar .0H Se , rejeita-se .0H ccal tt −> Teste de hipótese para a média com variância desconhecida Ex2: Dados os valores 4, 6, 3, 6 e 6, de uma amostra de cinco observações da variável . Teste, aonível de significância de 5%, a hipótese de que a média da população é 1, contra a hipótese alternativa de que( )µ ( )2,~ σµNX da população é 1, contra a hipótese alternativa de que é maior do que 1. ( )µ Teste de hipótese para proporções 1) Estabelecer as hipóteses: 00 : ppH = 01 : ppH ≠ (a) (b)pp > uma das alternativas 2) Fixar o nível de significância e identificar a variável do teste: .α (b) (c) 0pp > 0pp < uma das alternativas Nível de significância = ~ ˆ 00 0 n qp pp − ( )1,0N Estatística – teste: Teste de hipótese para proporções 3) Determinar a região crítica (RC) com o auxílio da tabela da N(0,1). (a) (b) (c) 2/α2/α α α 4) Calcular o valor da variável do teste: n pp pp Z cal )1( ˆ 00 0 − − = Região Crítica cz Z0 2/α Z0 Z0 2/α cz− cz cz− Teste de hipótese para proporções 5) Conclusões: ccalc zzz ≤≤−(a) Se , não se pode rejeitar .0H ccal zz −<Se ou , rejeita-se .0Hccal zz > (b) (c) ccal zz <Se , não se pode rejeitar .0H Se , rejeita-se .0Hccal zz > ccal zz −< Se , não se pode rejeitar .0H Se , rejeita-se .0H ccal zz −> Teste de hipótese para proporções Ex3: As condições de mortalidade de uma região são tais que a proporção de nascidos que sobrevivem até 60 anos é de 60%. Testar essa hipótese ao nível de 5% se em 1000 nascimentos amostrados aleatoriamente,em 1000 nascimentos amostrados aleatoriamente, verificou-se 530 sobreviventes até 60 anos. Teste de hipótese para a variância com média desconhecida 1) Estabelecer as hipóteses: 2 0 2 0 : σσ =H :1H (a) uma das alternativas 2 0 2 σσ ≠ 2) Fixar o nível de significância e identificar a variável do teste: .α (a) (b) (c) 2 0 2 σσ > 2 0 2 σσ < Nível de significância = ( ) ~ 1 2 0 2 σ Sn − ( ) 2 1−nχEstatística – teste: 0σσ ≠ Teste de hipótese para a variância com média desconhecida 3) Determinar a região crítica (RC) com o auxílio da tabela . (a) (b) (c) 2χ 2/α 2/α α α 4) Calcular o valor da variável do teste: ( ) 2 0 2 2 1 σ χ Sn cal − = Região Crítica ( ) 1 1 2 2 − − = ∑ = n XX S n i i , 2 supχ 2 )1( −nχ0 2infχ 2 supχ 2 )1( −nχ0 2 )1( −nχ0 2 infχ Se ou , rejeita-se Se , não se pode rejeitar Teste de hipótese para a variância com média desconhecida 5) Conclusões: 2 sup 22 inf χχχ ≤≤ cal(a) .0H 2 inf 2 χχ <cal .0H 2 sup 2 χχ >cal Se , rejeita-se Se , não se pode rejeitar(b) (c) 2 sup 2 χχ <cal .0H Se , rejeita-se .0H 2 sup 2 χχ >cal 2 inf 2 χχ <cal Se , não se pode rejeitar .0H .0H 2 inf 2 χχ >cal Teste de hipótese para a variância com média desconhecida Ex4: Para testar a hipótese de que a variância de uma população é 25, tirou-se uma amostra aleatória de 25 elementos obtendo-se . Admitindo-se , efetuar o teste de significância unilateral (unicaudal) a 3,182 =S 10,0=α efetuar o teste de significância unilateral (unicaudal) a esquerda. Teste de hipótese para a variância com média conhecida Estatística - teste: ( ) 21 2 ~ n i iX χ µ∑ = − ( ) 2 2 1 ~ n i χ σ = Teste de hipótese para a diferença de duas médias 1) Estabelecer as hipóteses: dH =− 210 : µµ Supondo que as variâncias populacionais são conhecidas, independentes e normais. Situação 1: 2) Fixar o nível de significância e identificar a variável do teste: .α dH =− 210 : µµ dH ≠− 211 : µµ Para d = 0 Nível de significância = (Testes unilaterais podem ser realizados) 210 : µµ =H 211 : µµ ≠H (Testes para igualdade de duas médias) Teste de hipótese para a diferença de duas médias Identificando a variável do teste: 21 µµ − 21 XX − ( )=− 21 XXE ( ) ( )=− 21 XEXE 21 µµ −( ) ( ) ( )=− 21 XXV ( ) ( )=+ 21 XVXV são independentes.1X 2Xe 2 2 2 1 2 1 nn σσ + ~21 XX − +− 2 2 2 1 2 1 21 , nn N σσ µµ ( ) ( ) 2 2 2 1 2 1 2121 nn XX Z σσ µµ + −−− = )1,0(~ N (Estatística - teste) Teste de hipótese para a diferença de duas médias 3) Determinar a região crítica (RC) com o auxílio da tabela da N(0,1). 2/α2/α 4) Calcular o valor da variável do teste: Região Crítica cz Z0 2/α2/α cz− ( ) 2 2 2 1 2 1 21 nn dXX Zcal σσ + −− = Teste de hipótese para a diferença de duas médias 5) Conclusões: ccalc zzz ≤≤−Se , não se pode rejeitar .0H ccal zz −<Se ou , rejeita-se .0Hccal zz > Teste de hipótese para a diferença de duas médias Ex5: Um fabricante faz dois tipos de pneus. Para o tipo A, milhas, e para o tipo B, milhas. Um táxi testou 50 pneus do tipo A e 40 pneus do tipo B, obtendo 24000 milhas e 26000 milhas de duração média 2500=σ 3000=σ obtendo 24000 milhas e 26000 milhas de duração média dos respectivos tipos. Adotando-se , testar a hipótese de que a vida média dos dois tipos é a mesma. %4=α Teste de hipótese para a diferença de duas médias Ex5: 1) 2) 0:0 =− BAH µµ %4=α 0:1 ≠− BAH µµ 4) ( ) ( ) ( ) 40 3000 50 2500 02600024000 22 + −− =calZ 38,3−= BA µµ = BA µµ ≠ 2) 3) %4=α Estatística – teste: cz Z0 %2%2 cz− %48 %48)0( =<< czZP 05,2=cz 4050 5) Como então rejeitamos, ao nível de significância de 4%, a hipótese nula, em favor da hipótese alternativa. Isso significa que a vida média dos dois tipos de pneus são diferentes. 05,238,3 −<− ( ) ( )1,0~ 22 N nn dXX Z B B A A BA σσ + −− = Teste de hipótese para a diferença de duas médias Supondo que as variâncias populacionais são desconhecidas, mas são supostamente iguais. Situação 2: ( ) ( ) 22 2121 XX σσ µµ −−− 2σ1σ e desconhecidos. Identificando a variável do teste: ( ) ( )2121 µµ −−− XX σσσ == 21 Estimador não tendencioso da variância, comum as duas populações, é dada por: 2 2 2 1 2 1 nn σσ + 21 e desconhecidos. 2 21 11 σ + nn ( ) ( ) 221 1 2 22 1 2 11 2 21 −+ −+− = ∑∑ == nn XXXX S n i i n i i ou ( ) ( ) 2 11 21 2 22 2 112 −+ −+− = nn SnSn S Teste de hipótese para a diferença de duas médias Identificando a variável do teste: Supondo que as variâncias populacionais são desconhecidas, mas são supostamente iguais. Situação 2: ( )221 −+nnt ( ) ( ) ~ 11 2 21 2121 S nn XX + −−− µµ =calt (Estatística - teste) Teste de hipótese para a diferença de duas médias Ex6: Uma amostra da população A forneceu os valores 10, 4, 8, 11, 14, 12, 9, 13 e 9, e uma amostra da população B forneceu os valores 14, 16, 16 e 10. Supondo que a variável em análise tem distribuiçãoSupondo que a variável em análise tem distribuição normal com variância , em ambas as populações, teste, ao nível de significância de 5%, a hipótese de que a média da população A é igual a média da população B. 2σ Teste de hipótese para a diferença de duas médias Variâncias desconhecidase diferentes.Situação 3: Variável do teste: ( ) ( ) ( )t XX t ~21 21 −−− = µµ os graus de liberdade para t são dados por: 2 2 2 2 2 2 1 2 1 1 2 2 2 2 1 2 1 1 1 1 1 − + − + = n S nn S n n S n S gl ( ) ( ) ( )glt n S n S t ~ 2 2 2 1 2 1 21 + = Teste de hipótese para a diferença entre as proporções de duas populações 1) Estabelecer as hipóteses: dppH =− 210 : dppH ≠− 211 : (Testes unilaterais podem ser realizados) 2) Fixar o nível de significância e identificar a variável do teste: .αNível de significância = Identificando a variável do teste: 21 pp − 21 ˆˆ pp − Teste de hipótese para a diferença entre as proporções de duas populações Identificando a variável do teste: ( )=− 21 ˆˆ ppE ( ) ( )=− 21 ˆˆ pEpE 21 pp − ( )=− 21 ˆˆ ppV ( ) ( ) =−+ )ˆ,ˆ(2ˆˆ 2121 ppCovpVpV 2 22 1 11 n qp n qp + 0 21 nn ~ˆˆ 21 pp − +− 2 22 1 11 21 , n qp n qp ppN ( ) ( ) 2 22 1 11 2121 ˆˆ n qp n qp pppp Z + −−− = )1,0(~ N (Estatística - teste) ( ) ( ) 2 22 1 11 2121 ˆˆˆˆ ˆˆ n qp n qp pppp Z + −−− = )1,0(~ N Teste de hipótese para a diferença entre as proporções de duas populações 3) Determinar a região crítica (RC) com o auxílio da tabela da N(0,1). 2/α2/α 4) Calcular o valor da variável do teste: Região Crítica cz Z0 2/α2/α cz− ( ) ( ) 2 22 1 11 2121 ˆˆˆˆ ˆˆ n qp n qp pppp Zcal + −−− = Teste de hipótese para a diferença entre as proporções de duas populações 5) Conclusões: ccalc zzz ≤≤−Se , não se pode rejeitar .0H ccal zz −<Se ou , rejeita-se .0Hccal zz > Teste de hipótese para a diferença entre as proporções de duas populações Freqüentemente , então:0=d 210 : ppH = 211 : ppH ≠ (Teste para igualdade de duas proporções) Identificando a variável do teste: ( ) ( ) 2 22 1 11 2121 ˆˆ n qp n qp pppp Z + −−− = Por :0H ppp == 21 ( ) 21 21 ˆˆ n pq n pq pp Z + − = ( ) + − = 21 21 11 ˆˆ nn pq pp Estimador apropriado de p, levando em consideração todas as observações é: 21 2211 ˆˆ ˆ nn pnpn p + + = Identificando a variável do teste: Teste de hipótese para a diferença entre as proporções de duas populações Para :0=d ( ) ( ) ( )1,0~ 11 ˆ1ˆ ˆˆ 21 N pp pp Z +− − = (Estatística - teste) ( ) 11ˆ1ˆ 21 nn pp +− onde: 21 2211 ˆˆ ˆ nn pnpn p + + = Teste de hipótese para a diferença entre as proporções de duas populações Ex7: Deseja-se testar se são iguais as proporções de homens e mulheres que lêem revista e se lembram de determinado anúncio. São os seguintes os resultados de amostras aleatórias independentes de homens eamostras aleatórias independentes de homens e mulheres: onde x1 é o número de homens que se lembram do anúncio e x2 é o correspondente número de mulheres. Admita 701 =x Homens Mulheres 502 =x 2002 =n2001 =n %.10=α Teste de hipótese para a igualdade de duas variâncias 1) Estabelecer as hipóteses: 2) Fixar o nível de significância e identificar a variável do 22 2 2 10 : σσσ ==H 2 2 2 11 : σσ ≠H 2) Fixar o nível de significância e identificar a variável do teste: .αNível de significância = Identificando a variável do teste: ( ) ~ 1 2 1 2 11 σ Sn U − = ( ) ~ 1 2 2 2 22 σ Sn V − = ( ) 2 11−n χ ( ) 2 12 −n χ ( ) ( ) 2 2 2 22 2 1 2 11 1 1 σ σ Sn Sn V U − − = ( ) ( ) ~ 1 1 / / 2 1 2 2 2 2 2 1 2 1 − − = n V n U S S σ σ ( )1,1 21 −− nnF Teste de hipótese para a igualdade de duas variâncias Supondo verdadeira: (Estatística - teste) 0H = 2 2 2 2 2 1 2 1 / / σ σ S S 22 2 2 1 σσσ == ( )1,12 2 2 1 21 ~ −− nnF S S 22 /σS 2S 3) Determinar a região crítica (RC) com o auxílio da tabela da distribuição F. supf 2/α ( )1,1 21 −− nnF 0 inff 2/α Região Crítica Teste de hipótese para a igualdade de duas variâncias 4) Calcular o valor da variável do teste: 2 2 2 1 S S Wcal = 5) Conclusões: Se ou , rejeita-se Se , não se pode rejeitarsupinf fWf cal ≤≤ .0H inffWcal < .0HsupfWcal > Teste de hipótese para a igualdade de duas variâncias Ex8: Queremos verificar se duas máquinas produzem peças com a mesma homogeneidade quanto à resistência à tensão. Para isso, sorteamos duas amostras de seis peças de cada máquina, e obtivemosamostras de seis peças de cada máquina, e obtivemos as seguintes resistências: Admita %.10=α Máquina A 145 127 136 142 141 137 Máquina B 143 128 132 138 142 132
Compartilhar