Baixe o app para aproveitar ainda mais
Prévia do material em texto
Teste de Hipótese para a Proporção Populacional. É uma conjectura sobre um parâmetro populacional Por exemplo, a proporção p é um parâmetro populacional. A hipótese deve ser estabelecida antes da análise. Um teste é dito ser paramétrico, se a partir do conhecimento de um particular parâmetro , a distribuição de probabilidade da variável X fica completamente definida. A moeda é honesta ou é viciada? Qual é a proporção de votos que o candidato A tem nas eleições? Qual é a probabilidade de "cara“ no lançamento de uma moeda? Qual é a proporção de adultos que tiveram dor de cabeça nas últimas 24 horas? O candidato A vencerá as eleições ? Pelo menos 10% dos adultos tiveram dor de cabeça nas últimas 24 horas? Em estimação o objetivo é “estimar” o valor desconhecido da proporção p de “indivíduos” em uma população com determinada característica. A estimativa é baseada no número x de “indivíduos” com a característica de interesse, numa amostra aleatória de tamanho n. Se o objetivo for saber se o valor observado x nessa amostra, dá ou não suporte a uma afirmativa sobre o valor de p , trata-se de testar uma hipótese. Queremos então testar a hipótese nula H0: a moeda é honesta contra a hipótese alternativa H1: a moeda não é honesta Exemplo 1: Queremos avaliar se uma moeda é não viciada. Na linguagem estatística, essas hipóteses podem ser escritas como: H0: p = 0,5 H1: p 0,5 com p sendo a probabilidade de aparecer “cara” na moeda. De uma maneira geral, uma hipótese estatística é uma afirmação ou conjectura sobre um parâmetro de uma distribuição de uma variável aleatória H0 : Hipótese nula: afirmação ou conjectura sobre p geralmente relacionada a um valor de referência, ou a uma especificação padrão ou histórica. É sempre a hipótese que queremos rejeitar. H1 : Hipótese alternativa: afirmação ou conjectura sobre p que esperamos ser verdadeira. No caso especial de teste de hipóteses sobre a proporção populacional p, temos: No nosso exemplo, se considerarmos 12 lançamentos independentes da moeda e denotarmos por X o número de caras nesses lançamentos, então o parâmetro é a proporção de caras p e , já sabemos que X ~ Binomial (12; p ) Note que o número de lançamentos está fixado (n=12), portanto fazer conjecturas sobre p é similar a fazer conjecturas sobre o número esperado de sucessos (esperança de X). Se observarmos 5 caras em 12 lançamentos independentes da moeda, o que podemos concluir? E se observarmos 4 caras? “Se, em 12 lançamentos da moeda, observarmos 0,1, 2, 3, 9, 10, 11 ou 12 caras, então rejeitamos a hipótese nula H0 de que a moeda é honesta; caso contrário, não rejeitamos a hipótese H0.” Podemos considerar uma regra de decisão, como por exemplo, Ou 10 caras? Ou 12 caras? No exemplo, o conjunto de valores de X que levam à rejeição da hipótese nula H0 é {0, 1, 2, 3, 9, 10, 11, 12}, o qual denominamos de região crítica (RC) ou região de rejeição de H0, ou seja, RC = {0, 1, 2, 3, 9 , 10, 11, 12} : região crítica ou região de rejeição RCc = {4, 5, 6, 7, 8} : região de não rejeição de H0 Testar uma hipótese estatística é estabelecer uma regra que nos permita, com base na informação de uma amostra, decidir pela rejeição ou não de H0. Regra de decisão (teste): Seja x o valor observado na amostra da variável X, então x RC rejeitamos H0 x RC não rejeitamos H0 No exemplo da moeda, suponha que observamos 4 caras, isto é, x = 4. Como 4 RC não rejeitamos H0 (não temos evidência suficiente de que a moeda seja viciada). Será que nossa conclusão está correta? Ao decidir pela rejeição ou não da hipótese nula H0, podemos cometer dois tipos de erro. (afirmar que uma moeda não é honesta quando, na verdade ela é). Rejeitar H0 quando H0 é verdadeira Erro tipo I: Erro tipo II: Não rejeitar H0 quando H0 é falsa (afirmar que uma moeda é honesta quando, na verdade ela é viciada). Prob(erro I) = P(rejeitar H0 | H0 é verdadeira) = : nível de significância do teste Prob(erro II) = P(não rejeitar H0 | H0 é falsa) = Ao valor (1 - ) denominamos poder do teste Em geral, só podemos controlar um dos erros (fixando sua probabilidade de ocorrência). No exemplo da moeda, RC = {0,1,2,3,9,10,11,12} = P( erro I) = P( rejeitar H0 | H0 verdadeira ) = P(X RC | p=0,5) = P(X=0 | p=0,5) + ... + P(X=3 | p=0,5) + P(X=9 | p=0,5)+ ... + P(X=12 | p=0,5) = 0,000244 + 0,00293 + 0,016113 + 0,053711 + 0,053711 + 0,016113 + 0,00293 + 0,000244 = 0,1458 Verdadeiro valor de p Decisão p = 0,5 (H0 é verd.) p 0,5 (H1 é verd.) Não rejeitar H0 Decisão correta 1 - = 0,8542 Erro II Rejeitar H0 Erro I = 0,1458 Decisão correta 1 - Se alterarmos a regra de decisão para RC = {0, 1, 2, 10, 11, 12}, isto é, concluiremos que a moeda é viciada se o número de caras for 0, 1, 2, 10, 11 ou 12, o que acontece com o nível de significância do teste (probabilidade de erro tipo I )? = P( erro I) = P( rejeitar Ho | Ho verdadeira )=P( X RC |p=0,5) = P(X=0 | p=0,5) + ... + P(X=2 | p=0,5) + P(X=10 | p=0,5)+ ... + P(X=12 | p=0,5) = 0,000244 + 0,00293 + 0,016113 + 0,016113 + 0,00293 + 0,000244 = 0,0384 RC {0, 1, 2, 3, 9, 10, 11, 12} {0, 1, 2, 10, 11, 12} {0, 1, 11, 12} 0,1458 0,0384 0,0063 Os valores de nível de significância usualmente adotados são entre 1% e 10%. RC Até agora, o procedimento foi escolher RC determinar Alternativamente, podemos fixar determinar RC Exemplo 2: Suponha que um medicamento existente no mercado produza o efeito desejado em 60% dos casos nos quais o mesmo é aplicado. Um laboratório produz um novo medicamento e afirma que ele é melhor do que o existente. Objetivo: Verificar estatisticamente se a afirmação do laboratório é verdadeira. Aplicou-se o medicamento em n = 10 pacientes. Sendo X o nº de pacientes, dentre os 10, para os quais o novo medicamento produz o efeito desejado, temos que, X ~ B (10; p), com p sendo a proporção de pacientes para os quais o novo medicamento é eficaz. H0: p = 0,6 H1: p > 0,6 (1) Hipóteses estatísticas: que correspondem a H0: o novo medicamento é similar ao existente H1: o novo medicamento é melhor, mais efetivo Pela tabela da binomial (10; 0,6), para k = 9, P(X 9) = 0,0463 (2) Fixemos o nível de significância em 5% ( = 0,05). (3) A região crítica deve ter a forma: RC = { X k } O valor de k deve ser tal que P(erro I) = P(X RC | p = 0,6) = P(X k) = , Portanto, RC = {X 9}, garante um erro tipo I de no máximo 5% (na realidade, = 0,0463). para k = 8, P(X 8) = 0,1672 No exemplo 2 as hipóteses nula e alternativa são: H0: p = 0,6 e H1: p 0,6 isto é, desejamos detectar desvios em p apenas em uma direção, ou seja, desvios à “direita” de 0,6. Neste caso, dizemos que a hipótese alternativa é unilateral. No exemplo 1 (da moeda),como as hipóteses são H0: p = 0,5 e H1: p 0,5 dizemos que a hipótese alternativa é bilateral (detectaríamos desvios em torno de p = 0,5 em qualquer direção). Exemplo 3: A proporção de complicações, associada a um determinado procedimento cirúrgico é de 15%. Com o objetivo de reduzir essa proporção, um pesquisador desenvolveu um novo procedimento e o aplicou a uma amostra de 60 pacientes. Seja X o número de pacientes com complicações entre 60 pacientes. Então, X ~ B(n=60; p), sendo p a proporção atual de pacientes com complicações (após o novo procedimento). H0: a proporção de complicações não se alterou (a afirmação do pesquisador está incorreta). H1: a proporção de complicações diminuiu (afirmação do pesquisador está correta). Equivalentemente, H0: p = 0,15 H1: p < 0,15 (2) Vamos fixar = 0,05. (1) As hipóteses de interesse são (3) A região crítica deve ter a forma: RC = { X k } O valor de k deve ser tal que P(erro I) = , ou seja, P(X k | p = 0,15) = 0,05. RC = { X 4} Pela tabela da binomial(60; 0,15), Na realidade temos = 0,0424. (5) Decisão e conclusão decidimos por não rejeitar H0, ao nível de significância de 4,24%. (4) Buscar a evidência na amostra para concluir: Se observamos 6 pacientes entre os 60 tratados, qual é a conclusão? 6 RC Concluímos que não temos evidência suficiente para afirmar que a proporção de pacientes com complicações (após o novo procedimento) é inferior a 15%, isto é, não há evidência suficiente de que a afirmação do pesquisador seja correta. Exemplo 4: Um industrial afirma que seu processo de fabricação produz 90% de peças dentro das especificações. O IPEM deseja investigar se este processo de fabricação ainda está sob controle. H0: p = 0,9 H1: p < 0,9 Sendo p a proporção de peças dentro das especificações, as hipóteses de interesse são: Ou seja, H0: o processo está sob controle H1: o processo não está sob controle Selecionamos uma amostra aleatória de 15 itens e observamos o número de itens satisfatórios (X), X ~ B(15, p). então Região crítica: RC= { X k } para = 6% Logo, temos k = 11 e RC = {X 11}. Para = 1% temos k = 9 e RC = {X 9}. Crítica: arbitrariedade na escolha da RC (ou do nível de significância). b) se = 1% a) se = 6% Se observamos X = 10 peças satisfatórias, então Rejeitamos H0 ao nível de significância de 6%. 10 RC Não rejeitamos H0 ao nível de significância de 1%. 10 RC Sugestão: determinar o nível de significância associado à evidência experimental, que é denominado nível descritivo. Nesse exemplo, a região crítica é da forma RC = { X k } O nível descritivo é calculado para xobs = 10, P = P (X 10 | p = 0,9) = 0,0127 “Essa probabilidade P mede a força da evidência contida nos dados, contra a hipótese nula H1.” Como saber se essa evidência é suficiente para rejeitar H0? Se o valor de P é “pequeno”, então é pouco provável observarmos valores iguais ou mais extremos que o da amostra, supondo a hipótese nula H0 verdadeira. Logo, há indícios que a hipótese nula não seja verdadeira e, tendemos a rejeitá-la. Assim, P “pequeno” rejeitamos H0 P “não pequeno” não rejeitamos H0 Quão “pequeno” deve ser o valor de P para rejeitarmos H0 ? Para valores “não tão pequenos” de P , não fica evidente que a hipótese nula Ho seja falsa, portanto, tendemos a não rejeitá-la. P rejeitamos H0 P > não rejeitamos H0 No exemplo, P = 0,0127. Adotando = 0,05, temos P < e, portanto, rejeitamos H0 ou seja, concluímos que o processo não está sob controle. Se P , dizemos que a amostra forneceu evidência suficiente para rejeitar a hipótese nula H. Lembrando que a idéia inicial de P era considerar um nível de significância associado à evidência amostral, então devemos compará-lo com o nível de significância fixado, de modo que, Observações: • Quanto menor o valor de P maior é a evidência contra a hipótese nula H0, contida nos dados. • Quanto menor o nível de significância fixado, mais forte deve ser a evidência contra a hipótese nula, para que ela seja rejeitada. • Quando a hipótese nula é rejeitada para o nível de significância fixado, diz-se também que a amostra é significante ao nível de significância . Exemplo 5: Pelo Anuário do IBGE de 2000, a proporção de analfabetos em uma cidade era de 15%. Em 2010, entre 200 entrevistados dessa cidade, 27 eram analfabetos. Esses dados suportam a tese de diminuição do analfabetismo na cidade de 2000 para 2010? (1) Estabelecer hipóteses Sendo p a proporção populacional de analfabetos na cidade em 2010, as hipóteses de interesse são: H0 : p = 0,15 H1 : p < 0,15 Seja X o número de analfabetos entre os 200 cidadãos entrevistados em 2010. X ~ B(200, p). (2) Fixar nível de significância (3) Observar a evidência na amostra Por exemplo, = 5% ( = 0,05). Foram observados 27 analfabetos xobs = 27 (4) Determinar o nível descritivo P = P (X 27 | p = 0,15) E(X) = np = 2000,15 = 30 Var(X) = np(1-p) = 2000,150,85 = 25,5 DP(X) = 25,5 = 5,05 Usando a aproximação normal: Cálculo exato (pela binomial): P = P(X 27 | p = 0,15) = 0,3164 P = P( X 27 | p = 0,15) P { Z (27- 30)/5,05 } = P( Z -0,59) = 0,2776 (5) Decisão e conclusão Como P > , decidimos por não rejeitar a hipótese nula H0. Portanto, ao nível de significância de 5%, não há evidências suficiente para concluir que o índice de analfabetismo na cidade diminuiu de 2000 para 2010. Nos exemplos anteriores, as hipóteses alternativas eram unilaterais (H1: p p0 ou H1: p p0 ). Nesses casos, o nível descritivo mede a probabilidade de se observar valores iguais ou mais extremos do que o encontrado na amostra (X xobs ou X xobs ), ou equivalentemente, o desvio do valor amostral à direita ou à esquerda do valor esperado sob a hipótese nula. Quando a hipótese alternativa é bilateral (H1: p p0), o nível descritivo mede o quanto o valor amostral pode se distanciar do valor esperado em ambas as direções. Exemplo 4: Se em 100 arremessos independentes de uma moeda observarmos 65 caras, podemos afirmar que a moeda é viciada ? Sendo p a probabilidade de “cara” da moeda, as hipóteses de interesse são H0: p = 0,5 H1: p 0,5 (1) Estabelecer hipóteses ou seja, a moeda é honesta (H0) ou é viciada(H1). (2) Fixar nível de significância Por exemplo, = 5% ( = 0,05). (3) Observar a evidência na amostra Seja X o número de caras obtidas em 100 arremessos. xobs = 65 caras (4) Determinar o nível descritivo Se a moeda fosse honesta, o número esperado de caras nos 100 arremessos seria 50. Observamos um desvio de |65 – 50| = 15 unidades em relação ao número esperado de caras. Se a moeda é honesta, E(X) = np = 1000,5 = 50 Var(X) = np(1-p) = 1000,50,5 = 25 DP(X) = 25 = 5 então, P = 2 P( X 65 | p = 0,5) P = P(X 65 ou X 35 | p = 0,5) (por simetria) = 2 P( X 65 | p = 0,5) 2 P { Z (65-50)/5 } = 2 P(Z 3) = 0,0027, com Z representando a distribuição Normal(0,1). Isso nos leva a duvidar da honestidade da moeda. Logo, a conclusão abaixo procede. (5) Decisãoe conclusão Como P < , decidimos por rejeitar a hipótese nula H0. Ou seja, concluímos que há evidências suficiente para se afirmar que a moeda é viciada, ao nível de significância de 5%. Como o valor de P é pequeno, um número de caras tão afastado da média como o que foi observado, dificilmente ocorre quando arremessamos uma moeda não viciada 100 vezes. (1) Estabelecer as hipóteses: H0: p = p0 contra uma das alternativas H1: p p0 , H1 : p p0 ou H1 : p p0 . (2) Escolher um nível de significância . (3) Selecionar uma amostra aleatória simples e determinar o número xobs de “indivíduos” na amostra portadores do atributo desejado. (4) Determinar o nível descritivo P (5) Decidir, comparando P com o nível de significância , e concluir. Se P rejeitamos H0 Se P > não rejeitamos H0 Se H1: p p0 , P = P (X xobs | p = p0). Se H1 : p p0 , P = P (X xobs | p = p0). Se H1 : p p0 , P = 2 P (X xobs | p = p0) (se xobs np0) ou 2 P (X xobs | p = p0) (se xobs np0) Para n grande, use a aproximação normal. OBRIGADA!!!!
Compartilhar