Logo Passei Direto
Buscar
Material
páginas com resultados encontrados.
páginas com resultados encontrados.

Prévia do material em texto

<p>UNIVERSIDADE AGOSTINHO NETO - FACULDADE DE CIÊNCIAS</p><p>INFERÊNCIA ESTATÍSTICA II</p><p>DOCENTE: HENDA MONDLANE 1</p><p>CAPÍTULO I - TESTES DE HIPÓTESES</p><p>1.1 Generalidades</p><p>Decisões estatísticas</p><p>Todos os dias temos de tomar decisões respeitantes a determinadas populações, com</p><p>base em amostras das mesmas. Essas decisões são denominadas decisões estatísticas.</p><p>Nesta tomada de decisões é útil formular hipóteses sobre as populações, hipóteses</p><p>essas que podem ou não ser verdadeiros. A essas hipóteses chamamos hipóteses</p><p>estatísticas, as quais geralmente se baseiam em afirmações sobre as distribuições de</p><p>probabilidade das populações ou alguns dos seus parâmetros. Por vezes estas hipóteses,</p><p>ao serem formuladas, têm por único objectivo serem rejeitadas.</p><p>Exemplo:</p><p>- Se queremos decidir se uma dada moeda está viciada, formulamos a hipótese de que</p><p>a moeda seja “honesta”, isto é, que a probabilidade de sair por exemplo cara seja p=0,5;</p><p>- Da mesma forma, se queremos decidir se um produto é melhor do que o outro,</p><p>podemos formular a hipótese de que não existe diferença entre ambos os produtos;</p><p>- Pode-se decidir, com base em dados amostrais, se um novo soro é realmente eficaz na</p><p>cura de uma doença, se um processo educacional é melhor do que outro; etc.</p><p>Desta forma os testes de hipóteses podem considerar-se uma segunda vertente da</p><p>inferência estatística, tendo por objectivo verificar, a partir de dados observados numa</p><p>ou várias variáveis, a validade de certas hipóteses relativas a uma ou várias populações.</p><p>Nos testes de hipóteses, e ao contrário dos intervalos de confiança, em vez de</p><p>procurarmos uma estimativa ou um intervalo para um parâmetro, vamos admitir um</p><p>valor hipotético para o mesmo e depois utilizar a informação da amostra para confirmar</p><p>ou rejeitar esse mesmo valor.</p><p>Os processos que habilitam a decidir se se aceitam ou rejeitam as hipóteses, ou a</p><p>determinar se as amostras observadas diferem, de modo significativo, dos resultados</p><p>esperados, são denominados testes de hipóteses ou de significância, ou regras de</p><p>decisão.</p><p>1.2 Princípios da realização dos testes de hipóteses</p><p>I. De uma forma geral emite-se uma certa hipótese a testar denominada Hipótese</p><p>Nula e representada por H0;</p><p>UNIVERSIDADE AGOSTINHO NETO - FACULDADE DE CIÊNCIAS</p><p>INFERÊNCIA ESTATÍSTICA II</p><p>DOCENTE: HENDA MONDLANE 2</p><p>Ao se tentar chegar às decisões, é conveniente a formulação de hipóteses ou de</p><p>conjecturas acerca das populações interessadas. Essas suposições, que podem ser ou</p><p>não verdadeiras, são denominadas hipóteses estatísticas e, podem ser afirmações</p><p>acerca das distribuições de probabilidade das populações.</p><p>Em alguns casos, formula-se uma hipótese estatística com um único propósito de</p><p>rejeitá-la ou invalidá-la. Por exemplo, se se deseja decidir se uma moeda é viciada,</p><p>formula-se a hipótese de que ela não o seja, isto é, p=0,5, em que p é a probabilidade</p><p>de caras. De modo semelhante se se deseja decidir se um processo é melhor do que</p><p>outro, formula-se a hipótese de que não há diferença entre eles (isto é, que quaisquer</p><p>diferenças observadas sejam devidas meramente a flutuações das amostras</p><p>provenientes da mesma população). Essas hipóteses são denominadas hipóteses nulas</p><p>e representamo-las por H0.</p><p>Qualquer hipótese que difira de uma prefixada é denominada hipótese alternativa. Por</p><p>exemplo se se admite que p=0,5, são hipóteses alternativas: p=0,7, ou p>0,5.</p><p>Uma hipótese alternativa da nula é representada por H1.</p><p>II. O conjunto dos valores observados para os quais a H0 é admissível forma a Região de</p><p>Aceitação (representada por RA). Os restantes valores formam a Região de Rejeição ou</p><p>Região Crítica (representada por RC).</p><p>III. Consoante o número de elementos (#) do parâmetro a determinar (q), podemos</p><p>distinguir quatro formas de especificar H0 e H1 (considerando q* estimador de q):</p><p>(a) Hipótese simples contra hipótese simples (em que #q0=1 e #q1=1)</p><p>H0:</p><p>H1: 𝜃 = 𝜃!</p><p>Considerando k o valor limite da RC teremos dois casos possíveis:</p><p>i. se q1>q0;</p><p>P(Rejeitar H0/H0)=P(q*∈ 𝑅𝐶/q=q0)= P(q*≥ 𝑘/q=q0)=a</p><p>FIGURA</p><p>ii. se q1<q0;</p><p>FIGURA</p><p>P(Rejeitar H0/H0)=P(q*∈ 𝑅𝐶/q=q0)= P(q*≤ 𝑘/q=q0)=a</p><p>5,0¹p</p><p>0qq =</p><p>UNIVERSIDADE AGOSTINHO NETO - FACULDADE DE CIÊNCIAS</p><p>INFERÊNCIA ESTATÍSTICA II</p><p>DOCENTE: HENDA MONDLANE 3</p><p>Consistindo a decisão em:</p><p>- rejeitar H0 se q*∈ 𝑅𝐶</p><p>- não rejeitar H0 q*∈ 𝑅𝐴</p><p>(b) hipótese simples contra hipótese composta (em que #q0=1 e #q1>1)</p><p>H0:</p><p>H1: ou q<q0 ou 𝜃 ≠ 𝜃"</p><p>Considerando k o valor limite da RC teremos três casos possíveis:</p><p>i. H0:</p><p>H1:</p><p>FIGURA</p><p>P(Rejeitar H0/H0)=P(q*∈ 𝑅𝐶/q=q0)= P(q*≥ 𝑘/q=q0)=a</p><p>ii. H0:</p><p>H1: q<q0</p><p>FIGURA</p><p>P(Rejeitar H0/H0)=P(q*∈ 𝑅𝐶/q=q0)= P(q*≤ 𝑘/q=q0)=a</p><p>iii.</p><p>H0:</p><p>H1: 𝜃 ≠ 𝜃"</p><p>FIGURA</p><p>Considerando k1 e k2 como sendo os limites da região crítica;</p><p>Como P(k1≤ 𝜃*)= P(𝜃* ≥ 𝑘$), então,</p><p>P(Rejeitar H0/H0)=P(q*∈ 𝑅𝐶/q=q0) = P((k1≤ 𝜃* ∪ 𝜃* ≥ 𝑘$) /q=q0)=a</p><p>Consistindo a decisão em:</p><p>- rejeitar H0 se q*∈ 𝑅𝐶</p><p>0qq =</p><p>0qq ></p><p>0qq =</p><p>0qq ></p><p>0qq =</p><p>0qq =</p><p>UNIVERSIDADE AGOSTINHO NETO - FACULDADE DE CIÊNCIAS</p><p>INFERÊNCIA ESTATÍSTICA II</p><p>DOCENTE: HENDA MONDLANE 4</p><p>- não rejeitar H0 se q*∈ 𝑅𝐴</p><p>(c) hipótese composta contra hipótese composta (em que #q0>1 e #q1>1)</p><p>H0: q≥q0 ou q≤q0</p><p>H1: q<q0 ou q>q0</p><p>Considerando k o valor limite da RC teremos dois casos possíveis:</p><p>i. H0: q≥q0</p><p>H1: q<q0</p><p>FIGURA</p><p>P(Rejeitar H0/H0)=P(q*∈ 𝑅𝐶/q=q0) = P(q*≤ 𝑘/q=q0)=a</p><p>ii.</p><p>H0: q≤q0</p><p>H1: q>q0</p><p>FIGURA</p><p>P(Rejeitar H0/H0)=P(q*∈ 𝑅𝐶/q=q0) = P(q*≥ 𝑘/q=q0)=a</p><p>Consistindo a decisão em:</p><p>- rejeitar H0 se q*∈ 𝑅𝐶</p><p>- não rejeitar H0 se q*∈ 𝑅𝐴</p><p>(d) hipótese composta contra hipótese simples (em que #q0>1 e #q1=1)</p><p>H0: 𝜃 ≠ 𝜃"</p><p>H1:</p><p>Este teste, embora teoricamente seja possível, na prática não se utiliza. Testar nestas</p><p>condições H0 fornece pouca informação, dado que o parâmetro a testar pode assumir</p><p>qualquer valor excepto q0. Como tal, podemos sempre transformar um teste deste tipo</p><p>num outro de hipótese simples contra hipótese composta, o qual faz muito mais sentido.</p><p>Suponhamos que se pretende testar a hipótese nula: H0: q Ɵ0 contra a hipótese</p><p>alternativa H1: q Ɵ1 em n observações da v.a. X;</p><p>0qq =</p><p>Î</p><p>Î</p><p>UNIVERSIDADE AGOSTINHO NETO - FACULDADE DE CIÊNCIAS</p><p>INFERÊNCIA ESTATÍSTICA II</p><p>DOCENTE: HENDA MONDLANE 5</p><p>Intuitivamente trata-se de decompor o espaço amostral Xn conjunto de amostras de</p><p>dimensão n da v.a. X, numa sua partição {A,R}, tal que ,</p><p>obtendo-se em consequência uma regra de teste que pode formular-se do modo</p><p>seguinte:</p><p>- Sendo A a região de aceitação e R a região de rejeição (região critica), observada a</p><p>amostra (X1, X2,…, Xn), então:</p><p>i. se o valor observado x cai em : aceita-se H0</p><p>ii. se o valor observado x cai em : rejeita-se H0</p><p>Testes unilaterais e bilaterais</p><p>Num teste de hipótese quando a RC abarca duas mangas da distribuição o teste se pode</p><p>denominar bilateral. Muitas vezes, entretanto, pode-se ter interesse apenas nos valores</p><p>extremos de um único lado da média, isto é, em uma “extremidade” da distribuição (a</p><p>esquerda ou a direita), como, por exemplo, quando se está a testar a hipótese de um</p><p>processo ser melhor do que o outro (o que é diferente de testar se um processo é melhor</p><p>ou pior do que outro). Esses testes são denominados</p><p>unilaterais ou de um lado.</p><p>IV. Erros do tipo I e II</p><p>Se uma hipótese for rejeitada quando deveria ser aceite, diz-se que foi cometido um</p><p>erro do tipo I. Se, por outro lado, for aceite uma hipótese que deveria ser rejeitada, diz-</p><p>se que foi cometido um erro do tipo II. Em ambos os casos, ocorreu uma decisão errada</p><p>ou um erro de julgamento.</p><p>Para que quaisquer testes de hipóteses ou regras de decisão sejam bons, eles deviam</p><p>ser planejados de modo que os erros de decisão sejam reduzidos ao mínimo.</p><p>Nível de significância</p><p>Ao testar uma hipótese estabelecida, a probabilidade máxima com a qual estaremos</p><p>dispostos a correr o risco de um erro do tipo I é denominada nível de significância do</p><p>teste. Essa probabilidade, representada frequentemente por a, é geralmente</p><p>especificada antes da extracção de quaisquer amostras, de modo que os resultados</p><p>obtidos não influenciem a escolha.</p><p>Na prática, é usual a adição de um nível de significância 0,05, ou 0,01, embora possam</p><p>ser usados outros valores. Se, por exemplo, é escolhido um nível de significância de 0,05</p><p>ou 5%, no planeamento de um teste de hipótese, há então cerca de 5 chances em 100,</p><p>da hipótese ser rejeitada, quando deveria ser aceite, isto é, há uma confiança de cerca</p><p>de 95% que se tome uma decisão acertada. Nesses casos, diz-se que a hipótese é</p><p>f=Ç=È RAeXRA n</p><p>AxA Î-</p><p>~</p><p>RxR Î-</p><p>~</p><p>UNIVERSIDADE AGOSTINHO NETO - FACULDADE DE CIÊNCIAS</p><p>INFERÊNCIA ESTATÍSTICA II</p><p>DOCENTE: HENDA MONDLANE 6</p><p>rejeitada no nível de significância 0,05, o que significa que a probabilidade de erro seria</p><p>de 0,05.</p><p>Definição: (Erros de 1ª e 2ª espécie): Um erro de 1ª espécie ou tipo I é cometido se</p><p>rejeitarmos H0 quando H0 é verdadeira. A probabilidade do erro de tipo I é designada</p><p>por a.</p><p>Um erro de 2ª espécie ou tipo II é cometido se aceitarmos H0 quando H0 é falsa. A</p><p>probabilidade do erro de tipo II é designada por b.</p><p>Designando por as probabilidades de serem cometidos erros de 1ª e 2ª</p><p>espécie, respectivamente, ter-se-á:</p><p>Haverá, a par das duas decisões incorrectas referidas, duas decisões correctas:</p><p>- aceitar H0, sendo H0 verdadeira</p><p>- rejeitar H0 sendo H0 falsa</p><p>O quadro seguinte resume as quatro situações descritas:</p><p>Natureza da</p><p>situação</p><p>Decisão tomada</p><p>(probabilidade da</p><p>decisão)</p><p>Aceitar H0 Rejeitar H0</p><p>H0 verdadeira decisão correcta (1-a) erro tipo I (a)</p><p>H0 falsa erro tipo II (b) decisão correcta (1-b)</p><p>É através das probabilidades a e b que se procura o melhor teste de hipóteses, sendo o</p><p>teste ideal o que minimiza simultaneamente ambos os valores. No entanto, e como a e</p><p>b variam em sentidos contrários, tal não é possível.</p><p>Chama-se função potência de um teste e representa-se por p(q) à probabilidade de</p><p>rejeitar H0 quando é falsa (decisão correcta). Então podemos dizer que dado o erro de</p><p>2ª espécie b= P(q*∈ 𝑅𝐴/H1), a função potência é o seu complementar p(q) = P(q*∈</p><p>𝑅𝐴/H1)=1-b(q). Esta probabilidade é função do grau de falsidade de H0, logo a</p><p>probabilidade de rejeição é tanto mais elevada, quanto mais falsa for H0. Conclui-se</p><p>então que a relação entre a probabilidade de rejeiçao de H0 e o grau de falsidade da</p><p>mesma constituem a função potência do teste, isto é, quanto maiores forem os valores</p><p>da função potência, menor é o erro de 2ª espécie cometido, logo, maior a qualidade do</p><p>teste (teste mais potente).</p><p>)()( qbqa e</p><p>{ }</p><p>{ }falsaHHaceitarP</p><p>everdadeiraHHrejeitarP</p><p>00</p><p>00</p><p>:)(</p><p>:)(</p><p>=</p><p>=</p><p>qb</p><p>qa</p><p>UNIVERSIDADE AGOSTINHO NETO - FACULDADE DE CIÊNCIAS</p><p>INFERÊNCIA ESTATÍSTICA II</p><p>DOCENTE: HENDA MONDLANE 7</p><p>Testes que envolvem a distribuição Normal</p><p>Considerando a RC a região crítica ou região de rejeição de H0 e RA a região de aceitação</p><p>de H0, podemos passar a enunciar, de uma forma geral, os procedimentos a utilizar num</p><p>teste de hipóteses:</p><p>i. Consoante os testes a realizar sejam sobre determinados parâmetros e se</p><p>conheçam ou não os restantes parâmetros da população normal, vamos</p><p>definir a estatística e respectiva distribuição adequadas (utilizadas nos</p><p>intervalos de confiança);</p><p>ii. Fixando a probabilidade de cometer um erro de 1ª espécie ou nível de</p><p>significância a=P(q*∈ 𝑅𝐶/H0), determina-se a RC;</p><p>iii. Verifica-se se o estimador do parâmetro (q*, fornecido pela amostra)</p><p>∈ 𝑅𝐶=> rejeitar H0</p><p>∈ 𝑅𝐶=> não rejeitar H0</p><p>Pode ainda calcular-se a probabilidade de cometer um erro de 2ª espécie</p><p>fazendo b= P(q*∈ 𝑅𝐴/H1) = 1- P(q*∈ 𝑅𝐶/H1) ou função potência, sua complementar.</p><p>Para exemplificar as ideias apresentadas, admita-se que, sob uma certa hipótese, a</p><p>distribuição amostral de uma estatística S é normal, com a média e o desvio padrão</p><p>. Então, a distribuição da variável reduzida (ou score z), dado por Z = (S - )/ é a</p><p>distribuição normal reduzida (com média 0 e variância 1).</p><p>FIGURA</p><p>Conforme se indica, pode-se estar 95% confiante de que, se a hipótese for verdadeira, o score z</p><p>de uma estatística amostral real S, estará compreendido entre -1,96 e 1,96.</p><p>Entretanto, se, ao escolher uma única amostra aleatória, fosse verificado que o score z dessa</p><p>estatística cai fora do intervalo de -1,96 a 1,96, concluir-se-ia que esse evento poderia ocorrer</p><p>com a probabilidade de apenas 0,05 se a hipótese estabelecida fosse verdadeira. Dir-se-ia,</p><p>então, que esse score difere de modo significativo do que seria esperado daquela hipótese, e se</p><p>estaria propenso a rejeitá-la.</p><p>A área total sombreada, de 0,05, é o nível de significância do teste. Ela representa a</p><p>probabilidade de incorrer-se em erro na rejeição da hipótese, isto é, a probabilidade de</p><p>ser cometido um erro do Tipo I. Por essa razão diz-se que a hipótese é rejeitada no nível</p><p>de significância 0,05.</p><p>Sµ</p><p>Ss Sµ Ss</p><p>UNIVERSIDADE AGOSTINHO NETO - FACULDADE DE CIÊNCIAS</p><p>INFERÊNCIA ESTATÍSTICA II</p><p>DOCENTE: HENDA MONDLANE 8</p><p>O conjunto dos scores z, situados fora do intervalo de -1,96 a 1,96, constitui a</p><p>denominada região crítica de rejeição da hipótese ou região de significância. O</p><p>conjunto dos scores z compreendidos no intervalo de -1,96 a 1,96 poderia, então, ser</p><p>denominado região de aceitação da hipótese ou região de não-significância.</p><p>Com base nas observações apresentadas, pode ser formulada a seguinte regra de</p><p>decisão:</p><p>i. Rejeição da hipótese no nível de significância 0,05, quando o score z da</p><p>estatística S situar-se fora do intervalo de -1,96 a 1,96 (isto é, z > 1,96 ou z <</p><p>-1,96). Isso equivale a dizer que a estatística amostral observada é</p><p>significativa no nível 0,05.</p><p>ii. Aceitação da hipótese (ou, se for desejado, não tomar nenhuma decisão) em</p><p>caso contrário.</p><p>Como o score é muito importante nos testes de hipóteses e na significância,</p><p>ele é também denominado teste estatístico.</p><p>Deve-se assinalar que poderiam ter sido utilizados outros níveis de significância. Por</p><p>exemplo, se for adoptado o nível 0,01, substituir-se-á, em toda a explanação acima, 1,96</p><p>por 2,58.</p><p>A tabela abaixo, que dá os valores críticos de z para ambos os testes, unilateral e</p><p>bilateral, em vários níveis de significância, pode revelar-se útil como referência. Os</p><p>valores críticos de z, para outros níveis de significância, são determinados mediante o</p><p>emprego das tabelas de áreas da curva normal.</p><p>Nível de significância 0,1 0,05 0,01 0,005 0,002</p><p>Valores críticos de z para</p><p>testes unilaterais</p><p>-1,28 ou</p><p>1,28</p><p>-1,645 ou</p><p>1,645</p><p>-2,33 ou</p><p>2,33</p><p>-2,58 ou</p><p>2,58</p><p>-2,88 ou</p><p>2,88</p><p>Valores críticos de z para</p><p>testes bilaterais</p><p>-1,645 ou</p><p>1,645</p><p>-1,96 ou</p><p>1,96</p><p>-2,58 ou</p><p>2,58</p><p>-2,81 ou</p><p>2,81</p><p>-3,08 ou</p><p>3,08</p><p>Teste de Hipóteses para a Média</p><p>UNIVERSIDADE AGOSTINHO NETO - FACULDADE DE CIÊNCIAS</p><p>INFERÊNCIA ESTATÍSTICA II</p><p>DOCENTE: HENDA MONDLANE 9</p><p>Neste caso, é a média amostral; é a média populacional;</p><p>, em que é o desvio padrão populacional e N o tamanho da</p><p>amostra. O score z é dado por , que possui distribuição 𝑁 0𝜇; %</p><p>√'</p><p>3.</p><p>Conforme viu-se anteriormente, consoante os restantes parâmetros sejam ou não</p><p>conhecidos e a dimensão da amostra seja grande ou pequena, vamos utilizar diferentes</p><p>variáveis aleatórias e respectivas distribuições, nomeadamente:</p><p>1. Se s2 (ou s) é conhecida:</p><p>Usa-se a estatística de teste:</p><p>Z ~ N (0;1)</p><p>Testes de alternativa unilateral</p><p>i. Alternativa unilateral esquerda</p><p>A regra de teste é :</p><p>- rejeitar H0 de zobs < zcr,</p><p>- não rejeitar (ou aceitar) H0 se zobs > zcr,</p><p>sendo</p><p>ii. Alternativa unilateral direita</p><p>A regra de teste é :</p><p>- rejeitar H0 de zobs > zcr,</p><p>- não rejeitar (ou aceitar) H0 se zobs < zcr,</p><p>Sendo</p><p>XS = µµµ == XS</p><p>NXS</p><p>sss == s</p><p>N</p><p>Xz</p><p>s</p><p>µ-</p><p>=</p><p>N</p><p>Xz</p><p>s</p><p>µ-</p><p>=</p><p>)1(1 af -= -</p><p>crz</p><p>)1(1 af -= -</p><p>crz</p><p>UNIVERSIDADE AGOSTINHO NETO - FACULDADE DE CIÊNCIAS</p><p>INFERÊNCIA ESTATÍSTICA II</p><p>DOCENTE: HENDA MONDLANE 10</p><p>Teste de alternativa bilateral</p><p>A regra de teste é :</p><p>- rejeitar H0 de zobs < zcr1 ou zobs > zcr2,</p><p>- não rejeitar (ou aceitar) H0 se</p><p>zcr1 < zobs < zcr2,</p><p>Sendo zcr1=-zcr2, zcr1<0 e</p><p>2.</p><p>Se s2 (ou s) é conhecida (com n grande):</p><p>Usa-se a estatítisca de teste:</p><p>~ N(0;1)</p><p>As regras de teste e os pontos críticos de z mantêm-se como no caso em que</p><p>s2 conhecida.</p><p>3.</p><p>Se s2 (ou s) é desconhecida e a dimensão da amostra é pequena:</p><p>Usa-se a estatítisca de teste</p><p>~ t (n-1)</p><p>Teste de alternativa unilateral</p><p>i. Alternativa unilateral direita:</p><p>A regra de teste é :</p><p>- rejeitar H0 de tobs > tcr,</p><p>- não rejeitar (ou aceitar) H0 se tobs< t cr,</p><p>)</p><p>2</p><p>1(12</p><p>af -= -</p><p>crz</p><p>N</p><p>S</p><p>X</p><p>z '</p><p>0µ-=</p><p>N</p><p>S</p><p>X</p><p>t '</p><p>0µ-=</p><p>UNIVERSIDADE AGOSTINHO NETO - FACULDADE DE CIÊNCIAS</p><p>INFERÊNCIA ESTATÍSTICA II</p><p>DOCENTE: HENDA MONDLANE 11</p><p>sendo</p><p>ii. Alternativa unilateral esquerda:</p><p>A regra de teste é :</p><p>- rejeitar H0 se tobs < tcr,</p><p>- não rejeitar (ou aceitar) H0 se tobs > tcr,</p><p>Sendo</p><p>tcr<0 e</p><p>Testes de alternativa bilateral</p><p>A regra de teste é :</p><p>- rejeitar H0 de tobs < tcr1 ou tobs > tcr2,</p><p>- não rejeitar (ou aceitar) H0 se</p><p>tcr1 < tobs ,</p><p>Sendo tcr1=-tcr2</p><p>Exemplo1:</p><p>De um universo normal de média desconhecida e variância igual a 16, foi retirada uma</p><p>amostra aleatória de 9 observações que forneceu média da amostra = 11. Proceda ao</p><p>seguinte ensaio de hipóteses:</p><p>H0: u0=10</p><p>H1: u1=14 com a=0,05</p><p>),1( a-= ntt cr</p><p>),1( a--= ntt cr</p><p>),1(2 a-= ntt cr</p><p>UNIVERSIDADE AGOSTINHO NETO - FACULDADE DE CIÊNCIAS</p><p>INFERÊNCIA ESTATÍSTICA II</p><p>DOCENTE: HENDA MONDLANE 12</p><p>Exemplo2:</p><p>De um universo normal, de média e variância desconhecidas, foi retirada uma amostra</p><p>aleatória de 9 observações, cujos resultados foram:</p><p>∑ 𝑥()</p><p>(*! = 36 e ∑ 𝑥($)</p><p>(*! = 162. Proceda ao seguinte ensaio de hipóteses:</p><p>H0: u=5</p><p>H1: u=6 com a=0,05</p><p>Exemplo3:</p><p>Para X~N(u,100), n=25, média da amostra = 980 e a=0,05, calcule a RC, os erros de 2ª</p><p>espécie e a função potência para:</p><p>H0: u=1000</p><p>H1: u<1000</p><p>Teste de Hipóteses para Proporções</p><p>Neste caso, S=P é a proporção de “sucessos” em uma amostra; , em que</p><p>p é a proporção populacional de sucessos e N o tamanho da amostra;</p><p>, em que q=1-p. O score é dado por</p><p>~N(0;1) para grandes amostras.</p><p>De modo semelhante podem ser obtidos os resultados para outras estatísticas.</p><p>Teste de hipótese para a variância de uma população normal</p><p>Usa-se a estatística de teste :</p><p>1. Se u é conhecido,</p><p>𝑉 =<=</p><p>𝑋( − 𝜇</p><p>𝜎 A</p><p>$</p><p>~𝜒$</p><p>+</p><p>(*!</p><p>(𝑛)</p><p>pPS == µµ</p><p>NpqPS ==ss</p><p>Npq</p><p>pPz -</p><p>=</p><p>UNIVERSIDADE AGOSTINHO NETO - FACULDADE DE CIÊNCIAS</p><p>INFERÊNCIA ESTATÍSTICA II</p><p>DOCENTE: HENDA MONDLANE 13</p><p>2. Se u é desconhecido,</p><p>3.</p><p>𝑋 = (𝑛 − 1) ,</p><p>!</p><p>%!</p><p>~𝜒$(𝑛 − 1)</p><p>Teste de alternativa unilateral</p><p>i. Alternativa unilateral direita</p><p>A regra de teste é :</p><p>- rejeitar H0 se xobs > xcr,</p><p>- não rejeitar (ou aceitar) H0 se xobs< xcr,</p><p>sendo</p><p>ii. Alternativa unilateral esquerda</p><p>A regra de teste é :</p><p>- rejeitar H0 se xobs < xcr,</p><p>- não rejeitar (ou aceitar) H0 se xobs> x cr,</p><p>sendo</p><p>Testes de alternativa bilateral</p><p>A regra de teste é :</p><p>- rejeitar H0, se xobs > xcr1 ou</p><p>xobs > xcr2</p><p>- não rejeitar (ou aceitar) H0, se xcr1<xobs< x cr2,</p><p>Sendo</p><p>)1,1(</p><p>2</p><p>ac --= nxcr</p><p>)1,1(</p><p>2</p><p>ac --= nxcr</p><p>UNIVERSIDADE AGOSTINHO NETO - FACULDADE DE CIÊNCIAS</p><p>INFERÊNCIA ESTATÍSTICA II</p><p>DOCENTE: HENDA MONDLANE 14</p><p>Testes de hipóteses envolvendo a diferença entre dois valores médios (amostras</p><p>independentes)</p><p>i. Variâncias conhecidas</p><p>Sejam amostra aleatórias independentes, pertencentes às</p><p>populações XX e Y, com variâncias conhecidas. Sendo n1 e n2 grandes. Sendo</p><p>e variáveis aleatórias com distribuição assimptoticamente</p><p>normal, respectivamente, e , sendo as verdadeiras médias</p><p>desconhecidas, das populações X e Y.</p><p>O estimador pontual de , o qual satisfaz as suposições exigidas para testes</p><p>em amostras grandes. Por outro lado, a distribuição da v.a. será também</p><p>assintoticamente normal, com valor médio</p><p>Assim, para testar , contra qualquer alternativa, recorre-se à</p><p>estatística de teste</p><p>ii. Variâncias desconhecidas</p><p>Uma vez mais, para amostras grandes as variâncias amostrais fornecem estimativas para as</p><p>correspondentes variâncias das populações, ter-se-ia</p><p>)</p><p>2</p><p>1,1(</p><p>2</p><p>1</p><p>ac --= nxcr</p><p>)</p><p>2</p><p>,1(</p><p>2</p><p>2</p><p>ac -= nxcr</p><p>nn YYYeXXX ,,,,,, 2121 !!</p><p>2</p><p>21</p><p>2 ss e</p><p>å</p><p>=</p><p>=</p><p>1</p><p>11</p><p>1 n</p><p>i</p><p>iXn</p><p>X å</p><p>=</p><p>=</p><p>2</p><p>12</p><p>1 n</p><p>j</p><p>jYn</p><p>Y</p><p>),( 2</p><p>11 sµN ),( 2</p><p>22 sµN 21 µµ e</p><p>YXé -- 21 µµ</p><p>YX -</p><p>÷÷</p><p>ø</p><p>ö</p><p>çç</p><p>è</p><p>æ</p><p>+-</p><p>2</p><p>2</p><p>2</p><p>1</p><p>2</p><p>1</p><p>21 var</p><p>nn</p><p>iânciae ss</p><p>µµ</p><p>)(: 0210 valorfixoDH =- µµ</p><p>( ) ( )1,0~</p><p>)(</p><p>2</p><p>2</p><p>2</p><p>1</p><p>2</p><p>1</p><p>21 N</p><p>nn</p><p>YX</p><p>Z</p><p>÷÷</p><p>ø</p><p>ö</p><p>çç</p><p>è</p><p>æ</p><p>+</p><p>---</p><p>=</p><p>ss</p><p>µµ</p><p>( ) ( )1,0~</p><p>)(</p><p>2</p><p>2'</p><p>2</p><p>1</p><p>2'</p><p>1</p><p>21 N</p><p>n</p><p>S</p><p>n</p><p>S</p><p>YX</p><p>Z</p><p>÷÷</p><p>ø</p><p>ö</p><p>çç</p><p>è</p><p>æ</p><p>+</p><p>---</p><p>=</p><p>µµ</p><p>UNIVERSIDADE AGOSTINHO NETO - FACULDADE DE CIÊNCIAS</p><p>INFERÊNCIA ESTATÍSTICA II</p><p>DOCENTE: HENDA MONDLANE 15</p><p>Tanto neste caso, como no anterior, existem 3 situações distintas conforme a natureza</p><p>da hipótese alternativa. Para cada hipótese alternativa, a delimitação da região é feita</p><p>de modo igual ao usado na construção de testes de significância para o valor médio.</p><p>Hipótese Estatística de teste valor crítico</p><p>Variância conhecida</p><p>Hipótese Estatística de teste valor crítico</p><p>Variância desconhecida</p><p>Para amostras pequenas, recorre-se a estatística de teste</p><p>0211</p><p>0210</p><p>:</p><p>:</p><p>DH</p><p>DH</p><p>¹-</p><p>=-</p><p>µµ</p><p>µµ</p><p>( )</p><p>÷÷</p><p>ø</p><p>ö</p><p>çç</p><p>è</p><p>æ</p><p>+</p><p>---</p><p>2</p><p>2</p><p>2</p><p>1</p><p>2</p><p>1</p><p>21</p><p>)(</p><p>nn</p><p>YX</p><p>ss</p><p>µµ</p><p>21</p><p>1</p><p>2 )</p><p>2</p><p>1(</p><p>crcr</p><p>cr</p><p>zz</p><p>z</p><p>-=</p><p>-= - af</p><p>0211</p><p>0210</p><p>:</p><p>:</p><p>DH</p><p>DH</p><p>>-</p><p>£-</p><p>µµ</p><p>µµ</p><p>)1(1 af -= -</p><p>crz</p><p>0211</p><p>0210</p><p>:</p><p>:</p><p>DH</p><p>DH</p><p><-</p><p>³-</p><p>µµ</p><p>µµ</p><p>)1(1 af --= -</p><p>crz</p><p>0211</p><p>0210</p><p>:</p><p>:</p><p>DH</p><p>DH</p><p>¹-</p><p>=-</p><p>µµ</p><p>µµ</p><p>( )</p><p>÷÷</p><p>ø</p><p>ö</p><p>çç</p><p>è</p><p>æ</p><p>+</p><p>---</p><p>=</p><p>2</p><p>2'</p><p>2</p><p>1</p><p>2'</p><p>1</p><p>21</p><p>)(</p><p>n</p><p>S</p><p>n</p><p>S</p><p>YX</p><p>Z</p><p>µµ</p><p>21</p><p>1</p><p>2 )</p><p>2</p><p>1(</p><p>crcr</p><p>cr</p><p>zz</p><p>z</p><p>-=</p><p>-= - af</p><p>0211</p><p>0210</p><p>:</p><p>:</p><p>DH</p><p>DH</p><p>>-</p><p>£-</p><p>µµ</p><p>µµ</p><p>)1(1 af -= -</p><p>crz</p><p>0211</p><p>0210</p><p>:</p><p>:</p><p>DH</p><p>DH</p><p><-</p><p>³-</p><p>µµ</p><p>µµ</p><p>)1(1 af --= -</p><p>crz</p><p>( )</p><p>( )</p><p>diferem, de modo</p><p>significativo, das esperadas e rejeitar-se-á H0 ao nível correspondente. Em caso contrário,</p><p>dever-se-á aceitá-la ou, pelo menos, não a rejeitar. Esse processo é denominado teste de</p><p>qui-quadrado.</p><p>Deveria ser assinalado que se deve encarar com suspeita as circunstâncias em que é</p><p>muito próximo de zero, porque é raro que as frequências observadas concordem muito bem</p><p>com as esperadas.</p><p>2.4 Teste de qui-quadrado para a prova de aderência</p><p>O teste de qui-quadrado pode ser usado para determinar quão aproximadamente as</p><p>distribuições teóricas, como a normal, a binomial etc., se ajustam às distribuições</p><p>empíricas, isto é, as obtidas por meio de dados amostrais.</p><p>Exemplo1:</p><p>Cinco moedas foram lançadas 1000 vezes e, em cada lance, foi anotado o número de</p><p>caras. Os números de lances nos quais foram obtidas 0,1,2,3,4 e 5 caras estão</p><p>indicados na tabela abaixo.</p><p>0</p><p>2</p><p>=c 0</p><p>2</p><p>>c</p><p>2</p><p>c</p><p>2</p><p>c</p><p>22</p><p>2</p><p>1</p><p>2</p><p>0</p><p>2</p><p>1)2(</p><p>2</p><p>1</p><p>2</p><p>0</p><p>cc</p><p>cc</p><p>-</p><p>-</p><p>--</p><p>=÷</p><p>ø</p><p>ö</p><p>ç</p><p>è</p><p>æ= eYeYY v</p><p>v</p><p>2</p><p>c</p><p>2</p><p>c</p><p>UNIVERSIDADE AGOSTINHO NETO - FACULDADE DE CIÊNCIAS</p><p>INFERÊNCIA ESTATÍSTICA II</p><p>DOCENTE: HENDA MONDLANE 21</p><p>Número</p><p>de caras</p><p>Número de</p><p>lances</p><p>(frequências)</p><p>0 38</p><p>1 144</p><p>2 342</p><p>3 287</p><p>4 164</p><p>5 25</p><p>a) Ajustar uma distribuição binomial aos dados</p><p>O ajuste à distribuição binomial aos dados, resulta na tabela seguinte:</p><p>Número</p><p>de caras</p><p>Pr (X</p><p>caras)</p><p>Frequência</p><p>esperada</p><p>Frequência</p><p>observada</p><p>0 0,0332 33,2 ou 33 38</p><p>1 0,1619 161,9 ou 162 144</p><p>2 0,3162 316,2 ou 316 342</p><p>3 0,3087 308,7 ou 309 287</p><p>4 0,1507 150,7 ou 151 164</p><p>5 0,0294 29,4 ou 29 25</p><p>b) Usar o teste do qui-quadrado para efectuar a prova de aderência aos dados,</p><p>considerando a=0,05.</p><p>Exemplo2: A seguradora ‘Mais Seguro’ estima as responsabilidades com os pensionistas do</p><p>seguro de Acidentes de Trabalho, recorrendo a tábua de mortalidade ANGV2020 P.</p><p>Com base em dados históricos, a tabela abaixo apresenta o registo de mortes ocorridas dos</p><p>últimos 7 anos.</p><p>Tabela 1</p><p>Por outro lado, a mortalidade esperada, de acordo com a tábua ANGV2020 P, encontra-se</p><p>espelhada na tabela abaixo.</p><p>Tabela 2</p><p>Usar o teste do qui-quadrado para verificar a aderência da tábua de mortalidade.</p><p>2.5 Tabelas de contingência</p><p>Evento E1 E2 E3 … Ek</p><p>UNIVERSIDADE AGOSTINHO NETO - FACULDADE DE CIÊNCIAS</p><p>INFERÊNCIA ESTATÍSTICA II</p><p>DOCENTE: HENDA MONDLANE 22</p><p>Frequência observada o1 o2 o3 … ok</p><p>Frequência teórica e1 e2 e3 … ek</p><p>A tabela acima, na qual as frequências observadas ocupam uma linha única, é denominada</p><p>tabela de simples entrada. Como o número de colunas é k, ela é também denominada tabela de</p><p>1xk. Mediante a aplicação dessas ideias, chega-se a tabelas de dupla entrada ou de hxk, nas</p><p>quais as frequências observadas ocupam h linhas e k colunas. São denominadas tabelas de</p><p>contingência.</p><p>Em uma tabela de contingência de hxk, em correspondência a cada frequência observada, há</p><p>uma esperada ou teórica, que é calculada, para as mesmas hipóteses, de acordo com as regras</p><p>e probabilidade. Essas frequências, que ocupam as células de uma tabela de contingência, são</p><p>denominadas frequências das células. A frequência total de cada linha ou coluna é denominada</p><p>frequência marginal.</p><p>Evento</p><p>Atributo e1 e2 e3 … ek TOTAIS</p><p>fr</p><p>eq</p><p>uê</p><p>nc</p><p>ia</p><p>s o</p><p>bs</p><p>er</p><p>va</p><p>da</p><p>A oA1 oA2 oA3 … oAk NA</p><p>B oB1 oB2 oB3 … oBk NB</p><p>C oC1 oC2 oC3 … oCk NC</p><p>D oD1 oD2 oD3 … oDk ND</p><p>… …</p><p>H oH1 oH2 oH3 … oHk NH</p><p>TOTAIS N1 N2 N3 … NK N</p><p>Para investigar a concordância entre as frequências observadas e esperadas, calcula-se a</p><p>estatística:</p><p>(4)</p><p>Em que é considerada a soma de todas as células da tabela de contingência e os símbolos oj e ej</p><p>representam, respectivamente, as frequências observadas e esperadas da célula de ordem j.</p><p>Essa soma, contém hk termos. A soma de todas as frequências observadas é representada por</p><p>N e é igual a de todas as frequências esperadas.</p><p>Tal como na expressão análoga anterior, a estatística (4) tem uma distribuição amostral dada</p><p>pela expressão (3), desde que as frequências esperadas não sejam muito pequenas. O número</p><p>de graus de liberdade, v, é dado, para h>1 e k>1, por:</p><p>( )</p><p>å</p><p>-</p><p>==</p><p>j j</p><p>jj</p><p>e</p><p>eo 2</p><p>2</p><p>c</p><p>UNIVERSIDADE AGOSTINHO NETO - FACULDADE DE CIÊNCIAS</p><p>INFERÊNCIA ESTATÍSTICA II</p><p>DOCENTE: HENDA MONDLANE 23</p><p>i. v=(h-1)(k-1), se as frequências esperadas podem ser calculadas sem que se tenha</p><p>de estimar os parâmetros populacionais por meio das estatísticas amostrais~;</p><p>ii. v=(h-1)(k-1)-m, se as frequências esperadas somente podem ser calculadas</p><p>mediante a estimativa de m parâmetros populacionais, por meio de estatísticas</p><p>amostrais.</p><p>Os testes de significância para as tabelas de hxk, são semelhantes aos para as tabelas 1xk.</p><p>As frequências esperadas encontram-se sujeitas a uma hipótese particular H0. Uma</p><p>hipótese comummente admitida é que as duas classificações são independentes uma da</p><p>outra.</p><p>Exemplo:</p><p>2.6 Fórmulas simples para cálculo de</p><p>Podem ser deduzidas fórmulas para o cálculo de , que envolvem somente as frequências</p><p>observadas. Apresentam-se, a seguir, os resultados para tabelas de contingência de 2x2 e</p><p>2x3</p><p>Tabelas de 2x2</p><p>Considere-se a tabela:</p><p>I II Totais</p><p>A a1 a2 NA</p><p>B b1 b2 NB</p><p>Totais N1 N2 N</p><p>, (5)</p><p>na qual</p><p>Exemplo:</p><p>2</p><p>c</p><p>2</p><p>c</p><p>( )</p><p>( )( )( )( ) BANNNN</p><p>N</p><p>bbaababa</p><p>babaN</p><p>21</p><p>2</p><p>21212211</p><p>2</p><p>1221</p><p>2 D</p><p>=</p><p>++++</p><p>-</p><p>=c</p><p>21211221 , bbaaNbaba +++=-=D</p><p>222111 , baNbaN +=+=</p><p>2121 , bbNaaN BA +=+=</p><p>UNIVERSIDADE AGOSTINHO NETO - FACULDADE DE CIÊNCIAS</p><p>INFERÊNCIA ESTATÍSTICA II</p><p>DOCENTE: HENDA MONDLANE 24</p><p>Dois grupos, A e B, são formados, cada um de 100 pessoas que têm a mesma enfermidade. É</p><p>ministrado um soro ao grupo A, mas não ao B (denominado grupo de controle); em relação a</p><p>todas as outras características, os dois grupos são tratados de modo idêntico. Determinou-se</p><p>que 75 e 65 pessoas dos grupos A e B, respectivamente, curaram-se da enfermidade. Testar a</p><p>hipótese do soro auxiliar a cura da enfermidade, mediante o emprego do teste de qui-quadrado,</p><p>considerando a=0,05.</p><p>Sol.</p><p>Os dados do problema, resultam na tabela de frequências observadas:</p><p>Curados</p><p>Não</p><p>curados Totais</p><p>Grupo A</p><p>(usando</p><p>soro) 75 25 100</p><p>Grupo B (não</p><p>usando soro) 65 35 100</p><p>Totais 140 60 200</p><p>Tabelas de 2x3</p><p>,</p><p>Em que se adoptou o resultado geral, válido para todas as tabelas de contingência:</p><p>I II III Totais</p><p>A a1 a2 a3 NA</p><p>B b1 b2 b3 NB</p><p>Totais N1 N2 N3 N</p><p>2.7 Coeficiente de contingência</p><p>Uma medida do grau de afinidade, associação ou dependência das classificações de</p><p>uma tabela de contingência, é dada por:</p><p>N</p><p>N</p><p>b</p><p>N</p><p>b</p><p>N</p><p>b</p><p>N</p><p>N</p><p>N</p><p>a</p><p>N</p><p>a</p><p>N</p><p>a</p><p>N</p><p>N</p><p>BA</p><p>-</p><p>ú</p><p>ú</p><p>û</p><p>ù</p><p>ê</p><p>ê</p><p>ë</p><p>é</p><p>+++</p><p>ú</p><p>ú</p><p>û</p><p>ù</p><p>ê</p><p>ê</p><p>ë</p><p>é</p><p>++=</p><p>3</p><p>2</p><p>3</p><p>2</p><p>2</p><p>2</p><p>1</p><p>2</p><p>1</p><p>3</p><p>2</p><p>3</p><p>2</p><p>2</p><p>2</p><p>1</p><p>2</p><p>1</p><p>2</p><p>c</p><p>( )</p><p>N</p><p>e</p><p>o</p><p>j j</p><p>j -==å</p><p>2</p><p>2</p><p>c</p><p>UNIVERSIDADE AGOSTINHO NETO - FACULDADE DE CIÊNCIAS</p><p>INFERÊNCIA ESTATÍSTICA II</p><p>DOCENTE: HENDA MONDLANE 25</p><p>, denominado coeficiente de contingência. Quanto maior for o valor de</p><p>C, tanto maior é o grau de associação. O número de linhas e colunas da tabela de</p><p>contingência determina o valor máximo de C, que nunca é maior do que 1. Se o</p><p>número de linhas e colunas de uma tabela de contingência é igual a k, o valor máximo</p><p>de C é dado por</p><p>2.8 Correlação de atributos</p><p>Como as classificações de uma tabela de contingência descrevem, muitas vezes, as</p><p>características de indivíduos ou de objectos, elas são frequentemente referidas como</p><p>atributos,</p><p>e seu grau de dependência, associação ou afinidade é denominado</p><p>correlação dos atributos. Para uma tabela kxk, define-se:</p><p>Como o coeficiente de correlação entre os atributos ou classificações. Esse coeficiente</p><p>tem valor entre 0 e 1</p><p>2.9 Propriedade aditiva de χ2</p><p>Suponha-se que os resultados de experiências repetidas produziram valores amostrais de χ2,</p><p>dados por χ21, χ22, χ23,… com v1, v2, v3,…graus de liberdade, respectivamente . Então o resultado</p><p>de todas essas experiências pode ser considerado equivalente a um valor de χ2 dado por χ21+</p><p>χ22+ χ23+… com v1+ v2+ v3+…graus de liberdade.</p><p>N</p><p>C</p><p>+</p><p>= 2</p><p>2</p><p>c</p><p>c</p><p>( )</p><p>k</p><p>k 1-</p><p>)1(</p><p>2</p><p>-</p><p>=</p><p>kN</p><p>r c</p>e seu grau de dependência, associação ou afinidade é denominado 
correlação dos atributos. Para uma tabela kxk, define-se: 
 
Como o coeficiente de correlação entre os atributos ou classificações. Esse coeficiente 
tem valor entre 0 e 1 
 
2.9 Propriedade aditiva de χ2 
Suponha-se que os resultados de experiências repetidas produziram valores amostrais de χ2, 
dados por χ21, χ22, χ23,… com v1, v2, v3,…graus de liberdade, respectivamente . Então o resultado 
de todas essas experiências pode ser considerado equivalente a um valor de χ2 dado por χ21+ 
χ22+ χ23+… com v1+ v2+ v3+…graus de liberdade. 
 
 
 
 
 
 
 
 
 
N
C
+
= 2
2
c
c
( )
k
k 1-
)1(
2
-
=
kN
r c

Mais conteúdos dessa disciplina