Baixe o app para aproveitar ainda mais
Prévia do material em texto
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 1 Raciocínio Lógico-Quantitativo para Traumatizados Aula 20 Testes de Hipóteses e Significância 20. Testes de Hipóteses e Significância ............................................................................... 3 20.1 Noções Fundamentais ................................................................................................ 3 20.1.1 Valor-p ........................................................................................................................... 7 20.2 Testes de Uma Média Populacional ..................................................................... 11 20.2.1 Desvio Padrão Conhecido ............................................................................................ 12 20.2.2 Desvio Padrão Desconhecido ...................................................................................... 19 20.3 Testes de Uma Proporção Populacional ............................................................. 20 20.4 Testes de Uma Variância Populacional .............................................................. 22 20.5 Testes Não Paramétricos ......................................................................................... 26 20.5.1 Teste de Aderência ....................................................................................................... 26 20.5.2 Teste de Independência ................................................................................................ 29 20.6 Memorize para a prova ............................................................................................ 33 20.7 Exercícios de Fixação ................................................................................................ 35 20.8 Gabarito ......................................................................................................................... 41 20.9 Resolução dos Exercícios de Fixação .................................................................. 41 APÊNDICE ....................................................................................................................................... 61 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 2 Erratas Aula 17 Resolução do Exemplo da pág. 15: Corrigir a fórmula da média não condicional de Y: E[Y] = y. fY (y)dy −∞ ∞ ∫ Enunciado da Questão 09: Corrigir a somatória dos Xi: X i = 440 i=1 22 ∑ . Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 3 20. Testes de Hipóteses e Significância Na prática, é muito comum a tomada de decisões sobre populações com base em informações amostrais. Tais decisões são denominadas decisões estatísticas. Por exemplo, podemos desejar conhecer, a partir de um conjunto de dados provenientes de uma população, se uma vacina experimental é eficaz contra um novo tipo de gripe ou se uma política governamental econômica é melhor que outra(s). Nesta aula, estudaremos o problema dos testes de hipóteses relativos à população. Diz-se que os testes são paramétricos quando se referem a hipóteses sobre parâmetros populacionais. Os testes são não paramétricos quando se referem a outros aspectos que não os parâmetros em si. Considere, por exemplo, uma população cujos elementos podem ser classificados de acordo com dois atributos, que denominaremos “sucesso” e “fracasso”. Podemos ter n elementos, dos quais alguns são defeituosos e os restantes são não defeituosos. Se p denota a proporção de sucessos na população, então o objetivo é fazer algum tipo de inferência sobre p. Aprendemos na aula anterior como estimar p. Aqui, estamos interessados em testar alguma hipótese estatística sobre p, tal como “p é maior do que um dado valor p0” ou “p é menor do que um certo valor p0”. A hipótese sob investigação será considerada válida até que se “prove” o contrário (a prova será dada num sentido probabilístico). Baseados em uma amostra da população vamos estabelecer uma regra de decisão, segundo a qual rejeitaremos ou aceitaremos a hipótese proposta. A regra de decisão é chamada teste. Somente serão consideradas amostras aleatórias. A presente aula é muito importante para a prova. Não prossiga com o estudo a partir deste ponto se você ainda sente que não está “craque” nos tópicos de amostragem e estimação de parâmetros. Estes assuntos são pré-requisitos para um bom entendimento/aproveitamento desta aula. No restante desta aula, aprenderemos a resolver questões que envolvam os testes de hipóteses mais prováveis de serem cobrados pela banca na prova. 20.1 Noções Fundamentais Dado um problema de teste de hipóteses, precisamos formular as chamadas hipótese nula e hipótese alternativa. A hipótese nula ou hipótese de trabalho (H0) é a hipótese aceita como verdadeira até prova estatística em contrário. É o ponto de partida para a análise dos dados. Em geral, ela é formulada em termos de igualdade entre parâmetros ou entre um parâmetro e uma constante. Ela geralmente representa o contrário do que queremos provar, ou seja, representa a hipótese que se quer rejeitar. Quando os dados mostrarem evidência suficiente de que a hipótese nula (H0) é falsa, o teste rejeita-a, aceitando em Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 4 seu lugar a chamada hipótese alternativa (H1). Em geral, a hipótese alternativa é formulada em termos de desigualdades (≠≠≠≠, < ou >). Ela comumente representa o que se quer provar, isto é, corresponde à própria hipótese de pesquisa formulada em termos de parâmetros. Exemplo. Uma empresa atuante na exploração e produção de óleo e gás natural compra de um fornecedor parafusos cuja carga média de ruptura é 55 kN. O desvio padrão das cargas de ruptura é igual a 6 kN e independe do valor médio. Deseja-se verificar se um grande lote de parafusos recebidos deve ser considerado satisfatório. Não é desejável que esse lote seja formado por parafusos cuja carga média de ruptura seja inferior a 55 kN. Por outro lado, o fato de a carga média de ruptura ser superior a 55 kN não representa problema, pois, nesse caso, os parafusos seriam de qualidade superior à necessária. A empresa poderia adotar a seguinte regra para decidir se concorda em aceitar o lote ou se prefere devolvê-lo ao fornecedor: coletar uma amostra aleatória de 36 parafusos do lote e submetê-los a ensaios de ruptura em laboratório; se a carga média de ruptura observada nessa amostra for maior ou igual a 53 kN, ela comprará o lote; caso contrário, ela se recusará a comprar. A princípio, a empresa poderia testar a hipótese de que a carga média de ruptura dos parafusos do lote seja maior ou igual a 55 kN, contra a alternativa de que ela seja inferior a 55 kN (esta última é a sua suspeita). Como a hipótese de que a carga média de ruptura seja superior a 55 kN não preocupa o comprador, a mesma poderia ser excluída, sem perda de generalidade, para simplificação do teste. Assim, as hipóteses do teste são H0: µµµµ = 55 kN H1: µµµµ < 55 kN Vamos admitir que a hipótese H0 seja verdadeira, ou seja, que a população dos valores da carga de ruptura tem de fato a média µ = 55 kN. Assim, a média X da amostra aleatória de 36 elementos será uma variável aleatória com média também de 55 kN e com desvio padrão igual a 0,136/6/ === n X σσ kN. Aprendemosque podemos considerar a distribuição amostral de X como aproximadamente normal. Temos então a situação indicada na figura abaixo, em que α indica a probabilidade de se obter x 1 < 53 kN (essa probabilidade corresponde à área sob a distribuição amostral de X no intervalo 53<<∞− x ). Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 5 51 52 53 54 55 56 57 58 59 0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 Distribuição da média amostral, n=36 Média amostral D e n s id a d e Rejeita se média < 53 kN α = P(média < 53) A probabilidade α pode ser determinada por meio de z = x 1 − µ σ X = 53−55 1,0 = −2,0, valor para o qual a tabela da normal reduzida fornece a área 0,5 – 0,4772 = 0,0228 = 2,28%. Assim, há uma probabilidade αααα = 2,28% de que, mesmo sendo a hipótese H0 verdadeira, x assuma valor na faixa que leva à rejeição de H0, de acordo com a regra de decisão adotada. Neste caso, a empresa iria rejeitar H0 sendo ela verdadeira, o que consiste no erro tipo I (neste exemplo, o erro tipo I levaria à rejeição de um lote satisfatório), cuja probabilidade é dada por α = P(erro tipo I) = P(rejeitar H0|H0 é verdadeira). Por outro lado, pode ocorrer a situação em que a hipótese H0 é falsa, ou seja, na realidade vale µ < 55 kg, e a média amostral assume um valor maior que 53 kg, levando a aceitação de H0. A empresa cometeria, neste caso, o erro tipo II, que consiste em aceitar a hipótese H0 sendo ela falsa. Por conseguinte, a empresa iria adquirir um lote insatisfatório, causando prejuízos à produção. A probabilidade de se cometer um erro tipo II é denotada por β, logo β = P(erro tipo II) = P(não rejeitar H0| H0 é falsa). A probabilidade β não pode ser calculada, a menos que se especifique um valor alternativo para o parâmetro sob investigação. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 6 Em resumo, em um teste de hipóteses, podem ocorrer dois tipos de erro (memorize para a prova!): • Erro tipo I: rejeitar H0, sendo H0 verdadeira; • Erro tipo II: aceitar H0, sendo H0 falsa. A faixa de valores da variável de teste que leva à rejeição de H0 é denominada Região Crítica (RC) ou região de rejeição do teste. Para o exemplo visto, a RC é 53<<∞− x . Por outro lado, a faixa de valores que leva à aceitação é chamada de Região de Aceitação (RA), 53≥x . A figura abaixo mostra as RC e RA do teste do exemplo anterior. 51 52 53 54 55 56 57 58 59 0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 Média amostral D e n s id a d e Região de Aceitação (RA) Região Crítica (RC) Voltando ao exemplo visto acima, a empresa poderia ter adotado o seguinte critério (alternativo) de decisão: se a carga média de ruptura observada na amostra de 36 elementos for inferior a 55 kN, isto é, se x < 55 kN, então ela se recusará a comprar o lote de parafusos. Entretanto, esta idéia, aparentemente intuitiva, de se rejeitar H0 caso x < 55 kN, não seria, de fato, recomendável, pois, nesse caso, a probabilidade α do erro tipo I seria igual a 50%! Vimos como, no exemplo anterior, fixada a RC do teste, determinamos a probabilidade α do erro tipo I por meio de uma simples manipulação da distribuição normal. Inversamente, dado α, podemos determinar o limite da RC. Isso é o que em geral se faz na prática, direta ou indiretamente, sendo os valores usualmente adotados α = 5% e α = 1%. Assim, no exemplo anterior, se for fixado α = 5%, resultará que , 0,1 55 645,1%5 − =−=− x z Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 7 x = 55,0 −1,645 = 53,355 kN ⇒ limite da RC. Da mesma forma, se for fixado α = 1%, o novo limite da RC será −z1% = −2,326 = x − 55 1,0 ⇒ x = 55,0 − 2,326 = 52,674 kN. Deste modo, se o valor numérico da média amostral for inferior a 52,674 kN, rejeitaremos a hipótese H0 ao nível α = 1% de significância (isso implica que H0 será também rejeitada se o nível de significância for α = 5%). Se a média amostral for superior a 53,355 kN, aceitaremos a hipótese H0 ao nível de α = 5% de significância (H0 será também aceita se o nível de significância for α = 1%). Se, por acaso, tivermos 52,674 < x < 53,355 kN, a hipótese H0 será aceita ao nível α = 1% e será rejeitada ao nível α = 5%. Isto quer dizer que, se a empresa admite realizar o teste a um risco de 5% de probabilidade de cometer o erro tipo I (rejeitar H0, sendo H0 verdadeira), a evidência estatística terá sido significativa, indicando que a hipótese nula deverá ser rejeitada. Se, porém, tivéssemos especificado um risco de apenas 1% de probabilidade de cometer o erro tipo I, a evidência amostral não teria sido significativa a esse nível de significância. O exemplo mostra que a decisão de aceitar ou rejeitar a hipótese nula H0 depende do nível de significância adotado. Um dado resultado amostral obtido pode ser ou não significante, dependendo do α fixado, e é por esta razão que α é denominado nível de significância. Um resultado significativo a um determinado nível αααα nos levará à rejeição de H0, pois admite-se que ele não é compatível com a hipótese nula, a menos de uma probabilidade α de erro. Por outro lado, se o resultado amostral cair na região de aceitação, não terá havido, no nível α especificado, evidência significativa suficiente para a rejeição de H0, a qual, por tal motivo, deverá ser aceita. Neste caso, estamos sujeitos a cometer o erro tipo II (aceitar H0 sendo H0 falsa). A aceitação de H0 está associada, via de regra, à insuficiência de evidência empírica, ao nível de significância desejado, para se chegar à sua rejeição. Essa aceitação, portanto, não deve ser interpretada como uma afirmação de H0. Assim, rejeitamos H0 quando estamos estatisticamente convencidos, ao nível de significância α, de que estamos certos, enquanto que, se aceitamos H0, em geral essa aceitação não representa uma afirmação estatisticamente forte. 20.1.1 Valor-p Geralmente, a hipótese nula H0 afirmará que um parâmetro populacional tem um valor específico e a hipótese alternativa H1 será uma das seguintes assertivas: Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 8 (i) O parâmetro é maior que o valor especificado (teste unilateral ou monocaudal à direita). 51 52 53 54 55 56 57 58 59 0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 Teste unilateral à direita Média amostral D e n s id a d e Rejeita se média > 57 kN (ii) O parâmetro é menor que o valor especificado (teste unilateral à esquerda). 51 52 53 54 55 56 57 58 59 0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 Teste unilateral à esquerda Média amostral D e n s id a d e Rejeita se média < 53 kN (iii) O parâmetro é maior que um valor ou menor que um outro valor especificado (teste bilateral ou bicaudal). Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 9 -5 -4 -3 -2 -1 0 1 2 3 4 5 0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 média amostral D e n s id a d e Rejeita se t>2.131 Prob = 0.025 Rejeita se x<-2.131 Prob = 0.025Teste bilateral Definição (valor-p). O valor-p (ou probabilidade de significância) é a probabilidade de a estatística do teste acusar um resultado tão ou mais distante do esperado, como o resultado ocorrido na particular amostra observada, supondo H0 como a hipótese verdadeira. Exemplo. Suponha que o desvio padrão σ de uma população normalmente distribuída seja igual a 3, e que H0 afirme que a média populacional seja igual a 12 (H0: µ = 12). Uma amostra aleatória com 36 elementos é extraída da população e produz a média amostral 95,12=X . Escolheu-se , 5,0 12 36/3 12 / 12 − = − = − = XX n X Z σ como a estatística do teste, que corresponderá à variável aleatória normal reduzida, se H0 for verdadeira. O valor da estatística é 9,15,0/)1295,12( =−=z . Vamos supor que o nível de significância especificado para o teste seja α = 5%. O valor-p do teste então dependerá da hipótese alternativa H1 como se segue: (i) Para H1: µ > 12 (caso (i)), o valor-p é a probabilidade de que uma amostra aleatória com 36 observações produza uma média amostral maior ou igual a 12,95, dado que a verdadeira média seja 12; neste caso, P(z ≥ 1,9) ≈ 2,9% (vide a figura abaixo). Isto significa que a chance de ocorrer 95,12≥X é aproximadamente igual a 3% (relativamente baixa) se µ = 12. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 10 10 10.5 11 11.5 12 12.5 13 13.5 14 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 Média amostral D e n s id a d e Valor-p = P(média > 12.95) (ii) Para H1: µ<12 (caso (ii)), o valor-p é a probabilidade de que uma amostra aleatória de tamanho 36 produza uma média amostral menor ou igual a 12,95, se µ = 12. Tem-se que P(z ≤ 1,9) ≈ 97,1% (veja a próxima figura). Isto quer dizer que a probabilidade de ocorrer 95,12≤X é aproximadamente igual a 97% (as chances são bastante altas) se µ = 12. 10 10.5 11 11.5 12 12.5 13 13.5 14 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 Média amostral D e n s id a d e Valor-p = P(média < 12.95) (iii) Para H1: µ ≠ 12 (caso (iii)), o valor-p é a probabilidade de que uma amostra aleatória de tamanho 36 produza uma média amostral que esteja 0,95 unidade ou mais afastada de µ = 12, ou seja, 95,12≥X ou 05,11≤X , se a média populacional é de fato igual a 12. Aqui, o valor- p é dado por P(z ≥ 1,9) + P(z ≤ -1,9) = 2,87 + 2,87 ≈ 5,7% (vide a figura abaixo), e isto quer dizer que as chances são de aproximadamente 6 em 100 de que 95,0|12| ≥−X se µ = 12. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 11 10 10.5 11 11.5 12 12.5 13 13.5 14 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 média amostral D e n s id a d e p/2p/2 Pequenos valores-p nos dão evidências estatísticas para rejeitarmos H0 em favor de H1, pois a probabilidade de ocorrer um resultado tão ou mais distante do esperado, como o resultado ocorrido na amostra observada é pequena, se H0 for verdadeira (mas é preciso quantificar quão pequeno deve ser o valor-p e é aí que entra em cena o nível de significância α). Neste exemplo, P(Z ≥ 1,9) = valor-p = 2,9% para H1: µ > 12. Neste caso, valor-p = 2,9% (menor que α = 5%) é um forte indicador de que a média populacional µ é maior que 12. Portanto, torna-se natural rejeitar H0 em favor de H1. Por outro lado, grandes valores-p não fornecem evidências estatísticas para rejeitarmos H0 em favor de H1, pois a probabilidade de ocorrer um resultado tão ou mais distante do esperado, como o resultado ocorrido na amostra observada é grande, se H0 for verdadeira. No exemplo, P(Z ≤ 1,9) = valor-p = 97,1% para H1: µ<12. Assim, um valor-p = 97,1% (maior que α = 5%) é uma forte evidência de que H0 não deve ser rejeitada em favor de H1. Para o caso (iii), H1: µ ≠ 12, foi obtido (valor-p = 5,7%) > (α = 5%). Aqui, a evidência estatística para rejeitar H0 em favor de H1 NÃO é suficientemente forte. Logo, não rejeitamos H0 em favor de H1. Porém, H0 seria rejeitada em favor de H1 se adotássemos um valor maior para o nível de significância, como α’ = 10%. Regra a ser memorizada para a prova: ⇒⇒⇒⇒ Se valor-p ≤ α , rejeitamos H0 em favor de H1. ⇒⇒⇒⇒ Se valor-p > α , não rejeitamos H0 em favor de H1. 20.2 Testes de Uma Média Populacional Ressaltamos que todos os testes de médias a serem vistos nesta seção pressupõem a normalidade da distribuição amostral de X . Essa suposição é válida, com boa aproximação, mesmo quando as populações sob investigação não seguem a distribuição normal, desde que as amostras sejam Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 12 suficientemente grandes. Na prática, amostras com mais de n = 30 observações podem ser consideradas grandes. 20.2.1 Desvio Padrão Conhecido Caso 1: Testes de hipóteses monocaudais: a) H0: µ = µ0 H1: µ < µ0 ou b) H0: µ = µ0 H1: µ > µ0 Deve-se padronizar o valor experimental 1x utilizando-se a fórmula: (1) . / 01 n x z σ µ α − = A RC irá corresponder aos valores 1xx < para o teste (a). Neste caso, devemos rejeitar H0 se z < -zα. A RC irá corresponder aos valores 1xx > para o teste (b). Portanto, a hipótese nula (H0) deve ser rejeitada se z > zα. Caso 2: Testes de hipóteses bilaterais: c) H0: µ = µ0 H1: µ ≠ µ0 A RC irá corresponder aos valores 1xx < ou 2xx > (vide a próxima figura), em que os dois limites da RC são dados por (2) n zx σ µ α 2/01 −= (3) n zx σ µ α 2/02 += Neste caso, devemos rejeitar H0 se z < -zα/2 ou z > zα/2, o que implica o critério de rejeição |z| > zα/2. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 13 10 10.5 11 11.5 12 12.5 13 13.5 14 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 média amostral D e n s id a d e x 1 x 2 α/2 α/2 µ 0 A Tabela I resume os testes de hipóteses de uma média populacional com desvio padrão σ conhecido. Tabela I: testes de hipóteses para µµµµ com σσσσ conhecido Hipóteses Rejeita-se H0 se H0: µ = µ0 z < -zα H1: µ < µ0 H0: µ = µ0 z > zα H1: µ > µ0 H0: µ = µ0 z < -zα/2 ou z > zα/2 ⇒ |z| > zα/2 H1: µ ≠ µ0 Já caiu em prova! (ICMS-RJ/2010/FGV). Para testar H0: µ ≤ 10 contra H1: µ > 10, sendo µ a média de uma variável populacional suposta normalmente distribuída com variância igual a 100, uma amostra aleatória simples de tamanho 25 foi obtida e resultou num valor da média amostral igual a 15,76. Ao nível de significância de 5%, o valor-p (nível crítico) correspondente e a decisão a ser tomada são respectivamente: A) 0,102 e não rejeitar H0. B) 0,01 e rejeitar H0. C) 0,058 e não rejeitar H0. D) 0,002 e rejeitar H0 E) 0,154 e não rejeitar H0. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 14 Resolução Dados: σ2=100, n=25, X =15,76 e α=5%. z = X − µ σ / n ∴z = 15,76 −10 10 / 25 = 2,88 Consultando a tabela normal, tem-se que o valor-p correspondente a z = 2,88 é igual a 0,002. Como valor-p < α , rejeitamos H0 em favor de H1. GABARITO: D Já caiu em prova!(Especialista em Regulação de Aviação Civil/ANAC/2009/UnB-CESPE). Em uma pequena pesquisa encomendada por uma empresa aérea, foi realizado o seguinte teste de hipóteses. H0: µ=20 kg versus H1: µ>20 kg, em que µ representa a quantidade média de bagagens (em kg) que cada passageiro gostaria de transportar em vôos domésticos; H0 é a hipótese nula e H1 é a hipótese alternativa. De um grupo de 324 passageiros escolhidos ao acaso, a pesquisa mostrou que, em média, cada passageiro gostaria de transportar 21 kg. O desvio padrão amostral das quantidades observadas nesse levantamento foi igual a 9 kg. Com base nessas informações e considerando que as quantidades sigam uma distribuic ̧ão normal, e que Φ(1,7) = 0,955, Φ(2,0) = 0,977 e Φ(2,5) = 0,994, em que Φ(z) representa a func ̧ão de distribuição acumulada da distribuic ̧ão normal padrão, julgue os itens seguintes. A probabilidade de significa ̂ncia do teste é superior a 0,03. Resolução A distribuição amostral de X é normal com média µ e variância σ2/n. Vimos que a variância amostral S2 é um estimador consistente da variância populacional σ2, pois a variabilidade de S2 é desprezível (é um valor muito próximo de zero) quando o tamanho n da amostra é um valor grande. Embora S2, seja um estimador justo da variância populacional σ2, sua raiz quadrada S não é um estimador justo do desvio padrão populacional σ. O viés de S como estimador de σ, entretanto, tende assintoticamente a zero. Logo, para amostras grandes, podemos, por simplificação, adotar como estimativa o próprio desvio padrão da amostra, calculado pela raiz quadrada da variância amostral Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 15 Portanto, podemos adotar a aproximação S = 9 ≅ σ (desvio-padrão amostral = desvio-padrão populacional), pois n = 324 é um valor muito grande. Deste modo, µ = 20 pela H0, σ2/n = 92/324 = 81/324 = 1/4, X ~ N(20; 1/4) e a estatística do teste é 0,2 2/1 2021 / = − =∴ − = z n x z σ µ . ⇒ Φ(2,0) = 0,977 ⇒ valor-p = 1-Φ(2,0) = 0,023 = 2,3% < 3%. O item está errado, porque a probabilidade de significância ou valor-p do teste é 2,3%, inferior a 3%. A próxima figura mostra a distribuição amostral da média, sendo a hipótese nula verdadeira. A área hachurada é o valor-p. 18 18.5 19 19.5 20 20.5 21 21.5 22 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 Média amostral D e n s id a d e Valor-p = 2,3% GABARITO: E Se o nível de significância for igual a 3,5%, então há evidências estatísticas contra a hipótese nula. Resolução Valor-p=2,3% < α=3,5% ⇒ deve-se rejeitar H0, pois o valor da média amostral ( 21=x ) encontra-se na região crítica 9060,20=> cxx (α=3,5%). A figura abaixo mostra a região crítica do teste (área hachurada em vermelho). Item certo. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 16 18 18.5 19 19.5 20 20.5 21 21.5 22 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 Média amostral D e n s id a d e RC GABARITO: C Se a média verdadeira for µ = 19,6, então, para uma probabilidade do erro do tipo I fixada em 4,5%, o valor da função característica de operação do teste será superior a 0,98. Resolução Aqui a probabilidade β do erro tipo II pode ser calculada, pois o item especificou um valor alternativo para µ, qual seja, µ’=19,6. Precisamos aprender um conceito novo antes de resolver este item. Definição. A função característica de operação do teste é definida como β(µ) = P(aceitar H0|µ). Ou seja, β(µ) é a probabilidade de aceitar H0, considerada como uma função de µ. Segue-se que a função característica do teste especificado pela questão é dada por β(µ) = P(aceitar H0|µ) = P( X pertencer à região de aceitação|µ). No item, β(µ = µ’ = 19,6) = P( X menor que o valor crítico|µ = 19,6). Observe que a nova probabilidade do erro do tipo I foi fixada em 4,5%, ou seja, α’ = 4,5% e isto implica z4,5% = 1,7, pois Φ(0,955) = 1,7. Então o novo Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 17 valor crítico do teste, assumindo-se verdadeira a hipótese nula µ = 20, será dado por 85,207,1 5,0 20 =∴= − c c x x . A região de aceitação para α’ = 4,5% é 85,20<x . Como a média verdadeira é µ’=19,6, a P( X menor que o valor crítico |µ = 19,6) é dada por %4,99)5,2()5,2( 2/1 6,1985,20 =Φ==<= −=< cc zzPzzP . Então β(19,6) = P(aceitar H0|média verdadeira) = 0,994 > 0,98. Item certo. A próxima figura mostra a probabilidade β, a distribuição verdadeira (linha preta) e a distribuição amostral falsa (linha vermelha). 18 18.5 19 19.5 20 20.5 21 21.5 22 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 distribuição pela H 0 distribuição verdadeira β GABARITO: C Considerando-se que o nível de significância do teste igual a 0,6%, o valor da func ̧ão poder (ou potência) do teste será igual a 0,5 se a média verdadeira µ for igual a 21kg. Resolução O poder ou potência do teste é definido como π(µ) = 1-β(µ) = P(rejeitar H0|µ). Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 18 No item, π(µ = 21) = P( X pertencer à região crítica|µ = 21). O nível de significância é 0,6%, isto é, α = 0,6%. Logo, z0,6%=2,5, pois Φ(0,994) = 2,5. Assim, o valor crítico do teste, assumindo-se verdadeira a hipótese nula µ = 20, será 25,215,2 5,0 20 =∴= − c c x x . Ou seja, a região crítica para α = 0,6% é 25,21>x . Como a média verdadeira é µ=21, então π(21) = P( X >21,25|µ=21) < 0,5, pois o valor crítico está direita da verdadeira média. A figura abaixo mostra que o poder do teste, representado pela área azul, é menor que 0,5. Item errado. 18 19 20 21 22 23 24 0 0.2 0.4 0.6 0.8 1 distribuição pela H 0 (falsa) distribuição verdadeira poder do teste GABARITO: E Pode-se afirmar, com 95,5% de confianc ̧a, que a estimativa da quantidade média de bagagens µ é de 21 kg ± 0,85 kg. Resolução Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 19 O intervalo de confiança para a média quando o desvio-padrão populacional é conhecido (lembre que σ ≅ S = 9, pois n = 324 é um valor grande), no nível de confiança 1-α, é dado por .2/ n zX σ α± Dados: 21=X e 2/118/9324/9/ ===nσ . Temos que 955,01 =−α ⇒ %5,4045,0 ==α ⇒ %25,22/ =α ⇒ 977,02/1 ≈−α ⇒ 0,2=z , pois Φ(2,0) = 0,977. Logo, o intervalo de confiança é 0,121)2/10,2(21 ±=×± . O item está errado. GABARITO: E O erro padrão da média amostral é inferior a 0,8 kg. Resolução O desvio padrão da média amostral é n X /σσ = = 0,5 kg, e o mesmo é inferior a 0,8 kg. Item certo. GABARITO: C 20.2.2 Desvio Padrão Desconhecido É muito freqüente, na prática, o caso em que desejamos testar hipóteses referentes à média de uma população cujo desvio padrão é desconhecido. Se tivermos à disposição uma amostra aleatória de n elementos provenientes dessa população, com base na qual iremos realizar o teste, deveremos então usar essa mesmaamostra para estimar o desvio padrão σ da população. Neste caso, a variável aleatória de teste terá distribuição t de Student com n-1 graus de liberdade: (4) . / 0 1 ns x tn µ− =− Assim, a única diferença em relação ao caso anterior (desvio padrão conhecido) reside no fato de que iremos trabalhar com valores t de Student no lugar de z (normal padrão). Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 20 A Tabela II resume os testes de hipóteses de uma média populacional com desvio padrão σ desconhecido. Tabela II: testes de hipóteses para µµµµ com σσσσ desconhecido Hipóteses Rejeita-se H0 se H0: µ = µ0 tn-1 < -tn-1,α H1: µ < µ0 H0: µ = µ0 tn-1 > tn-1,α H1: µ > µ0 H0: µ = µ0 |tn-1| > tn-1,α/2 H1: µ ≠ µ0 20.3 Testes de Uma Proporção Populacional Já aprendemos que, ao realizar inferências sobre uma proporção populacional p, devemos nos basear na proporção observada na amostra pˆ . Também vimos que se np ≥ 5 e n(1-p) ≥ 5, podemos aproximar a distribuição amostral de pˆ pela distribuição normal com média p e desvio padrão npp /)1( − . Teste que envolvem proporções populacionais são feitos de forma análoga aos testes com médias da população. Assim, por exemplo, sejam as hipóteses H0: p = p0 H1: p < p0. Satisfeitas as restrições np0 ≥ 5 e n(1-p0) ≥ 5, a distribuição amostral da frequência relativa será aproximadamente normal, com média p0 e desvio padrão npp /)1( 00 − (pela hipótese nula). Portanto, padronizando o valor experimental pˆ , teremos o valor padronizado experimental correspondente (5) . /)1( ˆ 00 0 npp pp z − − = Podemos multiplicar o numerador e o denominador de (5) por n, obtendo o mesmo teste em termos da freqüência observada f, por meio da expressão equivalente (6) . )1( 00 0 pnp npf z − − = A hipótese nula (H0) será rejeitada se z < -zα. De forma análoga ao que já visto para os testes com a média, no caso dos testes unilateral à direita e Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 21 bicaudal, as condições de rejeição de H0 são, respectivamente, z > zα e |z| > zα/2 A Tabela III resume os testes de hipóteses para uma proporção populacional. Tabela III: testes de hipóteses para p (*) Hipóteses Rejeita-se H0 se H0: p = p0 z < -zα H1: p < p0 H0: p = p0 z > zα H1: p > p0 H0: p = p0 |z| > zα/2 H1: p ≠ p0 (*) npp pp z /)1( ˆ 00 0 − − = ou )1( 00 0 pnp npf z − − = Já caiu em prova! (ICMS-RJ/2010/FGV). Para testar H0: p ≤ 0,5 contra H1: p > 0,5, sendo p a proporção de pessoas que são protegidas por planos de previdência privada numa certa população, uma amostra aleatória simples de tamanho 400 será obtida e será usado como critério de decisão rejeitar a hipótese H0 se a proporção de pessoas com essa proteção na amostra for maior ou igual a um certo número k. Ao nível de significância de 5%, o valor de k é aproximadamente igual a: A) 0,508. B) 0,541. C) 0,562. D) 0,588. E) 0,602. Resolução Testes que envolvem proporções populacionais são feitos de forma análoga aos testes com médias da população. Como as restrições np = 400 x 0,5 = 200>5 e n(1-p) = 400 x 0,5 = 200>5 são válidas, a distribuição amostral da frequência relativa será aproximadamente normal, com média p=0,5 e desvio padrão 1/2(1−1/2) /400 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 22 (pela hipótese nula). Portanto, padronizando o valor experimental kp =ˆ , teremos o valor padronizado experimental correspondente 40/14/120/1/)1(ˆ ˆ 0 0 dd npp pp z == − − = O teste de hipóteses é unilateral. A tabela normal indica z5% ≈1,64 = d 1/40 ∴d =1,64 /40 = 0,041. Assim, 541,0041,05,0ˆ =+== kp . GABARITO: B 20.4 Testes de Uma Variância Populacional Seja o teste unilateral à direita H0: ,20 2 σσ = H1: .20 2 σσ > Como a média populacional µ em geral é desconhecida, a variável de teste deverá ser a variância amostral , 1 )( 1 2 2 − − = ∑ = n xx s n i i que é um estimador justo de σ2, conforme já visto neste curso. Se a variância amostral s2 for próxima do valor testado 20σ , iremos aceitar a hipótese nula (H0). Rejeitaremos H0 se s2 cair na região crítica (RC), que corresponderá à cauda à direita com probabilidade α na distribuição amostral de s2, sendo verdadeira a hipótese nula. Ou seja, sendo 21s o limite da RC, rejeitamos H0 se (7) 21 2 ss > . Por outro lado, vimos que, se a população for normalmente distribuída, a quantidade 22 /)1( σsn − tem distribuição 2χ com n-1 graus de liberdade. Portanto, admitindo verdadeira a hipótese nula (H0), podemos escrever que (8) , )1( 2 12 2 0 −= − n sn χ σ Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 23 sendo a quantidade (8) denominada 2 1−nχ experimental. A Eq. (8) estabelece a relação existente entre valores de 2s e a distribuição 2 1−nχ , suposta verdadeira a hipótese nula. Assim, se em (8) fizermos 2 1 2 ss = , o qui-quadrado correspondente será o valor 2χ que determina sobre sua distribuição uma cauda à direita com probabilidade α, ou seja, 2 ;1 αχ −n (qui- quadrado superior): (9) 2 ;12 2 1 0 )1( αχσ − = − n sn Como 21 2 ss > implica 2 ;1 2 1 αχχ −− > nn , a condição de rejeição de H0 é (10) 2 ;1 2 1 αχχ −− > nn em que o 2 1−nχ experimental é dado por (8) e o valor crítico 2 ;1 αχ −n é obtido na Tabela da distribuição 2χ . A figura abaixo mostra a região crítica (cauda à direita azul) para uma variável qui-quadrado com 6 graus de liberdade e α = 5% ( 2 %5;6χ = 12,5916). 0 5 10 15 20 25 0 0.02 0.04 0.06 0.08 0.1 0.12 0.14 X superior D e n s id a d e X X 6 área = α α De forma análoga, se as hipóteses forem H0: ,20 2 σσ = H1: ,20 2 σσ < Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 24 rejeitaremos H0 se (11) 2 1;1 2 1 αχχ −−− < nn , em que 2 1;1 αχ −−n é o qui-quadrado inferior (é o valor que determina sobre sua distribuição uma cauda à direita com probabilidade 1-α). A figura abaixo mostra a região crítica (cauda à esquerda azul) para uma qui-quadrado com 6 graus de liberdade e α = 5% ( 2 %95;6χ = 1,6354). 0 5 10 15 20 25 0 0.02 0.04 0.06 0.08 0.1 0.12 0.14 X inferior D e n s id a d e X 6 área = α Se o teste for bilateral, isto é. H0: ,20 2 σσ = H1: ,20 2 σσ ≠ rejeitaremos H0 se (12) 2 2/1;1 2 1 αχχ −−− < nn ou 2 2/;1 2 1 αχχ −− < nn . Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 25 0 5 10 15 20 25 0 0.02 0.04 0.06 0.08 0.1 0.12 0.14 X D e n s id a d e X 6 área inferior = 2,5% área superior = 2,5%A figura acima mostra as regiões críticas para uma qui-quadrado com 6 graus de liberdade e α = 5% ( 2 %5,97;6χ = 1,2373 e 2 %5,2;6χ = 14,4494). A Tabela IV resume os testes de hipóteses para uma variância populacional. Tabela IV: testes de hipóteses para σσσσ2 (*) Hipóteses Rejeita-se H0 se H0: 20 2 σσ = 2 1;1 2 1 αχχ −−− < nn H1: 20 2 σσ < H0: 20 2 σσ = 2 ;1 2 1 αχχ −− > nn H1: 20 2 σσ > H0: 20 2 σσ = 2 2/1;1 2 1 αχχ −−− < nn ou 2 2/;1 2 1 αχχ −− < nn H1: 20 2 σσ ≠ (*) 2 2 2 1 0 )1( σ χ sn n − =− Exemplo. Uma amostra de dez elementos é extraída de uma população normal e fornece variância amostral igual a 12,0. O resultado obtido é suficiente para se concluir, ao nível α = 5% de significância, que a variância populacional é inferior a 20? As hipóteses a serem testadas são: H0: ,202 =σ Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 26 H1: .202 <σ O 29 2 1 χχ =−n experimental é dado por .4,5 20 129)1( 2 2 2 9 0 = × = − = σ χ sn A condição de rejeição da hipótese nula (H0) é 2 1;1 2 1 αχχ −−− < nn . O valor crítico χn−1;1−α 2 = χ9;0,95 2 = 3,325 ≈ 3,32 (vide tabela ao final desta aula). Como 5,4>3,32, devemos aceitar a hipótese nula .202 =σ 20.5 Testes Não Paramétricos Vimos nas seções anteriores como podemos testar hipóteses referentes a um parâmetro populacional (testes paramétricos). A partir deste ponto, abordaremos um tipo de teste não paramétrico de hipóteses. Um teste não paramétrico refere-se a outros aspectos que não os parâmetros da distribuição de probabilidades que modela a população. Na próxima seção, veremos o teste de aderência pelo χ2. 20.5.1 Teste de Aderência Uma modalidade relevante de teste não paramétrico é constituída pelo teste de aderência, em que a hipótese testada refere-se à forma da distribuição da população. Nesse teste, admitimos, por hipótese, que a distribuição da variável de interesse na população seja descrita por determinado modelo de distribuição de probabilidades. Testamos esse modelo e verificamos a boa ou má aderência dos dados da amostra ao modelo. Se obtivermos uma boa aderência e a amostra for grande (n>30), poderemos, em princípio, admitir que a distribuição populacional seja bem ajustada pelo modelo proposto no teste. Por outro lado, a rejeição da hipótese nula em um dado nível de significância indica que o modelo testado é inadequado para representar a população. A forma de testar a aderência baseia-se na estatística (13) χν 2 = (Oi − E i) 2 E i = i=1 k ∑ Oi 2 E i − n, i=1 k ∑ em que: - 2νχ denota a estatística do teste, com ν graus de liberdade; - iO é a freqüência observada de uma determinada classe ou valor da variável; Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 27 - iE é a freqüência esperada, segundo o modelo testado, dessa classe ou valor da variável; - ∑∑ == == k i i k i i EOn 11 é o número de elementos da amostra; - k denota o número de classes ou valores considerados. Demonstra-se que, se o modelo testado for verdadeiro e se todas 5≥iE , a quantidade definida acima terá distribuição assintótica 2νχ com ν = (k -1 – m) graus de liberdade, em que m denota o número de parâmetros do modelo estimado. A subtração de 1 ao valor de k deve-se à existência da restrição nO k i i =∑ =1 entre as freqüências observadas. O cálculo das freqüências esperadas é feito por meio da expressão ,ii npE = em que pi é a probabilidade, segundo o modelo, de se obter um valor da variável na classe considerada, e n é o número de elementos da amostra. Essa expressão resulta do fato de que cada freqüência observada Oi terá, para população infinita, distribuição binomial com parâmetros n e pi, sendo, portanto, seu valor esperado dado por ii npE = . A estatística distribui-se aproximadamente segundo um qui-quadrado porque ∑∑ == − = − = k i i ii k i i ii E EO E EO 1 2 1 2 2 )( νχ e, havendo muitas classe, )1( iiii pnpnpE −≅= (esta última expressão corresponde ao desvio padrão da binomial), pois os pi deverão ser pequenos. Supondo-se que valha 5≥iE , a distribuição binomial das Oi aproxima-se da normal, e o valor entre parênteses no segundo membro da equação acima seria aproximadamente um valor de z (normal padrão). Como a distribuição 2νχ surge de uma soma de valores de z ao quadrado, resulta que o somatório fornece uma variável com distribuição próxima do qui-quadrado com ν graus de liberdade. Observe que a estatística 2νχ pode ser interpretada como uma medida da discrepância existente entre as freqüências observadas e esperadas, pois consiste em uma soma de desvios quadráticos padronizados por suas respectivas freqüências esperadas. Quando 02 =νχ , as freqüências teóricas e observadas concordam exatamente, enquanto que, para 02 >νχ , isso não é Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 28 verdade. Quanto maior for o valor de 2νχ , maior será a discrepância entre as freqüências observadas e esperadas. O teste de aderência pelo 2χ é unilateral, devendo a hipótese nula (H0) ser rejeitada se 2, 2 ανν χχ > . Isso é razoável, porque, se o modelo testado estiver longe da realidade, as freqüências observadas irão diferir bastante das esperadas, o que fará com que a variável de teste cresça. Caso existam classes que não satisfaçam à condição 5≥iE , estas deverão ser englobadas às classes adjacentes, conforme veremos no exemplo a seguir. Exemplo. O número de defeitos por unidade observado em uma amostra de cem aparelhos eletrônicos do tipo home theaters produzidos em uma linha de montagem apresentou a seguinte distribuição de frequências Número de defeitos 0 1 2 3 4 5 6 7 Número de aparelhos 24 36 18 12 5 2 1 2 O teste de aderência pelo χ2 será usado para testar as seguintes hipóteses: H0: a distribuição do número de defeitos por unidade é bem modelada pela distribuição de Poisson; H1: a distribuição do número de defeitos por unidade não é do tipo Poisson. Aprendemos que a Lei de Poisson pode ser escrita na forma , ! )( k e kXP k λλ − == ,...2,1,0=k em que o parâmetro λ = E(X) = µ (média da distribuição). Como a hipótese a ser testada não especifica o valor de µ, devemos estimá-la por meio da média amostral X . Da tabela do enunciado deste exemplo, obtemos .58,1 100 158 === ∑ n fx x ii Usaremos, portanto, o modelo de Poisson com µ = λ = 1,58 para o cálculo das probabilidades pi. Considerando pi = P(X = i), i = 0, 1, 2, ... , 7, temos, aplicando a fórmula da distribuição de Poisson: ,2060,0 !0 58,1 58,1 58,10 0 ≈== − − e e p Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 29 5 2,24 2,76 ,3254,058,1 !1 58,1 58,1 58,11 1 ≈×== − − e e p ,2571,0 !2 58,1 58,12 2 ≈= −e p ,1354,0 !3 58,1 58,13 3 ≈= −e p ,0535,0 !4 58,1 58,14 4 ≈= −e p ,0169,0 !5 58,1 58,15 5 ≈= −e p 0045,0 !6 58,1 58,16 6 ≈= −e p e 0010,0!7 58,1 58,17 7 ≈= −e p E chegamos à seguinte Tabela de cálculo de 2νχ : ix ii Of = ii fx ip ii npE = ii EO − i ii E EO 2)( − 0 24 0 0,2060 20,60 3,40 0,5612 1 36 36 0,3254 32,54 3,46 0,3679 2 18 36 0,2571 25,71 -7,71 2,3121 3 12 36 0,1354 13,54 -1,54 0,1752 4 5 20 0,0535 5,35 -0,35 0,0229 5 2 10 0,0169 1,69 0,31 3,4007 6 1 6 0,0045 0,45 0,55 7 2 14 0,0010 0,10 1,90 Soma 158 ≈ 1,00 ≈ 100,0 6,84 Para determinação do 2νχ crítico, o número de graus de liberdade deverá ser ,41161 =−−=−−= mkν pois temos seis parcelas na tabela acima e somente um parâmetro foi estimado a partir da amostra. Adotando α = 5%, obtemos (vide tabela da distribuição 2χ ao final desta aula) 49,92 %5;4 2 == χχ crítico . Como 6,84 < 9,49, aceitamos H0 e concluímos que a variável tem boa aderência ao modelo de Poisson. 20.5.2 Teste de Independência Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 30 Quando existem duas ou mais variáveis qualitativas de interesse, a representação das freqüências observadas pode ser feita por meio de uma tabela de contingência. Considere, por exemplo, uma amostra de 100 pessoas, que foram entrevistadas quanto às suas opiniões sobre as cotas raciais nas universidades públicas brasileiras, tendo sido obtidos os resultados dados na Tabela V. Tabela V: pesquisa de opinião Sexo Opinião Totais Favorável Desfavorável Indiferente Feminino 34 11 15 60 Masculino 8 19 13 40 Totais 42 30 28 100 A Tabela V é uma tabela de contingência 2 x 3, pois a variável qualitativa “sexo” apresenta duas classificações possíveis e a variável “opinião”, três classificações. As frequências indicam que 34 mulheres foram favoráveis, 11 foram desfavoráveis e 15 foram indiferentes, no total de 100 pessoas entrevistadas. A linha e a coluna de totais fornecem as distribuições de frequências marginais, ou seja, as distribuições de cada variável qualitativa considerada individualmente, não importando a outra variável. É possível testar se as variáveis qualitativas envolvidas na Tabela V são ou não independentes (ou seja, é possível testar se a opinião independe do sexo). Ou seja, podemos formular o seguinte teste de hipóteses: H0: as variáveis são independentes; H1: as variáveis não são independentes, apresentando algum grau de associação entre si. O teste acima pode ser feito pelo χ2, de modo semelhante ao teste de aderência, isto é, utilizando a estatística (14) ∑∑∑∑ = == = −= − = l i c j ij ij l i c j ij ijij n E O E EO 1 1 2 1 1 2 2 )( νχ em que: - 2νχ denota a estatística do teste, com νννν graus de liberdade; - l é o número de linhas da tabela de contingência; - c é o número de colunas da tabela de contingência; - Oij é a freqüência observada na posição de linha i e coluna j da tabela; Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 31 - E ij é a freqüência esperada, na posição de linha i e coluna j da tabela; - n = Oij j=1 c ∑ i=1 l ∑ é o número de elementos da amostra; As freqüências esperadas de cada posição da tabelas são dadas por (15) E ij = npij , em que pij é a probabilidade de ocorrer uma observação na posição considerada. Havendo independência entre as variáveis, temos que (16) pij = pip j em que pi é a probabilidade marginal correspondente à linha i e p j a probabilidade marginal correspondente à linha j. As probabilidades marginais deverão ser estimadas, pois não são conhecidas, utilizando-se as frequências relativas pi ' e p j ', dadas por pi '= f i n , p j '= f j n , de modo que (17) E ij = npip j ≈ npi ' p j '= f i f j n . A Eq. (17) nos fornece a regra prática para o cálculo das freqüências esperadas: multiplicar o total da linha pelo total da coluna e dividir por n. Aqui, também deve-se obedecer a restrição E ij ≥ 5 O número de graus de liberdade da variável de teste 2νχ é (18) ν = (l −1)(c −1). A hipótese nula (H0) deve ser rejeitada se 2, 2 ανν χχ > . No caso bastante comum de tabela 2x2 (importante para a prova!), o cálculo de 2νχ pode ser feito pela expressão (19) χ1 2 = n(ad − bc)2 (a +b)(a + c)(b+ d)(c + d) Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 32 em que a, b, c e d são as frequências observadas, organizadas segundo o esquema: a b c d Exemplo. Realizar o teste de independência para os dados da Tabela V ao nível de 1% de significância. As frequências esperadas devem ser calculadas pela fórmula: , n ff E ji ij ≈ em que i denota a linha e j representa a coluna da tabela de contingência. Então, obtemos 2,25 100 426011 11 = × == n ff E , 0,18 100 3060 12 = × =E , 8,16 100 2860 23 = × =E 8,16 100 4260 21 = × =E , 0,12 100 3040 22 = × =E , 2,11 100 2840 23 = × =E Sexo Opinião Totais Favorável Desfavorável Indiferente Feminino O11 = 34,0 E11 = 25,2 O12 =11,0 E12 = 18,0 O13 =15,0 E13 = 16,8 60 Masculino O21 =8,0 E21 = 16,8 O22 =19,0 E22 = 12,0 O23 =13,0 E23 = 11,2 40 Totais 42 30 28 100 Note que, na condição de independência, as frequências esperadas mantêm relações constantes entre todas as linhas e todas as colunas, inclusive os totais. Assim, espera-se que as opiniões estejam na relação 42:30:28 independentemente do sexo. De fato, essa relação é verificada entre as frequências esperadas: 25,2:18,0:16,8 para mulheres e 16,8:12,0:11,2 para homens. Similarmente, o sexo independeria da opinião, pois 60:40 equivale a 25,2:16,8, 18,0:12,0 e 16,8:11,2. Será que as freqüências observadas diferem significativamente das frequências esperadas? Faremos esta verificação usando o χ2, cujo cálculo está registrado na tabela abaixo. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 33 ijO ijE ijij EO − ij ijij E EO 2)( − 34,0 25,2 8,8 3,073 11,0 18,0 -7,0 2,722 15,0 16,8 -1,8 0,193 8,0 16,8 -8,8 4,610 19,0 12,0 7,0 4,083 13,0 11,2 1,8 0,289 100,0 100,0 14,970 O 2νχ calculado conforme (14) é 14,970. O número de graus de liberdade é ν = (l-1)(c-1) = (2-1)(3-1) = 1.2 = 2. Logo, o valor crítico para α = 1% é 21,92 %1;2 =χ (vide tabela do qui-quadrado). Como 14,970 > 9,21, deve-se rejeitar a hipótese de independência entre opinião e sexo ao nível de 1% de significância. 20.6 Memorize para a prova - A hipótese nula (ou hipótese de trabalho) H0 é a hipótese aceita como verdadeira até prova estatística em contrário. Ela geralmente representa o contrário do que queremos provar, ou seja, representa a hipótese que se quer rejeitar. - A hipótese alternativa H1 usualmente representa o que se quer provar. - Em um teste de hipóteses, podem ocorrer dois tipos de erro: • Erro tipo I: rejeitar H0, sendo H0 verdadeira; • Erro tipo II: aceitar H0, sendo H0 falsa. - Valor-p: ⇒ se valor-p ≤ α , rejeitamos H0 em favor de H1. ⇒ se valor-p > α , não rejeitamos H0 em favor de H1. Nota: α é o nível de significância do teste. - Variáveis de teste para a média populacional: a) n X z/σ µ− = (normal padrão), se o desvio-padrão populacional σ é conhecido. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 34 Hipóteses Rejeita-se H0 se H0: µ = µ0 z < -zα H1: µ < µ0 H0: µ = µ0 z > zα H1: µ > µ0 H0: µ = µ0 z < -zα/2 ou z > zα/2 ⇒ |z| > zα/2 H1: µ ≠ µ0 b) ns X t / µ− = (t de Student), em que s denota o desvio-padrão amostral. Hipóteses Rejeita-se H0 se H0: µ = µ0 tn-1 < -tn-1,α H1: µ < µ0 H0: µ = µ0 tn-1 > tn-1,α H1: µ > µ0 H0: µ = µ0 |tn-1| > tn-1,α/2 H1: µ ≠ µ0 - Frequência relativa amostral pˆ tem distribuição binomial com média p e variância p(1-p)/n. Se np ≥ 5 e n(1-p) ≥ 5, então pˆ tem distribuição N ~ (p, p(1-p)/n). - Estatística para teste da proporção populacional p: npp pp z /)1( ˆ − − = . Hipóteses Rejeita-se H0 se H0: p = p0 z < -zα H1: p < p0 H0: p = p0 z > zα H1: p > p0 H0: p = p0 |z| > zα/2 H1: p ≠ p0 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 35 - Variável de teste para variância populacional σ2: 2 2 2 1 )1( σ χ sn n − =− , em que 1 )( 2 2 − − =∑ n xx s i denota a variância amostral. - Testes de hipóteses para variância populacional σ2: Hipóteses Rejeita-se H0 se H0: 20 2 σσ = 2 1;1 2 1 αχχ −−− < nn H1: 20 2 σσ < H0: 20 2 σσ = 2 ;1 2 1 αχχ −− > nn H1: 20 2 σσ > H0: 20 2 σσ = 2 2/1;1 2 1 αχχ −−− < nn ou 2 2/;1 2 1 αχχ −− < nn H1: 20 2 σσ ≠ 20.7 Exercícios de Fixação 1. (ICMS-RJ/2009/FGV) Uma empresa afirma que os pacotes de bala que ela produz pesam em média 25g. Para testar essa hipótese, foram selecionados ao acaso 16 pacotes produzidos pela empresa, registrados seus pesos X1, X2, ... , X16 e calculadas as estatísticas ∑ = = 16 1 320 i iX e ∑ = = 16 1 2 7360 i iX . O valor da estatística t (a ser comparado com o ponto desejado da distribuição t de Student) para o teste é: A) -0,8 B) -1,2 C) -2,0 D) -2,5 E) -3,2 2. (Analista da SUSEP/2006/ESAF) Em uma distribuição de sinistro S, formulando-se a hipótese de que não há diferença entre a freqüência esperada e a observada (hipótese nula: H0). Donde, segundo um determinado nível de significância, podemos afirmar que ocorreu A) um erro do tipo I, se for aceita a hipótese H0. B) um erro do tipo II, se for rejeitada a hipótese H0. C) um erro do tipo I, se for aceita a hipótese H0, sendo esta correta. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 36 D) um erro do tipo II, se for rejeitada a hipótese H0, sendo esta correta. E) um erro do tipo I, se for rejeitada a hipótese H0, sendo esta correta. 3. (ICMS-RJ/2007/Adaptada) Para a realização de um teste de hipóteses H0: µ = µ0, contra H1: µ > µ0, definimos ERRO DO TIPO I: A) P(µ > µ0 | µ = µ0) B) P(µ = µ0 | µ > µ0) C) Rejeitar H0 sendo H0 verdadeira. D) 1 – P(µ > µ0 | µ = µ0) E) Aceitar H0, sendo H0 falsa 4. (ICMS-SP/2009/FCC) O gerente de uma indústria de determinado componente eletrônico garante que a vida média do produto fabricado é igual a 100 horas. Um comprador dessa indústria decide testar a afirmação do gerente e faz um teste estatístico formulando as hipóteses H0: µ = 100 e H1: µ < 100, sendo que H0 é a hipótese nula, H1 é a hipótese alternativa e µ é a média da população considerada de tamanho infinito com uma distribuição normal. O desvio padrão populacional é igual a 10 horas e utilizou-se a informação da distribuição normal padrão (Z), segundo a qual P(Z ≥ 1,64) = 5%. H0 foi rejeitada com base em uma amostra aleatória de 64 componentes em um nível de significância de 5%. Então, o valor da média amostral foi, em horas, no máximo, A) 94,75 B) 95,00 C) 96,00 D) 96,50 E) 97,95 5. (AFPS/2002/ESAF) Um atributo X tem distribuição normal com média µ e variância σ2. A partir de uma amostra aleatória de tamanho 16 da população definida por X, deseja-se testar a hipótese H0: µ = 22 contra a alternativa Ha: µ ≠ 22. Para esse fim calcula-se a média amostral 30=x e a variância amostral S2 = 100. Assinale a opção que corresponde à probabilidade de significância (p-valor) do teste A) 2P{T>3,2} onde T tem distribuição de Student com 15 graus de liberdade. B) P{|Z|>3,2} onde Z tem distribuição normal padrão. C) P{Z<-2,2} onde Z tem distribuição normal padrão. D) P{T<-3,2} onde T tem distribuição de Student com 15 graus de liberdade E) P{|T|>2,2} onde T tem distribuição de Student com 15 graus de liberdade Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 37 6. (Fiscal de Rendas MS/2006/FGV) Em um teste de hipóteses, a hipótese nula foi rejeitada ao nível de 3%. Portanto, a hipótese nula: A) será aceita no nível de 1%. B) será aceita no nível de 5%. C) pode ser aceita ou rejeitada no nível de 5%. D) será rejeitada no nível de 1%. E) será rejeitada no nível de 5%. 7. (Fiscal de Rendas MS/2006/FGV) Um teste de hipótese apresentou p- valor igual a 0,03. Portanto, nos níveis de significância de 1% e 5%, respectivamente, a hipótese nula: A) deve ser aceita e aceita. B) deve ser aceita e rejeitada. C) deve ser rejeitada e aceita. D) deve ser rejeitada e rejeitada. E) pode ou não ser rejeitada, dependendo de a hipótese ser simples ou não. 8. (Economista Jr./Cia Potiguar de Gás/2006/FGV) Um teste de hipótese apresentou p-valor igual a 0,07. Portanto, nos níveis de significância de 10% e 5%, respectivamente, a hipótese nula: A) deve ser aceita e aceita. B) deve ser aceita e rejeitada. C) deve ser rejeitada e aceita. D) deve ser rejeitada e rejeitada. E) pode ou não ser rejeitada, dependendo de a hipótese ser simples ou não. 9. (Analista da SUSEP/2006/ESAF) Na análise da sinistralidade de uma determinada carteira, uma medida de discrepância existente entre as freqüências observadas e as esperadas é proporcionada pela estatística qui quadrado – X2. Com base nisso, pode-se afirmar que se: A) X2 = 0, as freqüências teóricas (esperadas) e as observadas concordam exatamente. B) X2 = 0, as freqüências teóricas (esperadas) e as observadas não concordam exatamente nem parcialmente. C) X2 = 0, as freqüências teóricas (esperadas) e as observadas concordam parcialmente, pode ser aceita-se como tal. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 38 D) X2 = 1, as freqüências teóricas (esperadas) e as observadas concordam exatamente. E) X2 ≠ 0, as freqüências teóricas (esperadas) e as observadas concordam exatamente. 10. (INÉDITA) Em 200 lances de uma moeda, observaram-se 116 caras e 84 coroas. Testou-se a hipótese da moeda ser honesta, adotando-se os níveis de significância 5% e 1%. Então pode-se afirmar que A) a hipótese da moeda ser honesta é aceita nos dois níveis de significância. B) a hipótese da moeda ser honesta é rejeitada nos dois níveis de significância. C) a hipótese da moeda ser honesta é rejeitada no nível de significância de 1%, mas é aceita no nível de significância de 5%. D) a hipótese da moeda ser honesta é rejeitada no nívelde significância de 5%, mas é aceita no nível de significância de 1%. E) a hipótese alternativa da moeda ser desonesta é rejeitada no nível de significância de 5%, mas é aceita no nível de significância de 1%.. 11. (AFT/2010/ESAF) Em uma amostra aleatória simples de 100 pessoas de uma população, 15 das 40 mulheres da amostra são fumantes e 15 dos 60 homens da amostra também são fumantes. Desejando-se testar a hipótese nula de que nesta população ser fumante ou não independe da pessoa ser homem ou mulher, qual o valor mais próximo da estatística do correspondente teste de qui-quadrado? A) 1,79. B) 2,45. C) 0,98. D) 3,75. E) 1,21. 12. (IRB/Resseguro/2004/ESAF) Num estudo do consumo de combustível para uma determinada marca de automóvel, supõe-se que a distribuição do consumo é aproximadamente normal com média desconhecida µ km/l e desvio padrão 3 km/l. Uma amostra de 36 veículos produziu a média de consumo de 16 km/l. Deseja-se testar a hipótese H: µ = 15 contra a alternativa A: µ > 15. Considerando os valores da função de distribuição normal padrão dados abaixo, assinale a opção que dá o valor probabilístico (p-valor) do teste que toma por base a estatística )15(2 −= Xz , sendo X a média amostral. z F(z) 1,0 0,841 1,2 0,885 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 39 1,4 0,919 1,6 0,945 1,8 0,964 2,0 0,977 2,2 0,986 2,4 0,992 A) 0,500 B) 0,977 C) 0,050 D) 0,023 E) 0,010 13. (Analista Área 2/BACEN/2010/CESGRANRIO) Com relação a um teste simples de hipótese, assinale a afirmativa correta. (A) Um teste bicaudal de nível de significância α rejeita ahipótese nula H0: µ = µ0 precisamente quando µ0 está fora do intervalo de confiança de nível (1−α) para µ. (B) A hipótese nula a ser testada deve ser construída com muita atenção porquanto é o objeto da inferência estatística, enquanto que a hipótese alternativa só precisa ser contrária à hipótese nula. (C) Se o grau de significa ̂ncia do teste é α, significa que (1− α) é a probabilidade de se cometer erro do tipo I. (D) Na definic ̧ão de um teste, deve-se levar em conta que quanto menor o grau de significa ̂ncia do teste (α), maior será o poder do teste(π), uma vez que (α + π)=1. (E) Erro do tipo II, embora definido para uma hipótese alternativa específica, ocorrerá sempre com probabilidade igual ao poder do teste. (Fiscal de Rendas-MS/2006/FGV) O enunciado a seguir refere-se às questões de números 14 e 15 Uma amostra aleatória simples de tamanho 25 foi selecionada para estimar a média desconhecida de uma população normal. A média amostral encontrada foi 4,2, e a variância amostral foi 1,44. 14. O intervalo de 95% de confiança para a média populacional é A) 4,2 ± 0,75 B) 4,2 ± 0,64 C) 4,2 ± 0,71 D) 4,2 ± 0,49 E) 4,2 ± 0,81 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 40 15. O intervalo de 95% de confiança para a variância populacional é A) (0,72, 3,05) B) (0,88, 2,79) C) (0,64, 3,20) D) (0,55, 3,16) E) (0,44, 3,44) (Fiscal de Rendas-MS/2006/FGV) O enunciado a seguir refere-se às questões de números 16, 17 e 18. A tabela a seguir mostra os resultados obtidos em Matemática por três turmas: Aprovados Reprovados Total Turma X 30 10 40 Turma Y 35 5 40 Turma Z 15 5 20 Total 80 20 100 Desejamos testar, usando o teste qui-quadrado: H0: os seis resultados possíveis têm probabilidades iguais versus H0: os seis resultados possíveis não têm probabilidades iguais. 16. O valor observado da estatística qui-quadrado é, aproximadamente: A) 1,16 B) 2,34 C) 3,44 D) 4,66 E) 5,58 17. O número de graus de liberdade é: A) 2 B) 3 C) 4 D) 6 E) 99 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 41 18. Nos níveis de 1%, 5% e 10%, a decisão sobre H0 é: α = 1% α = 5% α = 10% (A) não rejeitar não rejeitar não rejeitar (B) não rejeitar não rejeitar rejeitar (C) não rejeitar rejeitar rejeitar (D) rejeitar rejeitar não rejeitar (E) rejeitar rejeitar rejeitar 20.8 Gabarito 1 – D 2 – E 3 - C 4 - E 5 – A 6 – E 7 - B 8 - C 9 - A 10 – D 11 - A 12 – D 13 – A 14 – D 15 – B 16 – B 17 – A 18 - A 20.9 Resolução dos Exercícios de Fixação 1. (ICMS-RJ/2009/FGV) Uma empresa afirma que os pacotes de bala que ela produz pesam em média 25g. Para testar essa hipótese, foram selecionados ao acaso 16 pacotes produzidos pela empresa, registrados seus pesos X1, X2, ... , X16 e calculadas as estatísticas ∑ = = 16 1 320 i iX e ∑ = = 16 1 2 7360 i iX . O valor da estatística t (a ser comparado com o ponto desejado da distribuição t de Student) para o teste é: A) -0,8 B) -1,2 C) -2,0 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 42 D) -2,5 E) -3,2 Resolução É muito freqüente, na prática, o caso em que desejamos testar hipóteses referentes à média de uma população cujo desvio padrão é desconhecido. Se tivermos à disposição uma amostra aleatória de n elementos provenientes dessa população, com base na qual iremos realizar o teste, deveremos então usar essa mesma amostra para estimar o desvio padrão σ da população. Neste caso, a variável aleatória de teste terá distribuição t de Student com n-1 graus de liberdade: ns x tn / 1 µ− =− . O valor da estatística t é determinado pelos valores de x (média amostral) e s (desvio padrão amostral). x = X i i=1 16 ∑ n = 320 16 = 20 2 2 1 s n n m −= s2 = n n −1 m2 = n n −1 X i 2 i=1 n ∑ n − X i i=1 16 ∑ n 2 = n n −1 X i 2 i=1 n ∑ n − x 2 6420 16 7360 15 16 22 = −=s ⇒ 8=s . Logo, 5,2 16/8 2520 1 −= − =−nt . Solução alternativa (aproximada): Suponha que você tenha esquecido a fórmula 2 2 1 s n n m −= . Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 43 Para n “grande”, tem-se que 1 1 ≈ − n n e é válida a seguinte aproximação para a variância amostral: 60400 16 736021 2 2 =−=−≈ ∑ = x n X s n i i . Logo, 5,2 2 5 4 5 16/60 5 16/60 2520 1 −= − ≈ − ≈ − ≈ − ≈−nt (eu também usei a aproximação 15/6016/60 ≈ ) GABARITO: D 2. (Analista/SUSEP/2006/ESAF) Em uma distribuição de sinistro S, formulando-se a hipótese de que não há diferença entre a freqüência esperada e a observada (hipótese nula: H0). Donde, segundo um determinado nível de significância, podemos afirmar que ocorreu A) um erro do tipo I, se for aceita a hipótese H0. B) um erro do tipo II, se for rejeitada a hipótese H0. C) um erro do tipo I, se for aceita a hipótese H0, sendo esta correta. D) um erro do tipo II,se for rejeitada a hipótese H0, sendo esta correta. E) um erro do tipo I, se for rejeitada a hipótese H0, sendo esta correta. Resolução O enunciado parece estar “truncado” e o problema reside no tempo verbal do verbo formular. Não obstante, a questão é fácil e tem solução. Vimos que comete-se um erro tipo I quando rejeita-se a hipótese nula H0, sendo H0 verdadeira. Comete-se um erro tipo II quando aceita-se a hipótese nula H0, sendo H0 falsa. Análise das alternativas: (A) Ocorreu um erro do tipo I, se for rejeitada a hipótese nula H0, sendo H0 verdadeira ⇒ ERRADO. (B) Ocorreu um erro do tipo II, se for aceita a hipótese nula H0, sendo H0 falsa ⇒ ERRADO. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 44 (C) Ocorreu um erro do tipo I, se for rejeitada a hipótese nula H0, sendo H0 verdadeira ⇒ ERRADO. (D) Ocorreu um erro tipo II, se for aceita a hipótese nula H0, sendo H0 falsa ⇒ ERRADO. (E) Ocorreu um erro do tipo I, se for rejeitada a hipótese H0, sendo esta correta ⇒ CERTO. GABARITO: E 3. (ICMS-RJ/2007/FGV/Adaptada) Para a realização de um teste de hipóteses H0: µ = µ0, contra H1: µ > µ0, definimos ERRO DO TIPO I: A) P(µ > µ0 | µ = µ0) B) P(µ = µ0 | µ > µ0) C) Rejeitar H0 sendo H0 verdadeira. D) 1 – P(µ > µ0 | µ = µ0) E) Aceitar H0, sendo H0 falsa Resolução Em um teste de hipóteses, podem ocorrer dois tipos de erro: • Erro tipo I: rejeitar H0, sendo H0 verdadeira; • Erro tipo II: aceitar H0, sendo H0 falsa. A faixa de valores da variável de teste que leva à rejeição de H0 é denominada Região Crítica (RC) do teste. Neste exercício, a RC é x 1 < x < ∞, pois as hipóteses são: H0: µ = µ0, contra H1: µ > µ0 (unilateral à direita). Como o nível de significância não foi especificado pelo enunciado, não temos como determinar o limite inferior x 1 da RC do teste. Não obstante, fixada a RC, a probabilidade α do erro tipo I é dada pela probabilidade P(x > x 1). GABARITO: C 4. (ICMS-SP/2009/FCC) O gerente de uma indústria de determinado componente eletrônico garante que a vida média do produto fabricado é igual a 100 horas. Um comprador dessa indústria decide testar a afirmação do gerente e faz um teste estatístico formulando as hipóteses H0: µ = 100 e H1: µ < 100, sendo que H0 é a hipótese nula, H1 é a hipótese alternativa e µ é a média da população considerada de tamanho infinito com uma distribuição normal. O desvio padrão populacional é igual a 10 horas e utilizou-se a informação da distribuição normal padrão (Z), segundo a qual P(Z ≥ 1,64) = 5%. H0 foi rejeitada com base em uma amostra aleatória de 64 componentes em um nível de significância de 5%. Então, o valor da média amostral foi, em horas, no máximo, Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 45 A) 94,75 B) 95,00 C) 96,00 D) 96,50 E) 97,95 Resolução A Região Crítica (RC) do teste é −∞ < x < x 1, pois as hipóteses são: H0: µ = 100, contra H1: µ < 100 (unilateral à esquerda). A questão pede que o candidato(a) calcule o valor de x 1. Foram dados os valores σ = 10, n = 64 e −z5% = −1,64 . Logo, x 1 − µ σ / n = x 1 −100 10 / 64 = 8(x 1 −100) 10 = −1,64 x 1 −100 = −1,64 /8 ⇒ x 1 = 97,95. GABARITO: E 5. (AFPS/Área ATP/2002/ESAF) Um atributo X tem distribuição normal com média µ e variância σ2. A partir de uma amostra aleatória de tamanho 16 da população definida por X, deseja-se testar a hipótese H0: µ = 22 contra a alternativa Ha: µ ≠ 22. Para esse fim calcula-se a média amostral 30=x e a variância amostral S2 = 100. Assinale a opção que corresponde à probabilidade de significância (p-valor) do teste A) 2P{T>3,2} onde T tem distribuição de Student com 15 graus de liberdade. B) P{|Z|>3,2} onde Z tem distribuição normal padrão. C) P{Z<-2,2} onde Z tem distribuição normal padrão. D) P{T<-3,2} onde T tem distribuição de Student com 15 graus de liberdade E) P{|T|>2,2} onde T tem distribuição de Student com 15 graus de liberdade Resolução Esta questão aborda o teste de hipóteses para a média populacional de uma amostra pequena (n < 30) quando a variância populacional é desconhecida. Neste caso, a variável aleatória de teste terá distribuição t de Student com n-1 = 15 graus de liberdade e será dada por: ns x tn / 1 µ− =− ⇒ 2,3 4/10 8 16/10 2230 15 == − =t Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 46 O p-valor (ou probabilidade de significância) é a probabilidade de a estatística t15 do teste cair na RC, supondo H0 como a hipótese verdadeira. A figura a seguir mostra a RC (ou região de rejeição) e a Região de Aceitação (RA) da hipótese nula (H0). Observe que o teste realizado é bilateral (ou bicaudal), pois Ha: µ ≠ 22. Como o teste é bilateral, há duas áreas de rejeição: à esquerda de 2,315 −=− t e à direita de 2,315 =t , como ilustrado pela figura acima. t15 RCRC -t15 RA Logo, p-valor = }2,3{}2,3{}{}{ 1515 >+−<=>+−< tPtPttPttP , como a distribuição de Student é simétrica, tem-se que }2,3{}2,3{ >=−< tPtP e isto implica p-valor = }2,3{2 >tP , em que t possui 15 graus de liberdade. GABARITO: A 6. (Fiscal de Rendas MS/2006/FGV) Em um teste de hipóteses, a hipótese nula foi rejeitada ao nível de 3%. Portanto, a hipótese nula: A) será aceita no nível de 1%. B) será aceita no nível de 5%. C) pode ser aceita ou rejeitada no nível de 5%. D) será rejeitada no nível de 1%. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 47 E) será rejeitada no nível de 5%. Resolução O enunciado não diz se o teste é unilateral (à esquerda ou à direita) ou bilateral. Logo, podemos analisar as alternativas a partir de um caso particular, como, por exemplo, o do teste (unilateral à esquerda) da média da figura abaixo. x 3% 5% 1% -z -z-z Análise das alternativas: A) Não se pode garantir que a hipótese nula será aceita no nível de 1%. Tome, por exemplo, o valor experimental –z0,5% < –z1%, que cai na RC do teste no nível de 1%. Portanto, esta alternativa é FALSA. B) Pelo contrário, a hipótese nula será rejeitada no nível de 5%, pois –z3% < – z5% (dentro da RC do teste no nível de 5%) ⇒ FALSA. C) Negativo! A hipótese nula será rejeitada no nível de 5%, pois –z3% < –z5% ⇒ FALSA. D) Nem sempre isto será verdade. Por exemplo, a hipótese nula será aceita no nível de 1% para um valor experimental –z2% ⇒ FALSA. E) Isto sempre acontecerá, pois –z3% < –z5% ⇒ VERDADEIRA. GABARITO: E 7. (Fiscal de Rendas MS/2006/FGV) Um teste de hipótese apresentou p- valor igual a 0,03. Portanto, nos níveis de significância de 1% e 5%, respectivamente, a hipótese nula: Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 48 A) deve ser aceita e aceita. B) deve ser aceita e rejeitada. C) deve ser rejeitada e aceita. D) deve ser rejeitada e rejeitada. E) pode ou não ser rejeitada, dependendo de a hipótese ser simples ou não. Resolução Dados: p-valor = 3%, 1α = 1% e 2α = 5%. Regra: ⇒⇒⇒⇒ Se p-valor ≤ α , rejeitar H0 em favor de H1. ⇒⇒⇒⇒ Se p-valor > α , não rejeitar H0 em favor de H1.
Compartilhar