Prévia do material em texto
Lista de Exercícios VI – Análise Estatística Teste de Hipótese Prof. Frank Magalhães Sugestão de leitura: Capítulos 8 e 9 do livro Noções de Probabilidade e Estatística do Marcos Nascimento Magalhães. Questão 01: Elabore um quadro esquemático contendo as estatísticas de teste Normal, t-Student, Qui-quadrado e F para Testes de Hipótese de média, proporção e variância, considerando uma e duas populações. Questão 02 (Ex. 10 seção 8.6 – Magalhães): Considere o teste 𝑝 = 0,6 contra 𝑝 ≠ 0,6. Sendo 𝑛 = 100, indique a propabilidade de erro tipo I para as seguintes regiões críticas: a. 𝑅𝐶 = {𝑥 ∈ ℝ|𝑥 < 0,56 𝑜𝑢 𝑥 > 0,64}. b. 𝑅𝐶 = {𝑥 ∈ ℝ|𝑥 < 0,54 𝑜𝑢 𝑥 > 0,66}. Questão 03 (Ex. 1 seção 9.2 – Magalhães): Para se avaliar o nível de tensão ocasionada por exames escolares, doze alunos foram escolhidos e sua pulsação medida antes e depois do exame. (Resposta no livro) Instante da medição Estudantes 1 2 3 4 5 6 7 8 9 10 11 12 Antes 87 78 85 93 76 80 82 77 91 74 76 79 Depois 83 84 79 88 75 81 74 71 78 73 76 71 Faça um teste, com nível de significância de 1%, para verificar se existe maior tensão (isto é, maior pulsação) antes da realização dos exames. Indique as suposições necessárias. Questão 04 (Ex. 2 seção 9.2 – Magalhães): Sabe-se que o tempo necessário para percorrer uma determinada rota no final da tarde pode ser estudado por um modelo Normal com desvio padrão de 17 minutos. Foram instalados sensores para controlar o tempo de abertura dos semáfaros presentes na rota e deseja-se verificar se o tempo gasto para completar o percurso diminuiu. Estudos anteriores indicam que o tempo deve continuar se comportando segundo um modelo Normal, com mesmo desvio padrão. Com os sensores desativados, 11 veículos de mesmo ano e marca, denominado Grupo Controle, tiveram o tempo gasto no percurso anotado. Em seguida, os sensores foram ativados e outros 13 veículos (Grupo Teste) percorreram a mesma rota. Os tempos observados, em minutos, foram os seguintes. Grupo Tempos utilizados no percurso Controle 38 26 20 70 16 26 38 32 45 49 32 Teste 17 31 28 21 50 21 20 51 10 22 18 35 29 Indique se o uso dos sensores contribui para diminuir o tempo médio de percurso utilizando o nível descritivo do teste (𝑝 − 𝑣𝑎𝑙𝑜𝑟) Questão 05 (Ex. 3 seção 9.2 – Magalhães): Para verificar se duas populações têm a mesma média, amostras independentes foram retiradas. Sabendo que a população I é 𝑁𝑜𝑟𝑚𝑎𝑙(𝜇1, 25) e a população II 𝑁𝑜𝑟𝑚𝑎𝑙(𝜇1, 40), que conclusão pode ser tirada, ao nível de 2%? Os valores obtidos foram: (Resposta no livro) População Dados I 12 14 15 14 13 17 14 13 II 13 17 14 13 16 17 18 16 Questão 06 (Ex. 4 seção 9.2 – Magalhães): As variáveis 𝑋 e 𝑌 seguem a distribuição Normal com mesma variância. Deseja-se testar se, também, têm a mesma média. Doze observações de cada variável foram escolhidas e os resultados foram os seguintes: ∑ 𝑥𝑖 12 𝑖=1 = 48, ∑ 𝑦𝑖 12 𝑖=1 = 56, ∑ 𝑥𝑖 2 12 𝑖=1 = 4900, ∑ 𝑦𝑖 2 12 𝑖=1 = 5650. Qual é a conclusão ao nível de significância de 5%? Questão 07 (Ex. 5 seção 9.2 – Magalhães): Para comparar as médias de duas populações Normais, amostras aleatórias foram obtidas. Sabe-se que as variâncias populacionais são diferentes, sendo seus valores desconhecidos. (Resposta no livro) Amostra I 7 9 3 8 11 5 9 Amostra II 2 7 5 15 9 16 8 O que pode ser dito a respeito das médias das populações, com 𝛼 = 0,05? Questão 08 (Ex. 1 seção 9.3 – Magalhães): Supondo que 𝐹~(𝑎, 𝑏), encontre 𝑥𝑐 tal que: (Respostas no livro) a. 𝑃(𝑋 ≥ 𝑥𝑐) = 0,05 com 𝑎 = 18 e 𝑏 = 3. b. 𝑃(𝑋 > 𝑥𝑐) = 0,05 com 𝑎 = 3 e 𝑏 = 18. c. 𝑃(𝑋 > 𝑥𝑐) = 0,05 com 𝑎 = 180 e 𝑏 = 192. d. 𝑃(𝑋 ≥ 𝑥𝑐) = 0,95 com 𝑎 = 5 e 𝑏 = 12. e. 𝑃(𝑋 ≥ 𝑥𝑐) = 0,95 com 𝑎 = 30 e 𝑏 = 40. Questão 09 (Ex. 2 seção 9.3 – Magalhães): Uma linha de montagem produz peças cujos pesos, em gramas, obedecem ao modelo Normal com variância 30 𝑔2. Os equipamentos foram modernizados e, para verificar se o processo continua sob controle, foi tomada uma amostra de 23 peças, que forneceu 𝑠𝑜𝑏𝑠 2 = 40 𝑔2. Existem evidências indicando que a variância mudou, considerando 𝛼 = 10%? Questão 10 (Ex. 3 seção 9.3 – Magalhães): Uma panificadora produz determinado tipo de pão, cujo peso médio é de 190 gramas, com desvio padrão de 18 gramas. Devido a mudanças na política cambial, que ocasionou aumento no preço do trigo, alguns ingredientes da receita foram substituídos. Uma equipe do governo resolveu verificar se a variabilidade no peso do produto aumentou e escolheu, aleatoriamente, 16 unidades, medindo o peso de cada uma. O peso médio obtido da amostra foi de 102 gramas e o desvio padrão foi de 24,5 gramas. Qual a conclusão para 𝛼 = 10%? (Respostas no livro) Questão 11 (Ex. 4 seção 9.3 – Magalhães): Para comprar o grau de diversidade de duas populações primitivas, uma medida antropométrica foi obtida em fósseis coletados em sítios arqueológicos, fornecendo a tabela a seguir. Característica Sítio A (n=17) Sítio B (n=23) Média (cm) 15,12 12,21 Variância (cm2) 0,124 0,184 O que pode ser concluído a respeito das variâncias? E das médias populacionais? Questões da ANPEC Nas questões NÃO NUMÉRICAS verifique, de acordo com a instrução de cada uma delas, se os itens são VERDADEIROS ou FALSOS. Questão 01 (2011 – Q.01): Considere as seguintes afirmativas acerca de um teste de hipótese: Ⓞ O erro tipo I é definido como a probabilidade de não rejeitar a hipótese nula quando a hipótese nula é falsa. ① O poder do teste é definido como a probabilidade de não rejeitar a hipótese nula quando a hipótese nula é verdadeira. ② O erro tipo II é definido como a probabilidade de não rejeitar a hipótese nula quando a hipótese alternativa é verdadeira. ③ O p-valor de um teste é a probabilidade, sob a hipótese nula, de obter um valor da estatística pelo menos tão extremo quanto o valor observado. ④ Se um intervalo de confiança de 95% para a média amostral, calculado a partir de uma amostra aleatória, excluir o valor 0, pode-se rejeitar a hipótese de que a média populacional seja igual a 0 ao nível de significância de 5%. Questão 02 (2006 – Q.04): Com relação a testes de hipóteses, julgue as afirmativas: Ⓞ Em um teste de hipóteses, comete-se um erro do tipo I quando se rejeita uma hipótese nula verdadeira. ① O poder de um teste de hipóteses é medido pela probabilidade de se cometer o erro tipo II. ② A soma das probabilidades dos erros tipo I e tipo II é igual a 1. ③ Quanto maior for o nível de significância de um teste de hipóteses maior será o valor-p a ele associado. ④ Se o valor-p de um teste de hipóteses for igual 0,015, a hipótese nula será rejeitada a 5%, mas não a 1%. Questão 03 (2005 – Q.06): Seja nXXXX ........,,,, 321 uma amostra aleatória de tamanho n de uma população normal com média e variância 2 . Julgue as afirmativas: Ⓞ A probabilidade de a média populacional, , estar contida no intervalo de confiança ]96,1,96,1[ n X n X é igual a 95%. ① Se a variância 2 é desconhecida, o intervalo de confiança de 95% para a média será ],[ n s tX n s tX cc , em que s é o desvio padrão da amostra, ct é calculado de forma que 95,0)|(| cttP , e t segue uma distribuição de Student com n -1 graus de liberdade. ② Se construirmos vários intervalos de confiança para a média com amostras de idêntico tamanho, mesma variância 2 e mesma margem de confiança, estes terão extremos aleatórios, mas todos terão a mesma amplitude. ③ Num teste de hipótese: 00 : H contra 0: aH , se o intervalo de confiança estimado para a média não contiver o valor de 0 , então deve-se aceitar a hipótese de que 0 . ④ Se a amostra aleatória nXXXX ........,,,, 321 não provém de uma distribuição normal, não se pode construir um intervalo de confiança para a média , ainda que a amostraseja muito grande. Questão 04 (2004 – Q.06): Seja X uma variável aleatória normalmente distribuída com média e variância conhecida 2 =1, da qual se obtém a amostra aleatória X1, X2, ..., Xn (com n observações). É correto afirmar que: Ⓞ A média amostral é uma variável aleatória normalmente distribuída com média e variância 1/n. ① A probabilidade de o intervalo de confiança ]/96,1,/96,1[ nXnX conter a média da população, , é de 95%. ② A probabilidade de o intervalo de confiança ]/96,1,/96,1[ nXnX conter a média amostral é de 95%. ③ O intervalo de 95% para a média populacional independe do tamanho da amostra. ④ Em um intervalo de confiança de 95% para a média populacional, μ, espera-se que, extraindo-se todas as amostras de mesmo tamanho dessa população, esse intervalo conterá μ 95% das vezes. Questão 05 (2002 – Q.05): Indique se as seguintes considerações sobre a teoria dos testes de hipótese são verdadeiras (V) ou falsas (F). Ⓞ O erro do tipo II é definido como a probabilidade de não se rejeitar uma hipótese nula quando esta for falsa e o erro do tipo I é definido como a probabilidade de se rejeitar a hipótese nula quando esta for verdadeira. ① No teste de hipótese para proporções, se a variância da proporção populacional for desconhecida, a estatística t de Student com n-1 graus de liberdade (n é o tamanho da amostra) é a indicada para o teste. ② Num teste de hipótese bi-caudal, o valor-p (ou valor de probabilidade) é igual a duas vezes a probabilidade da região extrema delimitada pelo valor calculado da estatística do teste. ③ Não se pode realizar um teste de hipótese para a variância populacional pois a estatística do teste, que segue uma distribuição Qui-quadrado com n -1 graus de liberdade (n é tamanho da amostra), não é simétrica. ④ No teste de hipótese para a média (H0: = 0 contra Ha: 0), ao nível de significância , se o intervalo de confiança com 1- de probabilidade não contiver = 0, não se poderá rejeitar H0. Questão 06 (1998 – Q.09): Uma máquina está sendo examinada com o objetivo de substituir a máquina antiga de certa indústria. Segundo o fabricante da nova máquina, a proporção (P) de peças defeituosas produzida é de 3% ou menos. Uma amostra de 2.000 peças foi examinada e foram encontradas 74 peças defeituosas. Ⓞ As hipóteses para um teste estatístico de hipóteses devem ser H0: P = 0,03 e HA: P < 0,03. ① Ao realizarmos o teste de hipóteses para o problema, ao nível de significância de 5%, a hipótese nula deve ser rejeitada. ② Utilizando a proporção de peças defeituosas encontradas na amostra, a estimativa por intervalo para a verdadeira proporção de peças defeituosas produzida pela nova máquina, utilizando uma confiança de 95%, é ( 2,87%; 4,53%). ③ Admitindo que a verdadeira proporção de peças defeituosas seja 3%, seria necessário uma amostra de 3.000 peças para que o erro máximo admissível entre a proporção estimada e a verdadeira não excedesse a 1%, com probabilidade de 95%. ④ Se as probabilidade de que um intervalo de confiança contenha o verdadeiro parâmetro populacional é igual a (1 - ), isto significa que se retirássemos um número infinito de amostras da população em estudo e se para cada uma das amostras calculássemos o intervalo de confiança do parâmetro , então em (1 - )% destes intervalos conteriam o verdadeiro parâmetro . Questão 07 (1997 – Q.11): A vida útil de um tubo de televisão tem distribuição Normal com desvio padrão (conhecido) de 500 horas. O fabricante afirma que a vida útil média dos tubos é de, no mínimo, 9.000 horas. Sabendo-se que a vida útil média encontrada para uma amostra aleatória de 16 tubos foi de 8.800 horas, podemos afirmar que: Ⓞ Para verificar a veracidade da informação do fabricante através de um teste estatístico de hipóteses, as hipóteses são: Hipótese nula: H0: = 9.000 horas Hipótese alternativa : H1: > 9.000 horas ① Ao nível de significância de 5%, não podemos contestar a afirmação do fabricante. ② Se a informação amostral fosse obtida de uma amostra de 36 tubos, ao nível de significância de 2,5% também não podemos contestar a afirmação do fabricante. ③ O tamanho mínimo da amostra para uma estimativa por intervalo da vida média dos tubos deveria ser de 50 tubos, de modo que o erro da estimativa não excedesse a 100 horas, com uma probabilidade de 95%. ④ Caso desconheçamos o desvio padrão populacional é impossível testar a validade da afirmação do fabricante. Questão 08 (1995 – Q.14): O representante de um grupo comunitário informa a uma pessoa interessada em estabelecer um centro comercial que a renda média familiar na área é de R$ 15.000. Suponha que, para a área em questão, seja possível admitir que a renda média familiar tem distribuição aproximadamente normal, e que se possa aceitar o desvio-padrão como sendo R$ 2.000 (com base em um estudo anterior). Para uma amostra aleatória de 16 famílias, a renda média familiar foi de R$ 15.500. O centro comercial só será construído se o nível médio de renda familiar () for maior que o informado. Ⓞ A hipótese nula deve ser H R0 000: $15. . ① A hipótese alternativa deve ser H R1 000: $15. . ② Não pode ser realizado qualquer teste pois o número de elementos da amostra é pequeno. ③ A estatística que deve ser utilizada para a elaboração do teste é a Z, que tem distribuição N(0,1). ④ Um teste feito ao nível de significância de 5% permite concluir que a condição para a construção do centro será satisfeita. Questão 09 (1991 – Q.07): Com respeito aos testes de hipóteses pode-se afirmar que: Ⓞ O nível de significância de um teste é a probabilidade de cometer erro do tipo I, isto é, a probabilidade de aceitar a hipótese nula, quando ela é falsa. ① O valor 1 - é o poder do teste, onde é a probabilidade do erro do tipo II, isto é, a probabilidade de rejeitar a hipótese nula quando ela é verdadeira. ② Se x xn1,..., é uma amostra aleatória de uma população normal com média e variância conhecida 2, para testar H0 : 0 contra H1 : 0 usa-se a distribuição t de Student. ③ Dada uma população de indivíduos de tamanho n, deseja-se verificar se a população de empregados é de 0,5. Esta verificação pode ser feita através do teste de hipóteses: H0 : p1 2/ contra H1 : p1 2/ usando-se, para tanto, a distribuição normal como aproximação da binomial. ④ Uma empresa afirma que 60% dos seus empregados são ligados à produção. Para verificar esta afirmativa, o sindicato decide usar uma amostra de 200 trabalhadores e observa que 105 deles estão ligados à produção. Ao nível de significância de 5% pode-se afirmar que o número de empregados ligados à produção é inferior a 60%. Questão 10 (1991 – Q.09): Em relação às distribuições de probabilidade pode-se afirmar que: Ⓞ As medidas de localização, média, moda e mediana coincidem na distribuição normal. ① A soma de qui-quadrados independentes tem distribuição qui-quadrado. ② Uma variável aleatória com distribuição F de Snedecor é proporcional ao quociente de qui-quadrados independentes. ③ A distribuição t de Student é caracterizada por um único parâmetro que representa os seus graus de liberdade. ④ A distribuição qui-quadrado é simétrica.