Baixe o app para aproveitar ainda mais
Prévia do material em texto
Escola Superior de Tecnologia de Viseu Tratamento Estatístico de Dados – 2008/2009 Ficha Testes Não Paramétricos 1. Uma máquina de lavar roupa é vendida em 5 cores: Verde (A1), Castanho (A2), Encarnado (A3), Azul (A4) e Branco (A5) Num estudo de mercado para apreciar a popularidade das várias cores analisou-se uma amostra aleatória de 300 vendas recentes com o seguinte resultado: Cor A1 A2 A3 A4 A5 Total Frequências observadas 88 65 52 40 55 300 Será de admitir que os consumidores não manifestam preferência por qualquer uma das cores? (Use α=0.05) 2. Da produção de uma fábrica, seleccionaram-se 20 peças aleatoriamente e registou-se o comprimento de cada uma delas: 10.928 10.274 14.91 9.354 9.864 11.812 8.974 8.95 11.19 11.762 9.036 13.356 9.886 7.542 9.028 6.426 9.478 12.474 12.092 8.984 Serão os dados compatíveis com a hipótese de que se trata de uma amostra de uma população com distribuição N(10,22)? (Use α=0.1) i) Utilize o teste de ajustamento do Qui-quadrado; ii) Utilize o teste Kolmogorov-Smirnov. 3. Numa Baía da Florida efectuaram-se 48 medições dos níveis de salinidade. Os valores obtidos aleatoriamente foram os seguintes: 46 53 58 60 60 49 59 48 46 78 37 58 46 46 47 48 42 50 63 48 62 49 47 36 40 39 61 43 53 42 59 60 52 34 40 36 67 44 40 40 56 51 51 35 47 53 49 50 Pesquise a hipótese dos valores da salinidade nessa Baía serem normalmente distribuídos, recorrendo aos seguintes testes: a) Teste de ajustamento do Qui-quadrado; (Use α=0.1) b) Teste de normalidade de Lilliefors. (Use α=0.01) 2 4. Nas corridas de cavalos é ponto de vista comum entre os apostadores que, numa pista circular, as chances são mais favoráveis a cavalos em determinadas posições (postos). O posto de um cavalo é a posição que lhe é atribuída na linha de partida. O posto 1 é o mais próximo do lado interno da pista e o posto 8 o mais afastado (numa corrida com 8 cavalos).Registaram- se as vitórias em 144 corridas escolhidas aleatoriamente, tendo-se obtido os seguintes resultados: Posto 1 2 3 4 5 6 7 8 Total N.º de vitórias 29 19 18 25 17 10 15 11 144 Usando um teste de hipótese apropriado diga se será de aceitar o ponto de vista dos apostadores? (Use α=0.01) 5. Realize um teste de ajustamento para verificar se a distribuição das alturas de 100 estudantes do sexo feminino, segue distribuição normal.(Use α=0.05) Alturas 150-162 162-168 168-174 174-186 N.º de estudantes 16 22 40 22 6. Num determinado teste de inteligência, supõe-se que a pontuação obtida segue uma distribuição normal com média µ=100 e variância σ2=225. Para uma amostra aleatória de 1000 pessoas que fizeram o teste, foram obtidas as seguintes pontuações: Pontuações [0,50[ [50,70[ [70,85[ [85,100[ [100,115[ [115,130[ [130,150[ [150,+∞[ N.º de pessoas 6 28 114 360 344 120 20 8 Com base nestes dados teste a distribuição proposta ao nível se significância de 0.05. 7. Uma máquina embala pacotes de esparguete e foi recentemente calibrada de forma a que o peso de um pacote de esparguete fosse normalmente distribuído com média 500 gr e desvio padrão 5.1 gr. Recolheu-se uma amostra aleatória de 10 pacotes de esparguete embalados pela máquina e obtiveram-se os seguintes resultados: 507 490 497 510 501.5 499 502.5 507 510 510.5 a) Determine a função de distribuição empírica e represente-a graficamente. b) Perante a amostra obtida será possível afirmar que as normas estão a ser respeitadas? (Use α=0.01) 3 c) Para outra máquina usada para o mesmo efeito foi recolhida uma amostra aleatória de 9 pacotes de esparguete, a qual revelou os seguintes resultados: 492 495 497 497 500 502.5 508 509 509 Será de admitir que as duas máquinas estão a funcionar de modo idêntico? (Use α=0.05) 8. Suponha que a seguinte amostra aleatória foi retirada de uma população com função de distribuição F desconhecida: -5.641 4.297 -4.861 -7.78 7.58 12.232 10.78 -0.201 -10.813 -5.593 a) Teste a nível de significância de 0.05 a hipótese de F ser normal com alguma média e alguma variância. b) Considere a seguinte amostra recolhida de forma aleatória de outra população com distribuição F' desconhecida -9.44 -6.64 -0.93 3.28 6.49 10.71 Teste a hipótese de as duas populações de onde foram retiradas as amostras anteriores terem iguais distribuições. (α=0.01) 9. Para o nível de significância de 0.05 verifique se a hipótese da distribuição Normal da v.a. X é concordante com a distribuição empírica da amostra: xi 5 7 9 11 13 15 17 19 21 ni 15 26 25 30 26 21 24 20 13 10. Registaram-se as alturas de 80 árvores da mesma categoria, escolhidas aleatoriamente, obtendo-se os seguintes resultados: Altura (em mts) 20 22 23 26 29 30 31 33 34 N.º de árvores 2 3 9 12 27 16 7 2 2 a) Construa a função de distribuição empírica da amostra estandardizada. b) Ao nível de significância de α=0.01 indique se será possível afirmar que as árvores provêm de uma população normalmente distribuída. c) Seleccionaram-se aleatoriamente 70 árvores da mesma categoria noutra região do país. As alturas destas árvores estão registadas seguidamente. Pode-se admitir que a distribuição da altura das árvores desta categoria é igual nas duas regiões? (Use α=0.01) 4 Altrura 23 24 26 28 30 31 32 33 34 36 38 Nº de árvores 1 2 3 6 15 20 13 4 3 2 1 11. Num estudo comparativo da eficiência de empresas agrícolas, considerou-se uma amostra de 69 explorações que foram classificadas segundo dois atributos: A={explorações de cabeça, explorações intermédias, explorações de cauda} B={explorações vitícolas, explorações frutícolas} Os dados estão apresentados na seguinte tabela: Vitícolas Frutícolas Cabeça 6 8 Intermédia 10 9 Cauda 14 22 a) Será de admitir que o atributo A está relacionado com o atributo B? (Use α=0.01) b) Use as medidas que conhece para medir a intensidade da associação entre os dois atributos e relacione os valores obtidos com a resposta dada na alínea anterior. 12. O quadro apresenta uma tabela 3×3 construída a partir dos 86441 casamentos realizados em 1977 no continente português, considerando a classificação dos cônjuges, de ambos os sexos, segundo o estados civil anterior ao casamento. Homens Mulheres Solteiros Viúvos Divorciados Solteiras 77670 1573 3115 Viúvas 545 796 350 Divorciadas 1343 416 633 a) Na nível de significância de 0.05 será de admitir que havia naquele período uma intensa associação entre o estado civil dos cônjuges no que se refere aos casamentos realizados no continente português. b) Use os coeficientes de contingência, Tschuprow e Cramér para medir a intensidade de associação entre os dois atributos. 13. Com o objectivo de verificar se o tipo de revestimento florestal tem influência sobre a severidade da erosão em certa região, fizeram-se observações em 350 pontos, com os resultados que se condensam na tabela seguinte. 5 Revestimento Florestal Erosão Vegetação Herbácea Vegetação Arbustiva Floresta Severa 30 10 10 Moderada 50 30 20 Fraca 50 60 40 Desprezável 10 20 20 a) Parece-lhe que os dados obtidos permitem extrair alguma conclusão relativamente ao objectivo acima indicado? (Use α=0.01) b) Use as medidas que conhece para medir a intensidade de associação entre o tipo de erosão e o revestimento florestal. 14. Registam-se os dados do rendimento de 400 famílias do Norte e Sul de um país. Rendimento Região 0-5 5-10 10-15 >15 Norte 28 42 30 24 Sul 44 78 78 76 a) Será que o rendimento familiar depende da região do país? (Use α=0.025) b) Use os coeficientes de contingência, Tschuprow e Cramér para medir a intensidade de associação entre rendimento familiar e a região do país. 15. A tabela a seguir exibe os resultados obtidos por estudantes de Estatística e Cálculo. Estatística Cálculo 0≤notas<5 5≤notas<7 7≤notas≤10 0≤notas<5 75 35 13 5≤notas<7 29 120 32 7≤notas≤10 15 70 46a) Teste a hipótese de que os resultados em estatística são independentes dos resultados em cálculo, ao nível de significância de 2.5%. b) Utilize as medidas que conhece para medir a intensidade de associação entre os dois atributos. 16. Sobre uma população U sabe-se que a distribuição por grupos sanguíneos é a seguinte: A – 41% B – 9% AB – 4% O – 46% Numa amostra aleatória de 200 indivíduos sofrendo de cancro de estômago encontraram-se os seguintes dados: 6 A – 80 indivíduos B – 20 indivíduos AB – 9 indivíduos O – 91 indivíduos É de admitir que a distribuição por grupos sanguíneos é diferente na subpopulação sofrendo de cancro do estômago?(α=0.01) 17. Considere a seguinte amostra aleatória de 8 observações: X 35.1 35.5 35.9 35.9 36.0 36.1 36.1 36.3 a) Construa a função de distribuição empírica. b) Será razoável supor que a população de onde foi retirada esta amostra é normalmente distribuída com média 35.9 e variância 1, em relação à variável observada? Para responder a esta pergunta utilize o teste que lhe pareça mais adequado e justifique a sua escolha. (α=0.05) 18. Para uma amostra aleatória de estudantes de Gestão de uma determinada escola registou- se o ano curricular do aluno e a sua opinião relativamente a uma mudança na estrutura curricular do curso: Opinião Ano curricular Favor Contra 1º ano 120 80 2º ano 70 130 3º ano 60 70 4º ano 40 60 Será de admitir que a opinião emitida está associada ao ano curricular? Justifique convenientemente a sua resposta. 19. Para avaliar o mérito de três métodos de ensino diferentes, cada um de 14 estudantes foi aleatoriamente matriculado em uma de três turmas. Em cada turma utilizou-se um método de ensino diferente. Após algumas aulas, pediu-se a cada estudante que resolvesse o mesmo problema. Os tempos respectivos (em minutos) constam do quadro seguinte. Será possível afirmar que os métodos de ensino produzem resultados diferentes no que diz respeito à rapidez de um aluno para resolver um problema? (Use α=0.05) 7 Método 1 Método 2 Método 3 15 21 11 12 16 19 18 13 17 20 9 22 10 24 20. Está planeado um seminário na área de gestão de empresas para profissionais da industria, das finanças e do comércio. O orador está interessado em saber se o nível de conhecimentos acerca de alguns princípios de gestão é igual nos três grupos de profissionais. Para isso são escolhidos aleatoriamente alguns participantes de cada um dos grupos, aos quais é pedido para responderem por escrito a um conjunto de questões. Se não existirem diferenças entre os três grupos de profissionais nos resultados obtidos no conjunto de questões, o orador fará apenas uma sessão, caso contrário serão feitas sessões separadas para cada um dos grupos de profissionais. Os resultados obtidos estão registados na tabela seguinte. Pontuação total no conjunto de questões Profissionais da indústria Profissionais das finanças Profissionais do comércio 51 14 89 32 31 20 17 68 60 69 87 72 86 20 56 62 28 22 96 77 97 Qual deverá ser a actuação do orador? (Use α=0.05) 21. Pretende-se saber se existem diferenças efectivas na rapidez de resposta de três agências concorrentes no mercado de uma dada região. O quadro seguinte apresenta os dados relativos a três amostras aleatórias e independentes. O que pode concluir ao nível de significância de1%? Tempos de resposta (em horas) Agência A Agência B Agência C 133 151 225 125 149 224 143 162 220 128 145 212 135 153 8 22. Um dado fabricante suspeita que a tensão de rotura está relacionada com a percentagem de algodão na fibra e encomendou um estudo estatístico. Para esse estudo foram considerados quatro níveis de percentagem de algodão: 15%, 20%, 25% e 30%. Para cada um destes níveis foram registados as tensões de rotura de cinco pedaços de fibra escolhidos aleatoriamente. Utilize o teste de Kruskal-Wallis para testar a suspeita do fabricante. (α=0.01) % de algodão Observações 15% 7 7 15 11 9 20% 12 17 12 18 18 25% 14 18 18 19 19 30% 19 25 22 19 23 23. A cada uma de 18 pessoas com excesso de peso atribuiu-se aleatoriamente um de três planos de dieta. As perdas de peso (em Kg) foram as seguintes Dietas Perdas de peso 1 2.7 3.2 4.1 4.5 3.7 3.8 2 3.6 3.2 2.7 3.6 4.1 2.6 3 4.5 3.6 3.2 4.1 3.2 3.9 As dietas podem considerar-se equivalentes? (Use α=0.025) 24. Uma pesquisa feita junto de 320 famílias, cada uma com cinco filhos, levou à distribuição abaixo representada. N.º de meninos 5 4 3 2 1 0 N.º de famílias 18 56 110 88 40 8 Seja X= “Nº de filhos do sexo masculino, em 5 filhos”. Verifique se X ~ B(5;0.5), ao nível de significância de 0.05. 25. Determinado laboratório produz 10 frascos por dia. A probabilidade de determinado frasco ser contaminado é de 0.05. Verifique se o número de frascos contaminados segue uma distribuição binomial. (Use α=0.01). Retirou-se uma amostra de 100 dias e obteve-se: N.º de frascos contaminados 0 1 2 3 4 5 ou + N.º de dias 54 28 6 4 5 3 9 Soluções da ficha de trabalho 1. Teste de ajustamento do Qui-quadrado: Qobs=21.63>9.49, logo rejeita-se H0. 2. i) (resultado para 3 classes) Qobs=0.699<4.61, logo não se rejeita H0. ii) d20=0.1981<0.265, logo não se rejeita H0. 3. a) (resultado para 4 classes) Qobs=1.833<2.71, logo não se rejeita H0. b) *48d =0.0864<0.1488, logo não se rejeita H0. 4. Teste de ajustamento do Qui-quadrado: Qobs=16.333<18.5, logo não se rejeita H0. 5. Teste de ajustamento do Qui-quadrado: Qobs=5.3>3.84, logo rejeita-se H0. 6. Teste de ajustamento do Qui-quadrado: Qobs=13.117>11.1, logo rejeita-se H0. 7. b) Teste de Kolmogorov-Smirnov para uma amostra: d10=0.4147<0.489, logo não se rejeita H0. c) Teste de Kolmogorov-Smirnov para duas amostras: d'=0.3<0.58, logo não se rejeita H0. 8. a) Teste de Lilliefors: *10d =0.224<0.258, logo não se rejeita H0. b) Teste de Kolmogorov-Smirnov para duas amostras: d'=0.2<0.733, logo não se rejeita H0. 9. Teste de Lilliefors: *200d =0.1168>0.0626, logo rejeita-se H0. 10. b) Teste de Lilliefors: *80d =0.3005>0.1153, logo rejeita-se H0. c) Teste de Kolmogorov-Smirnov para duas amostras: d'=0.4911>0.26677, logo rejeita-se H0. 11. a) Teste do Qui-quadrado da independência: 2obsχ =0.9585<9.21, logo não se rejeita H0. b) C=0.117; T=0.099; V=0.118 12. a) Teste do Qui-quadrado da independência: 2obsχ =16509.8>9.49, logo rejeita-se H0. b) C=0.4; T=0.309; V=0.309 13. a) Teste do Qui-quadrado da independência: 2obsχ =25.504>16.8, logo rejeita-se H0. b) C=0.261; T=0.172; V=0.191 14. a) Teste do Qui-quadrado da independência: 2obsχ =5.81<9.35, logo não se rejeita H0. b) C=0.1197; T=0.092; V=0.121 15. a) Teste do Qui-quadrado da independência: 2obsχ =111.64>11.1, logo rejeita-se H0. b) C=0.452; T=0.358; V=0.358 16. Teste de ajustamento do Qui-quadrado: Qobs=0.4<11.3, logo não se rejeita H0. 10 17. Teste de Kolmogorov-Smirnov para uma amostra: d8=0.3446<0.454, logo não se rejeita H0. 18. Teste do Qui-quadrado da independência: 2obsχ =26.97>7.81, logo rejeita-se H0. 19. Teste de Kruskal-Wallis: Hobs=1.96<5.6429, logo não se rejeita H0. 20. Teste de Kruskal-Wallis: Hobs=0.3<5.99, logo não se rejeita H0. 21. Teste de Kruskal-Wallis: Hobs=11.57>7.79, logo rejeita-se H0. 22. Teste de Kruskal-Wallis: H'obs=34.99>11.3, logo rejeita-se H0. 23. Teste de Kruskal-Wallis: H'obs=2.027<7.38, logo não se rejeita H0.
Compartilhar