Prévia do material em texto
Material didático – Profa. Adriana Barbosa Santos Análise Exploratória de Dados Exercícios: [1] Estudando-se a distribuição das idades dos funcionários de duas repartições públicas, obtiveram-se algumas medidas que estão no quadro abaixo. Esboce o histograma ali- sado das duas distribuições, indicando nele as medidas descritas no quadro. Comente as principais diferenças. Repartição Mínimo Quartil 1 Mediana Média Quartil 3 Máximo Desvio padrão A 18 27 33 33 39 48 5 B 18 23 32 33 42 48 10 [2] A tabela a seguir dá os pesos (em libras) do plástico descartado por uma amostra de residências, os pesos dos restos de comida e também o número de moradores para cada residência amostrada. Plástico 0,27 1,41 2,19 2,83 2,19 1,81 0,85 3,05 Comida 1,04 3,68 4,43 2,98 6,30 1,46 8,82 9,62 Moradores 2 3 3 6 4 2 1 5 Com base nos dados fornecidos, calcule: a) Quanto em média é descartado de plástico por residência? E de comida? b) Calcule a variância, o desvio padrão, o coeficiente de variação e os quartis para o peso de plástico descartado por residência. Faça um resumo estatístico. c) Quanto em média é descartado de plástico por morador? E de comida? d) Represente graficamente a distribuição dos pesos. [3] Foi feito um estudo para determinar como as pessoas obtêm empregos em duas cidades importantes do estado (A e B). A tabela que segue relaciona dados de 400 pessoas na cidade A e 600 pessoas na cidade B. Os dados exibidos na tabela abaixo se baseiam em resultados de uma pesquisa. Descreva os resultados. Fontes de trabalho dos que respondem à pesquisa A B Anúncios tipo "Procura-se" 56 82 Classificados da Internet 14 25 Rádio e televisão 280 320 Firmas de pesquisa 30 120 Envio de correspondência em massa 20 53 Total 400 600 [4] O Prof. Moore, que reside a poucas quadras de distância da cidade universitária, registra o tempo que ele gasta dirigindo o carro até a faculdade toda manhã. Eis os tempos (em minutos) para 42 dias úteis consecutivos. Analisando os dados coletados, você acha que há dentre os dados algum ponto discrepante que seja óbvio? O Prof. Moore afirma que o tempo médio gasto no percurso é de 9 minutos. Analisando estatísticas descritivas e gráficos, você concorda com essa afirmação? 6,7 7,9 8,4 8,7 9,8 7,7 8,2 8,5 9,0 7,7 8,3 7,4 8,0 8,4 8,7 10,2 7,8 8,2 8,6 9,0 8,1 8,7 7,4 8,1 8,5 8,7 9,0 7,8 8,2 8,6 9,1 8,5 7,9 8,4 8,7 9,2 9,0 7,8 8,3 8,6 7,9 8,8 [5] A seguir são listados dois conjuntos de dados que se supõe serem as alturas (em cm) de homens adultos escolhidos aleatoriamente. Um conjunto consiste de alturas obtidas efetivamente de um conjunto aleatório de homens adultos, mas o outro conjunto consiste em números "fabricados". Examine os dados e identifique o conjunto que lhe parece ser o falso. Justifique seus argumentos estatisticamente. A 175 182,5 175 180 177,5 182,5 177,5 167,5 170 180 167,5 180 177,5 182,5 180 175 180 170 177,5 177,5 177,5 182,5 172,5 182,5 177,5 165 192,5 167,5 Material didático – Profa. Adriana Barbosa Santos B 175 182,5 175 180 177,5 165 185 190 170 187,5 167,5 170 177,5 192,5 165 172,5 180 167,5 192,5 187,5 165 190 190 192,5 182,5 185 172,5 167,5 Material didático – Profa. Adriana Barbosa Santos [5] Foram obtidos junto a linha de produção de uma indústria dados referentes à produção de detergente líquido. Os dados são relativos a variação de peso das amostras analisadas. São dados na Tabela1 alguns resultados estatísticos sobre dois tipos de enchedoras de detergente, uma manual e uma automática. Comparativamente o que poderíamos concluir sobre a eficiência das linhas de enchimento de detergentes, manual e automática, considerando que se pretende identificar se há evidências de um Controle Estatístico do Processo de envase? Tabela 1: Resumo estatístico sobre as variações de peso para as linhas de enchimento de detergentes. Estatísticas descritivas Automática Manual Média -0,9101 0,9528 Mediana 0,44 1,54 Mínimo -4,52 -5,48 Q1 -2,82 -0,58 Q3 1,44 2,43 Máximo 3,24 4,04 Desvio padrão 2,028 2,308 Variância 4,115 5,328 Amplitude 7,76 9,52