Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 UNIVERSIDADE FEDERAL DA BAHIA INSTITUTO DE MATEMÁTICA DEPARTAMENTO DE ESTATÍSTICA MAT020 - ESTATÍSTICA I A SEMESTRE: 2014.2 CURSOS: ADMINISTRAÇÃO / CIÊNCIAS CONTÁBEIS 1ª Lista de Exercícios 1. As fases principais do método estatístico são: i. Coleta dos dados, amostragem, apresentação tabular e apresentação gráfica e definição dos problemas. ii. Amostragem, apresentação tabular, apuração dos dados, interpretação dos dados e planejamento. iii. Definição do problema, planejamento, coleta dos dados, apuração, apresentação dos dados, análise e interpretação dos dados. 2. Para cada um dos itens a seguir, indique a população em estudo e a amostra escolhida. a. Para determinar o gasto médio das famílias em férias na cidade de Salvador, foram selecionadas 62 famílias que estavam chegando ao aeroporto de Salvador e foi perguntado quanto pretendiam gastar. b. Pretende-se fazer um estudo sobre o número de membros do agregado familiar, numa cidade. Para isso efetuou se um inquérito ao qual responderam 50 famílias. c. A fim de determinar os salários anuais de administradores recém-formados na cidade de Salvador foram considerados 150 jovens administradores e seus salários anuais foram contabilizados. 3. Você está realizando um estudo para determinar a opinião dos estudantes em sua universidade sobre auditorias de contas públicas em seu Estado. Identifique a técnica de amostragem que você usaria se selecionasse as amostras listadas. a. Você seleciona uma classe aleatoriamente e questiona cada aluno da classe. b. Você divide a população de estudantes com relação às graduações, seleciona aleatoriamente e questiona alguns de cada curso de graduação. c. Você designa um número para cada aluno e gera aleatoriamente. Então, você questiona cada estudante cujo número é selecionado aleatoriamente. d. Você seleciona estudantes que estão em sua aula de estatística. e. Você designa um número para cada estudante e, depois de escolher um número inicial, questiona cada 25º aluno. 4. Classifique cada uma das variáveis abaixo em qualitativa (nominal/ordinal) ou quantitativa (discreta/contínua). a. Número de matrícula da UFBA. b. Intenção de voto de um eleitor à presidência da República (possíveis respostas são os nomes dos candidatos, além de “indeciso”). c. Consumo de combustível de diferentes modelos de automóveis em km/l. d. Número de filhos por família em diferentes países. e. Renda, em reais, dos funcionários de uma empresa. f. Número de disciplinas cursadas por alunos de graduação em Administração. g. Classificação da redação dos candidatos de um concurso público em “excelente”, “ótima”, “boa”, “regular” e “insuficiente”. h. Classificação de pisos cerâmicos produzidos como “perfeitos”, “aceitáveis” e “inaceitáveis”. i. Temperatura medida em graus Celsius. j. Nível de instrução dos funcionários de uma empresa, medido pelo número de anos completos na escola (excluindo repetências). 2 k. Velocidade de automóveis em uma rodovia federal, sendo a velocidade declarada como “legal” ou “em excesso”. 5. Renda é uma variável que frequentemente está incluída em pesquisas. Às vezes a pergunta é formulada como: “Qual é a sua renda (em reais)?”. Em outras pesquisas, é pedido ao entrevistado que “Coloque um X no círculo correspondente ao seu nível de renda”, e são fornecidas várias faixas de renda para escolher. a. No primeiro formato, explique por que a renda pode ser considerada tanto discreta quanto contínua. b. Qual destes dois formatos você preferiria utilizar se estivesse definindo uma pesquisa? Por quê? c. Qual destes dois formatos iria, provavelmente, trazer a você uma melhor taxa de resposta? Por quê? 6. Uma amostra de 1200 vendedores, de uma empresa que vende cosmético a domicílio, foi selecionada e duas variáveis foram analisadas: Desempenho: Fraco, Médio e Bom e Treinamento: Recebeu treinamento e Não recebeu treinamento. Sabe-se que 65% dos vendedores pesquisados receberam treinamento. Dos vendedores analisados, 30% foram considerados fracos e 50% médios. Dentre os vendedores considerados fracos, 75% não receberam treinamento. Dentre os vendedores que receberam treinamento, 60% foram considerados médios. De acordo com as informações faça uma tabulação cruzada Treinamento x Desempenho. 7. Classifique o tipo de série estatística representado em cada tabela a seguir. a. b. c. Tabela 01. MATRÍCULAS NO ENSINO SUPERIOR SEGUNDO ÁREAS DE ENSINO - BRASIL - 1975 ÁREA DE ENSINO MATRÍCULAS CIÊNCIAS BIOLÓGICAS 32.109 CIÊNCIAS EXATAS E TECNOLÓGICAS 65.949 CIÊNCIAS AGRÁRIAS 2.419 CIÊNCIAS HUMANAS 148.842 LETRAS 9.883 ARTES 7.464 DUAS OU MAIS ÁREAS 16.323 TOTAL 282.989 FONTE: Serviço de Estatística da Educação e da Cultura 8. Na empresa Mercury Ltda foi observada a distribuição de funcionários do setor de serviços gerais com relação ao salário semanal, conforme mostra a distribuição de frequências: Salário Semanal (em US$) fi 25 |- 30 10 30 |- 35 20 35 |- 40 30 40 |- 45 15 45 |- 50 40 50 |- 55 35 Total 150 Sendo fi a frequência simples absoluta, calcule as frequências: (a) simples relativa; (b) acumulada absoluta “abaixo de”; (c) acumulada relativa “abaixo de”; (d) acumulada absoluta “acima de”; (e) acumulada relativa “acima de”. 9. Considere a seguinte distribuição de frequência correspondente aos diferentes preços de um determinado produto em vinte lojas pesquisadas. Preços (R$) Número de Lojas 50,00 2 51,00 5 52,00 6 53,00 6 54,00 1 Total 20 3 a. Quantas lojas apresentaram um preço de R$ 52,00? b. Calcule a frequência simples relativa. c. Quantas lojas apresentaram um preço de até R$ 52,00 (inclusive)? d. Qual o percentual de lojas com preço maior que R$ 51,00 e menor que R$ 54,00? 10. Em relação a gráficos e medidas descritivas como instrumentos úteis na análise estatística, assinale V(verdadeiro) / F(falso) nas afirmações abaixo: a. O gráfico de barras representa, por meio de uma série de retângulos, quantidades ou frequências para variáveis qualitativas. b. O gráfico de setores é apropriado, quando se quer representar as divisões em relação a um montante total. c. O histograma pode ser construído utilizando-se, indistintamente, as frequências absolutas ou relativas de intervalos de classe. d. O gráfico de linhas é indicado para representar séries geográficas. e. O desvio padrão é uma medida de dispersão, enquanto que a amplitude é uma medida de tendência central. 11. Os gráficos constituem um recurso bastante utilizado para apresentação dos resultados de uma pesquisa. Salário-base bruto dos soldados e cabos no Brasil (em reais) Considerando o gráfico anterior responda às seguintes questões: a. Classifique o tipo de série estatística. b. Qual o tipo de gráfico que está sendo apresentado? E os tipos de variáveis? c. Você tem alguma crítica a fazer em relação à construção deste gráfico? Qual (is)? d. É possível construir um histograma com os resultados citados? Por quê? 12. Uma empresa procurou estudar a ocorrência de acidentes com seus empregados, tendo, para isso, realizado um levantamento abrangendo um período de 36 meses, onde foi observado o número de operários acidentados para cada mês. Os dados correspondentes são: 1 2 2 3 3 3 3 4 4 4 4 4 5 5 5 5 5 5 5 6 6 6 6 6 6 7 7 7 7 7 8 8 8 9 9 10 a. Construa uma distribuição de frequência para dados agrupados em classes (use h = 2 e limite inferior da primeira classe igual a 1); b. Represente graficamente a distribuição do item a; c. Em quantos meses houveram entre três (inclusive) e cinco(exclusive) acidentes? d. Em qual porcentagem de meses houveram até cinco acidentes? e. Calcule o número médio de acidentes usando os dados tabelados. 4 13. Os quatro programas de televisão de maior audiência nos Estados Unidos foram CSI, ER, Everybody Loves Raymond e Friends (Nielsen Media Research,11 de janeiro de 2004). Seguem-se os dados que indicam os programas preferidos para uma amostra de 50 telespectadores (ASW, 2009): CSI Friends CSI CSI CSI CSI CSI Raymond ER ER Friends CSI ER Friends CSI ER ER Friends CSI Raymond CSI Friends CSI CSI Friends ER ER ER Friends Raymond CSI Friends Friends CSI Raymond Friends Friends Raymond Friends CSI Raymond Friends ER Friends CSI CSI ER CSI Friends ER a. Estes dados são qualitativos ou quantitativos? b. Forneça as distribuições de frequência simples absoluta e relativa. c. Com base nestes dados, qual o programa de televisão com a maior audiência? Qual o segundo colocado? 14. Considere a distribuição a seguir relativa a notas de dois alunos de estatística durante determinado semestre: a. Calcule as notas médias de cada aluno. b. Qual aluno apresentou resultado mais homogêneo? Justifique. 15. Uma amostra de 20 operários de uma companhia apresentou os seguintes salários recebidos durante uma certa semana, arredondados para o valor mais próximo e apresentados em rol: 140, 140, 140, 140, 140, 140, 140, 140, 165, 165, 165, 165, 180, 180, 180, 200, 200, 230, 230, 230. Calcular (a) a média, (b) a mediana, (c) a moda, (d) o desvio padrão, (e) o coeficiente de variação, para este grupo de salários. Analise estas medidas e faça uma breve conclusão sobre o salário dos operários desta companhia. 16. Em conjunto com uma auditoria anual, uma firma de contabilidade pública anota o tempo necessário para realizar a auditoria de 50 balanços contábeis. Calcular (a) a média (b) a mediana e (c) o desvio padrão, para o tempo de auditoria necessário para esta amostra de registro. Tempo necessário para a auditoria de balanços contábeis. Tempo de auditoria. (min.) Nº de balanços. (fi) 10 |-- 20 3 20 |-- 30 5 30 |-- 40 10 40 |-- 50 12 50 |-- 60 20 Total 50 17. A publicação Dow Jones Travel Index divulgou o valor que as pessoas que viajam a negócios pagam por pernoite em quartos de hotéis nas principais cidades dos Estados Unidos (The Wall Street Journal, 16 de janeiro de 2004). A média dos preços (em $) de quartos de hotel de 20 cidades são os seguintes (ASW, 2009): Aluno A 9,5 9,0 2,0 6,0 6,5 Aluno B 5,0 5,5 4,5 6,0 5,5 5 Atlanta 163 Denver 120 Minneapolis 125 Pittsburgh 134 Boston 177 Detroit 144 Nova Orleans 167 São Francisco 167 Chicago 166 Houston 173 Nova York 245 Seattle 162 Cleveland 126 Los Angeles 160 Orlando 146 St. Louis 145 Dallas 123 Miami 192 Phoenix 139 Washington, DC. 207 a. Qual a média dos preços de quartos de hotel? b. Qual é a mediana dos preços de quartos de hotel? c. Qual é a moda? d. Qual é o primeiro quartil? e. Qual é o terceiro quartil? 18. O peso em uma amostra de alunos do primeiro ano de uma escola é mostrado no histograma (o menor peso encontrado foi 41,5 quilogramas). a. Faça a distribuição de frequência para os dados e acrescente a frequência acumulada relativa “acima de”; b. Qual o peso médio encontrado na amostra de alunos do primeiro ano desta escola? c. Em quantos por cento dos alunos encontrou-se um peso igual ou maior a 73,5 quilogramas? 19. Em um exame final de Estatística, o grau médio de um grupo de 150 alunos foi de 7,8 e o desvio padrão, 0,80. Em Computação Básica, entretanto, o grau médio final foi de 7,3 e o desvio padrão, 0,76. Em que disciplina foi maior a dispersão relativa? 20. Na cidade A, a média de salários é de 1000 unidades monetárias (u.m.) e o 3o quartil é de 600 u.m. a. Escolhendo-se um trabalhador, ao acaso, na cidade A, o que é mais provável: ganhar mais ou menos do que 600 u.m.? Justifique. b. Em uma cidade B, a média de salários é de 700 u.m. e a variância é praticamente zero. Em qual cidade você procuraria emprego A ou B? Justifique. 21. Com as informações da tabela abaixo referentes a uma empresa, responda: 6 a. Qual o valor no ano 2 que nos permite identificar 25% das empresas com maior número de empregados? b. Com relação ao faturamento em cada um dos anos, quais os valores que permitem a identificação das empresas com os 10% menores faturamentos? c. Qual a proporção de empresas com, no máximo, 5 anos de existência? 22. Você é o responsável pela confecção de um relatório sobre o desempenho de vendas das 32 filiais da empresa em que trabalha. A alta direção investiu muito em uma série de promoções para aumentar as vendas, e quer verificar se isso realmente ocorreu: havia sido estabelecido um valor mínimo aceitável de 10%, em relação ao mesmo período do ano passado. Os valores de crescimento percentual das vendas foram: 4,30 6,34 7,38 3,51 10,90 0,28 7,96 8,12 1,58 5,53 4,11 0,41 8,31 1,54 4,49 4,65 4,19 -1,28 5,67 -0,25 12,00 4,32 8,43 2,95 8,54 18,76 7,34 1,82 -3,15 9,03 2,31 0,17 a. Construa a tabela de frequências que julgar apropriada para resumir os dados. Com base na tabela, o que você conclui acerca da eficácia das promoções? b. Que ferramenta gráfica você utilizaria para resumir os dados? Por quê? c. Que medida(s) de síntese você utilizaria para resumir os dados? Por quê? d. Calcule a(s) medida(s) escolhida(s) no item d, e com base nela(s), o que você conclui acerca da eficácia das promoções? 23. A figura a seguir mostra a distribuição de idades dos funcionários de três empresas similares A, B e C. Baseado neste gráfico, responda: a. Qual o tipo de gráfico que está sendo apresentado? b. Você tem alguma crítica a fazer em relação à construção deste gráfico? Qual(is)? c. É possível construir um histograma com os resultados citados? Por quê? d. Em qual das empresas há o funcionário mais jovem? E o mais velho? e. Em qual das empresas é maior a mediana das idades? f. Qual das empresas apresenta menor amplitude interquartílica? g. Descreva, quanto à simetria, a forma das distribuições para cada empresa. 24. A JD Powers and Associates fez uma pesquisa com usuários de telefones celulares a fim de saber quantos minutos eles usavam telefones celulares por mês (Associated Press, junho de 2002). Uma análise descritiva com 15 usuários de telefones celulares apresentou os seguintes resultados: 7 minutos --------------------------------------------------- ---------- Percentiles Smallest* 1% 105 105 5% 105 135 10% 135 180 Obs 15 25% 210 210 Sum of Wgt. 15 50% 380 Mean 422 Largest** Std. Dev. 295.7545 75% 615 615 90% 830 690 Variance 87470.71 95% 1180 830 Skewness 1.246316 99% 1180 1180 Kurtosis 3.89279 *Smallest – os quatro menores valores do conjunto de dados **Largest – os quatro maiores valores do conjunto de dados a. Qual a média e a mediana de minutos usados por mês por estes usuários? Interprete estes resultados. b. Qual é o primeiro quartil? Interprete seu valor. c. Qual o coeficiente de variação do número de minutos usados por mês? d. O 80º percentil é 774 minutos. A J.D. Powers and Associates divulgou que a média dos planos de assinatura de telefones sem fio permite até 750 minutos de uso por mês. O que estes dados sugerem a respeito da utilização que os assinantes de telefones celulares fazem de seus planos de assinatura mensal? e. Através da análise do boxplot com os minutos usados por mês em telefone celular, é possível identificar valores discrepantes? Especifique os limites para detecção de valores discrepantes para estes dados, justificando sua resposta anterior. 0 50 0 1, 0 00 1 ,5 00 m in u to s 25. As vendas anuais, em milhões de dólares, de 21 empresas produtoras de produtos farmacêuticos são apresentadas a seguir: 8.408 1.374 1.872 8.879 2.459 11.413 3.653 608 14.138 6.452 1.850 2.8181.356 5.794 10.498 7.478 4.019 4.341 739 2.127 8.305 a. Identifique os cinco elementos principais para definição do boxplot. b. Identifique os limites inferior e superior para detecção de valores discrepantes para estes dados. Existe algum valor discrepante? c. Defina um boxplot para representação destes dados. d. As vendas da Johnson & Johnson são as maiores da lista, com US$ 14.138 milhões. Suponha ter havido um erro de lançamento e que as vendas foram de US$ 41.138 milhões. O método definido no item (b) identifica o problema e possibilita a correção do mesmo? 8 26. Em um teste automobilístico de quilometragem e consumo de gasolina, 13 automóveis foram testados na estrada, em um percurso de 482,80 quilômetros, em condições de dirigibilidade tanto na cidade como na rodovia. Os dados apresentados a seguir referem-se à análise do desempenho obtido em termos de quilometragem por galão (1 galão = 3,78 litros). --------------------------------------------------- ---------------------- -> local = Cidade Desempenho em termos de quilômetros --------------------------------------------------- ---------- Percentiles Smallest 1% 21.24 21.24 5% 21.24 23.17 10% 23.17 24.46 Obs 13 25% 24.62 24.62 Sum of Wgt. 13 50% 25.58 Mean 25.05154 Largest Std. Dev. 1.559892 75% 25.91 25.91 90% 26.87 26.07 Variance 2.433264 95% 27.03 26.87 Skewness -1.056555 99% 27.03 27.03 Kurtosis 3.845761 --------------------------------------------------- ---------------------- -> local = Rodovia Desempenho em termos de quilômetros --------------------------------------------------- ---------- Percentiles Smallest 1% 27.35 27.35 5% 27.35 27.35 10% 27.35 28.96 Obs 13 25% 28.96 28.96 Sum of Wgt. 13 50% 29.93 Mean 29.98846 Largest Std. Dev. 1.863236 75% 30.89 30.89 90% 32.18 31.22 Variance 3.471648 95% 33.95 32.18 Skewness .4640106 99% 33.95 33.95 Kurtosis 2.801077 *Smallest – os quatro menores valores do conjunto de dados **Largest – os quatro maiores valores do conjunto de dados a. Use a média, a mediana e algumas separatrizes para fazer uma afirmação sobre a diferença de desempenho quando se dirige na cidade e na rodovia. b. Qual é o primeiro quartil? Interprete seu valor. c. Através da análise do boxplot da quilometragem de acordo com a estrada, é possível identificar valores discrepantes? Especifique os limites para detecção de valores discrepantes para estes dados, justificando sua resposta anterior. Caso hajam valores discrepantes, que valores são estes? 20 25 30 35 D es em pe nh o em te rm os d e qu ilô m et ro s Cidade Rodovia d. Avalie a assimetria destas distribuições com base nos boxplots. Justifique sua resposta. 9 27. Considere os seguintes histogramas. O primeiro apresenta uma aproximação da renda bruta ajustada anual dos Estados Unidos (Internal Revenue Service, março de 2003). O segundo mostra as notas de exames dos estudantes de um curso de Estatística (ASW, 2009). a. Qual evidência de assimetria apresenta o histograma para os dados da renda anual? Explique. b. Qual evidência de assimetria apresenta o histograma para as notas dos exames? Explique. 28. Para os casos a seguir indique qual é o método estatístico (tabela, gráfico, medida de síntese) mais apropriado para resumir e interpretar os dados. JUSTIFIQUE suas respostas. a. A diretoria de uma empresa especializada em entrega expressa quer ter uma ideia do peso dos pacotes das encomendas, para decidir ou não a adoção de um tipo maior de caixa. Há um arquivo com os pesos em kg (com até três casas decimais) das últimas 3000 encomendas. Você tem cinco minutos para fazer uma apresentação para a diretoria que é IGNORANTE em Estatística. b. Uma corretora de valores tem 450 clientes, desde pequenos a mega-investidores. A diretoria quer ter uma ideia dos valores investidos por estes clientes, identificando inclusive os “discrepantes”. Você tem três minutos para apresentar o relatório, e a diretoria é versada em Análise Exploratória de Dados. 29. Muitas pessoas nos Estados Unidos acreditam que os criminosos que se confessam culpados tendem a sofrer penas mais leves do que os que são condenados em julgamento. Considere na tabela seguinte os dados de acusados de roubo em São Francisco, EUA. Verifique se existe evidência de associação entre a sentença e a alegação do acusado. Qual sua conclusão? Justifique sua resposta com base no cálculo do coeficiente apropriado. Sentença Alegação do acusado Total Culpado Inocente Enviado à prisão 392 58 450 Mantido em liberdade 564 14 578 Total 956 72 1028 30. O que pode ser dito da associação entre a idade que o indivíduo começou a trabalhar com a série em que parou de estudar? Justifique sua resposta. Idade do início do trabalho Série Total Fundamental Médio 16 anos ou menos 182 57 239 mais de 16 anos 18 43 61 Total 200 100 300 10 31. Um estudo realizado junto a 218 alunos da Ohio State University sugere uma ligação entre o tempo gasto no portal eletrônico de relacionamento social Facebook e a média geral de notas do aluno. Alunos que raramente ou jamais utilizaram o Facebook apresentaram médias gerais mais altas do que alunos que fazem uso do Facebook. O estudo sugere que o tempo gasto no Facebook e a média geral de notas do aluno estão positivamente ou negativamente correlacionados? 32. Os dados a seguir correspondem à variável renda familiar e gasto com alimentação (em unidades monetárias) para uma amostra de 25 famílias: Renda Familiar (X) Gasto com Alimentação (Y) Renda Familiar (X) Gasto com Alimentação (Y) 3 1,5 80 25,0 5 2,0 100 40,0 10 6,0 100 35,0 10 7,0 100 40,0 20 10,0 120 30,0 20 12,0 120 40,0 20 15,0 140 40,0 30 8,0 150 50,0 40 10,0 180 40,0 50 20,0 180 50,0 60 20,0 200 60,0 70 25,0 200 50,0 70 30,0 a. Construa o diagrama de dispersão da variável gasto com alimentação (Y) em função da renda familiar (X). b. A que conclusões você consegue chegar sobre a relação entre a renda familiar e os gastos com alimentação? 11 33. Foi observada uma amostra de 20 empresas segundo o número de empregados e a receita anual da empresa. Sendo o coeficiente de correlação de Pearson, aproximadamente, 0,82e analisando o diagrama de dispersão a seguir, qual a conclusão da relação entre a receita e o porte da empresa? Gráfico de dispersão para as variáveis número de empregados e receita anual da empresa 34. O transporte público e o automóvel são dois meios de transporte que os trabalhadores podem usar para chegar ao trabalho diariamente. Os resultados amostrais sobre o tempo do percurso estão registrados a seguir para cada meio de transporte. Os tempos estão expressos em minutos: Transporte Público: 25 28 29 29 32 32 33 34 37 41 Automóvel: 29 30 31 31 32 32 33 33 34 35 Transporte Público: 320 10 1 =∑ =i ix e 194)( 10 1 2 =−∑ =i i xx ; Automóvel: 320 10 1 =∑ =i ix e 30)( 10 1 2 =−∑ =i i xx . a. Com os dados da amostra, calcule a média e o desvio padrão para o tempo do percurso para se chegar ao trabalho utilizando cada um dos meios de transporte. Com base apenas nestas informações, qual meio de transporte preferível? Explique. b. Faça uma análise do boxplot de acordo com os meios de transporte e verifique se sustenta suas conclusões para o item (a). Explique com uma breve descrição sobre as principais características do mesmo.
Compartilhar