Baixe o app para aproveitar ainda mais
Prévia do material em texto
Universidade Federal de Lavras Departamento de Estatística Estatística GES101 Prof. Marcelo Silva de Oliveira Lista de exercícios 1 - Estatística Descritiva. 1. Os dados a seguir referem-se ao número de falhas num sistema, ocorridas durante uma operação crítica, entre n = 85 sistemas em operação. Os dados foram colocados em ordem crescente. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 5, 5 e 6. a) Identifique a variável e seu tipo. b) Construa a distribuição de frequências da ocorrência do número de falhas. c) Obtenha o gráfico apropriado para a distribuição de frequências. d) Calcule as seguintes medidas de posição: média, mediana, moda. e) Calcule as seguintes medidas de variabilidade: variância, desvio-padrão, cv. 2. Considere uma amostra de 32 resistores, de uma mesma marca e tipo, que foram testados quanto aos seus valores reais de resistência elétrica (ohms). Os resultados obtidos foram: 6,27 6.10 6,26 7,11 5,78 5,30 6,70 6,43 5,85 5,67 6,24 5,71 6,04 7,02 6,54 6,76 6,50 5,61 6,98 6,63 5,75 5,85 6,00 6,77 6,95 5,98 6,36 6,79 6,24 6,12 6,30 6,13 a) Faça uma distribuição de frequências para estes dados. b) Faça o gráfico. c) Calcule a média e o desvio-padrão direto nos dados. d) Calcule a média e o desvio-padrão usando a distribuição de frequências. 3. Na UFLA há o registro de dados climáticos diários desde 1.908. Digamos que os dados abaixo (já colocados em ordem crescente) sejam os valores das temperaturas máximas diárias observadas nos dias 30 de Setembro, desde 1.908 até hoje: 15,84 18,81 20,06 21,04 21,95 22,81 23,76 25,71 17,06 19,04 20,17 21,07 21,98 22,93 23,84 26,04 17,24 19,11 20,21 21,12 22,19 23,01 23,94 26,20 17,34 19,18 20,23 21,41 22,24 23,07 23,96 26,33 17,54 19,29 20,31 21,55 22,30 23,14 24,08 26,53 17,55 19,31 20,50 21,61 22,38 23,16 24,23 26,59 17,65 19,40 20,59 21,65 22,38 23,23 24,24 26,69 18,23 19,54 20,78 21,69 22,47 23,23 24,31 26,83 18,40 19,63 20,80 21,70 22,68 23,35 24,39 27,59 18,47 19,73 20,85 21,76 22,70 23,51 24,42 27,65 18,55 19,81 20,88 21,83 22,73 23,59 24,65 27,95 18,57 19,82 20,98 21,89 22,75 23,63 24,69 18,58 19,94 21,01 21,92 22,76 23,69 24,98 18,72 19,98 21,02 21,93 22,79 23,75 25,33 a) Faça a distribuição de frequências. b) Faça o gráfico. c) Calcule a média, mediana, e moda. d) Calcule a Amplitude Total, a variância, o desvio-padrão, e o coeficiente de variação (cv). e) Calcule outra vez todas as medidas das letras (c) e (d), porém, desta vez, sobre a distribuição de frequências. Compare-as e conclua. f) Calcule os quantis de 1%, 2,5%, 5%, e 10%. g) Qual seria uma previsão para a temperatura máxima diária para 30/09/2017? 4. Sejam os dados abaixo referentes a um levantamento onde observaram-se 91 instâncias de instalação de um software de automação comercial, no Sul de Minas, nas quais contou-se o número de defeitos observados durante a instalação: Tabela 2. Frequência de ocorrência de defeitos na instalação de softwares de automação comercial, Sul de Minas, 2005. Número de defeitos observados Frequência absoluta (número de instâncias) Frequência percentual (%) 0 3 3,30 1 8 8,79 2 15 16,48 3 22 24,18 4 21 23,08 5 16 17,58 6 4 4,40 7 0 0,00 8 2 2,20 9 ou mais 0 0,00 Total 91 100,00 Fonte: levantamento obtido nas ODS da fábrica de software. a) Identifique a variável e seu tipo. b) Restaure os dados originais. c) Calcule as seguintes medidas de posição: média, mediana, moda. d) Calcule as seguintes medidas de variabilidade: variância, desvio-padrão, cv. e) O que você pode dizer sobre estes cálculos realizados sobre os dados originais e sobre a distribuição de fequências? 5. Considere o exemplo a seguir, relativo à produção média diária de leite (kg), durante o período de lactação, de um rebanho de 201 vacas da raça holandesa, pertencente a uma fazenda de gado holandês do Sul de Minas Gerais. A Tabela 1 dá a distribuição de fequências já pronta para você. Tabela 1. Distribuição de frequências, relativa à produção diária de leite de 201 vacas da raça holandesa, de um rebanho pertencente a fazenda Itirapuan, Sul de Minas Gerais, 2005. Classes fa 1 fr 2 fp 3 (5,25 ; 11,05] 7 0,0349 3,49 (11,05 ; 16,85] 61 0,3035 30,35 (16,85 ; 19,75] 48 0,2388 23,88 (19,75 ; 22,65] 37 0,1841 18,41 (22,65 ; 25,55] 29 0,1443 14,43 (25,55 ; 34,25] 19 0,0944 9,44 Totais 201 1,0000 100,00 1. frequência absoluta; 2. frequência relativa; 3. frequência porcentual. Fonte: dados do livro Oliveira et al. Introdução à Estatística. Editora da UFLA. Adaptado. (a) Identifique a variável e seu tipo. (b) Calcule as 3 medidas de tendência central para estes dados. Interprete-as. (c) Faça o histograma. (d) Calcule os percentis de 1%, 2,5%, 5%, 95%, 99%. Interprete-os. (e) Calcule as medidas de variabilidade (s, s2, cv, A) para estes dados. Interprete-as. (f) O que você pode dizer sobre estes cálculos em relação aos cálculos sobre os dados originais? 6. Numa universidade canadense (Capilano University), numa disciplina sobre Comportamento Organizacional, o questionário abaixo foi aplicado sobre cada estudante da turma: Um dos estudantes marcou suas respostas (números argolados). Mais abaixo há a informação da posição onde cada um se enquadra: “Seu escore total variará entre 18 e 108. Baseado sobre um grupo típico de 500 estudantes de graduação em Administração, as faixas seguintes podem te ajudar estimar em qual categoria você está em relação aos outros: 95 ou mais = você está acima do 3º quartil na habilidade de formar e liderar uma equipe 72 – 94 = você está entre o 2º quartil e o 3º quartil 60 – 71 = você está entre o 1º quartil e o 2º quartil Abaixo de 60 = você está abaixo do 1º quartil”. Utilize estas informações para: (a) Fazer a tabela de distribuição de frequências. (b) Calcular a média, a mediana, e a moda. (c) Calcular a variância, o desvio-padrão, e o cv. (d) Calcular o quantil de 99%, 97,5%, 95%, 5%, 2,5%, e de 1%. (e) Um estudante tirou um escore de 80: qual quantil é este 80? 7. Uma amostra de 97 barragens de contenção foram observadas quanto a classificação do risco de rompimento, segundo dois métodos diferentes. O método convencional, de custo elevado, consiste na sondagem do subsolo da barragem por técnicas de Mecânica dos Solos (pela qual se classifica o risco em baixo, médio, e alto), e um método simplificado, de custo mais baixo, que consiste em observar o aspecto da estabilidade da barragem (consoante o aspecto apresentado o risco é classificado em baixo, médio, e alto). Os métodos são as variáveis. Estas são chamadas também de fatores. Neste caso, as variáveis são categóricas, com 3 categorias cada uma. Estas categorias também são chamadas de níveis. Estas distribuições de frequência com duas ou mais variáveis são distribuições de frequência multivariadas, e, na sua apresentação tabular, também são chamadas de tabelas de contingência. O objetivo da pesquisa é avaliar a eficácia do método simplificado relativamente ao método convencional. Os resultados são: a) Faça um gráfico desta distribuição de frequências. b) Calcule a média, a mediana, e a moda de cada variável. c) Calcule a variância, o desvio-padrão, e o cv de cada variável. d) O que vocêconclui: os dois métodos são equivalentes? Fonte: Livro Análise de Dados Categorizados, Paulino e Singer, Editora Edgard Blucher, 2.006. Adaptado. 8. Visando estudar a qualidade das fibras têxteis produzidas por duas máquinas fabricadas por fabricantes diferentes, um estudo com 430 amostras de 100 g destas fibras foram inspecionadas em termos do número de defeitos de cada um de dois tipos (defeitos que resultam da presença de entrelaçamento em grupos de fibras, os do tipo “botões” - menores e de difícil separação- e defeitos do tipo “rolhas” – maiores e de fácil separação). Os resultados são: Fabricante Número de botões Número de rolhas 0 1 2 A 0 28 40 68 1 5 21 49 2 1 4 15 B 0 31 70 69 1 5 12 10 2 0 1 2 O interesse principal deste estudo é a avaliação da intensidade e da homogeneidade da associação entre as frequências dos dois tipos de defeito para os dois fabricantes. a) Faça o gráfico. b) É possível concluir sobre o interesse principal da pesquisa? Tabela 3. Distribuição de frequências de barragens classificadas quanto ao risco de rompimento, por dois métodos diferentes. São Paulo, 1.990. Risco de rompimento segundo o método convencional Baixo Médio Alto Risco de rompimento segundo o método simplificado Baixo 11 5 0 Médio 14 34 7 Alto 2 13 11
Compartilhar