Buscar

Lista 1 Estatística Descritiva

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 4 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Universidade Federal de Lavras 
Departamento de Estatística 
Estatística GES101 Prof. Marcelo Silva de Oliveira 
Lista de exercícios 1 - Estatística Descritiva. 
1. Os dados a seguir referem-se ao número de falhas num sistema, ocorridas durante uma operação crítica, 
entre n = 85 sistemas em operação. Os dados foram colocados em ordem crescente. 
 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 
 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 
 5, 5 e 6. 
a) Identifique a variável e seu tipo. 
b) Construa a distribuição de frequências da ocorrência do número de falhas. 
c) Obtenha o gráfico apropriado para a distribuição de frequências. 
d) Calcule as seguintes medidas de posição: média, mediana, moda. 
e) Calcule as seguintes medidas de variabilidade: variância, desvio-padrão, cv. 
 
2. Considere uma amostra de 32 resistores, de uma mesma marca e tipo, que foram testados quanto aos 
seus valores reais de resistência elétrica (ohms). Os resultados obtidos foram: 
6,27 6.10 6,26 7,11 5,78 5,30 6,70 6,43 
5,85 5,67 6,24 5,71 6,04 7,02 6,54 6,76 
6,50 5,61 6,98 6,63 5,75 5,85 6,00 6,77 
6,95 5,98 6,36 6,79 6,24 6,12 6,30 6,13 
 
a) Faça uma distribuição de frequências para estes dados. 
b) Faça o gráfico. 
c) Calcule a média e o desvio-padrão direto nos dados. 
d) Calcule a média e o desvio-padrão usando a distribuição de frequências. 
 
3. Na UFLA há o registro de dados climáticos diários desde 1.908. Digamos que os dados abaixo (já colocados em 
ordem crescente) sejam os valores das temperaturas máximas diárias observadas nos dias 30 de Setembro, desde 
1.908 até hoje: 
15,84 18,81 20,06 21,04 21,95 22,81 23,76 25,71 
17,06 19,04 20,17 21,07 21,98 22,93 23,84 26,04 
17,24 19,11 20,21 21,12 22,19 23,01 23,94 26,20 
17,34 19,18 20,23 21,41 22,24 23,07 23,96 26,33 
17,54 19,29 20,31 21,55 22,30 23,14 24,08 26,53 
17,55 19,31 20,50 21,61 22,38 23,16 24,23 26,59 
17,65 19,40 20,59 21,65 22,38 23,23 24,24 26,69 
18,23 19,54 20,78 21,69 22,47 23,23 24,31 26,83 
18,40 19,63 20,80 21,70 22,68 23,35 24,39 27,59 
18,47 19,73 20,85 21,76 22,70 23,51 24,42 27,65 
18,55 19,81 20,88 21,83 22,73 23,59 24,65 27,95 
18,57 19,82 20,98 21,89 22,75 23,63 24,69 
 18,58 19,94 21,01 21,92 22,76 23,69 24,98 
 18,72 19,98 21,02 21,93 22,79 23,75 25,33 
 
 
 
a) Faça a distribuição de frequências. 
b) Faça o gráfico. 
c) Calcule a média, mediana, e moda. 
d) Calcule a Amplitude Total, a variância, o desvio-padrão, e o coeficiente de variação (cv). 
e) Calcule outra vez todas as medidas das letras (c) e (d), porém, desta vez, sobre a distribuição de frequências. 
Compare-as e conclua. 
f) Calcule os quantis de 1%, 2,5%, 5%, e 10%. 
g) Qual seria uma previsão para a temperatura máxima diária para 30/09/2017? 
 
4. Sejam os dados abaixo referentes a um levantamento onde observaram-se 91 instâncias de instalação de um 
software de automação comercial, no Sul de Minas, nas quais contou-se o número de defeitos observados durante 
a instalação: 
Tabela 2. Frequência de ocorrência de defeitos na instalação de softwares de automação 
 comercial, Sul de Minas, 2005. 
Número de defeitos 
observados 
Frequência 
absoluta (número de instâncias) 
Frequência 
percentual (%) 
0 3 3,30 
1 8 8,79 
2 15 16,48 
3 22 24,18 
4 21 23,08 
5 16 17,58 
6 4 4,40 
7 0 0,00 
8 2 2,20 
 9 ou mais 0 0,00 
Total 91 100,00 
Fonte: levantamento obtido nas ODS da fábrica de software. 
a) Identifique a variável e seu tipo. 
b) Restaure os dados originais. 
c) Calcule as seguintes medidas de posição: média, mediana, moda. 
d) Calcule as seguintes medidas de variabilidade: variância, desvio-padrão, cv. 
e) O que você pode dizer sobre estes cálculos realizados sobre os dados originais e sobre a distribuição de 
fequências? 
 
5. Considere o exemplo a seguir, relativo à produção média diária de leite (kg), durante o período de 
lactação, de um rebanho de 201 vacas da raça holandesa, pertencente a uma fazenda de gado holandês 
do Sul de Minas Gerais. A Tabela 1 dá a distribuição de fequências já pronta para você. 
Tabela 1. Distribuição de frequências, relativa à produção diária de leite de 201 vacas da 
raça holandesa, de um rebanho pertencente a fazenda Itirapuan, Sul de Minas Gerais, 2005. 
Classes fa
1 
fr
2 
fp
3 
(5,25 ; 11,05] 7 0,0349 3,49 
(11,05 ; 16,85] 61 0,3035 30,35 
(16,85 ; 19,75] 48 0,2388 23,88 
(19,75 ; 22,65] 37 0,1841 18,41 
(22,65 ; 25,55] 29 0,1443 14,43 
(25,55 ; 34,25] 19 0,0944 9,44 
Totais 201 1,0000 100,00 
1. frequência absoluta; 2. frequência relativa; 3. frequência porcentual. 
Fonte: dados do livro Oliveira et al. Introdução à Estatística. Editora da UFLA. Adaptado. 
(a) Identifique a variável e seu tipo. 
(b) Calcule as 3 medidas de tendência central para estes dados. Interprete-as. 
(c) Faça o histograma. 
(d) Calcule os percentis de 1%, 2,5%, 5%, 95%, 99%. Interprete-os. 
(e) Calcule as medidas de variabilidade (s, s2, cv, A) para estes dados. Interprete-as. 
(f) O que você pode dizer sobre estes cálculos em relação aos cálculos sobre os dados originais? 
 
6. Numa universidade canadense (Capilano University), numa disciplina sobre Comportamento Organizacional, o 
questionário abaixo foi aplicado sobre cada estudante da turma: 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Um dos estudantes marcou suas respostas (números argolados). Mais abaixo há a informação da posição onde 
cada um se enquadra: “Seu escore total variará entre 18 e 108. Baseado sobre um grupo típico de 500 
estudantes de graduação em Administração, as faixas seguintes podem te ajudar estimar em qual categoria 
você está em relação aos outros: 
95 ou mais = você está acima do 3º quartil na habilidade de formar e liderar uma equipe 
72 – 94 = você está entre o 2º quartil e o 3º quartil 
60 – 71 = você está entre o 1º quartil e o 2º quartil 
Abaixo de 60 = você está abaixo do 1º quartil”. 
Utilize estas informações para: 
(a) Fazer a tabela de distribuição de frequências. 
(b) Calcular a média, a mediana, e a moda. 
(c) Calcular a variância, o desvio-padrão, e o cv. 
(d) Calcular o quantil de 99%, 97,5%, 95%, 5%, 2,5%, e de 1%. 
(e) Um estudante tirou um escore de 80: qual quantil é este 80? 
 
7. Uma amostra de 97 barragens de contenção foram observadas quanto a classificação do risco de 
rompimento, segundo dois métodos diferentes. O método convencional, de custo elevado, consiste na 
 
sondagem do subsolo da barragem por técnicas de Mecânica dos Solos (pela qual se classifica o risco em 
baixo, médio, e alto), e um método simplificado, de custo mais baixo, que consiste em observar o aspecto 
da estabilidade da barragem (consoante o aspecto apresentado o risco é classificado em baixo, médio, e 
alto). Os métodos são as variáveis. Estas são chamadas também de fatores. Neste caso, as variáveis são 
categóricas, com 3 categorias cada uma. Estas categorias também são chamadas de níveis. Estas 
distribuições de frequência com duas ou mais variáveis são distribuições de frequência multivariadas, e, 
na sua apresentação tabular, também são chamadas de tabelas de contingência. O objetivo da pesquisa 
é avaliar a eficácia do método simplificado relativamente ao método convencional. Os resultados são: 
a) Faça um gráfico desta distribuição de frequências. 
b) Calcule a média, a mediana, e a moda de cada variável. 
c) Calcule a variância, o desvio-padrão, e o cv de cada variável. 
d) O que vocêconclui: os dois métodos são equivalentes? 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 Fonte: Livro Análise de Dados Categorizados, Paulino e Singer, Editora Edgard 
 Blucher, 2.006. Adaptado. 
 
8. Visando estudar a qualidade das fibras têxteis produzidas por duas máquinas fabricadas por 
fabricantes diferentes, um estudo com 430 amostras de 100 g destas fibras foram inspecionadas em 
termos do número de defeitos de cada um de dois tipos (defeitos que resultam da presença de 
entrelaçamento em grupos de fibras, os do tipo “botões” - menores e de difícil separação- e defeitos 
do tipo “rolhas” – maiores e de fácil separação). Os resultados são: 
 
 
 
Fabricante 
Número de 
botões 
Número de rolhas 
0 1  2 
A 
0 28 40 68 
1 5 21 49 
 2 1 4 15 
B 
0 31 70 69 
1 5 12 10 
 2 0 1 2 
 
 
O interesse principal deste estudo é a avaliação da intensidade e da homogeneidade da associação 
entre as frequências dos dois tipos de defeito para os dois fabricantes. 
a) Faça o gráfico. 
b) É possível concluir sobre o interesse principal da pesquisa? 
 
Tabela 3. Distribuição de frequências de barragens classificadas quanto ao risco de rompimento, por 
dois métodos diferentes. São Paulo, 1.990. 
 
Risco de rompimento segundo o método convencional 
 Baixo Médio Alto 
Risco de rompimento 
segundo o método 
simplificado 
Baixo 11 5 0 
Médio 14 34 7 
Alto 2 13 11

Outros materiais