Buscar

2.2_DESCRITIVA_DISTRIBUIÇÕES DE FREQ

Prévia do material em texto

Luana de Melo Pereira 
 
Disciplina: Estatística Básica 
Universidade Federal de Pelotas 
Centro das Engenharias - Ceng 
2.2. DISTRIBUIÇÃO DE 
FREQUÊNCIAS 
Tabela de frequências 
Tabela de classificação simples 
Representação gráfica 
Histograma 
Polígono de frequências 
2 
Distribuição de Frequência 
3 
Distribuição de frequências e gráficos 
 A distribuição de frequências é uma forma muito útil 
de resumir a informação sobre uma ou mais variáveis; 
 Trata da organização de um conjunto de medidas ou 
observações em classes, indicando a frequência de 
observações em cada classe; 
 Formato é muito sensível ao número de observações 
disponíveis. 
4 
 Além de resumir a informação, tem por finalidade: 
 1. Representar a forma como os valores das 
variáveis se distribuem (localização da maioria dos 
valores, simetria, número de picos e formato das 
caudas). 
 2. Indicar qual modelo de distribuição de 
probabilidade poderia ser adequado para esses dados, 
pois fornece uma ideia empírica da distribuição da 
população. 
5 
 Tabelas de classificação simples 
As características dessas tabelas variam de acordo 
com o tipo de variável em estudo. 
 Se a variável é do tipo categórica ou numérica 
discreta (com poucos valores), devemos obter as 
frequências para cada nível dessa variável 
(SEM perda de informação). 
 Se a variável é do tipo numérica contínua, 
devemos primeiro construir intervalos e depois obter 
as frequências para cada intervalo 
(COM perda de informação). 
6 
Dados brutos: ruim, médio, bom, médio, ruim, médio, ruim, médio, ruim, 
bom, médio, médio, bom, médio, médio, médio, ótimo, médio, bom, 
ótimo, bom, ótimo, médio, ótimo, médio, ruim, médio, ótimo, médio, 
médio, bom, ruim, bom, bom, médio, ruim, médio, médio, ótimo, médio, 
bom, ruim, ruim, bom, médio, médio, ruim, bom, médio, médio, bom, 
bom, bom, médio, ruim, bom, médio, médio, ruim, médio 
Variável Categórica ou Numérica Discreta 
 Para este caso a tabela de distribuição de frequências 
apresentará a seguinte característica: cada valor da variável 
constituirá uma classe. 
Variável em estudo: conceito na disciplina de Estatística 
Exemplo 1 – VARIÁVEL CATEGÓRICA 
com poucos valores 
Número da classe (j) Classe 
1 Ruim 
2 Médio 
3 Bom 
4 Ótimo 
 
7 
Construção da tabela 
Para construir a tabela devemos seguir apenas dois passos: 
1o passo: Identificar e ordenar as categorias ou valores da 
variável. Cada categoria ou valor constituirá uma classe. 
O número da classe é representado por j, tal que j=1, 2, ..., k, 
onde k é o número total de classes. 
 
8 
2º passo: Contar o número de elementos em cada classe, 
ou seja, contar quantas vezes o dado está repetido. 
j Classe 
j
F
 
1 Ruim 1122 
2 Médio 2277 
3 Bom 1155 
4 Ótimo 66 
  60 
 
Os valores provenientes desta contagem, denotados por Fj, 
são denominados frequências absolutas das classes. 
9 
Outras frequências importantes: 
j Classe 
j
F
 
j
F
 
1 Ruim 12 1122 
2 Médio 27 3399 
3 Bom 15 5544 
4 Ótimo 6 6600 
  60 - 
 
 Frequência absoluta acumulada, denotada por , 
expressa o número de elementos acumulados em cada 
classe. 
j
F
10 
j Classe 
j
F
 
j
F
 
j
f
 
1 Ruim 12 12 00,,2200 
2 Médio 27 39 00,,4455 
3 Bom 15 54 00,,2255 
4 Ótimo 6 60 00,,1100 
  60 - 1 
 
 Frequência relativa, denotada por , expressa a proporção 
de elementos em cada classe. 
j
f
11 
j Classe 
j
F
 
jF
 
jf
 
jf
 
1 Ruim 12 12 0,20 00,,2200 
2 Médio 27 39 0,45 00,,6655 
3 Bom 15 54 0,25 00,,9900 
4 Ótimo 6 60 0,10 11 
  60 - 1 - 
 
 Frequência relativa acumulada, denotada por , expressa 
a proporção de elementos acumulada em cada classe. 
jf
12 
j Classe 
j
F
 
j
F
 
j
f
 
j
f 
 
1 Ruim 12 12 0,20 0,20 
2 Médio 27 39 0,45 0,65 
3 Bom 15 54 0,25 0,90 
4 Ótimo 6 60 0,10 1 
  60 - 1 - 
 
número de alunos que obtiveram conceito Ótimo 
proporção de alunos que 
obtiveram conceito Ruim 
número de alunos que 
obtiveram até conceito Bom 
proporção de alunos que obtiveram até conceito Médio 
 Interpretação 
13 
Dados brutos: 2, 5, 6, 0, 4, 4, 3, 4, 2, 2, 3, 3, 5, 3, 5, 1, 2, 4, 2, 3, 5, 
4, 3, 3, 2, 3, 0, 4, 4, 3, 4, 0, 2, 0, 2, 3, 3, 1, 2, 4, 2, ... 
Variável em estudo: número de peças com defeito na espessura 
por lote. 
1º passo: Identificar e ordenar 
os valores da variável 
2º passo: Contar o número de 
elementos em cada classe. 
j Classe 
j
F
 
1 0 55 
2 1 60 
3 2 112 
4 3 82 
5 4 31 
6 5 8 
7 6 2 
  350 
 
Exemplo 2 – VARIÁVEL NUMÉRICA DISCRETA 
Número de peças com 
defeito na espessura 
Número de lotes 
inspecionados 
14 
j Classe 
j
F
 
j
F
 
j
f
 
j
f 
 
1 0 55 55 0,1571 0,1571 
2 1 60 115 0,1714 0,3286 
3 2 112 227 0,3200 0,6486 
4 3 82 309 0,2343 0,8829 
5 4 31 340 0,0886 0,9714 
6 5 8 348 0,0229 0,9943 
7 6 2 350 0,0057 1 
  350 - 1 - 
 
 Interpretação 
112 dos 350 lotes apresentaram 2 peças com defeito na espessura. 
340 dos 350 lotes apresentaram até 4 
peças com defeito na espessura. 
32% dos 350 lotes apresentaram 2 peças com defeito na espessura. 
97,14% dos 
350 lotes 
apresentaram 
até 4 peças 
com defeito na 
espessura. 
15 
Os dados a seguir se referem ao número de peças 
cerâmicas destinadas a exportação por hora de trabalho 
numa indústria. 
0 0 4 2 0 1 0 2 0 4 
1 0 0 3 2 0 1 0 0 0 
2 0 0 1 0 0 3 2 1 5 
0 1 0 0 2 0 0 3 2 1 
 
Exercício proposto: 
Construa a distribuição de frequências para esses dados e 
interprete dois resultados. 
O que se 
observa? 
Onde se 
observa? 
16 
j Classe 
j
F
 
j
F
 
j
f
 
j
f 
 
1 0 20 20 0,5000 0,5000 
2 1 7 27 0,1750 0,6750 
3 2 7 34 0,1750 0,8500 
4 3 3 37 0,0750 0,9250 
5 4 2 39 0,0500 0,9750 
6 5 1 40 0,0250 1 
  40 - 1 - 
 
Resolução: 
j
f 
Em 85% das 40 horas trabalhadas foram produzidas até 2 peças 
destinadas a exportação. 
Número de peças 
destinadas a exportação 
3 
j
F
Em 2 das 40 horas trabalhadas foram produzidas 4 peças 
destinadas a exportação. 5 
Número de horas 
trabalhadas 
17 
Variáveis Numéricas Contínuas 
As variáveis contínuas, em geral, assumem muitos 
valores diferentes uns dos outros. 
 Para contornar problemas desse tipo, as tabelas 
de distribuição de frequências são construídas de 
modo que cada classe seja constituída por um 
intervalo de valores da variável. 
 Quando variáveis discretas assumem muitos 
valores diferentes é usual agrupar os dados 
discretos em intervalos de classe. 
18 
Variável em estudo: valor gasto num supermercado (em R$) 
pelos primeiros 50 clientes de um certo dia da semana. 
Exemplo - VARIÁVEL NUMÉRICA CONTÍNUA 
Dados brutos: 
32,03 19,54 45,40 25,13 46,69 18,36 13,78 15,23 36,37 15,62 
17,00 27,65 85,76 38,64 86,37 24,58 20,16 93,34 48,65 22,22 
23,04 42,97 28,06 52,75 3,11 8,88 9,26 10,81 12,69 28,38 
18,43 61,22 41,02 44,67 19,50 17,39 39,16 44,08 38,98 19,27 
26,24 28,08 59,07 82,70 26,26 24,47 54,80 70,32 50,39 20,59 
 
 
19 
1o passo: Ordenar o conjunto de dados: colocar os dados 
brutos em ordem crescente de grandeza (rol). 3,11 8,88 9,26 10,81 12,69 13,78 15,23 15,62 17,00 17,39 
18,36 18,43 19,27 19,50 19,54 20,16 20,59 22,22 23,04 24,47 
24,58 25,13 26,24 26,26 27,65 28,06 28,0828,38 32,03 36,37 
38,98 38,64 39,16 41,02 42,97 44,08 44,67 45,40 46,69 48,65 
50,39 52,75 54,80 59,07 61,22 70,32 82,70 85,76 86,37 93,34 
 
Dados ordenados: 
Construção da tabela 
20 
2º passo: Determinar o número de classes (k) da tabela. 
De modo geral, esse valor não deverá ser inferior a 5 e 
nem superior a 15. Essa definição deverá ser orientada 
pelos objetivos do trabalho, mas existem algumas regras 
objetivas de determinação, como, por exemplo: 
 Regras para determinação do número de classes: 
n log3,321k 
nk 
Regra empírica 
Fórmula de Sturges 
onde: k: número de classes 
 n: número de observações 
Arredondar 
para cima 
(inteiro) 
21 
3º passo: Determinar a amplitude do intervalo de classe. 
Para isso utilizamos a expressão 
k
a
i t
onde: i: amplitude do intervalo 
 at: amplitude total = x(n) – x(1) 
4º passo: Construir os intervalos de classe. 
Arredondar 
para cima 
x(n) = Extremo Superior 
x(1) = Extremo Inferior 
5º passo: Contar o número de elementos em cada classe. 
j Classe 
1 x(1) | x(1) + i 
2 x(1) + i | x(1) + 2i 
3 x(1) + 2i | x(1) + 3i 
 
22 
 Recomenda-se o uso de intervalos de mesma amplitude, 
mas eventualmente uma amplitude variável poderá ser 
mais adequada ao contexto; 
 Deve ser garantido que todas as observações sejam 
classificadas; 
 As classes são mutuamente exclusivas, ou seja, uma 
observação pertence a uma única classe; 
 Com exceção da última classe, que é fechada à 
esquerda e à direita, os intervalos são fechados à esquerda 
e abertos à direita, de modo que um valor que coincida com 
o extremo superior será classificado na classe seguinte. 
Na construção dos intervalos de classe, é importante 
observar que: 
23 
Tomemos a seguinte variável: 
X = Tempo (segundos) até a falha 
em 60 ensaios acelerados de tubos 
de imagem, para a qual os valores 
observados (e já ordenados) foram: 
Faça a distribuição de frequências desses dados. 
16, 17, 17, 18, 18, 18, 19, 20, 20, 20, 20, 20, 
21, 21, 22, 22, 23, 23, 23, 23, 23, 23, 23, 23, 
23, 25, 25, 25, 25, 25, 25, 26, 26, 27, 27, 27, 
27, 28, 28, 28, 29, 29, 29, 30, 30, 30, 30, 30, 
30, 30, 31, 32, 33, 33, 33, 34, 34, 35, 36, 39. 
Exemplo 
24 
k
EI ES
k
a
i t


3,33,2857
7
16-39

Resolução: 
n log3,321k 
6,91,778 3,321 
60n 
7
K 
25 
 35,8 || 39,1 
32,5 | 35,8 
29,2 | 32,5 
25,9 | 29,2 
22,6 | 25,9 
19,3 | 22,6 
 
37,45 
34,15 
30,85 
27,55 
24,25 
20,95 
17,65 16 | 19,3 
 
7 
6 
5 
4 
3 
2 
1 
Classes j 
60 
2 
6 
9 
12 
15 
9 
7 
jF
 
60 
58 
52 
43 
31 
16 
7 

jF
 1,0000 
 0,0333 
 0,1000 
 0,1500 
 0,2000 
 0,2500 
 0,1500 
 0,1167 
jf
 
1,0000 
0,9667 
0,8667 
0,7167 
0,5167 
0,2667 
0,1167 

jf
jc
Ponto médio ou 
centro de classe 
Tempo (segundos) até a falha 
em 60 ensaios acelerados de 
tubos de imagem 
15% dos 60 ensaios apresentaram tempos de falha entre [29,2;32,5) 
segundos. jf
5 
Número de ensaios 
observados 
26 
3,11 8,88 9,26 10,81 12,69 13,78 15,23 15,62 17,00 17,39 
18,36 18,43 19,27 19,50 19,54 20,16 20,59 22,22 23,04 24,47 
24,58 25,13 26,24 26,26 27,65 28,06 28,08 28,38 32,03 36,37 
38,98 38,64 39,16 41,02 42,97 44,08 44,67 45,40 46,69 48,65 
50,39 52,75 54,80 59,07 61,22 70,32 82,70 85,76 86,37 93,34 
 
Os dados em rol abaixo (ordenação horizontal) se referem ao valor 
gasto num supermercado (em R$) pelos primeiros 50 clientes de 
um certo dia da semana. 
Faça a distribuição de frequências 
desses dados. 
Exercício proposto: 
27 
k
EI ES
k
a
i t

 12,89
7
3,11-93,34

Resolução: 
j Classe 
j
F
 
j
F
 
j
f
 
j
f 
 
j
c
 
1 8 0,16 0,16 
2 28 0,40 0,56 
3 34 0,12 0,68 
4 42 0,16 0,84 
5 45 0,06 0,90 
6 46 0,02 0,92 
7 50 0,08 1 
  50 - 1 - - 
 
n log3,321k 
6,641,7 3,321 50n 
7
3,11| 16,00 
16,00| 28,89 
28,89| 41,78 
41,78| 54,67 
54,67| 67,56 
67,56| 80,45 
9,56 
22,45 
35,34 
48,23 
61,12 
74,01 
86,90 
8 
20 
6 
8 
3 
1 
4 80,45 || 93,34 
28 
As distribuições de frequências podem ser 
representadas graficamente através de: 
 Histograma 
 Polígono de frequências 
Representação gráfica 
29 
O histograma consiste de um conjunto de retângulos 
contíguos cuja base é igual à amplitude do intervalo e a altura 
proporcional à frequência das respectivas classes. 
 Histograma (variável contínua) 
Frequência 
no intervalo 
Figura - Histograma para o tempo (segundos) até a 
falha em 60 ensaios acelerados de tubos de imagem 
30 
 Polígono de frequências (variável contínua) 
O polígono de frequências é constituído por segmentos de 
retas que unem os pontos cujas coordenadas são o ponto 
médio e a frequência de cada classe. Para fechá-lo toma-se 
uma classe anterior a primeira e uma posterior a última, uma 
vez que ambas possuem frequência zero. 
 Figura - Polígono de frequências para o tempo (segundos) 
até a falha em 60 ensaios acelerados de tubos de imagem. 
31 
Variável Discreta (dados de enumeração) 
Frequência 
no ponto 
Figura - número de peças com defeito na espessura por lote. 
Quando trabalhamos 
com variáveis 
discretas, os 
retângulos dos 
histogramas se 
reduzem a retas e, 
consequentemente, 
deixam de ser 
contíguos. 
32 
0
5
10
15
20
25
30
Ruim Médio Bom Ótimo
Conceito
A
lu
no
s
Figura - Conceito dos alunos na 
disciplina de Estatística. UFPel, 2001. 
Gráfico de colunas 
20%
45%
25%
10%
Ruim
Médio
Bom
Ótimo
Figura - Conceito dos alunos na 
disciplina de Estatística. UFPel, 2001. 
Gráfico de setores 
Variável Categórica 
33 
Próxima aula 
 - 2.3. Medidas descritivas 
 
Medidas de localização 
Medidas separatrizes 
Medidas de variação 
Medidas de formato

Continue navegando