Buscar

Distribuição de Frequência

Prévia do material em texto

1 
E
st
a
tí
st
ic
a
 B
á
si
ca
 –
 A
d
m
in
is
tr
aç
ão
/U
F
F
S
 
Pr
of
a.
 I
ar
a 
E
nd
ru
w
ei
t 
B
at
ti
st
i 
 
 
Estatística Básica 
Distribuição de Frequência 
 
Profa. Dra. Iara Denise Endruweit Battisti 
 
 
iara.battisti@uffs.edu.br 
 
 
 
 
 
 
Outubro de 2013 
 
 
 
UFFS – Universidade Federal da Fronteira Sul 
Campus: Cerro Largo 
Curso: Administração 
1 
E
st
a
tí
st
ic
a
 B
á
si
ca
 –
 A
d
m
in
is
tr
aç
ão
/U
F
F
S
 
Pr
of
a.
 I
ar
a 
E
nd
ru
w
e
it
 B
at
ti
st
i 
2 
 
 
• Representação de dados em tabela de distribuição de 
frequência 
 
• Histograma 
 
• Polígono de frequência 
 
• Exercícios 
 
 
 
 
2 
E
st
a
tí
st
ic
a
 B
á
si
ca
 –
 A
d
m
in
is
tr
aç
ão
/U
F
F
S
 
Pr
of
a.
 I
ar
a 
E
nd
ru
w
ei
t 
B
at
ti
st
i 
Organização de dados – Variáveis 
quantitativas 
3 
• Conjunto de dados referente a variáveis 
quantitativas podem ser descritos de duas 
maneiras: 
 
• Distribuição de frequência 
 
• Medidas descritivas 
 
E
st
a
tí
st
ic
a
 B
á
si
ca
 –
 A
d
m
in
is
tr
aç
ão
/U
F
F
S
 
Pr
of
a.
 I
ar
a 
E
nd
ru
w
e
it
 B
at
ti
st
i 
Organização de dados – Variáveis 
quantitativas 
4 
• A representação de um conjunto de dados 
referentes a realizações de uma variável 
quantitativa discreta é em geral bastante 
semelhante à das variáveis qualitativas, pois 
os valores inteiros que a variável assume 
podem ser considerados como “categorias” ou 
“classes naturais”. 
• Exemplo: considere o estudo com 20 canteiros de um 
viveiro de mudas de eucalipto em que é contado o número 
de lagartas “rosca” (Agrotis ipsilon). Observe que a 
disposição da variável “número de lagartas”, em uma tabela 
simples, é semelhante à de uma variável qualitativa. 
• A representação gráfica é semelhante, com a diferença de 
que a escala referente à variável possui interpretação 
diferente, representando elementos do conjunto dos 
números inteiros. Exemplo: gráfico de colunas verticais. 
 
 
3 
E
st
a
tí
st
ic
a
 B
á
si
ca
 –
 A
d
m
in
is
tr
aç
ão
/U
F
F
S
 
Pr
of
a.
 I
ar
a 
E
nd
ru
w
ei
t 
B
at
ti
st
i 
Organização de dados – Variáveis 
quantitativas 
5 
• A representação de um conjunto de dados 
referentes a realizações de uma variável 
quantitativa contínua apresenta uma 
dificuldade adicional, em relação às discretas, 
ou às variáveis qualitativas. 
• Não existem aqui “classes naturais”, porque as realizações 
(dados) de variáveis contínuas são números pertencentes 
ao eixo dos números reais, e assim, existe uma infinidade 
de valores que a variável pode assumir. 
• Exemplo: estrutura fundiária (hectare) de propriedades 
rurais de uma microbacia. Nota-se que as únicas “classes 
naturais” que existem são aquelas determinadas pela 
precisão do aparelho de medida. 
 
E
st
a
tí
st
ic
a
 B
á
si
ca
 –
 A
d
m
in
is
tr
aç
ão
/U
F
F
S
 
Pr
of
a.
 I
ar
a 
E
nd
ru
w
e
it
 B
at
ti
st
i 
Organização de dados – Variáveis 
quantitativas 
6 
• Uma tabela de distribuição de freqüência é 
utilizada para representar respostas de uma 
variável quantitativa quando o tamanho do 
conjunto de dados é maior ou igual a 20 (n ≥ 
20). 
• Nesse tipo de tabela os valores são agrupados 
em intervalos. 
• A tabela de distribuição de freqüências é 
construída tendo como base um conjunto de 
classe ou intervalos. Os intervalos são 
divisões de valores que permitem agrupar ou 
contabilizar todos os dados observados. Cada 
valor observado só pode estar um dos 
intervalos definidos. 
 
4 
E
st
a
tí
st
ic
a
 B
á
si
ca
 –
 A
d
m
in
is
tr
aç
ão
/U
F
F
S
 
Pr
of
a.
 I
ar
a 
E
nd
ru
w
ei
t 
B
at
ti
st
i 
Organização de dados – Variáveis 
quantitativas 
7 
• O número de intervalos que serão utilizados 
para construir a tabela pode ser definido de 
forma aleatória, porém em determinados 
casos o uso de poucos ou muitos intervalos 
podem esconder informações relevantes 
sobre os dados. Para evitar estes problemas 
existe uma pequena fórmula para calcular a 
amplitude dos intervalos de acordo com a 
quantidade de dados existentes e amplitude 
total dos dados. A fórmula é a seguinte: 
 
n
At
hi 
E
st
a
tí
st
ic
a
 B
á
si
ca
 –
 A
d
m
in
is
tr
aç
ão
/U
F
F
S
 
Pr
of
a.
 I
ar
a 
E
nd
ru
w
e
it
 B
at
ti
st
i 
Distribuição de frequência 
8 
• Porém, o primeiro procedimento a ser tomado 
para a elaboração de uma tabela de 
distribuição de frequência de uma variável 
contínua consiste na ordenação dos dados, 
para facilitar o trabalho posteriormente. 
 
• Amplitude total; 
• Amplitude de classe (de intervalo); 
• Limite inferior dos dados; 
• Limite superior dos dados; 
 
5 
E
st
a
tí
st
ic
a
 B
á
si
ca
 –
 A
d
m
in
is
tr
aç
ão
/U
F
F
S
 
Pr
of
a.
 I
ar
a 
E
nd
ru
w
ei
t 
B
at
ti
st
i 
Distribuição de frequência 
9 
• Exemplo: um levantamento foi feito acerca da 
estrutura fundiária de uma microbacia (áreas 
das propriedades rurais em hectares), 
obtendo-se o resultado a seguir: 
12 62 127 151 219 294 365 454 612 
32 78 135 158 231 305 378 489 655 
36 93 139 164 257 319 391 526 757 
55 114 144 180 279 326 426 547 786 
58 121 145 202 283 338 432 584 875 
E
st
a
tí
st
ic
a
 B
á
si
ca
 –
 A
d
m
in
is
tr
aç
ão
/U
F
F
S
 
Pr
of
a.
 I
ar
a 
E
nd
ru
w
e
it
 B
at
ti
st
i 
Distribuição de frequência 
10 
• Tabela de distribuição de frequências 
 
Áreas (hectare) das propriedades rurais 
Área fi fa fr fr% frac% xi 
12 |--- 141 
141 |--- 270 
270 |--- 399 
399 |--- 528 
528 |--- 657 
657 |--- 786 
786 |---915 
Total 
6 
E
st
a
tí
st
ic
a
 B
á
si
ca
 –
 A
d
m
in
is
tr
aç
ão
/U
F
F
S
 
Pr
of
a.
 I
ar
a 
E
nd
ru
w
ei
t 
B
at
ti
st
i 
Distribuição de frequência 
11 
• Tabela de distribuição de frequências 
 
Áreas (hectare) das propriedades rurais 
Área fi fa fr fr% frac% xi 
12 |--- 141 13 
141 |--- 270 10 
270 |--- 399 10 
399 |--- 528 5 
528 |--- 657 4 
657 |--- 786 1 
786 |---915 2 
Total 45 
E
st
a
tí
st
ic
a
 B
á
si
ca
 –
 A
d
m
in
is
tr
aç
ão
/U
F
F
S
 
Pr
of
a.
 I
ar
a 
E
nd
ru
w
e
it
 B
at
ti
st
i 
Distribuição de frequência 
12 
• Tabela de distribuição de frequências 
 
Áreas (hectare) das propriedades rurais 
Área fi fa fr fr% frac% xi 
12 |--- 141 13 13 0,2889 28,89 28,89 76,5 
141 |--- 270 10 23 0,2222 22,22 51,11 205,5 
270 |--- 399 10 33 0,2222 22,22 73,33 334,5 
399 |--- 528 5 38 0,1111 11,11 84,44 463,5 
528 |--- 657 4 42 0,0889 8,89 93,33 592,5 
657 |--- 786 1 43 0,0222 2,22 95,56 721,5 
786 |---915 2 45 0,0444 4,44 100,00 850,5 
Total 45 - 1,0000 100,00 - - 
7 
E
st
a
tí
st
ic
a
 B
á
si
ca
 –
 A
d
m
in
is
tr
aç
ão
/U
F
F
S
 
Pr
of
a.
 I
ar
a 
E
nd
ru
w
ei
t 
B
at
ti
st
i 
Distribuiçãode frequência 
13 
• Tabela de distribuição de frequências 
 
• Os valores adicionados a tabela são: 
• fi = frequência absoluta simples. Representa o número de 
valores existente em cada intervalo. Para o primeiro intervalo 
fi =13. Também pode ser representado por “n”. 
 
• fa = freqüência absoluta simples acumulada. Representa o 
número de dados até o limite superior do intervalo 
considerado. Por exemplo, a fa do segundo intervalo é igual a 
fi do primeiro intervalo mais a fi do segundo intervalo (13 + 
10 = 23). A fa do terceiro intervalo é fi do primeiro intervalo 
+ fi do segundo intervalo + fi do terceiro intervalo (13+10+10). 
 
• fr = freqüência relativa. É a fi do intervalo considerado 
dividida pelo total da fi (total da fi = 45). A fi do primeiro 
intervalo é 13/45 = 0,2889. 
 
 
E
st
a
tí
st
ic
a
 B
á
si
ca
 –
 A
d
m
in
is
tr
aç
ão
/U
F
F
S
 
Pr
of
a.
 I
ar
a 
E
nd
ru
w
e
it
 B
at
ti
st
i 
Distribuição de frequência 
14 
• Tabela de distribuição de frequências 
 
• fr% = freqüência relativa percentual. É a fr do intervalo 
multiplicado por 100. Para o primeiro intervalo 0,2889 x 100 = 
28,89 
 
• frac% = freqüência relativa acumulada percentual. 
Representa o valor, em percentual, até o limite superior do 
intervalo considerado. A frac% do segundo intervalo, por 
exemplo, é igual a fr% do primeiro intervalo mais a fr% do 
segundo intervalo (28,89+22,22 = 51,11). 
 
• xi = ponto médio do intervalo. É o valor médio entre o limite 
inferior e o limite superior do intervalo. Por exemplo: 
(12+141)/2=76,5 é o ponto médio do primeiro intervalo. 
 
 
 
8 
E
st
a
tí
st
ic
a
 B
á
si
ca
 –
 A
d
m
in
is
tr
aç
ão
/U
F
F
S
 
Pr
of
a.
 I
ar
a 
E
nd
ru
w
ei
t 
B
at
ti
st
i 
Distribuição de frequência 
15 
• Tabela de distribuição de frequências 
 
• Se ocorrer um intervalo com fi =0, isto é, um intervalo que 
não contém valores e no intervalo seguinte ocorrer somente 
um ou dois valores então suspeita-se que esse ou esses 
valores são outlier. 
 
 
 
E
st
a
tí
st
ic
a
 B
á
si
ca
 –
 A
d
m
in
is
tr
aç
ão
/U
F
F
S
 
Pr
of
a.
 I
ar
a 
E
nd
ru
w
e
it
 B
at
ti
st
i 
Organização de dados 
16 
• OUTLIER 
• Se ocorrer um intervalo com fi =0, isto é, um intervalo que 
não contém valores e no intervalo seguinte ocorrer 
somente um ou dois valores então suspeita-se que esse ou 
esses valores são outlier. 
Outlier é um valor muito diferenciado 
dos demais, é um valor extremo, muito 
alto ou muito baixo. Também, pode 
existir mais que um valor outlier. 
9 
E
st
a
tí
st
ic
a
 B
á
si
ca
 –
 A
d
m
in
is
tr
aç
ão
/U
F
F
S
 
Pr
of
a.
 I
ar
a 
E
nd
ru
w
ei
t 
B
at
ti
st
i 
Distribuição de frequência 
17 
• Histograma 
0
2
4
6
8
10
12
14
12 |--- 141 141 |--- 270 270 |--- 399 399 |--- 528 528 |--- 657 657 |--- 786 786 |---915
n 
Área (hectare) 
Área (hectare) das propriedades rurais de 
uma microbacia 
E
st
a
tí
st
ic
a
 B
á
si
ca
 –
 A
d
m
in
is
tr
aç
ão
/U
F
F
S
 
Pr
of
a.
 I
ar
a 
E
nd
ru
w
e
it
 B
at
ti
st
i 
Distribuição de frequência 
18 
• Polígono de frequências 
0
2
4
6
8
10
12
14
-52,5 76,5 205,5 334,5 463,5 592,5 721,5 850,5 979,5
fi 
xi 
Área (hectare) das propriedades rurais de 
uma microbacia 
10 
E
st
a
tí
st
ic
a
 B
á
si
ca
 –
 A
d
m
in
is
tr
aç
ão
/U
F
F
S
 
Pr
of
a.
 I
ar
a 
E
nd
ru
w
ei
t 
B
at
ti
st
i 
Distribuição de frequência 
19 
• Polígono de frequência acumulada 
0
5
10
15
20
25
30
35
40
45
50
12 141 270 399 528 657 786 915
fa 
Hectare 
Área (hectare) das propriedades rurais de 
uma microbacia 
E
st
a
tí
st
ic
a
 B
á
si
ca
 –
 A
d
m
in
is
tr
aç
ão
/U
F
F
S
 
Pr
of
a.
 I
ar
a 
E
nd
ru
w
e
it
 B
at
ti
st
i 
Distribuição de frequência 
20 
• Natureza da distribuição 
• O objetivo de uma distribuição de frequências é o de 
evidenciar o comportamento global da variável em 
questão. A natureza desse comportamento pode ser 
simétrica, assimétrica à direita ou assimétrica à esquerda, 
conforme figura abaixo. Existem maneiras de quantificar 
essa assimetria. 
 simétrica assimétrica assimétrica 
 a direita a esquerda

Outros materiais

Perguntas relacionadas

Perguntas Recentes