Apostila de Estatística - Gazola
112 pág.

Apostila de Estatística - Gazola


DisciplinaEstatística I22.917 materiais112.298 seguidores
Pré-visualização21 páginas
ou fi %): É a proporção ou percentual de dados em cada 
classe, dada pela expressão: fi=Fi/n ou fi%=(Fi/n).100 
l) Frequências absolutas acumuladas percentuais (Fai %): Traduzem a percentagem de 
dados acumulados até a classe \u201c i \u201d: Fai%=(Fai/n).100 
 
Exemplo 3.3 Vamos construir a tabela de distribuição de frequências para os pesos (kg) de 
28 alunos de certa universidade. 
58 49 65 79 73 84 81 
76 67 63 52 61 48 55 
63 75 81 52 66 68 74 
70 69 72 58 67 67 60 
 
a) Colocamos os dados em ordem crescente (rol). 
48 55 61 66 68 73 79 
49 58 63 67 69 74 81 
52 58 63 67 70 75 81 
52 60 65 67 72 76 84 
 
b) Calculamos a amplitude total (AT): AT = xmáx-xmín=84-48=36 kg 
c) Definimos o número de classes (k): k n 28 5,29= = = . 
 25
Podemos considerar 5 ou 6 classes. Vamos usar 6 classes. 
d) Determinamos o tamanho da classe (h): h = AT/k=36/6=6. 
e) Construímos a tabela de distribuição de frequências e determinamos as frequências 
absolutas de classes (FI): Por exemplo, na primeira classe existem 4 valores: 48, 49, 52, 52. 
 
Tabela 3.5 Distribuição de frequências para os pesos (kg) de 28 alunos de uma certa 
universidade. 
Peso em kg Frequência (FI) 
48 \u251c\u2500\u2500\u2500 54 
54 \u251c\u2500\u2500\u2500 60 
60 \u251c\u2500\u2500\u2500 66 
66 \u251c\u2500\u2500\u2500 72 
72 \u251c\u2500\u2500\u2500 78 
78 \u251c\u2500\u2500\u2500\u252484 
4 
3 
5 
7 
5 
4 
Total 28 
 
Colunas complementares na tabela de distribuição de frequências: 
 
f) Calculamos o ponto médio de cada classe (xi): x1=(L1+l1)/2=(54+48)/2=51. Assim, 
procedemos para cada classe. 
g) Calculamos as frequências absolutas acumuladas (Fai): o valor acumulado da primeira 
classe consiste no valor da frequência absoluta, o valor acumulado da segunda classe é a 
soma dos valores das frequências absolutas da primeira e segunda, e, assim, 
sucessivamente se acumula o número de dados de uma dada classe acrescido de todos os 
dados das classes anteriores. 
 
Tabela 3.6 Distribuição de frequências e colunas complementares para os pesos (kg) de 
28 alunos de uma certa universidade. 
Peso em kg Frequência (FI) 
Ponto 
Médio (xi) Fai fi fi% Fai% 
48 \u251c\u2500\u2500\u2500 54 
54 \u251c\u2500\u2500\u2500 60 
60 \u251c\u2500\u2500\u2500 66 
66 \u251c\u2500\u2500\u2500 72 
72 \u251c\u2500\u2500\u2500 78 
78 \u251c\u2500\u2500\u2500\u252484 
4 
3 
5 
7 
5 
4 
51 
57 
63 
69 
75 
81 
4 
7 
12 
19 
24 
28 
0,143 
0,107 
0,179 
0,250 
0,179 
0,143 
14,3 
10,7 
17,9 
25,0 
17,9 
14,3 
14,3 
25,0 
42,9 
67,9 
85,8 
100,0 
Total 28 1,000 100,0 
 
 26
h) Calculamos as frequências relativas (fi ou fi %): f1=F1/n=4/28=0,143, ... 
f6=F6/n=4/28=0,143. Em percentual, multiplicamos por 100 a fi. 
i) Calculamos as frequências absolutas acumuladas percentuais (Fai%): 
Fa1%=(Fa1/n)100=(4/28)100=14,3% ... Fa6%=(Fa6/n)100=100,0% 
 
Construção de Gráficos de Distribuição de Frequências em Classes. 
 
A representação gráfica é feita de três formas: 
Histogramas: As classes da distribuição de frequências são representadas por colunas 
justapostas, cujas alturas são definidas pelas respectivas frequências absolutas (Fi). O 
histograma é construído sobre os intervalos de classe e as áreas dos retângulos que o 
compõem representam proporcionalmente os dados cujos valores ocorrem em cada classe. 
 
Polígonos de frequências: É um gráfico de área construído unindo-se os pontos (xi ; Fi) 
onde xi são os pontos médios dos intervalos de classe e Fi são as frequências absolutas das 
classes. Cria-se no eixo das abcissas um ponto médio aquém do menor valor de xi e outro 
além do maior valor de xi, para que o polígono fique definido e tenha equivalência de área 
com o histograma da mesma distribuição. Suavizando a linha poligonal que define o 
polígono obtém-se uma curva que visualiza a tendência de variação dos dados. 
 
Polígonos de frequências acumuladas ou ogivas: As ogivas (mais utilizadas) são 
construídas unindo os pontos (Li ; Fai) ou (Li ; Fai%), onde Li são os extremos superiores 
dos intervalos de cada classe. 
 
Para a tabela 3.4 os gráficos são apresentados nas Figuras 3.5, 3.6 e 3.7. 
2 3
10
15
29
18
11
7
4
1
0
5
10
15
20
25
30
35
50 55 60 65 70 75 80 85 90 95 100
Peso em kg
Fr
eq
üê
n
ci
a
 
 27
Figura 3.5 Histograma de frequências dos pesos dos alunos da disciplina 
de estatística da UEM, 2004. 
 
0
5
10
15
20
25
30
35
47
,
5
52
,
5
57
,
5
62
,
5
67
,
5
72
,
5
77
,
5
82
,
5
87
,
5
92
,
5
97
,
5
10
2,
5
Peso em kg
Fr
eq
u
en
ci
a
 
Figura 3.6 Polígono de frequências dos pesos dos alunos da disciplina de 
estatística da UEM, 2004. 
 
0 2 5
15
29
59
77
88 95
99 100
0
20
40
60
80
100
120
50 55 60 65 70 75 80 85 90 95 100
Peso em kg
Fr
eq
u
ên
ci
a
 
Figura 3.7 Polígono de frequências acumuladas dos pesos dos alunos da 
disciplina de estatística da UEM, 2004. 
 
 
 
 
 
 
 
 
 
 
 
 28
EXERCÍCIOS 
 
1) Numa pesquisa por amostragem, realizada com 25 pessoas em um supermercado, 
levantaram-se as seguintes informações: 
Aluno Número de 
pessoas na 
família 
Sexo Grau de 
escolaridade 
Idade Renda 
familiar 
(R$) 
1 3 M Fundamental 32 1200 
2 2 F Médio 45 1500 
3 4 F Fundamental 38 1000 
4 3 M Fundamental 35 950 
5 5 M Médio 41 750 
6 2 M Superior 40 1800 
7 1 F Superior 39 2200 
8 1 F Superior 33 1100 
9 2 M Médio 36 1600 
10 2 F Fundamental 35 2000 
11 5 M Superior 33 1250 
12 3 F Fundamental 40 1400 
13 7 M Médio 42 1800 
14 4 M Superior 45 1700 
15 6 F Fundamental 36 1700 
16 6 M Médio 40 1500 
17 5 F Médio 36 2000 
18 4 F Superior 38 1700 
19 2 M Superior 43 1800 
20 3 F Fundamental 38 2100 
21 3 F Médio 41 2000 
22 3 M Superior 35 1300 
23 4 M Médio 40 1500 
24 3 F Superior 34 1200 
25 4 F Médio 41 1500 
 
a) Classificar o tipo de cada variável. 
b) Construir uma tabela de distribuição de frequências adequada para cada variável. 
b) Construir os gráficos adequados para cada variável. 
 
 
 
 
 
 
 29
Capítulo 4 
 
 
 
 
 
 
 
 
 
ANÁLISE DE DADOS 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 30
4.1 MEDIDAS DE POSIÇÃO OU DE TENDÊNCIA CENTRAL 
 
São medidas que objetivam representar, através de um só número, características 
quantitativas dos dados. São elas: a média, a mediana e a moda. 
 
a) Média. Representa o ponto de equilíbrio de um conjunto de dados. Seja (x1,...,xn ) um 
conjunto de dados. 
Média da amostra: 
n
x
x
i\u2211
= e Média da população: 
N
x
µ
i\u2211
= 
Para obtemos a média em tabelas de distribuição de frequências usamos a seguinte 
expressão: 
\u2211
\u2211
=
i
ii
F
F x
x . 
- Para tabelas sem intervalos de classe, xi são os valores da variável. 
- Para tabelas com intervalos de classe, xi corresponde ao ponto médio do intervalo. 
Algumas propriedades da média: 
1) A soma algébrica dos desvios (di) tomados em relação a média é nula. 
di = xi - x e \u2211
=
k
1i
di = 0 
2) Somando ou subtraindo uma constante (c) a todos os valores de uma variável, a média 
do conjunto fica aumentada ou diminuída dessa constante. 
yi = xi ± c \u21d2 y = x ± c 
3) Multiplicando ou dividindo todos os valores de uma variável por uma constante (c), a 
média do conjunto fica multiplicada ou dividida por essa constante. 
yi = xi . c \u21d2 y = x . c e 
c
xy
c
xy ii =\u21d2= 
 
b) Moda. É o valor que ocorre com maior frequência em um conjunto de dados. Existem 
séries em que nenhum valor aparece mais vezes que outros (séries amodais). Em outros 
casos, pode aparecer dois (bimodal), três (trimodal), ou mais valores de concentração. 
Para localizar o valor da moda, usamos os dados em rol. 
A moda de dados de tabelas de distribuição de frequências