Buscar

Aula Teórica 2_Tema 2-Apresentação de dados e distribuição de frequência2

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

UNIVERSIDADE EDUARDO MONDLANE
FACULDADE DE VETERINÁRIA
BIOESTATÍSTICA 
	Tema 2
	Apresentação de dados e distribuição de frequências
Frequências absolutas, relativas e acumuladas
	
	Aula Teórica 02
2. Introdução
Ao colectar os dados referentes ao fenómeno objecto de estudo, normalmente o Analista se defronta com valores que se repetem algumas ou muitas vezes, sugerindo sua apresentação através de tabelas, onde somente apareçam valores distintos uns aos outros. Essa providência favorece evidentemente uma análise e interpretação mais rápida da natureza e comportamento do fenómeno observado.
Um dos objectivos da Estatística Descritiva quando se trabalha com grandes quantidades de dados é obter uma significativa redução dos mesmos dados, para facilitar a sua análise.
Neste caso, a Distribuição de Frequência é uma ferramenta estatística apropriada para a apresentação de grandes massas de dados, numa forma que torna mais clara a tendência central e a dispersão dos valores ao longo da escala de medição, bem como a frequência relativa de ocorrência dos diferentes valores.
2.1. Alguns conceitos importantes
Para que se possa organizar os dados em frequência é necessário que eles estejam na sua forma bruta.
Dados brutos – são os dados originais, que ainda não se encontram prontos para análise, por não estarem numericamente organizados. (Também são conhecidos como Tabela Primitiva).
Exemplo 1: Considere o conjunto dos pesos (em kg) de 20 sacos de feijão, seleccionados em um celeiro de produtor local, em Mecanhelas, na província do Niassa.
45, 41, 42, 41, 42 43, 44, 41, 50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51
Depois de obter os dados brutos no campo, é importante organiza-los em rol.
O Rol é uma lista em que os valores númericos brutos estão dispostos em uma determinada ordem, crecente ou decrescente.
Exemplo 2: Apresentando em ordem crescente o conjunto dos pesos dos 20 sacos de feijão do exemplo anterior temos: 
41, 41, 41, 42, 42 43, 44, 45, 46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60.
Existem 4 tipos de frequências pela qual podemos apresentar os dados
i. 
Frequência simples ou absoluta (): é o valor que representa o número de observações em uma determinada classe ou em um determinado atributo de uma variável qualitativa. A soma das frequências simples é igual ao número total dos dados da distribuição.
ii. 
Frequência relativa (): é o valor da razão (proporção) entre a frequência absoluta em uma determinada classe e a frequência total da distribuição. A soma das frequências relativas é igual a 1 (100%).
iii. 
Frequência simples acumulada de uma classe (): é o total das frequências de todos os valores inferiores ao limite superior do intervalo de uma determinada classe.
iv. 
Frequência relativa acumulada de uma classe (): é a frequência acumulada da classe, dividida pela frequência total da distribuição.
2.2. Distribuição de frequências de dados não agrupados em classe
É a simples condensação dos dados conforme as repetições de seus valores. Este tipo de apresentação é utilizado para representar uma variável discreta ou contínua. Para uma tabela de tamanho razoável, esta distribuição de frequência é inconveniente, já que exige muito espaço. 
Na primeira coluna, encabeçado pelo índice i, aparecem os números correspondentes à ordem dos valores da variável. Na segunda coluna, encabeçada por xi, são anotados em ordem crescente apenas os valores distintos da variável.
A terceira coluna é uma coluna auxiliar (opcional), utilizada para que se possa processar a contagem dos valores repetidos, sem grande esforço.
A última coluna, encabeçada por fi, apresenta as frequências, que são os resultados numéricos provenientes da contagem. A soma de frequências é sempre igual ao número total de valores observados: 
k: é o extremo superior do intervalo de valores do índice i.
fi,:é o número de observações de um valor
n: é o número total de valores observados.
Exemplo 3: Considerando o exemplo anterior, sobre o peso dos 20 estudantes, a tabela de distribuição de frequência será:
	
	
	
Frequências 
	1
	41
	3
	2
	42
	2
	3
	43
	1
	4
	44
	1
	5
	45
	1
	6
	46
	2
	7
	50
	2
	8
	51
	1
	9
	52
	1
	10
	54
	1
	11
	57
	1
	12
	58
	2
	13
	60
	2
	Soma
	---------
	20
Tabela1. Exemplo da distribuição de frequência de uma variável não agrupada em classe
2.3. Distribuição de frequências de dados agrupados em classe
Quando a variável objecto do estudo é contínua, é sempre conveniente agrupar os valores observados em classes. Se por outro lado, a variável é discreta e o número de valores representativos dessa variável é muito grande, recomenda-se o agrupamento dos dados em classes.
Neste último caso, o procedimento visa evitar certos inconvenientes, como:
· Grande extensão da tabela, dificultando, tanto quanto os dados brutos, a leitura e a interpretação dos resultados apurados;
· Aparecimento de diversos valores da variável com frequência nula;
· Dificuldade de visualização do comportamento do fenómeno como um todo.
Usando os dados do exemplo 1, abaixo a distribuição dos mesmos em classes
	
	Classes
	
Frequências 
	1
	41 |------ 45
	7
	2
	45 |------ 49
	3
	3
	49 |------ 53
	4
	4
	53 |------ 57
	1
	5
	57 |------ 61
	5
	Total
	
	20
2.3.1. Elementos de uma distribuição de frequência com classe
i. Classe: Intervalos nos quais os valores da variável analisada são agrupados. Cada classe é simbolizada por (i) e o número total de classe é simbolizado por (k).
Ex: na tabela anterior k=5 e 49 |------- 53 é a 3ª classe, onde i=3.
ii. 
Limites da classe: são extremos de cada classe. O menor número é o limite inferior de classe e o maior número, o limite superior de classe .
Deste modo, o intervalo de classe quanto a sua natureza pode ser aberto, fechado ou misto.
a. Intervalos abertos – os limites da classe (inferior e superior) não pertencem a ela. Exemplo de notação: 49 --- 53
b. Intervalos fechados – os limites de classe (superior e inferior) pertencem à classe em questão. Exemplo de notação: 49 |-----|53 
c. Intervalos mistos – um dos limites pertence à classe, e o outro, não. Exemplo de notação: 49 |-----53 ou 49 ----|53.
iii. Cálculo de número total de classes
Para montar uma distribuição de frequência é necessário que primeiro se determine o número de classes (k) em que os dados serão agrupados.
Não existe regra fixa para se determinar o número de classes (k). Contudo, neste material são apresentadas algumas:
Regra 1: Por questões de ordem prática e estética sugere-se utilizar de 5 a 20 classes;
Regra 2: o uso da fórmula de Sturges, que nos dá o número de classe em função do número de valores da variável: onde n é o número de itens que compõe a amostra
Regra 3: Se onde n é o número total de observações
Nota: De um modo geral, na resolução dos exercícios iremos usar a regra 2 e/ou regra 3, para determinar o número de classe em função do número de observações (n).
Exemplo 4: considerando os dados do exemplo 1 podemos obter o número total de classe:
Temos que n=20 então, pela regra 2, K=1+3.3*log20= 1+3.3*1.3= 5.29 5
iv. Amplitude Total ou “Range” (At) é a diferença entre o maior e o menor número do rol. A amplitude total pode ser denotada por: 
Exemplo 5: o maior peso dos 20 estudantes é de 60 kg e o menor peso é de 41 kg, a amplitude total será de 19 kg porque ( 60 kg - 41 kg= 19 kg).
v. Amplitude do intervalo de classe (c): é o valor que representa a quantidade de números que se encontram entre o limite inferior e limite superior de uma classe, e é constante em todas as classes de uma mesma distribuição de frequências.
A fórmula para o cálculo da c é: 
Onde: c – é a amplitude de classe; At – é a amplitude total de classe e k – é o nº total de classes.
Nota: Na prática, é comum considera-se Xmin como limite inferior da 1ª Classe. Quando assim é, o intervalo de classe de ser calculado usando: c = .
Exemplo 6: o c para o exemplo em estudo é: 
vi. Ponto Médio de classe (PM): é o valor que se encontra no meio dos limites de cada classe
, onde Lsup= Limite superior daclasse; Linf= Limite inferior da classe;
Assim, o limite inferior da primeira classe será:
, onde Xmin é o menor valor de todas as observações da amostra.
E os demais limites são obtidos somando-se c ao limite anterior.
Exemplo 7: Elaboração de uma distribuição de frequências com classes.
Os dados da tabela abaixo foram obtidos em uma pesquisa de mercado e correspondem ao tempo (T) em minutos que consumidores (C) de uma determinada operadora de telefonia móvel utilizariam em um mês. Elabore uma distribuição de frequências com classe.
	C
	T
	C
	T
	C
	T
	C
	T
	C
	T
	1
	104
	9
	122
	17
	129
	25
	144
	33
	183
	2
	108
	10
	142
	18
	138
	26
	151
	34
	138
	3
	138
	11
	106
	19
	122
	27
	146
	35
	115
	4
	101
	12
	201
	20
	161
	28
	82
	36
	179
	5
	163
	13
	169
	21
	167
	29
	137
	37
	142
	6
	141
	14
	120
	22
	189
	30
	132
	38
	111
	7
	90
	15
	210
	23
	132
	31
	172
	39
	140
	8
	154
	16
	98
	24
	127
	32
	87
	40
	136
Resolução: Passos para elaboração de uma distribuição de frequências com classes.
Primeiro passo: Organizar os dados brutos em um ROL crescente:
	82
	111
	132
	142
	167
	87
	115
	136
	142
	169
	90
	120
	137
	144
	172
	98
	122
	138
	146
	179
	101
	122
	138
	151
	183
	104
	127
	138
	154
	189
	106
	129
	140
	161
	201
	108
	132
	141
	163
	210
Segundo passo: Calcular a amplitude total At:
; então 
Terceiro passo: calcular o número total de classe (k) 
O número de observações da amostra (n) é 40, então 
 ou pelo Sturges
Quarto passo: conhecido o número de classe, calcular a amplitude de cada classe:
Quinto passo: calcular o limite inferior da primeira classe:
Sexto passo: Determinar os intervalos de classes:
69.2 |--- 94.8
94.8 |--- 120.4
120.4 |--- 146.0
146.0 |--- 171.6
171.6 |--- 197.2
197.2 |--- 222.8
Apresentar a tabela com as classes e respectivas frequências
	i
	classe
	
(consumidores)
	
	
(proporção)
	
	1
	69.2|---94.8
	3
	3
	0.075
	0.075
	2
	94.8|---120.4
	8
	11
	0.200
	0.275
	3
	120.4|---146.0
	16
	27
	0.400
	0.675
	4
	146.0|---171.6
	7
	34
	0.175
	0.850
	5
	171.6|---197.2
	4
	38
	0.100
	0.950
	6
	197.2|---222.8
	2
	40
	0.050
	1.000
	Total
	-------
	40
	
	1.000
	
Docente: Paulo Ziaveia / Elísio Mabasso	1
i
f
r
f
i
F
r
F
n
f
k
i
i
=
å
=
1
i
i
x
(
)
i
f
(
)
i
f
(
)
inf
L
(
)
sup
L
n
k
log
*
3
.
3
1
+
=
î
í
ì
=
®
³
=
®
<
n
k
n
k
n
25
5
25
»
min
max
X
X
A
t
-
=
1
-
=
k
A
c
t
75
.
4
1
5
19
=
-
=
c
2
inf
sup
L
L
PM
+
=
2
min
inf
1
c
X
L
-
=
minutos
82
min
=
X
210
max
=
X
min
128
82
210
min
max
=
-
=
-
=
X
X
A
t
6
32
.
6
40
»
=
=
=
n
k
classes
6
28
.
6
6
.
1
*
3
.
3
1
40
log
*
3
.
3
1
log
*
3
.
3
1
»
=
+
=
+
=
+
=
n
K
min
6
.
25
1
6
128
1
=
-
=
-
=
k
A
c
t
2
.
69
8
.
12
82
2
6
.
25
82
2
min
inf
=
-
=
-
=
-
=
c
X
L
i
f
i
F
r
f
r
F

Continue navegando