Buscar

CARACTERÍSTICAS DAS DISTRIBUIÇÕES DE FREQÜÊNCIAS

Prévia do material em texto

3. CARACTERÍSTICAS DAS DISTRIBUIÇÕES DE FREQÜÊNCIAS 
 
MEDIDAS DE POSIÇÃO OU DE TENDÊNCIA CENTRAL 
 
 Utilizando essas medidas podemos localizar o valor representativo do qual os dados 
tendem a agrupar-se, com maior ou menor freqüência. Isto é, se a concentração de dados se 
localiza no início, no meio, ou no final da distribuição, ou ainda, se há uma distribuição por 
igual dos dados. 
 
Média Aritmética ( X ) 
 
 É a mais importante das medidas de posição, além de ser um conceito muito familiar. 
Quando se fala, por exemplo, em altura média de um grupo de pessoas, ou da temperatura 
média numa cidade em determinado dia, ou da nota média de uma turma de alunos de 
estatística, etc, estamos tratando simplesmente de média aritmética. 
• Média Aritmética para Dados Não Agrupados: sejam x1, x2, x3,...,xn, portanto, n valores 
da variável X. Então: 
∑∑∑∑====
====
n
1i
ix
n
1X 
 
• Média Aritmética para Dados Agrupados: sendo assim, usaremos a média aritmética 
dos valores x1, x2, x3,...,xn, ponderados pelas respectivas freqüências absolutas (F1, F2, 
F3,...,Fn). Então: 
i
k
1i
i Fx
n
1X ∑=
=
 
No caso em que a tabela é divida em classes, usaremos como os “Xi’s”, os pontos médios de 
cada classes. 
 
 
 
Mediana ( x~ ou Med ) 
 
Colocando os valores em ordem crescente, mediana é o elemento que ocupa a posição 
central, ou seja, divide o conjunto de valores deixando 50% deles abaixo do seu valor e 50% 
acima. 
• Mediana para Dados Não Agrupados: para a série 5, 7, 8, 10 e 14, a mediana será 8. 
Indica-se x~ = Med = 8. 
Para a série 5, 7, 8, 10, 15, 17, a mediana será (8+10)/2, ou seja, x~ = 9. 
Percebemos que precisamos considerar dois casos: 
� n par: sendo assim a mediana será o valor que ocupa a posição entre 
2
n
 e .1
2
n
+ 
� n ímpar: neste caso, a mediana será o valor que ocupa a posição 
2
1n +
. 
 
• Mediana para Dados Agrupados em classes: 
 
1o PASSO: calcule 
2
n
, como a variável aleatória é contínua não se preocupe se n é par ou 
ímpar. 
2o PASSO: pela freqüência acumulada identifica-se a classe que contém a mediana. 
3o PASSO: utiliza-se a fórmula: 
 
2
.
i
med
med
n F
x l c
F
 
− 
 
= +
∑
ɶ
 
 
Em que: 
Lmed é o limite inferior da classe da mediana; 
∑ iF é a soma das freqüências anteriores a classe da mediana; 
Fmed é a freqüência absoluta da classe da mediana. 
c é a amplitude da classe da mediana. 
3.1.3 Separatrizes 
 
3.1.3.1 Quartis 
 Os quartis dividem um conjunto de dados em 4 partes iguais. Assim: 
Q1: é o primeiro quartil, e deixa 25% dos dados abaixo de seu valor; 
Q2: é o segundo quartil, e deixa 50% dos dados abaixo de seu valor (coincide com a mediana) 
Q3: é o terceiro quartil, e deixa 75% dos dados abaixo de seu valor. 
 
 
Os quartis são dados por: 
 
1
1
1
4
.
i
Q
Q
n F
Q l c
F
 
− 
 
= +
∑
 ; 
2
2
2
2
.
i
Q
Q
n F
Q l c
F
 
− 
 
= +
∑
 ; 
3
3
3
3
4
.
i
Q
Q
n F
Q l c
F
 
− 
 
= +
∑
 
 
3.1.3.2 Percentis 
 
 São medidas que dividem a série em 100 partes iguais. Assim: 
Em que: 
100
.
i
i
i
i P
P
in F
P l c
F
 
− 
 
= +
∑
 
 
Moda (Mo) 
 
 Denominamos moda o valor que ocorre com maior freqüência em uma série de valores. 
Obs: Quando todos os dados aparecem uma única vez (ou seja Fi=1 para todo Xi da amostra) 
dizemos que o conjunto é amodal; Quando dois valores ocorrem com freqüência máxima 
dizemos que o conjunto é bimodal. Se mais de dois valores ocorrem com frequência máxima 
dizemos que multimodal. 
Para dados agrupados em classes usamos a seguinte fórmula: 
1
1 2
.
oo M
M l c∆= +
∆ + ∆ 
Onde: 
∆1 é a diferença entre a freqüência da classe modal e a imediatamente anterior. 
∆2 é a diferença entre a freqüência da classe modal e a imediatamente posterior. 
h é a amplitude da classe modal. 
 
Características da Média, Mediana e Moda 
 
A média é uma medida mais estável do que a mediana e a moda. 
A média é preferível às demais medidas, para estimar a tendência central, quando se 
trata de muitas classes de populações, por haver menos variabilidade entre as médias 
calculadas a partir de várias amostras aleatórias. Pode ser calculada a partir dos dados 
brutos, sem recorrer a qualquer tipo de agrupamento ou ordenação, o que não ocorre com a 
mediana e a moda. É utilizada para medir a variabilidade da amostra. 
Em distribuições de freqüências onde ocorram classe com limites indefinidos a não há 
dificuldades para determinar mediana e a moda, todavia a média não pode ser determinada 
com exatidão. 
A mediana é preferível a média quando se está interessado em conhecer exatamente o 
ponto médio da distribuição, aquele valor que distribui em duas partes iguais, e ainda, 
quando os dados extremos são tais que possam afetar sensivelmente a média. 
A moda é utilizada essencialmente quando pretendemos uma medida rápida e 
aproximada da tendência central. (não levando em consideração a variabilidade da amostra). 
A média é afetada pelos extremos (xmax e xmin). A moda e a mediana não são afetadas 
pelos extremos. 
 
MEDIDAS DE DISPERSÃO 
Quase nunca uma única medida é suficiente para descrever de modo satisfatório um 
conjunto de dados. Tomemos como exemplo o caso da média aritmética, que é uma medida de 
posição, largamente empregada, e consideremos os dois conjuntos de observações: 
 
A: {24 25 25 26 27 29} e B: {15 17 25 28 35 36} 
 
Ambos têm a mesma média, 26. No entanto, percebe-se intuitivamente que o conjunto B 
acusa dispersão muito maior do que o conjunto A. Torna-se então necessário estabelecer 
medidas que indiquem o grau de dispersão, ou variabilidade, em relação ao valor central. 
Amplitude Total 
A amplitude total é a diferença entre o maior e o menor dos valores da série, ou seja: 
A = xmáx − xmín 
Esta é uma medida de dispersão muito limitada, pois depende apenas dos valores externos, não 
sendo afetada pela dispersão dos valores internos. 
 Desvio Médio 
Mede o grau de dispersão ou o grau de concentração dos valores em torno da média. 
∑
=
−=
k
i
iiM FXx
n
D
1
.
1
 
 Variância 
Neste caso considera-se o quadrado de cada (xi - X ). 
∑ −
−
=
=
k
1i
i
2
i
2 F.)Xx(
1n
1S 
 Desvio Padrão 
É a raiz quadrada da variância. 
S = 2S 
 
Coeficiente de Variação 
 
É útil para a comparação em termos relativos do grau de concentração em torno da 
média de séries de dados distintas. 
X
SCV = 
 
OBS: Quando os dados estão agrupados em classes, usamos a média de cada classe para Xi. 
 
Medida de Assimetria 
 
� Coeficiente de Pearson 
13
13
S QQ
X2QQ
A
−
−+
= 
Se 





<
>
=
negativaaassimétricéãodistribuiçaA
positivaaassimétricéãodistribuiçaA
siméticaéãodistribuiçaA
S
S
S
0
0
0
 
 
 
Medida de Curtose 
 
É o grau de achatamento de uma distribuição. 
Para medir o grau de curtose utilizaremos: 
 
)PP(2
QQ
K
1090
13
−
−
= 
 
Se 





<
>
=
caleptocúrtiécurvaa,263,0K
caplaticúrtiécurvaa,263,0K
amesocúrticécurvaa,263,0K
 
 
Características do Desvio Padrão 
 
Quando o desvio padrão representar uma descrição da amostra , o denominador é n –
1, a razão deste procedimento reside que no fato, que utilizando o denominador n-1 
obtém uma melhor estimativa para o parâmetro da população (será estudado no Capítulo 
de Estimação), além disto n-1 dos desvios são independentes determinando o n-ésimo 
desvio. Para n muito grande os divisoresn-1 e n não alteram o resultado. 
 
 Propriedades do Desvio-padrão 
 
P1 – Somando (subtraindo) um valor constante arbitrário, x0, a cada elemento do 
conjunto, o desvio-padrão não se altera. 
P2 - Multiplicando ou dividindo um valor constante arbitrário, c, a cada elemento do 
conjunto, o desvio-padrão fica multiplicado ou dividido pela constante. 
P3 – O desvio-padrão é maior desvio médio. 
 
Interpretação do Desvio Padrão 
 
I1 - Sejam duas amostras onde 21 xx = e S1> S2 . Então podemos afirmar a primeira 
amostra apresenta maior variabilidade dos dados em relação a segunda.

Continue navegando