Buscar

Medidas Estatísticas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 29 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 29 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 29 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

1 
 
 
 
FACULDADE MAURICIO DE NASSAU 
CURSO DE ADMINISTRAÇÃO 
MEDIDAS ESTATÍSTICAS 
 
 
 
 
 
 
MEDIDAS ESTATÍSTICAS: TENDÊNCIA CENTRAL, DISPERSÃO, 
ASSIMETRIA E CURTOSE 
 
 
 
 
 
PROFESSOR: LUCIANO MELO 
 
 
 
 
 
 
 
 
 
 
2 
 
MEDIDAS ESTATÍSTICAS E SUAS APLICABILIDADES 
 
1.0 - MEDIDAS DE POSIÇÃO 
 
 As medidas de posição mais importantes são as medidas de tendência central, que recebem tal 
denominação pelo fato de os dados observados tenderem, em geral, a se agrupar em torno de valores 
centrais. Dentre as medidas de tendência central destacamos: 
 
a) A média aritmética 
b) A mediana 
c) A moda 
 
As outras medidas de posição são separatrizes, que englobam: 
a) a própria mediana 
b) Os quartis, decis e percentis 
 
1.1 - Média Aritmética 
 
 Esta média é quociente da soma dos valores da variável pelo número deles. A média é 
representada por: 
n
x
x
i

 
 Sendo xi, os valores da variável e n o número de valores ou total de dados. 
 
Exemplo: Foram escolhidos entre os alunos de escola uma pequena amostra para verificar a média de 
idade, estas idades foram 10, 14,13, 15, 16, 18 e 12 anos. Qual a média aritmética dessas idades. 
 
10 14 15 16 18 12 98
14
7 7
x
    
  
anos. 
 
Nota: Ás vezes a média pode ser um número diferente de todos os da série. Como é o caso de 2, 4, 8 e 
9. O número 5 é o representativo da série, dizemos então que esta média não tem existência 
concreta. 
 
1.2 - Propriedades 
 
a) A soma algébrica dos desvios em relação à média é nula. 
b) Ao somar ou subtrair uma constante “k” a todos os elementos de um conjunto de dados, a média fica 
aumentada ou diminuída deste valor. 
c) Ao multiplicar ou dividir uma constante “k” a todos os elementos de um conjunto de dados, a média 
fica aumentada ou diminuída deste valor. 
 
1.3 - Média Aritmética Ponderada 
 
 Esta média é empregada quando são atribuídos pesos a uma determinado conjunto de variáveis. 
As freqüências são números indicadores de intensidade, funcionam como fator de ponderação, 
podendo portanto, ser calculada pela fórmula: 
 
 
1 1 2 2 3 3
1 2 3
...
...
n n
n
x p x p x p x p
x
p p p p
   

   
 ou 
n n
n
x p
x
p



 
Para entender como se calcula a média ponderada, temos o seguinte problema: Um aluno 
obteve as seguintes notas 4, 7 e 6 nas 3 primeiras avaliações de matemática, sabendo-se que, o peso 
atribuído a estas avaliações, são respectivamente 1, 2 e 3. Vamos calcular a média ponderada, para 
esta situação: 
3 
 
 
4.1 7.2 6.3 4 14 18 36
6
6 6 6
x
   
   
. Portanto, a nota obtida pelo aluno é 6,0 (média ponderada). 
Nota: A média geral pode ser calculada com base na fórmula de média ponderada. Mas, neste caso 
devemos considerar as médias de “k” séries e os seus respectivos números de termos. 
 
Exemplo: Sejam as séries relacionadas a quantidades de ocorrências de um setor administrativo. 
a) 4, 5, 6, 7, 8 em que n1 = 5 e 6x  ; 
b) 1, 2, 3 em que n2 = 3 e 
2x 
; 
c) 9, 10, 11, 12, 13 em que n3 = 5 e 11x  . 
 
5.6 3.2 5.11 30 6 55 91
7
5 3 5 13 13
x
   
   
 
 
 
 1.4 Média Aritmética ( Dados Agrupados ) 
 
 A média com de uma distribuição com intervalos de classe é calculada através da seguinte 
fórmula: 
i i
i
f x
x
f



 
Determinar a média aritmética para a distribuição de renda familiar em milhares, de acordo com 
a tabela. 
 
 
 Renda ($) fi xi fi . xi 
 2 ⊢ 4 5 3 15 
 4 ⊢ 6 10 5 50 
 6 ⊢ 8 14 7 98 
 8 ⊢ 10 8 9 72 
 10 ⊢ 12 3 11 33 
 

= 40 
268 
 
 
Utilizando a fórmula, 
x
 = 
i i
i
f x
f


, 
x
 = 
268
6,7
40

. 
 
Como a renda foi dada em milhares, podemos dizer que a média salarial deste grupo de 40 
famílias é, de R$6700,00. 
 
Nota: A utilização das médias é necessária quando: 
 
a) desejamos obter a medida de posição que possui maior estabilidade. 
b) houver tratamento algébrico para cálculos posteriores. 
 
Observação: Quando a média geométrica for para uma distribuição de freqüências, os dados 
acarretarão muitos cálculos. Neste caso, é conveniente usar logaritmos em ambos os membros da 
fórmula, que ficará: 
1 1.log .log ... .loglog n n
fi x fi x f x
Mg
fi
  


. 
 
4 
 
 2.0 – A MODA 
 
Denominamos moda o valor que ocorre com maior freqüência em um conjunto de dados ou em 
uma série de valores. Podemos dizer, por exemplo, que o salário modal de uma indústria é o salário 
mais comum, ou seja, o salário recebido pelo maior número de empregados. 
 
Quando lidamos com dados não agrupados, é fácil identificar a moda através do valor que mais 
se repete, veja o exemplo: 7,8,9,10,10,10,11,12,13,15, esta série tem moda igual a 10. 
Escrevemos Mo = 10. 
 
Podemos, entretanto, encontrar séries que não apresentam valor modal como é o caso da série: 
3,5,8,10,12,13 esta série é chamada amodal. Ou ainda, podemos encontrar séries que apresentam 
mais de dois valores que aparecem com freqüências, como é o caso de: 2,3,4,4,4,5,6,7,7,7,8,9, temos 
duas modas e denominamos de série bimodal. 
 
Se, o grupo de dados for muito extenso em dada situação, e aparecem além de 3 valores com 
freqüência, dizemos que a série e multimodal. 
 
2.1 - MODA COM INTERVALOS DE CLASSES 
 
 A classe que apresenta maior freqüência é denominada classe modal. Pela definição, podemos 
afirmar que a moda, neste caso, é o valor dominante que está compreendido entre o limites da classe 
modal. 
 O modo mais simples para o cálculo da moda consiste em tomar o ponto médio da classe modal. 
Denominamos esse valor de moda bruta, temos então: 
 
2
li Ls
Mo


 ; onde, 
li
 é o limite inferior da classe modal e 
Ls
 é o limite superior da classe modal. A 
classe modal é a 3ª pois, aí está a maior freqüência de estaturas. 
 
Assim, para a distribuição da seguinte tabela : 
 
 
 i Estaturas(cm) fi 
 1 150 ⊢ 154 4 
 2 154 ⊢ 158 9 
 3 158 ⊢ 162 11 
 4 162 ⊢ 166 8 
 5 166 ⊢ 170 5 
 6 170 ⊢ 174 3 
 
 40
 
 
 A moda bruta será então, 
2
li Ls
Mo


= 
158 162 320
160
2 2

 
. 
Nota: Há para o cálculo da moda, outros métodos mais elaborados, como por exemplo, 
a Fórmula de Czuber: 
 Mo = 
1
1 2
.li h
 
  
   
 
 
 
5 
 
Na qual: 
li
 é o limite inferior da classe modal; 
 h é a amplitude da classe modal; 
 ∆1 é a diferença entre a freqüência simples da classe modal e a imediatamente anterior; 
 ∆2 é a diferença entre a freqüência simples da classe modal e a imediatamente posterior. 
 Assim, para a distribuição da tabela anterior temos: 
 
1
1 2
.Mo li h
 
   
   
 ; 
11 9
158 .4
(11 9) (11 8)

  
   
; 
2
158 .4 158 (0,4).4 158 1,6 159,6
5
     
 . 
 
Como podemos verificar o resultado da aplicação da fórmula de Czuber nos dá um valor mais 
preciso da moda, que foi arredondada no caso da moda bruta. 
 
Nota: A moda é utilizada quando: 
a) Desejamos obter uma medida rápida e aproximada de posição. 
b) A medida de posição deve ser o valor mais típico da distribuição. 
 
Nota: A moda pode também ser determinada pela Fórmula de Pearson dada por: 
 
 
3 2Mo Md x 
 
 
 
A moda é aproximadamente a diferença entre o triplo da mediana e o dobro da média. Esta é uma 
boa aproximação quando a distribuição apresenta razoável simetria em relação à média. 
 
3.0 - A MEDIANA 
 
A mediana é outra medida de posição que se encontra no centro de uma série de números 
dispostos em uma determinada ordem. Ou podemos dizer que a mediana de um conjunto de valores, é 
um valor situado de tal forma, que separa-o em dois subconjuntos de mesmo número de elementos. 
 
 
0% 50% 100%
 
Dada uma série de valores: 5,13,10,2,18,15,6,16,9, primeiramente devemos ordená-la em 
crescente ou decrescente dos valores. Em seguida, devemos tomar o valor central que separa o 
mesmo número de elementos à esquerda e à direita. Vejamos como isso acontece para o nosso 
exemplo: 
 
2,5,6,9,10,13,15,16,18 a mediana desta série é Md = 10, pois há quatro elementos acima e 
quatro abaixo desse número. 
 
Se, porém, a série dada tiver um número par de elementos, convencionou-se utilizar o ponto 
médio, ou seja, encontrar a média aritmética entre os valores centrais da série: 
 
Para a série 2,6,7,10,12,13,18,21 temos para média aritmética os valores 10 e 12. Logo, a 
mediana será Md =
10 12 22
11
2 2

 
 
Nota: A mediana depende da posição e não dos valores dos elementos na série ordenada. Não se deve 
deixar influenciar pelo valor dos extremos, como no exemplo abaixo, portanto, no conjunto de dados em 
questão é preferível usar a média. 
 A: 5,7,10,13,15 

 
x
 = 10 e Md = 10 
 B: 5,7,10,13,65 

 
x
 = 20 e Md = 10 
 
6 
 
3.1 - MEDIANA COM INTERVALOS DE CLASSES 
 
 Neste caso, o problema consiste em determinar o ponto do intervalo em que está compreendida a 
mediana. 
 Para tanto, temos que determinar a classe na qual se acha a mediana. A classe mediana, que 
corresponde à freqüência acumulada imediatamente superior a 
2
 if
. 
 Feito isto e admitindo-se, agora, que os valores se distribuam uniformemente em todo o intervalo 
de classe, vamos verificar a mediana na tabela seguinte: 
 
 i Estaturas(cm) fi Fac 
 
1 150 ⊢ 154 4 4 
2 154 ⊢ 158 9 13 
 Md 3 158 ⊢ 162 11 24 
4 162 ⊢ 166 8 32 
5 166 ⊢ 170 5 37 
 6 170 ⊢ 174 3 40 
 
 
 40
 
 
temos: 
2
 if
= 
2
40
= 20. 
 
Como há 24 valores incluídos nas três primeiras classes da distribuição e pretendemos 
determinar o valor de que ocupa o 20º lugar, a partir do início da série, podemos observar que este 
deve estar localizado na terceira classe (i = 3), supondo que as freqüências dessas classes estejam 
uniformemente distribuídas. 
 
Como há 11 elementos nessa classe e o intervalo de classe é igual a 4, devemos tomar, a partir do 
limite inferior, a distância: 
 
 Fórmula:  / 2
.
fi Fant
Md li h
fmd
 
 
 
 
Temos que: 
li
 é o limite inferior da classe mediana; 
 
/ 2fi
 é o total de dados dividido por 2; 
 
Fant
 é a freqüência acumulada anterior à da classe mediana; 
 
fmd
 é a freqüência simples da classe mediana; 
 h é a amplitude classe mediana. 
Calculando a mediana temos: 
 
 40 / 2 13
158 .4
11
Md

 
 ⇒ 
7
158 .4 158 (0,6).4 158 2,4 160,4
11
     
.A mediana é empregada quando: 
a) Desejamos obter o ponto que divide a distribuição em partes iguais. 
b) Há valores extremos que afetam de uma maneira acentuada a média. 
c) A variável em estudo é o salário. 
 
 
7 
 
4.0 - MEDIDAS SEPARATRIZES 
 
Como vimos, a mediana caracteriza uma série de valores devido à sua posição central. No 
entanto, ela apresenta outra característica: ela separa a série em dois grupos que apresentam o mesmo 
número de valores. 
 
Assim além das medidas de posição já estudadas, há outras que são consideradas 
individualmente: os quartis, os percentis e os decis. Estas medidas recebem o nome genérico de 
separatrizes. 
 
4.1 - OS QUARTIS 
 
Denominamos “quartis” os valores de uma série que a dividem em quatro partes iguais. Há, 
portanto, três quartis: 
 
a) O primeiro quartil (Q1 ) valor situado de tal modo na série que uma Quarta parte dos valores (25%) 
dos dados é menor que ele e as três quartas partes restantes (75%) são maiores. 
 
b) O segundo quartil (Q2 ) evidentemente, coincide com a mediana (Q2 = Md ). 
 
c) O terceiro quartil (Q3 ) valor situado de tal modo que as três quartas partes (75%) dos termos são 
menores que ele e uma quarta parte (25%) é maior. 
 
Quando os dados são agrupados, para determinar os quartis usamos a mesma técnica do cálculo 
da mediana, bastando substituir, na fórmula da mediana, 
2
 if
 assim, temos: 
Qi =
.
( ) . *
4
*
*
ik f
f ant h
f
 
 
 

 
 
Onde, * é o limite inferior da classe mediana; 
 f (ant) é a freqüência acumulada da classe anterior à classe mediana; 
 f* é a freqüência simples da classe mediana; 
 h* é a amplitude do intervalo da classe mediana. 
 K é o número de ordem do quartil em questão. 
 
Vamos determinar o primeiro e o terceiro quartil para a tabela seguinte: 
 
 i estaturas(cm) fi fac 
 
1 150 ⊢ 154 4 4 
2 154 ⊢ 158 9 13 (Q1) 
3 158 ⊢ 162 11 24 
4 162 ⊢ 166 8 32 (Q3) 
5 166 ⊢ 170 5 37 
6 170 ⊢ 174 3 40 
 
 
 40
 
 
8 
 
a) Q1 = .
4
ik f = 
4
40
 = 10 ; Q1 = 154+ 
9
4)410( x
 ; 154 + 
9
24
= 154+ 2,66 = 156,67cm. 
 
b) Q3 = .
4
ik f = 3.
4
40
 = 30 ; Q3 = 162 + 
8
4)2430( x
 ; 162 + 
8
24
= 162+ 3 = 165 cm. 
 
Analisando estes resultados temos: 
 25 % das estaturas estão abaixo de 156,67cm e os outros 75% estão acima deste valor; 
 75% das estaturas são menores que 165 cm e o outro quarto restante está acima deste valor.4.2 - OS DECIS 
 
 Estas medidas comportam-se de forma semelhante aos quartis, no entanto, dividem a série de 
dados em 10 partes iguais. 
 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% 
 
 D1 D2 D3 D4 D5 D6 D7 D8 D9 
 
É possível observar que a fórmula sofre alteração na quantidade de dados que serão divididos, então: 
 
 Di =
.
( ) . *
10
*
*
ik f
f ant h
f
 
 
 

 
 
Temos: 
 * é o limite inferior da classe dos decis, onde i= 1,2,3,...9 ; 
 f (ant) é a freqüência acumulada da classe anterior à classe do decil ; 
 f* é a freqüência simples da classe do decil; 
 h* é a amplitude do intervalo da classe do decil. 
 K é o número de ordem do decil em questão. 
 
4. 3 - PERCENTIS 
 
 Denominamos percentis os noventa e nove valores que separam uma série em 100 partes iguais. 
Indicamos P1, P2, ...., P32, ......, P99 . Podemos dizer que: 
 P25 = Q1 ; P50 = Md = Q2 e P75 = Q3 . 
 O cálculo de um percentil segue a mesma técnica do cálculo da mediana, porém, a fórmula 
2
 if
 
será substituída por: 
.
100
ik f
, sendo k o número de ordem do percentil. Assim, para o 27º percentil, 
temos: 
 Pi = 
.
( ) . *
100
*
*
ik f
f ant h
l
f
 
 
 

 
Temos: 
 * é o limite inferior da classe dos percentis, onde i= 1,2,3,...9 ; 
 f (ant) é a freqüência acumulada da classe anterior à classe do percentil; 
 f* é a freqüência simples da classe do percentil; 
 h* é a amplitude do intervalo da classe do percentil. 
 K é o número de ordem do percentil em questão. 
9 
 
Veja o caso a seguir, envolvendo o decil e o percentil. 
 
Exemplo: Determinar o 4º decil e o 72º percentil da distribuição, fornecida a tabela: 
 
 Classes fi Fac 
 
 4 ⊢ 9 8 8 
 9 ⊢ 14 12 20 Classe D4 
 14 ⊢ 19 17 37 Classe P72 
 19 ⊢ 24 3 40 
 

= 40 
 
Cálculo do D4 e do P72 : 
a) 
4
4. 4.40
16º
10 10
fi
D   
 b) 
72
72. 72.40
28,8º
100 100
fi
P   
 
Identificando a classe de D4 e P72 através da fac, teremos: Verificar erro no fac 72 = 30!!! 
 
a) 
( ) . *
10
*
*
i
i
f
f ant h
D
f
 
 
  

= 
4.40
8 .5
10
9 12,33
12
 
   
 
 
b) Pi =
.
( ) . *
100
*
*
ik f
f ant h
l
f
 
 
 

= 
72.40
20 .5
100
14 16,58
17
 
   
 
 
Portanto, nesta distribuição podemos concluir que: O valor 12,33 divide a amostra em duas partes: uma 
com 40% dos elementos e a outra com 60% dos elementos. O valor 16,58 indica que 72% dos 
elementos da distribuição estão abaixo dele e 28% acima dele. 
 
4. 4 - Utilização das Medidas de Tendência Central 
 
Na maioria das situações, não necessitamos calcular as três medidas de tendência central. 
Normalmente precisamos de apenas uma das medidas para caracterizar o centro da série. Surge, 
então, a questão: qual medida deve ser utilizada? 
 
A medida ideal em cada caso é aquela que melhor representa a maioria dos dados da série. 
 
Quando todos os dados de uma série estatística são iguais, a média, a mediana e a moda 
coincidirão com este valor e, portanto qualquer uma delas representara bem a série. No entanto, este 
caso dificilmente ocorrerá na prática. 
 
Na maioria das vezes, teremos valores diferenciados para a série e conseqüentemente a medida 
irá representar bem, apenas os dados da série que se situam próximos a este valor. Os dados muito 
afastados em relação ao valor da medida não serão bem representados por ela. 
 
Desta forma, se uma série apresenta forte concentração de dados em sua área central, a 
média, a mediana e a moda ficam também situadas em sua área central representando bem a série 
como na figura abaixo. Como a mais conhecida é a média, optamos por esta medida de tendência 
central. Concluindo, devemos optar pela média, quando houver forte concentração de dados na área 
central da série. 
10 
 
 
 
 
 
 
 
 
 
x
 
Se uma série apresenta forte concentração de dados em seu início, a mediana e a moda 
estarão posicionadas mais no início da série, representando bem esta concentração. A média que é 
fortemente afetada por alguns valores posicionados no final da série se deslocará para a direita desta 
concentração não a representando bem. 
 
Como a mais conhecida entre mediana e moda é a mediana, esta será a medida indicada neste 
caso. A mesma situação ocorre se a série apresenta forte concentração de dados em seu final. 
 
Concluindo, devemos optar pela mediana, quando houver forte concentração de dados no 
início ou no final da série. 
 
A moda deve ser a opção como medida de tendência central apenas em séries que 
apresentam um elemento típico, isto é, um valor cuja freqüência é muito superior à freqüência dos 
outros elementos da série. 
 
NOTA: 
A figura (curva) a seguir indica uma distribuição de freqüência simétrica em que os valores das 
medidas de tendência central são iguais. Significa que os elementos estão bem distribuídos. Se a 
distribuição não apresentar esta característica será classifica como assimétrica e fará parte de um 
estudo posterior nas medidas de assimetria e curtose. 
 
 
 
 
 
 
 
 
 
x Md Mo 
 
 
ATIVIDADES 
 
1. Considerando o conjunto de dados: 
a) 3,5,6,5,9,5,2,8,6 
b) 20,9,7,2,12,7,20,15,7 
c) 51,6;48,7; 50,3;49,5;48,9 
 
Determine: 
a ) A média b) A mediana c) A moda 
 
2. Os salários-hora de cinco funcionários de uma companhia são: R$ 75,00; R$ 90,00; R$ 83,00; R$ 
142,00 e R$ 88. Determine: 
 
a) a média dos salários-hora b) O salário-hora mediano. 
 
11 
 
3. As notas de um candidato, em seis provas de um concurso, foram: 8,4; 9,1; 7,2; 6,8; 8,7; e 7,2. 
Encontre: 
a) A nota média 
b) A nota mediana 
c) A nota modal 
 
4. Observe as distribuições (tabelas) e determine a medida de tendência central mais adequada: 
a) 
 Salários(R$) fi 
 0 ⊢ 2 15 
 2 ⊢ 4 8 
 4 ⊢ 6 6 
 6 ⊢ 8 4 
 8 ⊢ 10 2 
 Total 
 
 
 b) 
 Pesos (kg) fi 
 145 ⊢ 151 10 
 151 ⊢ 157 9 
 157 ⊢ 163 8 
 163 ⊢ 169 6 
 169 ⊢ 175 3 
 175 ⊢ 181 3 
 181 ⊢ 187 1 
 Total 
 
5. Calcule o salário modal para a tabela do exercício 4. 
 
6. Calcule e interprete o primeiro e o terceiro quartil da tabela b0 do exercício4. 
 
7. A distribuição de freqüências a seguir mostra o controle de notas fiscais das atividades mensisl de um 
departamento de vendas de e-commerce (vendas virtuais) da loja INTERVENDAS. Determine o 4º decil 
e o 75º percentil para este caso e interprete o resultado. 
 
 
 Notas Fiscais fi 
 100 ⊢ 125 5 
 125 ⊢ 150 120 
 150 ⊢ 175 175 
 175 ⊢ 200 200 
 200 ⊢ 225 50 
 Total 
 
 
 
 
12 
 
8. O setor de marketing de uma empresa contatou funcionários repositores para divulgar produtos em 
gôndolas num shopping center. Os honorários serão pagos com base na tabela salarial informada. Será 
acrescida ao salário uma comissão de 30% do salário mínimo vigente por meta de vendas atingida. O 
tempo de serviço está previsto para 3 meses, e os funcionário com melhor desempenho serão 
bonificados com 5% sobre o salário bruto. Por outro lado, os funcionários com desempenho abaixo do 
previsto, terão a título de incentivo um auxílio alimentação de 2% sobre o salário bruto (sem a 
comissão). Determine: 
 
a) O valor do salário para que o funcionário receba auxílio alimentação. 
b) O valor salarial “central” que vigora na empresa. 
c) O valor salarial que indicará o ganho da bonificação. 
d) Qual o gasto da folha com os salários dos funcionários bonificados após os 3 meses? 
 
 
 Faixa de Ganhos fi 
 300 ⊢ 380 18 
 380 ⊢ 460 5 
 460 ⊢ 540 4 
 540 ⊢ 620 2 
 620 ⊢ 700 1 
 Total 
 
 
5.0 - MEDIDAS DE DISPERSÃO 
 
 Vimos anteriormente que um conjunto de valores pode ser convenientemente sintetizado, por 
meio de procedimentos matemáticos, em poucos valores representativos – média aritmética, mediana 
e moda. Tais valores podem servir de comparação para dar a posição de qualquer elemento do 
conjunto. 
 Em relação à média, dada a situação, ainda que seja considerada como um número que tem a 
faculdade de representar uma série de valores - não pode por si mesma, destacar o grau de 
homogeneidade ou heterogeneidade entre os valores que compõem o conjunto. 
 
Consideremos os seguintes conjuntos de valores de variáveis X , Y , Z : 
 X : 70,70,70,70,70 
 Y : 68,69,70,71,72 
 Z : 5,15,50,120,160 
Calculando a média aritmética de cada um desses conjuntos obtemos: 
 
n
x
x
i

 

 
x
 = 
5
350
 = 70 ; 
n
y
y
i


 
y
 = 
5
350
 = 70 ; 
n
z
z
i


 
z
= 
5
350
 = 70 ; 
 
Vemos então, que os três conjuntos apresentam a mesma média aritmética: 70. Entretanto, é 
fácil notar que o conjunto X é mais homogêneo que os conjuntos Y e Z, já que todos os valores são 
iguais a média. 
 
O conjunto Y, por sua vez, é mais homogêneo que o conjunto Z, pois há menor diversificação 
entre cada um, de seus valores e a média representativa. 
 
Chamando de dispersão ou variabilidade a maior ou menor diversificação dos valores de uma 
variável em torno de um valor central tomado como ponto de comparação, podemos dizer que o 
13 
 
conjunto X apresenta dispersão ou variabilidade nula e que o conjunto Y, apresenta uma dispersão 
ou variabilidade menor que o conjunto Z. 
 
Portanto, para qualificar os valores de uma variável, ressaltando a maior ou menor dispersão ou 
ainda, a variabilidade entre esses valores e a sua medida de posição, recorremos às medidas de 
dispersão ou de variabilidade. 
5.1. AMPLITUDE TOTAL 
 
 A amplitude total é a diferença entre a maior e o menor valor observado. 
 
AT= X (máx) – X (min). Por exemplo, para os valores 40,45,48,52,54,62,70, temos: 
AT= 70 – 40 = 30. 
 
Quando dizemos que a amplitude total dos valores é 30, estamos afirmando alguma coisa do 
seu grau de concentração. É evidente que, quanto maior a amplitude total, maior a dispersão o 
variabilidade dos valores da variável. 
 
Relativamente sobre os três conjuntos de valores mencionados anteriormente em X, Y e Z, 
temos as amplitudes totais. 
ATx = 70 – 70 = 0, dispersão nula.; 
ATy = 72 – 68 = 4 
ATZ = 160 – 5 = 155 
 
5.2 - AMPLITUDE TOTAL COM INTERVALOS DE CLASSES 
 
Neste caso, a amplitude total é a diferença entre o limite superior da última classe e o limite 
inferior da primeira classe. 
 
 AT = L (máx) – ℓ (min). 
 
Considerando a distribuição abaixo: 
 
 Estaturas (cm) fi Temos: AT = 190 – 150 = 40. 
 Logo, AT = 40 cm. 
 150 ⊢ 158 5 
 158 ⊢ 166 12 
 166 ⊢ 174 18 
 174 ⊢ 182 27 
 182 ⊢ 190 8 
 
  70
 
 
A amplitude total tem o inconveniente de só levar em conta os dois valores extremos das séries, 
descuidando do conjunto de valores intermediários, o que quase sempre invalida a idoneidade do 
resultado. Torna-se, portanto, apenas uma indicação da dispersão ou variabilidade. 
 
Faz-se uso da amplitude total quando se quer determinar a amplitude da temperatura de um dia 
ou no ano, no controle de qualidade como uma medida de cálculo rápido ou quando a compreensão 
popular é mais importante que a exatidão e a estabilidade. 
Exemplo: 
Uma empresa contrata profissionais de uma agência terceirizada, para o cargo de agente 
administrativo. No entanto, seleciona internamente os funcionários indicados através de uma bateria de 
14 
 
testes. Dessa forma 4 candidatos foram selecionados e passarão à fase final dos testes com as 
seguintes pontuações. 
Candidato A: 20,35,15,30 
Candidato B: 20,35,20,25 
Candidato C: 25,25,25,25 
Candidato D: 10,40,35,15 
Destes candidatos somente dois farão a entrevista e concorrerá a vaga final. Quais os dois 
selecionados? 
Observamos que todos possuem a mesma pontuação, 100 pontos e a mesma média aritmética 
(25 pontos). Para desfazer este critério de empate, calculamos a amplitude total o que nos leva a 
observar o desempenho mais homogêneo nos testes. 
 
AT(a)= 35-15=20 
AT(b)= 35-20=15 
AT(c)= 25-25=0 
AT(d)= 40-10=30 
 
Como os candidatos B e C tiveram menor dispersão, ou seja, maior regularidade em relação a 
média estes estão classificados para a fase final. 
 
5.3 - CÁLCULO DO DESVIO MÉDIO SIMPLES 
 
1º Caso – Dados Brutos 
 
Calculamos inicialmente a média da seqüência. Em seguida identificamos a distância de cada 
elemento da seqüência para sua média. Finalmente, calculamos a média destas distâncias. 
Se a seqüência for representada por x: x1, x2,..., xn, então o DMS admite como fórmula de 
cálculo: 
ix x
DMS
n
 

 
Exemplo: Calcule o DMS para a seqüência X: 2, 8, 5, 6. 
Solução: Determinamos inicialmente a média da série: 2 8 5 6
5,25
4
ix
x
n
  
  
 
em seguida determinamos as distâncias de cada elemento da série para a média da série: 
 
1 2 5,25 3,25x x   
 
2 8 5,25 2,75x x   
 
3 5 5,250,25x x   
 
4 6 5,25 0,75x x   
 
 
O DMS é a média aritmética simples destes valores. 
3,25 2,75 0,25 0,75 7
1,75
4 4
DMS
  
  
 
 
Interpretação: Em média, cada elemento da seqüência está afastado do valor 5,25 por 1,75 unidades. 
 
2º Caso – Variável Discreta 
 
No caso da apresentação de uma variável discreta, lembramos que a freqüência simples de 
cada elemento representa o número de vezes que este valor figura na série. Conseqüentemente, 
15 
 
haverá repetições de distâncias iguais de cada elemento distinto da série para a média da série. Assim, 
a média indicada para estas distância é uma aritmética ponderada. 
 
A fórmula para o cálculo do DMS é: .ix x fi
DMS
fi
 


 
Exemplo: Determine o DMS para a série: 
 
xi 1 3 4 5 
fi 2 5 2 1 
 
Solução: O número de elementos da série é n = 
10n fi  
 
A média da série é: 
.fi xi
x
fi



 
 
Usaremos a disposição da tabela, acrescentando novas colunas para a resolução dos cálculos. 
 
 Xi fi fi.xi 
 1 2 2 
 3 5 15 
 4 2 8 
 5 1 5 
 
10 . 30fi fi xi   
 
 
A média da série é dada por: 
.fi xi
x
fi



= 
30
3
10

 
O DMS é dado por: .ix x fi
DMS
fi
 


conforme a tabela: 
 
 Xi fi fi.xi 
.ix x fi
 
 1 2 2 4 
 3 5 15 0 
 4 2 8 2 
 5 1 5 2 
 
10 . 30fi fi xi   
 
.ix x fi 
 
 
O desvio médio simples é: 
.ix x fi
DMS
fi
 


= 
8
0,8
10

 
Interpretação: Em média, cada elemento da série está afastado de valor 3 por 0,8 unidade. 
 
3º Caso – Variável Contínua (Distribuição de Freqüências) 
 
Nesta situação, por desconhecer os valores individuais dos elementos componentes da série, 
substituiremos estes valores (xi) pelos pontos médios de classe. 
Desta forma, o desvio médio simples tem por cálculo a fórmula: 
.ix x fi
DMS
fi
 


 
onde xi é o ponto médio da classe i. 
 
Exemplo: Veja o cálculo do desvio médio para a seguinte série: 
 
16 
 
1º) Cálculo da média: 
.fi xi
x
fi



=
102
5,1
20
x  
 
 
2º) Cálculo dos desvios: 
1 3 5,1 2,1x x   
 
2 5 5,1 0,1x x   
 
3 7 5,1 1,9x x   
 
4 9 5,1 3,9x x   
 
3º) Cálculo do desvio médio: .ix x fi
DMS
fi
 


=
23
1,15
20
unidadees 
 
 
 Classes Intervalos fi xi fi.xi 
.ix x fi
 
 1 2 ⊢ 4 5 3 15 10,50 
 2 4 ⊢ 6 10 5 50 1,00 
 3 6 ⊢ 8 4 7 28 7,60 
 4 8 ⊢ 10 1 9 9 3,90 
 
20 . 102fi fi xi   
 
. 23ix x fi  
 
 
 
Interpretação: Em média, cada elemento da série está afastado de 5,1 por 1,15 unidades. 
 
Comentário: O desvio médio simples depende de cada componente da série. Se mudarmos o valor de 
um único elemento da série, mudamos também o DMS. Portanto, o desvio médio simples tem perfeita 
sensibilidade estatística. A maior dificuldade desta medida é envolver módulos, cujas propriedades, em 
geral não são suficientemente conhecidas, por quem normalmente desenvolve estes cálculos. 
 
6.0 – VARIÂNCIA E DESVIO PADRÃO 
 
Observamos no item anterior que a dificuldade em se operar com o DMS se deve à presença do 
módulo, para que as diferenças 
ix x
 possam ser interpretadas como distâncias. 
 Outra forma de se conseguir que as diferenças 
ix x
 se tornem sempre positivas ou nulas é 
considerar o quadrado destas diferenças, isto é: 
2( )ix x
 
Se substituirmos, nas fórmulas do DMS a expressão
ix x
 por 
2( )ix x
, obteremos nova 
medida de dispersão chamada variância. Portanto, variância é uma média aritmética calculada a 
partir dos quadrados dos desvios obtidos entre os elementos da série e a sua média. 
 
“O desvio padrão é a raiz quadrada positiva da variância”. 
 
Em particular, para estas medidas levaremos em consideração o fato de a seqüência de dados 
representarem toda uma população ou apenas uma amostra do universo. 
 
Obs: Usa-se o módulo para interpretar o desvio como distância em relação à média. 
 
17 
 
Notações: Quando a seqüência de dados representa uma População a variância será denotada por 
2 ( )x
 e o desvio padrão correspondente por 
( )x
. Quando a seqüência de dados representa uma 
amostra, a variância será denotada por 
2 ( )s x
 e o desvio padrão correspondente por 
( )s x
. 
6.1 - CÁLCULO DA VARIÂNCIA E DESVIO PADRÃO 
 
1º Caso – VARIÁVEL DISCRETA 
 
Exemplo: Calcule a variância e o desvio padrão da seqüência: X: 4, 5, 8, 5. 
a) Se a seqüência representa uma população, a variância é calculada pela fórmula: 
2
2 ( )( ) i
x x
x
n
  
 
Temos a seqüência com 4 elementos, cuja média é: 
4 5 8 5 22
5,5
4 4
ixx
n
   
   
 
Calculamos então os quadrados das diferenças: 
 
2 2
1( ) (4 5,5) 2,25x x   
 
2 2
1( ) (5 5,5) 0,25x x   
 
2 2
1( ) (8 5,5) 6,25x x   
 
2 2
1( ) (5 5,5) 0,25x x   
 
 
- Somando-se estes valores obtém-se: 
2
1( ) 9x x  
 
- Substituindo esses valores na fórmula da variância, teremos: 
2
2 ( ) 9( ) 2,25
4
ix xx
n
    
 
Como o desvio padrão é a raiz quadrada positiva da variância, temos: 
2( ) ( ) 2,25 1,5 .x x unidades    
 
b) Se a seqüência anterior representasse apenas uma amostra, basta trocar na fórmula o “n” por “n -1 “ 
e a variância bem como o desvio padrão serão dados por: 
 
2
2 2( )( ) ( ) ( )
1
ix xs x e s x s x
n
 
 

 
 
Note que a única diferença entre a fórmula de 
2 ( )x
indicado para populações e 
2 ( )s x
 
indicado para amostras é o denominador. 
 
Assim, 
2
2 ( ) 9( ) 3
3
ix xs x
n
 
  
 e o desvio padrão 
( ) 3 1,73s x  
. 
 
2º Caso – VARIÁVEL CONTÍNUA (D.F) 
 
Como há repetições de elementos na série, definimos a variância como sendo uma média 
aritmética ponderada dos quadrados dos desvios dos elementos da série para a média da série. 
 
a) Se a variável discreta é representativa de uma População, então a variância é dada por: 
2
2 ( ) .( ) i
x x fi
x
fi
  

 
E o desvio padrão é dado por: 
2( ) ( )x x 
. 
 
Observação: Para o Cálculo da “amostra” basta substituir 
1fi por f  
 
18 
 
 
Exemplo 1: Calcule a variância e o desvio padrão da série abaixo. 
 
 i Interv. fi 
 1 0 ⊢ 4 1 
 2 4 ⊢ 8 3 
 3 8 ⊢ 12 5 
 812 ⊢16 1 
 
 
1º) Verificamos que 
10 . 84ifi e que fi x   
 então a média será dada conforme a tabela abaixo: 
 
 Classes Intervalos fi xi fi.xi 
2( ) .ix x fi
 
 1 0 ⊢ 4 1 2 2 40,96 
 2 4 ⊢ 8 3 6 18 17,28 
 3 8 ⊢ 12 5 10 50 12,80 
 4 12 ⊢ 16 1 14 14 31,36 
 
 
10 . 84fi fi xi   
 
 
2
. 102, 4ix x fi  
 
 
Cálculo da média: 
. 84
8,4
10
fi xi
x
fi

  

. 
 
2º) Cálculo dos desvios: 
2 2
1( ) (2 8,4) . 40,96x x fi   
 
2 2
1( ) (6 8,4) . 17,28x x fi   
 
2 2
1( ) (10 8,4) . 12,80x x fi   
 
2 2
1( ) (14 8,4) . 31,36x x fi   
 
 
3º) Cálculo da variância: 
2
2 ( ) .( ) i
x x fi
x
fi
  

102,4
10,24
10
 
 e o desvio padrão: 
2( ) ( ) 10,24 3,2x x   
. 
 
 
Comentários: 
 
1. No cálculo da variância, quando elevamos ao quadrado a diferença 
1( )x x
, a unidade de medida da 
série fica também elevada ao quadrado. Portanto, a variância é dada sempre no quadrado da unidade 
de medida da série. 
 
Se os dados são expressos em metros, a variância é expressa em metro quadrados. Em algumas 
situações, a unidade de medida da variância nem faz sentido. É o caso, por exemplo, em que os dados 
são expressos em litros então, a variância seria expressa em litros quadrados. 
 
19 
 
2. Exatamente para suprir esta deficiência da variância é que se define o desvio padrão. Como o desvio 
padrão é a raiz quadrada positiva da variância, o desvio padrão terá sempre a mesma unidade de 
medida da série e, portanto admite interpretação. 
6.2 - Interpretação do Desvio Padrão 
 
O desvio padrão é, sem dúvida, a mais importante das medidas de dispersão. 
É fundamental que o interessado consiga relacionar o valor obtido do desvio padrão com os dados 
da série. Quando uma curva de freqüência representativa da série é perfeitamente simétrica como a 
curva abaixo, podemos afirmar que o intervalo 
,x x    
 contém aproximadamente 68% dos valores 
da série. 
 
 
 
 
 
 σ σ 
 
2 2x x x  
 
 
O intervalo 
2 , 2x x    
 contém aproximadamente 95% dos valores da série. 
 
 
 
 
 
 σ σ σ σ 
 
 
2 2x x x  
 
 
O intervalo 
3 , 3x x    
contém aproximadamente 99% dos valores da série. 
 
 
 
 
 
 σ σ σ σ σ σ 
 
 
3 3x x x  
 
 
Estes percentuais 68%, 95% e 99% que citamos na interpretação poderão mais tarde ser 
comprovados, com maios precisão, no estudo da distribuição normal de probabilidades. 
 
Para uma compreensão inicial do desvio padrão, estas noções são suficientes. 
 
Quando a distribuição não é perfeitamente simétrica estes percentuais apresentam pequenas 
variações para mais ou para menos, segundo o caso ou problema em estudo. 
 
Se considerarmos como exemplo para uma variável em estudo, uma série apresenta média 
100x 
 e desvio padrão 
( ) 5x 
, interpretamos estes valores da seguinte forma: 
 
 
 
20 
 
1. Os valores da série em estudo estão concentrados em torno de 100. 
2. O intervalo 
 95,105
contém aproximadamente, 68% dos valores da série. 
3. O intervalo 
 90,110
contém aproximadamente 95% dos valores da série. 
4. O intervalo
 85,115
 contém aproximadamente 99% dos valores da série. 
 
É importante perceber que, ao aumentar o tamanho do intervalo, aumenta-se o percentual de 
elementos contido no intervalo. Adiante verificaremos que é possível controlar o tamanho do intervalo 
de modo que contenha exatamente o percentual que queremos. 
 
5. As medidas de dispersão vistas até agora são medidas absolutas e, portanto, avaliam a dispersão 
absoluta da série. Todas elas são diretamente proporcionais à dispersão absoluta. 
 
Assim, se a série X apresenta 
20 ( ) 3x e x 
 e se a série Y apresenta 
22 ( ) 2y e y 
, podemos 
afirmar, comparando os desvios padrão, que a série X apresenta maior dispersão absoluta. 
 
6. Para considerações ainda mais precisas temos o Teorema de Tchebycheff : 
 
Para qualquer distribuição amostral com média (
x
) e desvio padrão (

) tem-se: 
 
 O Intervalo 
2x 
 contém, no mínimo, 75% de todas as observações amostrais. 
 O intervalo 
3x 
 contém, no mínimo, 89% de todas as observações amostrais. 
 
Exemplo: 
 
Uma empresa de RH que recruta e seleciona pessoas para trabalhar em vários cargos, 
apresentou conforme a tabela, as idades de 50 candidatos que pleiteiam as vagas. Vamos analisar a 
variabilidade distribuição através do desvio padrão. 
 
Cálculo da Média: 
. 1922
38,44
50
fi xi
x
fi

  

. 
 
 Pesos(kg) fi xi fi.xi 
2( ) .ix x fi
 
 18 ⊢ 25 6 21,5 129 1721,78 
 25 ⊢ 32 10 28,5 285 988,04 
 32 ⊢ 39 13 35,5 461,5 112,37 
 39 ⊢ 46 8 42,5 340 131,87 
 46 ⊢ 53 6 49,5 297 733,94 
 53 ⊢ 60 5 56,5 282,5 1630,82 
 60 ⊢ 67 2 63,5 127 1256,01 
 
50
 
1922
 
6574,83
 
 
 
 
 
 
 
 
 
21 
 
2 2
1( ) (21,5 38,44) .6 1721,78x x   
 
2 2
1( ) (28,5 38,44) .10 988,04x x   
 
2 2
1( ) (35,5 38,44) .13 112,37x x   
 
2 2
1( ) (42,5 38,44) .8 131,87x x   
 
2
2 ( ) .( )
1
ix x fix
fi
  
 
= 
6574,83
134,18
49
 
 (Variância). 
2 2
1( ) (49,5 38,44) .6 733,94x x   
 
2( ) ( ) 134,18 11,58x x   
anos ( Desvio Padrão). 
2 2
1( ) (56,5 38,44) .5 1630,82x x   
 
2 2
1( ) (63,5 38,44) .2 1256,01x x   
 
 
Após o cálculo do desvio médio, temos: 
 
Considerando o intervalo 
 , : 38,44 11,58 26,86 ; 61,60x temos x      concluímos que, entre 27 e 
50 anos temos aproximadamente 66% das observações (idades) isto é, o intervalo compreendido entre 
a média e o desvio padrão para mais ou para menos. Se aplicarmos o Teorema de Tchebycheff, para o 
intervalo de 
2x 
 observaremos que no mínimo 75% das observações estarão incluídas neste caso. 
Podemos dizer também que a distribuição possui assimetria elevada. 
 
Temos: 
( )
( )
100x
x
CV x
x


 = 
11,58
0,32 100 32%.
38, 44
CV x ou 
 
Esta confirmação em torno da assimetria será melhor justificada a seguir. 
 
7.0 – MEDIDAS DE DISPERSÃO RELATIVA 
 
 Se uma série X apresenta 
10 ( ) 2x e x 
e uma série Y apresenta 
100 ( ) 5y e y 
, do ponto de 
vista da dispersão absoluta, a serie Y apresenta maior dispersão que a série X. No entanto, se levarmosem consideração as médias das séries, o desvio padrão de Y que é 5em relação a 100 é um valor 
menos significativo que o desvio padrão de X que é 2 em relação 10. 
 
 Isto nos leva a definir as medidas de dispersão relativas: coeficiente de variação e variância 
relativa. O coeficiente de variação de uma série X é indicado por: CV(x) definido por: 
 
( )
( )
100x
x
CV x
x


 ( Coeficiente de Variação de Pearson) 
A variância relativa de uma série X é indicada por V(x) é definida por: 
 
2
( ) 2
( )
x
x
V
x


 
Note que o coeficiente de variação, como é uma divisão de elementos de mesma unidade, é um 
número puro. Portanto, pode ser expresso em percentual. Este fato justifica a utilização do denominador 
 
2
x
na definição de V(x). 
Deste modo, se calcularmos o coeficiente de variação da série X citada acima temos: 
 
( )
2
0,2 100 20%.
10
xCV x ou 
 Da mesma forma calculando o coeficiente da série Y temos, 
( )
5
0,05 100 5%.
100
yCV x ou 
 
 
 
22 
 
Comparando os valores destes dois coeficientes concluímos que a série X admite maior dispersão 
relativa. Como a medida de dispersão relativa leva em consideração a medida de dispersão absoluta e 
a média da série, é uma medida mais completa que a medida de dispersão absoluta. Portanto, a 
medida de dispersão relativa prevalece sobre a medida de dispersão absoluta. 
 
“ Podemos afirmar que a série possui a maior dispersão relativa, tem de modo geral a maior 
dispersão ”. 
 
Concluindo o exemplo anterior podemos dizer que: 
 
A série Y apresenta maior dispersão absoluta. A série X apresenta maior dispersão relativa. 
Portanto, a série X apresenta maior dispersão. 
 
Há algumas regras empíricas para interpretação do coeficiente de variação: 
 
Se o C.V < 15% há baixa dispersão; 
 
Se o 15% ≤ C.V ≤ 30% há média dispersão; 
 
Se o C.V ≥ 30% há elevada dispersão; 
 
Exemplo: Em uma empresa, o salário médio dos homens é de R$4000,00, com desvio padrão de 
R$1500,00, e o salário das mulheres é de R$3000,00 com desvio padrão de R$1200,00. Comente 
sobre a dispersão relativa entre os salários masculinos e femininos. 
 
Solução: 
Homens: 
( ) ( )4000 1500h hX e  
 
Mulheres: 
( ) ( )3000 1200m mX e  
 
 
Calculando o C.V. para os casos temos: 
 
( )
1500
100 37,5%
4000
hCV x 
 
( )
1200
100 40%
3000
hCV x 
 
 
Nestas condições, podemos dizer que o os salários das mulheres têm dispersão relativa maior 
que os salários dos homens. As duas distribuições apresentam elevada dispersão, pois o C.V≥30%. 
 
8.0 - MEDIDAS DE ASSIMETRIA E CURTOSE 
 
Para conceituar assimetria, obviamente precisamos conceituar simetria. Diremos que uma 
distribuição é simétrica quando X = Md = Mo. Se isto de fato ocorrer, a curva de freqüência tem a seguinte 
característica gráfica: 
 
 
23 
 
Se uma distribuição não for simétrica, será classificada como assimétrica. Existem duas 
alternativas para uma distribuição assimétrica: 
 
 
 
No caso (a) A distribuição é classificada de assimétrica positiva. No caso (b) A distribuição é 
classificada de assimétrica negativa. 
 
8.1 - MEDIDAS DE ASSIMETRIA 
 
A assimetria é o grau de afastamento, de uma distribuição, da unidade de simetria. Para tal, 
consideramos o seguinte coeficiente. 
 
De posse da média e da moda, temos: 
 
0Mox
; assimetria nula ou distribuição simétrica; 
0Mox
; assimetria negativa ou à esquerda; 
0Mox
; assimetria positiva ou à direita. 
 
Como as medidas anteriores apresentam caráter absoluto, podem apresentar a mesma 
deficiência do desvio padrão, não permitindo a comparação entre as medidas de duas distribuições. Por 
este motivo, estabelecemos o coeficiente de Pearson. 
 
8.2 - (1º Coeficiente de Pearson) 
 
S
Mdx
As
)(3 

 
Se 
0sA
então a distribuição é simétrica. 
Se 
0sA
 então a distribuição é assimétrica negativa. 
Se 
0sA
 então a distribuição é assimétrica positiva. 
 
Ainda sobre assimetria podemos considerar: assimetria moderada se 
115,0  As
 e assimetria 
forte se 
1As
. 
 
EXEMPLO: Classifique, quanto à assimetria, a distribuição abaixo, usando também o coeficiente de 
Pearson. 
 
 
 
 
 
24 
 
 
 Pesos (Kg) fi Temos: 
kgx 9,12
 ; Md=13,5 ; Mo=16Kg; S=4,20kg 
 2 ⊢ 6 6 Logo a distribuição é: 
kgMox 1,3169,12 
 assimétrica negativa. 
 6 ⊢ 10 12 
 10 ⊢ 14 24 
14 ⊢ 18 30 
 18 ⊢ 22 6 
 
78
 
 
Pelo coeficiente de assimetria, temos: As = 3.(12,9 -13,5) : 4,20 = - 0,429 ⇒assimetria negativa. 
 
8.3 - (2º Coeficiente de Pearson) 
 
A assimetria pode também ser classificada por este coeficiente. 
 
 
 
 
 
Se 
0sA
então a distribuição é simétrica. 
Se 
0sA
 então a distribuição é assimétrica negativa 
Se 
0sA
 então a distribuição é assimétrica positiva. 
 
EXEMPLO: Classifique, quanto à assimetria, a distribuição abaixo considerando as classes de salários 
e as freqüências a quantidade de colaboradores da empresa. 
 
Classes fi xi fi.xi fi.xi2 fi:h fac 
 30⊢50 80 40 3200 128000 80:20 =4 80 
50⊢100 50 75 3750 281250 50:50 =1 130 
100⊢150 30 125 3750 468750 30:50 =0,6 160 
∑ 160 10700 878000 
 
875,66
160
10700
x
; 
429,4120.
34
)4(
30 

Mo
; 
96,3162,1021
160
)10700(
878000
159
1 22 





 SS
; 
4020.
80
)040(
301 

Q
; 
9050.
50
)80120(
503 

Q
; 
5020.
80
)080(
30 

Md
 
Temos: 
.796,0
96,31
29,41875,66





S
MoX
As
 Como a As>0, a distribuição é assimétrica positiva. 
 
25 
 
 
Calculando pelo 2º coeficiente de Pearson, obteremos: As=0,6. De qualquer forma, o valor é 
positivo e a curva assimétrica positiva. 
 
9.0 – Medidas de Curtose 
 
A medida de curtose determina o grau de achatamento da curava de uma distribuição de 
freqüências em relação à distribuição padrão denominada curva normal. 
 
Observando a concentração dos valores de uma série em torno de sua moda, há três situações 
especiais. 
 
1º caso - Os dados estão fortemente concentrados em torno da moda, o que faria a curva de 
freqüência ser bastante afilada, como na figura: 
 
2º caso - Os dados estão razoavelmente concentrados em torno da moda, o que faria a curva de 
freqüência ser razoavelmente afilada, como na figura: 
 
3º caso - Os dados estão fracamente concentrados em torno da moda, o que faria a curva de 
freqüência ser fracamente afilada, como na figura: 
 
 
 
A medida de curtose procura classificar estes tipos de curvas com respeito ao afilamento ou 
achatamento de sua área central. 
Para isto, padroniza-se a curva do 2º caso. Este tipo de curva é classificada como mesocúrtica. 
A curva do 1º caso, bastante afilada em sua área central, é denominada leptocúrtica, e a curva 
do 3º caso, bastante achatada em sua área central, é denominada platicúrtica. 
 
26 
 
Para classificar uma distribuição quanto a sua curtose, podemos utilizar o coeficiente de curtose 
dado por: 
 
)(2 1090
13
PP
QQ
K

 
 
 
Se K = 0,263 a curva da distribuição é mesocúrtica. 
 
Se k > 0,263 a curva da distribuição é platicurtica. 
 
Se K < 0,263 a curva da distribuição é leptocúrtica. 
 
Nota: “A medida de curtose tem a finalidade de complementar a caracterizaçãoda distribuição”. 
 
EXEMPLO: 
 
1) Classifique, quanto ao grau de curtose a distribuição abaixo. 
 
Classes Fi 
 3 ⊢8 
 8 ⊢13 
13 ⊢18 
18 ⊢23 
5 
15 
20 
10 
 
 
5,10
15
5).55,12(
81 

Q
; 
;38,17
20
5).205,37(
133 

Q
 
 
;8
5
5).05(
310 

P ;5,20
10
5).4045(
1890 

P
 
 
Logo,
)(2 1090
13
PP
QQ
K

 
⇒
27,0
)85,20(2
5,1038,17



K
. 
 
Portanto, K>0,263 portanto, a curva é suavemente platicúrtica. 
 
EXERCÍCIOS 
 
1) Classifique quanto à assimetria ao grau de curtose, a distribuição abaixo (amostra), segundo o 
coeficiente de Pearson. 
Xi Fi 
2 
3 
4 
5 
6 
7 
8 
2 
4 
6 
10 
6 
4 
2 
27 
 
2) Considere a seguinte distribuição de freqüência a seguir em relação à população e classifique-a 
quanto à assimetria e ao grau de curtose, segundo o coeficiente de Pearson. 
 
Classes Fi 
0⊢ 4 
4⊢ 8 
 8⊢12 
12⊢16 
16⊢20 
10 
15 
6 
2 
1 
 
3) Classifique, quanto à assimetria e ao grau de curtose, a seguinte distribuição de freqüência. 
 
 
Classes Fi 
3⊢ 5 
5⊢ 7 
7⊢ 9 
9⊢11 
11⊢13 
14 
16 
18 
19 
17 
 
 
 
4) Considere a seguinte distribuição de freqüência da massa corporal dos colaboradores de uma 
empresa de calçados. Os dados foram obtidos em uma amostra de 45 pessoas por ocasião de um 
exame médico na semana da CIPA. 
 
 
 Pesos (Kg) Funcionários 
 40 ⊢ 45 04 
 45 ⊢ 50 10 
 50 ⊢ 55 15 
 55 ⊢ 60 08 
 60 ⊢ 65 05 
 65 ⊢ 70 03 
 

= 
 
a) Determine a média de peso dos funcionários. 
b) Qual a variância entre o peso dos funcionários? Qual o coeficiente de variação? 
c) A distribuição é simétrica? 
d) Qual o grau de achatamento da curva da distribuição? 
 
5. Uma fábrica de laticínios do ABC paulista, possui vários tipos de produtos que são comercializados. 
As notas de compra destes produtos são repassadas semanalmente aos representantes comerciais da 
empresa. O encarregado do setor financeiro fez a contagem das notas para lançamento no sistema e 
constatou os seguintes valores. 
 
 
 
 
 
28 
 
 
 Valores (R$) Quant. notas 
 0 ⊢ 100 20 
 100 ⊢ 200 35 
 200 ⊢ 300 18 
 300 ⊢ 400 40 
 400 ⊢ 500 12 
 500 ⊢ 600 30 
 

= 
 
a) Determine a medida de tendência central mais adequada para a análise das notas de 
compra, e calcule o valor desta medida? 
b) Calcule o 3º decil e o percentil 80 e interprete seus resultados? 
c) Qual o desvio padrão para esta distribuição? 
d) Qual o coeficiente de variação desta distribuição? 
e) Qual o coeficiente de assimetria? 
f) Verifique se a distribuição é simétrica? 
g) Classifique esta distribuição quanto ao grau de curtose. 
 
 
EXERCÍCIOS COMPLEMENTARES 
 
1. Calcule a amplitude total do conjunto de dados: 
 
 1, 3, 5, 9 
 -10, -6, 2, 3, 7, 9, 10 
 17,9 ; 22,5; 13,3; 16,8; 15,4; 14,2 
 
2. Calcule os desvios padrões dos conjuntos de dados do exercício 1. 
 
3. Sabendo que um conjunto de dados apresenta para média aritmética e para desvio padrão 
respectivamente: 18,3 e 1,47, calcule o coeficiente de variação. 
 
4. Em um exame final de matemática, o grau médio de um grupo de 150 alunos foi 7,8 e o desvio 
padrão, 0,80. Em estatística, no entanto, o grau médio final foi de 7,3 e o desvio padrão 0,76,. Em que 
disciplina foi maior a dispersão? 
 
5. Medidas as estaturas de 1017 indivíduos, foram obtidos: média aritmética 162,2 cm e s = 8,01 cm. O 
peso médio desses mesmos indivíduos e 52 kg, com um desvio padrão de 2,3 kg. Esses indivíduos 
apresentam maior variabilidade em estatura ou em peso? 
 
6. Um grupo de 85 mulheres tem estatura média de 160,6 cm, com um desvio padrão de 5,97 cm. 
Outro grupo de 125 mulheres tem uma estatura média de 161,9 cm, sendo o desvio padrão igual a 6,01 
cm. Qual é o coeficiente de variação de cada um dos grupos? Qual o grupo mais homogêneo? 
 
7. Um grupo de 100 estudantes tem uma estatura média de 163,8 cm, com um coeficiente de variação 
de 3,3%. Qual o desvio padrão desse grupo? 
 
 
 
 
 
29 
 
8. Responda justificando em cada caso, para os conjuntos de dados: 
 
a) Qual série apresenta maior dispersão absoluta? 
 
b) Qual das séries apresenta maior dispersão relativa? 
 
c) Qual das séries apresenta maior dispersão? 
 
 Série A: 
20 ( ) 2x e x 
 e Série B: 
20 ( ) 5x e x 
 
 
 Série A: 
50 ( ) 2x e x 
 e Série B: 
100 ( ) 3x e x 
 
 
 Série A: 
220 ( ) 9x e x 
 e Série B: 
230 ( ) 16x e x 
 
 
 Série A: 
220 ( ) 9x e x 
 e Série B: 
40 ( ) 3x e x 
 
 
 
 
REFERÊNCIAS BIBLIOGRÁFICAS 
 
CRESPO, Antônio Arnot. Estatística Fácil. São Paulo: Saraiva, 2002. 
 
FIGUEIRA, Sebastião de Paula. at all. Estatística Básica. Senac Nacional: Rio de Janeiro,1998. 
 
FONSECA, Jairo Simon da & MARTINS, Gilberto de A. Curso de Estatística. São Paulo: Atlas,1996. 
 
MARTINS, Gilberto de Andrade. Estatística Geral e Aplicada. São Paulo: Atlas, 2005. 
 
SILVA, Ermes Medeiros da. at all. Estatística para cursos de: Economia, Administração e 
Ciências Contábeis. São Paulo: Atlas, 2006. 
 
SMAILES, Joanne & MCGRANE, Angela. Estatística Aplicada a Administração com Excel. São 
Paulo: Atlas, 2002. 
 
TOLEDO, G. L. e OVALLE, I. I. - Estatística Básica. 2ª ed. São Paulo. Editora Atlas, 2008.

Outros materiais