Buscar

Medidas Estatísticas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 3, do total de 75 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 6, do total de 75 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 9, do total de 75 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Prévia do material em texto

- UNIDADE 02 - 
 
Medidas Estatísticas
 
 
 
1 − Introdução ........................................................................................................................... 3 
 
2 − Medida de Posição Central ................................................................................................. 6 
2.1 − Medida de posição central para dados brutos ............................................................ 6 
2.2 − Medidas de posição central para dados agrupados em tabelas de frequência ........ 14 
2.2.1 − Dados agrupados em tabelas de frequência sem classe .................................. 14 
2.2.2 − Dados agrupados em tabelas de frequência com classe .................................. 17 
2.3 - Exercícios propostos .................................................................................................. 21 
 
3 − Medidas de Variabilidade .................................................................................................. 25 
3.1 − Introdução .................................................................................................................. 25 
3.2 − Medida de variabilidade para dados brutos .............................................................. 26 
3.3 − Medidas de variabilidade para dados agrupados em tabelas de frequência ............ 34 
3.3.1 − Dados agrupados em tabelas de frequência sem classe .................................. 34 
3.2.2 − Dados agrupados em tabelas de frequência com classe .................................. 35 
3.4 − Algumas aplicações do desvio-padrão ...................................................................... 36 
3.5 - Exercícios propostos .................................................................................................. 38 
 
4 − Medida Separatrizes, de Assimetria e de Curtose ........................................................... 41 
4.1 − Introdução .................................................................................................................. 41 
4.2 − Medidas separatrizes para dados brutos .................................................................. 41 
4.3 − Medidas Separatrizes para dados agrupados em tabelas de frequência ................. 45 
4.3.1 − Dados agrupados em tabelas de frequência sem classe .................................. 45 
4.3.2 − Dados agrupados em tabelas de frequência com classe .................................. 47 
4.4 – Cálculo do percentil usando gráfico de frequência acumulada (Ogiva de Galton) ... 49 
4.5 – Construção do gráfico de caixa ................................................................................. 50 
4.6 − Medida de Assimetria ................................................................................................ 52 
4.7 − Medida de Curtose .................................................................................................... 55 
4.8 - Exercícios propostos .................................................................................................. 57 
 
5 – Correlação linear ............................................................................................................... 59 
5.1 – Introdução .................................................................................................................. 59 
5.2 – Diagrama de dispersão ............................................................................................. 59 
5.3 – Medidas de correlação .............................................................................................. 60 
5.4 – Usando recurso computacional ................................................................................. 66 
5.5 – Exercícios propostos ................................................................................................. 67 
 
6 – Regressão Linear Simples ................................................................................................ 68 
6.1 – Introdução .................................................................................................................. 68 
6.2 – Modelo de regressão ................................................................................................. 68 
6.3 – Ajuste do modelo ....................................................................................................... 69 
6.4 – Usando recurso computacional ................................................................................. 72 
6.5 – Exercícios propostos ................................................................................................. 73 
 
6 - Anexo ................................................................................................................................. 74 
 
7 - Bibliografia ......................................................................................................................... 75 
Medidas estatísticas 
 
Estatística Básica − 3 − prof. José Aguinaldo 
1 −−−− Introdução 
As tabelas de frequência e gráficos, vistos na unidade anterior, permitem sumarizar e mostrar a 
distribuição dos valores assumidos por uma variável. O Gráfico 3.1 mostra a distribuição do PIB 
per capita1 dos municípios brasileiros. Neste gráfico podemos observar que a maioria dos 
municípios brasileiros apresenta PIB per capita abaixo de 45 mil reais. É ainda possível observar 
uma pequena minoria de municípios com PIB per capita acima de 90 mil reais. 
 
GRÁFICO 3.1 – Distribuição do PIB per capita dos municípios brasileiros em 2004. 
 
 
 
 
 
 
 
 
 
 
Algumas características da distribuição devem ser consideradas em uma análise estatística. 
Uma delas é o valor típico da distribuição e outra é a dispersão dos valores. O valor típico e a 
dispersão dos valores, quando expressos em números, torna-se mais fácil fazer comparações 
entre as diversas distribuições, como por exemplo, comparar as distribuições do PIB per capita 
entre os municípios. 
Suponha, que uma pequena empresa que trabalha com apenas quatro máquinas de encher 
pacotes de café de 500 gramas. Os pesos de 40 pacotes selecionados de cada máquina estão 
mostrados no gráfico de pontos abaixo2. 
 
 
1
 O Produto Interno Bruto per capita de cada município foi estimado pelo quociente entre o valor do PIB 
do município por sua população residente. 
2
 No gráfico de ponto, cada ponto representa o peso de um pacote de café. 
315270225180135904510
2500
2000
1500
1000
500
0
PIB per capita (em mil reais)
Q
u
a
n
ti
d
a
d
e
 d
e
 m
u
n
ic
íp
io
s
zoom 
31527022518013590
10
0
Medidas estatísticas 
 
Estatística Básica − 4 − prof. José Aguinaldo 
 
 
 
 
 
 
 
 
 
 
 
 
Considerando o gráfico de pontos da máquina “A”, vemos que os pacotes de café enchidos por 
esta máquina apresentam um peso típico em torno de 490 gramas (10 gramas a menos do 
especificado), enquanto que, na máquina B, os pacotes apresentam um peso típico em torno de 
510 gramas (10 gramas a mais). Quanto à dispersão (ou variabilidade) dos pesos, parece que 
eles estão igualmente dispersos em torno dos valores típicos. Podemos ainda destacar a 
presença de um pacote com peso considerado atípico3 na máquina “A” (peso de 480 gramas). 
Na máquina “C”, os pesos dos pacotes giram em torno de 500 gramas (igual ao especificado), 
mas a dispersão dos pesos é muito grande, indicando alguma instabilidade na máquina (os pesos 
estão variando de 481 gramas a 520 gramas). 
Na máquina “D”, encontramos uma situação que podemos dizer ideal, os pesos giram em torno 
do valor especificado (de 500 gramas) e com uma pequena dispersãodos pesos. 
 
As medidas que ajudam a descrever uma distribuição são: 
• Medidas de posição central; 
• Medidas de variabilidade (ou dispersão); 
• Medidas separatrizes (posição não central) 
• Medidas de assimetria e de curtose. 
 
 
 
3
 Em estatística, costumamos chamar esse valor extremo de outlier. 
525520515510505500495490485480
Máquina A
Máquina B
Máquina C
Máquina D
Peso dos pacotes (em gramas)
Esse pacote pesou 
480 gramas 
média 
média 
média 
média 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Medidas de Posição 
Central 
 
 Medidas estatísticas 
 
Estatística Básica − 6 − prof. José Aguinaldo 
2 −−−− Medida de Posição Central 
É a medida estatística que “melhor” representa um conjunto de dados, sendo o valor mais típico 
ou o mais representativo do conjunto de dados. As medidas de posição central usuais são: média 
simples, média ponderada, mediana e a moda. 
 
2.1 −−−− Medida de posição central para dados brutos 
As medidas abaixo se referem aos dados brutos, ou seja, dados não agrupados em tabelas de 
frequência. 
 
•••• Média 
 
A média de um conjunto de valores é o somatório destes valores dividido pela quantidade de 
números no conjunto. Note que a média é simplesmente a média aritmética simples dos valores. 
Quando trabalhamos com os dados de uma amostra, a média é denominada de média amostral 
e é denotada pelo símbolo x (leia-se x barra). 
 
�̅ = ∑ ������	 = 
��
	��
	�
����
	��	���
	���
��	��	�
����
	��	� 
 
Uma amostra de cinco funcionários de uma empresa foi selecionada e registrada a distância (em 
km) que cada um percorre até chegar à empresa. Os valores obtidos foram 12, 4, 12, 9 e 3. A 
média amostral destas distâncias será: 
 
�̅ = ∑ ������	 = 12 + 4 + 12 + 9 + 35 = 405 = 8	"� 
 
 
 
 
 
 
A distância média percorrida até a empresa pelos funcionários é de 8,0 km. 
 
Caso particular: Média Populacional 
Quando trabalhamos com todos os dados de uma população (o que não é comum), a média 
passa a ser denominada de média populacional e denotada pela letra grega µµµµ (leia-se mi). 
 
# = ∑ ��$���% 
 
Como exemplo, imagine uma pequena região fictícia com apenas oito famílias, onde temos 
abaixo as renda (em reais) de cada uma delas. 
 
450 560 550 300 620 400 500 580 
 
Assumindo que esta região é a sua população de interesse, a renda média será: 
 
# = ∑ ��$���% = 450 + 560 +⋯+ 5808 = 495	��
�
 
 
1211109876543
Distância percorrida
média 
Medidas estatísticas 
 
Estatística Básica − 7 − prof. José Aguinaldo 
•••• Mediana 
A mediana de um conjunto de dados é o valor que está exatamente no centro deste conjunto 
com os valores ordenados. A mediana, portanto, “deixa” metade dos valores abaixo dela e a 
outra metade acima. A mediana pode ser denotada por Md ou x~ (leia-se x til). 
 
Dependendo se n é ímpar ou par, a mediana poderá ter um único valor central ou a média dos 
dois valores centrais. 
 
Se “n” é ímpar 
A mediana será o único valor central. 
Se “n” é par 
A mediana será a média dos dois valores 
centrais. 
x = {8, 10, 15} → 10Md = x = {8, 10, 15, 30} → 5,12
2
1510Md =+=
 
 
Uma amostra de cinco funcionários de uma empresa foi selecionada e registrada a distância (em 
km) que cada um percorre até chegar à empresa. Os valores obtidos foram 12, 4, 12, 9 e 3. A 
mediana dos valores será: 
 
Dados ordenados: 3 4 9 12 12 
 
Como n é ímpar, o conjunto ordenado só tem um único valor central, que é o 9. Portanto, a 
mediana amostral será o Md = 9 km. Veja o gráfico e pontos abaixo. 
 
 
 
 
 
 
 
 
Podemos formalizar um procedimento para obter a mediana da seguinte maneira: 
 
•••• Ordene o conjunto de dados em ordem crescente e calcule ()* = +/- que é a posição da 
mediana no conjunto ordenado; 
•••• Se pos não for um número inteiro, arredonde pos para cima (maior inteiro mais próximo) e 
a mediana será o valor central que está na posição pos. 
•••• Se pos for inteiro, então a mediana será a média entre os valores centrais que estão na 
posição pos e pos +1. 
 
No EXEMPLO anterior, a posição da mediana é pos = 5/2 = 2,5. Como esse número não é 
inteiro, ele deverá ser arredondado para cima (pos = 3). Portanto, a mediana será o 3ª valor (na 
série ordenada), que é Md = 9 km. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1211109876543
Distância percorrida
mediana Cerca da metade (50%) dos 
funcionários percorrem menos 
de 9 km para ir até a empresa. 
Medidas estatísticas 
 
Estatística Básica − 8 − prof. José Aguinaldo 
Comparação entre a média e a mediana 
Por usar todos os valores do conjunto de dados, a média acaba sendo bastante influenciada 
pelos valores atípicos4, enquanto que a mediana é menos sensível a estes valores. 
 
Supondo que no exemplo anterior, a distância de 12 km foi registrada erradamente como 120 
km. A média e a mediana dos valores serão 
 
Média 
6,29
5
148
5
391204121
==
++++
==
∑
=
n
x
x
n
i
i
 
 
Mediana 
 
3 ; 4 ; 9 ; 12 ; 120 
 
A mediana será o 3º valor, ou seja, a mediana 
será Md = 9 
 
O valor de 120 km fez a média “pular” de 8 km para 29,6 km. O cálculo matemático desta média 
está correto, mas uma média de 29,6 km não representa bem as distâncias percorridas pelos 
funcionários. Veja que todos os valores são menores do que a média obtida, com exceção de 
um valor. Enquanto isto, a mediana permaneceu igual a 9, mesmo com o alto valor de 120 km. 
Portanto, a mediana não foi influenciada pelo valor atípico. 
 
 
•••• Moda 
 
A moda, denotada por Mo, é o valor que ocorre com mais frequência no conjunto de dados. Em 
uma empresa, por exemplo, o salário modal dos empregados seria o salário mais comum, isto é, 
o salário recebido pelo maior número de empregados. 
 
Alguns exemplos. 
 
12, 4, 12, 9, 3 � moda = 12 (uma moda apenas) 
3, 4, 4, 4, 9, 10, 12, 12, 12 � modas = 4 e 12 (bimodal) 
3, 4, 4, 4, 9, 10, 10, 10, 12, 12, 12 � modas = 4, 10 e 12 (trimodal) 
 
ou mesmo não ter moda 
3, 4, 9, 10, 12 � amodal (não tem moda) 
 
 
•••• Média aparada de k% 
 
A média aparada é a média simples dos dados que permanecem, quando k% das observações 
ordenadas são removidas (aparadas) de cada extremidade. A média aparada, denotada por �̅./, 
é uma medida de posição central que procura ser menos sensível aos valores atípicos, como era 
o caso da mediana. 
 
O procedimento formal para obter a média aparada de k% é: 
•••• Ordene o conjunto de dados em ordem crescente; 
•••• Calcule T = k⋅⋅⋅⋅n/100, quantidade de valores a serem retirados de cada extremidade; 
•••• Arredonde o valor de T para um número inteiro; 
•••• Retire os T menores valores e também os T maiores valores; 
•••• Calcule a média aritmética simples dos valores que permaneceram 
 
 
4
 outliers em estatística. 
Medidas estatísticas 
 
Estatística Básica − 9 − prof. José Aguinaldo 
Calcule a média aparada de 10% para as idades de vinte alunos (vamos considerar que os 
valores 75 e 8 foram erro de digitação). 
 
8, 75, 21, 19, 18, 21, 19, 20, 21, 19, 19, 20, 22, 21, 21, 20, 19, 19, 21, 19 
 
Inicialmente, vamos ordenar os valores. 
 
8, 18, 19, 19, 19, 19, 19, 19, 19, 20, 20, 20, 21, 21, 21, 21, 21, 21, 22, 75Como queremos média aparada de 10%, a quantidade de valores que devem ser retiradas de 
cada extremidade é 
T = 10⋅20/100 = 2 valores (= 10% de 20) 
Os valores retirados são: 8, 18, 22 e 75. 
 
A média aparada é 9,19
16
319
16
211919
==
+++
=
L
apx anos 
 
•••• Média ponderada 
A média ponderada é a média das observações x1, x2, ..., xn levando em consideração seus 
respectivos pesos w1, w2, ..., wn. A média ponderada (�̅/) é dada por: 
 
�̅/ = ∑ ��0�����∑ 0����� =
��
	��	1������	(�
���	�	1�
�)
��
	��
	1�
�
 
 
 
Um professor aplicou quatro avaliações, cada uma tendo os seguintes pesos 1.5, 2, 4 e 6.5. Um 
aluno tirou as seguintes notas nessas avaliações 20, 25, 28 e 10. 
 
Nota (x) 20 25 28 10 
Peso (w) 1,5 2 4 6,5 
 
A média das notas deste aluno ponderadas pelos pesos será: 
 
�̅/ = ∑ ��0�����∑ 0����� =
20 × 1,5 + 25 × 2 + 28 × 4 + 10 × 6,51,5 + 2 + 4 + 6,5 = 25714 = 18,36	1�	��
 
Sem levar em consideração os pesos de cada prova, a nota média seria igual a 20,75 pontos, 
maior que os 18,36 pontos obtidos pela ponderação. O motivo dessa queda é que o aluno tirou 
uma nota muito baixa em uma prova com maior peso. 
Uma maneira mais prática de calcular a média ponderada é trabalhar com os dados dispostos 
em uma tabela. 
 
(1) 
x 
(2) 
w 
(3) 0 ∙ � 
20 1,5 30 
25 2 50 
28 4 112 
10 6,5 65 
- ∑w = 14 ∑w⋅x = 257 
 
�̅/ = ∑ ��0�����∑ 0����� =
25714 = 18,36 
Medidas estatísticas 
 
Estatística Básica − 10 − prof. José Aguinaldo 
Observação: 
Se os pesos (w) forem todos iguais, então a média ponderada será igual a média aritmética 
simples. Por exemplo, se os pesos (w) das provas no exemplo acima forem todos iguais a k, 
então a média pondera seria igual a média aritmética simples (20,75). 
 
�̅/ = ∑ ������ 0�∑ 0����� =
20 × 4 + 25 × 4 + 28 × 4 + 10 × 44 + 4 + 4 + 4 = 33216 = 20,75	1�	��
 
 
Demonstração 
( )
x
n
x
n
xxx
kn
xxxk
k k k 
kxkxkx
x
n
1i
i
n21n21n21
p ==
+++
=
⋅
+++
=
+++
+++
=
∑
=
LL
L
L
 
 
 
•••• Média geométrica 
 
A média geométrica dos n valores (positivos) x1, x2, ..., xn é a raiz n-ésima do produtos destes n 
valores. A média geométrica, denotada por gx , é calculada algebricamente por: 
n
n21g xxxx ⋅⋅⋅= L 
 
Por exemplo, a média geométrica dos valores 8, 5, 3, 6 é 
 
4
g 6358x ⋅⋅⋅= = 18,57204 = 
Aplicação: 
A média geométrica mede a taxa média de variação de uma variável ao longo do tempo, por 
exemplo, um crescimento médio de juros compostos com taxas variáveis ao longo de um período 
ou uma taxa média de retorno de um investimento ao longo do tempo. 
 
Como exemplo, o faturamento de uma empresa cresceu 30% em 2005, 26% em 2006, 48% em 
2007 e 15% em 2008. Qual foi a média de crescimento por ano? Vamos usar a média geométrica 
para obter esta taxa média de crescimento do faturamento. 
 
Se houve crescimento de 30%, 26%, 48% e 15% nos faturamentos, então os faturamentos de 
cada ano foram multiplicados por 1,30, 1,26, 1,48 e 1,15, respectivamente. A média geométrica 
dos valores 1,30, 1,26, 1,48 e 1,15 será: 
 
=⋅⋅⋅=
4
g 15,148,126,130,1x 29217,178788,24 = (um crescimento médio de 29,217%) 
 
A média geométrica da taxa de crescimento do faturamento no período estudado (2005 a 2008) 
foi de 29,217%. 
 
 
 
 
 
 
Medidas estatísticas 
 
Estatística Básica − 11 − prof. José Aguinaldo 
Para compreender melhor ... 
A tabela a seguir mostra a evolução dos faturamentos ao longo do período para o exemplo 
anterior, partindo de um faturamento hipotético de R$ 100 antes de iniciar o ano de 2005. No 
final de 2008, o faturamento obtido foi de 278,79 reais. 
Evolução dos faturamentos partindo de um valor 
inicial de R$ 100 
Ano Taxa Faturamento 
 100 reais 
2005 30% 100 * 1,30 = 130,00 
2006 26% 130,00 * 1,26 = 163,80 
2007 48% 163,80 * 1,48 = 242,42 
2008 15% 242,42 * 1,15 = 278,79 
 
Se usássemos a média geométrica obtida (29,217%) para cada ano teríamos o mesmo 
faturamento em 2008. 
Ano Taxa Faturamento 
 100 reais 
2005 29,22% 100 * 1,29217 = 129,22 
2006 29,22% 129,22 * 1,29217 = 166,97 
2007 29,22% 166,97 * 1,29217 = 215,75 
2008 29,22% 215,75 * 1,29217 = 278,79 
 
89::; = 100 × (1,29217)< = 278,79 
 
Esta é a finalidade das médias - obter o mesmo efeito produzido pelos valores individuais. 
A média aritmética simples das taxas foi de 29,75% (ligeiramente maior que a média geométrica). 
%75,29
4
15482630
x =
+++
= 
Estes 29,75% produziriam um faturamento de R$ 283,4 em 2008, diferente dos R$ 278,79 
esperados. 
89::; = 100 × (1,2975)< = 283,42	��
�
 
 
•••• Média harmônica 
A média harmônica equivale ao inverso da média aritmética dos inversos de n valores. Se temos 
n valores x1, x2, ..., xn, a média harmônica, denotada por hx , é calculada algebricamente por: 
∑
=
=
+++
=
n
i in x
xxx
n
121
h
1
1
111x
L
 
 
Por exemplo, a média harmônica dos valores 8, 5, 3, 6 é 
848,4
8250,0
4
6
1
3
1
5
1
8
1
4
x h ==
+++
=
 
Medidas estatísticas 
 
Estatística Básica − 12 − prof. José Aguinaldo 
Aplicação5: 
Problemas envolvendo média de velocidades, vazões, taxas e frequências são, em geral, 
resolvidos com a média harmônica. Por exemplo, ao percorrer um mesmo trajeto a 60 km/h na 
ida e a 40 km/h na volta, sua velocidade média no percurso não será a média aritmética 50 km/h 
[ = (50+60) ], mas sim a média harmônica, que é igual a 48 km/h [= 2 / (1/40 + 1/60) ]. 
 
Algumas observações 
 
a) Comparação entre as médias aritmética, geométrica e harmônica. 
 
É importante destacar que em todas as médias, o resultado sempre estará entre o maior e o 
menor número dado no conjunto e que para os mesmos valores, a média aritmética será o maior 
valor, seguida da média geométrica e depois da média harmônica. Resumidamente, se xmin e 
xmax são, respectivamente, o menor e maior valor do conjunto de dados, então temos que: 
maxghmi xxxxx ≤≤≤≤ 
 
b) Propriedades da média aritmética simples 
Suponha que os dados do conjunto x = {x1, x2,..., xn} têm uma média x : 
(1) Somando-se (ou subtraindo-se) uma constante a de todos os valores de uma variável, a 
média do conjunto fica aumentada (ou diminuída) dessa constante. 
Se axy ii ±= ⇒⇒⇒⇒ axy ±= 
(2) Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante b, 
a média do conjunto fica multiplicada (ou dividida) dessa constante. 
Se ii bxy = ⇒⇒⇒⇒ xby = 
(3) A soma dos desvios de cada valor xi em torno da média é sempre zero, ou seja, 0=∑
=
n
1i
id
onde xxd ii −= . 
 
 
EXEMPLO 01 - Considere o conjunto X = {1, 2, 3, 3, 4, 5}, cuja média é x = 3. 
 
a) Qual é a soma dos desvios de cada valor x em relação à média x ? 
b) Se cada valor x for somado o valor 6, qual será a média dos ‘novos’ valores? 
c) Se cada valor x for multiplicado pelo valor 4, qual será a média dos ‘novos’ valores? 
 
 
5
 José Luiz Pastore Mello, mestre em ensino de matemática pela USP e professor do Colégio Santa Cruz 
em especial para folha de São Paulo. 
Medidas estatísticas 
 
Estatística Básica − 13 − prof. José Aguinaldo 
Solução ------------------------------------------------------------------------------------------------------------------ 
 
Vamos aplicar as propriedades vistas acima. 
 
a) A soma dos desvios de cada valor x em relação à média é SEMPRE zero.Se d é o 
desvio, então Σd = 0 (veja a coluna 2 da tabela abaixo). 
 
b) Se y = x + 6, então 6+= xy = 3 + 6 = 9 (veja a coluna 3 da tabela abaixo). 
 
c) Se yi = 4*xi, então xy *4= = 4*3 = 12 (veja a coluna 4 da tabela abaixo). 
 
 
 
(1) 
x 
(2) 
xxd −=
 
(3) 
y = x + 6 
(4) 
y = 4*x
 
1 -2 7 4 
2 -1 8 8 
3 0 9 12 
3 0 9 12 
4 1 10 16 
5 2 11 20 
média = 3 soma = 0 média = 9 média = 12 
 
 
EXEMPLO 02 - O salário médio de 20 funcionários é 800 reais. Se cada funcionário recebeu 
um aumento de 20%, determine o salário médio após o aumento. 
Solução ------------------------------------------------------------------------------------------------------------------ 
Se cada funcionário recebeu um aumento de 20%, então seu salário foi multiplicado por 1,20. 
Portanto, o salário médio após o aumento é de 960 reais (= 800 * 1,20) pela propriedade 3. 
 
 
 
 
Medidas estatísticas 
 
Estatística Básica − 14 − prof. José Aguinaldo 
2.2 −−−− Medidas de posição central para dados agrupados em tabelas de 
frequência 
2.2.1 −−−− Dados agrupados em tabelas de frequência sem classe 
•••• Média 
Em tabelas de frequência sem intervalos de classe, as frequências (absoluta ou relativa) de cada 
valor xi da variável funcionam como fatores de ponderação, já que elas podem ser vistas como 
indicadores da intensidade de cada valor da variável. 
Por esse motivo, o cálculo de uma média amostral é bem parecido com o cálculo da média 
ponderada, tendo as frequências como pesos dos valores. 
 
�̅/ = ∑ ��=�����∑ =����� =
��
		��
		1������
	(�
���	 × =���)
��
(=���) 
 
 
EXEMPLO 03 - A tabela abaixo mostra a distribuição do o número de filhos para uma amostra 
de 20 funcionários. Calcule a média do número de filhos desses funcionários. 
 
Número de 
filhos 
Quantidade de 
funcionários 
0 5 
1 7 
2 5 
3 2 
4 1 
Solução ------------------------------------------------------------------------------------------------------------------ 
Para facilitar o cálculo da média, vamos acrescentar coluna � ∙ = que é o produto de cada valor 
x pela sua respectiva frequência f. 
 
X f x·f 
0 5 0 
1 7 7 
2 5 10 
3 2 6 
4 1 4 
Total ∑= = 20 ∑>�=? = 27 
 
 
 
 
 
 
 
 
 
 
 
 
 
Da tabela ao lado temos: ∑= = 20		�	 ∑>�=? = 27 
Portanto, 
�̅ = ∑>�=?∑ = = 2720 = 1,35	=��ℎ�								 
 
Obs: Pode parecer estranho dizer 1,35 filho, mas esse 
valor é uma média. Seria estranho dizer que uma família, 
em específico, tem 1,35 filho. 
 
Medidas estatísticas 
 
Estatística Básica − 15 − prof. José Aguinaldo 
•••• Mediana 
 
O cálculo da mediana para dados agrupados é bem semelhante àquele utilizado em dados não 
agrupados. Só vamos acrescentar a frequência acumulada (Fi) para ajudar na localização da 
mediana na tabela. 
 
Procedimento 
 
• Determine a frequência absoluta acumulada (Fi); 
• Calcule 2n=pos que é a posição da mediana (lembre-se: n = Σfi) 
• Localize a mediana como sendo o valor, cuja com frequência acumulada (Fi) é 
imediatamente superior à posição pos da mediana; 
 
Observação: 
No caso de existir uma frequência acumulada Fi exatamente igual a pos = n/2, a mediana será 
igual a média entre dois valores da variável. Um destes valores corresponderá ao Fi e o outro 
valor corresponderá ao Fi seguinte. 
 
EXEMPLO 04 - A tabela abaixo mostra a distribuição do o número de filhos para uma amostra 
de 20 funcionários. Calcule a mediana do número de filhos desses funcionários. 
 
Número de 
filhos 
Quantidade de 
funcionários 
0 5 
1 7 
2 5 
3 2 
4 1 
Solução ------------------------------------------------------------------------------------------------------------------ 
Para ajudar no cálculo da mediana, vamos acrescentar coluna F, que é a frequência absoluta 
acumulada. 
 
x f F 
0 5 5 
1 7 12 
2 5 17 
3 2 19 
4 1 20 
Total ∑∑∑∑ fi = 20 -- 
 
 
 
Há outra forma de obter a mediana de tabela sem classe. Basta replicar cada valor obtendo um 
conjunto de dados expandidos e depois calcular a mediana da mesma forma como foi calculado 
em dados não agrupados. Vamos usar esta forma com os dados da tabela anterior. O valor 0 
tem uma frequência de 5, ou seja, ele “repete” cinco vezes, o 1 repete 7 vezes e assim 
sucessivamente. 
 
0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 4 
 
Como 20 é par, a mediana será a média dos dois valores centrais acima (1 e 1). A mediana será 
(1+1)/ 2 = 1 filho. 
 
 
 
 
 
A posição da mediana é pos = n/2 = 20/2 = 10 
 
Da tabela vemos que a mediana é o valor 1 (um), visto 
que a frequência absoluta acumulada F é 12 
(imediatamente superior a pos =10). 
 
Portanto, a mediana é Md = 1 filho 
 
Medidas estatísticas 
 
Estatística Básica − 16 − prof. José Aguinaldo 
EXEMPLO 05 - Calcule a mediana da variável X na tabela abaixo. 
 
X Frequência 
0 4 
1 6 
2 7 
3 2 
4 1 
Solução ------------------------------------------------------------------------------------------------------------------ 
Para ajudar no cálculo da mediana, vamos acrescentar coluna F, que é a frequência absoluta 
acumulada. 
 
 X fi Fi 
0 4 5 
1 6 10 
2 7 17 
3 2 19 
4 1 20 
Total ∑∑∑∑fi = 20 -- 
 
 
 
•••• Moda 
 
A moda é o valor da variável com maior frequência (absoluta ou relativa). 
 
EXEMPLO 06 - A tabela abaixo mostra a distribuição do o número de filhos para uma amostra 
de 20 funcionários. Calcule a moda do número de filhos desses funcionários. 
 
Número de 
filhos 
Quantidade de 
funcionários 
0 5 
1 7 
2 5 
3 2 
4 1 
Solução ------------------------------------------------------------------------------------------------------------------ 
 
 xi fi 
0 5 
1 7 
2 5 
3 2 
4 1 
Total ∑∑∑∑fi = 20 
 
 
Da tabela vemos que a moda é o valor 1 (um), visto que ele 
apresenta a maior frequência absoluta (fi = 7) 
 
Portanto, a moda é Mo = 1 filho. 
 
A posição da mediana é pos = n/2 = 20/2 = 10 
Como existe uma Fi = 10, então 
 
Md = (1+2)/2 = 1,5 filho 
 
Portanto, a mediana é Md = 1,5 filho 
 
Medidas estatísticas 
 
Estatística Básica − 17 − prof. José Aguinaldo 
2.2.2 −−−− Dados agrupados em tabelas de frequência com classe 
•••• Média 
Em tabelas de frequência com intervalos de classe, as frequências (absoluta ou relativa) 
também funcionam como fatores de ponderação dos valores da variável. Mas é aí que está um 
problema, qual valor do intervalo deverá ser usado? 
Como estamos trabalhando com intervalos, temos de decidir qual valor usar para a variável em 
cada classe. Se optar por trabalhar com o limite inferior das classes, a média tende a ser 
subestimada (ser menor do que realmente é), por outro lado, se optar por trabalhar com o limite 
superior das classes, a média tende a ser superestimada (ser maior do que realmente é). Para 
evitar a subestimação e superestimação da média, assumimos que os valores estão distribuídos 
de forma uniforme dentro da classe e calculamos o ponto médio (PM) xi de cada classe. O cálculo 
da média é: 
 
�̅/ = ∑ ��=�����∑ =����� =
��
		��
		1������
	(AB	 × =���)
��
(=���) 
 
 
 
EXEMPLO 07 - A tabela abaixo mostra a distribuição dos salários (em salários-mínimos) para 
uma amostra de 20 funcionários. Calcule a média do salário desses funcionários. 
 
 TABELA - Salários dos funcionários 
Salários 
(em SM) 
Quantidade de 
funcionários 
 4 | 8 5 
 8 | 12 7 
12 | 16 416 | 20 3 
20 | 24 1 
Solução ------------------------------------------------------------------------------------------------------------------ 
 
Complete a tabela acrescentando uma coluna com o ponto médio de cada classe (xi) e uma 
coluna com o produto � ∙ = 
 
Salários X (PM) f x·f 
 4 | 8 6 5 30 
 8 | 12 10 7 70 
12 | 16 14 4 56 
16 | 20 18 3 54 
20 | 24 22 1 22 
Total --- ∑ = 20 ∑ = 232 
 
 
 
 
 
 
 
 
 
 
Da tabela ao lado temos: 
∑fi = 20 e ∑[xifi] = 232. 
 
Portanto, 
 
�̅/ = ∑ ��=�����∑ =����� =
23220 = 11,6	CB 
 
Medidas estatísticas 
 
Estatística Básica − 18 − prof. José Aguinaldo 
•••• Mediana 
 
Para obter a mediana em dados agrupados com classe, o procedimento é o seguinte: 
 
• Obtenha a frequência absoluta acumulada (Fi); 
• Calcule a posição da mediana pos = n/2 (lembre-se: n = Σ fi) 
• Localize a classe mediana, como sendo a classe com a frequência 
acumulada (Fi) imediatamente superior à posição pos da mediana; 
• Calcule a mediana usando um dos dois métodos abaixo: 
 
B���	�
	�	���1��
çã�	��	�
�:							Bd = ℓ + J	2 − 8.�LM= (N − ℓ) 
 
B���
	
	O���
:																																						Bd = ℓ + N2 
 
onde, 
if , l e L = frequência absoluta, limite inferior e superior da classe mediana, 
respectivamente. 
antF = frequência absoluta acumulada anterior à classe mediana. 
 
 
 
 
 
 
Observação: 
No caso de existir uma frequência acumulada Fi exatamente igual a 2n=pos , a mediana será 
o limite superior da classe correspondente. 
 
 
EXEMPLO 08 - A tabela abaixo mostra a distribuição dos salários (em salários-mínimos) para 
uma amostra de 20 funcionários. Calucle a mediana dos salários usando a interpolação linear. 
 
 TABELA - Salários dos funcionários 
Salários 
(em SM) 
Quantidade de 
funcionários 
 4 | 8 5 
 8 | 12 7 
12 | 16 4 
16 | 20 3 
20 | 24 1 
 
 
Medidas estatísticas 
 
Estatística Básica − 19 − prof. José Aguinaldo 
Solução ------------------------------------------------------------------------------------------------------------------ 
 
Vamos completar a tabela obtendo a frequência acumulada (Fi). 
 
Salários fi Fi 
 4 | 8 5 5 
 8 | 12 7 12 
12 | 16 4 16 
16 | 20 3 19 
20 | 24 1 20 
Total ∑ = 20 -- 
 
Usando o método da interpolação linear, a mediana será: 
 
( ) ( ) SM Md 86,10812
7
5108 =−⋅−+=
 
 
•••• Moda 
 
A moda em uma tabela de frequência com classe provavelmente está dentro da classe com a 
maior frequência. Essa classe é denominada de classe modal. 
 
Identificar a classe modal e calcule a moda usando um dos dois métodos abaixo: 
 
PéQRSR	ST	UVWXTY:										Mo = ℓ + (= − =.�L)(= − =.�L) + \= − =/]^L_ (N − ℓ) 
PéQRSR	ST	`abc:																Mo = ℓ + =/]^L=.�L + =/]^L (N − ℓ) 
PéQRSR	ST	dTeYfRb6:						Mo = 3Md − 2�̅ 
PRSe	XYWQe:																								Mo = ℓ + N2 
 
onde, 
 
 x e Md = média e mediana amostral 
l e L = limite inferior e superior da classe modal; 
if = frequência absoluta da classe modal; =.�L = frequência absoluta da classe anterior à 
classe modal; =/]^L	= frequência absoluta da classe posterior à 
classe modal. 
 
 
 
 
 
 
 
6
 O método de Pearson fornece boa aproximação para o cálculo da moda quando a distribuição analisada 
apresenta uma razoável simetria em torno da média. Algumas outras relações também são interessantes, a 
partir desse método. Por exemplo, ( ) 3x2MoMd ⋅+= ou ( ) 2MoMd3x −⋅= . 
A posição da mediana é pos = n/2 = 20/2 = 10. A 
classe mediana é a classe 8 | 12, pois a sua 
frequência acumulada é 12 (imediatamente superior 
a pos =10). Então, da tabela temos: 
 
l = 8, L = 12, if = 7 e antF = 5 
Medidas estatísticas 
 
Estatística Básica − 20 − prof. José Aguinaldo 
EXEMPLO 09 - A tabela abaixo mostra a distribuição dos salários (em salários-mínimos) para 
uma amostra de 20 funcionários. Calucle a moda dos salários usando os métodos de Czuber, 
King e de Pearson. 
 
 TABELA - Salários dos funcionários 
Salários 
(em SM) 
Quantidade de 
funcionários 
 4 | 8 5 
 8 | 12 7 
12 | 16 4 
16 | 20 3 
20 | 24 1 
Solução ------------------------------------------------------------------------------------------------------------------ 
 
A classe modal é a 8 | 12 (segunda classe), pois ela apresenta a maior frequência absoluta (f 
= 7). 
 
Salários fi 
 4,0 | 8,0 5 
 8,0 | 12,0 7 
12,0 | 16,0 4 
16,0 | 20,0 3 
20,0 | 24,0 1 
Total ∑ = 20 
 
Método de Czuber 
Mo = ℓ + (= − =.�L)(= − =.�L) + \= − =/]^L_ (N − ℓ) 				→ 								B� = 8 +
(7 − 5)(7 − 5) + (7 − 4) (12 − 8) = 9,6	CB 
Método de King 
Mo = ℓ + =/]^L=.�L + =/]^L (N − ℓ) 																			→ 							B� = 8 + 45 + 4 (12 − 8) = 9,8	CB 
Método de Pearson 
xMdMo ⋅−⋅= 23 → ( ) ( ) SM4,96,11286,103 =⋅−⋅=Mo 
 
Lembre-se de que a mediana (Md = 10,86) e a média ( x =11,6) foram obtidos nos exemplos 
anteriores. 
 
As informações que precisamos para calcular a 
moda são: 
l = 8, L = 12, if = 7, antf = 5, posf = 4 
Medidas estatísticas 
 
Estatística Básica − 21 − prof. José Aguinaldo 
2.3 - Exercícios propostos 
EXERCÍCIO 01 - Abaixo temos os saldos (em 100 reais) na conta corrente do Sr. DJ nos 
últimos seis meses. Considerando estes dados como amostra, calcule a média amostral, a 
mediana e a moda. 
-1,0 -3,0 5,0 1,0 -1,0 5,0 
resp: media = 1, mediana = 0, moda = 5 
EXERCÍCIO 02 - Uma amostra de 10 funcionários da empresa XYZ foi escolhida e registrada 
a distância em km que esses funcionários percorrem até chegar à empresa. 
 
x = distância percorrida = {13, 5, 15, 9, 3, 15, 9, 12, 15, 7} 
 
a) Qual a distância média percorrida pelos funcionários? 
b) Qual a mediana e a moda da distância percorrida pelos funcionários? 
c) Vamos imaginar que uma obra está sendo feito na estrada que leva à empresa XYZ, de 
forma que cada funcionário teria que percorrer mais 1,25 km para chegar à empresa. 
Calcule a distância média percorrida por esses funcionários considerando essa obra 
agora. 
d) Um funcionário que percorre 20 km foi acrescentado à amostra acima, mas vamos supor 
que o responsável pela entrada de dados errou na digitação e acabou registrando 200. 
Calcule novamente as medidas estatísticas que você calculou em ‘a’ e ‘b’. O que você 
reparou? 
resp: a) 10.3 b) 10.5 e 15 c) 11,55 d) 27.55 ; 12; 15 
EXERCÍCIO 03 - Um vendedor percorre um mesmo trajeto a 100 km/h na ida e a 60 km/h na 
volta. Qual a velocidade média harmônica desenvolvida pelo vendedor neste trajeto ida-volta? 
resp: 75 
EXERCÍCIO 04 - Sabendo que X é um conjunto de valores com média x = 5, calcule a média 
do conjunto ( ) 610X
5
4Y +−= . DICA: Utilize as propriedades da média. resp: 2 
EXERCÍCIO 05 - Um jornal anunciou que uma pessoa gasta, em média, 45 minutos por dia 
ouvindo música (The Des Moines Register, 5 de Dezembro de 1997). Os seguintes dados foram 
obtidos para o número de minutos gastos ouvindo música em uma amostra de 30 indivíduos. 
 
88,3 4,3 4,6 7 9,2 0 99,2 34,9 81,7 0 
85,4 0 17,5 45 53,3 29,1 28,8 0 98,9 64,5 
4,4 67,9 94,2 7,6 56,6 52,9 145,6 70,4 65,1 63,6 
 
a) Calcule o tempo médio que estes indivíduos amostrados ouvem música. Os dados 
amostrados são coerentes com a média populacional anunciada pelo jornal? 
b) Calcule a mediana do tempoouvindo música. 
resp: a) 46 b) 48.95 
 
 
Medidas estatísticas 
 
Estatística Básica − 22 − prof. José Aguinaldo 
EXERCÍCIO 06 - Calcule a média aparada de 5% para os dados abaixo, que se referem a 
distância percorrida até a empresa para uma amostra de 20 funcionários. 
x = {5, 6, 6, 2, 2, 2, 3, 3, 3, 8, 8, 8, 8, 9, 9, 9, 15, 13, 15, 11} 
resp: a) 7.25 
EXERCÍCIO 07 - Dona Maria foi à feira e encontrou batatas a R$ 1,50 o quilo e resolveu 
comprar 8 kg de batatas. Andando mais um pouco pela feira, ela encontrou batatas a R$ 1,00 kg 
e comprou mais 4 kg. No caminho de casa, notou que a quitanda do Sr. Manoel estava vendendo 
as batatas por R$ 0,60 e resolveu comprar mais 15 kg (vai gostar de batata, hein!). Qual foi o 
preço médio que Dona Maria pagou pelo quilo da batata? 
resp: a) 0.92 
EXERCÍCIO 08 - (Bussab e Morettin, modificado) A tabela abaixo mostra a distribuição dos 
frangos de uma granja em relação ao peso (em gramas). Calcule a mediana dos pesos dos 
frangos desta granja e escreva uma frase interpretando o valor obtido. 
 
Peso 
(em gramas) 
Quantidade 
de frangos 
fi 
 960 | 980 60 
 980 | 1000 160 
1000 | 1020 280 
1020 | 1040 260 
1040 | 1060 160 
1060 | 1080 80 
resp: a) 1020 
EXERCÍCIO 09 - De uma amostra de 500 divórcios ocorridos em uma cidade, foi registado a 
duração do casamento (em anos). Os dados estão na tabela abaixo. 
a) Qual a duração média dos casamentos? 
b) Qual é a moda (por Czuber) e a mediana (por interpolação linear) da 
duração dos casamentos? 
 
Anos de 
casamentos 
Quantidade de 
divórcios (fi) 
 0 | 6 280 
 6 | 12 140 
12 | 18 60 
18 | 24 15 
24 | 30 5 
resp: a) 46 b) 4 ; 5.36 
 
 
 
 
Medidas estatísticas 
 
Estatística Básica − 23 − prof. José Aguinaldo 
EXERCÍCIO 10 - Numa amostra de 150 candidatos ao vestibular, foi registrado o número de 
vestibulares prestados por cada um até aquele momento. Assim, pela tabela vemos que 75 
candidatos prestaram vestibular uma única vez e assim por diante. 
a) Qual o número médio de vestibulares prestados pelos candidatos? 
b) Qual é a moda e a mediana do número de vestibulares prestados pelos 
candidatos? 
 
Número de 
vestibular 
prestado 
Quantidade de 
candidatos 
(fi) 
1 75 
2 47 
3 21 
4 7 
resp: a) média = 1.73 b) md = 1,5 c) mo = 1 
EXERCÍCIO 11 - O histograma abaixo mostra a distribuição das notas finas de uma turma da 
disciplina de Introdução à Estatística. O eixo vertical representa a quantidade de aluno. Obtenha 
as seguintes medidas estatísticas: nota média, nota mediana (por interpolação linear) e moda 
(por Czuber) das notas. 
 
resp: média = 62.67 md = 65 mo = 65,94 
1009080706050403020
30
20
10
0
Notas
Qu
an
tid
ad
e
 
de
 
al
un
o
s 
(fi)
2
5
11
24
5643
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Medidas de Variabilidade 
 
Unidade 03 – Medidas Estatísticas 
 
Estatística Básica − 25 − prof. José Aguinaldo 
3 −−−− Medidas de Variabilidade 
3.1 −−−− Introdução 
A medida de dispersão ou de variabilidade procura “medir” o quanto os valores de um conjunto 
de dados estão afastados ou dispersos em relação a uma medida central, que normalmente é a 
média aritmética. Considere a quantidade de gols feitos por dois times nos últimos sete 
campeonatos nacionais. 
 
Time A: 80, 75, 80, 85, 75, 85, 80 
 
 
 
Time B: 50, 78, 67, 85, 88, 94, 98 
 
Cada time fez, em média, 80 gols em cada ano, nos levando a crer que ambos os times tiveram 
desempenhos iguais nos últimos sete campeonatos. Analisando a quantidade de gols marcados 
pelos times, notaremos que essa quantidade varia de 75 a 85 gols no time ‘A’, enquanto que a 
do time ‘B’ varia de 50 a 98 gols, e com essa análise da variação na quantidade de gols marcados 
podemos ver que o desempenho é bem distinto de ambos os times. 
Para quantificar a variação presente em um conjunto de dados, temos de nos valer das medidas 
de dispersão ou de variabilidade. As medidas usuais são: 
 
Medidas de dispersão absoluta 
Desvio-padrão 
Variância 
Amplitude 
Desvio médio absoluto 
 
Medidas de dispersão relativa 
Coeficiente de variação 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Unidade 03 – Medidas Estatísticas 
 
Estatística Básica − 26 − prof. José Aguinaldo 
3.2 −−−− Medida de variabilidade para dados brutos 
As medidas abaixo se referem aos dados brutos, ou seja, dados não agrupados em tabelas de 
frequência. 
 
•••• Amplitude 
A amplitude amostral é diferença entre o maior e o menor valor do conjunto de dados. 
 
MínimoMáximoAt −= 
Para o conjunto x = {9, 4, 5, 10, 7} a amplitude amostral será: 
6410 =−=tA 
É a medida mais simples de dispersão. Quanto maior for a amplitude, espera-se que os valores 
estejam mais afastados (maior dispersão ou variabilidade). A amplitude será sempre maior ou 
igual a zero, NUNCA negativa. 
Apesar de sua simplicidade, a amplitude deixa um pouco a desejar, principalmente quando temos 
grandes conjuntos de dados, pois ela só leva em consideração os valores extremos (mínimo e 
máximo) de um conjunto, deixando de lado os valores intermediários. 
 
Como exemplo, vamos calcular a amplitude dos valores de todos os conjuntos abaixo. 
x = {7, 7, 4, 7, 10} y = {9, 4, 5, 10, 7} 
Para o conjunto X, a amplitude será 10 – 4 = 6 e para o conjunto Y a amplitude será 10 – 4 = 6 
Os dois conjuntos abaixo têm mesma amplitude, deixando a entender que ambos têm a mesma 
variabilidade, mas o que vemos pelo gráficos de pontos abaixo é que a variabilidade não é igual 
(é maior no conjunto y). 
 
 
x = {7, 7, 4, 7, 10} At = 6 
 
 
y = {9, 4, 5, 10, 7} At = 6 
 
 
 
A amplitude tem grande aplicação na área de controle de qualidade ou em situações onde 
desejamos uma rápida medida de variabilidade dos dados. 
 
 
 
 
 
 
 
 
 
1211109876543
Distância percorrida
 
1211109876543
Distância percorrida
 
Unidade 03 – Medidas Estatísticas 
 
Estatística Básica − 27 − prof. José Aguinaldo 
 
•••• Desvio médio absoluto 
O grande inconveniente da amplitude é que ela usa apenas os valores extremos dos dados, 
deixando de lado os demais valores. Uma medida que considera todos os valores do conjunto 
seria mais interessante e “mais justa” para representar a variabilidade dos dados. 
O desvio médio absoluto, representado por DMA, é uma das medidas de dispersão que leva em 
consideração todos os valores do conjunto. O DMA analisa a dispersão dos dados em torno de 
um valor central, representado pela média aritmética. O desvio médio absoluto é dado pela 
fórmula abaixo: 
 
�̅ = ∑ |�� − �̅|���� 	 = 
��
	��
	módulos	��
	��
���
		(�� − �̅)��
	���
��	��	�
����
	��	� 
Como se vê, o desvio médio absoluto pode ser visto como uma média do afastamento dos 
valores em relação à média do conjunto. Quanto maior o DMA, mais afastados os valores estarão 
da média, portanto maior será a variabilidade. O DMA é uma medida sempre maior ou igual à 
zero, NUNCA negativa. 
 
EXEMPLO 10 - Calcule o desvio médio absoluto dos dois conjuntos de dados abaixo. 
x = {7, 7, 4, 7, 10} y = {9, 4, 5, 10, 7} 
Solução ------------------------------------------------------------------------------------------------------------------ 
O modo mais práticode calcular o desvio médio absoluto é formar uma tabela com os valores e 
calcular o módulo dos desvios em torno da média. Veja abaixo como ficariam os cálculos. 
 Conjunto x Conjunto y 
xi xx i − xx i − 
 
yi yy i − yyi − 
7 0 0 9 2 2 
7 0 0 4 -3 3 
4 -3 3 5 -2 2 
7 0 0 10 3 3 
10 3 3 7 0 0 
- ∑ = 0 ∑ = 6 - ∑ = 0 ∑ = 10 
 
2,1
5
61
==
−
=
∑
=
n
xx
DMA
n
i
i
X 0,25
101
==
−
=
∑
=
n
yy
DMA
n
i
i
Y 
 
Como o DMAY foi maior que o DMAX, conclui-se que o conjunto y apresenta maior variabilidade 
em seus valores do que o conjunto x. 
Apesar de usar todos os valores do conjunto e resolver aquele “problema” apresentado pela 
amplitude, o desvio médio absoluto também apresenta alguns pontos fracos, dentre eles: 
• O DMA é bastante influenciado pelos valores atípicos (outliers); 
• Pelo fato de trabalhar com o módulo, certas propriedades estatísticas do DMA são 
difíceis de serem verificadas7. 
 
 
 
 
 
7
 Verificar se um estimador é não-viciado e com menor variabilidade. 
Unidade 03 – Medidas Estatísticas 
 
Estatística Básica − 28 − prof. José Aguinaldo 
•••• Variância amostral (s2) e desvio-padrão amostral (s) 
A variância amostral, representada por s2, é uma medida de variabilidade baseada nos desvios 
de cada valor em torno da média. Como esses desvios podem assumir valores positivos e 
negativos, a soma de todos eles será sempre zero. Para evitar que esta soma dê sempre zero, 
a variância trabalha com os desvios elevados ao quadrado8. A variância é dada pela fórmula 
abaixo: 
�̅ = ∑ (�� − �̅)9����	 − 1 =
��
	��
	��
���
	(�� − �̅)	
�	��
��
��(	��
	���
��	��	�
����
	��	�) − 1 
onde 
( ) ( ) ( ) ( )2n2221
n
1i
2
i xxxxxxxx −++−−=−∑
=
L (soma dos desvios ao quadrado) 
A variância pode ser vista como uma média dos desvios ao quadrado. Quanto maior a variância, 
mais afastados os valores estarão da média, portanto maior será a variabilidade dos valores. A 
variância é uma medida sempre maior ou igual a zero, NUNCA negativa. 
 
EXEMPLO 11 - Calcule a variância dos dois conjuntos de dados abaixo. 
x = {7, 7, 4, 7, 10} y = {9, 4, 5, 10, 7} 
Solução ------------------------------------------------------------------------------------------------------------------ 
O modo mais prático é também formar uma tabela com os valores, 
Conjunto x Conjunto y 
xi xx i − ( )2i xx − yi yy i − ( )2i yy − 
7 0 0 9 2 4 
7 0 0 4 -3 9 
4 -3 9 5 -2 4 
7 0 0 10 3 9 
10 3 9 7 0 0 
- ∑ = 0 ∑ = 18 - ∑ = 0 ∑ = 26 
 
( )
5,4
15
18
1n
xx
s
n
1i
2
i
2
x =
−
=
−
−
=
∑
=
 
( )
5,6
15
26
1n
yy
s
n
1i
2
i
2
y =
−
=
−
−
=
∑
=
 
 
Como o 2Xs foi menor que o 
2
Ys , conclui-se que o conjunto x apresenta menor variabilidade em 
seus valores do que o conjunto y (os valores de x estão mais homogêneos em torno da média). 
Pelo fato de trabalhar com os desvios elevados ao quadrado, a unidade de medida da variância 
é também elevada ao quadrado também. Por exemplo, se conjunto x do exemplo anterior se 
referir à idade (em anos) de cinco crianças, então a variância será igual a 4,5 anos2. Se o conjunto 
se referir ao salário (em mil reais) de cinco funcionários, então a variância será igual a 4.500 
reais2 e, por fim, se o conjunto se referir ao número de filhos de cinco famílias, então a variância 
será igual 4,5 filhos2. 
 
 
 
8
 O DMA calcula o módulo de cada desvio, em vez de elevar cada desvio ao quadrado. 
Unidade 03 – Medidas Estatísticas 
 
Estatística Básica − 29 − prof. José Aguinaldo 
Fica difícil ter alguma interpretação prática para a variância, já que sua unidade de medida não 
é a mesma dos dados originais. Para resolver essa pequena inconveniência, bastou tirar a raiz 
quadrada do valor da variância, dessa forma, surgiu o desvio-padrão. 
O desvio-padrão amostral, representada por s, é apenas a raiz quadrada da variância. Portanto 
sua fórmula é dada por: 
variância=s
 → 
( )
1n
xx
s
n
1i
2
i
−
−
=
∑
=
 
 
O desvio-padrão dois conjuntos de dados no exemplo anterior foi: 
 
O desvio-padrão do conjunto x é == 5,4s
x
2,12 
O desvio-padrão do conjunto y é == 5,6s y 2,55 
Quanto maior o valor do desvio-padrão, mais afastados os valores estarão da média, portanto 
maior será a variabilidade dos valores. A unidade de medida do desvio-padrão é a mesma 
unidade dos dados originais. Por exemplo, se conjunto x do exemplo anterior se referir à idade 
(em anos) de cinco crianças, então o desvio-padrão será igual a 2,12 anos e, por fim, se o 
conjunto se referir ao salário (em mil reais) de cinco funcionários, então o desvio-padrão será 
igual a 2.120 reais. 
O que de fato é o desvio-padrão? 
Essa é a pergunta mais frequente do aluno. O que podemos dizer é que o desvio-padrão é uma 
medida do quanto os valores estão afastados da média (ou uns dos outros para ser mais fácil de 
entender), sua utilidade é mais visível quando ele é usado para comparar a variabilidade entre 
diversos conjuntos de valores. Por exemplo, suponha alguém esteja interessado em um emprego 
oferecido por duas pelas empresas. O resumo dos salários dessas empresas está na tabela 
abaixo: 
 
Empresa Salário médio Desvio-padrão dos salários 
A 1500 reais 50 reais 
B 1500 reais 250 reais 
O salário médio de ambas as empresas é 1500 reais, então a pessoa interessada deve estar 
ciente de que o seu salário vai girar em torno desse valor. Analisando o desvio-padrão, vemos 
que a variabilidade dos salários na empresa ‘A’ é muito menor indicando que os salários dessa 
empresa estão bem próximos de 1500 do que os salários da empresa ‘B’. Então, se a escolha 
não fosse influenciada por outros fatores (plano de carreira, plano de saúde, vale refeição, etc), 
a empresa ‘A’ seria mais interessante do que a ‘B’. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Unidade 03 – Medidas Estatísticas 
 
Estatística Básica − 30 − prof. José Aguinaldo 
CASO PARTIULAR: Variância e desvio-padrão populacional 
 
Por outro lado, quando trabalhamos com os dados de uma população (o que não é tão comum 
assim na prática), a variância passa a ser denominada de variância populacional e é denotado 
pelo símbolo σσσσ2 (leia-se sigma ao quadrado). Na realidade, o cálculo é semelhante ao cálculo da 
variância amostral, com exceção de que no denominador não há a subtração do valor 1. A 
fórmula da variância populacional, simbolizada por σσσσ2 e do desvio-padrão populacional, 
simbolizada por σσσσ, é: 
 
Variância Desvio-padrão 
( )
N
µx
σ
N
1i
2
i
2
∑
=
−
=
 
( )
N
µx
σ
N
1i
2
i∑
=
−
= 
onde 
xi = i-ésimo valor da variável X 
µ = média populacional 
N = tamanho da população 
 
Como exemplo, imagine uma pequena região fictícia com apenas oito famílias, onde temos 
abaixo as renda (em reais) de cada uma delas. 
 
450 560 550 300 620 400 500 580 
 
 
Assumindo que esta região é a sua população de interesse, calcule a desvio-padrão 
populacional destas famílias. 
 
Média populacional: 495
8
3960
8
580560450
N
x
µ
N
1i
i
==
+++
==
∑
=
L
 reais 
 
Desvio-padrão populacional: 
 
( ) ( ) ( ) ( ) 50,99
8
79200
8
495580495560495450
N
µx
σ
222
N
1i
2
i
==
−++−+−
=
−=
∑
=
L
 
 
O desvio-padrão populacional das rendas é 99,50 reais. 
 
 
Por que na variância amostral a divisão é por n - 1 e não por n? 
Quando temos os dados de toda a população, o cálculo da variância é feito dividindo a soma dos 
desvios ao quadrado pelo tamanho da população N, obtendo, então, uma média desses desvios. 
Entretanto, na estatística, frequentemente trabalhamos com uma amostra apenas e o desejo é 
usar essa amostra para obter estimativas de parâmetros da população, entre eles a variância 
populacional (σ2). 
Ao calcular a variância amostral (s2) usando n no denominador, o valor obtido de s2 estará 
subestimando a real variância (σ2). Então, para melhorar a estimativa da real variância (σ2), 
calculamos a variância usando o n – 1 no denominador, em vez de n. 
 
 
 
 
Unidade 03 – Medidas Estatísticas 
 
Estatística Básica − 31 − prof. José Aguinaldo 
Fórmula alternativa de calcular a variância e/ou o desvio-padrão 
Há uma fórmula alternativa que nos permite calcular a variância e o desvio-padrão amostral. 
 
Variância amostral Desvio-padrão amostral 
9 = 	\∑ ��9���� _ − (∑ ������ )9	(	 − 1) 																												s = n	\∑ ��
9���� _ − \∑ ������ _9	(	 − 1) 
 
Para simplificar a fórmulas vamos retirar os índices dos somatórios e dos x´s 
 
Variância amostral Desvio-padrão amostral 
9 = 	(∑�9) − (∑ �)9	(	 − 1) 																																			s = n	(∑ �
9) − (∑�)9	(	 − 1) 
 
onde: ∑�9	 				= 
��
	��
	�
����
	�	����
��
	��
��
�� (∑�	)9 = ��
��
��	�
	
��
	��
	�
����
 
 
Como exemplo, vamos usar o conjunto X = (3, 4, 5) ∑�9	 						= 39 + 49 + 59 = 9 + 16 + 25 = 50 (∑ �	)9 		= (3 + 4 + 5)9 = 129 = 144 
 
 
EXEMPLO 12 - Calcule a variância do conjunto x = {7, 7, 4, 7, 10} usando a fórmula 
alternativa. 
 
x �9 
7 49 
7 49 
4 16 
7 49 
10 100 
∑ ix = 35 ∑�9 = 263 
 
 
 
Propriedades do desvio-padrão 
 
Suponha que os dados do conjunto x = {x1, x2,..., xn} têm um desvio-padrão sx: 
(1) Somando-se (ou subtraindo-se) uma constante “a” a todos os valores de uma variável, o 
desvio-padrão do conjunto não se altera. Em outras palavras, adicionar/subtrair uma 
constante “não” muda o valor do desvio-padrão. 
Se axy ii ±= ⇒⇒⇒⇒ xy ss = 
(2) Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante “b”, 
o desvio-padrão do conjunto fica multiplicado (ou dividido) dessa constante. 
Se ii bxy = ⇒⇒⇒⇒ xy bss = 
 
 
Variância amostral: 
9 = 	(∑�9) − (∑ �)9	(	 − 1) = 5 ∙ 263 − (35)
9
5 ∙ 4 = 4,5 
 
Desvio-padrão amostral: 
5,4=s = 2,12 
Unidade 03 – Medidas Estatísticas 
 
Estatística Básica − 32 − prof. José Aguinaldo 
 
EXEMPLO 13 - Considere o conjunto x = {1, 2, 3, 3, 4, 5}, cujo desvio-padrão é sx = 1,4142. 
 
a) Se cada xi for adicionado o valor 6, qual será o desvio-padrão dos ‘novos’ valores? 
b) Se cada xi for multiplicado pelo valor 4, qual será o desvio-padrão dos ‘novos’ valores? 
Solução ------------------------------------------------------------------------------------------------------------------ 
 
Vamos aplicar as propriedades vistas acima. 
 
a) Se yi = xi + 6, então 
xy ss = = 1,4142 (como exercício, deixo para vocês calcularem o 
desvio-padrão usando as fórmulas que viram anteriormente). 
 
b) Se yi = 4*xi, então 
xy s4s ⋅= = 4*1,4142 = 5,6568 (como exercício, deixo para vocês 
calcularem o desvio-padrão usando as fórmulas que viram anteriormente). 
 
(1) 
xi 
(2) 
yi = xi + 6 
(3) 
yi = 4*xi 
1 7 4 
2 8 8 
3 9 12 
3 9 12 
4 10 16 
5 11 20 
sx = 1,4142 sy = 1,4142 sy = 5,6569 
 
 
EXEMPLO 14 - Sabendo que X é um conjunto de valores com desvio-padrão sx = 15, calcule 
o desvio-padrão e a variância do conjunto ( ) 610
5
4
+−= XY . 
Solução ------------------------------------------------------------------------------------------------------------------ 
 
Vamos primeiro desenvolver a fórmula do Y 
 
( ) 2
5
468
5
4610
5
4
5
4610
5
4
−=+−=+−=+−= XXXXY 
 
Portanto, 2
5
4
−= XY
 e aplicando as propriedades (1 e 2) 1215
5
4
5
4
=⋅== xy ss . 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Unidade 03 – Medidas Estatísticas 
 
Estatística Básica − 33 − prof. José Aguinaldo 
•••• Coeficiente de variação (CV) 
A amplitude, o desvio médio absoluto, a variância e o desvio-padrão são medidas absolutas de 
dispersão. O coeficiente de variação, representado por CV, é uma medida relativa de dispersão, 
pois leva em consideração a média do conjunto de dados. Ele é a razão entre o desvio-padrão s 
e a média x , isto é: 
x
sCV = 
Como se pode ver, o CV é adimensional (não tem unidade de medida) e multiplicando o valor 
obtido por 100, ele será expresso em percentual (%). O coeficiente de variação é indicado para 
comparar variabilidade de variáveis com unidades diferentes ou comparar variabilidade entre 
conjuntos com médias bem diferentes. 
 
EXEMPLO 15 - Considere os quatro conjuntos de valores: 
X = Peso de recém-nascidos (em kg) = {4, 5, 6, 5} 
Y = Peso da mãe (em kg) = {65, 75, 68, 60} 
Z = Altura da mãe (em cm) = {178, 176, 170, 160} 
Z = Altura do pai (em cm) = {185, 180, 175, 160} 
 
QUADRO RESUMO 
X = Peso de recém-
nascidos 
(em kg) 
Y = Peso da mãe 
dos recém-
nascidos 
(em kg) 
Z = Altura da mãe 
dos recém-
nascidos 
(em cm) 
Q = Altura do pai 
dos recém-
nascidos 
(em cm) 
média = 5 kg 
dp = 0,82 kg 
CV = 16,3% 
média = 67 kg 
dp = 6,78 kg 
CV = 9,4% 
média = 171 cm 
dp = 8,08 cm 
CV = 4,7% 
média = 175 cm 
dp = 10,8 cm 
CV = 6,2% 
dp = desvio-padrão 
 
Comparando variabilidade entre as variáveis X e Y 
→ As unidades de medidas são as mesmas para ambas as variáveis, porém o peso médio da 
mãe (67 kg) é muito diferente do peso médio da criança (5 kg). Nesse caso, a melhor forma 
de comparar a variabilidade é usar o coeficiente de variação (CVX = 16,3% e CVY = 
9,4%). Comparando os resultados, vê-se que a variação relativa dos pesos9 é maior para 
os recém-nascidos do que para as mães. 
 
Comparando variabilidade entre as variáveis Y e Z 
→ As unidades de medidas são bem diferentes (kg para peso e cm para altura). Nesse caso, a 
única forma de comparar a variabilidade é usando o coeficiente de variação (CVY = 9,4% e 
CVZ = 9,4%). Comparando os resultados, vê-se que a variação relativa é maior para os 
pesos das mães. 
 
Comparando variabilidade entre as variáveis Z e Q 
→ As unidades de medidas são as mesmas e as médias são bem parecidas (171 cm das mães 
e 175 cm dos pais). Nesse caso, podemos usar tanto o desvio-padrão quanto o coeficiente 
de variação. Comparando os resultados, vê-se que há uma maior variabilidade nas alturas 
dos pais (dp = 10,8 cm e CV = 6,2%) do que nas alturas das mães (dp = 8,08 cm e CV = 
4,7%). 
 
 
 
9Variação em torno da média. 
Unidade 03 – Medidas Estatísticas 
 
Estatística Básica − 34 − prof. José Aguinaldo 
3.3 −−−− Medidas de variabilidade para dados agrupados em tabelas de 
frequência 
3.3.1 −−−− Dados agrupados em tabelas de frequência sem classe 
Se os dados estão agrupados em tabela sem classe, então xi é o valor da nossa variável de 
interesse e fi é a frequência desse valor. Da mesma forma que levamos em consideração as 
frequências fi no cálculo da média agrupada, também devemos considerá-las no cálculoda 
variância e desvio-padrão. As duas fórmulas dão os mesmos resultados e, em se tratando de 
tabelas, a segunda fórmula abaixo é mais prática. 
 
9 = ∑(� − �̅)9=	 − 1 																				
9 =
	(∑�9=) − (∑�=)9
	(	 − 1) 		 
 
EXEMPLO 16 - A tabela abaixo mostra a distribuição do o número de filhos para uma amostra 
de 20 funcionários. Calcule a variância e o desvio-padrão do número de filhos dos funcionários. 
 
Número de 
Filhos 
Quantidade de 
funcionários 
0 5 
1 7 
2 5 
3 2 
4 1 
Solução ------------------------------------------------------------------------------------------------------------------ 
Para facilitar o cálculo da média, vamos acrescentar coluna x·f, que é o produto de cada valor x 
pela sua respectiva frequência f. 
 
 
 
 xi fi �= �9= 
0 5 0 0 
1 7 7 7 
2 5 10 20 
3 2 6 18 
4 1 4 16 
Total Σ =20 Σ = 27 Σ =61 
 
 
 
 
 
 
 
 
 
 
 
 
Da tabela ao lado temos: 	 = 20						 ∑ �9= = 61							 ∑ �= = 27		 
 
o
��â	q�
:		
9 = 	(∑�9=) − (∑ �=)9	(	 − 1) 
 
9 = 20(61) − (27)920 ∙ 19 = 1,29	=��ℎ�9 
 
r�
���	1
��ã�:		
 = 	s1,29 = 1,14	filho 
Unidade 03 – Medidas Estatísticas 
 
Estatística Básica − 35 − prof. José Aguinaldo 
3.2.2 −−−− Dados agrupados em tabelas de frequência com classe 
Se os dados estão agrupados em tabela com intervalo de classe, então xi é o ponto médio da 
classe e fi é a frequência dessa classe. As duas fórmulas dão os mesmos resultados e, em se 
tratando de tabelas, a segunda fórmula abaixo é novamente a mais prática. 
 
9 = ∑(� − �̅)9=	 − 1 																				
9 =
	(∑�9=) − (∑�=)9
	(	 − 1) 		 
 
EXEMPLO 17 - A tabela abaixo mostra a distribuição dos salários (em salários-mínimos) para 
uma amostra de 20 funcionários. Calcule a variância e o desvio-padrão dos salários dos 
funcionários. 
 
 TABELA - Salários dos funcionários 
Salários 
(em SM) 
Quantidade de 
funcionários 
 4 | 8 5 
 8 | 12 7 
12 | 16 4 
16 | 20 3 
20 | 24 1 
Solução ------------------------------------------------------------------------------------------------------------------ 
 
Complete a tabela acrescentando uma coluna com o ponto médio de cada classe (x), uma 
coluna com o produto x·f e outra com o produto x2·f. 
 
Salários xi fi iifx i2i fx 
 4,0 | 8,0 6 5 30 180 
 8,0 | 12,0 10 7 70 700 
12,0 | 16,0 14 4 56 784 
16,0 | 20,0 18 3 54 972 
20,0 | 24,0 22 1 22 484 
Total --- 20 232 3120 
Obs. xi = ponto médio da classe i 
 
 
o
��â	q�
	
��
��
�:					
9 = 	(∑�9=) − (∑ �=)9	(	 − 1) 
 
		
9 = 20(3120) − (232)920 ∙ 19 = 22,574	CB9 
 
r�
���	1
��ã�:																
 = 	s22,574 = 4,75	filho 
 
 
Da tabela ao lado temos: 
 	 = 20						 
 ∑�9= = 3120 
 ∑�= = 232		 
 
Unidade 03 – Medidas Estatísticas 
 
Estatística Básica − 36 − prof. José Aguinaldo 
3.4 −−−− Algumas aplicações do desvio-padrão 
a) Regra empírica 
Para conjunto de dados simétricos em forma de sino, uma útil regra prática pode ser aplicada a 
estes dados. Esta regra, algumas vezes chamada de regra empírica, nos diz que: 
• Cerca de 68,3% dos valores estarão dentro de uma distância de ± 1 desvio-padrão 
em torno da média (ou seja, média ± 1*dp). 
• Cerca de 95,4% dos valores estarão dentro de uma distância de ± 2 desvios-padrões 
em torno da média (ou seja, média ± 2*dp). 
• Cerca de 99,7% dos valores estarão dentro de uma distância de ± 3 desvios-padrões 
em torno da média (ou seja, média ± 3*dp). 
 
Como exemplo, suponha que as notas dos candidatos em um vestibular tenham uma média de 
90 pontos com um desvio-padrão de 20 pontos. Assumindo que as notas se distribuem 
simetricamente em torno da média (em forma de sino), podemos dizer que: 
 
Cerca de 95,4% dos alunos obtiveram notas dentro do intervalo 90 ± (2*20) = 90 ± 40, ou seja, 
de 50 pontos a 130 pontos (nove de cada dez tiram notas de 50 a 130 pontos). 
 
A regra acima deve ser usada em conjunto de dados distribuídos simetricamente em torna da 
média em forma de sino. Veja as figuras abaixo que mostra uma distribuição simétrica e 
assimétrica. 
 
Dados simétricos (em forma 
de sino) Dados assimétricos (não simétricos em torno da média) 
 
 
Uma alternativa é o uso da regra do Chebychev, usada para situações mais gerais. 
 
 
b) Regra Chebychev 
<<< Incluir depois >>> 
 
Unidade 03 – Medidas Estatísticas 
 
Estatística Básica − 37 − prof. José Aguinaldo 
c) Escore z (ou z-escore) 
O escore z de um valor x é o número de desvios-padrões que este valor x está acima ou abaixo 
da média. O escore z pode ser obtido pela fórmula abaixo: 
dp
médiavalor
z
−
=
 onde dp = desvio-padrão 
 
Usando o escore z para classificar um valor como não-usual 
 
O escore z pode ser usado para classificar um valor como atípico (valor não usual, não 
comum ou outlier) ou típico (valor usual ou comum). Para conjunto de dados simétricos em 
torno da média podemos usar a regra abaixo: 
 
 z < −2 � valor atípico (considerado valor muito pequeno) 
 z > +2 � valor atípico (considerado como muito grande) 
−2 ≤ z ≤ +2 � valor usual (considerado como valor comum) 
 
Como exemplo, considere que os homens adultos em geral têm uma altura média de 175 cm 
com um desvio-padrão de 6 cm. O jogador de basquetebol norte-americano Michael Jordan 
tem uma altura de 1,98 metro, portanto seu escore z é 
 
8,3
6
175198
Jordan Michael =
−
=
−
=
dp
médiavalor
z
 
 
Como z = 3,8 é maior que 2, então podemos concluir que a altura de Michael Jordan não é 
comum em homens adultos em geral (esta altura seria um valor não-usual). 
 
E o jogador brasileiro Romário que tem altura de 1,69 metro, o que você poderia dizer sobre 
sua altura? Tente responder. 
 
 
Usando o escore z para fazer comparações entre valores 
 
O escore z também pode ser usado comparar valores vindos de diferentes conjuntos de dados. 
 
Por exemplo, suponha que uma prova foi aplicada aos alunos de duas turmas (A e B). Na turma 
A, a nota média foi de 10 pontos com desvio-padrão de 5 pontos. Na turma B, a nota média foi 
de 15 pontos com desvio-padrão de 10 pontos. Vamos comparar o desempenho de dois alunos: 
 
Narizinho da turma A: obteve 18 pontos 
Pedrinho da turma B: obteve 25 pontos. 
 
O z-escore da Narizinho foi: 
 
6,1
5
1018
=
−
=Narizinhoz 
 
 
O z-escore do Pedrinho foi: 
 
0,1
10
1525
=
−
=Pedrinhoz 
 
 
Usando o escore z podemos concluir que a aluna Narizinho teve um desempenho melhor 
dentro da sua turma do que o aluno Pedrinho. 
Significa que a nota de Narizinho está 1,6 desvio-
padrão acima da média da sua turma (A). 
Significa que a nota de Pedrinho está 1 desvio-
padrão acima da média da turma 
Unidade 03 – Medidas Estatísticas 
 
Estatística Básica − 38 − prof. José Aguinaldo 
3.5 - Exercícios propostos 
EXERCÍCIO 01 - Uma amostra de 10 funcionários da empresa XYZ foi escolhida e registrada 
a distância em km que esses funcionários percorrem até chegar à empresa. 
 
x = distância percorrida = {13, 5, 15, 9, 3, 15, 9, 12, 15, 7} 
 
a) Calcule a amplitude, desvio-médio absoluto, variância, desvio-padrão e o 
coeficiente de variação para a distância percorrida pelos funcionários amostrados. 
b) Calcule o z-escore para um funcionário que percorre 20 km até a empresa. Esta 
distância pode ser considerada atípica? Justifique. 
EXERCÍCIO 02 - O desvio-padrão dos salários dos funcionáriosde uma empresa é 30 reais. 
No próximo mês, cada funcionário receberá um aumento de 50 reais e no mês seguinte um 
aumento de 20%, determine o desvio-padrão dos “novos” salários após estes aumentos. 
DICA: Use as propriedades do desvio-padrão. 
EXERCÍCIO 03 - De uma amostra de 500 divórcios ocorridos em uma cidade, foi registado a 
duração do casamento (em anos). Os dados estão na tabela abaixo. 
a) Calcule o desvio-padrão da duração dos casamentos. 
b) Suponha que o número de filhos destes casamentos 
 
Anos de 
casamentos 
Quantidade de 
divórcios 
 0 | 6 280 
 6 | 12 140 
12 | 18 60 
18 | 24 15 
24 | 30 5 
 
EXERCÍCIO 04 - O histograma abaixo mostra a distribuição das notas finas de uma turma da 
disciplina de Introdução à Estatística. O eixo vertical representa a quantidade de aluno. Calcule 
o coeficiente de variação (CV) das notas obtidas pelos alunos. 
 
 
 
 
 
1009080706050403020
30
20
10
0
Notas
Qu
an
tid
ad
e
 
de
 
al
un
o
s 
(fi)
2
5
11
24
5643
Unidade 03 – Medidas Estatísticas 
 
Estatística Básica − 39 − prof. José Aguinaldo 
EXERCÍCIO 05 - A sequência de operações executadas por operários para executar certa 
tarefa está sendo estudada. Uma nova sequência esta sendo proposta e deseja-se verificar se é 
adequado substituir a anterior. Para tanto, nove operários foram sorteados e mediu-se o tempo 
necessário, em minutos, para que cada um realizasse a tarefa, com dois tipos de sequências. 
Os dados coletados foram: 
 
Operário 1 2 3 4 5 6 7 8 9 
Atual sequência 24 25 27 22 23 28 26 28 29 
Nova sequência 21 23 28 27 24 26 25 22 23 
Diferenças (D= A-N) 3 
 
a) Calcule a diferença D entre os tempos obtidos na atual e nova sequência. 
b) Calcule as medidas estatísticas usuais (média, mediana, variância, desvio-
padrão e coeficiente de variação) da diferenças D. 
c) Um pesquisador utilizou a seguinte regra: “Se não houver diferenças 
significativas entre as duas sequências, então o valor zero estará incluído 
no intervalo10 abaixo”. 






+−
n
s
D
n
s
D DD 86,1;86,1 
onde n, D , Ds = tamanho, média e desvio-padrão das diferenças D 
 
Qual deveria ser a conclusão do pesquisador? 
 
 
 
10
 Isto é denominado de intervalo de confiança para dados emparelhados. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Medidas separatrizes, de 
assimetria e de curtose 
Unidade 03 – Medidas Estatísticas 
 
Estatística Básica − 41 − prof. José Aguinaldo 
4 −−−− Medida Separatrizes, de Assimetria e de Curtose 
4.1 −−−− Introdução 
As medidas de posição central (média, mediana, ...) e as medidas de dispersão (variância, 
desvio-padrão, ...) desempenham um papel importante na estatística, pois conseguem descrever 
as duas principiais características de uma distribuição de valores: o valor central e a variabilidade. 
A mediana, além de representar o valor central de uma distribuição, também apresenta uma 
característica interessante que é a de dividir a distribuição em duas partes iguais quanto ao 
número de elementos em cada parte. 
Usando essa última ideia da mediana podemos também dividir a distribuição em quatro, dez ou 
cem partes iguais quanto ao número de elemento. As medidas que dividem a distribuição em 
quatro, dez e cem partes iguais são denominados de quartis, decis e percentis, respectivamente. 
No geral, essas medidas são conhecidas como medidas separatrizes (ou medidas de posição 
não central). 
 
4.2 −−−− Medidas separatrizes para dados brutos 
As medidas separatrizes abaixo se referem aos dados brutos, ou seja, dados não agrupados em 
tabelas de frequência. 
 
•••• Quartil 
Há três quartis (Q1, Q2, Q3), que juntos dividem a distribuição em quatro partes iguais com cerca 
de um quarto (ou seja, 25%) dos elementos em cada parte. 
Primeiro Quartil 
O primeiro Quartil, simbolizado por Q1, é o valor que separa os 25% (1/4) menores valores dos 
demais em um conjunto de dados ordenados (ver figura a). 
Segundo Quartil 
O segundo Quartil, simbolizado por Q2, é o valor que separa o conjunto de dados ordenados 
em dois grupos: 50% acima e 50% abaixo (ver figura b). Note que o segundo quartil é a própria 
mediana, ou seja, Q2 = Md. 
Terceiro Quartil 
O terceiro Quartil, simbolizado por Q3, é o valor que separa os 25% maiores valores dos demais 
em um conjunto de dados ordenados (ver figura c). 
 
 
 
 
 
 
 
 
25% 75% 25% 75% 50% 50% 
Q1 Q2 = Md Q3 
( a ) ( b ) ( c ) 
Unidade 03 – Medidas Estatísticas 
 
Estatística Básica − 42 − prof. José Aguinaldo 
Abaixo mostramos um desenho esquematizando a divisão de uma distribuição em quatro partes 
com 25% dos elementos em cada grupo. Note que de Q1 a Q3 temos metade (ou 50%) dos 
valores. 
 
 
 
 
 
 
 
 
Não há um consenso entre os livros de estatística sobre um procedimento único para obter os 
quartis. Vamos usar o seguinte procedimento: 
 
•••• Ordene o conjunto de dados em ordem crescente e calcule 4)nk( ⋅=pos que é a posição 
do Quartil Qk (k = 1, 2 ou 3); 
•••• Se pos não for inteiro, arredonde pos para cima (maior inteiro mais próximo) e o Quartil Qk 
será o valor que está na posição pos. 
•••• Se pos for inteiro, então o Quartil Qk será a média entre os valores que estão na posição 
pos e pos +1. 
 
EXEMPLO 18 - Vinte e dois funcionários foram escolhidos em uma empresa e o tempo (em 
aos) que cada um está trabalhando na empresa foi registrado. Os dados estão logo abaixo. 
Calcule o 2º e 3º quartil das distâncias e interprete-os. 
 
4, 17, 22, 12, 12, 26, 8, 16, 21, 8, 17, 26, 14, 20, 5, 16, 17, 22, 5, 10, 5, 4 
Solução ------------------------------------------------------------------------------------------------------------------ 
Ordenando os dados: 
4 , 4 , 5, 5, 5, 8, 8, 10, 12, 12, 14, 16, 16, 17, 17, 17, 20, 21, 22, 22. 26, 26 n = 22 
 
Segundo quartil (Q2) 
k = 2 posição → 1�
 = 2 × 22/4 = 11 (como pos = 11 foi um valor inteiro, o Q2 será a média 
entre o 11º e 12º valor do conjunto ordenado) 
 
w9 = 14 + 162 = 15	anos 
 
Terceiro quartil (Q3) 
k = 3 posição → 1�
 = 3 × 22/4 = 16,5 (como pos = 16,5 não foi um valor inteiro, o Q3 será 
o 17º valor do conjunto ordenado) 
 
 wz = 20	anos 
 
 
 
 
Primeiro 
Quartil 
Segundo 
Quartil 
Terceiro 
Quartil 
Q1 Q2 Q3 
25% 
25% 
25% 
25% 
Pode-se dizer que metade (25%) dos funcionários 
trabalha menos de 15 anos nesta empresa 
Pode-se dizer que 3/4 (75%) dos funcionários trabalha 
menos de 20 anos nesta empresa 
Unidade 03 – Medidas Estatísticas 
 
Estatística Básica − 43 − prof. José Aguinaldo 
•••• Decil 
Há nove decis (D1, D2, ..., D9), que juntos dividem a distribuição em dez partes iguais com cerca 
de 10% dos elementos em cada parte. Lembre-se de que a divisão em partes iguais se refere ao 
número de elementos em cada parte. 
Decil k (k = 1, 2, ...., 9) 
O Decil k, simbolizado por Dk, é o valor que divide o conjunto ordenado de valores em duas 
partes, tais que (10*k)% dos valores sejam menores do que ele e os restantes sejam maiores. 
Por exemplo: 
Decil 7 (D7) 
É o valor que divide em duas partes, tais que 70% dos valores

Outros materiais

Materiais relacionados

Perguntas relacionadas

Perguntas Recentes