Buscar

Tema 6 Medidas de tendência central média, moda e mediana

Prévia do material em texto

Medidas de tendência central: 
média, moda e mediana
Rafael Botelho Barbosa
Introdução
As medidas de posição são utilizadas para representar e descrever um conjunto de dados. Elas 
são divididas em duas categorias: medidas de tendência central e separatrizes. Nesta aula, estuda-
remos as principais medidas de tendência central: média (simples ou ponderada); moda; e mediana.
Objetivos de aprendizagem
Ao final desta aula, você será capaz de:
 • identificar as principais medidas de tendência central;
 • entender como calcular as principais medidas de tendência.
1 Medidas de tendência central
De acordo com Medri (2011), as medidas de tendência central produzem um valor, e, em 
torno deste valor, as observações distribuem-se. Assim, os valores das medidas de tendência cen-
tral são utilizados para sintetizar um conjunto de dados. 
As principais medidas de tendência central são: média (simples e ponderada); moda; e 
mediana. A seguir, estudaremos sobre cada uma das medidas. Acompanhe!
1.1 Média
A média é a soma dos valores de um conjunto de dados dividido pelo número de dados 
somados. Ela pode ser dividida em média simples e ponderada. 
 • Média simples
	 De acordo com Duquia e Bastos (2006), a média simples – também chamada de média 
aritmética – é a medida de tendência central mais utilizada e melhor compreendida por 
todos, devido sua facilidade de cálculo e à utilização em inúmeras situações do coti-
diano. Para calcular a média aritmética, basta somar todos os valores de um conjunto 
de dados e dividir pelo número de valores somados.
A expressão geral para o cálculo da média simples é:
=
∑
n
i
i 1=i 1=
X
X
n
Em que:
X é a média simples ou aritmética;
n
i
i 1
X
i 1=i 1
∑
 
é o somatório dos valores X, com X variando de 1 a n, ou seja, estamos somando todos 
 os valores de X;
n é o número de dados em análise. 
EXEMPLO
No conjunto de dados (2, 2, 2, 4, 5), a média simples será calculada somando todos 
os valores (2 + 2 + 2 + 4 + 5 = 15) e dividindo pelo número de valores somados (5). 
Logo 15/3 = 5. Assim, podemos dizer que a média simples ou aritmética desse 
conjunto de dados é 3.
 • Média ponderada 
	 A média ponderada deve ser utilizada quando os dados não possuem a mesma proba-
bilidade de ocorrência, ou seja, é quando há diferenças de pesos (ou frequências) entre 
os valores que queremos analisar.
FIQUE ATENTO!
Imagine duas frequências: F1 > F2. Neste caso, a probabilidade de ocorrência do 
dado referente a F1 é maior que a probabilidade de ocorrência do dado referente a 
F2. Assim, caso tenhamos uma observação que se repita 5 vezes e outra se repita 
10 vezes, temos que a probabilidade de ocorrência da segunda observação é maior 
que a da primeira.
A expressão geral para o cálculo da média ponderada é:
n
i i
i 1
P n
i
i 1
X .fi iX .fi i
X
fifi
i 1=i 1
i 1=i 1
=
∑
∑
Em que:
PX é a média ponderada;
∑
n
i i
i 1=i 1=
X fi iX fi i
 
é o somatório dos produtos de cada valor pela respectiva frequência, com i variando de 1 a n.
 n é o número de dados em análise;
∑
n
i
i 1=i 1=
fifi é o somatório das frequências, variando de 1 a n.
EXEMPLO
No conjunto de dados (2, 2, 2, 4, 5), para calcular a média ponderada deve-se mul-
tiplicar cada valor pela sua repetição, e dividir pela soma das frequências. Assim, 
tem-se (2 x 3) + (4 x 1) + (5 x 1) = 15. A soma das frequências é dada por 3 + 1 + 1 = 
5. Logo, a média ponderada é 15/5 = 3.
Duquia e Bastos (2006) afi rmam que a média apresenta algumas vantagens e desvantagens. 
Entre as vantagens estão: o fato de que ela considera todos os valores estudados; que é utilizada, 
na maioria dos casos, para entender as diferenças entre dois conjuntos de dados; e que é uma 
medida de tendência central de fácil entendimento. A desvantagem é que a média é infl uenciada 
por valores extremos (valores muito acima ou muito abaixo da média dos dados). Assim, quando 
há valores muito discrepantes, ela não é a medida adequada para representar o conjunto de dados. 
Por exemplo, no conjunto (1, 10, 100), a média dos dados é 37. Note que este não é um bom valor 
para representar os dados, pois existem dois valores muito distantes (1 e 100).
Além disso, a média é recomendada, preferencialmente, quando a distribuição dos 
dados é simétrica.
1.2 Mediana
A mediana é o valor em que metade (50%) dos dados está abaixo dela e metade (50%) está 
acima. Assim, para descobrir a mediana, deve-se colocar os dados em ordem crescente, o ele-
mento que ocupar a posição central é a mediana. 
Quando o número total de dados é par, a mediana é dada pela média aritmética dos dois 
elementos centrais Por exemplo, no conjunto de dados (1, 2, 3, 4), como o número de dados é par, 
a mediana é dada pela média dos elementos centrais. Logo, (2+3)/2 = 2,5. Assim, a mediana é 2,5. 
Porém, quando o número total de dados é ímpar, a mediana é o elemento central do conjunto de 
dados organizados de maneira crescente. Caso uma amostra contenha muitos dados, basta esco-
lhermos o elemento que ocupa a posição ((n+1)/2). Por exemplo, no conjunto de dados (1, 2, 3, 4, 5), 
como o número de dados é ímpar, a mediana é o valor 3, pois é o valor central do conjunto de dados.
A fi gura a seguir mostra como é o comportamento das medidas de tendência central (média, 
mediana e moda) quando a distribuição é simétrica ou assimétrica. A distribuição é simétrica quando 
existe uma divisão de um conjunto de dados em duas partes iguais, em relação a um ponto central; 
e é assimétrica quando estas duas partes não possuem a mesma quantidade de dados.
Figura 1 – Distribuição simétrica e assimétrica
Média = Mediana = Moda
Frequência 
DadosMédia Moda Dados
Frequência
Mediana
Fonte: elaborado pelo autor, 2016.
A vantagem da mediana é que não é influenciada por valores extremos (valores muito distan-
tes da média) e pode ser utilizada tanto para distribuições simétricas quanto assimétricas. Entre 
as desvantagens, está o fato de ela ser de difícil compreensão e não ser considerada em grande 
parte dos testes estatísticos (DUQUIA E BASTOS, 2006). 
FIQUE ATENTO!
Lembre-se de que, para calcular a mediana, devemos sempre utilizar os dados em 
ordem crescente.
A mediana sempre tenderá a ocupar uma posição central de um conjunto de dados, diferente 
da média. Observe a figura a seguir, que apresenta um histograma para uma distribuição simétrica.
Figura 2 – Histograma para distribuição simétrica 
De
ns
ity
Média e mediana
Peso dos sacos de arroz
1000 2000 3000 4000 5000
0
2.
0e
 -0
4
4.
0e
 -0
4
6.
0e
 -0
4
8.
0e
 -0
4
00
1
Fonte: Duquia e Bastos, 2006, p. 191.
Na figura, percebemos que há uma distribuição simétrica. Neste caso, a média, mediana 
e moda apresentam os mesmos valores. Agora, observe a figura 3, em que a distribuição 
é assimétrica.
Figura 3 – Histograma para distribuição assimétrica
De
ns
ity
Média
Peso dos sacos de arroz
0 2000 4000 6000 8000
0
2.
0e
 -0
4
4.
0e
 -0
4
6.
0e
 -0
4
8.
0e
 -0
4
10000
Mediana
Fonte: Duquia e Bastos, 2006, p. 191.
No caso da figura 3, temos uma distribuição assimétrica positiva (ou à direita), assim, a média 
é menor do que a mediana.
SAIBA MAIS!
Para aprofundar seus conhecimentos sobre a assimetria, leia o tópico 6.4 do tex-
to “Análise Exploratória de Dados”, do Professor Dr. Waldir Medri (UEL). Acesse: 
<http://www.uel.br/pos/estatisticaeducacao/textos_didaticos/especializacao_es-
tatistica.pdf>.
1.3 Moda 
A moda é o elemento que mais se repete, ou seja, que possui a maior frequência no conjunto 
de dados. É possível que um conjunto de dados tenha uma moda (unimodal), duas modas (bimo-
dal), três ou mais modas (multimodal), ou nenhuma moda (amodal).Para compreender melhor o que é a moda, atende aos exemplos:
 • no conjunto de dados (2, 2, 2, 4, 5), a moda é o elemento que mais se repete. Observe 
que o elemento 2 se repetiu 3 vezes, logo ele é a moda. Aqui, então, temos uma única 
moda; ou seja, o conjunto de dados é unimodal;
 • no conjunto de dados (1, 1, 2, 2, 5), há duas modas, ou seja, dois elementos repetidos. 
Logo, é um conjunto bimodal;
 • no conjunto de dados (1, 1, 1, 2, 2, 2, 3, 3, 3, 4, 5), temos três modas (1, 2 e 3), uma vez 
que os números foram repetidos três vezes. Logo, trata-se de um caso multimodal (ou 
polimodal);
 • no conjunto de dados (2, 4, 5), não há moda, pois nenhum elemento se repetiu. Trata-se 
de um conjunto de dados amodal;
FIQUE ATENTO!
A moda considera apenas a frequência de ocorrência das observações. Sendo as-
sim, em geral, não é uma boa medida para se representar um conjunto de dados.
A figura a seguir traz um histograma que mostra a distribuição de um conjunto de dados em 
função da frequência. Assim, na figura, o elemento que possui a maior frequência será conside-
rado a moda.
Figura 4 – Histograma de dados
Dados
Fr
eq
uê
nc
ia
 
8 9 10 11 12
0,0
0,5
1,0
1,5
2,0
2,5
3,0
Fonte: elaborado pelo autor, 2016.
Neste caso, identificamos que a moda do conjunto de dados é 10, pois é o elemento que 
possui a maior frequência na figura. 
2 Comparações entre medidas de tendência central
Para decidir qual medida de posição tendência central é mais adequada para um conjunto 
de dados, é bastante importante fazer a representação gráfica deste conjunto. Esta representação 
pode ser por meio de um histograma, no qual consegue-se verificar se a distribuição é simétrica 
ou assimétrica.
Caso a distribuição seja simétrica, tanto a média quanto a mediana quanto a moda apre-
sentarão o mesmo valor. Dessa forma, podemos usar qualquer uma das medidas de posição de 
tendência central para representar um conjunto de dados. 
No entanto, é muito comum que a distribuição não seja simétrica, e sim assimétrica. Nestes 
casos, a média é um valor que sofre grandes influências de valores extremos, assim, não é capaz 
de representar de maneira satisfatória um conjunto de dados. Uma alternativa para este caso é 
utilizar a mediana, que sempre tende a assumir um valor central de um conjunto de dados (como 
observamos na figura 2).
SAIBA MAIS!
Das páginas 82 a 96 do link a seguir, você pode aprofundar seus conhecimentos so-
bre a média, mediana e moda para distribuições simétricas e assimétricas. Acesse: 
<http://portal.mec.gov.br/seb/arquivos/pdf/profunc/estatistica.pdf>.
Fechamento
Nesta aula, você teve a oportunidade de:
 • conhecer as principais medidas de tendência central;
 • observar como é o comportamento destas medidas para distribuições simétricas e 
assimétricas.
 • aprender a calcular cada uma das medidas de tendência central. 
Referências
BRASIL. Ministério da Educação. Estatística aplicada à educação. Brasília, 2007. Disponível em: 
<http://portal.mec.gov.br/seb/arquivos/pdf/profunc/estatistica.pdf>. Acesso em: 07 dez. 2016.
MEDRI, Waldir. Análise exploratória de dados. Universidade Federal de Londrina, Londrina, 2011. 
Disponível em: <http://www.uel.br/pos/estatisticaeducacao/textos_didaticos/especializacao_
estatistica.pdf>. Acesso em: 07 dez. 2016.
DUQUIA, Rodrigo Pereira; BASTOS, João Luiz Dornelles. Medidas de tendência central: onde a 
maior parte dos indivíduos se encontra? Scientia Medica, 2006.

Outros materiais

Materiais relacionados

Perguntas relacionadas

Perguntas Recentes