Baixe o app para aproveitar ainda mais
Prévia do material em texto
Medidas de tendência central: média, moda e mediana Rafael Botelho Barbosa Introdução As medidas de posição são utilizadas para representar e descrever um conjunto de dados. Elas são divididas em duas categorias: medidas de tendência central e separatrizes. Nesta aula, estuda- remos as principais medidas de tendência central: média (simples ou ponderada); moda; e mediana. Objetivos de aprendizagem Ao final desta aula, você será capaz de: • identificar as principais medidas de tendência central; • entender como calcular as principais medidas de tendência. 1 Medidas de tendência central De acordo com Medri (2011), as medidas de tendência central produzem um valor, e, em torno deste valor, as observações distribuem-se. Assim, os valores das medidas de tendência cen- tral são utilizados para sintetizar um conjunto de dados. As principais medidas de tendência central são: média (simples e ponderada); moda; e mediana. A seguir, estudaremos sobre cada uma das medidas. Acompanhe! 1.1 Média A média é a soma dos valores de um conjunto de dados dividido pelo número de dados somados. Ela pode ser dividida em média simples e ponderada. • Média simples De acordo com Duquia e Bastos (2006), a média simples – também chamada de média aritmética – é a medida de tendência central mais utilizada e melhor compreendida por todos, devido sua facilidade de cálculo e à utilização em inúmeras situações do coti- diano. Para calcular a média aritmética, basta somar todos os valores de um conjunto de dados e dividir pelo número de valores somados. A expressão geral para o cálculo da média simples é: = ∑ n i i 1=i 1= X X n Em que: X é a média simples ou aritmética; n i i 1 X i 1=i 1 ∑ é o somatório dos valores X, com X variando de 1 a n, ou seja, estamos somando todos os valores de X; n é o número de dados em análise. EXEMPLO No conjunto de dados (2, 2, 2, 4, 5), a média simples será calculada somando todos os valores (2 + 2 + 2 + 4 + 5 = 15) e dividindo pelo número de valores somados (5). Logo 15/3 = 5. Assim, podemos dizer que a média simples ou aritmética desse conjunto de dados é 3. • Média ponderada A média ponderada deve ser utilizada quando os dados não possuem a mesma proba- bilidade de ocorrência, ou seja, é quando há diferenças de pesos (ou frequências) entre os valores que queremos analisar. FIQUE ATENTO! Imagine duas frequências: F1 > F2. Neste caso, a probabilidade de ocorrência do dado referente a F1 é maior que a probabilidade de ocorrência do dado referente a F2. Assim, caso tenhamos uma observação que se repita 5 vezes e outra se repita 10 vezes, temos que a probabilidade de ocorrência da segunda observação é maior que a da primeira. A expressão geral para o cálculo da média ponderada é: n i i i 1 P n i i 1 X .fi iX .fi i X fifi i 1=i 1 i 1=i 1 = ∑ ∑ Em que: PX é a média ponderada; ∑ n i i i 1=i 1= X fi iX fi i é o somatório dos produtos de cada valor pela respectiva frequência, com i variando de 1 a n. n é o número de dados em análise; ∑ n i i 1=i 1= fifi é o somatório das frequências, variando de 1 a n. EXEMPLO No conjunto de dados (2, 2, 2, 4, 5), para calcular a média ponderada deve-se mul- tiplicar cada valor pela sua repetição, e dividir pela soma das frequências. Assim, tem-se (2 x 3) + (4 x 1) + (5 x 1) = 15. A soma das frequências é dada por 3 + 1 + 1 = 5. Logo, a média ponderada é 15/5 = 3. Duquia e Bastos (2006) afi rmam que a média apresenta algumas vantagens e desvantagens. Entre as vantagens estão: o fato de que ela considera todos os valores estudados; que é utilizada, na maioria dos casos, para entender as diferenças entre dois conjuntos de dados; e que é uma medida de tendência central de fácil entendimento. A desvantagem é que a média é infl uenciada por valores extremos (valores muito acima ou muito abaixo da média dos dados). Assim, quando há valores muito discrepantes, ela não é a medida adequada para representar o conjunto de dados. Por exemplo, no conjunto (1, 10, 100), a média dos dados é 37. Note que este não é um bom valor para representar os dados, pois existem dois valores muito distantes (1 e 100). Além disso, a média é recomendada, preferencialmente, quando a distribuição dos dados é simétrica. 1.2 Mediana A mediana é o valor em que metade (50%) dos dados está abaixo dela e metade (50%) está acima. Assim, para descobrir a mediana, deve-se colocar os dados em ordem crescente, o ele- mento que ocupar a posição central é a mediana. Quando o número total de dados é par, a mediana é dada pela média aritmética dos dois elementos centrais Por exemplo, no conjunto de dados (1, 2, 3, 4), como o número de dados é par, a mediana é dada pela média dos elementos centrais. Logo, (2+3)/2 = 2,5. Assim, a mediana é 2,5. Porém, quando o número total de dados é ímpar, a mediana é o elemento central do conjunto de dados organizados de maneira crescente. Caso uma amostra contenha muitos dados, basta esco- lhermos o elemento que ocupa a posição ((n+1)/2). Por exemplo, no conjunto de dados (1, 2, 3, 4, 5), como o número de dados é ímpar, a mediana é o valor 3, pois é o valor central do conjunto de dados. A fi gura a seguir mostra como é o comportamento das medidas de tendência central (média, mediana e moda) quando a distribuição é simétrica ou assimétrica. A distribuição é simétrica quando existe uma divisão de um conjunto de dados em duas partes iguais, em relação a um ponto central; e é assimétrica quando estas duas partes não possuem a mesma quantidade de dados. Figura 1 – Distribuição simétrica e assimétrica Média = Mediana = Moda Frequência DadosMédia Moda Dados Frequência Mediana Fonte: elaborado pelo autor, 2016. A vantagem da mediana é que não é influenciada por valores extremos (valores muito distan- tes da média) e pode ser utilizada tanto para distribuições simétricas quanto assimétricas. Entre as desvantagens, está o fato de ela ser de difícil compreensão e não ser considerada em grande parte dos testes estatísticos (DUQUIA E BASTOS, 2006). FIQUE ATENTO! Lembre-se de que, para calcular a mediana, devemos sempre utilizar os dados em ordem crescente. A mediana sempre tenderá a ocupar uma posição central de um conjunto de dados, diferente da média. Observe a figura a seguir, que apresenta um histograma para uma distribuição simétrica. Figura 2 – Histograma para distribuição simétrica De ns ity Média e mediana Peso dos sacos de arroz 1000 2000 3000 4000 5000 0 2. 0e -0 4 4. 0e -0 4 6. 0e -0 4 8. 0e -0 4 00 1 Fonte: Duquia e Bastos, 2006, p. 191. Na figura, percebemos que há uma distribuição simétrica. Neste caso, a média, mediana e moda apresentam os mesmos valores. Agora, observe a figura 3, em que a distribuição é assimétrica. Figura 3 – Histograma para distribuição assimétrica De ns ity Média Peso dos sacos de arroz 0 2000 4000 6000 8000 0 2. 0e -0 4 4. 0e -0 4 6. 0e -0 4 8. 0e -0 4 10000 Mediana Fonte: Duquia e Bastos, 2006, p. 191. No caso da figura 3, temos uma distribuição assimétrica positiva (ou à direita), assim, a média é menor do que a mediana. SAIBA MAIS! Para aprofundar seus conhecimentos sobre a assimetria, leia o tópico 6.4 do tex- to “Análise Exploratória de Dados”, do Professor Dr. Waldir Medri (UEL). Acesse: <http://www.uel.br/pos/estatisticaeducacao/textos_didaticos/especializacao_es- tatistica.pdf>. 1.3 Moda A moda é o elemento que mais se repete, ou seja, que possui a maior frequência no conjunto de dados. É possível que um conjunto de dados tenha uma moda (unimodal), duas modas (bimo- dal), três ou mais modas (multimodal), ou nenhuma moda (amodal).Para compreender melhor o que é a moda, atende aos exemplos: • no conjunto de dados (2, 2, 2, 4, 5), a moda é o elemento que mais se repete. Observe que o elemento 2 se repetiu 3 vezes, logo ele é a moda. Aqui, então, temos uma única moda; ou seja, o conjunto de dados é unimodal; • no conjunto de dados (1, 1, 2, 2, 5), há duas modas, ou seja, dois elementos repetidos. Logo, é um conjunto bimodal; • no conjunto de dados (1, 1, 1, 2, 2, 2, 3, 3, 3, 4, 5), temos três modas (1, 2 e 3), uma vez que os números foram repetidos três vezes. Logo, trata-se de um caso multimodal (ou polimodal); • no conjunto de dados (2, 4, 5), não há moda, pois nenhum elemento se repetiu. Trata-se de um conjunto de dados amodal; FIQUE ATENTO! A moda considera apenas a frequência de ocorrência das observações. Sendo as- sim, em geral, não é uma boa medida para se representar um conjunto de dados. A figura a seguir traz um histograma que mostra a distribuição de um conjunto de dados em função da frequência. Assim, na figura, o elemento que possui a maior frequência será conside- rado a moda. Figura 4 – Histograma de dados Dados Fr eq uê nc ia 8 9 10 11 12 0,0 0,5 1,0 1,5 2,0 2,5 3,0 Fonte: elaborado pelo autor, 2016. Neste caso, identificamos que a moda do conjunto de dados é 10, pois é o elemento que possui a maior frequência na figura. 2 Comparações entre medidas de tendência central Para decidir qual medida de posição tendência central é mais adequada para um conjunto de dados, é bastante importante fazer a representação gráfica deste conjunto. Esta representação pode ser por meio de um histograma, no qual consegue-se verificar se a distribuição é simétrica ou assimétrica. Caso a distribuição seja simétrica, tanto a média quanto a mediana quanto a moda apre- sentarão o mesmo valor. Dessa forma, podemos usar qualquer uma das medidas de posição de tendência central para representar um conjunto de dados. No entanto, é muito comum que a distribuição não seja simétrica, e sim assimétrica. Nestes casos, a média é um valor que sofre grandes influências de valores extremos, assim, não é capaz de representar de maneira satisfatória um conjunto de dados. Uma alternativa para este caso é utilizar a mediana, que sempre tende a assumir um valor central de um conjunto de dados (como observamos na figura 2). SAIBA MAIS! Das páginas 82 a 96 do link a seguir, você pode aprofundar seus conhecimentos so- bre a média, mediana e moda para distribuições simétricas e assimétricas. Acesse: <http://portal.mec.gov.br/seb/arquivos/pdf/profunc/estatistica.pdf>. Fechamento Nesta aula, você teve a oportunidade de: • conhecer as principais medidas de tendência central; • observar como é o comportamento destas medidas para distribuições simétricas e assimétricas. • aprender a calcular cada uma das medidas de tendência central. Referências BRASIL. Ministério da Educação. Estatística aplicada à educação. Brasília, 2007. Disponível em: <http://portal.mec.gov.br/seb/arquivos/pdf/profunc/estatistica.pdf>. Acesso em: 07 dez. 2016. MEDRI, Waldir. Análise exploratória de dados. Universidade Federal de Londrina, Londrina, 2011. Disponível em: <http://www.uel.br/pos/estatisticaeducacao/textos_didaticos/especializacao_ estatistica.pdf>. Acesso em: 07 dez. 2016. DUQUIA, Rodrigo Pereira; BASTOS, João Luiz Dornelles. Medidas de tendência central: onde a maior parte dos indivíduos se encontra? Scientia Medica, 2006.
Compartilhar