Baixe o app para aproveitar ainda mais
Prévia do material em texto
Estatística & Bioestatística (2017) – Lauro Boechat Batista; Keila Moreira Batista – cap. 3 Medidas de Tendência Central 55 3 MEDIDAS DE TENDÊNCIA CENTRAL 3.1 DEFINIÇÃO Quando procuramos fazer um determinado estudo estatístico, primeiramente definimos a população para depois extrairmos dela uma amostra. Coletamos os dados da amostra e depois procuramos representá-la por meio de valores. E alguns desses valores são denominados “medidas de tendência central”. Medidas de tendência central são medidas que tendem ao centro de uma distribuição e que servem para descrever um conjunto de dados. Medidas de tendência central são medidas que tendem ao centro de uma distribuição de dados ou valores. Logicamente, essas medidas devem ser representativas de todos os valores de uma distribuição dos dados, para que possam ser confiáveis. Distribuição de dados são os valores assumidos por uma determinada variável e que podem se apresentar sob diversas maneiras, geralmente na forma de uma distribuição normal no caso de variáveis biológicas contínuas. Se trabalharmos com a população, os valores das medidas de tendência central são considerados como parâmetros. Se trabalharmos com amostras, os valores das medidas de tendência central são chamados de estimativas. Medidas de tendência central são consideradas parâmetros, quando trabalhamos com população e estimativas, no caso de amostras. Estatística & Bioestatística (2017) – Lauro Boechat Batista; Keila Moreira Batista – cap. 3 Medidas de Tendência Central 56 Certamente, os parâmetros ou as estimativas poderão ser obtidos de variáveis discretas ou contínuas. As principais medidas de tendência central são a média, a moda e a mediana. São medidas que, geralmente, ficam próximas ao centro da distribuição. As principais medidas de tendência central são a média, a moda e a mediana. 3.2 PRINCIPAIS MEDIDAS DE TENDÊNCIA CENTRAL 3.2.1 Média A média é uma medida de tendência central que caracteriza, em parte, uma distribuição de dados. Por exemplo, quando dizemos que o consumo médio de carne em uma churrascaria é de 400 gramas, por pessoa, isto não implica dizer que todas as pessoas consomem exatamente 400 gramas de carne, naquela churrascaria. Umas consomem mais e outras menos de 400 gramas, mas na média, o consumo é de 400 gramas, informação importante para que o dono da churrascaria possa determinar o preço do rodízio. Se uma cartela de comprimidos contiver um beta-bloqueador como o atenolol com 50 mg/comprimido, não significa que todos os comprimidos vão ter exatamente 50 mg. Uns terão mais e outros terão menos quantidade de atenolol, sendo que no geral a média deverá ser em torno de 50 mg. Um outro exemplo é relativo à média das notas de Estatística em uma determinada turma. Se dissermos que a média foi igual a 9 (nove), teremos uma idéia Estatística & Bioestatística (2017) – Lauro Boechat Batista; Keila Moreira Batista – cap. 3 Medidas de Tendência Central 57 de como os alunos foram bem naquela prova. Por outro lado, se a média foi 2 (dois), teremos outro conceito da turma, em função deste valor. Existem três tipos de médias, a saber: (a) média aritmética; (b) média geométrica; e (c) média harmônica. As médias podem ser aritméticas, geométricas e harmônicas. 3.2.1.1 Média aritmética A principal medida de tendência central é a média aritmética, geralmente denominada simplesmente de “média”. Todas as vezes que no texto ocorrer a palavra "média", significa a média aritmética. Média aritmética ou simplesmente média, é a principal medida de tendência central. Há dois tipos de média aritmética, sendo que uma delas é “simples” e a outra “ponderada”, isto é, na primeira não se trabalha com freqüências (pesos), enquanto que na segunda sim. Média aritmética simples quando desprovida de pesos e média aritmética ponderada, a que tem pesos. Por definição, a média aritmética simples é o somatório dos valores da variável dividido pelo número deles. Estatística & Bioestatística (2017) – Lauro Boechat Batista; Keila Moreira Batista – cap. 3 Medidas de Tendência Central 58 Média aritmética simples é determinada somando-se todos os valores e dividindo-se a soma pelo número de valores somados. Assim, no caso de uma população, representamos a média, cujo valor é um parâmetro, pela seguinte fórmula: = x N i i N 1 leia-se “mu” mas a pronúncia é “mi” No caso de uma amostra, o valor da média é uma estimativa e é definida por: x_ = x n i i n 1 leia-se “xis barra” Ao invés de x_ (xis barra) pode-se usar (mu estimada). As duas fórmulas são idênticas, quanto ao cálculo delas. Em ambos os casos somamos todos os valores e o resultado da soma dividimos pelo número de valores somados. Para distinção, usamos a letra maiúscula N para indicar o número de valores da população e a letra minúscula n para indicar o número de valores da amostra. Exemplo 3.1. Determine a média aritmética da seguinte população: X1 = 3; X2 = 5; X3 = 3; X4 = 1; X5 = 3; X6 = 5; X7 = 1 e X8 = 3 Solução: Estatística & Bioestatística (2017) – Lauro Boechat Batista; Keila Moreira Batista – cap. 3 Medidas de Tendência Central 59 = x N i i N 1 = (X1 + X2 + ... + XN) / N = (3 + 5 + ... + 3) / 8 = 24/8 = 3 O leitor poderá observar que se tivéssemos dito amostra no lugar de população, o cálculo seria idêntico, somente modificando a fórmula ( x_ no lugar de ). Quando certos valores da variável estão repetidos, podemos representar estas repetições por meio de freqüências. Assim, definimos freqüências ou pesos como sendo o número de vezes que um valor ocorre. Portanto, podemos notar no exemplo 3.1 que o valor 3 ocorre 4 vezes, enquanto que os valores 5 e 1 ocorrem duas vezes cada um, isto é, X1 = 3 f1 = 4 X2 = 1 f2 = 2 (é um outro tipo de apresentação dos mesmos dados) X3 = 5 f3 = 2 Frequência ou peso é o número de vezes que um valor da variável ocorre. Como já foi dito, a freqüência é o número de vezes que um valor aparece e é representado por fi. Assim, f1 é a freqüência do primeiro valor da variável, f2 é a freqüência do segundo valor da variável e, assim, sucessivamente. Portanto, quando queremos obter a média aritmética ponderada, a fórmula é dada por: = Xi fi / fi no caso de população ( f i = N) X_ = Xi fi / fi no caso de amostra ( f i = n) Estatística & Bioestatística (2017) – Lauro Boechat Batista; Keila Moreira Batista – cap. 3 Medidas de Tendência Central 60 Todas as vezes que os dados são apresentados por meio de freqüências, a média a ser determinada é a média aritmética ponderada. Exemplo 3.2. Determine a média aritmética da seguinte população: X1 = 3 X2 = 1 X3 = 5 f1 = 4 f2 = 2 f3 = 2 Solução: = Xi fi / fi = (X1 f1 + X2 f2 + X3 f3) / (f1 + f2 + f3) = (3x4 + 1x2 + 5x2) / (4 + 2 + 2) = 24/8 = 3 Observe que o resultado deste exemplo é igual ao do exemplo 3.1, visto que os dados são os mesmos, só que descritos de maneira diferente. Exemplo 3.3. Determine a média de cada amostra: a) X1 = 6 X2 = 7 X3 = 2 b) Y1 = 16 Y2 = 17 Y3 = 12 Solução: a) X_= x n i i n 1 = (6 + 7 + 2) / 3 = 15 / 3 = 5 b) Y_ = x n i i n 1 = (16 + 17 + 12) / 3 = 45 / 3 = 15 Exemplo 3.4 São dados os valores de 5 comprimidos em relação à quantidade de atenolol, em mg: 50, 48, 53, 47 e 52. Determine a média da amostra. Estatística & Bioestatística (2017) – Lauro Boechat Batista; Keila Moreira Batista – cap. 3 Medidas de Tendência Central 61 Solução: a) X_ = x n i i n 1 = (50 + 48 + 53 + 47 + 52) / 5 = 250 / 5 = 50 mg/comprimido 3.2.1.2 Média geométrica Definimos a média geométrica simples dos valores X1, X2, ..., Xn como sendo: G = ( X1 . X2 . . . Xn )n = (X1 . X2 . . . Xn) 1/n Ou seja, é a raiz enésima do produto dos valores da variável X. Quando há repetição dos valores, isto é, quando há freqüências, a média geométrica ponderada é definida por: G = ( X1 f1 . X2 f2 . . . Xn fn )1/n , onde n = fi Logicamente, para se obter a média geométrica é necessário que Xi > 0. Embora o emprego da média geométrica seja de pouquíssimo uso, pode ser que em certos casos ela seja mais recomendável do que a média aritmética. O melhor emprego da média geométrica é quando os dados se distribuem mais ou menos segundo uma progressão geométrica. Exemplo 3.5. Determinar a média geométrica dos seguintes dados: a) X1 = 5 X2 = 7 X3 = 9,8 X4 = 13,72 X5 = 19,208 b) X1 = 5 X2 = 7 X3 = 9,8 X4 = 13,72 Estatística & Bioestatística (2017) – Lauro Boechat Batista; Keila Moreira Batista – cap. 3 Medidas de Tendência Central 62 c) X1 = 3 X2 = 6 X3 = 12 X4 = 24 X5 = 48 d) X1 = 3 X2 = 6 X3 = 12 X4 = 24 Solução: Observe que em todos os casos, os dados estão se distribuindo segundo uma progressão geométrica, onde nos itens a e b a razão vale 1,4 e nos itens c e d a razão vale 2. Portanto, é recomendável o emprego da média geométrica. Assim, a) G = 5 x 7 x 9,8 x 13,72 x 19,2085 = 9,8 que é o ponto central da progressão geométrica. b) G = 5 x 7 x 9,8 x 13,72 4 = 8,2825117 que é o ponto central da progressão geométrica. Repare que a média geométrica, neste caso, é exatamente a raiz quadrada do resultado do produto entre os pontos centrais 7 e 9,8. c) G = 3 x 6 x 12 x 24 x 485 = 12 d) G = 3 x 6 x 12 x 244 = 8,4852813 Se tivéssemos calculado a média aritmética para cada item deste exemplo, iríamos verificar que ela não representaria bem a distribuição dos dados. Portanto, quando os dados se distribuem semelhante a uma progressão geométrica, a média a ser calculada deve ser a geométrica. O leitor pode notar que os cálculos para a obtenção da média geométrica poderiam ser realizados de outra forma, pois G = ( X1 . X2 . . . Xn )n e, portanto, por exemplo, aplicando propriedades de logarítmos no item c deste exemplo, teríamos: Estatística & Bioestatística (2017) – Lauro Boechat Batista; Keila Moreira Batista – cap. 3 Medidas de Tendência Central 63 Log G = 1/n {log X1 + log X2 + ... + log Xn}. Então, Log G = 1/5 {log 3 + log 6 + log 12 + log 24 + log 48} Log G = 1/5 {5,39590623} Log G = 1,079181246 G = 12 Exemplo 3.6. Determinar a média geométrica dos seguintes dados: X1 = 5 ; f1 = 3 X2 = 10 ; f2 = 4 ; X3 = 18 e f3 = 3. Solução: G = (53 x 104 x183 )1/10 pois n = f1 + f2 + f3 G = 9,688861612 3.2.1.3 Média harmônica Dado um conjunto de dados da variável X, definimos a média harmônica pela seguinte expressão: H = n / 1 Xi (quando não há freqüências) e H = ( fi) / ( fi Xi ) (quando há freqüências) Exemplo 3.7. Determinar a média harmônica dos seguintes dados: X1 = 4 X2 = 5 X3 = 10 X4 = 2 Estatística & Bioestatística (2017) – Lauro Boechat Batista; Keila Moreira Batista – cap. 3 Medidas de Tendência Central 64 Solução: H = 4 / (1/4 + 1/5 + 1/10 + 1/2) = 4 / (0,25 + 0,20 + 0,10 + 0,50) = 4 / 1,05 = 3,81 Exemplo 3.8. Determinar a média harmônica dos seguintes dados: X1 = 4 ; f1 = 2 ; X2 = 5 ; f2 = 5 ; X3 = 6 e f3 = 3. Solução: H = (2 + 5 + 3) / (2/4 + 5/5 + 3/6) = 10 / 2 = 5 3.2.2 Moda Dado um conjunto de valores, definimos a moda como sendo o valor da variável de maior frequência. Moda é valor da variável de maior ocorrência. Uma distribuição que não tem moda é denominada de amodal; com uma só moda é chamada unimodal; duas modas de bimodal; e assim sucessivamente. Se não tiver nenhum valor de maior ocorrência, é amodal; se somente um valor ocorrer mais vezes, é unimodal; com dois valores ocorrendo mais vezes (mesma quantidade de vezes), é bimodal; com três valores é trimodal e mais de 3 valores, polimodal. Estatística & Bioestatística (2017) – Lauro Boechat Batista; Keila Moreira Batista – cap. 3 Medidas de Tendência Central 65 A aplicação da moda ocorre quase sempre em dados discretos. Por exemplo, quando um comerciante vai comprar uma partida de sapatos masculinos, ele leva em consideração a moda, isto é, compra maior quantidade de sapatos de acordo com a saída dos números. Se a moda for o número 40, ele comprará uma partida maior de sapatos tamanho 40 e os demais tamanhos em quantidade menores. Da mesma maneira, se a “moda” for usar produtos da “Redley”, então significa que as pessoas procuram com maior freqüência esses produtos. Quando um comerciante vai encomendar cigarros (aliás, altamente prejudicial à saúde), ele faz a encomenda levando em consideração as marcas de maior saída. Portanto, com este e outros exemplos, podemos ver a aplicação da moda. Exemplo 3.9. Determinar a moda dos conjuntos dos seguintes dados: a) 3, 5 1, 4 b) 4, 9, 3, 5, 9 c) 5, 8, 9, 9, 5, 9, 7, 7, 3 d) 3, 8, 3, 5, 9, 5, 4, 5, 3 e) 1, 7, 7, 8, 7, 9, 3, 3, 6, 8, 8, 3 Solução: a) não tem moda (amodal) b) Mo = 9 (unimodal) Estatística & Bioestatística (2017) – Lauro Boechat Batista; Keila Moreira Batista – cap. 3 Medidas de Tendência Central 66 c) Mo = 9 (unimodal) d) Mo = 3 e 5 (bimodal) e) Mo = 3, 7 e 8 (trimodal) Exemplo 3.10. Determine a moda dos seguintes dados: a) X1 = 3 f1 = 5 X2 = 4 f2 = 6 X3 = 1 f3 = 3 b) X1 = 3 f1 = 5 X2 = 4 f2 = 2 X3 = 1 f3 = 5 Solução: a) Mo = 4 (unimodal) b) Mo = 3 e 1 (bimodal) 3.2.3 Mediana Em uma distribuição de dados, a mediana é o valor da variável que divide uma distribuição de dados ordenados ao meio. Mediana é o valor da variável que divide uma distribuição de dados ordenados ao meio. Assim, se a distribuição tiver um número impar de valores, a mediana será exatamente o valor do elemento central. No caso de número par, a mediana é obtida somando-se os dois valores centrais e dividindo-se o resultado por 2. Estatística & Bioestatística (2017) – Lauro Boechat Batista; Keila Moreira Batista – cap. 3 Medidas de Tendência Central 67 Se a distribuição de dados tiver um número impar de elementos, a mediana será exatamente o elemento central. Se for um número par, a mediana será obtida pela soma dos dois elementos centrais, divididapor 2. A distribuição contendo os valores 5, 3, 1, 4 e 7, o valor da mediana é igual 4 (Mi = 4), pois o elemento central é igual a 4 (observe que devemos ordenar os dados, colocando-os em ordem crescente ou decrescente). A distribuição dos valores 2, 5, 6, 14, 20 e 22 tem para mediana o valor igual a 10, pois Mi = (6 + 14) / 2 = 10. A mediana é uma medida de tendência central que tem mais aplicação na estatística não-paramétrica. Vamos supor que temos 160 torcedores do Botafogo, 30 do Fluminense e 10 do Flamengo. Qual(is) das 3 medidas de tendência central que se aplica(m) nesse caso? Ora, é fácil de ver que a média e a mediana não podem ser aplicadas, pois qual seria a média e qual seria a mediana? A única medida que poderia ser aplicada é a moda, que seria ser torcedor do Botafogo. Portanto, quando trabalhamos com variáveis qualitativas, a única medida que pode ser aplicada é a moda. No estudo de variáveis qualitativas, somente a moda pode ser aplicada. Estatística & Bioestatística (2017) – Lauro Boechat Batista; Keila Moreira Batista – cap. 3 Medidas de Tendência Central 68 Exemplo 3.11. Determine a mediana dos seguintes dados: a) X1 = 3 f1 = 2 X2 = 4 f2 = 5 X3 = 8 f3 = 10 b) X1 = 1 f1 = 5 X2 = 4 f2 = 2 X3 = 6 f3 = 5 Solução: a) verifica-se que o fi = 17 e, portanto, tem-se 17 elementos neste exemplo. Logicamente, o elemento central será o nono elemento e o valor dele é 8, pois os dois primeiros valem 3, do terceiro ao sétimo valem 4 e do oitavo ao décimo sétimo valem 8. b) Então, Mi = 8. c) neste exemplo o fi = 12 e, então, tratando-se de número par, os elementos centrais serão o sexto e o sétimo, os quais deverão ser somados para o resultado ser dividido por 2, de modo a obter a mediana. Como os 5 primeiros elementos valem 1, do sexto ao sétimo valem 4 e do oitavo ao décimo segundo valem 6, então Mi = (4 + 4) / 2 = 4. Exemplo 3.12. Determine a mediana das seguintes distribuições: a) X1 = 3 X2 = 4 X3 = 7 X4 = 26 X5 = 30 b) X1 = 3 X2 = 4 X3 = 7 X4 = 7 Solução: a) Mi = 7 b) Mi = 5,5 Estatística & Bioestatística (2017) – Lauro Boechat Batista; Keila Moreira Batista – cap. 3 Medidas de Tendência Central 69 3.3 PROPORÇÃO, PERCENTAGEM E PORCENTAGEM Em estatística geralmente falamos sobre proporção, percentagem e porcentagem. Percentagem e porcentagem são sinônimos. Em estatística, proporção é dada por p = n X , onde X é o número de elementos com determinada característica e n é a quantidade total de elementos. Facilmente se vê que 0 p 1, sendo que quando X = 0, p = 0 e quando X = n, p = 1. Proporção é a relação entre o número de elementos com uma determinada característica e o número de elementos. Vamos supor que em 20 pessoas têm-se 12 do sexo feminino e 8 do sexo masculino. Assim, a proporção de pessoas do sexo feminino será dada por p = n X , ou seja, p = 20 12 = 0,60. Por outro lado, percentagem ou porcentagem é a proporção multiplicada por 100, ou seja, perc =p x 100. No exemplo anterior, a perc = 0,60 x 100 = 60%. Percentagem ou porcentagem é a proporção multiplicada por 100. Observe que sempre na percentagem o resultado vem acompanhado pelo símbolo %. A proporção pode variar de 0 (zero) a 1. Estatística & Bioestatística (2017) – Lauro Boechat Batista; Keila Moreira Batista – cap. 3 Medidas de Tendência Central 70 A percentagem pode variar de 0% a 100%. Exercício 3.1. Uma amostra de 5 cães recém-nascidos da raça Rottweiler apresentaram os seguintes pesos: X1 = 2,5 kg X2 = 2,3 kg X3 = 2,2 kg X4 = 2,8 kg e X5 = 2,7 kg. Determine as seguintes estimativas: a) das médias aritmética, geométrica e harmônica. c) da mediana e da moda. Exercício 3.2. Uma amostra de 16 alunos do Curso de Medicina Veterinária da apresentou as seguintes alturas: X1 = 1,70 m , f1 = 5 ; X2 = 1,66 m , f2 = 8 ; X3 = 1,74 m , f3 = 3 Determine as seguintes estimativas: a) da média aritmética. b) da média geométrica. d) da média harmônica. e) da moda. f) da mediana Estatística & Bioestatística (2017) – Lauro Boechat Batista; Keila Moreira Batista – cap. 3 Medidas de Tendência Central 71 Exercício 3.3. Em um concurso público, os pesos de Matemática, Português e Conhecimentos Gerais são, respectivamente, 5, 3 e 2. O aluno A obteve, respectivamente, as notas 8, 7 e 6, enquanto que o aluno B obteve, respectivamente, as notas, 7, 8 e 6. Quais foram as médias de cada um dos alunos? Exercício 3.4. Um investidor comprou 10.000 ações ao preço unitário de R$ 45,00, 30.000 ações à R$ 50,00 e 60.000 ações a R$ 40,00. Qual foi o preço médio de cada ação? Exercício 3.5. Um investidor comprou 20.000 ações ao preço unitário de R$ 45,00, 30.000 ações ao preço unitário de R$ 50,00 e após dois meses, o preço unitário das ações caiu para R$ 40,00. Quantas ações o investidor deve comprar para diminuir o preço médio das ações, ficando em R$ 42,00? PARA OS QUE QUISEREM IR ALÉM EM MEDIDAS DE TENDÊNCIA CENTRAL Suponha os seguintes dados, já ordenados, nas 5 amostras (A, B, C, D, E): A B C D E 8 10 6 16 4 8 10 6 16 4 10 12 8 20 5 12 14 10 24 6 12 14 10 24 6 X _ = 10 X_ = 12 X_ = 8 X_ = 20 X_ = 5 Mo = 8 e 12 Mo = 10 e 14 Mo = 6 e 10 Mo = 16 e 24 Mo = 4 e 6 Mi = 10 Mi = 12 Mi = 8 Mi = 20 Mi = 5 Considere a amostra A, comparando as demais com essa amostra: Estatística & Bioestatística (2017) – Lauro Boechat Batista; Keila Moreira Batista – cap. 3 Medidas de Tendência Central 72 (1) os elementos da amostra B são iguais aos elementos da amostra A somados da unidade 2, então todas as 3 medidas de tendência central ficaram somadas da unidade 2; (2) aos elementos da amostra C são iguais aos elementos da amostra A subtraídos de 2 unidades, então de todas as 3 medidas de tendência central foram subtraídas de 2 unidades; (3) os elementos da amostra D são iguais aos elementos da amostra A multiplicados pela unidade 2, então todas as 3 medidas de tendência central ficaram multiplicadas pela unidade 2; (4) os elementos da amostra E são iguais aos elementos da amostra A divididos pela unidade 2, então todas as 3 medidas de tendência central ficaram divididas pela unidade 2; Portanto, se somarmos ou subtrairmos a todos os elementos uma constante, as 3 medidas ficarão somadas ou subtraídas da constante. Se multiplicarmos ou dividirmos todos os elementos por uma constante, as 3 medidas ficarão multiplicadas ou divididas pela constante. Considere os 5 valores da amostra A. Vamos subtrair de cada um deles a constante 6 e depois dividirmos os novos valores por 2. Então a média passará a ser 2, a moda será 1 e 3 e a mediana será 2. Em outras palavras, a operação que fizermos aos dados também faremos às 3 medidas de tendência central.
Compartilhar