Prévia do material em texto
Estatística – Prof. Dr. Pedro Ivo Brasil Estatística – Prof. Dr. Pedro Ivo Brasil TEMA 03: MEDIDAS DE TENDÊNCIA CENTRAL: MÉDIA, MEDIANA E MODA Existem basicamente dois grandes grupos de medidas estatísticas. O primeiro grupo é formado pelas Medidas de Tendência Central (ou Medidas de Posição), que informam a magnitude da amostra estudada: um valor que seja representativo do que é típico da amostra. Essas medidas nos dão uma visão global da amostra sem se ater às características individuais de seus elementos. O outro grupo leva em conta as variações dos elementos da amostra em torno de suas medidas centrais e é formado pelas Medidas de Dispersão. MÉDIA A média é seguramente a medida de tendência central mais usada. É chamada de média simples quando a frequência dos diversos valores é igual a 1, ou de média ponderada quando algum dos dados são dotados de frequência maior que 1. Focaremos no cálculo da média aritmética simples. A média aritmética é o resultado da soma dos valores de todos os elementos dividida pelo número total de elementos, ou seja, pela frequência total. Em outras palavras se tivermos um conjunto de valores # = {'!, '", '#, . . . , '$ } a média aritmética deste conjunto será calculada através das fórmulas: !" = !%"!&"⋯"!'$ ou !" = ∑!( $ onde: *+ é a média aritmética; '!, '", etc. são os diversos valores; N o total de elementos da amostra. Exemplo 1: Calcular a média aritmética da população # = {2; 5; 7; 9; 10; 12; 16; 18}. *+ = ∑*!+ → *+ = ",-,.,/,!0,!",!1,!2 2 → *+ = 9,9 No exemplo acima, cada valor aparecia apenas uma única vez. Caso os valores se repitam na amostra, ou seja, se eles tiverem uma frequência diferente de um ('! com f1; '" com f2 etc.) então a fórmula para o cálculo da média aritmética será: !" = ∑%& . '&∑'& Este último conceito define a média ponderada, sendo que eventualmente as frequências podem ser substituídas por “pesos” que conferem a importância diferenciada de cada valor. Exemplo 2: Calcular a média aritmética dos valores relacionados na tabela ao lado: Como no exemplo anterior o cálculo da média aritmética consiste na soma de todos os valores dividida pela quantidade total de elementos. Note que cada um dos valores da tabela aparece certo número de vezes. Por exemplo, o valor 25 aparece 37 vezes. Portanto, precisamos multiplicar 25 por 37. A coluna C, na tabela a seguir, mostra todos os cálculos deste tipo. Quando somamos essa coluna obtemos o valor 9491 que corresponde à soma de todos os elementos da amostra, que por sua vez possui 193 elementos. Assim a média é: !" = ∑!(.((∑(( → ! " = )*)++), → !" = 49,2 Quando os dados são apresentados agrupados em classes (intervalos), o processo de cálculo será semelhante ao anterior com a diferença que o valor a ser usado é o ponto médio do intervalo (pmi) no lugar do valor do elemento médio ('3): xi = pmi Exemplo 3: Dada a tabela de frequências abaixo, calcule a média aritmética: Como os dados estão divididos em intervalos (classes), devemos determinar os pontos médios (pmi) de cada um deles para calcular a média. A tabela a seguir apresenta os valores e cálculos necessários para se determinar a média aritmética para uma amostra que estivermos descrevendo. As colunas E e F da tabela bem como os somatórios mostram os cálculos necessários para a obtenção da média aritmética. Note que há o somatório total dos valores dos elementos (col’s E e F). Lembre também que ∑83 = 84. Portanto, a média aritmética será de: !" = ∑.-& . '&∑'& !" = 369136,5225 34 = 5567, 8 Estatística – Prof. Dr. Pedro Ivo Brasil Estatística – Prof. Dr. Pedro Ivo Brasil Propriedades das médias aritméticas: (i) A soma algébrica dos afastamentos (ou desvios, ou resíduos) de um conjunto de números tomados em relação à média é nula. (ii) Se multiplicarmos ou dividirmos todas as informações por uma constante, a média aritmética ficará multiplicada ou dividida por essa constante. (iii) Somando-se ou subtraindo-se uma constante a todos os valores de um conjunto de informações, a média aritmética ficará somada ou subtraída dessa constante. MEDIANA Conceitualmente definimos mediana como o valor, dentro de um conjunto de valores ordenados, que divide exatamente esse conjunto em duas metades, com 50% dos valores superiores à mediana e 50% inferiores. Logo: * Caso N seja um número ímpar a mediana será o valor do elemento central (chamado de Elemento Mediano) * Caso N seja um número par a mediana será a média aritmética simples dos dois elementos centrais. Exemplo 4: Dados os dois conjuntos de notas abaixo, calcule a mediana: Grupo A = {6,2; 4,2; 8,7; 6,4; 2,8; 9,1; 5,0; 3,9; 7,1}. Para calcular a mediana é necessário ordenar os dados em ordem crescente: {2,8; 3,9; 4,2; 5,0; 6,2; 6,4; 7,1; 8,7; 9,1} Como o número de elementos é ímpar (N = 9) a mediana será o valor do elemento central (o 5º elemento), ou seja, o valor da mediana será 6,2. Matematicamente, determinamos o elemento mediano (956) como: !!" = # + 1 2 → !!" = 9 + 1 2 → !!" = 5 # onde: : é o número total de elementos (ou frequência total, ft) Logo, o valor do 5º elemento é a mediana (;6): 9. = 7, 8 Grupo B = {8,4; 6,3; 9,2; 4,9; 6,5; 8,0}, ordenando: {4,9; 6,3; 6,5; 8,0; 8,4; 9,2} :-/ = ; + 1 2 → :-/ = 6 + 1 2 → :-/ = 3,5 0 Evidentemente não existe um elemento 3,5º. A mediana será a média aritmética entre o valor dos 3º e 4º elementos: =/ = %, + %* 2 → =/ = 6,5 + 8,0 2 → 9. = @, 8A Vejamos agora como encontrar a mediana quando trabalhamos com dados agrupados Exemplo 5: Calcular a Mediana para os dados relacionados a seguir, relativos ao número de filhos por família moradora em duas determinadas cidades. Perceba que o número de elementos (: = 84 = 63 ) é ímpar, logo o Elemento Mediano será o 32º: 956 = 63 + 1 2 → 956 = 32 O 32º elemento tem o valor 18, isso porque com os valores ordenados os 15 primeiros referem-se a famílias com 0 filhos; do 16º ao 33º valores referem-se a famílias com 1 filho, e assim por diante. Logo a mediana será: Me = 1 Portanto, podemos afirmar que 50% das famílias têm um filho ou menos e 50% das famílias tem um filho ou mais. Perceba que o número de elementos (N = 72) é par, logo o Elemento Mediano seria o 36,5º, que evidentemente não existe. 956 = 72 + 1 2 → 956 = 36,5 O 36º elemento tem o valor 1 e o 37º o valor o valor 2 , portanto o 36,5º seria um valor médio entre esses dois valores, ou seja a mediana será: ;> = !,"" = 1,5 Portanto podemos afirmar que 50% das famílias têm menos de 1,5 filhos e 50% das famílias tem mais de 1,5 filhos. Número de filhos por família Quantidade de famílias na cidade Valor Frequência simples xi fi fac 0 15 15 1 18 33 2 12 45 3 8 53 4 5 58 5 3 61 6 1 62 Mais do que 6 1 63 Soma 63 CIDADE A Frequência acumulada crescente ( ≤ ) Número de filhos por família Quantidade de famílias na cidade Valor Frequência simples xi fi fac 0 15 15 1 21 36 2 16 52 3 9 61 4 6 67 5 4 71 6 1 72 Mais do que 6 0 72 Soma 72 CIDADE B Frequência acumulada crescente ( ≤ ) Estatística – Prof. Dr. Pedro Ivo Brasil Estatística – Prof. Dr. Pedro Ivo Brasil Quando trabalhamos com dados agrupados em classes (intervalos) o cálculo da Mediana é mais trabalhoso porque conseguimos determinar o elemento mediano e a classe da qual o elemento faz parte, mas não o valor exato da Mediana. A maneira de contornarmos este inconveniente é utilizando os conceitos de interpolação. Interpolar significaachar, dentro de uma faixa de valores, aquele valor que melhor corresponde às condições estabelecidas. No caso do cálculo da Mediana o processo de interpolação gera a seguinte fórmula, que sempre iremos usar: !! = #$"! + &#$% % &&'_&)*&+% ' × ℎ onde: ;6 é a mediana; liMe é o limite inferior da classe que contém o elemento mediano (classe mediana); Eme é o elemento mediano; fac_ant é a frequência acumulada crescente até a classe anterior à classe mediana; fMe é a frequência da classe mediana; h é a amplitude. Exemplo 6: Calcule a Mediana para a tabela a seguir que apresenta a distribuição de vendas de determinada empresa. O elemento mediano é dado por: 976 = !#8,!8 = 72° O 72º elemento está na 4º classe que chamamos de classe mediana, ou seja a mediana é um valor entre R$ 140.000,00 e R$ 170.000,00. Obteremos o resultado usando a fórmula da interpolação: +" = ,-," + . !!" − 0-._-/0 0," 1 × ℎ = 140.000 + .72 − 5726 1 × 30.000 = :$<=>. ?@>, BC Portanto podemos afirmar que 50% das vendas mensais dessa empresa estão acima de R$ 157.307,69 e 50% abaixo deste mesmo valor. MODA É simplesmente o valor que mais vezes se repete numa distribuição de frequências, ou seja, aquele valor dotado de maior frequência. O cálculo da Moda para dados isolados ou para dados não agrupados em classes é imediato, decorre de simples observação (exemplo 7). Já para dados agrupados é necessário adotar algumas recomendações feitas por estatísticos renomados. No exemplo 8 apresentamos um cálculo deste último tipo de distribuição. Exemplo 7: Encontre a Moda para os conjuntos de dados mostrados abaixo, referentes ao consumo de rolamentos em várias linhas de produção. Linha A: {21; 22; 24; 24; 25; 25; 25; 27; 28). A moda evidentemente é: Mo = 25 Linha B: {8; 8; 9; 9; 9; 9; 10; 11; 11; 11; 11; 12; 12; 12}. Neste conjunto temos duas modas: Mo = 9 e Mo = 11. Chamamos de amostra multimodal. Linha C: {15; 18; 25; 32; 43; 50; 61}. Não existe um valor que se repita mais de uma vez. Temos uma amostra sem moda, ou seja, amodal. A moda é o valor de maior frequência, portanto para a linha D teríamos Mo = 13. __________________________________________________________________ Quantidade de meses frequência li ls fi fac 1 R$50.000,00 |------ R$80.000,00 12 12 2 R$80.000,00 |------ R$110.000,00 18 30 3 R$110.000,00 |------ R$140.000,00 27 57 4 R$140.000,00 |------ R$170.000,00 26 83 5 R$170.000,00 |------ R$200.000,00 21 104 6 R$200.000,00 |------ R$230.000,00 18 122 7 R$230.000,00 |------ R$260.000,00 12 134 8 R$260.000,00 |------| R$290.000,00 9 143 143TOTAL Classes número Frequência acumulada crescente ( ≤ ) Vendas mensais, em R$ Valor Quantidade de rolamentos consumidos Número de vezes em que ocorreu o consumo Valor Frequência xi fi 8 18 10 25 12 32 12 45 15 28 16 21 17 12 21 8 Linha D Estatística – Prof. Dr. Pedro Ivo Brasil Estatística – Prof. Dr. Pedro Ivo Brasil Exemplo 8: Calcule a moda para a distribuição de Rendas Familiares apresentada no quadro abaixo: Você pode notar que os valores se repetem mais na classe 4 (a frequência é a maior de todas), logo a moda deve ser um valor entre R$2.000,00 e R$2.450,00. Mas exatamente qual é o valor da moda? Normalmente esse cálculo poderá ser feito por três recomendações diferentes: As formulas de Czuber; King e Pearson, que utilizaremos a seguir. Recomendação (método) de Czuber Para utilizarmos a recomendação de Czuber devemos inicialmente localizar a classe que tem maior frequência, a chamada classe modal. No nosso exemplo essa classe é a de número 4. Em seguida, aplicamos a seguinte fórmula: =B = CD10 + E ('10 − '234) ('10 − '234) + ('10 − '5064) I × ℎ onde: Mo é a moda; liMo é o limite inferior da classe modal; fMo é a frequência da classe modal; fant é a frequência da classe imediatamente anterior à classe modal; fpost é a frequência da classe imediatamente posterior à classe modal; h é a amplitude modal. No nosso exemplo ficaria: =B = 2000 + L (31 − 28)(31 − 28) + (31 − 18)M × 450 → 9N = O$8. QRS, TR Recomendação (método) de King: Para utilizarmos a recomendação de King devemos localizar a classe que tem maior frequência, ou a classe modal, em seguida aplicamos a seguinte fórmula: =B = CD10 + E '5064 ('234 + '5064) I × ℎ No nosso exemplo ficaria: =B = 2000 + L 18(28 + 18)M × 450 → 9N = O$8. 5@7, Q6 Recomendação (método) de Pearson: No caso de Pearson a recomendação parte de conceito diferente das anteriores. Baseia-se no uso da Média e da Mediana: ;@ = 3 ×;> − 2 × *+. No nosso exemplo teríamos: Me = R$2094,36; *+ = C$2123,59, logo: =B = 3 × 2094,36 − 2 × 2.123,59 → 9N = O$8. QTA, RR Perceba que cada recomendação resultou em valor diferente. Isso ocorre porque são recomendações que partem de considerações diferentes. A experiência nos ensina qual a melhor recomendação a se utilizar em cada caso prático. Quantidade de meses frequência li ls fi 1 R$650,00 |------ R$1.100,00 16 2 R$1.100,00 |------ R$1.550,00 21 3 R$1.550,00 |------ R$2.000,00 28 4 R$2.000,00 |------ R$2.450,00 31 5 R$2.450,00 |------ R$2.900,00 18 6 R$2.900,00 |------ R$3.350,00 16 7 R$3.350,00 |------ R$3.800,00 12 142 Classes número Rendas familiares mensais, em R$ Valor TOTAL Estatística – Prof. Dr. Pedro Ivo Brasil Estatística – Prof. Dr. Pedro Ivo Brasil Lista #2 – Estatística – Medidas de Tendência Central Prof. Dr. Pedro Ivo Brasil Exercício 1: Em determinada empresa os salários dos colaboradores de nível superior, sem nível de chefia, distribuem-se conforme a tabela abaixo. Nessas circunstâncias podemos afirmar que o salário médio; mediano e modal (segundo King) são respectivamente quanto? (R.: R$ 2596; R$ 2547; R$ 2868) Exercício 2: Na tabela abaixo são mostradas as variações de preços das cinco mais importantes despesas de uma família e os gastos médios mensais da mesma antes do aumento. Baseados nesses dados podemos afirmar que as médias simples e ponderadas de aumentos das despesas dessa família foram respectivamente quanto? (R.: 2,0% e 3,9%) Exercício 3: Uma corretora de valores relacionou 12 investimentos feitos recentemente e os rendimentos correspondentes a cada um desses investimentos. Os dados estão reunidos no quadro abaixo: Com base nesses dados podemos dizer que o rendimento médio dessas aplicações é de quanto? (R.: 13%) Exercício 4: Uma corretora de valores relacionou 12 investimentos feitos recentemente e os rendimentos correspondentes a cada um desses investimentos. Os dados foram reunidos no quadro abaixo: Com base nesses dados podemos dizer que os rendimentos mediano e modal dessas aplicações são de quanto? (R.: 13% e 13%) Exercício 5: O departamento de produção de uma empresa de confecções anota diariamente quantos defeitos ocorreram na linha de produção. Na tabela a seguir estão relacionadas as informações referentes aos últimos 120 dias: Nessas condições os números médio, mediano e modal de defeitos diários são, respectivamente quanto? (R.: 8,7; 8,0 e 7,0) Classes Salariais Número de funcionários A R$850,00 |-------- R$1.450,00 25 B R$1.450,00 |-------- R$2.050,00 32 C R$2.050,00 |-------- R$2.650,00 35 D R$2.650,00 |-------- R$3.250,00 37 E R$3.250,00 |-------- R$3.850,00 20 F R$3.850,00 |-------- R$4.450,00 13 G R$4.450,00 |--------| R$5.050,00 9 Limites de classes Item Percentual de aumento Despesas médias mensais (anteriores ao aumento) Alimentação -6,0% R$1.280,00 Aluguel 11,0% R$1.325,00 Escolas 12,0% R$637,00 Plano de saúde 8,0% R$298,00 Lazer -15,0% R$165,0012% 13% 18% 9% 10% 11% 13% 15% 16% 14% 8% 17% 12% 13% 18% 9% 10% 11% 13% 15% 16% 14% 8% 17% Número de defeitos diários Número de dias 6 20 7 23 8 21 9 18 10 16 12 13 13 5 14 3 15 1 Estatística – Prof. Dr. Pedro Ivo Brasil Estatística – Prof. Dr. Pedro Ivo Brasil Exercício 6: Uma pequena agência de publicidade relacionou no quadro abaixo o custo das suas 120 últimas campanhas publicitárias: Nestas condições podemos afirmar que os custos mediano e modal (pelo método de King) das campanhas publicitárias dessa agência são, respectivamente, quanto? (R.: R$23.370 e R$26.892) Exercício 7: Uma corretora de valores relacionou 12 investimentos e os rendimentos correspondentes a cada um deles. Os dados acham-se no quadro abaixo: Com base nesses dados podemos dizer que o rendimento médio, mediano e modal dessas aplicações é de quanto? (R.: 15%, 15% e 15%) Exercício 8: O departamento de produção de uma empresa de confecções anota diariamente quantos defeitos ocorreram na linha de produção. Na tabela abaixo estão relacionadas as informações referentes aos últimos 183 dias de produção. Nessas condições os números médio e mediano de defeitos diários é de aproximadamente quanto? (R.: 10, ambos) Exercício 9: Uma pequena agência de publicidade relacionou no quadro abaixo o custo das suas 130 últimas campanhas publicitárias: Nestas condições podemos afirmar que o custo médio, o custo mediano e o custo modal (método de King) das campanhas publicitárias dessa agência é respectivamente quanto? (R.: R$74.600,00; R$75.104,00; R$81.789,47) Classes Quantidade de campanhas (f i) A R$5.000,00 |-------- R$10.000,00 12 B R$10.000,00 |-------- R$15.000,00 15 C R$15.000,00 |-------- R$20.000,00 18 D R$20.000,00 |-------- R$25.000,00 23 E R$25.000,00 |-------- R$30.000,00 25 F R$30.000,00 |-------- R$35.000,00 14 G R$35.000,00 |--------| R$40.000,00 13 Custo das campanhas publicitárias 14% 20% 12% 15% 18% 10% 15% 11% 13% 17% 16% 19% Classes Quantidade de campanhas (f i) A R$25.000,00 |-------- R$38.000,00 12 B R$38.000,00 |-------- R$51.000,00 15 C R$51.000,00 |-------- R$64.000,00 18 D R$64.000,00 |-------- R$77.000,00 24 E R$77.000,00 |-------- R$90.000,00 26 F R$90.000,00 |-------- R$103.000,00 14 G R$103.000,00 |--------| R$116.000,00 13 H R$116.000,00 |--------| R$129.000,00 8 Custo das campanhas publicitárias Número de defeitos diários Número de dias 6 33 8 36 10 36 11 40 13 16 14 13 16 5 18 3 20 1