Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 CAPÍTULO II – Aula III Prof. Alan Gusmão MEDIDAS DE TENDÊNCIA CENTRAL 5.1 Introdução É necessário o conhecimento das populações, o mais completo possível, para fins de tomada de decisão. É muito comum que se façam suposições ou que se estabeleçam hipóteses a serem confirmadas pelas observações feitas. Essas observações poderão se estender à população em uma inspeção total ou uma parte do total fazendo-se amostragem. De um modo geral, as perguntas mais usuais e importantes são feitas, relativas população, são as seguintes: *Onde é?, ou está, o centro da distribuição (de dados ou de valores) ? *Com o se distribuem os valores em torno desse centro? *Como é a forma dessa distribuição? *Se houver duas ou mais variáveis, como elas se relacionam e qual a intensidade dessa relação? Para responder a essas perguntas, há necessidade do conhecimento das Medidas de: 1 – Média Medidas de Posição (ou medida de tendência central): 2 - Moda 3 - Mediana As medidas de posição são usadas para indicar um valor que tende a melhor representar um conjunto de números, ou seja, são “estatísticas“ usadas para representar uma série de dados, orientando-nos onde se localiza o centro da distribuição em relação ao eixo horizontal (eixo das abscissas). Nenhuma medida de posição pode dar uma completa sumarização de um conjunto de dados 5.2 Somatório – Notação Sigma ( ) Quando queremos representar uma soma de n valores do tipo 1X + 2X + + + . . . + nX ,podemos codificá-la através da expressão: 1X + 2X + + + . . . + nX = ni i Xi 1 , onde: - é utilizada para representar as operações de adição entre as parcelas. iX - é a parcela genérica. A expressão ni i Xi 1 deve ser lida “soma dos valores de xi, para i variando de 1 até n. 5.3 – Média A medida de tendência central mais comumente usada para descrever resumidamente uma distribuição de frequências é a média, ou mais propriamente, a média aritmética. Há vários tipos de médias, mas vamos aqui tratar apenas da média aritmética simples e ponderada. 5.3.1 Média Aritmética Simples 2 A média aritmética simples para um conjunto de números é igual ao quociente entre a soma dos valores do conjunto e o número total de valores, Assim,para uma seqüência numérica nxxxx ...,, 321 , a média aritmética simples, é dada por: x = n Xi . Exemplo: Lucro de uma agência de viagens durante o primeiro semestre. janeiro Fevereiro Março Abril Maio junho R$14900,00 R$15500,00 R$13400,00 R$13100,00 R$14200,00 R$15300,00 A média dos lucros no semestre é:................................................................ 5.3.2 Média Aritmética Ponderada – Para uma seqüência nxxxx ...,, 321 , afetados de pesos 321 ,, PPP ......, nP , respectivamente, a média aritmética ponderada, e dada por: x = Pi XiPi . Exemplo: Se X:2, 4, 3, com pesos 1, 2, 3 respectivamente , então: 2,3 5 19 321 332412 xxx X . Média Aritmética para dados agrupados sem intervalos de classe: x = f i Xifi Exemplo: Número de quartos dos chalés (escolha de 120 famílias). Número de quartos Frequência 1 27 2 44 3 33 4 16 Calcule a média para essa distribuição. Média aritmética para dados agrupados com intervalos de classe A média aritmética de dados agrupados com intervalo de classe é obtida pela somatória do produto do ponto médio de cada intervalo de classe pelo respectivo peso dividida pela somatória dos pesos. Isto é: x = f i Xifi , onde ix é ponto médio de classe. Exemplo: A distribuição abaixo representa a estatura de 54 crianças de um acampamento: 3 i Estaturas (cm) Fi Ponto Médio Xi.fi 1 120 129 6 124,5 747,0 2 129 138 12 133,5 1602,0 3 138 147 16 142,5 2280,0 4 147 156 13 151,5 1969,5 5 156 165 7 160,5 1123,5 Soma 54 7722,0 A média é dada por: x = f i Xifi = 54 7722 =143 cm A altura média das crianças é de 143 cm. Propriedades da Média Aritmética 1) A média de um conjunto de dados pode sempre ser calculada; 2) Para um dado conjunto de valores a média é única; 3) A soma algébrica dos desvios tomados em relação à média é nula, isto é, n i di 1 0 . 4) A média é sensível a todos os valores do conjunto; 5) Seja x a média de nxxxx ...,, 321 . Somando-se ou subtraindo-se uma constante k a cada valor de um conjunto de valores, a média do conjunto fica somada ou subtraída desta constante. De modo análogo, multiplicando-se ou dividindo-se todos os valores de um conjunto por uma constante k, a média do conjunto fica multiplicada ou dividida por esta constante. 5.3.3 Média Geométrica – Para a seqüência nxxxx ...,, 321 , a média geométrica simples é dada por: x = n nxxxx ...... 321 5.3.4 Média Harmônica Simples - Para uma seqüência nxxxx ...,, 321 , a média harmônica simples é dada por: x = Xi n 1 5.3.5 – Desvio em Relação à Média: (di) O desvio em relação à média é a diferença entre um valor da série e o valor médio. O desvio médio é o afastamento do valor da série em relação ao valor médio. ( di = ix - x ) Exemplo: Considere os números: 3, 5 e 4. a média é: x = n Xi = 3 453 = 4 4 1d = 3-4 = -1 2d = 5-4 = 1 3d = 4-4 = 0 Exercícios 1) A média aritmética de um conjunto formado por 10 elementos é igual a 8. acrescendo-se a esse conjunto 0 número 41, qual será a nova média? Resp. 11 2) A média aritmética de n números é 29. Retirando-se o número 24, a média aumenta para 30. Qual é o valor de n? Resp. 6 3) A média aritmética de 15 número é 26. Retirando-se um seles, a média dos demais passa a ser 15. Qual foi o número retirado? Resp. 40 4) Calcule o salário médio semanal de 100 operários de uma empresa, onde 40 empregados recebem R$ 152,00; 45 recebem R$ 232,50 e o restante R$ 340,00 semanal. 5) Uma prova consta de três questões, com pesos iguais a 3, 2, e 1, respectivamente. Se um aluno tirou 7,0 na primeira; 8,0 na segunda e 6,0 na terceira, qual foi sua média final? 6) Em março o preço de um produto era R$ 20,00, em abril o preço aumentou 23%, em maio chegou a R$ 38,00. Qual o preço médio desse produto nesses três meses? 5.4 - MODA (Mo) Denominamos moda o valor mais freqüente de um conjunto de dados. Desse modo, o salário modal dos empregados de uma indústria é o salário mais freqüente, isto é, é o salário recebido pelo maior número de funcionários dessa empresa. 5.4.1- Cálculo da moda 1º caso – Dados brutos ou rol: basta identificar o elemento de maior freqüência. Exemplos: a) X: 2 , 8 , 3 , 4 , 5 , 5, 4, 3 , 5 , 5 , 1 Mo = 5 (unimodal ) b) X: 6 , 10 , 5 , 6 , 10 , 2 , 8 Mo = 6 e Mo = 10 ( bimodal ) Poderemos encontrar seqüências trimodais, tetramodais e assim sucessivamente. c) X: 2,2,5,5,8,8,9,9. Observe que todos os elementos da série apresentam a mesma freqüência ( seqüência amodal ) 2º caso – Variável discreta: Basta identificar o elemento de maior freqüência. Exemplo: ix if 0 2 34 5 6 2 5 8 9 3 7 A maior frequência observada na segunda coluna é 9 e corresponde ao elemento 4 da série. Portanto, Mo = 4. 3º caso – Variável contínua: Existem várias fórmulas para o cálculo da moda: 1º Processo: MODA DE PEARSON 5 Mo = 3 dm - 2 x 2º Processo: MODA DE KING Mo = il + h ff f postant post * Onde: il - é o limite inferior da classe modal; antf - é a frequência simples anterior à classe modal; postf - é a frequência simples posterior à classe modal; h - é a amplitude da classe modal. 3º Processo: MODA DE CZUBER Mo = il + h fff ff postant anti * )(2 max , onde: if é a frequência simples de classe e maxf é a maior frequência ( frequência da classe modal). COMENTÁRIO: A fórmula de Pearson tem normalmente interesse teórico. Se não dispusermos da média e da mediana da distribuição, a fórmula de Pearson é a mais trabalhosa. A fórmula de King é a mais simples, mas não é a mais precisa. A fórmula de Czuber é mais precisa que a fórmula de King, pois leva também em consideração a frequência da classe modal. EMPREGO DA MODA. A moda é utilizada quando: a) Quando desejamos obter uma medida rápida e aproximada de posição; b) Quando a medida de posição deve ser o valor mais típico da distribuição. EXEMPLO A distribuição abaixo representa o consumo, em Kg, de um produto colocado em oferta em um supermercado, que limitou o consumo máximo em 5 kg. Calcule e interprete a moda pelo método de King e Czuber i Consumo em kg Nº de clientes 1 2 3 4 5 0 1 1 2 2 3 3 4 4 5 12 15 21 54 32 5.5 - MEDIANA (Md) Mediana é um valor real que separa o rol em duas partes deixando à sua esquerda o mesmo número de elementos que a sua direita. Portanto, a mediana é o valor que ocupa a posição central em uma série. 5.5.1 – Cálculo da mediana 1º caso – Dados Brutos ou Rol Inicialmente devemos ordenar os elementos caso sejam dados brutos, obtendo o rol. Em seguida determinaremos o número n de elementos do rol. 6 Se n é impar – O rol admite apenas um termo central que ocupa a posição ( 2 1n )º . O valor do elemento que ocupa esta posição é a mediana. Exemplo: Determinar a mediana do conjunto: X; 2,4,6,8,9,12,15. Solução: n = 7 (ímpar) a posição do termo central é ( 2 17 )o = 4. A mediana é o quarto elemento do rol: Md = 8. Interpretação: 50% dos valores são menores que 8 e 50% são maiores que 8. Se n é par – Neste caso o rol admite dois termos centrais que ocupam as posições (n/2) º e (n/2 +1)º. A mediana é convencionada como sendo a média dos valores que ocupam estas posições centrais. Exemplo: Assim a série de valores X: 2,5,7,10,12,13,18,21 tem para mediana a média entre 10 e 12. Logo: Md = 11 2 22 2 1210 . Interpretação: 50% dos valores da série são menores que 11 e 50% são maiores que 11. Obs. Cálculo da ordem: 5,4 2 18 2 1 n . A mediana está entre o 4º e o 5º termo, que são 10 e 12 e o valor da mediana não está contido na série. 2º caso - Variável Discreta Se os dados estão apresentados na forma de uma variável discreta, eles já estão naturalmente ordenados. Para facilitar a localização dos termos centrais, construímos a frequência acumulada da série. Exemplo: Determine a mediana da série: ix if af 2 1 1 5 4 5 8 10 15 10 6 21 12 2 23 Solução: O número de elementos da série é n = if = 23 e 2 123 2 1n 12º elemento. Na coluna da frequência acumulada podemos localizar facilmente o décimo segundo elemento da série que é 8. Logo: Md = 8. Interpretação: 50% dos valores são menores ou iguais a 8 e 50% são maiores ou iguais a 8. 3º caso – Variável Contínua Se os dados são apresentados na forma de uma variável contínua, o raciocínio anterior não pode ser utilizado, uma vez que mesmo identificada a posição da mediana na série o valor do elemento da série que ocupa esta posição não é identificável. Para o cálculo da mediana, procedemos da seguinte forma: 1º passo: Calcula-se a ordem 2 n , a variável é continua, independentemente se n é par ou ímpar. 2º passo: Pela frequência acumulada simples, identifica-se a classe que contém a mediana. 7 3º passo: Utiliza-se a fórmula: h f Fant n liM md d * 2 , onde: il - é o limite inferior da classe da mediana; ifn antF - é a frequência acumulada anterior à classe da mediana; mdf - é a frequência simples da classe da mediana; h - é a amplitude de classe. EMPREGO DA MEDIANA – emprega-se a mediana quando: a) Desejamos obter o ponto que divide a distribuição em partes iguais; b) Há valores extremos que afeta de uma maneira acentuada a média c) A variável em estudo é salário. Comentário: Fica evidente que o valor obtido pela fórmula é um valor aproximado do verdadeiro valor da mediana da série. De um modo geral, todas as medidas calculadas para uma variável contínua serão valores aproximados para estas medidas, uma vez que ao agruparmos os dados segundo uma variável contínua, há perda de informações quanto a identidade dos dados. Podemos generalizar para dizer que um conjunto de números tenha valores de dados extremos, a mediana é freqüentemente a medida de posição central preferida.( é mais utilizada quando se trata de salários). Para uma variável qualitativa, utiliza-se a moda, não tem sentido falar em média ou mediana. Exemplo O departamento de Recursos Humanos de uma empresa, tendo em vista o aumento de produtividade de seus vendedores, resolveu, premiar com um aumento de 5% no salário, a metade de seus vendedores mais eficientes. Para isto, fez um levantamento de vendas semanais, por vendedor, obtendo a tabela: i Vendas em R$ Nº de vendedores fa 1 2 3 4 5 0 10.000 10.000 20.000 20.000 30.000 30.000 40.000 40.000 50.000 1 1 12 13 27 40 31 71 10 81 A partir de qual volume de vendas o vendedor será premiado? Solução: 2 n = 2 81 = 40,5 ( 4ª classe ) 29,161.30000.10*) 31 405,40 (000.30 dM 3) Utilização das Medidas de Tendência Central Na maioria das situações, não necessitamos de calcular as três medidas de tendência central. Normalmente precisamos de apenas uma das medidas para caracterizar o centro de uma série. Surge, então a questão: qual medida deve ser utilizada? A medida ideal em cada caso é aquela que melhor representa a maioria dos dados da série. Quando todos os dados de uma série estatística são iguais, a média, a mediana e a moda coincidirão com este valor e, portanto qualquer uma delas representará bem a série. No entanto, este caso dificilmente ocorrerá na prática. 8 Na maioria das vezes, teremosvalores diferenciados para a série e conseqüentemente a medida irá representar bem, apenas os dados da série que se situa próximo a este valor. Os dados muito afastados em relação ao valor da medida não serão bem representados por ela. Desta forma, se uma série apresenta forte concentrarão de dados em sua área central, a média, a mediana e a moda ficam também situadas em sua área central representando bem a série como na figura 1, abaixo. Como a mais conhecida é a média, optamos por esta medida de tendência central. Concluindo, devemos optar pela média, quando houver forte concentração de dados na área central da série. Figura 1 X Se uma série apresenta forte concentração de dados em seu início, a mediana e a moda estarão posicionadas mais no início da série, representando bem esta concentração. A média que é fortemente afetada por alguns valores posicionados no final da série se deslocará para a direita desta concentração não representando bem. Como a mais conhecida entre a moda e a mediana é a mediana, esta será a medida indicada neste caso. A mesma situação ocorre se a séria apresenta forte concentração de dados no seu final. Concluindo, devemos optar pela mediana, quando houver forte concentração de dados em seu final. A moda deve ser a opção como medida de tendência central apenas em séries que apresentam um elemento típico, isto é, um valor cuja frequência é muito superior a frequência dos outros elementos da série. 5) Posição relativa da média, mediana e moda Quando uma distribuição é simétrica, as três medidas coincidem. Porém, a assimetria torna-se diferentes e essa diferença é tanto maior quanto menor é a assimetria. Assim, em uma distribuição em forma de sino, temos: od MMX , no caso da curva simétrica; XMM do , no caso da curva assimétrica positiva; od MMX , no caso da curva assimétrica negativa. EXERCÍCIOS 1) Calcule e interprete a média, a moda e a mediana das seguintes séries: a) X: 2,3,5,4,5,2,5,7 b) 7,7,7,7,7,7,7,7,7,7,7, c) 4,5,6,6,6,7,8,8,8,9,10,10,10,11 2) Calcule a média, a moda e a mediana da distribuição do número de acidentes diários, observados em um cruzamento, durante 40 dias· (interprete os resultados) 9 Nº de acidentes por dia Nº de dias 0 1 2 3 4 30 5 3 1 1 3) Dada à distribuição de valores de 54 notas fiscais emitidas na mesma data, selecionadas em uma loja de departamentos. i Consumo por notas(R$) Nº de notas 1 2 3 4 5 6 0 50 50 100 100 150 150 200 200 250 250 300 10 28 12 2 1 1 Calcule e interprete a moda, a média e a mediana. Qual a medida de tendência central que melhor representa a distribuição? 4) O consumo de energia elétrico verificado em 250 residências de famílias de classe média, com dois filhos, revelou a distribuição: classe Consumo Kwh Nº de residências 1 2 3 4 5 6 7 0 50 50 100 100 150 150 200 200 250 250 300 300 350 2 15 32 47 50 80 24 Calcule a média, a moda e a mediana. Interprete os resultados. 6.0) MEDIDAS DE SEPARATRIZES Separatrizes são números reais que dividem a seqüência ordenada de dados em partes que contêm a mesma quantidade de elementos da série. As principais medidas de separatrizes são: 6.1 – Mediana: a mediana divide a seqüência ordenada em duas partes iguais, cada uma ficando com 50% dos valores da seqüência, é também uma medida de separatriz. 6.2 – Quartis: Dividiremos a série ordenada em quatro partes, cada uma ficará com 25% dos seus elementos. Os elementos que separam estes grupos são chamados de quartis. Indicados por: 1Q - Separa a seqüência deixando 25% de seus valores à esquerda e 75% dos seus valores à direita. 2Q - já visto, é a mediana. 3Q - Separa a seqüência ordenada deixando à sua esquerda 75% dos seus elementos e 25% de seus elementos à direita. %100_______%75______%50______%25_____%0 1Q 2Q 3Q 10 6.3– Quintis: Dividiremos a série ordenada em 5 partes iguais, cada uma ficará com 20% de seus elementos. Os elementos que separam tais grupos são chamados quintis. Indicaremos por 1k , 2k , 3k , 4k %100_______%80_______%60_______%40_______%20______%0 1k 2k 3k 4k 6.4 – Decis: Dividiremos a seqüência ordenada em dez partes iguais, cada uma ficando co 10% de seus valores. Os elementos que separam estes grupos são chamados decis. Indicaremos por 1D , 2D ,........., 9D %100__%90____________________________%20___%10___%0 1D 2D 9D 6.5 – Percentis ou Centis: Dividiremos a seqüência ordenada em 100 partes iguais, cada uma ficando com 1% de seus elementos. Os elementos que separam estes grupos são chamados de centis ou percentis. Indicaremos por 1P , 2P ,........., 99P . %100___%99__________________________%2___%1___%0 1P , 2P , 99P 6.6 – Cálculo das separatrizez a) 1º Caso - Dados Brutos ou Rol: Identifica-se a medida que queremos obter com o percentual correspondente ( iP ). Calculamos i% de n, ou seja, 100 *ni para localizar a posição do percentil no rol. Em seguida, identificamos o elemento que ocupa esta posição. 1) Se 100 *ni for um número inteiro, então o iP que estamos procurando identificar é um dos elementos da seqüência ordenada; 2) Se 100 *ni não for um número inteiro, neste caso, o iP é definido como sendo a média dos valores que ocupam estas posições aproximadas. Exemplo: Dada a seqüência ordenada X: 1,2,5,5,5,8,10,11,12,12,13,15. Calcule: 3Q , 4k , 7D e 32P . Interprete os resultados. 2º Caso – Valores Discretos: Identifica-se a medida que queremos obter com o percentual correspondente ( iP ); Calculamos i% de n, ou seja, 100 *ni para localizar a posição do percentil na série; em seguida, utilizamos a frequência acumulada para localizar o elemento que ocupa esta posição na série. O valor deste elemento é o iP procurado. Exemplo: Dada a série abaixo, calcule e interprete 3Q , 4k , 7D e 32P 11 xi fi 1 3 4 5 5 8 7 6 10 2 Solução..... 3º Caso: Variável Contínua: Para obter uma fórmula geral para o cálculo dos percentis, vamos generalizar a fórmula ma mediana. h f Fant n liM md d * 2 . Identificamos 50PM d , podemos obter uma fórmula particular para 50P Note que a classe que contém a mediana é a mesma classe que contém o 50P . O 2 n pode ser representado na linguagem do 50Pcomo 100 *ni . Os outros termos não se modificam. Assim, a formula da mediana, adaptada par a linguagem do 50P pode ser escrito: 50P = h f F n l ant i * 100 *50 50 . Substituindo-se 50 pelo índice i, generalizamos a fórmula para o cálculo de qualquer percentual. h f F ni lP i ant ii * 100 * . Onde: iP = percentual ( i = 1,2,3......,99 ) il é o limite inferior da classe que contém a mediana; n é o número de elementos da série; antF é a frequência acumulada anterior à classe que contém o iP if é a Frequência simples da classe que contém o percentil i; h é a amplitude de classe. 12 Exemplo: Dada à distribuição de valores de 54 notas fiscais emitidas na mesma data, selecionadas em uma loja de departamentos. i Consumo por notas(R$) Nº de notas 1 2 3 4 5 6 0 50 50 100 100 150 150 200 200 250 250 300 10 28 12 2 1 1 Calcule e interprete 82831 ,, ePDKQ . Solução:........ EXERCÍCIOS 1) Uma amostra aleatória de 250 residências de famílias, de classe média, com dois filhos, revelou a seguinte distribuição do consumo de energia elétrica : i Consumo Kwh Nº de vendedores 1 2 3 4 5 6 7 0 50 50 100 100 150 150 200 200 250 250 300 300 350 2 15 32 47 50 80 24 Pede-se: 1.1. O consumo médio por residência; 1.2. A distribuição de frequência; 1.3. A porcentagem de famílias com consumo mensal maior ou igual a 200 e menor que 250kwh; 1.4. A porcentagem de consumo mensal menor que 200kwh; 1.5. O histograma e o polígono de frequência; 1.6. O consumo mediano; 1.7. A moda; 1.8. A amplitude total da série; 1.9. 906231 ,,, ePDKQQ ; 1.10. A amplitude da 5ª classe; 1.11. O desvio Médio Simples; 1.12. A variância; 1.13. O desvio padrão; 1.14. O coeficiente de variação. 2) Mariana comprou 6 camisetas iguais. Comprou duas em uma loja, pagando R$ 15.00, cada, e comprou as outras quatro em outra loja. Se o preço médio das 6 camisetas foi de R$ 12,00, determina quanto custou cada camiseta na segunda loja. 4) Em um exame final de matemática, o grau médio de um grupo de 150 alunos foi de 7,5 e o desvio padrão de 0,72. Em Estatística, entretanto, o grau médio final foi 7,6 e o desvio padrão de 0,81. Em qual disciplina foi maior a dispersão? 5) A tabela a seguir fornece o índice pluviométrico semanal de certa região em um ano qualquer. 13 Mês Jan. Fev. Mar. Abr. mai Jun. Jul . Ago. Set. Out. Nov. Dez. Índice 68 53 41 46 50 40 41 40 42 38 42 46 Qual a média, a moda, a mediana, a variância, o desvio padrão e o coeficiente de variação do índice pluviométrico dessa região? 6) Uma amostra do tempo de vida útil de uma peça forneceu a seguinte distribuição: N de horas (vida útil) Nº de peças 0 100 6 100 200 42 200 300 86 300 400 127 400 500 64 500 600 Se o produtor deseja estabelecer uma garantia mínima para o número de horas de vida de uma peça, trocando a peça que não apresentar este número mínimo de horas, qual é a garantia se ele está disposto a trocar 9 % das peças?
Compartilhar