Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 FACULDADE MAURICIO DE NASSAU CURSO DE ADMINISTRAÇÃO MEDIDAS ESTATÍSTICAS MEDIDAS ESTATÍSTICAS: TENDÊNCIA CENTRAL, DISPERSÃO, ASSIMETRIA E CURTOSE PROFESSOR: LUCIANO MELO 2 MEDIDAS ESTATÍSTICAS E SUAS APLICABILIDADES 1.0 - MEDIDAS DE POSIÇÃO As medidas de posição mais importantes são as medidas de tendência central, que recebem tal denominação pelo fato de os dados observados tenderem, em geral, a se agrupar em torno de valores centrais. Dentre as medidas de tendência central destacamos: a) A média aritmética b) A mediana c) A moda As outras medidas de posição são separatrizes, que englobam: a) a própria mediana b) Os quartis, decis e percentis 1.1 - Média Aritmética Esta média é quociente da soma dos valores da variável pelo número deles. A média é representada por: n x x i Sendo xi, os valores da variável e n o número de valores ou total de dados. Exemplo: Foram escolhidos entre os alunos de escola uma pequena amostra para verificar a média de idade, estas idades foram 10, 14,13, 15, 16, 18 e 12 anos. Qual a média aritmética dessas idades. 10 14 15 16 18 12 98 14 7 7 x anos. Nota: Ás vezes a média pode ser um número diferente de todos os da série. Como é o caso de 2, 4, 8 e 9. O número 5 é o representativo da série, dizemos então que esta média não tem existência concreta. 1.2 - Propriedades a) A soma algébrica dos desvios em relação à média é nula. b) Ao somar ou subtrair uma constante “k” a todos os elementos de um conjunto de dados, a média fica aumentada ou diminuída deste valor. c) Ao multiplicar ou dividir uma constante “k” a todos os elementos de um conjunto de dados, a média fica aumentada ou diminuída deste valor. 1.3 - Média Aritmética Ponderada Esta média é empregada quando são atribuídos pesos a uma determinado conjunto de variáveis. As freqüências são números indicadores de intensidade, funcionam como fator de ponderação, podendo portanto, ser calculada pela fórmula: 1 1 2 2 3 3 1 2 3 ... ... n n n x p x p x p x p x p p p p ou n n n x p x p Para entender como se calcula a média ponderada, temos o seguinte problema: Um aluno obteve as seguintes notas 4, 7 e 6 nas 3 primeiras avaliações de matemática, sabendo-se que, o peso atribuído a estas avaliações, são respectivamente 1, 2 e 3. Vamos calcular a média ponderada, para esta situação: 3 4.1 7.2 6.3 4 14 18 36 6 6 6 6 x . Portanto, a nota obtida pelo aluno é 6,0 (média ponderada). Nota: A média geral pode ser calculada com base na fórmula de média ponderada. Mas, neste caso devemos considerar as médias de “k” séries e os seus respectivos números de termos. Exemplo: Sejam as séries relacionadas a quantidades de ocorrências de um setor administrativo. a) 4, 5, 6, 7, 8 em que n1 = 5 e 6x ; b) 1, 2, 3 em que n2 = 3 e 2x ; c) 9, 10, 11, 12, 13 em que n3 = 5 e 11x . 5.6 3.2 5.11 30 6 55 91 7 5 3 5 13 13 x 1.4 Média Aritmética ( Dados Agrupados ) A média com de uma distribuição com intervalos de classe é calculada através da seguinte fórmula: i i i f x x f Determinar a média aritmética para a distribuição de renda familiar em milhares, de acordo com a tabela. Renda ($) fi xi fi . xi 2 ⊢ 4 5 3 15 4 ⊢ 6 10 5 50 6 ⊢ 8 14 7 98 8 ⊢ 10 8 9 72 10 ⊢ 12 3 11 33 = 40 268 Utilizando a fórmula, x = i i i f x f , x = 268 6,7 40 . Como a renda foi dada em milhares, podemos dizer que a média salarial deste grupo de 40 famílias é, de R$6700,00. Nota: A utilização das médias é necessária quando: a) desejamos obter a medida de posição que possui maior estabilidade. b) houver tratamento algébrico para cálculos posteriores. Observação: Quando a média geométrica for para uma distribuição de freqüências, os dados acarretarão muitos cálculos. Neste caso, é conveniente usar logaritmos em ambos os membros da fórmula, que ficará: 1 1.log .log ... .loglog n n fi x fi x f x Mg fi . 4 2.0 – A MODA Denominamos moda o valor que ocorre com maior freqüência em um conjunto de dados ou em uma série de valores. Podemos dizer, por exemplo, que o salário modal de uma indústria é o salário mais comum, ou seja, o salário recebido pelo maior número de empregados. Quando lidamos com dados não agrupados, é fácil identificar a moda através do valor que mais se repete, veja o exemplo: 7,8,9,10,10,10,11,12,13,15, esta série tem moda igual a 10. Escrevemos Mo = 10. Podemos, entretanto, encontrar séries que não apresentam valor modal como é o caso da série: 3,5,8,10,12,13 esta série é chamada amodal. Ou ainda, podemos encontrar séries que apresentam mais de dois valores que aparecem com freqüências, como é o caso de: 2,3,4,4,4,5,6,7,7,7,8,9, temos duas modas e denominamos de série bimodal. Se, o grupo de dados for muito extenso em dada situação, e aparecem além de 3 valores com freqüência, dizemos que a série e multimodal. 2.1 - MODA COM INTERVALOS DE CLASSES A classe que apresenta maior freqüência é denominada classe modal. Pela definição, podemos afirmar que a moda, neste caso, é o valor dominante que está compreendido entre o limites da classe modal. O modo mais simples para o cálculo da moda consiste em tomar o ponto médio da classe modal. Denominamos esse valor de moda bruta, temos então: 2 li Ls Mo ; onde, li é o limite inferior da classe modal e Ls é o limite superior da classe modal. A classe modal é a 3ª pois, aí está a maior freqüência de estaturas. Assim, para a distribuição da seguinte tabela : i Estaturas(cm) fi 1 150 ⊢ 154 4 2 154 ⊢ 158 9 3 158 ⊢ 162 11 4 162 ⊢ 166 8 5 166 ⊢ 170 5 6 170 ⊢ 174 3 40 A moda bruta será então, 2 li Ls Mo = 158 162 320 160 2 2 . Nota: Há para o cálculo da moda, outros métodos mais elaborados, como por exemplo, a Fórmula de Czuber: Mo = 1 1 2 .li h 5 Na qual: li é o limite inferior da classe modal; h é a amplitude da classe modal; ∆1 é a diferença entre a freqüência simples da classe modal e a imediatamente anterior; ∆2 é a diferença entre a freqüência simples da classe modal e a imediatamente posterior. Assim, para a distribuição da tabela anterior temos: 1 1 2 .Mo li h ; 11 9 158 .4 (11 9) (11 8) ; 2 158 .4 158 (0,4).4 158 1,6 159,6 5 . Como podemos verificar o resultado da aplicação da fórmula de Czuber nos dá um valor mais preciso da moda, que foi arredondada no caso da moda bruta. Nota: A moda é utilizada quando: a) Desejamos obter uma medida rápida e aproximada de posição. b) A medida de posição deve ser o valor mais típico da distribuição. Nota: A moda pode também ser determinada pela Fórmula de Pearson dada por: 3 2Mo Md x A moda é aproximadamente a diferença entre o triplo da mediana e o dobro da média. Esta é uma boa aproximação quando a distribuição apresenta razoável simetria em relação à média. 3.0 - A MEDIANA A mediana é outra medida de posição que se encontra no centro de uma série de números dispostos em uma determinada ordem. Ou podemos dizer que a mediana de um conjunto de valores, é um valor situado de tal forma, que separa-o em dois subconjuntos de mesmo número de elementos. 0% 50% 100% Dada uma série de valores: 5,13,10,2,18,15,6,16,9, primeiramente devemos ordená-la em crescente ou decrescente dos valores. Em seguida, devemos tomar o valor central que separa o mesmo número de elementos à esquerda e à direita. Vejamos como isso acontece para o nosso exemplo: 2,5,6,9,10,13,15,16,18 a mediana desta série é Md = 10, pois há quatro elementos acima e quatro abaixo desse número. Se, porém, a série dada tiver um número par de elementos, convencionou-se utilizar o ponto médio, ou seja, encontrar a média aritmética entre os valores centrais da série: Para a série 2,6,7,10,12,13,18,21 temos para média aritmética os valores 10 e 12. Logo, a mediana será Md = 10 12 22 11 2 2 Nota: A mediana depende da posição e não dos valores dos elementos na série ordenada. Não se deve deixar influenciar pelo valor dos extremos, como no exemplo abaixo, portanto, no conjunto de dados em questão é preferível usar a média. A: 5,7,10,13,15 x = 10 e Md = 10 B: 5,7,10,13,65 x = 20 e Md = 10 6 3.1 - MEDIANA COM INTERVALOS DE CLASSES Neste caso, o problema consiste em determinar o ponto do intervalo em que está compreendida a mediana. Para tanto, temos que determinar a classe na qual se acha a mediana. A classe mediana, que corresponde à freqüência acumulada imediatamente superior a 2 if . Feito isto e admitindo-se, agora, que os valores se distribuam uniformemente em todo o intervalo de classe, vamos verificar a mediana na tabela seguinte: i Estaturas(cm) fi Fac 1 150 ⊢ 154 4 4 2 154 ⊢ 158 9 13 Md 3 158 ⊢ 162 11 24 4 162 ⊢ 166 8 32 5 166 ⊢ 170 5 37 6 170 ⊢ 174 3 40 40 temos: 2 if = 2 40 = 20. Como há 24 valores incluídos nas três primeiras classes da distribuição e pretendemos determinar o valor de que ocupa o 20º lugar, a partir do início da série, podemos observar que este deve estar localizado na terceira classe (i = 3), supondo que as freqüências dessas classes estejam uniformemente distribuídas. Como há 11 elementos nessa classe e o intervalo de classe é igual a 4, devemos tomar, a partir do limite inferior, a distância: Fórmula: / 2 . fi Fant Md li h fmd Temos que: li é o limite inferior da classe mediana; / 2fi é o total de dados dividido por 2; Fant é a freqüência acumulada anterior à da classe mediana; fmd é a freqüência simples da classe mediana; h é a amplitude classe mediana. Calculando a mediana temos: 40 / 2 13 158 .4 11 Md ⇒ 7 158 .4 158 (0,6).4 158 2,4 160,4 11 .A mediana é empregada quando: a) Desejamos obter o ponto que divide a distribuição em partes iguais. b) Há valores extremos que afetam de uma maneira acentuada a média. c) A variável em estudo é o salário. 7 4.0 - MEDIDAS SEPARATRIZES Como vimos, a mediana caracteriza uma série de valores devido à sua posição central. No entanto, ela apresenta outra característica: ela separa a série em dois grupos que apresentam o mesmo número de valores. Assim além das medidas de posição já estudadas, há outras que são consideradas individualmente: os quartis, os percentis e os decis. Estas medidas recebem o nome genérico de separatrizes. 4.1 - OS QUARTIS Denominamos “quartis” os valores de uma série que a dividem em quatro partes iguais. Há, portanto, três quartis: a) O primeiro quartil (Q1 ) valor situado de tal modo na série que uma Quarta parte dos valores (25%) dos dados é menor que ele e as três quartas partes restantes (75%) são maiores. b) O segundo quartil (Q2 ) evidentemente, coincide com a mediana (Q2 = Md ). c) O terceiro quartil (Q3 ) valor situado de tal modo que as três quartas partes (75%) dos termos são menores que ele e uma quarta parte (25%) é maior. Quando os dados são agrupados, para determinar os quartis usamos a mesma técnica do cálculo da mediana, bastando substituir, na fórmula da mediana, 2 if assim, temos: Qi = . ( ) . * 4 * * ik f f ant h f Onde, * é o limite inferior da classe mediana; f (ant) é a freqüência acumulada da classe anterior à classe mediana; f* é a freqüência simples da classe mediana; h* é a amplitude do intervalo da classe mediana. K é o número de ordem do quartil em questão. Vamos determinar o primeiro e o terceiro quartil para a tabela seguinte: i estaturas(cm) fi fac 1 150 ⊢ 154 4 4 2 154 ⊢ 158 9 13 (Q1) 3 158 ⊢ 162 11 24 4 162 ⊢ 166 8 32 (Q3) 5 166 ⊢ 170 5 37 6 170 ⊢ 174 3 40 40 8 a) Q1 = . 4 ik f = 4 40 = 10 ; Q1 = 154+ 9 4)410( x ; 154 + 9 24 = 154+ 2,66 = 156,67cm. b) Q3 = . 4 ik f = 3. 4 40 = 30 ; Q3 = 162 + 8 4)2430( x ; 162 + 8 24 = 162+ 3 = 165 cm. Analisando estes resultados temos: 25 % das estaturas estão abaixo de 156,67cm e os outros 75% estão acima deste valor; 75% das estaturas são menores que 165 cm e o outro quarto restante está acima deste valor.4.2 - OS DECIS Estas medidas comportam-se de forma semelhante aos quartis, no entanto, dividem a série de dados em 10 partes iguais. 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% D1 D2 D3 D4 D5 D6 D7 D8 D9 É possível observar que a fórmula sofre alteração na quantidade de dados que serão divididos, então: Di = . ( ) . * 10 * * ik f f ant h f Temos: * é o limite inferior da classe dos decis, onde i= 1,2,3,...9 ; f (ant) é a freqüência acumulada da classe anterior à classe do decil ; f* é a freqüência simples da classe do decil; h* é a amplitude do intervalo da classe do decil. K é o número de ordem do decil em questão. 4. 3 - PERCENTIS Denominamos percentis os noventa e nove valores que separam uma série em 100 partes iguais. Indicamos P1, P2, ...., P32, ......, P99 . Podemos dizer que: P25 = Q1 ; P50 = Md = Q2 e P75 = Q3 . O cálculo de um percentil segue a mesma técnica do cálculo da mediana, porém, a fórmula 2 if será substituída por: . 100 ik f , sendo k o número de ordem do percentil. Assim, para o 27º percentil, temos: Pi = . ( ) . * 100 * * ik f f ant h l f Temos: * é o limite inferior da classe dos percentis, onde i= 1,2,3,...9 ; f (ant) é a freqüência acumulada da classe anterior à classe do percentil; f* é a freqüência simples da classe do percentil; h* é a amplitude do intervalo da classe do percentil. K é o número de ordem do percentil em questão. 9 Veja o caso a seguir, envolvendo o decil e o percentil. Exemplo: Determinar o 4º decil e o 72º percentil da distribuição, fornecida a tabela: Classes fi Fac 4 ⊢ 9 8 8 9 ⊢ 14 12 20 Classe D4 14 ⊢ 19 17 37 Classe P72 19 ⊢ 24 3 40 = 40 Cálculo do D4 e do P72 : a) 4 4. 4.40 16º 10 10 fi D b) 72 72. 72.40 28,8º 100 100 fi P Identificando a classe de D4 e P72 através da fac, teremos: Verificar erro no fac 72 = 30!!! a) ( ) . * 10 * * i i f f ant h D f = 4.40 8 .5 10 9 12,33 12 b) Pi = . ( ) . * 100 * * ik f f ant h l f = 72.40 20 .5 100 14 16,58 17 Portanto, nesta distribuição podemos concluir que: O valor 12,33 divide a amostra em duas partes: uma com 40% dos elementos e a outra com 60% dos elementos. O valor 16,58 indica que 72% dos elementos da distribuição estão abaixo dele e 28% acima dele. 4. 4 - Utilização das Medidas de Tendência Central Na maioria das situações, não necessitamos calcular as três medidas de tendência central. Normalmente precisamos de apenas uma das medidas para caracterizar o centro da série. Surge, então, a questão: qual medida deve ser utilizada? A medida ideal em cada caso é aquela que melhor representa a maioria dos dados da série. Quando todos os dados de uma série estatística são iguais, a média, a mediana e a moda coincidirão com este valor e, portanto qualquer uma delas representara bem a série. No entanto, este caso dificilmente ocorrerá na prática. Na maioria das vezes, teremos valores diferenciados para a série e conseqüentemente a medida irá representar bem, apenas os dados da série que se situam próximos a este valor. Os dados muito afastados em relação ao valor da medida não serão bem representados por ela. Desta forma, se uma série apresenta forte concentração de dados em sua área central, a média, a mediana e a moda ficam também situadas em sua área central representando bem a série como na figura abaixo. Como a mais conhecida é a média, optamos por esta medida de tendência central. Concluindo, devemos optar pela média, quando houver forte concentração de dados na área central da série. 10 x Se uma série apresenta forte concentração de dados em seu início, a mediana e a moda estarão posicionadas mais no início da série, representando bem esta concentração. A média que é fortemente afetada por alguns valores posicionados no final da série se deslocará para a direita desta concentração não a representando bem. Como a mais conhecida entre mediana e moda é a mediana, esta será a medida indicada neste caso. A mesma situação ocorre se a série apresenta forte concentração de dados em seu final. Concluindo, devemos optar pela mediana, quando houver forte concentração de dados no início ou no final da série. A moda deve ser a opção como medida de tendência central apenas em séries que apresentam um elemento típico, isto é, um valor cuja freqüência é muito superior à freqüência dos outros elementos da série. NOTA: A figura (curva) a seguir indica uma distribuição de freqüência simétrica em que os valores das medidas de tendência central são iguais. Significa que os elementos estão bem distribuídos. Se a distribuição não apresentar esta característica será classifica como assimétrica e fará parte de um estudo posterior nas medidas de assimetria e curtose. x Md Mo ATIVIDADES 1. Considerando o conjunto de dados: a) 3,5,6,5,9,5,2,8,6 b) 20,9,7,2,12,7,20,15,7 c) 51,6;48,7; 50,3;49,5;48,9 Determine: a ) A média b) A mediana c) A moda 2. Os salários-hora de cinco funcionários de uma companhia são: R$ 75,00; R$ 90,00; R$ 83,00; R$ 142,00 e R$ 88. Determine: a) a média dos salários-hora b) O salário-hora mediano. 11 3. As notas de um candidato, em seis provas de um concurso, foram: 8,4; 9,1; 7,2; 6,8; 8,7; e 7,2. Encontre: a) A nota média b) A nota mediana c) A nota modal 4. Observe as distribuições (tabelas) e determine a medida de tendência central mais adequada: a) Salários(R$) fi 0 ⊢ 2 15 2 ⊢ 4 8 4 ⊢ 6 6 6 ⊢ 8 4 8 ⊢ 10 2 Total b) Pesos (kg) fi 145 ⊢ 151 10 151 ⊢ 157 9 157 ⊢ 163 8 163 ⊢ 169 6 169 ⊢ 175 3 175 ⊢ 181 3 181 ⊢ 187 1 Total 5. Calcule o salário modal para a tabela do exercício 4. 6. Calcule e interprete o primeiro e o terceiro quartil da tabela b0 do exercício4. 7. A distribuição de freqüências a seguir mostra o controle de notas fiscais das atividades mensisl de um departamento de vendas de e-commerce (vendas virtuais) da loja INTERVENDAS. Determine o 4º decil e o 75º percentil para este caso e interprete o resultado. Notas Fiscais fi 100 ⊢ 125 5 125 ⊢ 150 120 150 ⊢ 175 175 175 ⊢ 200 200 200 ⊢ 225 50 Total 12 8. O setor de marketing de uma empresa contatou funcionários repositores para divulgar produtos em gôndolas num shopping center. Os honorários serão pagos com base na tabela salarial informada. Será acrescida ao salário uma comissão de 30% do salário mínimo vigente por meta de vendas atingida. O tempo de serviço está previsto para 3 meses, e os funcionário com melhor desempenho serão bonificados com 5% sobre o salário bruto. Por outro lado, os funcionários com desempenho abaixo do previsto, terão a título de incentivo um auxílio alimentação de 2% sobre o salário bruto (sem a comissão). Determine: a) O valor do salário para que o funcionário receba auxílio alimentação. b) O valor salarial “central” que vigora na empresa. c) O valor salarial que indicará o ganho da bonificação. d) Qual o gasto da folha com os salários dos funcionários bonificados após os 3 meses? Faixa de Ganhos fi 300 ⊢ 380 18 380 ⊢ 460 5 460 ⊢ 540 4 540 ⊢ 620 2 620 ⊢ 700 1 Total 5.0 - MEDIDAS DE DISPERSÃO Vimos anteriormente que um conjunto de valores pode ser convenientemente sintetizado, por meio de procedimentos matemáticos, em poucos valores representativos – média aritmética, mediana e moda. Tais valores podem servir de comparação para dar a posição de qualquer elemento do conjunto. Em relação à média, dada a situação, ainda que seja considerada como um número que tem a faculdade de representar uma série de valores - não pode por si mesma, destacar o grau de homogeneidade ou heterogeneidade entre os valores que compõem o conjunto. Consideremos os seguintes conjuntos de valores de variáveis X , Y , Z : X : 70,70,70,70,70 Y : 68,69,70,71,72 Z : 5,15,50,120,160 Calculando a média aritmética de cada um desses conjuntos obtemos: n x x i x = 5 350 = 70 ; n y y i y = 5 350 = 70 ; n z z i z = 5 350 = 70 ; Vemos então, que os três conjuntos apresentam a mesma média aritmética: 70. Entretanto, é fácil notar que o conjunto X é mais homogêneo que os conjuntos Y e Z, já que todos os valores são iguais a média. O conjunto Y, por sua vez, é mais homogêneo que o conjunto Z, pois há menor diversificação entre cada um, de seus valores e a média representativa. Chamando de dispersão ou variabilidade a maior ou menor diversificação dos valores de uma variável em torno de um valor central tomado como ponto de comparação, podemos dizer que o 13 conjunto X apresenta dispersão ou variabilidade nula e que o conjunto Y, apresenta uma dispersão ou variabilidade menor que o conjunto Z. Portanto, para qualificar os valores de uma variável, ressaltando a maior ou menor dispersão ou ainda, a variabilidade entre esses valores e a sua medida de posição, recorremos às medidas de dispersão ou de variabilidade. 5.1. AMPLITUDE TOTAL A amplitude total é a diferença entre a maior e o menor valor observado. AT= X (máx) – X (min). Por exemplo, para os valores 40,45,48,52,54,62,70, temos: AT= 70 – 40 = 30. Quando dizemos que a amplitude total dos valores é 30, estamos afirmando alguma coisa do seu grau de concentração. É evidente que, quanto maior a amplitude total, maior a dispersão o variabilidade dos valores da variável. Relativamente sobre os três conjuntos de valores mencionados anteriormente em X, Y e Z, temos as amplitudes totais. ATx = 70 – 70 = 0, dispersão nula.; ATy = 72 – 68 = 4 ATZ = 160 – 5 = 155 5.2 - AMPLITUDE TOTAL COM INTERVALOS DE CLASSES Neste caso, a amplitude total é a diferença entre o limite superior da última classe e o limite inferior da primeira classe. AT = L (máx) – ℓ (min). Considerando a distribuição abaixo: Estaturas (cm) fi Temos: AT = 190 – 150 = 40. Logo, AT = 40 cm. 150 ⊢ 158 5 158 ⊢ 166 12 166 ⊢ 174 18 174 ⊢ 182 27 182 ⊢ 190 8 70 A amplitude total tem o inconveniente de só levar em conta os dois valores extremos das séries, descuidando do conjunto de valores intermediários, o que quase sempre invalida a idoneidade do resultado. Torna-se, portanto, apenas uma indicação da dispersão ou variabilidade. Faz-se uso da amplitude total quando se quer determinar a amplitude da temperatura de um dia ou no ano, no controle de qualidade como uma medida de cálculo rápido ou quando a compreensão popular é mais importante que a exatidão e a estabilidade. Exemplo: Uma empresa contrata profissionais de uma agência terceirizada, para o cargo de agente administrativo. No entanto, seleciona internamente os funcionários indicados através de uma bateria de 14 testes. Dessa forma 4 candidatos foram selecionados e passarão à fase final dos testes com as seguintes pontuações. Candidato A: 20,35,15,30 Candidato B: 20,35,20,25 Candidato C: 25,25,25,25 Candidato D: 10,40,35,15 Destes candidatos somente dois farão a entrevista e concorrerá a vaga final. Quais os dois selecionados? Observamos que todos possuem a mesma pontuação, 100 pontos e a mesma média aritmética (25 pontos). Para desfazer este critério de empate, calculamos a amplitude total o que nos leva a observar o desempenho mais homogêneo nos testes. AT(a)= 35-15=20 AT(b)= 35-20=15 AT(c)= 25-25=0 AT(d)= 40-10=30 Como os candidatos B e C tiveram menor dispersão, ou seja, maior regularidade em relação a média estes estão classificados para a fase final. 5.3 - CÁLCULO DO DESVIO MÉDIO SIMPLES 1º Caso – Dados Brutos Calculamos inicialmente a média da seqüência. Em seguida identificamos a distância de cada elemento da seqüência para sua média. Finalmente, calculamos a média destas distâncias. Se a seqüência for representada por x: x1, x2,..., xn, então o DMS admite como fórmula de cálculo: ix x DMS n Exemplo: Calcule o DMS para a seqüência X: 2, 8, 5, 6. Solução: Determinamos inicialmente a média da série: 2 8 5 6 5,25 4 ix x n em seguida determinamos as distâncias de cada elemento da série para a média da série: 1 2 5,25 3,25x x 2 8 5,25 2,75x x 3 5 5,250,25x x 4 6 5,25 0,75x x O DMS é a média aritmética simples destes valores. 3,25 2,75 0,25 0,75 7 1,75 4 4 DMS Interpretação: Em média, cada elemento da seqüência está afastado do valor 5,25 por 1,75 unidades. 2º Caso – Variável Discreta No caso da apresentação de uma variável discreta, lembramos que a freqüência simples de cada elemento representa o número de vezes que este valor figura na série. Conseqüentemente, 15 haverá repetições de distâncias iguais de cada elemento distinto da série para a média da série. Assim, a média indicada para estas distância é uma aritmética ponderada. A fórmula para o cálculo do DMS é: .ix x fi DMS fi Exemplo: Determine o DMS para a série: xi 1 3 4 5 fi 2 5 2 1 Solução: O número de elementos da série é n = 10n fi A média da série é: .fi xi x fi Usaremos a disposição da tabela, acrescentando novas colunas para a resolução dos cálculos. Xi fi fi.xi 1 2 2 3 5 15 4 2 8 5 1 5 10 . 30fi fi xi A média da série é dada por: .fi xi x fi = 30 3 10 O DMS é dado por: .ix x fi DMS fi conforme a tabela: Xi fi fi.xi .ix x fi 1 2 2 4 3 5 15 0 4 2 8 2 5 1 5 2 10 . 30fi fi xi .ix x fi O desvio médio simples é: .ix x fi DMS fi = 8 0,8 10 Interpretação: Em média, cada elemento da série está afastado de valor 3 por 0,8 unidade. 3º Caso – Variável Contínua (Distribuição de Freqüências) Nesta situação, por desconhecer os valores individuais dos elementos componentes da série, substituiremos estes valores (xi) pelos pontos médios de classe. Desta forma, o desvio médio simples tem por cálculo a fórmula: .ix x fi DMS fi onde xi é o ponto médio da classe i. Exemplo: Veja o cálculo do desvio médio para a seguinte série: 16 1º) Cálculo da média: .fi xi x fi = 102 5,1 20 x 2º) Cálculo dos desvios: 1 3 5,1 2,1x x 2 5 5,1 0,1x x 3 7 5,1 1,9x x 4 9 5,1 3,9x x 3º) Cálculo do desvio médio: .ix x fi DMS fi = 23 1,15 20 unidadees Classes Intervalos fi xi fi.xi .ix x fi 1 2 ⊢ 4 5 3 15 10,50 2 4 ⊢ 6 10 5 50 1,00 3 6 ⊢ 8 4 7 28 7,60 4 8 ⊢ 10 1 9 9 3,90 20 . 102fi fi xi . 23ix x fi Interpretação: Em média, cada elemento da série está afastado de 5,1 por 1,15 unidades. Comentário: O desvio médio simples depende de cada componente da série. Se mudarmos o valor de um único elemento da série, mudamos também o DMS. Portanto, o desvio médio simples tem perfeita sensibilidade estatística. A maior dificuldade desta medida é envolver módulos, cujas propriedades, em geral não são suficientemente conhecidas, por quem normalmente desenvolve estes cálculos. 6.0 – VARIÂNCIA E DESVIO PADRÃO Observamos no item anterior que a dificuldade em se operar com o DMS se deve à presença do módulo, para que as diferenças ix x possam ser interpretadas como distâncias. Outra forma de se conseguir que as diferenças ix x se tornem sempre positivas ou nulas é considerar o quadrado destas diferenças, isto é: 2( )ix x Se substituirmos, nas fórmulas do DMS a expressão ix x por 2( )ix x , obteremos nova medida de dispersão chamada variância. Portanto, variância é uma média aritmética calculada a partir dos quadrados dos desvios obtidos entre os elementos da série e a sua média. “O desvio padrão é a raiz quadrada positiva da variância”. Em particular, para estas medidas levaremos em consideração o fato de a seqüência de dados representarem toda uma população ou apenas uma amostra do universo. Obs: Usa-se o módulo para interpretar o desvio como distância em relação à média. 17 Notações: Quando a seqüência de dados representa uma População a variância será denotada por 2 ( )x e o desvio padrão correspondente por ( )x . Quando a seqüência de dados representa uma amostra, a variância será denotada por 2 ( )s x e o desvio padrão correspondente por ( )s x . 6.1 - CÁLCULO DA VARIÂNCIA E DESVIO PADRÃO 1º Caso – VARIÁVEL DISCRETA Exemplo: Calcule a variância e o desvio padrão da seqüência: X: 4, 5, 8, 5. a) Se a seqüência representa uma população, a variância é calculada pela fórmula: 2 2 ( )( ) i x x x n Temos a seqüência com 4 elementos, cuja média é: 4 5 8 5 22 5,5 4 4 ixx n Calculamos então os quadrados das diferenças: 2 2 1( ) (4 5,5) 2,25x x 2 2 1( ) (5 5,5) 0,25x x 2 2 1( ) (8 5,5) 6,25x x 2 2 1( ) (5 5,5) 0,25x x - Somando-se estes valores obtém-se: 2 1( ) 9x x - Substituindo esses valores na fórmula da variância, teremos: 2 2 ( ) 9( ) 2,25 4 ix xx n Como o desvio padrão é a raiz quadrada positiva da variância, temos: 2( ) ( ) 2,25 1,5 .x x unidades b) Se a seqüência anterior representasse apenas uma amostra, basta trocar na fórmula o “n” por “n -1 “ e a variância bem como o desvio padrão serão dados por: 2 2 2( )( ) ( ) ( ) 1 ix xs x e s x s x n Note que a única diferença entre a fórmula de 2 ( )x indicado para populações e 2 ( )s x indicado para amostras é o denominador. Assim, 2 2 ( ) 9( ) 3 3 ix xs x n e o desvio padrão ( ) 3 1,73s x . 2º Caso – VARIÁVEL CONTÍNUA (D.F) Como há repetições de elementos na série, definimos a variância como sendo uma média aritmética ponderada dos quadrados dos desvios dos elementos da série para a média da série. a) Se a variável discreta é representativa de uma População, então a variância é dada por: 2 2 ( ) .( ) i x x fi x fi E o desvio padrão é dado por: 2( ) ( )x x . Observação: Para o Cálculo da “amostra” basta substituir 1fi por f 18 Exemplo 1: Calcule a variância e o desvio padrão da série abaixo. i Interv. fi 1 0 ⊢ 4 1 2 4 ⊢ 8 3 3 8 ⊢ 12 5 812 ⊢16 1 1º) Verificamos que 10 . 84ifi e que fi x então a média será dada conforme a tabela abaixo: Classes Intervalos fi xi fi.xi 2( ) .ix x fi 1 0 ⊢ 4 1 2 2 40,96 2 4 ⊢ 8 3 6 18 17,28 3 8 ⊢ 12 5 10 50 12,80 4 12 ⊢ 16 1 14 14 31,36 10 . 84fi fi xi 2 . 102, 4ix x fi Cálculo da média: . 84 8,4 10 fi xi x fi . 2º) Cálculo dos desvios: 2 2 1( ) (2 8,4) . 40,96x x fi 2 2 1( ) (6 8,4) . 17,28x x fi 2 2 1( ) (10 8,4) . 12,80x x fi 2 2 1( ) (14 8,4) . 31,36x x fi 3º) Cálculo da variância: 2 2 ( ) .( ) i x x fi x fi 102,4 10,24 10 e o desvio padrão: 2( ) ( ) 10,24 3,2x x . Comentários: 1. No cálculo da variância, quando elevamos ao quadrado a diferença 1( )x x , a unidade de medida da série fica também elevada ao quadrado. Portanto, a variância é dada sempre no quadrado da unidade de medida da série. Se os dados são expressos em metros, a variância é expressa em metro quadrados. Em algumas situações, a unidade de medida da variância nem faz sentido. É o caso, por exemplo, em que os dados são expressos em litros então, a variância seria expressa em litros quadrados. 19 2. Exatamente para suprir esta deficiência da variância é que se define o desvio padrão. Como o desvio padrão é a raiz quadrada positiva da variância, o desvio padrão terá sempre a mesma unidade de medida da série e, portanto admite interpretação. 6.2 - Interpretação do Desvio Padrão O desvio padrão é, sem dúvida, a mais importante das medidas de dispersão. É fundamental que o interessado consiga relacionar o valor obtido do desvio padrão com os dados da série. Quando uma curva de freqüência representativa da série é perfeitamente simétrica como a curva abaixo, podemos afirmar que o intervalo ,x x contém aproximadamente 68% dos valores da série. σ σ 2 2x x x O intervalo 2 , 2x x contém aproximadamente 95% dos valores da série. σ σ σ σ 2 2x x x O intervalo 3 , 3x x contém aproximadamente 99% dos valores da série. σ σ σ σ σ σ 3 3x x x Estes percentuais 68%, 95% e 99% que citamos na interpretação poderão mais tarde ser comprovados, com maios precisão, no estudo da distribuição normal de probabilidades. Para uma compreensão inicial do desvio padrão, estas noções são suficientes. Quando a distribuição não é perfeitamente simétrica estes percentuais apresentam pequenas variações para mais ou para menos, segundo o caso ou problema em estudo. Se considerarmos como exemplo para uma variável em estudo, uma série apresenta média 100x e desvio padrão ( ) 5x , interpretamos estes valores da seguinte forma: 20 1. Os valores da série em estudo estão concentrados em torno de 100. 2. O intervalo 95,105 contém aproximadamente, 68% dos valores da série. 3. O intervalo 90,110 contém aproximadamente 95% dos valores da série. 4. O intervalo 85,115 contém aproximadamente 99% dos valores da série. É importante perceber que, ao aumentar o tamanho do intervalo, aumenta-se o percentual de elementos contido no intervalo. Adiante verificaremos que é possível controlar o tamanho do intervalo de modo que contenha exatamente o percentual que queremos. 5. As medidas de dispersão vistas até agora são medidas absolutas e, portanto, avaliam a dispersão absoluta da série. Todas elas são diretamente proporcionais à dispersão absoluta. Assim, se a série X apresenta 20 ( ) 3x e x e se a série Y apresenta 22 ( ) 2y e y , podemos afirmar, comparando os desvios padrão, que a série X apresenta maior dispersão absoluta. 6. Para considerações ainda mais precisas temos o Teorema de Tchebycheff : Para qualquer distribuição amostral com média ( x ) e desvio padrão ( ) tem-se: O Intervalo 2x contém, no mínimo, 75% de todas as observações amostrais. O intervalo 3x contém, no mínimo, 89% de todas as observações amostrais. Exemplo: Uma empresa de RH que recruta e seleciona pessoas para trabalhar em vários cargos, apresentou conforme a tabela, as idades de 50 candidatos que pleiteiam as vagas. Vamos analisar a variabilidade distribuição através do desvio padrão. Cálculo da Média: . 1922 38,44 50 fi xi x fi . Pesos(kg) fi xi fi.xi 2( ) .ix x fi 18 ⊢ 25 6 21,5 129 1721,78 25 ⊢ 32 10 28,5 285 988,04 32 ⊢ 39 13 35,5 461,5 112,37 39 ⊢ 46 8 42,5 340 131,87 46 ⊢ 53 6 49,5 297 733,94 53 ⊢ 60 5 56,5 282,5 1630,82 60 ⊢ 67 2 63,5 127 1256,01 50 1922 6574,83 21 2 2 1( ) (21,5 38,44) .6 1721,78x x 2 2 1( ) (28,5 38,44) .10 988,04x x 2 2 1( ) (35,5 38,44) .13 112,37x x 2 2 1( ) (42,5 38,44) .8 131,87x x 2 2 ( ) .( ) 1 ix x fix fi = 6574,83 134,18 49 (Variância). 2 2 1( ) (49,5 38,44) .6 733,94x x 2( ) ( ) 134,18 11,58x x anos ( Desvio Padrão). 2 2 1( ) (56,5 38,44) .5 1630,82x x 2 2 1( ) (63,5 38,44) .2 1256,01x x Após o cálculo do desvio médio, temos: Considerando o intervalo , : 38,44 11,58 26,86 ; 61,60x temos x concluímos que, entre 27 e 50 anos temos aproximadamente 66% das observações (idades) isto é, o intervalo compreendido entre a média e o desvio padrão para mais ou para menos. Se aplicarmos o Teorema de Tchebycheff, para o intervalo de 2x observaremos que no mínimo 75% das observações estarão incluídas neste caso. Podemos dizer também que a distribuição possui assimetria elevada. Temos: ( ) ( ) 100x x CV x x = 11,58 0,32 100 32%. 38, 44 CV x ou Esta confirmação em torno da assimetria será melhor justificada a seguir. 7.0 – MEDIDAS DE DISPERSÃO RELATIVA Se uma série X apresenta 10 ( ) 2x e x e uma série Y apresenta 100 ( ) 5y e y , do ponto de vista da dispersão absoluta, a serie Y apresenta maior dispersão que a série X. No entanto, se levarmosem consideração as médias das séries, o desvio padrão de Y que é 5em relação a 100 é um valor menos significativo que o desvio padrão de X que é 2 em relação 10. Isto nos leva a definir as medidas de dispersão relativas: coeficiente de variação e variância relativa. O coeficiente de variação de uma série X é indicado por: CV(x) definido por: ( ) ( ) 100x x CV x x ( Coeficiente de Variação de Pearson) A variância relativa de uma série X é indicada por V(x) é definida por: 2 ( ) 2 ( ) x x V x Note que o coeficiente de variação, como é uma divisão de elementos de mesma unidade, é um número puro. Portanto, pode ser expresso em percentual. Este fato justifica a utilização do denominador 2 x na definição de V(x). Deste modo, se calcularmos o coeficiente de variação da série X citada acima temos: ( ) 2 0,2 100 20%. 10 xCV x ou Da mesma forma calculando o coeficiente da série Y temos, ( ) 5 0,05 100 5%. 100 yCV x ou 22 Comparando os valores destes dois coeficientes concluímos que a série X admite maior dispersão relativa. Como a medida de dispersão relativa leva em consideração a medida de dispersão absoluta e a média da série, é uma medida mais completa que a medida de dispersão absoluta. Portanto, a medida de dispersão relativa prevalece sobre a medida de dispersão absoluta. “ Podemos afirmar que a série possui a maior dispersão relativa, tem de modo geral a maior dispersão ”. Concluindo o exemplo anterior podemos dizer que: A série Y apresenta maior dispersão absoluta. A série X apresenta maior dispersão relativa. Portanto, a série X apresenta maior dispersão. Há algumas regras empíricas para interpretação do coeficiente de variação: Se o C.V < 15% há baixa dispersão; Se o 15% ≤ C.V ≤ 30% há média dispersão; Se o C.V ≥ 30% há elevada dispersão; Exemplo: Em uma empresa, o salário médio dos homens é de R$4000,00, com desvio padrão de R$1500,00, e o salário das mulheres é de R$3000,00 com desvio padrão de R$1200,00. Comente sobre a dispersão relativa entre os salários masculinos e femininos. Solução: Homens: ( ) ( )4000 1500h hX e Mulheres: ( ) ( )3000 1200m mX e Calculando o C.V. para os casos temos: ( ) 1500 100 37,5% 4000 hCV x ( ) 1200 100 40% 3000 hCV x Nestas condições, podemos dizer que o os salários das mulheres têm dispersão relativa maior que os salários dos homens. As duas distribuições apresentam elevada dispersão, pois o C.V≥30%. 8.0 - MEDIDAS DE ASSIMETRIA E CURTOSE Para conceituar assimetria, obviamente precisamos conceituar simetria. Diremos que uma distribuição é simétrica quando X = Md = Mo. Se isto de fato ocorrer, a curva de freqüência tem a seguinte característica gráfica: 23 Se uma distribuição não for simétrica, será classificada como assimétrica. Existem duas alternativas para uma distribuição assimétrica: No caso (a) A distribuição é classificada de assimétrica positiva. No caso (b) A distribuição é classificada de assimétrica negativa. 8.1 - MEDIDAS DE ASSIMETRIA A assimetria é o grau de afastamento, de uma distribuição, da unidade de simetria. Para tal, consideramos o seguinte coeficiente. De posse da média e da moda, temos: 0Mox ; assimetria nula ou distribuição simétrica; 0Mox ; assimetria negativa ou à esquerda; 0Mox ; assimetria positiva ou à direita. Como as medidas anteriores apresentam caráter absoluto, podem apresentar a mesma deficiência do desvio padrão, não permitindo a comparação entre as medidas de duas distribuições. Por este motivo, estabelecemos o coeficiente de Pearson. 8.2 - (1º Coeficiente de Pearson) S Mdx As )(3 Se 0sA então a distribuição é simétrica. Se 0sA então a distribuição é assimétrica negativa. Se 0sA então a distribuição é assimétrica positiva. Ainda sobre assimetria podemos considerar: assimetria moderada se 115,0 As e assimetria forte se 1As . EXEMPLO: Classifique, quanto à assimetria, a distribuição abaixo, usando também o coeficiente de Pearson. 24 Pesos (Kg) fi Temos: kgx 9,12 ; Md=13,5 ; Mo=16Kg; S=4,20kg 2 ⊢ 6 6 Logo a distribuição é: kgMox 1,3169,12 assimétrica negativa. 6 ⊢ 10 12 10 ⊢ 14 24 14 ⊢ 18 30 18 ⊢ 22 6 78 Pelo coeficiente de assimetria, temos: As = 3.(12,9 -13,5) : 4,20 = - 0,429 ⇒assimetria negativa. 8.3 - (2º Coeficiente de Pearson) A assimetria pode também ser classificada por este coeficiente. Se 0sA então a distribuição é simétrica. Se 0sA então a distribuição é assimétrica negativa Se 0sA então a distribuição é assimétrica positiva. EXEMPLO: Classifique, quanto à assimetria, a distribuição abaixo considerando as classes de salários e as freqüências a quantidade de colaboradores da empresa. Classes fi xi fi.xi fi.xi2 fi:h fac 30⊢50 80 40 3200 128000 80:20 =4 80 50⊢100 50 75 3750 281250 50:50 =1 130 100⊢150 30 125 3750 468750 30:50 =0,6 160 ∑ 160 10700 878000 875,66 160 10700 x ; 429,4120. 34 )4( 30 Mo ; 96,3162,1021 160 )10700( 878000 159 1 22 SS ; 4020. 80 )040( 301 Q ; 9050. 50 )80120( 503 Q ; 5020. 80 )080( 30 Md Temos: .796,0 96,31 29,41875,66 S MoX As Como a As>0, a distribuição é assimétrica positiva. 25 Calculando pelo 2º coeficiente de Pearson, obteremos: As=0,6. De qualquer forma, o valor é positivo e a curva assimétrica positiva. 9.0 – Medidas de Curtose A medida de curtose determina o grau de achatamento da curava de uma distribuição de freqüências em relação à distribuição padrão denominada curva normal. Observando a concentração dos valores de uma série em torno de sua moda, há três situações especiais. 1º caso - Os dados estão fortemente concentrados em torno da moda, o que faria a curva de freqüência ser bastante afilada, como na figura: 2º caso - Os dados estão razoavelmente concentrados em torno da moda, o que faria a curva de freqüência ser razoavelmente afilada, como na figura: 3º caso - Os dados estão fracamente concentrados em torno da moda, o que faria a curva de freqüência ser fracamente afilada, como na figura: A medida de curtose procura classificar estes tipos de curvas com respeito ao afilamento ou achatamento de sua área central. Para isto, padroniza-se a curva do 2º caso. Este tipo de curva é classificada como mesocúrtica. A curva do 1º caso, bastante afilada em sua área central, é denominada leptocúrtica, e a curva do 3º caso, bastante achatada em sua área central, é denominada platicúrtica. 26 Para classificar uma distribuição quanto a sua curtose, podemos utilizar o coeficiente de curtose dado por: )(2 1090 13 PP QQ K Se K = 0,263 a curva da distribuição é mesocúrtica. Se k > 0,263 a curva da distribuição é platicurtica. Se K < 0,263 a curva da distribuição é leptocúrtica. Nota: “A medida de curtose tem a finalidade de complementar a caracterizaçãoda distribuição”. EXEMPLO: 1) Classifique, quanto ao grau de curtose a distribuição abaixo. Classes Fi 3 ⊢8 8 ⊢13 13 ⊢18 18 ⊢23 5 15 20 10 5,10 15 5).55,12( 81 Q ; ;38,17 20 5).205,37( 133 Q ;8 5 5).05( 310 P ;5,20 10 5).4045( 1890 P Logo, )(2 1090 13 PP QQ K ⇒ 27,0 )85,20(2 5,1038,17 K . Portanto, K>0,263 portanto, a curva é suavemente platicúrtica. EXERCÍCIOS 1) Classifique quanto à assimetria ao grau de curtose, a distribuição abaixo (amostra), segundo o coeficiente de Pearson. Xi Fi 2 3 4 5 6 7 8 2 4 6 10 6 4 2 27 2) Considere a seguinte distribuição de freqüência a seguir em relação à população e classifique-a quanto à assimetria e ao grau de curtose, segundo o coeficiente de Pearson. Classes Fi 0⊢ 4 4⊢ 8 8⊢12 12⊢16 16⊢20 10 15 6 2 1 3) Classifique, quanto à assimetria e ao grau de curtose, a seguinte distribuição de freqüência. Classes Fi 3⊢ 5 5⊢ 7 7⊢ 9 9⊢11 11⊢13 14 16 18 19 17 4) Considere a seguinte distribuição de freqüência da massa corporal dos colaboradores de uma empresa de calçados. Os dados foram obtidos em uma amostra de 45 pessoas por ocasião de um exame médico na semana da CIPA. Pesos (Kg) Funcionários 40 ⊢ 45 04 45 ⊢ 50 10 50 ⊢ 55 15 55 ⊢ 60 08 60 ⊢ 65 05 65 ⊢ 70 03 = a) Determine a média de peso dos funcionários. b) Qual a variância entre o peso dos funcionários? Qual o coeficiente de variação? c) A distribuição é simétrica? d) Qual o grau de achatamento da curva da distribuição? 5. Uma fábrica de laticínios do ABC paulista, possui vários tipos de produtos que são comercializados. As notas de compra destes produtos são repassadas semanalmente aos representantes comerciais da empresa. O encarregado do setor financeiro fez a contagem das notas para lançamento no sistema e constatou os seguintes valores. 28 Valores (R$) Quant. notas 0 ⊢ 100 20 100 ⊢ 200 35 200 ⊢ 300 18 300 ⊢ 400 40 400 ⊢ 500 12 500 ⊢ 600 30 = a) Determine a medida de tendência central mais adequada para a análise das notas de compra, e calcule o valor desta medida? b) Calcule o 3º decil e o percentil 80 e interprete seus resultados? c) Qual o desvio padrão para esta distribuição? d) Qual o coeficiente de variação desta distribuição? e) Qual o coeficiente de assimetria? f) Verifique se a distribuição é simétrica? g) Classifique esta distribuição quanto ao grau de curtose. EXERCÍCIOS COMPLEMENTARES 1. Calcule a amplitude total do conjunto de dados: 1, 3, 5, 9 -10, -6, 2, 3, 7, 9, 10 17,9 ; 22,5; 13,3; 16,8; 15,4; 14,2 2. Calcule os desvios padrões dos conjuntos de dados do exercício 1. 3. Sabendo que um conjunto de dados apresenta para média aritmética e para desvio padrão respectivamente: 18,3 e 1,47, calcule o coeficiente de variação. 4. Em um exame final de matemática, o grau médio de um grupo de 150 alunos foi 7,8 e o desvio padrão, 0,80. Em estatística, no entanto, o grau médio final foi de 7,3 e o desvio padrão 0,76,. Em que disciplina foi maior a dispersão? 5. Medidas as estaturas de 1017 indivíduos, foram obtidos: média aritmética 162,2 cm e s = 8,01 cm. O peso médio desses mesmos indivíduos e 52 kg, com um desvio padrão de 2,3 kg. Esses indivíduos apresentam maior variabilidade em estatura ou em peso? 6. Um grupo de 85 mulheres tem estatura média de 160,6 cm, com um desvio padrão de 5,97 cm. Outro grupo de 125 mulheres tem uma estatura média de 161,9 cm, sendo o desvio padrão igual a 6,01 cm. Qual é o coeficiente de variação de cada um dos grupos? Qual o grupo mais homogêneo? 7. Um grupo de 100 estudantes tem uma estatura média de 163,8 cm, com um coeficiente de variação de 3,3%. Qual o desvio padrão desse grupo? 29 8. Responda justificando em cada caso, para os conjuntos de dados: a) Qual série apresenta maior dispersão absoluta? b) Qual das séries apresenta maior dispersão relativa? c) Qual das séries apresenta maior dispersão? Série A: 20 ( ) 2x e x e Série B: 20 ( ) 5x e x Série A: 50 ( ) 2x e x e Série B: 100 ( ) 3x e x Série A: 220 ( ) 9x e x e Série B: 230 ( ) 16x e x Série A: 220 ( ) 9x e x e Série B: 40 ( ) 3x e x REFERÊNCIAS BIBLIOGRÁFICAS CRESPO, Antônio Arnot. Estatística Fácil. São Paulo: Saraiva, 2002. FIGUEIRA, Sebastião de Paula. at all. Estatística Básica. Senac Nacional: Rio de Janeiro,1998. FONSECA, Jairo Simon da & MARTINS, Gilberto de A. Curso de Estatística. São Paulo: Atlas,1996. MARTINS, Gilberto de Andrade. Estatística Geral e Aplicada. São Paulo: Atlas, 2005. SILVA, Ermes Medeiros da. at all. Estatística para cursos de: Economia, Administração e Ciências Contábeis. São Paulo: Atlas, 2006. SMAILES, Joanne & MCGRANE, Angela. Estatística Aplicada a Administração com Excel. São Paulo: Atlas, 2002. TOLEDO, G. L. e OVALLE, I. I. - Estatística Básica. 2ª ed. São Paulo. Editora Atlas, 2008.
Compartilhar