Baixe o app para aproveitar ainda mais
Prévia do material em texto
39 ESTATÍSTICA Re vi sã o: A na M ar so n - Di ag ra m aç ão : M ár ci o - 19 /1 1/ 09 / / 2ª R ev is ão : A na M ar so n - Co rr eç ão : M ár ci o - 27 /1 1/ 09 Unidade II 5 10 15 20 25 3 MEDIDAS OU PARÂMETROS ESTATÍSTICOS O estudo que fizemos anteriormente diz respeito ao agrupamento de dados coletados e à representação gráfica de alguns deles. Cumpre agora estudarmos as medidas estatísticas. Esses valores nos darão a imagem sintetizada do comportamento de uma amostra, permitindo que com relativamente poucas informações possamos chegar a conclusões sobre esta amostra estudada. Existem basicamente dois grandes grupos de medidas estatísticas. O primeiro grupo é formado pelas medidas de tendência central, também chamadas de medidas de posição, que informam a magnitude da amostra estudada. Essas medidas nos dão uma visão global da amostra sem se ater às características individuais de seus elementos. No entanto, como é necessário que tenhamos ideia das variações dos elementos da amostra em torno de suas medidas centrais, iremos estudar, no módulo 2, o segundo grupo de medidas estatísticas: as medidas de dispersão, também chamadas de medidas de variabilidade. Medidas de posição Objetivos do módulo As medidas de posição ou medidas de tendência central, como o próprio nome indica, preocupam-se com definir uma posição central da amostra, ou seja, um valor que seja representativo do que é típico da amostra. Iremos trabalhar com as três principais medidas deste tipo: a média, a mediana e a moda. 40 Unidade II Re vi sã o: A na M ar so n - Di ag ra m aç ão : M ár ci o - 19 /1 1/ 09 / / 2ª R ev is ão : A na M ar so n - Co rr eç ão : M ár ci o - 27 /1 1/ 09 3.1 Média De todas as medidas de posição, a média é, seguramente, a mais usada. São chamadas de médias simples quando a frequência dos diversos valores é igual a 1, ou seja, cada valor aparece uma única vez na amostra, ou de médias ponderadas, quando os dados são dotados de certa frequência. Existem vários métodos diferentes para se calcular as médias. Iremos nos preocupar com a principal delas, a média aritmética. As demais (geométrica, quadrática e harmônica), além de serem muito menos utilizadas, seguem os mesmos princípios da média aritmética, apenas com a utilização de operações matemáticas diferentes. A média aritmética é o resultado da soma dos valores de todos os elementos dividido pelo número total de elementos, ou seja, pela frequência total. Em outras palavras, se tivermos um conjunto de valores S ={ x1, x2, x3,………xn}, a média aritmética deste conjunto será calculada através das fórmulas: X x x x x N n= + + + +1 2 3 .... Ou X x N i= Σ Onde: X é a média aritmética; x1, x2, etc. os diversos valores; e N, a quantidade total de elementos da amostra. Exemplo 1 Calcular a média aritmética dos valores abaixo relacionados: S={2;5;7;9;10;12;16;18}. Observe que são 8 elementos de diferentes valores, portanto: X x N X Xi= ⇒ = + + + + + + + ⇒ =Σ 2 5 7 9 10 12 16 18 8 9 9, 5 10 15 20 25 41 ESTATÍSTICA Re vi sã o: A na M ar so n - Di ag ra m aç ão : M ár ci o - 19 /1 1/ 09 / / 2ª R ev is ão : A na M ar so n - Co rr eç ão : M ár ci o - 27 /1 1/ 09 Caso os valores sejam repetidos na amostra, ou seja, se eles tiverem uma frequência diferente de 1 ( x1 com f1; x2 com f2 e assim por diante), então a fórmula para o cálculo da média aritmética será: X x f f i i i = Σ Σ Este último conceito define a média ponderada, sendo que, eventualmente, as frequências podem ser substituídas por “pesos” que conferem a importância diferenciada de cada valor. O exemplo a seguir mostra o cálculo para dados não agrupados em classe. Exemplo 2 Calcular a média aritmética dos valores abaixo relacionados: Como no exemplo anterior, o cálculo da média aritmética consiste na soma de todos os valores dividida pela quantidade total de elementos. Note, porém, que cada um dos valores da tabela aparece certo número de vezes, diferente de 1; por exemplo, o valor 25 aparece 37 vezes, portanto, precisamos somar 25 com ele mesmo 37 vezes ou, de maneira mais direta, precisamos multiplicar 25 por 37. A coluna C mostra todos os cálculos deste tipo. Quando somamos essa coluna, obtemos o valor 9.491, que corresponde à soma de todos os elementos da amostra (193 elementos). Assim, a média é: A B C=AxB Valor Frequência Simples Valor x Frequência xi fi xi.fi 25 37 925 42 28 1176 57 54 3078 62 62 3844 39 12 468 ft 193 9491 X x f f X Xi i i = ⇒ = ⇒ =Σ Σ 9491 193 49 2, 5 10 15 20 42 Unidade II Re vi sã o: A na M ar so n - Di ag ra m aç ão : M ár ci o - 19 /1 1/ 09 / / 2ª R ev is ão : A na M ar so n - Co rr eç ão : M ár ci o - 27 /1 1/ 09 No caso de dados agrupados em classes, o processo de cálculo é idêntico ao anterior, com a diferença de que o valor a ser usado é o ponto médio de classe (lembre que já definimos esse valor no módulo anterior): xi=pmi O exemplo a seguir mostra-nos, passo a passo, o cálculo da média aritmética ponderada para dados agrupados por classes: Exemplo 3 Dada a tabela de frequências abaixo, calcular a média aritmética: A B C D E=(C+D)/2 F=DxE Classe Limites de classe Frequência simples Ponto médio de classe Frequência x Ponto médio li ls fi pmi fi x pmi 1,0 3,0 |------- 414,0 14 208,5 2.919,0 2,0 414,0 |------- 825,0 19 619,5 11.770,5 3,0 825,0 |------- 1.236,0 41 1.030,5 42.250,5 4,0 1.236,0 |------- 1.647,0 53 1.441,5 76.399,5 5,0 1.647,0 |------- 2.058,0 32 1.852,5 59.280,0 6,0 2.058,0 |------- 2.469,0 27 2.263,5 61.114,5 7,0 2.469,0 |------- 2.880,0 20 2.674,5 53.490,0 8,0 2.880,0 |------- 3.291,0 11 3.085,5 33.940,5 9,0 3.291,0 |------| 3.702,0 8 3.496,5 27.972,0 ft = 225 Σ = 369.136,5 A tabela acima apresenta os valores e cálculos necessários para se determinar a média aritmética para uma amostra que estivermos descrevendo. As áreas sombreadas da tabela mostram os cálculos necessários para a obtenção da média aritmética. 5 10 15 43 ESTATÍSTICA Re vi sã o: A na M ar so n - Di ag ra m aç ão : M ár ci o - 19 /1 1/ 09 / / 2ª R ev is ão : A na M ar so n - Co rr eç ão : M ár ci o - 27 /1 1/ 09 O uso de uma tabela para estes cálculos facilita as operações de cálculo, bem como são mais facilmente trabalhadas em computador. Note que acima nós somamos os valores de todos os elementos da amostra, ficando na seguinte situação: o valor da soma dos 225 elementos da amostra é 369136,5, portanto, a média aritmética será de: X x f f X Xi i i = ⇒ = ⇒ =Σ Σ 369136 5 225 1640 61 , , É importante observar as seguintes propriedades das médias aritméticas: • a soma algébrica dos afastamentos (ou desvios ou resíduos) de um conjunto de números tomados em relação à média é nula; • se multiplicarmos ou dividirmos todas as informações por uma constante, a média aritmética ficará multiplicada ou dividida por essa constante; • somando-se ou subtraindo-se uma constante a todos os valores de um conjunto de informações, a média aritmética ficará somada ou subtraída dessa constante; • a soma dos quadrados dos desviostomados em relação à média aritmética é mínima. 3.2 Mediana Conceitualmente, definimos mediana como o valor, dentro de um conjunto de valores ordenados, que divide exatamente esse conjunto em duas metades, com 50% dos valores superiores à mediana e 50% inferiores. Evidentemente que essa definição precisa se adaptar ao número N de elementos da amostra: • caso N seja um número ímpar, a mediana será o valor do elemento central (chamado de elemento mediano); 5 10 15 20 25 44 Unidade II Re vi sã o: A na M ar so n - Di ag ra m aç ão : M ár ci o - 19 /1 1/ 09 / / 2ª R ev is ão : A na M ar so n - Co rr eç ão : M ár ci o - 27 /1 1/ 09 • caso N seja um número par, a mediana será a média aritmética simples dos dois elementos centrais (o elemento mediano passa a ser um elemento teórico intermediário). Veja no exemplo abaixo: Exemplo 1 Dados os dois conjuntos de notas abaixo, de alunos de estatística, calcule a mediana: Grupo A = {6,2; 4,2; 8,7; 6,4; 2,8; 9,1; 5,0; 3,9; 7,1} Para calcular a mediana, é necessário ordenar os dados em ordem crescente: {2,8; 3,9; 4,2; 5,0; 6,2; 6,4; 7,1; 8,7; 9,1} Como o número de elementos é impar (N = 9), a mediana será o valor do elemento central (o 5º elemento), ou seja, o valor da mediana será 6,2. Poderíamos dar uma roupagem mais matemática ao cálculo utilizando as fórmulas abaixo, onde Eme é o elemento mediano, e Me, a mediana: E N E Eme me me= + => = + => =1 2 9 1 2 5º O valor do 5º elemento é a mediana: Me = 6,2 Grupo B = { 8,4; 6,3; 9,2; 4,9; 6,5; 8,0}, ordenando {4,9; 6,3; 6,5; 8,0; 8,4; 9,2} E N E Eme me me= + => = + => =1 2 6 1 2 3 5, 5 10 15 20 45 ESTATÍSTICA Re vi sã o: A na M ar so n - Di ag ra m aç ão : M ár ci o - 19 /1 1/ 09 / / 2ª R ev is ão : A na M ar so n - Co rr eç ão : M ár ci o - 27 /1 1/ 09 Evidentemente, não existe um elemento 3,5º. A mediana será a média aritmética entre o valor dos 3º e 4º elementos: Me x x Me Me= + => = + => =3 4 2 6 5 8 0 2 7 25 , , , Cálculo semelhante se fará quando trabalhamos com dados agrupados, seja em classes ou não. Primeiro, veremos quando os dados não forem agrupados em classe. Nesse caso, o procedimento é semelhante ao feito no exemplo 1, com a diferença de que precisaremos calcular a frequência acumulada crescente para permitir localizarmos o elemento mediano. O exemplo 2 mostra o cálculo em duas situações diferentes. Exemplo 2 Calcular a mediana para os dados relacionados abaixo, relativos ao número de filhos por família moradora em determinada cidade. Cidade A Número de filhos por família Quantidade de famílias na cidade Frequência acumulada crescente Valor Frequência simples xi fi fac ↓ 0 15 15 1 18 33 2 12 45 3 8 53 4 5 58 5 3 61 6 1 62 Mais do que 6 1 63 Soma 63 5 10 15 46 Unidade II Re vi sã o: A na M ar so n - Di ag ra m aç ão : M ár ci o - 19 /1 1/ 09 / / 2ª R ev is ão : A na M ar so n - Co rr eç ão : M ár ci o - 27 /1 1/ 09 Perceba que o número de elementos (N = 63) é ímpar; logo, o elemento mediano será o 32º: E Eme me= + = =63 1 2 32º O 32º elemento tem o valor 18, isso porque, com os valores ordenados, os 15 primeiros referem-se a famílias com 0 filhos; do 16º ao 33º, os valores referem-se a famílias com 1 filho, e assim por diante. Logo, a mediana será: Me = 18 Portanto, podemos afirmar que 50% das famílias têm um filho ou menos, e 50% das famílias têm um filho ou mais. Observe agora esta outra bservação de frequências relativa á cidade B Cidade B Número de filhos por família Quantidade de famílias na cidade Frequência acumulada crescente Valor Frequência simples xi fi fac ↓ 0 15 15 1 21 36 2 16 52 3 9 61 4 6 67 5 4 71 6 1 72 Mais do que 6 0 72 Soma 72 Perceba que o número de elementos (N = 72) é par; logo, o elemento mediano seria o 36,5º, que, evidentemente, não existe. E Eme me= + = =72 1 2 36 5, 5 10 47 ESTATÍSTICA Re vi sã o: A na M ar so n - Di ag ra m aç ão : M ár ci o - 19 /1 1/ 09 / / 2ª R ev is ão : A na M ar so n - Co rr eç ão : M ár ci o - 27 /1 1/ 09 O 36º elemento tem o valor 1, e o 37º, o valor o valor 2, portanto, o 36,5º seria um valor médio entre esses dois valores, ou seja, a mediana será: E Eme me= + = =1 2 2 15, Portanto, podemos afirmar que 50% das famílias têm menos de 1,5 filho, e 50% das famílias tem mais de 1,5 filho. O cálculo da mediana, quando lidamos com dados agrupados em classes, é mais trabalhoso porque conseguimos determinar o elemento mediano e a classe da qual o elemento faz parte, mas não o valor exato da mediana. A maneira de contornarmos esse inconveniente é utilizando os conceitos de interpolação. Interpolar significa achar, dentro de uma faixa de valores, aquele valor que melhor corresponde às condições estabelecidas. No caso do cálculo da mediana, o processo de interpolação gera a seguinte fórmula, que sempre iremos usar: Me li E f f x hMe me ac ant Me = + − Onde: Me = Mediana liMe= Limite inferior da classe que contém o elemento mediano (classe mediana) Eme = Elemento mediano Fac ant = Frequência acumulada crescente até a classe anterior à classe mediana 5 10 15 20 25 48 Unidade II Re vi sã o: A na M ar so n - Di ag ra m aç ão : M ár ci o - 19 /1 1/ 09 / / 2ª R ev is ão : A na M ar so n - Co rr eç ão : M ár ci o - 27 /1 1/ 09 fMe = Frequência da classe mediana h = Amplitude da classe mediana O exemplo 3, a seguir, demonstra o cálculo da mediana para uma distribuição de vendas em R$ agrupadas por classe. Exemplo 3 Calcular a mediana para a tabela abaixo que apresenta a distribuição de vendas de determinada empresa. Classes número Vendas mensais em R$ Quantidade de meses Frequência acumulada crescenteValor Frequência li ls fi fac↑ 1 R$ 50.000,00 |---- R$ 80.000,00 12 12 2 R$ 80.000,00 |---- R$ 110.000,00 18 30 3 R$ 110.000,00 |---- R$ 140.000,00 27 57 4 R$ 140.000,00 |---- R$ 170.000,00 26 83 5 R$ 170.000,00 |---- R$ 200.000,00 21 104 6 R$ 200.000,00 |---- R$ 230.000,00 18 122 7 R$ 230.000,00 |---- R$ 260.000,00 12 134 8 R$ 260.000,00 |---| R$ 290.000,00 9 143 Total 143 O elemento mediano é dado por: E Eme me= + => =143 1 2 72º O 72º elemento está na 4ª classe, que chamamos de classe mediana, ou seja, a mediana é um valor entre R$ 140.000,00 e R$ 170.000,00. Obteremos o resultado usando a fórmula da interpolação: Me li E f f x h xMe me ac ant Me = + − = + − 140 000 72 57 26 30 000. . ==> =Me 157 307 69. , 5 10 49 ESTATÍSTICA Re vi sã o: A na M ar so n - Di ag ra m aç ão : M ár ci o - 19 /1 1/ 09 / / 2ª R ev is ão : A na M ar so n - Co rr eç ão : M ár ci o - 27 /1 1/ 09 Portanto, podemos afirmar que 50% das vendas mensais dessa empresa estão acima de R$ 157.307,69, e 50%, abaixo deste mesmo valor. 3.3 Moda O conceito de moda é mais simples entre as medidas estatísticas. É simplesmenteo valor que mais vezes se repete numa distribuição de frequências, ou seja, aquele dotado de maior frequência. O cálculo da moda para dados isolados ou para dados não agrupados em classes é imediato, decorre de simples observação, como mostra o exemplo 1; já para dados agrupados necessitados, adotam-se algumas recomendações feitas por estatísticos renomados. No exemplo 2, apresentamos um cálculo deste último tipo de distribuição. Exemplo 1 Calcular a moda para os conjuntos de dados mostrados abaixo, referentes ao consumo de rolamentos (em unidades) em várias linhas de produção. Linha A: {21; 22; 24; 24; 25; 25; 25; 27; 28) A moda, evidentemente, é: Mo=25. Linha B: {8; 8; 9; 9; 9; 9; 10; 11; 11; 11; 11; 12; 12; 12} Neste conjunto, temos duas modas: Mo=9 e Mo=11. Chamamos de amostra multimodal. Linha C: {15; 18; 25; 32; 43; 50; 61} Não existe um valor que se repita mais de uma vez. Temos uma amostra sem moda, ou seja, amodal. 5 10 15 20 25 50 Unidade II Re vi sã o: A na M ar so n - Di ag ra m aç ão : M ár ci o - 19 /1 1/ 09 / / 2ª R ev is ão : A na M ar so n - Co rr eç ão : M ár ci o - 27 /1 1/ 09 Linha D Quantidade de rolamentos consumidos Número de vezes em que ocorreu o consumo xi fi Valor Frequência 8 18 10 25 12 32 13 45 15 28 16 21 17 12 21 8 A moda é o valor de maior frequência, portanto, para a linha D, teríamos Mo=13. Exemplo 2 Calcular a moda para a distribuição de rendas familiares apresentada no quadro abaixo: Classes número Rendas familiares mensais em R$ Quantidade de meses Valor Frequência li ls fi 1 R$ 650,00 |---- R$ 1.100,00 16 2 R$ 1.100,00 |---- R$ 1.550,00 21 3 R$ 1.550,00 |---- R$ 2.000,00 28 4 R$ 2.000,00 |---- R$ 2.450,00 31 5 R$ 2.450,00 |---- R$ 2.900,00 18 6 R$ 2.900,00 |---- R$ 3.350,00 16 7 R$ 3.350,00 |---- R$ 3.800,00 12 Total 142 5 51 ESTATÍSTICA Re vi sã o: A na M ar so n - Di ag ra m aç ão : M ár ci o - 19 /1 1/ 09 / / 2ª R ev is ão : A na M ar so n - Co rr eç ão : M ár ci o - 27 /1 1/ 09 Você pode notar que os valores se repetem mais na classe 4 (a frequência é a maior de todas); logo, a moda deve ser um valor entre R$ 2.000,00 e R4 2.450,00. Mas exatamente qual é o valor da moda? Normalmente, esse cálculo poderá ser feito por três recomendações diferentes: as fórmulas de Czuber, King e Pearson, que utilizaremos a seguir. Recomendação de Czuber Para utilizarmos a recomendação de Czuber, devemos inicialmente localizar a classe que tem maior frequência, a chamada classe modal. No nosso exemplo, essa classe é a de número 4, como já falamos. Em seguida, aplicamos a seguinte fórmula: Mo li f f f f f f x hMo Mo ant Mo ant Mo post = + − − + − ( ) ( ) ( ) Onde: Mo = Moda liMo = Limite inferior da classe modal fMo = Frequência da classe modal fant = Frequência da classe imediatamente anterior à classe modal fpost = Frequência da classe imediatamente posterior à classe modal h = Amplitude da classe modal 5 10 15 20 52 Unidade II Re vi sã o: A na M ar so n - Di ag ra m aç ão : M ár ci o - 19 /1 1/ 09 / / 2ª R ev is ão : A na M ar so n - Co rr eç ão : M ár ci o - 27 /1 1/ 09 No nosso exemplo, ficaria: Mo x Mo R= + −( ) −( ) + −( ) => =2 000 31 28 31 28 31 18 450 2 103 85. $ . , Recomendação de King Para utilizarmos a recomendação de King, devemos inicialmente localizar a classe que tem maior frequência, a chamada classe modal. No nosso exemplo, essa classe é a de número 4, como já falamos. Em seguida, aplicamos a seguinte fórmula: Mo li f f f x hMo post ant post = + + Onde: Mo = Moda liMo = Limite inferior da classe modal fant = Frequência da classe imediatamente anterior à classe modal fpost = Frequência da classe imediatamente posterior à classe modal h = Amplitude da classe modal No nosso exemplo, ficaria: Mo x Mo R= + + => =2 000 18 28 18 450 2 176 09. $ . , 5 10 15 53 ESTATÍSTICA Re vi sã o: A na M ar so n - Di ag ra m aç ão : M ár ci o - 19 /1 1/ 09 / / 2ª R ev is ão : A na M ar so n - Co rr eç ão : M ár ci o - 27 /1 1/ 09 Recomendação de Pearson No caso de Pearson, a recomendação parte de conceito diferente das anteriores. Baseia-se no uso da média e da mediana: Mo=3 x Me – 2 x X Onde: Mo = Moda Me = Mediana X = Média No nosso exemplo, teríamos: Me = R$ 2.094,36 X = R$ 2.123,59 Logo, a moda seria: Mo=3 x 2.094,36 – 2 x 2.123,59 => Mo=R$ 2.035,88 Perceba que cada recomendação resultou em valor diferente. Isso ocorre porque são recomendações que partem de considerações diferentes. A experiência nos ensina qual é a melhor recomendação a se utilizar em cada caso prático. O uso de cada uma das medidas de dispersão depende da situação prática que se apresenta. Adriano Leal Bruni, em sua obra Estatística aplicada à gestão empresarial, apresenta uma série de vantagens e desvantagens de cada uma delas, as quais podem ser resumidas no quadro a seguir: 5 10 15 20 54 Unidade II Re vi sã o: A na M ar so n - Di ag ra m aç ão : M ár ci o - 19 /1 1/ 09 / / 2ª R ev is ão : A na M ar so n - Co rr eç ão : M ár ci o - 27 /1 1/ 09 Medida de posição Vantagens Desvantagens Média É de fácil compreensão, podendo ser calculada diretamente usando-se calculadoras apropriadas. É afetada por valores extremos da série, não representando com precisão a distribuição em que esses valores ocorrem com frequência acentuada. Depende de todos os valores da distribuição, usando todos os dados disponíveis. É necessário conhecer todos os valores da distribuição. Evidencia bastante estabilidade de amostra para amostra. A média não tem, necessariamente, existência real. Possibilita a manipulação de dados, com cálculo de médias combinadas. Pode ser obtida uma média de número fracionário inexistente, por exemplo, 6,7 alunos. Pode ser facilmente incluída em equações matemáticas. Mediana Mesmo que alguns valores da série sejam modificados, ela pode manter-se inalterada. Se for determinada a mediana dos grupos separados, não será encontrada a mediana do grupo. Os valores extremos não interferem no seu resultado; por isso é indicada quando existem valores discrepantes. Mesmo que os valores mais altos ou mais baixos da série não estejam definidos, ela pode ser determinada. Pode ser utilizada para dados que têm a possibilidade de ser ordenados. Moda Caso algum valor da série seja modificado, não necessariamente a moda alterará. A moda tem que ter necessariamente um valor real, já que ela é representada por algum valor da série. Os valores extremos não interferem no seu resultado Quando utilizada para calcular distribuições de classe aberta, não pode ser determinada a moda empregando algum procedimento aritmético elementar. Pode ser calculada em distribuições que possuam classe indeterminada. 55 ESTATÍSTICA Re vi sã o: A na M ar so n - Di ag ra m aç ão :M ár ci o - 19 /1 1/ 09 / / 2ª R ev is ão : A na M ar so n - Co rr eç ão : M ár ci o - 27 /1 1/ 09 4 MEDIDAS DE DISPERSÃO Objetivos As medidas de dispersão completam a informação contida nas medidas de posição, revelando o afastamento ou desvio dos elementos do valor central. Quanto menor for a dispersão de uma amostra, maior será a qualidade da informação contida na medida de posição, ou, em outras palavras, menor a margem de erro que será assumido considerando a medida de posição como representante de toda a amostra. Existem basicamente dois grandes grupos de medidas de dispersão: • medidas de dispersão absolutas: levam em conta a dispersão propriamente dita; • medidas de dispersão relativas: levam em conta simultaneamente uma medida de posição e a medida de dispersão correspondente. São úteis para efetuarmos comparações entre amostras. O objetivo deste capítulo é tomarmos contato com ambos os grupos. 4.1 Medidas de dispersão absolutas 4.1.1 Amplitude total A amplitude total (At) já é nossa conhecida e é a mais elementar das medidas de dispersão. É extremamente fácil de ser calculada, mas de difícil interpretação, em especial quando os dados extremos são muito grandes ou muito pequenos. São mais utilizadas, portanto, quando as distribuições apresentam certa homogeneidade. 5 10 15 20 25 56 Unidade II Re vi sã o: A na M ar so n - Di ag ra m aç ão : M ár ci o - 19 /1 1/ 09 / / 2ª R ev is ão : A na M ar so n - Co rr eç ão : M ár ci o - 27 /1 1/ 09 Por exemplo, suponha que tenhamos as valorizações mensais das ações de duas diferentes empresas A e B, com os seguintes valores (em porcentagem): Empresa A = {21,5; 18,0; 26,3; 32,4; 45,1; 18,6; 37,6}. Empresa B = {15,3; 19,7; 23,9; 16,7; 25,9; 14,6; 18,9; 25,8}. As amplitudes seriam, respectivamente, de 45,1 – 18,0 = 27,1% para as ações da empresa A e de 25,9 – 14,6 = 11,3% para a empresa B. Em outras palavras, as variações máximas seriam de 27,1% para as ações da empresa A e de 11,3% para a empresa B. Logo, o risco de oscilação é maior para a empresa A do que para a empresa B. 4.1.2 Desvio médio É definido como a média aritmética do módulo1 dos desvios dos elementos em relação à média dos mesmos. Entende-se por desvio a diferença entre o valor de um elemento da amostra para a média dessa mesma amostra: di=xi – X Portanto, o desvio médio será dado pela fórmula: dm d N ii n = =∑ 1 O exemplo abaixo deixará mais claro esse processo. Exemplo 1 Calcular o desvio médio da amostra {18; 21; 22; 27; 28; 29; 32; 37}. 1 Define-se módulo ou valor de um número a distância deste número para zero, independentemente do sinal, ou seja, módulo de um número positivo e módulo de um número negativo é o seu simétrico, isto é, o mesmo número positivo. Para efeito do cálculo do desvio médio, consideramos o número sempre positivo, seja qual for seu sinal. 5 10 15 20 57 ESTATÍSTICA Re vi sã o: A na M ar so n - Di ag ra m aç ão : M ár ci o - 19 /1 1/ 09 / / 2ª R ev is ão : A na M ar so n - Co rr eç ão : M ár ci o - 27 /1 1/ 09 O primeiro passo será calcular a média aritmética desses valores e, em seguida, os desvios de cada um dos valores. Depois, somaremos o módulo desses valores dividindo-os pelo número total de elementos da amostra. O quadro abaixo mostra passo a passo esses cálculos: Ordem dos elementos Valores Desvios Módulo dos desvios di=xi – X _ |di=xi – X _ | 1 18 18 - 27 = -9 9 2 21 21 - 27 = -6 6 3 22 22 - 27 = -5 5 4 27 27 - 27 = 0 0 5 28 28 - 27 = 1 1 6 29 29 - 27 = 2 2 7 33 33 - 27 = 6 6 8 38 38 - 27 = 11 11 Soma 216 0 40 Média ( X _ ) 216/8=27 Desvio médio (dm) 40/8 = 5 Observe que a soma dos desvios é zero, o que é evidente. O próprio conceito de média (valor equidistante de todos os elementos da amostra) nos conduz a isso. O conceito de desvio médio só tem sentido quando utilizamos o módulo dos desvios. Para ficar mais claro, veja abaixo os cálculos feitos, utilizando-se das fórmulas informadas: Cálculo da média: X x N X Xi= ⇒ = ⇒ =Σ 216 8 27 Cálculo do desvio médio: dm d N dm dm ii n = => = => ==∑ 1 40 8 5 5 10 15 58 Unidade II Re vi sã o: A na M ar so n - Di ag ra m aç ão : M ár ci o - 19 /1 1/ 09 / / 2ª R ev is ão : A na M ar so n - Co rr eç ão : M ár ci o - 27 /1 1/ 09 Quando trabalhamos com dados agrupados em classes ou não, utilizamos exatamente o mesmo processo de cálculo, evidentemente que com alterações nas fórmulas de cálculos, introduzindo-se o conceito de frequência simples, como se mostra a seguir: dm d x f f i ii n ii n= = = ∑ ∑ 1 1 Observar que para dados agrupados em classes o cálculo dos desvios é dado por: di = pmi - X Os exemplos a seguir demonstram esses cálculos. Exemplo 2 Calcular o desvio médio da amostra de distribuição abaixo, relativa ao número de acidentes diários numa estrada federal. Distribuição de acidentes por dia - estrada X Número de acidentes diários Dias pesquisados Valor x Frequência Desvios Módulo dos desvios Módulo dos desvios x Frequência Valor Frequência xi fi xi.fi di=xi – X _ |di=xi – X _ | |di| x fi 0 12 0 -3,6 3,6 43,5 1 15 15 -2,6 2,6 39,4 2 28 56 -1,6 1,6 45,6 4 23 92 0,4 0,4 8,6 5 19 95 1,4 1,4 26,1 6 8 48 2,4 2,4 19,0 8 6 48 4,4 4,4 26,2 10 4 40 6,4 6,4 25,5 11 2 22 7,4 7,4 14,7 12 1 12 8,4 8,4 8,4 Somas 118 428 257,0 Média 3,6 Desvio médio 2,2 5 10 59 ESTATÍSTICA Re vi sã o: A na M ar so n - Di ag ra m aç ão : M ár ci o - 19 /1 1/ 09 / / 2ª R ev is ão : A na M ar so n - Co rr eç ão : M ár ci o - 27 /1 1/ 09 dm d x f f dm dm i ii n ii n= => = => = = = ∑ ∑ 1 1 257 118 2 2, Exemplo 3 Calcular o desvio médio da amostra de distribuição abaixo, relativa ao tempo de mão de obra gasto com a manutenção dos aviões de uma empresa aérea. Distribuição das horas de manutenção - aero X Classes Limites de classes Pontos médios de classe Manutenções pesquisadas Valor x Frequência Desvios Módulo dos desvios Módulo dos desvios x Frequência Valor Frequência li ls pmi fi pmi.fi di=xi – X _ |di=xi – X _ | |di| x fi 1 0 |--- 3 1,5 26 39 -4,1 4,1 106,0 2 3 |--- 6 4,5 20 90 -1,1 1,1 21,5 3 6 |--- 9 7,5 16 120 1,9 1,9 30,8 4 9 |--- 12 10,5 10 105 4,9 4,9 49,2 5 12 |--| 15 13,5 6 81 7,9 7,9 47,5 Somas 78 435 255,1 Média 5,6 Desvio Médio 3,3 dm d x f f dm dm i ii n ii n= => = => = = = ∑ ∑ 1 1 255 1 78 3 3 , , 4.1.3 Variância A definição de desvio médio leva em consideração os desvios dos elementos tomados a 1ª potência. Matematicamente, demonstra-se que os efeitos de desvio são mais bem- representados quando tomados ao quadrado. Essa consideração nos leva à definição das duas mais importantes medidas de 5 10 60 Unidade II Re vi sã o: A na M ar so n - Di ag ra m aç ão : M ár ci o - 19 /1 1/ 09 / / 2ª R ev is ão : A na M ar so n - Co rr eç ão : M ár ci o - 27 /1 1/ 09variabilidade absolutas: a variância e o desvio padrão que veremos em seguida. A variância é o somatório dos desvios tomados ao quadrado, ou seja, é basicamente a mesma definição do desvio médio, alterando-se apenas a potência dos desvios:2 S d N ii n 2 2 1 1 = − =∑ No caso em que estivermos trabalhando com dados agrupados, a forma, naturalmente, deverá incluir o conceito de frequência simples, ou seja: S d x f f i ii n ii n 2 2 1 1 1 = − = = ∑ ∑ Os exemplos de 1 a 3 no próximo item mostram o cálculo da variância nos vários casos possíveis. 4.1.4 Desvio padrão O cálculo ou a análise da variância tem um grande inconveniente prático: ela apresenta unidades ao quadrado em relação à medida de tendência central. Por exemplo, suponha que queremos descrever uma amostra de salários de uma empresa. Poderíamos afirmar que o salário médio da empresa é de 1.340 reais, e a variância, de 11.025 reais ao quadrado. Observe a estranheza que causa a unidade: “reais ao quadrado”. Sem falar do número extravagante que resultou dos cálculos. Para contornar esse problema, define-se a mais utilizada das medidas de variabilidade: o desvio padrão. 2 Observe também uma alteração no denominador da fórmula; ao invés de N, é N-1. Essa alteração é importante quando tratarmos dos assuntos relativos à estimação estatística (em Estatística para Administradores). A rigor, utilizaremos a fórmula acima para amostras e a mesma fórmula com denominador igual a N para populações. 5 10 15 20 61 ESTATÍSTICA Re vi sã o: A na M ar so n - Di ag ra m aç ão : M ár ci o - 19 /1 1/ 09 / / 2ª R ev is ão : A na M ar so n - Co rr eç ão : M ár ci o - 27 /1 1/ 09 Conceitualmente, o desvio padrão é a raiz quadrada da variância e é simbolizado pela letra S maiúscula. Dessa forma, é calculado pelas fórmulas S d N ii n = − =∑ 21 1 para dados isolados e S d x f f i ii n ii n= − = = ∑ ∑ 2 1 1 1 para dados agrupados em classes ou não. Nos exemplos de 1 a 3 a seguir, são calculados os valores do desvio padrão e da variância, de maneira semelhante ao que foi feito anteriormente para o desvio médio. Observe que o cálculo segue os seguintes passos em ambos os casos: 1. Calcular a média da distribuição. 2. Calcular os desvios de cada elemento. 3. Calcular o quadrado dos desvios. 4. Somar o quadrado dos desvios (usando o conceito de frequência caso sejam dados agrupados). 5. Dividir a soma obtida pelo número de elementos menos 1, obtendo-se a variância. 6. Extrair a raiz quadrada, obtendo-se o desvio padrão. 5 10 15 20 62 Unidade II Re vi sã o: A na M ar so n - Di ag ra m aç ão : M ár ci o - 19 /1 1/ 09 / / 2ª R ev is ão : A na M ar so n - Co rr eç ão : M ár ci o - 27 /1 1/ 09 Exemplo 1 Calcular a média e o desvio padrão da amostra {18; 21; 22; 27; 28; 29; 32; 37}. Ordem dos elementos Valores Desvios Desvios ao quadrado xi di=xi – X _ di 2 1 18 18 - 27 = -9 81 2 21 21 - 27 = -6 36 3 22 22 - 27 = -5 25 4 27 27 - 27 = 0 0 5 28 28 - 27 = 1 1 6 29 29 - 27 = 2 4 7 33 33 - 27 = 6 36 8 38 38 - 27 = 11 121 Soma 216 0 304 Média ( X _ ) 216/8=27 Variância 304/7 = 43,4 Desvio padrão 6,6 Cálculo da média: X x N X Xi= ⇒ = ⇒ =Σ 216 8 27 Cálculo da variância: S d N S S ii n 2 2 1 2 2 1 304 8 1 43 4= − => = − => ==∑ , Cálculo do desvio padrão: S d N S S S ii n 2 2 1 1 304 8 1 43 4 6 6= − => = − => = => ==∑ , , 5 63 ESTATÍSTICA Re vi sã o: A na M ar so n - Di ag ra m aç ão : M ár ci o - 19 /1 1/ 09 / / 2ª R ev is ão : A na M ar so n - Co rr eç ão : M ár ci o - 27 /1 1/ 09 Exemplo 2 Calcular a variância e o desvio padrão da amostra de distribuição abaixo, relativa ao número de acidentes diários numa estrada federal. Distribuição de acidentes por dia - Estrada X Número de acidentes diários Dias pesquisados Valor x Frequência Desvios Quadrado dos desvios Quadrado dos desvios x FrequênciaValor Frequência xi fi xi.fi di=xi – X _ di 2 di 2 x fi 0 12 0 -3,6 13,2 157,9 1 15 15 -2,6 6,9 103,5 2 28 56 -1,6 2,6 74,1 4 23 92 0,4 0,1 3,2 5 19 95 1,4 1,9 35,8 6 8 48 2,4 5,6 45,0 8 6 48 4,4 19,1 114,7 10 4 40 6,4 40,6 162,5 11 2 22 7,4 54,4 108,7 12 1 12 8,4 70,1 70,1 Somas 118 428 875,6 Média 3,6 Variância 7,5 Desvio Médio 2,7 Cálculo da variância: S d x f f S S i ii n ii n 2 2 1 1 2 2 1 875 6 118 1 7 5= − => = − = == = ∑ ∑ , , Cálculo do desvio padrão: S d x f f S S Si ii n ii n = − => = − => = => == = ∑ ∑ 2 1 1 1 875 6 118 1 7 5 2 7 , , , 5 64 Unidade II Re vi sã o: A na M ar so n - Di ag ra m aç ão : M ár ci o - 19 /1 1/ 09 / / 2ª R ev is ão : A na M ar so n - Co rr eç ão : M ár ci o - 27 /1 1/ 09 Exemplo 3 Calcular o desvio padrão da amostra de distribuição abaixo, relativa ao tempo de mão de obra gasto com a manutenção dos aviões de uma empresa aérea. Distribuição das horas de manutenção - Aero X Classes Limites de classes Pontos médios de classe Manutenções pesquisadas Valor x Frequência Desvios Quadrado dos desvios Quadrado dos desvios x Frequência Valor Frequência li ls pmi fi pmi.fi di=xi – X _ di 2 di 2 x fi 1 0 |--- 3 1,5 26 39 -4,1 16,6 432,2 2 3 |--- 6 4,5 20 90 -1,1 1,2 23,2 3 6 |--- 9 7,5 16 120 1,9 3,7 59,2 4 9 |--- 12 10,5 10 105 4,9 24,2 242,4 5 12 |--| 15 13,5 6 81 7,9 62,8 376,7 Somas 78 435 1133,5 Média 5,6 Variância 14,7 Desvio Padrão 3,8 Cálculo da variância: S d x f f S S i ii n ii n 2 2 1 1 2 2 1 1133 5 78 1 14 7= − => = − => == = ∑ ∑ , , Cálculo do desvio padrão: S d x f f S S S i ii n ii n= − => = − => = => == = ∑ ∑ 2 1 1 1 1133 5 78 1 14 7 3 8 , , , O desvio padrão é a mais utilizada medida de dispersão, e, quando relacionada com a média, informa a quantidade de elementos da amostra ou da população que se situam em torno da média. 5 10 65 ESTATÍSTICA Re vi sã o: A na M ar so n - Di ag ra m aç ão : M ár ci o - 19 /1 1/ 09 / / 2ª R ev is ão : A na M ar so n - Co rr eç ão : M ár ci o - 27 /1 1/ 09 O mais comum, na estatística, é que essa relação entre média e desvio padrão seja feita pela chamada distribuição normal, à qual nós voltaremos na disciplina de Estatística para Administradores. Nessa relação, válida na maior parte dos casos práticos, seguem-se os seguintes intervalos: 1. Entre a média mais uma vez o desvio padrão e a média menos uma vez o desvio padrão, estão contidos 68% dos elementos da amostra ou da população. 2. Entre a média mais duas vezes o desvio padrão e a média menos duas vezes o desvio padrão, estão contidos 85% dos elementos da amostra ou da população. 3. Entre a média mais três vezes o desvio padrão e a média menos três vezes o desvio padrão, estão contidos 99,74% dos elementos da amostra ou da população. 4. Entre a média maisquatro vezes o desvio padrão e a média menos quatro vezes o desvio padrão, estão contidos 100% dos elementos da amostra ou da população. Exemplo: um estudo estatístico com 4.850 alunos de Administração da Produção de uma universidade mostrou que a nota final média deles foi de 5,3 com desvio padrão de 1,2. Quantos alunos tiveram médias finais entre 4,1 e 6,5? Observe que as notas 4,1 e 6,5 correspondem exatamente à média menos um desvio padrão (5,3 – 1,2 = 4,1) e à média mais um desvio padrão (5,3 + 1,2 = 6,5). Portanto, 68% dos alunos estão contidos nesse intervalo, ou seja: 68% de 4.850 são 3.280 alunos. Podemos, portanto, afirmar que 3.280 alunos tiveram notas entre 4,1 e 6,5. 5 10 15 20 25 66 Unidade II Re vi sã o: A na M ar so n - Di ag ra m aç ão : M ár ci o - 19 /1 1/ 09 / / 2ª R ev is ão : A na M ar so n - Co rr eç ão : M ár ci o - 27 /1 1/ 09 4.2 Medidas de dispersão relativas A maneira mais comum de se informar de maneira sintética (resumida) dados quantitativos é através de uma medida de posição (média, mediana ou moda) em conjunto com uma medida de dispersão absoluta (desvio médio, variância ou desvio padrão). O mais comum é o par de informações: média - desvio padrão. Frequentemente, no entanto, é interessante utilizar as chamadas medidas de dispersão relativas, que analisam simultaneamente uma medida de posição e a medida de dispersão correspondente. São especialmente interessantes essas medidas quando fazemos comparações entre amostras diferentes. A rigor, podemos obter essas medidas, costumeiramente chamadas de coeficientes de variação, dividindo uma medida de dispersão por uma medida de posição; no entanto, as mais comuns são: 1. Coeficiente de variação de Pearson: divisão do desvio padrão pela média: Cv S X Cv S Xp p = = × ou 100 2. Coeficiente de variação de Thorndike: divisão do desvio padrão pela mediana: Cv S Me Cv S Mep p = = × ou 100 O exemplo a seguir mostra uma aplicação dos coeficientes de variação, num caso de ordem prática. 5 10 15 20 67 ESTATÍSTICA Re vi sã o: A na M ar so n - Di ag ra m aç ão : M ár ci o - 19 /1 1/ 09 / / 2ª R ev is ão : A na M ar so n - Co rr eç ão : M ár ci o - 27 /1 1/ 09 Um especialista estudou, estatisticamente, dois tipos de investimentos, chegando às conclusões do quadro abaixo. Qual é o investimento que apresenta menor risco?3 Estatísticas Aplicações Observações X Y Retorno esperado 12% 20% O especialista teria chegado a essas conclusões através de um estudo estatístico no qual pesquisou e resumiu os retornos ocorridos no passado, conforme vimos no item 3.1 Desvio padrão 9% 10% Analogamente, o especialista teria calculado o devio padrão conforme vimos no item 4.1.4 Observe que se o especialista comparasse as aplicações somente com base em seus desvios padrões, ele preferiria a aplicação X, uma vez que essa aplicação tem um desvio padrão menor que Y (9% versus 10%). Essa comparação seria baseada no fato de que, sendo mais homogênea a aplicação A, “daria menos sustos”. No entanto, se ele calculasse e comparasse os coeficientes de variação, chegaria a conclusões diferentes: Estatísticas Aplicações X Y Retorno esperado 12% 20% Desvio padrão 9% 10% Coeficiente de variação de Pearson 75% 50% Cv Cvpa pa= = 9 12 75 x 100=> % Cv Cvpb pb= = 10 20 50 x 100=> % 3 Adaptado de GITMAN, Lawrence J. Princípios de administração financeira. São Paulo: Harbra, 2003. 5 10 68 Unidade II Re vi sã o: A na M ar so n - Di ag ra m aç ão : M ár ci o - 19 /1 1/ 09 / / 2ª R ev is ão : A na M ar so n - Co rr eç ão : M ár ci o - 27 /1 1/ 09 A comparação dos coeficientes de variação das aplicações mostra que o especialista estaria cometendo um erro sério se escolhesse a aplicação X em vez de a aplicação Y, já que a dispersão relativa, ou risco, das aplicações, conforme refletida no coeficiente de variação, é menor para o ativo Y do que para o X (50% versus 75%). Evidentemente, o uso do coeficiente de variação para comparar o risco da aplicação é melhor porque este também considera o tamanho relativo, ou retorno esperado, das aplicações. 4.3 Relações gráficas entre as medidas estatísticas Nos estudos e análises estatísticos, é interessante e importante visualizar as informações contidas nos dados através do uso dos diversos gráficos, assunto esse de que tratamos no módulo 2. Quando utilizamos os histogramas, é facilmente perceptível que as frequências dos valores mais centrais tendem a ser maiores que as dos valores extremos. Esse comportamento nos permitirá conclusões importantes no capítulo da estatística indutiva, porque, via de regra, ocorre de modo repetitivo. Observações do padrão de comportamento das distribuições mostram que grande parte delas tende a se apresentar da maneira conhecida como distribuição normal. A figura 1 mostra o comportamento estatístico de uma distribuição de frequências relativa aos pesos de um grupo de pessoas qualquer. Observe que os pesos próximos da média têm maior frequência, e o longe da média, menor. Observe também a curva que se forma pela distribuição das colunas. 5 10 15 20 25 69 ESTATÍSTICA Re vi sã o: A na M ar so n - Di ag ra m aç ão : M ár ci o - 19 /1 1/ 09 / / 2ª R ev is ão : A na M ar so n - Co rr eç ão : M ár ci o - 27 /1 1/ 09 Figura 1 - Pesos corporais 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 105 Peso em quilos Fr eq uê nc ia s im pl es 40 35 30 25 20 15 10 5 0 No curso de Estatística para Administradores, iremos retornar ao assunto, quando diremos, por exemplo, que é pouco provável uma pessoa adulta ter peso acima de 100 kg ou abaixo de 35 kg, e utilizaremos essa curva para determinar qual é essa probabilidade, se houver. Por ora, iremos nos preocupar com a variação de formatos desse tipo de curva, chamada de curva normal, ou curva de Gauss ou, ainda, de curva do sino. Em teoria, espera-se que essa curva tenha comportamento mostrado nas curvas desenhadas em linha contínua nas figuras 2 e 3. Mas na prática ocorrem deformações nessas curvas, demonstradas nas curvas pontilhadas das mesmas figuras. Essas deformações são chamadas, respectivamente, de assimetria (figura 2) e curtose (figura 3). 5 10 70 Unidade II Re vi sã o: A na M ar so n - Di ag ra m aç ão : M ár ci o - 19 /1 1/ 09 / / 2ª R ev is ão : A na M ar so n - Co rr eç ão : M ár ci o - 27 /1 1/ 09 Figura 2 - Assimetria Média0 0 Variável Fr eq uê nc ia si m pl es Assimétrica positiva Assimétrica negativa Simétrica 0 Figura 3 - Curtose Curva platicúrtica Curva mesocúrtica Curva leptocúrtica Fr eq uê nc ia si m pl es Média Variável 4.3.1 Assimetria A assimetria mede o quanto a distribuição se afasta da média. Esse afastamento pode ocorrer para a direita ou para a esquerda, gerando, respectivamente, as assimetrias positiva e negativa. O grau de assimetria é dado, frequentemente, pelo chamado 1º coeficiente de Pearson:4 As X MeS= − 4 Existem outras medidas de assimetria, além do 1º coeficiente de Pearson. 5 71 ESTATÍSTICA Revi sã o: A na M ar so n - Di ag ra m aç ão : M ár ci o - 19 /1 1/ 09 / / 2ª R ev is ão : A na M ar so n - Co rr eç ão : M ár ci o - 27 /1 1/ 09 Onde: As = Coeficiente de assimetria X = Média Me = Mediana S = Desvio padrão Caso: As = 0, a distribuição é simétrica. As > 0, a distribuição é assimétrica positiva ou à direita. As < 0, a distribuição é assimétrica negativa ou à esquerda. Por esse critério, costuma-se classificar as distribuições da seguinte maneira: Caso As �<-1: assimétrica negativa forte. Caso -1 < As < 0: assimétrica negativa fraca. Caso As = 0: simétrica. Caso 0 < As < 1: assimétrica positiva fraca. Caso As > 1: assimétrica positiva forte. 4.3.2 Curtose A curtose mede o quanto a distribuição se alonga ou se achata em relação à curva teórica. A curva teórica é chamada de mesocúrtica; as mais alongadas, de leptocúrtica, e as mais achatadas, de platicúrtica O grau de curtose é dado, frequentemente, pelo coeficiente:5 k d x f f S i i i= − ∑ ∑ 4 4 3 5 Existem outros coeficientes de curtose além do apresentado aqui. 5 10 15 20 72 Unidade II Re vi sã o: A na M ar so n - Di ag ra m aç ão : M ár ci o - 19 /1 1/ 09 / / 2ª R ev is ão : A na M ar so n - Co rr eç ão : M ár ci o - 27 /1 1/ 09 Onde: K = Coeficiente de curtose di = Desvios fi = Desvio Padrão Caso: K = 0, a distribuição é mesocúrtica. K > 0, a distribuição é leptocúrtica. K < 0, a distribuição é platicúrtica. Exemplo: O exemplo a seguir demonstra o cálculo da assimetria e da curtose de uma distribuição referente ao consumo de energia elétrica entre 1.245 famílias de determinada região. Observando os cálculos da próxima página, notamos que a distribuição (e a curva dela decorrente) é assimétrica negativa fraca, ou seja, ligeiramente deslocada para a esquerda e que é platicúrtica, ou seja, achatada. A curva teria a aparência aproximada abaixo (a curva pontilhada é a do exercício; a cheia, é a padrão): Figura 4 - Assimetria e curtose Média Variável Fr eq uê nc ia si m pl es 5 10 15 73 ESTATÍSTICA Re vi sã o: A na M ar so n - Di ag ra m aç ão : M ár ci o - 19 /1 1/ 09 / / 2ª R ev is ão : A na M ar so n - Co rr eç ão : M ár ci o - 27 /1 1/ 09 Cl as se s nú m er o Co ns um o m en sa l po r fa m ili a N úm er o de fa m íli as Po nt os m éd io s de cl as se Fr eq uê nc ia ac um ul ad a cr es ce nt e Po nt os m éd io s x Fr eq uê nc ia s De sv io s De sv io s ao qu ad ra do De sv io a o qu ad ra do x Fr eq uê nc ia s De sv io s a qu ar ta po tê nc ia De sv io s a qu ar ta p ot ên ci a x Fr eq uê nc ia s Va lo r Fr eq uê nc ia l i l s f i pm i f a c ↓ p m i x f i d i =x i – X_ d i 2 d i 2 x f i d i 4 d i 4 x f i 1 0 |- -- - 50 15 8 25 15 8 3. 95 0 -1 92 36 .9 44 5. 83 7. 18 9 1. 36 4. 87 6. 60 2 21 5. 65 0. 50 3. 10 7 2 50 |- -- - 10 0 10 0 75 25 8 7. 50 0 -1 42 20 .2 23 2. 02 2. 33 5 40 8. 98 4. 00 0 40 .8 98 .4 00 .0 46 3 10 0 |- -- - 15 0 11 2 12 5 37 0 14 .0 00 -9 2 8. 50 2 95 2. 27 7 72 .2 91 .9 84 8. 09 6. 70 2. 25 9 4 15 0 |- -- - 20 0 16 4 17 5 53 4 28 .7 00 -4 2 1. 78 2 29 2. 18 0 3. 17 4. 04 8 52 0. 54 3. 85 5 5 20 0 |- -- - 25 0 17 5 22 5 70 9 39 .3 75 8 61 10 .6 23 3. 68 5 64 4. 83 3 6 25 0 |- -- - 30 0 28 0 27 5 98 9 77 .0 00 58 3. 34 0 93 5. 14 9 11 .1 54 .3 89 3. 12 3. 22 8. 92 9 7 30 0 |- -- - 35 0 84 32 5 1. 07 3 27 .3 00 10 8 11 .6 19 97 5. 99 1 13 4. 99 9. 65 5 11 .3 39 .9 70 .9 93 8 35 0 |- -- - 40 0 63 37 5 1. 13 6 23 .6 25 15 8 24 .8 98 1. 56 8. 57 7 61 9. 91 2. 97 6 39 .0 54 .5 17 .4 68 9 40 0 |- -- - 45 0 56 42 5 1. 19 2 23 .8 00 20 8 43 .1 77 2. 41 7. 92 1 1. 86 4. 26 7. 84 6 10 4. 39 8. 99 9. 37 7 10 45 0 |- -- | 50 0 53 47 5 1. 24 5 25 .1 75 25 8 66 .4 56 3. 52 2. 18 3 4. 41 6. 43 7. 76 0 23 4. 07 1. 20 1. 26 2 So m at ór io s 1. 24 5 27 0. 42 5 18 .5 34 .4 26 65 7. 15 4. 71 2. 12 9 74 Unidade II Re vi sã o: A na M ar so n - Di ag ra m aç ão : M ár ci o - 19 /1 1/ 09 / / 2ª R ev is ão : A na M ar so n - Co rr eç ão : M ár ci o - 27 /1 1/ 09 • Cálculo da média: X x f f X Xi i i = => = => =∑∑ 270 425 1 245 217 2 . . , • Cálculo do desvio padrão: S d x f f S S S i ii n ii n= − => = − => = => == = ∑ ∑ 2 1 1 1 18 534 426 1 245 1 14 899 1 . . . . 222 1, • Cálculo da mediana: - elemento mediano: E N E Eme me me= + => = + => =1 2 1 245 1 2 623 . - mediana: Me=li + E -f f x h=200+ 623-534 175 x 50=>Me=Me me ac ant Me 2225,4 • Cálculo da assimetria: As X Me S As As= − => = − => = −217 2 225 4 122 1 0 067 , , , , • Cálculo da curtose: K d x f f S K K i i i= − => = − => = − ∑ ∑ 4 4 43 657 154 712 129 1245 122 1 3 0 62 . . . ( , ) , 55 5 10 75 ESTATÍSTICA Re vi sã o: A na M ar so n - Di ag ra m aç ão : M ár ci o - 19 /1 1/ 09 / / 2ª R ev is ão : A na M ar so n - Co rr eç ão : M ár ci o - 27 /1 1/ 09 Referências bibliográficas ANDERSON, D. R.; SWEENEY, D. J.; WILLIAMS, T. A. Estatística aplicada à administração e economia. 2. ed. São Paulo: Thomson Learning, 2007. BRUNI, Adriano B. Estatística aplicada à gestão empresarial. São Paulo: Atlas, 2007. BUSSAB, W. O.; MORETIN, P. A. Estatística básica. 3. ed. São Paulo: Atual, 1986. COSTA NETO, P. L. O. Estatística. São Paulo: Edgard Blücher, 1979. COSTA NETO, P. L. O.; CYMBALISTA, M. Probabilidades. São Paulo: Edgard Blücher, 1974. DOWNING, D.; CLARK, J. Estatística aplicada. 1. ed. São Paulo: Saraiva, 1998. FONSECA, J. S.; MARTINS, G. A.; TOLETO, G. L. Estatística aplicada. São Paulo: Atlas, 1995. GUERRA, M.; GUERRA, M. J.; DONAIRE, D. Estatística aplicada. São Paulo: Ciência e Tecnologia, 1991. KAZMIER, L. J. Estatística aplicada à economia e administração. São Paulo: Makron Books, 1982. KUNE, H. Métodos estatísticos para a melhoria da qualidade. São Paulo: Gente, 1993. LAPPONI, J. A. Estatística usando Excel. 4. ed. Rio de Janeiro: Elsevier, 2005. 76 Unidade IIRe vi sã o: A na M ar so n - Di ag ra m aç ão : M ár ci o - 19 /1 1/ 09 / / 2ª R ev is ão : A na M ar so n - Co rr eç ão : M ár ci o - 27 /1 1/ 09 MEDEIROS, E.; MEDEIROS, E.; GONÇALVES, V.; MUROLO, A. C. Estatística para os cursos de economia, administração e ciências contábeis. 2. ed. v. 1 e 2. São Paulo: Atlas, 1997. __________. Tabelas de estatística para os cursos de economia, administração e ciências contábeis. 2. ed. São Paulo: Atlas, 1999. MEYER, P. L. Probabilidade — aplicações à estatística. 1. ed. Rio de Janeiro: Livros Técnicos e Científicos, 1976. MILONE, G.; ANGELINI, F. Estatística aplicada. São Paulo: Atlas, 1995. MOORE, D. A estatística básica e sua prática. 1. ed. Rio de Janeiro: LTC, 2000. MOORE, D; McCABE, G. P.; DUCKWORTH, W. M.; SCLOVE, S. L. A prática da estatística empresarial. Como usar dados para tomar decisões. Rio de Janeiro: LTC, 2006. SPIEGEl, M. R. Estatística. São Paulo: Makron Books, 1993. STEVENSON, W. J. Estatística aplicada à administração. São Paulo: Habra, 1981. TRIOLA, M. F. Introdução à estatística. Rio de Janeiro: LTC, 2005. WITTE, R. S.; WITTE, J. S. Estatística. 7. ed. Rio de Janeiro: LTC, 2005.
Compartilhar