Baixe o app para aproveitar ainda mais
Prévia do material em texto
UNIDADE IV: MEDIDAS DE DISPERSÃO OU VARIABILIDADE OBJETIVO DA UNIDADE: - Entender a definição de medida de dispersão ou variabilidade; - Saber calcular variância e desvio padrão; - Conceituar intervalo padrão ou zona de normalidade; - Identificar dados homogêneos e heterogêneos através do coeficiente de variação. Já estudamos que um conjunto de valores pode ser sintetizado por meio de procedimento matemático, como o cálculo da média, moda, mediana, quartis e percentis. No entanto, a interpretação de dados estatísticos exige que se realize um número maior de estudos, além dos estudados nas unidades precedentes. Torna-se necessário ter uma idéia de como se apresentam os dados, qual a variação em torno da média, qual a concentração. Vejamos o seguinte exemplo: Foram avaliados três grupos de executivos, cada um com cinco elementos, no que se refere à criatividade e os testes mostraram os seguintes resultados: Grupo A: - 5 5 5 5 5 Grupo B: - 3 4 5 6 7 Grupo C: - 1 2 5 7 10 Para representar cada grupo, podemos calcular a média e vamos verificar que os três grupos têm a mesma média x = 5, entretanto observando a variação dos dados podemos perceber que os grupos se comportam de forma diferente, apesar de todos terem a mesma média. Nesse caso, a média ainda que considerada como um número que pode representar uma seqüência de números, não pode destacar o grau de homogeneidade ou heterogeneidade que existe entre os valores que compõem o conjunto. Desse modo, precisamos efetuar outros procedimentos matemáticos para caracterizar melhor os dados de cada grupo com o objetivo de tirarmos conclusões qualitativas. As medidas que mostram a variação dos dados de um conjunto são chamadas de Medidas de Dispersão ou Variabilidade: I) Medida de Dispersão Absoluta: - Amplitude total; - Desvio médio; - Variância e desvio-padrão. II) Medidas de Dispersão relativa: - Coeficiente de variação de Pearson; 4.1 Medidas de Dispersão Absoluta 4.1.1 Amplitude Total ou Intervalo Total O Símbolo da Amplitude Total é: AT Definição: A amplitude total de um conjunto de números é a diferença entre os valores extremos do conjunto observado: Min Max x x AT - = Exemplo 1: Calcular a amplitude total dos seguintes conjuntos de números: A = {10, 12, 13, 20, 25, 34, 45} B = {17, 18, 19, 20, 21, 22, 23} C = {-4, -3, -2, 3, 5} Solução: Para o conjunto A, temos: AT = 45 - 10 = 35 Para o conjunto B, temos: AT = 23 - 17 = 6 Para o conjunto C, temos: AT = 5 - (-4) = 9 Se os dados vierem dispostos em uma tabela de freqüências, com os valores agrupados em classes, há duas formas de se definir a amplitude total: Primeiro Método: AT = Ponto médio da última classe - ponto médio da primeira classe. Segundo Método: AT = Limite superior da última classe - limite inferior da primeira classe. Exemplo 2: Calcular a amplitude total dos valores dispostos na tabela 8.1. Tabela 4.1 - Consumo de água do Bairro Santa Mônica /06 Classes Fj Xj 10 ├ 20 5 15 20 ├ 30 12 25 30 ├ 40 20 35 40 ├ 50 14 45 50 ├ 60 10 55 60 ├ 70 4 65 n = 65 Pelo primeiro método: AT = 65 - 15 = 50 ( AT = 50 Nesse método, os valores extremos são eliminados. Pelo segundo método: AT = 70 - 10 = 60 ( AT = 60 4.1.2 Restrições ao uso da Amplitude Total Embora a amplitude total seja a mais simples das medidas de dispersão, há uma forte restrição ao seu uso em virtude de sua grande instabilidade, uma vez que ela leva em conta apenas os valores extremos da série. Comparemos os conjuntos A e B do exemplo 1: Tabela 4.2 Conjunto Média Amplitude Total: A t A = {10, 12, 13, 15, 20, 25, 45} x = 20 AT A = 35 B = {17, 18, 19, 20, 21, 22, 23} x = 20 AT B = 6 A média aritmética de cada um desses conjuntos é igual a 20. Portanto, no que diz respeito a uma medida de posição, ambos os conjuntos podem ser considerados idênticos. Ao calcularmos a amplitude total, verificaremos que os valores do conjunto A apresentam maior dispersão. Todavia, no cálculo da amplitude total não são levados em consideração os valores da série que se encontram entre os extremos, o que poderia conduzir o analista a interpretações equivocadas. Muitas vezes, um valor particularmente anormal poderá afetar de maneira acentuada a medida. O conjunto A, por exemplo, apresenta o último valor (45) sensivelmente distante do penúltimo (25), fato que talvez tenha provocado uma amplitude total de tal magnitude (35). Além da insensibilidade aos valores entre os extremos anormais, a amplitude total é sensível ao tamanho de amostra. Ao aumentar essa última, a amplitude total tende a aumentar, ainda que não proporcionalmente. Finalmente, a amplitude total apresenta muita variação de uma amostra para outra, mesmo que ambas sejam extraídas da mesma população. Apesar dos inconvenientes dessa medida, os quais não justificam, na maioria das vezes, seu uso, há situações especiais em que ela resulta satisfatória. É o caso, por exemplo, da amplitude da temperatura em um dia ou no ano. Outra situação seria aquela em que os dados são raros ou demasiadamente esparsos para justificar o emprego de uma medida mais precisa. É importante acrescentar que, ao descrever uma série por uma medida de posição (média, por exemplo) e de dispersão, se essa última for a amplitude total, é recomendável que se indiquem os valores extremos da série. Pratique resolvendo mais alguns exemplos: Determine a amplitude total em cada um dos casos. 1. { } 33 12 45 19 , 36 , 18 , 45 , 32 , 25 , 15 , 12 = Þ - = - = Þ AT x x AT A Min Máx 2. Tabela 4.2.1 Número de faltas dos acadêmicos da Turma A Faltas Acadêmicos 2 15 3 10 5 8 6 6 9 4 total 43 7 7 2 9 = Þ = - = AT AT 3. Tabela 4.2.2. Notas da atividade 1, dos acadêmicos da Turma A Notas Acadêmicos 3,8 ├ 4,8 5 4,8 ├ 5,8 6 5,8 ├ 6,8 12 6,8 ├ 7,8 15 7,8 ├ 8,8 5 total 43 Pelo primeiro método: AT = 8,3 – 4,3 = 4( AT = 4 Nesse método, os valores extremos são eliminados. Pelo segundo método: AT = 8,8 - 3,8 = 5 ( AT = 5 4.2 Desvio Médio (Símbolo: Dm) O desvio médio ou média dos desvios é igual à média aritmética dos valores absolutos dos desvios tomados em relação a uma das seguintes medidas de tendência central: média ou mediana. 4.2.1 Desvio Médio para Dados Brutos Quando os valores não vierem dispostos em uma tabela de freqüências, o desvio médio será calculado, de acordo com a definição, através do emprego de uma das seguintes fórmulas: å å = - = i K i i m f x x D 1 (1) desvio em relação à média aritmética. å å = - = i k i md i m f x x D 1 (2) desvio em relação à mediana. As barras verticais indicam que são tomados os valores absolutos dos desvios. Exemplo: Calcular o desvio médio dos conjuntos de números apresentados no exemplo 1: A= {10, 12, 13, 20, 25, 34, 45} B= {17, 18, 19, 20, 21, 22, 23} C= {-4, -3, -2, 3, 5} Os dados necessários para o cálculo do desvio são: 71 , 22 7 159 7 45 34 25 20 13 12 10 = = + + + + + + = A x e 20 = mdA x 20 7 140 7 23 22 21 20 19 18 17 = = + + + + + + = B x e 20 = mdB x 2 , 0 5 1 5 5 3 (-2) (-3) (-4) - = - = + + + + = C x e 2 - = mdC x É conveniente colocarmos os valores dispostos em uma tabela, considerando: a) Desvio Médio do Conjunto A: onde temos 20 71 , 22 = = md x e x Tabela 4.3 - Elementos do Conjunto A xi ) ( x x i - x x i - ) ( md i x x - md i x x - 10 10 – 22,71 = -12,71 12,71 10 – 20 = -10 10 12 12 – 22,71 = -10,71 10,71 12 – 20 = -8 8 13 13 – 22,71 = -9,71 9,7113 - 20 = -7 7 20 20 – 22,71 = -2,71 2,71 20 – 20 = 0 0 25 25 – 22,71 = 2,29 2,29 25 – 20 = 5 5 34 34 – 22,71 = 11,29 11,29 34 – 20 = 14 14 45 45 – 22,71 = 22,29 22,29 45 – 20 = 25 25 å = 61,71 å = 69 Usando as fórmulas (1) e (2), chegaremos a: Pela Média Dm= 10,24 24 , 10 7 71 , 71 7 22,71 - 7 1 = = = å = i i m x D Pela Mediana Dm = 9,86 86 , 9 7 69 7 20 7 1 = = - = å = i i m x D b) Desvio Médio do Conjunto B: onde temos 20 20 = = md x e x Tabela 4.4 - Elementos do Conjunto B xi ) ( x x i - x x i - ) ( md i x x - md i x x - 17 17 – 20 = -3 3 17 – 20 = -3 3 18 18 – 20 = -2 2 18 – 20 = -2 2 19 19 – 20 = -1 1 19 – 20 = -1 1 20 20 – 20 = 0 0 20 – 20 = 0 0 21 21 – 20 = 1 1 21 – 20 = 1 1 22 22 – 20 = 2 2 22 – 20 = 2 2 23 23 – 20 = 3 3 23 – 20 = 3 3 12 = - å x x i 12 = - å md i x x Neste caso, o desvio médio é igual, tanto quando calculado a partir da média como da mediana, uma vez que 20 = = md x x Pela Média Dm = 1,71 Dm = 71 , 1 7 12 7 20 - x 7 1 i = = å = i Pela Mediana Dm = 71 , 1 7 12 7 20 - x 7 1 i = = å = i c) Desvio Médio do Conjunto C: onde temos 2 2 , 0 - = - = md x e x Tabela 4.5 - Elementos do Conjunto C xi ) ( x x i - x x i - ) ( md i x x - md i x x - -4 (-4) – (-0,2) = - 3,8 3,8 -4 – (-2) = -2 2 -3 (-3) – (-0,2) = -2,8 2,8 -3 – (-2) = -1 1 -2 (-2) – (-0,2) = -1,8 1,8 -2 – (-2) = 0 0 3 3 – (-0,2) = 3,2 3,2 3 – (-2) = 5 5 5 5 – (-0,2) = 5,2 5,2 5 – (-2) = 7 7 8 , 16 = - å x x i 15 = - å md i x x Pela Média Dm = 3,36 Dm= 36 , 3 5 8 , 16 5 (-0,2) = = - å i x Pela Mediana Dm = 3 Dm= 3 5 15 5 (-2) = = - å i x Como ocorreu para o primeiro conjunto, o desvio médio neste caso é menor quando tomado em relação à mediana do que em relação à média. 4.2.2 Desvio Médio para Dados Tabulados sem Intervalo de Classe Se os valores vierem dispostos em uma tabela de frequências, agrupados ou não em classes, serão usadas as seguintes fórmulas: Cálculo pela Média å å = - = i k i i i m f f x x D . 1 Onde X j representa um valor individual ou um ponto médio da classe. Cálculo pela Mediana å å = - = i k i i md i m f f x x D . 1 Exemplo: Calcular o desvio médio em relação à média e em relação à mediana do número de empregados por estabelecimentos comerciais conforme a tabela 4.6. Tabela 4.6 Número de empregados por estabelecimentos comerciais Emp/estab f Fa i i f x i i f x × - 71 , 4 i i f x × - 5 1 2 2 2 3,71.(2)=7,42 4.(2)=8 2 3 5 6 2,71.(3)=8,13 3.(3)=9 3 3 8 9 1,71.(3)=5,13 2.(3)=6 4 5 13 20 0,71.(5)=3,55 1.(5)=5 5 6 19 30 0,29.(6)=1,74 0.(6)=0 6 4 23 24 1,29.(4)=5,16 1.(4)=4 7 3 26 21 2,29.(3)=6,87 2.(3)=6 10 2 28 20 5,29.(2)=10,58 5.(2)=6 28 å = 132 i i f x å = 58 , 48 å = 44 Inicialmente completamos a tabela 4.6 com a coluna da frequência acumulada Fa para o cálculo da mediana e da coluna para i i f x para o cálculo da média. Após determinarmos os valores da median e da média devemos colocar mais duas colunas para o cálculo do desvio com a média e com a mediana. Cálculo da média 71 , 4 28 132 = = x Para encontrarmos o valor do desvio em relação à média completamos a tabela com a coluna 5. Cálculo do Desvio médio em relação à Média 74 , 1 28 58 , 48 = = m D Cálculo da Mediana ( Posição da mediana ) ( 14 2 28 2 posição f = = å Na coluna da Fa vemos que o elemento de ordem 14° está na classe 5, onde o valor de x é 5, ou seja 5 = md x Para encontrarmos o valor do desvio em relação à mediana completamos a tabela com a coluna 6. Cálculo do Desvio médio em relação à Mediana 71 , 1 28 48 = = m D 4.2.3. Desvio Médio para dados Tabulados com Intervalo de Classe. Exemplo: Calcular o desvio médio dos valores representativos do consumo de energia elétrica (em Kwh) de 80 usuários. Tabela 4.7 - Consumo de energia elétrica de consumidores de Campo Grande/MS/06 Consumo (Kwh) fj x j x j fj i i f x x - i md i f x x - Fa 5 ├ 25 4 15 60 64,5 x 4 = 258 62,31 x 4 = 249,24 4 25 ├ 45 6 35 210 44,5 x 6 = 267 42,31 x 6 = 253,86 10 45 ├ 65 14 55 770 24,5 x 14 = 343 22,31 x 14 = 312,34 24 65 ├ 85 26 75 1950 4,5 x 27 = 117 2,31 x 27 = 60,06 50 85 ├ 105 14 95 1330 15,5 x 14 = 217 17,69 x 14 = 247,66 64 105├ 125 8 115 920 35,5 x 8 = 284 37,69 x 8 = 301,52 72 125├ 145 6 135 810 55,5 x 6 = 333 57,69 x 6 = 346,14 78 145├ 165 2 155 310 75,5 x 2 = 150 77,69 x 2 = 155,38 80 80 å =6360 1970 å = 2 , 1926 Iniciamos com o cálculo da média e da mediana 31 , 77 20 26 24 40 65 5 , 79 80 6360 = Þ × - + = Þ = = = md md x x Mediana x Média Completamos as tabelas com as diferenças e os produtos necessários para o cálculo do desvio médio. Cálculo pela média: Kwh D f x D m i i i m 63 , 24 80 1970 80 5 , 79 8 1 = Þ = - = å = Cálculo pela mediana: Kwh D f x D m i i i m 08 , 24 80 2 , 1926 80 31 , 77 8 1 = Þ = - = å = Podemos observar novamente que o desvio médio, calculado com base na mediana, é menor que o calculado com base na média aritmética. Observações: 1. O desvio médio apresenta resultado mais vantajoso que as medidas de dispersão precedentes, principalmente pelo fato de, em seu cálculo, levar em consideração todos os valores da distribuição. 2. O desvio médio, calculado levando-se em consideração os desvios em torno da mediana, é mínimo, ou seja, é menor do que qualquer desvio médio calculado com base em qualquer outra medida de tendência central. 3. Apesar de o desvio médio expressar aceitavelmente a dispersão de uma amostra não é tão freqüentemente empregado como o desvio-padrão, o qual será estudado a seguir, pois este se adapta melhor a uma ampla gama de aplicações. Além disso, o desvio médio não considera o fato de alguns desvios serem negativos e outros positivos, pois essa medida os trata como se fossem todos positivos, como valores absolutos. Contudo, será preferível o uso do desvio médio em lugar do desvio-padrão, quando esse for indevidamente influenciado pelos desvios extremos. Pratique resolvendo mais alguns exemplos: Determine o desvio médio em cada um dos casos, pela média. 1. { } 19 , 18 , 32 , 25 , 15 , 12 A Para facilitar vamos colocar os valores em uma tabela: i x 25 , 25 - i x 12 13,25 15 10,25 18 7,25 19 6,25 25 0,25 32 6,75 å = 202 44 33 , 7 6 44 = = m D 2. Tabela 4.2.1 Número de faltas dos acadêmicos da Turma A Faltas Acadêmicos i i f x 4 - i x i i f x 4 - 2 15 30 2 30 3 10 30 1 10 5 8 40 1 8 6 6 36 2 12 9 4 36 5 20 total 43 172 80 Para o cálculo do Dm, precisamos da média, dos módulos dos desvios e do produto dos desvios pela frequência, em seguida é só aplicarmos a fórmula: å å = - = i k i i i m f f x x D . 1 86 , 1 43 80 = = m D 3. Tabela 4.2.2. Notas da atividade 1, dos acadêmicos da Turma A Notas Acadêmicos i x i i f x 51 , 6 - i x i i f x 51 , 6 - 3,8 ├ 4,8 5 4,3 21,5 2,21 11,05 4,8 ├ 5,8 6 5,3 31,8 1,21 7,26 5,8 ├ 6,8 12 6,3 75,6 0,21 2,52 6,8 ├ 7,8 15 7,3 109,5 0,79 11,85 7,8 ├ 8,8 5 8,3 41,5 1,79 8,95 total 43 279,9 41,63 Para o cálculo do Dm, precisamos dos valores de i x , da média, dos módulos dos desvios e do produtodos desvios pela frequência, em seguida é só aplicarmos a fórmula: 51 , 6 43 9 , 279 = = x å å = - = i k i i i m f f x x D . 1 97 , 0 43 63 , 41 = = m D 4.3 Variância (Símbolo: S2) Vimos que a Amplitude total e o Desvio Médio são medidas que se deixam influenciar pelos valores extremos, que em grande maioria são devidos ao acaso. A variância é uma medida que leva em consideração valores extremos e os valores intermediários, isto é, expressa melhor os resultados obtidos. A variância relaciona os desvios em torno da média, ou mais claramente, é a média aritmética dos quadrados dos desvios. Variância de uma população: ( ) n d n x x S i i å å = - = 2 2 2 Sendo: 2 S = variância x = valor da média aritmética di = ( ) x x i - n = å i f Observação: É mais comum na estatística o trabalho com amostra e não com a população. Neste caso o denominador passa a ser (n - 1) em vez de n, pois assim teremos uma melhora na estimativa do parâmetro da população: Variância de uma amostra: ( ) 1 1 2 2 2 - = - - = å å n d n x x S i i 4.4 Desvio-padrão (Símbolo: S) O desvio-padrão é a medida de dispersão mais usada, tendo em comum com o desvio médio o fato de em ambos serem considerados os desvios com relação à média ( x ). Só que, no cálculo do desvio-padrão, em lugar de serem usados os valores absolutos das discrepâncias ou desvios, calculam-se os quadrados desses. O desvio-padrão não é senão uma média quadrática dos desvios em relação à média aritmética de um conjunto de números, ou seja, é a raiz quadrada da média aritmética dos quadrados dos desvios, tomados a partir da média aritmética. 4.4.1 Desvio-padrão de Dados Brutos Seja o seguinte conjunto de números: X = {x1, x2,... xn}. O desvio-padrão ou a média quadrática dos desvios ou afastamento em relação à média aritmética desse conjunto será definido por: ( ) n x x n d S n i i n i i å å = = - = = 1 2 1 2 ou resumidamente: n x x S i å - = 2 ) ( Exemplo: Calcular o desvio padrão do conjunto de números { } 7 , 5 , 3 , 1 A Vamos utilizar uma tabela para o cálculo do desvio padrão. Iniciamos calculando o valor da média. 4 4 4 7 5 3 1 = Þ = + + + = x x Tabela 4.8. Cálculo do Desvio Padrão i x ( ) 2 4 - i x 1 (1 - 4)2 = 9 3 (3 - 4)2 = 1 5 (5 - 4)2 = 1 7 (7 - 4)2 = 9 å = - 20 ) 4 ( 2 i x Aplicando a fórmula do desvio padrão temos: 24 , 2 5 4 20 = Þ = = S S Observação: quando o desvio-padrão representar uma descrição da amostra e não da população, caso mais freqüente em estatística, o denominador das expressões será igual a n - 1, em vez de n. A razão desse procedimento reside no fato de que, utilizando o divisor (n - 1), obtém-se uma estimativa melhor do parâmetro de população. Além do mais, apenas n - 1 das discrepâncias (xi - x) são independentes, uma vez que essas (n - 1) discrepâncias determinam automaticamente a n-ésima. Para valores grandes de n (n > 30) não há grande diferença entre os resultados proporcionados pela utilização de qualquer dos dois divisores, n ou n - 1. Entretanto, daremos preferência para a fórmula que proporciona uma estimativa mais justa do desvio-padrão da população, ou seja: ( ) 1 1 1 2 1 2 - - = - = å å = = n x x n d S n i i n i i 4.4.2 Desvio-padrão de Dados Tabulados sem Intervalo de Classe Quando os valores vierem dispostos em uma tabela de frequências, o cálculo do desvio-padrão se fará através de uma das seguintes fórmulas: Desvio padrão para dados populacionais ( ) n f x x n f d S k i i i k i i i å å = = - = = 1 2 1 2 Desvios padrão para dados amostrais ( ) 1 1 1 2 1 2 - - = - = å å = = n f x x n f d S k i i i k i i i i x = valor isolado da variável, ou ponto médio da classe, se os valores vierem agrupados em classe. Exemplo: Calcular o desvio padrão da tabela 4.9 Tabela 4.9 Número de faltas/mês dos funcionários da empresa Agro Sul / 08 N° de faltas / mês f i i f x 0 4 0 1 3 3 2 2 4 3 1 3 4 1 4 5 2 10 6 1 6 7 1 7 * pesquisa populacional å = 15 f å = 37 i i f x Inicialmente calculamos a média mês / faltas 47 , 2 15 37 = = = Þ å å f f x x i i Em seguida, inserimos mais uma coluna na tabela 4.9 onde vamos fazer os cálculos necessários para o cálculo do desvio padrão: Tabela 4.10 Número de faltas/mês dos funcionários da empresa Agro Sul / 08 N° de faltas / mês f i i f x i i f x 2 ) 47 , 2 ( - 0 4 0 ( 0 - 2,47 )2. ( 4 ) = 24,40 1 3 3 ( 1 - 2,47 )2. ( 3 ) = 6,48 2 2 4 ( 2 - 2,47 )2. ( 2 ) = 0,44 3 1 3 ( 3 - 2,47 )2. ( 1 ) = 0,28 4 1 4 ( 4 - 2,47 )2. ( 1 ) = 2,34 5 2 10 ( 5 - 2,47 )2.( 2 ) = 12,80 6 1 6 ( 6 - 2,47 )2.( 1 ) = 12,46 7 1 7 ( 7 - 2,47 )2.( 1 ) = 20,52 * pesquisa populacional å = 15 f å = 37 i i f x 79,72 3 , 2 3 , 2 31 , 5 15 72 , 79 ) ( 2 = Þ = = = Þ - = å å P P i P S S f x x S Exemplo: Foi realizada uma pesquisa amostral para conhecer o número de filhos dos funcionários da Empresa Coisas & Tal. Determine o desvio padrão da quantidade de filhos. Tabela 4.11 Número de filhos/funcionários da empresa Cisas & Tal /08 N° de filhos /func f i i f x i i f x x 2 ) ( - 0 3 0 1 5 5 2 2 4 3 1 3 4 1 4 5 1 5 6 1 6 14 27 Inicialmente calculamos a média func / filhos 93 , 1 14 27 = = = Þ å å f f x x i i Em seguida, vamos completar na tabela, na próxima coluna com os desvios ao quadrado, multiplicado pela frequência, obtendo assim a soma total para aplicarmos na fórmula. Tabela 4.12 Número de filhos/funcionários da empresa Coisas & Tal /08 N° de filhos /func f i i f x i i f x 2 ) 93 , 1 ( - 0 3 0 ( 0 – 1,93 )2. ( 3 ) = 11,17 1 5 5 ( 1 – 1,93 )2. ( 5 ) = 4,32 2 2 4 ( 2 – 1,93 )2. ( 2 ) = 0,01 3 1 3 ( 3– 1,93 )2. ( 1 ) = 1,15 4 1 4 ( 4 – 1,93 )2. ( 1 ) = 4,28 5 1 5 ( 5 – 1,93 )2. ( 1 ) = 9,42 6 1 6 ( 6 – 1,93 )2. ( 1 ) = 16,56 * pesquisa amostral 14 27 46,91 9 , 1 9 , 1 61 , 3 13 91 , 46 1 14 91 , 46 1 ) ( 2 = Þ = = = - = Þ - - = å å A A i A S S f x x S 4.4.3 Desvio padrão de Dados Tabulados com Intervalo de Classes Quando tivermos que calcular o desvio padrão para tabelas de dados tabulados com intervalos de classes usaremos as mesmas fórmulas para dados sem intervalos de classes, utilizando para i x os pontos médios de cada classe, seguindo com os mesmos procedimentos. Exwmplo: Com dados da tabela a seguir, calcule o desvio-padrão da distribuição de frequências do consumo de energia elétrica (Kwh) : Tabela 4.13 Distribuição de freqüências do consumo de energia elétrica Consumo Número de usuários i f i x i i f x ) 5 , 79 ( - i x 2 ) 5 , 79 ( - i x i i f x 2 ) 5 , 79 ( - 5 ├ 25 4 15 60 - 64,5 4160,25 16641,0 25├ 45 6 35 210 - 44,5 1980,25 11881,5 45├ 65 14 55 770 - 24,5 600,25 8403,5 65├ 85 26 75 1950 - 4,5 20,25 526,5 85├ 105 14 95 1330 15,5 240,25 3363,5 105├ 125 8 115 920 35,5 1260,25 10082,0 125├ 145 6 135 810 55,5 3080,25 18481,5 145├ 165 2 155 310 75,5 5700,25 11400,5 å 6360 80780 A média aritmética do consumo já foi calculada anteriormente: 5 , 79 80 6360 = = = å n f x x i i Cálculo do Desvio-padrão pela Fórmula Original : ( ) ( ) 98 , 31 53 , 1022 79 80780 1 80 5 , 79 1 8 1 2 1 2 = Þ = = - - = - - = å å = = S f x n f x x S j j j k j j j O desvio-padrão do consumo de energia elétrica é 31,98 Kwh. Lembre-se queo desvio médio já foi calculado, resultando em Dm = 24,63 Kwh. Pratique resolvendo mais alguns exemplos: Determine o desvio padrão em cada um dos casos, pela média. 1. { } 19 , 18 , 32 , 25 , 15 , 12 A Para facilitar vamos colocar os valores em uma tabela: i x 25 , 25 - i x 2 25 , 25 - i x 12 13,25 175,5625 15 10,25 105,0625 18 7,25 52,5625 19 6,25 39,0625 25 0,25 0,0625 32 6,75 45,5625 å = 202 44 417,875 Para o cálculo do desvio padrão precisamos elevar ao quadrado os desvios em relação á média 08 , 3 08 , 3 5 , 9 44 88 , 417 ) ( 2 = Þ = = = Þ - = å å P P i P S S f x x S 2. Tabela 4.2.1 Número de faltas dos acadêmicos da Turma A Faltas Acadêmicos i i f x 4 - i x 2 4 - i x i i f x 2 4 - 2 15 30 2 4 60 3 10 30 1 1 10 5 8 40 1 1 8 6 6 36 2 4 24 9 4 36 5 25 100 total 43 172 202 Para o cálculo do Desvio padrão precisamos da soma dos quadrado dos módulos dos desvios multiplicado pela frequência, em seguida é só aplicarmos a fórmula: ( ) ( ) 19 , 2 81 , 4 42 202 1 43 4 1 8 1 2 1 2 = Þ = = - - = - - = å å = = S f x n f x x S j j j k j j j 3. Tabela 4.2.2. Notas da atividade 1, dos acadêmicos da Turma A Notas Acadêmicos i x i i f x 51 , 6 - i x i i f x 2 51 , 6 - 3,8 ├ 4,8 5 4,3 21,5 2,21 24,4205 4,8 ├ 5,8 6 5,3 31,8 1,21 8,7846 5,8 ├ 6,8 12 6,3 75,6 0,21 0,5292 6,8 ├ 7,8 15 7,3 109,5 0,79 9,3615 7,8 ├ 8,8 5 8,3 41,5 1,79 16,0205 total 43 279,9 59,1163 Para o cálculo do Desvio padrão precisamos da soma dos quadrado dos módulos dos desvios multiplicado pela frequência, em seguida é só aplicarmos a fórmula: ( ) ( ) 19 , 1 41 , 1 42 12 , 59 1 43 51 , 6 1 8 1 2 1 2 = Þ = = - - = - - = å å = = S f x n f x x S j j j k j j j 4.5 Interpretação do desvio padrão Neste item vamos apresentar duas regras para interpretação do desvio padrão: 1ª) Regra Empírica Para qualquer distribuição amostral com média x e desvio padrão S, tem-se: · O intervalo [ ] S x S x + - , contém entre 60% e 80% de todas as observações amostrais. A porcentagem aproxima-se de 70% para distribuições fortemente simétricas, chegando a 90% para distribuições fortemente assimétricas. · O intervalo [ ] S x S x 2 , 2 + - contém aproximadamente 95% das observações amostrais para distribuições simétricas e aproximadamente 100% para distribuições com assimetria elevada. · O intervalo [ ] S x S x 3 , 3 + - contém aproximadamente 100% das observações amostrais, para distribuições simétricas. 2º) Teorema de Tchebycheff Para qualquer distribuição amostral com media x e desvio padrão S, tem-se: · O intervalo [ ] S x S x 2 , 2 + - contém, no mínimo, 75% de todas as observações amostrais. · O intervalo [ ] S x S x 3 , 3 + - contém, no mínimo, 89% de todas as observações amostrais. Observação: O intervalo padrão é definido por um conjunto de valores (ou uma região) em torno da média aritmética, contidos num intervalo de amplitude “2S ” (duas vezes o desvio-padrão), ou seja, -S (antes da média) e +S (depois da média). Conforme estudos matemáticos, essa região engloba 68,26% dos valores da série ou dos dados pesquisados. Gráfico da zona de Normalidade pg 80 da apostila atual Exemplo: O restaurante “Sabor em kilo” fez um levantamento para saber o consumo médio e obteve média de 580 g e o desvio padrão de 210 g, calcule: a) a amplitude de intervalo da zona de normalidade; b) a amplitude dos 95% centrais. Solução: a) Zona de normalidade: de ) ( S x - até ) ( S x + Sendo x = 580 g e S = 210 g calcula-se o intervalo: ) ( S x - = 580 - 210 = 370 g ) ( S x + = 580 + 210 = 790 g Assim, a zona de normalidade é de 370 g até 790 g. Isso representa que 68% dos clientes do restaurante consomem entre 370 g e 790 g. b) amplitude dos 95% centrais: ) 2 ( S x - de até ) 2 ( S x + ) 2 ( S x - = 580 – 2.(210) = 160 g ) 2 ( S x + = 580 + 2.(210) = 1000 g Assim, a amplitude dos 95% centrais é de 160 g até 1000. Essa amplitude indica que 95% dos clientes consomem entre 160 g e 1000 g. 4.6 Intervalo Padrão ou Zona de Normalidade Como pudemos estudar no item 4.5 sobre a interpretação do Desvio Padrão, o Intervalo Padrão ou Zona de Normalidade engloba cerca de 68% da pesquisa realizada. Em muitos casos utilizamos o intervalo padrão para especificar com maior precisão o que realmente pode ser considerado padrão. Observamos esse fato nos exames de sangue que realizamos para saber se estamos dentro do padrão. Temos sempre um valor mínimo e um valor máximo na normalidade. Isso é facilmente percebido para vários fenômenos cotidianos Exemplo: Consideremos o exemplo: Número de faltas por mês dos funcionários da Empresa Coisas & tal agosto/08 Média calculada . / 2 func faltas x = Þ Desvio padrão . / 2 func faltas S P = Þ Para calcular o Intervalo padrão ou número padrão de faltas / mês dos funcionários usamos a fórmula: ( ) ( ) ( ) 4 ; 0 2 2 ; 2 2 ; Þ + - Þ + - P P S x S x Portanto, o número padrão de faltas por funcionários da Empresa Coisas&Tal é de 0 a 4. Exemplo: Consideremos o exemplo: Número de filhos dos funcionários da Empresa Total/08 Média calculada . / 2 func filhos x = Þ Desvio padrão . / 3 func filhos S P = Þ Para calcular o Intervalo padrão ou número padrão de faltas / mês dos funcionários usamos a fórmula: ( ) ( ) ( ) 5 ; 0 3 2 ; 3 2 ; Þ + - Þ + - P P S x S x Portanto, o número padrão de filhos por funcionários da Empresa Coisas&Tal é de 0 a 5. 4.7 Coeficiente de Variação de Pearson O desvio-padrão por si só não revela muita coisa. Assim, um desvio padrão pode ser considerado pequeno para uma média e para outra é extremamente grande. Por exemplo, um desvio-padrão de 40 pode ser considerado pequeno para uma média de 35, entretanto, se a média for 4, este se torna muito grande. Quando precisamos comparar duas ou mais séries de valores quanto à sua dispersão e variabilidade e esses conjuntos estão expressos em grandezas diferentes é preciso dispor de outra medida. Para contornar essas dificuldades e limitações, podemos caracterizar a dispersão ou variabilidade dos dados de maneira relativa ao seu valor médio. Essa medida que mede o grau de concentração dos valores em torno da média é denominada de Coeficiente de Variação. 100 . . × = x S V C onde S = desvio-padrão amostral e x = média amostral Podemos realizar interpretações do coeficiente de variação através de algumas regras empíricas: Se: C.V < 15% tem-se baixa dispersão Se: 15% < C.V. < 30% tem-se média dispersão Se: C.V > 30% tem-se elevada dispersão Podemos classificar as distribuições em homogêneas ou heterogêneas da seguinte forma: Distribuição homogênea: tem coeficiente da variação com baixa ou média dispersão (até 30% de variação) Distribuição heterogênea: tem coeficiente da variação com elevada dispersão (acima de 30% de variação) Exemplo . Na Empresa Carrefour, o salário médio dos homens é de R$ 1500,00 com desvio-padrão de R$ 650,00 e o salário médio das mulheres é de R$ 1200,00 com desvio padrão de 580,00. A dispersão relativa dos salários é maior para os homens? Solução: Homens: 1500 = H x e 650 = H S Mulheres 1200 = M x e 580 = M S Para os homens: % 3 , 43 1500 650 100 . . = = × = H H x S V C Para as mulheres: % 3 , 48 1200 580 100 . . = = × = M M x S V C Os Salários das mulheres têm dispersão relativamaior que os salários dos homens. As duas distribuições apresentam alta dispersão (C.V. > 30%). LISTA DE EXERCÍCIOS 4.1 DA APOSTILA ATUAL ATIVIDADE 4.1 DA APOSTILA ATUAL _1303129931.unknown _1303216092.unknown _1303218812.unknown _1303277122.unknown _1303557938.unknown _1303558369.unknown _1303559165.unknown _1303560045.unknown _1303560402.unknown _1303560704.unknown _1303560917.unknown _1303560526.unknown _1303560388.unknown _1303559476.unknown _1303559801.unknown _1303559074.unknown _1303559152.unknown _1303558867.unknown _1303558915.unknown _1303558815.unknown _1303558457.unknown _1303558753.unknown _1303558245.unknown _1303558303.unknown _1303552858.unknown _1303555606.unknown _1303557765.unknown _1303557535.unknown _1303557703.unknown _1303556040.unknown _1303554249.unknown _1303554773.unknown _1303554823.unknown _1303555168.unknown _1303554884.unknown _1303554787.unknown _1303554338.unknown _1303554377.unknown _1303554256.unknown _1303553822.unknown _1303554197.unknown _1303554216.unknown _1303553726.unknown _1303552597.unknown _1303552712.unknown _1303552832.unknown _1303552850.unknown _1303552826.unknown _1303552642.unknown _1303277177.unknown _1303277160.unknown _1303275989.unknown _1303276308.unknown _1303276965.unknown _1303277088.unknown _1303276935.unknown _1303276114.unknown _1303276246.unknown _1303276072.unknown _1303276101.unknown _1303274463.unknown _1303275710.unknown _1303275797.unknown _1303274986.unknown _1303273777.unknown _1303273998.unknown _1303273718.unknown _1303217101.unknown _1303218072.unknown _1303218143.unknown _1303218378.unknown _1303218043.unknown _1303217384.unknown _1303217943.unknown _1303217267.unknown _1303216509.unknown _1303216819.unknown _1303216973.unknown _1303216679.unknown _1303216319.unknown _1303216468.unknown _1303216213.unknown _1303132357.unknown _1303214482.unknown _1303215495.unknown _1303215571.unknown _1303216022.unknown _1303215544.unknown _1303215292.unknown _1303215437.unknown _1303215461.unknown _1303214730.unknown _1303215271.unknown _1303133376.unknown _1303214222.unknown _1303214433.unknown _1303214463.unknown _1303214287.unknown _1303133454.unknown _1303133061.unknown _1303133229.unknown _1303132930.unknown _1303130150.unknown _1303131320.unknown _1303131427.unknown _1303132150.unknown _1303131408.unknown _1303130610.unknown _1303131119.unknown _1303130247.unknown _1303130578.unknown _1303129997.unknown _1303130132.unknown _1303129939.unknown _1303128238.unknown _1303129640.unknown _1303129867.unknown _1303129915.unknown _1303129795.unknown _1303129070.unknown _1303129522.unknown _1303129601.unknown _1303129217.unknown _1303128531.unknown _1303128733.unknown _1303128813.unknown _1303128569.unknown _1303128281.unknown _1303127869.unknown _1303128108.unknown _1303128159.unknown _1303128064.unknown _1156764870.unknown _1303126604.unknown _1303127835.unknown _1218464817.unknown _1218962890.unknown _1218962941.unknown _1218473805.unknown _1218464592.unknown _1074293253.unknown _1074539128.unknown _1074293196.unknown
Compartilhar