Baixe o app para aproveitar ainda mais
Prévia do material em texto
Medidas de Dispersão aula08-jemc Página 1 Introdução Os fenômenos em cuja análise intervém o método estatístico, bem como os dados estatísticos a eles referentes, caracterizam-se tanto pela sua semelhança quanto pela sua variabilidade. Assim é que o cálculo de um promédio só se justifica em razão dessa variabilidade presente na natureza. Não há razão alguma para se calcular a média de um conjunto de dados onde não haja variação desses elementos. Ocorre, todavia que, se a variabilidade dos dados for muito grande, sua média terá um grau de confiabilidade tão pequeno que será inútil calcula-la. É importante ressaltar nessa altura que a análise completa dos dados requer não apenas sua apresentação, através de gráficos e tabelas, ou o cálculo de promédios ou outras medidas de posição. Caracterizar um conjunto de valores apenas através de uma média, por exemplo, é descreve-lo inadequadamente, uma vez que os dados diferem entre si em maior ou menor grau. Para avaliar o grau de variabilidade ou dispersão dos valores de um conjunto numérico, lançaremos mão das estatísticas denominadas medidas de dispersão. Essas nos proporcionarão um conhecimento mais completo do fenômeno a ser analisado, permitindo estabelecer comparações entre os fenômenos de mesma natureza e mostrando até que ponto os valores se distribuem acima ou abaixo da tendência central. Iremos a tratar as seguintes medidas de dispersão absoluta: a) Amplitude total, b) Desvio médio, c) Variância e desvio–padrão. Amplitude Total ou Intervalo Total. Símbolo: At Definição: A amplitude total de um conjunto de números é a diferença entre os valores extremos do conjunto. Medidas de Dispersão aula08-jemc Página 2 Exemplo: Calcular a amplitude total dos seguintes conjuntos de números: }5,3,2,3,4{ }23,22,21,20,19,18,17{ }45,34,25,20,13,12,10{ C B A Para o conjunto A, temos At = 45–10=35 Se os dados vierem dispostos em uma tabela de freqüências, com os valores agrupados em classes, há duas formas de se verificar a amplitude total: Primeiro método: At = Ponto médio da última classe – Ponto médio da primeira classe. Segundo Método: At = Limite superior da última classe – Limite inferior da primeira classe. Exemplo Calcular a amplitude total dos valores dispostos na tabela. Classes fj xj 10 |––20 5 15 20 |––30 12 25 30 |––40 20 35 40 |––50 14 45 50 |––60 10 55 60 |––70 4 65 n= 65 Restrições ao uso da Amplitude Total Embora a amplitude total seja a mais simples das medidas de dispersão, há uma forte restrição ao seu uso em virtude de sua grande instabilidade, uma vez que ela leva em conta apenas os valores extremos da série. Medidas de Dispersão aula08-jemc Página 3 Desvio Médio Símbolo: Dm O desvio médio dos desvios é igual à medida aritmética dos valores absolutos dos desvios tomados em relação a uma das seguintes medidas de tendência central: media ou mediana. a) Desvio Médio para dados brutos Quando os valores não vierem dispostos em uma tabela de freqüências, o desvio médio será calculado, de acordo com a definição, através do emprego de uma das fórmulas seguintes: n xx D n i i m 1 , onde di = (xi - x )= desvio em relação à média aritmética. n Mdx D n i i m 1 , onde di =(xi - Md)=desvio em relação à mediana. b) Desvio Médio para Dados Tabulados Se os valores vierem dispostos em uma tabela de freqüências, agrupados ou não em classes, serão usadas as seguintes fórmulas: Em relação à média n fxx D k j jj m 1 , onde xj representa um valor individual ou um ponto médio da classe. Em relação à mediana mD n fMdx k j jj 1 , onde xj representa um valor individual ou um ponto médio da classe. Medidas de Dispersão aula08-jemc Página 4 Exercícios 1- Calcular o desvio médio dos conjuntos de números apresentados no exemplo anterior. }5,3,2,3,4{ }23,22,21,20,19,18,17{ }45,34,25,20,13,12,10{ C B A Os dados necessários para o cálculo do desvio médio são: 20 714,22 7 45342520131210 A A Md x Desvio médio do conjunto A xj xj- x | xj- x | xj-Md | xj-Md| 10 10-22,714= -12,714 12,714 10 - 20= -10 10 12 -10.714 -10.714 -8 8 13 -9,7144 -9,7144 -7 7 20 -2,714 -2,714 0 0 25 2,286 2,286 5 5 34 11,286 11,286 14 14 45 22,286 22,286 25 25 0)( xx j 714,71xx j 69 xx j 2- Calcular o desvio médio utilizando os dados mostrados na seguinte tabela: Cosumo (kwh) Número de usuários (fj) Freqüência acumulada (Fj) 5 |–– 25 4 4 25 |–– 45 6 10 45 |–– 65 14 24 65 |–– 85 26 50 85 |–– 105 14 64 105 |–– 125 8 72 125 |–– 145 6 78 145 |–– 165 2 80 Total 80 Medidas de Dispersão aula08-jemc Página 5 Consumo Número de usuários xj xj- x jj fxx xj - Md jj fMdx Fj 5 |––25 4 15 -64,5 258 -62,31 249,24 4 25 |––45 6 35 -44,5 267 -42,31 253,86 10 45 |––65 14 55 -24,5 343 -22,31 312,34 24 65 |––85 26 75 -4,5 117 -2,31 60,06 50 85 |––105 14 95 15,5 217 17,69 247,66 64 105 |––125 8 115 35,5 284 37,69 301,52 72 125 |––145 6 136 55,5 333 57,69 5346,14 78 145 |––165 2 155 75,5 151 77,69 155,38 80 Total 1970 1926,2 Cálculo pela média: 625,24 80 1970 80 5,79 8 1 j jj m fx D Cálculo pela mediana: 08,24 80 2,1926 80 3,77 8 1 j jj m fx D Observações: 1- O desvio médio resulta mais vantajoso que as medidas de dispersão precedentes, principalmente pelo fato de, em seu cálculo, levar em consideração todos os valores da distribuição. 2- O desvio médio, calculado levando-se em consideração os desvios em torno da mediana, é mínimo, ou seja, é menor do que qualquer desvio médio calculado com base em qualquer outra medida de tendência central. 3- Apesar de o desvio médio expressar aceitavelmente a dispersão de uma amostra, não é tão freqüentemente empregado como o desvio–padrão. Medidas de Dispersão aula08-jemc Página 6 Desvio–Padrão Símbolo: S O desvio–padrão é a medida de dispersão mais usada, tendo em comum com o desvio médio o fato de em ambos serem considerados os desvios com relação a x . Só que, no cálculo do desvio–padrão, em lugar de serem usados os valores absolutos das discrepâncias ou desvios calculam-se os quadrados deste. Desvio–Padrão para dados brutos Seja um conjunto de números X, n xx n d S n i i n i i 1 2 1 2 )( Quando se quer representar uma descrição da amostra e não da população, caso mais freqüente na estatística, o denominador da expressão anterior será igual a n-1, em vez de n. Além do mais, quando o valor dos dados excede 30, existe pouca diferença se colocarmos n ou n-1. 1 )( 1 1 2 1 2 n xx n d S n i i n i i
Compartilhar