Baixe o app para aproveitar ainda mais
Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
Medidas de Dispersão Elionai Sobrinho INTRODUÇÃO A principal utilidade das medidas de tendência central, quando calculadas para determinado conjunto de dados, é a determinação de valores característicos ou típicos deste conjunto. Entretanto. a informação fornecida por tais medidas é incompleta. se não for acompanhada de alguma informação sobre a variabilidade dos dados. Esta informação é obtida através do cálculo de medidas de dispersão. ou variabilidade. 1– Amplitude Total Seja um conjunto de dados ordenados {x(1) . x(2) . ... . x(n) }. onde x(1) e x(n) representam o valor mínimo e o valor máximo. respectivamente. do conjunto. A amplitude total é dada por: Exemplo 1 – A amplitude total para o conjunto de dados do Quadro 1 é: R = 44 – 20 = 24 mm. Quadro 1 – Larguras (em mm) das sépalas observadas em 150 exemplares de flores iris. 2- Desvio Médio Seja um conjunto de dados {x1 . x2 . ... . xn }. não necessariamente ordenados. Então o desvio médio dos valores do conjunto em relação à sua média é dado por: Exemplo 2 – O Quadro 2 mostra os teores (%) de vanádio encontrados em uma amostra de sete estratos de óleo cru extraídas de solo do tipo “Wilhelm sandstone”. Quadro 2 – Teores de vanádio. 3 – Variância Seja um conjunto de dados {x1 . x2 . ... . xn }, não necessariamente ordenados, Assim como o desvio médio, a variância é gerada a partir das diferenças dos valores do conjunto de dados em relação à média do mesmo. Entretanto, é necessário ter em mente a natureza dos dados estudados, mais Especificamente, se os mesmos constituem uma população ou uma amostra. Para o primeiro caso. e representando a média populacional por μ, a variância é dada por: Quando o conjunto de dados {x1 . x2 . ... . xn } representa uma amostra. calcula-se o estimador corrigido para a variância amostral, dado por: Exemplo 3 – Calcular a variância para a amostra de teores de vanádio. mostrados no Quadro 2. Quadro 2 – Teores de vanádio 4 – Desvio Padrão É dado pela raiz quadrada da variância. Deste modo, para o cálculo do desvio padrão, deve-se levar em consideração a natureza dos dados. É a medida de dispersão mais utilizada para a descrição de dados, juntamente com a média aritmética. Seja o conjunto de dados {x1 . x2 . ... . xn }, não necessariamente ordenados. Se o conjunto representa uma população. o desvio padrão é dado por: Se o conjunto representa uma amostra. o estimador corrigido é dado por: Exemplo 4 – Calcular o desvio padrão para os dados do Quadro 2. Quadro 2 – Teores de vanádio 5 – Coeficiente de Variação É definido como a razão entre o desvio padrão e a média. isto é Exemplo 5 – Calcular o coeficiente de variação para os dados do Quadro 2. 6 – Coeficiente de Assimetria Já foi visto que uma distribuição de freqüências pode ser assimétrica positiva. negativa ou simétrica. neste caso também chamada distribuição normal. O coeficiente de assimetria de Pearson mede o afastamento que caracteriza o tipo de assimetria. Este coeficiente é dado por: 7 – Coeficiente de Curtose O coeficiente de curtose mede o achatamento de uma distribuição de freqüências. em comparação com uma distribuição normal. Na prática só é calculado para distribuições simétricas. ou muito aproximadamente simétricas. O coeficiente percentílico de curtose é dado por: Para uma distribuição normal. o coeficiente de curtose é C = 0.263. Se o valor calculado para C é inferior a 0.263. diz-se que a distribuição é leptocúrtica (alongada). Se o valor é superior a 0.263. diz-se que a distribuição é platicúrtica (achatada). As três situações são ilustradas nas figuras a seguir: A caracterização do tipo de curtose auxilia na avaliação da dispersão dos dados do conjunto. Uma distribuição leptocúrtica possui dispersão baixa. enquanto uma distribuição platicúrtica possui dispersão elevada. tomando como referência a dispersão verificada em uma distribuição normal. Exercícios O Quadro abaixo contém os teores de ácido oléico observados em 120 observações de óleos vegetais. a) Construir uma distribuição de frequências para os dados. b) Traçar o histograma. c) Calcular a média aritmética. d) Calcular a mediana. e) Calcular a moda. f) Calcular o desvio padrão. g) Estudar a assimetria da distribuição. h) O cálculo do coeficiente de curtose é justificado para este conjunto de dados ? Por quê ? 22.3 25.1 26.8 30.4 34.8 52.2 22.7 25.1 27 31 34.9 53.2 22.8 25.2 27.1 31.1 35 54.6 22.9 25.3 27.1 31.1 35 55.5 23.1 25.3 27.1 31.1 35 55.9 23.1 25.3 27.2 31.1 35.2 56.6 23.2 25.5 27.4 31.1 35.2 57.2 23.2 25.6 27.8 31.7 35.2 58 24 25.7 28.3 31.7 35.4 58.2 24.1 25.7 28.3 31.8 35.8 59 24.1 25.8 28.3 31.8 37.4 59.1 24.4 25.8 29.1 32.1 37.7 59.2 24.4 25.9 29.4 32.6 38.4 59.2 24.4 26 29.5 32.9 39.3 59.3 24.5 26 29.6 33.6 39.7 61.6 24.5 26.1 29.6 33.6 40.1 61.8 24.6 26.1 29.8 33.9 41.4 62.6 24.6 26.4 29.9 34 43 64.9 24.7 26.5 30.3 34.4 43.3 77.8 24.9 26.7 30.4 34.5 45.7 80.6
Compartilhar