Estatistica 06 Medidas de Dispersão

Estatística e Probababilidade para Ciências Exatas

•

UFPA

0

Gabriela Torres

07.06.2016

Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original

Medidas de Dispersão
Elionai Sobrinho
INTRODUÇÃO
 A principal utilidade das medidas de tendência central, quando calculadas para determinado conjunto de dados, é a determinação de valores característicos ou típicos deste conjunto. 
Entretanto. a informação fornecida por tais medidas é incompleta. se não for acompanhada de alguma informação sobre a variabilidade dos dados. 
Esta informação é obtida através do cálculo de medidas de dispersão. ou variabilidade.
1– Amplitude Total
Seja um conjunto de dados ordenados {x(1) . x(2) . ... . x(n) }. onde x(1) e x(n) representam o valor mínimo e o valor máximo. respectivamente. do conjunto. A amplitude total é dada por:
Exemplo 1 – A amplitude total para o conjunto de dados do Quadro 1 é: R = 44 – 20 = 24 mm. 
Quadro 1 – Larguras (em mm) das sépalas 
observadas em 150 exemplares de flores iris.
2- Desvio Médio
Seja um conjunto de dados {x1 . x2 . ... . xn }. não necessariamente ordenados. Então o desvio médio dos valores do conjunto em relação à sua média é dado por:
Exemplo 2 – O Quadro 2 mostra os teores (%) de vanádio encontrados em uma amostra de sete estratos de óleo cru extraídas de solo do tipo “Wilhelm sandstone”.
Quadro 2 – Teores de vanádio.
3 – Variância
Seja um conjunto de dados {x1 . x2 . ... . xn }, não necessariamente ordenados, Assim como o desvio médio, a variância é gerada a partir das diferenças dos valores do conjunto de dados em relação à média do mesmo. 
Entretanto, é necessário ter em mente a natureza dos dados estudados, mais
Especificamente, se os mesmos constituem uma população ou uma amostra. Para o primeiro caso. e representando a média populacional por μ, a variância é dada por:
Quando o conjunto de dados {x1 . x2 . ... . xn } representa uma amostra. calcula-se o estimador corrigido para a variância amostral, dado por:
Exemplo 3 – Calcular a variância para a amostra de teores de vanádio. mostrados no Quadro 2.
Quadro 2 – Teores de vanádio
4 – Desvio Padrão
É dado pela raiz quadrada da variância. Deste modo, para o cálculo do desvio padrão, deve-se levar em consideração a natureza dos dados. É a medida de dispersão mais utilizada para a descrição de dados, juntamente com a média aritmética.
Seja o conjunto de dados {x1 . x2 . ... . xn }, não necessariamente ordenados. Se o conjunto representa uma população. o desvio padrão é dado por:
Se o conjunto representa uma amostra. o estimador corrigido é dado por:
Exemplo 4 – Calcular o desvio padrão para os dados do Quadro 2.
Quadro 2 – Teores de vanádio
5 – Coeficiente de Variação
É definido como a razão entre o desvio padrão e a média. isto é
Exemplo 5 – Calcular o coeficiente de variação para os dados do Quadro 2.
6 – Coeficiente de Assimetria
Já foi visto que uma distribuição de freqüências pode ser assimétrica positiva. negativa ou simétrica. neste caso também chamada distribuição normal. 
O coeficiente de assimetria de Pearson mede o afastamento que caracteriza o tipo de assimetria. Este coeficiente é dado por:
7 – Coeficiente de Curtose
O coeficiente de curtose mede o achatamento de uma distribuição de freqüências. em comparação com uma distribuição normal. Na prática só é calculado para distribuições simétricas. ou muito aproximadamente simétricas. O coeficiente percentílico de curtose é dado por:
Para uma distribuição normal. o coeficiente de curtose é C = 0.263. Se o valor calculado para C é inferior a 0.263. diz-se que a distribuição é leptocúrtica (alongada). Se o valor é superior a 0.263. diz-se que a distribuição é platicúrtica (achatada). As três situações são ilustradas nas figuras a seguir:
A caracterização do tipo de curtose auxilia na avaliação da dispersão dos dados do conjunto. Uma distribuição leptocúrtica possui dispersão baixa. enquanto uma distribuição platicúrtica possui dispersão elevada. tomando como referência a dispersão verificada em uma distribuição normal.
Exercícios
O Quadro abaixo contém os teores de ácido oléico observados em 120 observações de óleos vegetais.
a) Construir uma distribuição de frequências para os dados.
b) Traçar o histograma.
c) Calcular a média aritmética.
d) Calcular a mediana.
e) Calcular a moda.
f) Calcular o desvio padrão.
g) Estudar a assimetria da distribuição.
h) O cálculo do coeficiente de curtose é justificado para este conjunto de dados ? Por quê ?
22.3	25.1	26.8	30.4	34.8	52.2
22.7	25.1	27	31	34.9	53.2
22.8	25.2	27.1	31.1	35	54.6
22.9	25.3	27.1	31.1	35	55.5
23.1	25.3	27.1	31.1	35	55.9
23.1	25.3	27.2	31.1	35.2	56.6
23.2	25.5	27.4	31.1	35.2	57.2
23.2	25.6	27.8	31.7	35.2	58
24	25.7	28.3	31.7	35.4	58.2
24.1	25.7	28.3	31.8	35.8	59
24.1	25.8	28.3	31.8	37.4	59.1
24.4	25.8	29.1	32.1	37.7	59.2
24.4	25.9	29.4	32.6	38.4	59.2
24.4	26	29.5	32.9	39.3	59.3
24.5	26	29.6	33.6	39.7	61.6
24.5	26.1	29.6	33.6	40.1	61.8
24.6	26.1	29.8	33.9	41.4	62.6
24.6	26.4	29.9	34	43	64.9
24.7	26.5	30.3	34.4	43.3	77.8
24.9	26.7	30.4	34.5	45.7	80.6