Buscar

ESTAT MÓDULO 04

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

ESTATÍSTICA-MÓDULO-04 MANUEL 1 
MÓDULO- 04 - MEDIDAS DE DISPERSÃO 
 
As medidas de posição (média, mediana e moda) não são suficientes para caracterizar 
perfeitamente um conjunto de dados. Duas distribuições (dois conjuntos de dados) podem ter a 
mesma média, mediana e moda mas serem diferentes. Em uma delas, os valores podem se 
concentrar fortemente em torno da média, na outra, podem se espalhar nos dois lados desse 
valor médio. Os conjuntos X e Y a seguir exemplificam este fato. 
 
X = 11; 9; 8; 12; 7; 10; 10; 13 
 
Y = 2; 18; 1; 5; 19; 5; 0; 30 
 
Calculando as médias dos conjuntos X e Y obtemos: 
 
8
80
8
1310107128911




n
x
x
i
  x  10 
 
y
y
n
i
 
      

 2 18 1 5 19 5 0 30
8
80
8
  y  10 
 
Apesar dos dois conjuntos de dados terem a mesma média, é fácil notar que o conjunto X é 
mais homogêneo que o conjunto Y. Ou seja, os valores do conjunto X, “variam menos” que os 
valores do conjunto Y. 
 
Dispersão (variabilidade) - é a maior ou menor diversificação dos valores de uma variável, em 
torno de um valor de tendência central tomado como referência (média ou mediana). As 
medidas de dispersão mais usadas são: amplitude total, desvio médio, desvio-quartil, variância, 
desvio padrão e coeficiente de variação. 
 
 
Amplitude Total - é a diferença entre o maior e o menor valor observado. Se os dados forem 
distribuídos em intervalos de classe, será a diferença entre o limite superior da última classe e 
o limite inferior da primeira classe. 
 
Em relação a amplitude total pode-se fazer as seguintes observações: 
 
1. É afetada por valores extremos. 
2. Depende do tamanho da amostra. 
3. Apresenta muita variação de uma amostra para outra. 
 
Desvio Médio - é a média aritmética dos desvios absolutos (módulos) em relação a média 
aritmética ou a mediana. 
 
Dados não Agrupados 
 
Dm
x x
n
i


 
 
Dados Agrupados 
 

 

i
ii
f
fxx
Dm 
 
ESTATÍSTICA-MÓDULO-04 MANUEL 2 
Exemplo-1: Determinar a amplitude total e o desvio médio do seguinte conjunto de dados: 
 
X = 4; 10; 2; 6; 8 
 
Amplitude total: Ampl = 10 - 2 = 8 
 
Média aritmética: x
x
n
i
 
   

 4 10 2 6 8
5
30
5
 = 6 
 
Como os dados são não agrupados vem: 
 
4,2
5
12
5
68666261064


Dm 
 
Variância - é a média aritmética dos quadrados dos desvios em relação à média. 
 
Dados não Agrupados 
 
S
x x
n
i2
2

( )
 , onde n = número de observações 
 
Desenvolvendo-se a expressão acima, obtém-se uma fórmula mais simples para a variância: 
 
S
x
n
x
n
i i2
2
2
 






 
 ou seja: S
x
n
x
i2
2
2 

 
 
Dados Agrupados 
 
Sem Intervalo de Classe 
22
2







 







i
ii
i
ii
f
xf
f
xf
S 
 
Como x
f
xf
i
ii




 , vem: 
2
2
2 x
f
xf
S
i
ii





 
 
 
Com Intervalo de Classe 
 
22
2







 







i
ii
i
ii
f
xf
f
xf
S ou 
2
2
2 x
f
xf
S
i
ii





 
 
Obs: A única diferença para o anterior (sem intervalo de classe) é que neste caso, os valores 
de xi correspondem aos pontos médios de cada intervalo de classe. 
 
Através da fórmula simplificada acima, pode-se então definir a variância como sendo: 
 
“a média dos quadrados, menos o quadrado da média” 
 
Como a variância é calculada a partir dos quadrados dos desvios, ela possui uma dimensão 
diferente da dos dados originais. Objetivando eliminar este inconveniente, usa-se outra medida 
de dispersão chamada desvio-padrão. 
ESTATÍSTICA-MÓDULO-04 MANUEL 3 
Desvio Padrão - é a raiz quadrada da variância. 
Temos: S = 
2S 
 
ou 

 

i
ii
f
fxx
S
2)(
 
 
Exemplo-2: Calcular a variância e o desvio-padrão do seguinte conjunto de dados 
 
X = 2; 4; 3; 6; 10 (Dados não agrupados) 
Temos, média aritmética: x 
25
5
  x = 5 
Como os dados são não agrupados a variância é dada por: S
x x
n
i2
2

( )
 
Substituindo os valores vem: 
8
5
40
5
)510()56()53()54()52( 222222 

S 
 
O desvio-padrão é dado por: S = 8 2 82 , 
 
Exemplo-3: Achar a variância e o desvio-padrão da seguinte distribuição de freqüência: 
 
Classe i Estatura (cm) fi 
1 150 ├ 154 4 
2 154 ├ 158 9 
3 158 ├ 162 11 
4 162 ├ 166 8 
5 166 ├ 170 5 
6 170 ├ 174 3 
  40 
 
Precisamos abrir na tabela novas colunas para xi (ponto médio), fi xxi e fi x xi
2
 
 
Classe ì Estatura (cm) fi xi fi xxi fi xxi
2
 
1 150 ├ 154 4 152 608 92416 
2 154 ├ 158 9 156 1404 219024 
3 158 ├ 162 11 160 1760 281600 
4 162 ├ 166 8 164 1312 215168 
5 166 ├ 170 5 168 840 141120 
6 170 ├ 174 3 172 516 88752 
  40 6440 1.038.080 
 
Como os dados estão distribuídos em intervalos devemos usar a fórmula: 
 
22
2







 







i
ii
i
ii
f
xf
f
xf
S , onde os xi são os pontos médios de cada intervalo. 
Substituindo os valores da tabela obtém-se: 
 
 S 2
2
1038080
40
6440
40
 





 = 25952 - 25921 = 31 cm2 
 
O desvio-padrão é a raiz quadrada da variância. 
Assim, S = 31 5 57 , cm 
ESTATÍSTICA-MÓDULO-04 MANUEL 4 
Correção da Fórmula da Variância para o caso de Amostra 
 
Quando se trabalha com uma amostra deve-se usar a seguinte fórmula para o cálculo da 
variância: 
 
 
 
 
A razão para este procedimento reside no fato de que, utilizando-se (n-1) obtém-se uma melhor 
estimativa do parâmetro da população. Para amostras grandes (n>30) não há grandes 
diferenças nos resultados proporcionados pela utilização de n ou (n-1) no denominador. Este 
fator de correção é conhecido como fator de correção de Bessel: 
n
n 1
 
Obs: Tanto o desvio-padrão como a variância são usados como medidas de dispersão ou 
variabilidade. O uso de uma ou de outra dependerá da finalidade que se tenha em vista. A 
variância é uma medida que tem pouca utilidade como estatística descritiva, porém é 
extremamente importante na inferência estatística e no uso de amostras. 
 
Propriedades da Variância 
 
1. Somando-se ou subtraindo-se uma constante a todos os elementos de um conjunto de 
 dados, a variância deste conjunto não de altera. 
 
2. Multiplicando-se ou dividindo-se todos os elementos de um conjunto de dados por uma 
constante (diferente de zero), a variância deste conjunto fica multiplicada ou dividida pelo 
quadrado desta constante. 
 
Propriedades do Desvio Padrão 
 
1. Somando-se ou subtraindo-se uma constante a todos os valores de um conjunto de dados, 
 o desvio padrão não se altera. 
 
2. Multiplicando-se ou dividindo-se todos os valores de um conjunto de dados por uma 
constante (diferente de zero), o desvio padrão ficará multiplicado ou dividido por essa 
constante. 
 
3. O desvio-padrão não tem interpretação física como ocorre com a média, à mediana e a 
moda. 
 
4. Em uma distribuição normal tem-se entre: 
 
 [ x - S , x + S ] - 68,25% das observações 
 
 [ x - 2S , x + 2S ] - 95,46% das observações 
 
 [ x - 3S , x + 3S ] - 99,73% das observações 
 
1
1
2
2





n
xx
S
n
i
i
ESTATÍSTICA-MÓDULO-04 MANUEL 5 
Coeficiente de Variação - algumas medidas estatísticas quando observadas isoladamente 
não trazem muita informação. Dessa forma, um desvio padrão de 5 unidades pode ser 
considerado pequeno para um conjunto de valores cuja média é 500, no entanto, se a média 
for igual a 50 o mesmo não pode ser dito. Por outro lado, por ser o desvio padrão expresso na 
mesma unidade que os dados originais, é complicado o seu uso para efeito de comparação da 
dispersão entre dois conjuntos de dados expressos em unidades diferentes. Objetivando-se 
contornar essas dificuldades e limitações, criou-se uma nova medida chamada Coeficiente de 
Variação (CV) assim definida: 
 
 
(Desvio Padrão dividido pela Média Aritmética) 
(Coeficiente de Variação de Pearson) 
 
 
 
Exemplo-8: Para um conjunto de dados relativos a estaturas têm-se:x =161 cm e S=5,57 cm. 
 
Achar o CV desteconjunto de dados. 
 
Temos: 
x
S
CV  CV = 5 57
161
,
 CV = 0,0345 ou 3,45% 
 
Exemplo-4: Consideremos os resultados das medidas de altura e peso de um mesmo grupo de 
indivíduos exibidos na tabela abaixo: 
 
 
Medidas x S 
Estatura 175 cm 5,0 cm 
Peso 68 Kg 2,0 Kg 
 
 
Qual apresenta maior grau de dispersão ? 
 
Temos: 
 
 CVe = 
5
175
 = 0,0285 (estaturas) 
 
 CVp = 
2
68
 = 0,0294 (pesos) 
 
 
Logo, os pesos (2,94%) apresentam maior grau de dispersão relativa que as alturas (2,85%), 
embora a dispersão absoluta (desvio padrão) seja maior para as alturas. 
 
 
Propriedades do Coeficiente de Variação 
 
1. Somando-se uma constante positiva a todos os elementos de um conjunto de dados o 
coeficiente de variação diminui. No entanto, não é possível determinar o novo valor a partir 
apenas do valor original. 
 
2. Subtraindo-se uma constante positiva de todos os elementos de um conjunto de dados o 
coeficiente de variação aumenta. No entanto, não é possível determinar o novo valor a partir 
apenas do valor original. 
 
3. Multiplicando-se ou dividindo-se todos os elementos de um conjunto de dados por uma 
constante positiva, o coeficiente de variação não se altera. 
x
S
CV 

Outros materiais