Buscar

4-Medidas Descritivas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 3, do total de 66 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 6, do total de 66 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 9, do total de 66 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Prévia do material em texto

� Medidas de localização, posição ou tendência central
Medidas DescritivasMedidas Descritivas
� Medidas de localização, posição ou tendência central
� Medidas separatrizes
� Medidas de variação ou dispersão
� Medidas de formato
1
Medidas Medidas DescritivasDescritivas
Objetivo Objetivo →→→→→→→→ reduzir um conjunto de dados numéricos a 
um pequeno grupo de valorespequeno grupo de valores que deve fornecerdeve fornecer toda a toda a 
informação relevanteinformação relevante a respeito desses dados
�������� Existe uma grande variedade de medidas descritivas
Como escolher a mais adequada?
� Com que objetivo a medida está sendo obtida?Com que objetivo a medida está sendo obtida?
informação relevanteinformação relevante a respeito desses dados
2
��Existem valores atípicos que podem afetáExistem valores atípicos que podem afetá--la la 
exageradamente?exageradamente?
� O propósito da análise é meramente descritivo O propósito da análise é meramente descritivo 
ou planejaou planeja--se fazer inferências?se fazer inferências?
� Também denominadas medidas de tendência central ou 
medidas de posição.
� Indicam um ponto central onde, geralmente, está 
Medidas de localizaçãoMedidas de localização
� Indicam um ponto central onde, geralmente, está 
localizada a maioria das observações.
3
Medidas de localizaçãoMedidas de localização
Objetivo Objetivo →→→→→→→→ representar o ponto de equilíbrioponto de equilíbrio ou
o centrocentro ou o ponto de concentraçãoponto de concentração
�� MédiaMédia aritméticaaritmética
�� MedianaMediana
o centrocentro ou o ponto de concentraçãoponto de concentração
de uma distribuição
Medidas de localização mais utilizadas:
4
�� MedianaMediana
�� ModaModa
�������� facilidade de cálculo e de compreensão
Média aritméticaMédia aritmética
Medida mais conhecida e utilizada:
�������� propriedades matemáticas e estatísticas
SimplesSimples→→→→→→→→ todos os valores 
participam do cálculo 
com o mesmo pesoMédia aritméticaMédia aritmética
5
PonderadaPonderada→→→→→→→→
com o mesmo peso
pelo menos um dos 
valores participa com 
peso diferente
Média aritméticaMédia aritmética
Média aritmética simplesMédia aritmética simples
Para um conjunto de nn valores:
xi = x1, x2, ..., xn
Quando falarmos 
simplesmente média – é 
dela que estamos falando
=x
xi = x1, x2, ..., xn
soma de todos os valoressoma de todos os valores
total de valores somadostotal de valores somados
Exemplo:Exemplo:
n
∑ ix
6
X = tempo para realizar uma tarefa (min)
xi = 4, 5, 7, 9, 10
7
5
35
5
109754
x ==
++++
= min
Média aritmética ponderadaMédia aritmética ponderada
Temos um conjunto de valores e um conjunto de pesos:
xi = x1, x2, ..., xn
pii = p1, p2, ..., pn
=px
pii = p1, p2, ..., pn
soma de produtos de valores e pesossoma de produtos de valores e pesos
Exemplo:Exemplo:
soma dos pesossoma dos pesos∑ ip
∑ ii p x
7
X = nota
xii = 7, 8, 6, 10
pii = 2, 2, 1, 1
1122
110162827
xp +++
×+×+×+×
=
7,67
6
46
xp ==
Propriedades da média aritméticaPropriedades da média aritmética
11aa propriedadepropriedade:: A média de um conjunto de dados que
não varia, ou seja, cujos valores são uma constante, é anão varia, ou seja, cujos valores são uma constante, é a
própria constante.
 7 7, 7, 7, 7,xi =
Verificação numérica:Verificação numérica:
8
7x =
22aa propriedade:propriedade: Ao somar uma constante c por todos os 
valores de um conjunto de dados, sua média também é 
somada por esta constante.
xi = 4, 5, 7, 9, 10 7x =
x+2 = 6, 7, 9, 11, 12
Somar c=2Somar c=2
Verificação numérica:Verificação numérica:
9
xi+2 = 6, 7, 9, 11, 12
n
2)(x
x i2x
∑ +
=+ 95
45
5
1211976
==
++++
=
cxx
27x
cx
2x
+=
+=
+
+
33aa propriedade:propriedade: Ao multiplicar uma constante c por todos os 
valores de um conjunto de dados, sua média também é 
multiplicada por esta constante.
xi = 4, 5, 7, 9, 10 7x =
Verificação numérica:Verificação numérica:
Multiplicar por c=2Multiplicar por c=2
10
2xi = 8, 10, 14, 18, 20
n
2x
x i2x
∑
= 145
70
5
201814108
==
++++
=
xcx
72x
cx
2x
=
×=
44aa propriedadepropriedade:: A soma de todos os desvios em relação à
média de um conjunto de valores é nula.
∑ =− 0)x(xi
desviodesviodesviodesvio
diferença entre a observação e a média aritméticadiferença entre a observação e a média aritmética
Verificação numérica:Verificação numérica:
=−74 --33
11
xi = 4, 5, 7, 9, 10
7x =
=−75
=−77
=−79
=−710
)x(xi −
--22
00
22
33
SOMA = 0
55aa propriedadepropriedade:: A soma dos quadrados dos desvios em
relação a uma constante c é mínima quando c = .x
∑ −
2
i c)(x é mínima quando c =é mínima quando c = x
7x =
i xi 2i )x(x − 2i 5)(x − 2i 10)(x − 
1 4 
2 5 
9
4
1
0
36
25
Verificação numérica:Verificação numérica:
12
2 5 
3 7 
4 9 
5 10 
Σ 35 
 
4
0
4
9
26
0
4
16
25
46
25
9
1
0
71
ÉÉ aa medidamedida queque dividedivide umum conjuntoconjunto dede dadosdados
ordenadoordenado emem duasduas partespartes iguaisiguais:: 5050%% dosdos valoresvalores
Mediana (Md)Mediana (Md)
ficamficam abaixoabaixo ee 5050%% ficamficam acimaacima dada medianamediana..
MdMd
50% 50%xx(1)(1) xx(n)(n)
13
Para obter a mediana:
1.1. Ordenar os dados
2.2. Determinar a posição (p) da mediana
Dois casos:
n ímparn ímpar →→→→→→→→ um valor central
2.2. Determinar a posição (p) da mediana
n parn par →→→→→→→→ dois valores centrais
posiçãoposição
2
1np +=→→→→→→→→ Md = x(p)
14
posiçõesposições 1 2(p ) (p )
x +x
Md=
22
1np +=
p1
p2
XX = Tempo para realizar uma tarefa (min)= Tempo para realizar uma tarefa (min)
xxii = 5, 9, 7, 4, 12, 10= 5, 9, 7, 4, 12, 10
Exemplo:Exemplo:
1.1. Ordenar os dados
n = 6 (par)
1.1. Ordenar os dados
x(i) = 4, 5, 7, 9, 10, 12
2.2. Determinar a posição (p) da mediana
p =3
15
2
1np += 3,5
2
16
=
+
=
2
xx
Md (4)(3)
+
= 82
97
=
+
=
min 8Md =
p1=3
p2=4
Moda (Mo)Moda (Mo)
�������� É o valor de maior ocorrênciamaior ocorrência num conjunto de dados.
�������� É a única medida que pode não existirpode não existir e, existindo, �������� É a única medida que pode não existirpode não existir e, existindo, 
pode não ser únicapode não ser única.
XX = Tempo para realizar uma tarefa (min)= Tempo para realizar uma tarefa (min)
MoMo = 8 min= 8 minxi = 12, 8, 7, 5, 7, 4, 8, 8, 9
Exemplos:Exemplos:
16
xi = 9, 5, 4, 5, 7, 1, 2, 2
xi = 5, 7, 3, 7, 9, 5, 9, 3 não existenão existe MoMo (conjunto amodal)
MoMo = 2 = 2 ee 5 min5 min (conjunto bimodal)
Os valores que seguem são os tempos (em segundos) de
reação a um alarme de incêndio, após a liberação de fumaça
de uma fonte fixa:
Exercício proposto:Exercício proposto:
de uma fonte fixa:
Para este conjunto de valores, calcule as medidas de
posição (média, mediana e moda).
12 9 11 7 9 14 6 10
17
posição (média, mediana e moda).
= 9,75
Md = 9,5
Mo = 9
X
� No cálculo da média participam todos os valores 
observados.
� É uma medida de fácil interpretação e presta-se muito bem 
Média aritmética Média aritmética -- característicascaracterísticas
� É uma medida de fácil interpretação e presta-se muito bem 
a tratamentos estatísticos adicionais.
� É uma medida que sempre existe e é única.
� É o ponto de equilíbrio de uma distribuição, sendo tão 
mais eficiente quanto mais simétrica for a distribuição dos 
18
valores ao seu redor.
� Desvantagem:
� É uma medida altamente influenciada por valores atípicos ou 
discrepantes (não resistente).4 5 7 9 104 5 7 9 10
=x
=Md 77
77
4 5 7 9 154 5 7 9 15
=x
88
88
77=Md
19
4 5 7 9 254 5 7 9 25
=x
1010
1010
77=Md
� Define exatamente o centro de uma distribuição, mesmo 
quando os valores se distribuem assimetricamente em torno 
da média.
Mediana Mediana -- característicascaracterísticas
da média.
� Pode ser determinada mesmo quando não se conhece 
todos os valores do conjunto de dados.
� É uma medida que sempre existe e é única.
� É uma medida resistente, ou seja, não sofre influência de 
20
valores discrepantes.
Desvantagem:
� É uma medida que não se presta a cálculos matemáticos.
� É uma medida que têm existência real dentro do 
conjunto de dados e em grande número de vezes.
Moda Moda -- característicascaracterísticas
� Não exige cálculo, apenas uma contagem.
� Pode ser determinada também para variáveis 
categóricas.
� Desvantagem: 
21
� Desvantagem: 
� É uma medida que não se presta a cálculos matemáticos. 
� Deixa sem representação todos os valores do conjunto de 
dados que não forem iguais a ela.
MÉDIA ARITMÉTICA MEDIANA MODA 
Objetivo Objetivo Objetivo 
Frequentemente usada para operações 
estatísticas mais avançadas. 
Eventualmente pode ser usada para operações 
estatísticas mais avançadas ou para separar 
distribuições em duas categorias (alta versus 
baixa) 
Medida de tendência central rápida, simples, mas 
um tanto grosseira. 
Forma da distribuição Forma da distribuição Forma da distribuição 
Mais apropriada para simetria e unimodal. Mais apropriada para assimetria acentuada. Mais apropriada para bimodal. 
Nível de mensuração Nível de mensuração Nível de mensuração 
Intervalar ou racional Ordinal, intervalar ou racional Nominal, ordinal, intervalar ou racional 
Vantagens Vantagens Vantagens 
- No cálculo da média participam todos os 
valores observados. 
- É uma medida de fácil interpretação e presta-se 
muito bem a tratamentos estatísticos adicionais. 
- É uma medida que sempre existe e é rígida e 
unicamente determinada. 
- É um valor típico de um conjunto de dados, 
podendo substituir todos os valores de um 
- Define exatamente o centro de uma distribuição, 
mesmo quando os valores se distribuem 
assimetricamente em torno da média. 
- Pode ser determinada mesmo quando não se 
conhece todos os valores do conjunto de dados. 
- É uma medida que sempre existe e é única. 
- Esta medida pode ser utilizada para definir o 
meio de um número de objetos, propriedades ou 
- É uma medida que têm existência real dentro 
do conjunto de dados e em grande número de 
vezes. 
- Não exige cálculo, apenas uma contagem. 
- Pode ser determinada também para variáveis 
qualitativas nominais. 
22
podendo substituir todos os valores de um 
conjunto sem alterar o total. 
- É o ponto de equilíbrio de uma distribuição, 
sendo tão mais eficiente quanto mais simétrica 
for a distribuição dos valores ao seu redor. 
meio de um número de objetos, propriedades ou 
qualidades que possam de alguma forma ser 
ordenados. 
- É uma medida resistente, ou seja, não sofre 
influência de valores discrepantes. 
Desvantagem Desvantagem Desvantagens 
- É uma medida altamente influenciada por 
valores discrepantes (não resistente). 
- É uma medida que não se presta a cálculos 
matemáticos. 
- É uma medida que não se presta a cálculos 
matemáticos. 
- Deixa sem representação todos os valores do 
conjunto de dados que não forem iguais a ela. 
 
Medidas separatrizesMedidas separatrizes
�������� Indicam limites para proporções de observações em um Indicam limites para proporções de observações em um 
conjuntoconjunto
QuartisQuartis→→→→→→→→ dividem o conjunto ordenado ordenado em quatroquatro partes
Decis Decis →→→→→→→→ dividem o conjunto ordenadoordenado em dezdez partes
Mediana Mediana →→→→→→→→ divide o conjunto ordenadoordenado em duasduas partes 
conjuntoconjunto
23
Percentis Percentis →→→→→→→→ dividem o conjunto ordenadoordenado em cemcem partes 
�������� São três medidas que dividem um conjunto de dados São três medidas que dividem um conjunto de dados 
ordenado em quatro partes iguais. ordenado em quatro partes iguais. 
Quartis (QQuartis (Qii))
MdMd25%
QQ11
25%
QQ22
25% 25%
QQ33
xx(1)(1) xx(n)(n)
24
Primeiro quartil Primeiro quartil (Q(Q11):): 25% dos valores abaixo e 75% acima dele25% dos valores abaixo e 75% acima dele
Segundo quartil Segundo quartil (Q(Q22):): 50% dos valores abaixo e 50% acima dele50% dos valores abaixo e 50% acima dele
Terceiro quartil Terceiro quartil (Q(Q33):): 75% dos valores abaixo e 25% acima dele75% dos valores abaixo e 25% acima dele
Para obter os quartis:
1.1. Ordenar os dados
2.2. Determinar a posição (pp) de cada quartil
Dois casos:
n ímparn ímpar n parn par
4
1np1
+
=Posição do QPosição do Q1 1 →→→→→→→→ 4
2np1
+
=Posição do QPosição do Q1 1 →→→→→→→→
25
4
1)2(np2 +=Posição do QPosição do Q2 2 →→→→→→→→
4
1)3(np3 +=Posição do QPosição do Q3 3 →→→→→→→→
4
22np2
+
=Posição do QPosição do Q2 2 →→→→→→→→
4
23np3
+
=Posição do QPosição do Q3 3 →→→→→→→→
i i (p )Q x=
Se pp não for inteiro, tomamos os dois inteiros mais próximos. 
7,5pi =Exemplo:Exemplo:
77
88
xx + O quartil será a média O quartil será a média 
26
2
xxQ (8)(7)i 
+
=
O quartil será a média O quartil será a média 
aritmética dos dois valores que aritmética dos dois valores que 
ocupam essas duas posições.ocupam essas duas posições.
Foram registrados os tempos de frenagem para 21 motoristas 
que dirigiam a 30 milhas por hora. Os valores obtidos foram:
Exercício proposto: Exercício proposto: 
69 58 70 80 46 61 65 74 75 55 67 
56 70 72 61 66 58 68 70 68 58 
 
Para o conjunto de valores, calcule os quartis e interprete esses 
valores.
46 55 56 58 58 58 61 61 65 66 67
27
Q1 = 58 Q2 = 67 Q3 = 70
46 55 56 58 58 58 61 61 65 66 67
68 68 69 70 70 70 72 74 75 80
i xi yi zi 
Medidas de variação ou dispersãoMedidas de variação ou dispersão
1 4 2 1 
2 4 5 8 
3 4 4 5 
4 4 6 4 
5 4 3 2 
Σ 20 20 20 
28
Σ 
 
 
44 44 44MédiaMédia
Medidas de variação ou dispersãoMedidas de variação ou dispersão
Objetivo Objetivo →→→→→→→→ indicar quanto os valores diferem entrediferem entre
si ou quanto eles se afastam da médiase afastam da média
�� Amplitude Amplitude totaltotal
�� VariânciaVariância
si ou quanto eles se afastam da médiase afastam da média
Medidas de variação mais utilizadas:
�������� Complementam as medidas de tendência central
29
�� VariânciaVariância
�� Desvio padrãoDesvio padrão
�� Coeficiente de variaçãoCoeficiente de variação
Tendo a cabeça a arder e os pés enterrados 
no gelo, na média está tudo bem!
Amplitude total (aAmplitude total (att))
�������� Fornece uma ideia inicial de variação
�������� É obtida pela diferença entre o maiormaior valorvalor e o
menormenor valorvalor de um conjunto de dados
aatt
EIESa −=
EI=xEI=x(1)(1) ES=xES=x(n)(n)
30
(1)(n)t xxa −=
EIESat −=
ESES:: extremo superior do conjunto de dados ordenado
EIEI:: extremo inferior do conjunto de dados ordenado
Exemplo:Exemplo:
min9312 =−=EIESa −=
X = Tempo para realizar uma tarefa (min)
xi = 3, 3, 4, 6, 7, 9, 9, 11, 12
min9312 =−=EIESat −=
Significado:Significado: todos os valores do conjunto de dados diferem, todos os valores do conjunto de dados diferem, 
EIEI ESES100%100%
31
Significado:Significado: todos os valores do conjuntode dados diferem, todos os valores do conjunto de dados diferem, 
no máximo, em 9 minutosno máximo, em 9 minutos
DesvantagensDesvantagens
�������� extremamente influenciada por valores discrepantesextremamente influenciada por valores discrepantes
�������� pouco precisapouco precisa
i xi yi zi 
1 4 2 1 
2 4 5 8 
3 4 4 5 
4 4 6 4 
5 4 3 2 
Σ 20 20 20 
Média 4 4 4 
32
Média 4 4 4 
aatt 
 
00 44 77
�������� Medida de variação mais utilizada:
�������� facilidade de compreensãofacilidade de compreensão
�������� propriedades estatísticas importantes para a propriedades estatísticas importantes para a 
Variância Variância ((ss22))
�������� propriedades estatísticas importantes para a propriedades estatísticas importantes para a 
inferênciainferência
�������� Considera o desvio da média como unidade básicaunidade básica
da variação:
�������� Leva em conta todos os valores do conjunto de dados
33
mede quanto cada valor mede quanto cada valor 
varia em relação à médiavaria em relação à média
da variação:
)x(xi −Desvio:
=−74
xi = 4, 5, 7, 9, 10
Exemplo:Exemplo:
=−75
7x =
--33
--22=−75
=−77
=−79
=−710
variação do xvariação do xii em em 
relação à médiarelação à média)x(xi −
--22
00
22
33
Média dos desvios Média dos desvios →→→→→→→→ variação média do conjunto de valoresvariação média do conjunto de valores
34
0=∑
− )x(xisoma de todos os desviossoma de todos os desvios
número de desvios somadosnúmero de desvios somados n
44aa propriedadepropriedade dada médiamédia →→→→→→→→ ∑ =− 0)x(xi
Solução:Solução: elevar os desvios ao quadradoelevar os desvios ao quadrado →→→→→→→→ desvios negativos 
ficam positivos e podem ser somados 
∑ −
2
i )x(xsoma dos quadrados dos desviossoma dos quadrados dos desvios Média dos Média dos 
número de desvios somadosnúmero de desvios somados
∑ −i )x(x
n
soma dos quadrados dos desviossoma dos quadrados dos desvios Média dos Média dos 
quadrados quadrados 
dos desviosdos desvios
35
1-n
)x(x
s
2
i2 ∑ −
= número de graus de liberdade número de graus de liberdade 
ou desvios independentesou desvios independentes
Porque este denominador confere à variância melhores 
propriedades estatísticas (importante na inferência estatística).
Por que utilizar nPor que utilizar n--1 como denominador?1 como denominador?
�������� Quando o objetivo for apenas descrever a variação de descrever a variação de 
n
)x(x
s
2
i2
n
∑ −
=
�������� Quando o objetivo for apenas descrever a variação de descrever a variação de 
um conjunto de valoresum conjunto de valores, podemos usar o denominador nn.
�������� Quando o objetivo for estimar a variação de uma estimar a variação de uma 
36
1-n
)x(x
s
2
i2 ∑ −
=
�������� Quando o objetivo for estimar a variação de uma estimar a variação de uma 
populaçãopopulação por meio da variação de um conjunto de 
valores (amostra), devemosdevemos usar o denominador nn--11.
X = tempo para realizar uma tarefa (min)
xi = 4, 5, 7, 9, 10
Exemplo:Exemplo:
min7x =
1n
)x(x
s
2
i2
−
−
=
∑
15
7)(107)(97)(77)(57)(4 22222
−
−+−+−+−+−
=
37
6,5
4
26
4
94049
==
++++
=
22 min6,5s =
unidade de medida fica unidade de medida fica 
elevada ao quadradoelevada ao quadrado
Propriedades da variânciaPropriedades da variância
11aa propriedade:propriedade: A variância de um conjunto de dados que não 
varia, ou seja, cujos valores são uma constante, é zero.
Verificação numérica:Verificação numérica:
xi = 7, 7, 7, 7, 7 
0
15
7)(77)(77)(77)(77)(7
s
22222
2
=
−
−+−+−+−+−
=
7x=
Verificação numérica:Verificação numérica:
38
15−
2
2
c
c c
s 0
n 1
( )−
= =
−
∑
22aa propriedade:propriedade: Ao somar uma constante cc a todos os valores 
de um conjunto de dados, a variância destes dados não se 
altera. 
x = 4, 5, 7, 9, 10
7x=
Verificação numérica:Verificação numérica:
xi = 4, 5, 7, 9, 10
xi+2 = 6, 7, 9, 11, 12
Somar c=2Somar c=2
6,5s2 =
9x 2x =+ cxx cx +=+→→→→→→→→
22
cx ss =+6,5s2 2x =+ →→→→→→→→
39
2min 6,5
4
26
4
94049
==
++++
=
15
9)(129)(119)(99)(79)(6
s
22222
2
2x
−
−+−+−+−+−
=+
33aa propriedadepropriedade:: Ao multiplicar todos os valores de um
conjunto de dados por uma constante cc, a variância destes
dados fica multiplicada pelo quadrado desta constante.
7x=
Verificação numérica:Verificação numérica:
xi = 4, 5, 7, 9, 10
Multiplicar por c=2Multiplicar por c=2
6,5s2 =
7x=
2xi= 8, 10, 14, 18, 20
14x2x = →→→→→→→→ xcxcx =
26s22x =
222
xc scs =→→→→→→→→
40
2min 26
4
104
4
361601636
==
++++
=
15
14)(2014)(1814)(1414)(1014)(8
s
22222
2
2x
−
−+−+−+−+−
=
6,522 ×=
Trabalhando com a expressão da variância, é possível encontrar uma fórmula mais prática de cálculo:
1n
x nx
 s
22
2 i
−
−
=
∑
41
Desvantagens da variância:Desvantagens da variância:
1.1. Como a variância é calculada a partir da 
média, é uma medida pouco resistentepouco resistente, ou seja, 
muito influenciada por valores atípicos.
2.2. Como a unidade de medida fica elevada ao 
quadrado, a interpretação da variância se torna a interpretação da variância se torna 
mais difícilmais difícil.
muito influenciada por valores atípicos.
42
Para solucionar o problema de interpretação da 
variância surge outra medida: o desvio padrãodesvio padrão. 
Desvio padrão (s)Desvio padrão (s)
�������� É definido como a raiz quadrada positiva da raiz quadrada positiva da 
variânciavariância
X = tempo para realizar uma tarefa (min)
2ss =
Exemplo:Exemplo:
variânciavariância
2ss =
43
xi = 4, 5, 7, 9, 10
22 min 6,5s =
min 7x =
2ss =
2min 6,5s =
min 2,55s =
2,557±
sx ±
Apresentação do desvio padrão:Apresentação do desvio padrão:
Tempo médio para realizar a Tempo médio para realizar a 
2,557± tarefa de 7 minutos com uma tarefa de 7 minutos com uma 
variação média de 2,55 minutos variação média de 2,55 minutos 
acima e abaixo da média.acima e abaixo da média.
Significado:Significado: variação média em torno da média aritméticavariação média em torno da média aritmética
44
ATENÇÃO:ATENÇÃO: ver propriedades da variância e quais as ver propriedades da variância e quais as 
adaptações necessárias para o desvio padrão!adaptações necessárias para o desvio padrão!
Interpretação do Desvio PadrãoInterpretação do Desvio Padrão
O desvio padrão é uma forma de medir distância entre as 
observações de um conjunto de dados em relação a sua média.
Exemplo:Exemplo:
Podemos comparar 85 em um exame de inglês com 80 em um 
exame de alemão? 
Que nota é realmente mais alta? 
Um raciocínio rápido mostra que isso depende do desempenho 
45
Um raciocínio rápido mostra que isso depende do desempenho 
dos outros estudantes em cada turma, ou seja, da variabilidade 
das notas – do desvio padrão. 
Esse mesmo raciocínio de comparação de escores em provas é 
utilizado nos concursos vestibulares. 
Coeficiente de Variação (CV)Coeficiente de Variação (CV)
O coeficiente de variação é definido como a proporção a proporção 
(ou percentual) da média representada pelo desvio (ou percentual) da média representada pelo desvio 
padrãopadrão.
s
=
��������
100% 
x
sCV =
X = tempo para realizar uma tarefa (min)
xi = 4, 5, 7, 9, 10
min 7x =
Exemplo:Exemplo:
46
xi = 4, 5, 7, 9, 10
min 2,55s =
100% 
x
sCV = 100% 
min 7
min 2,55
= 36,4% =
O CV é a medida mais utilizada para comparar comparar 
variabilidadesvariabilidades de diferentes conjuntos de dados 
��������
�������� Esta comparação não deve ser feita através de qualquer não deve ser feita através de qualquer 
medida de variaçãomedida de variaçãoem duas situações:
�������� quandoquando asas médiasmédias dosdos conjuntosconjuntos comparadoscomparados sãosão
Vantagens:Vantagens:
�������� quandoquando asas médiasmédias dosdos conjuntosconjuntos comparadoscomparados sãosão
muitomuito desiguaisdesiguais
�������� quandoquando asas unidadesunidades dede medidamedida sãosão diferentesdiferentes
NessasNessas situaçõessituações devemosdevemos usarusar oo CVCV.
47
�������� O CV é desprovido de unidade de medidadesprovido de unidade de medida (expresso
em percentagem)
�������� O CV é uma medida relativamedida relativa, pois relaciona o desvio
padrão com a sua respectiva média aritmética
Consideremos que x1i e x2i são conjuntos de valores 
referentes aos salários (R$) de mulheres e homens salários (R$) de mulheres e homens , para os 
quais foram obtidas as seguintes medidas:
Exemplo:Exemplo:
48
Mulheres Mulheres (X(X11):): Homens Homens (X(X22):):1.300x1 =
s1 = 340
2.500x2 =
s2 = 420
Qual grupo varia mais em relação aos salários?Qual grupo varia mais em relação aos salários?
1300x1 = 2500x2 =
CV1 = 26,2%
O maior desvio padrão, quando comparado à O maior desvio padrão, quando comparado à 
s1 = 340
CV2 = 16,8%
s2 = 420
49
O maior desvio padrão, quando comparado à O maior desvio padrão, quando comparado à 
sua média, representou menor variação.sua média, representou menor variação.
Quando as médias são diferentes, devemos usar o CV.Quando as médias são diferentes, devemos usar o CV.
Contou-se o número de vendas de determinado produto durante 
os sete dias de uma semana, com os seguintes resultados:
14 20 20 20 15 16 18
Exercício proposto:Exercício proposto:
14 20 20 20 15 16 18
a) Determine a média, a mediana e a moda. 
b) Calcule a variância, o desvio padrão e o coeficiente
de variação.
média = 17,6
50
mediana = 18
moda = 20
variância = 6,62
desvio padrão = 2,57
CV = 14,64%
O formato é um aspecto importante de uma distribuição. 
Está relacionado com as ideias de simetriasimetria e curtosecurtose.
A simetriasimetria em torno de um eixo indica que o formato da 
Medidas de FormatoMedidas de Formato
��������
�������� A simetriasimetria em torno de um eixo indica que o formato da 
distribuição à esquerda e à direita desse eixo é o mesmo.
A curtosecurtose está relacionada com o grau de concentração 
das observações no centro e nas caudas da distribuição. 
��������
��������
51
caudacaudacaudacauda caudacauda
centrocentro
Informa se a maioria dos valores se localiza à esquerda, ou 
à direita, ou se estão distribuídos uniformemente em torno 
da média aritmética.
Coeficiente de AssimetriaCoeficiente de Assimetria
��������
3ma =
da média aritmética.
O coeficiente de coeficiente de assimetriaassimetria é calculado a partir do 
segundosegundo e do terceiroterceiro momentos centrados na médiamomentos centrados na média:
��������
n
)x(x
m
3
i
3
∑ −
=
52
22
3
3
mm
a =
Indica o graugrau e o sentidosentido do afastamento da simetria.��������
n
)x(x
m
2
i
2
∑ −
=
Se aa33==00, a distribuição é classificada como simétricasimétrica,
indicando que os valores estão uniformemente 
distribuídos em torno da média.
Classificação quanto à simetriaClassificação quanto à simetria
distribuídos em torno da média.
53
MoMdx ==
Se aa33>>00, a distribuição é classificada como assimétricaassimétrica
positivapositiva, indicando que a maioria dos valores são 
menores ou se localizam à esquerda da média (cauda 
para direita).
54
xMdMo <<
Se aa33<<00, a distribuição é classificada como assimétrica assimétrica 
negativanegativa, indicando que a maioria dos valores são 
maiores ou se localizam à direita da média (cauda para 
esquerda).
55
MoMdx <<
Indica o grau de achatamento de uma distribuição. 
O coeficiente de curtosecoeficiente de curtose é calculado a partir do 
Coeficiente de CurtoseCoeficiente de Curtose
��������
��������
2
2
4
4 m
m
a =
O coeficiente de curtosecoeficiente de curtose é calculado a partir do 
segundo e do quarto momentos centrados na médiasegundo e do quarto momentos centrados na média.
��������
)x(x 2∑ −
n
)x(x
m
4
i
4
∑ −
=
56
2m
A classificação é feita tendo por base a curtosecurtose
que ocorre na distribuição normaldistribuição normal. 
��������
n
)x(x
m
2
i
2
∑ −
=
Classificação quanto à curtoseClassificação quanto à curtose
aa44<<3 3 ⇒ platicúrtica ⇒ baixa concentração de valores no 
centro, tornando a distribuição mais achatada que a 
distribuição normal.distribuição normal.
aa44==33⇒ mesocúrtica⇒ concentração das observações 
ocorre de forma semelhante à da distribuição normal.
aa44>>3 3 ⇒ leptocúrtica ⇒ alta concentração de valores no 
centro, o que provoca um pico maior que o da distribuição 
normal.
57
Platicúrtica Mesocúrtica Leptocúrtica
Medidas Medidas 
DescritivasDescritivas
Dados não agrupadosDados não agrupados
Dados agrupados em classeDados agrupados em classe
3,11 8,88 9,26 10,81 12,69 
(medidas exatas)(medidas exatas)
(medidas aproximadas)(medidas aproximadas)
j Classes jF 
1 3,11 |

 16,00 8 
2 16,00 |

 28,89 20 
3 28,89 |

 41,78 6 
4 41,78 |

 54,67 8 
5 54,67 |

 67,56 3 
3,11 8,88 9,26 10,81 12,69 
13,78 15,23 15,62 17,00 17,39 
18,36 18,43 19,27 19,50 19,54 
20,16 20,59 22,22 23,04 24,47 
24,58 25,13 26,24 26,26 27,65 
28,06 28,08 28,38 32,03 36,37 
38,98 38,64 39,16 41,02 42,97 
44,08 44,67 45,40 46,69 48,65 
58
5 54,67 |

 67,56 3 
6 67,56 |

 80,45 1 
7 80,45 |

| 93,34 4 
 Σ 50 
 
44,08 44,67 45,40 46,69 48,65 
50,39 52,75 54,80 59,07 61,22 
70,32 82,70 85,76 86,37 93,34 
Dados agrupados em classeDados agrupados em classeDados não agrupadosDados não agrupados
j Classes jc jF 
1 3,11 |

 16,00 9,555 8 
PressuposiçãoPressuposição
Medidas para dados agrupados em classeMedidas para dados agrupados em classe
1 3,11 |

 16,00 9,555 8 
2 16,00 |

 28,89 22,445 20 
3 28,89 |

 41,78 35,335 6 
4 41,78 |

 54,67 48,225 8 
5 54,67 |

 67,56 61,115 3 
6 67,56 |

 80,45 74,005 1 
7 80,45 |

| 93,34 86,895 4 
59
7 80,45 |

| 93,34 86,895 4 
 Σ − 50 
n
x
x i∑=
←←←←←←←← nnão estão disponíveisão estão disponíveis
Distribuição simétrica Distribuição simétrica 
dentro dos intervalosdentro dos intervalos
j Classes jc jF jc jF 
1 3,11 |

 16,00 9,555 8 
2 16,00 |

 28,89 22,445 20 
9,555 x 8 = 76,44
22,445 x 20 = 448,90
MédiaMédia
2 16,00 |

 28,89 22,445 20 
3 28,89 |

 41,78 35,335 6 
4 41,78 |

 54,67 48,225 8 
5 54,67 |

 67,56 61,115 3 
6 67,56 |

 80,45 74,005 1 
7 80,45 |

| 93,34 86,895 4 
 Σ − 50 
22,445 x 20 = 448,90
35,335 x 6 = 212,01
∑ Fc
48,225 x 8 = 385,80
61,115 x 3 = 183,345
74,005 x 1 = 74,005
86,895 x 4 = 347,58
= 1.728,08
60
 Σ − 50 
n
Fc
x jj∑=
∑ jjFc
Média aritmética:Média aritmética:
= 1.728,08
= =
1728,08
34,56 reais
50
gasto no supermercado
j Classes jc jF jF′ jc jF 
1 3,11 | 16,00 9,555 8 8 76,44 
2 16,00 | 28,89 22,445 20 28 448,90 
3 28,89 | 41,78 35,335 6 34 212,01 Classe modalClasse modal
Classe medianaClasse mediana
Mediana e ModaMediana e Moda
3 28,89 | 41,78 35,335 6 34 212,01 
4 41,78 | 54,67 48,225 8 42 385,80 
5 54,67 | 67,56 61,115 3 45 183,35 
6 67,56 | 80,45 74,005 1 46 74,01 
7 80,45 || 93,34 86,895 4 50 347,58 
 Σ − 50 − 1.728,08 
 
Classe modalClasse modal
61
 
Posição da Mediana Posição da Mediana →→→→→→→→ += =n 1p 25,5
2
25
26
Classe modal: Classe modal: classe com a maiorfrequência absoluta
Classe mediana:Classe mediana: classe que compreende a mediana
j Classes jc jF 2jj )( xcF − 
1 3,11 | 16,00 9,555 8 
 
8 (9,555- 34,56)2 = 5.002,00
reais34,56x =
VariânciaVariância
1 3,11 | 16,00 9,555 8 
 
2 16,00 | 28,89 22,445 20 
 
3 28,89 | 41,78 35,335 6 
 
4 41,78 | 54,67 48,225 8 
 
5 54,67 | 67,56 61,115 3 
 
6 67,56 | 80,45 74,005 1 
 
7 
8 (9,555- 34,56) = 5.002,00
20 (22,445- 34,56)2 = 2.935,46
6 (35,335- 34,56)2 = 3,60
62
7 80,45 || 93,34 86,895 4 
 
 Σ − 50 
 
 
Variância:Variância:
( )∑ − 2jj xcF
24.062,15
( )
1n
xcF
s
2
jj2
−
−
=
∑
( ) 22jj2 reais491,06
49
24062,15
1n
xcF
s ==
−
−
=
∑
2
=== reais22,16491,06ss 2 ===
reais 22,1634,56
sx
±
±
63
64,12%100%
34,56
22,16100%
x
sCV ===
 
 DDaaddooss nnããoo aaggrruuppaaddooss DDaaddooss aaggrruuppaaddooss eemm ccllaassssee 
x = 34,78 reais 
 
x = 34,56 reais 
Md = 27,31 reais Classe mediana: [16,00 ; 28,89) Md = 27,31 reais 
 
Classe mediana: [16,00 ; 28,89) 
Mo não existe 
 
Classe modal: [16,00 ; 28,89) 
s2 = 471,32 reais 2 
 
s2 = 491,06 reais2 
s = 21,71 reais s = 22,16 reais 
64
s = 21,71 reais 
 
s = 22,16 reais 
CV = 62,42% 
 
CV = 64,12% 
Exercício proposto:Exercício proposto:
Calcule as medidas descritivas para o conjunto de dados 
referente ao número de pães não vendidos em uma certa 
padaria até a hora do encerramento do expediente.
j Classes Fj
1 0 20
2 1 7
3 2 7
4 3 3
5 4 2
65
5 4 2
6 5 1
∑ 40
Solução:
j Classes Fj Fj´ cjFj Fj(cj-xp)2
1 0 20 20 0 23,11
2 1 7 27 7 0,04
3 2 7 34 14 5,99
média = 1,075
moda = 0 Assimétrica positiva
2 7 34 14 5,99
4 3 3 37 9 11,12
5 4 2 39 8 17,11
6 5 1 40 5 15,41
∑ 40 - 43 72,78
66
moda = 0 Assimétrica positiva
mediana = 0,5
Variância = 1,87
Desvio padrão = 1,37
CV = 127,07

Outros materiais