Buscar

Aula 2. ZAB0262

Prévia do material em texto

1
Características Numéricas de uma 
Distribuição de Dados
Medidas de tendência central ou de posição
Medidas de dispersão ou variabilidade
Introdução
2
 As vezes é necessário resumir certas características das distribuições
de dados (ou mesmo de frequências de dados) por meio de certas
quantidades.
 Tais quantidades são usualmente denominadas de MEDIDAS, por
quantificarem alguns aspectos de nosso interesse.
 Nosso objetivo é apresentar algumas das chamadas MEDIDAS DE
POSIÇÃO, bem como, algumas MEDIDAS DE DISPERSÃO,
consideradas mais importantes no campo da aplicabilidade prática do
nosso dia a dia.
 Tais medidas servem para:
(a) Localizar uma distribuição;
(b) Caracterizar sua variabilidade.
Medidas de Posição 
(ou de Tendência Central)
3
Servem para localizar a distribuição dos dados brutos (das
frequências) sobre o eixo de variação da variável em questão.
Veremos os três tipos principais de medidas de posição:
(a) Média Aritmética;
(b) Mediana;
(c) Moda.
Medidas de Posição 
(ou de Tendência Central)
n
fX ii
k
i 1ˆX 

 
4
Média (Aritmética)
A notação internacional recomenda símbolos específicos
para a Média:
n
X i
n
i 1ˆX 

 
(a) Amostra:
Conjunto de Dados =>
Tabelas de Frequência =>
=>
Medidas de Posição 
(ou de Tendência Central)
N
fX
μ
ii
k
i 1


N
X
μ
i
N
i 1


5
Média (Aritmética)
Conjunto de Dados =>
Tabela de Frequência =>
(b) POPULAÇÃO:
Medidas de Posição 
(ou de Tendência Central)
seg
n
fPm
n
fX
ii
k
i
ii
k
i
5,54
50
725.2
X
ˆX
1
1







6
Exemplo: Tempo (em segundos) gasto por um funcionário
Cálculo da média
Classes xi fi Pmifi
40

45 42 3 126
45

50 47 8 376
50

55 52 16 832
55

60 57 12 684
60

65 62 7 434
65

70 67 3 201
70

75 72 1 72
50 2.725
2
Medidas de Posição 
(ou de Tendência Central)
7
Propriedades da Média
(a) Multiplicando todos os valores de uma variável por uma
constante, a média do conjunto fica multiplicada por essa
constante.
(b) Somando-se ou subtraindo-se uma constante a todos os
valores da variável, a média do conjunto fica acrescida ou
subtraída dessa constante.
Medidas de Posição 
(ou de Tendência Central)
8
Mediana
A mediana é uma quantidade que, como a média, também
caracteriza o centro de uma distribuição pertencente a um
conjunto de dados.
dmˆ
(a) Amostra:
(b) População:
=>
md
Medidas de Posição 
(ou de Tendência Central)
1
2

n
9
Conjunto de Dados: Para obtenção da estimativa de mediana
de um conjunto de dados são necessários
os seguintes passos:
1º Passo: Ordenar de forma crescente os “n” valores da variável
em questão;
2º Passo: (i) Sendo “n” ímpar, a mediana será igual ao valor de
ordem ;
2
)1( n
(ii) Sendo “n” par, a mediana será o valor médio entre
os valores de ordem e .
2
n
Medidas de Posição 
(ou de Tendência Central)
h
f
F
n
Ldm
md
a
i .
2
ˆ







10
Tabelas de Frequência =>
Li = limite inferior da classe que contém a mediana;
n = números de elementos do conjunto da dados;
Fa = soma das frequências das classes anteriores que
fmd = frequência da classe que contém a mediana;
h = amplitude da classe que contém a mediana.
contém a mediana;
Mediana
Medidas de Posição 
(ou de Tendência Central)
11
Exemplo: Tempo (em segundos) gasto por um funcionário
Cálculo da mediana
Classes xi fi Pmifi
40

45 42 3 126
45

50 47 8 376
50

55 52 16 832
55

60 57 12 684
60

65 62 7 434
65

70 67 3 201
70

75 72 1 72
50 2.725
md
md
a
i h
f
F
n
Ldm







2
ˆ
segundosdm
dm
375,54ˆ
5.
16
11)2/50(
50ˆ



Medidas de Posição 
(ou de Tendência Central)
Om
12
Moda
=> A moda (ou modas) de um conjunto de valores é definida
como o valor (ou valores) de máxima frequência.
É uma quantidade que, como a média, também caracteriza o
centro de uma distribuição, indicando a região das máximas
frequências.
=>
Omˆ
(a) Amostra:
(b) População:
3
Medidas de Posição 
(ou de Tendência Central)
h
ffff
ff
Lm
smoamo
amo
io .
)()(
)(
ˆ



13
Moda
Tabelas de Frequência =>
Li = limite inferior da classe modal;
f = frequência absoluta: anterior, seguinte e da classe
modal
h = amplitude das classes.
Medidas de Posição 
(ou de Tendência Central)
14
Exemplo: Tempo (em segundos) gasto por um funcionário
Cálculo da moda
Classes xi fi Pmifi
40

45 42 3 126
45

50 47 8 376
50

55 52 16 832
55

60 57 12 684
60

65 62 7 434
65

70 67 3 201
70

75 72 1 72
50 2.725
h
ffff
ff
Lm
smoamo
amo
io .
)()(
)(
ˆ



segm
m
o
o
33,53ˆ
5.
)1216()816(
)816(
50ˆ




Medidas de Dispersão (ou de Variabilidade)
 A informação fornecida pelas Medidas de Posição em geral
necessitam de ser complementadas pelas Medidas de Dispersão.
 As Medidas de Dispersão servem para indicar o “quanto os dados
se apresentam dispersos em torno da região central”.
 Portanto caracterizam o grau de variação existente em um
conjunto de valores.
 As Medidas de Dispersão que mais nos interessam são:
(a) Amplitude;
(b) Variância;
(c) Desvio Padrão;
(d) Coeficiente de Variação.
Medidas de Dispersão 
(ou de Variabilidade)
MINMAX XXH 
ˆ
MINMAX XXH 
Vantagem e Desvantagem.
Amplitude
A amplitude, já mencionada, é definida como a diferença
entre o maior e o menor valores do conjunto de dados.
(a) Amostra:
(b) População:
Salvo aplicações de Controle de Qualidade, a amplitude
não é muito utilizada como Medida de Dispersão.
=>
=>
=>
Medidas de Dispersão 
(ou de Variabilidade)
222222 ˆ)(ˆˆ)( XXXSSS X  
222 )( XX  
Variância
A variância é definida como a “média dos quadrados das
diferenças entre os valores em relação a sua própria média”.
(a) Amostra:
(b) População:
Conjunto de Dados =>
Tabela de Frequência =>
Em se tratando de População:
=>
=>
N
μX
σXσσ
i
N
i
X
2
1222
)(
)(

 
N
fμX
σXσσ
ii
k
i
X
2
1222
)(
)(

 
Medidas de Dispersão 
(ou de Variabilidade)
Variância
Conjunto de Dados =>
Tabela de Frequência =>
Em se tratando de Amostra: 
A razão de utilizarmos n - 1 no denominador da variância de dados
provenientes de Amostras deve-se a motivos que veremos no
tópico relacionado a Estimação.
OBS:
=>
1
)(
)(
2
122


 
n
XX
SXS
i
n
i
X
1
)(
)(
2
122


 
n
fXX
SXS
ii
k
i
X
4
Medidas de Dispersão 
(ou de Variabilidade)
14ˆX 1 

 
n
X i
n
i 1
)(
)(
2
122


 
n
XX
SXS
i
n
i
X
Variância
Ex.: Executar o cálculo da variância de um conjunto pequeno de
dados, formado pelos valores seguinte: {15, 12, 10, 17, 16}
As expressões apresentadas não são as mais apropriadas para o
cálculo da variância, pois a média é quase sempre um valor
fracionário, o que viria a dificultar o cálculo dos desvios .
2)( XX i 
Medidas de Dispersão 
(ou de Variabilidade)
22 2 XnXXX ii 
)2()( 222 XXXXXX iii 
2
2 2 




 



n
X
nX
n
X
X ii
i
i
n
X
n
X
X iii
22
2 )()(2




Variância
Note que o numerador pode sertrabalhado:
1
)(
)(
2
122


 
n
XX
SXS
i
n
i
X
n
X
XXX iii
2
22 )()(


Medidas de Dispersão 
(ou de Variabilidade)
Variância
Assim, para um conjunto com “n” dados:
11
)(
)(
2
12
1
2
122















n
n
X
X
n
XX
SXS
i
n
i
i
n
ii
n
i
X
Da mesma forma, para dados agrupados em Tabela de
frequência, teremos:
11
)(
)(
2
12
1
2
122















n
n
fX
fX
n
fXX
SXS
ii
k
i
ii
k
iii
k
i
X
22
Exemplo: Tempo (em segundos) gasto por um funcionário
Cálculo da variância
Classes xi fi Pmifi Pmi
2fi
40

45 42 3 126 5.292
45

50 47 8 376 17.672
50

55 52 16 832 43.264
55

60 57 12 684 38.988
60

65 62 7 434 26.908
65

70 67 3 201 13.467
70

75 72 1 72 5.184
50 2.725 150.775
 
2
2
2
2
12
12
17,46
49
50
725.2
775.150
1
segS
n
n
fPm
fPm
S
X
ii
k
i
ii
k
i
X















Medidas de Dispersão 
(ou de Variabilidade)
Propriedades da Variância
(a) Multiplicando-se todos os valores de uma variável por uma
constante, a variância do conjunto fica multiplicada pelo
quadrado dessa constante.
(b) Somando-se ou subtraindo-se uma constante a todos os
valores de uma variável, a variância não se altera.
(i) A variância é uma medida de dispersão importante na teoria
estatística;
OBS:
(ii) Do ponto de vista prático, ela tem o inconveniente de se
expressar em unidade quadrática em relação a variável em
questão.
Medidas de Dispersão 
(ou de Variabilidade)
Medidas de Dispersão 
(ou de Variabilidade)
2
XX SS 
Desvio Padrão
Definimos desvio padrão como “a raiz quadrada positiva da
variância”.
O cálculo do desvio padrão é feito por meio da variância.
XXSS X  ˆ)(ˆˆ 
XX   )(
(a) Amostra:
(b) População:
Em se tratando de Amostra:
=>
=>
=>
5
 
17,46
49
50
725.2
775.150
1
)(
2
2
12
122 














n
n
fX
fX
SXS
ii
k
i
ii
k
i
X
Desvio Padrão
(i) O desvio padrão se expressa na mesma unidade da variável,
sendo por isso, de maior interesse que a variância nas
aplicações práticas;
(ii) É mais realístico para efeito de comparação de dispersões.
OBS:
Exemplo: Tempo (em segundos) gasto por um funcionário
segundosSXS X 79,617,46)( 
Medidas de Dispersão 
(ou de Variabilidade)
Coeficiente de Variação
O coeficiente de variação é definido como “o quociente entre
o desvio padrão e a média”, sendo frequentemente expresso
em porcentagem.
XCVXCV )(
(a) Amostra:
(b) População:
XCVXCV )(
^ ^
Em se tratando de Amostra:
=>
=>
Medidas de Dispersão 
(ou de Variabilidade)
X
S
VC XX 
ˆ
27
Exemplo: Tempo (em segundos) gasto por um funcionário
Cálculo de dispersão
Classes xi fi Pmifi Pmi
2fi
40

45 42 3 126 5.292
45

50 47 8 376 17.672
50

55 52 16 832 43.264
55

60 57 12 684 38.988
60

65 62 7 434 26.908
65

70 67 3 201 13.467
70

75 72 1 72 5.184
50 2.725 150.775
Medidas de Dispersão 
(ou de Variabilidade)
%5,12125,0
5,54
795,6ˆ 
X
S
VC XX
Coeficiente de Variação
(i) A vantagem é caracterizar a dispersão dos dados em termos
relativos ao seu valor médio;
OBS:
(ii) Pequena dispersão absoluta pode ser, na verdade considerável,
quando comparada com a ordem de grandeza dos valores da
variável. Quando consideramos o CV, enganos de interpretações
desse tipo não ocorrem;
(iii) Além disso, por ser adimensional, o CV fornece uma maneira
de se compararem as dispersões de variáveis cujas medidas
são irredutíveis.
Medidas de Dispersão 
(ou de Variabilidade)
Os dados abaixo são referentes aos teores de conservantes (em mg/100 ml do
produto) e vida útil de prateleira (em dias) para uma amostra de 09 marcas de
iogurtes, encontrados nos principais Hipermercados da grande São Paulo
Marca
Teor de
Conservante (X)
Vida Útil de 
Prateleira (Y)
1 174 73
2 161 66
3 170 64
4 180 94
5 182 79
6 164 72
7 156 62
8 168 64
9 178 90
Com base nestes valores amostrais, pede-se:
A descrição dos teores de Conservantes e da Vida Útil de Prateleira dos iogurtes
avaliados, de acordo com as Medidas de Tendência Central ou de Posição (média,
mediana e moda), bem como, em termos de Medidas de Dispersão ou de
Variabilidade (amplitude, variância, desvio padrão e coeficiente de variação).
Exercício
Exercício
Os dados abaixo são provenientes do estudo que tem como objetivo verificar
o potencial de utilização do ácido ascórbico em pepinos ‘caipira’
minimamente processados quanto ao teor de umidade.
Dados obtidos:
- % de umidade
58,5 60,0 62,1 63,4 64,0 65,7 66,4 67,3 67,4 68,5 68,7
69,7 70,0 71,4 72,0 73,5 74,0 74,6 75,3 75,6 78,4 81,0
81,9 82,2 82,5 82,8 86,0 87,0 87,1 88,1
Com base nos dados, pede-se:
- a distribuição de frequência da variável em estudo;
- medidas de tendência central ou de posição;
- medidas de dispersão;

Continue navegando