Buscar

Medidas de Dispersão e Variabilidade

Prévia do material em texto

Métodos Estatı́sticos
Prof. Dr. Hélio Doyle Pereira da Silva
http://lattes.cnpq.br/5161139844851891
Medidas de Posição, Separatrizes e Variabilidade
Notável Mestre - 2023
Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 1-31
http://lattes.cnpq.br/5161139844851891
Medidas de Tendência Central
Separatrizes
Medidas de Dispersão
Diagrama em Caixas
Medidas de tendência central
MÉDIA
MEDIANA
MODA
Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 2-31
Medidas de Tendência Central
Separatrizes
Medidas de Dispersão
Diagrama em Caixas
Medidas de tendência central
MÉDIA
(MÉDIA ARITMÉTICA)
Para Amostra Para População
x̄ =
∑n
i=1 xi
n
µ =
∑N
i=1 xi
N
onde:
xi = i-ésimo valor observado
n = número de elementos da amostra
N = número de elementos da população
Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 3-31
Medidas de Tendência Central
Separatrizes
Medidas de Dispersão
Diagrama em Caixas
Medidas de tendência central
MÉDIA
Para dados agrupados x̄ =
∑k
i=1 fixi∑k
i=1 fi
onde:
k = número de classes da distribuição de frequência
fi = frequência da i-ésima classe
xi =

- P/ dados agrupados sem perda de informação,
é o valor da i-ésima classe
- P/ dados agrupados com perda de informação,
é o valor do ponto médio da i-ésima classe
Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 4-31
Medidas de Tendência Central
Separatrizes
Medidas de Dispersão
Diagrama em Caixas
Medidas de tendência central
MÉDIA
Propriedades da média
A média de um conjunto de números pode ser sempre calculada.
Para um dado conjunto de dados a média é única.
A soma algébrica dos desvios de um conjunto de números em
relação à média aritmética é zero.
Multiplicando-se todos os valores de uma variável por uma
constante, a média do conjunto fica multiplicada por essa
constante.
Somando-se ou subtraindo-se uma constante a todos os valores
de uma variável, a média do conjunto fica acrescida ou
diminuı́da dessa constante.
Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 5-31
Medidas de Tendência Central
Separatrizes
Medidas de Dispersão
Diagrama em Caixas
Medidas de tendência central
MEDIANA
Divide um conjunto ordenado de dados em duas partes iguais.
É o valor da variável X que divide o histograma em duas partes
de áreas iguais.
Determinação da mediana para dados não agrupados
Ordenar os valores (geralmente em ordem crescente).
Se o número de valores for ı́mpar, a mediana é o valor do meio
do conjunto de dados (ocupa a posição n+12 ).
Se o número de valores for par, a mediana é a média dos dois
valores do meio do conjunto de dados (valores que ocupam as
posições n2 e
n
2 + 1).
Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 6-31
Medidas de Tendência Central
Separatrizes
Medidas de Dispersão
Diagrama em Caixas
Medidas de tendência central
MEDIANA
Determinação da mediana para dados agrupados
Calcular a posição da mediana no conjunto de dados (PM = n2 ).
Identificar a classe que contém a mediana, determinando:
• o limite inferior da classe (L);
• a frequência da classe (fm);
• a amplitude da classe (c);
• a frequência acumulada da classe anterior (F ).
Assumindo que os valores que pertencem à classe da mediana
são equiespaçados, a mediana (Md) é obtida por:
Md = L +
PM − F
fm
c
Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 7-31
Medidas de Tendência Central
Separatrizes
Medidas de Dispersão
Diagrama em Caixas
Medidas de tendência central
MODA
É o valor que ocorre com maior frequência num conjunto de
dados.
Indica o valor “tı́pico” em termos da maior ocorrência.
Para dados agrupados com perda de informação, determina-se
a classe modal, que é aquela que apresenta a maior frequência.
A moda pode: não existir; ser única (distribuição unimodal); ou
ser múltipla (distribuição multimodal).
Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 8-31
Medidas de Tendência Central
Separatrizes
Medidas de Dispersão
Diagrama em Caixas
Calcule a média, a mediana e a moda
4
6
7
3
9
5
6
1
Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 9-31
Medidas de Tendência Central
Separatrizes
Medidas de Dispersão
Diagrama em Caixas
Separatrizes
PERCENTIS
QUARTIS
Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 9-31
Medidas de Tendência Central
Separatrizes
Medidas de Dispersão
Diagrama em Caixas
Separatrizes
PERCENTIS
Os percentis dividem os dados ordenados em 100 subgrupos
iguais.
O P-ésimo percentil é o valor do conjunto de dados para o qual
“P” porcento dos dados são menores que ele e (100− P) são
maiores.
Exemplo:
P85 percentil = valor para o qual 85% dos valores do conjunto de
dados são menores que ele.
Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 10-31
Medidas de Tendência Central
Separatrizes
Medidas de Dispersão
Diagrama em Caixas
Separatrizes
PERCENTIS
Determinação do p-ésimo percentil
Ordenar os valores do conjunto de dados (em geral, ordem
crescente).
O valor do p-ésimo percentil é o valor que ocupa a posição “i” no
conjunto ordenado de dados, onde:
i =
p
100
n
p = percentil
n = no de elementos do conjunto de dados.
Se “i” não for inteiro, o próximo inteiro maior do que “i” fornece a
posição do p-ésimo percentil.
Se “i” for inteiro, o p-ésimo percentil é dado pela média dos
valores que se encontram nas posições “i” e “i + 1”.
Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 11-31
Medidas de Tendência Central
Separatrizes
Medidas de Dispersão
Diagrama em Caixas
Separatrizes
PERCENTIS
Determinação do p-ésimo percentil para dados agrupados
Calcular a posição do p-ésimo percentil (i) no conjunto de dados.
i =
p
100
n
p = percentil
n = no de elementos do conjunto de dados.
Identificar a classe que contém o p-ésimo percentil,
determinando:
• o limite inferior da classe (L);
• a frequência da classe (fp);
• a amplitude da classe (c);
• a frequência acumulada da classe anterior (F ).
Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 12-31
Medidas de Tendência Central
Separatrizes
Medidas de Dispersão
Diagrama em Caixas
Separatrizes
PERCENTIS
Determinação do p-ésimo percentil para dados agrupados
Assumindo que os valores que pertencem à classe do p-ésimo
percentil são equiespaçados, o percentil (Pi ) é obtido por:
Pi = L +
i − F
fp
c
Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 13-31
Medidas de Tendência Central
Separatrizes
Medidas de Dispersão
Diagrama em Caixas
Separatrizes
QUARTIS
Os quartis dividem os dados ordenados em 4 subgrupos iguais.
Q1 = Primeiro quartil = 25% Percentil
Q2 = Segundo quartil = 50% Percentil = Mediana
Q3 = Terceiro quartil = 75% Percentil
Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 14-31
Medidas de Tendência Central
Separatrizes
Medidas de Dispersão
Diagrama em Caixas
Calcule os quartis (Q1,Q2,Q3)
2 3 5 7 8 10 11 12 15 67
Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 15-31
Medidas de Tendência Central
Separatrizes
Medidas de Dispersão
Diagrama em Caixas
Medidas de dispersão
As medidas de dispersão permitem verificar se os valores de um
conjunto de dados estão próximos uns dos outros, ou separados.
INTERVALO DESVIO MÉDIO ABSOLUTO VARIÂNCIA DESVIO PADRÃO︸ ︷︷ ︸
A média é o ponto de referência︸ ︷︷ ︸
O valor zero indica ausência de dispersão
Quanto maior o valor da medida, maior a dispersão
Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 15-31
Medidas de Tendência Central
Separatrizes
Medidas de Dispersão
Diagrama em Caixas
Medidas de dispersão
INTERVALO
Pode ser expresso pela diferença entre o maior e o menor valor
do conjunto, ou pela identificação desses dois valores.
A diferença entre o maior e o menor valor do conjunto de dados
também é chamada AMPLITUDE TOTAL (At ):
At = Xmáximo − Xmı́nimo
Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica16-31
Medidas de Tendência Central
Separatrizes
Medidas de Dispersão
Diagrama em Caixas
Medidas de dispersão
INTERVALO
DETERMINAÇÃO DA AMPLITUDE DE UMA DISTRIBUIÇÃO DE
FREQUÊNCIA
Quando se dispõe dos dados originais: At = Xmáximo − Xmı́nimo
Quando não se dispõe dos dados originais:
At = Limite inferior da primeira classe− Limite superior da última classe
Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 17-31
Medidas de Tendência Central
Separatrizes
Medidas de Dispersão
Diagrama em Caixas
Medidas de dispersão
INTERVALO
(AMPLITUDE TOTAL)
VANTAGEM:
É fácil de calcular e de entender.
RESTRIÇÕES AO USO:
Apresenta grande instabilidade, pois leva em conta apenas os
valores extremos do conjunto de dados.
A amplitude total é sensı́vel ao tamanho da amostra. Ela tende a
aumentar com o tamanho da amostra, embora não
proporcionalmente.
A amplitude total apresenta grande variabilidade entre amostras
retiradas da mesma população.
Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 18-31
Medidas de Tendência Central
Separatrizes
Medidas de Dispersão
Diagrama em Caixas
Medidas de dispersão
DESVIO MÉDIO ABSOLUTO
O desvio médio absoluto (DMA) é a média aritmética dos valores
absolutos dos desvios tomados em relação à média aritmética (ou
mediana) do conjunto de dados.
DMA =
∑n
i=1 |xi − x̄ |
n
ou DMA =
∑n
i=1 |xi −Md |
n
Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 19-31
Medidas de Tendência Central
Separatrizes
Medidas de Dispersão
Diagrama em Caixas
Medidas de dispersão
DESVIO MÉDIO ABSOLUTO
DETERMINAÇÃO DO DESVIO MÉDIO ABSOLUTO DE UMA
DISTRIBUIÇÃO DE FREQUÊNCIA
DMA =
∑n
i=1 |xi − x̄ |fi
n
ou DMA =
∑n
i=1 |xi −Md |fi
n
onde:
n = tamanho da amostra (número de valores observados);
k = número de classes da distribuição de frequência;
xi = representa um valor individual ou o ponto médio da classe;
fi = frequência da i-ésima classe.
Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 20-31
Medidas de Tendência Central
Separatrizes
Medidas de Dispersão
Diagrama em Caixas
Medidas de dispersão
VARIÂNCIA
A variância é a média dos quadrados dos desvios dos valores
tomados a partir da média. No caso da variância amostral, esta
média é calculada usando-se (n − 1) no denominador.
Variância Populacional (σ2) Variância Amostral (S2)
σ2 =
∑N
i=1(xi − µ)2
N
S2 =
∑n
i=1(xi − x̄)2
n − 1
onde N é o número de elementos da população e n é o número de
elementos da amostra.
Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 21-31
Medidas de Tendência Central
Separatrizes
Medidas de Dispersão
Diagrama em Caixas
Medidas de dispersão
VARIÂNCIA
DETERMINAÇÃO DA VARIÂNCIA DE UMA DISTRIBUIÇÃO DE
FREQUÊNCIA
Variância Populacional (σ2) Variância Amostral (S2)
σ2 =
∑N
i=1(xi − µ)2fi
N
S2 =
∑n
i=1(xi − x̄)2fi
n − 1
onde:
k = número de classes da distribuição de frequência;
xi = representa um valor individual ou o ponto médio da classe;
fi = frequência da i-ésima classe.
Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 22-31
Medidas de Tendência Central
Separatrizes
Medidas de Dispersão
Diagrama em Caixas
Medidas de dispersão
DESVIO PADRÃO
O desvio padrão é obtido pela raiz quadrada positiva da variância.
Desvio Padrão Populacional (σ) Desvio Padrão Amostral (S)
σ =
√∑N
i=1(xi − µ)2
N
S =
√∑n
i=1(xi − x̄)2
n − 1
O desvio padrão é a medida de dispersão mais utilizada. A sua
unidade é a mesma da média.
Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 23-31
Medidas de Tendência Central
Separatrizes
Medidas de Dispersão
Diagrama em Caixas
Medidas de dispersão
DESVIO PADRÃO
DETERMINAÇÃO DO DESVIO PADRÃO DE UMA DISTRIBUIÇÃO
DE FREQUÊNCIA
Desvio Padrão Populacional (σ) Desvio Padrão Amostral (S)
σ =
√∑k
i=1(xi − µ)2fi
N
S =
√∑k
i=1(xi − x̄)2fi
n − 1
onde:
k = número de classes da distribuição de frequência;
xi = representa um valor individual ou o ponto médio da classe;
fi = frequência da i-ésima classe.
Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 24-31
Medidas de Tendência Central
Separatrizes
Medidas de Dispersão
Diagrama em Caixas
Medidas de dispersão
DESVIO PADRÃO
PROPRIEDADES DO DESVIO PADRÃO
A adição (ou subtração) de um valor constante e arbitrário a
cada elemento do conjunto de dados não altera o valor do
desvio padrão.
A multiplicação (ou divisão) de cada elemento do conjunto por
um valor constante e arbitrário não altera o valor do desvio
padrão.
O desvio padrão é maior do que o desvio médio.
Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 25-31
Medidas de Tendência Central
Separatrizes
Medidas de Dispersão
Diagrama em Caixas
Calcule o desvio médio e o desvio padrão amostral
xi |xi − x̄ | (xi − x̄)2
2
9
1
6
5
(DESVIO AMOSTRAL)
Médio absoluto Padrão
DMA =
∑n
i=1 |xi − x̄ |
n
S =
√∑n
i=1(xi − x̄)2
n − 1
Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 26-31
Medidas de Tendência Central
Separatrizes
Medidas de Dispersão
Diagrama em Caixas
Medidas de dispersão
MEDIDAS DE DISPERSÃO RELATIVA
A dispersão relativa permite comparar duas ou mais distribuições,
mesmo quando os dados destas distribuições são expressos em
unidades diferentes.
COEFICIENTE DE VARIAÇÃO DE PEARSON (CVp)
Para população // CVp =
σ
µ
100
Para amostra // CVp =
S
x̄
100
Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 26-31
Medidas de Tendência Central
Separatrizes
Medidas de Dispersão
Diagrama em Caixas
Medidas de dispersão
MEDIDAS DE DISPERSÃO RELATIVA
COEFICIENTE DE VARIAÇÃO DE THORNDIKE (CVT )
Para população // CVT =
σ
Md
100
Para amostra // CVT =
S
Md
100
Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 27-31
Medidas de Tendência Central
Separatrizes
Medidas de Dispersão
Diagrama em Caixas
Diagrama em caixas
 
Fonte: Barbetta, 2002 (Fig. 6.8a)
Onde:
ES (extremo superior) = maior va-
lor do conjunto de dados;
EI (extremo inferior) = menor valor
do conjunto de dados;
QS (quartil superior) = terceiro
quartil;
Md (mediana) = segundo quartil;
QI (quartil inferior) = primeiro quar-
til;
dQ = desvio entre quartis.
dQ = QS −QI
Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 28-31
Medidas de Tendência Central
Separatrizes
Medidas de Dispersão
Diagrama em Caixas
Diagrama em caixas
Os valores que estão afastados do primeiro ou terceiro quartis mais
do que 1,5dQ podem ser considerados valores discrepantes.
Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 29-31
Medidas de Tendência Central
Separatrizes
Medidas de Dispersão
Diagrama em Caixas
Diagrama em caixas
Forma do diagrama em caixas para uma distribuição simétrica:
 
 
 
Fonte: Barbetta, 2002 (Fig. 6.9)
Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 30-31
Medidas de Tendência Central
Separatrizes
Medidas de Dispersão
Diagrama em Caixas
Diagrama em caixas
Forma do diagrama em caixas para uma distribuição assimétrica: 
 
 
Fonte: Barbetta, 2002 (Fig. 6.9)
Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 31-31

Continue navegando