Buscar

formulas estatisticas

Prévia do material em texto

Mário Ferreira Neto 
Professor Especialista em Matemática e Estatística – UFLA/MG 
 
ESTATÍSTICA DESCRITIVA 
 
EQUAÇÕES E FÓRMULAS ALGÉBRICAS DAS MEDIDAS 
DE TENDÊNCIA CENTRAL E DE DISPERSÃO 
 
1- ELEMENTOS DA DISTRIBUIÇÃO DE FREQUENCIA 
 
1.1- Frequência absoluta ou simples 
nfi 
 

→ Somatório 
if
→ Frequência absoluta ou simples 
n
→ Quantidade de frequência da amostra ou tamanho da amostra 
 
1.2- Frequência acumulada simples 
kk ffffF  ...321
 
kF
→ Frequência acumulada simples 
1f
→ Frequência na primeira ordem 
2f
→ Frequência na segunda ordem 
kf
→ Frequência na última ordem 
 
1.3- Frequência relativa 


i
i
ri
f
f
f
 
rif
→ Frequência relativa 
if
→ Frequência absoluta ou simples 

→ Somatório 
 
Mário Ferreira Neto 
Professor Especialista em Matemática e Estatística – UFLA/MG 
 
 
 
 
1.4- Frequência acumulada relativa 


i
i
ri
f
F
F
 
riF
→ Frequência acumulada relativa 
if
→ Frequência acumulada 

→ Somatório 
 
1.5- Frequência relativa (percentual) 
100.%


i
i
ri
f
f
f
 
rif
→ Frequência relativa em porcentagem 
if
→ Frequência absoluta ou simples 

→ Somatório 
 
1.6- Frequência acumulada relativa 
100.%


i
i
ri
F
F
F
 
riF
→ Frequência acumulada relativa em porcentagem 
if
→ Frequência acumulada 

→ Somatório 
 
2- AMOSTRA 
2.1- Dados brutos (não agrupados) ou dados em rol 
 
 
Mário Ferreira Neto 
Professor Especialista em Matemática e Estatística – UFLA/MG 
 
2.1.1- Número de classes (K) 
K = 5 se n ≤ 25 
nK 
 se n > 25 ou K = 1 + 3,32 log(n) → Regra de Sturges 
K
→ Número de classes 
n
→ Quantidade de frequência da amostra ou tamanho da amostra 
 
2.1.2- Amplitude de classe 
K
MenorMaior
h


 
h
→ Amplitude da classe 
Maior
→ Maior número do rol ou da série 
Menor
→ Menor número do rol ou da série 
K
→ Número de classes 
 
2.1.3- Média aritmética simples 
n
x
x
i

 
x
→ Média aritmética 
ix
→ Valor genérico da observação ou da frequência (rol ou série) 
n
→ Quantidade de frequência da amostra ou tamanho da amostra 
 
2.1.4- Média geométrica simples 
n
ng xxxxx ..... 321
 
gx
→ Média geométrica 
1x
→ Valor dado qualquer do rol ou da série (primeiro) 
2x
→ Valor dado qualquer do rol ou da série (segundo) 
nx
→ Valor dado qualquer (último valor do rol ou da série) 
n
→ Quantidade de frequência da amostra ou tamanho da amostra 
 
Mário Ferreira Neto 
Professor Especialista em Matemática e Estatística – UFLA/MG 
 
 
2.1.5- Média harmônica simples 
n
h
xxx
n
x
1
...
11
21


 
hx
→ Média harmônica 
1x
→ Valor dado qualquer do rol ou da série (primeiro) 
2x
→ Valor dado qualquer do rol ou da série (segundo) 
nx
→ Valor dado qualquer (último valor do rol ou da série) 
n
→ Quantidade de frequência da amostra ou tamanho da amostra 
 
2.1.6- Média ponderada simples 



1
.
c
xc
x
ii
p
 
px
→ Média ponderada 
ix
→ Valor genérico da observação ou da frequência (rol ou série) 
ic
→ Valor do peso da variável 
 
2.1.7- Desvio em relação à média 
 xxd ii 
 
id
→ Desvio 
ix
→ Valor genérico da observação ou frequência 
x
→ Média aritmética 
 
2.1.8- Desvio médio simples 
 
n
xx
DM
i 

 
 
Mário Ferreira Neto 
Professor Especialista em Matemática e Estatística – UFLA/MG 
 
DM
→ Desvio médio 
ix
→ Valor genérico da observação ou frequência 
x
→ Média aritmética 
n
→ Quantidade de frequência da amostra ou tamanho da amostra 

→ Somatório 
 
 
 
 
2.1.9- Mediana 
2
1

n
M d
 Quando for ímpar (A mediana divide o rol ou a série em 
duas partes iguais - ordem central do rol ou da série). 
dM
→ Mediana 
n
→ Quantidade de dados do rol ou da série ou a frequência da 
amostra ou tamanho da amostra 
2
n
M d 
 e 
1
2

n
M d
 Quando for par (A medida divide o rol ou a 
série em duas partes iguais - duas ordens centrais do rol ou da 
série). A mediana será a média aritmética entre os termos da ordem. 
dM
→ Mediana 
n
→ Quantidade de frequência da amostra ou tamanho da amostra 
 
2.1.10- Moda 
oM
 Valor com maior número de repetições (classe modal). A moda é 
o valor que estiver na ordem ou na classe modal (valor modal). 
oM
→ Moda 
Observações: 
 
Mário Ferreira Neto 
Professor Especialista em Matemática e Estatística – UFLA/MG 
 
Série amodal → não tem valor modal 
Série unimodal → um valor modal 
Série bimodal → dois valores modais 
Série trimodal → três valores modais 
Série polimodal → quatro ou mais valores modais 
 
2.1.11- Quartis 
1Q
 → Mediana da primeira metade dos elementos da série 
2Q
 → Mediana de todos os elementos da série 
3Q
 → Mediana da segunda metade dos elementos da série 
 
Observações: Nos quartis a série é dividida em quatro partes iguais 
com o mesmo número de elementos, de tal forma que cada intervalo 
do quartil contenha 25% dos elementos coletados: 1º quartil separa 
os primeiros 25% dos elementos da serie; 2º quartil separa os 
primeiros 50% dos elementos da serie; 3º quartil separa os primeiros 
75% dos elementos da serie. 
 
2.1.12- Variância 
 
1
2
2




n
xx
s
i 
2s
→ Variância 
ix
→ Valor genérico da observação ou frequência 
x
→ Média aritmética 
n
→ Quantidade de frequência da amostra ou tamanho da amostra 

→ Somatório 
 
 
Mário Ferreira Neto 
Professor Especialista em Matemática e Estatística – UFLA/MG 
 
2.1.13- Desvio-padrão 
2ss 
 
s
→ Desvio-padrão 
2s
→ Variância 
 
2.2- Dados agrupados sem intervalos de classes 
 
2.2-1. Média aritmética simples 
n
fx
x
ii .

 ou 



i
ii
f
fx
x
. Observação: 
  nfi
 
x
→ Média aritmética 
ix
→ Valor genérico da observação ou frequência 
if
→ Frequência absoluta ou simples 
n
→ Quantidade de frequência da amostra ou tamanho da amostra 

→ Somatório 
 
2.2-2. Mediana 
2
1

n
M d
 Quando for ímpar (A mediana divide o rol ou a série em 
duas partes iguais, mas a ordem central do rol ou da série). 
dM
→ Mediana 
n
→ Quantidade de dados do rol ou da série ou a frequência da 
amostra ou tamanho da amostra 
2
n
M d 
 e 
1
2

n
M d
 Quando for par (A medida divide o rol ou a 
série em duas partes iguais - duas ordens centrais do rol ou da 
série). A mediana será a média aritmética entre os termos da ordem. 
 
Mário Ferreira Neto 
Professor Especialista em Matemática e Estatística – UFLA/MG 
 
dM
→ Mediana 
n
→ Quantidade de frequência da amostra ou tamanho da amostra 
 
2.2-3. Moda 
oM
 Valor com maior número de repetições ou maior frequência 
(classe modal). A moda é o valor que estiver na ordem ou na classe. 
oM
→ Moda 
Observação: 1º- Localizar a classe modal (classe que contém o maior 
valor de frequência); 2º- Verificar o valor da variável contidona 
classe modal. 
 
2.2-4. Quartis 
1Q
 → k = 1 
2Q
 → k = 2 
3Q
 → k = 3 
kQ
 → É o valor da variável que corresponde à classe desse quartil 
considerado. 
1º- Calcular a posição do quartil para estabelecer em que classe se 
localiza o quartil considerado 
4
.nk
Qk
 
kQ
→ É o valor da variável que corresponde à classe desse quartil 
considerado. 
k
→ Número do quartil considerado 
n
→ Quantidade de frequência da amostra ou tamanho da amostra 
 
Mário Ferreira Neto 
Professor Especialista em Matemática e Estatística – UFLA/MG 
 
Observação: 1º- Localizar esse valor na coluna da frequência 
acumulada para conhecer qual é a classe que corresponde a essa 
posição (classe do quartil k); 2º- Verificar na coluna da variável em 
estudo qual o valor da variável localizada na classe do quartil 
considerado. 
 
2.2-5. Variância 
 
1
2
2
2





n
n
x
x
s
i
i
 
2s
→ Variância 
ix
→ Valor genérico da observação ou frequência 
x
→ Média aritmética 
n
→ Quantidade de frequência da amostra ou tamanho da amostra 

→ Somatório 
 
2.2-6. Desvio-padrão 
2ss  
s
→ Desvio-padrão 
2s
→ Variância 
 
2.3- Dados agrupados com intervalos de classes 
 
2.3.1- Amplitude de classe 
ii lLh 
 ou k
R
h 
 
 
h
→ Amplitude da classe 
h
→ Amplitude da classe 
iL
→ Limite superior da classe 
R
→ Amplitude 
 
Mário Ferreira Neto 
Professor Especialista em Matemática e Estatística – UFLA/MG 
 
il
→ Limite inferior da classe 
k
→ Número de classes 
 
2.3.2- Amplitude total da distribuição 
mínmáx lLAT 
 
AT
→ Amplitude total da distribuição 
máxL
→ Limite superior da distribuição 
mínl
→ Limite inferior da distribuição 
 
2.3.3- Amplitude amostral 
mínmáx xxAA 
 
AA
→ Amplitude amostral 
máxx
→ Limite máximo da amostra 
mínx
→ Limite mínimo da amostra 
 
2.3.4- Ponto médio de classe 
2
ii LlPM


 
PM
→ Ponto Médio 
il
→ Limite inferior da classe 
iL
→ Limite superior da classe 
 
 
2.3.5- Média aritmética ponderada 



i
ii
f
fx
x
. 
x
→ Média aritmética ponderada 
ix
→ Valor do ponto médio do intervalo de classe 
 
Mário Ferreira Neto 
Professor Especialista em Matemática e Estatística – UFLA/MG 
 
if
→ Frequência absoluta ou simples 

→ Somatório 
 
2.3.6- Ponto médio de classe 
2
supinf Ll
xi


 
ix
→ Valor genérico da observação ou frequência 
infl
→ Limite inferior da classe 
supL
→ Limite superior da classe 
 
2.3.7- Desvio em relação à média 
 xxd ii 
 
id
→ Desvio 
ix
→ Valor genérico da observação ou frequência 
x
→ Média aritmética 
 
2.3.8- Desvio médio simples 
 
n
xx
DM
i 

 
DM
→ Desvio médio 
ix
→ Valor genérico da observação ou frequência 
x
→ Média aritmética 
n
→ Quantidade de frequência da amostra ou tamanho da amostra 

→ Somatório 
 
2.3.9- Desvio médio absoluto 
 
Mário Ferreira Neto 
Professor Especialista em Matemática e Estatística – UFLA/MG 
 
n
xx
DM
i
A
 

 Observação: O desvio médio, em geral, é 
aproximadamente igual a 0,8 vezes o desvio-padrão. 
ADM
→ Desvio médio 
ix
→ Valor genérico da observação ou frequência 
x
→ Média aritmética 
n
→ Quantidade de frequência da amostra ou tamanho da amostra 

→ Somatório 
 
2.3.10- Mediana 
Critérios para determinação da mediana: 
1º- 
2
 if
 ou 2
n
 

→ Somatório 
if
→ Frequência absoluta ou simples 
n
→ Quantidade de frequência da amostra ou tamanho da amostra 
2º- A menor frequência acumulada que superar o valor da frequência 
acumulada da classe mediana
 
3º- 
i
ant
i
d
f
hF
f
lM
.
2
inf











 ou Md
Mdant
Mdd
f
hF
n
lM
.
2








 
 
dM
→ Mediana 
infl
→ Limite inferior do intervalo de classe mediana 
if
→ Frequência absoluta ou simples da classe mediana 
antF
→ Frequência acumulada da classe anterior à classe mediana 
h
→ Amplitude do intervalo de classe mediana 
 
Mário Ferreira Neto 
Professor Especialista em Matemática e Estatística – UFLA/MG 
 

→ Somatório 
 
dM
→ Mediana 
Mdl
→ Limite inferior da classe que contém a mediana 
n
→ Quantidade de frequência da amostra ou tamanho da amostra ou 
número de elementos do conjunto de dados 
Mdf
→ Frequência absoluta ou simples da classe que contém a 
mediana 
antF
→ Frequência acumulada da classe anterior à classe mediana ou 
soma das frequências simples anteriores à classe que contém a 
medida 
Mdh
→ Amplitude do intervalo da classe que contém a mediana 
 
2.3.11- Moda 
h
dd
d
lM o .
21
1
inf 







 
Mo
→ Moda 
infl
→ Limite inferior da classe modal 
1d
→ Frequência absoluta ou simples menos frequência absoluta ou 
simples anterior à classe modal (diferença entre a frequência da 
classe modal e a da classe imediatamente anterior) 
2d
→ Frequência absoluta ou simples menos frequência absoluta ou 
simples posterior à classe modal (diferença entre a frequência da 
classe modal e a da classe imediatamente posterior - seguinte) 
h
→ Amplitude de intervalo da classe modal 
Observação: 1º- Localizar a classe modal (classe que contém o maior 
valor de frequência); 2º- A moda é um valor contido no intervalo de 
 
Mário Ferreira Neto 
Professor Especialista em Matemática e Estatística – UFLA/MG 
 
classe modal; 3º - Cálculo da moda pela Regra de Czuber com base 
nos valores da classe modal. 
MoMoMo lLh 
 
Moh
→ Amplitude de intervalo da classe modal 
MoL
→ Limite Superior da classe modal 
Mol
→ Limite inferior da classe modal 
antMo ffd 1
 
1d
→ Diferença entre a frequência da classe modal e a frequência da 
classe anterior à classe modal 
Mof
→ Frequência da classe modal 
antf
→ Frequência da classe anterior à classe modal 
postMo ffd 2
 
2d
→ Diferença entre a frequência da classe modal e a frequência da 
classe posterior à classe modal 
Mof
→ Frequência da classe modal 
postf
→ Frequência da classe posterior à classe modal 
Observação: Moda bruta é o valor do ponto médio da classe modal. 
 
2.3.12- Quartis 
Qk
Qk
ant
Qkk h
f
F
nk
lQ .4
.












 
kQ
→ Quartil 
k
→ Quartil considerado 
Qkl
→ Limite inferior do intervalo de classe do quartil considerado 
 
Mário Ferreira Neto 
Professor Especialista em Matemática e Estatística – UFLA/MG 
 
n
→ Quantidade de frequência da amostra ou tamanho da amostra ou 
número de elementos do conjunto de dados 
Qkf
→ Frequência absoluta ou simples da classe do quartil considerado 
antF
→ Frequência acumulada da classe anterior à classe do quartil 
considerado 
Qkh
→ Amplitude do intervalo de classe do quartil considerado 
QkQkQk lLh 
 
Qkh
→ Amplitude do intervalo de classe do quartil considerado 
QkL
→ Limite Superior da classe do quartil considerado 
Qkl
→ Limite inferior da classedo quartil considerado 
 
2.3.13- Relação empírica entre média, mediana e moda 
 do MxMx  3
 
x
→ Média aritmética 
Mo
→ Moda 
dM
→ Mediana 
 
2.3.14- Amplitude total 
mínmáx xxR 
 
R
→ Amplitude total 
máxx
→ Limite máximo e 
mínx
→ Limite mínimo 
 
2.3.15- Variância 
 
1
.
.
2
2
2





n
n
fx
fx
s
ii
ii
 
2s
→ Variância 
 
Mário Ferreira Neto 
Professor Especialista em Matemática e Estatística – UFLA/MG 
 
ix
→ Valor genérico da observação ou frequência 
if
→ Frequência absoluta ou simples 
n
→ Quantidade de frequência da amostra ou tamanho da amostra 

→ Somatório 
 
2.3.16- Desvio-padrão 
2ss  
s
→ Desvio-padrão 
2s
→ Variância 
 
2.3.17- Erro padrão 
n
s
sx 
 
xs
→ Erro padrão 
s
→ Desvio-padrão 
n
→ Quantidade de frequência da amostra ou tamanho da amostra 
 
2.3.18- Relação empírica entre o desvio-padrão e a amplitude 
3
R
<s<
6
R 
R
→ Amplitude 
s
→ Desvio-padrão 
 
2.3.19- Coeficiente de variação 
100.
x
s
CV 
 Observação: CV é dado em percentual 
 
Mário Ferreira Neto 
Professor Especialista em Matemática e Estatística – UFLA/MG 
 
CV
→ Coeficiente de variação 
s
→ Desvio-padrão 
x
→ Média aritmética 
Análise do coeficiente de variação 
CV≥ 30% → Dispersão alta (elevada, intensa) 
15%<CV<30% → Dispersão média (central, mediana) 
CV≤ 15% → Dispersão baixa (mínima, pequena) 
 
2.3.20- Momentos de uma distribuição de frequências 
 
2.3.19.1- Dados em ordem ou rol ou série 
n
x
M
t
i
t


 Observação: momento de ordem t de um conjunto 
de dados 
tM
→ Momento de ordem t 
ix
→ Valor genérico da observação ou frequência 
n
→ Quantidade de frequência da amostra ou tamanho da amostra 
 
n
ax
M
t
ia
t
 

 Observação: momento de ordem t em 
relação a uma constante a 
a
tM
→ Momento de ordem t em relação a constante a 
ix
→ Valor genérico da observação ou frequência 
a
→ Constante 
n
→ Quantidade de frequência da amostra ou tamanho da amostra 
 
 
n
xx
M
t
i
t
 

 Observação: momento de ordem t centrado 
em relação à média 
 
Mário Ferreira Neto 
Professor Especialista em Matemática e Estatística – UFLA/MG 
 
tM
→ Momento de ordem t 
ix
→ Valor genérico da observação ou frequência 
x
→ Média aritmética 
n
→ Quantidade de frequência da amostra ou tamanho da amostra 
 
2.3.19.2- Dados agrupados em classes de frequências 
n
fx
M
i
t
i
t


. Observação: momento de ordem t de um 
conjunto de dados 
tM
→ Momento de ordem t 
ix
→ Valor genérico da observação ou frequência 
if
→ Frequência absoluta ou simples 
n
→ Quantidade de frequência da amostra ou tamanho da amostra 
 
n
fax
M
i
t
ia
t
 

. Observação: momento de ordem t em 
relação a uma constante a 
a
tM
→ Momento de ordem t em relação a constante a 
ix
→ Valor genérico da observação ou frequência 
a
→ Constante 
if
→ Frequência absoluta ou simples 
n
→ Quantidade de frequência da amostra ou tamanho da amostra 
 
n
fxx
M
i
t
i
t
 

. Observação: momento de ordem t 
centrado em relação à média 
tM
→ Momento de ordem t 
ix
→ Valor genérico da observação ou frequência 
x
→ Média aritmética 
 
Mário Ferreira Neto 
Professor Especialista em Matemática e Estatística – UFLA/MG 
 
if
→ Frequência absoluta ou simples 
n
→ Quantidade de frequência da amostra ou tamanho da amostra 
 
2.3.19.3- Momentos em ordens 
xM 1
 e 
01 m
 
1M
→ Momento de ordem 1 
x
→ Média aritmética 
2
2 .
1
s
n
n
m


 
2m
→ Momento de ordem 2 
2s
→ Variância 
n
→ Quantidade de frequência da amostra ou tamanho da amostra 
 
2.3.19.4- Momentos centrados de 3ª e 4ª ordem em rol ou 
série 
3
23
3 2.3 x
n
x
x
n
x
m
ii

 
3m
→ Momento de ordem 3 
x
→ Média aritmética 
n
→ Quantidade de frequência da amostra ou tamanho da amostra 
4
2
2
34
4 3.6.4 x
n
x
x
n
x
x
n
x
m
iii

 
4m
→ Momento de ordem 4 
x
→ Média aritmética 
n
→ Quantidade de frequência da amostra ou tamanho da amostra 
 
 
 
 
Mário Ferreira Neto 
Professor Especialista em Matemática e Estatística – UFLA/MG 
 
 
2.3.19.5- Momentos centrados de 3ª e 4ª ordem em classes 
3
23
3 2
.
.3
.
x
n
fx
x
n
fx
m
iiii

 
3m
→ Momento de ordem 3 
if
→ Frequência absoluta ou simples 
x
→ Média aritmética 
n
→ Quantidade de frequência da amostra ou tamanho da amostra 
4
2
2
34
4 3
.
.6
.
.4
.
x
n
fx
x
n
fx
x
n
fx
m
iiiiii

 
4m
→ Momento de ordem 4 
if
→ Frequência absoluta ou simples 
x
→ Média aritmética 
n
→ Quantidade de frequência da amostra ou tamanho da amostra 
4
22
4 .
240
2
2
.
h
sh
m 
 Observação: Correção de Sheppard 
(subtração) para dados agrupados em classes
 
4m
→ Momento de ordem 4 
h
→ Amplitude da classe 
2s
→ Variância 
 
2.3.21- Escore padronizado 
s
xx
z ii

 Observação: xxi  afastamento do valor da 
observação em relação a media com a divisão pelo Desvio-padrão 
como unidade de medida 
iz
→ Escore padronizado 
 
Mário Ferreira Neto 
Professor Especialista em Matemática e Estatística – UFLA/MG 
 
ix
→ Valor genérico da observação ou frequência 
x
→ Média aritmética 
s
→ Desvio-padrão 
z>1 → Anormal 
z<1 → Normal 
 
2.3.22- Assimetria 
 
s
mx
AS d


3 Observação: assimetria situa-se entre -3 e 3 
AS
→ Assimetria 
x
→ Média aritmética 
dM
→ Mediana 
s
→ Desvio-padrão 
Análise da assimetria 
AS > 1 → Assimetria Moderada 
AS > 0 → Assimetria positiva 
AS < 0 → Assimetria negativa 
 
2.3.23- Medidas de assimetria (coeficiente de assimetria) 
3
3
3
s
m
a 
 Observação: momento de 3ª ordem dividido pelo cubo do 
desvio-padrão (indica o sentido da assimetria) 
3a
→ Coeficiente de assimetria de ordem 3 
3m
→ Momento de ordem 3 
s
→ Desvio-padrão 
 
2.3.24- Índice de assimetria de Pearson 
x
o
s
mx
A


 
 
Mário Ferreira Neto 
Professor Especialista em Matemática e Estatística – UFLA/MG 
 
A
→ Coeficiente de assimetria de ordem 3 
x
→ Média aritmética 
Mo
→ Moda 
s
→ Desvio-padrão 
Análise da assimetria 
|A| < 0,15 → praticamente a distribuição é simétrica 
0,15 < |A| < 1 → Assimetria moderada 
|A| > 1 → Assimetria forte 
 
2.3.25- Medidas de achatamento ou curtose 
22
4
4
s
m
a 
 
4a
→ Coeficiente de curtose 
4m
→ Momento de ordem 4 
2s
→ Variância 
Observação: Coeficiente de curtose é o quociente do momento de 4ª 
ordem pelo quadrado da variância 
Análise da assimetria 
Adimensional < 3 para as distribuições platicúrticas 
Adimensional = 3 para as distribuições mesocúrticas 
Adimensional > 3 para as distribuições leptocúrticas 
Observação: Distribuição normal é mesocúrtica; Distribuiçõesachatadas: platicúrtica e leptocúrtica. 
Coeficiente de excesso: 
34 a
 para fixar o zero como referência 
mesocúrtica. 
 
Observação especial: Os tamanhos da população e da amostra 
permitem estabelecer duas relações importantes: 
 
Mário Ferreira Neto 
Professor Especialista em Matemática e Estatística – UFLA/MG 
 
Fração de amostragem = 
N
n 
n
→ Tamanho da amostra 
N
→ Tamanho da população 
Fator de expansão ou Intervalo de Seleção = 
n
N 
N
→ Tamanho da população 
n
→ Tamanho da amostra

Mais conteúdos dessa disciplina