Buscar

ESTATISTICA 5

Prévia do material em texto

Análise Exploratória de Dados
● Medidas de Posição (tendência central)
– Média
– Moda (medida mais frequente)
– Mediana (medida que ocupa a posição central)
● Medidas de Dispersão
indicam se valores relativamente próximos um dos 
outros, ou separados em torno de uma medida de 
posição: a média.
– Desvio padrão
– Variância
– Coeficiente de Variação
 
Medidas de Dispersão
Dados Não Agrupados
 
Medidas de Dispersão
Dados Não Agrupados
● Desvio padrão (S)
Mede o grau de dispersão dos dados numéricos em 
torno de um valor médio.
Sejam os elementos de uma amostra, 
portanto “n” valores da variável x. 
x1 , x2 , x3 ,... , xn
 
Medidas de Dispersão
Dados Não Agrupados
● Exemplo de cálculo do desvio padrão:
Seja a amostra 10, 12, 14, 16, 18.
1º – calcula-se a média
2º – calculam-se os desvios de cada valor em relação 
a média
3º – aplica-se a formula do desvio padrão
 
Medidas de Dispersão
Dados Não Agrupados
● Exemplo de cálculo do desvio padrão:
Seja a amostra 10, 12, 14, 16, 18.
1º – calcula-se a média: = 14.
2º – calculam-se os desvios de cada valor em relação a média
10 – 14 = -4 12 – 14 = -2 14 – 14 = 0
16 – 14 = 2 18 – 14 = 4
3º – aplica-se a formula do desvio padrão
 
x
S=√ (−4 )2+(−2)2+(0)2+(2)2+(4 )24 =√ 16+4+0+4+164 =√ 404 =√ 10
S=3,162277.
 
Medidas de Dispersão
Dados Não Agrupados
● Variância (S²)
Mede a variação média em torno da Média.
Sejam os elementos de uma amostra, 
portanto “n” valores da variável x. 
x1, x2 , x3 ,... , xn
 
Medidas de Dispersão
Dados Não Agrupados
● Exemplo de cálculo da variância:
Seja a amostra de tempo de serviço de cinco 
funcionários: 3, 7, 8, 10 e 11.
1º – calcula-se a média
2º – calculam-se os desvios de cada valor em relação 
a média
3º – aplica-se a formula da variância
 
Medidas de Dispersão
Dados Não Agrupados
● Exemplo de cálculo da variância:
Seja a amostra 3, 7, 8, 10 e 11.
1º – calcula-se a média: = 7,8.
2º – calculam-se os desvios de cada valor em relação a média
 3 – 7,8 = -4,8 7 – 7,8 = -0,8 8 – 7,8 = 0,2
10 – 7,8 = 2,2 11 – 7,8 = 3,2
3º – aplica-se a formula da variância
S² = [(-4,8)² + (-0,8)² + (0,2)² + (2,2)² + (3,2)²] / 4
S² = [23,04 + 0,64 + 0,04 + 4,84 + 10,24] / 4
S² = 38,8 / 4 = 9,7. E o desvio padrão: S = 3,11448..
x
 
Medidas de Dispersão
Dados Não Agrupados
● Relação entre desvio padrão e variância:
Desvio padrão:
Variância:
Relação:
 
Medidas de Dispersão
Dados Não Agrupados
● Coeficiente de Variação (CV)
média relativa útil para comparação e observação em 
termos relativos ao grau de concentração em torno da 
média de séries distintas.
Representa o desvio padrão expresso como porcenta-
gem da média.
 
Medidas de Dispersão
Dados Não Agrupados
● Coeficiente de Variação
Classificação da distribuição quanto à dispersão:
● Dispersão baixa: CV ≤ 15%
● Dispersão média: 15% < CV < 30%
● Dispersão alta: CV ≥ 30%
 
Medidas de Dispersão
Dados Não Agrupados
● Exemplo de cálculo do coeficiente de variação:
Seja a amostra de tempo de serviço de cinco 
funcionários: 3, 7, 8, 10 e 11.
1º – calcula-se a média
2º – calcula-se o desvio padrão
3º – aplica-se a formula do coeficiente de variação
 
Medidas de Dispersão
Dados Não Agrupados
● Exemplo de cálculo do coeficiente de variação:
Seja a amostra 3, 7, 8, 10 e 11.
1º – calcula-se a média: = 7,8.
2º – calcula-se o desvio padrão: S = 3,11448 = 3,11
3º – aplica-se a formula do coeficiente de variação
CV = (3,11 / 7,8) * 100
CV = 0,3987* 100
CV = 39,87%.
x
 
Propriedades
Medidas de Posição e Dispersão
Dados Não Agrupados
 
Medidas de Posição
Propriedades
Dados Não Agrupados
● Média Aritmética
– A soma algébrica dos desvios em relação a 
média é nula.
 onde 
 
– A soma dos quadrados dos desvios em relação 
a média é um mínimo.
∑
i=1
n
d i=∑
i=1
n
(x i−x)=0
∑
i=1
n
(x i−x)
2<∑
i=1
n
(xi−x0)
2
d i=x i−x
i=1, 2,... , n
 
● Média Aritmética
– Se números tem média , se números 
tem média , … , se números tem média 
então:
n1 x1 n2
x2 nk xk
x=
x1 .n1+ x2.n2+...+xk .nk
n1+n2+...+nk
x=
∑
j=1
k
x j .n j
∑
j=1
n
n j
Medidas de Posição
Propriedades
Dados Não Agrupados
 
● Média Aritmética
– Ao somar (ou subtrair) uma constante a cada 
elemento de uma série , a média fica somada (ou 
subtraída) por essa constante.
 
 
– Ao multiplicar (ou dividir) uma constante a cada 
elemento de uma série , a média fica multiplicada 
(ou dividida) por essa constante.
Y=X±X0⇒ y=x± x0
X0
X
c
X
Y=c . X⇒ y=c .x Y= Xc ⇒ y=
x
c
Medidas de Posição
Propriedades
Dados Não Agrupados
 
● Desvio Padrão
– Ao somar (ou subtrair) uma constante a cada 
elemento de uma série , o desvio padrão não se 
altera.
 
 
– Ao multiplicar (ou dividir) uma constante a cada 
elemento de uma série , o desvio padrão fica 
multiplicado (ou dividido) por essa constante.
Y=X±X0⇒SY=S X
X0
X
c
X
Y=c . X⇒SY=c . SX Y=
X
c
⇒SY=
S X
c
Medidas de Dispersão
Propriedades
Dados Não Agrupados
 
● Variância
– Ao somar (ou subtrair) uma constante a cada 
elemento de uma série , a variância não se altera.
 
 
– Ao multiplicar (ou dividir) uma constante a cada 
elemento de uma série , a variância fica multipli-
cada (ou dividida) pelo quadrado dessa constante.
Y=X±X0⇒SY
2=S X
2
X0
X
c
X
Y=c . X⇒SY
2=c2 . SX
2 Y= X
c
⇒SY
2=
S X
2
c2
Medidas de Dispersão
Propriedades
Dados Não Agrupados
 
Análise Exploratória de Dados
● Medidas de Posição (tendência central)
– Média
– Moda (medida mais frequente)
– Mediana (medida que ocupa a posição central)
● Medidas de Dispersão
indicam se valores relativamente próximos um dos outros, 
ou separados em torno de uma medida de posição: a 
média.
– Desvio padrão
– Variância
– Coeficiente de Variação
 
Medidas de Posição 
Dados Agrupados
● Média 
– Distribuição de frequência por valores simples
Faz-se a média aritmética de 
ponderados pelas respectivas frequências
absolutas 
 
 onde
k: quantidade de elementos distintos.
x1, x2 , x3 ,... , xn
f 1, f 2, ... , f n .
x=
∑
i=1
k
x i . f i
n
n=∑
i=1
k
f i
 
Medidas de Posição 
Dados Agrupados
● Exemplo: nº de alunos em 20 turmas da UFC 
Calcular a média aritmética por valores simples
1 2 3 4 5 6 7 8 9 10 11 12 13 Total
41 42 43 44 45 46 50 51 52 54 57 58 60
3 2 1 1 1 2 2 1 1 1 1 2 2 20
1 2 3 4 5 6 7 8 9 10 11 12 13 Total
41 42 43 44 45 46 50 51 52 54 57 58 60
3 2 1 1 1 2 2 1 1 1 1 2 2 20
1 2 3 4 5 6 7 8 9 10 11 12 13 Total
41 42 43 44 45 46 50 51 52 54 57 58 60
3 2 1 1 1 2 2 1 1 1 1 2 2 20
123 84 43 44 45 92 100 51 52 54 57 116 120 981
x=
∑
i=1
13
x i . f i
20
=?
 
Medidas de Posição 
Dados Agrupados
● Exemplo: nº de alunos em 20 turmas da UFC 
Calcular a média aritmética por valores simples
x=
∑
i=1
13
x i . f i
20
=
981
20
=49,05
1 2 3 4 5 6 7 8 9 10 11 12 13 Total
41 42 43 44 45 46 50 51 52 54 57 58 60
3 2 1 1 1 2 2 1 1 1 1 2 2 20
123 84 43 44 45 92 100 51 52 54 57 116 120 981
 
Medidas de Posição 
Dados Agrupados
● Média 
– Distribuição de frequência por classes
Faz-sea média aritmética dos pontos médios 
 de cada classe, ponderados pelas
respectivas frequências absolutas 
 onde
 
k: quantidade de classes.
x1 , x2 , x3 ,... , xn
f 1, f 2, ... , f n .
x=
∑
i=1
k
x i . f i
n
n=∑
i=1
k
f i
 
Medidas de Posição 
Dados Agrupados
● Exemplo: nº de alunos em 20 turmas da UFC 
Calcular a média aritmética por classes
x=?
Classes Frequência
1 41 |-- 45 7
2 45 |-- 49 3
3 49 |-- 53 4
4 53 |-- 57 1
5 57 |-- 61 5
Total 20
 
Medidas de Posição 
Dados Agrupados
● Exemplo: nº de alunos em 20 turmas da UFC 
Calcular a média aritmética por classes
Classes
1 41 |-- 45 7
2 45 |-- 49 3
3 49 |-- 53 4
4 53 |-- 57 1
5 57 |-- 61 5
Total 20
f i x i x i . f i
x=
∑
i=1
5
x i . f i
20
=?
 
Medidas de Posição 
Dados Agrupados
● Exemplo: nº de alunos em 20 turmas da UFC 
Calcular a média aritmética por classes
x=
∑
i=1
5
x i . f i
20
=
996
20
=49,80
Classes
1 41 |-- 45 7 43 301
2 45 |-- 49 3 47 141
3 49 |-- 53 4 51 204
4 53 |-- 57 1 55 55
5 57 |-- 61 5 59 295
Total 20 996
f i x i x i . f i
 
Medidas de Posição 
Dados Agrupados
● Moda 
– Distribuição de frequência por valores simples
Faz-se pela simples observação do elemento que 
apresenta a maior frequência.
Exemplo: nº de alunos em 20 turmas da UFC
Como a maior frequência é então Mo = 41. 
1 2 3 4 5 6 7 8 9 10 11 12 13 Total
41 42 43 44 45 46 50 51 52 54 57 58 60
3 2 1 1 1 2 2 1 1 1 1 2 2 20
1 2 3 4 5 6 7 8 9 10 11 12 13 Total
41 42 43 44 45 46 50 51 52 54 57 58 60
3 2 1 1 1 2 2 1 1 1 1 2 2 20
f i=3
 
Medidas de Posição 
Dados Agrupados
● Moda 
– Distribuição de frequência por classes
Temos diversos métodos para o cálculo da moda 
neste caso. Usaremos o Método de Czuber:
● Identifica-se a classe modal (maior frequência)
Classe (Mo)
● Aplica-se a formula:
Mo=li+h .
Δ1
Δ2+Δ1
 
Medidas de Posição 
Dados Agrupados
● Moda 
– Distribuição de frequência por classes
em que:
 Limite inferior da classe modal
 (freq. modal – freq. anterior)
 (freq. modal – freq. posterior)
 amplitude da classe modal
Mo=li+h .
Δ1
Δ2+Δ1
li :
Δ1=f mo−f ant :
Δ2=f mo−f post :
h :
 
Medidas de Posição 
Dados Agrupados
● Exemplo: nº de alunos em 20 turmas da UFC 
Calculando a moda por classes, temos:
Classe (Mo) = ?, , , 
Classes
1 41 |-- 45 7
2 45 |-- 49 3
3 49 |-- 53 4
4 53 |-- 57 1
5 57 |-- 61 5
Total 20
f i
li=? h=?
Δ1=f mo−f ant=?
Δ2= f mo−f post=?
Mo=li+h .
Δ1
Δ2+Δ1
 
Medidas de Posição 
Dados Agrupados
● Exemplo: nº de alunos em 20 turmas da UFC 
Calculando a moda por classes, temos:
Classe (Mo) = 41 |-- 45, , , li=41 h=4
Δ1=f mo−f ant=7−0=7
Δ2=f mo−f post=7−3=4
Classes
1 41 |-- 45 7
2 45 |-- 49 3
3 49 |-- 53 4
4 53 |-- 57 1
5 57 |-- 61 5
Total 20
f i
Mo=li+h .
Δ1
Δ2+Δ1
 
Medidas de Posição 
Dados Agrupados
● Exemplo: nº de alunos em 20 turmas da UFC 
Calculando a moda por classes, temos:
Classe (Mo) = 41 |-- 45, , , li=41 h=4
Δ1=f mo−f ant=7−0=7
Δ2=f mo−f post=7−3=4
Classes
1 41 |-- 45 7
2 45 |-- 49 3
3 49 |-- 53 4
4 53 |-- 57 1
5 57 |-- 61 5
Total 20
f i
Mo=li+h .
Δ1
Δ2+Δ1
=41+4 . 77+4
Mo=43,55
 
Medidas de Posição 
Dados Agrupados
● Mediana 
– Distribuição de frequência por valores simples
Verifica-se se o número de observações é par ou impar para
determinar o elemento mediano.
– Em seguida, acrescentam-se as frequências acumuladas a tabela 
original para encontrar a localização do elemento mediano.
 
Medidas de Posição 
Dados Agrupados
● Exemplo: nº de alunos em 20 turmas da UFC 
Calcular a mediana por valores simples
1 2 3 4 5 6 7 8 9 10 11 12 13 Total
41 42 43 44 45 46 50 51 52 54 57 58 60
3 2 1 1 1 2 2 1 1 1 1 2 2 20
1 2 3 4 5 6 7 8 9 10 11 12 13 Total
41 42 43 44 45 46 50 51 52 54 57 58 60
3 2 1 1 1 2 2 1 1 1 1 2 2 20
1 2 3 4 5 6 7 8 9 10 11 12 13 Total
41 42 43 44 45 46 50 51 52 54 57 58 60
3 2 1 1 1 2 2 1 1 1 1 2 2 20
3 5 6 7 8 10 12 13 14 15 16 18 20
EMe=? Me=?
 
Medidas de Posição 
Dados Agrupados
● Exemplo: nº de alunos em 20 turmas da UFC 
Calcular a mediana por valores simples
1 2 3 4 5 6 7 8 9 10 11 12 13 Total
41 42 43 44 45 46 50 51 52 54 57 58 60
3 2 1 1 1 2 2 1 1 1 1 2 2 20
1 2 3 4 5 6 7 8 9 10 11 12 13 Total
41 42 43 44 45 46 50 51 52 54 57 58 60
3 2 1 1 1 2 2 1 1 1 1 2 2 20
1 2 3 4 5 6 7 8 9 10 11 12 13 Total
41 42 43 44 45 46 50 51 52 54 57 58 60
3 2 1 1 1 2 2 1 1 1 1 2 2 20
3 5 6 7 8 10 12 13 14 15 16 18 20
EMe=
20
2 =10 Me=
46+50
2 =48
 
Medidas de Posição 
Dados Agrupados
● Mediana 
– Distribuição de frequência por classes
Procedimento:
● Calcula-se o elemento mediano 
● Pela identifica-se a classe com o valor da 
mediana – Classe (Me).
 Frequência acumulada.
● Aplica-se a formula:
Me=li+h .
EMe−Fant
f Me
EMe .
Fi
Fi :
 
Medidas de Posição 
Dados Agrupados
● Mediana 
– Distribuição de frequência por classes
em que:
 Limite inferior da classe mediana
 Amplitude da classe mediana
 Frequência acumulada anterior a classe mediana
 Frequência absoluta simples da classe mediana
 se n par se n impar
li :
Fant :
h :
f Me :
Me=li+h .
EMe−Fant
f Me
EMe=
n
2 : EMe=
n+1
2 :
 
Medidas de Posição 
Dados Agrupados
● Exemplo: nº de alunos em 20 turmas da UFC 
Calculando a mediana por classes, temos:
 
Classes
1 41 |-- 45 7
2 45 |-- 49 3
3 49 |-- 53 4
4 53 |-- 57 1
5 57 |-- 61 5
Total 20
f i
Fant=?
f Me=?
Me=li+h .
EMe−Fant
f Me
EMe=? , li=? ,h=? ,
 
Medidas de Posição 
Dados Agrupados
● Exemplo: nº de alunos em 20 turmas da UFC 
Calculando a mediana por classes, temos:
 
Fant=?
f Me=?
Me=li+h .
EMe−Fant
f Me
EMe=? , li=? ,h=? ,
Classes
1 41 |-- 45 7 7
2 45 |-- 49 3 10
3 49 |-- 53 4 14
4 53 |-- 57 1 15
5 57 |-- 61 5 20
Total 20
f i Fi
 
Medidas de Posição 
Dados Agrupados
● Exemplo: nº de alunos em 20 turmas da UFC 
Calculando a mediana por classes, temos:
 Classe(Me) = 45|--49, 
Fant=7
f Me=3
Me=li+h .
EMe−Fant
f Me
=49
EMe=10⇒
Classes
1 41 |-- 45 7 7
2 45 |-- 49 3 10
3 49 |-- 53 4 14
4 53 |-- 57 1 15
5 57 |-- 61 5 20
Total 20
f i Fi
li=45,h=4,
	Slide 1
	Slide 2
	Slide 3
	Slide 4
	Slide 5
	Slide 6
	Slide 7
	Slide 8
	Slide 9
	Slide 10
	Slide 11
	Slide 12
	Slide 13
	Slide 14
	Slide 15
	Slide 16
	Slide 17
	Slide 18
	Slide 19
	Slide 20
	Slide 21
	Slide 22
	Slide 23
	Slide 24
	Slide 25
	Slide 26
	Slide 27
	Slide 28
	Slide 29
	Slide 30
	Slide 31
	Slide 32
	Slide 33
	Slide 34
	Slide 35
	Slide 36
	Slide 37
	Slide 38
	Slide 39
	Slide 40
	Slide 41

Continue navegando