Buscar

Estatistica Descritiva

Prévia do material em texto

Aula 07 – Estatística Descritiva
ESTATÍSTICA DESCRITIVA
2
Aula 07 – Estatística Descritiva
Estatística Descritiva
O que fazer com as observações que 
coletamos?
Resumo dos dados: organizar, descrever e 
resumir os dados coletados ⇒ Estatística 
descritiva
Primeira etapa da análise:
5
Aula 07 – Estatística Descritiva
QUALITATIVA
QUANTITATIVA
NOMINAL
ORDINAL
CONTÍNUA
DISCRETA
tempo, distância, salário
número de clientes, número de 
caminhões
origem de um pedido 
(capital ou interior) 
porte de uma empresa 
(pequena, média, grande)
Variável: 
Qualquer característica associada a uma população.
Classificação das variáveis
Aula 07 – Estatística Descritiva
Amplitude, Intervalo-Interquartil, Variância, Desvio 
Padrão, Coeficiente de Variação
MEDIDAS DE DISPERSÃO: 
Mínimo, Máximo, Moda, Média, Média Aparada, 
Mediana, Percentis
MEDIDAS DE POSIÇÃO: 
Variáveis Quantitativas
Aula 07 – Estatística Descritiva
• Mínimo (min): o menor valor observado 
• Máximo (max): o maior valor observado
• Moda (mo): é o valor (ou atributo) que ocorre com 
maior frequência,
Medidas de Posição
Aula 07 – Estatística Descritiva
n
x
n
xxxxx
n
i
i
n
∑
==
++++
= 1321
...
• Média
Medidas de Posição
• Mediana
A mediana é o valor da variável que ocupa a posição
central de um conjunto de n dados ordenados,
Aula 07 – Estatística Descritiva
O percentil de ordem p ×100 (0 < p < 1), em um 
conjunto de dados de tamanho n, é o valor da variável 
tal que p ×100 das observações do conjunto dos n
dados ordenados são inferiores ou iguais a ele.
• Percentil p
percentil 50 = mediana ou segundo quartil (Md)
percentil 25 = primeiro quartil (Q1)
percentil 75 = terceiro quartil (Q3)
Casos particulares
Medidas de Posição
Aula 07 – Estatística Descritiva
Finalidade: encontrar um valor que resuma a
variabilidade de um conjunto de dados
• Amplitude (A)
A = máx - min
Medidas de Dispersão
• Intervalo-Interquartil 
É a diferença entre o terceiro quartil e o primeiro 
quartil, ou seja, Q3 - Q1.
Aula 07 – Estatística Descritiva
∑
= −
−
=
−
−++−
==
n
i
in
n
xx
n
xxxxsVariância
1
222
12
1
)(
1
)(...)( 
VariânciasPadrãoDesvio == 
• Variância
• Desvio padrão 
Medidas de Dispersão
Aula 07 – Estatística Descritiva
- é uma medida de dispersão relativa
- elimina o efeito da magnitude dos dados
- exprime a variabilidade em relação à média
%100×=
x
sCV
• Coeficiente de Variação (CV)
Medidas de Dispersão
Aula 07 – Estatística Descritiva
Idade 27,47 anos 1,88 anos 6,8%
Renda 3763,7 reais 594,7reais 15,8%
Média DesvioPadrão
Coef, de 
Variação
Conclusão: Os indivíduos são, aproximadamente, 
duas vezes mais dispersos quanto à renda do que 
quanto à idade 
Idade e renda de indivíduosExemplo 1 :
Medidas de Dispersão
Aula 07 – Estatística Descritiva
Conclusão: Em relação às médias, os atrasos de 
ambas as companhias apresentam variabilidade 
quase iguais.
Desvio
padrão
Coef. de
variaçãoMédia
Cia. A 50 6 12%
Cia. B 160 16 10%
Número de atrasos de vôos de uma amostra da Cia. 
A e de uma amostra de Cia. B
Exemplo 2:
Medidas de Dispersão
Aula 07 – Estatística Descritiva
Representa os dados através de um
retângulo construído com os quartis e
fornece informações sobre os valores
extremos.
Gráfico Boxplot
GRÁFICOS
Aula 07 – Estatística Descritiva
“Máximo”
Q3
Mediana
Q1
“Mínimo”
25%
50%
75%
LS = Q3+1,5(Q3-Q1)
LI = Q1-1,5(Q3-Q1)
“Máximo” é o maior valor menor que LS; “Mínimo” é o menor valor maior que LI.
Boxplot
Aula 07 – Estatística Descritiva
md = 41,5 Q1 = 30,25 Q3 = 49,5 
*
*
120
100
80
60
40
20
Dados ordenados (n=36) 
18 21 21 23 23 25
27 29 30 31 32 32
32 34 35 36 38 41
42 42 43 44 45 46
46 47 48 50 54 56
57 58 60 61 98 116
LI = Q1 - 1,5(Q3 - Q1) =1,38
LS = Q3 + 1,5(Q3 - Q1) =78,38
Observações discrepantes
Vida útil de máquinas (dias)Exemplo 3: 
Boxplot
Aula 07 – Estatística Descritiva
Os dados também podem ser resumidos construindo-se 
uma tabela de distribuição de frequências .
Distribuição de frequências de uma variável
é uma lista dos valores individuais ou de
intervalos de valores que a variável pode
assumir, com as respectivas frequências de
ocorrência.
Aula 07 – Estatística Descritiva
Dados do Tempo de duração de 187 viagens (em horas)
Tempo Frequência (ni) Tempo Frequência (ni)
0 55 30 2
2 1 35 2
4 1 40 1
5 59 44 1
6 2 50 1
7 3 57 1
8 2 60 1
9 1 70 2
10 28 75 2
13 2 95 1
15 10 660 1
20 6 1245 1
28 1
N = 187
Exemplo 4: 
Distribuição de frequências
Aula 07 – Estatística Descritiva
Com a simples tabulação dos dados detectou-se:
• em 55 viagens encontra-se registrado o tempo 
zero, que é um valor claramente impossível;
• percebe-se a existência de um número 
excessivo de viagens com tempo de duração 
múltiplo de 5: 5, 10, 15 horas, etc. Existe uma 
tendência observada na população em geral em 
arredondar valores numéricos para múltiplos de 
5;
• dois valores apresentam-se muito superiores 
aos demais (660 e 1245). 
Exemplo 4 (continuação): 
Distribuição de frequências
Aula 07 – Estatística Descritiva
Medidas descritivas para a variável Tempo de duração de viagens
Medida Descritiva Amostra Completa Excluindo o valor 1245
Excluindo os 
valores 1245 e 660
Média 27,5 18,2 13,3
Mediana 7,5 7,0 7,0
Desvio-padrão 121,8 58,8 16,4
Q1 5,0 5,0 5,0
Q3 14,5 13,0 13,0
n 132 131 130
Exemplo 4 (cont.): Retirando os “zero’s” 
Distribuição de frequências
Aula 07 – Estatística Descritiva
Variável: distância contínua Construir 
intervalos 
de classeClasses de distâncias ni fri
0,0 |- 10,0
10,0 |- 20,0
20,0 |- 30,0
30,0 |- 40,0
40,0 |- 50,0
50,0 |- 60,0
60,0 |- 70,0
70,0 |- 80,0
80,0 |- 90,0
90,0 |- 100,0
Total
69
40
7
4
2
2
1
4
0
1
130
0,531
0,308
0,054
0,031
0,015
0,015
0,008
0,031
0,000
0,008
1,000
Distribuição de frequências para a variável 
Tempo de duração de viagens
Exemplo 4 (cont.): Retirando o “zero” 
Distribuição de frequências
Aula 07 – Estatística Descritiva
• Bases iguais ou diferentes
• Construir um retângulo para cada classe, com base
igual ao tamanho da classe e área do retângulo igual
a frequência relativa da classe (fr).
• A altura será dada por
h = fr/tamanho da base (densidade de frequência).
Dados agrupados em intervalos de classes 
(distribuição de frequências)
Gráfico histograma
Aula 07 – Estatística Descritiva
Classes (meses) ni fri hi
0 |- 3 140 0,28 0,093
3 |- 12 100 0,20 0,022
12 |-24 80 0,16 0,013
24 |-60 180 0,36 0,010
Total 500 1,00
0 3 12 24 60
h
0,10
0,02
0,04
0,06
0,08
Exemplo 5: Vida útil de lâmpadas
Histograma
Aula 07 – Estatística Descritiva
Exemplo 6: 
Tempo de duração de viagens
Histograma
Aula 07 – Estatística Descritiva
Sobre um eixo, são representados retângulos, um 
para cada categoria da variável. 
A altura do retângulo é proporcional à frequência 
da categoria.
⇒Adequado para variáveis qualitativas
Gráfico de Barras
Aula 07 – Estatística Descritiva
Exemplo 7:
3210
60
50
40
30
20
10
0
Activity
Co
un
t o
f A
ct
iv
ity
Variável Activity : atividade de armazéns 
(nenhuma – 0; leve – 1; moderada – 2; intensa –
3)
Gráfico de barras
⇒ Variável qualitativa ordinal
Aula 07 – Estatística Descritiva
Porcentagem acumulada
Exemplo 8: Considere a variável “Número de 
funcionários” de empresas pequenas de logística. 
Um levantamento de 20 empresas forneceu os 
seguintes dados (já ordenados):
5, 5, 5, 5, 10, 10, 10, 10, 10, 15, 15, 15, 15, 15, 15, 
15, 20, 20, 20, 25.
Aula 07 – Estatística Descritiva
Dados: 5, 5, 5, 5, 10, 10, 10, 10, 10, 15, 15, 15, 15, 15, 15, 
15, 20, 20, 20, 25
Porcentagem acumulada
Distribuição de  frequências do no. de funcion.
No.de filhos ni fifi(%) Ni Fi Fi (%)
5 4 0,20 20 4 0,20 20
10 5 0,25 25 9 0,45 45
15 7 0,35 35 .16 0,80 80
20 3 0,15 15 19 0,95 95
25 1 0,05 5 20 1,00 100
Total n=20 1,00 100,0
Considerando os distintos valores da variável ordenados, temos
Ni: frequencia absoluta acumulada no valor xi da variável;
Fi: frequencia relativa acumulada no valor xi;
Fi (%) : frequencia relativa acumulada no valor xi, em %
Exemplo 8 (cont):
Aula 07 – Estatística Descritiva
Porcentagem acumulada
Distribuição de  frequências do número de funcionários
no.de func. ni fi fi(%) Ni Fi Fi (%)
5 4 0,20 20 4 0,20 20
10 5 0,25 25 9 0,45 45
15 7 0,35 35 16 0,80 80
20 3 0,15 15 19 0,95 95
25 1 0,05 5 20 1,00 100
Total n=20 1,00 100,0
• 25 % das empresas tem 10 funcion.; (5 empresas das 20)
• 45 % tem até 10 funcion.; (que são 9 das 20 empresas)
• 7 empresas tem 15 funcion;
• 19 empresas tem até 20 funcion. (ou 95% dos empresas 
tem 20 funcion. ou menos); etc...
Exemplo 8 (cont.): Interpretação 
Aula 07 – Estatística Descritiva
Forma da Distribuição
	Slide Number 1
	Slide Number 2
	Slide Number 3
	Slide Number 4
	Slide Number 5
	Slide Number 6
	Slide Number 7
	Slide Number 8
	Slide Number 9
	Slide Number 10
	Slide Number 11
	Slide Number 12
	Slide Number 13
	Slide Number 14
	Slide Number 15
	Slide Number 16
	Slide Number 17
	Slide Number 18
	Slide Number 19
	Slide Number 20
	Slide Number 21
	Slide Number 22
	Slide Number 23
	Slide Number 24
	Slide Number 25
	Slide Number 26
	Slide Number 27
	Slide Number 28
	Slide Number 29

Continue navegando