Buscar

RESUMO ESTATÍSTICA DESCRITIVA

Prévia do material em texto

14/08/2018
1
ESTATÍSTICA 
DESCRITIVA
PROF. ELSON DE JESUS ANTUNES JÚNIOR
Estatística Descritiva
É a parte da estatística que lida com a organização,
resumo e apresentação de dados.
Coleta, organização e apresentação de 
dados
As mensurações que são realizadas em uma
característica de interesse na população ou na
amostra possuem uma característica denominada de
VARIAÇÃO.
14/08/2018
2
Coleta, organização e apresentação de 
dados
Esse fenômeno refere-se ao fato de que uma medida
de um indivíduo tem grandes chances de ser
diferente da medida dessa característica em outro
indivíduo, além do que, antes de a medida ser
realizada é praticamente impossível determinar ou
fazer previsão do seu valor.
Coleta, organização e apresentação de 
dados
Os dados coletados numa forma sem ordenação e
sem nenhum tipo de arranjo sistemático.
DADOS BRUTOS
Coleta, organização e apresentação de 
dados
Dados brutos obtidos de uma amostra de 10 carros
vendidos em função do tipo de transmissão,
automática (A) ou manual (M).
M A A A M A A M A A
14/08/2018
3
Coleta, organização e apresentação de 
dados
Dados brutos de uma amostra da vida útil (h) de
baterias da marca D.
3,65 21,26 3,87 24,57 1,38 5,67 9,79 12,56
4,54 6,79 13,19 4,14 3,78 15,60 6,23 12,13
17,12 19,68 5,64 8,21
Coleta, organização e apresentação de 
dados
Essa representação de dados apresentada é pouco
informativa.
Para melhorá-la um pouco é possível ORDENAR em
uma sequencia crescente ou decrescente ou
AGRUPÁ-LOS quanto as suas categorias ou atributos.
Coleta, organização e apresentação de 
dados
Dados elaborados obtidos de uma amostra de 10
carros vendidos em função do tipo de transmissão,
automática (A) ou manual (M).
A A A A A A A M M M
14/08/2018
4
Coleta, organização e apresentação de 
dados
Dados brutos de uma amostra da vida útil (h) de
baterias da marca D.
1,38 3,65 3,78 3,87 4,14 4,54 5,64 5,67 6,23
6,79 8,21 9,79 12,13 12,56 13,19 15,60 17,12
19,68 21,26 24,57
Coleta, organização e apresentação de 
dados
Frequência do tipo de transmissão escolhida na
aquisição de um carro novo
TIPO DE TRANSMISSÃO FREQUÊNCIA (Fi)
AUTOMÁTICA 7
MANUAL 3
Coleta, organização e apresentação de 
dados
Gráfico de setores (pizza) e barras mostrando formas
alternativas para representação da escolha do tipo de
transmissão do carro novo.
14/08/2018
5
Coleta, organização e apresentação de 
dados
Ao se lidar com dados quantitativos contínuos não é
possível efetuar o mesmo tipo de tratamento
dispensado aos dados qualitativos e quantitativos
discretos.
Coleta, organização e apresentação de 
dados
Para resolver o problema de apresentar a distribuição
de dados quantitativos contínuos de uma forma
resumida e manter o máximo de informação contida
nela, será apresentada a DISTRIBUIÇÃO DE
FREQUÊNCIAS para esse tipo de dados.
Coleta, organização e apresentação de 
dados
Nesse tipo de representação, os dados quantitativos
contínuos são agrupados em classes de valores, das
quais as frequências e os limites são apresentados
em uma tabela.
14/08/2018
6
Coleta, organização e apresentação de 
dados
O grande problema dessa representação é definir o
número de classes ideal para agrupar um conjunto
de dados de uma amostra.
Coleta, organização e apresentação de 
dados
Um critério empírico para isso que tem sido muito
usado é o de considerar um número de classes entre
5 e 20, em função do conhecimento do investigador
sobre os dados de sua pesquisa.
Coleta, organização e apresentação de 
dados
Normalmente, quanto maior o número de observações em
um conjunto de dados, mais classes devem ser usadas.
Uma regra prática razoável é
número de classes (k) ≈ número de observações (n)
14/08/2018
7
Coleta, organização e apresentação de 
dados
O próximo passo será determinar o tamanho de uma classe
específica. O tamanho da classe é denominado de amplitude
de classe e representado por c.
c =
A
k − 1
Sendo:
A = amplitude [A = X(n) – X(1)]
Coleta, organização e apresentação de 
dados
O limite da primeira classe (LI1) é definido por:
LI1 = X 1 −
c
2
Coleta, organização e apresentação de 
dados
O limite superior da primeira classe é então obtido
somando-se, ao limite inferior dessa classe, a
amplitude de classe.
O limite inferior da segunda classe é igualado ao
limite superior da primeira classe.
O limite superior dessa classe é obtido somando-se
a amplitude de classe ao limite inferior.
14/08/2018
8
Coleta, organização e apresentação de 
dados
Distribuição de frequência da vida útil (h) para uma
amostra de n=20 baterias.
Fi = frequência dos indivíduos Fri = frequência relativa Fpi = frequência percentual
Classe de tempo (h) 𝑿i Fi Fri Fpi
-2,49 ˫ 5,25 1,38 6 0,30 30
5,25 ˫ 12,98 9,11 8 0,40 40
12,98 ˫ 20,71 16,84 4 0,20 20
20,71 ˫ 28,44 24,57 2 0,10 10
Medidas de tendência central
Pela concentração de dados de um conjunto de
mensurações nas proximidades de alguns valores,
verifica-se que esses valores podem ser usados para
representar todos os dados. Em outras palavras, é
possível afirmar que alguns valores podem ser
representantes do conjunto de mensurações.
Medidas de tendência central
MÉDIAARITMÉTICA
A média é a soma das observações dividida pelo
número delas.
 𝑋 =
 𝑖=1
𝑛 𝑋𝑖
𝑛
14/08/2018
9
Medidas de tendência central
Para dados agrupados em uma tabela de distribuição
de frequências, a média para esse caso é apresentada
na equação a seguir:
 𝑋 =
 𝑖=1
𝑛 𝐹𝑖 𝑋𝑖
𝑛
Em que 𝑋i é o ponto médio Fi é a frequência da
classe i, para i = 1, 2,... , k; k é o número de classes.
Medidas de tendência central
MEDIANA
É uma medida típica de tendência central, sendo
definida em um conjunto de dados ordenados como
o valor central, ou seja, o valor para o qual há tanta
mensurações que o superam quanto são superados
por ele.
Medidas de tendência central
MEDIANA
X 𝑛+1
2
se n for ímpar
md =
X 𝑛
2
+ X 𝑛+2
2
2
se n for par
14/08/2018
10
Medidas de tendência central
MODA
A moda é uma dessas medidas típicas de tendência
central, sendo definida de uma forma mais grosseira
em um conjunto de dados como o valor mais
frequente.
Analise...
Consumo de combustível de três carros.
Qual o consumo médio de cada carro?
Qual o melhor?
A B C
14,27 13,44 11,27
14,60 13,76 13,30
14,72 14,55 13,50
14,95 14,86 15,25
14,99 15,30 15,44
15,17 15,42 15,51
15,21 15,81 15,72
15,42 15,89 16,04
15,63 15,94 16,39
16,00 15,99 18,54
Medidas de dispersão e variabilidade
AMPLITUDE
A diferença entre a maior e a menor observação é
denominada de amplitude (A).
14/08/2018
11
Medidas de dispersão e variabilidade
DEVIOMÉDIO
É possível considerar conjuntos de dados com a
mesma amplitude, mas com diferentes estruturas de
variação de seus valores intermediários. É possível
expressar a variabilidade de um conjunto de dados
em termo de desvios da média.
Medidas de dispersão e variabilidade
DEVIOMÉDIO
Assim, o desvio médio será definido com sendo a
média dos desvios absolutos em relação à média da
amostra.
Medidas de dispersão e variabilidade
DEVIOMÉDIO
𝑆| 𝑋| =
 𝑖=1
𝑛 𝑋𝑖 − 𝑋
𝑛
14/08/2018
12
Medidas de dispersão e variabilidade
VARIÂNCIA
A variância é definida dividindo-se a soma de quadrados
de desvios pelo grau de liberdade da amostras, ou seja,
n – 1.
A unidade da variância não é a mesma de cada
mensuração.
Essa unidade não tem significado físico por estar ao
quadrado.
Medidas de dispersão e variabilidade
VARIÂNCIA
𝑆2 =
𝑆𝑄
𝑛 − 1
=
 𝑖=1
𝑛 𝑋𝑖 − 𝑋
2
𝑛 − 1
Medidas de dispersão e variabilidade
FORMADECALCULODAVARIÂNCIA
𝑆2 =
1
𝑛 − 1
 
𝑖=1
𝑛
𝑋𝑖
2 −
 𝑖=1
𝑛 𝑋𝑖
2
𝑛14/08/2018
13
Medidas de dispersão e variabilidade
DESVIOPADRÃO
O desvio padrão é definido tomando-se a raiz
quadrada da variância.
Dessa forma o desvio padrão é expresso na mesma
unidade dos dados e por essa razão possui significado
físico e é preferido pelos investigadores, por ser mais
fácil de interpretar.
Medidas de dispersão e variabilidade
DESVIOPADRÃO
𝑆 =
1
𝑛 − 1
 
𝑖=1
𝑛
𝑋𝑖
2 −
 𝑖=1
𝑛 𝑋𝑖
2
𝑛
Medidas de dispersão e variabilidade
COEFICIENTEDEVARIAÇÃO
O desvio padrão e a variância são medidas da
variabilidade absoluta dos dados. Essa medidas são
dependentes da grandeza, escala ou unidade de
medida empregada para mensurar os dados.
Fica evidente que um estimador que não seja
dependente desses fatores se faz necessário.
14/08/2018
14
Medidas de dispersão e variabilidade
COEFICIENTEDEVARIAÇÃO
Essa avaliação da variabilidade é conhecida por
medida de variabilidade relativa de um amostra ou
população.
O coeficiente de variação (CV) é usado para esse
propósito.
Medidas de dispersão e variabilidade
COEFICIENTEDEVARIAÇÃO
𝐶𝑉 =
𝑆
 𝑋
𝑥 100%
Medidas de dispersão e variabilidade
A média e o desvio padrão do consumo de
combustível de dois carros são: 𝑋A = 14 km/l e SA =
0,8 km/l e 𝑋B= 18 km/l e SB = 1,2 km/l.
Qual carro possui maior uniformidade de consumo?
14/08/2018
15
Medidas de dispersão e variabilidade
ERROPADRÃODAMÉDIA
O erro padrão da média é uma medida da dispersão
das médias amostrais em torno da média da
população.
É fácil perceber que quanto menor for o seu valor,
mais provável será a chance de obter a média da
amostra nas proximidades da média da população, e
quanto maior for, menos provável será esse evento.
Medidas de dispersão e variabilidade
ERROPADRÃODAMÉDIA
𝑆 𝑋 =
𝑆
𝑛
EXEMPLO
O conjunto de dados a seguir consiste de observações da vazão de 
chuveiros (L/min) de uma amostra de n = 117 lares em Pether, Austrália.
4,6 12,3 7,1 7,0 9,2 6,7 6,9 11,5 5,1
11,2 10,5 14,3 8,0 6,4 5,1 5,6 9,6 7,5
7,5 6,2 5,8 2,3 10,4 9,8 6,6 3,7 6,4
8,3 6,5 7,6 9,3 7,3 5,0 6,3 13,8 6,2
5,4 4,8 7,5 6,0 10,8 7,5 6,6 5,0 3,3
7,6 3,9 11,9 2,2 7,2 6,1 15,3 18,9 7,2
5,4 5,5 4,3 9,0 11,3 7,4 5,0 3,5 8,2
8,4 7,3 10,3 11,9 5,6 9,5 9,3 10,4 9,7
5,1 6,7 10,2 6,2 7,0 4,8 5,6 10,5 14,6
10,8 15,5 7,5 6,4 5,5 6,6 5,9 15,0 9,6
7,8 7,0 6,9 4,1 11,9 3,7 5,7 6,8 11,3
9,3 9,6 10,4 9,3 9,8 9,1 10,6 4,5 6,2
8,3 3,2 4,9 5,0 8,2 6,3 3,8 6,0 10,1
14/08/2018
16
EXEMPLO
a. Determine as frequências e frequências relativas dos 
valores observados.
b. Desenhe o histograma de dados, usando a frequência 
relativa na escala vertical e comente suas características.
c. Determine o valor da média amostral.
d. Determine o valor da mediana e moda amostral. Por que 
o valor da média, mediana e moda são tão diferentes?
e. Qual a amplitude amostra?
EXEMPLO
f. Calcule 𝑋𝑖 e 𝑋𝑖
2 .
g. Use os valores anteriores para obter a variância amostral 
e o desvio padrão amostral.
h. Determine o coeficiente de variação e o erro padrão da 
média.

Continue navegando