Buscar

UnidadeII-Estatística_Descritiva

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 3, do total de 9 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 6, do total de 9 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 9, do total de 9 páginas

Prévia do material em texto

04/05/2012
1
UNIDADE II – ESTATÍSTICA 
DESCRITIVA
PROF.: RÔMULO MÔRA
CUIABÁ, MT
1. Introdução
É a parte da estatística que possui a finalidade da
organização, apresentação e descrição dos dados
coletados, que podem ser de natureza discreta ou
contínua, sem fazer nenhuma inferência sobre a
população.
2. Resumo da Estatística Descritiva
1. Definição do Problema
2. Planejamento
3. Coleta de dados
4. Crítica dos dados
5. Apresentação dos dados
Série Estatística
6. Descrição dos dados
3. Conceitos de Estatística Descritiva
1. Dados Brutos
Dados coletados que não foram numericamente 
ordenados.
2. Rol
Ordenação dos dados de forma crescente ou 
decrescente.
3. Amplitude total (AT)
È a diferença entre o maior e o menor valor do rol.
4. Frequência absoluta (fi)
É o número de vezes que um valor xi foi observado.
5. Intervalo de Classe
É cada um dos intervalos disjuntos em que 
subdivide-se o intervalo total do conjunto de valores 
observados da variável de estudo. Muitas vezes 
definidos apenas por classe.
Existem quatro tipos:
a) Significa um intervalo fechado à esquerda e 
à direita.
b) significa um intervalo aberto à direita e à 
esquerda.
c) significa um intervalo fechado à direita e 
aberto á esquerda
d) significa um intervalo fechado à esquerda e 
aberto á direita.
6. Limite de classes
São os extremos dos intervalos de classes
Li = limite inferior
Ls = limite superior
7. Amplitude de classe (hi)
É a diferença entre o limite superior e inferior da 
classe.
hi = Ls – Li
04/05/2012
2
8. Pontos Médios ou Centro de Classe (Pmi)
É a média aritmética entre o limite superior e 
inferior de uma classe.
9. Frequência acumulada (fai)
Frequência acumulada de uma classe (ou de um 
valor) é a soma de frequencia absoluta até essa 
classe.
22
h
L
LL
Pm i
si
i 


10. Frequência Relativa Simples (fri)
É o quociente entre a frequência absoluta (fi) pelo 
número de observações (n)
ou
11. Frequência Relativa acumulada (frai)
É o quociente da frequência acumulada (fai) pelo 
número total de observações (n)
ou 
n
f
fr ii    100%
n
f
fr ii 
n
fa
far ii    100%
n
fa
far ii 
4. Distribuição de frequência
É um arranjo dos valores observados em uma
tabela com suas respectivas frequências.
1. Separação em Classes (Número de classes) - K
n > 25, , se não K = 5
Fórmula de Sturges K = 1 + 3,22.log(n)
2. Amplitude de Classe (h)
nK 
K
AT
h 
4.1. Representação Gráfica da 
Distribuição de Frequência
1. Histograma
2. Polígono de Frequência 2. Polígono de Frequência Acumulada (Ogiva)
04/05/2012
3
5. Medidas de Posição ou medidas de 
tendência central
1. Médias
1.1 Média Aritmética
n
X
n
XXX
X
n
i
i
n



 121
...







n
i
i
n
i
ii
n
nn
f
Xf
fff
XfXfXf
X
1
1
21
2211
...
...
Dados não agrupados
Dados agrupados
1.2 Média Aritmética Ponderada
1.2.1 Propriedades da Média Aritmética
 Propriedade 1
A soma algébrica dos desvios de um conjunto de
números em relação à média aritmética é zero.







n
i
i
n
i
ii
n
nn
p
Xp
ppp
XpXpXp
X
1
1
21
2211
...
...
0)(
1


XXSD
n
i
i
 Propriedade 2
Somando-se ou subtraindo-se uma constante a cada
um dos valores de conjunto de números, a média fica
somada ou subtraída dessa constante.
 Propriedade 3
Multiplicando-se ou dividindo-se cada um dos valores
de conjunto de números por uma constante, a média
fica multiplicada ou dividida dessa constante.
KX
n
KX
X
n
i
i





)(
1
XK
n
KX
X
n
i
i


1 X
Kn
X
K
X
n
i
i
1
1
1 


 Propriedade 4
A soma algébrica dos quadrados dos desvios tomados
em relação à média é um mínimo, isto é,


2
1
)( XX
n
i
i
mínimo
1.3 Média Geométrica
Regida pela propriedade:
Utilizada no cálculo das médias de razões ou
grandezas inversamente proporcionais.
1
1


n
i G
i
X
X
n
n
i
i
n
G XXXXX 


1
321 .......



n
i
i
n
i
i
n
n
i
iG X
n
X
n
XX
111
log
1
log
1
loglog
n
X
antX
n
i
i
G

 1
log
log
Obs.: Não pode ser calculada se tiver um dado nulo 
ou dado negativo.
1.3 Média Harmônica
Têm utilização muito rara. Utilizada quando deseja-
se comparar quantidades variáveis de uma espécie
com um quantidade constante da outra, quando se
deseja na média o fator que é variável na razão.










n
i i
n
i i
G
X
n
n
X
X
11
11
1
Obs.: Não pode ser calculada se tiver um dado
nulo.
04/05/2012
4
2. Moda
Dados não agrupados
É o valor que ocorre com maior frequência na
série de dados.
Serve para dados qualitativos e quantitativos.
A série pode ser amodal, unimodal, bimodal ou
multimodal.
Dados agrupados
O primeiro passo é localizar a classe que
apresenta maior frequência, denominada classe
modal.
em que:
Δ1= diferença entre a frequência da classe modal e da classe anterior
Δ2= diferença entre a frequência da classe modal e da classe posterior
h = amplitude de classe
li= limite inferior da classe modal.
21
1


 hlMo i
3. Separatrizes
Dividem o conjunto de dados em k partes iguais.
3.1 Mediana
É o valor abaixo ou acima do qual tem-se 50 %
dos dados da série estatística.
Dados não agrupados
- Determinar a posição do elemento mediano.
- verificar no rol qual o elemento mediano.
2
1 nXMd
2
1
22



nn XX
Md
 se n é ímpar  se n é par
Dados agrupados
O primeiro passo é localizar a classe que
apresenta o elemento correspondente a mediana.
em que:
P = posição do elemento mediano: n/2.. Determinar o elemento que ocupa
essa posição
fi = frequência da classe da mediana
fai-1 = frequência acumulada da classe anterior à classe mediana
h = amplitude de classe
li= limite inferior da classe da mediana
h
f
faP
lMd
i
i
i
1
3.2 Quartis
Divide a distribuição em 4 partes iguais.
em que:
P = posição do elemento mediano: n/2.. Determinar o elemento que ocupa
essa posição
fi = frequência da classe da mediana
fai-1 = frequência acumulada da classe anterior à classe mediana
h = amplitude de classe
li= limite inferior da classe da mediana
h
f
faP
lQ
i
i
ii
14
.ni
Qi i 
Corresponde ao valor P
3.3 Decis
Divide a distribuição em 10 partes iguais.
em que:
P = posição do elemento mediano: n/2.. Determinar o elemento que ocupa
essa posição
fi = frequência da classe da mediana
fai-1 = frequência acumulada da classe anterior à classe mediana
h = amplitude de classe
li= limite inferior da classe da mediana
h
f
faP
lD
i
i
ii
110
.ni
Di i 
Corresponde ao valor P
04/05/2012
5
3.4 Percentis
Divide a distribuição em 100 partes iguais.
em que:
P = posição do elemento mediano: n/2.. Determinar o elemento que ocupa
essa posição
fi = frequência da classe da mediana
fai-1 = frequência acumulada da classe anterior à classe mediana
h = amplitude de classe
li= limite inferior da classe da mediana
h
f
faP
lP
i
i
ii
1100
.ni
Pi i 
Corresponde ao valor P
6. Medidas de Dispersão ou Medidas 
de Variabilidade
1. Variância Amostral
1
)(
1
1
2
2







n
XX
nSQD
s
n
i
i
Dados não agrupados
1
1
2
12
2













n
n
X
X
s
n
i
n
i
i
i
2. Desvio padrão
Dados agrupados
1
1
1
1
2
12
2

















n
i
i
n
i
n
i
i
n
i
ii
ii
f
f
Xf
Xf
s
2ss 
3. Coeficiente de Variação
X
S
CV x 100(%) X
S
CV x
> CV – mais heterogêneo
< CV – mais homogêneo
4. Erro padrão da Média
n
S
Xs x)(
Indica a precisão com que foi estimada a média
da amostra.
Quanto menor for o erro padrão da média,
melhor será a estimativa da média da amostra.
7. MEDIDAS DE ASSIMETRIA E 
CURTOSE
Medidas utilizadas para descrever se uma
população da qual a amostra foi coletada pode ser
descrita por uma curva normal.
04/05/2012
6
7.1. Medidas de Assimetria 7.1.1 Coeficiente de Assimetria
3
3
22
3
s
m
ss
m
As  n
XX
m
n
i
i


 1
3
3
)(
ou
s
MoX
As
)( 

 As positivo (As > 0) = indica uma assimetria à
direita;
 As negativo (As < 0) = indica uma assimetria à
esquerda.
As igual a zero (As = 0) = indica uma simetria
7.2. Medidas de Curtose
7.2.1 Coeficiente de Curtose
4
4
22
4
s
m
ss
m
K  n
XX
m
n
i
i


 1
4
4
)(
K > 3 = indica uma distribuição afiada chamada
leptocúrtica;
 K < 3 = indica uma distribuição achatada
chamada platicúrtica;
 K = 3 = indica uma distribuição semelhante a
normal chamada mesocúrtica.
7.2.2 Coeficiente de Curtose
 
 1090
13
2 PP
QQ
K



K > 0,263 = indica uma distribuição afiada
chamada leptocúrtica;
 K < 0,263 = indica uma distribuição achatada
chamada platicúrtica;
 K = 0,263 = indica uma distribuição semelhante
a normal chamada mesocúrtica.
04/05/2012
7
EXERCÍCIO DE APLICAÇÃO 1
Considere o seguinte conjunto de dados: 9; 3; 8;
8; 9; 8; 9; 1; 8.
Calcular
a) Média;
b) Moda;
c) Mediana;
d) Variância;
e) Desvio-padrão;
f) Erro padrão da média;
g) Coeficiente de Variação
h) Coeficiente de Assimetria.
i) Coeficiente de Curtose.
EXERCÍCIO DE APLICAÇÃO 2
Considere o seguinte tabela de frequência:
Calcular
a) Média;
b) Moda;
c) Mediana;
d) Q1
e) D2
f) P55
g) Variância;
h) Desvio-padrão;
i) Erro padrão da média;
j) Coeficiente de Variação
k) Coeficiente de Assimetria.
l) Coeficiente de Curtose.
m) Desenhar o Histograma, o polígono de
frequência e a ogiva
8. COEFICIENTE DE CORRELAÇÃO 
LINEAR
1. Coeficiente de correlação amostral
YX
XY
Y
Y
X
X
XY
xy
SQDSQD
SP
n
SQD
n
SQD
n
SP
YVXV
YXCOV
r
.
1
.
1
1
)()(
),(
^^
^



11  xyr
n
YX
YXSP
n
i
i
n
i
i
i
n
i
ixy














 

11
1
n
X
XSQD
n
i
in
i
iX
2
1
1
2








 
 n
Y
YSQD
n
i
in
i
iY
2
1
1
2








 

- Coeficiente de correlação de Pearson
1
.
1
1
.
),cov(
2
1
22
1
2
1











n
yny
n
xnx
n
yxnyx
ss
YX
r
n
i
i
n
i
i
i
n
i
i
yx
xy
11  xyr



















2
1
22
1
2
1
.
.
),cov(
ynyxnx
yxnyx
ss
YX
r
n
i
i
n
i
i
i
n
i
i
yx
xy
04/05/2012
8
O coeficiente de correlação linear é usado para expressar o
grau de aproximação dos pontos do diagrama de dispersão
aos de uma reta, chamada reta de regressão. Em outras
palavras, diz-se que é o grau de fidelidade com que uma reta
descreve a relação entre as variáveis.
Esta medida tem a importante propriedade de não somente
ser adimensional, como de variar entre –1 e +1.
Um coeficiente de correlação próximo da unidade positiva ou
negativa significa uma grande concentração de pontos em
torno da reta, enquanto um coeficiente menor, próximo de
zero, significa maior dispersão dos pontos com respeito a
essa reta.
Quando o valor da correlação for positivo indica correlação
diretamente proporcional, se não a associação das variáveis é
inversamente proporcional.
EXERCÍCIO DE APLICAÇÃO 3
Calcular o coeficiente de correlação entre as variáveis:
X = índice de preço para o consumidor e
Y = índice de preço por atacado
FIM
Apresentação dos dados
Tabelas
Tabela 1 - Número de árvores mortas, com cipó e 
epifitas numa Floresta Nativa, por parcela, 2012
Parcela
Árvores
Mortas Cipós Epifitas
1 - ... 3
2 2 6 4
3 10 20 8
4 9 4 6
Fonte: coleta de dados própria
Gráficos
0
5
10
15
20
25
1 2 3 4
F
re
q
u
ê
n
c
ia
Parcela
Quantidade de árvores
Mortas
Cipós
Epifitas
Fonte: coleta de dados própria
Exemplo1
Considere o seguinte conjunto de diâmetros à
altura do peito, medidos em um parcela
permanente de Eucalipto.
19 – 16 – 23 – 15 – 20 – 25 – 20 – 13 – 17 – 19 –
14 – 22 – 14 – 17 – 23 – 10 – 18 – 13 – 17 – 22 –
19 – 20 – 24 – 15 – 19 – 18 – 23 – 14 – 16 – 10 – 9 
– 13 – 11 – 15 – 13 – 12 – 9 – 20 – 15 – 25
04/05/2012
9
Exemplo 2
a) Calcular a Média, Moda e Mediana para o
conjunto de dados:
2 – 3 – 5 – 8 – 9 – 10 – 11 – 12 – 13
Exemplo 3
Em determinado teste de medição de altura de
mudas foram obtidos os seguintes pontos:
Classe Pmi fi Fai fiXi
0 <- 5 2,5 7 7 17,5
5 < - 10 7,5 9 16 67,5
10 <- 15 12,5 11 27 137,5
15 <- 20 17,5 8 35 140
20 < - 25 22,5 12 47 270
25 <- 30 27,5 3 50 82,5
Total 50 715
Calcule: a) Média b) Moda c) Mediana d) Q3 e) P35
f) D6

Outros materiais