Buscar

Aula 5 medidas de posição e dispersão

Prévia do material em texto

UNIVERSIDADE FEDERAL DO PIAUÍ – UFPI
CAMPUS PROFª CINOBELINA ELVAS – CPCE 
Bom Jesus - PI
2019
ESTATÍSTICA BÁSICA 
Professora: Priscila Alves Barroso 
1. Soma simples
n
n
i
i xxxX 

...21
1
onde: 
é o limite inferior (LI) do somatório;
é o limite superior (LS) do somatório;
é o índice que esta sendo indexando os valores da variável .
1i
n
i
2. Soma de quadrados
22
2
2
1
1
2 ... n
n
i
i xxxX 

X
 221
2
1
... n
n
i
i xxxX 






 nn
n
i
ii yxyxyxYX 

...2211
1    
 

n
i
nn
n
i
ii yyyxxxYX
1
2121
1
......
3. Quadrado da soma
4. Soma de produtos
5. Produto da soma
.
Exemplo: Considere amostras de tamanho n = 4 das variáveis X e Y representando o 
número de brotos por estaca de ipê
X = {15,23,22,40}
Y = {24,53,30,31}
c)
a) 
d)
b) 
e)
Estatística Descritiva: 
Medidas de posição
MEDIDAS DE POSIÇÃO : Representar o conjunto de dados por meio de um único 
valor
(Média, mediana e moda) 
Média ( ̅x)
• É a razão entre a soma das observações e o número 
total delas, determinada pela expressão:
• Está na mesma medida da amostra (mm, cm, m, kg, %)
x
x x x
n
x
n
n
i
i
n

  



1 2 1...
n : tamanho amostral (número de observações) 
• Aplicação: 
Número de brotações por cepa de Eucalyptus grandis: 
0, 2, 3, 1, 0, 1, 2, 2, 3, 1, 2, 3, 2, 1 
• Afetada por valores extremos 
Número de brotações por cepa de Eucalyptus grandis: 
0, 2, 3, 1, 0, 1, 2, 2, 3, 1, 2, 3, 2, 25
3,3571
Md - Valor que ocupa a posição central de um conjunto de dados ordenados
Cálculo - com base na ordem (rol) dos valores, dependendo do número de
observações.
Quando número de observações (n) for ímpar: 
a mediana é o valor da variável que ocupa a posição 
n  1
2
 
então Md = X (n+1)/2 
Quando o número de observações (n) for par: 
a mediana é a média aritmética dos valores da variável que ocupam as posições 
n
2
 e 
n  2
2
 então Md = X
n
2
+ X 
n  2
2
 
 
 
1º Ordenar
2º Valor Central
1º Ordenar
2ºMédia dos dois valores
centrais
• Aplicação 
Moda (Mo)
É o valor associado a maior frequência ou probabilidade de ocorrência.Indica
a região da máxima frequência.
=> Amodal
Ex. {1, 3, 9, 4}
Unimodal
Ex. {30, 21, 21, 20, 25} Mo= 21
=>Bimodal
Ex. {1, 3, 3, 9, 1, 9, 5, 1, 3} Mo=1,3
Multimodal
Ex. {30, 30, 21, 21, 20, 20, 25, 25, }
Diâmetro 21.4 22.7 30.6 35.7 34.8 28.5 29.1 28.7 30.1 29.6
Produção 0.82 0.91 1.08 1.23 1.18 1.03 1.05 1.04 1.07 1.06
Seja os valores de diâmetro (em cm) e produção (em metros cúbicos) para uma
amostra de 10 plantas de mogno.
Calcule:
a) Média;
b) Mediana;
c) Moda
Estatística Descritiva: 
Medidas de dispersão
MEDIDAS DE DISPERSÃO: Indicar o quanto os dados se apresentam dispersos 
em torno de uma medida de posição (amplitude total, variância amostral, 
desvio-padrão amostral, coeficiente de variação) 
Um melhorista foi contratado para
selecionar clones de eucalipto com a estatura
ideal para transplantio (60-110cm) a empresa
que o contratou enviou os seguintes dados:
(dados fictícios)
Área 1 65 80 120 130 126 115 60 45 131 118
Área 2 36 135 150 78 95 115 48 129 82 122
Como pode ser feita a seleção??
È a medida mais simples de dispersão. A amplitude total é a diferença entre o
maior e o menor valor da amostra, ou de um conjunto de dados.
)min()max( XXATX 
.
Área 1 H = 130-45 =>86
Área 2 H = 150-36 =>114
Desvantagens :
1) Só utiliza valores extremos, nada
informando sobre os intermediários;
2) Quando avaliada em amostras,
frequentemente fornece uma
subestimativa da amplitude populacional,
É uma medida da dispersão dos dados em torno da média
Cálculo: Soma dos quadrados dos desvios de cada observação
em relação a média, leva em consideração o n.
 
11
2
1
1
2
1
2
2
















n
n
X
X
n
XX
S
n
i
in
i
i
n
i
i
X
Desvantagem: 1) medida extremamente afetada por valores extremos;
2) a unidade é ao ². (kg², cm², t/ha²) 
a1 a2 a3 a4
9,0
9,0
9,0
9,0
9,0
7,0
8,0
9,0
10,0
11,0
0,6
3,4
9,8
13,8
17,4
0,6
9,0
9,0
9,0
17,4
Calcular Variância dos seguintes conjuntos de dados :
Variância (S²)
Área 1 65 80 120 130 126 115 60 45 131 118
Área 2 36 135 150 78 95 115 48 129 82 122
• Como ficaria a questão 
do melhorista ? 
Raiz quadrada da variância; Diferença de que é expressa na mesma 
unidade dos dados.
Cálculo: raiz quadrada positiva da variância.
2
XX SS 
Área 1 65 80 120 130 126 115 60 45 131 118
Área 2 36 135 150 78 95 115 48 129 82 122
a1 a2 a3 a4
9,0
9,0
9,0
9,0
9,0
7,0
8,0
9,0
10,0
11,0
0,6
3,4
9,8
13,8
17,4
0,6
9,0
9,0
9,0
17,4
Calcular Desvio - Padrão:
Cálculo: desvio-padrão dividido pela média.
É uma medida da homogeneidade, ou dispersão relativa, dos dados.
Ideia de precisão do experimento. Compara a dispersão entre
conjunto de dados que apresentam médias diferentes.
100
x
s
CV
Compara variabilidade
Área 1 65 80 120 130 126 115 60 45 131 118
Área 2 36 135 150 78 95 115 48 129 82 122
Qual amostra é 
mais 
homogênea???
a1 a2 a3 a4
9,0
9,0
9,0
9,0
9,0
7,0
8,0
9,0
10,0
11,0
0,6
3,4
9,8
13,8
17,4
0,6
9,0
9,0
9,0
17,4
Calcular CV:
Cálculo: desvio-padrão dividido pelo número de observações.
É uma medida da precisão com que a média é estimada. Desvio
padrão de um conjunto de médias amostrais.
Quanto menor o erro-padrão maior a precisão 
associada à estimativa da média.
n
S
S X
X

a1 a2 a3 a4
9,0
9,0
9,0
9,0
9,0
7,0
8,0
9,0
10,0
11,0
0,6
3,4
9,8
13,8
17,4
0,6
9,0
9,0
9,0
17,4
Calcular Erro padrão:
Área 1 65 80 120 130 126 115 60 45 131 118
Área 2 36 135 150 78 95 115 48 129 82 122
Complementando – Gráficos 
• Gráficos boxplot (diagrama de caixas)
• Centro 
• Dispersão 
• Assimetria 
• Identificação de outliers
• Quartis 
Intervalo interquartil = Q3 – Q1 
• Construir o box plot das duas áreas e comparar 
Área 1 65 80 120 130 126 115 60 45 131 118
Área 2 36 135 150 78 95 115 48 129 82 122
Em um estudo de preservação ambiental de determinada área foram coletadas dez
amostras de solo e medido a quantidade de chumbo (em ppm). Sabe-se que o chumbo é um
grande contaminante do solo. Os valores observados estão apresentados abaixo.
Calcule e interprete:
a) Média
b) Mediana
c) Moda
d) Variância
e) Desvio padrão
f) Erro padrão da média
g) Coeficiente de variação
h) Amplitude total
f) Construir um boxplot
EXERCÍCIO

Continue navegando