Buscar

AULA 07_MEDIDAS NUMERICAS DESCRITIVAS (PARTE 03)

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 3, do total de 45 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 6, do total de 45 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 9, do total de 45 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Prévia do material em texto

Profª Kellen Lima 
Medidas Numéricas Descritivas 
(Parte 03) 
Aula 
07 
TENDÊNCIA CENTRAL 
Corresponde à extensão na qual todos os 
valores de dados se agrupam em torno de um 
valor central típico. 
VARIAÇÃO 
Corresponde ao montante da dispersão de 
valores em relação a um valor central. 
FORMATO 
Corresponde ao padrão da distribuição de 
valores, do valor mais baixo para o mais alto. 
5.7 Formato de uma Distribuição 
CONTINUAÇÃO... 
Na DISTRIBUIÇÃO ASSIMÉTRICA  os valores não são 
simétricos em torno da média aritmética. Essa assimetria 
resulta em um desequilíbrio dos valores baixos ou dos 
valores altos. 
 Na DISTRIBUIÇÃO SIMÉTRICA  os valores abaixo da 
média aritmética estão distribuídos exatamente do mesmo 
modo que os valores acima da média aritmética. Nesse 
caso, os valores baixos e os altos se equilibram; 
Pode ser SIMÉTRICA ou ASSIMÉTRICA; 
É o padrão da distribuição de valores de dados ao longo de 
um intervalo inteiro que contém a totalidade de valores; 
O formato influencia na relação da média 
aritmética com a mediana dos seguintes modos: 
Média < mediana  negativa ou assimétrica à esquerda; 
Média = mediana  simétrica ou zero de assimetria; 
Média > mediana  positiva ou assimétrica à direita. 
Simétrica 
Os dados abaixo representam a 
vida útil de baterias (em termos 
do número de fotografias) de 
câmeras digitais de três 
megapixels. Calcule: 
(a) 𝑿 , Q1, Q2, Q3 
(b) 𝑺𝟐, 𝑺, A, AI, CV e o escore Z. 
Existem valores extremos 
(outliers)? Explique 
(c) Os dados são simétricos ou 
assimétricos? Em caso de 
assimetria, qual é o tipo? 
300 180 85 170 380 460
260 35 380 120 110 240
𝒂) 𝑋 =
 𝑋𝑖
𝑛
1=1
𝑛
= 𝟐𝟐𝟔, 𝟔𝟕 
 
 𝑄1 =
𝑛 + 1
4
= 𝟏𝟏𝟎 
𝑄2 = 𝑝𝑎𝑟 =
𝑛 + 1
2
= 𝟐𝟏𝟎 
𝑄3 =
3(𝑛 + 1)
4
= 𝟑𝟖𝟎 
 
 
𝒃) 𝐴 = 460 − 35 = 𝟒𝟐𝟓 
 
 𝑄3 − 𝑄1 = 𝟏𝟕𝟎 
 
 𝑆2 =
 (𝑋𝑖 − 𝑋 )
2
𝑛 − 1
= 𝟏𝟕𝟕𝟓𝟔, 𝟎𝟔 
 
 𝑆 = 𝑆2 = 𝟏𝟑𝟑, 𝟐𝟓 
 
𝐶𝑉 =
𝑆
𝑋 
× 100% = 𝟓𝟖, 𝟕𝟗% 
 
 
 Não existe valor 
extremo, uma vez que nenhum dos 
escores Z possui um valor absoluto 
que seja maior do que 3,0 . 
 
c) Os dados são assimétricos à 
direita, uma vez que a média 
aritimética é > do que a mediana . 
 
 
 
 
 
 
 
 
 
 



S
XX
Z i
R
E
S
O
L
U
Ç
Ã
O
 
5.8 Medidas Numéricas Descritivas 
para a População 
 
 
 
As 
ESTATÍSTICAS 
descritivas 
discutidas 
descrevem uma 
AMOSTRA e não 
a população. 
 
 
 
 
 
 
 
 
 
 
 
 
Medidas 
descritivas para a 
POPULAÇÃO são 
chamadas de 
PARÂMETROS e 
geralmente 
denotadas por 
letras gregas. 
 
 
 
 
 
PARÂMETROS 
DE POPULAÇÃO 
IMPORTANTES 
são: 
média, 
 a variância, 
 e desvio-padrão 
populacional. 
5.8.1 Média Populacional 
N
XXX
N
X
N
N
i
i 


 211
A média populacional é a soma dos valores da 
população dividida pelo tamanho da população, N. 
Onde: 
5.8.2 Variância Populacional 
N
X
N



 1i
2
i
2
μ)(
σ
Onde: 
A variância populacional é a média do quadrado dos 
desvios dos valores em relação a média populacional. 
5.8.3 Desvio-Padrão Populacional 
O desvio-padrão populacional é a medida de 
variação populacional mais usada; 
 
• É a raiz da variância; 
N
X
N



 1i
2
i μ)(
σ
Onde: 
5.9 Estatísticas Amostrais 
versus 
Parâmetros Populacionais 
MEDIDA PARÂMETRO 
POPULACIONAL 
ESTATÍSTICA 
AMOSTRAL 
Média 
Variância 
Desvio-padrão 
X
2S
S

2

5.10 Análise Exploratória de Dados 
5.10.1 Resumo de Cinco Números 
Um Resumo de Cinco Números consiste de: 
Mínimo (Xmenor) 
Primeiro Quartil (Q1) 
Mediana (Q2) 
Terceiro Quartil (Q3) 
Máximo (Xmaior) 
5.10 Análise Exploratória de Dados 
5.10.2 Box-Plot 
O Box-Plot é uma apresentação gráfica do resumo 
de 5 números. 
O quadro e a linha central se localizam no meio 
dos pontos extremos somente se os dados forem 
simétricos em torno da média. 
Um gráfico Box-Plot pode ser apresentado tanto na 
vertical quanto na horizontal. 
O ultra-som foi usado para obter 
informações sobre dados de 
corrosão na espessura da chapa 
do assoalho de um reservatório 
elevado usado para armazenar 
óleo bruto. Cada observação é a 
maior profundidade do orifício na 
placa, expressa em milipolegadas. 
Contrua um box-plot e descreva o 
formato. 
40 52 55 60 70 75 85 85 90 90
92 94 94 95 98 100 115 125 125
Sendo n=19, então: 
 
Xmin = 40 
 
Q1 = n+1/4  5° valor = 70 
 
Q2 = 90 
 
Q3 = 3(n+1)/4 15° valor = 98 
 
Xmax = 125 
RESOLUÇÃO 
Uma vez que: 
𝑿 = 𝟖𝟔, 𝟑𝟐 é < 𝑸𝟐 = 𝟗𝟎 
 
Logo, temos assimetria à esquerda 
Os efeitos de descargas parciais na 
degradação de materiais de cavidades 
isolantes têm importantes implicações na 
vida útil de componentes de alta voltagem. 
Consideremos a seguinte amostra de n=25 
larguras de pulso de descargas lentas em 
uma cavidade cilíndrica de polietileno. Foi 
observado o impacto de diversas 
ferramentas estatísticas na interpretação dos 
dados de descarga. Construa um box-plot. 
BOX-PLOT COM VALORES EXTREMOS 
5,3 8,2 13,8 74,1 85,3 88 90,2 91,5 92,4 92,9 93,6 94,3 94,8
94,9 95,5 95,8 95,9 96,6 96,7 98,1 99 101,4 103,7 106 113,5
R
E
S
O
L
U
Ç
Ã
O
 
Sendo n=25, então: 
 
Xmin = 5,3 
 
Q1 = n+1/4  6,5 valor = 89,1 
 
Q2 = 94,8 
 
Q3 = 3(n+1)/4  19,5 valor = 
97,4 
 
Xmax = 113,5 
Valores extremos: 
 
LI = Q1 – (1,5) (AI) 
LI = 89,1 – (1,5) (8,3) 
LI = 89,1 – 12,45 
LI = 76,65 
 
 
LS = Q3 + (1,5) (AI) 
LS = 97,4 + (1,5) (8,3) 
LS = 97,4 + 12,45 
LS = 109,85 
5.11 Covariância Amostral 
A covariância amostral objetiva verificar se duas variáveis 
aleatórias movimentam-se ou não no mesmo sentido. 
Deficiência  uma vez que a variância pode assumir 
qualquer valor, você não consegue determinar a força 
relativa da relação; 
Por exemplo, você não consegue afirmar se o valor 
6,83777 é uma indicação de uma relação forte ou fraca. 
1n
)YY)(XX(
)Y,X(cov
n
1i
ii





cov(X,Y) > 0 : 
X e Y tendem 
a se mover 
na mesma 
direção. 
cov(X,Y) < 0: 
X e Y 
tendem a se 
mover em 
direções 
opostas. 
cov(X,Y) = 0 : 
X e Y são 
linearmente 
independentes. 
A 
Covariância 
entre duas 
variáveis: 
5.12 Coeficiente de Correlação 
O coeficiente de correlação mede a força relativa da relação 
linear entre duas variáveis. 







n
i
i
n
i
i
n
i
ii
YX
YYXX
YYXX
SS
YX
r
1
2
1
2
1
)()(
))((
),(cov
5.12 Coeficiente de Correlação 
5.12.1 Propriedades 
Adimensional; 
Varia entre -1 e 1; 
Quanto mais próximo de -1 mais forte é a 
relação linear negativa entre as variávies; 
Quanto mais próximo de 1, mais forte é a 
relação linear positiva entre as variáveis; 
Quanto mais próximo de 0, mais fraca é a relação 
linear entre as variáveis. 
y 
x 
r = -1 r = +1 
y 
x 
r = - 0,6 
y 
x 
r = 0 
y 
x 
r = + 0,3 
y 
x 
Intensidade da Correlação 
Correlação 
não é o mesmo 
que causa e 
efeito. 
Duas variáveis 
podem estar 
altamente 
correlacionadas e, 
no entanto, não 
haver relação de 
causa e efeito 
entre elas. 
Se duas 
variáveis 
estiverem 
amarradas por 
uma relação 
de causa e 
efeito 
Elas estarão, 
obrigatoria 
mente, 
correlaciona 
das. 
r = 0,733 
Claramente 
existe uma 
relação linear 
positiva 
média entre a 
nota na 1a 
prova e a 
nota na 2a 
prova. 
Alunos que 
tiraram notas 
boas na 1a 
prova tendem 
a tirar notas 
boas na 2a 
prova. 
70
75
80
85
90
95
100
70 75 80 85 90 95 100
No
ta 
na
 2a
 Pr
ov
a
Nota na 1a Prova
Gráfico de Dispersão das Notas nas 
Provas
Agente Anos de 
serviço (X) 
Número de 
clientes (Y) 
A 2 48 
B 3 50 
C 4 56 
D 5 52 
E 4 43 
F 6 60 
G 7 62 
H 8 58 
I 8 64 
J 10 72 
A partir dos dados abaixo, calcule a 
covariância amostral e o coeficiente de 
correlação entre as variáveis X e Y. 
RESOLUÇÃO 
COV (X, Y) = 171,5 / 9 = 19,05 
1n
)YY)(XX(
)Y,X(cov
n
1i
ii





Xi – MÉDIA(X) Yi – MÉDIA(Y) [Xi –MÉDIA(X)] . [Yi – MÉDIA(Y)] 
(2-5,7) = - 3,7 - 8,5 31,45 
- 2,7 - 6,5 17,55 
- 1,7 - 0,5 0,85 
- 0,7 - 4,5 3,15 
- 1,7 - 13,5 22,95 
0,3 3,5 1,05 
1,3 5,5 7,15 
2,3 1,5 3,45 
2,3 7,5 17,45 
4,3 15,5 66,65 
 Ʃ = 171,5 
AGENTE ANOS DE 
SERVIÇO (X) 
NÚMERO DE 
CLIENTES (Y) 
A 2 48 
B 3 50 
C 4 56 
D 5 52 
E 4 43 
F 6 60 
G 7 62 
H 8 58 
I 8 64 
J 10 72 
 MÉDIA (X) = 
5,7 
MÉDIA (Y) = 
56,6 
As variáveis tendem a se mover na mesma direção 
YX
n
1i
2
i
n
1i
2
i
n
1i
ii
SS
)Y,X(cov
)YY()XX(
)YY)(XX(
r 







r = cov / Sx . Sy = 0,87 
R
E
S
O
L
U
Ç
Ã
O
 
[Xi – MÉDIA(X)] 2 [Yi – MÉDIA(Y)] 2 
13,69 72,25 
7,29 42,25 
2,89 0,25 
0,49 20,25 
2,89 182,25 
0,09 12,25 
1,69 30,25 
5,29 2,25 
5,29 56,25 
18,49 240,25 
Ʃ = 58,1 Ʃ = 658,5 
 
58,1/9=6,45 658,5/9=73,17 
Temos uma correlação forte!!!! 
RESOLUÇÃO 
30
35
40
45
50
55
60
65
70
75
0 2 4 6 8 10 12
Anos de serviço (X) 
N
ú
m
e
ro
 d
e
 c
li
e
n
te
s
 (
Y
) 
5.13 Resumo das Aulas 
Medidas de 
tendência 
central 
Média, mediana, 
moda. 
Medidas 
separatrizes 
Medidas de 
variação 
Amplitude, amplitude 
interquartil, variância, 
desvio-padrão e 
coeficiente de variação 
Em três aulas vimos: 
Formatos de 
distribuição 
Distribuições 
simétricas, assimétricas 
e diagramas Box-Plot. 
Covariância e 
coeficiente de 
correlação. 
Quartis 
Oito programas foram monitorados para 
estudar a demanda por recursos. Neste 
trabalho, a variável resposta (dependente) é o 
tempo de CPU, e a variável independente é o 
número de acessos ao disco (disk I/O). 
(a) Calcule o coeficiente de correlação de 
Pearson. Conclua sobre a correlação entre as 
duas variáveis. 
(b) Que tipo de gráfico você utilizaria para 
fazer a correlação entre duas variáveis? 
Tempo de CPU (Y) Número de acessos ao disco (X) 
2,0 14 
4,6 15 
5,7 23 
7,3 31 
9,8 38 
10,9 40 
12,6 53 
13,2 51 
GABARITO 
 
(a) r = 0,98 
(b) ?

Outros materiais