Prévia do material em texto
BOX PLOT
Uma maneira simples,
rápida e poderosa de
representar seus dados
2
Box Plot
Sumário
» Como representar esses dados? . . . . . . . . . . . 3
» O que é . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
» Box plot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
» Representação . . . . . . . . . . . . . . . . . . . . . . . . . . 6
» Métrica fundamental: Quartis . . . . . . . . . . . . . 7
» Calculando os quartis… . . . . . . . . . . . . . . . . . . 8
» Montando o Box Plot . . . . . . . . . . . . . . . . . . . . 11
» Qual a vantagem? . . . . . . . . . . . . . . . . . . . . . . . 12
» O que o Box-plot não mostra? . . . . . . . . . . . . 13
» Outliers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
» Como decidir quando um dado
será um outlier? . . . . . . . . . . . . . . . . . . . . . . . . 16
» Resumindo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
» Exercitando . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
» Resolução: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
» Representando os 4 conjuntos: . . . . . . . . . . . 23
» Box Plot no Excel . . . . . . . . . . . . . . . . . . . . . . . 24
» Correlação utilizando box plot . . . . . . . . . . . . 27
» ANOVA auxiliado pelo Box-Plot . . . . . . . . . . . 29
» Exemplo prático 1: . . . . . . . . . . . . . . . . . . . . . . 31
» Exemplo prático 2: . . . . . . . . . . . . . . . . . . . . . . 32
» Exercitando . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
https://www.escolaedti.com.br/
3
Box Plot
Como representar
esses dados?
17 31 12 5 17 22 29 6 31 31 17 33
5 25 20 33 13 13 18 26 29 12 34 22
32 8 27 28 29 6 35 7 32 6 19 15
24 16 21 14 19 19 30 11 5 10 31 23
DotPlot: HistoGrama: BOX PLOT
4
Box Plot
O que é
» Representação gráfica de uma variável
numérica, utilizando quartis .
» Recurso muito útil para realizar comparações
de dados, principalmente a variação destes;
» Útil para evidenciar correlação entre variáveis;
» Permite representar dados sem que
estes obedeçam a determinada
distribuição específica;
» Também conhecido como diagrama de
caixa, diagrama de extremos e quartis
https://www.escolaedti.com.br/
5
Box Plot
Box plot
6
Box Plot
Representação
Whisker;
“Fio de
bigode”
Whisker;
“Fio de
bigode”
“CAIXA”
Limite
Superior
3º quartil
Mediana
1º quartil
Limite
Inferior
7
Box Plot
Métrica
fundamental: Quartis
» Os quartis (Q1; Q2; Q3)
dividem uma distribuição de
dados em 4 partes iguais .
EXemPlo:
» Observe a distribuição
abaixo que representa o
número de funcionários
alocados em cada andar
de um prédio comercial .
Andar nº funcionários
1º 42
2º 19
3º 44
4º 53
5º 28
6º 19
7º 22
8º 23
9º 39
10º 35
11º 39
8
Box Plot
Calculando
os quartis…
1º Passo: Ordenar os dados.
2º Passo: LoCaliZar a mediana.
19 19 22 23 28 35 39 39 42 44 53
19 19 22 23 28 35 39 39 42 44 53
MEDIANA
50%50%
9
Box Plot
Calculando
os quartis…
3º Passo: CalCUlar o Primeiro e terCeiro QUartis.
19 19 22 23 28 35 39 39 42 44 53
19 19 22 23 28 35 39 39 42 44 53
MEDIANA
2º quartil
1º quartil 3º quartil
1/4
25%
1/4
25%
1/4
25%
1/4
25%
10
Box Plot
Calculando
os quartis…
19 19 22 23 28 35 39 39 42 44 53
19 19 22 23 28 35 39 39 42 44 53
19 19 22 23 28 35 39 39 42 44 53
Q2 ou mediana
Q1
Q3
1/4= 25%
1/4= 25%
2/4= 50%
3/4= 75%
3/4= 75%
2/4= 50%
11
Box Plot
Montando
o Box Plot
19 19 22 23 28 35 39 39 42 44 53
» 1º quartil 22
» 2º quartil 35
» 3º quartil 42
» mínimo 19
» máximo 53
12
Box Plot
Qual a
vantagem?
Fácil compreensão
Simples
Entendimento da dispersão
13
Box Plot
O que o Box-plot
não mostra?
» É possível saber qual a média
de altura do time A? NÃO
» É possível saber qual a média
de altura do time B? NÃO
» É possível saber quantos
jogadores tem o time A? NÃO
» É possível saber quantos
jogadores tem o time B? NÃO
BoX-Plot não mostra
» Média dos dados;
» Quantidade de dados;
14
Box Plot
Outliers
» Um empresa de logística
monitora o tempo que os
entregadores levam para
realizar uma rota entre
duas cidades próximas .
» Os dados coletados durante
um mês estão representados
pelo box plot ao lado
Outlier
Valor atípico“ponto
fora da curva”
https://www.escolaedti.com.br/
15
Box Plot
Outliers
Observemos os dados:
Semana
1ª 2ª 3ª 4ª
45 57 48 51
55 52 50 55
49 39 55 42
42 42 55 111
44 44
Obs .: tempo em segundos .
Outlier!
https://www.escolaedti.com.br/
16
Box Plot
Como decidir quando um
dado será um outlier?
Calculemos: Q3 + 1,5 (Q3 – Q1)
Q3 + 1,5 (Q3 – Q1)
55,00 + 1,5 (11,50)
= 72,25
Q1 - 1,5 (Q3 – Q1)
43,50 - 1,5 (11,50)
= 26,25
Calculemos: Q1 - 1,5 (Q3 – Q1)
Q3 – Q1 =
(55,00 – 43,50) = 11,50
39 42 42 42 44 44 45 48 49 50 51 52 55 55 55 55 57 111
Q1 = 43,50
Q2 ou mediana = 49,50
Q3 = 55,00
Portanto
Outliers sãO tOdOs Os valOres abaixO de 26,25 e acima de 72,25
https://www.escolaedti.com.br/
17
Box Plot
Resumindo
Limite Superior = mín { max
(dados); Q3 + 1,5 (Q3 – Q1) }
3º quartil
Mediana
1º quartil
Limite Inferior = máx { min
(dados); Q1 – 1,5 (Q3 – Q1)
18
Box Plot
Exercitando
» Considere os quatro
conjuntos de dados
mostrados ao lado .
» Represente esses conjuntos
utilizando-se box plots .
A B C D
1 3 1 1
1 4 4 2
1 5 6 3
2 5 10 4
4 6 12 5
5 7 14 6
6 8 14 7
7 10 14 8
10 12 15 9
11 12 16 10
13 15 16 11
14 21 12
14 22 13
15 27 13
16 30 13
17 30 30
18 30
20
25
19
Box Plot
Resolução:
A
1
1
1
2
4
5
6
7
10
11
13
14
14
15
16
17
18
20
25
» Q1 = 4
» Q2 = 11
» Q3 = 16
Há Presença de OUtliers? VERIFICAR!
QUal o
tamanHo dos
WHisKers?
Q3 + 1,5 (Q3 – Q1)
16 + 1,5 (16 - 4) = 34
Q1 - 1,5 (Q3 – Q1)
4 - 1,5 (16 - 4) = - 14
Outiliers são
dados que
estão fora desse
intervalo
POrtaNtO NãO HÁ Outliers
» Limite Superior = mín { max (dados); Q3 + 1,5 (Q3 – Q1) }
• Limite Superior = min { 25 ; 34 } = 25
» Limite Inferior = máx { min (dados); Q1 – 1,5 (Q3 – Q1)
• Limite Inferior = máx { 1 ; -14 } = 1
20
Box Plot
Resolução:
B
3
4
5
5
6
7
8
10
12
12
15
» Q1 = 5
» Q2 = 7
» Q3 = 12
Há Presença de OUtliers? VERIFICAR!
QUal o
tamanHo dos
WHisKers?
Q3 + 1,5 (Q3 – Q1)
12 + 1,5 (12 - 5) = 22,5
Q1 - 1,5 (Q3 – Q1)
5 - 1,5 (12 - 5) = - 5,5
Outiliers são
dados que
estão fora desse
intervalo
POrtaNtO NãO HÁ Outliers
» Limite Superior = mín { max (dados); Q3 + 1,5 (Q3 – Q1) }
• Limite Superior = min { 15 ; 22,5 } = 15
» Limite Inferior = máx { min (dados); Q1 – 1,5 (Q3 – Q1)
• Limite Inferior = máx { 3 ; - 5,5} = 3
21
Box Plot
Resolução:
C
1
4
6
10
12
14
14
14
15
16
16
21
22
27
30
30
30
» Q1 = 11
» Q2 = 15
» Q3 = 24,5
Há Presença de OUtliers? VERIFICAR!
QUal o
tamanHo dos
WHisKers?
Q3 + 1,5 (Q3 – Q1)
24,5 + 1,5 (24,5 - 11) = 44,75
Q1 - 1,5 (Q3 – Q1)
11 - 1,5 (24,5 - 11) = -9,25
Outiliers são
dados que
estão fora desse
intervalo
POrtaNtO NãO HÁ Outliers
» Limite Superior = mín { max (dados); Q3 + 1,5 (Q3 – Q1) }
• Limite Superior = min { 30 ; 44,75 } = 30
» Limite Inferior = máx { min (dados); Q1 – 1,5 (Q3 – Q1)
• Limite Inferior = máx { 1 ; - 9,25} = 1
22
Box Plot
Resolução:
D
1
2
3
4
5
6
7
8
9
10
11
12
13
13
13
30
» Q1 = 4,25
» Q2 = 8,50
» Q3 = 12,75
Há Presença de OUtliers? VERIFICAR!
QUal o
tamanHo dos
WHisKers?
Q3 + 1,5 (Q3 – Q1)
12,75 + 1,5 (12,75 – 4,25) = 25,5
Q1 - 1,5 (Q3 – Q1)
4,25 - 1,5 (12,75 – 4,25) = - 8,5
Outiliers sãodados que
estão fora desse
intervalo
POrtaNtO Há Outliers
» Limite Superior = mín { max (dados); Q3 + 1,5 (Q3 – Q1) }
• Limite Superior = min { 13 ; 25,5 } = 13
» Limite Inferior = máx { min (dados); Q1 – 1,5 (Q3 – Q1)
• Limite Inferior = máx { 1 ; - 8,5 } = 1
23
Box Plot
Representando
os 4 conjuntos:
24
Box Plot
Box Plot
no Excel
» O Microsoft Excel traz em seu pacote de recursos a opção para construir um gráfico box plot .
» No caso, ele é denominado “Caixa Estreita”
25
Box Plot
Box Plot
no Excel
RealiZando o eXemPlo dos QUatro ConJUntos no EXCel:
1) Selecione o conjunto de dados; 2) Inserir → Gráficos → Caixa Estreia
26
Box Plot
Box Plot
no Excel
» É possível alterar o que é mostrado no box plot . Clique sobre
alguma caixa e as opções serão mostradas ao lado .
» Por exemplo: por padrão, o Excel mostra (através
de um símbolo “x”) a média dos dados .
27
Box Plot
Correlação
utilizando box plot
» Correlação é a “interdependência
entre duas variáveis”
» Exemplo: Uma empresa que produz canecas
plásticas estava enfrentando problemas
com tempos excessivos de setup . Como a
variedade de modelos era elevada, o setup
é considerado crítico para a produção . Os
responsáveis por um projeto de melhoria
estavam desconfiados que havia diferentes
nos tempos de setup entre os três turnos .
Buscando verificar se havia correlação entre o
tempo de setup e o turno de trabalho, foram
coletados dados conformes mostrado ao lado:
1º turno 2º turno 3º turno
20 24 29
19 23 24
21 28 26
21 22 28
22 24 27
18 24 27
20 23 25
20 21 29
19 25 25
19 23 26
23 26 28
21 27 26
19 22 28
20 22 27
22 25 25
18 26 30
https://www.escolaedti.com.br/
28
Box Plot
Correlação
utilizando box plot
Como tradUZir esses dados de maneira a
evidenCiar se eXiste Correlação? BOX-PLOT!!
29
Box Plot
ANOVA auxiliado
pelo Box-Plot
ANOVA = Análise de Variação
» Análise para comparar as médias de
mais de duas populações
» Exemplo: Um médico deseja comparar os efeitos de
três diferentes remédios na recuperação de pacientes
idosos, que sofreram derrame devido a um ataque
do coração de média intensidade . Um total de 18
pacientes foi selecionado procurando manter constantes
parâmetros como idade, condição física, motivação,
etc . . . Esses pacientes foram divididos aleatoriamente
em três grupos e, após um período de seis meses, eles
foram avaliados por um especialista que não tinha
conhecimento a que grupo pertencia cada paciente .
Remédio A Remédio B Remédio C
80 56 97
73 72 90
79 61 75
88 64 87
68 80 88
75 74 83
https://www.escolaedti.com.br/
30
Box Plot
ANOVA auxiliado
pelo Box-Plot
» Com o auxílio de um soft ware estatístico, sua análise fica fácil e rápida, e
o Box-plot é utilizado para auxiliar a análise conforme vemos
Análise de variância
Fonte GL SQ (Aj.) QM (Aj.) Valor F Valor-P
C6 2 1064,1 532,06 8,78 0,003
Erro 15 909,0 60,60
Total 17 1973,1
31
Box Plot
Exemplo
prático 1:
» Um pesquisador realizou um experimento para comparar três tipos de fertilizantes . O intuito
era descobrir qual deles contribuia mais para o crescimento de mudas de cana de açúcar .
Cada fertilizante foi aplicado em dez mudas . Após duas semanas, anotou-se o comprimento
de cada muda . As condições ambientais (temperatura, luminosidade, umidade, etc) foram
mantidas idênticas . O resultado do experimento é mostrado no box-plot abaixo:
Observando-se o gráfico é possível ver de maneira
clara a comparação entre os três fertilizantes .
Claramente o fertilizante 3 foi aquele que
provocou os maiores resultados de crescimento .
Podemos notar um outlier para esse fertilizante .
No caso, uma das mudas apresentou um
comportamento anormal . Este ponto deve
ser investigado o que de fato aconteceu .
Provavelmente essa medida será excluída .
32
Box Plot
Exemplo
prático 2:
» Uma grande rede de shoppings, com cinco unidades localizadas em regiões distintas da
cidade de São Paulo, monitora a quantidade diária de pessoas que frequentam o shopping .
Os dados comparativos das cinco unidades são mostrados abaixo para o mês de agosto .
33
Box Plot
Exercitando
» Os números abaixo representam a idade dos funcionários de determinada
empresa . Qual o Box-plot que representa corretamente esses valores?
21 23 23 26 28 29 30 30 31 33 36 38 39 40 45
a)
b)
c)
34
Box Plot
Exercitando
» Considerando os dados mostrados abaixo, qual o Box-plot que representa corretamente esses valores?
0 5 6 7 8 10 12 12 15 16 22 43 43
a)
b)
c)
Exercitando
Exemplo prático 2:
Exemplo prático 1:
ANOVA auxiliado pelo Box-Plot
Correlação utilizando box plot
Box Plot no Excel
Representando os 4 conjuntos:
Resolução:
Exercitando
Resumindo
Como decidir quando um dado será um outlier?
Outliers
O que o Box-plot não mostra?
Qual a vantagem?
Diagrama de Causa e Efeito
Calculando os quartis…
Métrica fundamental: Quartis
Representação
Box plot
O que é
Como representar esses dados?