Baixe o app para aproveitar ainda mais
Prévia do material em texto
BOX PLOT Uma maneira simples, rápida e poderosa de representar seus dados 2 Box Plot Sumário » Como representar esses dados? . . . . . . . . . . . 3 » O que é . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 » Box plot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 » Representação . . . . . . . . . . . . . . . . . . . . . . . . . . 6 » Métrica fundamental: Quartis . . . . . . . . . . . . . 7 » Calculando os quartis… . . . . . . . . . . . . . . . . . . 8 » Montando o Box Plot . . . . . . . . . . . . . . . . . . . . 11 » Qual a vantagem? . . . . . . . . . . . . . . . . . . . . . . . 12 » O que o Box-plot não mostra? . . . . . . . . . . . . 13 » Outliers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 » Como decidir quando um dado será um outlier? . . . . . . . . . . . . . . . . . . . . . . . . 16 » Resumindo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 » Exercitando . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 » Resolução: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 » Representando os 4 conjuntos: . . . . . . . . . . . 23 » Box Plot no Excel . . . . . . . . . . . . . . . . . . . . . . . 24 » Correlação utilizando box plot . . . . . . . . . . . . 27 » ANOVA auxiliado pelo Box-Plot . . . . . . . . . . . 29 » Exemplo prático 1: . . . . . . . . . . . . . . . . . . . . . . 31 » Exemplo prático 2: . . . . . . . . . . . . . . . . . . . . . . 32 » Exercitando . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 https://www.escolaedti.com.br/ 3 Box Plot Como representar esses dados? 17 31 12 5 17 22 29 6 31 31 17 33 5 25 20 33 13 13 18 26 29 12 34 22 32 8 27 28 29 6 35 7 32 6 19 15 24 16 21 14 19 19 30 11 5 10 31 23 DotPlot: HistoGrama: BOX PLOT 4 Box Plot O que é » Representação gráfica de uma variável numérica, utilizando quartis . » Recurso muito útil para realizar comparações de dados, principalmente a variação destes; » Útil para evidenciar correlação entre variáveis; » Permite representar dados sem que estes obedeçam a determinada distribuição específica; » Também conhecido como diagrama de caixa, diagrama de extremos e quartis https://www.escolaedti.com.br/ 5 Box Plot Box plot 6 Box Plot Representação Whisker; “Fio de bigode” Whisker; “Fio de bigode” “CAIXA” Limite Superior 3º quartil Mediana 1º quartil Limite Inferior 7 Box Plot Métrica fundamental: Quartis » Os quartis (Q1; Q2; Q3) dividem uma distribuição de dados em 4 partes iguais . EXemPlo: » Observe a distribuição abaixo que representa o número de funcionários alocados em cada andar de um prédio comercial . Andar nº funcionários 1º 42 2º 19 3º 44 4º 53 5º 28 6º 19 7º 22 8º 23 9º 39 10º 35 11º 39 8 Box Plot Calculando os quartis… 1º Passo: Ordenar os dados. 2º Passo: LoCaliZar a mediana. 19 19 22 23 28 35 39 39 42 44 53 19 19 22 23 28 35 39 39 42 44 53 MEDIANA 50%50% 9 Box Plot Calculando os quartis… 3º Passo: CalCUlar o Primeiro e terCeiro QUartis. 19 19 22 23 28 35 39 39 42 44 53 19 19 22 23 28 35 39 39 42 44 53 MEDIANA 2º quartil 1º quartil 3º quartil 1/4 25% 1/4 25% 1/4 25% 1/4 25% 10 Box Plot Calculando os quartis… 19 19 22 23 28 35 39 39 42 44 53 19 19 22 23 28 35 39 39 42 44 53 19 19 22 23 28 35 39 39 42 44 53 Q2 ou mediana Q1 Q3 1/4= 25% 1/4= 25% 2/4= 50% 3/4= 75% 3/4= 75% 2/4= 50% 11 Box Plot Montando o Box Plot 19 19 22 23 28 35 39 39 42 44 53 » 1º quartil 22 » 2º quartil 35 » 3º quartil 42 » mínimo 19 » máximo 53 12 Box Plot Qual a vantagem? Fácil compreensão Simples Entendimento da dispersão 13 Box Plot O que o Box-plot não mostra? » É possível saber qual a média de altura do time A? NÃO » É possível saber qual a média de altura do time B? NÃO » É possível saber quantos jogadores tem o time A? NÃO » É possível saber quantos jogadores tem o time B? NÃO BoX-Plot não mostra » Média dos dados; » Quantidade de dados; 14 Box Plot Outliers » Um empresa de logística monitora o tempo que os entregadores levam para realizar uma rota entre duas cidades próximas . » Os dados coletados durante um mês estão representados pelo box plot ao lado Outlier Valor atípico“ponto fora da curva” https://www.escolaedti.com.br/ 15 Box Plot Outliers Observemos os dados: Semana 1ª 2ª 3ª 4ª 45 57 48 51 55 52 50 55 49 39 55 42 42 42 55 111 44 44 Obs .: tempo em segundos . Outlier! https://www.escolaedti.com.br/ 16 Box Plot Como decidir quando um dado será um outlier? Calculemos: Q3 + 1,5 (Q3 – Q1) Q3 + 1,5 (Q3 – Q1) 55,00 + 1,5 (11,50) = 72,25 Q1 - 1,5 (Q3 – Q1) 43,50 - 1,5 (11,50) = 26,25 Calculemos: Q1 - 1,5 (Q3 – Q1) Q3 – Q1 = (55,00 – 43,50) = 11,50 39 42 42 42 44 44 45 48 49 50 51 52 55 55 55 55 57 111 Q1 = 43,50 Q2 ou mediana = 49,50 Q3 = 55,00 Portanto Outliers sãO tOdOs Os valOres abaixO de 26,25 e acima de 72,25 https://www.escolaedti.com.br/ 17 Box Plot Resumindo Limite Superior = mín { max (dados); Q3 + 1,5 (Q3 – Q1) } 3º quartil Mediana 1º quartil Limite Inferior = máx { min (dados); Q1 – 1,5 (Q3 – Q1) 18 Box Plot Exercitando » Considere os quatro conjuntos de dados mostrados ao lado . » Represente esses conjuntos utilizando-se box plots . A B C D 1 3 1 1 1 4 4 2 1 5 6 3 2 5 10 4 4 6 12 5 5 7 14 6 6 8 14 7 7 10 14 8 10 12 15 9 11 12 16 10 13 15 16 11 14 21 12 14 22 13 15 27 13 16 30 13 17 30 30 18 30 20 25 19 Box Plot Resolução: A 1 1 1 2 4 5 6 7 10 11 13 14 14 15 16 17 18 20 25 » Q1 = 4 » Q2 = 11 » Q3 = 16 Há Presença de OUtliers? VERIFICAR! QUal o tamanHo dos WHisKers? Q3 + 1,5 (Q3 – Q1) 16 + 1,5 (16 - 4) = 34 Q1 - 1,5 (Q3 – Q1) 4 - 1,5 (16 - 4) = - 14 Outiliers são dados que estão fora desse intervalo POrtaNtO NãO HÁ Outliers » Limite Superior = mín { max (dados); Q3 + 1,5 (Q3 – Q1) } • Limite Superior = min { 25 ; 34 } = 25 » Limite Inferior = máx { min (dados); Q1 – 1,5 (Q3 – Q1) • Limite Inferior = máx { 1 ; -14 } = 1 20 Box Plot Resolução: B 3 4 5 5 6 7 8 10 12 12 15 » Q1 = 5 » Q2 = 7 » Q3 = 12 Há Presença de OUtliers? VERIFICAR! QUal o tamanHo dos WHisKers? Q3 + 1,5 (Q3 – Q1) 12 + 1,5 (12 - 5) = 22,5 Q1 - 1,5 (Q3 – Q1) 5 - 1,5 (12 - 5) = - 5,5 Outiliers são dados que estão fora desse intervalo POrtaNtO NãO HÁ Outliers » Limite Superior = mín { max (dados); Q3 + 1,5 (Q3 – Q1) } • Limite Superior = min { 15 ; 22,5 } = 15 » Limite Inferior = máx { min (dados); Q1 – 1,5 (Q3 – Q1) • Limite Inferior = máx { 3 ; - 5,5} = 3 21 Box Plot Resolução: C 1 4 6 10 12 14 14 14 15 16 16 21 22 27 30 30 30 » Q1 = 11 » Q2 = 15 » Q3 = 24,5 Há Presença de OUtliers? VERIFICAR! QUal o tamanHo dos WHisKers? Q3 + 1,5 (Q3 – Q1) 24,5 + 1,5 (24,5 - 11) = 44,75 Q1 - 1,5 (Q3 – Q1) 11 - 1,5 (24,5 - 11) = -9,25 Outiliers são dados que estão fora desse intervalo POrtaNtO NãO HÁ Outliers » Limite Superior = mín { max (dados); Q3 + 1,5 (Q3 – Q1) } • Limite Superior = min { 30 ; 44,75 } = 30 » Limite Inferior = máx { min (dados); Q1 – 1,5 (Q3 – Q1) • Limite Inferior = máx { 1 ; - 9,25} = 1 22 Box Plot Resolução: D 1 2 3 4 5 6 7 8 9 10 11 12 13 13 13 30 » Q1 = 4,25 » Q2 = 8,50 » Q3 = 12,75 Há Presença de OUtliers? VERIFICAR! QUal o tamanHo dos WHisKers? Q3 + 1,5 (Q3 – Q1) 12,75 + 1,5 (12,75 – 4,25) = 25,5 Q1 - 1,5 (Q3 – Q1) 4,25 - 1,5 (12,75 – 4,25) = - 8,5 Outiliers sãodados que estão fora desse intervalo POrtaNtO Há Outliers » Limite Superior = mín { max (dados); Q3 + 1,5 (Q3 – Q1) } • Limite Superior = min { 13 ; 25,5 } = 13 » Limite Inferior = máx { min (dados); Q1 – 1,5 (Q3 – Q1) • Limite Inferior = máx { 1 ; - 8,5 } = 1 23 Box Plot Representando os 4 conjuntos: 24 Box Plot Box Plot no Excel » O Microsoft Excel traz em seu pacote de recursos a opção para construir um gráfico box plot . » No caso, ele é denominado “Caixa Estreita” 25 Box Plot Box Plot no Excel RealiZando o eXemPlo dos QUatro ConJUntos no EXCel: 1) Selecione o conjunto de dados; 2) Inserir → Gráficos → Caixa Estreia 26 Box Plot Box Plot no Excel » É possível alterar o que é mostrado no box plot . Clique sobre alguma caixa e as opções serão mostradas ao lado . » Por exemplo: por padrão, o Excel mostra (através de um símbolo “x”) a média dos dados . 27 Box Plot Correlação utilizando box plot » Correlação é a “interdependência entre duas variáveis” » Exemplo: Uma empresa que produz canecas plásticas estava enfrentando problemas com tempos excessivos de setup . Como a variedade de modelos era elevada, o setup é considerado crítico para a produção . Os responsáveis por um projeto de melhoria estavam desconfiados que havia diferentes nos tempos de setup entre os três turnos . Buscando verificar se havia correlação entre o tempo de setup e o turno de trabalho, foram coletados dados conformes mostrado ao lado: 1º turno 2º turno 3º turno 20 24 29 19 23 24 21 28 26 21 22 28 22 24 27 18 24 27 20 23 25 20 21 29 19 25 25 19 23 26 23 26 28 21 27 26 19 22 28 20 22 27 22 25 25 18 26 30 https://www.escolaedti.com.br/ 28 Box Plot Correlação utilizando box plot Como tradUZir esses dados de maneira a evidenCiar se eXiste Correlação? BOX-PLOT!! 29 Box Plot ANOVA auxiliado pelo Box-Plot ANOVA = Análise de Variação » Análise para comparar as médias de mais de duas populações » Exemplo: Um médico deseja comparar os efeitos de três diferentes remédios na recuperação de pacientes idosos, que sofreram derrame devido a um ataque do coração de média intensidade . Um total de 18 pacientes foi selecionado procurando manter constantes parâmetros como idade, condição física, motivação, etc . . . Esses pacientes foram divididos aleatoriamente em três grupos e, após um período de seis meses, eles foram avaliados por um especialista que não tinha conhecimento a que grupo pertencia cada paciente . Remédio A Remédio B Remédio C 80 56 97 73 72 90 79 61 75 88 64 87 68 80 88 75 74 83 https://www.escolaedti.com.br/ 30 Box Plot ANOVA auxiliado pelo Box-Plot » Com o auxílio de um soft ware estatístico, sua análise fica fácil e rápida, e o Box-plot é utilizado para auxiliar a análise conforme vemos Análise de variância Fonte GL SQ (Aj.) QM (Aj.) Valor F Valor-P C6 2 1064,1 532,06 8,78 0,003 Erro 15 909,0 60,60 Total 17 1973,1 31 Box Plot Exemplo prático 1: » Um pesquisador realizou um experimento para comparar três tipos de fertilizantes . O intuito era descobrir qual deles contribuia mais para o crescimento de mudas de cana de açúcar . Cada fertilizante foi aplicado em dez mudas . Após duas semanas, anotou-se o comprimento de cada muda . As condições ambientais (temperatura, luminosidade, umidade, etc) foram mantidas idênticas . O resultado do experimento é mostrado no box-plot abaixo: Observando-se o gráfico é possível ver de maneira clara a comparação entre os três fertilizantes . Claramente o fertilizante 3 foi aquele que provocou os maiores resultados de crescimento . Podemos notar um outlier para esse fertilizante . No caso, uma das mudas apresentou um comportamento anormal . Este ponto deve ser investigado o que de fato aconteceu . Provavelmente essa medida será excluída . 32 Box Plot Exemplo prático 2: » Uma grande rede de shoppings, com cinco unidades localizadas em regiões distintas da cidade de São Paulo, monitora a quantidade diária de pessoas que frequentam o shopping . Os dados comparativos das cinco unidades são mostrados abaixo para o mês de agosto . 33 Box Plot Exercitando » Os números abaixo representam a idade dos funcionários de determinada empresa . Qual o Box-plot que representa corretamente esses valores? 21 23 23 26 28 29 30 30 31 33 36 38 39 40 45 a) b) c) 34 Box Plot Exercitando » Considerando os dados mostrados abaixo, qual o Box-plot que representa corretamente esses valores? 0 5 6 7 8 10 12 12 15 16 22 43 43 a) b) c) Exercitando Exemplo prático 2: Exemplo prático 1: ANOVA auxiliado pelo Box-Plot Correlação utilizando box plot Box Plot no Excel Representando os 4 conjuntos: Resolução: Exercitando Resumindo Como decidir quando um dado será um outlier? Outliers O que o Box-plot não mostra? Qual a vantagem? Diagrama de Causa e Efeito Calculando os quartis… Métrica fundamental: Quartis Representação Box plot O que é Como representar esses dados?
Compartilhar