Baixe o app para aproveitar ainda mais
Prévia do material em texto
Me´dia, mediana, desvio-padra˜o e pontos discrepantes Quantis emp´ıricos Diagrama de Caixas (Box-plot) Medidas Resumo (parte 2) Wesley de Jesus Silva wjsilva.est.professor@gmail.com Departamento de Estat´ıstica Universidade de Bras´ılia Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2) I´ndice 1 Me´dia, mediana, desvio-padra˜o e pontos discrepantes 2 Quantis emp´ıricos 3 Diagrama de Caixas (Box-plot) Me´dia, mediana, desvio-padra˜o e pontos discrepantes Quantis emp´ıricos Diagrama de Caixas (Box-plot) 1 Me´dia, mediana, desvio-padra˜o e pontos discrepantes 2 Quantis emp´ıricos 3 Diagrama de Caixas (Box-plot) Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2) Me´dia, mediana, desvio-padra˜o e pontos discrepantes Quantis emp´ıricos Diagrama de Caixas (Box-plot) Considere as seguintes amostras amostra 1: 2 2 3 2 1 2 5 4 amostra 2: 2 2 3 2 1 2 5 4 23 Me´dias: x¯am1 = x¯am2 = Desvios-padra˜o: Sam1 = Sam2 = Medianas: md(X )am1 = md(X )am1 = Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2) Me´dia, mediana, desvio-padra˜o e pontos discrepantes Quantis emp´ıricos Diagrama de Caixas (Box-plot) Medidas-resumo das amostras amostra 1: 2 2 3 2 1 2 5 4 amostra 2: 2 2 3 2 1 2 5 4 23 Me´dias: x¯am1 = 2.625 x¯am2 = 4.889 Desvios-padra˜o: Sam1 = 1.302 Sam2 = 6.9 Medianas: md(X )am1 = 2 md(X )am2 = 2 Exerc´ıcio: calcule os valores apresentados acima Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2) Me´dia, mediana, desvio-padra˜o e pontos discrepantes Quantis emp´ıricos Diagrama de Caixas (Box-plot) Concluso˜es Incluindo-se o nu´mero 23 na amostra, a me´dia aumenta quase duas vezes, e o desvio-padra˜o quase seis vezes; A mediana na˜o se alterou; Veremos adiante que 23 e´ um ponto discrepante, tambe´m chamado de outlier ; Me´dias de desvios-padra˜o: 1 Sa˜o sens´ıveis a pontos discrepates; 2 Apenas estas duas medidas, sozinhas, nada informam sobre a assimetria da distribuic¸a˜o Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2) Me´dia, mediana, desvio-padra˜o e pontos discrepantes Quantis emp´ıricos Diagrama de Caixas (Box-plot) 1 Me´dia, mediana, desvio-padra˜o e pontos discrepantes 2 Quantis emp´ıricos 3 Diagrama de Caixas (Box-plot) Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2) Me´dia, mediana, desvio-padra˜o e pontos discrepantes Quantis emp´ıricos Diagrama de Caixas (Box-plot) Interpretac¸a˜o da mediana Definic¸a˜o: A mediana de X sera´ o valor que ocupa a posic¸a˜o central da sequeˆncia de valores crescentes dessa varia´vel; Definic¸a˜o formal: md(X ) e´ tal que, para 50% das observac¸o˜es, X ≤ md(X ); Ex. 1: md(X ) = 2 1 O nu´mero 2 ocupa a posic¸a˜o central da sequeˆncia de valores cresentes de X ; 2 Para 50% da amostra, X ≤ 2; Ex. 2: Salarios (Sal) da cia MB: md(Sal) = 10.165 1 O nu´mero 10.165 ocupa a posic¸a˜o central da sequeˆncia de valores cresentes de Sal ; 2 50% dos funciona´rios da cia MB ganham ate´ 10.165 sala´rios m´ınimos, (para metade dos funciona´rios, Sal ≤ 10.165); Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2) Me´dia, mediana, desvio-padra˜o e pontos discrepantes Quantis emp´ıricos Diagrama de Caixas (Box-plot) Interpretac¸a˜o da mediana Definic¸a˜o: A mediana de X sera´ o valor que ocupa a posic¸a˜o central da sequeˆncia de valores crescentes dessa varia´vel; Definic¸a˜o formal: md(X ) e´ tal que, para 50% das observac¸o˜es, X ≤ md(X ); Ex. 1: md(X ) = 2 1 O nu´mero 2 ocupa a posic¸a˜o central da sequeˆncia de valores cresentes de X ; 2 Para 50% da amostra, X ≤ 2; Ex. 2: Salarios (Sal) da cia MB: md(Sal) = 10.165 1 O nu´mero 10.165 ocupa a posic¸a˜o central da sequeˆncia de valores cresentes de Sal ; 2 50% dos funciona´rios da cia MB ganham ate´ 10.165 sala´rios m´ınimos, (para metade dos funciona´rios, Sal ≤ 10.165); Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2) Me´dia, mediana, desvio-padra˜o e pontos discrepantes Quantis emp´ıricos Diagrama de Caixas (Box-plot) Quantis emp´ıricos p: proporc¸a˜o, 0 ≤ p ≤ 1; q(p) (ou qX (p)): quantil de ordem p, tambe´m chamado de p-quantil; q(p) (ou qX (p)): valor para o qual 100× p% das observac¸o˜es possuem valores de X menores ou iguais a este; qX (p) e´ tal que, para 100× p% das observac¸o˜es, X ≤ qX (p); Ex.: Sala´rio da cia MB. Dizer que qSal(0.6) = 11.59 (quantil de ordem 0.6 da varia´vel Sala´rio = 11.59) significa que 60% (100× 0.6) dos funciona´rios ganham ate´ 11.59 sala´rios m´ınimos. Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2) Me´dia, mediana, desvio-padra˜o e pontos discrepantes Quantis emp´ıricos Diagrama de Caixas (Box-plot) Quantis Emp´ıricos. Ilustrac¸a˜o Figura: Quantil q(p) para um p ∈ [0, 1] Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2) Me´dia, mediana, desvio-padra˜o e pontos discrepantes Quantis emp´ıricos Diagrama de Caixas (Box-plot) Quantis Emp´ıricos. Ilustrac¸a˜o Figura: Quantil q(0.15) (15%) Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2) Me´dia, mediana, desvio-padra˜o e pontos discrepantes Quantis emp´ıricos Diagrama de Caixas (Box-plot) Quantis Emp´ıricos. Ilustrac¸a˜o Figura: Quantil q(0.68) (68%) Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2) Me´dia, mediana, desvio-padra˜o e pontos discrepantes Quantis emp´ıricos Diagrama de Caixas (Box-plot) Ca´lculo de quantis O ca´lculo de um quantil, a partir de um conjunto de informac¸o˜es, e´ obtido atrave´s de um me´todo de interpolac¸a˜o. Existem va´rios me´todos de interpolac¸a˜o para ca´lculo de quantis, um deles e´ apresentado a seguir: Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2) Me´dia, mediana, desvio-padra˜o e pontos discrepantes Quantis emp´ıricos Diagrama de Caixas (Box-plot) Ca´lculo de quantis Calculando o p-quantil qx(p). Passo 1: ordenar os valores de X : X(1) ≤ X(2) ≤ · · · ≤ X(n) Passo 2: Calcular o candidato a` posic¸a˜o (rank) do quantil no conjunto. L = (n − 1)p + 1 L∗ = parte inteira de L Passo 3: interpolac¸a˜o 1 Se L = L∗ qx(p) = X(L∗) 2 Caso contra´rio qx(p) = X(L∗) + ( X(L∗+1) − X(L∗) ) (L∗ + 1− L) Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2) Me´dia, mediana, desvio-padra˜o e pontos discrepantes Quantis emp´ıricos Diagrama de Caixas (Box-plot) Exemplo 3 Quantil de 68% (q(0.68)) da Amostra 1 2 2 3 2 1 2 5 4 Passo 1: Valores ordenados 1 2 2 2 2 3 4 5 Passo 2: Candidato a posic¸a˜o L = (8− 1)0.68 + 1 = 5.76 L∗ = 5 Passo 3: Interpolac¸a˜o. L∗ 6= L, portanto: q(0.68) = X(L∗) + ( X(L∗+1) − X(L∗) ) (L∗ + 1− L) q(0.68) = X(5) + ( X(6) − X5 ) (5 + 1− 5, 76) q(0.68) = 2 + (3− 2)(0, 24) = 2, 24 Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2) Me´dia, mediana, desvio-padra˜o e pontos discrepantes Quantis emp´ıricos Diagrama de Caixas (Box-plot) Exemplo 3 Quantil de 68% (q(0.68)) da Amostra 1 2 2 3 2 1 2 5 4 Passo 1: Valores ordenados 1 2 2 2 2 3 4 5 Passo 2: Candidato a posic¸a˜o L = (8− 1)0.68 + 1 = 5.76 L∗ = 5 Passo 3: Interpolac¸a˜o. L∗ 6= L, portanto: q(0.68) = X(L∗) + ( X(L∗+1) − X(L∗) ) (L∗ + 1− L) q(0.68) = X(5) + ( X(6) − X5 ) (5 + 1− 5, 76) q(0.68) = 2 + (3− 2)(0, 24) = 2, 24 Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2) Me´dia, mediana, desvio-padra˜o e pontos discrepantes Quantis emp´ıricos Diagrama de Caixas (Box-plot) Exemplo 3 Quantil de 68% (q(0.68)) da Amostra 1 2 2 3 2 1 2 5 4 Passo 1: Valores ordenados 1 2 2 2 2 3 4 5 Passo 2: Candidato a posic¸a˜o L = (8− 1)0.68 + 1 = 5.76 L∗ = 5Passo 3: Interpolac¸a˜o. L∗ 6= L, portanto: q(0.68) = X(L∗) + ( X(L∗+1) − X(L∗) ) (L∗ + 1− L) q(0.68) = X(5) + ( X(6) − X5 ) (5 + 1− 5, 76) q(0.68) = 2 + (3− 2)(0, 24) = 2, 24 Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2) Me´dia, mediana, desvio-padra˜o e pontos discrepantes Quantis emp´ıricos Diagrama de Caixas (Box-plot) Exemplo 3 Quantil de 68% (q(0.68)) da Amostra 1 2 2 3 2 1 2 5 4 Passo 1: Valores ordenados 1 2 2 2 2 3 4 5 Passo 2: Candidato a posic¸a˜o L = (8− 1)0.68 + 1 = 5.76 L∗ = 5 Passo 3: Interpolac¸a˜o. L∗ 6= L, portanto: q(0.68) = X(L∗) + ( X(L∗+1) − X(L∗) ) (L∗ + 1− L) q(0.68) = X(5) + ( X(6) − X5 ) (5 + 1− 5, 76) q(0.68) = 2 + (3− 2)(0, 24) = 2, 24 Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2) Me´dia, mediana, desvio-padra˜o e pontos discrepantes Quantis emp´ıricos Diagrama de Caixas (Box-plot) Alguns Quantis especiais Sa˜o definidos nomes especiais para quantis: os quartis. (100/4 = 25) os decis (100/10 = 10), os percentis (100/100 = 1), etc. q(0.25): 10 quartil = 250 percentil; q(0.5): 20 quartil = 500 percentil = 50 decil = mediana; q(0.75): 30 quartil = 750 percentil; q(0.9): 900 percentil = 90 decil; q(0.95): 950 percentil; q(0.9576): quantil de ordem 95, 76%; Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2) Me´dia, mediana, desvio-padra˜o e pontos discrepantes Quantis emp´ıricos Diagrama de Caixas (Box-plot) Quartis Primeiro quartil = q(0, 25) = q1; Segundo quartil = q(0, 5) = q2; Terceiro quartil = q(0, 75) = q3; Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2) Me´dia, mediana, desvio-padra˜o e pontos discrepantes Quantis emp´ıricos Diagrama de Caixas (Box-plot) Um me´todo mais simples para o ca´lculo de quartis Ide´ia: dividir os dados em quatro partes; q1 (quartil 1): mediana dos valores abaixo de md(x); q3 (quartil 2): mediana dos valores acima de md(x); Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2) Me´dia, mediana, desvio-padra˜o e pontos discrepantes Quantis emp´ıricos Diagrama de Caixas (Box-plot) Quartis e medida de dispersa˜o A distaˆncia interquartis, dq ou dq(X ) e´ uma medida de dispersa˜o alternativa ao desvio-padra˜o. dq = q3 − q1 amostra 1: 2 2 3 2 1 2 5 4 amostra 2: 2 2 3 2 1 2 5 4 23 Distaˆncias interquartis: dqam1 = dqam2 = Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2) Me´dia, mediana, desvio-padra˜o e pontos discrepantes Quantis emp´ıricos Diagrama de Caixas (Box-plot) Quartis e medida de dispersa˜o A distaˆncia interquartis, dq ou dq(X ) e´ uma medida de dispersa˜o alternativa ao desvio-padra˜o. dq = q3 − q1 amostra 1: 2 2 3 2 1 2 5 4 amostra 2: 2 2 3 2 1 2 5 4 23 Distaˆncias interquartis: dqam1 = 1, 5 dqam2 = 2, 5 Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2) Me´dia, mediana, desvio-padra˜o e pontos discrepantes Quantis emp´ıricos Diagrama de Caixas (Box-plot) Quartis, extremos e assimetria Extremos: X(1) e X(n) (m´ınimo e ma´ximo); Os cinco valores x(1), q1, q2, q3 e x(n) sa˜o importantes para se ter uma boa ide´ia da assimetria de distribuic¸a˜o; Para uma distribuic¸a˜o simetrica ou aproximadamente sime´trica, dever´ıamos ter: 1 q2 − x(1) ' x(n) − q2; 2 q2 − q1 ' q3 − q2; 3 q1 − x(1) ' x(n) − q3; 4 Distaˆncias entre mediana e q1, q3 menores que distaˆncias entre extremos e q1, q3; Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2) Me´dia, mediana, desvio-padra˜o e pontos discrepantes Quantis emp´ıricos Diagrama de Caixas (Box-plot) Ilustrac¸a˜o simetria Figura: Quartis e extremos em distribuic¸a˜o sime´trica Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2) Me´dia, mediana, desvio-padra˜o e pontos discrepantes Quantis emp´ıricos Diagrama de Caixas (Box-plot) Ilustrac¸a˜o assimetria Figura: Quartis e extremos em distribuic¸a˜o assime´trica Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2) Me´dia, mediana, desvio-padra˜o e pontos discrepantes Quantis emp´ıricos Diagrama de Caixas (Box-plot) 1 Me´dia, mediana, desvio-padra˜o e pontos discrepantes 2 Quantis emp´ıricos 3 Diagrama de Caixas (Box-plot) Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2) Me´dia, mediana, desvio-padra˜o e pontos discrepantes Quantis emp´ıricos Diagrama de Caixas (Box-plot) Diagrama de Caixas (Box-plot) Gra´fico simples de desenhar; Depende de poucos componentes, dependendo do caso; Componentes que auxiliam na construc¸a˜o: 1 Quartis (q1,q2 e q3); 2 Limites, inferior (LI ) e superior (LS); 3 Pontos discrepantes (outliers), caso existam; 4 Mı´nimo e ma´ximo dentre os valores que na˜o sa˜o outliers. Observac¸a˜o: LI 6= X(1) e LS 6= X(n) LI e LS sa˜o escolhidos de tal modo que, em uma distribuic¸a˜o hipoteticamente sime´trica (curva normal), 99.3% dos valores estejam entre LI e LS . Valores abaixo de LI ou acima de LS sa˜o os outliers. Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2) Me´dia, mediana, desvio-padra˜o e pontos discrepantes Quantis emp´ıricos Diagrama de Caixas (Box-plot) Diagrama de Caixas (Box-plot) l ll l l l l ll l l − 10 − 5 0 5 10 Va riá ve l X Figura: Exemplo de box-plot Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2) Me´dia, mediana, desvio-padra˜o e pontos discrepantes Quantis emp´ıricos Diagrama de Caixas (Box-plot) Componentes do Box-Plot l − 10 − 5 0 5 10 Va riá ve l X Menor valor de X não inferior a LI q1 q2 q3 Maior valor de X nao superior a LS } Outliers } Outliers Limite superior (LS) Limite inferior (LI) l ll l l l l ll l l − 10 − 5 0 5 10 Figura: Componentes do box-plot Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2) Me´dia, mediana, desvio-padra˜o e pontos discrepantes Quantis emp´ıricos Diagrama de Caixas (Box-plot) Componentes LS e LI Observac¸o˜es: 1 Os topos das arestas que saem da caixa nao sa˜o os limites LI e LS ; 2 LI e LS nao sa˜o representados no box-plot, apenas servem para definir os outliers; 3 Os topos das arestas que saem da caixa sa˜o os valores de X mais extremos que na˜o ultrapassem LI e LS (ou seja, sa˜o o m´ınimo e o ma´ximo dos valores de X que nao sa˜o outliers); Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2) Me´dia, mediana, desvio-padra˜o e pontos discrepantes Quantis emp´ıricos Diagrama de Caixas (Box-plot) Box-Plot e assimetrias Figura: Box-Plot em distribuic¸o˜es assime´tricas Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2) Me´dia, mediana, desvio-padra˜o e pontos discrepantes Quantis emp´ıricos Diagrama de Caixas (Box-plot) Ex.: Sala´rios da cia MB Figura: Box-Plot da varia´vel Sala´rios, cia MB Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2) Média, mediana, desvio-padrão e pontos discrepantes Quantis empíricos Diagrama de Caixas (Box-plot)
Compartilhar