Baixe o app para aproveitar ainda mais
Prévia do material em texto
Separatrizes Mediana - Quartis - Decis - Percentis Moda Médias Aritmética (Simples e Ponderada) MEDIDAS DE POSIÇÃO: (ou de tendência central) MEDIDAS DE DISPERSÃO: Amplitude Intervalo interquartil Variância Desvio Padrão Coeficiente de Variação MEDIDAS DESCRITIVAS variável quantitativa discreta contínua Média Amplitude Interv. interquartil Variância Desvio Padrão Coef. de Variação Separatrizes variável quantitativa discreta contínua variável qualitativa ordinal Moda variável qualitativa e quantitativa MEDIDAS DESCRITIVAS PARÂMETRO medida descritiva de uma característica da população ESTATÍSTICA medida descritiva de uma característica da amostra inferência 2 Amostra n amostragem População N ssx 2 N k n kp ˆ Média Aritmética simples amostrazywx população N X N i i 1 Kg 4,39...3806,39 36 0,47...7,342,36 y n X X n i i 1 n Y Y n i i 1 Medida mais utilizada para descrever resumidamente um conjunto de dados Muito influenciada por valores discrepantes Peso YPeso (Kg) de RSU recicláveis (amostra) Kg 1,51...1306,51 36 470...7,342,36 y 31,0 34,7 35,7 37,8 39,1 39,7 40,3 43,7 46,9 31,6 34,9 35,7 38,1 39,1 40,0 41,4 43,9 47,0 32,3 35,4 36,2 38,3 39,4 40,1 41,9 44,8 48,2 32,7 35,7 36,3 39,0 39,5 40,1 42,2 45,8 49,2 Peso (Y) de resíduos sólidos urbanos (RSU) recicláveis, em quilos, recolhidos em uma amostra de 36 pontos de coleta 36,2 41,4 32,3 35,7 32,7 40,1 36,3 34,9 39,5 34,7 42,2 41,9 31,6 43,9 45,8 39,1 39,7 37,8 39,4 46,9 35,7 38,1 48,2 49,2 40,3 35,4 31,0 43,7 44,8 40,0 39,0 40,1 39,1 35,7 38,3 47,0 Média Aritmética ponderada Distribuição por ponto k i i k i ii f fx x 1 1 em que: xi é o i-ésimo valor da variável fi é a frequência absoluta do i-ésimo valor da variável sdefeituosa peças675,5 2...31 )28(...)34()13( x Dados agrupados Xi fi fr fr% 3 1 2,500,0250 4 3 7,500,0750 5 9 22,500,2250 6 21 52,500,5250 7 4 10,000,1000 8 2 1,0000Total 40 100,00 5,000,0500 Tabela de frequência Nº de peças defeituosas encontradas em 40 lotes de 50 peças Distribuição por classe k i i k i ii f fx x 1 1 em que: xi é o ponto médio da classe i fi é a frequência absoluta da classe i Kg 5,39 1...84 )15,50(...)45,32( y Média Aritmética ponderada Tabela de frequência para dados agrupados em classes (distribuição de frequências) Y f Ponto médio 31,0 34,0 4 32,5 34,0 37,0 8 35,5 37,0 40,0 9 38,5 40,0 43,0 7 41,5 43,0 46,0 4 44,5 46,0 49,0 3 47,5 49,0 52,0 1 50,5 Total 36 - Peso (Kg) de RSU recicláveis Dados agrupados Separatrizes Mediana - Quartis - Decis - Percentis Dividem os dados ordenados (rol) em partes iguais 0% 25% 50% 75% 100% |--------------------|--------------------|--------------------|--------------------| Q1= P25 Q2 = Md = D5 = P50 Q3 = P75 O percentil de ordem p 100 (0 < p < 1), em um conjunto de dados com n elementos, é o valor da variável na posição p (n + 1) do rol mediana (Md ) ou segundo quartil (Q2) = percentil 50 primeiro quartil (Q1) = percentil 25 terceiro quartil (Q3) = percentil 75 primeiro decil (D1) = percentil 10 Y (m): 3,4 2,1 3,7 2,5 3,0 1,9 3,3 6,3 1,9 7,7 n = 10 Posição de Md: 0,50(n+1)= 0,511= 5,5º Posição de Q1: 0,25 (11) = 2,75º Posição de Q3: 0,75 (11) = 8,25º Md = 3,0 + 0,5(3,3 - 3,0) = 3,15 3,2 m Q1= 1,9 + 0,75 (2,1- 1,9) = 1,9 + 0,15 = 2,05 m Q3= 3,7 + 0,25 (6,3- 3,7) = 3,7 + 0,65 = 4,35 4,4 m Posição de P87: 0,87 (11) = 9,57º P87 = 6,3 + 0,57 (7,7 - 6,3) = 6,3 + 0,798 = 7,098 7,1 m n = 11W (mg): 5,5 0,9 1,7 3,1 33,6 5,3 5,2 5,9 1,0 2,9 3,5 Posição: p (n + 1) do rol Obter: Md Q1 Q3 P87 Md 3,2 m Q1 = 2,05 m Q3 4,4 m Exercício: P87 7,1 m Dados ordenados: 1,9 1,9 2,1 2,5 3,0 3,3 3,4 3,7 6,3 7,7 1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª 9ª 10ª Obter: Média, Q1, Md e Q3 W (rol): 0,9 1,0 1,7 2,9 3,1 3,5 5,2 5,3 5,5 5,9 33,6 O percentil de ordem p 100 (0 < p < 1), em um conjunto de dados com n elementos, é o valor da variável na posição p (n + 1) do rol W (mg): 5,5 0,9 1,7 3,1 33,6 5,3 5,2 5,9 1,0 2,9 3,5 n = 11Obter: Média, Q1, Md e Q3 w Posição de Q1: 0,25 (12) = 3º Posição de Q3 : 0,75 (12) = 9º Q1= 1,7 mg Posição de Md: 0,50 (12) = 6º Md = 3,5 mg Q3= 5,5 mg 3,6 mgw ,53 W (rol): 0,9 1,0 1,7 2,9 3,1 3,5 3,6 5,2 5,3 5,5 5,9 Q3 = 5,3 mg mg 2,6w Md = 3,5 mg Q1 = 1,7 mg Ramos Folhas 1 3 0 2 4 5 33 . . . 7, 0 1, 5 9 9 - 5, 3, 2, 9 6 mg 2,6...23636,6 11 5,3...9,05,5 Média Q1, Md e Q3 (amostra) mg ,509...3w Obter Q1, Md e Q3 da amostra do peso de RSU recicláveis Posição de Md: 0,5(36 +1) = 0,5 37= 18,5° Md = 39,1 + 0,5 (39,4 – 39,1) = 39,25 39,3 Kg Posição de Q1: 0,25 (37) = 9,25° Posição de Q3: 0,75 (37) = 27,75° Q1 = 35,7 + 0,25 (35,7 - 35,7) = 35,7 Kg Q3 = 41,9 + 0,75 (42,2 - 41,9) = 41,9 + 0,225 Q3 = 42,125 42,1 Kg - 6 0 3 7 - 9 7 7 7 4 3 8 1 3 0 1 1 7 5 0 1 1 3 4 9 2 7 9 8 8 9 0 2 2 Ramos Folhas 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 7 2 4 31,0 34,7 35,7 37,8 39,1 39,7 40,3 43,7 46,9 31,6 34,9 35,7 38,1 39,1 40,0 41,4 43,9 47,0 32,3 35,4 36,2 38,3 39,4 40,1 41,9 44,8 48,2 32,7 35,7 36,3 39,0 39,5 40,1 42,2 45,8 49,2 Peso (Y) de resíduos sólidos urbanos (RSU) recicláveis, em quilos, recolhidos em uma amostra de 36 pontos de coleta 36,2 41,4 32,3 35,7 32,7 40,1 36,3 34,9 39,5 34,7 42,2 41,9 31,6 43,9 45,8 39,1 39,7 37,8 39,4 46,9 35,7 38,1 48,2 49,2 40,3 35,4 31,0 43,7 44,8 40,0 39,0 40,1 39,1 35,7 38,3 47,0 5 3 6 6 4 5 5 7 6 5 6 6 8 6 5 4 6 6 6 5 6 8 6 5 6 6 6 6 5 6 7 5 6 6 7 4 6 6 7 6 3 4 4 4 5 5 5 5 5 5 5 5 5 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 7 7 7 7 8 8 Xi fi fr fr% 3 1 2,500,0250 4 3 7,500,0750 5 9 22,500,2250 6 21 52,500,5250 7 4 10,000,1000 8 2 1,0000Total 40 100,00 5,000,0500 Número de peças defeituosas (X) encontradas em uma amostra de 40 lotes de 50 peças Posição de Md: Md = 6 + 0,5(6 - 6) = 6 peças 0,50(40+1)= 0,541= 20,5º Separatrizes (Sp) Mediana - Quartis - Decis - Percentis Dados agrupados Sp Sp ant Spp a f fnp lS )( fSp é a frequência da classe separatriz aSp é a amplitude da classe separatriz em que: lSp é o limite inferior da classe separatriz Classe separatriz: classe com valor da variável na posição p.n (0 < p < 1) antf é a soma das frequências anteriores a classe separatriz (distribuição de frequências) Y f Fd 31,0 34,0 4 4 34,0 37,0 8 12 37,0 40,0 9 21 40,0 43,0 7 28 43,0 46,0 4 32 46,0 49,0 3 35 49,0 52,0 1 36 Total 36 - Sp Sp ant Spp a f fnp lS )( Classe separatriz: Md p = 0,50 classe com valor da variável na posição (0,50 . 36) = 18º Obter: Md Classe Mediana: 3ª classe KgMd 0,390,3 9 1218 0,37 Y: Peso (Kg) de RSU recicláveis (amostra) p.n = 18 12 antf0,37Mdl 9Mdf 0,3Mda Y f Fd 31,0 34,0 4 4 34,0 37,0 8 12 37,0 40,0 9 21 40,0 43,0 7 28 43,0 46,0 4 32 46,0 49,0 3 35 49,0 52,0 1 36 Total 36 - Sp Sp ant Spp a f fnp lS )( Classe separatriz: Q3 p = 0,75 classe com valor da variável na posição (0,75 . 36) = 27º Obter: Q3 Q1 P40 Classe 3º Quartil: 4ª classe KgQ 6,42...571,420,3 7 2127 0,403 Y: Peso (Kg) de RSU recicláveis (amostra) Q1 = 35,875 35,9 Kg P40 = 37,8 Kg p.n = 27 21 antf0,40 3 Ql 73 Qf 0,33 Qa Moda Valor (ou atributo) com maior ocorrênciaY (m): 3,4 2,1 3,7 2,5 3,0 1,9 3,3 6,3 1,9 7,7 )(Mo Mo = 1,9 m unimodal W (mg): 5,5 0,9 1,7 3,1 33,6 5,3 5,2 5,9 1,0 2,9 3,5 amodal Z (mg): 5,5 0,9 1,7 3,1 33,6 5,3 5,2 5,9 1,7 0,9 3,5 bimodal Mais de duas modas multimodal Mo = 0,9 mg Mo = 1,7 mge T (pontos): 5,0 5,0 5,0 5,0 5,0 5,0 5,0 5,0 amodal X (mg): 5,5 0,9 1,7 3,1 33,6 5,3 5,2 5,9 1,7 0,9 1,7 unimodalMo = 1,7 mg Satisfação dos usuários quanto aos serviços prestados por um laboratório Mo = Bom unimodal Número de peças defeituosas encontradas em 40 lotes de 50 peças Mo = 6 peças defeituosas unimodal Moda )(Mo Classe modal = classe maior frequência lMo é o limite inferior da classe modal aMo é a amplitude da classe modal antMo ff 1 2 postMo ff 21 1 MoMo a lMo em que: Dados agrupados Mo = 35,7 Kg unimodalPeso (Kg) de RSU recicláveis (amostra) 31,0 34,7 35,7 37,8 39,1 39,7 40,3 43,7 46,9 31,6 34,9 35,7 38,1 39,1 40,0 41,4 43,9 47,0 32,3 35,4 36,2 38,3 39,4 40,1 41,9 44,8 48,2 32,7 35,7 36,3 39,0 39,5 40,1 42,2 45,8 49,2 Peso (Kg) de RSU recicláveis (amostra) Xi fi fr fr% 3 1 2,500,0250 4 3 7,500,0750 5 9 22,500,2250 6 21 52,500,5250 7 4 10,000,1000 8 2 1,0000Total 40 100,00 5,000,0500 Nº de peças defeituosas encontradas em 40 lotes de 50 peças Satisfação Frequência absoluta (f) Freq. Relativa (fr) Freq. Relativa Porcentual (%) (fr %) Péssimo 2 0,0416 4,16 Regular 5 0,1042 10,42 Bom 26 0,5417 54,17 Ótimo 15 0,3125 31,25 Total 48 1,0000 100,00 Satisfação dos usuários quanto aos serviços prestados por um laboratório de análise de água Y f 31,0 34,0 4 34,0 37,0 8 37,0 40,0 9 40,0 43,0 7 43,0 46,0 4 46,0 49,0 3 49,0 52,0 1 Total 36 Y: Peso (Kg) de RSU recicláveis (amostra) 21 1 MoMo a lMo lMo = 37,0 aMo = 3,0 1891 antMo ff 279 2 postMo ff Kg a lMo MoMo 0,38 21 )0,31( 0,37 21 1 Classe modal = 3ª classe MEDIDAS DE DISPERSÃO: Amplitude Intervalo interquartil Variância Desvio Padrão Coeficiente de Variação Finalidade: resumir a variabilidade de um conjunto de dados por meio de um determinado valor (várias observações de um fenômeno não produzem o mesmo resultado) MEDIDAS DE DISPERSÃO Amplitude (A) A = maior - menor Considera somente os valores extremos do conjunto Peso (Kg) de RSU recicláveis (amostra) A = 49,2 – 31,0 = 18,2 Kg Iq = 42,1 – 35,7 = 6,4 Kg Intervalo interquartil (Iq ) Iq = Q3 - Q1 Posição de Md: 0,5(36 +1) = 0,5 37= 18,5° Md = 39,1 + 0,5 (39,4 – 39,1) = 39,25 Kg Posição de Q1: 0,25 (37) = 9,25° Posição de Q3: 0,75 (37) = 27,75° Q1 = 35,7 + 0,25 (35,7 - 35,7) = 35,70 Kg Q3 = 41,9 + 0,75 (42,2 - 41,9) = 41,9 + 0,225 Q3 = 42,125 Kg Peso de RSU (Kg) de uma amostra de 36 pontos de coleta Folhas - 6 0 3 7 - 9 7 7 7 4 3 8 1 3 0 1 1 7 5 0 1 1 3 4 9 2 7 9 8 8 9 0 2 2 Ramos 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 7 2 4 31,0 34,7 35,7 37,8 39,1 39,7 40,3 43,7 46,9 31,6 34,9 35,7 38,1 39,1 40,0 41,4 43,9 47,0 32,3 35,4 36,2 38,3 39,4 40,1 41,9 44,8 48,2 32,7 35,7 36,3 39,0 39,5 40,1 42,2 45,8 49,2 Q3 Q1 1,5 Iq 1,5 Iq Variável GRÁFICO DE CAIXA (BOX-PLOT) - Observações Discrepantes LI LI = Q1 - 1,5(Q3 - Q1) LS LS = Q3 + 1,5(Q3 - Q1) Iq Iq = (Q3 - Q1) * * * * = Observações discrepantes (outliers) Md Mín Máx V a lo re s d a v a ri á v e l Iq Iq= Q3 - Q1 = (42,125 – 35,7) = 6,425 Observações Discrepantes Q1 = 35,7 Q3 = 42,125 0 20 40 60 Q3 Q1 Peso (Kg) Não possui observações discrepantes (outliers) 49,2 Md = 39,25 Mín = 31,0 Kg Máx = 49,2 Kg LS = Q3 + 1,5(Q3 - Q1) = 42,125 + 9,6375 = 51,7625 1,5 Iq 51,8 LI = Q1 - 1,5(Q3 - Q1) = 35,7 – 9,6375 = 26,0625 1,5 Iq 26,1 31,0 Fonte: Dados da pesquisa (2020). Gráfico 12 - Peso (Kg) de resíduos sólidos urbanos (RSU) recicláveis 3 0 3 5 4 0 4 5 5 0 Peso(Kg) — mediana = 39,3 25%-75% = (35,7 ; 42,1) Mín-Máx = (31,0 ; 49,2) 0,9 W (mg): 5,5 0,9 1,7 3,1 33,6 5,3 5,2 5,9 1,0 2,9 3,5 Posição de Q1: 0,25 (12) = 3° Q1= 1,7 mg Posição de Md: 0,50 (12) = 6° Md = 3,5 mg Posição de Q3 : 0,75 (12) = 9° Q3= 5,5 mg Rol W (mg): 0,9 1,0 1,7 2,9 3,1 3,5 5,2 5,3 5,5 5,9 33,6 1,5 Iq LS = Q3 + 1,5(Q3 - Q1) = 5,5 + 5,7 = 11,2 LI = Q1 - 1,5(Q3 - Q1) = 1,7 – 5,7 = -4,0 * 33,6 observação discrepante n= 11 5,9 Iq Iq= Q3 - Q1 = (5,5 – 1,7) = 3,8 Peso (mg) 0 10 20 30 Q1 Q3 * Mediana = 3,5 25%-75% = (1,7 ; 5,5) Mín-Máx = (0,9 ; 5,9) * = 33,6 Gráfico 13 - Peso (mg) de ......... Fonte: Dados da pesquisa (2020). 0 10 20 30 Peso (mg) Discrepante Variância Populacional população2 MEDIDAS DE DISPERSÃO N N x x N x xxxx N x N i i N i ii N i 2 2 2 2 2 1 2 1 22 1 2 2 ...)2( Variância populacional (2): soma dos quadrados dos desvios em relação à média dividida pelo número de observações N Variância Amostral amostras 2 MEDIDAS DE DISPERSÃO Variância amostral (s2): soma dos quadrados dos desvios em relação à média dividida pelo número de observações menos um (n-1) O denominador (n - 1) fornece uma estimativa imparcial para a variância populacional, calculada a partir de uma amostra 1 ...)2( 1 2 2 2 2 2 1 2 1 22 1 2 2 n n x x s n x xxxxxxx n xx s n i i n i ii n i i Desvio padrão MEDIDAS DE DISPERSÃO amostras população VariânciaPadrãoDesvio Desvio padrão Populacional N N x x N x N i i 2 2 1 2 Desvio padrão Amostral 11 2 2 1 2 n n x x n xx s n i i O desvio padrão possui a mesma unidade dos dados A = (33,6 – 0,9) = 32,7 mg Q3 - Q1 = (5,5 – 1,7) = 3,8 mg g 3,9...2536,9 ms 222 g 6,85...6305,85...2563,9 ms A = (5,9 – 0,9) = 5,0 mg Q3 - Q1 = (5,3 – 1,7) = 3,6 mg g 8,1...807,1 ms 222 g 3,3...2669,3...807,1 ms Obter: Desvio padrão, Variância, Amplitude e o Intervalo interquartil (amostra) W1 (mg): 5,5 0,9 1,7 3,1 33,6 5,3 5,2 5,9 1,0 2,9 3,5 W2 (mg): 5,5 0,9 1,7 3,1 3,6 5,3 5,2 5,9 1,0 2,9 3,5 (amostra) Peso de uma amostra de 36 pontos (n=36) de coleta de RSU (Kg) Kgs 7,4...6856,4 Desvio padrão Variância 2 22 0,22...9553,21...6856,4 Kgs Peso de todos (população N=36) os pontos de coleta de RSU (Kg) Kg 6,4...6201,4 Desvio padrão Variância 2 22 3,21...3454,21...6201,4 Kg g 3,9...2536,9 ms 222 g 6,85...6305,85...2563,9 ms g 8,8...8230,8 m 222 g 8,77...8459,77...8230,8 m (amostra) (população) W1 (mg): 5,5 0,9 1,7 3,1 33,6 5,3 5,2 5,9 1,0 2,9 3,5 W1 (mg): 5,5 0,9 1,7 3,1 33,6 5,3 5,2 5,9 1,0 2,9 3,5 - medida de dispersão relativa - exprime a variabilidade em relação à média - elimina o efeito da magnitude dos dados (%) . x 100 Média padrãoD CV Coeficiente de variação MEDIDAS DE DISPERSÃO CV Média 100,00 % D. padrão CV % W1 (mg): 5,5 0,9 1,7 3,1 33,6 5,3 5,2 5,9 1,0 2,9 3,5 g 3,9...2536,91 ms W2 (mg): 5,5 0,9 1,7 3,1 3,6 5,3 5,2 5,9 1,0 2,9 3,5 g 8,1...807,1 ms mg,...,w 262363661 %38,148...382,148 ...23,6 ...25,9 x 100 mg,w 53 ,509...32 %51,51...507,51 ...509,3 ...807,1 x 100 1W CV 2W CV 1 - Obter a média, 1º quartil, mediana, 3º quartil, o percentil 82 e a moda. 2 - Obter o intervalo interquartil, desvio padrão, variância e o coeficiente de variação. 3 - Obter o gráfico de caixa (box-plot). 95 108 108 102 105104 115 96 100 97 107 102 87 114 90 96 104 102 116 116 101 106 105 104 99 118 99 106 109 105 111 Os dados abaixo representam o peso (W), em gramas, de uma amostra de peças produzidas por uma máquina. Desvio padrão Dados agrupados Distribuição por ponto em que: xi é o i-ésimo valor da variável e fi é a frequência absoluta do i-ésimo valor da variável defeituosa peça 1...006,1 2 12...31 2...31 )28(...)13( )228(...)123( s Desvio padrão Populacional Desvio padrão Amostral N xf f f fx fx k i ii k i i k i k i i k i ii ii 1 2 1 1 1 2 12 )( 1 )( 1 1 2 1 1 1 2 12 n xxf f f fx fx s k i ii k i i k i k i i k i ii ii Distribuição por classe em que: xi é o ponto médio da classe i e fi é a frequência absoluta da classe i Kg7,4...7025,4 11...84 2 1...84 )15,50(...)45,32( )125,50(...)425,32( s Desvio padrão N xf f f fx fx k i ii k i i k i k i i k i ii ii 1 2 1 1 1 2 12 )( Desvio padrão Populacional Desvio padrão Amostral Dados agrupados 1 )( 1 1 2 1 1 1 2 12 n xxf f f fx fx s k i ii k i i k i k i i k i ii ii Xi fi fr fr% 3 1 2,500,0250 4 3 7,500,0750 5 9 22,500,2250 6 21 52,500,5250 7 4 10,000,1000 8 2 1,0000Total 40 100,00 5,000,0500 Nº de peças defeituosas encontradas em 40 amostras de lotes de 50 peças Tabela de frequência para dados agrupados em classes (distribuição de frequências) Y f Ponto médio 31,0 34,0 4 32,5 34,0 37,0 8 35,5 37,0 40,0 9 38,5 40,0 43,0 7 41,5 43,0 46,0 4 44,5 46,0 49,0 3 47,5 49,0 52,0 1 50,5 Total 36 - Peso (Kg) de RSU recicláveis (amostra) Quando a média, mediana e moda são iguais Distribuição Simetria oM dM simétrica oMdM assimétrica à direita ou assimétrica positiva oM dM oMdM assimétrica à esquerda ou assimétrica negativa oMdM oMdM 3 - Comparando a média, mediana e moda, comentar sobre a simetria ou assimetria dos dados. 1 - Obter: média, 1º quartil, mediana, 3º quartil e a moda. 2 - Obter: desvio padrão, variância e o coeficiente de variação. W f 87 92 2 92 97 3 97 102 5 102 107 11 107 112 5 112 117 4 117 122 1 Total 31 Os dados abaixo representam o peso (W), em gramas, de uma amostra de peças produzidas por uma máquina.
Compartilhar