Baixe o app para aproveitar ainda mais
Prévia do material em texto
Universidade Federal de Uberlândia Faculdade de Engenharia Química Prof.ª: Camila Silveira Lamanes dos Santos. Uberlândia-MG 31 de março de 2016 07 de abril de 2016 Medidas de Posição e Medidas de Dispersão Medidas de Posição • Medidas de posição são também chamadas de medidas de tendência central; • Forma mais sintética de apresentar os resultados contidos nos dados observados; • Representam um valor central, em torno do qual os dados se concentram; • Objetivo: Encontrar um único valor, em um conjunto de valores observados, que seja representante desse conjunto; • Média, mediana e moda → medidas de posição mais comuns . G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 2 Média Aritmética • A média aritmética é uma medida de posição que procura sintetizar um conjunto de observações; • É muito utilizada por: o Apresentar facilidade de cálculo e de interpretação; o adaptar-se bem à tratamentos algébricos; o ser um estimador que produz estimativas sem tendência, consistente, suficiente e geralmente, com boa precisão. • Em distribuições assimétricas, não é considerada a melhor medida de posição. • Simbologia: 𝜇 = 𝑚é𝑑𝑖𝑎 𝑝𝑜𝑝𝑢𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙 𝑥 = 𝑚é𝑑𝑖𝑎 𝑎𝑚𝑜𝑠𝑡𝑟𝑎𝑙 G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 3 Média Aritmética • Dados não agrupados (sem tabelas de distribuição de frequências) 𝑥 = 𝑥𝑖 𝑛 𝑖=1 𝑛 • Dados agrupados (em tabelas de distribuição de frequências): 𝑥 = 𝑥𝑖 . 𝑓𝑖 𝑘 𝑖=1 𝑛 , onde 𝑥𝑖 é 𝑜 𝑝𝑜𝑛𝑡𝑜 𝑚é𝑑𝑖𝑜 𝑑𝑎 𝑐𝑙𝑎𝑠𝑠𝑒 𝑖 o Obs: Se não existir intervalo na classe, 𝒙𝒊 é o valor da classe. o Hipótese Tabular Básica (H.T.B): os dados contidos em uma determinada classe são representados pelo ponto médio da classe. G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 4 Exemplos 1. O número de peças defeituosas observado em amostras retiradas diariamente da linha de produção de uma indústria, durante uma semana, foi: 10 14 13 15 16 18 12 Calcular o número médio de peças defeituosas por dia desta semana avaliada. G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 5 Exemplos Solução i. Dados não estão agrupados em tabelas de distribuição de frequências; ii. n=7; 𝑥 = 𝑥𝑖 𝑛 𝑖=1 𝑛 = 10 + 14 + 13 + 15 + 16 + 18 + 12 7 = 98 7 = 14 𝑝𝑒ç𝑎𝑠 Conclusão: Espera-se que o número médio de peças defeituosas dessa indústria seja de 14 peças por dia, podendo variar para mais ou para menos. G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 6 Exemplos 2. Considere os números de gols por partida em um determinado campeonato de futebol, agrupados e apresentados na sequência. Calcule o número médio de gols por partida. G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 7 Nº de gols por partida fi 0 7 1 12 2 16 3 12 4 9 5 4 Total 60 Tabela 1: Distribuição de frequências do nº de gols por partida. Exemplos Solução i. Os dados estão organizados em uma distribuição de frequências; ii. n=60 𝑥 = 𝑥𝑖 . 𝑓𝑖 𝑘 𝑖=1 𝑛 = 0𝑥7 + 1𝑥12 + 2𝑥16 + 3𝑥12 + 4𝑥9 + 5𝑥4 60 = 136 60 = 2,30 𝑔𝑜𝑙𝑠 Conclusão: Pode-se dizer que o número médio de gols é de aproximadamente 2 por partida, podendo existir jogos com mais de 2 gols e outros com menos de 2 gols. G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 8 Exemplos 3. Para a distribuição de frequências que representa a força de ruptura em libras por polegada quadrada (psi) das garrafas descartáveis de um litro de refrigerante, calcular a média. G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 9 Classes fi 86 |-----147 1 147|-----208 6 208|-----269 13 269|-----330 8 330|-----390 2 Total 30 Tabela 2: Distribuição de frequências da força de ruptura das garrafas descartáveis. Exemplos Solução i. Os dados estão organizados em uma distribuição de frequências com intervalos de classe → Calcular o ponto médio de cada classe; ii. n=30; G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 10 Classes fi 𝒙𝒊 86 |-----147 1 116,5 147|-----208 6 177,5 208|-----269 13 238,5 269|-----330 8 299,5 330|-----391 2 360,5 Total 30 Exemplos 𝑥 = 𝑥𝑖 . 𝑓𝑖 𝑘 𝑖=1 𝑛 = 1𝑥116,5 + 6𝑥177,5 + 13𝑥238,5 + 8𝑥299,5 + 2𝑥360,5 30 = 7399 30 = 246,63 𝑝𝑠𝑖 Conclusão: Espera-se que a força média de ruptura das garrafas descartáveis seja em torno de 246,63 psi, podendo variar um pouco para mais ou para menos. G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 11 Propriedades da média aritmética 1) A soma dos desvios (SD) de um conjunto de dados em relação à sua média é nula. 𝑆𝐷 = 𝑥𝑖 − 𝑥 = 𝑥𝑖 − 𝑛. 𝑥 = 𝑥𝑖 − 𝑛. 𝑥𝑖 𝑛 𝑖=1 𝑛 = 0 𝑛 𝑖=1 𝑛 𝑖=1 𝑛 𝑖=1 2) A soma dos quadrados dos desvios de um conjunto de dados em relação a uma constante z é mínima se e somente se 𝑧 = 𝑥 . 𝑆𝐷 = (𝑥𝑖 − 𝑧) 𝑛 𝑖=1 ² G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 12 𝒅(𝑺𝑫) 𝒅𝒛 = 𝟎→ Condição de mínimo −2. 𝑥𝑖 + 2. 𝑧 = 0 ÷ 2 𝑛 𝑖=1 𝑛 𝑖=1 𝑧 = 𝑥𝑖 𝑛 𝑖=1 𝑛 𝑖=1 𝑛. 𝑧 = 𝑥𝑖 𝑛 𝑖=1 𝑧 = 𝑥𝑖 𝑛 𝑖=1 𝑛 = 𝑥 G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 13 Propriedades da média aritmética 3) Somando ou subtraindo uma constante z a cada valor observado, a média do novo conjunto de dados ficará somada ou subtraída da constante z, em relação à média inicial. Exemplo: 1 3 5 7 9 → 𝑥 = 5; Somar 2 (z=2): 3 5 7 9 11 → 𝑦 = 7 → 𝑦 = 𝑥 + 𝑧 G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 14 Propriedades da média aritmética Propriedades da média aritmética 4) Multiplicando-se ou dividindo-se cada valor observado por uma constante z, a nova média ficará multiplicada ou dividida por z. Exemplo: G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 15 1 3 5 7 9 → 𝑥 = 5; Multiplicar por 3 (z=3): 3 9 15 21 27 → 𝑦 = 15 → 𝑦 = 𝑥 . 𝑧 Mediana (Md) • Realização (valor) que ocupa a posição central de um conjunto de dados ordenados (rol), ou seja, abaixo da mediana deverão estar 50% dos elementos analisados e acima da mediana deverão estar 50% dos dados analisados. Dados não agrupados: o Número de dados ímpar: mediana igual ao valor central. 𝑀𝑑 = 𝑥 ( 𝑛+1 2 ) o Número de dados par: a mediana será dada pela média aritmética entre os dois valores centrais. 𝑀𝑑 = 𝑥 𝑛 2 + 𝑥 ( 𝑛+2 2 )2 Importante!!!! As fórmulas acima podem ser utilizadas para variáveis discretas em distribuições de frequências sem intervalo (caso 2). G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 16 Exemplos 4. Os preços em reais para cada amostra de aparelho de ar condicionado são: 1500 1840 1470 1480 1420 1440 1440 Calcular a mediana. Solução: i. Ordenar os dados: 1420 1440 1440 1470 1480 1500 1840 ii. n=7 → mediana dada pelo valor central Logo, 𝑀𝑑 = 𝑥 𝑛+1 2 = 𝑥 ( 8 2) = 𝑥4 = 1470 Conclusão: Pode-se afirmar que 50% dos aparelhos de ar condicionado têm preços abaixo de 1470 reais e os outros 50% tem preços acima desse valor. G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 17 Exemplos 5. O peso de mancais produzidos por um processo de fundição está sendo estudado. Uma amostra de seis mancais foi medida, resultando nos seguintes pesos em libras: 1,18 1,21 1,19 1,17 1,20 1,21 Obtenha a mediana. Solução: i. Ordenar os dados em rol: 1,17 1,18 1,19 1,20 1,21 1,21 ii. n=6 → amostra com tamanho par Logo, 𝑀𝑑 = 𝑥 𝑛 2 + 𝑥 ( 𝑛+2 2 ) 2 = 𝑥3 + 𝑥4 2 = 1,19 + 1,20 2 = 1,195 𝑙𝑖𝑏𝑟𝑎𝑠 Conclusão: Tem-se que 50% dos mancais têm pesos abaixo de 1,195 libras e 50% deles têm peso acima desse valor. G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 18 Mediana (Md) Dados agrupados (tabelas de distribuições de frequências com intervalos de classes): 𝑀𝑑 = 𝐿𝐼 + 0,5. 𝑛 − 𝐹𝑖 𝑓𝑀𝑑 . 𝐶 Onde: LI=limite inferior da classe mediana; Fi= frequência acumulada das classes anteriores a classe mediana; fMd= frequência da classe mediana C= amplitude da classe mediana n= número de observações (tamanho da amostra) Classe mediana: classe onde se encontra o indivíduo mediano. G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 19 Opção alternativa usar o ponto médio da classe mediana (Hipótese Tabular Básica) Exemplos 6. Considere os números de gols por partida em um determinado campeonato de futebol, agrupados e apresentados na sequência. Calcule a mediana desses valores. G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 20 Nº de gols por partida fi 0 7 1 12 2 16 3 12 4 9 5 4 Total 60 Tabela 1: Distribuição de frequências do nº de gols por partida. Exemplos Solução: i. n=60 → tamanho da amostra par 𝑀𝑑 = 𝑥 𝑛 2 + 𝑥 ( 𝑛+2 2 ) 2 = 𝑥30 + 𝑥31 2 = 2 + 2 2 = 2 𝑔𝑜𝑙𝑠 Conclusão: Pode-se afirmar que em 50% das partidas realizadas tiveram menos que 2 gols e as outras 50% mais que 2 gols. G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 21 Exemplos 7. Suponha que a renda familiar em salários mínimos de uma amostra com 72 trabalhadores pudesse ser representada segundo a tabela: Calcular a mediana. G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 22 Classe fi 1 |-----2 13 2 |-----4 22 4 |-----6 18 6 |-----8 7 8 |-----10 8 10|-----12 4 Total 72 Tabela 3: Distribuição de frequências da renda familiar em salários mínimos. Exemplos Solução i. n=72 (número de dados par) ii. Para encontrar a classe mediana: deve-se identificar em quais posições estão os dois elementos centrais: 𝑥 ( 𝑛 2) = 𝑥36 𝑥 ( 𝑛+2 2 ) = 𝑥37 De acordo a distribuição de frequências, os números que ocupam essas posições estão na 3ª classe. Logo, a classe mediana será 4|-----6. Portanto: 𝑀𝑑 = 4 + 0,5.72 − 35 18 2 = 4,11 salários mínimos G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 23 Moda (Mo) • É o valor que ocorre com maior frequência entre os valores observados; • Em um conjunto de dados pode existir mais de uma moda ou nenhum valor modal. Dados não agrupados: é o valor que aparece repetido mais vezes (D.F caso 2-variáveis discretas sem intervalos de classe). Dados agrupados (tabelas de distribuição de frequências): 𝑀𝑜 = 𝐿𝐼 + Δ1 Δ1 + Δ2 . 𝐶 Onde: LI= limite inferior da classe modal ∆1= diferença entre a frequência da classe modal e a frequência da classe imediatamente inferior ∆2=diferença entre a frequência da classe modal e a frequência da classe posterior; C=amplitude da classe modal Classe modal é a classe de maior frequência G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 24 Opção alternativa usar o ponto médio da classe modal (Hipótese Tabular Básica) Exemplos 8. Determine a moda para os seguintes conjuntos de dados: a. 150, 155, 157, 160, 160, 163, 165, 165, 170 Resposta: Mo= 160 e Mo= 165 (repetiu duas vezes cada) b. 10, 12, 14, 15, 16, 19, 21 Resposta: Não existe moda (nenhum número se repetiu). G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 25 Exemplos 9. Considere os dados amostrais do número de circuitos defeituosos em um sistema composto por 4 circuitos. Uma amostra de 19 sistemas foi coletada, obtendo os seguintes dados: Determinar a moda, ou seja, o número modal de circuitos defeituosos por sistema. Resposta: Mo=1 circuito defeituoso por sistema (maior frequência absoluta) G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 26 Nº de circuitos defeituosos fi 1 10 2 7 3 1 4 1 Total 19 Tabela 4: Distribuição de frequências do nº de circuitos defeituosos. Exemplos 10. O quadro a seguir representa a distribuição de frequências do peso (kg) de pessoas de uma certa faixa etária. Calcule a moda e interprete-a. G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 27 Peso fi 40 |-----45 3 45 |-----50 8 50 |-----55 16 55 |-----60 12 60 |-----65 7 65 |-----70 3 70 |-----75 1 Total 50 Tabela 5: Distribuição de frequências do peso de pessoas de certa faixa etária. Exemplos Solução • 1º modo i. Classe modal: 50 |-----55 (maior frequência absoluta=16) 𝑀𝑜 = 𝐿𝐼 + Δ1 Δ1 + Δ2 . 𝐶 = 50 + (16 − 8) 16 − 8 + (16 − 12) . 5 = 53,33 𝐾𝑔 Conclusão: Espera-se que o peso que tenha maior ocorrência seja aproximadamente 53,33 Kg. G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 28 Exemplos • 2º modo:H.T.B 𝑀𝑜 = 50 + 55 2 = 52,5 𝐾𝑔 • 3º modo: método gráfico (quadro) G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 29 Relação entre 𝑥 , Md e Mo A. Se 𝑥 = 𝑀𝑑 = 𝑀𝑜:𝐷𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑖çã𝑜 𝑠𝑖𝑚é𝑡𝑟𝑖𝑐𝑎 B. Se 𝑥 > 𝑀𝑑 > 𝑀𝑜:𝐷𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑖çã𝑜 𝑎𝑠𝑠𝑖𝑚é𝑡𝑟𝑖𝑐𝑎 à 𝑑𝑖𝑟𝑒𝑖𝑡𝑎 C. Se 𝑥 < 𝑀𝑑 < 𝑀𝑜:𝐷𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑖çã𝑜 𝑎𝑠𝑠𝑖𝑚é𝑡𝑟𝑖𝑐𝑎 à 𝑒𝑠𝑞𝑢𝑒𝑟𝑑𝑎G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 30 Outras medidas de posição • Média geométrica (G): utilizada para representar variáveis com distribuições assimétricas, pois nesses casos, a média aritmética, por ser muito inflacionada pelos valores extremos, não representa bem a variável. 𝐺 = (𝑥1. 𝑥2. … . 𝑥𝑛 𝑛 ou 𝐿𝑜𝑔 𝐺 = 1 𝑛 . (𝑙𝑜𝑔𝑥1 + 𝑙𝑜𝑔𝑥2 +⋯+ 𝑙𝑜𝑔𝑥𝑛) • Média harmônica (H): utilizada para variáveis que apresentam periodicidade, ou seja, uma variação harmônica como, por exemplo, ondas de rádio, variação de preços, entre outros. 𝐻 = 𝑛 1 𝑥𝑖 𝑛 𝑖=1 G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 31 • Média Ponderada 𝒙 𝒑 : essa média associa as observações x1, x2, ..., xn determinadas ponderações ou pesos que dependem da importância atribuída a cada uma das observações. 𝑥 𝑝 = 𝑤𝑖 . 𝑥𝑖 𝑛 𝑖=1 𝑤𝑖 𝑛 𝑖=1 , 𝑜𝑛𝑑𝑒 𝑤𝑖 é 𝑜 𝑝𝑒𝑠𝑜 𝑑𝑎 𝑜𝑏𝑠𝑒𝑟𝑣𝑎çã𝑜 𝑖 Exemplo 11: Uma indústria realizou ao longo dos últimos três meses cinco compras de determinada matéria-prima: G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 32 Outras medidas de posição Compra Custo por quilo (R$) Quantidade em quilos 1 3 1200 2 3,40 500 3 2,80 2750 4 2,90 1000 5 3,25 800 Deseja-se obter informações sobre o custo médio por quilo de matéria-prima. Qual é esse custo médio? Solução: 𝑥 𝑝 = 𝑤𝑖 . 𝑥𝑖 𝑛 𝑖=1 𝑤𝑖 𝑛 𝑖=1 = 3.1200 + 3,40.500 + 2,80.2750 + 2,90.1000 + 3,25.800 1200 + 500 + 2750 + 1000 + 800 = 2,96 𝑟𝑒𝑎𝑖𝑠 𝑞𝑢𝑖𝑙𝑜𝑠 G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 33 Outras medidas de posição Outras medidas de posição • Separatrizes (Quartis): Se um conjunto de dados é organizado em rol, o valor central ou a média entre os valores centrais é definido como mediana. Por extensão, desse conceito de mediana, pode-se pensar nos valores que dividem o conjunto em quatro partes iguais, e teremos os quartis (Q1, Q2, Q3). O quartil Q2 coincide com a mediana. Pode-se ainda ter os decis que dividem s dados ordenados em 10 (D1, D2, ..., D9) conjunto iguais, ou os percentis que os dividem em 100 partes iguais (P1, P2, ..., P99). Desse modo, segue que: Q2=D5=P50=Md P75=Q3 P25=Q1 G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 34 Outras medidas de posição • Cálculo do p-ésimo percentil: o Organize os dados em rol e calcule o índice (i): 𝑖 = 𝑝 100 𝑛, em que p é o percentil procurado e n o número de observações; o Se i não for um número inteiro, arredonde-o para cima. Esse número denomina a posição do p-ésimo percentil; o Se i for um número inteiro, o p-ésimo percentil será a média dos valores na posição i e i+1. G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 35 Outras medidas de posição 12. As nota finais de nove alunos em uma determinada disciplina são iguais a 89, 88, 94, 65, 42, 73, 66, 66 e 35. Calcular e interpretar os quartis. Solução: i. Organizar os dados em rol: 35 42 65 66 66 73 88 89 94 ii. Sabe-se que: P25=Q1 Q2=P50=Md P75=Q3 Logo: G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 36 Outras medidas de posição • 𝑖 = 𝑝 100 𝑛 = 25 100 . 9 = 2,25 ≈ 3 • 𝑖 = 𝑝 100 𝑛 = 50 100 . 9 = 4,5 ≈ 5 • 𝑖 = 𝑝 100 𝑛 = 75 100 . 9 = 6,75 ≈ 7 Portanto, P25=Q1=65 Q2=P50=Md=66 P75=Q3=88 Pode-se afirma que 25% dos alunos tiraram nota abaixo de 65, 50% nota abaixo de 66 e 75% nota abaixo de 88. G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 37 Qual medida de posição devo usar para expressar uma variável? Ferramentas diferentes para situações diferentes!!! G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 38 Atrasado Bêbado Batom Medidas de dispersão • As medidas de posição não apresentam informações sobre o comportamento da variável, ou seja, qual sua variabilidade; • Necessário associar à medida de posição uma medida de dispersão (variabilidade); • Medidas de dispersão: indicam o quanto os dados se encontram dispersos em torno da região central, ou seja, da média. Quanto maior a variação dos dados menor a representatividade da média. Assim, dizemos que as medidas de dispersão servem para qualificar a média. Quanto menor a dispersão, mais confiável é a média. • Principais medidas de posição: amplitude total da amostra, variância, desvio padrão, coeficiente de variação e erro padrão da amostra. G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 39 Medidas de dispersão • Exemplo: Três grupos de alunos submeteram-se a um teste, obtendo as seguintes notas: Grupo A: {1, 8, 10, 10, 11, 12, 18} 𝑥𝐴 = 10;𝑀𝑑 = 10; 𝑀𝑜𝐴 = 10 Grupo B: {1, 2, 10, 10, 10, 13, 24} 𝑥𝐵 = 10;𝑀𝑑 = 10; 𝑀𝑜𝐵 = 10 Grupo C: {10, 10, 10, 10, 10, 10, 10} 𝑥𝐶 = 10;𝑀𝑑 = 10; 𝑀𝑜𝐶 = 10 • Apesar da média, mediana e moda serem iguais nos três grupos, eles apresentam comportamentos diferentes; • A variabilidade que é distinta nos três grupos não pode ser identificada apenas com medidas de posição, seria necessário uma medida de dispersão. G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 40 Medidas de dispersão • Características desejáveis em uma medida de dispersão: Considera todas as observações no cálculo; É facilmente calculável e compreensível; Deve estar exposta o menos possíveis a flutuações da amostra. G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 41 Amplitude total da amostra (A) • Ideia geral da dispersão dos dados; • Corresponde a diferença entre a maior (máximo) e a menor observação (mínimo) de um conjunto de dados. Dados não agrupados 𝐴 = 𝑥(𝑛) − 𝑥(1) Dados agrupados (distribuições de frequências com intervalos de classes) 𝐴 = 𝑥 𝑘 − 𝑥 1 = 𝑑𝑖𝑓𝑒𝑟𝑒𝑛ç𝑎 𝑒𝑛𝑡𝑟𝑒 𝑜 𝑝𝑜𝑛𝑡𝑜 𝑚é𝑑𝑖𝑜 𝑑𝑎 ú𝑙𝑡𝑖𝑚𝑎 𝑐𝑙𝑎𝑠𝑠𝑒 𝑒 𝑜 𝑝𝑜𝑛𝑡𝑜 𝑚é𝑑𝑖𝑜 𝑑𝑎 𝑝𝑟𝑖𝑚𝑒𝑖𝑟𝑎 𝑐𝑙𝑎𝑠𝑠𝑒 Problemas!! o Não considera todas as observações no cálculo; o Não se tem ideia do comportamento dos dados entre os extremos; o Apresenta muita variação de uma amostra para outra, mesmo que ambas sejam extraídas da mesma população. G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 42 Exemplo 13. Utilizando o exemplo da distribuição de frequências do peso (Kg) de pessoas de uma mesma faixa etária, calcule a amplitude total. Solução: G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 43 Tabela 5: Distribuição de frequências do peso de pessoas de certa faixa etária. 𝐴 = 𝑥 𝑘 − 𝑥 1 = 70+75 2 − 40+45 2 = 30 Kg Variância(s²) e desvio padrão (s) • Dados não agrupados: 𝑠² = 𝑆𝑜𝑚𝑎 𝑑𝑒 𝑄𝑢𝑎𝑑𝑟𝑎𝑑𝑜𝑠 𝑑𝑜𝑠 𝑑𝑒𝑠𝑣𝑖𝑜𝑠 (𝑆𝑄𝐷) 𝑛 − 1 • Dados agrupados (tabelas com distribuições de frequências) 𝑠² = 𝑥𝑖 ²𝑓𝑖 − 𝑥𝑖 𝑓𝑖 𝑘 𝑖=1 ² 𝑛 𝑘 𝑖=1 𝑛 − 1 G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 44 11 )( ² 2 1 1 2 1 2 n n x x n xx s n i in i i n i i Obs: Se não existir intervalo na classe, 𝒙𝒊 é o valor da classe. Variância (s²) e desvio padrão (s) • O desvio padrão (s) é definido como sendo a raiz quadrada positiva da variância, ou seja: 𝑠 = 𝑠² • O desvio padrão possui a mesma unidade dos dados; • A variância tem a unidade dos dados elevadas ao quadrado (sem significado físico). G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 45 Exemplos 14. Os dados a seguir referem-se a produção média, em toneladas, de um certo produto de uma indústria: Calcular a produção média da indústria, sua variância e desvio padrão. Solução: i. Cálculo da média para dados não agrupados: 𝑥 = 𝑥𝑖 𝑛 𝑖=1 𝑛 = (50 + 280 + 560 + 170 +⋯+ 870 + 360) 20 = 430,5 𝑡𝑜𝑛𝑒𝑙𝑎𝑑𝑎𝑠 G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 46 50 280 560 170 180 500 250 200 1050 240 180 1000 1100 120 420 510 480 90 870 360 Exemplos ii. Cálculo da variância para dados não agrupados: 𝑠² = 𝑥𝑖² 𝑛 𝑖=1 − 𝑥𝑖 𝑛 𝑖=1 ² 𝑛 𝑛 − 1 = 502 + 2802 + 5602 +⋯+ 8702 + 3602 − (50 + 280 + 560 +⋯+ 870 + 360)² 20 19 = 109478,60 𝑡𝑜𝑛𝑒𝑙𝑎𝑑𝑎𝑠² iii. Cálculo do desvio padrão: 𝑠 = 𝑠² = 330,88 𝑡𝑜𝑛𝑒𝑙𝑎𝑑𝑎𝑠 Interpretação: Espera-se que a produção média da indústria seja de 430,5 toneladas com uma dispersão em torno desse valor de 330,88 toneladas. G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 47 Exemplos 15. Uma inspeção feita em uma amostra de 30 embalagens, cada uma contendo uma dúzia da ovos, ao serem transportados de uma granja até o local destinado, apresentou os seguintes números de ovos danificados: Determinar o desvio padrão e fazer uma interpretação. G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 48 Número de ovos quebrados fi 0 13 1 9 2 3 3 3 4 1 5 1 Total 30 Exemplos 𝑠² = 𝑥𝑖 ²𝑓𝑖 − 𝑥𝑖 𝑓𝑖 𝑘 𝑖=1 ² 𝑛 𝑘 𝑖=1 𝑛 − 1 = 02. 13 + 12. 9 + 22. 3 + 32. 3 + 42. 1 + 52. 1 − (0.13 + 1.9 + ⋯+ 5.1)² 30 29 = 1,8174 (ovos danificados)² 𝑠 = 𝑠² ≅ 1,35 𝑜𝑣𝑜𝑠 𝑑𝑎𝑛𝑖𝑓𝑖𝑐𝑎𝑑𝑜𝑠 𝑥 = 𝑥𝑖 . 𝑓𝑖 𝑘 𝑖=1 𝑛 = (0.13 + 1.9 + 2.3 + 3.3 + 4.1 + 5.1) 30 = 1,1 𝑜𝑣𝑜𝑠 𝑑𝑎𝑛𝑖𝑓𝑖𝑐𝑎𝑑𝑜𝑠 Interpretação: Espera-se que a média de ovos danificados durante o transporte seja de 1,1, com uma dispersão em torno desse valor de aproximadamente 1,35 ovos danificados. G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 49 Exemplos 16. Um estudo foi realizado para investigar a quantidade (em milhões) de passageiros transportados em diferentes semanas do ano (n=40) por uma grande empresa de transporte urbano: Pede-se determinar a média e o desvio padrão desse conjunto de dados. G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 50 Quantidade de passageiros (em milhões) fi 1,5|-----4,5 5 4,5|-----7,5 10 7,5|-----10,5 12 10,5|-----13,5 6 13,5|-----16,5 7 Total 40 Exemplos i. Cálculo da média dos dados agrupados em classes com intervalos: 𝑥 = 𝑥𝑖 . 𝑓𝑖 𝑘 𝑖=1 𝑛 Precisa-se calcular o ponto médio de cada classe: G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 51 Quantidade de passageiros (em milhões) fi 𝒙𝒊 1,5|-----4,5 5 3 4,5|-----7,5 10 6 7,5|-----10,5 12 9 10,5|-----13,5 6 12 13,5|-----16,5 7 15 Total 40 Exemplos Logo, 𝑥 = 𝑥𝑖.𝑓𝑖 𝑘 𝑖=1 𝑛 = (3.5+6.10+9.12+12.6+15.7) 40 = 9 𝑚𝑖𝑙ℎõ𝑒𝑠 𝑑𝑒 𝑝𝑎𝑠𝑠𝑎𝑔𝑒𝑖𝑟𝑜𝑠 ii. Calcular a variância e o desvio padrão para dados agrupados: 𝑠² = 𝑥𝑖 ²𝑓𝑖 − 𝑥𝑖 𝑓𝑖 𝑘 𝑖=1 ² 𝑛 𝑘 𝑖=1 𝑛 − 1 = 32. 5 + 62. 10 + 92. 12 + 122. 6 + 152. 7 − 3.5 + 6.10 + 9.12 + 12.6 + 15.7 ² 40 39 = 14,7692 (𝑚𝑖𝑙ℎõ𝑒𝑠 𝑑𝑒 𝑝𝑎𝑠𝑠𝑎𝑔𝑒𝑖𝑟𝑜𝑠)² 𝑠 = 𝑠² = 3,84 𝑚𝑖𝑙ℎõ𝑒𝑠 𝑑𝑒 𝑝𝑎𝑠𝑠𝑎𝑔𝑒𝑖𝑟𝑜𝑠 G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 52 Interpretação: Pode-se dizer a o número média de passageiros que utilizam o transporte urbano é 9 milhões, com uma dispersão em torno desse valor de 3,84 milhões de passageiros. Observações-(s² e s) • O desvio padrão é um valor mínimo de erro, pois os desvios são calculados em relação à média aritmética; • São estatísticas que utilizam todas as observações no cálculo e também sofrem pouca influência de mudanças amostrais. G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 53 Propriedades-(s² e s) • Somando-se ou subtraindo-se uma constante k a cada observação, a variância e o desvio padrão não se alteram; • Multiplicando-se ou dividindo-se cada observação por uma constante k, a nova variância ficará multiplicada ou dividida por k², e o novo desvio por k; • A variância de uma constante é igual a zero; • A variância e o desvio padrão são sempre positivos e são usados todos os valores observados em seu cálculo. G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 54 Exemplo: Suponha que o salário médio de uma empresa X é de R$ 1500,00 com desvio padrão de R$ 250,00. Será dado um aumento de R$150,00 para cada funcionário. Qual o novo salário médio e o novo desvio padrão? o Nova média → Somando ou subtraindo uma constante z a cada valor observado, a média do novo conjunto de dados ficará somada ou subtraída da constante z, em relação à média inicial. Logo, o novo salário médio da empresa X será R$1500,00+ R$150,00= R$1650,00. o Novo desvio padrão → Somando-se ou subtraindo-se uma constante k a cada observação, a variância e o desvio padrão não se alteram. Logo, o desvio padrão dos salários continua sendo R$250,00. G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 55 Propriedades-(s² e s) Coeficiente de Variação (CV) • Conjuntos de dados com diferentes unidades de medida, ou mesmo para uma única unidade: se os conjuntos de dados possuem médias diferentes, suas variabilidades não podem ser comparadas pela variância ou desvio padrão. Uma medida de variabilidade que não depende desses fatores é o coeficiente de variação, que não possui unidade de medida e pode ser calculado pela fórmula: 𝐶𝑉 = 𝑠 𝑥 . 100 GE Q0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 56 Exemplo 17. Uma pesquisa sobre temperatura (°C) e pressão (atm) em uma caldeira industrial mostrou os seguintes resultados: a. Calcular a média e o desvio padrão de cada variável. b. Qual atributo apresenta maior variabilidade? G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 57 T(°C) 400 450 350 500 600 550 P(atm) 40 52 37 67 70 72 Exemplo a. i. Cálculo da média (dados não agrupados) 𝑥𝑇 = 𝑥𝑖 𝑛 𝑖=1 𝑛 = (400 + 450 + 350 + 500 + 600 + 550) 6 = 475 °𝐶 𝑥𝑃 = 𝑥𝑖 𝑛 𝑖=1 𝑛 = (40 + 52 + 37 + 67 + 70 + 72) 6 = 56,33 𝑎𝑡𝑚 GE Q 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 58 Exemplo ii. Calcular o desvio padrão para dados não agrupados → preciso calcular a variância 𝑠𝑇² = 𝑥𝑖² 𝑛 𝑖=1 − 𝑥𝑖 𝑛 𝑖=1 ² 𝑛 𝑛 − 1 = 4002 + 4502 +⋯+ 5502 − (400 + 450 +⋯+ 550)² 6 5 = 8750 °𝐶² 𝑠 = 8750 = 93,54 °𝐶 G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 59 Exemplo ii. Calcular o desvio padrão para dados não agrupados → preciso calcular a variância 𝑠𝑃² = 𝑥𝑖² 𝑛 𝑖=1 − 𝑥𝑖 𝑛 𝑖=1 ² 𝑛 𝑛 − 1 = 402 + 522 +⋯+ 72 − (40 + 52 +⋯+ 72)² 6 5 = 246,07 𝑎𝑡𝑚² 𝑠 = 246,07 = 15,53 𝑎𝑡𝑚 G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 60 Exemplo b. 𝐶𝑉𝑇 = 𝑠 𝑥 . 100 = 93,54 475 . 100 = 19,70 % 𝐶𝑉𝑃 = 𝑠 𝑥 . 100 = 15,53 56,33 . 100 = 27,60% Logo, como o coeficiente de variação da pressão é maior que o temperatura, pode-se dizer que a pressão apresenta maior variabilidade. G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 61 Erro Padrão da Média (𝑠𝑥 ) • Também chamado de erro padrão da amostra; • Mede a precisão com qual a média amostral foi calculada; • Quanto menor for seu valor, mais provável será a chance de obter a média da amostra nas proximidades da média da população; 𝑠𝑥 = 𝑠 𝑛 Se n→∞, 𝑠𝑥 → 0 G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 62 Exemplo 18. Em um estudo sobre a acidez de algumas soluções, o pH de um certo produto foi medido, obtendo os seguintes resultados: a. Calcular o erro padrão da média usando as duas primeiras linhas de dados; b. Calcular o erro padrão da média usando todos os dados. G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 63 5,1 5,3 5,2 5,5 4,9 6,2 6,0 5,8 5,3 5,0 5,1 5,4 5,1 6,1 5,6 5,4 5,8 5,7 5,5 5,1 Exemplos Solução: a. 𝑠𝑥 = 𝑠 𝑛 Preciso calcular o desvio padrão da amostra (dados não agrupados): 𝑠² = 𝑥𝑖² 𝑛 𝑖=1 − 𝑥𝑖 𝑛 𝑖=1 ² 𝑛 𝑛 − 1 = 5,12 + 5,32 +⋯+ 5,02 − (5,1 + 5,3 + ⋯+ 5,0)² 10 9 = 0,1912 𝑠 = 0,1912 = 0,4373 𝑠𝑥 = 𝑠 𝑛 = 0,4373 10 = 0,1383 G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 64 Exemplos Solução: b. 𝑠𝑥 = 𝑠 𝑛 Preciso calcular o desvio padrão da amostra (dados não agrupados): 𝑠² = 𝑥𝑖² 𝑛 𝑖=1 − 𝑥𝑖 𝑛 𝑖=1 ² 𝑛 𝑛 − 1 = 5,12 + 5,32 +⋯+ 5,12 − (5,1 + 5,3 + ⋯+ 5,1)² 20 19 = 0,1437 𝑠 = 0,1437 = 0,3790 𝑠𝑥 = 𝑠 𝑛 = 0,3790 20 = 0,085 G EQ 0 1 9 - Es ta tí st ic a A p lic ad a à En g. Q u ím ic a 65
Compartilhar