Baixe o app para aproveitar ainda mais
Prévia do material em texto
MEDIDAS DE TENDÊNCIA CENTRAL Consiste em encontrar um único número que represente o que é “médio” ou “típico” naquele conjunto particular de dados, onde a maior parte dos dados tende a concentrar-se. Observação Importante! Os conceitos de média e mediana devem ser muito bem entendidos. Especificamente, devem ser bem conhecidos os métodos para se encontrar os valores da média e da mediana. Devemos saber, também que o valor da média pode ser dramaticamente afetado pela presença de um outlier, mas a mediana já não é tão sensível a um outlier. (Um outlier é um valor bem afastado de quase todos os demais valores.) Média A Média Aritmética de um conjunto de valores é a medida de centro encontrada pela adição dos valores e divisão do total pelo número de valores. I) Dados não-agrupados: ( 1 ) II) Dados agrupados: II.I. Sem intervalos de classe ̅ ( 2 ) II.II. Com intervalos de classe ̅ onde xi é o ponto médio da classe. ( 3 ) Notação ∑ denota a soma de um conjunto de valores. x é a variável geralmente usada para representar os valores individuais dos dados. n representa o número de valores em uma amostra. N representa o número de valores em uma população. ̅ é a média de um conjunto de valores amostrais. é a média de todos os valores em uma população. EXEMPLO Monitoração de Chumbo no Ar Sabe-se que o chumbo tem alguns adversos à saúde. Abaixo estão listadas as medidas das quantidades de chumbo (em microgramas por metro cúbico, ou ug/m 3 ) no ar. A Agência de Proteção Ambiental americana estabeleceu um padrão de qualidade do ar para o chumbo: um máximo de 1,5 ug/m 3 . As medidas mostradas abaixo foram registradas no local do Edifício 5 do World Trade Center, em dias diferentes, logo após a destruição causada pelos ataques terroristas de 11 de setembro de 2001. Ache a média para essa amostra de medidas de níveis de chumbo no ar. 5,40 1,10 0,42 0,73 0,48 1,10 SOLUÇÃO A média é calculada usando-se a fórmula (1). Primeiro some os valores e a seguir divida pelo número de valores: ̅ O nível médio de chumbo é 1,538 ug/m 3 . Independentemente do valor da média, é também de se notar que o conjunto de dados contém um valor (5,40) que está bem afastado dos demais. Seria interessante investigar tal “outlier”. Nesse caso, o nível de chumbo de 5,40 ug/m3 foi medido um dia após o desmoronamento das torres do World Trade Center, e havia níveis elevados de poeira e fumaça. Também, alguma quantidade de chumbo poderia ser proveniente do grande número de veículos que se dirigiram para o local. Esses fatores fornecem uma explicação razoável para um tal valor extremo. Mediana A mediana de um conjunto de dados é a medida de centro que é o valor do meio quando os dados originais estão arranjados em ordem crescente (ou decrescente) de magnitude. A mediana é, em geral, representada por ̃ (pronuncia-se “x til”). I) Dados não-agrupados: Para encontrar a mediana, primeiro ordene os valores e depois siga um dos dois procedimentos seguintes: 1°caso: Distribuição com número ímpar de dados. A mediana será o dado que cai exatamente no meio da distribuição. Exemplo: Assim, 16 é o valor mediano na distribuição 11, 12, 13, 16, 17, 20, 25; em outras palavras, 16 é o valor que divide a distribuição de tal forma que, de ambos os lados, há igual quantidade de dados. 2°caso: Distribuição com número par de dados. A mediana será encontrada pelo cálculo da média dos dois números do meio. Exemplo: 11, 12, 13, 16, 17, 20, 25, 26 O ponto central dessa distribuição vai, então, ser 16,5, uma vez que ele fica precisamente no meio de 16 (4° valor) e 17 (5° valor). II) Dados agrupados: ( 4 ) II.I. Sem intervalos de classe: Neste caso, é o bastante identificar a freqüência acumulada imediatamente superior à metade da soma das freqüências. A mediana será aquele valor da variável que corresponde a tal freqüência acumulada. II.II. Com intervalos de classe: 1. Determinamos as freqüências acumuladas. 2. Calculamos 3. Marcamos a classe correspondente à freqüência acumulada imediatamente superior à - classe mediana - e, em seguida, empregamos a fórmula: [ ] ( 5 ) na qual: l * é o limite inferior da classe mediana; F (ant) é a freqüência acumulada da classe anterior à classe mediana; f * é a freqüência simples da classe mediana; h * é a amplitude do intervalo da classe mediana. EXEMPLO Monitoração de Chumbo de Ar Abaixo, estão listadas as quantidades medidas de chumbo no ar (em ug/m 3 ). Ache a mediana para essa amostra. 5,40 1,10 0,42 0,73 0,48 1,10 SOLUÇÃO Primeiro ordene os valores: 0,42 0,48 0,73 1,10 1,10 5,40 Como o número de valores é um número par (6), a mediana é encontrada pelo cálculo da média dos dois valores do meio, 0,73 e 1,10 Mediana = Como o número de valores é um número par (6), a mediana é a média dos dois valores do meio, de modo que a mediana é 0,915 ug/m 3 . Note que a mediana é muito diferente da média de 1,538 ug/m 3 que encontramos para o mesmo conjunto de dados amostrais no exemplo anterior. A razão para essa grande discrepância é o efeito que 5,40 tem sobre a média. Se esse valor extremo fosse reduzido para 1,20, a média cairia de 1,538 ug/m 3 para 1,838 ug/m 3 , mas a mediana não se alteraria. Observação Importante! Deve estar claro que a média é drasticamente afetada por valores extremos, enquanto a mediana não o é. Pelo fato de a mediana não ser tão sensível a valores extremos, ela é, em geral, usada para conjuntos de dados com um número relativamente pequeno de valores extremos. Moda Escore ou categoria, que numa distribuição, ocorre com mais freqüência. I) Dados não-agrupados Quando dois valores ocorrem com a mesma maior freqüência, cada um é uma moda, e o conjunto de dados é bimodal. Exemplo: 27, 27, 27, 55, 55, 55, 88, 88, 1,10 moda = 27 e 55 Quando mais de dois valores ocorrem com a mesma maior freqüência, cada um é uma moda, e o conjunto de dados é multimodal. Exemplo: 1, 1, 1, 1, 5, 4, 7, 7, 7, 7, 8, 3, 10, 10, 10, 10 moda = 1, 7 e 10 Quando nenhum valor se repete, dizemos que não há moda. Exemplo: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 não há moda, porque nenhum valor se repete II) Dados agrupados II.I. Sem intervalos de classes Uma vez agrupados os dados, é possível determinar imediatamente a moda: basta fixar o valor da variável de maior freqüência. II.II. Com intervalos de classe A classe que apresenta a maior freqüência é denominada classe modal. Temos, então: Onde: l * é o limite inferior da classe modal; L* é o limite superior da classe modal. Ponto Médio Ponto médio = Observação Importante! O ponto médio raramente é usado. Como ele usa apenas o valor mínimo e máximo, é muito sensível a esses extremos. RESUMO DAS MEDIDAS DE TENDÊNCIA CENTRAL POSIÇÃO RELATIVA DA MÉDIA, MEDIANA E MODA Quando uma distribuição é simétrica, as três medidas coincidem. Porém, a assimetria torna-as diferentes e essa diferença é tanto maior quanto maior é a assimetria. Assim, em uma distribuição em forma de sino, temos: ̅ ̅ ̅ EXERCÍCIOS 1) Os dados abaixo representam a produção diária em toneladas de uma máquina durante um período de 60 dias. Obs.: Use duas casas decimais nos seus cálculos. 22,7302 26,542 27,237 28,029 29,219 30,268 30,719 31,349 32,611 34,395 24,0993 26,583 27,232 28,102 29,663 30,435 30,838 31,522 32,626 34,486 24,1828 26,662 27,268 28,231 29,812 30,464 30,968 31,556 32,877 34,702 25,6412 26,694 27,514 28,533 30,012 30,523 31,048 31,669 33,075 34,873 26,3536 26,782 27,605 28,624 30,049 30,627 31,295 32,089 33,956 35,168 26,5023 27,213 27,729 29,182 30,152 30,715 31,313 32,446 34,367 36,662 a) Construa uma tabela de freqüências contendo freqüências simples, relativas, percentual e acumulada para a produção diária desta máquina usando 6 classes. Resposta: AT = Xmáx – Xmín = 36,66 – 22,73 = 13,93 H = AT / hc = 13,93 / 6 = 2,32 Classes Frequencia simples Frequencia relativa Frequencia percentual Frequencia acumulada Xi Xifi 22,73I--- 25,05 3 0,05 5% 0,05 23,89 71,67 25,05I--- 27,37 12 0,20 20% 0,25 26,21 314,52 27,37I--- 29,69 11 0,18 18% 0,43 28,53 313,83 29,69I--- 32,01 20 0,33 33% 0,76 30,85 617,00 32,01I--- 34,33 6 0,10 10% 0,86 33,17 199,02 34,33I--- 36,65 8 0,13 13% 0,99 35,49 283,92 Total 60 1 100% 1.799,96 b) Determine o menor valor que seja superior aos 15 piores resultados. Resposta: 27,514 c) Qual a pior produção dos 10% melhores resultados? Resposta: 34,367 d) Qual a produção média diária de máquina? Resposta: ̅ 2) O dono de um bar deseja atrair mais clientes para o seu estabelecimento. Para isso precisa analisar as idades dos seus clientes para escolher atrações mais compatíveis com a faixa etária. As idades dos clientes estão apresentadas a seguir: 25, 19, 31, 20, 20, 30, 35, 28, 22, 30, 32, 23, 24, 32, 28, 19, 23, 24, 28, 36, 26, 38, 31, 33, 27. 1. Organize esses valores em uma distribuição de frequência de cinco classes. 2. Qual a idade média dos clientes? E a idade mais frequente? 3. Qual a idade acima da qual estão os 50% mais velhos? 4. O que é mais provável ocorrer clientes com idade inferior a 27 anos ou clientes com idades maior ou igual a 27 e inferior a 34? Justifique. Solução: 1º Passo: Colocar os valores em ordem crescente: 19, 19, 20, 20, 22, 23, 23, 24, 24, 25, 26, 27, 28, 28, 28, 30, 30, 31, 31, 32, 32, 33, 35, 36, 38 2º Passo: Amplitude da classe = (Xmáximo – Xmínimo) / Número de classes = (38 - 19) / 5 = 3,8 ≈ 4 1. INTERVALOS fi 19 I--- 23 5 23 I--- 27 6 27 I--- 31 6 31 I--- 35 5 35 I--- 39 3 Ʃfi = 25 2. INTERVALOS fi Xi fiXi 19 I--- 23 5 21 105 23 I--- 27 6 25 150 27 I--- 31 6 29 174 31 I--- 35 5 33 165 35 I--- 39 3 37 111 Ʃfi = 25 ƩXifi = 705 Idade média dos clientes: ̅ A idade mais freqüente: 28 anos 3. INTERVALOS fi Xi fa 19 I--- 23 5 21 5 23 I--- 27 6 25 11 27 I--- 31 6 29 17 31 I--- 35 5 33 22 35 I--- 39 3 37 25 Ʃfi = 25 a classe mediana superior é 27 I--- 31 [ ] Portanto, a idade acima da qual estão os 50% mais velhos é 28. Ou seja, 50% abaixo são os clientes mais novos. É provável ocorrer as duas situações, pois as freqüências simples para os dois casos são iguais. QUESTÕES EXTRAS 1. Um estudo sobre tainhas nos estuários do Rio Mamanguape em determinada época do ano coletou 80 peixes e anotou o peso, o qual está apresentado no quadro abaixo. 390,97 1121,09 1286,30 1431,65 1520,56 1661,04 1845,83 2055,81 766,88 1124,24 1299,55 1434,70 1523,13 1668,99 1867,59 2106,69 895,14 1138,05 1306,95 1435,51 1540,91 1684,46 1892,77 2171,89 954,71 1154,02 1333,92 1448,21 1545,33 1702,77 1893,34 2195,26 990,08 1173,30 1358,11 1454,71 1580,85 1746,27 1897,68 2215,22 1005,29 1176,85 1378,58 1475,87 1595,49 1749,00 1941,98 2226,13 1020,42 1195,76 1412,71 1484,33 1622,64 1750,60 1959,96 2274,08 1075,78 1206,23 1413,53 1494,01 1632,12 1792,82 2010,37 2407,51 1106,35 1211,94 1416,71 1498,45 1648,52 1795,64 2019,79 2509,64 1114,43 1255,54 1423,30 1505,91 1654,16 1802,91 2045,15 2680,25 a) Construa uma distribuição de freqüências com 06 classes (use duas casas decimais) para freqüências simples, relativa e percentual. Amplitude da classe = (Xmáximo – Xmínimo) / Número de classes = (2680,25 – 390,97) / 6 = 381,55 Classes Frequencia simples Frequencia relativa Frequencia percentual 390,97 I--- 772,52 2 0,025 2,5% 772,52 I--- 1154,07 12 0,15 15% 1154,07 I--- 1535,62 28 0,35 35% 1535,62 I--- 1917,17 23 0,2875 28,75% 1917,17 I--- 2298,72 12 0,15 15% 2298,72 I--- 2680,27 3 0,0375 3,75% Total 80 1 100% b) Construa um histograma. c) Qual o peso modal e mediano das tainhas observadas? Resposta: Peso modal: Peso mediano: CLASSES fi Xi fa Xifi 390,97 I--- 772,52 2 581,75 2 1163,50 772,52 I--- 1154,07 12 963,30 14 11559,60 1154,07 I--- 1535,62 28 1344,85 42 37655,80 1535,62 I--- 1917,17 23 1726,40 65 39707,20 1917,17 I--- 2298,72 12 2107,95 77 25295,40 2298,72 I--- 2680,27 3 2489,50 80 7468,50 Ʃfi = 80 122850,00 2 12 28 23 12 3 0 5 10 15 20 25 30 a classe mediana é 1154,07 I--- 1535,62 [ ] 1153,78 d) Qual o peso médio? ̅
Compartilhar