Baixe o app para aproveitar ainda mais
Prévia do material em texto
MEDIDAS DE TENDÊNCIA CENTRAL Definição: As medidas de tendência central são números que indicam o valor médio de uma distribuição de freqüência, procurando reduzir todos os valores num só, de referência tomar como mais representativo aquele que esteja no centro da distribuição. As medidas de posição são: - média - medida de uniformização; - mediana - medida de posição; - moda - medida de concentração. Na maioria das situações, não necessitamos calcular as três medidas de tendência central. Normalmente precisamos apenas uma das medidas para caracterizar o centro da série. Surge, então, a questão: qual medida deve ser utilizada? A medida ideal em cada caso é aquela que melhor representa a maioria dos dados da série. Quando todos os dados de uma série estatística são iguais, a média, a mediana e a moda coincidirão com este valor e, portanto qualquer uma delas representará bem a série. No entanto, este caso dificilmente ocorrerá na prática. Na maioria das vezes, teremos valores diferenciados para a série e conseqüentemente a medida irá representar bem, apenas os dados da série que se situam próxima a este valor. Os dados muito afastados em relação ao valor da medida não serão bem representados por ela. Quando houver forte concentração de dados na área central da série optaremos pelo uso da mais conhecida das medidas, a média. Se uma série apresenta forte concentração de dados em seu início, a mediana e a moda estarão posicionadas mais no início da série, representando bem esta concentração. Devemos optar pelo uso da mediana quando houver forte concentração de dados no início ou no final da série. A moda deve ser a opção como medida de tendência central apenas em séries que apresentam um elemento típico, isto é, um valor cuja freqüência é muito superior à freqüência dos outros elementos da série. Média, Mediana e Moda MÉDIA A média é um elemento representativo de série mais usado, procura uniformizar os dados em torno do valor médio, por isto, é também chamado de uniformização. Simbologia: M à média no sentido geral x à média de uma amostra µ à média de uma população Operacionalmente, a média é o quociente entre a soma de todos os valores (∑x) pelo número total dos dados (n). a) Para uma pequena quantidade de dados (dados brutos1). X n x∑ = (sem freqüência) Exemplo ilustrativo 1: Imagine que na inspeção de um produto foram obtidas 7 amostras de uma substância cujas massas em gramas resultaram no seguinte conjunto: {3,2 - 3,3 - 3,4 - 3,4 - 3,6 - 3,5 - 3,4} 4,3 7 3,43,53,63,43,43,33,2 = ++++++ =x g Portanto a massa média das sete amostras é 3,4 gramas. b) Para dados agrupados em uma distribuição de freqüência simples. x fi fixi ∑ ∑ = ).( 1 Representam dados que não foram tabelados. Exemplo ilustrativo 2: Seja X o número de filhos dos empregados do setor de produção de uma empresa. Considere estes uma população. Tabela 1 – Distribuição do Número de Filhos dos Empregados do Setor de produção, e Cálculos Intermediários para Obtenção de x . Xi(Número de Filhos) fi(Número de Empregados) Xi*f i 0 3 0 1 10 10 2 13 26 3 11 33 4 7 28 5 4 20 6 2 12 Total 50 129 58,2 50 129 ==X filhos. O que representa uma média de 2,58 filhos por empregado. Ou seja, aproximadamente 3 filhos por empregado. c) Para dados agrupados em uma distribuição de freqüência em classes. fi fix X i ∑ ∑ = ).( Média Ponderada (utilizada para dados agrupados em classes): Ao calcularmos uma média, podemos cometer sério engano, se ignorarmos o fato de que as grandezas em jogo não têm todas as mesmas importâncias em relação ao fenômeno que se está sendo estudado. Exemplo ilustrativo 3: Seja X o salário semanal dos operários da Empresa X medidos em reais. Tabela 2 - Distribuição do Salário Semanal dos Operários da Empresa X, e Cálculos Intermediários para Obtenção de µ . f(Número de Operários) Xi Xi*f 40 60 7 50 350 60 80 12 70 840 80 100 14 90 1260 100 120 18 110 1980 120 140 10 130 1300 140 160 6 150 900 160 180 3 170 510 70 - 7140 X(Salário Semanal) Total l—- l—- l—- l—- l—- l—- l—- Para o cálculo da média deve-se inicialmente obter os pontos médios (Xi) e então proceder como no exemplo anterior. 102 70 7140 ==X reais. O que representa um salário semanal médio de 102 reais. Propriedades da média: a) A média de um conjunto de números pode sempre ser calculada. b) Para um dado conjunto de números, a média é única. c) A média é sensível a (ou afetada por) todos os valores do conjunto. Assim, se um valor se modifica, a média também se modifica. d) A soma algébrica da diferença de cada valor observado e a média é nula. (∑d = 0 sendo d = Xi - X ) ou (∑d*fi = 0 sendo d = Xi - X ). A média de uma constante é a constante. e) A média ficará aumentada ou diminuída da quantidade que for adicionada ou subtraída todos os dados. f) A média ficará multiplicada ou dividida pela quantidade que for multiplicar ou dividir todos os dados. g) Multiplicando ou dividindo todos os pesos (f) pelo mesmo número a média não se altera. Observação: Não esquecer a “unidade junto ao valor da média”. Principais características da média: a) Depende de cada valor da série e qualquer alteração de um deles altera seu valor. b) É influenciada por valores excepcionais. c) Representa uma série cujos valores estão ou se aproximam de uma progressão aritmética. d) É a medida mais empregada. MEDIANA Medida de tendência central que divide a série ordenada (crescente ou decrescente) exatamente ao meio, ou seja, em 2 partes iguais. 50% antecedem e 50% da distribuição sucedem seu valor. a) Para uma pequena quantidade de dados (dados brutos2). A mediana é o valor médio ou a média entre os valores centrais. É importante que eles estejam ordenados. Exemplo ilustrativo 1: Imagine que na inspeção de um produto foram obtidas 7 amostras de uma substância cujas massas em gramas resultaram no seguinte conjunto: {3,2 - 3,3 - 3,4 - 3,4 - 3,6 - 3,5 - 3,4} Os dados ordenados: 3,2 – 3,3 – 3,4 – 3,4 – 3,4 – 3,5 – 3,6 Portanto a mediana é 3,4 gramas. Ou seja, a metade das amostras obteve até 3,4 gramas de massa. b) Para dados agrupados em uma distribuição de freqüência simples. A mediana é obtida seguindo os passos abaixo. - calcula-se a Fi (freqüência acumulada); - calcula-se a posição: 2 ∑= fiP , se ∑f for par, e 2 )1( + = ∑ fiP se for ímpar. 2 Representam dados que não foram tabelados. - localiza-se P na Fi. - procura-se o valor de X correspondente da Fi que contém P. Este valor será a mediana. Exemplo ilustrativo 2: Seja X o número de filhos dos empregados do setor de produção de uma empresa. Considere estes uma população. Tabela 3 – Distribuição do Número de Filhos dos Empregados do Setor de produção, e Cálculos Intermediários para Obtenção da Me. X(Número de Filhos) f(Número de Empregados) Fi 0 3 3 (1o ao 3o) 1 10 13 (4o ao 13o) 2 13 26 (14o ao 26o) 3 11 37 (27o ao 37o) 4 7 44 (38o ao 44o) 5 4 48 (45o ao 48o) 6 2 50 (49o ao 50o) Total 50 °=== ∑ 25 2 50 2 f P c) Para dados agrupados em uma distribuição de freqüência em classes. Nº cálculo da mediana utiliza-se os mesmos procedimentos vistos no item “b” e a fórmula: fi FiPh LiMe ant )( − += Exemplo ilustrativo 3: Seja X o salário semanal dos operários da Empresa X medidos em reais. Tabela 4 – Distribuição do Salário Semanal dos Operários da Empresa X, e Cálculos Intermediários para Obtenção daMe. Me = 2 filhos. Portanto, 50% dos empregados têm até 2 filhos. f(Número de Operários) Fi 40 60 7 7 (1o ao 7o) 60 80 12 19 (8o ao 19o) 80 100 14 33 (20o ao 33o) 100 120 18 51 (34o ao 51o) 120 140 10 61 (52o ao 61o) 140 160 6 67 (62o ao 67o) 160 180 3 70 (68o ao 70o) X(Salário Semanal) l—- l—- l—- l—- l—- l—- l—- °=== ∑ 35 2 70 2 fi P 22,102 18 )3335(20 100 )( = −⋅ += − += fi FiPh LiMe ant reais. Ou seja, a metade dos operários recebe até 102,22 reais por semana. VANTAGENS E LIMITAÇÕES DA MEDIANA: a) É menos sensível a valores extremos do que a média. b) É difícil de determinar para grandes quantidades de dados. c) Mais adequada para distribuições muito assimétricas. COMPARAÇÕES ENTRE MÉDIA E MEDIANA Em geral, dado um conjunto de valores, a média é a medida de posição central mais adequada, quando se supõe que estes valores tenham uma distribuição razoavelmente simétrica, enquanto que a mediana surge como uma alternativa para representar a posição central em distribuições muito assimétricas, mesmo assim, para variáveis que supostamente tenham distribuições razoavelmente simétricas, a média e a mediana podem não se igualar, já que, em geral, estamos observando apenas alguns valores (amostras) destas variáveis. MODA (Mo) A moda é definida como a realização mais freqüente do conjunto de valores observados. Em alguns casos pode haver mais de uma moda, ou seja, a distribuição dos valores pode ser bimodal (duas modas), trimodal (três modas), etc. A moda é o valor ou os valores que ocorrem com maior freqüência, logo é uma medida de concentração. Num rol a moda é localizada imediatamente, é o valor que mais repete. a) Para uma pequena quantidade de dados (dados brutos). A moda “Mo” é o valor que ocorre com maior freqüência. Exemplo ilustrativo 1: Imagine que na inspeção de um produto foram obtidas 7 amostras de uma substância cujas massas em gramas resultaram no seguinte conjunto: {3,2 - 3,3 - 3,4 - 3,4 - 3,6 - 3,5 - 3,4} Ordenam-se os dados para ter uma visão melhor: 3,2 – 3,3 – 3,4 – 3,4 – 3,4 – 3,5 – 3,6 Portanto a moda é 3,4 gramas, pois é o valor que mais aparece. b) Para dados agrupados em uma distribuição de freqüência simples. A moda é o valor que ocorre com maior freqüência. Moda para dados agrupados com intervalos de classe VARIÁVEIS CONTÍNUAS E O USO DA MODA Existem várias maneiras para determinarmos a moda de uma variável contínua, optaremos pela moda de PEARSON. Segundo PEARSON, a moda de uma variável contínua pode ser obtida através do valor da média e da mediana. A classe de maior freqüência será chamada de classe modal xmm do 23 −= Exemplo: Calcule a moda de Pearson para a distribuição de freqüência. Classe Int. cl. fi xi Xifi Fi 1 2 3 4 0 ⏐⎯ 10 10 ⏐⎯ 20 20 ⏐⎯ 30 30 ⏐⎯ 40 1 3 6 2 VANTAGENS E DESVANTAGENS DA MODA: a) é a menos útil para problemas estatísticos, porque se presta a análise matemática; b) a utilidade da moda se acentua quando um ou dois valores, ou um grupo de valores, ocorrem com muito maior freqüência que outros. Inversamente quando todos ou quase todos os valores ocorrem aproximadamente com a mesma freqüência, a moda nada acrescenta em termos de descrição dos dados. Conclusão: Das três medidas as mais usadas são a M e Me, pois a Mo nos dá uma informação mais rápida e grosseira. Características importantes das medidas de tendência central A media aritmética é preferível às demais medidas, para estimar a tendência central, quando se trata de muitas classes de população, por haver menos variabilidade entre as médias aritméticas calculadas a partir de várias amostras aleatórias do que entre as medianas e as modas. A média aritmética pode ser calculada a partir dos dados brutos, sem recorrer a qualquer agrupamento ou ordenação de valores originais, o que não ocorre com a mediana e a moda. Já para a determinação da mediana e da moda, em distribuições de freqüências onde ocorram classes com limites indefinidos (“menos de ...” ou “mais de ...”), não há dificuldade alguma. Em casos como este, todavia, o valor da média não pode ser determinado com exatidão para a série, a menos que figure na tabela o valor total dos itens na classe ou classes que tenham algum extremo (limite superior ou inferior) aberto. A mediana é preferível à média quando se está interessado em conhecer exatamente o ponto médio da distribuição, aquele valor que a divide em duas partes exatamente iguais. E preferível, ainda, quando os resultados extremos são tais que podem afetar sensivelmente o valor da média. A moda é utilizada essencialmente quando pretendemos apenas uma medida rápida e aproximada de tendência central. EXERCICIOS 1. Considere as distribuições do tipo de combustível doméstico usado em 2 cidades, em 2005. Tipo de combustível Número de residências Cidade A Cidade B Gás 67450 31800 Eletricidade 23800 3450 Outros 6450 3850 Total 97700 39100 a) Identifique quem são as variáveis e qual(is) o(s) tipo(s) também o tipo de série estatística; b) Justifique a proposição: “De forma relativa, a cidade B usa mais gás que a cidade A”; c) Observe o gráfico que segue e analise-o e calcule a média percentual representada pelo gás e eletricidade. 69,0 24,4 6,6 81,3 8,8 9,8 0 10 20 30 40 50 60 70 80 90 Gás Eletricidade Outros Tipo de combustível % Cidade A Cidade B 2. O valor médio de comercialização da saca de milho de 60 quilos na Bolsa de Cereais é apresentado abaixo, para os últimos 20 meses. 6,0 6,3 6,5 6,8 7,0 7,1 7,1 7,1 7,3 7,4 7,4 7,4 7,4 7,5 7,7 7,7 7,9 7,9 8,0 8,0 Pede-se: Construa uma tabela de freqüências e calcule a média, moda e mediana. 3. Uma pesquisa com usuários de transporte coletivo na cidade de São Paulo, indagou sobre os diferentes tipos usados nas suas locomoções diárias. Dentre ônibus, metrô e trem, o número de diferentes meios de transporte utilizados foi: Número de locomoções diárias Freqüência absoluta 1 14 2 12 3 4 Total 30 a) Admitindo que essa amostra represente bem o comportamento do usuário paulistano, determine a porcentagem dos usuários que utilizam mais de um tipo de transporte? b) Calcule as medidas de dispersão. 4. Segundo Secex/BC, o resultado do comércio internacional do Brasil nos anos indicados é dado abaixo. O gráfico faz uma comparação entre a Exportação e Importação e discuta os resultados. Ano 90 91 92 93 94 95 96 97 Expor. 31,4 31,6 35,8 38,6 43,5 46,5 47,7 53,0 Impor. 20,6 21,0 20,6 25,3 33,1 49,9 53,3 59,8 0 10 20 30 40 50 60 70 89 90 91 92 93 94 95 96 97 98 Anos Expor. Impor. a) Qual a média de exportação e importação? b) O que o gráfico representa? 5) A tabela abaixo representa as idades de uma amostra. 28 6 17 48 63 47 27 21 3 7 12 39 50 54 33 45 15 24 1 7 36 53 46 27 5 10 32 5 52 11 42 22 3 17 34 56 25 2 30 10 33 1 49 13 16 8 31 22 6 9 2 11 32 25 0 55 23 41 29 4 51 1 6 31 5 5 11 4 10 26 12 6 16 8 2 4 28. a. Média aritmética simples. b. Divida em classes, conforme a regra já estudada, e encontre a média ponderada (baseada na freqüência das classes) c. Calcule a moda bruta (considerando as classes) d. Calcule a mediana 6. Marque a questão correta e explique o resultado: A - Em uma prova de Estatística, 3 alunos obtiveram a nota 8,2 ; outros 3 obtiveram a nota 9,0 ; 5 obtiveram a nota 8,6 ; 1 obteve a nota 7,0 e 1 a nota 8,9. A nota média dos alunos será: 1. uma média aritmética simples com valor 8,0 ; 2. uma média aritmética simples com valor 8,7 ; 3. uma média aritmética ponderada com valor 8,0 ; 4. uma média aritmética ponderada com valor 8,5 ; 5. uma média aritmética ponderada com valor 8,6, pois é o de maior freqüência. Justif: ______________________________________________________________________ B -Um professor, após verificar que toda a classe obteve nota baixa, eliminou as questões que não foram respondidas pelos alunos. Com isso, as notas de todos os alunos foram aumentadas de 3 pontos. Então: 1. a média aritmética ficou alterada, assim como a mediana. 2. apenas a média aritmética ficou alterada. 3. apenas a mediana ficou alterada. 4. não houve alteração nem na média nem na mediana. 5. nada podemos afirmar sem conhecer o número total de alunos. Justif: ______________________________________________________________________ C - Na tabela primitiva : { 6, 2, 7, 6, 5, 4 } a soma dos desvios em relação à média aritmética é igual a : 1. ao número - 4 2. ao número 8 3. ao número 0 4. ao número 25 5. ao número 4 Justif: ______________________________________________________________________ D - A moda da série { 1, 3, 8, 15, 10, 12, 7 } é : 1. igual a 15 2. igual a 10 3. igual a 7 4. igual a 3,5 5. não há moda, pois não existe repetição de valores. Justif: ______________________________________________________________________ E - Numa pesquisa de opinião, 80 pessoas são favoráveis ao divórcio, 50 são desfavoráveis, 30 são indiferentes e 20 ainda não têm opinião formada a respeito do assunto. Então a média aritmética será: 1. igual a 180, porque todos opinaram somente uma vez. 2. igual a 40, porque é a média entre os valores 50 e 30. 3. igual a 45. 4. igual a 1, porque todos opinaram somente uma vez. 5. não há média aritmética. Justif: ______________________________________________________________________ F- Segundo o site de VEJA na internet 28% da população brasileira é de origem africana, 32% de origem portuguesa, 20% de origem italiana e 20% de outras origens. Qual é a moda quanto a origem ? 1. 32% 2. 20% 3. 32% da população. 4. origem portuguesa. 5. não podemos identificar a moda por falta de dados. Justif: ______________________________________________________________________ G- Numa determinada Escola com 300 alunos 34% deles completam o 2º grau em 3 anos e 66% em 4 anos. Qual o tempo médio de conclusão do 2º grau na referida Escola. 1. 7 anos. 2. 3 e 4 anos. 3. 3,66 anos. 4. 3 ou 4 anos. 5. 3,5 anos. H - Na série estatística formada por { -1 , -2 , 3 , 4 }: 1. a mediana está entre -2 e 3. 2. a mediana é 0,5. 3. a questão 1 e 2 estão corretas. 4. a mediana é 2. 5. não existe mediana, pois não há dados repetidos. I - Na série estatística formada por { 3 , 1 , 2 , 3 , 6 }: 1. mediana > moda > média. 2. moda < média < mediana. 3. moda = mediana = média. 4. mediana = média e não há moda. 5. média > mediana e não há moda. Justif: ______________________________________________________________________ J - Na série estatística formada por { 3 , 1 , 2 , 3 , 4 } se for alterado o valor máximo: 1. a média poderá ser alterada ou não. 2. a mediana não vai ser alterada. 3. a moda não será alterada. 4. a média será alterada. 5. a mediana vai ser alterada. Justif: ______________________________________________________________________ K- Quando a medida de posição deve ser o valor mais típico da distribuição utilizamos: 1. a média. 2. a mediana. 3. a moda. 4. a média, a moda e mediana. 5. a moda ou a média. Justif: ______________________________________________________________________ L- Quando desejamos o ponto médio exato de uma distribuição de frequência, basta calcular: 1. o desvio médio. 2. a média. 3. a moda. 4. a mediana. 5. qualquer medida de posição. Justif: ______________________________________________________________________ M- Considere uma série estatística com 2351 elementos. A posição da mediana é representada pelo: 1. 1175º elemento. 2. 1176º elemento. 3. ponto médio entre o 1175º e o 1176º elemento. 4. 1175,5º elemento. 5. Impossível resolução, pois não há identificação dos elementos. Justif: ______________________________________________________________________ N- Dados os conjuntos de números B = { 0 , 1 , 2 , 3 , 4 , 5 } e A = { 220, 225, 230, 235, 240, 245}, podemos afirmar, de acordo com as propriedades da média, que a média de A: 1. é igual à constante 220 somada ao produto da média de B por 5. 2. é igual à média de B mais a constante 220. 3. é igual à média de B multiplicada por uma constante arbitrária. 4. é igual à média de B mais a constante 220 e esse último resultado multiplicado por 5. 5. é igual à média de B multiplicada pela constante 94. Justif: _________________________________________________________________
Compartilhar