Prévia do material em texto
ESTATÍTICA APLICADA AULA 3 Profa. Aline Purcote 2 CONVERSA INICIAL Os métodos estatísticos envolvem a análise e interpretação de dados numéricos. Vimos que, para interpretar os dados corretamente, é necessário, primeiramente, organizar e sumarizar os números, sendo possível sintetizá-los sob a forma de distribuições de frequências. Outra forma de resumir os dados é apresentar um ou mais valores que sejam representativos da série estudada. Podemos apresentar os dados por meio de um valor único, utilizando medidas para descrever o conjunto de dados de uma pesquisa. Assim surge a utilização de medidas como as Medidas de Posição ou Tendência Central, altamente aplicáveis nas organizações, gerando informações úteis que servem como base para decisões do cotidiano. CONTEXTUALIZANDO Constantemente utilizamos a média para realizar análises seja em casa, seja dentro das empresas. Por exemplo, verificamos a média de consumo que um carro está fazendo e, assim, sabemos o gasto que temos, podendo comparar modelos e até tomar a decisão de comprar ou vender um veículo. Dentro de uma empresa verificamos a média de consumo de energia, média de preço ou de vendas de um determinado produto, e média de atendimento de clientes. Utilizamos a média em diversas situações, mas como calcular esta medida? Além da média, temos outras medidas que podem ser utilizadas, como a mediana e a moda; vamos calcular estas medidas e interpretar os resultados obtidos. TEMA 1 – MEDIDAS DE POSIÇÃO Uma forma mais sintética de descrever um conjunto de dados é por meio de um valor único que represente, em termos “médios”, todo o conjunto. Esse valor tende a se localizar no centro do conjunto de dados, sendo conhecido como medidas de posição ou medidas de tendência central. Visa a identificar um valor em torno do qual os dados tendem a se agrupar, facilitando a interpretação e geração de informações em uma pesquisa. 3 As medidas de posição serão aplicadas em três situações: dados não agrupados em uma distribuição de frequência, distribuição de frequência e distribuição de frequência por classe ou intervalo. Dados não agrupados em uma distribuição de frequência: Exemplo 1: 15 13 10 14 15 15 14 14 12 13 Exemplo 2: Obs: no exemplo 2 temos uma tabela, mas ela não é uma distribuição de frequência, pois não possui a informação de frequência. Neste caso temos os meses e o valor em R$. Cuidado: nem toda tabela é uma distribuição. Dados agrupados em uma distribuição de frequência: Exemplo 1: Exemplo 2: Veículos Negociados Número de Vendedores 1 1 2 3 3 5 4 1 Total 10 4 Dados agrupados em uma distribuição de frequência por classe: Salário Número de empregados 1.000 |– 2.000 2.000 |– 3.000 3.000 |– 4.000 4.000 |– 5.000 20 19 9 3 As medidas de tendência centrais mais conhecidas são: a média aritmética, a mediana e a moda. TEMA 2 – MÉDIA A média aritmética ou apenas média é a medida de centralidade mais comum e representada pelo símbolo X . É a soma dos resultados obtidos divididos pela quantidade de resultados, ou seja, somamos todos os dados apresentados e dividimos pela quantidade de dados que temos. Para calcular a média em dados não agrupados, utilizamos a fórmula: N X X em que X são os dados, N a quantidade de observações e o símbolo representa o somatório, ou seja, a soma de todos os valores. Exemplo 1: Calcule a média aritmética de 3, 4, 7, 8 e 8. Para encontrar a média precisamos somar os dados apresentados (3, 4, 7, 8 e 8) e dividir pela quantidade de observações, que neste caso são 5 observações, pois temos 5 dados: 5 88743 X 5 30 X 6X 5 Exemplo 2: Oito alunos fizeram um teste e obtiveram os seguintes resultados: 9 6 5 8 7 9 4 8 Qual a média desses resultados? 8 84978569 X 8 56 X 7X Em média os alunos obtiveram 7 pontos no teste aplicado. Exemplo 3: Foram realizadas 10 medidas do tempo (em segundos) gasto por um operário para efetuar certa tarefa, obtendo-se: 15 13 10 14 15 15 14 14 12 13 Qual o tempo médio? 10 13121414151514101315 X 10 135 X = 13,5 segundos Em média o operário gasta 13,5 segundos para realizar a tarefa. Exemplo 4: As exportações de determinado porto brasileiro registraram o seguinte movimento em bilhões de reais durante um ano. Qual foi a média mensal de exportações, em bilhões de reais? (CASTANHEIRA, 2010). 6 Para encontrar a média precisamos somar os valores mensais de exportações, segunda coluna (R$) e depois dividir por 12, pois temos 12 meses: A média mensal de exportações é de 3 bilhões de reais. TEMA 3 – MÉDIA PONDERADA A média aritmética ponderada (ou apenas média ponderada) é utilizada quando os dados estão agrupados numa distribuição de frequências. Usamos a média aritmética dos valores ponderados pelas suas respectivas frequências absolutas, ou seja, cada grandeza envolvida no cálculo da média tem diferente importância ou acontece em um número diferente de vezes durante a coleta de dados. Para isso, usamos a fórmula: N )f.X( X , em que N = f Para calcular a média ponderada temos os seguintes passos: 1. Multiplicar os dados (X) pela frequência (f) para cada um dos valores da distribuição, ou seja, para todas as linhas da tabela; 2. Somar os valores obtidos na multiplicação X.f; 3. Encontrar o valor de N somando a coluna de frequências; 4. Dividir o valor encontrado na soma de X.f pelo valor de N. Exemplo 1: Calcule a média das idades representadas na seguinte distribuição de frequências: Idade Frequência 4 4 5 6 6 6 7 4 Para calcular a média vamos seguir os passos mencionados acima: 1. Multiplicar os dados (X) – neste caso X são as idades que estão representadas na primeira coluna, pela frequência (f) que estão representadas na segunda coluna para cada um dos valores da distribuição: 3 12 36 X 7 Idade Frequência X.f 4 4 16 5 6 30 6 6 36 7 4 28 2. Somar os valores obtidos na multiplicação X.f: Idade Frequência X.f 4 4 16 5 6 30 6 6 36 7 4 28 110 3. Encontrar o valor de N somando a coluna de frequências: N= 20. Idade Frequência X.f 4 4 16 5 6 30 6 6 36 7 4 28 20 110 4. Dividir o valor encontrado na soma de X.f pelo valor de N. Idade Frequência X.f 4 4 16 5 6 30 6 6 36 7 4 28 20 110 5,5 20 110 X A idade média deste grupo é de 5,5 anos. Exemplo 2: Foram inspecionados 30 aparelhos fabricados por certa indústria, obtendo-se os seguintes números de defeitos por aparelhos: 8 Número de defeitos f 0 12 1 8 2 7 3 1 4 2 Qual o número médio de defeitos? Para calcular a média vamos encontrar a soma de X. f e o valor de N: Número de defeitos f X.f 0 12 0 1 8 8 2 7 14 3 1 3 4 2 8 30 33 1,1 30 33 X Em média os aparelhos inspecionados apresentaram 1,1 defeitos. Quando temos uma distribuição de frequências representada em intervalos ou classes, os valores de X na fórmula da média aritmética são representados pelos pontos médios (Pm) desses intervalos.Assim: X = N )f.PM( Desta forma sempre que for necessário calcular a média em uma distribuição de frequência por classe, o primeiro passo será calcular o ponto médio de cada classe, para depois seguir com o cálculo da média. Para calcular a média em uma distribuição de frequência por classe temos os seguintes passos: 9 1. Calcular o ponto médio de cada classe: 2 LiLs Pm ; 2. Multiplicar o ponto médio (Pm) pela frequência (f) para cada um dos valores da distribuição, ou seja, para todas as classes da tabela; 3. Somar os valores obtidos na multiplicação Pm.f ; 4. Encontrar o valor de N somando a coluna de frequências; 5. Dividir o valor encontrado na soma de Pm.f pelo valor de N. Exemplo 1: Foram medidas as alturas dos funcionários de uma determinada empresa, obtendo os dados apresentados na tabela abaixo. Qual a média das alturas? Para calcular a média vamos seguir os passos apresentados acima: 1. Calcular o ponto médio de cada classe: 2 LiLs Pm : Para primeira classe temos: 152 2 304 2 150154 2 LiLs Pm Seguindo o cálculo para todas as classes temos: 10 2. Multiplicar o ponto médio (Pm) pela frequência (f) para cada um dos valores da distribuição, ou seja, para todas as classes da tabela: 3. Somar os valores obtidos na multiplicação Pm.f : 4. Encontrar o valor de N somando a coluna de frequências: 5. Dividir o valor encontrado na soma de Pm.f pelo valor de N. 161 40 6440 X Em média os funcionários desta empresa possuem alturas iguais a 161 cm. 11 TEMA 4 – MEDIANA O valor da mediana é o elemento que ocupa a posição central, dividindo a distribuição em 50%, ou seja, é o valor que divide a amostra ou população em duas partes iguais. Representamos a mediana de uma amostra ou população por Md. A mediana para dados não agrupados é o valor que divide a série ordenada em dois conjuntos com o mesmo número de valores. Segundo Castanheira (2010), é necessário observar que a quantidade de dados pode ser par ou ímpar. Sendo ímpar, o valor da mediana é o valor que está no centro da série; sendo par, a mediana será média aritmética dos dois valores que estão no centro da série. Passos para o cálculo da mediana para dados não agrupados: 1. Colocar os dados em ordem crescente, ordenar a série; 2. Encontrar a quantidades de dados N, que é igual ao número de observações; 3. Verificar se N é ímpar ou par; 4. Calcular a posição da Mediana. Posição = 2 N ; 5. Calcular a mediana: Ímpar = valor central. Par = Média dos valores centrais. Exemplo 1: Considere a série 2,5,6,8,10,13,15,16,18 e calcule a mediana. Para encontrar a mediana seguimos os passos descritos acima: 1. Ordenar; neste exemplo, a série já está ordenada. 2. Encontrar o Número de observações (N), isto é, contar quantos dados temos na série. Neste caso, N = 9. 3. Verificar se N é ímpar ou par: N = 9 é ímpar. 4. Calcular a posição. Posição = 55,4 2 9 2 N 12 Obs: sempre que a posição apresentar número com vírgula, arredondar para o inteiro mais próximo. 5. Calcular a mediana. Como o N é ímpar, vamos procurar na série ordenada o número que está na posição 5. Para isso, contamos as posições, ou seja, o número 2 está na primeira posição e o número 5 na segunda. Seguindo este processo temos o número 10 na quinta posição. 2,5,6,8,10,13,15,16,18 Temos que a mediana é igual a 10, pois abaixo de 10 temos 4 números (2,5,6,8) e acima de 10 também 4 (13, 15, 16, 18). Exemplo 2: Considere a série 1,6,3,10,9,8 e calcule a mediana. Passos: 1. Ordenar a série: 1,6,3,10,9,8 1, 3, 6, 8, 9, 10 2. Encontrar o número de observações (N), isto é, contar quantos dados temos na série, assim N = 6; 3. Verificar se N é ímpar ou par: N = 6 é par; 4. Calcular Posição; 3 2 6 2 N 5. Calcular a mediana. Como o N é par, precisamos encontrar os dois valores que estão no meio da série para calcular a média, assim vamos procurar na série ordenada o número que está na posição 3 e a próxima posição que é a posição 4. 1,3,6,8,9,10 Na posição 3 temos o número 6, e na posição 4 o número 8, desta forma devemos encontrar a média entre os dois valores, ou seja, somar e dividir por 2. Desta forma a mediana será: Md = 7 2 14 2 86 13 2 N Exemplo 3: Calcule a mediana dos seguintes dados a. 5 8 4 6 7 3 4 Md = 5 b. 8 0 7 4 7 10 6 5 Md = 6,5 c. 5, 2, 6, 13, 9, 15, 10 Md = 9 Para calcular a mediana em uma distribuição de frequências seguimos os seguintes passos para determinar a mediana: 1. Encontrar o valor de N que é igual a soma das frequências; 2. Determinar se N é par ou ímpar; 3. Calcular frequência acumulada (fa); 4. Calcular a Posição = ; 5. Identificar na frequência acumulada a posição calculada no passo 4. Sempre buscar um valor igual ou maior que a posição calculada. 6. Calcular a mediana: Ímpar = valor central Par = Média dos valores centrais Exemplo 4: Foram inspecionados 30 aparelhos fabricados por certa indústria, obtendo-se os seguintes números de defeitos por aparelhos: Número de defeitos f 0 12 1 8 2 7 3 1 4 2 Qual a mediana desta distribuição? Para determinar a mediana seguimos os passos indicados acima: 14 1. Encontrar o valor de N: para encontrar somamos as frequências e temos N = 30: Número de defeitos f 0 12 1 8 2 7 3 1 4 2 30 2. Determinar se N é par ou ímpar: neste caso N = 30, então N é par. Logo a mediana será obtida por meio dos dois elementos centrais da série. 3. Calcular a Frequência Acumulada: para calcular a frequência acumulada repetimos a primeira frequência e somamos até chegar a última: Número de defeitos f fa 0 12 12 1 8 20 2 7 27 3 1 28 4 2 30 4. Calcular Posição: Posição = 15 2 30 2 N Como N é par precisamos de dois valores centrais assim consideramos o valor que está na posição 15 e posição 16. 5. Identificar por meio da frequência acumulada onde se encontram a posição. No exemplo, posições 15 e 16. Procuramos na coluna da 15 frequência acumulada valor igual ou maior a 15 e 16; este número está na frequência acumulada igual a 20 que possui dado igual a 1. Número de defeitos f fa 0 12 12 1 8 20 2 7 27 3 1 28 4 2 30 Posição 15 = 1 Posição 16 = 1 6. Calcular a mediana: Md = 1 2 2 2 11 Logo a mediana desta distribuição é igual a 1, ou seja 50% dos aparelhos verificamos possui até 1 defeito. Exemplo 5: Em um determinado dia foi registrado o número de veículos negociados por uma amostra de 10 vendedores de uma agência de automóveis obtendo a seguinte tabela. Considerando os dados calcule a mediana. (Adaptação: Shiguti, Wanderley Akira; Shiguti, Valéria da S. C. Apostila De Estatística) Seguindo os passos temos: 1. Encontrar o valor de N: para encontrar somamos as frequências e temos N = 10: 16 2. Determinar se N é par ou ímpar: neste caso N = 10, então N é par. Logo, a mediana será obtida por meio dos dois elementos centrais da série. 3. Calcular a Frequência Acumulada: para calcular a frequência acumulada repetimos a primeira frequênciae somamos até chegar a última: 4. Calcular Posição: Posição = 5 2 10 2 N Como N é par, precisamos de dois valores centrais, assim consideramos o valor que está na posição 5 e na posição 6. 5. Identificar por meio da frequência acumulada onde se encontra a posição. No exemplo, posições 5 e 6. Procuramos na coluna da frequência acumulada valor igual ou maior a 5 e 6; este número está na frequência acumulada igual a 9 que possui dado igual a 3. Posição 5 = 3 Posição 6 = 3 6. Calcular a mediana: Md = 3 2 6 2 33 Logo a mediana desta distribuição é igual a 3, ou seja, 50% dos vendedores comercializaram no máximo 3 veículos, ou então, metade dos vendedores comercializou pelo menos 3 veículos. Para calcular a mediana em uma distribuição de frequências com os dados agrupados por classes, seguimos os seguintes passos para determinar a mediana: 1. Encontrar o valor de N que é igual à soma das frequências; 17 2. Calcular a Posição = 2 N ; 3. Calcular Frequência Acumulada (fa). 4. Identificar na frequência acumulada a posição calculada no passo 2. Sempre buscar um valor igual ou maior que a posição calculada. 5. Calcular a mediana, utilizando a fórmula: Md = Li + A f fN Md ant . )2/( Em que: Li = limite inferior da classe que contém a mediana N = tamanho da amostra antf = soma das frequências anteriores à classe que contém a mediana. A = amplitude da classe que contém a mediana. A = Ls - Li Mdf = frequência da classe que contém a mediana. Exemplo 6: A tabela abaixo representa as notas obtidas por um grupo de 58 alunos matriculados em uma determinada disciplina. Calcule a mediana. (Baseado em SHIGUTI & SHIGUTI, 2006) Para calcular a mediana seguimos os passos mencionados acima: 1. Encontrar o valor de N, que é igual à soma das frequências; 18 2. Calcular a Posição: Posição = 29 2 58 2 N 3. Calcular Frequência Acumulada (fa). 4. Identificar na frequência acumulada a posição calculada no passo 2. Sempre buscar um valor igual ou maior que a posição calculada. Posição = 29. Desta forma temos que a mediana está na terceira classe. 5. Calcular a mediana, utilizando a fórmula: Md = Li + A f fN Md ant . )2/( Como a posição foi encontrada na terceira classe ela será utilizada como base para o cálculo, em que: Li = 55 29 2 58 2 N antf = soma das frequências anteriores à classe que contém a mediana = 17 19 antf A = Ls – Li = 65 – 55 = 10 Mdf = frequência da classe que contém a mediana = 18 Conhecidos todos os valores, aplicamos a fórmula e encontramos a mediana: A mediana é igual a 61,67, ou seja, 50% dos alunos obtiveram nota máxima de 61,67 pontos, ou então, metade dos alunos obtiveram nota maior que 61,67 pontos. TEMA 5 – MODA A moda é representada pelo valor que ocorre o maior número de vezes, ou seja, é o valor que mais se repete em uma série de dados. É o valor mais frequente da distribuição e representado por Mo. Nos dados não agrupados obtemos a moda pela observação da série, ou seja, verificamos o valor que mais se repete. Um conjunto de valores pode não apresentar moda, como também, a moda poderá não ser única. Exemplo 1: Na série 7, 10, 9, 8, 12, 10, 11, 10 a moda é igual a 10, pois este número aparece 3 vezes. 20 Exemplo 2: A série 3, 5, 8, 10, 12 não apresenta moda, isto é, a série é amodal. Não temos moda, pois todos os dados aparecem apenas uma vez. Exemplo 3: A série 4, 3, 2, 4, 5, 7, 6, 4, 7, 9, 8, 7 apresenta duas modas: 4 e 7, isto é, a série é bimodal. Isso ocorre porque tanto o número 4 como 7 aparecem 3 vezes na série. Em alguns casos, pode haver dois ou mais valores de concentração. Dizemos, então, que a série tem dois ou mais valores modais. Na distribuição de frequência sem o agrupamento em intervalos ou classes, a moda é o valor que possui maior frequência. Desta forma, a moda é encontrada pela verificação da coluna de frequência; ao encontrar a maior frequência, a moda será o dado, ou seja, o valor de X que está na primeira coluna. Exemplo 4: Encontre a moda da seguinte distribuição. Número de defeitos f 0 12 1 8 2 7 3 1 4 2 Verificamos na coluna de frequência qual é a maior frequência apresentada; neste caso, a maior é 12. Assim, a moda é identificada pelo dado com que possui esta frequência, ou seja, a moda é igual a zero (Mo = 0). Para o cálculo da moda em uma distribuição de frequências com dados agrupados em classes, temos o seguinte: 1. Identificar em que classe se encontra a moda, ou seja, a classe que apresenta a maior frequência de ocorrência; 2. Determinar o valor da moda utilizando a fórmula: Mo = Li + postant post ff A.f Em que: Li = limite inferior da classe que contém a moda. postf = frequência da classe posterior à classe que contém a moda. antf = frequência da classe anterior á classe que contém a moda. 21 A = amplitude da classe que contém a moda. A = Ls – Li. Exemplo 6: A tabela abaixo representa as notas obtidas por um grupo de 58 alunos matriculados em uma determinada disciplina. Calcule a moda. (Baseado em SHIGUTI & SHIGUTI, 2006) Passos para determinação da moda: 1. Identificar em que classe se encontra a moda, ou seja, a classe que apresenta a maior frequência de ocorrência. A maior frequência é 18, assim a moda está localizada na seguinte classe: 2. Determinar o valor da moda utilizando a fórmula, em que: Li = 55 postf = frequência da classe posterior à classe que contém a moda = 14 antf = frequência da classe anterior à classe que contém a moda = 12 A = Ls – Li = 65 – 55 = 10 1412 10.14 55 Mo 26 140 55Mo 38,555Mo 38,60Mo A moda é igual a 60,38, ou seja, a nota que aparece com mais frequência é 60,38. post f ant f 22 TROCANDO IDEIAS Nesta aula estudamos as principais medidas de posição: média, mediana e moda, e verificamos que estas medidas estão presentes em diversas situações do nosso cotidiano. Você já utilizou algumas das medidas citadas em seu dia a dia em casa ou dentro da empresa? Como foi esta utilização? NA PRÁTICA Frequentemente utilizamos as medidas para auxiliar na tomada de decisão; verificamos o preço médio de um produto, o consumo médio, o tempo médio de entrega e assim geramos informações úteis em nosso cotidiano dentro e fora das organizações. Outras aplicações que ocorrem com frequência são comparar valores e realizar análises, além de auxiliar no planejamento e controle embasando às tomadas de decisões. Um exemplo de utilização das medidas pode ocorrer dentro das organizações através de pesquisas. Por exemplo, uma loja está interessada em conhecer o perfil de seus clientes, assim coleta as idades de uma amostra de consumidores para estimar sua média de idade. Com esta informação, a empresa pode embasar os anúncios da loja direcionando o anúncio adequado para a faixa etária de seu público, garantindo assim mais assertividade e conquistando o seu público principal. Podemos também citar outros exemplos: observando os tempos de viagem de um determinado ônibus, em várias viagens, é possível se chegar a um valor que indica,em geral, o tempo gasto nessa viagem; se observarmos o número de investimentos que ocorrem em determinada instituição, podemos obter qual é o investimento mais procurado, o quanto, em média, é investido em cada situação, e conhecer o perfil de investidores em determinada instituição financeira. FINALIZANDO Nesta aula apresentamos as principais medidas de posição, seus cálculos, aplicações e interpretações dos resultados obtidos. Definimos e calculamos a média, mediana e moda em três situações: dados não agrupados, 23 agrupados em uma distribuição de frequência e agrupados em uma distribuição de frequência por classe ou intervalo. REFERÊNCIAS CASTANHEIRA, N. P. Estatística aplicada a todos os níveis. Curitiba: InterSaberes, 2010. LARSON, R.; FARBER, B. Estatística aplicada. 2. ed. São Paulo: Pearson, 2004. MARTINS, G. de A. Estatística geral e aplicada. 3. ed. São Paulo: Atlas, 2010. SHIGUTI, W. A.; SHIGUTI, V. da S. C. Apostila de estatística. Brasília: UFSC, 2006. Disponível em: <http://www.inf.ufsc.br/~paulo.s.borges/Download/Apostila5_INE5102_Quimica. pdf>. Acesso em: 24 fev. 2017.