Baixe o app para aproveitar ainda mais
Prévia do material em texto
TÉCNICO EM ADMINISTRAÇÃO Noções básicas de estatística: medidas de posição e dispersão Até o momento, vimos apenas a parte conceitual da estatística. Vimos o que é a estatística e quais são as suas áreas. Aprendemos como são feitas as coletas e a exposição de dados e também o que são os modelos estatísticos e suas representações por fórmulas matemáticas. Neste material, abordaremos os cálculos matemáticos utilizados na estatística para medir os dados. Esses cálculos fornecem diversas informações sobre os dados. Antes de entendermos os cálculos, é importante salientar que os dados podem ser apresentados de duas maneiras: agrupados ou não agrupados. Os dados não agrupados são os valores que aparecem de maneira individual. Suponhamos, por exemplo, que você vá medir os alunos de uma turma para verificar a altura de cada um. Os dados obtidos podem ser expostos de forma não agrupada, como mostra a figura 1. Altura (em metros) Quantidade 0,96 2 0,98 1 1,00 1 1,05 2 1,09 1 1,10 1 1,11 2 Figura 1 – Altura dos alunos Os dados agrupados são os valores que são agrupados em classes. Veja na figura 2 como os dados da altura das crianças podem ser agrupados dessa maneira. Altura (em metros) Quantidade 0,96 |– 1,00 3 1,00 |– 1,04 1 1,04 |– 1,08 2 1,08 |– 1,12 4 Figura 2 – Altura dos alunos, em classes Atenção - Os conteúdos trabalhados nos tópicos a seguir abordarão as medidas de posição e dispersão somente para dados não agrupados. Medidas de posição para dados não agrupados As medidas de posição indicam a localização de dados. Para que os conceitos das medidas fiquem bem claros, trabalharemos com eles de forma prática. Partiremos de um caso hipotético para ilustrar as funções de um auxiliar de recursos humanos. Imagine a seguinte situação: você é auxiliar de recursos humanos em uma empresa, e seu chefe pediu que você fizesse o levantamento do salário dos dez funcionários que trabalham no setor de logística. Você deverá determinar os valores em salários-mínimos. Salário de cada funcionário: Arnaldo recebe 2 salários-mínimos; Bernardo recebe 2 salários-mínimos; Carlos recebe 5 salários-mínimos; Daniel recebe 4 salários- mínimos; Evandro recebe 8 salários-mínimos; Filipe recebe 9 salários-mínimos; Guilherme recebe 7 salários-mínimos; Horácio recebe 2 salários-mínimos; Ivan recebe 1 salário-mínimo; e João, 6 salários-mínimos. De modo organizado, podemos apresentar os dados da seguinte forma: Funcionário Valor do salário em salários-mínimos (Xi) Arnaldo 2 Bernardo 2 Carlos 5 Daniel 4 Evandro 8 Filipe 9 Guilherme 7 Horácio 2 Ivan 1 João 6 Figura 3 – Salário dos funcionários do setor de logística Xi é uma variável aleatória que indica os salários dos funcionários do setor de logística. As observações assumiram os valores 2, 2, 5, 4, 8, 9, 7, 2, 1 e 6 salários- mínimos. Rol O rol é a forma de organizar os dados e de apresentá-los em ordem crescente ou decrescente. Funcionário Valor do salário em salários-mínimos (Xi) Ivan 1 Arnaldo 2 Bernardo 2 Horácio 2 Daniel 4 Carlos 5 João 6 Guilherme 7 Evandro 8 Filipe 9 Figura 4 – Salários dos funcionários em ordem crescente A determinação do rol crescente, na forma de conjunto, fica assim: X = {1, 2, 2, 2, 4, 5, 6, 7, 8, 9} A variável Xi assume oito valores. Logo, pode-se determinar que N = 10 (número de observações). Moda (Mo) Moda (Mo) é o dado que mais vezes aparece na amostra. Isso significa que tem a maior frequência absoluta f (número de repetições) entre as N observações. Observando a figura 4, pode-se perceber que a moda do conjunto é 2, pois esse é o valor que mais se repete no conjunto (f = 3) (Arnaldo, Bernardo e Horácio). A determinação de Mo = 2 mostra que é maior o número de funcionários que recebem 2 salários-mínimos. Se a maior frequência estiver associada a mais de um valor de Xi , então a distribuição terá mais de uma moda. Ela poderá ser bimodal (dois valores de Xi apresentam a maior frequência); trimodal (três valores de Xi apresentam a maior frequência); ou multimodal (vários valores apresentam a maior frequência). Ainda pode ser amodal, sem moda, sem valores repetidos. Para observar mais facilmente o dado que mais aparece, devem-se ordenar os dados em rol. Média (X̅) A média é uma medida de tendência central cujo objetivo é determinar uma possível localização, o espaço do conjunto que deu origem à média. A média X é representada pelo símbolo X̅, tal que: x maiúsculo com barra em cima é igual ao somatório de cada X multiplicado pela sua respectiva frequência, dividido pela população. Na equação, efe i é o número de repetições da observação, e X i são as observações. Podemos então chamar efe i de frequência absoluta de X i. N é o total de elementos do rol. A letra grega sigma (∑) representa um somatório. Na equação, fi é o número de repetições da observação; e Xi são as observações. Podemos então chamar fi de frequência absoluta de Xi. N é o total de observações do rol. Vamos agora calcular a média do exemplo. Equação: x maiúsculo com barra em cima é igual a, 1 multiplicado por 1, mais 2 multiplicado por 3, mais 4 multiplicado por 1, mais 5 multiplicado por 1, mais 6 multiplicado por 1, mais 7 multiplicado por 1, mais 8 multiplicado por 1, mais 9 multiplicado por 1, dividido por 10. x maiúsculo com barra em cima é igual a 46 dividido por 10. x maiúsculo com barra em cima é igual a 4,6. Em média, cada trabalhador recebe 4,6 salários-mínimos. De acordo com a fundamentação teórica, a média é um fator de localização do conjunto, fazendo com que 4,6 salários-mínimos sejam, mesmo que simbolicamente, a melhor representação de salário por trabalhador. Mediana (Md) Mediana (Md) é a medida que ocupa a posição central do rol. Ela divide o conjunto original em dois conjuntos de mesmo tamanho. Geram-se dois subconjuntos de mesmo número de observações, ou seja, 50% dos dados são superiores à mediana, e 50% são inferiores. Para calcular a mediana, devemos seguir estes passos: 1.º Colocar os valores em ordem crescente ou decrescente. 2.º Encontrar a posição central da amostra por meio da equação (n + 1) / 2. Funcionário Valor do salário em salários-mínimos (Xi) Posição Ivan 1 1º Arnaldo 2 2º Bernardo 2 3º Horácio 2 4º Daniel 4 5º Carlos 5 6º João 6 7º Guilherme 7 8º Evandro 8 9º Filipe 9 10º Figura 5 – Posição dos funcionários por salário No nosso exemplo, as dez observações já estão em ordem crescente. Para encontrarmos a posição central, devemos usar esta equação: Posição é igual a, abre parênteses, 10 mais 1, fecha parênteses, dividido por 2. Posição é igual a 5,5. A posição 5,5 está entre a 5.ª e a 6.ª posições. Portanto, calcula-se a média entre os valores que ocupam essas posições, desta maneira: 4 mais 5 dividido por 2 é igual a 4,5 salários-mínimos. Desses dados, 50% são inferiores a 4,5 (1, 2, 2, 2, 4); e 50% são superiores a 4,5 (5, 6, 7, 8, 9). Medidas de dispersão de dados não agrupados: variância (var) e desvio-padrão (dp) Na estatística, há ferramentas que permitem conferir se os valores de um conjunto de dados estão espalhados ou mais agrupados, bem como averiguar a distância entre esses valores. Tais ferramentas são conhecidas como medidas de dispersão, sendo as principais a variância e o desvio-padrão. E o que cada uma delas representa? Variância (var) Variância (var) é uma medida de dispersão que resulta da média dos quadrados dos desvios. Os desvios (di) são as distâncias entre a média do conjunto e os valores das observações. As expressões para calcular as variâncias populacionais são estas: variância é igual sigma, abre parênteses, d i, fecha parênteses, ao quadrado, dividido por total de observações. d i é igual ao valor de x i menos x com barra em cima. Quando se quer calcular a variância a partir de uma amostra, é necessário substituir N por (n - 1), em que n é igual ao tamanho da amostra utilizada. A variável aleatória Xi determina o número salários-mínimos por trabalhador.Dez trabalhadores foram consultados, e as observações assumiram os valores 1, 2, 2, 2, 4, 5, 6, 7, 8, e 9 salários-mínimos. Sabendo que a média X̅ = 4,6, podemos calcular os desvios, pois estes são resultado de Xi menos a média dos dados. Vamos agora calcular o quadrado dos desvios: Agora, podemos calcular a variância: variância é igual a 12,96 mais 6,76 mais 6,76 mais 6,76 mais 0,36 mais 0,16 mais 1,96 mais 5,76 mais 5,76 mais 11,56 mais 19,36, dividido por 10. Variância é igual a 7,24. Quanto menor for a variância, mais próximos os valores estarão da média; e quanto maior ela for, mais os valores estarão distantes da média. Desvio-padrão (dp) O desvio-padrão é representado pelas letras dp. O dp é a raiz quadrada da variância. Como os valores originais não são quadráticos, é preciso retirar a raiz quadrada da variância como fator de correção. O desvio-padrão tem a mesma unidade de medida da variável de estudo. Temos, então: O valor que define um desvio-padrão para mais ou para menos em torno da média (dispersão) é 2,69 salários-mínimos por trabalhador. Como esse número representa uma expectativa de variabilidade em torno da média, então sua interpretação pode assumir valores decimais. O número médio de salários-mínimos por trabalhador entre os dez consultados é de 4,6 salários-mínimos, com 2,69 salários-mínimos para mais ou para menos. Quanto menor for o desvio-padrão, mais os valores da variável se aproximarão de sua média, ou seja, os dados estarão mais agrupados. Quanto maior for o desvio-padrão, mais significativa será a heterogeneidade entre os elementos de um conjunto, ou seja, os dados estarão mais espalhados ou dispersos. No nosso caso, quanto menor for o desvio-padrão, mais homogêneos serão os salários dos funcionários, ou seja, os funcionários receberão salários mais parecidos. E, quanto maior for o desvio-padrão, maior será a diferença salarial entre os funcionários da empresa. Referências bibliográficas CRESPO, Antônio A. Estatística Fácil. São Paulo: Saraiva, 2002. IGNÁCIO, Sérgio Aparecido. Importância da estatística para o processo de conhecimento e tomada de decisão. Nota Técnica Ipardes, Curitiba, n. 6, out. 2010. 15 p. TAVARES, Marcelo. Estatística aplicada à administração. Florianópolis: Departamento de Ciências da Administração / UFSC; [Brasília]: CAPES: UAB, 2011. 222 p. WALTER, Maria Inez Machado Telles. Estatística Básica. Brasília: MSD, 2000. v. 1. 72 p.
Compartilhar