Baixe o app para aproveitar ainda mais
Prévia do material em texto
23/06/2020 Noções básicas de estatística: medidas de posição e dispersão https://www.senacrs.com.br/cursos_rede/gestao_de_projetos/html/conteudo/nocoes_basicas_de_estatisticas/index.html 1/15 Noções básicas de estatística: medidas de posição e dispersão Até o momento, vimos apenas a parte conceitual da estatística. Vimos o que é a estatística e quais são as suas áreas. Aprendemos como são feitas as coletas e a exposição de dados e também o que são os modelos estatísticos e suas representações por fórmulas matemáticas. Neste material, abordaremos os cálculos matemáticos utilizados na estatística para medir os dados. Esses cálculos fornecem diversas informações sobre os dados. Antes de entendermos os cálculos, é importante salientar que os dados podem ser apresentados de duas maneiras: agrupados ou não agrupados. Os dados não agrupados são os valores que aparecem de maneira individual. Suponhamos, por exemplo, que você vá medir os alunos de uma turma para verificar a altura de cada um. Os dados obtidos podem ser expostos de forma não agrupada, como mostra a figura 1. 23/06/2020 Noções básicas de estatística: medidas de posição e dispersão https://www.senacrs.com.br/cursos_rede/gestao_de_projetos/html/conteudo/nocoes_basicas_de_estatisticas/index.html 2/15 Altura (em metros) Quantidade 0,96 2 0,98 1 1,00 1 1,05 2 1,09 1 1,10 1 1,11 2 Figura 1 – Altura dos alunos Os dados agrupados são os valores que são agrupados em classes. Veja na figura 2 como os dados da altura das crianças podem ser agrupados dessa maneira. Altura (em metros) Quantidade 0,96 |– 1,00 3 1,00 |– 1,04 1 1,04 |– 1,08 2 1,08 |– 1,12 4 Figura 2 – Altura dos alunos, em classes Atenção - Os conteúdos trabalhados nos tópicos a seguir abordarão as medidas de posição e 23/06/2020 Noções básicas de estatística: medidas de posição e dispersão https://www.senacrs.com.br/cursos_rede/gestao_de_projetos/html/conteudo/nocoes_basicas_de_estatisticas/index.html 3/15 dispersão somente para dados não agrupados. Medidas de posição para dados não agrupados As medidas de posição indicam a localização de dados. Para que os conceitos das medidas fiquem bem claros, trabalharemos com eles de forma prática. Partiremos de um caso hipotético para ilustrar as funções de um auxiliar de recursos humanos. Imagine a seguinte situação: você é auxiliar de recursos humanos em uma empresa, e seu chefe pediu que você fizesse o levantamento do salário dos dez funcionários que trabalham no setor de logística. Você deverá determinar os valores em salários-mínimos. Salário de cada funcionário: Arnaldo recebe 2 salários-mínimos; Bernardo recebe 2 salários- mínimos; Carlos recebe 5 salários-mínimos; Daniel recebe 4 salários-mínimos; Evandro recebe 8 salários-mínimos; Filipe recebe 9 salários-mínimos; Guilherme recebe 7 salários- mínimos; Horácio recebe 2 salários-mínimos; Ivan recebe 1 salário-mínimo; e João, 6 salários- mínimos. De modo organizado, podemos apresentar os dados da seguinte forma: 23/06/2020 Noções básicas de estatística: medidas de posição e dispersão https://www.senacrs.com.br/cursos_rede/gestao_de_projetos/html/conteudo/nocoes_basicas_de_estatisticas/index.html 4/15 Funcionário Valor do salário emsalários-mínimos (Xi) Arnaldo 2 Bernardo 2 Carlos 5 Daniel 4 Evandro 8 Filipe 9 Guilherme 7 Horácio 2 Ivan 1 João 6 Figura 3 – Salário dos funcionários do setor de logística Xi é uma variável aleatória que indica os salários dos funcionários do setor de logística. As observações assumiram os valores 2, 2, 5, 4, 8, 9, 7, 2, 1 e 6 salários-mínimos. Rol O rol é a forma de organizar os dados e de apresentá-los em ordem crescente ou decrescente. 23/06/2020 Noções básicas de estatística: medidas de posição e dispersão https://www.senacrs.com.br/cursos_rede/gestao_de_projetos/html/conteudo/nocoes_basicas_de_estatisticas/index.html 5/15 Funcionário Valor do salário emsalários-mínimos (Xi) Ivan 1 Arnaldo 2 Bernardo 2 Horácio 2 Daniel 4 Carlos 5 João 6 Guilherme 7 Evandro 8 Filipe 9 Figura 4 – Salários dos funcionários em ordem crescente A determinação do rol crescente, na forma de conjunto, fica assim: X = {1, 2, 2, 2, 4, 5, 6, 7, 8, 9} A variável Xi assume oito valores. Logo, pode-se determinar que N = 10 (número de observações). Moda (Mo) Moda (Mo) é o dado que mais vezes aparece na amostra. Isso significa que tem a maior frequência absoluta f (número de repetições) entre as N observações. 23/06/2020 Noções básicas de estatística: medidas de posição e dispersão https://www.senacrs.com.br/cursos_rede/gestao_de_projetos/html/conteudo/nocoes_basicas_de_estatisticas/index.html 6/15 Observando a figura 4, pode-se perceber que a moda do conjunto é 2, pois esse é o valor que mais se repete no conjunto (f = 3) (Arnaldo, Bernardo e Horácio). A determinação de Mo = 2 mostra que é maior o número de funcionários que recebem 2 salários-mínimos. Se a maior frequência estiver associada a mais de um valor de Xi , então a distribuição terá mais de uma moda. Ela poderá ser bimodal (dois valores de Xi apresentam a maior frequência); trimodal (três valores de Xi apresentam a maior frequência); ou multimodal (vários valores apresentam a maior frequência). Ainda pode ser amodal, sem moda, sem valores repetidos. Para observar mais facilmente o dado que mais aparece, devem-se ordenar os dados em rol. Média (X̅) A média é uma medida de tendência central cujo objetivo é determinar uma possível localização, o espaço do conjunto que deu origem à média. A média X é representada pelo símbolo X̅, tal que: A letra grega sigma (∑) representa um somatório. 23/06/2020 Noções básicas de estatística: medidas de posição e dispersão https://www.senacrs.com.br/cursos_rede/gestao_de_projetos/html/conteudo/nocoes_basicas_de_estatisticas/index.html 7/15 Na equação, fi é o número de repetições da observação; e Xi são as observações. Podemos então chamar fi de frequência absoluta de Xi. N é o total de observações do rol. Vamos agora calcular a média do exemplo. Em média, cada trabalhador recebe 4,6 salários-mínimos. De acordo com a fundamentação teórica, a média é um fator de localização do conjunto, fazendo com que 4,6 salários-mínimos sejam, mesmo que simbolicamente, a melhor representação de salário por trabalhador. Mediana (Md) Mediana (Md) é a medida que ocupa a posição central do rol. Ela divide o conjunto original em dois conjuntos de mesmo tamanho. Geram-se dois subconjuntos de mesmo número de observações, ou seja, 50% dos dados são superiores à mediana, e 50% são inferiores. Para calcular a mediana, devemos seguir estes passos: 1.º Colocar os valores em ordem crescente ou decrescente. 2.º Encontrar a posição central da amostra por meio da equação (n + 1) / 2. 23/06/2020 Noções básicas de estatística: medidas de posição e dispersão https://www.senacrs.com.br/cursos_rede/gestao_de_projetos/html/conteudo/nocoes_basicas_de_estatisticas/index.html 8/15 Funcionário Valor do salário emsalários-mínimos (Xi) Posição Ivan 1 1º Arnaldo 2 2º Bernardo 2 3º Horácio 2 4º Daniel 4 5º Carlos 5 6º João 6 7º Guilherme 7 8º Evandro 8 9º Filipe 9 10º Figura 5 – Posição dos funcionários por salário No nosso exemplo, as dez observações já estão em ordem crescente. Para encontrarmos a posição central, devemos usar esta equação: 23/06/2020 Noções básicas de estatística: medidas de posição e dispersão https://www.senacrs.com.br/cursos_rede/gestao_de_projetos/html/conteudo/nocoes_basicas_de_estatisticas/index.html 9/15 A posição 5,5 está entre a 5.ª e a 6.ª posições. Portanto, calcula-se a média entre os valores que ocupam essas posições, desta maneira: Desses dados, 50% são inferiores a 4,5 (1, 2, 2, 2, 4); e 50% são superiores a 4,5 (5, 6, 7, 8, 9). Medidas de dispersão de dados não agrupados: variância (var) e desvio- padrão (dp) Na estatística, há ferramentas que permitem conferir se os valores de um conjunto de dados estão espalhados ou mais agrupados, bem como averiguara distância entre esses valores. Tais ferramentas são conhecidas como medidas de dispersão, sendo as principais a variância e o desvio-padrão. E o que cada uma delas representa? Variância (var) 23/06/2020 Noções básicas de estatística: medidas de posição e dispersão https://www.senacrs.com.br/cursos_rede/gestao_de_projetos/html/conteudo/nocoes_basicas_de_estatisticas/index.html 10/15 Variância (var) é uma medida de dispersão que resulta da média dos quadrados dos desvios. Os desvios (di) são as distâncias entre a média do conjunto e os valores das observações. As expressões para calcular as variâncias populacionais são estas: Quando se quer calcular a variância a partir de uma amostra, é necessário substituir N por (n - 1), em que n é igual ao tamanho da amostra utilizada. A variável aleatória Xi determina o número salários-mínimos por trabalhador. Dez trabalhadores foram consultados, e as observações assumiram os valores 1, 2, 2, 2, 4, 5, 6, 7, 8, e 9 salários-mínimos. 23/06/2020 Noções básicas de estatística: medidas de posição e dispersão https://www.senacrs.com.br/cursos_rede/gestao_de_projetos/html/conteudo/nocoes_basicas_de_estatisticas/index.html 11/15 Sabendo que a média X̅ = 4,6, podemos calcular os desvios, pois estes são resultado de Xi menos a média dos dados. Vamos agora calcular o quadrado dos desvios: 23/06/2020 Noções básicas de estatística: medidas de posição e dispersão https://www.senacrs.com.br/cursos_rede/gestao_de_projetos/html/conteudo/nocoes_basicas_de_estatisticas/index.html 12/15 Agora, podemos calcular a variância: 23/06/2020 Noções básicas de estatística: medidas de posição e dispersão https://www.senacrs.com.br/cursos_rede/gestao_de_projetos/html/conteudo/nocoes_basicas_de_estatisticas/index.html 13/15 Quanto menor for a variância, mais próximos os valores estarão da média; e quanto maior ela for, mais os valores estarão distantes da média. Desvio-padrão (dp) O desvio-padrão é representado pelas letras dp. O dp é a raiz quadrada da variância. Como os valores originais não são quadráticos, é preciso retirar a raiz quadrada da variância como fator de correção. O desvio-padrão tem a mesma unidade de medida da variável de estudo. Temos, então: O valor que define um desvio-padrão para mais ou para menos em torno da média (dispersão) é 2,69 salários-mínimos por trabalhador. Como esse número representa uma expectativa de variabilidade em torno da média, então sua interpretação pode assumir valores decimais. 23/06/2020 Noções básicas de estatística: medidas de posição e dispersão https://www.senacrs.com.br/cursos_rede/gestao_de_projetos/html/conteudo/nocoes_basicas_de_estatisticas/index.html 14/15 O número médio de salários-mínimos por trabalhador entre os dez consultados é de 4,6 salários-mínimos, com 2,69 salários-mínimos para mais ou para menos. Quanto menor for o desvio-padrão, mais os valores da variável se aproximarão de sua média, ou seja, os dados estarão mais agrupados. Quanto maior for o desvio-padrão, mais significativa será a heterogeneidade entre os elementos de um conjunto, ou seja, os dados estarão mais espalhados ou dispersos. No nosso caso, quanto menor for o desvio-padrão, mais homogêneos serão os salários dos funcionários, ou seja, os funcionários receberão salários mais parecidos. E, quanto maior for o desvio-padrão, maior será a diferença salarial entre os funcionários da empresa. Vamos aprender agora a utilizar alguns instrumentos da estatística no Excel. Clique para assistir ao vídeo. Referências bibliográficas CRESPO, Antônio A. Estatística Fácil. São Paulo: Saraiva, 2002. IGNÁCIO, Sérgio Aparecido. Importância da estatística para o processo de conhecimento e tomada de decisão. Nota Técnica Ipardes, Curitiba, n. 6, out. 2010. 15 p. 23/06/2020 Noções básicas de estatística: medidas de posição e dispersão https://www.senacrs.com.br/cursos_rede/gestao_de_projetos/html/conteudo/nocoes_basicas_de_estatisticas/index.html 15/15 TAVARES, Marcelo. Estatística aplicada à administração. Florianópolis: Departamento de Ciências da Administração / UFSC; [Brasília]: CAPES: UAB, 2011. 222 p. WALTER, Maria Inez Machado Telles. Estatística Básica. Brasília: MSD, 2000. v. 1. 72 p.
Compartilhar