Baixe o app para aproveitar ainda mais
Prévia do material em texto
06/03/2018 1 Medidas de Dispersão Para entender a importância e o conceito das medidas de dispersão, vamos analisar a situação a seguir: Por exemplo, você é um agente de compra de uma grande firma de manufatura e regularmente faz pedidos de compra com dois diferentes fornecedores. Depois de diversos meses de trabalho, você descobre que o número médio de dias exigido para preencher os pedidos de compra é de 10,3 dias para ambos os fornecedores. 1 Medidas de Dispersão A Figura 1 resume o número de dias trabalhados exigido para preencher os pedidos de compra dos fornecedores. Embora o número médio de dias seja 10,3 para ambos os fornecedores, será que eles têm o mesmo grau de confiabilidade em termos de fazer entregas no tempo programado? Que fornecedor você preferiria? 2 Medidas de Dispersão Figura 1: diagrama em colunas mostrando o número de dias exigidos para preencher os pedidos de compra. Fonte: Anderson et al. Estatística Aplicada à Administração e Economia 3 Tempo médio de entrega dos fornecedores A e B • 4 06/03/2018 2 Medidas de Dispersão Para a maioria das empresas, o recebimento de materiais no tempo programado é muito importante. As entregas em sete ou oito dias pelo fornecedor B podem ser vistas como favoráveis, no entanto, ter uma parte das entregas com demora de 13 a 15 dias pode causar problemas em termos de fazer a produção no tempo programado. Esse exemplo ilustra uma situação na qual a variabilidade no tempo de entrega pode ser considerada primordial na seleção de um fornecedor. 5 Medidas de Dispersão As medidas de dispersão indicam o grau de variabilidade das observações. Essas medidas possibilitam que façamos distinção entre conjuntos de observações quanto à sua homogeneidade. Quanto menor as medidas de dispersão, mais homogêneo é o conjunto de dados. As medidas que vamos apresentar são: • Amplitude Total • Desvio-Padrão • Variância • Coeficiente de Variação 6 Amplitude Total A amplitude total é a diferença entre o maior e o menor valor observado no conjunto de dados, ou seja: A amplitude não é uma medida muito utilizada, pois só leva em conta dois valores de todo o conjunto de dados e é muito influenciada por valores extremos. Uma medida mais interessante seria aquela que considerasse todos os valores do conjunto de dados, por exemplo, o desvio-padrão. 7 Desvio-Padrão O desvio padrão é uma medida de variabilidade muito utilizada, pois mede de maneira eficaz a dispersão dos dados em torno da média. O cálculo do desvio padrão é feito através da seguinte fórmula: 8 06/03/2018 3 Desvio-Padrão Quando os dados estiverem dispostos numa distribuição de frequências, o desvio-padrão pode ser encontrado da seguinte forma: 9 Regra prática para interpretar o desvio-padrão Para conjuntos de dados que tenham distribuição em forma de sino, valem as seguintes considerações: • cerca de 68% das observações do conjunto de dados ficam a um desvio-padrão da média, ou seja, ; • cerca de 95% das observações do conjunto de dados ficam a dois desvios-padrões da média, ou seja, ; • cerca de 99,7% das observações do conjunto de dados ficam a três desvios-padrões da média, ou seja, . 10 Figura 2: Regra prática 11 Propriedades do desvio-padrão • 12 06/03/2018 4 Propriedades do desvio-padrão • O desvio-padrão mede a variação entre os valores dos dados. • Valores próximos uns dos outros têm um desvio-padrão pequeno, mas valores com muito mais variação têm desvio-padrão maior. • O desvio-padrão tem as mesmas unidades de medida (tais como minuto, metros ou reais) que os valores originais dos dados. 13 Propriedades do desvio-padrão • Para muitos conjuntos de dados, um valor é não usual se é diferente da média por mais de dois desvios-padrão. • Ao se comparar a variação em dois conjuntos de dados diferentes, compare o desvio- padrão apenas se os conjuntos de dados usarem a mesma unidade de medida e tiverem médias aproximadamente iguais. 14 Variância A variância é o valor do desvio-padrão elevado ao quadrado, ou seja: A variância expressa o seu resultado numa medida ao quadrado, ficando difícil interpretar o seu valor. Portanto, para interpretação, utilizaremos o desvio- padrão, que se apresenta na mesma medida do conjunto de dados. 15 Coeficiente de Variação O coeficiente de variação é uma estatística útil para comparar a variação de valores originados de diferentes variáveis (por exemplo: peso, em Kg e altura, em cm). Também é utilizado para comparar conjunto de dados que apresentam médias substancialmente diferentes. Esse coeficiente é obtido por meio da seguinte fórmula: 16 06/03/2018 5 Exemplo 1: Considere a distribuição a seguir relativa às notas de dois alunos de informática durante determinado semestre: a)Qual a nota média de cada aluno? b)Qual aluno apresentou resultado mais homogêneo? 17 Aluno A 18 Notas Frequência 1 1 1 1 2 2 4 8 5 1 5 25 6 2 12 72 9 2 18 162 Total 8 40 268 Aluno A 19 Aluno B 20 Notas Frequência 4 1 4 16 4,5 2 9 40,5 5 2 10 50 5,5 2 11 60,5 6 1 6 36 Total 8 40 203 06/03/2018 6 Aluno B A aluno B apresentou resultado mais homogêneo. 21 Vamos utilizar os dados abaixo para calcular as medidas de dispersão. 22 Idade Nº funcionários 18 1 18 324 19 1 19 361 21 1 21 441 22 2 44 968 24 2 48 1152 25 3 75 1875 28 2 56 1568 Total 12 281 6689 A amplitude é calculada como: O desvio-padrão é calculado por: 23 Como o conjunto de dados não apresenta uma distribuição em forma de sino, não vamos utilizar a interpretação do desvio-padrão vista anteriormente. 24 06/03/2018 7 Como a variância é definida como o quadrado do desvio-padrão, temos: o que nos mostra que não conseguimos interpretar esse valor. O coeficiente de variação é dado por: 25
Compartilhar