Baixe o app para aproveitar ainda mais
Prévia do material em texto
ANÁLISE DESCRITIVA MEDIDAS DE DISPERSÃO OU VARIABILIDADE * VARIABILIDADE Para descrever adequadamente uma variável quantitativa, além da tendência central, é necessário dizer também o quanto estes valores variam, ou seja, o quão dispersos eles são. Somente a informação sobre a tendência central de um conjunto de dados não consegue representá-lo adequadamente. * VARIABILIDADE Diagrama de pontos para tempo de espera (minutos) em filas única e múltipla. * VARIABILIDADE - EXEMPLO Várias medições – valores diferentes; Quanto menor a variabilidade, mais precisa é a balança; Balança A: oscilação entre 950g e 1050g (imprecisão de 50g) Balança B: oscilação entre 900g e 1100g (imprecisão de 100g) * MEDIDA DE VARIABILIDADE 1. AMPLITUDE TOTAL É a medida de dispersão mais simples. Diferença entre o valor máximo e o valor mínimo de um conjunto de dados. AT = X maior – X menor Apesar de simples, é uma medida grosseira, pois depende somente de dois valores do conjunto de dados (máximo e mínimo), não captando o que ocorre com os outros valores. * MEDIDA DE VARIABILIDADE AMPLITUDE TOTAL Exemplo: Dados I: {2, 6, 7, 7, 10, 12, 13, 100}, AT1 = 100 – 2 = 98 Dados II: {2, 6, 10, 20, 35, 50, 80, 100}, AT2 = 100 – 2 = 98 As variabilidades desses dois conjuntos de dados são claramente diferentes. No entanto, apenas usando a amplitude total para medi-las, concluiríamos que os dois conjuntos de dados são igualmente dispersos. * MEDIDA DE VARIABILIDADE 2. DESVIO-PADRÃO Medida de variabilidade que resume o grau de dispersão desses valores em torno da média. X1 = valor observado; μ = média. Exemplo: {2,3,3,3,4,7,8,10} Média: 40/8 = 5 X1 - μ X1 X1 - μ 2 -3 3 -2 3 -2 3 -2 4 -1 7 2 8 3 10 5 * MEDIDA DE VARIABILIDADE DESVIO-PADRÃO A soma dos desvios = 0 (desvios - compensam os +). Como os sinais não são importantes para as medidas de dispersão, eles são eliminados elevando-se os desvios ao quadrado. (X1 – μ)2 Após elevar ao quadrado, soma-se os valores obtidos (Σ) X1 X1 - μ (X1 – μ)2 2 -3 9 3 -2 4 3 -2 4 3 -2 4 4 -1 1 7 2 4 8 3 9 10 5 25 Σ 60 * MEDIDA DE VARIABILIDADE DESVIO-PADRÃO A soma dos desvios ao quadrado é dividida pelo nº de participantes. Por razões teóricas, a soma dos desvios ao quadrado é dividida pelo nº de participantes menos 1. Σ (x1 – μ)2 n - 1 60 = 8,57 7 VARIÂNCIA * MEDIDA DE VARIABILIDADE DESVIO-PADRÃO A variância ainda não pode ser a medida de variabilidade porque ao se elevar ao quadrado, eleva-se também as unidades de medida em que os dados estão expressos (filhos ao quadrado). A solução é extrair a raiz quadrada. DP = √ Σ (x1 – μ)2 n - 1 √ 8,57 = 2,92 * EXEMPLO: Os agentes de fiscalização realizam, periodicamente, uma vistoria nos restaurantes para apurar possíveis irregularidades na venda de seus produtos. A seguir, são apresentados dados de uma vistoria sobre os pesos (em gramas) de uma amostra de 10 bifes, constantes de um cardápio de um restaurante como “bife de 200 gramas ” . 170 175 180 185 190 195 200 200 200 205 MEDIDA DE VARIABILIDADE: DESVIO-PADRÃO * PASSO A PASSO: 1. Calcule a média (soma dos valores observados / nº de observações) 2. Valor observado – média 3. Eleve cada resultado ao quadrado 4. Some todos os resultados que foram elevados ao quadrado 5. Divida o valor da soma pelo nº de observações -1(variância) 6. Calcule a raiz quadrada do valor obtido (desvio padrão) MEDIDA DE VARIABILIDADE: DESVIO-PADRÃO MEDIDA DE VARIABILIDADE: DESVIO-PADRÃO Exemplo: bifes de 200g μ = 1900 / 10 = 190 DP = √ Σ (x1 – μ)2 (n-1) DP = 1300 / 9 = 144,44 √144,44 = 12,01 DP = 12,01 gramas Nº X1 X1 - μ (X1- μ)2 1 170 170-190 = -20 400 2 175 175-190 = -15 225 3 180 180-190 = -10 100 4 185 185-190 = -5 25 5 190 190-190 = 0 0 6 195 195-190 = 5 25 7 200 200-190 = 10 100 8 200 200-190 = 10 100 9 200 200-190 = 10 100 10 205 205-190 = 15 225 Σ 1900 0 1300 * MEDIDA DE VARIABILIDADE: DESVIO-PADRÃO Os bifes desse restaurante pesam, em média, 190 gramas, com um desvio-padrão de 12g, ou seja, variam tipicamente entre 178 e 202g. Analisando esses valores, concluímos que esse restaurante pode estar lesando a maior parte de seus clientes. * MEDIDA DE VARIABILIDADE 3. COEFICIENTE DE VARIAÇÃO Ao analisarmos o grau de dispersão de um conjunto de dados, poderemos nos deparar com uma questão do tipo: “Um desvio-padrão de 10 unidades é pequeno ou grande?” Se a média dos dados analisados for 10.000, um desvio de 10 unidades em torno dessa média significa pouca dispersão (0,1% da média) – (10/10.000) Mas, se a média for 100, um desvio de10 unidades em torno dessa média significa muita dispersão (10% da média) – (10/100) * MEDIDA DE VARIABILIDADE COEFICIENTE DE VARIAÇÃO A razão entre o desvio-padrão e a média damos o nome de Coeficiente de Variação: CV = DP / μ Quanto menor o CV menor é a sua variabilidade. VANTAGEM: O CV não depende da unidade de medida, permitindo comparar a variabilidade de conjuntos de dados medidos em unidades diferentes, o que seria impossível usando o DP. * MEDIDA DE VARIABILIDADE COEFICIENTE DE VARIAÇÃO Comparação da homogeneidade entre variáveis diferentes em um mesmo grupo Tabela: Estatísticas descritivas para idade, tempo de profissão e salário de motoristas. VARIÁVEL μ DP CV IDADE 35,6 anos 5,08 anos 0,143 (14,3%) TEMPO DE PROFISSÃO 6,5 anos 2,98 anos 0,458 (45,8%) SALÁRIO 537,52 reais 25,34 reais 0,047 (4,7%) * MEDIDA DE VARIABILIDADE COEFICIENTE DE VARIAÇÃO Em qual das variáveis os motoristas são mais parecidos entre si? Essa informação é conseguida através da análise da variabilidade, procurando-se a variável mais homogênea. Se usarmos o DP, estaremos comparando anos com reais. O CV é a única opção nesse caso, pois ele é adimensional. Ao analisarmos os CVs das três variáveis, concluímos que os motoristas são mais homogêneos quanto ao salário, heterogêneos quanto ao tempo de profissão. * EXERCÍCIO 1 O setor de RH de uma grande empresa pensou em presentear no Natal todos os filhos de suas funcionárias e, para estimar o custo, perguntou para as dez funcionárias de um setor, quantos filhos cada uma delas tinha. À partir dos dados acima, determine as três medidas de variabilidade desta variável. 1 2 3 4 5 6 7 8 9 10 1 1 2 3 4 4 5 6 7 7 FUNCIONÁRIA Nº DE FILHOS * EXERCÍCIO 2 O professor perguntou a 10 alunos o número de horas por dia em que utilizavam o celular e o número de páginas de livros lidas por dia, e obteve as seguintes informações: 2.1. Á partir da tabela acima, calcule as três medidas de dispersão para o número de horas no celular e número de páginas lidas. 2.2. Qual variável é mais heterogênea? A B C D E F G H I J 3 4 2 4 4 2 6 5 4 2 5 5 3 4 4 5 0 2 4 10 ALUNO CELULAR PÁGINAS Uma agência bancária verificou o período de permanência dos dez primeiros clientes nas filas do caixa: 5, 7, 9, 15, 5, 15, 5, 18, 15, 5 (em resultando minutos). Calcule as medidas de dispersão (amplitude total, desvio padrão e coeficiente de variação). EXERCÍCIO 3 Numa classe com 12 alunos de um curso de inglês, os alunos indicaram o número de outras línguas (além de português e inglês) com que tinham alguma familiaridade. O resultado foi o seguinte: 0, 0, 0, 0, 1, 1, 1, 1, 1, 2, 2 e 4. Obtenha as três medidas de variabilidade ou dispersão (amplitude total, desvio padrão e coeficiente de variação). EXERCÍCIO 4 Numa empresa o salário médio dos homens é de R$ 6000,00 com um desvio padrão de R$450,00, e o das mulheres é na média de R$5000,00 com desvio padrão de R$500,00. Qual dos sexos é mais heterogêneo? EXERCÍCIO 5 Em um exame final de anatomia, a nota média de um grupo de 150 alunos foi 6,7 e o desvio padrão foi 0,32. Em semiologia, entretanto, anota média final foi 8,5 e o desvio padrão foi 0,40. Em qual disciplina a nota foi mais homogênea? EXERCÍCIO 6
Compartilhar