Prévia do material em texto
Curso: Administração Disciplina: Estatística Prof. Dalton de Sousa – dalton.sousa@gmail.com UNIVERSIDADE FEDERAL DE MATO GROSSO DO SUL Percentis (continuação de estatística descritiva – medidas de posição) Um percentil fornece a informação sobre como os dados se distribuem ao longo do intervalo entre o menor e o maior valor. Para dados que não têm muitos valores repetidos, o p-ésimo percentil divide os dados em duas partes. Aproximadamente p por cento das observações apresentam valores menores que o p-ésimo percentil; aproximadamente (100-p) por cento das observações possuem valores maiores que o p-ésimo percentil. Universidades podem registrar notas em termos percentis. Por exemplo, suponha que um candidato obtenha uma nota bruta de 54 pontos na parte oral de um exame de admissão. O desempenho desse estudante em relação a outros que fizeram o mesmo exame pode não ser claro imediatamente. Entretanto, se a nota bruta corresponde ao 70° percentil, sabemos que aproximadamente 30% dos estudantes tiveram notas mais altas do que ele. Procedimento de Cálculo do Percentil Etapa 1: organize os dados em ordem crescente (do menor para o maior valor) Etapa 2: calcule um índice i => i = (p/100).n Etapa 3: (a) Se i não for um número inteiro, arredonde-o para cima. O número inteiro seguinte maior que i denota a posição do p-ésimo percentil. (b) se i for um número inteiro, o p-ésimo percentil será a média dos valores nas posições i e i + 1. Curso: Administração Disciplina: Estatística Prof. Dalton de Sousa – dalton.sousa@gmail.com UNIVERSIDADE FEDERAL DE MATO GROSSO DO SUL Percentis (continuação de estatística descritiva – medidas de posição) Determine o 85° percentil dos dados de salários apresentados a seguir: 2.710 2.755 7.850 2.880 2.880 2.890 2.920 2.940 2.950 3.050 3.130 3.325 Etapa 1 – Ordenação dos dados 2.710 2.755 2.880 2.880 2.890 2.920 2.940 2.950 3.050 3.130 3.325 7.850 Etapa 2 I = (85/100).12 = 10,2 Etapa 3 Uma vez que i não é um número inteiro, arredonde-o para cima. A posição do 85° percentil é o número inteiro seguinte maior que 10,2, a 11ª posição. Retornando aos dados, vemos que o 85° percentil é o valor de dados que está na 11ª posição, ou seja, 3.325. Agora, encontre o 50° percentil. Curso: Administração Disciplina: Estatística Prof. Dalton de Sousa – dalton.sousa@gmail.com UNIVERSIDADE FEDERAL DE MATO GROSSO DO SUL Quartis Muitas vezes é desejável dividir os dados em quatro partes, tendo cada parte aproximadamente um quarto, ou 25% das observações. Q1 = primeiro quartil ou 25° percentil Q2 = o segundo quartil ou 50° percentil (igual a mediana) Q3 = o terceiro quartil ou 75° percentil Para encontrar os quartis Q1, Q2 e Q3 basta utilizar os procedimentos para encontrar os percentis, respectivamente, 25°, 50° e 75°. Curso: Administração Disciplina: Estatística Prof. Dalton de Sousa – dalton.sousa@gmail.com UNIVERSIDADE FEDERAL DE MATO GROSSO DO SUL 3.3 Medidas de Variação Discutiremos o conceito de variação, crucial em estatística. Uma ilustração visual é feita por meio de três gráficos a seguir, construídos para os tempos de espera de clientes de três diferentes bancos. No banco 1, o gerente é compulsivo em relação ao controle cuidadoso dos tempos de espera e muda o número de atendentes de acordo com a necessidade. No banco 2, os clientes esperam todos em uma fila única, que serve a todos os caixas. No banco 3, os clientes esperam em filas diferentes para cada um dos caixas. Banco 1 Banco 2 Banco 3 Cliente Tempo de Espera (min) Cliente Tempo de Espera (min) Cliente Tempo de Espera (min) 1 6 1 4 1 1 2 6 2 7 2 3 3 6 3 7 3 14 Curso: Administração Disciplina: Estatística Prof. Dalton de Sousa – dalton.sousa@gmail.com UNIVERSIDADE FEDERAL DE MATO GROSSO DO SUL Compreendendo a Variação Nenhuma variação a partir da Média Média = 6 Pequena variação a partir da Média Média = 6 Grande variação a partir da Média Média = 6 Nesta seção, desenvolveremos a habilidade de medir e compreender a variação dos dados. Curso: Administração Disciplina: Estatística Prof. Dalton de Sousa – dalton.sousa@gmail.com UNIVERSIDADE FEDERAL DE MATO GROSSO DO SUL Definições Amplitude A amplitude de um conjunto de dados (como visto anteriormente) é a diferença entre o maior e o menor valor. amplitude = (valor máximo) – (valor mínimo) A amplitude é muito fácil de ser calculada, mas não é tão útil quanto as outras medidas de variação, que levarão em conta todos os valores de um conjunto de dados. Desvio Padrão O desvio padrão de um conjunto de valores amostrais é uma medida da variação dos valores em torno da média. É uma espécie de desvio médio dos valores em relação à média, que é calculado pelas fórmulas a seguir. Curso: Administração Disciplina: Estatística Prof. Dalton de Sousa – dalton.sousa@gmail.com UNIVERSIDADE FEDERAL DE MATO GROSSO DO SUL Fórmulas do Desvio Padrão (x - x)2 n - 1 s = n (n - 1) s = nx2) - (x)2 Fórmula 1 - Desvio Padrão Amostral Fórmula 2 - abreviada para o Desvio Padrão Amostral Curso: Administração Disciplina: Estatística Prof. Dalton de Sousa – dalton.sousa@gmail.com UNIVERSIDADE FEDERAL DE MATO GROSSO DO SUL Desvio Padrão O Desvio Padrão é uma medida de variação de todos os valores a partir da média. O valor do desvio padrão s é usualmente positivo. É zero apenas quando todos os valores dos dados são o mesmo número. Ele nunca é negativo. Maiores valores de s indicam maior variação. O valor do desvio padrão s pode crescer drasticamente com a inclusão de um ou mais outliers (valores de dados que estão muito afastados dos demais). As unidades do desvio padrão (tais como minutos, metros, pés, libras etc.) são as mesmas unidades dos dados originais. Curso: Administração Disciplina: Estatística Prof. Dalton de Sousa – dalton.sousa@gmail.com UNIVERSIDADE FEDERAL DE MATO GROSSO DO SUL Desvio Padrão de uma População Uma fórmula ligeiramente diferente é usada para cálculo do desvio padrão populacional. Note as diferenças. 2 (x - µ) N = - desvio padrão populacional (letra grega sigma minúscula). µ - é a média populacional N - utiliza-se N (tamanho da população) e não o n – 1 (usado no cálculo de s) Curso: Administração Disciplina: Estatística Prof. Dalton de Sousa – dalton.sousa@gmail.com UNIVERSIDADE FEDERAL DE MATO GROSSO DO SUL Variância Amostral e Populacional Estamos usando o termo variação como uma descrição geral de quanto os valores variam entre eles. O termo dispersão é algumas vezes usado em lugar de variação. O termo variância se refere a uma definição específica. Definição A variância de um conjunto de valores é uma medida da variação igual ao quadrado do desvio padrão. Variância amostral: s2 Quadrado do desvio padrão s Variância populacional: 2 Quadrado do desvio populacional A variância amostral s2 é considerada um estimador não-viesado da variância populacional 2, o que significa que os valores de s2 tendem para o valor de 2 em vez de sistematicamente superestimarem ou substimarem 2. Curso: Administração Disciplina: Estatística Prof. Dalton de Sousa – dalton.sousa@gmail.com UNIVERSIDADE FEDERAL DE MATO GROSSO DO SUL Regra Empírica (ou 68-95-99,7) O desvio padrão mede a variação entre valores, como foi apresentado. Valores muito próximos resultarão em desvios padrões muito pequenos, enquanto valores mais espalhados resultarão em desvios padrões muito maiores. A regra empírica estabelece que para conjuntos de dados que tenham uma distribuição com forma aproximadamente de sino, aplicam-se as seguintes propriedades (figuras nos próximos slides). • Cerca de 68% de todos os valores ficam a 1 desvio padrão da média. • Cercade 95% de todos os valores ficam a 2 desvios padrões da média. • Cerva de 99,7% de todos os valores ficam a 3 desvios padrões da média. Curso: Administração Disciplina: Estatística Prof. Dalton de Sousa – dalton.sousa@gmail.com UNIVERSIDADE FEDERAL DE MATO GROSSO DO SUL Regra Empírica Curso: Administração Disciplina: Estatística Prof. Dalton de Sousa – dalton.sousa@gmail.com UNIVERSIDADE FEDERAL DE MATO GROSSO DO SUL Regra Empírica Curso: Administração Disciplina: Estatística Prof. Dalton de Sousa – dalton.sousa@gmail.com UNIVERSIDADE FEDERAL DE MATO GROSSO DO SUL Regra Empírica Curso: Administração Disciplina: Estatística Prof. Dalton de Sousa – dalton.sousa@gmail.com UNIVERSIDADE FEDERAL DE MATO GROSSO DO SUL Exercícios 1. Os tempos (em minutos) de espera de clientes do Banco Jefferson Valley (onde os clientes esperam em fila única) e do Banco Providence (onde os clientes esperam em filas individuais para três caixas diferentes) estão listados abaixo. Compare a variação nos dois conjuntos de dados (calcule a média e o desvio padrão de cada um dos conjuntos de dados). 2. Alunos de estatística obtiveram as seguintes notas em uma prova (7 – 8,5 – 9 – 3,5 – 7 – 1,5 – 2 – 4 – 5 – 6 – 7 – 10). Calcule o desvio padrão da amostra. Jefferson Valley 6,5 6,6 6,7 6,8 7,1 7,3 7,4 7,7 7,7 7,7 Providence 4,2 5,4 5,8 6,2 6,7 7,7 7,7 8,5 9,3 10 Curso: Administração Disciplina: Estatística Prof. Dalton de Sousa – dalton.sousa@gmail.com UNIVERSIDADE FEDERAL DE MATO GROSSO DO SUL Exercícios 3. O preço (em dólar) da ação da Cia Vale, negociada na NYSE no período de 19/10 a 05/11/2009 são apresentados a seguir. Calcule a média e o desvio padrão do preço da ação nesse período. 19/10/09 27,38 20/10/09 26,43 21/10/09 27,46 22/10/09 27,38 23/10/09 26,98 26/10/09 26,57 27/10/09 26,08 28/10/09 24,39 29/10/09 26,71 30/10/09 25,40 02/11/09 26,11 03/11/09 26,55 04/11/09 26,85 05/11/09 27,36 Curso: Administração Disciplina: Estatística Prof. Dalton de Sousa – dalton.sousa@gmail.com UNIVERSIDADE FEDERAL DE MATO GROSSO DO SUL Comparação da Variação em Diferentes Populações Verificamos que por serem as unidades do desvio padrão as mesmas dos dados originais, é mais fácil entender o desvio padrão do que a variância. No entanto, essa mesma propriedade torna difícil comparar a variação para valores originados de diferentes populações. Ao resultar em um valor que não tem unidade específica, o coeficiente de variação superar essa desvantagem. Definição O coeficiente de variação (CV) para um conjunto de dados amostrais ou populacionais não- negativos, expresso como um percentual, descreve o desvio padrão relativo à média e é dado pela seguinte expressão: Amostra População CV = s . 100 CV = x µ 3.3 Medidas de Variação (continuação...) Curso: Administração Disciplina: Estatística Prof. Dalton de Sousa – dalton.sousa@gmail.com UNIVERSIDADE FEDERAL DE MATO GROSSO DO SUL Coeficiente de Variação - Exemplo Encontre o coeficiente de variação dos dados de uma amostra de alturas e pesos de homens, a seguir. Alturas: CV = (3,02/68,34)*100 = 4,42% Pesos: CV = (26,33/172,55)*100 = 15,26% Embora a diferença nas unidades torne impossível comparar o desvio padrão de alturas (3,02 in.) e pesos (26,33 lb), podemos comparar os coeficientes de variação, que não têm unidades. As alturas apresentaram menor variação do que os pesos, o que era de se esperar. Média Desvio Padrão Altura 68,34 in. 3,02 in. Peso 172,55 lb 26,33 lb Curso: Administração Disciplina: Estatística Prof. Dalton de Sousa – dalton.sousa@gmail.com UNIVERSIDADE FEDERAL DE MATO GROSSO DO SUL Desvio Padrão para uma Distribuição de Frequência n (n - 1) s = n [f.x2)] – [f.x)]2 n X = f.x Média para uma Distribuição de Frequência Curso: Administração Disciplina: Estatística Prof. Dalton de Sousa – dalton.sousa@gmail.com UNIVERSIDADE FEDERAL DE MATO GROSSO DO SUL TRIOLA, Mário F. Introdução à Estatística. 10 ed. Rio de Janeiro: LTC, 2008. ANDERSON, D.R.; SWEWNEY, D.J.; WILLIAMS, T.A. Estatística Aplicada à Administração e Economia. 2 ed. São Paulo: Cengaje Learning, 2009. STEVENSON, W.J. Estatística aplicada à Administração. São Paulo: Harper & Row do Brasil, 1981.