Prévia do material em texto
Aula 07 – Estatística Descritiva ESTATÍSTICA DESCRITIVA 2 Aula 07 – Estatística Descritiva Estatística Descritiva O que fazer com as observações que coletamos? Resumo dos dados: organizar, descrever e resumir os dados coletados ⇒ Estatística descritiva Primeira etapa da análise: 5 Aula 07 – Estatística Descritiva QUALITATIVA QUANTITATIVA NOMINAL ORDINAL CONTÍNUA DISCRETA tempo, distância, salário número de clientes, número de caminhões origem de um pedido (capital ou interior) porte de uma empresa (pequena, média, grande) Variável: Qualquer característica associada a uma população. Classificação das variáveis Aula 07 – Estatística Descritiva Amplitude, Intervalo-Interquartil, Variância, Desvio Padrão, Coeficiente de Variação MEDIDAS DE DISPERSÃO: Mínimo, Máximo, Moda, Média, Média Aparada, Mediana, Percentis MEDIDAS DE POSIÇÃO: Variáveis Quantitativas Aula 07 – Estatística Descritiva • Mínimo (min): o menor valor observado • Máximo (max): o maior valor observado • Moda (mo): é o valor (ou atributo) que ocorre com maior frequência, Medidas de Posição Aula 07 – Estatística Descritiva n x n xxxxx n i i n ∑ == ++++ = 1321 ... • Média Medidas de Posição • Mediana A mediana é o valor da variável que ocupa a posição central de um conjunto de n dados ordenados, Aula 07 – Estatística Descritiva O percentil de ordem p ×100 (0 < p < 1), em um conjunto de dados de tamanho n, é o valor da variável tal que p ×100 das observações do conjunto dos n dados ordenados são inferiores ou iguais a ele. • Percentil p percentil 50 = mediana ou segundo quartil (Md) percentil 25 = primeiro quartil (Q1) percentil 75 = terceiro quartil (Q3) Casos particulares Medidas de Posição Aula 07 – Estatística Descritiva Finalidade: encontrar um valor que resuma a variabilidade de um conjunto de dados • Amplitude (A) A = máx - min Medidas de Dispersão • Intervalo-Interquartil É a diferença entre o terceiro quartil e o primeiro quartil, ou seja, Q3 - Q1. Aula 07 – Estatística Descritiva ∑ = − − = − −++− == n i in n xx n xxxxsVariância 1 222 12 1 )( 1 )(...)( VariânciasPadrãoDesvio == • Variância • Desvio padrão Medidas de Dispersão Aula 07 – Estatística Descritiva - é uma medida de dispersão relativa - elimina o efeito da magnitude dos dados - exprime a variabilidade em relação à média %100×= x sCV • Coeficiente de Variação (CV) Medidas de Dispersão Aula 07 – Estatística Descritiva Idade 27,47 anos 1,88 anos 6,8% Renda 3763,7 reais 594,7reais 15,8% Média DesvioPadrão Coef, de Variação Conclusão: Os indivíduos são, aproximadamente, duas vezes mais dispersos quanto à renda do que quanto à idade Idade e renda de indivíduosExemplo 1 : Medidas de Dispersão Aula 07 – Estatística Descritiva Conclusão: Em relação às médias, os atrasos de ambas as companhias apresentam variabilidade quase iguais. Desvio padrão Coef. de variaçãoMédia Cia. A 50 6 12% Cia. B 160 16 10% Número de atrasos de vôos de uma amostra da Cia. A e de uma amostra de Cia. B Exemplo 2: Medidas de Dispersão Aula 07 – Estatística Descritiva Representa os dados através de um retângulo construído com os quartis e fornece informações sobre os valores extremos. Gráfico Boxplot GRÁFICOS Aula 07 – Estatística Descritiva “Máximo” Q3 Mediana Q1 “Mínimo” 25% 50% 75% LS = Q3+1,5(Q3-Q1) LI = Q1-1,5(Q3-Q1) “Máximo” é o maior valor menor que LS; “Mínimo” é o menor valor maior que LI. Boxplot Aula 07 – Estatística Descritiva md = 41,5 Q1 = 30,25 Q3 = 49,5 * * 120 100 80 60 40 20 Dados ordenados (n=36) 18 21 21 23 23 25 27 29 30 31 32 32 32 34 35 36 38 41 42 42 43 44 45 46 46 47 48 50 54 56 57 58 60 61 98 116 LI = Q1 - 1,5(Q3 - Q1) =1,38 LS = Q3 + 1,5(Q3 - Q1) =78,38 Observações discrepantes Vida útil de máquinas (dias)Exemplo 3: Boxplot Aula 07 – Estatística Descritiva Os dados também podem ser resumidos construindo-se uma tabela de distribuição de frequências . Distribuição de frequências de uma variável é uma lista dos valores individuais ou de intervalos de valores que a variável pode assumir, com as respectivas frequências de ocorrência. Aula 07 – Estatística Descritiva Dados do Tempo de duração de 187 viagens (em horas) Tempo Frequência (ni) Tempo Frequência (ni) 0 55 30 2 2 1 35 2 4 1 40 1 5 59 44 1 6 2 50 1 7 3 57 1 8 2 60 1 9 1 70 2 10 28 75 2 13 2 95 1 15 10 660 1 20 6 1245 1 28 1 N = 187 Exemplo 4: Distribuição de frequências Aula 07 – Estatística Descritiva Com a simples tabulação dos dados detectou-se: • em 55 viagens encontra-se registrado o tempo zero, que é um valor claramente impossível; • percebe-se a existência de um número excessivo de viagens com tempo de duração múltiplo de 5: 5, 10, 15 horas, etc. Existe uma tendência observada na população em geral em arredondar valores numéricos para múltiplos de 5; • dois valores apresentam-se muito superiores aos demais (660 e 1245). Exemplo 4 (continuação): Distribuição de frequências Aula 07 – Estatística Descritiva Medidas descritivas para a variável Tempo de duração de viagens Medida Descritiva Amostra Completa Excluindo o valor 1245 Excluindo os valores 1245 e 660 Média 27,5 18,2 13,3 Mediana 7,5 7,0 7,0 Desvio-padrão 121,8 58,8 16,4 Q1 5,0 5,0 5,0 Q3 14,5 13,0 13,0 n 132 131 130 Exemplo 4 (cont.): Retirando os “zero’s” Distribuição de frequências Aula 07 – Estatística Descritiva Variável: distância contínua Construir intervalos de classeClasses de distâncias ni fri 0,0 |- 10,0 10,0 |- 20,0 20,0 |- 30,0 30,0 |- 40,0 40,0 |- 50,0 50,0 |- 60,0 60,0 |- 70,0 70,0 |- 80,0 80,0 |- 90,0 90,0 |- 100,0 Total 69 40 7 4 2 2 1 4 0 1 130 0,531 0,308 0,054 0,031 0,015 0,015 0,008 0,031 0,000 0,008 1,000 Distribuição de frequências para a variável Tempo de duração de viagens Exemplo 4 (cont.): Retirando o “zero” Distribuição de frequências Aula 07 – Estatística Descritiva • Bases iguais ou diferentes • Construir um retângulo para cada classe, com base igual ao tamanho da classe e área do retângulo igual a frequência relativa da classe (fr). • A altura será dada por h = fr/tamanho da base (densidade de frequência). Dados agrupados em intervalos de classes (distribuição de frequências) Gráfico histograma Aula 07 – Estatística Descritiva Classes (meses) ni fri hi 0 |- 3 140 0,28 0,093 3 |- 12 100 0,20 0,022 12 |-24 80 0,16 0,013 24 |-60 180 0,36 0,010 Total 500 1,00 0 3 12 24 60 h 0,10 0,02 0,04 0,06 0,08 Exemplo 5: Vida útil de lâmpadas Histograma Aula 07 – Estatística Descritiva Exemplo 6: Tempo de duração de viagens Histograma Aula 07 – Estatística Descritiva Sobre um eixo, são representados retângulos, um para cada categoria da variável. A altura do retângulo é proporcional à frequência da categoria. ⇒Adequado para variáveis qualitativas Gráfico de Barras Aula 07 – Estatística Descritiva Exemplo 7: 3210 60 50 40 30 20 10 0 Activity Co un t o f A ct iv ity Variável Activity : atividade de armazéns (nenhuma – 0; leve – 1; moderada – 2; intensa – 3) Gráfico de barras ⇒ Variável qualitativa ordinal Aula 07 – Estatística Descritiva Porcentagem acumulada Exemplo 8: Considere a variável “Número de funcionários” de empresas pequenas de logística. Um levantamento de 20 empresas forneceu os seguintes dados (já ordenados): 5, 5, 5, 5, 10, 10, 10, 10, 10, 15, 15, 15, 15, 15, 15, 15, 20, 20, 20, 25. Aula 07 – Estatística Descritiva Dados: 5, 5, 5, 5, 10, 10, 10, 10, 10, 15, 15, 15, 15, 15, 15, 15, 20, 20, 20, 25 Porcentagem acumulada Distribuição de frequências do no. de funcion. No.de filhos ni fifi(%) Ni Fi Fi (%) 5 4 0,20 20 4 0,20 20 10 5 0,25 25 9 0,45 45 15 7 0,35 35 .16 0,80 80 20 3 0,15 15 19 0,95 95 25 1 0,05 5 20 1,00 100 Total n=20 1,00 100,0 Considerando os distintos valores da variável ordenados, temos Ni: frequencia absoluta acumulada no valor xi da variável; Fi: frequencia relativa acumulada no valor xi; Fi (%) : frequencia relativa acumulada no valor xi, em % Exemplo 8 (cont): Aula 07 – Estatística Descritiva Porcentagem acumulada Distribuição de frequências do número de funcionários no.de func. ni fi fi(%) Ni Fi Fi (%) 5 4 0,20 20 4 0,20 20 10 5 0,25 25 9 0,45 45 15 7 0,35 35 16 0,80 80 20 3 0,15 15 19 0,95 95 25 1 0,05 5 20 1,00 100 Total n=20 1,00 100,0 • 25 % das empresas tem 10 funcion.; (5 empresas das 20) • 45 % tem até 10 funcion.; (que são 9 das 20 empresas) • 7 empresas tem 15 funcion; • 19 empresas tem até 20 funcion. (ou 95% dos empresas tem 20 funcion. ou menos); etc... Exemplo 8 (cont.): Interpretação Aula 07 – Estatística Descritiva Forma da Distribuição Slide Number 1 Slide Number 2 Slide Number 3 Slide Number 4 Slide Number 5 Slide Number 6 Slide Number 7 Slide Number 8 Slide Number 9 Slide Number 10 Slide Number 11 Slide Number 12 Slide Number 13 Slide Number 14 Slide Number 15 Slide Number 16 Slide Number 17 Slide Number 18 Slide Number 19 Slide Number 20 Slide Number 21 Slide Number 22 Slide Number 23 Slide Number 24 Slide Number 25 Slide Number 26 Slide Number 27 Slide Number 28 Slide Number 29