Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 E st a tí st ic a B á si ca – A d m in is tr aç ão /U F F S Pr of a. I ar a E nd ru w ei t B at ti st i Estatística Básica Distribuição de Frequência Profa. Dra. Iara Denise Endruweit Battisti iara.battisti@uffs.edu.br Outubro de 2013 UFFS – Universidade Federal da Fronteira Sul Campus: Cerro Largo Curso: Administração 1 E st a tí st ic a B á si ca – A d m in is tr aç ão /U F F S Pr of a. I ar a E nd ru w e it B at ti st i 2 • Representação de dados em tabela de distribuição de frequência • Histograma • Polígono de frequência • Exercícios 2 E st a tí st ic a B á si ca – A d m in is tr aç ão /U F F S Pr of a. I ar a E nd ru w ei t B at ti st i Organização de dados – Variáveis quantitativas 3 • Conjunto de dados referente a variáveis quantitativas podem ser descritos de duas maneiras: • Distribuição de frequência • Medidas descritivas E st a tí st ic a B á si ca – A d m in is tr aç ão /U F F S Pr of a. I ar a E nd ru w e it B at ti st i Organização de dados – Variáveis quantitativas 4 • A representação de um conjunto de dados referentes a realizações de uma variável quantitativa discreta é em geral bastante semelhante à das variáveis qualitativas, pois os valores inteiros que a variável assume podem ser considerados como “categorias” ou “classes naturais”. • Exemplo: considere o estudo com 20 canteiros de um viveiro de mudas de eucalipto em que é contado o número de lagartas “rosca” (Agrotis ipsilon). Observe que a disposição da variável “número de lagartas”, em uma tabela simples, é semelhante à de uma variável qualitativa. • A representação gráfica é semelhante, com a diferença de que a escala referente à variável possui interpretação diferente, representando elementos do conjunto dos números inteiros. Exemplo: gráfico de colunas verticais. 3 E st a tí st ic a B á si ca – A d m in is tr aç ão /U F F S Pr of a. I ar a E nd ru w ei t B at ti st i Organização de dados – Variáveis quantitativas 5 • A representação de um conjunto de dados referentes a realizações de uma variável quantitativa contínua apresenta uma dificuldade adicional, em relação às discretas, ou às variáveis qualitativas. • Não existem aqui “classes naturais”, porque as realizações (dados) de variáveis contínuas são números pertencentes ao eixo dos números reais, e assim, existe uma infinidade de valores que a variável pode assumir. • Exemplo: estrutura fundiária (hectare) de propriedades rurais de uma microbacia. Nota-se que as únicas “classes naturais” que existem são aquelas determinadas pela precisão do aparelho de medida. E st a tí st ic a B á si ca – A d m in is tr aç ão /U F F S Pr of a. I ar a E nd ru w e it B at ti st i Organização de dados – Variáveis quantitativas 6 • Uma tabela de distribuição de freqüência é utilizada para representar respostas de uma variável quantitativa quando o tamanho do conjunto de dados é maior ou igual a 20 (n ≥ 20). • Nesse tipo de tabela os valores são agrupados em intervalos. • A tabela de distribuição de freqüências é construída tendo como base um conjunto de classe ou intervalos. Os intervalos são divisões de valores que permitem agrupar ou contabilizar todos os dados observados. Cada valor observado só pode estar um dos intervalos definidos. 4 E st a tí st ic a B á si ca – A d m in is tr aç ão /U F F S Pr of a. I ar a E nd ru w ei t B at ti st i Organização de dados – Variáveis quantitativas 7 • O número de intervalos que serão utilizados para construir a tabela pode ser definido de forma aleatória, porém em determinados casos o uso de poucos ou muitos intervalos podem esconder informações relevantes sobre os dados. Para evitar estes problemas existe uma pequena fórmula para calcular a amplitude dos intervalos de acordo com a quantidade de dados existentes e amplitude total dos dados. A fórmula é a seguinte: n At hi E st a tí st ic a B á si ca – A d m in is tr aç ão /U F F S Pr of a. I ar a E nd ru w e it B at ti st i Distribuição de frequência 8 • Porém, o primeiro procedimento a ser tomado para a elaboração de uma tabela de distribuição de frequência de uma variável contínua consiste na ordenação dos dados, para facilitar o trabalho posteriormente. • Amplitude total; • Amplitude de classe (de intervalo); • Limite inferior dos dados; • Limite superior dos dados; 5 E st a tí st ic a B á si ca – A d m in is tr aç ão /U F F S Pr of a. I ar a E nd ru w ei t B at ti st i Distribuição de frequência 9 • Exemplo: um levantamento foi feito acerca da estrutura fundiária de uma microbacia (áreas das propriedades rurais em hectares), obtendo-se o resultado a seguir: 12 62 127 151 219 294 365 454 612 32 78 135 158 231 305 378 489 655 36 93 139 164 257 319 391 526 757 55 114 144 180 279 326 426 547 786 58 121 145 202 283 338 432 584 875 E st a tí st ic a B á si ca – A d m in is tr aç ão /U F F S Pr of a. I ar a E nd ru w e it B at ti st i Distribuição de frequência 10 • Tabela de distribuição de frequências Áreas (hectare) das propriedades rurais Área fi fa fr fr% frac% xi 12 |--- 141 141 |--- 270 270 |--- 399 399 |--- 528 528 |--- 657 657 |--- 786 786 |---915 Total 6 E st a tí st ic a B á si ca – A d m in is tr aç ão /U F F S Pr of a. I ar a E nd ru w ei t B at ti st i Distribuição de frequência 11 • Tabela de distribuição de frequências Áreas (hectare) das propriedades rurais Área fi fa fr fr% frac% xi 12 |--- 141 13 141 |--- 270 10 270 |--- 399 10 399 |--- 528 5 528 |--- 657 4 657 |--- 786 1 786 |---915 2 Total 45 E st a tí st ic a B á si ca – A d m in is tr aç ão /U F F S Pr of a. I ar a E nd ru w e it B at ti st i Distribuição de frequência 12 • Tabela de distribuição de frequências Áreas (hectare) das propriedades rurais Área fi fa fr fr% frac% xi 12 |--- 141 13 13 0,2889 28,89 28,89 76,5 141 |--- 270 10 23 0,2222 22,22 51,11 205,5 270 |--- 399 10 33 0,2222 22,22 73,33 334,5 399 |--- 528 5 38 0,1111 11,11 84,44 463,5 528 |--- 657 4 42 0,0889 8,89 93,33 592,5 657 |--- 786 1 43 0,0222 2,22 95,56 721,5 786 |---915 2 45 0,0444 4,44 100,00 850,5 Total 45 - 1,0000 100,00 - - 7 E st a tí st ic a B á si ca – A d m in is tr aç ão /U F F S Pr of a. I ar a E nd ru w ei t B at ti st i Distribuiçãode frequência 13 • Tabela de distribuição de frequências • Os valores adicionados a tabela são: • fi = frequência absoluta simples. Representa o número de valores existente em cada intervalo. Para o primeiro intervalo fi =13. Também pode ser representado por “n”. • fa = freqüência absoluta simples acumulada. Representa o número de dados até o limite superior do intervalo considerado. Por exemplo, a fa do segundo intervalo é igual a fi do primeiro intervalo mais a fi do segundo intervalo (13 + 10 = 23). A fa do terceiro intervalo é fi do primeiro intervalo + fi do segundo intervalo + fi do terceiro intervalo (13+10+10). • fr = freqüência relativa. É a fi do intervalo considerado dividida pelo total da fi (total da fi = 45). A fi do primeiro intervalo é 13/45 = 0,2889. E st a tí st ic a B á si ca – A d m in is tr aç ão /U F F S Pr of a. I ar a E nd ru w e it B at ti st i Distribuição de frequência 14 • Tabela de distribuição de frequências • fr% = freqüência relativa percentual. É a fr do intervalo multiplicado por 100. Para o primeiro intervalo 0,2889 x 100 = 28,89 • frac% = freqüência relativa acumulada percentual. Representa o valor, em percentual, até o limite superior do intervalo considerado. A frac% do segundo intervalo, por exemplo, é igual a fr% do primeiro intervalo mais a fr% do segundo intervalo (28,89+22,22 = 51,11). • xi = ponto médio do intervalo. É o valor médio entre o limite inferior e o limite superior do intervalo. Por exemplo: (12+141)/2=76,5 é o ponto médio do primeiro intervalo. 8 E st a tí st ic a B á si ca – A d m in is tr aç ão /U F F S Pr of a. I ar a E nd ru w ei t B at ti st i Distribuição de frequência 15 • Tabela de distribuição de frequências • Se ocorrer um intervalo com fi =0, isto é, um intervalo que não contém valores e no intervalo seguinte ocorrer somente um ou dois valores então suspeita-se que esse ou esses valores são outlier. E st a tí st ic a B á si ca – A d m in is tr aç ão /U F F S Pr of a. I ar a E nd ru w e it B at ti st i Organização de dados 16 • OUTLIER • Se ocorrer um intervalo com fi =0, isto é, um intervalo que não contém valores e no intervalo seguinte ocorrer somente um ou dois valores então suspeita-se que esse ou esses valores são outlier. Outlier é um valor muito diferenciado dos demais, é um valor extremo, muito alto ou muito baixo. Também, pode existir mais que um valor outlier. 9 E st a tí st ic a B á si ca – A d m in is tr aç ão /U F F S Pr of a. I ar a E nd ru w ei t B at ti st i Distribuição de frequência 17 • Histograma 0 2 4 6 8 10 12 14 12 |--- 141 141 |--- 270 270 |--- 399 399 |--- 528 528 |--- 657 657 |--- 786 786 |---915 n Área (hectare) Área (hectare) das propriedades rurais de uma microbacia E st a tí st ic a B á si ca – A d m in is tr aç ão /U F F S Pr of a. I ar a E nd ru w e it B at ti st i Distribuição de frequência 18 • Polígono de frequências 0 2 4 6 8 10 12 14 -52,5 76,5 205,5 334,5 463,5 592,5 721,5 850,5 979,5 fi xi Área (hectare) das propriedades rurais de uma microbacia 10 E st a tí st ic a B á si ca – A d m in is tr aç ão /U F F S Pr of a. I ar a E nd ru w ei t B at ti st i Distribuição de frequência 19 • Polígono de frequência acumulada 0 5 10 15 20 25 30 35 40 45 50 12 141 270 399 528 657 786 915 fa Hectare Área (hectare) das propriedades rurais de uma microbacia E st a tí st ic a B á si ca – A d m in is tr aç ão /U F F S Pr of a. I ar a E nd ru w e it B at ti st i Distribuição de frequência 20 • Natureza da distribuição • O objetivo de uma distribuição de frequências é o de evidenciar o comportamento global da variável em questão. A natureza desse comportamento pode ser simétrica, assimétrica à direita ou assimétrica à esquerda, conforme figura abaixo. Existem maneiras de quantificar essa assimetria. simétrica assimétrica assimétrica a direita a esquerda
Compartilhar