Baixe o app para aproveitar ainda mais
Prévia do material em texto
Luana de Melo Pereira Disciplina: Estatística Básica Universidade Federal de Pelotas Centro das Engenharias - Ceng 2.2. DISTRIBUIÇÃO DE FREQUÊNCIAS Tabela de frequências Tabela de classificação simples Representação gráfica Histograma Polígono de frequências 2 Distribuição de Frequência 3 Distribuição de frequências e gráficos A distribuição de frequências é uma forma muito útil de resumir a informação sobre uma ou mais variáveis; Trata da organização de um conjunto de medidas ou observações em classes, indicando a frequência de observações em cada classe; Formato é muito sensível ao número de observações disponíveis. 4 Além de resumir a informação, tem por finalidade: 1. Representar a forma como os valores das variáveis se distribuem (localização da maioria dos valores, simetria, número de picos e formato das caudas). 2. Indicar qual modelo de distribuição de probabilidade poderia ser adequado para esses dados, pois fornece uma ideia empírica da distribuição da população. 5 Tabelas de classificação simples As características dessas tabelas variam de acordo com o tipo de variável em estudo. Se a variável é do tipo categórica ou numérica discreta (com poucos valores), devemos obter as frequências para cada nível dessa variável (SEM perda de informação). Se a variável é do tipo numérica contínua, devemos primeiro construir intervalos e depois obter as frequências para cada intervalo (COM perda de informação). 6 Dados brutos: ruim, médio, bom, médio, ruim, médio, ruim, médio, ruim, bom, médio, médio, bom, médio, médio, médio, ótimo, médio, bom, ótimo, bom, ótimo, médio, ótimo, médio, ruim, médio, ótimo, médio, médio, bom, ruim, bom, bom, médio, ruim, médio, médio, ótimo, médio, bom, ruim, ruim, bom, médio, médio, ruim, bom, médio, médio, bom, bom, bom, médio, ruim, bom, médio, médio, ruim, médio Variável Categórica ou Numérica Discreta Para este caso a tabela de distribuição de frequências apresentará a seguinte característica: cada valor da variável constituirá uma classe. Variável em estudo: conceito na disciplina de Estatística Exemplo 1 – VARIÁVEL CATEGÓRICA com poucos valores Número da classe (j) Classe 1 Ruim 2 Médio 3 Bom 4 Ótimo 7 Construção da tabela Para construir a tabela devemos seguir apenas dois passos: 1o passo: Identificar e ordenar as categorias ou valores da variável. Cada categoria ou valor constituirá uma classe. O número da classe é representado por j, tal que j=1, 2, ..., k, onde k é o número total de classes. 8 2º passo: Contar o número de elementos em cada classe, ou seja, contar quantas vezes o dado está repetido. j Classe j F 1 Ruim 1122 2 Médio 2277 3 Bom 1155 4 Ótimo 66 60 Os valores provenientes desta contagem, denotados por Fj, são denominados frequências absolutas das classes. 9 Outras frequências importantes: j Classe j F j F 1 Ruim 12 1122 2 Médio 27 3399 3 Bom 15 5544 4 Ótimo 6 6600 60 - Frequência absoluta acumulada, denotada por , expressa o número de elementos acumulados em cada classe. j F 10 j Classe j F j F j f 1 Ruim 12 12 00,,2200 2 Médio 27 39 00,,4455 3 Bom 15 54 00,,2255 4 Ótimo 6 60 00,,1100 60 - 1 Frequência relativa, denotada por , expressa a proporção de elementos em cada classe. j f 11 j Classe j F jF jf jf 1 Ruim 12 12 0,20 00,,2200 2 Médio 27 39 0,45 00,,6655 3 Bom 15 54 0,25 00,,9900 4 Ótimo 6 60 0,10 11 60 - 1 - Frequência relativa acumulada, denotada por , expressa a proporção de elementos acumulada em cada classe. jf 12 j Classe j F j F j f j f 1 Ruim 12 12 0,20 0,20 2 Médio 27 39 0,45 0,65 3 Bom 15 54 0,25 0,90 4 Ótimo 6 60 0,10 1 60 - 1 - número de alunos que obtiveram conceito Ótimo proporção de alunos que obtiveram conceito Ruim número de alunos que obtiveram até conceito Bom proporção de alunos que obtiveram até conceito Médio Interpretação 13 Dados brutos: 2, 5, 6, 0, 4, 4, 3, 4, 2, 2, 3, 3, 5, 3, 5, 1, 2, 4, 2, 3, 5, 4, 3, 3, 2, 3, 0, 4, 4, 3, 4, 0, 2, 0, 2, 3, 3, 1, 2, 4, 2, ... Variável em estudo: número de peças com defeito na espessura por lote. 1º passo: Identificar e ordenar os valores da variável 2º passo: Contar o número de elementos em cada classe. j Classe j F 1 0 55 2 1 60 3 2 112 4 3 82 5 4 31 6 5 8 7 6 2 350 Exemplo 2 – VARIÁVEL NUMÉRICA DISCRETA Número de peças com defeito na espessura Número de lotes inspecionados 14 j Classe j F j F j f j f 1 0 55 55 0,1571 0,1571 2 1 60 115 0,1714 0,3286 3 2 112 227 0,3200 0,6486 4 3 82 309 0,2343 0,8829 5 4 31 340 0,0886 0,9714 6 5 8 348 0,0229 0,9943 7 6 2 350 0,0057 1 350 - 1 - Interpretação 112 dos 350 lotes apresentaram 2 peças com defeito na espessura. 340 dos 350 lotes apresentaram até 4 peças com defeito na espessura. 32% dos 350 lotes apresentaram 2 peças com defeito na espessura. 97,14% dos 350 lotes apresentaram até 4 peças com defeito na espessura. 15 Os dados a seguir se referem ao número de peças cerâmicas destinadas a exportação por hora de trabalho numa indústria. 0 0 4 2 0 1 0 2 0 4 1 0 0 3 2 0 1 0 0 0 2 0 0 1 0 0 3 2 1 5 0 1 0 0 2 0 0 3 2 1 Exercício proposto: Construa a distribuição de frequências para esses dados e interprete dois resultados. O que se observa? Onde se observa? 16 j Classe j F j F j f j f 1 0 20 20 0,5000 0,5000 2 1 7 27 0,1750 0,6750 3 2 7 34 0,1750 0,8500 4 3 3 37 0,0750 0,9250 5 4 2 39 0,0500 0,9750 6 5 1 40 0,0250 1 40 - 1 - Resolução: j f Em 85% das 40 horas trabalhadas foram produzidas até 2 peças destinadas a exportação. Número de peças destinadas a exportação 3 j F Em 2 das 40 horas trabalhadas foram produzidas 4 peças destinadas a exportação. 5 Número de horas trabalhadas 17 Variáveis Numéricas Contínuas As variáveis contínuas, em geral, assumem muitos valores diferentes uns dos outros. Para contornar problemas desse tipo, as tabelas de distribuição de frequências são construídas de modo que cada classe seja constituída por um intervalo de valores da variável. Quando variáveis discretas assumem muitos valores diferentes é usual agrupar os dados discretos em intervalos de classe. 18 Variável em estudo: valor gasto num supermercado (em R$) pelos primeiros 50 clientes de um certo dia da semana. Exemplo - VARIÁVEL NUMÉRICA CONTÍNUA Dados brutos: 32,03 19,54 45,40 25,13 46,69 18,36 13,78 15,23 36,37 15,62 17,00 27,65 85,76 38,64 86,37 24,58 20,16 93,34 48,65 22,22 23,04 42,97 28,06 52,75 3,11 8,88 9,26 10,81 12,69 28,38 18,43 61,22 41,02 44,67 19,50 17,39 39,16 44,08 38,98 19,27 26,24 28,08 59,07 82,70 26,26 24,47 54,80 70,32 50,39 20,59 19 1o passo: Ordenar o conjunto de dados: colocar os dados brutos em ordem crescente de grandeza (rol). 3,11 8,88 9,26 10,81 12,69 13,78 15,23 15,62 17,00 17,39 18,36 18,43 19,27 19,50 19,54 20,16 20,59 22,22 23,04 24,47 24,58 25,13 26,24 26,26 27,65 28,06 28,0828,38 32,03 36,37 38,98 38,64 39,16 41,02 42,97 44,08 44,67 45,40 46,69 48,65 50,39 52,75 54,80 59,07 61,22 70,32 82,70 85,76 86,37 93,34 Dados ordenados: Construção da tabela 20 2º passo: Determinar o número de classes (k) da tabela. De modo geral, esse valor não deverá ser inferior a 5 e nem superior a 15. Essa definição deverá ser orientada pelos objetivos do trabalho, mas existem algumas regras objetivas de determinação, como, por exemplo: Regras para determinação do número de classes: n log3,321k nk Regra empírica Fórmula de Sturges onde: k: número de classes n: número de observações Arredondar para cima (inteiro) 21 3º passo: Determinar a amplitude do intervalo de classe. Para isso utilizamos a expressão k a i t onde: i: amplitude do intervalo at: amplitude total = x(n) – x(1) 4º passo: Construir os intervalos de classe. Arredondar para cima x(n) = Extremo Superior x(1) = Extremo Inferior 5º passo: Contar o número de elementos em cada classe. j Classe 1 x(1) | x(1) + i 2 x(1) + i | x(1) + 2i 3 x(1) + 2i | x(1) + 3i 22 Recomenda-se o uso de intervalos de mesma amplitude, mas eventualmente uma amplitude variável poderá ser mais adequada ao contexto; Deve ser garantido que todas as observações sejam classificadas; As classes são mutuamente exclusivas, ou seja, uma observação pertence a uma única classe; Com exceção da última classe, que é fechada à esquerda e à direita, os intervalos são fechados à esquerda e abertos à direita, de modo que um valor que coincida com o extremo superior será classificado na classe seguinte. Na construção dos intervalos de classe, é importante observar que: 23 Tomemos a seguinte variável: X = Tempo (segundos) até a falha em 60 ensaios acelerados de tubos de imagem, para a qual os valores observados (e já ordenados) foram: Faça a distribuição de frequências desses dados. 16, 17, 17, 18, 18, 18, 19, 20, 20, 20, 20, 20, 21, 21, 22, 22, 23, 23, 23, 23, 23, 23, 23, 23, 23, 25, 25, 25, 25, 25, 25, 26, 26, 27, 27, 27, 27, 28, 28, 28, 29, 29, 29, 30, 30, 30, 30, 30, 30, 30, 31, 32, 33, 33, 33, 34, 34, 35, 36, 39. Exemplo 24 k EI ES k a i t 3,33,2857 7 16-39 Resolução: n log3,321k 6,91,778 3,321 60n 7 K 25 35,8 || 39,1 32,5 | 35,8 29,2 | 32,5 25,9 | 29,2 22,6 | 25,9 19,3 | 22,6 37,45 34,15 30,85 27,55 24,25 20,95 17,65 16 | 19,3 7 6 5 4 3 2 1 Classes j 60 2 6 9 12 15 9 7 jF 60 58 52 43 31 16 7 jF 1,0000 0,0333 0,1000 0,1500 0,2000 0,2500 0,1500 0,1167 jf 1,0000 0,9667 0,8667 0,7167 0,5167 0,2667 0,1167 jf jc Ponto médio ou centro de classe Tempo (segundos) até a falha em 60 ensaios acelerados de tubos de imagem 15% dos 60 ensaios apresentaram tempos de falha entre [29,2;32,5) segundos. jf 5 Número de ensaios observados 26 3,11 8,88 9,26 10,81 12,69 13,78 15,23 15,62 17,00 17,39 18,36 18,43 19,27 19,50 19,54 20,16 20,59 22,22 23,04 24,47 24,58 25,13 26,24 26,26 27,65 28,06 28,08 28,38 32,03 36,37 38,98 38,64 39,16 41,02 42,97 44,08 44,67 45,40 46,69 48,65 50,39 52,75 54,80 59,07 61,22 70,32 82,70 85,76 86,37 93,34 Os dados em rol abaixo (ordenação horizontal) se referem ao valor gasto num supermercado (em R$) pelos primeiros 50 clientes de um certo dia da semana. Faça a distribuição de frequências desses dados. Exercício proposto: 27 k EI ES k a i t 12,89 7 3,11-93,34 Resolução: j Classe j F j F j f j f j c 1 8 0,16 0,16 2 28 0,40 0,56 3 34 0,12 0,68 4 42 0,16 0,84 5 45 0,06 0,90 6 46 0,02 0,92 7 50 0,08 1 50 - 1 - - n log3,321k 6,641,7 3,321 50n 7 3,11| 16,00 16,00| 28,89 28,89| 41,78 41,78| 54,67 54,67| 67,56 67,56| 80,45 9,56 22,45 35,34 48,23 61,12 74,01 86,90 8 20 6 8 3 1 4 80,45 || 93,34 28 As distribuições de frequências podem ser representadas graficamente através de: Histograma Polígono de frequências Representação gráfica 29 O histograma consiste de um conjunto de retângulos contíguos cuja base é igual à amplitude do intervalo e a altura proporcional à frequência das respectivas classes. Histograma (variável contínua) Frequência no intervalo Figura - Histograma para o tempo (segundos) até a falha em 60 ensaios acelerados de tubos de imagem 30 Polígono de frequências (variável contínua) O polígono de frequências é constituído por segmentos de retas que unem os pontos cujas coordenadas são o ponto médio e a frequência de cada classe. Para fechá-lo toma-se uma classe anterior a primeira e uma posterior a última, uma vez que ambas possuem frequência zero. Figura - Polígono de frequências para o tempo (segundos) até a falha em 60 ensaios acelerados de tubos de imagem. 31 Variável Discreta (dados de enumeração) Frequência no ponto Figura - número de peças com defeito na espessura por lote. Quando trabalhamos com variáveis discretas, os retângulos dos histogramas se reduzem a retas e, consequentemente, deixam de ser contíguos. 32 0 5 10 15 20 25 30 Ruim Médio Bom Ótimo Conceito A lu no s Figura - Conceito dos alunos na disciplina de Estatística. UFPel, 2001. Gráfico de colunas 20% 45% 25% 10% Ruim Médio Bom Ótimo Figura - Conceito dos alunos na disciplina de Estatística. UFPel, 2001. Gráfico de setores Variável Categórica 33 Próxima aula - 2.3. Medidas descritivas Medidas de localização Medidas separatrizes Medidas de variação Medidas de formato
Compartilhar