Baixe o app para aproveitar ainda mais
Prévia do material em texto
CAP_2_FREQ 2011.doc PROF. OLÍMPIO 1 CAP 2 - EXERCÍCIO DE ANÁLISE E SIMULAÇÃO ESTUDO DAS FREQUENCIAS Objetivo: Este adendo do capitulo 2 trata do estudo teórico da “distribuição de freqüência” e como isso pode ser aplicado na análise dos problemas e nas decisões sobre os fenômenos registrados durante a coleta de dados, seja qual for a aplicação da estatística descritiva. TIPOS DE FREQUENCIAS PASSO 1 = FREQUENCIAS SIMPLES, TOMADAS DIRETAMENTE NA AMOSTRA. Neste caso, na distribuição de freqüência os valores escolhidos para representar cada classe “i” são idênticos aos valores coletados e que estão distribuídos nos dados. Exemplo: seja a seguinte tabela de Tempo Total Gasto no Balcão (TTG_B): 1) Freqüências simples ou absolutas fi (f minúsculo), ver coluna D da tabela nfi Obs. “xi” são os valores para a análise e que foram coletados na amostra de dados. 2) Freqüências relativas fri São os valores das razões entre as freqüências simples e a freqüência total CAP_2_FREQ 2011.doc PROF. OLÍMPIO 2 (100%) fr que sendo f f fr i i i i 1 Exemplo: Na tabela TTG_B, para i=3, fi=2, então fri=2/20 ==> fri=0,1 , ou 10% 3) Freqüência acumulada Fi (F maiúsculo) É o total das freqüências de todos os valores inferiores ao limite do intervalo de uma classe dada (k). k"" classe no.i com fF ou f......fffF k i ikkk 1 321 Exemplo, na tabela TTG_B , fk, para k=4, f4=17. 4) Freqüência acumulada relativa Fri É a freqüência acumulada da classe dividida pela freqüência total de distribuição. i i i f F Fr ou n F Fr ii Exemplo: para i=3, Fr3=12/20 ==> Fr3=0,6. 5) REPRESENTAÇÃO GRÁFICA DE UMA DISTRIBUIÇÃO Basicamente temos três tipos: 5 A ) HISTOGRAMA São retângulos justapostos, sendo que a largura de cada um corresponde à amplitude dos intervalos de classes, e a altura à freqüência das classes. A área de um histograma é proporcional à soma das freqüências. A seguir é mostrado o histograma da tabela (TTG_B) anterior, com os cálculos das freqüências fi e Fi. Contudo pela simples observação dos dados, a classe que contém os valores [12] e [13] podem ser agrupadas numa só devido á proximidades dimensional, tornando-se uma única classe. CAP_2_FREQ 2011.doc PROF. OLÍMPIO 3 5 B ) POLÍGONO DE FREQUENCIAS É um gráfico em linha sendo as freqüências marcadas sobre perpendiculares ao eixo horizontal levantadas pelos pontos médios dos intervalos de classes. Isto se deve ao fato que nem sempre as classes possuem valores perfeitamente definidos pela coleta de dados, por exemplo: a classe 1 pode agora representar valores xi do intervalo [12,13], o que seria mais coerente e razoável sob o ponto de vista de análise, uma vez que o próximo ponto xi é o valor 21.Assim teríamos apenas 4 classes e não cinco classes, representadas como segue: No caso do exercício teremos pares ordenados (xi,fi) com xi valores médios de cada classe “i”. CAP_2_FREQ 2011.doc PROF. OLÍMPIO 4 5 C ) POLÍGONO DE FREQUENCIA ACUMULADA É traçado mantendo-se as freqüências acumuladas sobre as perpendiculares do eixo horizontal, levantadas nos pontos correspondentes aos limites superiores dos intervalos de classes. 6) CURVA DE FREQUENCIA (POLIDA) Para mostrar de modo mais evidente a verdadeira natureza da distribuição da população, ou seja, como os dados estão dispostos no levantamento feito. Dá uma idéia da tendência do fenômeno estudado. É um método que avalia e utiliza os valores de freqüência de uma classe “i” e dos seus vizinhos imediatos. Isto determina a idéia de que os dados imediatos anteriores e posteriores podem interferir na análise e decisão para uma determinada classe. Para obter a curva de freqüência é preciso “polir, alisar, melhorar” o polígono de freqüência, pois este pode apresentar-se “rugoso” com pontas ou vértices obtusos. Curva polida: Assemelha-se mais à curva de freqüência do que ao polígono de freqüência, Tal polimento consegue-se utilizando o cálculo de novas freqüências acumuladas chamadas de fci. Um exemplo de cálculo empírico é dado pela seguinte expressão: 4 2 11 iiii fff fc que nada mais é do que uma nova média. CAP_2_FREQ 2011.doc PROF. OLÍMPIO 5 Obs; fci = freqüência acumulada calculada na classe considerada fi = freqüência simples calculada na classe considerada fi-1 = freqüência simples calculada na classe anterior à classe considerada fi+1 = freqüência simples calculada na classe posterior à classe considerada A linha da curva dependerá dos tipos de dados e dos cálculos de fci . Por exemplo,a figura a seguir é uma curva polida de freqüência genérica, e também serve de análise para decisões sobre os fenômenos analisados. Junto com o gráfico da curva polida pode-se deixar também os pontos verdadeiros dos fi para efeito de comparação. Nota: As curvas geradas por estes cálculos podem variar conforme o tipo de distribuição, por exemplo podemos obter no final gráficos com estilos de curvas simétricas, assimétricas, gaussianas, hiperbólicas, em J, J invertido, U, retangulares, lineares, etc...., e tudo dependerá do tipo de população tomada como amostra. PASSO 2 = FREQUENCIAS EM AMPLITUDES . Quando os dados coletados possuem muitos valores diferentes, consequentemente a análise deverá ser também com muitas classes. Ms isto não é prático e nem viável, uma vez que o conjunto de dados pode possui milhares de informações, tornando impraticável milhares de classes. Então, neste caso, a distribuição de freqüência deverá receber um tratamento prévio, isto é, devemos acumular os dados em pequenos subconjuntos e em seqüências justapostas, de forma a mostrar uma continuidade dos dados, mas classificados independentemente. CAP_2_FREQ 2011.doc PROF. OLÍMPIO 6 É necessário dimensionar o valor de “h” (amplitude de cada classe), que pode ser flexível, pois depende da distribuição dos valores coletados Xi (conjunto de dados). Contudo, para facilitar, iremos trabalhar com um dimensionamento constante, isto é, iremos projetar cada classe com dimensões similares, e se possível constantes. A seqüência de procedimentos “Pj” é a seguinte: P1: Sabendo o tamanho “n” do conjunto de dados Xi, o primeiro passo é quantificar as classes “i”, para isso usaremos a expressão seguinte: )n( 10 ]1[ ci log3,31q Esta expressão é conhecida como “fórmula ou regra de Sturges”, e é uma aproximação aceita para análise de problemas mais simples. Um outro cálculo aproximado é o seguinte nq ]2[ ci Como os valores de ]1[ ciq e ]2[ ciq podem resultar em decimais, então deverão receber os devidos arredondamentos, pois quantidade de classes é um número natural (inteiro positivo), então aplica-se as regras de arredondamento: O mais comum é o seguinte: Caso 1: para valores com decimais iguais a “5”, o arredondamento é i) para mais se o algarismo anterior é impar, e ii) mantém para menos se o algarismo é par, por exemplo: i)3,4553,46, e ii) 3,4453,44. Caso 2: Para valores com decimais maiores que “5” o arredondamento é para mais, por exemplo.3,463,5 Caso 3: Para valores com decimais menores que “5” o arredondamento é para menos. Por exemplo: 3,443,4 Assim os valores das quantidades se transformam em ]1[ ciq ~ e ]2[ ciq ~ Agora falta escolher um dos dois valores como quantidade de classes ciq . A técnica manda escolher o maior valor: }q~,q~[imomaxq ]2[ ci ]1[ cici P2: Limites de cada classe. Determinar para cada classe “i” que será formada, os limites mínimos “li”, e os respectivos limites máximos “Li”, de modo que teremos os subconjuntos [li, Li] dentro da amostra completa de todos os Xi coletados. O limite mínimo “l1” da primeira classe deve ser o valor mínimo Xi dos dados coletados, e o limite máximo da última classe “i“ deve ser o máximo valor Xi dos dados coletados. Os outros valores deverão ser distribuídos equitativamente de acordo com a expressão h=Li-li. Sabendo ainda que o limite superior de uma classe será o limite superior da classe subsequente, e que: para a primeira classe: (lp)min=mínimo(Xi), para a última classe: (Lu)max=máximo(Xi). P3: CALCULO DA AMPLITUDE AMOSTRAL(AA): Amplitude amostral (AA) é calculada diretamente sobre os valores observados na análise de dados (coleta de dados), assim: AA= (Xi)máximo-(Xi)mínimo. CAP_2_FREQ 2011.doc PROF. OLÍMPIO 7 P4 – CALCULO DA AMPLITUDE TOTAL A Amplitude Total (AT) é quem permite dimensionar cada subconjunto nos seus valores individuais li e Li. Admitindo inicialmente que os limites inferior e superior da primeira e da última classes sejam: l1=(Xi)mínimo e Li=(Xi)máximo então AT=AA Mas quando construímos cada classe “i”, alguns erros vão se acumulando, para mais ou para menos, conforme a decisão tomada para ciq no procedimento P1 . Então na verdade, teremos a relação AT= (L_ultimo)-(l_primeiro), configurando a amplitude total que será usada para os cálculos de freqüência. Portanto o valor de AT e AA poderão ser ligeiramente diferentes um do outro depois de construídas as classes, uma por uma! Deve-se adotar oficialmente a Amplitude (real) Total a ser utilizada como o valor de AT, para garantir que nenhum dos dados xi fique de fora da análise. P5 – AMPLITUDE “h” DE CADA CLASSE “i” Cada classe terá o tamanho fixo “h”, dado por: h=AT/qci , e será constante ao longo da análise. Para iniciar o procedimento, admitimos que AT=AA, logo; h=AA/qci, que deverá ser usada para calculo da amplitude. P6 – DEFINIÇÃO DO INTERVALO DE CADA CLASSE Baseado no princípio que cada classe terá tamanho fixo “h”, conforme P4, agora podemos construir cada subconjunto [li, Li]. O processo deve começar na primeira classe onde se conhece “h” e (lp)min. Assim, 1a classe: h=L1-l1, ou seja, L1=li+h, como l1=(lp)min, L1=(lp)min+h 2a classe: h=L2-l2, ou seja, L2=l2+h, mas l2=L1 (sup.1a.=inf. 2a.) 3a classe: h=L3-l3, ou seja, L3=l3+h, mas l3=L2 (sup.2a.=inf. 3a.) 4a classe: h=L4-l4, ou seja, L4=l4+h, mas l4=L3 (sup.3a.=inf. 2a.) …............................etc.......................etc...................................... ia classe: h=Li-li, ou seja, Li=li+h, mas li=Li-1 (sup.i-1a.=inf. ia.) No final do processo, devido às aproximações numéricas necessárias para a regra de Sturges (ou da raiz quadrada) e quantidade de classes, quando os dados são redistribuídos na reta real poderá ocorrer que na última classe o limite superior máximo real “Lmax-real” não corresponda com o previamente determinado em P2. Isto explica porque AA e AT serão diferentes entre si. Caso o valor da diferença comprometa a análise, isto é seja maior que um erro aceitável e_ac, então será necessário fazer correções nos cálculos desde o procedimento P1. Se |AA-AT|< e_ac CAP_2_FREQ 2011.doc PROF. OLÍMPIO 8 então “continua” senão “recalcula desde P1” Ou então manter uma aproximação aceita se os valores forem suficientemente próximos que não acarretem análises distorcidas e falsas. Por exemplo, aplicar a comparação com um erro “e” aceitável (eac =0,001) sobre os limites máximos para as Amplitudes Amostral (AA) e Total (AT). Se ac AA imomax AT imomax eLL então continua, senão “recalcula desde P1”. Se o limite de erro aceitável (eac) for obedecido, nada acontecerá de grave nas análises futuras, no entanto se o limite de erro for ultrapassado, isto significará algum prejuízo nas análises futuras. Resumidamente, deve-se avaliar os seguintes resultados: ci ]1[ q AA h e ci ]2[ q AT h , e redistribuindo na reta real para averiguar se todos os dados xi estão sendo analisados. Caso algum dado fique de fora, então a opção é utilizar ci ]2[ q AT h , o que garante a análise globas dos dados. P7 – CALCULO DAS FREQUENCIAS “fi”. De posse de cada subconjunto [li, Li] em cada classe “i”, agora é possível montar uma tabela, ou vetor de distribuição de freqüências, baseado em amplitudes. O método é por contagem direta, isto é, para cada classe “i” com amplitude “h”, deve-se determinar (contar, somar) quantos valores “Xi” estão dentro do subconjunto. Por exemplo, sejam valores quaisquer de xi de forma que as amplitudes mínimas e máximas sejam lmin=28 e lmax=48 e suas classes com amplitudes iguais a h=4 conforme as figuras a seguir: CAP_2_FREQ 2011.doc PROF. OLÍMPIO 9 A Tabela a seguir mostra os resultados obtidos para as freqüências “fi” a partir dos gráficoss anteriores. Estes dados podem por exemplo, representar tempos de produção de uma peça manufaturada, cilcos de automação de CNC, tempo de manutenção de um conjunto moto-propulsor, pressão de caldeiras, esforços em sistemas parafusados, montagem e desmontagem de equipamentos, pressão de sucção ou de compressão de bombas hidráulicas, tempo de processamento de rotinas computacionais, tempo gasto no trânsito, etc. P8 – ROTINA COMPUTACIONAL PARA CADA FREQUENCIA Para contabilizar computacionalmente o valor de cada freqüência, é necessário desenvolver uma rotina recursiva com a capacidade de acumular dados uma só vez, ou seja, aplicar um procedimento de busca sobre o conjunto de dados coletados de modo a validar a amplitude “h” e os limites inferior (li) e superior (Li) para cada busca, apontado a quantidade detectada em cada subconjunto “i” de classe. Em outras palavras é preciso escrever uma rotina que faça a “contagem” de quantos Xi estão dentro de cada intervalo [li, Li]. Normalmente a sintaxe exige comparações do tipo “if-then-else” e laços dentro de laços, do tipo “for' ou “do while”, de modo a fazer a varredura no espaço amostral de Xi e armazenando os somatórios em um vetor definido por fi[qci]. P9 – HISTOGRAMA - GRÁFICO DAS FREQUENCIAS DE AMPLITUDE “h” CAP_2_FREQ 2011.doc PROF. OLÍMPIO 1 0 Desde que se tenha a disposição os valores das freqüências “fi” versus cada subconjunto de amplitude h=[Li-li], agora é possível desenhar (construir) o histograma e efetuar a análise dos resultados. P10 – MÉDIA DE CADA CLASSE Como os procedimentos anteriores envolvem freqüências de amplitude “h”, é necessário calcular em cada classe o valor médio (Xi)médio, isto é, para cada classe efetuar o seguinte calculo de média aritmética: (Xi)med=(média da classe i) = (li+Li)/2 portando é um vetor de dados calculados, e será utilizado para construir o gráfico do “Polígono das Freqüências” P11 – POLÍGONO DE FREQUENCIAS É o gráfico de pontos ligados por segmentos de retas (linhas), de modo que no eixo horizontal tem-se os valores das médias do procedimento P10, e no eixo vertical as freqüências. Lembrando que este fato indica a idéia de que nem sempre as classes estão perfeitamente definidas. Auxiliando também na análise dos resultados. P12 – SOMA DAS FREQUENCIAS Conhecidos todos os valores de fi, efetuar agora a soma, de modo que nfi , conforme já escrito anteriormente. P13 – FREQUENCIA ACUMULADA Efetuar o calculo da freqüência acumula, isto é, perfazer uma soma acumulativa, partindo da freqüência da primeira classe e ir acumulando atéa freqüência da última classe, conforme a sentença a seguir: k"" classe no.i com fF ou f......fffF k i ikkk 1 321 Obs: É o total das freqüências de todos os valores inferiores ao limite do intervalo de uma classe dada (k). P14 – POLÍGONO DE FREQUENCIAS ACUMULADAS Fk Como já detalhado anteriormente, trata-se de desenhar um gráfico usando no eixo horizontal os valores dos limites superiores de cada classe versus os valores correspondentes da freqüência acumulada Fk. P15 – FREQUENCIAS ABSOLUTAS “fci” (POLIDAS) Os valores das freqüências absolutas “fci” são na verdade são médias aritméticas ponderadas entre três valores: o atual, o anterior e o posterior. Para uma classe qualquer “i”, o calculo de fci é obtido usando os valores de freqüências adjacentes, pois admite-se que “os vizinhos também interferem' nos resultados parciais e no global das análises. CAP_2_FREQ 2011.doc PROF. OLÍMPIO 1 1 Um exemplo de cálculo empírico é dado pela seguinte expressão: 4 2 11 iiii fff fc que nada mais é do que uma nova média (média ponderada). Sendo então: fci = frequencia acumulada calculada na classe considerada fi = frequencia simples calculada na classe considerada fi-1 = frequencia simples calculada na classe anterior à classe considerada fi+1 = frequencia simples calculada na classe posterior à classe considerada Obs. Para a primeira e a última classe não é possível calcular o fci usando a expressão dada, e recomenda-se usar o seguinte: fc1=f1 para a primeira classe, e fc(ultima)=f(ultima). P16 – GRÁFICO DA CURVA POLIDA O procedimento anterior (P15) permite descobrir dados “polidos”, “alisados”, “melhorados”, para as freqüências. Os dados obtidos servem para construir o gráfico polido, que mostra com mais realidade a natureza da distribuição dos dados. É uma representação que indica as tendências do fenômeno que está sendo estudado. PASSO 3 – APLICAÇÃO DOS PROCEDIMENTOS EXERCICIO: O exercício proposto é construir um programa capaz de executar todos os procedimentos anteriores (P1 até P16), usando como referencia uma base de dados de n=20 clientes, conforme dado na tabela a seguir. Os dados coletados (TTG_B) são referentes ao problema da loja, mas somente estão sendo considerados os resultados finais para o Tempo Total Gasto no Balcão, que é o conjunto de amostra que deve ser analisado. De posse deste programa é possível aplicá-lo em uma base maior e também nos outros subsistemas (PDV e PACOTE). PASSO 4 – 1a EXPANSÃO DO PROGRAMA Expandir o programa para n=60 clientes. PASSO 5 – 2a. EXPANSÃO DO PROGRAMA Expandir o programa para os resultados obtidos no PDV (CAIXA) e no PACOTE. CAP_2_FREQ 2011.doc PROF. OLÍMPIO 1 2
Compartilhar