Buscar

CAP_2_QUALIDADE FREQ 2011

Prévia do material em texto

CAP_2_FREQ 2011.doc PROF. OLÍMPIO 1
 
CAP 2 - EXERCÍCIO DE ANÁLISE E SIMULAÇÃO 
ESTUDO DAS FREQUENCIAS 
 
Objetivo: Este adendo do capitulo 2 trata do estudo teórico da “distribuição de freqüência” e como isso pode ser 
aplicado na análise dos problemas e nas decisões sobre os fenômenos registrados durante a coleta de dados, seja 
qual for a aplicação da estatística descritiva. 
 
 
 TIPOS DE FREQUENCIAS 
 
PASSO 1 = FREQUENCIAS SIMPLES, TOMADAS DIRETAMENTE NA AMOSTRA. 
 
Neste caso, na distribuição de freqüência os valores escolhidos para representar cada classe “i” são idênticos aos 
valores coletados e que estão distribuídos nos dados. 
 
Exemplo: seja a seguinte tabela de Tempo Total Gasto no Balcão (TTG_B): 
 
 
 
1) Freqüências simples ou absolutas fi (f minúsculo), ver coluna D da tabela 
 
 nfi
 Obs. “xi” são os valores para a análise e que foram coletados na amostra de dados. 
 
 
2) Freqüências relativas fri 
 
São os valores das razões entre as freqüências simples e a freqüência total 
 
CAP_2_FREQ 2011.doc PROF. OLÍMPIO 2
 
 (100%) fr que sendo 
f
f
fr i
i
i
i 

 1
 
Exemplo: Na tabela TTG_B, para i=3, fi=2, então fri=2/20 ==> fri=0,1 , ou 10% 
 
 
3) Freqüência acumulada Fi (F maiúsculo) 
 
É o total das freqüências de todos os valores inferiores ao limite do intervalo de uma classe dada (k). 
 
k"" classe no.i com fF ou f......fffF
k
i
ikkk  
1
321
 
 
Exemplo, na tabela TTG_B , fk, para k=4, f4=17. 
 
 
4) Freqüência acumulada relativa Fri 
 
É a freqüência acumulada da classe dividida pela freqüência total de distribuição. 
 


i
i
i
f
F
Fr
 ou 
n
F
Fr ii 
 
 
Exemplo: para i=3, Fr3=12/20 ==> Fr3=0,6. 
 
 
5) REPRESENTAÇÃO GRÁFICA DE UMA DISTRIBUIÇÃO 
 
 Basicamente temos três tipos: 
 
5
A
) HISTOGRAMA 
São retângulos justapostos, sendo que a largura de cada um corresponde à amplitude dos intervalos de classes, e 
a altura à freqüência das classes. 
A área de um histograma é proporcional à soma das freqüências. 
 
A seguir é mostrado o histograma da tabela (TTG_B) anterior, com os cálculos das freqüências fi e Fi. Contudo 
pela simples observação dos dados, a classe que contém os valores [12] e [13] podem ser agrupadas numa só 
devido á proximidades dimensional, tornando-se uma única classe. 
 
CAP_2_FREQ 2011.doc PROF. OLÍMPIO 3
 
 
 
 
5
B
) POLÍGONO DE FREQUENCIAS 
É um gráfico em linha sendo as freqüências marcadas sobre perpendiculares ao eixo horizontal levantadas pelos 
pontos médios dos intervalos de classes. Isto se deve ao fato que nem sempre as classes possuem valores 
perfeitamente definidos pela coleta de dados, por exemplo: a classe 1 pode agora representar valores xi do 
intervalo [12,13], o que seria mais coerente e razoável sob o ponto de vista de análise, uma vez que o próximo 
ponto xi é o valor 21.Assim teríamos apenas 4 classes e não cinco classes, representadas como segue: 
 
 
No caso do exercício teremos pares ordenados (xi,fi) com xi valores médios de cada classe “i”. 
 
CAP_2_FREQ 2011.doc PROF. OLÍMPIO 4
 
 
5
C
) POLÍGONO DE FREQUENCIA ACUMULADA 
 
É traçado mantendo-se as freqüências acumuladas sobre as perpendiculares do eixo horizontal, levantadas nos 
pontos correspondentes aos limites superiores dos intervalos de classes. 
 
 
 
 
6) CURVA DE FREQUENCIA (POLIDA) 
 
Para mostrar de modo mais evidente a verdadeira natureza da distribuição da população, ou seja, como os dados 
estão dispostos no levantamento feito. 
 
Dá uma idéia da tendência do fenômeno estudado. É um método que avalia e utiliza os valores de freqüência de 
uma classe “i” e dos seus vizinhos imediatos. Isto determina a idéia de que os dados imediatos anteriores e 
posteriores podem interferir na análise e decisão para uma determinada classe. 
Para obter a curva de freqüência é preciso “polir, alisar, melhorar” o polígono de freqüência, pois este pode 
apresentar-se “rugoso” com pontas ou vértices obtusos. 
Curva polida: Assemelha-se mais à curva de freqüência do que ao polígono de freqüência, Tal polimento 
consegue-se utilizando o cálculo de novas freqüências acumuladas chamadas de fci. 
 
Um exemplo de cálculo empírico é dado pela seguinte expressão: 
 
4
2 11   iiii
fff
fc
 que nada mais é do que uma nova média. 
CAP_2_FREQ 2011.doc PROF. OLÍMPIO 5
 
Obs; 
fci = freqüência acumulada calculada na classe considerada 
fi = freqüência simples calculada na classe considerada 
fi-1 = freqüência simples calculada na classe anterior à classe considerada 
fi+1 = freqüência simples calculada na classe posterior à classe considerada 
 
A linha da curva dependerá dos tipos de dados e dos cálculos de fci . 
Por exemplo,a figura a seguir é uma curva polida de freqüência genérica, e também serve de análise para 
decisões sobre os fenômenos analisados. 
 
 
 
Junto com o gráfico da curva polida pode-se deixar também os pontos verdadeiros dos fi para efeito de 
comparação. 
 
Nota: As curvas geradas por estes cálculos podem variar conforme o tipo de distribuição, por exemplo podemos 
obter no final gráficos com estilos de curvas simétricas, assimétricas, gaussianas, hiperbólicas, em J, J invertido, U, 
retangulares, lineares, etc...., e tudo dependerá do tipo de população tomada como amostra. 
 
 
PASSO 2 = FREQUENCIAS EM AMPLITUDES . 
 
Quando os dados coletados possuem muitos valores diferentes, consequentemente a análise deverá ser também 
com muitas classes. Ms isto não é prático e nem viável, uma vez que o conjunto de dados pode possui milhares de 
informações, tornando impraticável milhares de classes. 
 
Então, neste caso, a distribuição de freqüência deverá receber um tratamento prévio, isto é, devemos acumular os 
dados em pequenos subconjuntos e em seqüências justapostas, de forma a mostrar uma continuidade dos dados, 
mas classificados independentemente. 
 
 
CAP_2_FREQ 2011.doc PROF. OLÍMPIO 6
 
É necessário dimensionar o valor de “h” (amplitude de cada classe), que pode ser flexível, pois depende da 
distribuição dos valores coletados Xi (conjunto de dados). Contudo, para facilitar, iremos trabalhar com um 
dimensionamento constante, isto é, iremos projetar cada classe com dimensões similares, e se possível 
constantes. A seqüência de procedimentos “Pj” é a seguinte: 
 
P1: Sabendo o tamanho “n” do conjunto de dados Xi, o primeiro passo é quantificar as classes “i”, para isso 
usaremos a expressão seguinte: 
 
)n(
10
]1[
ci log3,31q 
 
 
Esta expressão é conhecida como “fórmula ou regra de Sturges”, e é uma aproximação aceita para análise de 
problemas mais simples. 
 
Um outro cálculo aproximado é o seguinte 
nq
]2[
ci 
 
 
Como os valores de 
]1[
ciq
 e 
]2[
ciq
 podem resultar em decimais, então deverão receber os devidos 
arredondamentos, pois quantidade de classes é um número natural (inteiro positivo), então aplica-se as regras de 
arredondamento: O mais comum é o seguinte: 
 
Caso 1: para valores com decimais iguais a “5”, o arredondamento é i) para mais se o algarismo anterior é impar, e 
ii) mantém para menos se o algarismo é par, por exemplo: i)3,4553,46, e ii) 3,4453,44. 
Caso 2: Para valores com decimais maiores que “5” o arredondamento é para mais, por exemplo.3,463,5 
Caso 3: Para valores com decimais menores que “5” o arredondamento é para menos. Por exemplo: 3,443,4 
 
Assim os valores das quantidades se transformam em 
 
]1[
ciq
~
 e 
]2[
ciq
~
 
 
Agora falta escolher um dos dois valores como quantidade de classes 
ciq
. A técnica manda escolher o maior 
valor: 
}q~,q~[imomaxq
]2[
ci
]1[
cici P2: Limites de cada classe. 
 
Determinar para cada classe “i” que será formada, os limites mínimos “li”, e os respectivos limites máximos “Li”, de 
modo que teremos os subconjuntos [li, Li] dentro da amostra completa de todos os Xi coletados. 
O limite mínimo “l1” da primeira classe deve ser o valor mínimo Xi dos dados coletados, e o limite máximo da 
última classe “i“ deve ser o máximo valor Xi dos dados coletados. Os outros valores deverão ser distribuídos 
equitativamente de acordo com a expressão h=Li-li. 
 
Sabendo ainda que o limite superior de uma classe será o limite superior da classe subsequente, e que: 
para a primeira classe: (lp)min=mínimo(Xi), para a última classe: (Lu)max=máximo(Xi). 
 
 
P3: CALCULO DA AMPLITUDE AMOSTRAL(AA): 
 
 
Amplitude amostral (AA) é calculada diretamente sobre os valores observados na análise de dados (coleta de 
dados), assim: 
 
 
AA= (Xi)máximo-(Xi)mínimo. 
CAP_2_FREQ 2011.doc PROF. OLÍMPIO 7
 
 
P4 – CALCULO DA AMPLITUDE TOTAL 
 
A Amplitude Total (AT) é quem permite dimensionar cada subconjunto nos seus valores individuais li e Li. 
Admitindo inicialmente que os limites inferior e superior da primeira e da última classes sejam: 
 
l1=(Xi)mínimo e Li=(Xi)máximo 
 
 
então AT=AA 
 
Mas quando construímos cada classe “i”, alguns erros vão se acumulando, para mais ou para menos, conforme a 
decisão tomada para 
ciq
 no procedimento P1 . 
 
Então na verdade, teremos a relação 
 
AT= (L_ultimo)-(l_primeiro), configurando a amplitude total que será usada para os cálculos de freqüência. 
 
Portanto o valor de AT e AA poderão ser ligeiramente diferentes um do outro depois de construídas as classes, 
uma por uma! 
Deve-se adotar oficialmente a Amplitude (real) Total a ser utilizada como o valor de AT, para garantir que nenhum 
dos dados xi fique de fora da análise. 
 
 
P5 – AMPLITUDE “h” DE CADA CLASSE “i” 
 
Cada classe terá o tamanho fixo “h”, dado por: h=AT/qci , e será constante ao longo da análise. 
Para iniciar o procedimento, admitimos que AT=AA, logo; 
 
 h=AA/qci, que deverá ser usada para calculo da amplitude. 
 
 
P6 – DEFINIÇÃO DO INTERVALO DE CADA CLASSE 
 
Baseado no princípio que cada classe terá tamanho fixo “h”, conforme P4, agora podemos construir cada 
subconjunto [li, Li]. 
O processo deve começar na primeira classe onde se conhece “h” e (lp)min. 
 
Assim, 
 1a classe: h=L1-l1, ou seja, L1=li+h, como l1=(lp)min, L1=(lp)min+h 
 2a classe: h=L2-l2, ou seja, L2=l2+h, mas l2=L1 (sup.1a.=inf. 2a.) 
 3a classe: h=L3-l3, ou seja, L3=l3+h, mas l3=L2 (sup.2a.=inf. 3a.) 
 4a classe: h=L4-l4, ou seja, L4=l4+h, mas l4=L3 (sup.3a.=inf. 2a.) 
 …............................etc.......................etc...................................... 
 ia classe: h=Li-li, ou seja, Li=li+h, mas li=Li-1 (sup.i-1a.=inf. ia.) 
 
 
 
No final do processo, devido às aproximações numéricas necessárias para a regra de Sturges (ou da raiz 
quadrada) e quantidade de classes, quando os dados são redistribuídos na reta real poderá ocorrer que na última 
classe o limite superior máximo real “Lmax-real” não corresponda com o previamente determinado em P2. 
 
 
Isto explica porque AA e AT serão diferentes entre si. Caso o valor da diferença comprometa a análise, isto é seja 
maior que um erro aceitável e_ac, então será necessário fazer correções nos cálculos desde o procedimento P1. 
 
Se |AA-AT|< e_ac 
CAP_2_FREQ 2011.doc PROF. OLÍMPIO 8
 
 então “continua” 
 senão “recalcula desde P1” 
 
 
Ou então manter uma aproximação aceita se os valores forem suficientemente próximos que não acarretem 
análises distorcidas e falsas. 
Por exemplo, aplicar a comparação com um erro “e” aceitável (eac =0,001) sobre os limites máximos para as 
Amplitudes Amostral (AA) e Total (AT). 
 
 Se 
ac
AA
imomax
AT
imomax eLL 
 
 então continua, 
 senão “recalcula desde P1”. 
 
Se o limite de erro aceitável (eac) for obedecido, nada acontecerá de grave nas análises futuras, no entanto se o 
limite de erro for ultrapassado, isto significará algum prejuízo nas análises futuras. 
 
 
 
 
Resumidamente, deve-se avaliar os seguintes resultados: 
 
 
ci
]1[
q
AA
h 
 e 
ci
]2[
q
AT
h 
, e redistribuindo na reta real para averiguar se todos os dados xi estão sendo 
analisados. 
 
Caso algum dado fique de fora, então a opção é utilizar 
ci
]2[
q
AT
h 
, o que garante a análise globas dos dados. 
 
 
 
P7 – CALCULO DAS FREQUENCIAS “fi”. 
 
De posse de cada subconjunto [li, Li] em cada classe “i”, agora é possível montar uma tabela, ou vetor de 
distribuição de freqüências, baseado em amplitudes. O método é por contagem direta, isto é, para cada classe “i” 
com amplitude “h”, deve-se determinar (contar, somar) quantos valores “Xi” estão dentro do subconjunto. 
Por exemplo, sejam valores quaisquer de xi de forma que as amplitudes mínimas e máximas sejam lmin=28 e 
lmax=48 e suas classes com amplitudes iguais a h=4 conforme as figuras a seguir: 
CAP_2_FREQ 2011.doc PROF. OLÍMPIO 9
 
 
 
A Tabela a seguir mostra os resultados obtidos para as freqüências “fi” a partir dos gráficoss anteriores. 
 
Estes dados podem por exemplo, representar tempos de produção de uma peça manufaturada, cilcos de 
automação de CNC, tempo de manutenção de um conjunto moto-propulsor, pressão de caldeiras, esforços em 
sistemas parafusados, montagem e desmontagem de equipamentos, pressão de sucção ou de compressão de 
bombas hidráulicas, tempo de processamento de rotinas computacionais, tempo gasto no trânsito, etc. 
 
 
 
 
P8 – ROTINA COMPUTACIONAL PARA CADA FREQUENCIA 
 
Para contabilizar computacionalmente o valor de cada freqüência, é necessário desenvolver uma rotina recursiva 
com a capacidade de acumular dados uma só vez, ou seja, aplicar um procedimento de busca sobre o conjunto de 
dados coletados de modo a validar a amplitude “h” e os limites inferior (li) e superior (Li) para cada busca, 
apontado a quantidade detectada em cada subconjunto “i” de classe. Em outras palavras é preciso escrever uma 
rotina que faça a “contagem” de quantos Xi estão dentro de cada intervalo [li, Li]. 
 
 
Normalmente a sintaxe exige comparações do tipo “if-then-else” e laços dentro de laços, do tipo “for' ou “do while”, 
de modo a fazer a varredura no espaço amostral de Xi e armazenando os somatórios em um vetor definido por 
fi[qci]. 
 
 
P9 – HISTOGRAMA - GRÁFICO DAS FREQUENCIAS DE AMPLITUDE “h” 
 
CAP_2_FREQ 2011.doc PROF. OLÍMPIO 1
0
 
Desde que se tenha a disposição os valores das freqüências “fi” versus cada subconjunto de amplitude h=[Li-li], 
agora é possível desenhar (construir) o histograma e efetuar a análise dos resultados. 
 
 
P10 – MÉDIA DE CADA CLASSE 
 
Como os procedimentos anteriores envolvem freqüências de amplitude “h”, é necessário calcular em cada classe o 
valor médio (Xi)médio, isto é, para cada classe efetuar o seguinte calculo de média aritmética: 
 
(Xi)med=(média da classe i) = (li+Li)/2 
 
portando é um vetor de dados calculados, e será utilizado para construir o gráfico do “Polígono das Freqüências” 
 
 
P11 – POLÍGONO DE FREQUENCIAS 
 
É o gráfico de pontos ligados por segmentos de retas (linhas), de modo que no eixo horizontal tem-se os valores 
das médias do procedimento P10, e no eixo vertical as freqüências. Lembrando que este fato indica a idéia de que 
nem sempre as classes estão perfeitamente definidas. Auxiliando também na análise dos resultados. 
 
 
P12 – SOMA DAS FREQUENCIAS 
 
Conhecidos todos os valores de fi, efetuar agora a soma, de modo que 
 nfi
 , conforme já escrito anteriormente. 
 
 
P13 – FREQUENCIA ACUMULADA 
 
Efetuar o calculo da freqüência acumula, isto é, perfazer uma soma acumulativa, partindo da freqüência da 
primeira classe e ir acumulando atéa freqüência da última classe, conforme a sentença a seguir: 
 
 
 
k"" classe no.i com fF ou f......fffF
k
i
ikkk  
1
321
 
 
Obs: É o total das freqüências de todos os valores inferiores ao limite do intervalo de uma classe dada (k). 
 
 
 
P14 – POLÍGONO DE FREQUENCIAS ACUMULADAS Fk 
 
Como já detalhado anteriormente, trata-se de desenhar um gráfico usando no eixo horizontal os valores dos limites 
superiores de cada classe versus os valores correspondentes da freqüência acumulada Fk. 
 
 
P15 – FREQUENCIAS ABSOLUTAS “fci” (POLIDAS) 
 
Os valores das freqüências absolutas “fci” são na verdade são médias aritméticas ponderadas entre três valores: o 
atual, o anterior e o posterior. Para uma classe qualquer “i”, o calculo de fci é obtido usando os valores de 
freqüências adjacentes, pois admite-se que “os vizinhos também interferem' nos resultados parciais e no global das 
análises. 
 
CAP_2_FREQ 2011.doc PROF. OLÍMPIO 1
1
 
 
Um exemplo de cálculo empírico é dado pela seguinte expressão: 
 
4
2 11   iiii
fff
fc
 que nada mais é do que uma nova média (média ponderada). 
 
Sendo então: 
fci = frequencia acumulada calculada na classe considerada 
fi = frequencia simples calculada na classe considerada 
fi-1 = frequencia simples calculada na classe anterior à classe considerada 
fi+1 = frequencia simples calculada na classe posterior à classe considerada 
 
 
Obs. Para a primeira e a última classe não é possível calcular o fci usando a expressão dada, e recomenda-se 
usar o seguinte: 
 fc1=f1 para a primeira classe, e fc(ultima)=f(ultima). 
 
 
P16 – GRÁFICO DA CURVA POLIDA 
 
O procedimento anterior (P15) permite descobrir dados “polidos”, “alisados”, “melhorados”, para as freqüências. Os 
dados obtidos servem para construir o gráfico polido, que mostra com mais realidade a natureza da distribuição 
dos dados. É uma representação que indica as tendências do fenômeno que está sendo estudado. 
 
 
PASSO 3 – APLICAÇÃO DOS PROCEDIMENTOS 
 
 
EXERCICIO: O exercício proposto é construir um programa capaz de executar todos os procedimentos anteriores 
(P1 até P16), usando como referencia uma base de dados de n=20 clientes, conforme dado na tabela a seguir. Os 
dados coletados (TTG_B) são referentes ao problema da loja, mas somente estão sendo considerados os 
resultados finais para o Tempo Total Gasto no Balcão, que é o conjunto de amostra que deve ser analisado. 
 
De posse deste programa é possível aplicá-lo em uma base maior e também nos outros subsistemas (PDV e 
PACOTE). 
 
 
 
PASSO 4 – 1a EXPANSÃO DO PROGRAMA 
 
Expandir o programa para n=60 clientes. 
 
 
PASSO 5 – 2a. EXPANSÃO DO PROGRAMA 
 
Expandir o programa para os resultados obtidos no PDV (CAIXA) e no PACOTE. 
 
 
 
 
CAP_2_FREQ 2011.doc PROF. OLÍMPIO 1
2

Continue navegando