Baixe o app para aproveitar ainda mais
Prévia do material em texto
CONTROLE ESTATÍSTICO DE PROCESSO Gisele Lozada Distribuição de Poisson, binomial e hipergeométrica Objetivos de aprendizagem Ao final deste texto, você deve apresentar os seguintes aprendizados: Reconhecer características e aplicações da distribuição de Poisson. De� nir atributos e utilidades da distribuição binomial. Identi� car propriedades e destinações da distribuição hipergeométrica. Introdução A probabilidade corresponde a uma ciência que se encontra nos bas- tidores de nosso cotidiano, sendo utilizada em muitas de nossas ações rotineiras. Ao consultarmos a previsão de tempo ou realizarmos um jogo da loteria, estamos sob os princípios da teoria da probabilidade. Uma de suas muitas aplicações está relacionada ao controle de processos, em que são formuladas e testadas hipóteses, com a intenção de qualificar o processo de tomada de decisões. O universo da teoria da probabilidade e da estatística lida com uma considerável gama de variáveis, sendo uma delas denominada variável aleatória. Definida como evento numérico cujo valor é determinado por processo acidental, e que pode ser designada discreta ou contínua. Especialmente, sobre a variável aleatória discreta, podemos conside- rar sua característica quantitativa, cujos resultados ocorrem em pontos isolados ao longo de uma escala de valores, podendo ser listados em sua totalidade, e aplicados em avaliações de probabilidade, às quais são destinados diversos modelos probabilísticos discretos. Neste capítulo, você vai estudar alguns desses modelos, que corres- pondem a distribuição de Poisson, distribuição binomial e distribuição hipergeométrica, conhecendo sobre suas principais características e aplicações. U2_C05_Controle estatístico de processos.indd 73 17/07/2017 12:12:45 Distribuição de Poisson A distribuição de Poisson corresponde a um dos modelos probabilísticos discretos, utilizados na teoria da probabilidade e na estatística. Destina-se ao estudo de distribuição discreta de uma variável aleatória, que expressa a probabilidade de uma série de eventos ocorrerem num determinado intervalo, sendo que: a probabilidade permite calcular a chance de ocorrência de um número em um experimento aleatório; o intervalo pode ser o tempo, a distância, o volume, a área ou outra unidade análoga. A distribuição de Poisson expressa a probabilidade de uma série de eventos ocorrerem num determinado intervalo. Segundo Becker (2015, p. 236) “[...] a distribuição de Poisson é utilizada em processos de contagem ao longo do tempo ou de qualquer outra dimensão contínua (p. ex.: linha, superfície, etc.) em que a taxa média é conhecida e as ocorrências do fenômeno de interesse ocorrem independentemente”. Cabe lembrar que uma variável aleatória é aquela definida como sendo um evento numérico cujo valor é determinado por processo acidental, de acordo com Kazmier (2008). Esta variável aleatória pode ser denominada discreta quando todos os seus resultados possíveis podem ser listados (visto que ocorrem em pontos isolados ao longo de uma escala de valores, normalmente originados de um processo de contagem e expressos como números inteiros). Ao contrário disso, a variável aleatória pode ser denominada contínua, assumindo qualquer valor entre outros dois (em qualquer casa decimal ao longo de um intervalo de valores, e normalmente gerados a partir de um processo de medição). Quando utilizar a distribuição de Poisson A distribuição de Poisson é frequentemente usada para medir o número de ocorrências de um evento por certo intervalo, em situações como: Controle estatístico de processos 74 U2_C05_Controle estatístico de processos.indd 74 17/07/2017 12:12:46 número de falhas em componentes manufaturados; número de clientes que chegam a um ponto comercial; quantidade de pessoas conectadas à internet; número de chamadas telefônicas por unidade de tempo. Em todas estas situações, temos um conjunto de ocorrências que satisfazem as seguintes condições: a probabilidade de duas ou mais ocorrências simultâneas é praticamente zero; o número de ocorrências de um evento em determinado tempo (espaço) é independente do número de ocorrências de eventos em qualquer outro intervalo; o número médio de ocorrências por unidade de tempo (espaço) é cons- tante ao longo do tempo (espaço); o número de ocorrências durante qualquer intervalo depende da dura- ção ou tamanho do intervalo, quanto maior o intervalo, maior será o número de ocorrências; em intervalos iguais, as probabilidades de ocorrências devem ser iguais. Se a situação atender a todas estas condições, trata-se de uma distribuição de Poisson. E sendo assim, a variável aleatória x será o número de ocorrências do evento no intervalo. A distribuição de Poisson pode ser utilizada em processos como a contagem de defeitos em processos industriais ou a contagem de demandas por canais de telecomunicações, segundo Becker (2015, p. 236). Como aplicar a distribuição de Poisson A distribuição discreta de probabilidade aplicável às ocorrências de um de- terminado evento em um intervalo específi co gera uma taxa (normalmente 75Distribuição de Poisson, binomial e hipergeométrica U2_C05_Controle estatístico de processos.indd 75 17/07/2017 12:12:46 apresentada em percentual), que é apurada através da aplicação de fórmula específi ca, geralmente apresentada de seguinte maneira: P (X = k) = e–λ . λk k! As variáveis integrantes da fórmula da distribuição de Poisson são as seguintes: P (X) = a probabilidade de X de ocorrências, com ƛ conhecido; ƛ = a média do número de eventos que acontecem por unidade de medida; X = número esperado de sucessos; e = número de sucessos por unidade (base do sistema logarítmico natural, que corresponde a aproximadamente 2,71828); k = é dada pela fórmula de distribuição de probabilidade (k! = k fatorial). Uma empresa que presta serviços de call center recebe, em média, cinco chamadas por minuto. Qual a probabilidade de a empresa não receber nenhuma chamada durante o intervalo de um minuto? P (X = 0) = 50 . e–5 0! = e–5 = 0,0067 ou 6,7% Sendo assim, a probabilidade de nenhuma ligação ser recebida no intervalo de um minuto é de 6,7%. Distribuição binomial Antes de ingressarmos no estudo das distribuições binomial e hipergeométrica, cabe chamar atenção para um conceito importante: a diferença entre amostra- gem com ou sem reposição. Sobre este assunto, Doane e Seward (2014, p. 35) Controle estatístico de processos 76 U2_C05_Controle estatístico de processos.indd 76 17/07/2017 12:12:47 apontam que a “[...] amostragem sem reposição signifi ca que, uma vez que um item tenha sido selecionado para ser incluído em uma amostra, ele não pode ser selecionado novamente nessa mesma amostra”. Logo, no sentido contrário, a amostragem com reposição signifi ca que cada elemento da população tem a chance de ser considerado mais de uma vez no processo de amostragem. Imagine uma urna em que várias fichas estão misturadas, e da qual é retirada uma destas fichas. Se a ficha for devolvida à urna e misturada às demais antes da seleção seguinte, esta mesma ficha poderá ser escolhida novamente. A distribuição binomial corresponde a outro modelo probabilístico desti- nado a variáveis aleatórias discretas, consistindo em uma das alternativas mais frequentemente usadas em estatística. Uma variável aleatória tem distribuição binomial quando o experimento apresenta apenas dois resultados, que são denominados como sucesso ou fracasso. Neste ponto, cabe ressaltar a conotação de sucesso ou fracasso: sucesso significa que a condição ou evento de interesse foram atendidos e, desta forma, fracasso não necessariamente significa algo ruim, apenas sinaliza o inverso, correspondendo ao não atendimento da condição ou evento de interesse. Segundo Kazmier (2008, p. 103) “[...] a distribuição binomial é uma distri- buição de probabilidade discreta que é aplicável como modelo para tomadade decisão em situações nas quais o processo de amostragem pode ser assumido como em conformidade com um processo de Bernoulli”. Na teoria de probabilidades e estatística, o processo de Bernoulli corres- ponde a um processo de amostragem, indicado para casos em que o mesmo ocorrer com reposição, relativo a uma distribuição discreta de espaço amostral (0 e 1), que tem o valor 1 com probabilidade de sucesso p e o valor 0 com probabilidade de fracasso q = 1 – p. 77Distribuição de Poisson, binomial e hipergeométrica U2_C05_Controle estatístico de processos.indd 77 17/07/2017 12:12:48 A distribuição binomial expressa a probabilidade de um entre dois resultados (sucesso ou fracasso) ocorrer em uma série de tentativas. Doane e Seward (2014, p. 230), ao compararem as distribuições binomial e de Poisson, relatam que no modelo Poisson, “[...] ao contrário da binomial, X não tem um limite evidente, isto é, o número de eventos que podem ocorrer em uma dada unidade de tempo não é limitado”. Quando utilizar a distribuição binomial A distribuição binomial pode ser empregada na determinação da probabili- dade quando no evento especifi cado se deseja calcular a probabilidade de um acontecimento ou acontecimentos. Neste caso, é importante observar que: os eventos que constituem o acontecimento devem ser independentes; a ordem dos eventos não influencia o cálculo da probabilidade. Deve-se observar também que o processo de amostragem de Bernoulli, sobre o qual a distribuição binomial é aplicável, considera que: a cada tentativa ou observação, somente dois eventos mutuamente excludentes são possíveis (sucesso ou fracasso); os resultados da série de tentativas ou observações correspondem a eventos independentes; a probabilidade de sucesso em cada tentativa da série permanece constante de uma tentativa para outra, configurando um processo estacionário. Como aplicar a distribuição binomial Para a aplicação da distribuição binomial, as seguintes considerações devem ser observadas: Controle estatístico de processos 78 U2_C05_Controle estatístico de processos.indd 78 17/07/2017 12:12:48 o experimento deve ser repetido, nas mesmas condições, um número fi- nito de vezes (n); as provas repetidas devem ser independentes, ou seja, o resultado de uma prova não deve afetar os resultados das demais provas; como consequência de cada prova, deve-se obter um dos dois possíveis resultados: sucesso ou fracasso; no decorrer do experimento, a probabilidade p do sucesso e a probabi- lidade q (q = 1 – p) do fracasso são constantes. Quando o experimento realizado corresponder a uma única tentativa, a probabilidade de realização de um evento de sucesso será p, e a probabilidade de fracasso será q = 1 – p. Repetindo-se o mesmo experimento n vezes sucessivas e independentes, a probabilidade de que um evento se realize k vezes nas provas é geralmente dada pela função: P (X = k) = n k = pk qn–k n! k! (n – k)! n k = Essa função, também denominada lei binomial, define a distribuição bi- nomial, cujas variáveis integrantes correspondem a: P (X = k) é a probabilidade de que o evento se realize k vezes em n provas; p é a probabilidade de que o evento se realize em uma só prova = sucesso; q é a probabilidade de que o evento não se realize nesta prova = fracasso; (n/k) é o coeficiente binomial, apurado por fórmula específica = n! / k! (n-k)! Para que a fórmula possa ser aplicada, os valores de três variáveis são requeridos: o número designado de sucessos (X), o número de tentativas (n) e a probabilidade de sucesso a cada tentativa (p). 79Distribuição de Poisson, binomial e hipergeométrica U2_C05_Controle estatístico de processos.indd 79 17/07/2017 12:12:49 Uma moeda é lançada cinco vezes seguidas e independentes. Qual a probabilidade de serem obtidas três “caras” nestas cinco tentativas? Temos: n = 5 e k = 3 Como “cara” e “coroa” têm a mesma probabilidade de ocorrência, logo: p = 1/2 (que equivale a 0,50 ou 50%) e q = 1/2 (ou 1–1/2, que também corresponde a 0,5) Resolvendo o coeficiente binomial: (5/3) = 5! = 5! = 5x4x3x2x1 = 120 = 10 3! · (5 – 3!) · 3! · 2! (3x2x1) · (2x1) 12 Aplicando a fórmula: P (X = 3) = (5/3) · 1/23 · 1/25-3 = 10 · 0,53 · 0,52 = 10 · 0,125 · 0,25 = 0,3125 ou 31,25% Logo, a probabilidade de se obter três “caras” em cinco tentativas é de 31,25%. Distribuição hipergeométrica Assim como a distribuição binomial, a distribuição hipergeométrica destina- -se a expressão da probabilidade de ocorrência de um entre dois resultados possíveis, relativo a uma distribuição discreta de espaço amostral. Cada item da amostra a ser analisada apresentará um dos dois resultados possíveis, sendo denominados evento ou não evento, podendo representar situações como sucesso ou fracasso, defeito ou não defeito, entre outras. O resultado objeto de estudo desta distribuição é denominado característica de interesse. Contudo, em determinadas situações, uma considerável diferença poderá ser observada, no que diz respeito à forma como a amostra é retirada da po- pulação, podendo a primeira impactar sensivelmente a segunda na apuração Controle estatístico de processos 80 U2_C05_Controle estatístico de processos.indd 80 17/07/2017 12:12:50 das probabilidades. E isso, inevitavelmente, traz implicações sobre o modelo a ser adotado para o estudo das probabilidades. Segundo Kazmier (2008, p. 106), “[...] quando uma amostragem é feita sem reposição de cada item amostrado, tomada de uma população de itens finitos, o processo de Bernoulli não se aplica devido a uma sistemática mu- dança na probabilidade de sucessos à medida em que os itens são retirados da população”. Nesta situação, o estudo de probabilidades através da distribuição binomial (que é frequentemente aplicada ao processo de Bernoulli) passa a não ser o mais indicado, tendo em vista que a retirada de amostra sem reposição irá impactar na população. Assim, um modelo específico de distribuição deve ser utilizado, como a hipergeométrica, que corresponde à distribuição de probabilidade discreta apropriada para casos em que uma amostragem sem reposição é adotada. A distribuição hipergeométrica expressa a probabilidade de ocorrência de um entre dois resultados possíveis, em situações em que a amostra é retirada da população sem reposição. Na teoria das probabilidades e estatística, a distribuição hipergeométrica corresponde a uma distribuição discreta que descreve a probabilidade de se retirar X elementos do tipo A, numa sequência de n extrações de uma popu- lação finita de tamanho N, com K elementos do tipo A e N-K elementos do tipo B, sem reposição. As amostras a serem analisadas são retiradas de sua população sem repo- sição ou substituição, de modo que cada item da amostra é diferente. Desta forma, quando um item é escolhido na população, ele não será escolhido novamente. Assim, a chance de outro item ser selecionado aumenta a cada tentativa, supondo que ainda não tenha sido selecionado. 81Distribuição de Poisson, binomial e hipergeométrica U2_C05_Controle estatístico de processos.indd 81 17/07/2017 12:12:50 Considere um conjunto de 10 bolinhas (cinco vermelhas e cinco azuis), do qual são selecionados aleatoriamente duas bolinhas, sem reposição. Com este experimento, a probabilidade de seleção de bolinhas vermelhas ou azuis muda a cada tentativa. No início, a probabilidade de selecionar uma bolinha de qualquer uma das cores é de 5/10. Se na primeira tentativa for selecionada uma bolinha azul, a probabilidade de selecionar uma bolinha azul na segunda tentativa já será de 4/9, enquanto que a probabilidade de selecionar uma bolinha vermelha será de 5/9. Caso as bolinhas selecionadas sejam devolvidas ao conjunto, a probabilidade de sucesso não mudaria, seria de 5/10 em cada tentativa, representando um experimento binomial. A distribuição hipergeométrica é normalmente descrita por três parâmetros: tamanho da população,contagem de eventos em população e tamanho da amostra. Além disso, dado o potencial efeito da amostragem sem reposição, a distribuição hipergeométrica apresenta estreito relacionamento com a teoria das combinações ou análise combinatória. Leia mais sobre análise combinatória na obra Teoria e problemas de estatística aplicada à administração e economia (KAZMIER, 2008). Quando utilizar a distribuição hipergeométrica Kazmier (2008, p. 106) comenta que “[...] quando uma população é grande e a amostra é relativamente pequena, o fato de que a amostragem é feita sem reposição tem uma pequena infl uencia na probabilidade de sucesso em cada tentativa”. Deste modo, para a escolha do modelo de distribuição a ser utilizado, o autor sugere a análise da relação entre a amostra e o tamanho da população, Controle estatístico de processos 82 U2_C05_Controle estatístico de processos.indd 82 17/07/2017 12:12:50 considerando que, quando a amostra for superior a 5% da população, o modelo de distribuição hipergeométrico passa a ser o mais indicado. A distribuição ou função hipergeométrica de probabilidade fornece f(x), a probabilidade de se obter x sucessos em uma amostra de tamanho n, em que os ensaios não são independentes e a probabilidade de sucesso muda de ensaio para ensaio. (ANDERSON; SWEENEY; WILLLIANS, 2002) Segundo Becker (2015, p. 239), a distribuição hipergeométrica pode ser aplicada a estudos que envolvam comportamento do consumidor, controle de qualidade, bibliometria, sensoriamento remoto, epidemiologia, biologia, genética e auditoria. Como aplicar a distribuição hipergeométrica Becker (2015, p. 238) relata que “[...] a distribuição hipergeométrica emerge em processos de amostragem de populações fi nitas onde cada indivíduo da população apresenta ou não uma determinada característica”. Para ilustrar, o autor supõe que uma população seja formada por N indiví- duos, m dos quais apresentam uma determinada característica, enquanto que os demais não a apresentam. Retira-se, então, uma amostra de tamanho n desta população, em um processo sem reposição (indivíduos retirados aleatoriamente, um a um e em sequência, em que um indivíduo selecionado não mais retorna à população ou ao processo de seleção nela realizado). Nestas condições, assume-se que: a variável X é definida pelo número de indivíduos na amostra que apresentam a característica de interesse; X não pode ser maior do que o tamanho da amostra, n, nem maior do que o número de indivíduos na população que apresenta a característica de interesse, m; X ≥ 0, pois X é uma variável de contagem; n ≤ N, pois o tamanho da amostra é menor que a população; m ≤ N, pois o número de indivíduos que apresentam a característica de interesse é menor que o tamanho da população; 83Distribuição de Poisson, binomial e hipergeométrica U2_C05_Controle estatístico de processos.indd 83 17/07/2017 12:12:51 N – m corresponde ao total de indivíduos da população que não apresenta a característica de interesse. Assim, uma variável aleatória hipergeométrica X corresponde ao número de sucessos que resulta de um experimento hipergeométrico. A distribuição de probabilidades de uma variável aleatória hipergeométrica é chamada de função de distribuição hipergeométrica, apurada por fórmula específica, como a apresentada abaixo: Pk = r k N – r n – k N n As variáveis integrantes da fórmula da distribuição hipergeométrica cor- respondem a: N = número de elementos da população avaliada; r = número de elementos que apresentam um determinado atributo; N – r = número de elementos que apresentam o outro atributo possível; n = número de elementos da amostra (sem reposição); k = número de elementos que apresentam a variável (atributo) de interesse; (r/k) e N/n correspondem coeficientes binomiais, apurados por fórmula específica = r! / k! (r-k)! e N!/n! (N-n)!, respectivamente. Controle estatístico de processos 84 U2_C05_Controle estatístico de processos.indd 84 17/07/2017 12:12:52 Considere um lote de N = 100 peças e r = 10 peças defeituosas. Selecionando-se cinco peças aleatórias (sem reposição), qual a probabilidade de não se obter peças defeituosas? P0 = 10 0 90 5 100 5 = 90 5 100 5 ≈ 0,584 Neste caso, a probabilidade de não se obter peças defeituosas será de aproxima- damente 58,4%. Leia mais sobre as distribuições de Poisson, binomial e hipergeométrica na obra Teoria e problemas de estatística aplicada à administração e economia (KAZMIER, 2008). 85Distribuição de Poisson, binomial e hipergeométrica U2_C05_Controle estatístico de processos.indd 85 17/07/2017 12:12:52 ANDERSON, D. R.; SWEENEY, O. J.; WILLLIANS, T. A. Estatística aplicada à administração e economia. 2. ed. São Paulo: Pioneira, 2002. BECKER, J. L. Estatística básica: transformando dados em informação. Porto Alegre: Bookman, 2015. DOANE, D. P.; SEWARD, L. E. Estatística aplicada à administração e economia. Porto Alegre: AMGH, 2014. KAZMIER, L. Teoria e problemas de estatística aplicada à administração e economia. 4. ed. Porto Alegre: Bookman, 2008. (Coleção Schaum). 86Distribuição de Poisson, binomial e hipergeométrica U2_C05_Controle estatístico de processos.indd 87 17/07/2017 12:12:54
Compartilhar