Prévia do material em texto
CURSO DE ESTATÍSTICA I Ricardo Bruno N. dos Santos FACECON-PPGE (UFPA) Distribuição Binomial, Poisson e Hipergeométrica DISTRIBUIÇÕES DISCRETAS DISTRIBUIÇÕES DISCRETAS: Imagine uma situação na qual somente podem ocorrer dois possíveis resultados, “sucesso” e “fracasso”. Veja alguns exemplos: - uma venda é efetuada ou não em uma ligação de call center; - um contribuinte pode ser adimplente ou inadimplente; - uma guia recolhida pode ter seu preenchimento ocorrido de forma correta ou incorreta; e - um consumidor que entra em uma loja pode comprarou não comprar um produto. DISTRIBUIÇÕES DISCRETAS Essas situações correspondem à Distribuição de Bernoulli. Ou seja, se associarmos uma variável aleatória x aos possíveis resultados do experimento de forma que X=1 se o resultado for “sucesso” e X=0 se o resultado for “fracasso”, então, a variável aleatória X, assim definida, tem Distribuição de Bernoulli, com p sendo a probabilidade de ocorrer “sucesso” e q = (1-p) a probabilidade de ocorrer “fracasso”. Ampliando a discussão, é importante frisar que a função de probabilidade da Distribuição de Bernoulli é dada por: 𝑷 𝑿 = 𝒙 = 𝑝 para 𝑥 = 1 𝑞 = 1 − 𝑝 para 𝑥 = 0 0 para 𝑥 diferente de 0 ou 1 DISTRIBUIÇÕES DISCRETAS Dessa forma, a média e a variância serão obtidas por: Média = 𝑝 (onde p corresponde à probabilidade de sucesso). Variância = 𝑝 × 𝑞 (onde q corresponde à probabilidade de fracasso). Essa obtenção da estimativa de média e desvio padrão é importante, pois, tais medidas, podem ser usadas para caracterizar a situação e também para a definição da média e do desvio padrão da distribuição binomial que será vista posteriormente. DISTRIBUIÇÕES DISCRETAS Contextualizando a Distribuição de Bernoulli, tem-se a seguinte situação: a experiência tem mostrado que até fevereiro o motorista que é parado em uma blitz tem 60% de chance de estar adimplente em relação ao Imposto sobre a Propriedade de Veículos Automotores (IPVA). Temos, portanto, uma probabilidade de sucesso (o motorista não estar devendo o IPVA) de 0,6 e uma probabilidade de estar devendo de 0,4 (vem da diferença 𝒒 = 𝟏 – 𝟎, 𝟔). DISTRIBUIÇÃO BINOMIAL Para que uma situação possa se enquadrar em uma distribuição binomial, deve atender as seguintes condições: - são realizadas n repetições (tentativas) independentes; - cada tentativa é uma prova de Bernoulli (somente podem ocorrer dois possíveis resultados); e - a probabilidade 𝑝 de sucesso em cada prova é constante. Se uma situação atende a todas as condições anteriores, então a variável aleatória 𝑋 = número de sucessos obtidos nas 𝑛 tentativas terá uma distribuição binomial com 𝑛 tentativas e 𝑝 probabilidades de sucesso. DISTRIBUIÇÃO BINOMIAL O problema da loja de Roupas do Martin Considere as decisões de compra dos próximos três clientes que entram na loja de roupas do Martin. Com base em experiências passadas, o gerente da loja estima que a probabilidade de que qualquer um dos clientes comprará é de 0,30. Qual é a probabilidade de que dois primeiros dos próximos três clientes realizarão a compra? DISTRIBUIÇÃO BINOMIAL Usando um diagrama de Árvore para identificar tal situação temos: DISTRIBUIÇÃO BINOMIAL Verificando as quatro exigências para um experimento binomial, nota-se que: 1 – São realizadas 3 repetições (tentativas) independentes; 2 – Cada uma das tentativas é uma prova de Bernoulli compra (sucesso) ou o cliente não faz a compra (fracasso); 3 – A probabilidade p de sucesso em cada prova é constante, pois 𝑝 = 0,30 e 1 − 𝑝 = 0,70 é a mesma para todos os clientes. O número de resultados experimentais resultado em exatamente x sucessos e n ensaios pode ser calculado a partir da combinação, onde (para 3 sucesso tem-se): 𝐶𝑥 𝑛 = 𝑛 𝑥 = 𝑛! 𝑥! 𝑛 − 𝑥 ! = 3! 3! 3 − 3 ! = 3 2 1 3 2 1 1 = 6 6 = 1 DISTRIBUIÇÃO BINOMIAL A probabilidade de compra pelos primeiros dois clientes e de não- compra pelo terceiro é dada por: 𝑝𝑝 1 − 𝑝 𝑝𝑝 1 − 𝑝 = 0,30 0,30 0,70 = 0,063 Duas outras sequências de resultados seguem-se em dois sucessos e em um fracasso. As probabilidades para as três sequências, envolvendo dois sucessos, são mostradas abaixo: DISTRIBUIÇÃO BINOMIAL Simbolicamente, temos: 𝑋 ~ 𝐵 (𝑛, 𝑝) com a interpretação: A variável aleatória 𝑋 tem distribuição binomial (𝐵) com 𝑛 ensaios e uma probabilidade p de sucesso (em cada ensaio). A função binomial de probabilidade é expressa como: 𝑷 𝑿 = 𝒙 = 𝑪𝒙 𝒏𝒑𝒙 𝟏 − 𝒑 𝒏−𝒙 𝑷(𝑿 = 𝒙) – é a probabilidade de 𝑥 sucessos em 𝑛 ensaios; 𝒏 – é o número de ensaios; 𝑝 é probabilidade de “sucesso” em cada ensaio; 𝑞 = 1 − 𝑝 é a probabilidade de “fracasso” em cada ensaio; 𝐶𝑥 𝑛 = 𝑛 𝑥 = 𝑛! 𝑥! 𝑛−𝑥 ! - combinação de 𝑛 valores tomados de 𝑥 a 𝑥. DISTRIBUIÇÃO BINOMIAL Fazendo o gráfico da probabilidade contra o número de ensaios tem-se: DISTRIBUIÇÃO BINOMIAL Faça a aplicação aumentando no R o número de ensaios, o que acontece? A programação no R segue abaixo: binouma frequência média de sucesso . DISTRIBUIÇÃO POISSON A função de probabilidade da Distribuição de Poisson será dada por meio da seguinte expressão: 𝑃 𝑋 = 𝑥 = 𝑒−𝜇𝜇𝑥 𝑥! Lembrando que: 𝑃 𝑋 = 𝑥 - Probabilidade de 𝑥 ocorrências em um intervalo e =2,7182 (base dos logaritmos neperianos); e corresponde a frequência média de sucesso no intervalo contínuo que se deseja calcular a probabilidade. DISTRIBUIÇÃO POISSON Exemplo: A análise dos dados dos últimos anos de uma empresa de energia elétrica forneceu o valor médio de um blecaute por ano. Pense na probabilidade de isso ocorrer no próximo ano: a) Nenhum blecaute. b) De 2 a 4 blecautes. c) No máximo 2 blecautes. Observe que o exemplo afirma que a cada ano acontece em média um blecaute, ou seja, o número de sucesso ocorrido em um intervalo contínuo. Verificamos que a variável tem Distribuição Poisson: 𝑃 𝑋 = 𝑥 = 𝑒−𝜇𝜇𝑥 𝑥! DISTRIBUIÇÃO POISSON Veja que aqui não é necessário fazer regra de três, pois as perguntas são no intervalo de um ano. Então: = 1 𝑎) 𝑃 𝑥 = 0 = 𝑒−1 1 0 0! = 0,3679 1 1 = 0,3679 𝑏) 𝑃 𝑥 = 2 + 𝑃 𝑥 = 3 + 𝑃 𝑥 = 4 = 𝑒−1 1 2 2! + 𝑒−1 1 3 3! + 𝑒−1 1 4 4! = 0,1839 + 0,061 + 0,015 = 0,2599 DISTRIBUIÇÃO POISSON 𝑐) como já temos os valores de 𝑥 = 0 𝑒 𝑥 = 2 basta calcular o valor para 𝑥 = 1 𝑃 𝑥 = 1 = 𝑒−1 1 1 1! = 0,3679 𝑃 𝑥 ≤ 2 = 𝑃 𝑥 = 0 + 𝑃 𝑥 = 1 + 𝑃 𝑥 = 2 = 0,3679 + 0,3679 + 0,1839 = 0,9197 Vejamos a mesma aplicação no R Vamos usar a função dpois() Vídeos/Estatística I - Poisson.mp4 Vídeos/Estatística I - Poisson.mp4 DISTRIBUIÇÃO POISSON Uma característica da Distribuição de Poisson é que as estatísticas da distribuição (média e variância) apresentam o mesmo valor, ou seja, são iguais a . Então, teremos: 𝑀é𝑑𝑖𝑎 = 𝑉𝑎𝑟𝑖â𝑛𝑐𝑖𝑎 = 𝜇 No próximo Slide temos a apresentação da Tabela de Poisson, onde está destacada a probabilidade para 𝜇 = 10, 𝑥 = 5 DISTRIBUIÇÃO POISSON DISTRIBUIÇÃO HIPERGEOMÉTRICA A DISTRIBUIÇÃO HIPERGEOMÉTRICA é uma distribuição de probabilidade discreta que descreve a probabilidade de se retirar 𝑥 elementos do tipo 𝐴 numa sequência de 𝑛 extrações de uma população finita de tamanho 𝑁, com 𝑟 elementos do tipo 𝐴 e 𝑁 − 𝑟 elementos do tipo 𝐵, sem reposição. Seja um conjunto com 𝑁 elementos tal que existem 𝑟 elementos do tipo 𝐴 e 𝑁 − 𝑟 elementos do tipo 𝐵. Um conjunto de 𝑛 elementos é selecionado, aleatoriamente e sem reposição, do conjunto de 𝑁 elementos. A variável aleatória 𝑋 denota o número de elementos tipo 𝐴. Então, 𝑋 tem distribuição hipergeométrica e DISTRIBUIÇÃO HIPERGEOMÉTRICA 𝑃 𝑋 = 𝑥|𝑁, 𝑟, 𝑛 = 𝑟 𝑥 𝑁−𝑟 𝑛−𝑥 𝑁 𝑛 = 𝐶𝑥 𝑟𝐶𝑛−𝑥 𝑁−𝑟 𝐶𝑛 𝑁 , 𝑝𝑎𝑟𝑎 0 ≤ 𝑥 ≤ 𝑟 𝑃 𝑋 = 𝑥|𝑁, 𝑟, 𝑛 - Probabilidade de 𝑥 sucessos em n ensaios; 𝑛 – Número de ensaios; 𝑁 – número de elementos na população; 𝑟 – Número de elementos na população rotulados de sucesso. DISTRIBUIÇÃO HIPERGEOMÉTRICA Um jogo de loteria consiste em selecionar seis dezenas do conjunto de cem dezenas de 00 a 99, com uma bola para cada dezena e sem reposição. Num volante (cartão aposta) o jogador pode escolher de 6 a 12 dezenas. Qual é a probabilidade de acertar- se a quina (5 dezenas) marcando-se 10 dezenas no volante? N: total de dezenas, N = 100 n: total de dezenas sorteadas/escolhidas pelo jogador), n = 10 r: total de dezenas premiadas, r = 6 X: total de sucessos, queremos X = 5 𝑃 𝑋 = 5 100,6,10 = 𝐶5 6𝐶10−5 100−6 𝐶10 100 = 252 × 90 1.192.052.400 = 0,000019 DISTRIBUIÇÃO HIPERGEOMÉTRICA Com relação a média e a variância da mesma temos: 𝜇 = 𝑛 𝑟 𝑁 𝜎2 = 𝑁−𝑛 𝑁−1 𝑛 𝑟 𝑁 1 − 𝑟 𝑁