Baixe o app para aproveitar ainda mais
Prévia do material em texto
20 Modelos probabilísticos para variáveis aleatórias discretas As observações geradas por diferentes experimentos podem, por vezes, apresentar o mesmo tipo geral de comportamento. As variáveis aleatórias associadas a esses experimentos podem então ser descritas pela mesma distribuição de probabilidade, ou representadas por uma única fórmula. Para descrever o comportamento de muitas das variáveis aleatórias, existem importantes distribuições de probabilidade, também chamadas de modelos probabilísticos. Alguns dos principais modelos probabilísticos discretos são: Distribuição de Bernoulli; - Distribuição Binomial; Distribuição Poisson; 1. Distribuição de Bernoulli Considere uma única realização de um experimento aleatório, no qual se pode obter sucesso, com probabilidade p ou fracasso com probabilidade q, sendo p + q = 1. Seja a v.a. X igual ao número de sucessos em uma única tentativa. Então: O, fracasso com P(X 0) q X 1, sucesso com P(X 1) p Nessas condições a v. a. X tem distribuição de Bernoulli e sua função de probabilidade é dada por: x 1 xP(X x) p q ; sendo q = 1- p. Os parâmetros da distribuição de Bernoulli são: 1 0 ( ) ( ) 0 1 ( ) x E X xP X x q p E X p e ( ) (1 ) Var X p p pq Exemplos de variáveis de Bernoulli: Em uma linha de montagem, uma peça selecionada pode ser defeituosa (sucesso) ou não defeituosa (fracasso). No lançamento de uma moeda, cara (sucesso) ou coroa (fracasso). Uma semente avaliada pode germinar (sucesso) ou não germinar (fracasso). Exemplo: 1) Considere um experimento que consiste no lançamento de um dado e verifique a ocorrência da face 5 (sucesso) ou não. Determine a função de probabilidade e a distribuição acumulada. 2. Distribuição Binomial É uma generalização da distribuição de Bernoulli. É a mais importante das distribuições teóricas de probabilidade para variáveis discretas. São realizados n ensaios independentes de Bernoulli. A probabilidade de sucesso em cada ensaio é constante. Como as probabilidades p de sucesso se mantêm constantes em cada ensaio, a distribuição binomial é indicada para os casos em que a amostragem é feita com reposição. 21 Definição: Seja a variável aleatória X que conta o número total de sucessos obtidos numa seqüência de n ensaios independentes de Bernoulli. A variável X segue uma distribuição binomial com parâmetros n e p, denotada por X ~ b(x; n, p), e tem função de probabilidade: n x n x x x n x x nb(x;n, p) P(X x) ( )p q C p q , x = 0, 1, 2, ..., n n é o nº de repetições do experimento; x é o nº desejado de sucessos; n - x é o nº esperado de fracassos; p é a probabilidade de sucesso num ensaio individual; 1 – p é a probabilidade de fracasso num ensaio individual; Os parâmetros da distribuição Binomial são: ( ) E X np e 2 ( ) Var X npq Exemplos: 1. Sabe-se que, em certa região, 60% dos domicílios possuem computadores. Cinco domicílios são selecionados ao acaso nesta região. a) Verifique se este experimento se caracteriza como binomial b) Calcule a probabilidade de que exatamente 3 domicílios tenham computador ; c) Calcule a probabilidade de que no máximo um domicílio tenha computador d) Determinar o número esperado de domicílios com computador e o desvio padrão. b) c) d) µ = n p = 5 x 0,60 = 3 domicílios; 2. Sabe-se que 20% de frangos expostos a um particular agente infeccioso adquirem certa doença. Considere um grupo de 4 frangos com igual exposição ao agente infeccioso. Qual a probabilidade de que: a) Nenhum frango adoeça; b) Todos os frangos adoeçam; c) Ao menos um frango adoeça; d) Supondo que o proprietário tenha um custo de R$300 para tratar cada frango doente. Qual será o gasto esperado com esse tratamento, se o medicamento for recomendado a 30 frangos? 3) A probabilidade de que certo tipo de componente sobreviva a um teste de choque é de ¾. Determine a probabilidade de que dos próximos quatro componentes testados, a) exatamente 2 sobrevivam. b) pelo menos 2 sobrevivam. c) no máximo 2 sobrevivam. 3 5 353( 3) 0,6 0, 4 0,3456P X C 5 0 5 5 1 4 0 1( 1) ( 0) ( 1) 0,6 0,4 0,6 0,4 0,01024 0,0768 0,08704P X P X P X C C 5 0,60 0,40 = 1,09 22 3. Distribuição Poisson A distribuição Poisson ocorre quando se deseja contar o número de eventos de um certo tipo, verificados em um intervalo de tempo, de superfície (área) ou volume. Uma variável aleatória X com distribuição Poisson pode assumir infinitos valores no conjunto dos inteiros positivos (v.a. discreta). Exemplos de variáveis de Poisson: - Número de telefonemas recebidos por hora em um escritório. - Número de bactérias por unidade de área em uma lâmina. - Número de erros de digitação por página. - Numero de falhas de um computador em um dia de operação. Uma variável aleatória X com distribuição Poisson tem: função de probabilidade: xef (x; ) P(X x) x! parâmetros: x E(X) Var(X) A distribuição Poisson tem aplicação também nos casos em que os parâmetros n e p da distribuição binomial dificultam o cálculo por esta distribuição (eventos raros). Nesses casos, a Poisson é usada como aproximação da binomial, sendo a aproximação considerada adequada quando n é “grande” e p é “pequeno” n 50 e p 0,10 . Neste caso a media da Poisson será: = = n.p. Exemplos. 1) Durante um experimento de laboratório, o número médio de partículas que passam por um contador em um milésimo de segundo é quatro. a) Qual é a probabilidade de que seis partículas entrem em um dado contador, em um específico milésimo de segundo? R: 0,1042 b) Qual é a probabilidade de que 10 partículas entrem no contador, em 5 milésimos de segundo? c) Qual é a probabilidade de que no mínimo uma partícula entre em um dado contador, em dois milésimos de segundo? 2) Um corpo de bombeiro atende em média 5 chamadas por dia. Qual a probabilidade de, num determinado dia atender 0, 1, 3, 6 e 10 chamadas? 3) Sabe-se que uma raça bovina apresenta uma doença virótica em 2% dos animais . Realizando- se uma amostra de 100 animais dessa raça, calcule as probabilidades. a) de nenhum animal doente nessa amostra. R. 0,1326 b) de no máximo 2 animais doentes nessa amostra. R. 0,6767 d) Use a aproximação pela distribuição Poisson para calcular as mesmas probabilidades. 23 Modelos probabilísticos para variáveis aleatórias contínuas Distribuição normal A distribuição normal ou de Gauss ou Gaussiana é uma das mais importantes distribuições da estatística. Além de descrever uma série de fenômenos físicos, naturais, financeiros, nas indústrias e nas pesquisas em geral, possui grande uso na estatística inferencial. É inteiramente descrita por seus parâmetros média m e desvio padrão s, ou seja, conhecendo-se estes é possível determinar qualquer probabilidade em uma distribuição Normal. - Seu gráfico tem a forma campanular (sino) - É uma distribuição simétrica em relação à média - É duplamente assintótica em relação ao eixo das abscissas - Tem dois pontos de inflexão que correspondem à media ± desvio padrão. Uma variável aleatória contínua X tem uma distribuição normal ou gaussiana se a função densidade de probabilidade for dada por: 2 2 (x ) 21f (x) e 2 para - < x < , - < < e 2 > 0 Notação: X~N( , 2): X tem distribuição normal com média =E(X) e variância Var(X) = 2. Probabilidades (áreas) especiais: ( ) 0,68 P x x ; ( 2 2 ) 0,95 P x x ; ( 3 3 ) 0,99 P x x Função de distribuição acumulada: x F(x) P(X x) f (x)dx Cálculo de probabilidades: Suponha a v.a. X~N( , 2) 2 2 (x )b b 2 a a 1P(a x b) f (x)dx e dx 2 A integral não pode ser resolvida analiticamente. Distribuição normal padrão (normal padronizada ou reduzida) Seja 2~ ( , )X N . Subtraímos de x a média, dividimos pelo desvio padrão e obtemos a variável Z, que tem média zero e variância 1, sendo chamada de distribuição normal padronizada; ~ (0,1)Z N cuja fdp é ( ) 1f x dx 24 2(Z) 21f (Z) e 2 ; sendo XZ . Com esta densidade, é possível resolver a integral e calcular probabilidades de intervalos, que podem ser tabelados para a variável Z. A variável X é transformada na variável Z, já que a transformação preserva a área abaixo da curva, ou seja, 1 2 1 2P(x x x ) P(z Z z ) , sendo 11 XZ e 22 XZ . A tabela de probabilidade Z, e o gráfico. (0 ) P Z z Exemplo de uso da tabela: P(0 < Z < 1,64)= 0,4495 Calcular as seguintes probabilidades: a) P(0 < Z < 1,28) b) P(Z>1,96) c) P(Z< 2,57) d) P(Z< - 1,33) e) P(Z> -1,00) f) P( -1,00 < Z < 1,45) g) P( 1,00< Z < 1,96) Determinar os valores de k para: a) P(Z> k) = 0,0505 b) P( Z < k) = 0,9949 c) P( Z < k) = 0,0505 d) P(Z> K) = 0,8997 e) P(-1,00 < Z < k) = 0,6826 Exemplo1. Os registros indicam que o tempo médio para se fazer um teste é aproximadamente normal, com média de 50 min e variância 20 min2. Nestas condições, determinar: a) a porcentagem de candidatos que levam menos de 45 min. b) se o tempo concedido é de 1h, que porcentagem não conseguirá terminar o teste. c) qual a probabilidade de um candidato demorar entre 45 e 55 minutos? d) qual a probabilidade de um candidato demorar menos que 50 minutos? a) 45 50[ 45] 1.12 0,1314 20 XP X P P Z 13,14% levam menos que 45 min para terminar o teste 25 b) 60 50[ 60] 2,24 0,0125 20 XP X P P Z 1,25% dos candidatos não terminará o teste a tempo. c) 45 50 55 50[45 55] 1,12 1,12 1 2 (0,1314) 0,7372 20 20 XP X P P Z Exemplo 2. Em um processo industrial, as especificações exigem que o diâmetro de um rolamento tenha medida de 3 0,01 cm . Sabe-se que a medida do diâmetro tem distribuição normal com média 3cm e desvio padrão de 0,005. Qual a porcentagem de peças que será inutilizada por estar fora das especificações? R: 0,0456 Exemplo 3. A produção de leite de animais de uma fazenda tem distribuição normal com média de 12 litros e desvio padrão de 3 litros. Um animal é selecionado aleatoriamente. a) Qual a probabilidade de ele produzir mais de 17 litros? b) Qual a probabilidade de ele produzir entre 7 e 15 litros? c) Qual a probabilidade de ele produzir pelo menos 14 litros? d) O produtor decide utilizar o seguinte critério: 10% dos animais com as menores produções e 15% dos animais com as maiores produções serão separados dos demais para tratamento especial. Utilizando as informações da distribuição normal, quais serão os limites para a separação? 26 Distribuições amostrais Distribuição amostral da média – Teorema do limite central (TLC) Se a v.a. X tem uma distribuição qualquer, com média X e variância 2 X , então a média amostral x , baseada em uma amostra de tamanho n, terá distribuição normal aproximada, com média XXE X e variância 2 2 X X n . Assim, a variável Z definida a seguir tem distribuição aproximadamente normal padrão, ou seja, 0,1X X a X X XZ N n . A aproximação é adequada para amostras maiores ou iguais a 30 n 30 . Quanto maior o tamanho da amostra, melhor será a aproximação. Para amostragem sem reposição, em população finita, fazer a correção a seguir, XE X e 1X N n Nn . Se a v.a. X tem distribuição normal tem-se, 2, XXX N 2 2, XXXX N n 0,1XXZ N n Distribuição t de Student – Distribuição amostral da média em pequenas amostras (n < 30) Se a v.a. X tem uma distribuição qualquer, com média X e variância 2 X , então a média amostral x , baseada em uma amostra de tamanho n < 30, terá distribuição aproximada t de Student, ou seja, 2 2, XXX SX t S n ; X X X X Xt SS n , em que S é o desvio padrão amostral. O valor de t associado às probabilidades pode ser obtido na tabela t de Student, em função do número de graus de liberdade v, sendo v = n – 1gl. Exemplo de uso da tabela. a) se v = 10, P t 1,093 b) se n = 16, P 1,34 t 2,131 27 c) se v = 20, P t 2,086 d) se n = 17, P 1,071 t 1,071 Exemplo 2. Encontre os valores de to: a) P(t > t0) = 0,10; com v = 13 b) P( t < t0) = 0,95 ; com v = 15 c) P( t0 < t < - 1,761) = 0,045; com n = 15 Distribuição amostral da variância – Distribuição qui-quadrado 2 Se 2S é a variância de uma amostra aleatória (aa) de tamanho n, retirada de uma população normal, com variância 2 então a estatística 2 tem distribuição qui-quadrado com v = n-1 graus de liberdade (gl), sendo, 2 2 2 (n 1)S e 2 2P . A distribuição 2 não é simétrica e parte sempre da origem. Exemplo de uso da tabela. a) se n = 12, 2P 17, 275 b) se v = 3, 2P 11,345 Exemplo: Uma máquina está regulada para empacotar um produto com média de 500g e desvio padrão de 10g. Em uma amostra de 16 pacotes, qual a probabilidade da variância ser, a) maior que 48,407? b) menor que 121,63? Distribuição amostral de duas variâncias – Distribuição F – Snedecor. Se 21S e 2 1S são variâncias de amostras aleatórias independentes, de tamanhos 1n e 2n , retiradas de populações normais, com variâncias 21 e 2 2 , então a estatística F tem distribuição F – Snedecor, com 1 1 1v n e 2 2 1v n graus de liberdade, sendo, 28 2 1 2 2 2 1 1 2 2 2 2 2 1 2 2 2 S SF S S e 1 2P F F (v , v ) (área acima) Se 1 2F (v , v ) é o valor de F com 1v e 2v gl, (valor que deixa uma área acima dele), então, 1 1 2 2 1 1F (v , v ) F (v , v ) ( valor que deixa uma área (1 ) acima dele). A distribuição F não é simétrica e parte sempre da origem. Para cada probabilidade existe uma tabela. Exemplo de uso da tabela. a) sendo 1 9v e 2 15v P F 3,12 0,025 b) sendo 1 13n e 2 7n P F 4,0 1 P F 4,0 1 0,05 0,95 Exemplo. Se 21S e 2 1S representam variâncias de amostras aleatórias de tamanhos 1 21n e 2 31n , cujas populações têm variâncias 21 35 e 2 2 25 , encontre. a) 2 1 2 2 SP 2,702 S b) 2 1 2 2 SP 0,594 3,094 S Aproximação da distribuição Binomial pela distribuição normal Se X é uma variável aleatória binomial com média np e variância 2 npq , então a variável Z tem distribuição aproximadamente normal padrão; 0,1x npZ N npq . Correção de continuidade: 1 2 1 20,5 0,5P x X x P x X x . 29 Aproximação da distribuição Poisson pela distribuição normal Se Y é uma variável aleatória Poisson com média 2 então a variável Z tem distribuição aproximadamente normal padrão; 0,1xZ N . Exemplos: 1) Em um canal digital de comunicação, suponha que o número de bits recebidos com erro possa ser modelado por uma variável binomial e que a probabilidade de erro seja 51 10 . Se 16 milhões de bits são transmitidos, qual será a probabilidade de se ter 150 ou menos erros? Use a aproximação normal com correção de continuidade. 2: Se a ocorrência de falhas em um tecido é uma v.a. Poisson com média de 0,2 falhas por metro quadrado, qual a probabilidade de o número de falhas, em 5000 2m , de tecido estar entre 975 e 1025? E de ser superior a 980? Use a aproximação normal. 3) No horário de maior movimento, um sistema de banco de dados recebe, em média, 100 requisições por minuto. Qual é a probabilidade de que no próximo minuto ocorram mais de 120 requisições? R: 0,0202 4) A cada 5 automóveis vendidos em uma concessionária, 1 é da cor preta. Em uma análise de 50 automóveis vendidos, qual a probabilidade de se vender: a) Exatamente 10 pretos? B) Pelo menos 10 pretos?
Compartilhar