Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Modelos Probabilísticos Discretos Modelo Bernoulli Considere um experimento aleatório com 2 resultados possíveis denominados de sucesso e fracasso. Seja X a variável indicadora de sucesso, isto é: X = 1 se ocorre sucesso e X = 0 se ocorre fracasso Seja p a probabilidade de sucesso P(X = 1) = p e P(X = 0) = 1 - p Diz-se que X é uma variável aleatória Bernoulli. Propriedades: E(X) = 0 (1 - p) + 1(p) = p VAR(X) = E(X2) - (E(X))2 = p – p2 = p(1-p) 2 Exemplo 1: Uma moeda é lançada e observa-se a face voltada para cima. X = 0 se ocorre cara X = 1 se ocorre coroa P(X = 0) = ½ P(X = 1) = ½ X segue um modelo Bernolli com parâmetro p = ½. Exemplo 2: Pergunta-se a um eleitor de Belo Horizonte se ele aprova a administração municipal. Seja X a resposta do eleitor X = 0 se não aprova X = 1 se aprova P(X = 0) = 1 - p P(X = 1) = p X segue um modelo Bernolli com parâmetro p Exemplo 3: Suponha que 10% dos indivíduos de certa população são desempregados. Seja X a condição de emprego de uma pessoa selecionada ao acaso desta população. X = 0 se desempregado X = 1 se empregado P(X = 0) = 0,10 P(X = 1) = 0,90 X segue um modelo Bernolli com parâmetro p = 0,90 Modelo Binomial 4,...,0x 0,67 0,33 x 4)xX(P x- 4x = == X: número de questões marcadas corretamente numa prova com 4 questões de múltipla escolha com 3 itens cada onde apenas um está correto e onde cada questão é respondida ao acaso P(X = 0) = 0,674 = 1 x 0,330 x 0,674 = 1 x 0,330 x 0,674-0 P(X = 1) = 4 x 0,33 x 0,673 = 4 x 0,331 x 0,673 = 4 x 0,331 x 0,674-1 P(X = 2) = 6 x 0,332 x 0,672 = 6 x 0,332 x 0,672 = 6 x 0,332 x 0,674-2 P(X = 3) = 4 x 0,333 x 0,67 = 4 x 0,333 x 0,671 = 4 x 0,333 x 0,674-3 P(X = 4) = 0,334 = 1 x 0,334 x 0,670 = 1 x 0,334 x 0,674-4 questões n em sucessosx ter podemos maneiras quantas de x n −−−− 3 1)....1(! 4 !1 4 !|3!1 !34 !3!1 !4 1 4 )!(! ! 1 4 4 4 3 4 6 2 4 4 1 4 1 0 4 −= ==== − = = = = = = nnn x xnx n x n Modelo Binomial: Considere n realizações independentes de um experimento aleatório com 2 resultados possíveis chamados de sucesso (S) e fracasso (F), que resulta em sucesso com probabilidade p , isto é P(S) = p. Seja X: número de sucessos nas n realizações do experimento, Diz-se que X segue um modelo binomial com parâmetros n e p, e P X x n x x n( ) , , ,...,= = = p (1- p)x n-x 0 1 Notação: X ~ B(n,p) X segue modelo binomial com parâmetros n e p E(X) = np VAR(X)= np (1-p) 4 Para o exemplo: X ~B(4,0,33) E(X) = 4 x 0,33 = 1,32 VAR(X) = 4 x 0,33 x 0,67 = 0,88 Exemplo: Em certa população 10% das pessoas estão desempregadas. Se 15 pessoas são selecionadas ao caso com reposição, qual a probabilidade de que 2 delas estejam desempregadas? X: número de desempregados numa amostra de 15 pessoas X ~B(15, 010) 2669,0)9,0()1,0(1050.1)-(1 0,1 2 15)2X(P 132132 == == Qual a probabilidade de encontramos no máximo 2 desempregados? P(X ≤ 2) = P(X = 0) + P(X = 1) + P(X = 2) = 0,2059 + 0,3431 + 0,2669 = 0,8116 Qual o número esperado de desempregados numa amostra de 15 pessoas? E a variância? E(X) = 15 x 0,10 = 1,5 VAR(X) = 15 x 0,10 x 0,90 = 1,35 Seja Y o número de empregados numa amostra de 15 pessoas Qual a distribuição de Y? Y ~ B(15, 0.90) Qual a probabilidade da amostrar conter 13 empregados? )2X(P2669,0)9,0()1,0(1050.1)-(1 0,1 13 15)13Y(P 132132 ==== == 1 14 023456789101112131415Y 15131211109876543210X 5 Exemplo: Um pesquisador acredita que 10% da população está desempregada. Considerando que a hipótese de pesquisador está correta, qual a probabilidade de numa amostra de 100 pessoas obtida com reposição encontrarmos uma proporção de desempregados maior ou igual a 0,20? X – número de desempregados numa amostra de 100 pessoas X ~ b(100;0,20) pessoas 100 de amostra numa dosdesemprega de proporção n Xpˆ = [ ] ∑ = ==≥= ≥= ≥=≥ 100 20x )xX(P20XP20,0 100 XP20,0 n XP)20,0pˆ(P Obtendo probabilidade no R para uma B(n,p) pbinom(x,n,prob) para obter P( X ≤ x) dbinom(x,n,prob) para obter P( X = x) pbinom(x,n,prob, lower.tail=FALSE) para obter P( X > x) B(n,p) qbinom(p,n,prob) para obter quantil de ordem p Q(p) i.e. o menor x tal que P(X ≤ x) ≥ p P(X = 20) > dbinom(20,100,0.1) [1] 0.001170987 P(X ≤ 20) > pbinom(20,100,0.10) [1] 0.9991924 P(X > 20) = P(X ≥ 19) > pbinom(20,100,0.10,lower.tail=F) [1] 0.0008075739 Q(0.20) > qbinom(0.20,100,0.1) [1] 7 0 20 40 60 80 100 0. 00 0. 02 0. 04 0. 06 0. 08 0. 10 0. 12 Binomial(100,0.10)) x P( X= x ) > plot(0:100, dbinom(0:100,100,0.10), type="h", ylab="P(X=x)",xlab="x", main="Binomial(100,0.10))") 6 Como o valo de p influencia a forma da B(n,p)? 0 5 1 0 1 5 2 0 0. 00 0. 05 0. 10 0. 15 0. 20 0. 25 B in o m ia l (2 0 ,0 .1 0 )) x P( X= x ) 0 5 1 0 1 5 2 0 0. 00 0. 05 0. 10 0. 15 B in o m ia l (2 0 ,0 .3 0 )) x P( X= x ) 0 5 1 0 1 5 2 0 0. 00 0. 05 0. 10 0. 15 B in o m ia l (2 0 ,0 .5 0 )) x P( X= x ) 0 5 1 0 1 5 2 0 0. 00 0. 05 0. 10 0. 15 0. 20 0. 25 B in o m ia l (2 0 ,0 .9 0 )) x P( X= x ) 0 5 1 0 1 5 2 0 0. 00 0. 05 0. 10 0. 15 B in o m ia l (2 0 ,0 .7 0 )) x P( X= x ) Modelo Hipergeométrico 10 50 50? em alunos 10obter podemos maneiras quantas De 5 20 x5 30 mulheres? 5 e homens 5 sendo 50, em alunos 01 podemos maneiras quantas De Uma turma possui 50 alunos sendo 30 homens e 20 mulheres. Se uma amostra de 10 alunos é obtida sem reposição dentre os 50 alunos qual a probabilidade de que 5 sejam homens? Como as combinações são equiprováveis = 10 50 5 20 x5 30 )H5(P 7 Distribuição Hipergeométrica Considere uma população com N objetos: r objetos do tipo 1. N – r objetos do tipo 2. Uma amostra de n objetos é selecionada aleatoriamente e sem reposição desta população. Seja X: número de objetos do tipo 1 na amostra. Então: )n,rmin(,...,0x n N x-n r-N x r )xX(P = == Total Objetos Tipo de Objeto NN - nnTotal N - rN – r – n - xn - xTipo 2 rr - xxTipo 1 Não SelecionadosSelecionados 1 tipodo objetos de proporção a é N rp 1-N n-Np)-np(1 = VAR(X) np)X(E = = Se N é grande, quando comparado com n, amostragem com ou sem reposição são praticamente equivalentes. Então as probabilidades calculadas pelo modelo binomial e hipergeométrica serão aproximadamente iguais. A esperança e variância também serão aproximadamente iguais. p)-np(1 1-N n-Np)-np(1 = VAR(X) ≈ 8 X ~ B(100,0.10) X ~ Hipergeometrica(N = 10.000, n=100, r= 1000) Comparação da Binomial e Hipergeométrica Caso de n pequeno relativo a N 0 5 1 0 1 5 2 0 2 5 3 0 0. 00 0. 02 0. 04 0. 06 0.08 0. 10 0. 12 B (1 0 0 ,0 .1 0 ) e H ip e r (N = 1 0 0 0 0 , r = 1 0 0 0 ,n = 1 0 0 ) x P( X= x) b ino m ia l hip e rg e o m e tric a NO R: m número de objetos do tipo 1 N número de objetos do tipo 2 K numero de objetos selecionados X ~ Hipergeométrica(N = 10.000, n=100, r= 1000) P(X = 20) > dhyper(20,m=1000,n=9000,k=100) [1] 0.001117507 P(X ≤ 20) > phyper(20,m=1000,n=9000,k=100) [1] 0.999244 Q(0,20) > qhyper(0.20,m=1000,n=9000,k=100) [1] 7 9 Distribuição de Poisson A distribuição de Poisson pode ser vista como o limite da distribuição Binomial quando n →∞ e q é pequeno Faça X ~B(n , p = λ/n)) )exp( n 1 n0 n)0X(P n n0 λλλ −= − == ∞→ + → = += ⇒ → −+ + → +− → −+ − +− = −+ − = − + − = − + − = − − −−+ = − + = − − + = = += − −−+ 1k)kX(P )1kX(P 0 n1k k e 1k1kn n 0n Quando n1k k 1kn n n1k kn n n n1k kn n 1 n1k kn n 1)!kn(!k !n n)!1kn(!1k !n n 1k n n1k n n 1 nk n n 1 n1k n )kX(P )1kX(P 11knk 1kn1k λ λ λλλ λ λ λλ λλ λ λ λ λ λ λ λ λ λ λλ λλ !x e)xX(P 1 x 2 x 3 e 31 x 2 e 3 )2X(P)3X(P 1 x 2 e 21 e 2 )1X(P)2X(P 1 e 1 )0X(P)1X(P x 32 2 λ λλ λλ λ λ λλλλ λλλλ λλ − −− −− − == ===== ===== ==== Uma variável aleatória X tem distribuição de Poisson se λ λ λ == === − )X(VAR)X(E:opriedadePr ......2,1,0x, !x e)xX(P x 10 Comparação de uma B(100,0.05) com uma Poisson(5) 0 5 10 15 20 25 30 0. 00 0. 02 0. 04 0. 06 0. 08 0. 10 B(300,0.05) e Poisson(15) x P( X= x) binomial Poisson Aplicações da distribuição de Poisson • Descrever eventos que ocorrem aleatoriamente e independentemente no espaço ou no tempo Exemplo: Suponha que o número de acidentes automobilísticos ocorridos por dia num trecho de uma rodovia tenha distribuição de Poisson com parâmetro λ = 4. Qual a probabilidade de num dia qualquer ocorrerem 2 acidentes? X – número de acidentes por dia 1465,0 !2 4e)2X(P 24 === − 11 Obtendo Quantis e probabilidades para uma v.a. Poisson no R X – número de acidentes por dia X ~ Poisson(λ = 4) 1) Calculando P(X = 3) > dpois(3,4) [1] 0.1953668 2) Calculando P(X ≤ 3) > ppois(3,4) [1] 0.4334701 3) Obtendo Q(0,25) > qpois(0.25,4) [1] 3 Exemplo: Uma certa região florestal foi dividida em 109 quadrados de mesma área. Para cada quadrado foram contadas o número de árvores. Os resultados são dados na tabela abaixo: 109Total 0Acima de 8 18 47 56 45 114 143 232 211 260 Número de quadrados com X plantas X – número de plantas por quadrado Qual a distribuição de X se as plantas se distribuem completamente ao acaso na área estudada? X ~ Poisson(λ) λ – número médio de plantas por quadrado. λ desconhecido → estimá-lo 1926,2 109 )1 x 8(......)4 x 14()23 x 2()21 x 1()26 x 0( xˆ = +++++ ==λ 12 Se o modelo Poisson é adequado quais seriam as freqüências esperadas de quadrados com X plantas, X = 0,1,2,..., ? 1 0,0004 0,0015 0,0054 0,0172 0,0471 0,1075 0,1961 0,2683 0,2447 0,1116 P(X = x) 109 0 1 4 5 4 11 14 23 21 26 Número de quadrados com X plantas 109Total 0,04Acima de 8 0,168 0,597 1,886 5,145 11,724 21,383 29,252 26,681 109 x 0,1116 = 12,170 Número esperado de quadrados com X plantas X – número de plantas por quadrado Observe que as freqüências observadas (coluna 2) são bastante distintas das frequências esperadas sob o modelo Poisson (coluna 4), indicando que a distribuição das plantas não região não é completamente aleatória Processo de Poisson Processo Estocástico: coleção de variáveis aleatórias indexadas pelo tempo Exemplos: 1) Número de usuários em uma fila de banco em um determinado instante 2) Índice pluviométrico em cada dia do mês 3) Número de dias que choveram em cada mês do ano Processo de Contagem N(t) número de eventos ocorridos até o tempo t Propriedades: 1)N(t) ≥ 0 N(0) = 0 2) N(t) assume valores inteiros 3) Se s < t N(s) ≤ N(t) 4) Se s < t, N(t) – N(s) é igual ao numero de eventos ocorridos no intervalo (s,t] Exemplo: Número de acidentes de transito ocorridos até o tempo t 13 Processo de Poisson 1) Os números de eventos em intervalos de tempos disjuntos são independentes. Considere os tempos 0 ≤ t0 ≤ t1 ≤ t2 ≤...... ≤ tn para n > 0 N(t0), N(t1) - N(t0), N(t2) - N(t1), ....., N(tn) - N(tn - 1) são variáveis aleatórias independentes 2) Considere dois intervalos de tempo de mesmo comprimento ∆: (t , t + ∆) e (s, t + ∆). P[N(t + ∆) - N(t) = k] = P[N(s + ∆) - N(s) = k] para qualquer inteiro K, ∆ > 0 e s ≤ t A probabilidade de ocorrer k eventos num intervalo de comprimento ∆ depedende somente do comprimento do intervalo, não da sua localização. 3) Para h suficientemente pequeno P(N(h) = 1) ≈ λh P(N(h) = 0) ≈ 1 – λh P(N(h) ≥ 2) ≈ 0 Num intervalo suficientemente pequeno a probabilidade de ocorrência de 2 ou mais acidentes é desprezível. Relação entre o Processo de Poisson e a distribuição de Poisson: Para qualquer processo de Poisson o número de eventos em um intervalo de comprimento t tem distribuição de Poisson com média λt. Exemplo N(t) – Número de acidentes por envolvendo um segurado de seguro automóvel até o tempo t 1) Suposição 1 indica que o fato de envolver-se em um acidente não modifica a probabilidade de envolver-se em uma acidente no futuro. 2) Suposição 2 indica que condições que podem afetar a ocorrência de acidentes, tais como condições metereológicas e condições de segurança podem ser negligenciadas no modelo. 3) Suposição 3 indica que comparada às probabildades de sofrer 0 ou 1 acidentes, a probabilidade de envolver-se em 2 ou mais acidentes num intervalo de tempo pequeno é muito pequena. 14 Suponha que o número de acidentes automobilísticos ocorridos por dia um trecho de uma rodovia tenha distribuição de Poisson com parâmetro λ = 4. Considerando que o número de acidentes ocorridos até o tempo t pode ser descrito por um processo de Poisson, qual a distribuição de: a) Y - Número de acidentes observados por semana? Y ~ Poisson(λ = 4 x 7 = 28) a) Z - Número de acidentes observados por hora? Z ~ Poisson(λ = 4/24 = 0,17)
Compartilhar