Baixe o app para aproveitar ainda mais
Prévia do material em texto
MODELOS PROBABILISTICOS VISÃO GERAL: O que fizemos até agora e para onde vamos? *Agora - combinaremos conceitos de distribuições de probabilidade que descrevem o que provavelmente acontecerá, em vez do que realmente aconteceu. Além disso, construiremos distribuições de probabilidade, apresentando os resultados possíveis junto com as frequências relativas que esperamos. “Pulo do Gato” - com suposições adequadas e sem observarmos diretamente o fenômeno aleatório de interesse, podemos criar um Modelo Teórico que reproduza de maneira razoável a distribuição das frequências, quando o fenômeno é observado diretamente. Tais modelos são chamados “Modelos Probabilísticos”. 1 ~ Probabilidade Jogue um dado Ache a probabilidade para cada resultado P(1) = 1/6 P(2) = 1/6 ... = 1/6 P(6) = 1/6 Análise Descritiva Colete dados amostrais e obtenha medidas resumos e gráficos. x F 1 8 2 10 3 9 4 12 5 11 6 10 *Agora Crie um modelo teórico que descreve como se espera que o experimento se comporte e então obtenha seus parâmetros x P(x) 1 1/6 2 1/6 3 1/6 4 1/6 5 1/6 6 1/6 µ = 3,5 σ = 1,7 ⇒ Definições: • Variável aleatória (X) é uma função que “associa” um número real a cada resultado no espaço amostral de um experimento aleatório. Exemplo: Jogamos uma moeda três vezes onde: a - Cara o - Coroa S = {aaa,aao,aoa,oaa,aoo,aao,ooa,ooo} Uma forma natural de lidar com S é definir uma função que associa os elementos de S a números. Neste caso, tal função é: X = nº de “caras” nas três jogadas S Espaço da variável aleatória χ ooo X = 0 ooa oao X = 1 aoo aao aoa X = 2 oaa aaa X = 3 Espaço da v.a. χ = {0,1,2,3} Como definir P(X ∈ a) onde a ⊂ χ? 2 ~ Assim uma v.a. é uma função que “pega” resultados num espaço amostral S e os “leva” no subconjunto dos Reais. Associe a probabilidade do evento a em χ à probabilidade de um evento correspondente no espaço amostral S. Exemplo: retorne ao exemplo anterior... X = nº de cara nas 3 jogadas P(x = 2) = P(x = 1) = 3/8 P(x = 0) = P(x = 3) = 1/8 Note que o somatório das probabilidades é igual a 1, pois isto é equivalente à probabilidade do espaço amostral inteiro. P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3) = 1. Variável Aleatória Discreta Tem ou um número finito de valores ou uma quantidade enumerável de valores, mas que podem ser associadas a um processo de contagem. Ex: Números de linhas com erro no programa; Números de peças defeituosas. Variável Aleatória Contínua Tem infinitos valores, e esses valores podem ser associados com medidas em escalas contínuas de modo que não há pulos ou interrupções. Ex: Tempo de processamento de uma máquina; Temperatura ambiente. 3 ~ Distribuição de probabilidade Distribuição de probabilidade de uma v.a. é um gráfico, uma tabela ou uma fórmula (modelo) que fornece a probabilidade para cada valor uma probabilidade. Exemplo: Um estudo consiste na escolha aleatória de 14 recém-nascidos e na contagem do números de meninas. Se considerarmos que meninos e meninas são igualmente prováveis e fizermos a tabela abaixo, que fornece a probabilidade para cada valor da v.a. X. xi (nº de meninas) P(X=xi) = f(xi) 0 0,000 1 0,001 2 0,006 3 0,022 4 0,061 5 0,122 6 0,183 7 0,209 8 0,183 9 0,122 10 0,061 11 0,022 12 0,006 13 0,001 14 0,000 onde: f(xi) = P(X = xi) = função de probabilidade ou probabilidade de X assumir xi xi = valores possíveis da v.a. X Como f(xi) é definida como uma probabilidade f(xi) ≥ 0 e f(xi) ≤ 1, xi e . Obs: a fórmula de f(xi) será um modelo de probabilidade apresentado a seguir. 4 ~ Distribuição de probabilidade de uma v.a. Discreta - Função de Distribuição Acumulada de uma v.a. discreta X denotada por F(X) é: F(X) = P(X ≤ x) = Para uma v.a. discreta X, F(x) satisfaz as seguintes propriedades: 1. F(X) = P(X≤ x) = 2. 0 ≤ F(x) ≤ 1 ou 3. Se x ≤ y ,então F(x) ≤ F(y) - Média e Variância de uma v.a. Discreta Pelo fato de ser útil resumir uma amostra de dados pela média e variância, a distribuição de probabilidade de X é sumarizada por sua média e variância. A Média ou valor esperado ou esperança de X denotados por µ ou E(X), será dada por: E(X) = onde f(x) É O MODELO DE PROBABILIDADE PARA PONDERAR OS VALORES POSSIVEIS DE X. A E(X) descreve o centro dessa distribuição de X, em uma maneira similar ao ponto de equilíbrio da media amostral. A variância de uma v.a. X é a medida de dispersão ou espalhamento nos valores possíveis para X. A variância de x é denotada por σ² ou var(x) ou V(x): V(x) = onde f(x) é o modelo de probabilidade. Se desenvolvermos V(X), temos: V(x) = 5 ~ = = = - + = - + = - + = - = [E(X²)] – [E(X)]² Desvio-padrão σ = ou σ = - Algumas Propriedades do Valor Médio Dada uma v.a. Discreta e a respectiva função de probabilidade f(x), a esperança da função h(x) é dada por: E[h(x)] = Ʃ h(x)f(x) Exemplo: Z=2X As probabilidades associadas a v.a. Z serão as mesmas da v.a. X, pois cada valor de X corresponde a um único valor de Z. E(Z) = E(2X) = Ʃ (2X)f(x) = 2 Ʃ xf(x) = =2E(X) Por fim, temos as seguintes propriedades (importante em Inferência Estatística): (a) Se h(x)= aX + b, onde a e b são constantes E(aX + b) = aE(X) + b Var(aX + b) = a²Var(X) + 0 = a² Var(X) (b) V(X) = E(X²) – [E(X)]² = Ʃ x²f(x) – [Ʃ xf(x)]² ⇒ esta fórmula é usada para facilitar o cálculo da variância posteriormente. 6 ~ MODELOS PROBABILISTICOS PARA VARIÁVEIS ALEATÓRIAS DISCRETAS DISTRIBUIÇÃO BINOMINAL Nos permite lidar com circunstâncias nas quais os resultados pertencem a duas categorias relevantes, tais como: • Respostas SIM/NÃO em perguntas de pesquisa; • Linhas de programa COM/SEM erro; • Sucesso/Fracasso Um experimento aleatório que satisfaz os requisitos abaixo é chamado de experimento binomial: 1. Número fixo de tentativas ou repetições (n) 2. As tentativas ou repetições são independentes (o resultado de qualquer tentativa individual não afeta as probabilidades nas outras tentativas). 3. Cada tentativa resulta em somente dois resultados possíveis (duas categorias designadas como “Sucesso” e “Fracasso”). 4. A probabilidade de um sucesso em cada tentativa, denotada por p, permanece constante. A v.a. X, que é igual ao número de tentativas que resultam em um sucesso, tem uma Distribuição de Probabilidade Binomial com parâmetros p e n ∴ X ~ Bin(n,p). A função de probabilidade de X é: P(X=x) = f(x) = px(1 – p)n-x x=0,1;…;n onde: f(x)=P(X=x) - modelo probabilístico para se obter exatamente x sucessos em n tentativas. n - é o número fixo de tentativas 7 ~ x - número específico de sucesso em n tentativas p - probabilidade de sucesso = Exemplo: Voltando a tabela de nascimento de meninas entre 14 recém-nascidos... p: probabilidade de sucesso q: probabilidade de fracasso (1 – p) n=14 p=0,5 q=0,5 a) Qual a probabilidade de nascer exatamente 3 meninas em 14 recém-nascidos? P(X=3) = f(3) = (0,5)³(1-0,5)¹¹=0,022 b) Qual a probabilidade de nascer no máximo 3 meninas? P(X≤3)= F(3) = P(X=0) + P(X=1) + P(X=2) + P(X=3)= 0,029 c) Qual a probabilidade de nascer no mínimo 4 meninas? P(X≥4) = P(X=4) + … + P(X=14) ou 1 - P(X≤ 3) [Usamos aqui a ideia de evento complementar] A Média e a Variância de uma variável aleatória binomial dependem somente dos parâmetros p e n, então temos: E(X) = µ = np Var(X) = σ² = npq Exemplo: Calcule a média e a variância do nascimento de meninas. E(X) = 14(0,5) = 7 ⇒ nascem em média 7 meninas V(X) = 14(0,5)(0,5) = 3,5 meninas² ∴ σ = = 1,9 meninas. 8 ~ Observação: Para um número n de tentativas a distribuição binomial será: • Simétrica se p = 1/5 • Assimétrica positiva se p < 1/5 • Assimétrica negativa se p > 1/5 DISTRIBUIÇÃO GEOMETRICA Novamente suponha uma série de tentativas independentes,com probabilidade constante p de um sucesso em cada tentativa. Entretanto, ao invés de serem um número fixo, as tentativas são agora realizadas até que um sucesso seja obtido. Então, faça a v.a. X denotar o número de tentativas até que o primeiro sucesso ocorra. Logo, X tem uma distribuição geométrica com parâmetro p ∴ X~geo(p) e a f(x) da v.a. X é: P(X=x) = f(x) = (1 – p)x-1 p ; x = 1,2,… Se X for uma v.a. geométrica com parâmetro p, então, a E(X) e V(X) serão, respectivamente: E(X) = 1/p e V(X) = q/p² Exemplo: A probabilidade com que um bit transmitido através de um canal digital de transmissão seja recebido com erro é de 0,1. Considere que as transmissões sejam eventos independentes e faça a v.a. X denotar o número de bits transmitidos até que o primeiro erro seja encontrado. Calcule a probabilidade de que os 4 primeiros bits sejam transmitidos corretamente e o 5º tenha erro. t - transmitida sem erro e - transmitida com erro S=(t,t,t,t,e) P(X=5) = f(5) = (0,9)4(0,1) = 0,066 9 ~ Para este exemplo, calcule o número médio de transmissões até que o primeiro erro seja encontrado. E(X) = 1/0,1 = 10 bits Calcule o desvio-padrão de transmissões antes do primeiro erro ocorrer. σ² = (0,9)/(0,1)² = 90 bits ² ∴ σ = = 9,48 bits. DISTRIBUIÇÃO BINOMIAL NEGATIVA (ou DISTRIBUIÇÃO DE PASCAL) Em uma série de tentativas independentes, com probabilidade constante p de um sucesso, faça a v.a. X denotar o número de tentativas até que r sucessos ocorram. Então X tem uma Distribuição Binomial Negativa, com parâmetros p e r ∴ X~Nbin(r,p), com a seguinte função de probabilidade: P(X=x) = f(x) = (1 - p)x-r pr, r=1, 2, 3... x=r, r+1, r+2,.... Pelo fato de, no mínimo, r tentativas serem requeridas para obter r sucessos, a faixa de X é de r a ∞. Νo caso especial, em que r = 1, uma v.a. Binomial Negativa é uma v.a. Geométrica. Obs: A “falta de memória” de uma v.a. geométrica implica no seguinte: Seja X o número total de tentativas requeridas para obter r sucessos. Seja X1 o nº de tentativas requeridas para obter o 1º sucesso; seja X2 o nº de tentativas extras requeridas para obter o 2º sucesso e assim por diante. Então o número total de tentativas requeridas para obter r sucessos é: X = X1 + X2 + … + Xr 10 ~ Devido a propriedade “falta de memória”, cada uma das v.as X1, X2 , … , Xr tem uma Distribuição Geométrica com o mesmo valor de p. Consequentemente, uma v.a. Binomial Negativa pode ser interpretada como a soma de r v.as Geométricas. Se X~NBin(p,r), então a Média e a Variância de X serão: E(X) = µ = r/p V(X) = r Exemplo: Um comprador em potencial entra numa loja de carro a cada hora. O vendedor tem probabilidade 0,25 de concluir uma venda. O vendedor decide trabalhar até conseguir vender 3 carros num só dia. a) Qual a probabilidade de que o vendedor tenha de trabalhar exatamente 8 horas para conseguir vender os 3 carros? X = nº de horas de trabalho necessárias para vender 3 carros. P(X = 8) = (0,75)8-3 (0,25)³ = 0,07787 b) E mais de 8 horas? P(X>8) = 1 – P (X≤8) = 1 – {P(X = 3) + P(X= 4) + P(X = 5)+ … + P(X = 8)}= =0,67854 c) Para vender 3 carros o vendedor precisa trabalhar em média quantas horas? E(X)=3/0,25=12 horas 11 ~ DISTRIBUIÇÃO DE POISSON Útil para descrever a probabilidade do número de ocorrências em um intervalo (em geral tempo). Exemplo: Defeitos/cm², acidentes/dia, clientes/hora, chamadas telefônicas/minuto. Note que a unidade de medida (tempo, área) é contínua, mas a v.a. número de ocorrências é discreta! A utilização da distribuição de Poisson baseia-se nas seguintes hipóteses: 1. A probabilidade de uma ocorrência em todo o intervalo de observações; 2. A probabilidade de mais de uma ocorrência num único ponto é aproximadamente 0; 3. O número de ocorrências em qualquer intervalo é independente de qualquer número de outros intervalos A v.a. X, que é igual ao numero de contagens no intervalo, terá uma distribuição de poisson com parâmetro λ. X~Poisson(λ), sendo a função de probabilidade de X dada por: f(x) = ; x = 0,1,2,… onde: e: base dos logaritmos naturais λ: número médio de contagens (ocorrências) no intervalo desejado. x: um número específico de contagens (ocorrências) de um intervalo Se X~Poisson(λ), então a Média e a Variância de X serão: E(X) = λ V(X) = λ 12 ~ Exemplo: Seja X um número de certo tipo de animais capturados em uma armadilha durante certo período de tempo. Suponha que X tenha uma distribuição de Poisson de forma que, a média, que cada armadilha contenha 4 animais. a) Calcule a probabilidade de cada armadilha conter exatamente 5 animais? P(X = 5) = = 0,156 b) Calcule a probabilidade de uma armadilha conter no máximo 5 animais? P(X ≤ 5) = = 0,785 A derivação da distribuição de Poisson pode ser feito de duas formas: a) Processo de Poisson b) Aproximação da distribuição binomial a) Processo de Poisson: É importante usar unidades consistentes no cálculo de probabilidades, médias e variâncias envolvendo as v.as de Poisson, por exemplo: Nº médio de falhas por cm de fio por 3,4 , então Nº médio de falhas por 10cm de fio será 34 , então Nº médio de falhas por 100cm de fio será 340. MORAL DA HISTORIA Como uma v.a. de Poisson representa o número de contagens (ou ocorrências) em algum intervalo, então a média da v.a. terá de ser igual ao (número esperado) ou médio de contagens no mesmo comprimento de intervalo. 13 ~ Exemplo: Suponha que um número médio de falhas por minuto de um sistema é 6. Então, X é o número de falhas em 1 minuto. E(X) = λ = 6,0 a) Determine a probabilidade de existir exatamente duas falhas em 1 minuto. P(X = 2) = = = 0,045 b) Determine a probabilidade de ocorrer 10 falhas em 5 minutos. X= nº de falhas em 5 minutos. 6 1 | X = 30 falhas/5 minutos X 5 | P(X = 10) = c) Determine o número de falhas em 0,5 minuto. X = nº de falhas em 0,5 minuto E(X) = 3 falhas em 0,5 minuto P(X ≥ 1) = 1 – P(X = 0) = 1 - = = 0,950. b) Aproximação de Distribuição Binomial Em qualquer experimento binomial quando n é grande e p é pequeno, podemos dizer que Bin(n,p) ≈ Poisson(λ), onde λ= np. Como Regra Prática, tal aproximação pode ser aplicada se n ≥ 100, p ≤ 0,01 e np ≤ 20. Exemplo: Se uma editora de livros não-técnicos se esforça para garantir que seus livros não possuam erros tipográficos, de forma que a probabilidade de uma página conter um erro desse tipo é de 0,005 e os erros são independentes de página para página, qual a probabilidade de um de seus romances de 400 páginas conter exatamente 1 página com erros? 14 ~ - Problema de caráter de Distribuição Binomial X: número de páginas que contém ao menos um erro P(X = x) = px(1-p)n-x P(X = 1) = (0,005)1(1-0,005)399 Como n ≥ 100, p ≤ 0,01 e np ≤ 20, podemos aproximar o cálculo da Distribuição de Probabilidade Binomial pelo cálculo da Distribuição de Probabilidade de Poisson. P(X=x) = f(x) = P(X = 1) = = 0,271 15 ~
Compartilhar