Baixe o app para aproveitar ainda mais
Prévia do material em texto
* ESTATÍSTICA APLICADA Modelos probabilísticos mais comuns Professor Rodrigo Vieira * * Aulas prévias Conceitos básicos de probabilidade: Experimento aleatório, espaço amostral, eventos, definições de probabilidade, probabilidade condicional, independência. Variável aleatória: Conceito, variáveis discretas e contínuas, valor esperado e variância. * * Conteúdo desta aula Principais modelos probabilísticos: Variáveis aleatórias discretas: binomial, Poisson. Variáveis aleatórias contínuas: uniforme, normal, t, qui-quadrado. Como usá-los no cálculo de probabilidades. * * * Modelos para variáveis discretas Variável aleatória discreta: contradomínio finito ou infinito numerável. Modelo binomial: aplicável a casos em que o contradomínio é finito. Modelo de Poisson: também aplicável a casos em que o contradomínio é infinito numerável. * * Modelo binomial Seja o seguinte experimento aleatório: Número finito (n) de ensaios. Cada ensaio tem apenas 2 resultados possíveis: “sucesso” ou “fracasso”. Os ensaios são INDEPENDENTES entre si. p = prob. de sucesso 1- p = prob. de fracasso são CONSTANTES. * * Modelo binomial Experimento binomial X = no. de “sucessos” em n realizações. X segue o modelo binomial com os seguintes parâmetros: n e p. X = {0, 1, ..., n} E(X) = n × p V(X) = n × p × (1- p) * * Modelo binomial Observar o número de caras em 3 lançamentos de uma moeda: n=3; p=0,5 Observar o número de meninos nascidos em 3 partos de uma família: n=3; p = x Observar o número de componentes defeituosos em uma amostra de 10 que apresentaram anteriormente 1% de defeituosos: n = 10; p= 0,01. * * Fórmula binomial A probabilidade de ocorrências de k sucessos em n tentativas será: * * Exemplo 1 Estudos anteriores mostraram que há 73% de chance de consumidoras apresentarem uma reação positiva a anúncios publicitários com crianças. Uma agência apresentou um novo anúncio para 5 consumidoras. Qual é a probabilidade de que pelo menos 3 das 5 consumidores apresentem reação positiva? * * Exemplo 1 Para cada consumidora (“ensaio”) há apenas 2 resultados: reação positiva ou não. Há um número finito de realizações, n = 5. Definindo “sucesso” como reação positiva, e considerando as consumidoras “independentes”. * * Exemplo 1 A variável aleatória X, número de consumidoras com reação positiva em 5 que assistiram o novo anúncio terá distribuição binomial com parâmetros n = 5 e p = 0,73 (e 1- p = 0,27). Evento de interesse: X ≥ 3 * * Exemplo 1 P(X≥3) = P(X=3) + P(X=4) + P(X=5) * * Exemplo 1 P(X≥3) = P(X=3) + P(X=4) + P(X=5) P(X≥3) = 0,284 + 0,383 + 0,207 = ? P(X≥3) = 0,874 * * Modelo de Poisson Experimento binomial mas com n “infinito”. Modelo binomial não pode ser usado. Modelo de Poisson: Analisar as ocorrências em um período contínuo. Uso de uma quantidade constante: valor esperado. * * Modelo de Poisson Os parâmetros para esse modelo: = taxa de ocorrência por período Histórico ou experimental. t = período contínuo analisado Tempo, área, comprimento Constate: Valor Esperado E(x) E(x) = V(x) = m = × t * * Modelo de Poisson A variável aleatória X, número de sucessos em um período contínuo t Seguirá o modelo de Poisson com os parâmetros e t. Onde m = × t; e = 2,71... * * Modelo de Poisson E(X) = V(X) = m = × t Modelo usado para modelar filas. Número mensal de acidentes de tráfego em um cruzamento. Número de itens defeituosos produzidos por hora em uma indústria. * * Exemplo 2 Um departamento de polícia recebe em média 0,2 solicitações por minuto. Qual a probabilidade de receber exatamente 5 solicitações em 10 minutos? Qual a probabilidade de receber até 2 solicitações em 12 minutos? Qual o desvio padrão do número de chamadas em meia hora? * * Exemplo 2 X = de chamadas ocorridas em um período contínuo (de tempo no caso). Não há limite para o número de chamadas no período (apenas o número mínimo: 0) = o número médio de chamadas num intervalo específico (um minuto = 0,2) * Exemplo 2 O período t será igual a 10 minutos t = 10 min = 0,2 m = x t = 0,20 x 10 = 2 chamadas P(X = 5)? Então a probabilidade de receber exatamente 5 chamadas em 10 minutos é 3,61%. * * Exemplo 2 O período t será igual a 12 minutos t = 12 min = 0,2 m = x t = 0,20 x 12 = 2,4 chamadas P(X ≤ 2) = P(X = 0) + P(X = 1) + P(X = 2)? * * Exemplo 2 * * Exemplo 2 P(X≤2)=P(X=0)+P(X=1)+P(X=2)? 0,0907 + 0,2177 + 0,2613 = 0,5697 Então, a probabilidade de receber até 2 chamadas em 12 minutos é 56,97%. * * Exemplo 2 * * * Modelos para variáveis contínuas Variáveis aleatórias contínuas: contradomínio infinito. Modelo uniforme. Modelo normal. Modelo t Modelo qui-quadrado. * * Modelo uniforme Faixas de valores de mesma amplitude têm a mesma probabilidade de ocorrer. * * Modelo uniforme Usado na geração de números pseudo-aleatórios. * * Modelo normal Se os dados apresentam distribuição simétrica. Se à medida que os valores da variável afastam-se da parte central da distribuição, suas probabilidades de ocorrência diminuem. Possibilidade de uso do modelo normal. * * Modelo normal Muito adequado para descrever várias variáveis aleatórias: Medidas corpóreas (alturas, comprimentos, etc.). Dimensões de peças fabricadas (diâmetros, comprimentos, espessuras). Importante para inferência estatística. * Modelo normal * * * Modelo normal * * Modelo normal Para calcular probabilidades de intervalos de valores de uma variável aleatória que siga o modelo normal: Apenas métodos numéricos de integração. Os sábios dos séculos XVIII e XIX fizeram isso, sem computador... * * Distribuição normal padrão (z) Normal com média = 0 e variância = 1. Probabilidades calculadas para este modelo e registradas em tabela (Tabela). Uma normal qualquer pode ser transformada em normal padrão. * * Distribuição normal padrão (z) = média de uma normal qualquer. σ = desvio padrão de uma normal qualquer. x = valor de interesse. Z = número de desvios padrões a partir da média (se x < , z será negativo). * * Tabela da normal padrão Valor de z com duas casas decimais: P(Z > z) => cauda superior. * * Exemplo 2 Considere que uma variável aleatória X segue um modelo normal com média igual a 50 e desvio padrão = 10. Calcule a probabilidade de X assumir valores entre 48 e 56. * * * * Exemplo 2 Precisamos encontrar os valores de z correspondentes a 48 e 56. Z1 = (48 - 50)/ 10 = - 0,20 Z2 = (56 - 50)/ 10 = 0,60 Então: P (48 <X < 56) = P (-0,20<Z<0,60) * * Exemplo 2 Repare que a área entre 48 e 56 é igual à área de 48 até + MENOS a área de 56 até +. P(48<X<56) = P(X>48) - P(X>56) = P(-0,20<Z<0,60)=P(Z>- 0,20) - P(Z > 0,60) * * Exemplo 2 P(Z > 0,60) = 0,2743 P(Z > -0,20) = 1- P(Z > 0,20) = 1- 0,4207 = 0,5793 P(48 < X < 56)= P(-0,20< Z <0,60) = P(Z>-0,20) - P(Z>0,60) = 0,5793 - 0,2743 = 0,3050 (30,5%). * * Exemplo 3 Veja o 11º exemplo da Unidade 7. Supondo a mesma variável aleatória X com média 50 e desvio padrão 10. Encontre os valores de X, situados à mesma distância abaixo e acima da média, que contém 95% dos valores da variável. * * * * P(Z > z2) = 0,025 P(Z > 1,96) = 0,025 z2 = 1,96 z1 = -1,96 * * Exemplo 3 Agora é possível obter os valores de x1 e x2. x1 = m + (z1× s) = 50 + [(-1,96) × 10] = 30,4 x2 = m + (z2× s) = 50 + (1,96 × 10) = 69,6 * * Modelo t de Student Derivação do modelo normal, desenvolvido por William Gosset (Student). Mais apropriado para o processo de estimação de parâmetros usando pequenas amostras (Unidade 9). * * Modelo t de Student O modelo tem média igual a zero (como anormal padrão). Mas sua variância é: n/(n-2). Onde n é o tamanho da amostra que foi retirada para o processo de Estimação. O modelo t tem n – 1 graus de liberdade. * * Para cada valor de n temos uma curva t. * * Exemplo 4 Veja o 13º exemplo da Unidade 7. Imagine a situação do Exemplo 3, obter os valores de t simétricos em relação à média que contêm 95% dos dados, supondo uma amostra de 10 elementos. * * Exemplo 4 Encontrar os valores de t1 e t2, simétricos em relação à média, que contém 95% dos dados. t1 = - t2 P(t > t2) = 0,025 n = 10, então t terá 9 graus de liberdade. * * t2 = 2,262 t1 = - t2 = -2,262 * * Para saber mais Sobre modelos probabilísticos para variáveis aleatórias discretas e contínuas: BARBETTA, P.A., REIS, M.M., BORNIA, A.C. Estatística para Cursos de Engenharia e Informática. São Paulo: Atlas, 2004, capítulos 5 e 6. STEVENSON, Willian J. Estatística Aplicada à Administração. São Paulo: Ed. Harbra, 2001, capítulos 4 e 5. * * Próxima aula Inferência estatística Conceito, tipos, parâmetros e estatísticas. Distribuições amostrais das principais estatísticas: média e proporção.
Compartilhar