Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Curso de Engenharia de Produção MODELOS PROBABILÍSTICOS APLICADOS À ENGENHARIA DE PRODUÇÃO 1ª AvD PROF. SÉRGIO RICARDO BASTOS DE MELLO, MSC. 2015.1 2 Disciplina: Modelos Probabilísticos Aplicados à Engenharia de Produção Ementa: Introdução. Conceitos básicos de probabilidades. Probabilidade condicional e independência. Variáveis aleatórias. Funções de variáveis aleatórias. Valor esperado e variância. Distribuições de variáveis aleatórias discretas e contínuas. Teorema central do limite. Distribuições por amostragem. Aplicações de modelos probabilísticos em engenharia de produção. Bibliografia Básica: CALADO, Mônica; MONTGOMERY, Douglas C; RUNGER, George C. Estatística aplicada e probabilidade para engenheiros. 5. ed. Rio de Janeiro: LTC. 2012. QUEIROZ, Luiz Claudio; RYAN, Thomas P.. Estatística moderna para engenharia. Rio de Janeiro: Elsevier, 2009. WALPOLE, Ronald E., MYERS, et. al. Probabilidade e estatística para engenharia e ciências. 8. ed. São Paulo: Pearson Prentice Hall, 2009. Bibliografia Complementar: VIEIRA, Sonia. Estatística básica. São Paulo. 2012. MOORE, David S. Estatística básica e sua prática. 5. ed. Rio de Janeiro. 2011. BARBETTA, Pedro Alberto; BORNIA, Antônio Cezar; REIS, Marcelo Menezes. Estatística: para cursos de engenharia e informática. 2. ed. São Paulo: Atlas, 2008. CRESPO, Antônio Arnot. Estatística. São Paulo. 2008. ANDERSON, David R.; SWEENEY, Dennis; WILLIANS, Thomas A. Estatística aplicada à Administração e Economia. 2. ed. São Paulo: Pioneira Thomson Learning, 2008. Plano de aula: 1. Apresentação do plano de ensino e plano de aula. Importância da disciplina. Revisão de conceitos básicos. Teoria dos conjuntos. (4h_a) 2. Conceitos básicos de probabilidades. (1 h_a) 3. Princípios de probabilidade. (1h_a) 4. Probabilidade condicional e independência estatística. (2h_a) 5. Teoremas de Bayes e da Probabilidade total. (2 h_a) 6. Exercícios. (2 h_a) 7. Variável aleatória. (2 h_a) 3 8. Função de distribuição de probabilidade. (2 h_a) 9. Valor esperado e variância de variável aleatória. (2 h_a) 10. Exercícios. (2 h_a) 11. Distribuição uniforme discreta. (1 h_a) 12. Distribuição multinomial. (1 h_a) 13. Distribuição binomial. (2 h_a) 14. Distribuição geométrica (1 h_a) 15. Distribuição binomial negativa. (2 h_a) 16. Exercícios. (1 h_a) 17. Distribuição hipergeométrica multivariada. (1 h_a) 18. Distribuição hipergeométrica. (1 h_a) 19. Distribuição de Poisson. (2 h_a) 20. Exercícios. (2 h_a) 21. 1ª AvD. (4 h_a) 22. Vista da 1ª AvD. (2 h_a) 23. Modelos de distribuição contínua. (2 h_a) 24. Função de distribuição de probabilidade. (2 h_a) 25. Valor esperado e variância de variáveis aleatórias contínuas. (2h_a) 26. Exercícios. (2h_a) 27. Distribuição uniforme contínua. (1h_a) 28. Distribuição normal. (2h_a) 29. Exercícios. (1 h_a) 30. Distribuição Gama. (1 h_a) 31. Distribuição exponencial. (2 h_a) 32. Exercícios. (1 h_a) 33. Distribuição qui-quadrado. (2 h_a) 34. Distribuição t. (2 h_a) 35. Outras distribuições contínuas. (4 h_a). 36. 2ª AvD. (4h_a) 37. Vista 2ª AvD. (2 h_a) 38. Exercícios de revisão. (2 h_a) 39. 2ª Chamada. (4h_a) 40. Exame final. (4 h_a) 4 Capítulo 0: Revisão de Estatística Descritiva 0. Análise Exploratória de Dados 0.1 Introdução A essência da ciência é a observação e seu objetivo é a inferência, que pode ser dedutiva (das premissas às conclusões) ou indutiva (do específico ao geral). A inferência estatística tem por objetivo a coleta, redução, análise e modelagem de dados para inferir para uma população, da qual os dados (a amostra) foram obtidos. A análise exploratória de dados inclui a redução, análise e interpretação dos dados, para identificar uma regularidade, padrão ou modelo presente nas observações, ou seja, busca estabelecer a relação: DADOS = MODELO + RESÍDUOS ou D = M + R 0.2 Tipos de variáveis 0.3 Distribuição de frequências O interesse no estuda de uma variável é conhecer sua distribuição através de seus possíveis valores. Variável qualitativa: Variável Contagem Frequência (absoluta) Frequência absoluta acumulada Proporção (frequência relativa) Proporção acumulada Gráfico: pontos Notação: absoluta) frequência(ou frequência - in relativa) frequência(ou proporção - n n f ii inn 10 if 1 if Variável Qualitativa Quantitativa Nominal (não existe ordem – estado civil) Ordinal (existe ordem – grau de instrução) Discreta (contagem – nº de filhos) Contínua (mensuração - salário) 5 Variável quantitativa: Classes da Variável Ponto médio da classe Frequência (absoluta) Frequência absoluta acumulada Proporção (frequência relativa) Proporção acumulada Gráfico: histograma. Procedimento para construção do histograma: Nº de classes (K) o Se n ≤ 25 K = 5; o Se n > 25 )log(32,31ou nKnK Amplitude das classes (h): K dadosdosMenordadosdosMaior h Construir o agrupamento em classes de frequência: partir do menor valor e somar gradualmente o intervalo obtido para cada uma das classes até incluir o último valor; adotar uma notação de limites de classes. Histograma é um gráfico de barras contíguas, com altura proporcional a f i. A área total da figura é igual a 1, correspondendo à soma total das proporções. A área correspondente ao intervalo [a,b), qualquer, representa proporção deste intervalo. 0.4 Medidas de posição Média, mediana e moda. n i ii xfx 1 . Md ant f fn hIMd )2/( mediana da classe da frequência mediana da classe àanterior classe da acumulada frequência sobservaçõe denº classes das amplitude mediana da classe dainferior limite : Md ant f f n h I Onde Fórmula de Pearson: xMdMo .2.3 0.5 Medidas de dispersão Amplitude, desvio médio absoluto, variância e desvio padrão. R = xmaior − xmenor ||. 1 xxfDMA n i ii V(X) = ∑ fi(xi − x̅) 2 n i=1 = ∑ fi(xi 2 − 2xix̅ + x̅ 2) = n i=1 ∑ fixi 2 − x̅2 n i=1 )()( XVXDP 6 Exemplo 1: Um pesquisador está interessado em fazer um levantamento sobre alguns aspectos socioeconômicos dos empregados da seção de orçamentos da Companhia Milsa. Usando informações obtias na seção de pessoal, ele elaborou a tabela a seguir. Nº Estado Civil Grau de instrução Nº de Filhos Salário (X sal min) Idade Região de procedência anos meses 1 solteiro Fundamental - 4,00 26 03 Interior 2 casado Fundamental 1 4,56 32 10 Capital 3 casado Fundamental 2 5,25 36 05 Capital 4 solteiro Médio - 5,73 20 10 Outro 5 solteiro Fundamental - 6,26 40 07 Outro 6 casado Fundamental 0 6,66 28 00 Interior 7 solteiro Fundamental - 6,86 41 00 Interior 8 solteiro Fundamental - 7,39 43 04 Capital 9 casado Médio 1 7,59 34 10 Capital 10 solteiro Médio - 7,44 23 06 Outro 11 casado Médio 2 8,12 33 06 Interior 12 solteiro Fundamental - 8,46 27 11 Capital 13 solteiro Médio - 8,74 37 05 Outro 14 casado Fundamental 3 8,95 44 02 Outro 15 casado Médio 0 9,13 30 05 Interior 16 solteiro Médio - 9,35 38 08 Outro 17 casado Médio 1 9,77 31 07 Capital18 casado Fundamental 2 9,80 39 07 Outro 19 solteiro Superior - 10,53 25 08 Interior 20 solteiro Médio - 10,76 37 04 Interior 21 casado Médio 1 11,06 30 09 Outro 22 solteiro Médio - 11,59 34 02 Capital 23 solteiro Fundamental - 12,00 41 00 Outro 24 casado Superior 0 12,79 26 01 Outro 25 casado Médio 2 13,23 32 05 Interior 26 casado Médio 2 13,60 35 00 Outro 27 solteiro Fundamental - 13,85 46 07 Outro 28 casado Médio 0 14,69 29 08 Interior 29 casado Médio 5 14,71 40 06 Interior 30 casado Médio 2 15,99 35 10 Capital 31 solteiro Superior - 16,22 31 05 Outro 32 casado Médio 1 16,61 36 04 Interior 33 casado Superior 3 17,26 43 07 Capital 34 solteiro Superior - 18,75 33 07 Capital 35 casado Médio 2 19,40 48 11 Capital 36 casado Superior 3 23,30 42 02 Interior 7 Questões: 1 Classifique as variáveis da tabela anterior. 2 Elabore a distribuição de frequências da variável número de filhos dos empregados casados e construa o seu gráfico para a frequência relativa. 3 Elabore a distribuição de frequências da variável salário dos empregados e construa o seu gráfico para a frequência relativa. 4 Determine a média e a variância da distribuição de frequências da variável número de filhos dos empregados casados. 5 Determine a média e a variância da distribuição de frequências da variável salário dos empregados. 0.6 Outras medidas Restrições à média e ao desvio padrão para representar um conjunto de valores: São afetados, de forma significativa, por valores extremos; As duas estatísticas juntas não são suficientes para indicar a assimetria da distribuição das observações. Proposta de Tukey, 1977: Mediana: Md Os extremos, E: maior e menor valores do conjunto de observações Os quartis ou juntas, J: J1 (1/4 e 3/4), J2 (1/2 e 1/2) e J3 (3/4 e 1/4) – medidas de posição Intervalo quartil, dJ = J3 – J1: medida de dispersão Outliers ou observações discrepantes (muito aquém de J1 ou muito além de J3), x: dados menores que J1 – (3/2) dJ e dados maiores que J3 + (3/2) dJ 0.7 Gráfico boxplot 0.8 Análise bidimensional Análise conjunta de duas (ou mais) variáveis. Objetivo: verificar a associabilidade entre as variáveis, ou seja, o grau de dependência entre elas. Segue tabela da distribuição conjunta de X e Y. J2 x x J3 J1 Jd 2 3 Jd 2 3 Jd 8 Y X X1 X2 X3 Total Y1 Y2 Y3 Total A linha dos totais fornece a distribuição da variável X e a coluna dos totais fornece a distribuição da variável Y. As distribuições assim obtidas são chamadas de distribuições marginais. Cada casela pode conter as frequências absolutas ou relativas. No caso da frequência relativa ela pode ser expressa em relação: ao total geral, ao total de cada linha e ao total de cada coluna, de acordo com o objetivo da pesquisa. INDEPENDÊNCIA DE VARIÁVEIS 1º passo: substituir as frequências absolutas pelas relativas (eliminando as diferenças marginais – todas as variáveis estarão referenciadas a 100). 2º passo: fixar os totais pelas linhas ou colunas, que definirão os valores esperados para cada variável. A quantificação do grau de dependência entre duas variáveis é feita pelos coeficientes de correlação. Usaremos o coeficiente de contingência de Pearson, que varia de 0 a 1 (zero indica total independência). 3º passo: construir as tabelas dos valores observados; dos valores esperados; e dos resíduos. 4º passo: calcular a medida i ii e eo 2)( esperado valor - observado valor - i i e o 5º passo: calcular o χ2 – como uma medida do afastamento global i ii e eo 22 )( Para maiores valores de χ2, maior a dependência entre as variáveis. 6º passo: calcular o coeficiente de contingência C, de Pearson: 1C0 e sobservaçõe de nº n onde 2 2 n C 9 COEFICIENTE DE CORRELAÇÃO LINEAR Agente X Y 𝑥 − �̅� 𝑦 − �̅� 𝑥 − �̅� 𝐷𝑃(𝑋) = 𝑧𝑥 𝑦 − �̅� 𝐷𝑃(𝑌) = 𝑧𝑦 𝑧𝑥 . 𝑧𝑦 A B Total Definição: Dados n pares de valores (x1,y1), (x2,y2) ... (xn,yn), o coeficiente de correlação linear entre as variáveis X e Y é 𝐶𝑜𝑟𝑟(𝑋, 𝑌) = 1 𝑛 ∑ ( 𝑥𝑖−�̅� 𝐷𝑃(𝑋) ) ( 𝑦𝑖−�̅� 𝐷𝑃(𝑌) )𝑛𝑖=1 − 1 ≤ 𝐶𝑜𝑟𝑟(𝑋, 𝑌) ≤ 1 ou 𝐶𝑜𝑟𝑟(𝑋, 𝑌) = 1 𝑛 ∑(𝑥𝑖 − �̅�)(𝑦𝑖 − �̅�) 𝐷𝑃(𝑋). 𝐷𝑃(𝑌) = ∑ 𝑥𝑖𝑦𝑖 − 𝑛�̅��̅� √(∑ 𝑥𝑖 2 − 𝑛�̅�2). (∑ 𝑦𝑖 2 − 𝑛�̅�2) 0.9 Teoria dos Conjuntos 0.9.1 Elementos da Teoria dos Conjuntos O interesse ao estudar os fenômenos aleatórios está em afirmar quais eventos podem ocorrer. Eventos e combinações de eventos desempenham papel central na teoria das probabilidades, também chamada álgebra dos eventos, que tem íntima relação com a teoria dos conjuntos. Conjunto é uma coleção de objetos (elementos) que possuem alguma(s) propriedade(s) em comum. Por exemplo: A={1,2,3,4,5,6} conjunto A tem como elementos os números inteiros de 1 a 6. Usa-se letras maiúsculas A, B, C, , , ... para representar os conjuntos e letras minúsculas a, b, c, , , ... para representar seus elementos. Relação entre elemento e conjunto: (pertence) e (não pertence). Por exemplo, para o conjunto A anterior: 1 A e 7 A Conjunto finito: pode-se contar seu número de elementos. Por exemplo, conjunto das vogais {a, e, i, o,u} Conjunto infinito: não se pode contar seu número de elementos. Por exemplo, conjunto dos números reais maiores que 6 {x R | x > 6}. Pode ser numerável ou não numerável. Um conjunto infinito é numerável se pode ser estabelecida uma correspondência biunívoca de seus elementos com o conjunto dos números inteiros positivos. Caso contrário o conjunto infinito é não numerável, como o exemplo anterior. Subconjunto: dados 2 conjuntos A e B, B é subconjunto de A se, e somente se, todos os elementos que pertencem a B também pertencem a A. Símbolos utilizados para definir a 10 relação entre conjuntos: (está contido), (contém) e (não está contido). Por exemplo, para o conjunto A anterior e o conjunto B={1,2,3} podemos dizer que: B A, A B e A B Diagrama de Venn para B A Conjunto vazio: é o conjunto que não tem elementos. É representado por { } ou . É subconjunto de todo e qualquer conjunto. Exemplo: Lançamento de um dado e obter a face 7. Conjunto unitário: é aquele que possui somente um elemento. Por exemplo: conjunto dos satélites da terra {lua} Conjunto universo ou espaço: é um conjunto “máximo”, que contém todos os conjuntos em estudo. É representado por S; Conjunto complementar de A: conjunto de todos elementos de S que não são elementos de A. É representado por A . AA S S , 0.9.2 Operações com Conjuntos Dados A, B, C, ... subconjuntos de S. A união ou soma de A e B, A U B: conjunto de todos elementos que pertencem a A, ou a B ou a ambos. A interseção ou produto de A e B, A ∩ B ou AB: conjunto de todos elementos comuns a A e a B. Conjuntos disjuntos: quando A ∩ B = . Sempre um conjunto (A) e seu complementar ( A ) são disjuntos. A diferença de A e B, A – B: conjunto de todos elementos que pertencem a A e não a B. Então: BABAAAS e eA -A A B S A A A U B A ∩ B A B A B 11 Exemplo 2: Seja S o espaço que consiste do segmento da reta real de0 a 10 e os segmentos reais A de 1 a 7 e B de 3 a 9. Marque os segmentos representativos de A U B, A ∩ B, A e B . Generalização das definições de união e interseção para vários conjuntos: j n j nj n j n AAAAAAAA 1 21 1 21 ... e ... Se os conjuntos Aj, j=1,2,...,n são disjuntos , ji AA para todos i, j (i j). Exemplo 3: Utilizando diagramas de Venn verifique as relações abaixo, bem como, que as operações de união e interseção são associativas, comutativas e distributivas, ou seja: ABBA CBACBACBA ABBA CBACBACBA BABABA BAABA CABACBA CABACBA BA e 0.10 Técnicas de Contagem São técnicas para determinar o número de resultados em um espaço amostral ou evento. Em muitos exemplos a contagem é muito simples. Por exemplo, quantos resultados podem ser obtidos ao lançar um dado? Outros exemplos podem ser mais complexos. Nestes casos são utilizadas diferentes técnicas de contagem. Por exemplo: Um fabricante de automóveis fornece veículos equipados com opcionais selecionados. Cada veículo é encomendado: Com ou sem transmissão automática Com ou sem ar condicionado Com uma das três escolhas de um sistema estéreo Com uma das quatro cores exteriores: vermelho, branco, azul ou marrom Com uma das quatro cores interiores: vermelha, preta, azul ou marrom, de acordo com os seguintes critérios: o Com exterior vermelho: interior preto ou vermelho o Com exterior branco: interior em qualquer cor o Com exterior azul: interior preto, vermelho ou azul o Com exterior marrom: somente interior marrom. Se o espaço amostral consistir no conjunto de todos os tipos possíveis de veículos, qual será o número de resultados no espaço amostral? 12 Regra da Multiplicação (para técnicas de contagem) Considere uma operação que possa ser descrita como uma sequência de k etapas se O número de maneiras de completar a etapa 1 for n1, O número de maneiras de completar a etapa 2 for n2 para cada maneira de completar a etapa 1, O número de maneiras de completar a etapa 3 for n3 para cada maneira de completar a etapa 2 e Assim por diante. O número total de maneiras de completar a operação será n1 x n2 x n3 x ... x nk Permutações É uma sequência ordenada dos elementos (ab ≠ ba). número de permutações de n elementos diferentes: n! = n x (n-1) x (n-2) x ... x 2 x 1 número de permutações circulares: (n-1)! número de permutações com repetição com n = n1 + n2 + ... + nr objetos dos quais n1 são de um tipo, n2 são de um segundo tipo, ..., e nr são de um r-ésimo tipo, é 𝑛! 𝑛1! 𝑛2! 𝑛3! … 𝑛𝑟! número de permutações de subconjuntos de r elementos selecionados de um conjunto de n elementos diferentes é 𝑃𝑟 𝑛 = 𝑛 𝑥 (𝑛 − 1)𝑥 (𝑛 − 2)𝑥 … 𝑥 (𝑛 − 𝑟 + 1) = 𝑛! (𝑛 − 𝑟)! número de permutações de subconjuntos de r elementos selecionados de um conjunto de n elementos diferentes com repetição é 𝑃𝑟 𝑛 = 𝑛𝑟 Combinação É uma sequência de elementos em que a ordem não é importante (ab = ba). número de combinações de subconjuntos de r elementos selecionados de um conjunto de n elementos diferentes é 𝐶𝑟 𝑛 = ( 𝑛 𝑟 ) = 𝑛! 𝑟! (𝑛 − 𝑟)! = 𝑃𝑟 𝑛 𝑟! 13 número de combinações de subconjuntos de r elementos selecionados de um conjunto de n elementos diferentes é 𝐶𝑟 𝑛 = 𝐶𝑟 𝑛+𝑟−1 Exemplo 4: Dadas as palavras: ESTADO e ESTATISTICAMENTE, determine: número total de anagramas com todas as letras das palavras; número total de anagramas com 5 letras para cada palavra fornecida sem importar a ordem das letras; número total de anagramas com 5 letras para cada palavra fornecida diferenciados pela ordem das letras; número total de anagramas com 5 letras para cada palavra fornecida sem importar a ordem das letras e podendo conter repetição das letras; número total de anagramas com 5 letras para cada palavra fornecida diferenciados pela ordem das letras e podendo conter repetição das letras; 0.11 Exercícios 1) Represente os diagramas de Venn e verifique se as relações abaixo são verdadeiras ou falsas. a) )()()()( CBCBABCBA b) BABA 2) Suponha que uma família esteja saindo para as férias de verão em seu trailer e que M seja o evento no qual irão passar problemas mecânicos, T seja o evento no qual receberão uma multa de trânsito e V seja o evento no qual chegarão a um camping sem vagas. Com base no diagrama de Venn abaixo e usando a notação de operações entre eventos (∩ interseção e U união), liste os números das regiões que representam os seguintes eventos: a) (0,2) A família não passará por problemas mecânicos, não será multada nem chegará a um camping sem vagas (férias dos sonhos!!!) b) (0,2) A família não passará por problemas mecânicos nem cometerá violações de trânsito, mas chegará a um camping sem vagas c) (0,2) A família terá problemas mecânicos e para localizar um camping que tenha vagas, mas não receberá multa de trânsito d) (0,2) A família terá problemas mecânicos ou chegará a um camping sem vagas, mas não receberá multa de trânsito e) (0,2) Dado que a família será multada, ela terá problema mecânico ou chegará a um camping sem vagas f) (0,2) A família não chegara a um camping sem vagas 14 Exemplo: A família terá problema mecânico, será multada e chegará a um camping sem vagas. M ∩ T ∩ V = 1; A família terá problema mecânico, será multada ou chegará a um camping sem vagas. M U T U V = 1 + 2 +3 + 4 + 5 + 6 + 7 8 M T 1 2 3 4 5 6 7 V 15 Capítulo 1: CONCEITOS BÁSICOS DE PROBABILIDADE 1.1 Introdução O sucesso industrial japonês iniciado na segunda metade do século XX é atribuído a implantação dos métodos estatísticos no gerenciamento de seus processos de manufatura. No início dos anos 80 as montadoras instaladas no Brasil, sob orientação de suas matrizes americanas e europeias e em resposta ao avanço da indústria nipônica, assumiram a responsabilidade pela disseminação dos métodos estatísticos junto à cadeia de suprimentos do segmento automotivo. É fato que o avanço da indústria japonesa atestou a importância da estatística no controle da qualidade dos processos de manufatura. É importante entender a estatística como uma ciência exata, suportada por princípios que garantem sua eficácia na solução de problemas. A Estatística Descritiva (análise exploratória de dados) é a parte da Estatística que organiza e descreve os dados científicos, através de: Coleta de dados: planos de amostragem aleatória; Representação dos dados: tabelas e gráficos; e Síntese dos dados experimentais através de estatísticas: medidas de posição, medidas de dispersão absolutas e relativas e medidas de forma. A Inferência Estatística é um processo de raciocínio indutivo, em que se procuram tirar conclusões indo do particular para o geral, ou seja, a partir das propriedades verificadas na amostra (estatísticas), inferir propriedades para a população (parâmetros). O raciocínio com base em dados da amostra para inferir sobre a população pode resultar em erros (chamados erros de amostragem). No entanto, se a amostra for selecionada adequadamente, esses riscos poderão ser quantificados e um tamanho apropriadode amostra pode ser determinado. Os modelos probabilísticos são essenciais na transição entre a Estatística Descritiva e a Inferência Estatística. Os modelos de probabilidade ajudam a quantificar os riscos envolvidos em inferência estatística, isto é, os riscos envolvidos em decisões feitas todo dia. A probabilidade é ramo da ciência que estuda os fenômenos aleatórios – o resultado não pode ser previsto. Os fenômenos aleatórios estão associados a duas classes de situações e/ou problemas: o grau de incerteza associado aos fenômenos físicos ou naturais e a variabilidade inerente aos processos de manufatura. A incerteza de um problema é devida a sua complexidade, desconhecimento de suas causas e efeitos ou por informação insuficiente. Por exemplo, qual a previsão do tempo para daqui a um mês? A variabilidade dos processos é devida a pequenas variações de diferentes fontes. Por exemplo, por que duas peças produzidas numa mesma máquina e pelo mesmo operador não são exatamente iguais? A utilização de modelos é corrente no nosso dia a dia. Para que servem os modelos? Permitem a simplificação de uma realidade complexa pela eliminação dos seus aspectos irrelevantes para o problema analisado. 16 O modelo probabilístico estipula que as condições da experimentação determinam somente o comportamento probabilístico (mais especificamente, a lei probabilística) do resultado observável. Para explicar os fenômenos aleatórios, o modelo utilizado será o cálculo das probabilidades. 1.2 Experimentos Aleatórios Experimento é qualquer processo que gere um conjunto de dados. O interesse maior está nas observações obtidas ao se repetir o experimento estatístico diversas vezes. Ao descrever um experimento aleatório devemos especificar: O procedimento que deve ser realizado e O que deve ser observado. Exemplos de experimentos aleatórios: E1: Jogue uma moeda 4 vezes e observe a sequência obtida de caras e coroas. E2: Jogue uma moeda 4 vezes e observe o número de caras obtido. E3: Peças são fabricadas até que 10 peças perfeitas sejam produzidas; o número total de peças fabricadas é contado. E4: Uma lâmpada é fabricada; em seguida é ensaiada quanto à duração da vida, pela colocação em um soquete e anotação do tempo decorrido (em horas) até queimar. Características de um experimento aleatório: a) Cada experimento pode ser repetido indefinidamente sob condições essencialmente inalteradas; b) Embora não seja possível afirmar que resultado particular ocorrerá, seremos capazes de descrever o conjunto de todos os possíveis resultados do experimento; e c) Quando o experimento é executado repetidamente, os resultados individuais parecem acidentais, entretanto, para um grande número de vezes uma regularidade surgirá. 1.3 Espaço Amostral Para cada experimento aleatório (E), define-se o ESPAÇO AMOSTRAL “S” como o conjunto de todos os possíveis resultados desse experimento. Cada resultado possível é um ponto amostral. Exemplos de espaços amostrais (com referência aos experimentos anteriores): S1: {cccc, ccck, cckc, ckcc, kccc, ..., kkkk} S2: {0,1,2,3,4} S3: {10, 11,12, ...} S4: {t ϵ R| t ≥ 0} 17 Espaços amostrais discretos e contínuos: Discreto: consiste em um conjunto finito (S1 e S2) ou infinito (S3) contável de resultados; Continuo: contém um intervalo de números reais (S4). 1.4 Evento Evento é um subconjunto do espaço amostral de um experimento aleatório. A ocorrência de um evento significa que o resultado observado no experimento é um ponto amostral daquele evento. Portanto, o espaço amostral é o evento certo e é um evento impossível. Eventos podem ser descritos a partir de combinações de eventos existentes, através de operações básicas de conjuntos aplicáveis aos mesmos, tais como: União de eventos (A U B): é o evento que consiste em todos os resultados (pontos amostrais) contidos em cada evento (A e B). Interseção de eventos (A ∩ B): é o evento que consiste em todos os resultados (pontos amostrais) contidos nos eventos (A e B), simultaneamente. Complemento de um evento em um espaço amostral (�̅�, 𝐴′, 𝐴𝑐): é o evento que consiste em todos os resultados (pontos amostrais) no espaço amostral que não estão no evento. Eventos mutuamente excludentes: quando os eventos não têm pontos amostrais em comum, ou seja, A ∩ B = . Exemplos de eventos relativos aos espaços amostrais anteriores: A1: {cccc, ccck, cckc, ckcc, kccc}, isto é, no máximo uma coroa ocorre A2: {2}, isto é, 2 caras ocorrem A3: {10, 11, 12, 13, 14,15, 16, 17, 18, 19, 20}, isto é, 10 peças perfeitas ocorrem na produção de 10 a 20 peças consecutivas A4: {t ϵ R | t < 100}, isto é, a lâmpada queima em menos de 100 h A descrição do espaço amostral, ponto amostral e evento se encaixam na teoria dos conjuntos, permitindo uma análise dos resultados de um experimento aleatório. Todas as relações entre resultados ou eventos na teoria das probabilidades podem ser descritas por meio de conjuntos ou operações com conjuntos. A tabela a seguir dá a correspondência entre alguns conceitos relativos a conjuntos e probabilidade. Teoria dos conjuntos Probabilidade Espaço S Espaço amostral, evento certo Conjunto vazio Evento impossível (nenhum resultado possível pode ser elemento do conjunto vazio) Elementos a, b, ... Pontos amostrais Conjuntos A, B,... Eventos 18 A Ocorrência do evento A A Não ocorrência do evento A A U B Ocorrência de ao menos um dos eventos A ou B A ∩ B Ocorrência de ambos os eventos A e B A – B Ocorrência apenas do evento A A B A ocorrência do evento A necessariamente implica a ocorrência do evento B A ∩ B = Eventos A e B são mutuamente excludentes (i.é., A e B não podem ocorrer simultaneamente) Todo espaço amostral S (n pontos amostrais) finito ou infinito numerável tem 2n eventos (subconjuntos possíveis). A relação entre eventos e espaço amostral correspondente pode ser representada graficamente pelo diagrama de Venn, como ilustra a figura a seguir. Exemplo 1: Considere um experimento que consiste na contagem de conversões de automóveis à esquerda num cruzamento, em um grupo de 100 automóveis. Dados os eventos: A – evento que consiste em, no máximo, 50 carros fazerem conversão à esquerda; B – evento que consiste em entre 40 e 60 (inclusive) conversões à esquerda; e C – evento que consiste em 80 ou mais conversões à esquerda. Qual é o espaço amostral do experimento? Determine A U B e A ∩ B. Qual a relação entre os eventos A e C? Exemplo 2: Um dispositivo eletrônico é ensaiado e o tempo total do serviço t é registrado. Admitiremos que o espaço amostral seja {t ϵ R | t ≥ 0}. Sejam A, B e C três eventos definidos como segue: A = {t ϵ R | t < 100}; B = {t ϵ R | 50 ≤ t ≤ 200}; C = {t ϵ R | t>150} Determine: ;;;;;;;;;;; CACACBCBBABACBBABCBBA 19 1.5 Medida de Probabilidade 1.5.1 Frequência Relativa Exemplo 3: Vamos supor que uma determinada indústria produz lâmpadas em linha e são coletadas durante um dia 10 amostras de 25 lâmpadas, no outro dia 10 amostras de 250 lâmpadas e no terceiro dia 10 amostras de 2500 lâmpadas e para cada amostra obtiveram- se as porcentagens de lâmpadas defeituosas como mostrado na tabela a seguir. Amostras Quantidade de lâmpadas analisadas 25 250 2500 % defeitos % defeitos % defeitos 1 4 4,8 6,28 2 16 5,6 6,08 3 0 6,8 6,28 4 0 4,4 5,44 5 4 8,8 6,08 6 4 3,6 5,40 7 8 6,0 5,72 8 0 5,6 6,40 9 4 8,4 5,96 10 4 3,2 6,12 Média 4,400 5,720 5,976 Desvio padrão 4,7891,867 0,348 Coeficiente de variação 109% 33% 6% Suponha que o experimento (E) seja repetido n vezes. Sejam A e B dois eventos associados ao experimento E. Considere que os eventos A e B ocorrem nA e nB vezes, respectivamente. Por definição n n f AA é a frequência relativa do evento A nas n repetições do experimento E. A frequência relativa tem as seguintes propriedades: 1) 0 ≤ fA ≤ 1 2) fA = 1 se, e somente se, o evento A ocorrer nas n repetições do experimento E 3) fA = 0 se, e somente se, o evento A não ocorrer nas n repetições do experimento E 4) se A e B são eventos mutuamente excludentes, então fAUB = fA + fB 1.5.2 Interpretações de Probabilidade Quando um experimento é repetido n vezes, e n se torna grande surgirá uma regularidade de ocorrência de um evento A, e sua frequência relativa será naturalmente a probabilidade do evento A, representada por P(A). O método da frequência relativa para atribuição de probabilidades é o processo adotado na ciência e engenharia. 20 𝑃(𝐴) = lim 𝑛→∞ 𝑓𝐴 Probabilidade é usada para quantificar a possibilidade ou a chance de ocorrência de um resultado de um experimento aleatório. Maior a certeza de ocorrer um ponto amostral quando o experimento é realizado, a probabilidade atribuída a ele se aproxima de 1. Maior a certeza de não ocorrer um ponto amostral quando o experimento é realizado, a probabilidade atribuída a ele se aproxima de 0. Um zero indica que um resultado não ocorrerá. Uma probabilidade de 1 indica que um resultado ocorrerá com certeza. 1.5.3 Princípios de Probabilidade Para determinar a probabilidade de um evento A, P(A), somamos todas as probabilidades atribuídas aos pontos amostrais de A. Dado um espaço amostral S, a probabilidade de um evento A, P(A), é uma função definida em S, que associa ao evento um número real, satisfazendo os seguintes princípios: I. 0 ≤ P(A) ≤ 1 II. P(S) = 1 para todo ponto amostral em S, atribuímos uma probabilidade de modo que a soma de todas as probabilidades seja 1. III. Se A e B são eventos mutuamente excludentes (A ∩ B = ): P(A U B) = P(A) + P(B), ou seja, a probabilidade de que pelo menos um evento ocorra é a soma das probabilidades da ocorrência dos eventos individuais. Exemplo 4: Os princípios anteriores são suficientes para deduzir todas as propriedades de uma função de probabilidade. Verifique as propriedades: I. P() = 0 – Para pontos fora do espaço amostral, a probabilidade atribuída a eles é 0. II. P( A ) = 1 – P(A) III. Se A B então P(A) ≤ P(B) IV. Se A e B são dois eventos quaisquer, então P(A U B) = P(A) + P(B) – P(A ∩ B) 1.6 Probabilidades Finitas dos Espaços Amostrais Finitos Consideremos o seguinte exemplo: três cavalos, A, B e C estão em uma corrida; A tem duas vezes mais probabilidade de ganhar que B, e B tem duas vezes mais probabilidade de ganhar que C. Quais são as probabilidades de vitória de cada um, isto é, P(A), P(B) e P(C)? Fazendo P(C) = p, então P(B) = 2 P(C) = 2p e P(A) = 2 P(B) = 4p; como a soma das probabilidade é igual a 1, temos: p + 2p + 4p = 1 então p = 1/7. Logo, P(A) = 4 p = 4/7; P(B) = 2 p = 2/7; e P(C) = p = 1/7 1.7 Espaços Amostrais Finitos Equiprováveis Em muitos experimentos os pontos amostrais têm iguais probabilidades (jogar moeda ou dados, por exemplo). 21 Um espaço amostral é chamado equiprovável quando associamos a cada ponto amostral a mesma probabilidade, ou seja, se S contém “n” pontos amostrais, a probabilidade de cada ponto amostral será n 1 . Por outro lado, se um evento A associado a S contém “r” pontos amostrais, então n r n rAP 1 )( . Exemplo, ao jogar um dado equilibrado a probabilidade da face superior ser 6 é 6 1 e ao escolher aleatoriamente uma carta de um baralho com 52 cartas a probabilidade da carta ser de ouros é 52 13 52 1 13 x . A expressão “aleatória” nos indicará que o espaço é equiprovável. Ou seja, selecionar aleatoriamente implica que, em cada etapa da amostragem, os itens são igualmente prováveis de serem selecionados. Para listar os pontos amostrais de um espaço amostral finito que fornece o maior número de informações construímos o diagrama de árvore. Exemplo 5: Jogue uma moeda. Se der cara jogue a moeda novamente e se der coroa jogue um dado. Construa o diagrama de árvore para representar o espaço amostral desse experimento estatístico. 1.8 Probabilidade Condicional Exemplo 6: Em um total de 400 itens fabricados 10% dos itens contêm falhas visíveis na superfície (evento F) e 25% dos itens com falhas na superfície são itens funcionalmente defeituosos. Entretanto, somente 5% dos itens sem falhas na superfície são defeituosos. Falha na superfície Sim (evento F) Não (evento F’) Total Defeituoso Sim (evento D) Não (evento D’) Total 400 Calcule, a partir da tabela acima, probabilidade P(D/F) e P(D/F’). Solução: A probabilidade de um item defeituoso (evento D) depende do nosso conhecimento da presença ou ausência de uma falha na superfície. Portanto, representando por P(D/F) a 22 probabilidade de D ocorrer dado que (ou considerando que) F ocorreu, temos P(D/F) = 0,25 e P(D/F’) = 0,05. Probabilidade condicional Dados dois eventos A e B associados a um experimento aleatório, define-se a probabilidade condicional de A, sabendo-se que B ocorreu, por P(A/B), como sendo , / / / BP BAP nn nn n n BAP B AB B AB P(B) 0, pois B já ocorreu. Assim, P(A B) = P(A/B).P(B) Onde, n é o número de experimentos, nAB é o número de resultados que ambos A e B ocorreram, nB é o número de resultados que B ocorreu. Dado que B ocorreu, a frequência relativa de A é nAB / nB. O diagrama em forma de árvore pode ser empregado para dispor as probabilidades condicionais. Segue diagrama em árvore para a tabela anterior. 1.9 Independência Estatística Dois eventos A e B são independentes se, e somente se, P(A/B) = P(A), ou seja, P(A∩B) = P(A).P(B), então, a probabilidade de ocorrência simultânea de A e B depende somente das probabilidades associadas aos eventos individuais. Portanto, a ocorrência ou não ocorrência de um evento não afeta a ocorrência ou não ocorrência do outro. Dados n eventos A1, A2, .. , An; eles são independentes se eles são independentes 2 a 2, 3 a 3, ..., n a n. Exemplo 7: Sendo S = {1, 2, 3, 4} um espaço amostral equiprovável e A = {1, 2}, B = {1. 3} e C = {1, 4} três eventos de S. Verificar se os eventos A, B e C são independentes. 23 Exemplo 8: Dois dados são lançados. Consideremos os eventos: A = {(x1, x2)/x1+x2 = 10} e B = {(x1, x2)/x1 > x2}. Calcular P(A), P(B), P(A/B) e P(B/A). Exemplo 9: Em lote de 12 peças das quais 4 são defeituosas, 2 peças são retiradas uma após a outra sem reposição. Qual a probabilidade de que ambas sejam boas? Exemplo 10: Em lote de 10 peças das quais 4 são defeituosas, 2 peças são retiradas uma após a outra com reposição. Qual a probabilidade de que ambas sejam boas? 1.10 Regras Aditivas Se A e B são dois eventos, então: P(A U B) = P(A) + P(B) – P(A ∩ B). Se A e B são eventos mutuamente excludentes, então: P(A U B) = P(A) + P(B). Para 3 eventos A, B e C: P(A U B U C) = P(A) + P(B) + P(C) – P(A ∩ B) – P(A ∩ C) – P(B ∩ C) + P(A ∩ B ∩ C) Para n eventos: 𝑃 (⋃ 𝐴𝑗 𝑛 𝑗=1 ) = ∑ 𝑃(𝐴𝑗 𝑛 𝑗=1 ) − ∑ ∑ 𝑃(𝐴𝑖 ∩ 𝐴𝑗) + ⋯ − (−1) 𝑛−1𝑃(𝐴1 ∩ 𝐴2 ∩ … ∩ 𝐴𝑛 𝑛 𝑗=2 𝑛 𝑖=1 ) Para n eventos mutuamente excludentes:P(A1 U A2 U ... U An) = P(A1) + P(A2) + ... + P(An) Exemplo 11: [Walpole, et al] A probabilidade de que uma indústria norte-americana será localizada em Xangai, na China, é de 0,7; a probabilidade de que será localizada em Pequim, China, é de 0,4; e a probabilidade de que será localizada em Xangai ou em Pequim, ou em ambos os lugares, é de 0,8. Qual é a probabilidade de que a empresa seja localizada em (a) ambas as cidades? (R. 0,3) (b) em nenhuma das cidades? (R. 0,2) 1.11 Regras Multiplicativas Se A e B são dois eventos, então: P(A ∩ B) = P(A).P(B|A), desde que P(A) > 0. Se A e B são dois eventos independentes, então: P(A ∩ B) = P(A).P(B). Para n eventos: P(A1∩A2∩...∩An) = P(A1).P(A2|A1). P(A3|A1∩A2). ... .P(An|A1∩A2∩A3∩...∩An-1). Para n eventos independentes: P(A1∩A2∩...∩An) = P(A1).P(A2). P(A3). ... .P(An). Exemplo 12: [Walpole, et al] Um sistema elétrico consiste em quatro componentes, como ilustrado na figura a seguir. O sistema funciona se ambos os componentes A e B funcionarem e se ou o componente C, ou D, ou ambos funcionarem. A confiabilidade (probabilidade de funcionamento) de cada componente é mostrada na figura. Determine a probabilidade de que o sistema funcione por completo. (R. 0,7776) 24 1.12 Teorema de Bayes Sejam A e B dois eventos arbitrários com P(A) 0 e P(B) 0. Então )( )(/ / AP BPBAP ABP 1.13 Teorema da probabilidade total Dizemos que os eventos B1, B2, ..., Bn representam uma partição do espaço amostral S, quando a) B1, B2, ..., Bn são eventos mutuamente excludentes, ou seja, n i iB 1 b) B1, B2, ..., Bn são eventos exaustivos, ou seja, SB n i i 1 c) P(Bi) > 0 para todo i. d) P(B1 U B2 U ... U Bn) = P(B1) + P(B2) + ... + P(Bn) = 1 Ou seja, quando um experimento E é realizado um, e somente um, dos eventos B ocorre. Então, para um evento arbitrário A referente a S, podemos escrever: )(...)()()( ... 21 21 n n BAPBAPBAPAP BABABAA Substituindo as probabilidades de interseção pela probabilidade condicional, obtemos a expressão que traduz o teorema da probabilidade total: P(A) = P(A/B1)P(B1) + P(A/B2)P(B2) + ... + P(A/Bn)P(Bn) B7 B2 B1 B3 B4 B5 B6 B8 B9 A 25 Exemplo 13: Consideremos um lote de 20 peças defeituosas e 80 não defeituosas, do qual extrairemos duas peças sem reposição. Sendo A o evento que representa a 1ª peça defeituosa e B o evento que representa a 2ª peça defeituosa, calcular: P(A); P(B); P(A|B). Exemplo 14: [Walpole, et al] Um saco contém 4 bolas brancas e 3 pretas, e um segundo saco contém 3 bolas brancas e 5 pretas. Uma bola é retirada do 1º saco e colocada no 2º sem ser vista. Qual é a probabilidade de que uma bola, selecionada depois do 2º saco, seja preta? (R. 38/63) Exemplo 15: Um canal de comunicação binária simples transmite mensagens utilizando apenas dois sinais, digamos 0 e 1. Supondo que: a) o sinal 1 seja transmitido 40% das vezes; b) a probabilidade de um 0 transmitido ser recebido corretamente é 0,90; c) a probabilidade de um 1 transmitido ser recebido corretamente é 0,95. Determine: A probabilidade de um 1 ser recebido Dado que um 1 é recebido, a probabilidade de 1 ter sido transmitido. Exemplo 16: Falhas em semicondutores. Suponha as seguintes probabilidades para falha no produto sujeito a níveis de contaminação na fabricação: Probabilidade de falha Nível de contaminação 0,10 Alto 0,01 Médio 0,001 Baixo Em uma batelada particular de produção, 20% dos chips estão sujeitos a níveis altos de contaminação, 30% a níveis médios de contaminação e 50% a níveis baixos de contaminação. Qual é a probabilidade de um produto falhar ao usar um desses ships? 1.14 Exercícios 1) A teoria da confiabilidade estuda sistemas e seus componentes. O sistema funciona se seus componentes ligados em série funcionam simultaneamente e o sistema em paralelo funciona se pelo menos um de seus componentes funciona. Para o sistema da figura a seguir seus componentes funcionam independentemente. Calcule a confiabilidade do sistema. 0,90 0,92 0,84 0,85 a b 26 2) Um lote é formado por 10 peças boas, 5 peças com defeitos e 1 peça com defeito grave. Retiram-se 2 peças ao acaso. Qual a probabilidade de que: a) ambas sejam perfeitas; b) pelo menos uma seja perfeita; c) nenhuma tenha defeito grave; d) nenhuma seja perfeita. 3) Amostras de plástico policarbonato são analisadas com relação à resistência a arranhões e choque. Os resultados de 100 discos estão resumidos a seguir. Resistência a choque Alta Baixa Resistência a arranhão Alta 80 9 Baixa 6 5 Faça “A” denotar o evento em que um disco tem alta resistência a choque e faça “B” denotar o evento em que um disco tem alta resistência a arranhões. Determine a probabilidade dos eventos: 𝐴 ∩ 𝐵; 𝐴 ∪ 𝐵; �̅�; 𝐴 ∩ �̅� 4) A tabela a seguir resume a análise de amostras de aço galvanizado, para peso de recobrimento e rugosidade da superfície. Peso do recobrimento Alto Baixo Rugosidade da superfície Alta 12 16 Baixa 88 34 a) Se o peso de recobrimento de uma amostra for elevado, qual será a probabilidade da rugosidade da superfície ser elevada? b) Se rugosidade da superfície de uma amostra for elevada, qual será a probabilidade do peso de revestimento ser elevado? c) Se a rugosidade da superfície de uma amostra for baixa, qual será a probabilidade do peso de recobrimento ser elevado? 5) O Distúrbio de hiperatividade com déficit de atenção, DHDA, é uma desordem que afeta entre 3 a 10% das crianças em idade escolar. Assumindo que essa probabilidade seja 6,6%, estimar: a) A probabilidade de que, entre duas crianças em idade escolar escolhidas ao acaso, as duas apresentem DHDA. b) Uma criança escolhida ao acaso não apresente DHDA. c) Duas crianças escolhidas ao acaso não apresentem DHDA. d) Em duas crianças escolhidas ao acaso, uma apresente DHDA. e) No caso anterior, pelo menos uma apresente DHDA. 6) Dados divulgados sobre os 30 maiores fundos de ações e de investimentos diversificados apresentaram a rentabilidade percentual para aplicações de um ano e de cinco anos, respectivamente, correspondentes ao período com vencimento em 31 de março de 2000 (The Wall Street Journal, 10 de abril de 2000). Suponha que 27 consideremos elevada uma rentabilidade superior a 50%, para aplicações de um ano e que consideremos também elevada uma rentabilidade acima de 300%, para aplicações de 5 anos. Nove dos fundos tiveram rentabilidade acima de 50% para aplicações de um ano, sete dos fundos tiveram rentabilidade acima de 300%, para aplicações de cinco anos, e cinco dos fundos tanto tiveram rentabilidade acima de 50% para aplicações de um ano, como rentabilidade acima de 300% para aplicações de cinco anos. a) Qual é a probabilidade de haver uma rentabilidade elevada para aplicações de um ano, e qual é a probabilidade de rentabilidade elevada para aplicações de cinco anos? b) Qual é a probabilidade de rentabilidade elevada tanto para aplicações de um ano como para aplicações de cinco anos? c) Qual é a probabilidade de não haver rentabilidade elevada para aplicações de um ano nem para aplicações de cinco anos? 7) Descreva o espaço amostral para cada um dos seguintes experimentos: a) Sabe-se que um lote de 120 tampas de baterias para marca-passos contém um certo número de tampas defeituosas por causa deum problema com o material de isolamento aplicado.Três tampas são aleatoriamente selecionadas (sem reposição) e são cuidadosamente inspecionadas. b) Sabe-se que uma forma com 10 peças contém uma unidade defeituosa e nove unidades boas. Quatro peças são aleatoriamente selecionadas (sem reposição) e inspecionadas. 8) Suponha que, em um levantamento de dados, uma determinada população foi classificada de acordo com uma das características abaixo: P1 Heterossexuais 63% P2 Homossexuais 18% P3 Hemofílicos 5% P4 Usuários de drogas injetáveis 14% Imagine ainda que levantamentos estatísticos anteriores permitiram presumir que o risco de transmissão do HIV entre os heterossexuais é da ordem de 2,3%; entre a população homossexual 9,3%; entre os hemofílicos 12%; e entre os usuários de drogas 17,1%. Com estas informações, determine a probabilidade de: a) transmissão do HIV; b) a chance de um HIV+ ser proveniente do grupo de heterossexuais. 9) Sejam P(A B) = 0,75 e P(AB) = 0,25. Determine P(A) e P(B), se A e B são independentes. 10) Apenas uma em cada dez pessoas de uma população tem tuberculose. Das pessoas que têm tuberculose 80% reagem positivamente ao teste Y, enquanto apenas 30% dos que não têm tuberculose reagem positivamente. Uma pessoa da população é 28 selecionada ao acaso e o teste Y é aplicado. Qual a probabilidade de que essa pessoa tenha tuberculose, se reagiu positivamente ao teste? 11) Três máquinas, A, B e C produzem respectivamente 40%, 50% e 10% do total de peças de uma fábrica. As porcentagens de peças defeituosas nas respectivas máquinas são 3%, 5% e 2%. Uma peça é sorteada ao acaso e verifica-se que é defeituosa. Qual a probabilidade de que a peça tenha vindo da máquina B? 12) Uma aula de estatística avançada tem dez estudantes do primeiro ano, 30 do último ano e dez formados. O resultado final mostra que três dos alunos do primeiro ano, dez do último ano e cinco dos formados receberam um A pelo curso. Se um estudante for escolhido aleatoriamente nessa aula e for sabido que ele recebeu um A, qual é a probabilidade de que seja um aluno do último ano? 13) Consumidores são usados para avaliar projetos iniciais de produtos. No passado, 95% dos produtos altamente aprovados recebiam bons conceitos, 60% dos produtos moderadamente aprovados recebiam bons conceitos e 10% dos produtos ruins recebiam bons conceitos. Além disso, 40% dos produtos tinham sido altamente aprovados, 35% moderadamente aprovados e 25% tinham sido produtos ruins. a) Qual é a probabilidade de um produto atingir um bom conceito? b) Se um novo projeto atingir um bom conceito, qual será a probabilidade de que ele será um produto altamente aprovado? 14) Uma nave espacial tem 1.000 componentes em série. Se a confiabilidade da nave deve ser de 0,9, e se todos os componentes têm o mesmo grau de confiabilidade, qual deve ser a confiabilidade de cada componente? (R: 0,999895) 15) Uma indústria automobilística está preocupada com um possível recall de seu sedã 4 portas mais vendido. Se houver um recall, há 0,25 de probabilidade de que o defeito seja no sistema de freios; 0,18 de que seja na transmissão; 0,17 de que seja no sistema de combustível e 0,40 de que seja em alguma outra parte. a) Qual é a probabilidade de que o defeito esteja nos freios ou no sistema de combustível, se a probabilidade de defeitos em ambos os sistemas, simultaneamente, é de 0,15? b) Qual é a probabilidade de que não haja defeitos nem no sistema de freios nem no sistema de combustível? 29 Capítulo 2: VARIÁVEIS ALEATÓRIAS DISCRETAS 2.1 Introdução O interesse no estudo de um fenômeno aleatório reside em afirmações sobre os eventos que podem ocorrer; essas afirmações são feitas com base em probabilidades atribuídas a resultados simples. Nosso interesse agora é estabelecer um processo aritmético para facilitar essas afirmações. Para isso o primeiro passo consiste em representar por um número real cada um dos resultados possíveis de um experimento aleatório e assim substituir sua descrição qualitativa por uma quantitativa, por exemplo: quando os resultados possíveis de um experimento são sucesso e fracasso, atribuímos arbitrariamente a esses eventos os números 1 e 0, respectivamente. Então o espaço amostral [0,1] tem 0 e 1 como pontos amostrais em lugar de fracasso e sucesso. Isso possibilitará a utilização de meios aritméticos para o cálculo de probabilidades e utilizar espaços amostrais associados a muitos experimentos aleatórios de interesse já constituídos de conjuntos de números reais não equiprováveis. 2.2 Variáveis aleatórias Sejam E um experimento e S o espaço amostral associado ao experimento. Uma função X, que associe a cada elemento s S um número real, X(s), é denominada VARIÁVEL ALEATÓRIA (V.A.). Ou seja, uma variável aleatória é uma função que atribui um número real a cada resultado no espaço amostral de um experimento aleatório. A variável aleatória X é uma função unívoca, ou seja, a cada s S corresponderá exatamente um valor X(s). Diferentes valores de s podem levar ao mesmo valor de X. Notação: Uma variável aleatória é denotada por uma letra maiúscula, tal como X. Depois de um experimento ser conduzido, o valor medido da variável aleatória é denotado por uma letra minúscula x, tal como x = 70 mm. Exemplo 1: Dados: E: lançamento de duas moedas e observação da face superior Então, S = {(c,c), (c,k), (k,c), (k,k)} Seja X: nº de caras (k) obtidas nas duas moedas Portanto, x = 0, 1, 2 Seja A = {(c,k), (k,c)}, como A S, então:𝑃(𝐴) = 𝑛𝐴 𝑛𝑆 = 2 4 = 1 2 s S Rx x=X(s) X 30 Similarmente, temos que a probabilidade de x=1 é: 2 1 )1( XP Definição: Sendo A um evento no domínio S e B um evento no contradomínio RX, definimos P(B) = P(A), onde A = {s S | X(s) B} Admitindo que probabilidades possam ser associadas a eventos em S, então, a definição torna possível atribuir probabilidades a eventos associados a RX em termos de probabilidades definidas sobre S. Assim, para o exemplo 1, lançamento de duas moedas tem: P(X = 0) = P((c,c)) = ¼ P(X = 1) = P((c,k),(k,c)) = ½ P(X = 2) = P((k,k)) = ¼ Usando a aritmética podemos calcular essas probabilidades: 2 1, 0, x para , 4 1 )( 2 x xp Uma variável aleatória X será DISCRETA se o número de valores possíveis de X (seu contradomínio) for finito ou infinito numerável (contável). Isto é, os valores possíveis de X, podem ser postos em lista como x1, x2,...,xn. Caso contrário será CONTÍNUA, ou seja, seu contradomínio é um intervalo real a < x < b (onde a e b podem ser -∞ e +∞, respectivamente). 2.3 Variáveis aleatórias discretas Seja X uma V.A. discreta. Portanto, RX, o contradomínio de X, será formado no máximo por um número infinito numerável de valores x1, x2,... A cada possível resultado xi associaremos um número p(xi) = P(X = xi), denominado probabilidade de xi. Os números p(xi), i = 1, 2, ... devem satisfazer às seguintes condições: a) p(xi) ≥ 0 para todo i, b) 1 .1)()( i i SPxp A função p(x) é denominada função de probabilidade (fp) da variável aleatória X. A coleção de pares [xi,p(xi)], i = 1, 2,..., é denominada distribuição de probabilidade da V.A. X. p(x) pode ser expressa por uma tabela, gráfico ou fórmula. Exemplo 2: Para o exemplo 1 tem-se Tabela: Gráfico: x 0 1 2 p(x) 1/4 1/2 1/4 p(x) x 0 1 2 1/2 1/4 31 Fórmula: , 41 )( 2 x xp para x = 0, 1, 2 Qualquer função de uma variável aleatória é uma variável aleatória, isto é, se X é uma V.A. Y = f(X) é também uma V. A. Exemplo 3: Suponha que uma válvula eletrônica seja posta num soquete e ensaiada. Admita que a probabilidade de que o ensaio seja positivo seja ¾ e que a condição de uma válvula não influencia a condição de outra. Admita também que seja ensaiada uma partida grande dessas válvulas. Os ensaios continuam até que a primeira válvula positiva apareça. Determine a distribuição de probabilidade da variável aleatória que representa o número de testes necessários para concluir o experimento. Exemplo 4: (Fonseca, p.29) Uma variável aleatória discreta X tem a distribuição de probabilidade dada por: 7 5, 3, 1, xpara )( x K xp . Determine o valor de K e P(X = 5). Exemplo 5: (Bussab e Morettin, p.128) O ponteiro dos segundos de um relógio mecânico pode parar a qualquer instante por defeito técnico, e vamos indicar por X o ângulo que este ponteiro forma com o eixo imaginário, passando pelo centro do relógio e pelo número XII, conforme mostra a figura a seguir. Medindo este ângulo X em graus, e lembrando que: a) O ponteiro deve dar 60 “saltos” (ele dá um salto em cada segundo) para completar uma volta; b) O ponteiro tem probabilidade igual de parar em qualquer ponto. Determine a função de probabilidade da variável aleatória discreta X. (Resposta: 𝑝(𝑥) = 1 60 , 𝑝𝑎𝑟𝑎 𝑥 = 6, 12, 18, … , 60º) 2.4 Função de distribuição de probabilidade (fd) Seja X uma variável aleatória discreta. Define-se a função F como a função de distribuição de probabilidade da variável aleatória X como sendo a probabilidade de que X assuma um valor menor ou igual a x, isto é, F(x) = P(X x). Cálculos: 32 a) xx i i i xpxF 1 )()( , portanto, a fd pode ser interpretada como a probabilidade associada ao ponto x e a todos os pontos à esquerda de x; b) )()()()( 1 iiii xFxFxXPxp Propriedades da função de distribuição acumulada: a) F(-) = 0 b) F(+) = 1 c) P(a X b) = F(b) – F(a) d) P(a X b) = F(b) – F(a) + P(X = a) e) P(a < X < b) = F(b) – F(a) - P(X = b) Exemplo 6: Para o exemplo 1 e 2 tem-se 4 1 )0()()0()0( 0 1 pxpXPF ix i i 4 3 2 1 4 1 )1()0()()1()1( 1 1 ppxpXPF ix i i 1 4 1 2 1 4 1 )2()1()0()()2()2( 2 1 pppxpXPF ix i i Qual a probabilidade de ocorrem 1 cara ou 2 caras? 4 3 2 1 4 3 1)1()1()2()21()21( XPFFXPXXP Exemplo 7: Considere que a variável aleatória X tome os valores 0, 1 e 2, com probabilidades 1/3, 1/6 e 1/2, respectivamente. Determine a F(x) e construa os gráficos de p(x) e F(x). Exemplo 8: Considere o exemplo 5. Determine a função de distribuição acumulada da variável aleatória discreta X e calcule F(10º). 2.5 Valor esperado de uma VAD (variável aleatória discreta) Genericamente, o valor esperado de uma VAD X é dado por: 1 )()( i ii xpxXE x 0 1 2 p(x) 1/4 1/2 1/4 F(x) x 0 1 2 1/2 1/4 3/4 1 Prop. a) fd Prop. b) 33 Obs.: a) para um número finito de termos, E(X) corresponde à média dos possíveis valores de X, ponderada pelos pesos p(x); b) se todos os pesos forem iguais, E(X) é a própria média aritmética dos possíveis valores de X. Exemplo 9: (Ross, 1976, p.184) Um dado equilibrado é lançado várias vezes. Seja X uma VAD representando a face de cima em cada repetição (note que X = 1,2,...,6). Qual o valor esperado de X nessas repetições? Exemplo 10: (Meyer, 1976, p.140) Um grande lote de peças é produzido. Cada peça tem probabilidade 0,9 de ser perfeita e 0,1 de ser defeituosa. Lucra-se $ 5 por peça produzida perfeita e $ -1 se ela for defeituosa. Quanto espera-se lucrar por peça com esse lote? 2.6 Valor esperado de uma função de VA Discreta Seja X uma VA com distribuição conhecida, e Y = H(x) uma função de X. Calcular o valor esperado de Y, E(Y): 1 )()())(()( i ii xpxHXHEYE Exemplo 11: Seja X o número de bits com erro transmitido nos próximos 4 bits transmitidos. As probabilidades para esses erros são P(X = 0) = 0,6561, P(X = 1) = 0,2916, P(X = 2) = 0,0486, P(X = 3) = 0,0036 e P(X = 4) = 0,0001. A variável Y representa o quadrado do número de bits com erro. Determine o valor esperado de Y. Solução: (R. 0,52) x 0 1 2 3 4 y p(x) 0,6561 0,2916 0,0486 0,0036 0,0001 y.p(x) 2.7 Propriedades do valor esperado I. Se C é uma constante, então E(C) = C II. Se Y=CX, em que C é uma constante e X é uma VA, então E(Y)=E(CX)=CE(X) III. Se Z=X+Y, em que X e Y são VA, então E(Z)=E(X)+E(Y) IV. Se Z=AX+B, em que A e B são constantes, então E(Z)=AE(X)+B Exemplo 12: Uma moeda é lançada n vezes. Em cada lançamento, a probabilidade de sair cara é constante e igual a p. Qual o número de caras esperado nos n lançamentos? 34 2.8 Variância de VAD Para uma mesma VAD X, podemos obter um mesmo valor esperado E(X) para diferentes distribuições de X. Veja figura a seguir. Para distinguir essas diferentes situações, introduzimos o conceito de variância, que mede o grau de “compactação” ou grau de “dispersão” dos dados em torno do valor esperado E(X), definida por: 222 )()(]))([()( XEXEXEXEXV 2 11 222 ))(()()()()( i ii i ii xpxxpxXEXEXV A variância V(X) é expressa em unidades quadradas de X. Assim, para os casos de medidas de componentes em mm, a variância V(X) é expressa em mm². Para expressar a dispersão dos dados em unidades iguais as de X, define-se o desvio padrão como a raiz quadrada da variância: )()( XVX Exemplo 13: (Meyer, 1983, p.158) Uma estação metereológica me 11 graus de nebulosidades do céu, X = 0, 1, 2,..., 10, com as probabilidades 0,05, 0,15, 015, 0,06, 0,06, 0,06, 0,06, 0,06, 0,15, 0,15, 0,05, respectivamente. Os graus extremos X=0 e X=10 correspondem, respectivamente, a um céu completamente aberto e um completamente fechado. Determine E(X), V(X) e σ(X). 2.9 Propriedades da variância I. Se C é uma constante, então V(C) = 0 II. Se Y=CX, em que C é uma constante e X é uma VA, então V(Y)=V(CX)=C²V(X) III. Se Z=X+Y, em que X e Y são VA independentes, então V(Z)=V(X)+V(Y) IV. Se Z=AX+B, em que A e B são constantes, então V(Z)=A²V(X)+0 Exemplo 14: Considere o exemplo 12. Qual a variância do número de caras X obtido em n lançamentos? 35 2.10 Coeficiente de variação No exemplo 13 observamos que os desvios padrões são muito altos se comparados com E(X) e com o intervalo de variação de X. Em situações em que conhecemos E(X) e V(X) e não conhecemos a distribuição de X (isto é, p(x)), podemos ter uma ideia da dispersão dos dados em relação ao valor esperado. Dados muito dispersos são pouco precisos, ou seja, quanto maior é a variância dos dados menor é a precisão. Por definição, o coeficiente de variação é a razão entre o desvio-padrão e o valor esperado. Normalmente expresso em porcentagem. )( )( XE x CV Como regra geral, experimentos feitos em laboratório não devem ter CV muito maior que 10%. Experimentos “de campo” têm CV em torno de 30%. 2.11 Exercícios 1) Dada a função da variável aleatória X a seguir: 𝑝(𝑥) = 𝑐(𝑥2 + 4), 𝑝𝑎𝑟𝑎𝑥 = 0, 1, 2, 3. Determine: a) c de modo que p(x) seja uma função de probabilidade. b) O valor esperado, a variância e a função de distribuição acumulada de X. 2) Dada a função da variável aleatória X a seguir: 𝑝(𝑥) = 𝑘 ( 2 𝑥 ) ( 3 3 − 𝑥 ) , 𝑝𝑎𝑟𝑎 𝑥 = 0, 1, 2. Determine: a) k de modo que p(x) seja uma função de probabilidade. b) O valor esperado e a variância de X. 3) Uma aula de estatística avançada tem dez estudantes do primeiro ano, 30 do último ano e dez formados. O resultado final mostra que três dos alunos do primeiro ano, dez do último ano e cinco dos formados receberam um A pelo curso. Se um estudante for escolhido aleatoriamente nessa aula e for sabido que ele recebeu um A, qual é a probabilidade de que seja um aluno do último ano? 4) A quantidade de chips de memória, M, necessária num computador pessoal depende do número de aplicativos, X, que o proprietário pretende executar simultaneamente. Suponha que a distribuição de probabilidade de X, P(X), de todos os proprietários seja determinada por, com a expectativa incluindo obviamente todos os proprietários: P(X) = k (7,5 – x), x = 1, 2, 3, 4 Determine: a) O valor de k. 36 b) A quantidade esperada e a variância de X. c) A função de distribuição acumulada de X. 5) Examinaram-se 2.000 ninhadas de 5 porcos cada uma, segundo o número de machos. Os dados estão representados na tabela a seguir: Nº machos 0 1 2 3 4 5 Nº ninhadas 20 360 700 680 200 40 Determine a esperança e a variância da variável aleatória discreta que descreve a quantidade de machos. 6) A variável aleatória X assume os valores 1, 2 e 3 com probabilidades (1+3k)/3, (1+2k)/3 e (0,5+5k)/3, respectivamente. a) Encontre o valor apropriado de k; b) Encontre o valor esperado e a variância de X; c) Encontre a função de distribuição acumulada (FDP); d) Calcule P(X ≥ 2). 7) Um modelo teórico para a distribuição da variável aleatória X, que um empresário poderá usar para julgar a viabilidade econômica de um projeto que ele pretende realizar é dado pela tabela a seguir. a) Construa o gráfico da função de probabilidade de X (p(x)); b) Determine a função de distribuição acumulada de X (F(x)); c) Construa o gráfico da função de distribuição acumulada de X; d) Qual a probabilidade P(0 ≤ X ≤ 12)? e) Qual a probabilidade P(5 ≤ X ≤ 10)? x p(x) 15 0,56 10 0,23 5 0,02 -5 0,19 Total 1,00 8) Determine o valor esperado, a variância, o desvio padrão e o coeficiente de variação da variável aleatória discreta X da questão anterior. 9) Suponha que o número de carros X que passam por um lava-rápido entre 16 h e 17 h, numa sexta-feira ensolarada, tenha a seguinte distribuição de probabilidade: x 4 5 6 7 8 9 Soma P(X = x) 1/12 1/12 1/4 1/4 1/6 1/6 Seja Y = 2X – 1 a quantia (em dólares) paga ao atendente pelo gerente. Determine os ganhos esperados do atendente para esse período em particular, e a variância e o coeficiente de variação. 10) X é uma variável aleatória discreta, tal que a função distribuição de probabilidade é dada por: F(-2) = 0,3; F(0) = 0,5; F(1) = 0,6; F(2) = 0,8; F(5) = 1,0. a) Calcule a E(X) e V(X); 37 b) P(-1 ≤ x ≤ 4)? 11) Um empreiteiro vai entrar em uma concorrência, e o número de dias para completar o trabalho, X, segue a distribuição de probabilidade dada por p(x) = 0,1 x = 10, = 0,3 x = 11, = 0,4 x = 12, = 0,1 x = 13, = 0,1 x = 14, = 0 caso contrário. Determine: a) E(X), V(X) e o coeficiente de variação; b) Distribuição de probabilidade acumulada. 12) Suponha que X seja uma variável aleatória tal que E(X) = 3 e V(X) = 5. Se H(X) = 2 X – 7, determine E(X) e V(X). 13) A função de probabilidade para a soma dos valores obtidos no lançamento de dois dados pode ser escrita como 𝑝(𝑥) = 𝑥 − 1 36 𝑝𝑎𝑟𝑎 𝑥 = 2, 3, … , 6, = 13−𝑥 36 𝑝𝑎𝑟𝑎 𝑥 = 7, 8, … , 12 Determine a média e a variância da variável aleatória de X. 14) Um processo que fabrica anéis de pistão produz anéis cujos diâmetros, em centímetros, variam de acordo com as funções densidades de probabilidade: a) Produtor A: 𝑓(𝑥) = {3 [1 − 16(𝑥 − 10)2] 9,75 < 𝑥 < 10,25 0 𝑐𝑎𝑠𝑜 𝑐𝑜𝑛𝑡𝑟á𝑟𝑖𝑜 b) Produtor B: 𝑓(𝑥) = { 15[1 − 25(𝑥 − 10,05)2] 4 9,85 < 𝑥 < 10,25 0 𝑐𝑎𝑠𝑜 𝑐𝑜𝑛𝑡𝑟á𝑟𝑖𝑜 As especificações determinam que os diâmetros estejam entre 10,0 ± 0,1 cm. Qual processo é melhor? Justifique sua resposta indicando para cada processo, a porcentagem de anéis dentro da especificação. 38 Capítulo 3: MODELOS DE DISTRIBUIÇÃO DISCRETA 3. 1 Distribuição Uniforme Discreta Se a variável aleatória X assume os valores x1, x2, ..., xk com igual probabilidade, então a distribuição uniforme discreta é dada por: p(x) = 1/k, com x = x1, x2, ... , xk. A média e variância da distribuição uniforme discreta são: .))(( 1 V(X) e 1 )( 2 11 XEx k x k XE k i i k i i Exemplo 1: Um funcionário é escolhido de um grupo de 10 para supervisionar um projeto selecionando-se uma etiqueta aleatoriamente de uma caixa que contém 10 etiquetas numeradas de 1 a 10. Determine a fórmula para a distribuição de probabilidade de X, que representa o número na etiqueta selecionada. a) Qual é a probabilidade de que o número selecionado seja menor que 4? b) Determine a média e a variância da variável aleatória X. 3. 2 Distribuição Multinomial Considerando a possibilidade de k alternativas, ou seja, repartimos o espaço amostral em k eventos (A1, A2, ..., Ak) mutuamente exclusivos e exaustivos com probabilidades p1, p2, ..., pk, e, portanto, p1 + p2 + ... + pk=1. Considerando que n repetições do experimento inclui x1 ocorrências do evento A1, x2 ocorrências do evento A2, ... e xk ocorrências do evento Ak, com x1+x2+...+ xk = n, então o número de permutações distintas em n experimentos é dada por (significado: número de possibilidades de ocorrer k eventos em n repetições sem observar a ordem): !!...xx!x n! = k21,...,, 21 n xxx k Assim, em n experimentos, a probabilidade de que A1 ocorra x1 vezes, A2 ocorra x2 vezes, ..., Ak ocorra xk vezes é igual: kx k xx ppp .... !!...xx!x n! =) x,P(X 21 21 k21 ii Em que k i i k i i pnx 11 1 e Para cada classe i = 1,2,...,k, temos: Valor esperado: E(Xi) = npi Variância: V(Xi) = npi(1-pi) 39 Exemplo 2: Um dado é lançado 10 vezes. Qual a probabilidade de terem aparecido duas vezes o número 2, duas vezes o número 5, três vezes o número 1 e uma vez os demais resultados? 3. 3 Experimentos de Bernoulli Uma VAD X representa as saídas de um processo Bernoulli se apresenta as seguintes propriedades: a) Cada tentativa gera apenas dois resultados possíveis, sucesso e fracasso, mutuamente excludentes; b) Suas probabilidades permanecem constantes em todos os experimentos; c) O experimento envolve n repetições independentes e do mesmo tipo; Portanto, para um processo Bernoulli, podemos definir as seguintes variáveis aleatórias: Y – representa o número de sucessos em n tentativas; Z – representa o número de tentativas para r sucessos; e W – representa o número de sucessos em um intervalo contínuo (tempo, linear, área, volume, e outros). Exemplo: Y – representa o número depeças defeituosas em 25 peças produzidas; Z – representa o número de peças produzidas para ocorrerem 3 peças defeituosas; W – representa o número de peças produzidas com defeito em um turno de trabalho de 8 horas. 3. 4 Distribuição Binomial Uma VAD X tem distribuição binomial quando representa o número de sucessos em uma sequência de eventos Bernoulli. kx k xx ppp .... !!...xx!x n! =) x,P(X 21 21 k21 ii Para k = 2: 21 21 21 ii . !x!x n! =) x,P(X xx pp Como x1 + x2 = n e fazendo x1 = x x2 = n – x e p1 + p2 = 1 e fazendo p1 = p p2 = 1 – p )1( )( x)!-(nx! n! = x)P(X, pp xnx 40 Fazendo 1-p = q temos a explicação do nome binomial: é por que xnx n x qp é o termo de grau x em p no desenvolvimento pelo Binômio de Newton (q + p)n. Portanto, a função de probabilidade da distribuição binomial: xnx n x ppxp )1()( 0,10 e positivo e inteiro ãodistribuiç da parâmetros dois os são e ,...,2,1,0 pn pn nx Como a distribuição binomial é a soma de n experimentos Bernoulli temos que: Valor esperado: E(X) = n.p Variância: V(X) = n.p.(1-p) Função de distribuição de probabilidade (fd) da distribuição binomial: xm x xnx n x qpxF 0 )( . asuperior não inteiromaior o é xm Exemplo 3: Uma moeda não viciada é lançada 8 vezes. Encontre a probabilidade de: a) dar 5 caras; (R: 7/32) b) pelo menos 1 cara; (R: 255/256) c) no máximo 2 caras. (R: 37/256) Exemplo 4: Uma companhia aérea estima que 5% das pessoas que fazem reserva para determinado voo não comparecem. Consequentemente, sua política consiste em vender 84 bilhetes para um voo que só pode acomodar 80 passageiros. a) Qual a probabilidade de não sobrar nenhum dos passageiros que comparecem? b) Qual o número médio de não-comparecimentos? 3. 5 Distribuição geométrica Uma VAD X tem distribuição geométrica quando representa o número de provas em uma sequência de tentativas Bernoulli para a ocorrência do primeiro sucesso. Seja X a VAD número de repetições necessárias até obter um sucesso. Então, X pode tomar os valores 1, 2, ..., n. Representando o sucesso por 1 e o fracasso por 0, podemos escrever: X = 1 1 sucesso P(1) = p X = 2 1 fracasso e 1 sucesso P(2) = q.p X = 3 2 fracassos e 1 sucesso P(3) = q.q.p = q2.p X = x x-1 fracassos e 1 sucesso P(x) = qx-1.p Função de probabilidade da distribuição geométrica: ppxp x .)1()( 1 0,10 e positivo e inteiro ãodistribuiç da parâmetros dois os são e ,...,2,1 pn pn nx 41 Características da distribuição geométrica: Valor esperado: p XE 1 )( Variância: 2 )1( )( p p XV Função de distribuição de probabilidade (fd) da distribuição geométrica: x.asuperior não inteiromaior o é m onde 1 )()( ,portanto )...1(.)1(...).1(.)1()()( 1 1 121 1 1 1 m xm x mm xm x x xm x qxpxF qqqppppppppxpxF Exemplo 5: (Soong, 1986, p. 151): Um motorista vê uma vaga para estacionamento em uma rua. Há 5 carros na frente dele, e cada um tem uma probabilidade de 0,2 de tomar a vaga. Qual a probabilidade de a vaga ser tomada pelo carro imediatamente adiante dele? Exemplo 6: (Soong, 1986, p. 152): A probabilidade de um elemento falhar durante certo experimento é 0,1. Qual a probabilidade de serem necessários mais de 3 elementos para que um sobreviva ao experimento? 3. 6 Distribuição binomial negativa (Pascal) A distribuição binomial negativa é uma generalização da distribuição geométrica, em que o experimento é repetido até que ocorram r sucessos. A VAD X tem distribuição binomial negativa quando representa o número de provas de Bernoulli necessárias para a ocorrência do réssimo sucesso e tem sua distribuição de probabilidade dada por: ,...2,1, )1()( 1 1 rrrxppxp rxr x r Características da distribuição binomial negativa: Valor esperado: p r XE )( Variância: 2 )1( )( p pr XV Exemplo 7: (Meyer, 1983, p. 205): A probabilidade de sucesso de certo experimento é p = 0,8 em cada repetição. O experimento deve ser repetido até obter 4 sucessos. Qual a probabilidade de o experimento ser repetido 6 vezes? 42 Diferenciação entre as distribuições binomial e binomial negativa: Distribuição Binomial Binomial negativa Nº de sucessos VAD Conhecido Nº de repetições Conhecido VAD 3. 7 Distribuição hipergeométrica multivariada Dada uma população com N elementos com a possibilidade de k alternativas, ou seja, repartimos o espaço amostral em k eventos (A1, A2, ..., Ak), com a1, a2, ... , ak ocorrências, respectivamente. É extraída uma amostra desta população com n elementos, sem reposição. Se Xi é a VAD que representa o nº de elementos da classe i na amostra, então Xi tem distribuição hipergeométrica multivariada, cuja função de probabilidade é da dada por: ... ),,( 2 2 1 1 N n a x a x a x iii k k axXP Exemplo 8: (Walpole, 2009, p. 100): Um grupo de 10 indivíduos é usado para um estudo biológico de casos. O grupo tem três pessoas com tipo sanguíneo O, quatro com tipo A e três com tipo B. Qual é a probabilidade de que uma amostra aleatória de cinco contenha uma pessoa com tipo sanguíneo O, duas com tipo A e duas com tipo B? 3. 8 Distribuição hipergeométrica A distribuição hipergeométrica é um caso particular da distribuição hipergeométrica multivariada para k = 2. De uma população com N elementos é extraída uma amostra com n elementos, sem reposição. Para uma dada classe i, há r elementos na população (p = r / N). Se X é a VAD que representa o nº de elementos da classe i na amostra, então X tem distribuição hipergeométrica, cuja função de probabilidade é da dada por: ),(,...,2,1,0 )( nrmínxxp N n rN xn r x N r pnpXE com )( )1( ))(1( )( N nNpnp XV Exemplo 9: (Meyer, 1983, p. 207): Em um lote de 50 motores, 3 são defeituosos. Uma amostra de 5 motores é retirada aleatoriamente desse lote, sem reposição. O lote será 43 reprovado se 1 ou mais motores dessa amostra forem defeituosos. Qual a probabilidade de reprovação do lote? 3. 9 Distribuição de Poisson A distribuição de Poisson é uma distribuição discreta empregada em situações probabilísticas onde o intervalo de oportunidade de ocorrência de um evento é grande, mas a oportunidade de ocorrência em um intervalo particular (ou em um ponto) é muito pequena. (Fernando Nogueira). O modelo de Poisson é relevante no estudo de fenômenos: Biológicos – contagem de bactérias em uma lâmina de Petri Físicos – desintegração radioativa Sociais – bombardeio aéreo sobre Londres Para construir esse modelo, são assumidas as seguintes hipóteses: I. Os eventos relativos a intervalos não-sobrepostos constituem VA independentes, ou seja, as variáveis aleatórias
Compartilhar