Baixe o app para aproveitar ainda mais
Prévia do material em texto
31 © Tânia F Bogutchi – PUC Minas – Revisão em 2012 Estatística e Probabilidade Unidade 2: Distribuições de Probabilidade � O conteúdo dessa Unidade pode ser encontrado nos capítulos 3 e 4 do livro base: MONTGOMERY, Douglas C, RUNGER, George C. Estatística aplicada e Probabilidade para Engenheiros. 4ª edição. Rio de Janeiro: LTC, 2009 � As cópias desses capítulos podem ser requisitadas por meio da Pasta do Professor (www.pastadoprofessor.com.br), fazendo login nessa página e enviando-as para serem impressas na Copiadora Set (casa amarela) da Unidade do Coração Eucarístico, ou em alguma outra copiadora da Unidade a que o aluno pertence. Não deixem de ler! Algumas notas de aulas: Epictetus, Séc. II D.C , dizia que as aparências para a mente são de quatro tipos: • As coisas são o que parecem ser, • ou são e não parecem ser; • ou não são, mas parecem ser, • ou não são, nem parecem ser. Esses dizeres nos remetem à Estatística, por ser essa uma ciência que estuda fenômenos na presença de incertezas, ou seja, com variações causadas por mudanças imprevisíveis. A probabilidade é a base matemática sob a qual a Estatística é construída, pois fornece métodos para quantificar as situações imprevisíveis presentes no cotidiano. Na primeira unidade vimos alguns conceitos básicos de probabilidade os quais são necessários para a continuidade do próximo tópico. Primeiramente, retomamos o conceito de variável em Estatística: 1) Caracterização Estatística de Variáveis Muitos experimentos produzem resultados não-numéricos, mas para análise desses resultados é conveniente transformá-los em números. A regra que associa um valor numérico a cada ponto de um espaço amostral é denominada de VARIÁVEL ALEATÓRIA. Exemplo: Lançamento de duas moedas e observação das faces. Escrevendo: K= cara e C = coroa: O espaço amostral é: {KK, KC, CK, CC} Seja definida X, uma variável aleatória de interesse em observar caras: X = { número de caras} Então, a cada ponto do espaço amostral associaremos um número que é o valor assumido pela variável aleatória X: Evento KK KC CK CC X 2 1 1 0 32 © Tânia F Bogutchi – PUC Minas – Revisão em 2012 Estatística e Probabilidade Unidade 2: Distribuições de Probabilidade Dessa maneira, tomamos conhecimento dos valores possíveis que a variável aleatória X pode assumir, mas não sabemos a priori qual deles ocorrerá... Por outro lado, a cada um desses valores podemos associar a sua probabilidade de ocorrência: Obtém-se então uma distribuição de probabilidades a qual pode ser representada num gráfico: A variável aleatória X ficou completamente caracterizada pelos valores possíveis que assume e pela regra, ou função, que associa a cada um desses valores a sua probabilidade, ou seja, pelo par (x, p(x)). De maneira geral, os valores numéricos possíveis que uma variável aleatória assume podem ser provenientes de contagens ou de mensurações (medidas), e são, portanto, classificadas em dois tipos: a) Discretas – os valores numéricos são provenientes de contagens Exemplo: X: número de falhas ocorridos num determinado dia em um mecanismo eletrônico. X : { 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10} Seus valores podem ser enumerados, pois são pertencentes ao conjunto dos números naturais. b) Contínuas – provenientes de mensuração (medidas). Exemplo: X: tempo, em horas, gasto no atendimento em máquinas que falham num determinado dia. Valores de X 2 1 0 Probabilidade 1/4 1/2 1/4 210 0,5 0,4 0,3 0,2 0,1 0,0 x P (X = x) Distribuição de probabilidades de X: no. de caras no lançamento de 2 moedas 33 © Tânia F Bogutchi – PUC Minas – Revisão em 2012 Estatística e Probabilidade Unidade 2: Distribuições de Probabilidade Seus valores não podem ser enumerados. Podem assumir quaisquer valores da reta real, nesse exemplo, valores entre 0 e 24 (horas). A diferenciação do tipo de uma variável aleatória é necessária para a escolha das técnicas estatísticas adequadas. 2) Variáveis Aleatórias Discretas Considere o seguinte exemplo: O psicólogo de uma empresa ministrou um teste de personalidade para determinar características passivas/agressivas em 150 funcionários. Aos indivíduos foram atribuídos valores de 1 a 5, em que, 1 representava o extremo passivo e 5, o extremo agressivo. Um escore de 3 indicava não haver nenhuma característica preponderante. Os resultados constam do quadro a seguir. Estabelecer uma distribuição de probabilidade para a variável aleatória X. Escore (x) Frequência (f) Frequência Relativa [p(x)] 1 24 0,16 2 33 0,22 3 42 0,28 4 30 0,20 5 21 0,14 Total 150 1,00 Observe que: • O escore é uma classificação ordenada! • Cada valor da frequência relativa [p(x)] está entre 0 e 1 • A soma de todas as frequências relativas é igual a 1 sendo, portanto, uma probabilidade. O gráfico da distribuição de probabilidade, p(x): A área de cada bloco é igual à probabilidade de um resultado específico. Dessa maneira, é possível calcular, por exemplo, a probabilidade de um funcionário “ter uma pontuação dois ou três”, a qual é obtida pela soma das áreas do segundo e terceiro blocos. 0,00 0,05 0,10 0,15 0,20 0,25 0,30 1 2 3 4 5 x P( x ) 34 © Tânia F Bogutchi – PUC Minas – Revisão em 2012 Estatística e Probabilidade Unidade 2: Distribuições de Probabilidade Suponha, agora, que se queira representar esse grupo por uma característica central, ou seja, o escore médio. Valor Esperado A média de uma variável aleatória X é chamada de valor esperado ou esperança matemática, E(X), e é obtida considerando os valores possíveis ponderados por suas probabilidades, ou seja, Considerando os dados desse exemplo tem-se: x 1 2 3 4 5 Total p(x) 0,16 0,22 0,28 0,20 0,14 1,00 x.p(x) 0,16 0,44 0,84 0,80 0,70 2,94 E(X) Ou seja, escore médio obtido é 2,94. Ligeiramente abaixo de 3. Conclusão do teste: A característica de personalidade média não é nem extremamente passiva nem extremamente agressiva, mas ligeiramente próxima da passiva. A média, ou valor esperado de X, E(X) é o ponto de equilíbrio da massa de dados da variável aleatória X. Fisicamente, é o seu centro de massa. Variância e Desvio-padrão A medida de variabilidade é definida pela variância, a qual é obtida pela média dos quadrados das distâncias das observações em relação ao seu valor esperado, ponderado por suas respectivas probabilidades, ou seja, Se o somatório for expandido, pode-se obter a fórmula alternativa: Para preservar as medidas de tendência central e a de dispersão na mesma unidade de medida, é conveniente extrair a raiz quadrada da variância, a qual é denominada de desvio- padrão, dp(X). Em algumas literaturas, o desvio-padrão é representado pela letra s – do inglês standard deviation e a variância por s2. Voltando ao exemplo anterior, x 1 2 3 4 5 Total p(x) 0,16 0,22 0,28 0,20 0,14 1,00 x.p(x) 0,16 0,44 0,84 0,80 0,70 2,94 x2.p(x) 0,16 0,88 2,52 3,20 3,50 10,26 E(X2) Ou seja: Var(X) = 10,26 – (2,94)2 = 1,62 dp(X) = 62,1 = 1,27 ∑= )x(xP)X(E ∑ −= )x(P))X(Ex()X(Var 2 ( )22 )()()( XEXEXVar −= 35 © Tânia F Bogutchi – PUC Minas – Revisão em 2012 Estatística e Probabilidade Unidade 2: Distribuições de Probabilidade Propriedades do Valor Esperado e da Variância Sejam consideradas: a variável aleatória X e as constantes a e b. O valor esperado de X, E(x) possui as seguintespropriedades: 1) E(b) = b 2) E(a X) = a E(X) 3) E(a X ± b)= a E(X) ± b Analogamente, as propriedades da variância são: 1) Var(b) = 0 ; Var(X) ≥ 0 sempre! 2) Var(a X) = a2 Var(X) 3) Var(a X ± b)= a2 Var(X) Obs: O desvio-padrão segue as propriedades da variância, tomando-se o cuidado de primeiramente calcular a variância... Algumas variáveis, apesar de serem diferenciadas pelo seu contexto, possuem distribuição de probabilidades similares, ou seja, possuem mesmo comportamento matemático, mas são totalmente diferentes em essência. O exemplo anterior poderia representar uma distribuição de probabilidades da variável aleatória representada por X: número de defeitos apresentados em uma indústria de componentes eletrônicos durante certo dia e, nesse caso, 2,94 representaria a média de componentes eletrônicos diários. Para facilitar os cálculos, as variáveis aleatórias que possuem distribuições de probabilidades com mesmo comportamento matemático são agrupadas em modelos. 3) Modelos de distribuições discretas de probabilidades 3.1 ) Bernoulli São variáveis aleatórias discretas definidas pelos resultados de experimentos que possuem apenas dois resultados possíveis, designados por: • Sucesso (S) com probabilidade, P(S) = p , 0 < p < 1 • Fracasso (F) com P(F) = 1 – p Esse tipo de variável aleatória é chamada de “ensaio de Bernoulli”. Notação: X ~ Ber(p). A média e a variância de um “ensaio de Bernoulçli” é: E(X) = p e Var(X)= p(1-p) Exemplo: De acordo com uma tabela de vida, a probabilidade de uma pessoa, pertencente a um grupo com certas características, estar viva daqui a 30 anos é 40%. Uma pessoa desse grupo daqui a 30 anos: ou está viva com P(S)=p=0,4 ou não com P(F)=1- p=0,6. Em geral, o interesse de um pesquisador está em contabilizar a quantidade de vezes que um ensaio de Bernoulli ocorre, dessa maneira tem-se então uma nova distribuição de probabilidades, a Binomial. 3.2 ) Binomial Obtida por meio de num número fixo, n, de repetições independentes de ensaios de Bernoulli com probabilidade de sucesso, p, constante em cada ensaio. A variável aleatória X contabiliza o número de ensaios com sucesso. Exemplo: Cinco pessoas, com as características do exemplo acima de Bernoulli, compram apólices de seguro. Qual a probabilidade de nenhuma estar viva daqui a 30 anos? 36 © Tânia F Bogutchi – PUC Minas – Revisão em 2012 Estatística e Probabilidade Unidade 2: Distribuições de Probabilidade Solução: Seja definida a variável aleatória X: número de pessoas que estarão vivas daqui a 30 anos. Nenhuma estar viva significa que todos os ensaios falharam, ou seja, P(F,F,F,F,F) = P(F) P(F) P(F) P(F) P(F) =(1 – 0,40)5 = 0,605 = 0,078 (7,8%) Ou seja, P(X=0) = 0,078. E se porventura, for solicitada a probabilidade de que 2 dessas pessoas estejam vivas daqui a 30 anos? Solução: Uma possível seqüência para duas pessoas estarem vivas daqui a 30 anos pode ser representada como: SSFFF E sua probabilidade é: P(SSFFF) = P(S)P(S)P(F)P(F)P(F) = (0,4)2 (0,6)3 Observe que os expoentes desse resultado indica a existência de 2 sucessos e 3 fracassos! Mas, quantas seqüências com dois sucessos e três fracassos são possíveis? Então, para poder calcular essa probabilidade é preciso saber contar! •••• Princípio Fundamental da Contagem Um evento pode ocorrer de m maneiras e um segundo evento de n maneiras, o número de maneiras em que os dois eventos podem ocorrer em sequencia é m.n. Essa regra pode ser estendida para um número qualquer de eventos que ocorram em seqüência. Exemplo: Suponha que se queira comprar um carro novo. De quantas maneiras diferentes é possível selecionar um fabricante, um tamanho e uma cor. Considere: Fabricante: Ford, Chevrolet, Fiat Tamanho do carro: pequeno, médio Cores: branco (B), vermelho (V), preto (P), verde (Vd) Solução: Tem-se três fabricantes, dois modelos e quatro cores, então: 3 x 2 x 4 = 24 maneiras. Ou pelo desenho do diagrama em árvore para ajudar a “enxergar” a existência das 24 opções •••• Permutações Uma permutação é um arranjo ordenado de objetos. O número de permutações diferentes de n objetos diferentes é n! A expressão n! é lida “n fatorial” e definida por: n! = n.(n-1).(n-2)…….3.2.1 Caso especial: 0!=1 Exemplo: A fila inicial para um time de futebol tem 11 jogadores. De quantas maneiras diferentes pode-se definir a ordem dos jogadores? Solução: 11! = 11.10.9……3.2.1 = 39.916.800 maneiras diferentes de ordenar os jogadores. pequeno Ford médio B V P Vd B V P Vd pequeno Chevrolet médio B V P Vd B V P Vd pequeno Fiat médio B V P Vd B V P Vd pequeno Ford médio B V P Vd B V P Vd pequeno Chevrolet médio B V P Vd B V P Vd pequeno Fiat médio B V P Vd B V P Vd 37 © Tânia F Bogutchi – PUC Minas – Revisão em 2012 Estatística e Probabilidade Unidade 2: Distribuições de Probabilidade •••• Permutações de n objetos tomando r a cada vez O número de permutações de n objetos distintos tomando r a cada vez é definido como: Esse número é também conhecido como Arranjo de n objetos tomados de r em r : nAr ou r nA Exemplo: Determinar a formação de códigos de 3 dígitos, sem que os dígitos sejam repetidos. Solução: n=10 e r = 3 •••• Permutações de n objetos com repetição (ou distinguíveis) O número de permutações distintas de n objetos dos quais n1 são iguais entre si, n2 são iguais entre si,.., nr são iguais entre si é definida por: Exemplo: Um empreiteiro planeja realizar uma obra que consiste em seis casas de um pavimento, quatro casas com dois pavimentos e duas em dois níveis. De quantas maneiras distinguíveis as casas podem ser arranjadas?. Solução: n = 12, com n1 = 6; n2 = 4 e n3 = 2 •••• Combinações de n objetos tomando r a cada vez Uma combinação é uma seleção de r objetos de um grupo de n objetos, sem que tenha importância a ordem entre eles. É denotada por: Exemplo: Um departamento de transporte estadual planeja desenvolver uma nova seção de uma estrada interestadual e recebe 16 propostas para o projeto. O Estado planeja contratar quatro das companhias que fizeram ofertas. Quantas combinações diferentes de quatro dessas companhias são possíveis? A combinação de r objetos de um grupo de n objetos, sem que tenha importância a ordem, também é conhecida como um binômio e é denotada por : )!( ! ou Prn rn nP rn − = 720 7! 10.9.8.7! )!310( !10 A rn == − == r nP nnn nnn nP r r nnn n r =+++= ....n com , !!...! ! 21 21 ,..,, 21 860.13 6!4!2! .8.7.6!12.11.10.9 !2!4!6 !122,4,6 12 ===P !)!( !Cou C rn rrn nr n − = 208.1 12!4! 16! !4)!416( !16C C 416rn == − == !)!( !C r n rrn nr n − == 38 © Tânia F Bogutchi – PUC Minas – Revisão em 2012 Estatística e Probabilidade Unidade 2: Distribuições de Probabilidade •••• Continuação do exemplo da Binomial: Agora que foram relembradas as técnicas de contagem, podemos voltar ao exemplo do modelo de distribuição Binomial, em que é solicitada a probabilidade de 2 pessoas estarem vivas daqui a 30 anos dentre as cinco pessoas que compraram as apólices. Tínhamos que os expoentes indicavam 2 sucessos e 3 fracassos, logo a quantidade de sequências possíveis com dois sucessos é: Em que, 5! (cinco fatorial) é obtido por: 5! = 5 x 4 x 3 x 2 x 1 = 120 Logo, a probabilidade de exatamente duas pessoas sobreviverem:P(X=2)= 10 (0,4)2 (0,6)3 = 0,3456 (34,6%) Genericamente, A probabilidade de k sucessos em n repetições independentes de ensaios de Bernoulli com probabilidade de sucesso constante p, é: , k=0,1,2,….,n Notação: X ~ Bin (n,p) E sua média é E(X) = np e sua variância, Var (X) = np(1-p) Vantagem: os valores das probabilidades são tabelados!!! (Tabela 1) Exemplo de leitura da Tabela 1 – Binomial Suponha X ~ Bin(10; 0,35) Tem-se que P(X = 5) = 0,1536 p n x 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 10 0 0,5987 0,3487 0,1969 0,1074 0,0563 0,0282 0,0135 0,0060 0,0025 0,0010 10 1 0,3151 0,3874 0,3474 0,2684 0,1877 0,1211 0,0725 0,0403 0,0207 0,0098 9 2 0,0746 0,1937 0,2759 0,3020 0,2816 0,2335 0,1757 0,1209 0,0763 0,0439 8 3 0,0105 0,0574 0,1298 0,2013 0,2503 0,2668 0,2522 0,2150 0,1665 0,1172 7 4 0,0010 0,0112 0,0401 0,0881 0,1460 0,2001 0,2377 0,2508 0,2384 0,2051 6 5 0,0001 0,0015 0,0085 0,0264 0,0584 0,1029 0,1536 0,2007 0,2340 0,2461 5 6 0,0000 0,0001 0,0012 0,0055 0,0162 0,0368 0,0689 0,1115 0,1596 0,2051 4 7 0,0000 0,0000 0,0001 0,0008 0,0031 0,0090 0,0212 0,0425 0,0746 0,1172 3 8 0,0000 0,0000 0,0000 0,0001 0,0004 0,0014 0,0043 0,0106 0,0229 0,0439 2 9 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0005 0,0016 0,0042 0,0098 1 10 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0003 0,0010 0 0,95 0,90 0,85 0,80 0,75 0,70 0,65 0,60 0,55 0,50 x p 10 !2)!25( !5 2 52 5 = − = =C knk pp k n kXP −− == )1()( 39 © Tânia F Bogutchi – PUC Minas – Revisão em 2012 Estatística e Probabilidade Unidade 2: Distribuições de Probabilidade Se p <0,50 a leitura é feita buscando o n=10; e p=0,35 e o x lê-se de cima para baixo Por outro lado, se p > 0,50 então o valor de p, encontra-se na parte de baixo da tabela referente ao n=10, e o x é lido de baixo para cima. Por exemplo, ainda em X binomial com n=10, seja agora p=0,80, ou seja, X ~ Bin (10; 0,80). Logo, P(X=5) = 0,0264 Observe que se a probabilidade de sucesso de X for 0,80, a probabilidade de fracasso é 0,20. Elas encontram-se na mesma coluna, mas com leituras invertidas. Assim, se X ~ Bin(10; 0,80) e Y ~ Bin(10; 0,20) → P(X=5) = P(Y=5) = 0,0264 ! 3.3) Hipergeométrica Suponha uma população finita com N elementos, dos quais r, r ≤ N, têm uma determinada característica de interesse. A retirada de um desses elementos com essa característica corresponde a um sucesso. Seja retirada, sem reposição, uma amostra de tamanho n dessa população e considerado X: número de sucessos na amostra (elementos com a característica de interesse). Qual é a probabilidade de serem encontrado k sucessos, P(X=k)? Podem ser feitas as seguintes contagens: n N = a quantidade de amostras sem reposição que podem ser retiradas; k r = numero de maneiras em que os sucessos podem ocorrer; − − kn rN = numero de maneiras em que os fracassos podem ocorrer. Logo, p n x 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 10 0 0,5987 0,3487 0,1969 0,1074 0,0563 0,0282 0,0135 0,0060 0,0025 0,0010 10 1 0,3151 0,3874 0,3474 0,2684 0,1877 0,1211 0,0725 0,0403 0,0207 0,0098 9 2 0,0746 0,1937 0,2759 0,3020 0,2816 0,2335 0,1757 0,1209 0,0763 0,0439 8 3 0,0105 0,0574 0,1298 0,2013 0,2503 0,2668 0,2522 0,2150 0,1665 0,1172 7 4 0,0010 0,0112 0,0401 0,0881 0,1460 0,2001 0,2377 0,2508 0,2384 0,2051 6 5 0,0001 0,0015 0,0085 0,0264 0,0584 0,1029 0,1536 0,2007 0,2340 0,2461 5 6 0,0000 0,0001 0,0012 0,0055 0,0162 0,0368 0,0689 0,1115 0,1596 0,2051 4 7 0,0000 0,0000 0,0001 0,0008 0,0031 0,0090 0,0212 0,0425 0,0746 0,1172 3 8 0,0000 0,0000 0,0000 0,0001 0,0004 0,0014 0,0043 0,0106 0,0229 0,0439 2 9 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0005 0,0016 0,0042 0,0098 1 10 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0003 0,0010 0 0,95 0,90 0,85 0,80 0,75 0,70 0,65 0,60 0,55 0,50 x p 40 © Tânia F Bogutchi – PUC Minas – Revisão em 2012 Estatística e Probabilidade Unidade 2: Distribuições de Probabilidade − − == n N kn rN k r kXP )( , 0 ≤ k ≤ n e k ≤ r. Essa probabilidade define a variável aleatória X como uma distribuição hipergeométrica de probabilidade. Notação: X ~ Hiper (N, n, r) Sua média é E(X) = np e sua variância, Var(X)=np(1-p) − − 1N nN em que N rp = Exemplo: Pequenos motores são guardados em caixas de 50 unidades. Um inspetor de qualidade examina cada caixa, antes da posterior remessa, testando 5 motores. Se nenhum motor for defeituoso, a caixa é aceita. Se pelo menos um for defeituoso, todos os 50 motores são testados. Há 6 motores defeituosos numa caixa. Qual a probabilidade de que seja necessário examinar todos os motores dessa caixa? Seja, X: número de motores defeituosos da amostra. Tem-se: N = 50; r = 6; n = 5 Logo, 4874,05126,01 5 50 5 44 0 6 1 5 50 05 650 0 6 1)0(1)1(1)1( =−= −= − − −==−=<−=≥ XPXPXP ou seja, aproximadamente 48,7% é a probabilidade de serem examinados todos os motores dessa caixa. 3.4) Poisson Descreve variáveis aleatórias que se expressam através de contagens do número de ocorrências de um evento em um período de tempo, área ou volume. O modelo foi desenvolvido pelo matemático francês Poisson e sua distribuição de probabilidade é dada por: , em que λ (lambda) é interpretado como taxa média de ocorrências, é a constante de Euler. Notação: X ~ Pois ( λ ) Nessa distribuição a média e a variância são iguais: Pressupostos básicos para utilização desse modelo: ,...1,0k , ! )( === − k ekXP kλλ λ== )()( XVarXE ...7182,2 ; 0 ≅> eλ 41 © Tânia F Bogutchi – PUC Minas – Revisão em 2012 Estatística e Probabilidade Unidade 2: Distribuições de Probabilidade 1. A taxa média de ocorrências ( λ ) permanece constante ao longo do intervalo de tempo, área ou volume; 2. Intervalos de tempo, área ou volume, disjuntos são independentes, isto é, a informação sobre o número de ocorrências em um intervalo nada revela sobre o número de ocorrências em outro intervalo. Exemplo: X: número de consultas anuais de um associado de um plano de saúde. É um número finito de valores possíveis e pode tomar qualquer valor de {0, 1, 2, 3, 4,...}. A estimativa para o parâmetro λ é dada pela razão: associados de total no. consultas de total no. =λ Em um plano de saúde com 5.694 associados, ao fim de um ano fizeram-se 13.098 consultas, com distribuição conforme a tabela a seguir: A estimativa para λ é 3,2 694.5 098.13 ≅ , que é a média das consultas anuais, ou seja, um usuário típico deste plano de saúde faz cerca de duas consultas anuais e espera-se aproximadamente 23 consultas em 10 anos. A distribuição dessa probabilidade pode ser representada graficamente por: A probabilidade de um associado fazer uma consulta em um ano é: (23,1%) Alguns valores dessa distribuição encontram-se na Tabela 2, cuja leitura é bastante simples. No. consultas Freqüência No. consultasFreqüência 0 589 5 304 1 1274 6 126 2 1542 7 39 3 1144 8 10 4 663 9 3 9876543210 1500 1000 500 0 No.Consultas Fr eq üê nc ia ( ) 231,0 !1 1)3,2(3,2 1 = − == eXP 42 © Tânia F Bogutchi – PUC Minas – Revisão em 2012 Estatística e Probabilidade Unidade 2: Distribuições de Probabilidade Se em uma distribuição binomial o número de repetições for grande, n > 30, e a probabilidade de sucesso, p, for pequena, em geral p < 0,1, pode-se fazer uma aproximação da binomial pela distribuição de Poisson, considerando λ = E(x) = np. Exemplo de resolução por aproximação da Binomial pela de Poisson: A probabilidade de que um determinado rebite da superfície da asa de uma aeronave seja defeituoso é 0,001. Existem 4000 rebites na asa. Qual é a probabilidade de que sejam instalados não mais de 6 rebites defeituosos? Seja: X: número de rebites defeituosos na asa da aeronave → X ~ Bin (4000; 0,001) Como n é grande e p < 0,1, podemos utilizar a distribuição de Poisson como aproximação considerando λ = (4000)(0,001) = 4, ou seja, X ≈ Pois (4). Logo, P(X ≤ 6) = ∑ = −6 0 4 ! 4 k k k e = 0,01832 + 0,07327 + ... + 0,10420 = 0,88933 Existem muitos outros modelos de distribuições de probabilidades discretas, tais como Geométrica, Pascal (binomial negativa), mas as que foram aqui apresentadas são as mais utilizadas. 4) Variáveis Aleatórias Contínuas Uma variável aleatória é dita contínua, se seus valores variam em intervalos de números reais. Cada variável contínua X tem uma função de densidade de probabilidade f(x) e isso significa que a probabilidade de X estar entre dois valores reais a e b, P(a ≤ X ≤ b), é encontrada pela integração dessa função f(x), ou seja, a probabilidade está associada a uma área. Definição 1: Uma função contínua, f(x) é uma função de densidade de probabilidade se forem satisfeitas as seguintes propriedades: 1. f(x) ≥ 0 2. 1dx (x)f - =∫ ∞+ ∞ 3. P ( a ≤ X ≤ b) = ∫ b a dx (x)f O valor esperado ou a média µ (mi) de uma variável contínua X pode ser interpretada como o valor médio, a longo prazo, da variável aleatória X ou como uma medida da centralidade da função densidade de probabilidade (centro de massa de dados) e é obtido por: E(x) = ∫ ∞+ ∞− =µ dx (x)f x A variância, 2σ (sigma ao quadrado), definida como a média das distâncias dos pontos em relação à média µ é calculada por: 43 © Tânia F Bogutchi – PUC Minas – Revisão em 2012 Estatística e Probabilidade Unidade 2: Distribuições de Probabilidade Var(X) = ( )∫ ∞+ ∞− = 22 (x)E(X)-x dxfσ 5) Modelos de distribuições contínuas de probabilidades 5.1) Exponencial1 Fenômenos como tempo de espera ou tempo de falha de um equipamento são comumente modelados por funções de densidade de probabilidade exponencialmente decrescentes. Pense em uma variável aleatória como sendo o tempo em espera na linha antes de ser atendido por um funcionário da companhia que você está chamando. Assim, no lugar de x, use t para representar o tempo, em minutos. Se f é a função densidade de probabilidade e você telefona em um tempo t = 0, então, pela Definição 1, ∫ 2 0 dt (t)f representa a probabilidade de o funcionário responder dentro dos primeiros dois minutos, e ∫ 5 4 dt (t)f é a probabilidade de sua chamada ser atendida no quinto minuto. Está claro que o funcionário não pode atender antes de você fazer a ligação então f(t)=0 para t < 0. Para t > 0 devemos usar uma função exponencial decrescente, isto é, uma função do tipo f(t) = A e-ct, onde A e c são constantes positivas. Então, < ≥ = − 0 t se , 0 0 t se , Ae)t(f ct Calculando o valor genérico de A tem-se que A= c = α donde pode-se reescrever a função f(t) acima como a função de distribuição exponencial da variável aleatória X: < ≥− = 0 x se , 0 0 xse , )( xexf αα Observe que 1 (x) = ∞ ∞− ∫ dxf , e como f(x) > 0 para todo x, então a função acima definida é uma função de densidade de probabilidade! Calculando a média da distribuição exponencial com função de distribuição de probabilidade conforme definida anteriormente, obtém-se: α µ 1)( ==XE . E a variância: 2 2 1)( α σ ==XVar Dessa maneira, se X é uma variável aleatória com função de distribuição de probabilidade exponencial com parâmetro α , é faz-se uso da Notação: X ~ exp(α ). Com α 1 )( =XE e 2 1 )( α =XVar A função de densidade acumulada é F(x) = P(X≤ x) em que, 1 Texto adaptado do livro de cálculo do James Stewart. 44 © Tânia F Bogutchi – PUC Minas – Revisão em 2012 Estatística e Probabilidade Unidade 2: Distribuições de Probabilidade < ≥−− =≤= 0 x se , 0 0 xse , 1)()( xexXPxF α Uma utilização prática dessa distribuição é a área complementar à distribuição acumulada de probabilidades, chamada de tempo de sobrevida ou confiabilidade. Dessa maneira, a função do tempo de sobrevida é obtida pela P(X > x) = 1 – F(x)= xe α− , para x ≥ 0. Obs.: (1) Esses resultados são importantes e facilitam muito a resolução de problemas de sobrevida ou confiabilidade; (2) são facilmente obtidos por meio do cálculo das integrais. Verifique-os!! Propriedade importante da distribuição exponencial é a da falta de memória. A distribuição exponencial é a única distribuição contínua que a possui e essa propriedade está relacionada com as probabilidades condicionais, ou seja, seja X uma variável aleatória exponencial, então P(X < t1+t2| X > t1 ) = P(X < t2) Exemplo: Considere que o tempo entre detecções de uma partícula rara em um contador Geiger seja representado pela variável aleatória exponencial X com média de 1,4 minutos. Suponha que o contador Geiger seja ligado e que se espere 3 minutos sem que seja detectada uma partícula. Qual é a probabilidade de uma partícula ser detectada nos próximos 30 segundos? Como E(X) = α 1 = 1,4 minutos → 4,1 1 =α Como já foram esperados 3 minutos sem observar a detecção de uma partícula, a probabilidade de uma partícula ser detectada nos próximo 0,5 minutos é obtida pela probabilidade condicional: P(X < 3,5 | X > 3) que por definição é calculada por: P(X < 3,5 | X > 3) = 30,0 117,0 035,0)1()1( )3(1 )3()5,3( )3( )5,33( 4,1 3 4,1 3 4,1 5,3 == −−− = − − = > << − −− e ee F FF XP XP Por outro lado, a probabilidade de se detectar uma partícula dentro de 30 segundos a partir do começo da contagem é: P(X < 0,5 min) = F(0,5) = 1 - 4,1 5,0− e = 0,30 Conclusão: Depois de se esperar 3 minutos sem uma detecção, a probabilidade de uma detecção nos próximos 30 segundos é a mesma probabilidade de uma detecção nos 30 segundos imediatamente depois de começar a contagem. O fato de se ter esperado 3 minutos sem uma detecção não muda a probabilidade de uma detecção nos próximos 30 segundos, o que ilustra a propriedade de falta de memória dessa distribuição. 5.2) Normal A distribuição contínua mais importante em Estatística é chamada de distribuição Normal ou Gaussiana, devido a Gauss, matemático alemão que modelava os erros de mensuração das observações astronômicas e o chamava de “lei normal dos erros”. 45 © Tânia F Bogutchi – PUC Minas – Revisão em 2012 Estatística e Probabilidade Unidade 2: Distribuições de Probabilidade A curva dessa distribuição é determinada por uma função de densidade, f(x), que depende de doisparâmetros: da média µ (mi) e do desvio-padrão σ (sigma) e é definida matematicamente por: Notação: X ~ N ( σµ , ) A distribuição normal tem as seguintes propriedades: 1. A curva normal tem o formato de sino e é simétrica em torno da média, µ ; 2. A área total sob a curva normal é 1; 3. A curva tem inflexões nos pontos É côncava para baixo se σµ − < x < σµ + e côncava para cima em caso contrário. Na figura a seguir um exemplo dos pontos de inflexão numa curva normal com média zero e desvio-padrão igual a 1. F(x) é chamada de função densidade de probabilidade, fdp, da variável aleatória X A P(a < X < b) é a área sob a curva entre os valores a e b, (a < b). Por exemplo, seja a distribuição da altura, em cm, dos alunos de certa escola: 2 2 1 2 1 )( − − = σ µ piσ x exf σµ ±=x 46 © Tânia F Bogutchi – PUC Minas – Revisão em 2012 Estatística e Probabilidade Unidade 2: Distribuições de Probabilidade Se um aluno for sorteado aleatoriamente, a probabilidade de ele ter altura entre 120 e 135 cm é obtida pelo cálculo da área entre esses dois valores, limitada pela curva f(x) (hachurada em azul). A próxima figura apresenta a influência da média e do desvio-padrão no gráfico da distribuição Normal. Observe que as curvas X1 e X2 possuem a mesma média e desvios-padrão diferentes. O desvio-padrão da curva X1 é maior que o da curva X2. As curvas X1 e X2 estão centradas (ponto mais alto) no mesmo ponto, a média, mas o formato da curva X1 é mais achatado que o da curva X2 e esses formatos são influenciados pelo desvio-padrão. Observe agora, as curvas X2 e X3, elas possuem mesmo desvio-padrão, mas a média de X3 é menor que a de X2. As duas curvas apresentam mesmo formato, mas encontram-se deslocadas em relação ao ponto mais alto – a média. Dessa maneira, a média é dita uma medida de locação ao passo que o desvio-padrão de forma (ou formato). P(120 < X < 135)P(120 < X < 135) Data Fr e qu e n ci a 9,07,25,43,61,80,0-1,8 1200 1000 800 600 400 200 0 Mean 1,510 0,7004 10000 StDev N 3,479 1,500 10000 3,493 0,7017 10000 Variable X3 X1 X2 Normal Histograma: X1; X2; X3 X1 ~ N(3,5 ; 1,5) X2 ~ N(3,5 ; 0,7)X3 ~ N (1,5 ; 0,7) Data Fr e qu e n ci a 9,07,25,43,61,80,0-1,8 1200 1000 800 600 400 200 0 Mean 1,510 0,7004 10000 StDev N 3,479 1,500 10000 3,493 0,7017 10000 Variable X3 X1 X2 Normal Histograma: X1; X2; X3 X1 ~ N(3,5 ; 1,5) X2 ~ N(3,5 ; 0,7)X3 ~ N (1,5 ; 0,7) 47 © Tânia F Bogutchi – PUC Minas – Revisão em 2012 Estatística e Probabilidade Unidade 2: Distribuições de Probabilidade 5.3) Normal padronizada, Z Seja a variável aleatória normal X, com média µ e desvio-padrão σ . A variável aleatória Z obtida pela transformação de X, de tal maneira que a média µ fica centrada no valor zero e a distância de cada ponto à média (centro) é dita em números de desvios-padrão é chamada de Normal padronizada, ou seja, Tem-se então uma maneira muito mais fácil de calcular a área sob a curva, pois a transformada de X em Z fica com a função de densidade de probabilidade simplificada em: Os cálculos dessa área podem, então, ser tabelados. A Tabela 3 apresenta esses valores calculados considerando sempre a área abaixo de um determinado ponto z, limitada no zero. Por exemplo, o ponto que fica a 1,96 desvios-padrão da média é 0,975, ou seja, 97,5% da área da curva normal fica abaixo do ponto 1,96, conforme mostra a figura a seguir: A área entre o ponto que fica entre a média (zero) e a uma distância de 1,96 desvios-padrão da média é 0,475, conforme mostra a figura a seguir: N(0,1) ~ -XZ ),N( ~ σ µ σµ =⇒X 2 2 1 2 1 )( x ezf − = pi 48 © Tânia F Bogutchi – PUC Minas – Revisão em 2012 Estatística e Probabilidade Unidade 2: Distribuições de Probabilidade Obtida pela leitura na tabela 3: Tem-se também que P(Z < 0) = 0,50, portanto utilizando os valores da Tabela 3, obtém-se a área desejada: P(Z < 1, 96) = P(Z < 0) + P( 0 < Z < 1,96)= 0,50 + 0,475 = 0,975. Uma importante particularidade da curva normal é a concentração dos dados. Tem-se aproximadamente 68,3% dos dados concentrados entre ± 1 desvio-padrão em torno da média, ou a uma amplitude de 2 desvios-padrão em torno da média; 95,4% dos dados ficam concentrados entre ± 2 desvios-padrão em torno da média e 99,7% entre ± 3 desvios-padrão em torno da média. Podemos dizer que praticamente todos os dados de uma população com distribuição normal ficam concentrados a uma amplitude de 6 desvios-padrão com centro na média. Os dados que se encontram nas caudas, menores ou maiores a 3 desvios-padrão da média, representam apenas 0,3%. Esses dados são considerados incomuns ou raros. A próxima figura apresenta essas probabilidades: 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359 0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0754 0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141 0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517 0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879 0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224 0,6 0,2258 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2518 0,2549 0,7 0,2580 0,2612 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852 0,8 0,2881 0,2910 0,2939 0,2967 0,2996 0,3023 0,3051 0,3079 0,3106 0,3133 0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389 1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621 1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015 1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177 1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319 1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4430 0,4441 1,6 0,4452 0,4463 0,4474 0,4485 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545 1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633 1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4700 0,4706 1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4762 0,4767 2,0 0,4773 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817 segunda casa decimal de z u n i d a d e e p r i m e i r a z 49 © Tânia F Bogutchi – PUC Minas – Revisão em 2012 Estatística e Probabilidade Unidade 2: Distribuições de Probabilidade 5.4) Aproximações pela Normal a) Binomial Se X for uma variável aleatória com distribuição binomial, com parâmetros n e p, ela terá uma distribuição aproximada pela normal se o número esperado de sucessos, np, e o número esperado de fracassos, n(1-p), forem maiores do que 5. Para uma melhora aproximação no cálculo das probabilidades é feita uma correção de continuidade (cc) por meio da subtração e adição de 0,5 nos valores dos limites inferiores e superiores, respectivamente, do intervalo considerado. Isso significa: X ~ Bin (n, p) )1 ,0( )1( N pnp npXZ ≈ − − =⇒ P(a ≤ X ≤ b ) ≅ CC P(a – 0,5 ≤ X ≤ b + 0,5). Exemplo de resolução por aproximaçãoda Binomial pela Normal: Em um canal digital de comunicação, suponha que o número de bits recebidos com erro possa ser modelado por uma variável aleatória binomial. Suponha que a cada 50 bits transmitidos a probabilidade de um erro é de 0,1. Qual a probabilidade de ocorrência de 8 a 10 erros na transmissão? X: número de erros de transmissão X ~ Bin(50; 0,1) E(X)=np=5 – número esperado de sucessos. A probabilidade exata será: P(8 ≤ X ≤ 10 ) = P(X=8) + P(X=9) + P(X=10) = 0,1128 Pela aproximação da binomial pela Normal: 5== npµ 50 © Tânia F Bogutchi – PUC Minas – Revisão em 2012 Estatística e Probabilidade Unidade 2: Distribuições de Probabilidade 12,25,490,0)(1,0(50()1( ≅==−= pnpσ Logo, X ~ Bin(50; 0,1) ⇒ X ≈ N(5; 2,12) P(8 ≤ X ≤ 10 ) ≅ CC P(7,5 ≤ X ≤ 10,5) ≅ CC P(1,18 ≤ Z ≤ 2,59) ≅ CC 0,1142 Erro de aproximação: 0124,0 1128,0 1142,01128,0 = − (~1,14%) Obs.: o erro de aproximação percentual é dado por: 100x P PP binomial normalbinomial − b) Hipergeométrica Se X for uma variável aleatória com distribuição hipergeométrica, em que p é a proporção de sucesso na amostra n de uma população de tamanho N, então a distribuição normal proporcionará efetivas aproximações das probabilidades hipergeométricas se forem satisfeitas as seguintes condições: >− > < 5)1( 5 1,0 pn np N n Lembrar que, N kp = c) Poisson Se X for uma variável aleatória com distribuição de Poisson, com taxa média de sucesso λ em que E(X) = Var(X) = λ , então ela terá uma boa aproximação Normal quando λ > 5. Exemplo de resolução por aproximação da Poisson pela Normal: Considere que o número de ácaros em um metro quadrado de poeira em uma superfície siga a distribuição de Poisson com uma taxa média de 1000. Se um metro quadrado for analisado, qual a probabilidade de serem encontrados até 950 ácaros? A probabilidade exata pode ser calculada por: ∑ = − =≤ 950 0 1000 ! 1000)950( k k k eXP A qual requer uma difícil computação!! Por outro lado, essa probabilidade poderá ser aproximada por: 058208,0)57,1( 1000 10005,950)950( ≅−≤≅ −≤≅≤ ZPZPXP 51 © Tânia F Bogutchi – PUC Minas – Revisão em 2012 Estatística e Probabilidade Unidade 2: Distribuições de Probabilidade Essa curva é tão importante que às vezes em nossos passeios ecológicos podemos observá-las até mesmo na natureza!! Serra do Cipó – MG, Foto: R.Q.C. Ribeiro 5.5) T-Student Em geral, o desvio-padrão populacional, s, é desconhecido. Nesse caso, seu valor é estimado pelo desvio-padrão amostral, s. A distribuição t de Student é utilizada quando a amostra é pequena (n<30). T terá uma distribuição “t de Student” com n-1 graus de liberdade. A caracterização com n-1 graus de liberdade é necessária porque para cada tamanho de amostra temos uma distribuição t de Student diferente. A figura a seguir apresenta a Comparações entre a curva da distribuição N(0,1), uma curva t com 5 graus de liberdade (t5) e outra com 30 graus de liberdade (t30): Dados Fr e q u e n ci a 4,53,01,50,0-1,5-3,0-4,5 100 80 60 40 20 0 Histograma para T-gl=5; T-gl=30; N(0,1) N(0,1) T, gl=5 T, gl=30 52 © Tânia F Bogutchi – PUC Minas – Revisão em 2012 Estatística e Probabilidade Unidade 2: Distribuições de Probabilidade 6) RESOLUÇÃO DE ALGUNS EXERCÍCIOS DE DISTRIBUIÇÃO DE PROBABILIDADE Exercício 1 - Uma pessoa vende apólices de seguro empresariais. Visita semanalmente uma, duas ou três empresas com probabilidade 0,2 , 0,5 e 0,3 , respectivamente. De cada contato pode conseguir a venda de uma apólice por R$ 1.200,00 com probabilidade de 0,3. Determinar o valor total médio (esperado) das vendas semanais. Solução: Sejam definidas as variáveis aleatórias: X: no de vendas semanais Visita em 1 empresa: X ~ Ber(0,3) Visita em 2 empresas: X ~ Bin(2; 0,3) Visita em 3 empresas: X ~ Bin(3; 0,3) L: valor das vendas semanais. Tem-se que p(l) = (prob. Visita)(prob no vendas semanais) Por que ∑ )(lp =0,512 ??? Resp: Lucro total médio é de R$756,00 Exercício 2 - Uma seguradora vendeu apólices de seguro a cinco pessoas, todas da mesma idade e com boa saúde. De acordo com as tábuas atuariais, a probabilidade de que uma pessoa daquela idade esteja viva daqui a 30 anos é de 70%. Calcular a probabilidade de daqui a 30 anos: a) Exatamente duas pessoas estejam vivas; b) Todas as pessoas estejam vivas; c) Pelo menos três pessoas estejam vivas. Solução: X: no. de pessoas vivas daqui a 30 anos X ~ Bin(5; 0,7) a) Exatamente duas pessoas estejam vivas: P(X=2) = 252 )7,01()7,0( 2 5 − − = 0,1323 Esse valor pode ser encontrado na Tabela 1 da distribuição Binomial! R$ 756,000,512Total R$ 29,160,008R$ 3.600,000,0273 R$ 136,080,057R$ 2.400,000,1892 R$ 158,760,132R$ 1.200,000,4411 0,303 R$ 108,000,045R$ 2.400,000,0902 R$ 252,000,210R$ 1.200,000,4201 0,502 R$ 72,000,060R$ 1.200,000,30010,201 l.p(l)p(l)lp(x)xProb. VisitaNo. empresas L: valor das vendas semanais R$ 756,000,512Total R$ 29,160,008R$ 3.600,000,0273 R$ 136,080,057R$ 2.400,000,1892 R$ 158,760,132R$ 1.200,000,4411 0,303 R$ 108,000,045R$ 2.400,000,0902 R$ 252,000,210R$ 1.200,000,4201 0,502 R$ 72,000,060R$ 1.200,000,30010,201 l.p(l)p(l)lp(x)xProb. VisitaNo. empresas L: valor das vendas semanais 53 © Tânia F Bogutchi – PUC Minas – Revisão em 2012 Estatística e Probabilidade Unidade 2: Distribuições de Probabilidade Ou, se quiser, pode fazer o cálculo buscando essa probabilidade no Excel®: p n x 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 5 0 0,7738 0,5905 0,4437 0,3277 0,2373 0,1681 0,1160 0,0778 0,0503 0,0313 5 1 0,2036 0,3281 0,3915 0,4096 0,3955 0,3602 0,3124 0,2592 0,2059 0,1563 4 2 0,0214 0,0729 0,1382 0,2048 0,2637 0,3087 0,3364 0,3456 0,3369 0,3125 3 3 0,0011 0,0081 0,0244 0,0512 0,0879 0,1323 0,1811 0,2304 0,2757 0,3125 2 4 0,0000 0,0005 0,0022 0,0064 0,0146 0,0284 0,0488 0,0768 0,1128 0,1563 1 5 0,0000 0,0000 0,0001 0,0003 0,0010 0,0024 0,0053 0,0102 0,0185 0,0313 0 0,95 0,90 0,85 0,80 0,75 0,70 0,65 0,60 0,55 0,50 x p 54 © Tânia F Bogutchi – PUC Minas – Revisão em 2012 Estatística e Probabilidade Unidade 2: Distribuições de Probabilidade Repetindo os processos pode-se calcular: b) Todas as pessoas estejam vivas: P(X=5) P(X=5) = 0,1681 c) Pelo menos três pessoas estejam vivas: OBS.: A função acumulada no Excel®, para X menor ou igual a 2: =DISTRBINOM(2;5;0,7;VERDADEIRO) Exercício 3 - (Anpec – 2002) Uma companhia de seguros tem 400 segurados de certo tipo. O prêmio do seguro é R$ 1.000,00 por ano. Caso ocorra um sinistro a seguradora indenizará R$ 8.000,00 a cada acidentado. Sabe-se que a probabilidade de ocorrência de sinistro, é 0,1 por ano. Os custos fixos da seguradora são de R$ 8.000,00 por ano. Qual a probabilidade da seguradora ter prejuízo em um certo ano? Solução: Indenização por acidentado: R$ 8.000,00 Capacidade de indenização: R$ 392.000,00/R$ 8.000,00 = 49 indenizações possíveis. X: no. de sinistros por ano X ~ Bin(400; 0,1) Probabilidade de prejuízo: P(X > 49) Fazendo o cálculo pelo Excel® =DISTRBINOM(49;400;0,1;VERDADEIRO) fornece: 0,939903 Esse exercício também pode ser resolvido pela aproximação da Binomial pela Normal! Normal : P(X>49)=1-P(X<49,5)=1 - 0,9429 = 0,0571(5,71%), pois Erro da aproximação: 8369,01631,01)2(1)3(1)3( =−=≤−=<−=≥ XPXPXP R$ 392.000,00R$ 8.000,00R$ 400.000,00R$ 1.000,00400 Saldo/anoCustofixo/ano Total Premios/anoPremio/segurNo. segurados R$ 392.000,00R$ 8.000,00R$ 400.000,00R$ 1.000,00400 Saldo/anoCustofixo/ano Total Premios/anoPremio/segurNo. segurados 0601,09399,01)49(1)49( =−=≤−=> XPXP )58,1(1)58,1( 6 405,49 )49( ≤−=>= − >=> ZPZPZPXP 0492,0 0601,0 003,0 0601,0 0571,00601,0 == − 55 © Tânia F Bogutchi – PUC Minas – Revisão em 2012 Estatística e Probabilidade Unidade 2: Distribuições de Probabilidade Exercício 4 - O chefe de polícia do Morro da Oncinha recebe cinco pedidos de socorro por hora. Qual a probabilidade de ele, em três quartos de hora: a) poder tirar um cochilo tranqüilo? b) ter que atender: b.1) um? b.2) entre dois e cinco? b.3) mais de quatro chamados? Solução: X : no. de pedidos de socorro por hora X ~ Pois(5) Para X: no. de pedidos de socorro a cada três quartos de hora (45 min) Então, X ~ Pois(3,75), pois, a) para tirar um cochilo tranqüilo... (2,4%) Tabela de resultados obtida diretamente do Excel®, dado que a Tabela 2 não fornece esse valor. Dessa maneira, podemos obter os demais resultados diretamente dessa tabela construída: b.1) P(X=1) = 0,0882 b.2) P(X=2) + P(X=3) + P(X=4) + P(X=5) = 0,7111 75,3 60 )5)(45( min 45 5 min 60 ==→ → → λλ ( ) 0235,0 !0 )75,3( 0 075,3 === −e XP 56 © Tânia F Bogutchi – PUC Minas – Revisão em 2012 Estatística e Probabilidade Unidade 2: Distribuições de Probabilidade b.3) P(X > 4) = 1 – [P(X=0) + P(X=1) + ...+ P(X=4)]= 1 – 0,6775 = 0,3225 Exercício 5 – Um agricultor planta seis sementes escolhidas aleatoriamente, sem reposição, de uma caixa com cinco sementes de tulipa e quatro de crisântemo. Qual a probabilidade de ele plantar duas sementes de crisântemo e quatro de tulipa? Solução: Distribuição hipergeométrica. Temos: N = 9 sementes; n = 6 Vamos considerar as tulipas como sucesso, então K = 5 (sementes de tulipa), N – K = 4 e X : sementes de tulipa plantadas Resp.: A probabilidade de ele plantar 4 sementes de tulipa e consequentemente 2 de crisântemo numa amostra de 6 sementes é 0,3571 (ou 35,7%) Exercício 6 – Os salários dos diretores das empresas de São Paulo distribuem-se normalmente com média de R$ 8.000,00 e desvio-padrão de R$ 5.000,00. Qual a porcentagem de diretores que recebem: a) Menos de R$ 6.470,00? b) Entre R$ 8.920,00 e R$ 9.380,00? c) Qual o valor do salário que deixa 10% dos diretores mais mal pagos de São Paulo? Solução: X: salário dos diretores das empresas de São Paulo, em reais. X ~ N (8.000; 5.000) a) P(X<6470) = 0,3783 (37,8%) Pois, Exercício 4.5 – Solução: Por simetria da distribuição Normal tem-se que P(Z < -0,31) = P(Z > 0,31) A Tabela 3-1 fornece os valores das probabilidades entre zero e z positivo, dessa maneira, tem- se P(Z > 0,31) = P(Z > 0) – P(0< Z < 0,31) = 0,50 – 0,1217 = 0,3783 3571,0 14 5 6 9 2 4 4 5 )2( == = − − == n N xn kN x k XP 3783,0)31,0( 5000 80006470 )6470( =−<= − <=< ZPZPXP 57 © Tânia F Bogutchi – PUC Minas – Revisão em 2012 Estatística e Probabilidade Unidade 2: Distribuições de Probabilidade Outra opção é quando se utiliza a Tabela 3, que fornece as probabilidades abaixo de z (P(Z < z) diretamente: Dessa tabela, P(Z < -0,31) = 0,37828... Apesar da disponibilização dessas tabelas na área de aprendizado, vamos utilizar a tabela 3-1 no formulário das provas por ser menor. Resp.: Aproximadamente 37,8% dos diretores das empresas de São Paulo recebem salários de até R$ 6.470,00 b) P(8920 < X < 9380) = P(X < 9380) – P(X<8920) Tem-se: 0,00 0,01 0,02 0,03 0,04 0,05 0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,6 0,2258 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,7 0,2580 0,2612 0,2642 0,2673 0,2704 0,2734 0,2764 0,8 0,2881 0,2910 0,2939 0,2967 0,2996 0,3023 0,3051 0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 z segunda casa decimal de z u n i d a d e 58 © Tânia F Bogutchi – PUC Minas – Revisão em 2012 Estatística e Probabilidade Unidade 2: Distribuições de Probabilidade (1) (da Tabela 3-1) (2) Logo, de (1) e (2): P(8920 < X < 9380) = P(X<9380) – P(X<8920) = P(Z<0,18) - P(Z<0,28)= 0,6103 - 0,5714 = 0,0389 (3,9%) P(X < 9380) = 0,6103P(X < 9380) = 0,6103 6103,0)28,0( 5000 80009380 )9380( =<= − <=< ZPZPXP P(X < 8920) = 0,5714P(X < 8920) = 0,5714 5714,0)18,0( 5000 80008920 )8920( =<= − <=< ZPZPXP 59 © Tânia F Bogutchi – PUC Minas – Revisão em 2012 Estatística e Probabilidade Unidade 2: Distribuições de Probabilidade Resp.: Aproximadamente 3,9% dos diretores das empresas de São Paulo recebem salários entre R$ 8.920,00 e R$ 9.380,00 O valor -1,28 foi obtido diretamente da Tabela 3-1 no sentido inverso, ou seja, buscando o valor de z por meio da coluna com a probabilidade com valor mais próximo de 0,10. Nesse caso, busca-se o valor da probabilidade positiva, ou seja, P(Z > z) = 0,10 a qual equivale a P(0 < Z < z) = 0,40. Na tabela o valor mais próximo de 0,40 equivale ao z = 1,28 e por simetria, o valor procurado é o -1,28. Na figura da distribuição Normal, pode-se observar as simetrias: 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359 0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0754 0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141 0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517 0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879 0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224 0,6 0,2258 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2518 0,2549 0,7 0,2580 0,2612 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852 0,8 0,2881 0,2910 0,2939 0,2967 0,2996 0,3023 0,3051 0,3079 0,3106 0,3133 0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389 1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621 1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015 1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177 1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319 1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4430 0,4441 1,6 0,4452 0,4463 0,4474 0,44850,4495 0,4505 0,4515 0,4525 0,4535 0,4545 1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633 z segunda casa decimal de z u n i d a d e e p r i m e c) P(X<x) = 0,10 (10%) P(Z < z) = 0,10 z = -1,28 c) P(X<x) = 0,10 (10%) P(Z < z) = 0,10 z = -1,28 60 © Tânia F Bogutchi – PUC Minas – Revisão em 2012 Estatística e Probabilidade Unidade 2: Distribuições de Probabilidade Temos que: Logo, x = (-1,28)(5.000) + 8.000 x = R$ 1.600,00 Então, o salário de 10% dos diretores mais mal pagos das empresas de São Paulo é de até R$1.600,00 por mês. Exercício 7 – Uma fábrica de tubos para TV determinou que a vida média dos tubos de sua fabricação é de 800 horas de uso contínuo e segue uma distribuição exponencial. Qual a probabilidade de que a fábrica tenha de substituir um tubo gratuitamente, se oferece uma garantia de 300 horas de uso? Solução: X: tempo de vida dos tubos, em horas X ~ exp ( λ ) Temos, Logo, Para uma garantia de 300 horas, a probabilidade de ele ter que substituir será: P(X ≤ 300). Temos, F(x) = P(X < x) é dada por: Logo, A probabilidade da fabrica ter que substituir um tubo gratuitamente, dada a garantia de 300 horas de uso é 0,3127 (ou aprox. 31,3%) z -1,28 0,10 1,28 0,10 0 N(0,1) 0,400,40 µσ σ µ +=⇒ − = zx x z 800 1 == λµ 800 1 =λ ≥ − = contrario caso , 0 0 xse , 800 1 800 1 )( x exf < ≥−− = ∞− − −= ∞− − =<= ∫ 0 x se , 0 0 xse , 1)( 1 1 )()( xexte x dt t exXPxF λλλ λ 3127,06873,018 3 1 300 800 1 1)300()300( =−= − −= − −=≤= eeXPF 61 © Tânia F Bogutchi – PUC Minas – Revisão em 2012 Estatística e Probabilidade Unidade 2: Distribuições de Probabilidade 7) MISCELÂNEA DE EXERCÍCIOS RESOLVIDOS EM ATIVIDADES E PROVAS Questão 1: Dada a tabela: x 4 5 6 7 8 p(x) p2 p2 p p p2 O valor de p; a P(5 ≤ X ≤ 7) e o valor esperado (média) de X são aproximados respectivamente por: a) -1; 0,778 e 3,48 b) 0,333; 0,778 e 6,22 c) 1/3; 2/3 e 4/9 d) 0,333; 0,445 e 6,22 Resposta: B x 4 5 6 7 8 p(x) p2 p2 p p p2 (1) Sabemos que 1)x(p i =∑ , logo 3p2 + 2p = 1 → 3p2 + 2p – 1 = 0 , resolvendo essa equação do 2º grau obtemos: 3 1 p ou 1- p 6 )1)(3(442 p ==⇒ −−±− = , com p é uma probabilidade, valores negativos não servem, então 3 1p = =0,333. (2) P(5 ≤ X ≤ 7) = P(X=5) + P(X=6) + P(X= 7) = p2 +2 p = 9 7 3 1 2 9 1 =+ =0,778 (3) E(X) = ( )∑ = n 1i ii xpx = 22,6 9 56 3 13 9 17 9 1 8 3 1 7 3 1 6 9 1 5 9 1 4 ==+=++++ Questão 2: Em seu caminho matinal, você se aproxima de um determinado sinal de trânsito, que está verde 20% do tempo. Suponha que cada manhã represente uma tentativa independente. As probabilidades para as seguintes situações: (1) em 5 manhãs a luz esteja 62 © Tânia F Bogutchi – PUC Minas – Revisão em 2012 Estatística e Probabilidade Unidade 2: Distribuições de Probabilidade verde exatamente um dia; e (2) em 20 manhãs a luz esteja verde em mais de 4 dias, são aproximadas respectivamente por: a) 0,0576; 0,2181 b) 0,4096; 0,2181 c) 0,4096; 0,3704 d) 0,0576; 0,3704 Resposta: C Seja a variável aleatória X: sinal verde numa manhã , então X ~ Bin ( n; 0,20) (1) X ~ Bin(5 ; 0,20) P(X= 1) = 4096,0)80,0()20,0( 1 5 41 = (2) X ~Bin (20 ; 0,20) P(X > 4) = 1 – P(X ≤ 4) = 1 – 0,6296 = 0,3704 Questão 3: Lotes de 40 peças são considerados aceitáveis se contém, no máximo, três peças defeituosas. O processo de amostragem consiste em extrair aleatoriamente cinco peças de cada lote e rejeita-lo se for encontrada pelo menos uma peça defeituosa nas cinco peças extraídas. A probabilidade de se encontrar exatamente uma peça defeituosa se há três peças defeituosas em todo o lote é aproximadamente: a) 27,0% b) 30,1% c) 42,3% d) 28,5% Resposta: B A variável aleatória X é hipergeométrica com N = 40; n = 5; k = 3 e x = 1 P(X= 1) = 304,0 008.658 )045.66)(3( 5 40 4 37 1 3 == 63 © Tânia F Bogutchi – PUC Minas – Revisão em 2012 Estatística e Probabilidade Unidade 2: Distribuições de Probabilidade Questão 4: Mensagens chegam a um servidor de computadores, de acordo com a distribuição de Poisson, com uma taxa média de 10 por hora. O intervalo de tempo, em segundos, tal que a probabilidade de nenhuma mensagem chegar seja de 90% é: a) 25,8 b) 32,4 c) 90,0 d) 37,9 Resposta: D Seja X: numero de mensagens que chegam, em horas, no tempo t X ~ Pois(10t) P(X=0) = 0,90 90,0e90,0 !0 )t10(e t10 0t10 =⇒=⇒ − − Logo, -10t = ln(0,90) ⇒ -10t = -0,10536 ⇒ t = 1,0536 x 10-2 horas Então, t = (0,01054)(3.600) segundos ⇒ t = 37,9 segundos. Questão 5: A função, 2 xou 0 xse , 0 2x 0 se >≤ ≤<+ = ,32)( xxf é uma função de densidade de probabilidade se, e somente se, ela for: a) Multiplicada pela constante 0,10 b) Adicionada da constante 0,10 c) Multiplicada pela constante 10 d) Adicionada da constante 10 Resposta: A ( ) >≤ ≤<+ = 2x ou 0x ,0 2x0 ,3x2 xf 1) f(x) > 0 → suposição confirmada sempre 64 © Tânia F Bogutchi – PUC Minas – Revisão em 2012 Estatística e Probabilidade Unidade 2: Distribuições de Probabilidade 2) ( ) 1dxxf =∫∞ ∞− , tem-se: ( ) ( ) ( ) ( ) 2 0 2 2 0 2 2 0 0 x3 2 x 2 dx3x2 dx0dx3x2dx3x2dx3x2 + / /= =+= =++++=+ ∫ ∫∫∫∫ ∞ ∞− ∞ ∞− 11064 ∴>=+= f(x) não é uma probabilidade Para ser uma probabilidade, f(x) pode ser definida: ( ) ( ) >≤ ≤<+ = 2x ou 0x ,0 2x0 ,3x2 10 1 xf Conclusão: Se f(x) for multiplicada por 0,10 então ela será uma f.d.p. Questão 6: O tempo entre as chegadas de táxi a um movimento cruzamento é distribuído exponencialmente com uma média de 10 minutos. A probabilidade de você esperar menos que x minutos é 0,50. O valor aproximado de x, em minutos é: a) 5,0 b) 8,52 c) 6,93 d) 10,15 Resposta: C Seja X: tempo entre as chegadas de táxi, em minutos 65 © Tânia F Bogutchi – PUC Minas – Revisão em 2012 Estatística e Probabilidade Unidade 2: Distribuições de Probabilidade X ~ exp ( λ ) µ = E(X) = 10 ⇒ 1,0 10 1 ==λ P(X < x) = 0,50 ⇒ 50,0e x =λ− ⇒ 50,0e x1,0 =− ⇒ -0,1x = ln(0,50)= -0,693 ⇒ x = 6,93 min. Questão 7: A velocidade de transferência de um arquivo de um servidor da universidade para um computador pessoal na casa de um estudante, em uma noite de dia de semana, é normalmente distribuída, com média de 60 kbits por segundo e um desvio-padrão de 4 kbits por segundo. A probabilidade de o arquivo se transferir a uma velocidade entre 58 e 70 kbits por segundo é aproximadamente: a) 0,298 b) 0,685 c) 0,542 d) 0,320 Resposta: B X: velocidade de transferência arquivos, em kbits/seg X ~ N (60; 4) P(58 ≤ X ≤ 70) = P(X ≤ 70) - P(X ≤ 58) = −≤ 4 6070 ZP - −≤ 4 6058ZP = P(Z ≤ 2,5) – P(Z ≤ -0,5) = 0,993790 – 0,308538 = 0,685252 Questão 8: O tempo de reação de um motorista para o estímulo visual é normalmente distribuído, com uma média de 0,4 s e um desvio-padrão de 0,05 s. As probabilidades para: (1) de que uma reação requeira entre 0,4 s e 0,5 s; (2) de que uma reação requeira mais de 0,5 s; (c) o tempo de reação que é excedido em 90% do tempo; são dadas, respectivamente, por: a) 0,47725 ; 0,02275 ; 0,336 b) 0,02275 ; 0,47725 ; 0,336 c) 0,97725 ; 0,02275 ; 0,500 d) 0,97725 ; 0,47725 ; 0,336 Resposta: A Seja X: tempo de reação do motorista ao estímulo visual, em segundos X ~ N (0,4; 0,05) 66 © Tânia F Bogutchi – PUC Minas – Revisão em 2012 Estatística e Probabilidade Unidade 2: Distribuições de Probabilidade (1) P (0,4 ≤ X ≤ 0,5) = P −≤≤ 05,0 4,05,0 Z0 = P (0 ≤ Z ≤ 2) = = P (Z ≤ 2) – P (Z ≤ 0) = = 0,97725 – 0,50 = 0,47725 (2) P (X ≥ 0,5) = P (Z ≥ 2) = 1 – P (Z ≤ 2) = 1 – 0,97725 = 0,02275 (3) P (X ≥ x) = 0,90 ⇒ P (Z ≥ z) = 0,90 ⇒ P (Z ≤ z) = 0,10 ⇒ z = -1,28 σ µ− = x z ⇒ x = zσ + µ = (- 1,28) (0,05) + 0,4 = - 0,064 +0,4 = 0,336 Questão 9: As linhas telefônicas em um sistema de reservas de uma companhia aérea estão ocupadas em 40% do tempo. Suponha que os eventos em que as linhas estejam ocupadas em sucessivas chamadas sejam independentes. As probabilidades para as seguintes situações: (1) que 10 chamadas aconteçam e em exatamente três chamadas as linhas estejam ocupadas; e (2) que 5 chamadas sejam feitas e no mínimo em uma chamada as linhas não estejam ocupadas, são aproximadas respectivamente por: a) 0,0425; 0,9940 b) 0,4096; 0,8180 c) 0,2150; 0,9898 d) 0,3456; 0,9744 Resposta: C Seja X: número de linhas ocupadas X ~ Bin (10; 0,40) (1) P(X = 3 ) = 0,2150 (2) Seja Y ~ Bin (5; 0,60) P( Y ≥ 1) = 1 – P( Y < 1) = 1 – P( Y= 0) = 1 – 0,0102 = 0,9898 Questão 10: Em uma auto-estrada, o número de buracos, que é bastante significante para requerer reparo, é suposto seguir uma distribuição de Poisson, com uma média de dois buracos 67 © Tânia F Bogutchi – PUC Minas – Revisão em 2012 Estatística e Probabilidade Unidade 2: Distribuições de Probabilidade por quilometro. As probabilidades para as seguintes situações: (1) não há buracos que requeiram reparos em 5 quilometros; e (2) no mínimo um buraco requeira reparo em meio quilometro de auto-estrada, são aproximadas respectivamente por: a) 13,5%; 4,9% b) 0,01%; 63,2% c) 21,5%; 98,1% d) 0,01%; 27,8% Resposta: B Seja X : número de buracos por Km em uma auto-estrada. X ~ Pois (2) (1) Se temos 2 buracos a cada quilometro, então teremos 10 buracos em 5 km (regra de 3 simples), logo X ~ Pois (10) P(X = 0) ≅ 0,00005 ≅ 0,0001 ≅ 0,01% (2) Se temos 2 buracos a cada quilometro, então teremos 1 buracos em 0,5 km (regra de 3 simples), logo X ~ Pois (1) P( X ≥ 1) = 1 – P( X = 0) = 1 – 0,36788 ≅ 0,63212 ≅ 63,2% Questão 11: O tempo até a falha, em horas, de um importante componente de um equipamento eletrônico usado na fabricação de um aparelho DVD é distribuído exponencialmente com uma média de 2000 horas. A probabilidade de que o componente (e, conseqüentemente o aparelho DVD) dure mais do que 1000 horas antes que o componente tenha de ser substituído é aproximadamente: a) 0,6321 b) 0,3935 c) 0,3679 d) 0,6065 Resposta: D Seja X: tempo até a falha do componente eletrônico, em horas X ~ exp ( λ ) µ = E(X) = 2000 ⇒ 0005,0 2000 1 ==λ 68 © Tânia F Bogutchi – PUC Minas – Revisão em 2012 Estatística e Probabilidade Unidade 2: Distribuições de Probabilidade P(X > 1000) = )1000)(0005,0(e− = e-0,5 ≅ 0,6065 Questão 12: O tempo de vida de um arranjo mecânico em um teste vibracional é distribuído exponencialmente, com uma média de 400 horas. Se um arranjo estiver em teste por 400 horas sem apresentar falha, a probabilidade de uma falha ocorrer nas próximas 100 horas é aproximadamente: a) 0,7788 b) 0,2212 c) 0,2865 d) 0,7135 Resposta: B Defina X: tempo de vida de um arranjo mecânico, em horas X ~ Exp( λ ) E(X)=400 , mas 400 1 1)( =⇒= λλXE Probabilidade de falhar nas próximas 100 horas: 22119,07788,01e1)100(F)100X(P 400 100 =−=−==≤ − Questão 13: O tempo entre as chegadas de táxi a um movimento cruzamento é distribuído exponencialmente com uma média de 10 minutos. Suponha que você já estivesse esperando uma hora por um taxi, a probabilidade de que o taxi chegue dentro dos próximos 10 minutos é aproximadamente: a) 0,6321 b) 0,3679 c) 0,0091 d) 0,9982 Resposta: A Seja X: tempo entre as chegadas de táxi, em minutos X ~ exp ( λ ) 69 © Tânia F Bogutchi – PUC Minas – Revisão em 2012 Estatística e Probabilidade Unidade 2: Distribuições de Probabilidade µ = E(X) = 10 ⇒ 1,0 10 1 ==λ P(X < 10) = 1- )10)(1,0(e− = 1 – e-1 = 1 – 0,3679 = 0,6321 Questão 14: A vida de um semicondutor a laser, a uma potência constante, é normalmente distribuída com média de 7.000 horas e desvio-padrão de 600 horas. As probabilidades para: (1) que um semicondutor a laser falhe em menos de 5.000 horas; e (2) o tempo de vida em horas que 95% dos lasers excedem; são dadas, respectivamente, por: a) 0,71 ; 5800 b) 1,0 ; 6016 c) 0,0 ; 6016 d) 0,50 ; 5800 Resposta: C Seja a variável aleatória X: vida de um semicondutor a laser, em horas X ~ N (7000; 600) (1) que um semicondutor a laser falhe em menos de 5.000 horas: P(X< 5000) = − < 600 70005000 XP = P(Z < -3,33) ≅ 0,0 (2) o tempo de vida em horas que 95% dos lasers excedem: P (X > x) = 0,95 ⇒ P (Z > z) = 0,95 ⇒ P (Z < z) = 0,05 ⇒ z = - 1,64 x = zσ + µ = (- 1,64) (600) + 7000 = 6.016 horas Questão 15: A velocidade de transferência de um arquivo de um servidor da universidade para um computador pessoal na casa de um estudante, em uma noite de dia de semana, é normalmente distribuída, com média de 60 kbits por segundo e um desvio-padrão de 4 kbits por segundo. A probabilidade de o arquivo se transferir a uma velocidade entre 58 e 70 kbits por segundo é aproximadamente: a) 0,9938 b) 0,6853 c) 0,3085 d) 0,4983 70 © Tânia F Bogutchi – PUC Minas – Revisão em 2012 Estatística e Probabilidade Unidade 2: Distribuições de Probabilidade Resposta: B X: velocidade de transferência arquivos, em kbits/seg X ~ N (60; 4) P(58 ≤ X ≤ 70) = P(X ≤ 70) - P(X ≤ 58) = −≤ 4 6070 ZP - −≤ 4 6058 ZP = P(Z ≤ 2,5) – P(Z ≤ -0,5) = 0,993790 – 0,308538 = 0,685252 71 © Tânia F Bogutchi – PUC Minas – Revisão em 2012 Estatística e Probabilidade Unidade 2: Distribuições de Probabilidade TABELA 1 – Distribuição BINOMIAL P(X = x) para X ~ Bin(n, p) n x 0 ,0 5 0 ,10 0 ,15 0 ,2 0 0 ,25 0 ,30 0 ,35 0 ,4 0 0 ,4 5 0 ,50 0 0,9025 0,81 0,7225 0,6400 0,5625 0,4900 0,4225 0,3600 0,3025 0,2500 2 1 0,095 0,18 0,2550 0,3200 0,3750 0,4200 0,4550 0,4800 0,4950 0,5000 1 2 0,0025 0,01 0,0225 0,0400 0,0625 0,0900 0,1225 0,1600 0,2025 0,2500 0 0 ,9 5 0 ,9 0 0 ,8 5 0 ,8 0 0 ,75 0 ,70 0 ,65 0 ,6 0 0 ,5 5 0 ,50 x n x 0 ,0 5 0 ,10 0 ,15 0 ,2 0 0 ,25 0 ,30 0 ,35 0 ,4 0 0 ,4 5 0 ,50 0 0,8574 0,7290 0,6141 0,5120 0,4219 0,3430 0,2746 0,2160 0,1664 0,1250 3 1 0,13540,2430 0,3251 0,3840 0,4219 0,4410 0,4436 0,4320 0,4084 0,3750 2 2 0,0071 0,0270 0,0574 0,0960 0,1406 0,1890 0,2389 0,2880 0,3341 0,3750 1 3 0,0001 0,0010 0,0034 0,0080 0,0156 0,0270 0,0429 0,0640 0,0911 0,1250 0 0 ,9 5 0 ,9 0 0 ,8 5 0 ,8 0 0 ,75 0 ,70 0 ,65 0 ,6 0 0 ,5 5 0 ,50 x n x 0 ,0 5 0 ,10 0 ,15 0 ,2 0 0 ,25 0 ,30 0 ,35 0 ,4 0 0 ,4 5 0 ,50 0 0,8145 0,6561 0,5220 0,4096 0,3164 0,2401 0,1785 0,1296 0,0915 0,0625 4 1 0,1715 0,2916 0,3685 0,4096 0,4219 0,4116 0,3845 0,3456 0,2995 0,2500 3 2 0,0135 0,0486 0,0975 0,1536 0,2109 0,2646 0,3105 0,3456 0,3675 0,3750 2 3 0,0005 0,0036 0,0115 0,0256 0,0469 0,0756 0,1115 0,1536 0,2005 0,2500 1 4 0,0000 0,0001 0,0005 0,0016 0,0039 0,0081 0,0150 0,0256 0,0410 0,0625 0 0 ,9 5 0 ,9 0 0 ,8 5 0 ,8 0 0 ,75 0 ,70 0 ,65 0 ,6 0 0 ,5 5 0 ,50 x n x 0 ,0 5 0 ,10 0 ,15 0 ,2 0 0 ,25 0 ,30 0 ,35 0 ,4 0 0 ,4 5 0 ,50 0 0,7738 0,5905 0,4437 0,3277 0,2373 0,1681 0,1160 0,0778 0,0503 0,0313 5 1 0,2036 0,3281 0,3915 0,4096 0,3955 0,3602 0,3124 0,2592 0,2059 0,1563 4 2 0,0214 0,0729 0,1382 0,2048 0,2637 0,3087 0,3364 0,3456 0,3369 0,3125 3 3 0,0011 0,0081 0,0244 0,0512 0,0879 0,1323 0,1811 0,2304 0,2757 0,3125 2 4 0,0000 0,0005 0,0022 0,0064 0,0146 0,0284 0,0488 0,0768 0,1128 0,1563 1 5 0,0000 0,0000 0,0001 0,0003 0,0010 0,0024 0,0053 0,0102 0,0185 0,0313 0 0 ,9 5 0 ,9 0 0 ,8 5 0 ,8 0 0 ,75 0 ,70 0 ,65 0 ,6 0 0 ,5 5 0 ,50 x n x 0 ,0 5 0 ,10 0 ,15 0 ,2 0 0 ,25 0 ,30 0 ,35 0 ,4 0 0 ,4 5 0 ,50 0 0,7351 0,5314 0,3771 0,2621 0,1780 0,1176 0,0754 0,0467 0,0277 0,0156 6 1 0,2321 0,3543 0,3993 0,3932 0,3560 0,3025 0,2437 0,1866 0,1359 0,0938 5 2 0,0305 0,0984 0,1762 0,2458 0,2966 0,3241 0,3280 0,3110 0,2780 0,2344 4 3 0,0021 0,0146 0,0415 0,0819 0,1318 0,1852 0,2355 0,2765 0,3032 0,3125 3 4 0,0001 0,0012 0,0055 0,0154 0,0330 0,0595 0,0951 0,1382 0,1861 0,2344 2 5 0,0000 0,0001 0,0004 0,0015 0,0044 0,0102 0,0205 0,0369 0,0609 0,0938 1 6 0,0000 0,0000 0,0000 0,0001 0,0002 0,0007 0,0018 0,0041 0,0083 0,0156 0 0 ,9 5 0 ,9 0 0 ,8 5 0 ,8 0 0 ,75 0 ,70 0 ,65 0 ,6 0 0 ,5 5 0 ,50 x n x 0 ,0 5 0 ,10 0 ,15 0 ,2 0 0 ,25 0 ,30 0 ,35 0 ,4 0 0 ,4 5 0 ,50 0 0,6983 0,4783 0,3206 0,2097 0,1335 0,0824 0,0490 0,0280 0,0152 0,0078 7 1 0,2573 0,3720 0,3960 0,3670 0,3115 0,2471 0,1848 0,1306 0,0872 0,0547 6 2 0,0406 0,1240 0,2097 0,2753 0,3115 0,3177 0,2985 0,2613 0,2140 0,1641 5 3 0,0036 0,0230 0,0617 0,1147 0,1730 0,2269 0,2679 0,2903 0,2918 0,2734 4 4 0,0002 0,0026 0,0109 0,0287 0,0577 0,0972 0,1442 0,1935 0,2388 0,2734 3 5 0,0000 0,0002 0,0012 0,0043 0,0115 0,0250 0,0466 0,0774 0,1172 0,1641 2 6 0,0000 0,0000 0,0001 0,0004 0,0013 0,0036 0,0084 0,0172 0,0320 0,0547 1 7 0,0000 0,0000 0,0000 0,0000 0,0001 0,0002 0,0006 0,0016 0,0037 0,0078 0 0 ,9 5 0 ,9 0 0 ,8 5 0 ,8 0 0 ,75 0 ,70 0 ,65 0 ,6 0 0 ,5 5 0 ,50 x 3 4 5 6 7 p p p p p 2 p p 72 © Tânia F Bogutchi – PUC Minas – Revisão em 2012 Estatística e Probabilidade Unidade 2: Distribuições de Probabilidade n x 0 ,0 5 0 ,10 0 ,15 0 ,2 0 0 ,25 0 ,30 0 ,35 0 ,4 0 0 ,4 5 0 ,50 0 0,6634 0,4305 0,2725 0,1678 0,1001 0,0576 0,0319 0,0168 0,0084 0,0039 8 1 0,2793 0,3826 0,3847 0,3355 0,2670 0,1977 0,1373 0,0896 0,0548 0,0313 7 2 0,0515 0,1488 0,2376 0,2936 0,3115 0,2965 0,2587 0,2090 0,1569 0,1094 6 3 0,0054 0,0331 0,0839 0,1468 0,2076 0,2541 0,2786 0,2787 0,2568 0,2188 5 4 0,0004 0,0046 0,0185 0,0459 0,0865 0,1361 0,1875 0,2322 0,2627 0,2734 4 5 0,0000 0,0004 0,0026 0,0092 0,0231 0,0467 0,0808 0,1239 0,1719 0,2188 3 6 0,0000 0,0000 0,0002 0,0011 0,0038 0,0100 0,0217 0,0413 0,0703 0,1094 2 7 0,0000 0,0000 0,0000 0,0001 0,0004 0,0012 0,0033 0,0079 0,0164 0,0313 1 8 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0002 0,0007 0,0017 0,0039 0 0 ,9 5 0 ,9 0 0 ,8 5 0 ,8 0 0 ,75 0 ,70 0 ,65 0 ,6 0 0 ,5 5 0 ,50 x n x 0 ,0 5 0 ,10 0 ,15 0 ,2 0 0 ,25 0 ,30 0 ,35 0 ,4 0 0 ,4 5 0 ,50 0 0,6302 0,3874 0,2316 0,1342 0,0751 0,0404 0,0207 0,0101 0,0046 0,0020 9 1 0,2985 0,3874 0,3679 0,3020 0,2253 0,1556 0,1004 0,0605 0,0339 0,0176 8 2 0,0629 0,1722 0,2597 0,3020 0,3003 0,2668 0,2162 0,1612 0,1110 0,0703 7 3 0,0077 0,0446 0,1069 0,1762 0,2336 0,2668 0,2716 0,2508 0,2119 0,1641 6 4 0,0006 0,0074 0,0283 0,0661 0,1168 0,1715 0,2194 0,2508 0,2600 0,2461 5 5 0,0000 0,0008 0,0050 0,0165 0,0389 0,0735 0,1181 0,1672 0,2128 0,2461 4 6 0,0000 0,0001 0,0006 0,0028 0,0087 0,0210 0,0424 0,0743 0,1160 0,1641 3 7 0,0000 0,0000 0,0000 0,0003 0,0012 0,0039 0,0098 0,0212 0,0407 0,0703 2 8 0,0000 0,0000 0,0000 0,0000 0,0001 0,0004 0,0013 0,0035 0,0083 0,0176 1 9 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0003 0,0008 0,0020 0 0 ,9 5 0 ,9 0 0 ,8 5 0 ,8 0 0 ,75 0 ,70 0 ,65 0 ,6 0 0 ,5 5 0 ,50 x n x 0 ,0 5 0 ,10 0 ,15 0 ,2 0 0 ,25 0 ,30 0 ,35 0 ,4 0 0 ,4 5 0 ,50 0 0,5987 0,3487 0,1969 0,1074 0,0563 0,0282 0,0135 0,0060 0,0025 0,0010 10 1 0,3151 0,3874 0,3474 0,2684 0,1877 0,1211 0,0725 0,0403 0,0207 0,0098 9 2 0,0746 0,1937 0,2759 0,3020 0,2816 0,2335 0,1757 0,1209 0,0763 0,0439 8 3 0,0105 0,0574 0,1298 0,2013 0,2503 0,2668 0,2522 0,2150 0,1665 0,1172 7 4 0,0010 0,0112 0,0401 0,0881 0,1460 0,2001 0,2377 0,2508 0,2384 0,2051 6 5 0,0001 0,0015 0,0085 0,0264 0,0584 0,1029 0,1536 0,2007 0,2340 0,2461 5 6 0,0000 0,0001 0,0012 0,0055 0,0162 0,0368 0,0689 0,1115 0,1596 0,2051 4 7 0,0000 0,0000 0,0001 0,0008 0,0031 0,0090 0,0212 0,0425 0,0746 0,1172 3 8 0,0000 0,0000 0,0000 0,0001 0,0004 0,0014 0,0043 0,0106 0,0229 0,0439 2 9 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0005 0,0016 0,0042 0,0098 1 10 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0003 0,0010 0 0 ,9 5 0 ,9 0 0 ,8 5 0 ,8 0 0 ,75 0 ,70 0 ,65 0 ,6 0 0 ,5 5 0 ,50 x n x 0 ,0 5 0 ,10 0 ,15 0 ,2 0 0 ,25 0 ,30 0 ,35 0 ,4 0 0 ,4 5 0 ,50 0 0,5688 0,3138 0,1673 0,0859 0,0422 0,0198 0,0088 0,0036 0,0014 0,0005 11 1 0,3293 0,3835 0,3248 0,2362 0,1549 0,0932 0,0518 0,0266 0,0125 0,0054 10 2 0,0867 0,2131 0,2866 0,2953 0,2581 0,1998 0,1395 0,0887 0,0513 0,0269 9 3 0,0137 0,0710 0,1517 0,2215 0,2581 0,2568 0,2254 0,1774 0,1259 0,0806 8 4 0,0014 0,0158 0,0536 0,1107 0,1721 0,2201 0,2428 0,2365 0,2060 0,1611 7 5 0,0001 0,0025 0,0132 0,0388 0,0803 0,1321 0,1830 0,2207 0,2360 0,2256 6 6 0,0000 0,0003 0,0023 0,0097 0,0268 0,0566 0,0985 0,1471 0,1931 0,2256 5 7 0,0000 0,0000 0,0003 0,0017 0,0064 0,0173 0,0379 0,0701 0,1128 0,1611 4 8 0,0000 0,0000 0,0000 0,0002 0,0011 0,0037 0,0102 0,0234 0,0462 0,0806 3 9 0,0000 0,0000 0,0000 0,0000 0,0001 0,0005 0,0018 0,0052 0,0126 0,0269 2 10 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0007 0,0021 0,0054 1 11 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0005 0 0 ,9 5 0 ,9 0 0 ,8 5 0 ,8 0 0 ,75 0 ,70 0 ,65 0 ,6 0 0 ,5 5 0 ,50 x 8 9 10 11 p p p p p 73 © Tânia F Bogutchi – PUC Minas – Revisão em 2012 Estatística e Probabilidade Unidade 2: Distribuições de Probabilidade n x 0 ,0 5 0 ,10 0 ,15 0 ,2 0 0 ,25 0 ,30 0 ,35 0 ,4 0 0 ,4 5 0 ,50 0 0,5404 0,2824 0,1422 0,0687 0,0317 0,0138 0,0057 0,0022 0,0008 0,0002 12 1 0,3413 0,3766 0,3012 0,2062 0,1267 0,0712 0,0368 0,0174 0,0075 0,0029 11 2 0,0988 0,2301 0,2924 0,2835 0,2323 0,1678 0,1088 0,0639 0,0339 0,0161 10 3 0,0173 0,0852 0,1720 0,2362 0,2581 0,2397 0,1954 0,1419 0,0923 0,0537 9 4 0,0021 0,0213 0,0683 0,1329 0,1936 0,2311 0,2367 0,2128 0,1700 0,1208 8 5 0,0002 0,0038 0,0193 0,0532 0,1032 0,1585 0,2039 0,2270 0,2225 0,1934 7 6 0,0000 0,0005 0,0040 0,0155 0,0401 0,0792 0,1281 0,1766 0,2124 0,2256 6 7 0,0000 0,0000 0,0006 0,0033 0,0115 0,0291 0,0591 0,1009 0,1489 0,1934 5 8 0,0000 0,0000 0,0001 0,0005 0,0024 0,0078 0,0199 0,0420 0,0762 0,1208 4 9 0,0000 0,0000 0,0000 0,0001 0,0004 0,0015 0,0048 0,0125 0,0277 0,0537 3 10 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0008 0,0025 0,0068 0,0161 2 11 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0003 0,0010 0,0029 1 12 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0002 0 0 ,9 5 0 ,9 0
Compartilhar