Baixe o app para aproveitar ainda mais
Prévia do material em texto
CURSO ON‐LINE – MATEMÁTICA FINANCEIRA E ESTATÍSTICA – ICMS/RJ PROFESSORES: VÍTOR MENEZES E JUCI MELI www.pontodosconcursos.com.br 1 Aula 3 – Principais distribuições e amostragem I DISTRIBUIÇÃO UNIFORME DISCRETA ............................................................................................. 3 II DISTRIBUIÇÃO DE BERNOULLI .......................................................................................................... 5 III DISTRIBUIÇÃO BINOMIAL .................................................................................................................... 9 1 Introdução .................................................................................................................................................... 9 2 Média e variância da variável binomial ................................................................................................... 15 3 Proporções .................................................................................................................................................. 18 IV DISTRIBUIÇÃO DE POISSON ............................................................................................................... 23 V DISTRIBUIÇÃO UNIFORME CONTÍNUA .......................................................................................... 33 VI DISTRIBUIÇÃO NORMAL ..................................................................................................................... 36 1 Teorema do limite central ......................................................................................................................... 39 2 Utilização das tabelas ................................................................................................................................. 42 3 Aproximação da distribuição binomial com a distribuição normal ...................................................... 58 VII AMOSTRAGEM ................................................................................................................................... 63 1 Amostragem aleatória simples .................................................................................................................. 63 2 Amostragem estratificada ......................................................................................................................... 64 3 Amostragem por conglomerado ............................................................................................................... 64 4 Amostragem sistemática ............................................................................................................................ 65 VIII LISTA DAS QUESTÕES DE CONCURSO ....................................................................................... 69 IX GABARITO DAS QUESTÕES DE CONCURSO .................................................................................. 76 X TABELA DA DISTRIBUIÇÃO NORMAL ............................................................................................. 76 CURSO ON‐LINE – MATEMÁTICA FINANCEIRA E ESTATÍSTICA – ICMS/RJ PROFESSORES: VÍTOR MENEZES E JUCI MELI www.pontodosconcursos.com.br 2 Antes de começarmos a aula, vamos corrigir dois erros cometidos nas aulas anteriores. O primeiro foi no EC 26 da aula 1. Como o exercício fala em variância amostral, então todas as divisões para cálculo de variância deveriam ser feitas por )1( −n . Eu escrevi o seguinte: Inicialmente, a variância era dada por: 20 )5( 20 1 2 2 ∑ = − = i Xi σ Portanto: ∑ ∑ = = =−⇒ − = 20 1 2 20 1 2 20)( 20 )5( 1 i i XXi Xi A soma dos quadrados dos desvios em relação à média é 20. Quando acrescentamos a vigésima primeira observação, igual a 5, teremos o vigésimo primeiro desvio. Esse desvio adicional será nulo. Com isso, a soma dos quadrados dos desvios não se altera. ∑ = =+=− 21 1 2 20020)5( i Xi E a nova variância fica: == − = ∑ = 21 20 21 )5( 21 1 2 2 i Xi σ 0,95 Mas o correto seria: Inicialmente, a variância era dada por: 120 )5( 20 1 2 2 − − = ∑ =i Xi σ Portanto: ∑ ∑ = = =−⇒ − = 20 1 2 20 1 2 19)( 19 )5( 1 i i XXi Xi A soma dos quadrados dos desvios em relação à média é 19. Quando acrescentamos a vigésima primeira observação, igual a 5, teremos o vigésimo primeiro desvio. Esse desvio adicional será nulo. Com isso, a soma dos quadrados dos desvios não se altera. CURSO ON‐LINE – MATEMÁTICA FINANCEIRA E ESTATÍSTICA – ICMS/RJ PROFESSORES: VÍTOR MENEZES E JUCI MELI www.pontodosconcursos.com.br 3 ∑ = =+=− 21 1 2 19019)5( i Xi E a nova variância fica: == − − = ∑ = 20 19 121 )5( 21 1 2 2 i Xi σ 0,95 O segundo erro foi no EP 5 da aula 2. Eu escrevi: Nestes casos, a probabilidade da soma é igual à soma das probabilidades dos eventos. %506/33/13/13/1)6()4()2()_( ==++=++= PPPparsairP Mas o correto seria: Nestes casos, a probabilidade da soma é igual à soma das probabilidades dos eventos. %506/36/16/16/1)6()4()2()_( ==++=++= PPPparsairP Agradecemos aos alunos que perceberam os erros e nos avisaram. Vamos à aula de hoje! I DISTRIBUIÇÃO UNIFORME DISCRETA A distribuição uniforme discreta é o tipo mais simples de variável aleatória. É a variável em que todos os valores têm a mesma probabilidade de ocorrer. Um exemplo bem simples, e que já temos trabalhado, é o caso do lançamento do dado de seis faces. A variável que designa o resultado do lançamento é discreta (podem ocorrer apenas os valores 1, 2, 3, 4, 5 e 6). Além disso, se o dado for honesto, todos os resultados são equiprováveis. Dizemos que a variável em questão é discreta e uniforme. Seja X a variável discreta uniforme que pode assumir ‘n’ resultados diferentes ( 1x , 2x , 3x , ..., nx ). A esperança de X fica: ∑ = ×= n i ixn XE 1 1][ A esperança é simplesmente a média aritmética de todos os valores que podem ocorrer. EXERCÍCIOS PROPOSTOS EP 1 Considere uma variável aleatória X, uniforme e discreta, que pode assumir os valores 5, 6, 7 e 8. Calcule a esperança desta variável. CURSO ON‐LINE – MATEMÁTICA FINANCEIRA E ESTATÍSTICA – ICMS/RJ PROFESSORES: VÍTOR MENEZES E JUCI MELI www.pontodosconcursos.com.br 4 EP 2 Para a variável aleatória definida no exercício anterior, faça o esboço do gráfico da função de distribuição de probabilidade. RESOLUÇÃO DOS EXERCÍCIOS PROPOSTOS Resolução do EP 1 A variável é uniforme discreta. A esperança é simplesmente a média dos valores que X pode assumir. ( ) 5,6 4 268765 4 1][ ==+++×=XE A esperança de X é 6,5. Resolução do EP 2. A variável aleatória é discreta. A FDP vai apresentar saltos (lembram? matéria da aula passada). Será em forma de escada. Os saltos ocorrem justamente nos valores em que X assume. Os tamanhos dos degraus correspondem às probabilidades de cada valor ocorrer. Para x entre 4 e 5, a FDP é nula. A título de exemplo, tomemos x = 4,5. A probabilidade de X assumir valores menores ou iguais a 4,5 é zero. Não há nenhum caso favorável dentre os casos possíveis. Em x = 5, a FDP dá um salto. A probabilidade de X assumir valores menores ou iguais a 5 é de 1/4. Temos 1 caso favorável (o próprio 5) em 4 possíveis. Para x entre 5 e 6, a FDP segue em 1/4. Como exemplo, tomemos o valor x = 5,5. A probabilidade de x ser menor ou igual a 5,5 continua sendo de 1/4 (temos um caso favorável – 5 – em 4 possíveis – 5, 6, 7, 8). Em x = 6 temos outro salto. A probabilidade de X assumir valores menores ou iguais a 6 é de 2/4. Temos dois casos favoráveis (5 e 6) em quatro possíveis. Em x = 7 temos outro salto. A FDP passa para 3/4. Em x = 8 temos o último salto. A FDP vai para 4/4. A probabilidade de X assumir valores menores ou iguais a 8 é de 100%. CURSO ON‐LINE – MATEMÁTICA FINANCEIRA E ESTATÍSTICA – ICMS/RJ PROFESSORES: VÍTOR MENEZES E JUCI MELI www.pontodosconcursos.com.br 5 EC 1. TJ RO 2008 [CESGRANRIO] Uma urna contémdez bolas, cada uma gravada com um número diferente, de 1 a 10. Uma bola é retirada da urna aleatoriamente e X é o número marcado nesta bola. X é uma variável aleatória cujo(a) (A) desvio padrão é 10. (B) primeiro quartil é 0,25. (C) média é 5. (D) distribuição de probabilidades é uniforme. (E) distribuição de probabilidades é assimétrica. Resolução. A variável X é discreta (assume apenas os valores inteiros de 1 a 10). Além disso, ela é uniforme, pois todas as possíveis realizações têm probabilidade de 10% (ou seja, as probabilidades são todas iguais entre si). Gabarito: D II DISTRIBUIÇÃO DE BERNOULLI São de grande importância alguns tipos de experimento em que a variável de interesse pode assumir apenas dois valores. Podemos falar em sucessos e fracassos. Um exemplo é o lançamento de uma moeda. Temos dois resultados possíveis (cara e coroa). Podemos considerar que “cara” é sucesso e “coroa” é fracasso. Em casos assim, é comum atribuirmos ao sucesso o valor 1 e ao fracasso o valor zero. Seja X a variável aleatória que assume o valor 1 quando o resultado do lançamento da moeda é cara e que assume o valor 0 quando o resultado do lançamento é coroa. A variável aleatória X assume apenas os valores 0 e 1. É uma variável de Bernoulli. Além disso, X é também uma variável discreta (pois assume apenas alguns valores, quais sejam, 0 e 1). CURSO ON‐LINE – MATEMÁTICA FINANCEIRA E ESTATÍSTICA – ICMS/RJ PROFESSORES: VÍTOR MENEZES E JUCI MELI www.pontodosconcursos.com.br 6 Caso a moeda seja honesta, então a probabilidade de sucesso é igual à probabilidade de fracasso (e ambas valem 50%). Mudemos de exemplo. Considere o lançamento de um dado de seis faces. Se sair um múltiplo de 3, consideramos sucesso. Se não sair um múltiplo de 3, consideramos fracasso. Vamos criar uma variável aleatória I. A nossa variável aleatória I vai se comportar da seguinte forma. Se o resultado do lançamento do dado for 1, 2, 4, 5, teremos fracasso. Então I assume valor zero. Se o resultado do lançamento do dado for 3 ou 6, teremos sucesso. Então I assume valor 1. Dizemos que I é uma variável de Bernoulli. Ela tem a seguinte distribuição de probabilidade: I P 0 2/3 1 1/3 A probabilidade de I assumir o valor zero é 2/3. E a probabilidade de I assumir o valor 1 é 1/3. → VARIÁVEL DE BERNOULLI: ASSUME APENAS OS VALORES 0 E 1 A probabilidade de a variável assumir o valor zero não necessariamente é igual à probabilidade de assumir o valor 1. A grande importância da variável de Bernoulli, em termos de concursos, é que ela serve pra gente estudar uma outra variável: a Binomial. EP 3 Considere a distribuição de probabilidades para a variável Y: Y Probabilidade 1 0,5 2 0,2 3 0,3 a) a variável Y é discreta ou contínua? b) a variável Y é uniforme? Por quê? c) a variável Y tem distribuição de Bernoulli? Por quê? d) calcule a esperança e a variância de Y. EP 4 Considere a distribuição de probabilidades para a variável Z: Z Probabilidade 1,24 0,25 2 0,25 6,55 0,25 100 0,25 CURSO ON‐LINE – MATEMÁTICA FINANCEIRA E ESTATÍSTICA – ICMS/RJ PROFESSORES: VÍTOR MENEZES E JUCI MELI www.pontodosconcursos.com.br 7 a) a variável Z é discreta ou contínua? b) a variável Z é uniforme? Por quê? c) a variável Z tem distribuição de Bernoulli? Por quê? EP 5 Considere a distribuição de probabilidades para a variável K: K Probabilidade 0 0,5 1 0,5 a) a variável K é discreta ou contínua? b) a variável K é uniforme? Por quê? c) a variável K tem distribuição de Bernoulli? Por quê? EP 6 Considere a distribuição de probabilidades para a variável T: T Probabilidade 0 0,75 1 0,25 a) a variável T é discreta ou contínua? b) a variável T é uniforme? Por quê? c) a variável T tem distribuição de Bernoulli? Por quê? RESOLUÇÃO DOS EXERCÍCIOS PROPOSTOS Resolução do EP 3 Foi dada a seguinte distribuição de probabilidade. Y Probabilidade 1 0,5 2 0,2 3 0,3 A variável Y é discreta. Ela não pode assumir qualquer valor em um dado intervalo real. A variável Y não pode ser classificada como uniforme. Na variável discreta uniforme, as probabilidades de ocorrência de cada valor são todas iguais entre si. Não é o caso desta questão. A probabilidade de Y ser igual a 1 é maior que a probabilidade de Y ser igual a 2. A variável Y também não pode ser classificada como de Bernoulli. A variável Y não assume apenas os valores zero e 1. Portanto, não tem distribuição de Bernoulli. Vamos agora calcular a esperança de Y. Como fazemos para qualquer variável discreta, consideramos que a probabilidade é análoga à freqüência relativa simples. ∑ ×= )()( ii yPyYE 8,19,04,05,03,032,025,01)( =++=×+×+×=YE CURSO ON‐LINE – MATEMÁTICA FINANCEIRA E ESTATÍSTICA – ICMS/RJ PROFESSORES: VÍTOR MENEZES E JUCI MELI www.pontodosconcursos.com.br 8 Finalmente, vamos calcular a variância de Y. 47,28,05,03,032,025,01)( 2222 =++=×+×+×=YE Logo: 22 )()( YYEYV μ−= 76,08,14)( 2 =−=YV Resolução do EP 4 Foi dada a seguinte distribuição: Z Probabilidade 1,24 0,25 2 0,25 6,55 0,25 100 0,25 A variável Z assume apenas alguns valores (são apenas 4). Ela é uma variável discreta. Muita gente confunde isso. O fato de uma variável aleatória assumir valores não inteiros (como 1,24 ou como raiz de 2) não significa que ela seja contínua. Se a variável Z fosse contínua ela poderia assumir qualquer valor real contido num dado intervalo. Note que as probabilidades de todos os valores são iguais entre si (todas valem 0,25). A variável Z é, portanto, uniforme. Por outro lado, como ela não assume apenas os valores zero e 1, ela não pode ser classificada como de Bernoulli. Resolução do EP 5 Foi dada a seguinte distribuição de probabilidade: K Probabilidade 0 0,5 1 0,5 A variável K assume apenas alguns valores. Ela é discreta. Além disso, as probabilidades são todas iguais entre si (valem 0,5 cada uma). Podemos classificar a variável K como uniforme. Por fim, a variável K assume apenas os valores zero e 1. Isso faz com que ela, além de ser discreta uniforme, tenha distribuição de Bernoulli. Resolução do EP 6 T Probabilidade 0 0,75 1 0,25 A variável T é discreta. Contudo, não é uniforme, pois as probabilidades não são iguais entre si (a probabilidade de T ser igual a zero é maior que a probabilidade de T ser igual a 1). CURSO ON‐LINE – MATEMÁTICA FINANCEIRA E ESTATÍSTICA – ICMS/RJ PROFESSORES: VÍTOR MENEZES E JUCI MELI www.pontodosconcursos.com.br 9 De modo diverso, T pode ser classificada como de Bernoulli, pois assume apenas os valores zero e 1. III DISTRIBUIÇÃO BINOMIAL 1 Introdução A distribuição binomial é aplicável quando temos vários experimentos independentes e, a cada um deles, associamos apenas dois resultados. Podemos pensar em resultados favoráveis e resultados desfavoráveis. Ou em sucessos e fracassos. Por exemplo: vamos lançar um dado. Vamos considerar um resultado favorável (sucesso) se sair um múltiplo de 3. Vamos considerar um resultado desfavorável (fracasso) se não sair um múltiplo de 3. Seja “I” a variável que, em caso de sucesso, assume o valor 1. E, em caso de fracasso, assume o valor zero. A cada lançamento, a probabilidade de ocorrer um evento favorável é de 1/3 (ou seja, a probabilidade de I = 1 é de 1/3). E a probabilidade de ocorrer um evento desfavorável é 2/3 (a probabilidade de I = 0 é 2/3). Como já vimos, “I” é uma variável de Bernoulli. Segue a distribuição de probabilidades da variável I: I Probabilidade 0 2/3 1 1/3 Muito bem, só que não vamos lançar o dado uma única vez. Vamos lançar o dado três vezes. A variável aleatória X vai representar o número de sucessos em três lançamentos. Um possível resultado dos três lançamentos seria: 2, 4, 3. Vamos ver como se comporta a variável “I” em cada um destes lançamentos. • 1º lançamento: 2 ⇒ I = 0 (tivemos um fracasso, pois não saiu um múltiplo de 3) • 2º lançamento:4 ⇒ I = 0 (tivemos outro fracasso, pois não saiu um múltiplo de 3) • 3º lançamento: 3 ⇒ I = 1 (tivemos um sucesso, pois saiu um múltiplo de 3). Nesse caso, em três lançamentos, o número de casos favoráveis foi de 1 (X = 1). Se somarmos todos os valores que “I” assume, temos exatamente 1. Ou seja, “X” é igual à soma de todos os valores de “I”. Vamos mudar um pouco o exemplo. Suponhamos agora que os resultados dos três lançamentos foram: 3, 1, 6. Vamos ver como se comporta a variável I em cada lançamento: • 1º lançamento: 3 ⇒ I = 1 • 2º lançamento: 1 ⇒ I = 0 • 3º lançamento: 6 ⇒ I = 1 Nesse outro caso, em três lançamentos, o número de casos favoráveis foi de 2 (X = 2). Se somarmos todos os valores que “I” assume, temos exatamente 2. Novamente, X é igual à soma de todos os valores de “I”. CURSO ON‐LINE – MATEMÁTICA FINANCEIRA E ESTATÍSTICA – ICMS/RJ PROFESSORES: VÍTOR MENEZES E JUCI MELI www.pontodosconcursos.com.br 10 Esta variável X é dita binomial. Ela representa o número de casos favoráveis em um conjunto de experimentos que só admitem dois resultados possíveis (sucesso ou fracasso). Ela é a soma de várias variáveis de Bernoulli. → VARIÁVEL BINOMIAL Corresponde à soma de várias variáveis de Bernoulli. Tem relação com o número de resultados favoráveis em ‘n’ experimentos. É muito importante o candidato saber a fórmula da probabilidade da variável binomial. No nosso exemplo, a variável binomial X só pode assumir quatro valores (0, 1, 2 e 3). São três lançamentos do dado. Ou não temos nenhum sucesso. Ou apenas 1. Ou 2. Ou então, em três lançamentos, temos três sucessos (múltiplos de 3 em todos os lançamentos). Vamos calcular a probabilidade de X assumir cada um desses valores. Para X ser igual a zero, precisamos que, nos três lançamentos, tenhamos números que não são múltiplos de 3. Queremos que ocorram, simultaneamente, os três eventos: • Fracasso no primeiro lançamento • Fracasso no segundo lançamento • Fracasso no terceiro lançamento Observe que o resultado de um lançamento não tem qualquer influência no resultado dos demais lançamentos. São três eventos independentes. Todos eles têm probabilidade de 2/3 de ocorrer. Nesse caso, como já vimos na aula 4, a probabilidade da intersecção dos eventos é igual ao produto das probabilidades. 3 2 3 2 3 2)0( ××==XP 3 3 2)0( ⎟ ⎠ ⎞ ⎜ ⎝ ⎛==XP Para X ser igual a 1, precisamos ter exatamente 1 lançamento com sucesso. Temos as seguintes hipóteses: • Sucesso no primeiro lançamento, fracasso no segundo lançamento, fracasso no terceiro lançamento; • Fracasso no primeiro lançamento, sucesso no segundo lançamento, fracasso no terceiro lançamento; • Fracasso no primeiro lançamento, fracasso no segundo lançamento, sucesso no terceiro lançamento. Vamos ver a probabilidade para o primeiro caso. Temos: • Sucesso no primeiro lançamento • Fracasso no segundo lançamento • Fracasso no terceiro lançamento CURSO ON‐LINE – MATEMÁTICA FINANCEIRA E ESTATÍSTICA – ICMS/RJ PROFESSORES: VÍTOR MENEZES E JUCI MELI www.pontodosconcursos.com.br 11 São três eventos independentes. O primeiro tem probabilidade 1/3. Os demais têm probabilidade de 2/3 de ocorrer. A probabilidade da intersecção fica: 3 2 3 2 3 1 ×× Para os demais casos, a conta é exatamente a mesma. Ou seja, a probabilidade de X ser igual a 1 fica: ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ ×××== 3 2 3 2 3 13)1(XP Para X ser igual a 2, precisamos de dois sucessos e um fracasso. Temos as seguintes hipóteses: • Sucesso no primeiro lançamento, sucesso no segundo lançamento, fracasso no terceiro lançamento; • Fracasso no primeiro lançamento, sucesso no segundo lançamento, sucesso no terceiro lançamento; • Sucesso no primeiro lançamento, fracasso no segundo lançamento, sucesso no terceiro lançamento. Vejamos a probabilidade da primeira hipótese. São três eventos independentes. A probabilidade de sucesso é 1/3. A de fracasso é 2/3. Ficamos com: 3 2 3 1 3 1 ×× Para as demais hipóteses, as contas são análogas. A probabilidade de X ser igual a 2 fica: ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ ×××== 3 2 3 1 3 13)2(XP ⎟ ⎠ ⎞ ⎜ ⎝ ⎛×⎟ ⎠ ⎞ ⎜ ⎝ ⎛×== 3 2 3 13)2( 2 XP Finalmente, para X ser igual a 3, precisamos de sucessos nos três lançamentos. Ficamos com: ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ ××== 3 1 3 1 3 1)3(XP Pronto. Calculamos as probabilidades de X assumir cada um dos valores possíveis. Seja ‘n’ o número de experimentos. Seja ‘p’ a probabilidade de sucesso em cada experimento. Seja ‘q’ a probabilidade de fracasso. Nesse nosso exemplo, lançamos o dado 3 vezes (n = 3). E a probabilidade de sucesso em cada lançamento era de 1/3 (p = 1/3). A probabilidade de fracasso em cada experimento era de 2/3 (q = 2/3). Para não precisarmos ficar fazendo todas essas contas que fizemos acima para cada problema diferente, existe uma fórmula que indica a probabilidade da variável binomial assumir um dado valor. É a que segue: CURSO ON‐LINE – MATEMÁTICA FINANCEIRA E ESTATÍSTICA – ICMS/RJ PROFESSORES: VÍTOR MENEZES E JUCI MELI www.pontodosconcursos.com.br 12 knk qp k n kXP −××⎟ ⎠ ⎞ ⎜ ⎝ ⎛ == )( Não custa relembrar o significado do símbolo de combinação: !)!( ! kkn n k n ×− =⎟ ⎠ ⎞ ⎜ ⎝ ⎛ Vamos ver a aplicação da fórmula ao nosso exemplo do dado. Lançamos o dado três vezes ( 3=n ). Consideramos sucesso se der múltiplo de 3. Assim, a probabilidade de sucesso é 1/3 ( 3/1=p ) e a probabilidade de fracasso é 2/3 ( 3/2=q ). Vamos calcular, a título de exemplo, a probabilidade de X ser igual a 2 ( 2=k ). knk qp k n kXP −××⎟ ⎠ ⎞ ⎜ ⎝ ⎛ == )( 232 3 2 3 1 2 3 )2( − ⎟ ⎠ ⎞ ⎜ ⎝ ⎛×⎟ ⎠ ⎞ ⎜ ⎝ ⎛×⎟ ⎠ ⎞ ⎜ ⎝ ⎛ ==XP 12232 3 2 3 13 3 2 3 1 !2!1 !3)2( ⎟ ⎠ ⎞ ⎜ ⎝ ⎛×⎟ ⎠ ⎞ ⎜ ⎝ ⎛×=⎟ ⎠ ⎞ ⎜ ⎝ ⎛×⎟ ⎠ ⎞ ⎜ ⎝ ⎛× × == − XP Que é o mesmo resultado que tínhamos achado antes, sem a fórmula. → LEMBRETE DE VARIÁVEL BINOMIAL Seja X nossa variável binomial. Ela representa o número de sucessos em “n” experimentos (onde cada experimento pode resultar em sucesso ou em fracasso). A fórmula da variável binomial é a que segue. A probabilidade de termos k sucessos em n experimentos é: knk qp k n kXP −××⎟ ⎠ ⎞ ⎜ ⎝ ⎛ == )( Onde p é a probabilidade de sucesso em cada experimento e q é a probabilidade de fracasso em cada experimento. Vamos praticar um pouco. EP 7 Qual a probabilidade de, lançando uma moeda três vezes, obtermos exatamente duas caras? Resolução do EP 7. Vamos considerar que cada lançamento é um experimento. O sucesso é sair cara. O fracasso é sair coroa. A probabilidade de sucesso é igual à de fracasso que é igual a 50%. 5,0== qp São três experimentos. CURSO ON‐LINE – MATEMÁTICA FINANCEIRA E ESTATÍSTICA – ICMS/RJ PROFESSORES: VÍTOR MENEZES E JUCI MELI www.pontodosconcursos.com.br 13 3=n Queremos que X assuma valor 2 (queremos dois sucessos). 2=k A probabilidade fica: knk qp k n kXP −××⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ == )( 232 5,05,0 2 3 )2( −××⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ ==XP 232 5,05,0 !1!2 !3)2( −×× × ==XP 8 35,05,03)2( 12 =××==XP EC 2. Sefaz RJ 2007 [FGV] Um candidato se submete a uma prova contendo três questões de múltipla escolha precisando acertar pelo menos duas para ser aprovado. Cada questão apresenta cinco alternativas, mas apenas uma é correta. Se o candidato não se preparou e decide responder a cada questão ao acaso, a probabilidade de ser aprovado no concurso é igual a: (A) 0,104. (B) 0,040. (C) 0,096. (D) 0,008. (E) 0,200 Resolução. Quando analisamos uma única questão, podemos ter sucesso (acerta a questão) ou fracasso (erra a questão). A probabilidade de sucesso é de 20% e a de fracasso é 80%. 2,0=p ; 8,0=q Assim, quando analisamos uma única questão, temos uma distribuição de Bernoulli. A quantidade de sucessos em três experimentos corresponde, portanto, à soma de três variáveis de Bernoulli. Temos uma distribuição binomial. A probabilidade de 2 acertos em três é: knk qp k n kXP −⎟ ⎠ ⎞ ⎜ ⎝ ⎛ == )( =××⎟⎠ ⎞ ⎜ ⎝ ⎛ == 12 8,02,0 2 3 )2(XP 0,096 CURSO ON‐LINE – MATEMÁTICA FINANCEIRA E ESTATÍSTICA – ICMS/RJ PROFESSORES: VÍTOR MENEZES E JUCI MELI www.pontodosconcursos.com.br 14 A probabilidade de 3 acertos é: =××⎟ ⎠ ⎞ ⎜ ⎝ ⎛ == 03 8,02,0 3 3 )3(XP 0,008 A probabilidade de ser aprovado é: 104,0008,0096,0)3()2( =+==+= XPXP Gabarito: A EC 3. SEFAZ/MG – 2005 [ESAF]. Suponha que a probabilidade de que se encontre um erro contábil grave em uma auditoria seja 0,2. Se dez auditorias independentes são realizadas, assinale a opção que dá a probabilidade de que não mais do que uma detecte erro contábil grave. a) 5/48,2 × b) 0,400 c) 0,210 d) ( )105/48,2 × e) ( )95/48,2 × Resolução. Podemos pensar que cada auditoria é um experimento. Em cada experimento, o sucesso ocorre quando é encontrado um erro grave. Queremos que o número de sucessos seja zero ou 1. Podemos dividir o problema em duas partes. Primeiro: calculando a probabilidade de termos zero sucessos (k = 0). · n = 10 · p = 0,2 · q = 0,8 · k = 0 A probabilidade fica: knk qp k n kXP −××⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ == )( 0100 8,02,0 0 10 )0( −××⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ ==XP 0108,011)0( −××==XP 108,0)0( ==XP CURSO ON‐LINE – MATEMÁTICA FINANCEIRA E ESTATÍSTICA – ICMS/RJ PROFESSORES: VÍTOR MENEZES E JUCI MELI www.pontodosconcursos.com.br 15 Segundo: calculando a probabilidade de termos um sucesso (k = 1). · n = 10 · p = 0,2 · q = 0,8 · k = 1 A probabilidade fica: knk qp k n kXP −××⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ == )( 1101 8,02,0 1 10 )1( −××⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ ==XP 91 8,02,010)1( ××==XP 91 8,02,010)1( ××==XP 98,02)1( ×==XP Somando as duas probabilidades, ficamos com: ==∪= )10( XXP 910 8,028,0 ×+ ==∪= )10( XXP )28,0(8,0 9 +× Lembrando que 5/48,0 = , temos: ==∪= )10( XXP )8,2()5/4( 9 × Gabarito: E. 2 Média e variância da variável binomial Vamos continuar com o lançamento do dado. O resultado é considerado favorável se sair um múltiplo de 3. É desfavorável se não sair um múltiplo de 3. Vamos lançar o dado 3 vezes. Nossa variável aleatória X vai representar o número de casos favoráveis nesses lançamentos. É, portanto, uma variável binomial. Vamos calcular a probabilidade de X assumir cada valor. Já até fizemos essa conta quando começamos a estudar a variável binomial. Mas ok, vamos lá de novo. Para X assumir valor zero, precisamos que os três lançamentos sejam desfavoráveis. · n = 3 · k = 0 · p = 1/3 · q = 2/3 CURSO ON‐LINE – MATEMÁTICA FINANCEIRA E ESTATÍSTICA – ICMS/RJ PROFESSORES: VÍTOR MENEZES E JUCI MELI www.pontodosconcursos.com.br 16 030 3 2 3 1 0 3 )0( − ⎟ ⎠ ⎞ ⎜ ⎝ ⎛×⎟ ⎠ ⎞ ⎜ ⎝ ⎛×⎟ ⎠ ⎞ ⎜ ⎝ ⎛ ==XP 27 8 3 2 3 1 !0!3 !3)0( 030 =⎟ ⎠ ⎞ ⎜ ⎝ ⎛×⎟ ⎠ ⎞ ⎜ ⎝ ⎛× × == − XP Para X assumir valor 1, precisamos que exatamente um dos três lançamentos resulte em múltiplo de 3. · n = 3 · k = 1 · p = 1/3 · q = 2/3 27 12 3 2 3 13 3 2 3 1 !1!2 !3)1( 21131 =⎟ ⎠ ⎞ ⎜ ⎝ ⎛×⎟ ⎠ ⎞ ⎜ ⎝ ⎛×=⎟ ⎠ ⎞ ⎜ ⎝ ⎛×⎟ ⎠ ⎞ ⎜ ⎝ ⎛× × == − XP Para X assumir o valor 2, precisamos que exatamente dois dos três lançamentos resultem em múltiplo de 3. · n = 3 · k = 2 · p = 1/3 · q = 2/3 27 6 3 2 3 13 3 2 3 1 !2!1 !3)2( 12232 =⎟ ⎠ ⎞ ⎜ ⎝ ⎛×⎟ ⎠ ⎞ ⎜ ⎝ ⎛×=⎟ ⎠ ⎞ ⎜ ⎝ ⎛×⎟ ⎠ ⎞ ⎜ ⎝ ⎛× × == − XP Por fim, para X assumir o valor 3, precisamos que todos os lançamentos resultem em múltiplo de 3. · n = 3 · k = 3 · p = 1/3 · q = 2/3 27 1 3 2 3 11 3 2 3 1 !3!0 !3)3( 03333 =⎟ ⎠ ⎞ ⎜ ⎝ ⎛×⎟ ⎠ ⎞ ⎜ ⎝ ⎛×=⎟ ⎠ ⎞ ⎜ ⎝ ⎛×⎟ ⎠ ⎞ ⎜ ⎝ ⎛× × == − XP Queremos calcular a média desta variável aleatória. Vimos como fazer isto na aula passada. Basta considerarmos que as probabilidades são freqüências relativas. X P PX × 0 8/27 0 1 12/27 12/27 2 6/27 12/27 3 1/27 3/27 Total 1 1 E a média da nossa variável X fica: CURSO ON‐LINE – MATEMÁTICA FINANCEIRA E ESTATÍSTICA – ICMS/RJ PROFESSORES: VÍTOR MENEZES E JUCI MELI www.pontodosconcursos.com.br 17 1 1 1 ==μ Vamos agora calcular a sua variância. X 2e P Pe ×2 0 1 8/27 8/27 1 0 12/27 0 2 1 6/27 6/27 3 4 1/27 4/27 Total 1 18/27 Só lembrando: usamos o símbolo “e” para indicar o desvio em relação à média aritmética. A variância de X seria: 3 2 27 182 ==σ Só que todo esse passo a passo dá muito trabalho. Quando X for uma variável aleatória binomial, um jeito mais rápido de calcular a sua média e sua variância é: np=μ npq=2σ Para calcular a média, basta multiplicar o número de experimentos (no nosso caso, lançamos o dado três vezes, n = 3) pela probabilidade de sucesso em 1 experimento (neste caso, em um lançamento, a probabilidade de sair um múltiplo de 3 é 1/3). Logo: np=μ 1 3 13 =×=μ E para variância fazemos a mesma coisa. Só que, além dos passos acima, multiplicamos pela probabilidade de fracasso em um experimento (neste caso, em um lançamento, a probabilidade de sair um número que não seja múltiplo de 3 é 2/3). npq=2σ 3 2 3 2 3 132 =××=σ Outro exemplo. EP 8 Seja X o número de resultados “coroa” em cinco lançamentos de uma moeda honesta. Calcule a média e a variância de X. RESOLUÇÃO DO EP 8. A cada lançamento da moeda, podemos ter um sucesso (sair coroa) ou um fracasso (sair cara). A variável X está relacionada com o número de sucessos. Portanto, é uma variável binomial. CURSO ON‐LINE – MATEMÁTICA FINANCEIRA E ESTATÍSTICA – ICMS/RJ PROFESSORES: VÍTOR MENEZES E JUCI MELI www.pontodosconcursos.com.br 18 Temos as seguintes informações: · n = 5 (são 5 experimentos, ou cinco lançamentos da moeda) · p = 0,5 (a probabilidade de sucesso é 50%) · q = 0,5 (a probabilidade de fracasso é 50%) A média fica: np=μ 5,25,05 =×=μ . A variância é dada por: npq=2σ 25,12 =××= qpnσ O que isto significa? Significa que, se fosse possível repetir este experimento inúmeras vezes (ou seja, se fosse possível fazer infinitas vezes a seqüência de 5 lançamentos da moeda), em média, obteríamos 2,5 coroas para cada seqüência de 5 lançamentos. Não estamos dizendo que, para um dado conjunto de 5 lançamentos, serão obtidas 2,5 coroas. Pra falar a verdade, isso é impossível (não dá para obter um número “quebrado” de coroas; não faz sentido dizer que obtivemos meia coroa). Podemos pensar o seguinte. Por cem mil vezes nós fazemos os 5 lançamentos. Observem que cem mil é um número bem grandão. Em cada um destes cem mil conjuntos de 5 lançamentos, nós anotamos quantas coroas foram obtidas (= valor de X, que pode variar de zero a 5). Obteremos cem mil valores para X. A média de todos esses cem mil valores de X será bem próxima de 2,5. É isto que estamos dizendo. E mais: quanto mais aumentarmos o número de experimentos, mais a média de X se aproxima de 2,5. O mesmo vale para a variância. A variância destes cem mil valores de X será bem próxima de 1,25. → MÉDIA E VARIÂNCIA DA VARIÁVEL BINOMIAL np=μ npq=2σ 3 Proporções A distribuição binomial é muito aplicada quando estamos interessados em proporções de uma dada população. Considere uma cidade com 100.000 habitantes em que 2/5 são favoráveis a uma dada política urbana. Ou ainda: a proporção de habitantes favoráveis à política urbana é de 40%. Vamos entrevistar cinco pessoas ao acaso. A nossa variável aleatória X vai designar o número de pessoas entrevistadas que são favoráveis à política urbana. Primeiramente, vamos supor que nosso processo ocorre com reposição. CURSO ON‐LINE – MATEMÁTICA FINANCEIRA E ESTATÍSTICA – ICMS/RJ PROFESSORES: VÍTOR MENEZES E JUCI MELI www.pontodosconcursos.com.br 19 Como assim? O que significa “processo com reposição”? Listamos todas as pessoas. Sorteamos uma. Entrevistamos tal pessoa. Depois disso, o nome dela volta para a lista, podendo ser sorteada novamente. A nossa variável X pode assumir os valores 0, 1, 2, 3, 4, 5. É um caso análogo ao lançamento do dado. São cinco experimentos independentes e, em cada um deles, a probabilidade de ocorrer o resultado favorável éde 2/5. Como X designa o número de pessoas favoráveis à política (= número de sucessos), X é uma variável binomial. Assim, temos: · n = 5 (número de experimentos) · p = 2/5 (probabilidade de resultado favorável em um experimento – é o mesmo valor da proporção de pessoas favoráveis à política) · q = 3/5 (probabilidade de resultado desfavorável em um experimento) A probabilidade de X assumir cada um dos valores possíveis é dada abaixo: X P 0 0,07776 1 0,2592 2 0,3456 3 0,2304 4 0,0768 5 0,01024 Todos os valores acima foram calculados com a fórmula da variável binomial dada abaixo. knk qp k n kXP −××⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ == )( É por isso que a proporção está relacionada com a variável binomial. Ela tem relação com a probabilidade de sucesso e fracasso (valores de p e q). Vamos agora mudar um pouco o exemplo. Poderíamos fazer a entrevista de um modo um pouco diferente. Podemos fazer um experimento sem reposição, o que é até mais comum. Não queremos entrevistar a mesma pessoa duas vezes. Uma vez que um nome é sorteado, ele não volta para lista, de modo que uma pessoa jamais poderia ser sorteada mais de uma vez. Neste caso, não temos mais uma variável binomial. Continuamos tendo cinco experimentos. Só que eles não são mais independentes entre si (e, para termos variável binomial, os n eventos têm que ser independentes). A probabilidade de, no segundo experimento, ser entrevistada uma pessoa favorável à política urbana depende do resultado do primeiro experimento. São 100.000 habitantes. 40.000 são favoráveis à referida política. 60.000 são contrários. Suponhamos que a primeira pessoa entrevistada foi favorável à política. Entrevistada a primeira pessoa, a situação é a seguinte: CURSO ON‐LINE – MATEMÁTICA FINANCEIRA E ESTATÍSTICA – ICMS/RJ PROFESSORES: VÍTOR MENEZES E JUCI MELI www.pontodosconcursos.com.br 20 · temos agora 99.999 pessoas · restaram 39.999 favoráveis à política A probabilidade de a segunda pessoa também ser favorável é: 39.999/99.999. Este número é diferente de 2/5. De outro modo, se a primeira pessoa foi contrária à referida política, temos: · 99.999 pessoas ainda restam com chances de serem entrevistadas · todas as 40.000 favoráveis à política ainda podem ser entrevistadas A probabilidade da segunda pessoa ser favorável é: 40.000/99.999, que também é diferente de 2/5. Notem que a probabilidade de sucesso e fracasso no segundo experimento (na segunda entrevista) depende do resultado do experimento anterior. Ou seja, os experimentos não são independentes. Conclusão: não temos uma variável binomial. Mesmo nossa variável não sendo exatamente binomial, obedecidas algumas condições, podemos considerá-la aproximadamente binomial. É exatamente o caso acima. Para ficar mais claro, vamos para uma situação extrema. Suponha que as quatro primeiras pessoas entrevistadas foram favoráveis à política. Qual a probabilidade da quinta pessoa também ser? · restam 99.996 pessoas · destas, 39.996 são favoráveis à política urbana Portanto, a probabilidade procurada é: 39.996/99.996 = 0,399976. Este número é muito próximo de 2/5 (=0,4). A proximidade é tanta que podemos considerar que esta distribuição é praticamente binomial. Ou seja, mesmo que não haja reposição, podemos considerar que, a cada novo entrevistado, a probabilidade de a pessoa ser favorável à política urbana é de 2/5. Isto porque, mesmo na situação extrema acima, o valor obtido ainda foi muito próximo de 2/5. Utilizaremos esta propriedade nas próximas aulas. Então, resumindo, temos que: • a variável binomial é útil para estudarmos proporções • as probabilidades de sucesso e fracasso têm relação com a proporção de ocorrência de um dado fenômeno/resultado/valor/etc. Vejamos praticar um pouco. EC 4. Prefeitura Municipal de Vila Velha [CESPE] Determinado fornecedor informou que 5% dos produtos comercializados por ele apresentam algum tipo de defeito. Uma prefeitura efetuará uma compra desse fornecedor de um grande lote desses produtos. Como parte do procedimento de controle de qualidade dessa prefeitura, uma amostra aleatória de dez produtos do lote enviada pelo fornecedor será retirada. O lote só será aceito pela prefeitura se a amostra não apresentar produtos defeituosos. Caso a amostra apresente um ou mais produtos defeituosos, todo o lote será devolvido ao fornecedor. Com base nas informações apresentadas nessa situação hipotética, julgue os itens que se seguem. 1. A probabilidade de um lote ser devolvido é superior a 0,25. CURSO ON‐LINE – MATEMÁTICA FINANCEIRA E ESTATÍSTICA – ICMS/RJ PROFESSORES: VÍTOR MENEZES E JUCI MELI www.pontodosconcursos.com.br 21 2. A variância do número de produtos defeituosos na amostra é inferior a 0,40. 3. A moda da distribuição do número de produtos defeituosos na amostra é igual a 1. Resolução. A questão envolve proporção. Proporções estão relacionadas com variáveis binomiais. Seja X o número de produtos defeituosos na amostra. X é uma variável binomial. A probabilidade de sucesso é igual a 5% (probabilidade de um dado item ser defeituoso). A probabilidade de fracasso é 95%. Estamos interessados nos produtos defeituosos. Por isso associamos a eles os casos favoráveis (ou sucessos). Não estamos fazendo qualquer juízo de valor. Não estamos dizendo que um produto defeituoso é bom, nem que é ruim. Apenas indicamos que é neles que estamos interessados (por isso chamamos de casos favoráveis). Até porque, em regra, um produto defeituoso não é algo bom. Mesmo assim, chamamos de casos favoráveis, pois neles é que estamos interessados. Continuando com o exercício. A probabilidade de sucesso coincide com a proporção de produtos defeituosos fabricados pelo fornecedor. No item 1, queremos calcular a probabilidade de X assumir algum dos valores: 1, 2, 3, 4, ..., 10. Isto porque se houver um ou mais produtos defeituosos, o lote será devolvido. Assim, se o número de produtos defeituosos (= X) não for zero, isto é, se nem todos os produtos funcionarem, o lote não será aceito. Lembrando a fórmula de cálculo vista no começo da aula: knk qp k n kXP −××⎟ ⎠ ⎞ ⎜ ⎝ ⎛ == )( Teríamos que aplicar esta fórmula dez vezes. Uma vez para X = 1. Outra para X = 2. Outra para X = 3. E assim por diante, até X = 10. Só que isto dá muito trabalho. É mais fácil fazer o seguinte. Em vez de calcularmos a probabilidade do lote ser devolvido, vamos calcular a probabilidade do lote ser aceito (evento complementar). Para que o lote seja aceito, todos os produtos devem estar funcionando. Ou seja, queremos calcular a probabilidade de X ser igual a 0. 100 95,05,0 0 10 )0( ××⎟ ⎠ ⎞ ⎜ ⎝ ⎛ ==XP 100 95,05,0 !0)!10( !10)0( ×× × ==XP 1095,0)0( ==XP 598737,0)0( ==XP Percebeu a diferença? Precisamos aplicar a fórmula uma só vez. Foi muito menos trabalhoso. A probabilidade do lote ser aceito é de 59,87%. Portanto, a probabilidade de ele ser devolvido é de 40,13%. O item está correto, pois a probabilidade de devolução é superior a 25%. CURSO ON‐LINE – MATEMÁTICA FINANCEIRA E ESTATÍSTICA – ICMS/RJ PROFESSORES: VÍTOR MENEZES E JUCI MELI www.pontodosconcursos.com.br 22 Na versão da prova que eu tenho não consta nenhuma tabela de valores do tipo ba . Algo que permitisse que não fizéssemos a conta 1095,0 na “raça”. Talvez, para esta prova, tenha sido distribuída calculadora. Isto porque não é típico do CESPE fazer os candidatos perderem tempo com contas. No nosso caso, em que a banca será a FGV, também não precisamos nos preocupar muito com contas trabalhosas (não é a “cara da banca” fazer o candidato perder tempo com trabalho braçal). Deste modo, vou supor que vocês podem usar calculadora para resolver a esta questão. Em todo caso, alerto que é possível responder a este item, mesmo sem calculadora, e sem precisar fazer uma conta tão trabalhosa. Para quem tiver curiosidade, coloco o procedimento ao final da aula. Gabarito: certo. Vamos para o segundo item.Pede-se a variância de uma variável binomial. Basta aplicar a fórmula. npq=2σ São 10 elementos na amostra. 10=n Chamando a probabilidade de um produto ser defeituoso de p, temos: 05,0=p 95,01 =−= pq E a variância fica: 95,005,0102 ××=σ 475,02 =σ . A variância não é inferior a 0,40. O item está errado. Gabarito: errado. Vamos ao terceiro item. Afirma-se que a moda da distribuição do número de produtos defeituosos é igual a 1. Nós vimos que a moda é o termo que mais se repete. Quando temos uma seqüência de números, a moda é o termo que tem maior freqüência. No caso de variável aleatória, temos probabilidades no lugar de freqüências. Vimos nas aulas anteriores que a probabilidade corresponde à freqüência relativa que seria obtida num número muito grande de experimentos. Pois bem, para que um número seja a moda, a probabilidade de ele ocorrer tem que ser maior que a probabilidade de ocorrer qualquer outro número. CURSO ON‐LINE – MATEMÁTICA FINANCEIRA E ESTATÍSTICA – ICMS/RJ PROFESSORES: VÍTOR MENEZES E JUCI MELI www.pontodosconcursos.com.br 23 Para que a moda seja 1, a probabilidade de X ser igual a 1 tem que ser maior que a probabilidade de X assumir qualquer outro valor. Vamos calcular a probabilidade de X ser igual a 1. knk qp k n kXP −××⎟ ⎠ ⎞ ⎜ ⎝ ⎛ == )( 91 95,005,0 1 10 )1( ××⎟ ⎠ ⎞ ⎜ ⎝ ⎛ ==XP 91 95,005,0 !9!1 !10)1( ×× × ==XP 91 95,005,010)1( ××==XP 3151,0)1( ==XP No primeiro item, vimos que a probabilidade de X assumir o valor zero é igual a 59,87%. A probabilidade de X assumir o valor 1 é 31,51%. Portanto a moda não é 1. Há pelo menos um valor cuja probabilidade é superior à probabilidade de ocorrer o número 1. Caso não tenha sido fornecida calculadora, destaco, novamente, que não era preciso calcular 995,0 . Bastava fazer o seguinte. 91 95,005,010)1( ××==XP 1095,0)0( ==XP Dividindo a segunda probabilidade pela primeira: 9 10 95,005,010 95,0 )1( )0( ×× = = = XP XP 05,010 95,0 )1( )0( × = = = XP XP 5,0 95,0 )1( )0( = = = XP XP 9,1 )1( )0( = = = XP XP Portanto, a probabilidade de X assumir o valor 0 é maior que a probabilidade de X assumir o valor 1. O item está errado. Gabarito: errado. IV DISTRIBUIÇÃO DE POISSON Vimos que a distribuição binomial é útil para calcularmos a probabilidade de, em “n” experimentos, termos k casos favoráveis. A fórmula estudada foi: CURSO ON‐LINE – MATEMÁTICA FINANCEIRA E ESTATÍSTICA – ICMS/RJ PROFESSORES: VÍTOR MENEZES E JUCI MELI www.pontodosconcursos.com.br 24 knk qp k n kXP −××⎟ ⎠ ⎞ ⎜ ⎝ ⎛ == )( Vamos retomar o EC 4. Calculamos a probabilidade da variável binomial assumir o valor zero (ou seja, do lote ser aceito). Ela era, aproximadamente, igual a 0,598737. Para tanto, fizemos o seguinte cálculo: 0100 95,005,0 0 10 )0( −××⎟ ⎠ ⎞ ⎜ ⎝ ⎛ ==XP Pois bem. É possível demonstrar que, quando “n” é grande e “p” é pequeno, a fórmula knk qp k n kXP −××⎟ ⎠ ⎞ ⎜ ⎝ ⎛ == )( pode ser aproximada por: ( ) ! )( k npekXP knp × == − O símbolo “ e ” representa um número real, que vale aproximadamente 2,7. Segundo Bussab e Morettin, no livro Estatística Básica, a aproximação é boa se 7≤np . Vamos resolver o mesmo exercício, agora usando essa aproximação. Com o auxílio de uma calculadora, temos: ( ) 606531,0 !0 05,010)0( 005,010 ≅ ×× == ×−eXP Muitos tipos de variáveis são bem descritas por meio da distribuição de probabilidades dada por ( ) ! )( k npekXP knp × == − . Essa é a distribuição de Poisson. É comum substituir o produto np pela letra λ (lâmbda). Como a esperança da variável binomial é dada por np , dizemos que λ corresponde ao número esperado de ocorrências. A distribuição de Poisson descreve muito bem o número de ocorrências ao longo do tempo (ou ao longo de uma superfície). Alguns exemplos seriam: • O número de carros que passam por uma cabine de pedágio, durante 5 minutos; • O número de telefonemas recebido por uma central de atendimento, durante 2 horas; • O número de clientes que entram na fila de um banco, durante 1 hora. • O número de defeitos observados em 2 metros quadrados de material; → DISTRIBUIÇÃO DE POISSON ( ) ! )( k ekXP kλλ × == − Pode ser usada no lugar da distribuição binomial, quando o número de experimentos é grande (n grande) e quando a probabilidade de sucesso é pequena (p pequeno). Muito útil para representar alguns tipos de ocorrências em um determinado tempo/superfície. CURSO ON‐LINE – MATEMÁTICA FINANCEIRA E ESTATÍSTICA – ICMS/RJ PROFESSORES: VÍTOR MENEZES E JUCI MELI www.pontodosconcursos.com.br 25 EC 5. TRF 1ª Região/2001 [FCC] A probabilidade de que um item produzido por uma máquina seja defeituoso é de 10%. Uma amostra de 30 itens produzidos por esta máquina é selecionada ao acaso. Use a aproximação pela distribuição de Poisson para determinar a probabilidade de que não mais do que um item defeituoso seja encontrado nesta amostra. a) 34 −e b) 24 −e c) 33 −e d) 341 −− e e) 331 −− e Resolução. Antes de resolvermos a questão da maneira solicitada pelo enunciado, vamos usar a distribuição binomial. Podemos considerar que, a cada item selecionado, temos um experimento. Estamos interessados nos itens defeituosos. Se o item sorteado for defeituoso, consideramos um caso favorável. Caso contrário, consideramos um caso desfavorável. A probabilidade de sucesso, em um experimento, é de 10% (p = 0,1). O número de experimentos é de 30 (n = 30). Seja X o número de itens defeituosos na amostra de 30 itens. Queremos a probabilidade de X ser igual a zero ou 1. Basta aplicar a fórmula: knk qp k n kXP −××⎟ ⎠ ⎞ ⎜ ⎝ ⎛ == )( 300 9,01,0 0 30 )0( ××⎟ ⎠ ⎞ ⎜ ⎝ ⎛ ==XP Usando a calculadora: 04239,0)0( ≅=XP 291 9,01,0 1 30 )1( ××⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ ==XP Novamente com o auxilio de calculadora: 14130,09,01,030)1( 291 ≅××==XP Assim, a probabilidade de termos um ou nenhum item defeituoso na amostra é de: 18369,004239,014130,0 =+ Pronto. Achamos a probabilidade, considerando a distribuição binomial. Acontece que nós vimos que, em certas situações, a fórmula da distribuição binomial pode ser aproximada por: CURSO ON‐LINE – MATEMÁTICA FINANCEIRA E ESTATÍSTICA – ICMS/RJ PROFESSORES: VÍTOR MENEZES E JUCI MELI www.pontodosconcursos.com.br 26 ( ) ! )( k ekXP kλλ × == − Onde λ é o número esperado de ocorrências. Em média, 10% dos itens produzidos são defeituosos. Numa amostra com 30 itens, espera-se que existam 3 itens defeituosos ( 3=λ ). Note que: 31,030 =×== npλ . A probabilidade de termos zero itens defeituosos fica: ( ) 303 !0 3)0( − − = × == eeXP A probabilidade de termos 1 item defeituoso na amostra é de: ( ) 313 3 !1 3)1( − − = × == eeXP Assim, a probabilidade de termos zero ou um item defeituoso é de: 333 43 −−− =+ eee Gabarito: A Por curiosidade, usando a calculadora, temos: 19915,04 3 ≅−e O resultado foi relativamente próximo daquele calculado sem a aproximação (usando a distribuição binomial). Pergunta: Professor, como vou saber quando é para usar a distribuição binomial e quando vou utilizar a distribuição de Poisson? Neste exercício em particular, era perfeitamente possível usar a distribuição binomial. Em geral, se for possível usar a binomial, use-a! Neste caso, só usamos a distribuição de Poisson porque a questão disse expressamente para fazer isso. Do contrário, usaríamos a distribuição binomial mesmo. EC 6. MPE PE/2006 [FCC] O número de falhas de certo tipo de placa térmica tem distribuição de Poisson, com taxa média de 0,1 defeitos por m2. Na confecção da superfície de um armário, é necessário cobrir uma superfície de 2m por 2m com essa placa. A probabilidade de que haja pelo menos uma falha nessa superfície é de: a) 1,0−e b) 1,01 −− e CURSO ON‐LINE – MATEMÁTICA FINANCEIRA E ESTATÍSTICA – ICMS/RJ PROFESSORES: VÍTOR MENEZES E JUCI MELI www.pontodosconcursos.com.br27 c) 4,01 −− e d) 4,0−e e) 4,04,11 −− e Resolução. Exercício bem parecido com o anterior. Seja X a variável que designa o número de falhas. Vamos calcular a probabilidade de X seja igual a zero. ( ) ! )( k ekXP kλλ × == − A taxa média é de 0,1 defeito por m2. Em 4 m2, o número esperado é de 0,4 defeitos ( 4,0=λ ). ( ) ! )( k ekXP kλλ × == − ( ) 4,004,0 !0 4,0)0( − − = × == eeXP Portanto, a probabilidade que não haja defeitos na placa é de 4,0−e . Desse modo, a probabilidade de haver pelo menos uma falha nessa placa é de: 4,01 −− e Gabarito: C. Interessante notar o seguinte. O exercício pediu para usarmos a distribuição de Poisson. Mas, mesmo que ele não tivesse dito nada a respeito, necessariamente teríamos que usar a distribuição de Poisson. Não dá para usar a distribuição binomial aqui. Por quê? Tanto na distribuição binomial quanto na de poisson, a variável de interesse é o número de ocorrências de alguma coisa. Vamos retomar o EC 5. Lá a variável de interesse era o número de itens defeituosos produzidos pela máquina. Trata-se de uma variável discreta, que pode assumir apenas os valores 0, 1, 2, 3, ...., 29, 30. Pois bem, a cada item analisado, temos um experimento. A probabilidade de sucesso (=item defeituoso) é de 10%. A probabilidade de fracasso é de 90%. Se, a título de exemplo, quisermos calcular a probabilidade de termos exatamente 1 item defeituoso, usamos a fórmula da variável binomial. Ela vai nos dar a probabilidade de haver exatamente zero 1 defeituoso (e, consequentemente, 29 itens sem defeito). Ficaria assim: 291 9,01,0 1 30 )1( ××⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ ==XP CURSO ON‐LINE – MATEMÁTICA FINANCEIRA E ESTATÍSTICA – ICMS/RJ PROFESSORES: VÍTOR MENEZES E JUCI MELI www.pontodosconcursos.com.br 28 Pois bem, estamos calculando a probabilidade de: · Termos 1 item defeituoso · Termos 29 itens não defeituosos · Tudo isso, verificado em 30 experimentos Mudemos de exercício. Vamos agora para o EC 6. Vamos calcular a probabilidade de ter exatamente uma falha na superfície, usando a distribuição binomial. Vamos considerar sucesso sempre que observarmos uma falha. Vamos considerar fracasso sempre que não observarmos qualquer falha. Pergunta: quanto experimentos foram realizados? Não dá para saber. O que seria um experimento? Seria a análise de 1 m2 de superfície? Seria a análise de 1 cm2 de superfície? Não temos como contar quantos experimentos foram feitos. E mais: não sabemos quantos fracassos ocorreram. Estamos interessados em calcular a probabilidade de exatamente uma falha no material. Estamos considerando que cada falha é um caso favorável (=sucesso). Ou seja, queremos saber a probabilidade de, em uma placa de 4m2, termos exatamente 1 falha. Queremos a probabilidade de 1 caso favorável. Ok, para os casos favoráveis é tranqüilo. Contudo, não dá para contar quantos seriam os casos desfavoráveis. Quantas falhas deixaram de ocorrer? Outra vez, não temos resposta. Sempre que estivermos diante de situações assim, não dá para usar a distribuição binomial. Daí partimos para a distribuição de Poisson. A variável que apresenta distribuição de poisson é discreta. É sempre número de ocorrências de alguma coisa (portanto, só pode assumir os valores 0, 1, 2, 3, 4, ...). Mas, em geral, é um número de ocorrências contado sobre uma base contínua. Neste exercício, tínhamos o número de ocorrências de falhas em uma área (a área tem natureza contínua: pode assumir qualquer valor real maior que zero). Outro caso típico é o número de chamadas telefônicas numa central de atendimento. Novamente, estamos contando o número de ocorrências (a variável de interesse é discreta). Mas o tempo é contínuo. O tempo pode assumir qualquer valor real maior que zero. Novamente, teremos as mesmas dificuldades: como contar quantos experimentos aconteceram? Cada segundo é um experimento? Cada minuto? Cada hora? Como contar os CURSO ON‐LINE – MATEMÁTICA FINANCEIRA E ESTATÍSTICA – ICMS/RJ PROFESSORES: VÍTOR MENEZES E JUCI MELI www.pontodosconcursos.com.br 29 casos desfavoráveis? Como contar quantas chamadas não ocorreram? Como contar quantas ligações não foram feitas? → BINOMIAL VERSUS POISSON Sempre que for possível usar a variável binomial, use-a (exceto se o exercício disser para usar a variável de poisson). Há casos em que não é possível usar a distribuição binomial. São casos em que o número de ocorrências é contado num campo contínuo (como espaço/área e tempo). Nestas situações: use a distribuição de poisson Apenas por curiosidade, a idéia da distribuição de poisson é a seguinte. No caso das falhas na superfície de 4 m2, supõe-se que seria possível dividir esta superfície em áreas muito pequenas. Muito pequenas mesmo. Áreas infinitesimais. Isto de tal forma que a probabilidade de ocorrência de duas ou mais falhas em cada uma destas pequenas áreas seja igual a zero. Cada “areazinha” é analisada, para ver se contempla uma falha. Ou seja, a cada área temos um experimento. Se a área apresentar uma falha, temos sucesso. Do contrário, temos fracasso. Feito isso, aplica-se a fórmula da distribuição binomial. Só que como as áreas têm que ser bem pequenas mesmo, então o número de experimentos é bem grandão. Quando ‘n’ é bem grande e ‘p’ é pequeno, daí é possível demonstrar que a fórmula da variável binomial tende a ( ) ! )( k ekXP kλλ × == − . Ou seja: a fórmula da variável de poisson é baseada na distribuição binomial. Seria uma distribuição binomial “especial” (especial porque se aplica a casos em que o número de experimentos é bem grandão, uma vez que as ocorrências são contadas num campo contínuo). EC 7. MPE PE/2006 [FCC] Considerando os dados da questão anterior, responda ao que segue. Na confecção de 3 superfícies deste tipo, a probabilidade de que exatamente duas não apresentem defeito é: a) 4,024,0 )1(3 −−− ee b) 1,03 −e c) )1(3 2,0−− e d) 1,021,0 )1(3 −−− ee e) 8,024,0 )1(3 −−− ee Resolução. Já sabemos que a probabilidade de uma peça de 4 m2 ser defeituosa é de 4,01 −− e . CURSO ON‐LINE – MATEMÁTICA FINANCEIRA E ESTATÍSTICA – ICMS/RJ PROFESSORES: VÍTOR MENEZES E JUCI MELI www.pontodosconcursos.com.br 30 Queremos saber a probabilidade de exatamente duas peças não serem defeituosas. Temos três possibilidades: • A primeira peça é defeituosa (e as demais são normais) • A segunda peça é defeituosa (e as demais são normais) • A terceira peça é defeituosa (e as demais são normais) Vamos trabalhar com a primeira hipótese. Queremos que três eventos, independentes, ocorram simultaneamente (a primeira peça é defeituosa, a segunda peça é normal, e a terceira peça é normal). Como os três eventos são independentes, a probabilidade da intersecção é igual ao produto das probabilidades: ( ) ( ) 8,04,04,04,04,0 11)_( −−−−− ×−=××−= eeeeedefeituosaprimeiraP Para as duas outras hipóteses, as contas são análogas. Somando as probabilidades das três possibilidades, ficamos com: ( ) 8,04,013)__( −− ×−×= eenormaisduasexatamenteP Gabarito: E. Outra forma de resolver é aplicar direto a fórmula da distribuição binomial. Note que aqui a situação muda completamente. No exercício anterior, estávamos contando quantas falhas ocorriam em uma área (contínua). Usamos a distribuição de Poisson. Agora mudou tudo. Estamos contando quantas placas de 4m2 apresentam defeitos. A contagem não se dá mais em função de uma superfície/área. A contagem é por placa de 4m2. Cada placa analisada corresponde a um experimento. Se a placa apresentar falhas, temos um caso favorável. Do contrário, temos um caso desfavorável. Dá para contar quantos são os experimentos, quantos são os sucessos e quantos são os fracassos. Temos: · n = 3 (são confeccionadas três placas) · 4,01 −−= ep (a probabilidade de caso favorável – placa defeituosa – foi calculada no exercício anterior) · 4,0−= eq (probabilidade de caso desfavorável– placa sem defeitos) · 1=k (queremos exatamente uma placa com defeito – 1 caso favorável) Aplicando a fórmula da variável binomial: knk qp k n kXP −××⎟ ⎠ ⎞ ⎜ ⎝ ⎛ == )( ( ) ( ) 134,014,01 1 3 )1( −−− ×−×⎟ ⎠ ⎞ ⎜ ⎝ ⎛ == eeXP CURSO ON‐LINE – MATEMÁTICA FINANCEIRA E ESTATÍSTICA – ICMS/RJ PROFESSORES: VÍTOR MENEZES E JUCI MELI www.pontodosconcursos.com.br 31 ( ) ( )24,04,013)1( −− ×−×== eeXP ( ) ( )8,04,013)1( −− ×−×== eeXP E obtivemos o mesmo resultado. EC 8. Sefaz RJ 2009 [FGV] O número de clientes que buscam, em cada dia, os serviços de um renomado cirurgião tem uma distribuição de Poisson com média de 2 pacientes por dia. Para cada cirurgia efetuada, o cirurgião recebe R$ 10.000,00. No entanto, ele consegue fazer o máximo de duas cirurgias em um dia; clientes excedentes são perdidos para outros cirurgiões. Assinale a alternativa que indique o valor esperado da receita diária do cirurgião. (considere e–2 = 0,14) (A) R$ 5.600,00. (B) R$ 8.400,00. (C) R$ 10.000,00. (D) R$ 14.400,00. (E) R$ 20.000,00. Resolução. Seja X a variável que indica o número de clientes que buscam o cirurgião, por dia. X tem distribuição de Poisson. ( ) ! )( k ekXP kλλ × == − . 2 02 !0 2)0( − − = × == eeXP 2 12 2 !1 2)1( − − = × == eeXP Já achamos as probabilidades de X ser igual a zero e de X ser igual a 1. E quanto aos demais casos? E quanto aos casos em que X é maior ou igual a 2? Bem, eles podem ser tratados em conjunto. Isto porque, se X for maior ou igual a 2, o cirurgião só poderá atender 2 clientes. Sua receita diária, em qualquer desses casos, será de R$ 20.000,00. Assim, pouco importa se, num dado dia, 2 clientes procuram o cirurgião, ou se 20 clientes procuram o cirurgião. Nos dois casos ele só terá uma receita de R$ 20.000,00. Por isso, vamos tratar todos estes casos de forma conjunta. ?)2( =≥XP =≥ )2(XP ( ))1()0(1 =+=− XPXP =≥ )2(XP 231 −− e CURSO ON‐LINE – MATEMÁTICA FINANCEIRA E ESTATÍSTICA – ICMS/RJ PROFESSORES: VÍTOR MENEZES E JUCI MELI www.pontodosconcursos.com.br 32 Seja Y a variável que indica a receita diária do cirurgião. A tabela abaixo relaciona os valores de X e suas probabilidades com os respectivos valores de Y. X Y Probabilidade 0 0 2−e 1 10.000 2 2−e maior ou igual a 2 20.000 231 −− e A esperança de Y fica: )31(000.202000.100)( 222 −−− −×+×+×= eeeYE 22 000.60000.20000.20)( −− −+= eeYE 2000.40000.20)( −−= eYE 14,0000.40000.20)( ×−=YE 600.5000.20)( −=YE = 14.400 Gabarito: D EC 9. MPU/2007 [FCC] O número de pacientes atendidos por um clínico geral segue uma distribuição de Poisson com taxa de 4 pacientes por hora. A probabilidade de que pelo menos um paciente consulte o clínico geral em um período de 15 minutos é: a) 11 −− e b) 41 −− e c) 4−e d) 4e e) 1−e Resolução. Notem que a contagem de pacientes se dá por tempo (que é contínuo). É o caso típico de utilização da distribuição de poisson. Antes de fazer qualquer conta, notem que a letra D é totalmente absurda. O número “e” é aproximadamente igual a 2,7. Quando elevado à quarta potência, fica ainda maior. Portanto, na letra D temos uma probabilidade maior que 1, o que é impossível. Uma probabilidade, no máximo, é de 100%. Se em uma hora, em média, são atendidos 4 pacientes, então o número esperado de pacientes no período de 15 minutos é 1 (basta fazer regra de três). Portanto, 1=λ . Seja X a variável que designa o número de pacientes atendidos. Queremos calcular a probabilidade de X ser maior que zero. CURSO ON‐LINE – MATEMÁTICA FINANCEIRA E ESTATÍSTICA – ICMS/RJ PROFESSORES: VÍTOR MENEZES E JUCI MELI www.pontodosconcursos.com.br 33 Para tanto, primeiro vamos calcular a probabilidade de X ser igual a zero. ( ) ! )( k ekXP kλλ × == − ( ) 101 !0 1)0( − − = × == eeXP Portanto: 11)0( −−=≠ eXP Gabarito: A. Para encerrar os comentários da distribuição de Poisson, faltou dizer o seguinte. Se X tem distribuição de Poisson, então: λ== )()( XVXE A variância e a esperança de X são iguais a λ . V DISTRIBUIÇÃO UNIFORME CONTÍNUA No início da aula estudamos a distribuição uniforme discreta. É a distribuição em que todos os possíveis valores assumidos pela variável aleatória têm a mesma chance de ocorrer. Agora, veremos também uma variável uniforme. Só que, em vez de ser discreta (ou seja, assumir apenas alguns valores), ela é contínua. Sabemos, desde a aula anterior, que, no caso de uma variável contínua, não podemos falar em probabilidade de ocorrer um dado número. Podemos falar apenas em probabilidades relacionadas a intervalos de valores. E essas probabilidades podem ser calculadas a partir do gráfico da função densidade de probabilidade. Pois bem, as variáveis contínuas são estudadas a partir de seu gráfico de densidade de probabilidade. Vejamos um exemplo de variável uniforme contínua. CURSO ON‐LINE – MATEMÁTICA FINANCEIRA E ESTATÍSTICA – ICMS/RJ PROFESSORES: VÍTOR MENEZES E JUCI MELI www.pontodosconcursos.com.br 34 Observemos a figura acima. Temos o desenho de um gráfico de uma função densidade de probabilidade (fdp). Ela assume o valor 0,5, quando X pertence ao intervalo [1;3]. Quando X não pertence a este intervalo, a função assume o valor zero. O que caracteriza uma variável uniforme? No intervalo em que a fdp é diferente de zero, ela é constante. No presente caso, no intervalo de 1 a 3 a fdp vale sempre 0,5. → VARIÁVEL UNIFORME CONTÍNUA É igual a zero em toda a reta real, com exceção de um dado intervalo, onde assume um valor constante. Achar a média da variável uniforme é bem simples. Tomamos o intervalo em que ela é diferente de zero. O ponto médio desse intervalo corresponde à média da variável. No exemplo acima, a média de X é igual a 2 (pois o ponto médio do intervalo [1;3] é 2. EC 10. MPU/2007 [FCC] O tempo necessário para um medicamento contra dor fazer efeito segue um modelo com densidade Uniforme no intervalo de 5 a 15 (em minutos). Um paciente é selecionado ao acaso entre os que tomaram o remédio. A probabilidade do medicamento fazer efeito em até 10 minutos, neste paciente, é: a) 0,8 b) 0,7 c) 0,5 d) 0,4 e) 0,3 Resolução. O gráfico da função densidade de probabilidade fica: 0 0,05 0,1 0,15 0 5 10 15 20 x fd p A fdp vale zero em toda a reta real, com exceção do intervalo entre 5 e 15. Nesse intervalo a fdp é constante e igual a 0,1. Como sabemos disso? CURSO ON‐LINE – MATEMÁTICA FINANCEIRA E ESTATÍSTICA – ICMS/RJ PROFESSORES: VÍTOR MENEZES E JUCI MELI www.pontodosconcursos.com.br 35 A variável só assume valores entre 5 e 10. Logo, a probabilidade de ela estar nesse intervalo é igual a 1. Portanto, a área do retângulo acima deve ser igual a 1. Para que isso aconteça, a altura deve ser o inverso da base. A base vale 10. A altura é o inverso da base. Portanto, vale 0,1. O exercício perguntou qual a probabilidade da variável aleatória assumir valores menores ou iguais a 10. Ou seja, precisamos da área verde da figura abaixo: 5,01,05_)10( =×==< verdeAreaXP Gabarito: C. EC 11. PETROBRAS 2005 [CESGRANRIO] Toma-se uma amostra aleatória de 5 observações de uma população com distribuição uniforme no intervalo [0, 1]. Qual é a probabilidade de a maior das observações ser superior a 0,5? (A) 1/2 (B) 3/4 (C) 4/5 (D) 15/16 (E) 31/32 Resolução. A média desta variável aleatória é igual a 0,5 (ponto médio entre 0 e 1). A fdp é simétrica em torno de sua média. Logo, a probabilidade de termos um valor maior que 0,5 é igual à probabilidade de termos um valor menor que 0,5. E ambas valem 50%. Seja A o evento que ocorre quando, selecionando-se 5 observações ao acaso, pelo menos uma delas é maior que 0,5. O exercício pediu: CURSO ON‐LINE – MATEMÁTICA FINANCEIRA E ESTATÍSTICA – ICMS/RJ PROFESSORES: VÍTOR MENEZES E JUCI MELI www.pontodosconcursos.com.br 36 ?)( =AP O eventoA ocorre quando todas as observações são menores que 5. 32 15,0)( 5 ==AP Conseqüentemente: )(1)( APAP −= = 32 31 Gabarito: E VI DISTRIBUIÇÃO NORMAL Nesta e na aula anterior estudamos a função densidade de probabilidade, que serve para caracterizar variáveis aleatórias contínuas. A resolução das questões passava por desenhar seus gráficos e calcular áreas abaixo das curvas. Uma função densidade de probabilidade muito importante é a função da variável gaussiana (ou normal). Sua fórmula é a seguinte: ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ −− = 2 2 2 2 )(exp 2 1)( σ μ πσ xxf Onde μ é a média da variável aleatória (=esperança), σ é o desvio padrão e “exp” é a função exponencial em que a base é o número de Euler (aquele que vale aproximadamente 2,7). Nem precisa ficar preocupado em decorar ou entender a função acima. Nós só a citamos e nem vamos comentar novamente. É claro que nós não vamos ficar desenhando seu gráfico para, em seguida, ficar calculando áreas abaixo da curva. Como a distribuição normal é muito importante, o que geralmente vem na prova são tabelas que nos fornecem as informações das áreas abaixo da curva. O que nós vamos aprender é simplesmente como consultar tais tabelas. Então vamos resumir. Sabemos que existe uma variável aleatória que é muito importante, que se chama normal (ou gaussiana). Ela tem uma função densidade de probabilidade meio complicada, por isso a prova vai nos fornecer tabelas com as contas prontas. Temos apenas que saber como olhar na tabela. Mesmo que a gente não precise saber como desenhar o gráfico, vamos ver alguns deles, gerados no excel (função “dist.norm”). É útil para visualizarmos algumas propriedades da variável normal. Para desenhar o gráfico, precisamos saber a média e o desvio padrão da variável aleatória normal em análise. O gráfico abaixo representa a função densidade de probabilidade quando a variável aleatória normal tem média zero e desvio padrão unitário. CURSO ON‐LINE – MATEMÁTICA FINANCEIRA E ESTATÍSTICA – ICMS/RJ PROFESSORES: VÍTOR MENEZES E JUCI MELI www.pontodosconcursos.com.br 37 Figura 1 - Função densidade de probabilidade para variável aleatória normal com média zero e desvio padrão unitário. Algumas características da função densidade de probabilidade da variável normal. Primeiro: o ponto de máximo corresponde à média da variável aleatória (=esperança). Neste caso, a média é zero. Corresponde também à moda e à mediana da distribuição. Segundo: a função é simétrica. Poderíamos colocar um espelho bem em cima do zero (ponto de máximo, que coincide com a média), que as duas metades da função se sobreporiam com perfeição. Isto quer dizer que o valor da função em -0,5 é igual ao valor da função em +0,5. Por quê? Porque esses dois valores estão igualmente afastados da média. Este gráfico acima, que representa a variável aleatória normal com média zero e desvio padrão unitário, é o mais importante. Isto porque as tabelas que nós estudaremos mais adiante fornecem áreas abaixo da curva justamente para este gráfico. Se no exercício tivermos uma outra variável aleatória normal que não tenha média zero e desvio padrão unitário, vamos precisar fazer algumas transformações para utilizar as tabelas. A variável normal com média zero e desvio padrão unitário é comumente chamada de variável normal reduzida. Ou ainda, de variável normal padrão. Seu símbolo usual é “Z”. →Z variável normal reduzida (média zero e desvio padrão unitário). Terceiro: à medida que x assume valores muito grandes (tendendo a ∞+ ) ou muito pequenos (tendendo a ∞− ), a função tende para zero. Quarto: a área abaixo da curva inteira (considerando valores de x tendendo ao infinito, bem como aqueles tendendo a menos infinito) é 1. Isto porque a probabilidade de x assumir um valor qualquer em toda a reta real é 100%. A seguir o gráfico de uma função densidade de probabilidade para uma variável normal com média zero e desvio padrão igual a 1,6. CURSO ON‐LINE – MATEMÁTICA FINANCEIRA E ESTATÍSTICA – ICMS/RJ PROFESSORES: VÍTOR MENEZES E JUCI MELI www.pontodosconcursos.com.br 38 Figura 2 - Função densidade de probabilidade para variável aleatória normal com média zero e desvio padrão igual a 1,6 Observe que o ponto de máximo é o mesmo do gráfico anterior. Isto porque a média, nos dois casos, é zero. Mas o gráfico da Figura 2 é mais suave que o gráfico da Figura 1. À medida que os valores de x ficam muito grandes, os valores da função vão para zero de forma mais lenta. Isto porque, na variável aleatória representada na Figura 2, o desvio padrão é maior. Ou seja, é uma variável que apresenta valores mais dispersos, mais afastados da média. Se os valores são mais dispersos, então a probabilidade de encontrarmos valores mais afastados da média é maior. Por isso a curva cai lentamente, de forma que a área abaixo dela, para valores mais afastados da média, não seja tão pequena quanto no caso da Figura 1. Vamos para um terceiro exemplo. Figura 3 - Função densidade de probabilidade para variável normal com média 2 e desvio padrão unitário Agora a média é 2. Portanto, o ponto de máximo não fica em zero, sim em 2. Mas o gráfico continua sendo simétrico. Só que nosso espelho agora tem que ficar em cima de 2. CURSO ON‐LINE – MATEMÁTICA FINANCEIRA E ESTATÍSTICA – ICMS/RJ PROFESSORES: VÍTOR MENEZES E JUCI MELI www.pontodosconcursos.com.br 39 Assim, a função assume os mesmos valores, tanto em x igual a 1 quanto em x igual a 3. Por quê? Porque esses dois valores estão igualmente afastados da média. O mesmo vale para os valores de x iguais a 4 e a 0. Ambos estão igualmente afastados da média. Note que o desvio padrão é unitário. É o mesmo desvio da variável da Figura 1. Portanto, as duas curvas têm exatamente o mesmo formato. Só houve um deslocamento horizontal ao longo do eixo x. 1 Teorema do limite central Não vamos ver este teorema a fundo. Não vou demonstrá-lo nem apresentar seus resultados em notação matemática. Mas vamos tentar entender o que ele quer dizer. É possível demonstrar que, se somarmos diversas variáveis aleatórias independentes, a variável aleatória resultante terá distribuição próxima de uma gaussiana. Quanto mais o número de variáveis somadas cresce, mais a variável aleatória resultante se aproxima da distribuição normal. Este é o teorema do limite central. Vamos supor que nossa variável aleatória seja o resultado do lançamento de um dado de seis faces. A variável pode assumir os valores 1, 2, 3, 4, 5 e 6, todos com probabilidade de 1/6. Para entender o que acontece neste teorema, o ideal seria desenharmos a função densidade de probabilidade para esta variável. Só que, no caso de variáveis discretas, o desenho da fdp depende de alguns conceitos que nós não estudamos. Uma opção para entender o teorema do limite central seria trabalhar com o histograma. Alguns livros fazem isso. Aqui vou optar por algo ligeiramente diferente. Vamos criar uma “fdp” adaptada. Então vamos fazer a tal adaptação. Vamos desenhar o gráfico abaixo. Figura 4 - Função densidade de probabilidade adaptada para o lançamento de um dado A função vale zero em quase todos os valores de x. Para x indo de 0,95 até 1,05, a função vale 10/6. Assim, se quisermos saber qual a probabilidade da variável X assumir valores neste intervalo, teríamos que calcular a área abaixo da curva, entre esses limites. Corresponderia à área verde da figura a seguir. CURSO ON‐LINE – MATEMÁTICA FINANCEIRA E ESTATÍSTICA – ICMS/RJ PROFESSORES: VÍTOR MENEZES E JUCI MELI www.pontodosconcursos.com.br 40 Figura 5 - Cálculo da probabilidade de x assumir valores entre 0,95 e 1,05 A probabilidade seria igual a 1/6. Sabemos que isto é apenas uma adaptação. Na verdade, X não assume valores em todo o intervalo de 0,95 a 1,05. Neste intervalo, ela assume apenas o valor 1, com probabilidade de 1/6. Se o gráfico tivesse sido desenhado de maneira fiel, em x iguala 1 teríamos um retângulo de base zero e altura infinita, de forma que o produto fosse 1/6. Mas não vamos estudar aqui conceitos de limite para entender como ficaria tal gráfico. Entendido que se trata apenas de uma adaptação, vamos agora mudar um pouco o problema. Vamos supor que lançamos dois dados. E somamos os resultados. Nossa variável aleatória será a soma dos resultados obtidos nos dois dados. Agora os valores possíveis de nossa variável aleatória são: 2, 3, ..., 10, 11, 12. A tabela abaixo representa todas as possíveis somas. Resultados Combinações que geram tal soma 2 (1+1) 3 (1+2) (2+1) 4 (1+3) (3+1) (2+2) 5 (1+4) (4+1) (2+3) (3+2) 6 (1+5) (5+1) (2+4) (4+2) (3+3) 7 (1+6) (6+1) (2+5) (5+2) (3+4) (4+3) 8 (2+6) (6+2) (3+5) (5+3) (4+4) 9 (3+6) (6+3) (4+5) (5+4) 10 (4+6) (6+4) (5+5) 11 (5+6) (6+5) 12 (6+6) Observem que agora nem todos os resultados possíveis têm a mesma probabilidade. O valor 12 só acontece se os resultados forem 6 e 6. É mais difícil de sair uma soma 12. Já o valor 7 tem probabilidade maior. São várias as combinações que resultam em 7. As probabilidades de cada soma ficariam: CURSO ON‐LINE – MATEMÁTICA FINANCEIRA E ESTATÍSTICA – ICMS/RJ PROFESSORES: VÍTOR MENEZES E JUCI MELI www.pontodosconcursos.com.br 41 Resultados Probabilidade 2 1/36 3 2/36 4 3/36 5 4/36 6 5/36 7 6/36 8 5/36 9 4/36 10 3/36 11 2/36 12 1/36 E a nossa fdp adaptada ficaria assim: Figura 6 - Função densidade de probabilidade adaptada para a soma dos resultados dos lançamentos de dois dados Agora, em vez de dois dados, vamos supor que temos três dados. A nossa variável aleatória agora será dada pela soma dos resultados dos três dados. Os valores possíveis agora são 3, 4, 5 ..., 15, 16, 17, 18. A tabela de probabilidades fica: Resultados Probabilidade 3 1/216 4 3/216 5 6/216 6 10/216 7 15/216 8 21/216 9 25/216 10 27/216 11 27/216 12 25/216 13 21/216 14 15/216 CURSO ON‐LINE – MATEMÁTICA FINANCEIRA E ESTATÍSTICA – ICMS/RJ PROFESSORES: VÍTOR MENEZES E JUCI MELI www.pontodosconcursos.com.br 42 15 10/216 16 6/216 17 3/216 18 1/216 E o gráfico ficaria: Figura 7 – Função de densidade de probabilidade adaptada para o lançamento de três dados Quando tínhamos um dado apenas, o gráfico era bem diferente do gráfico da variável normal. Com dois dados, o formato já mudou bastante. Com três dados, já estamos com um perfil que lembra uma variável normal. Se aumentássemos bastante o número de dados lançados, estaríamos com um gráfico muito próximo ao da curva normal, com a única diferença de estarmos diante de um caso de uma variável discreta, quando a função densidade de probabilidade da variável normal é contínua. Então pra gente o que importa é saber isto: a soma de um número muito grande de variáveis aleatórias independentes resulta numa variável cuja distribuição é próxima da distribuição normal. Há mais algumas condições a serem obedecidas para que isto seja aplicável, mas para o nosso curso saber até aqui já está ótimo. Por isto a variável normal ou gaussiana é importante. Muitas variáveis, resultantes de um número muito grande de outras variáveis, podem ser aproximadas por uma curva normal. Aqui vou dar um exemplo tirado do livro “Estatística para economistas”, do Rodolfo Hoffmann. Tomemos a altura de indivíduos adultos. A altura é influenciada por diversas variáveis que podem ser tomadas como independentes: carga genética, alimentação, doenças (talvez as doenças não sejam realmente independentes das demais, mas é só um exemplo), entre outros. Com tantas variáveis diferentes, é razoável esperar que a variável resultante em questão (a altura) siga mais ou menos uma distribuição normal. Não vamos ver problemas com este teorema. Na verdade ele serve para que muitas propriedades que veremos daqui pra frente sejam demonstradas. Para esse nosso curso acho que basta apenas saber da existência deste teorema, pois ajuda a entender porque a variável normal é tão importante. 2 Utilização das tabelas Geramos a tabela de áreas da distribuição normal, colocada ao final da aula, utilizando o excel. Os exercícios seguintes devem ser resolvidos com seu auxílio. CURSO ON‐LINE – MATEMÁTICA FINANCEIRA E ESTATÍSTICA – ICMS/RJ PROFESSORES: VÍTOR MENEZES E JUCI MELI www.pontodosconcursos.com.br 43 Nas provas de concursos, estas tabelas serão dadas. Podemos ter · a tabela no começo da prova · a tabela no final da prova · um pequeno trechinho da tabela no próprio enunciado, trazendo as informações necessárias para resolver a questão. Uma tabela de áreas da distribuição normal pode ser estruturada de diversas formas diferentes. Nesta aula, trabalharemos apenas com a tabela colocada ao final da aula. Nas próximas aulas, reproduziremos as tabelas que a FGV tem trazido, para que vocês possam se acostumar. Vejamos o seguinte exemplo: EP 9 Calcule a probabilidade de uma variável aleatória normal, com média zero e desvio padrão unitário, assumir valores entre 1 e 2. Resolução. Precisaríamos traçar o gráfico da fdp desta variável e, em seguida, calcular a área abaixo da curva entre os valores 1 e 2. Ficaria assim: Figura 8 – Área correspondente à probabilidade de X assumir valores entre 1 e 2 Só que nós vimos que a fdp da variável normal é meio complicada. Não vamos calcular esta área como fazíamos na aula anterior, quando os gráficos eram mais tranqüilos (áreas de triângulos, retângulos e trapézios). Vamos usar a tabela. O que esta tabela fornece é a probabilidade de X estar entre zero e Z0. E que fique bem claro: é bom olhar atentamente o que é que a tabela está fornecendo. É possível construí-la de diversas formas, trazendo informações diferentes. CURSO ON‐LINE – MATEMÁTICA FINANCEIRA E ESTATÍSTICA – ICMS/RJ PROFESSORES: VÍTOR MENEZES E JUCI MELI www.pontodosconcursos.com.br 44 Quando Z0 for igual a 2, o que temos? A probabilidade de X estar entre 0 e 2. Vamos consultar a tabela. Procuramos pelo valor Z0 = 2. Encontramos a seguinte probabilidade: 0,4772. A tabela está nos dizendo que a seguinte área é de 0,4772: Figura 9 – Área correspondente à probabilidade de X estar entre 0 e 2 (basta consultar tabela para Z0 = 2) E se Z0 for igual a 1? Consultamos a tabela e encontramos a seguinte probabilidade: 0,3413. Ou seja, a probabilidade de X assumir valores entre 0 e 1 é de 0,3413. Ou ainda, a área abaixo é igual a 0,3413: Figura 10 - Área correspondente à probabilidade de X estar entre 0 e 1 (basta consultar tabela para Z0 = 1) Então, para obter a área entre 1 e 2, basta subtrair a área verde da Figura 9 da verde da Figura 10. Ficamos com: 0,4772 - 0,3413 = 0,1359 CURSO ON‐LINE – MATEMÁTICA FINANCEIRA E ESTATÍSTICA – ICMS/RJ PROFESSORES: VÍTOR MENEZES E JUCI MELI www.pontodosconcursos.com.br 45 Figura 11 – Área correspondente à probabilidade de X assumir valores entre 1 e 2 Logo, a área entre 1 e 2 é de 0,1359. Portanto, X assume valores entre 1 e 2 com probabilidade de 13,59%. EP 10 Considerando o mesmo caso do exercício anterior, qual a probabilidade de X assumir valores maiores do que 2? Resolução. Queremos a seguinte área: Figura 12 – Área correspondente à probabilidade de X assumir valores maiores que 2 Consultando a tabela, só conseguimos descobrir a probabilidade de X estar entre 0 e 2. Mas queremos a probabilidade de X estar entre 2 e ∞ . CURSO ON‐LINE – MATEMÁTICA FINANCEIRA E ESTATÍSTICA – ICMS/RJ PROFESSORES: VÍTOR MENEZES E JUCI MELI www.pontodosconcursos.com.br 46 Figura 13 – Comparação entre as probabilidades de X estar entre 0 e 2 (em vermelho) e de X estar entre 2 e infinito (verde). A tabela nos dá a área vermelha. Nós queremos a área verde. Como sabemos que a função é simétrica, a área à esquerda de zero é igual à área à direita de zero. E as duas somadas dão 100%. Portanto, a área à direita de zero é igual a 0,5 (ou 50%) Somando
Compartilhar