Baixe o app para aproveitar ainda mais
Prévia do material em texto
Ponto dos Concursos www.pontodosconcursos.com.br Atenção. O conteúdo deste curso é de uso exclusivo do aluno matriculado, cujo nome e CPF constam do texto apresentado, sendo vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição. É vedado, também, o fornecimento de informações cadastrais inexatas ou incompletas – nome, endereço, CPF, e-mail - no ato da matrícula. O descumprimento dessas vedações implicará o imediato cancelamento da matrícula, sem prévio aviso e sem devolução de valores pagos - sem prejuízo da responsabilização civil e criminal do infrator. Em razão da presença da marca d’ água, identificadora do nome e CPF do aluno matriculado, em todas as páginas deste material, recomenda-se a sua impressão no modo econômico da impressora. ESTATÍSTICA P/ ICMS-SP 1 PROFESSOR VÍTOR MENEZES AULA 06 XIV DISTRIBUIÇÃO UNIFORME DISCRETA ....................................................................................... 2 XV DISTRIBUIÇÃO DE BERNOULLI ........................................................................................................ 3 XVI DISTRIBUIÇÃO BINOMIAL ............................................................................................................. 6 1 Introdução ................................................................................................................................................... 6 2 Média e variância da variável binomial.................................................................................................... 18 3 Proporções ................................................................................................................................................ 21 XVII DISTRIBUIÇÃO DE POISSON ........................................................................................................ 26 XVIII DISTRIBUIÇÃO UNIFORME CONTÍNUA.................................................................................... 36 XIX DISTRIBUIÇÃO NORMAL .............................................................................................................. 44 1 Teorema do limite central.......................................................................................................................... 46 2 Utilização das tabelas ............................................................................................................................... 50 3 Aproximação da distribuição binomial com a distribuição normal .......................................................... 70 XX AMOSTRAGEM ..................................................................................................................................... 75 1 Amostragem aleatória simples .................................................................................................................. 75 2 Amostragem estratificada.......................................................................................................................... 76 3 Amostragem por conglomerado ................................................................................................................ 76 4 Amostragem sistemática ............................................................................................................................ 77 LISTA DAS QUESTÕES DE CONCURSO ..................................................................................................... 80 GABARITO DAS QUESTÕES DE CONCURSO............................................................................................ 90 TABELA PARA A VARIÁVEL NORMAL ..................................................................................................... 91 www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 2 PROFESSOR VÍTOR MENEZES Aula passada vimos algumas noções de variáveis aleatórias. Estudamos que, quando temos variáveis discretas, podemos nos referir à probabilidade da variável aleatória assumir um dado valor. E, quando temos variáveis contínuas, a probabilidade da variável assumir um dado valor é sempre nula. Para caracterizar a variável aleatória, nesses casos, usamos a função densidade de probabilidade que, de forma semelhante a um histograma, nos permite calcular a probabilidade de um intervalo de valores. XIV DISTRIBUIÇÃO UNIFORME DISCRETA A distribuição uniforme discreta é o tipo mais simples de variável aleatória. É a variável em que todos os valores têm a mesma probabilidade de ocorrer. Um exemplo bem simples, e que já temos trabalhado, é o caso do lançamento do dado de seis faces. A variável que designa o resultado do lançamento é discreta (podem ocorrer apenas os valores 1, 2, 3, 4, 5 e 6). Além disso, se o dado for honesto, todos os resultados são equiprováveis. Dizemos que a variável em questão é discreta e uniforme. Seja X a variável discreta uniforme que pode assumir ‘n’ resultados diferentes ( 1x , x2 , x3 , ..., xn ). A esperança de X fica: E[ X ] = 1 n × ∑ xi n i =1 A esperança é simplesmente a média aritmética de todos os valores que podem ocorrer. EXERCÍCIOS PROPOSTOS EP 1 Considere uma variável aleatória X, uniforme e discreta, que pode assumir os valores 5, 6, 7 e 8. Calcule a esperança desta variável. EP 2 Para a variável aleatória definida no exercício anterior, faça o esboço do gráfico da função de distribuição de probabilidade. Resolução do EP 1. RESOLUÇÃO DOS EXERCÍCIOS PROPOSTOS A variável é uniforme discreta. A esperança é simplesmente a média dos valores que X pode assumir. E[ X ] = 1 × ( )5 + 6 + 7 + 8 = 4 26 = 6 5, 4 A esperança de X é 6,5. Resolução do EP 2. www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 3 PROFESSOR VÍTOR MENEZES A variável aleatória é discreta. A FDP vai apresentar saltos (lembra? Matéria da aula passada). Será em forma de escada. Os saltos ocorrem justamente nos valores em que X assume. Os tamanhos dos degraus correspondem às probabilidades de cada valor ocorrer. Para x entre 4 e 5, a FDP é nula. A título de exemplo, tomemos x = 4,5. A probabilidade de X assumir valores menores ou iguais a 4,5 é zero. Não há nenhum caso favorável dentre os casos possíveis. Em x = 5, a FDP dá um salto. A probabilidade de X assumir valores menores ou iguais a 5 é de 1/4. Temos 1 caso favorável (o próprio 5) em 4 possíveis. Para x entre 5 e 6, a FDP segue em 1/4. Como exemplo, tomemos o valor x = 5,5. A probabilidade de x ser menor ou igual a 5,5 continua sendo de 1/4 (temos um caso favorável – 5 – em 4 possíveis – 5, 6, 7, 8). Em x = 6 temos outro salto. A probabilidade de X assumir valores menores ou iguais a 6 é de 2/4. Temos dois casos favoráveis (5 e 6) em quatro possíveis. Em x = 7 temos outro salto. A FDP passa para 3/4. Em x = 8 temos o último salto. A FDP vai para 4/4. A probabilidade de X assumir valores menores ou iguais a 8 é de 100%. 1 0,75 0,5 0,25 0 0 1 2 3 4 5 6 7 8 9 10 x XV DISTRIBUIÇÃO DE BERNOULLI São de grande importância alguns tipos de experimentoem que a variável de interesse pode assumir apenas dois valores. Podemos falar em sucessos e fracassos. Um exemplo é o lançamento de uma moeda. Temos dois resultados possíveis (cara e coroa). Podemos considerar que “cara” é sucesso e “coroa” é fracasso. Em casos assim, é comum atribuirmos ao sucesso o valor 1. E ao fracasso o valor zero. Seja X a variável aleatória que assume o valor 1 quando o resultado do lançamento da moeda é cara e que assume o valor 0 quando o resultado do lançamento é coroa. A variável aleatória X assume apenas os valores 0 e 1. É uma variável de Bernoulli. Além disso, X é também uma variável discreta (pois assume apenas alguns valores, quais sejam, 0 e 1). Caso a moeda seja honesta, então a probabilidade de sucesso é igual à probabilidade de fracasso (e ambas valem 50%). www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 4 PROFESSOR VÍTOR MENEZES Mudemos de exemplo. Considere o lançamento de um dado de seis faces. Se sair um múltiplo de 3, consideramos sucesso. Se não sair um múltiplo de 3, consideramos fracasso. A nossa variável aleatória I, portanto, vai se comportar da seguinte forma. Se o resultado do lançamento do dado for 1, 2, 4, 5, teremos fracasso. Então I assume valor zero. Se o resultado do lançamento do dado for 3 ou 6, teremos sucesso. Então I assume valor 1. Dizemos que I é uma variável de Bernoulli. Ela tem a seguinte distribuição de probabilidade: I P 0 2/3 1 1/3 A probabilidade de I assumir o valor zero é 2/3. E a probabilidade de I assumir o valor 1 é 1/3. Variável de Bernoulli: assume apenas os valores 0 e 1. A probabilidade de a variável assumir o valor zero não necessariamente é igual à probabilidade de assumir o valor 1. A grande importância da variável de Bernoulli, em termos de concursos, é que ela serve pra gente estudar uma outra variável: a Binomial. EP 3 Considere a distribuição de probabilidades para a variável Y: Y Probabilidade 1 0,5 2 0,2 3 0,3 a) a variável Y é discreta ou contínua? b) a variável Y é uniforme? Por quê? c) a variável Y tem distribuição de Bernoulli? Por quê? EP 4 Considere a distribuição de probabilidades para a variável Z: Z Probabilidade 1,24 0,25 2 0,25 6,55 0,25 100 0,25 a) a variável Z é discreta ou contínua? b) a variável Z é uniforme? Por quê? c) a variável Z tem distribuição de Bernoulli? Por quê? www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 5 PROFESSOR VÍTOR MENEZES EP 5 Considere a distribuição de probabilidades para a variável K: K Probabilidade 0 0,5 1 0,5 a) a variável K é discreta ou contínua? b) a variável K é uniforme? Por quê? c) a variável K tem distribuição de Bernoulli? Por quê? EP 6 Considere a distribuição de probabilidades para a variável T: T Probabilidade 0 0,75 1 0,25 a) a variável T é discreta ou contínua? b) a variável T é uniforme? Por quê? c) a variável T tem distribuição de Bernoulli? Por quê? Resolução do EP 3. RESOLUÇÃO DOS EXERCÍCIOS PROPOSTOS Foi dada a seguinte distribuição de probabilidade. Y Probabilidade 1 0,5 2 0,2 3 0,3 A variável Y é discreta. Ela não pode assumir qualquer valor em um dado intervalo real. A variável Y não pode ser classificada como uniforme. Na variável discreta uniforme, as probabilidades de ocorrência de cada valor são todas iguais entre si. Não é o caso desta questão. A probabilidade de Y ser igual a 1 é maior que a probabilidade de Y ser igual a 2. A variável Y também não pode ser classificada como de Bernoulli. A variável Y não assume apenas os valores zero e 1. Portanto, não tem distribuição de Bernoulli. Resolução do EP 4. Foi dada a seguinte distribuição: Z Probabilidade 1,24 0,25 2 0,25 6,55 0,25 100 0,25 www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 6 PROFESSOR VÍTOR MENEZES A variável Z assume apenas alguns valores (são apenas 4). Ela é uma variável discreta. Muita gente confunde isso. O fato de uma variável aleatória assumir valores não inteiros (como 1,24 ou como raiz de 2) não significa que ela seja contínua. Se a variável Z fosse contínua ela poderia assumir qualquer valor real contido num dado intervalo. Note que as probabilidades de todos os valores são iguais entre si (todas valem 1,25). A variável Z é, portanto, uniforme. Por outro lado, como ela não assume apenas os valores zero e 1, ela não pode ser classificada como de Bernoulli. Resolução do EP 5. Foi dada a seguinte distribuição de probabilidade: K Probabilidade 0 0,5 1 0,5 A variável K assume apenas alguns valores. Ela é discreta. Além disso, as probabilidades são todas iguais entre si (valem 0,5 cada uma). Podemos classificar a variável K como uniforme. Por fim, a variável K assume apenas os valores zero e 1. Isso faz com que ela, além de ser discreta uniforme, tenha distribuição de Bernoulli. Resolução do EP 6. T Probabilidade 0 0,75 1 0,25 A variável T é discreta. Contudo, não é uniforme, pois as probabilidades não são iguais entre si (a probabilidade de T ser igual a zero é maior que a probabilidade de T ser igual a 1). De modo diverso, T pode ser classificada como de Bernoulli, pois assume apenas os valores zero e 1. XVI DISTRIBUIÇÃO BINOMIAL 1 Introdução A distribuição binomial é aplicável quando temos vários experimentos independentes e, a cada um deles, associamos apenas dois resultados. Podemos pensar em resultados favoráveis e resultados desfavoráveis. Ou em sucessos e fracassos. Por exemplo: vamos lançar um dado. Vamos considerar um resultado favorável (sucesso) se sair um múltiplo de 3. Vamos considerar um resultado desfavorável (fracasso) se não sair um múltiplo de 3. Seja “I” a variável que, em caso de sucesso, assume o valor 1. E, em caso de fracasso, assume o valor zero. A cada lançamento, a probabilidade de ocorrer um evento favorável é de 1/3 (ou seja, a probabilidade de I = 1 é de 1/3). E a probabilidade de ocorrer um evento desfavorável é 2/3 (a probabilidade de I = 0 é 2/3). Como já vimos, “I” é uma variável de Bernoulli. Segue a distribuição de probabilidades da variável I: www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 7 PROFESSOR VÍTOR MENEZES I Probabilidade 0 0,75 1 0,25 Muito bem, só que não vamos lançar o dado uma única vez. Vamos lançar o dado três vezes. A variável aleatória X vai representar o número de sucessos em três lançamentos. Um possível resultado dos três lançamentos seria: 2, 4, 3. Vamos ver como se comporta a variável “I” em cada um destes lançamentos. • 1º lançamento: 2 � I = 0 (tivemos um fracasso, pois não saiu um múltiplo de 3) • 2º lançamento: 4 � I = 0 (tivemos outro fracasso, pois não saiu um múltiplo de 3) • 3º lançamento: 3 � I = 1 (tivemos um sucesso, pois saiu um múltiplo de 3). Nesse caso, em três lançamentos, o número de casos favoráveis foi de 1 (X = 1). Se somarmos todos os valores que “I” assume,temos exatamente 1. Ou seja, “X” é igual à soma de todos os valores de “I”. Vamos mudar um pouco o exemplo. Suponhamos agora que os resultados dos três lançamentos foram: 3, 1, 6. Vamos ver como se comporta a variável I em cada lançamento: • 1º lançamento: 3 � I = 1 • 2º lançamento: 1 � I = 0 • 3º lançamento: 6 � I = 1 Nesse outro caso, em três lançamentos, o número de casos favoráveis foi de 2 (X=2). Se somarmos todos os valores que “I” assume, temos exatamente 2. Novamente, X é igual à soma de todos os valores de “I”. Esta variável X é dita binomial. Ela representa o número de casos favoráveis em um conjunto de experimentos que só admitem dois resultados possíveis (sucesso ou fracasso). Ela é a soma de várias variáveis de Bernoulli. Variável binomial: corresponde à soma de várias variáveis de Bernoulli. Tem relação com o número de resultados favoráveis em ‘n’ experimentos. É muito importante o candidato saber a fórmula da probabilidade da variável binomial. No nosso exemplo, a variável binomial X só pode assumir quatro valores (0, 1, 2 e 3). São três lançamentos do dado. Ou não temos nenhum sucesso. Ou apenas 1. Ou 2. Ou então, em três lançamentos, temos três sucessos (múltiplos de 3 em todos os lançamentos). Vamos calcular a probabilidade de X assumir cada um desses valores. Para X ser igual a zero, precisamos que, nos três lançamentos, tenhamos números que não são múltiplos de 3. Queremos que ocorram, simultaneamente, os três eventos: • Fracasso no primeiro lançamento • Fracasso no segundo lançamento www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 8 PROFESSOR VÍTOR MENEZES • Fracasso no terceiro lançamento Observe que o resultado de um lançamento não tem qualquer influência no resultado dos demais lançamentos. São três eventos independentes. Todos eles têm probabilidade de 2/3 de ocorrer. Nesse caso, como já vimos na aula passada, a probabilidade da intersecção dos eventos é igual ao produto das probabilidades. P( X = )0 = 2 2× 2× 33 3 P( X = )0 3 = � 2 � � � � 3 � Para X ser igual a 1, precisamos ter exatamente 1 lançamento com sucesso. Temos as seguintes hipóteses: • Sucesso no primeiro lançamento, fracasso no segundo lançamento, fracasso no terceiro lançamento; • Fracasso no primeiro lançamento, sucesso no segundo lançamento, fracasso no terceiro lançamento; • Fracasso no primeiro lançamento, fracasso no segundo lançamento, sucesso no terceiro lançamento. Vamos ver a probabilidade para o primeiro caso. Temos: • Sucesso no primeiro lançamento • Fracasso no segundo lançamento • Fracasso no terceiro lançamento São três eventos independentes. O primeiro tem probabilidade 1/3. Os demais têm probabilidade de 2/3 de ocorrer. A probabilidade da intersecção fica: 1 × 2 × 2 33 3 Para os demais casos, a conta é exatamente a mesma. Ou seja, a probabilidade de X ser igual a 1 fica: P( X = )1 = 3 × � 1 × 2 × 2 � 3� 3 3 � Para X ser igual a 2, precisamos de dois sucessos e um fracasso. Temos as seguintes hipóteses: • Sucesso no primeiro lançamento, sucesso no segundo lançamento, fracasso no terceiro lançamento; • Fracasso no primeiro lançamento, sucesso no segundo lançamento, sucesso no terceiro lançamento; • Sucesso no primeiro lançamento, fracasso no segundo lançamento, sucesso no terceiro lançamento. Vejamos a probabilidade da primeira hipótese. São três eventos independentes. A probabilidade de sucesso é 1/3. A de fracasso é 2/3. Ficamos com: 1 × 1 × 2 33 3 www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 9 PROFESSOR VÍTOR MENEZES Para as demais hipóteses, as contas são análogas. A probabilidade de X ser igual a 2 fica: P( X = )2 = 3 × � 1 × 1 × 2 � 3� 3 3 � 2 × � == � × � 2 � P( X )2 3 � 1 � � � � 3 � � 3 � Finalmente, para X ser igual a 3, precisamos de sucessos nos três lançamentos. Ficamos com: × × 1 = = � � P( X )3 1� 1 � 3� 3 3 � Pronto. Calculamos as probabilidades de X assumir cada um dos valores possíveis. Seja ‘n’ o número de experimentos. Seja ‘p’ a probabilidade de sucesso em cada experimento. Seja ‘q’ a probabilidade de fracasso. Nesse nosso exemplo, lançamos o dado 3 vezes (n = 3). E a probabilidade de sucesso em cada lançamento era de 1/3 (p = 1/3). A probabilidade de fracasso em cada experimento era de 2/3 (q = 2/3). Para não precisarmos ficar fazendo todas essas contas que fizemos acima para cada problema diferente, existe uma fórmula que indica a probabilidade da variável binomial assumir um dado valor. É a que segue: P( X � n � = k ) = × p k × q n−k� k � � � � Não custa relembrar o significado do símbolo de combinação que vimos na aula passada: � n � = !n � (n − k )!×k! �k � � � Vamos ver a aplicação da fórmula ao nosso exemplo do dado. Lançamos o dado três vezes (n=3). Consideramos sucesso se der múltiplo de 3. Assim, a probabilidade de sucesso é 1/3 (p=1/3) e a probabilidade de fracasso é 2/3 (q=2/3). Vamos calcular, a título de exemplo, a probabilidade de X ser igual a 2 (k=2). P( X � n � = k ) = × p k × q n−k� k � � � � ( 2) 2 3 � × 1 � × � 2 � 3−2 XP = �= � � � � � � � 3 � �2 � � � 3 � � ( ) 2 2 !3 × � 1 � × � 2 � 3−2 2 = 3 × � 1 � 1 × � 2 � XP = = �� � � �� � � !1× !2 � 3 � � 3 � � 3 � � 3 � Que é o mesmo resultado que tínhamos achado antes, sem a fórmula. www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 10 PROFESSOR VÍTOR MENEZES Lembrete de variável binomial Seja X nossa variável binomial. Ela representa o número de sucessos em “n” experimentos (onde cada experimento pode resultar em sucesso ou em fracasso). A fórmula da variável binomial é a que segue. A probabilidade de termos k sucessos em n experimentos é: P( X � n � = k ) = × p k × q n−k� k � � � � Onde p é a probabilidade de sucesso em cada experimento e q é a probabilidade de fracasso em cada experimento. Vamos praticar um pouco. EP 7 Qual a probabilidade de lançarmos uma moeda três vezes e obtermos exatamente duas caras? RESOLUÇÃO DO EP 7. Vamos considerar que cada lançamento é um experimento. O sucesso é sair cara. O fracasso é sair coroa. A probabilidade de sucesso é igual à de fracasso que é igual a 50%. p = q = 0 5, São três experimentos. n = 3 Queremos que X assuma valor 2 (queremos dois sucessos). k = 2 A probabilidade fica: P( X � n � = k ) = × p k × q n−k� k � � � � P( X = )2 = � 3 � × 0 5, � 2 � � � 2 × 0 5, 3−2 � P( X = )2 = !3 × 0 5, !2 × !1 2 × 0 5, 3−2 P( X = )2 = 3 × 0 5, 2 × 0 5, 1 = 3 8 EC 1 Analista Previdenciário Pleno – Área estatística – Paraná Previdência/2002. [CESPE] Parte das atribuições doanalista previdenciário é a participação na elaboração de sistemas de informações previdenciárias. As informações, em geral, vêm de diversas www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 11 PROFESSOR VÍTOR MENEZES fontes. É importante que um sistema de informações forneça com detalhes todo o processo metodológico, desde a obtenção dos dados até a sua disponibilização para o usuário final. Para assegurar a fidedignidade dos dados, as possíveis fontes de erros devem ser monitoradas e os erros, quando detectados, devem ser corrigidos. Nesse sentido, considere por hipótese, que o departamento DDD de determinada empresa deva coletar e enviar diariamente um conjunto de informações para a previdência. Ao longo do procedimento de envio dessas informações, há várias situações problemáticas, como dificuldades de transmissão dos dados, perda acidental de dados, atraso na coleta dos dados etc. Suponha que, ocorrendo uma dessas situações problemáticas, uma nova tentativa seja feita apenas no dia seguinte. Suponha ainda que, em 1.000 dias, um relatório gerencial tenha apresentado os seguintes resultados. Situação Quantidade de ocorrências em dias Impossibilidade de coleta das informações dentro do prazo 300 Problema na transmissão dos dados coletados 140 Problema na recepção dos dados transmitidos 56 Julgue o item seguinte, com base na situação hipotética descrita acima. 1. Assumindo-se independência entre os dias e que as probabilidades permaneçam constantes ao longo do tempo, a probabilidade de haver sucesso na coleta das informações nos dois dias seguintes aos 1.000 dias de observação é superior a 0,50. Questão do CESPE. De cada 1000 dias, em 300 temos fracassos (impossibilidade de coleta da informação dentro do prazo). Portanto, em 700 dias nós temos sucessos (sucesso na coleta das informações). Vamos considerar que em cada dia nós temos um experimento. Se num dado dia a informação foi coletada, temos sucesso. Do contrário, se não foi possível coletar a informação, temos um fracasso. Seja “I” a variável que assume o valor zero em caso de fracasso, e assume o valor 1 em caso de sucesso. A distribuição de probabilidade da variável “I” fica: I Probabilidade 0 0,7 1 0,3 Pois bem, só que a coleta não é feita num único dia. O enunciado descreve uma situação em que a coleta é feita por dois dias. Seja X o número de sucessos nesses dois dias. X é uma variável binomial, em que a probabilidade de sucesso é 0,7 e a probabilidade de fracasso é 0,3. · p = 0,7 · q = 0,3 São dois experimentos (são dois dias). Portanto, n = 2. Queremos que nossa variável assuma o valor 2 (queremos que o número de sucessos seja 2). Logo, k = 2. · n = 2 · k = 2 Aplicando a fórmula: P( X � n � = k ) = × p k × q n−k� k � � � � www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 12 PROFESSOR VÍTOR MENEZES P( X = )2 = � 2 � × ( )0 7, � 2 � � � 2 × ( ,0 )3 2−2 � P( X = )2 = !2 × ( )0 7, !2 × !0 2 × ( ,0 )3 0 P( X P( X = )2 = )2 = 1× ( )0 7, = ,0 49 2 ×1 A probabilidade procurada é inferior a 0,5. O item está errado. EC 2 Analista de Meio Ambiente e de recursos hídricos – Área estatística ou matemática. SEAMA/ES – 2007. [CESPE] X Classificação Probabilidade 80 < X ≤ 100 Ótima/muito 80 boa 40 < X ≤ 80 Boa/aceitável 15 0 < X ≤ 40 Imprópria 5 Com base nas informações da tabela acima, em que são dadas a distribuição e a classificação do índice de qualidade da água (X), instrumento para avaliação das condições bacteriológicas e físico-químicas de um corpo d’água, julgue os itens seguintes. 1. Considere-se uma amostra aleatória simples de índices X1, X2 e X3. Neste caso, a probabilidade de que exatamente dois desses índices resultem na classificação da água como ótima ou muito boa é inferior a 0,5. 2. Na situação considerada, X é uma variável aleatória discreta e assimétrica. Outra questão do CESPE. Temos costumeiramente designado por X a variável binomial. Como neste exercício já existe uma outra variável X (que indica o índice de qualidade da água) vamos chamar a nossa variável binomial de Y. Primeiro item. A variável binomial Y vai indicar o número de ocorrências de sucesso. O sucesso (ou caso favorável) acontece se o índice de qualidade da água for maior que 80 (=água classificada como ótima ou muito boa). São três experimentos (n = 3). Queremos que em dois deles o resultado seja favorável (k = 2). A probabilidade de sucesso é 80% (basta consultar a tabela fornecida). Portanto, p = 0,8. A probabilidade de fracasso é 20%. Portanto, q = 0,2. · n = 3 · k = 2 · p = 0,8 · q = 0,2 www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 13 PROFESSOR VÍTOR MENEZES Aplicando a fórmula: P Y( � n � = k ) = × p k × q n−k� k � � � � P(Y = )2 = � 3 � × 0 8, � 2 � � � 2 × ,0 23−2 � P(Y = )2 = !3 × 0 8, !1× !2 2 × ,0 23−2 P(Y = )2 = 3 × 0 8, P(Y = )2 = 0 384, 2 × ,0 21 A probabilidade procurada é inferior a 0,5. O primeiro item está correto. O segundo item é bom pra revisarmos o conceito de variável discreta. Repare que a variável X pode assumir qualquer valor real no intervalo de 0 a 100. Portanto, é uma variável contínua. O item está errado. EC 3 Auditor Fiscal/MG – 2005 [ESAF]. Suponha que a probabilidade de que se encontre um erro contábil grave em uma auditoria seja 0,2. Se dez auditorias independentes são realizadas, assinale a opção que dá a probabilidade de que não mais do que uma detecte erro contábil grave. a) 2 8, × 4 / 5 b) 0,400 c) 0,210 d) 2 8, e) 2 8, × ( )4 / 5 10 × ( )4 / 5 9 Questão da ESAF. Podemos pensar que cada auditoria é um experimento. Em cada experimento, o sucesso ocorre quando é encontrado um erro grave. Queremos que o número de sucessos seja zero ou 1. Podemos dividir o problema em duas partes. Primeiro: calculando a probabilidade de termos zero sucessos (k = 0). · n = 10 · p = 0,2 · q = 0,8 · k = 0 A probabilidade fica: www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 14 PROFESSOR VÍTOR MENEZES P( X � n � = k ) = × p k × q n−k� k � � � � P( X = )0 = �10 � ,0 20 × ,0 108 −0 × �� � � 0� P( X P( X = )0 = )0 = 1×1× ,0 108 −0 = ,0 108 Segundo: calculando a probabilidade de termos um sucesso (k=1). · n = 10 · p = 0,2 · q = 0,8 · k = 1 A probabilidade fica: P( X � n � = k ) = × p k × q n−k� k � � � � P( X = )1 = �10 � ,0 21 × ,0 108 1− × �� �1 � � P( X P( X = )1 = )1 = 10 × ,0 21 × 0 8, 9 = 10 × ,0 21 × 0 8, 9 P( X = )1 = 2 × 0 8, 9 Somando as duas probabilidades, ficamos com:P( X = 0 � X = )1 = ,0 108 + 2 × 0 8, 9 P( X = 0 � X = )1 = 0 8, 9 × (0 8, + )2 Lembrando que 0 8, = 4 / 5 , temos: P( X = 0 � X = )1 = 4 / 59 × ( ,2 )8 Resposta: E. EC 4 Especialista em regulação de saúde suplementar. Especialidade: Estatística. Ministério da Saúde/2007 [FCC] Um procedimento de controle de qualidade foi planejado para garantir o máximo de 5% de itens defeituosos na produção. A cada 20 minutos sorteia-se uma amostra aleatória de 10 itens e, havendo mais de 10% defeituosos, nesta amostra, interrompe-se a produção para verificação. A probabilidade de uma interrupção desnecessária é: a) 1 − ,0 1095 b) 1 − ,1 45 × 0 95, 9 c) ,0 1005 d) 9 × 0 05, 9 × 0 95, www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 15 PROFESSOR VÍTOR MENEZES e) 1 − 0 5, × 0 95, 9 Não gostei muito da redação do exercício não. O que a questão quis dizer foi o seguinte. Suponha que o percentual de itens defeituosos seja, realmente, de 5%, exatamente o máximo aceitável pela equipe de controle de qualidade. Nessa situação, qualquer interrupção será desnecessária (eis que a qualidade desejada estaria sendo obedecida). Nesse contexto, qual a probabilidade de uma interrupção desnecessária? Ou seja, qual a probabilidade de, em uma amostra de 10 itens, termos dois ou mais defeituosos? Podemos considerar que a análise de cada item da amostra seja um experimento. Temos 10 experimentos (n=10). Vamos considerar sucesso quando o item analisado é defeituoso. E vamos considerar fracasso quando o item analisado não é defeituoso. Certamente vocês vão estar se perguntando: como pode chamar de sucesso um item defeituoso? E aí vale lembrar da observação que fizemos logo no comecinho aula 5. A nomenclatura sucesso/fracasso (ou caso favorável/desfavorável) não traz nenhum juízo de valor sobre o que é bom ou ruim, certo ou errado. Apenas serve para distinguir os resultados em que estamos interessados daqueles que não são de nosso interesse. Neste exercício, o interesse recai sobre os itens defeituosos. É sobre eles que atua o controle de qualidade. Por isso estou chamando de sucesso ao fato do item analisado ser defeituoso. A cada item analisado temos um experimento. Em cada experimento, a probabilidade de sucesso (item defeituoso), é de 5%. A probabilidade de termos zero itens defeituosos é: P( X � n � = k ) = × p k × q n−k� k � � � � P( X = )0 = �10 � × 0 05, 0 × ,0 10 95 −0 = ,0 1095 � � 0 � � � A probabilidade de termos 1 item defeituoso é: P( X = )1 = �10 � × ,0 10 5 × ,0 1095 1− = 10 × 0 05, × 0 95, 9 = 0 5, × 0 95, 9 � �1 � � � A probabilidade de termos zero ou item defeituoso é: P( X = 0 � X = )1 = P( X = )0 + P( X = )1 = ,0 10 95 + 0 5, × 0 95, 9 A interrupção na produção ocorrerá se X for maior que 1. Logo, a probabilidade de interrupção corresponde à probabilidade de X ser maior que 1. P( X > )1 = 1 − ( ,0 10 95 + 0 5, × 0 95, 9 ) Vamos separar o 0,9510 em duas partes: 0 95, 10 = 0 95, 9 × 0 95, P( X > )1 = 1 − (0 95, 9 × 0 95, + 0 5, × 0 95, 9 ) www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 16 PROFESSOR VÍTOR MENEZES Colocando o 0,959 em evidência: P( X > )1 = 1 − 0 95, 9 (0 95, + 0 5, ) P( X > )1 = 1 − 0 95, 9 × ,1 45 Resposta: B. EC 5 AFC/CGU - 2008. Área: Estatística e cálculos atuariais. [ESAF] A probabilidade de sucesso em um experimento aleatório é p. Seja X o número de experimentos independentes realizados até se obter o primeiro sucesso. Qual a probabilidade de X = k, onde k=1,2,3,.... a) (1-p)k-1. b) p(1-p)k-1. c) k pk-1(1-p). d) pk-1(1-p). e) k(1-p)k-1 p. Cuidado para não confundir. Nesse caso, X não é uma variável binomial. X não representa o número de sucessos em ‘n’ experimentos. X representa quantos experimentos são realizados até que se obtenha o primeiro sucesso. São feitos k experimentos. Em cada experimento, a probabilidade de sucesso é ‘p’. A probabilidade de fracasso é ‘1- p´. Seja I a variável que, em cada experimento, assume o valor zero em caso de sucesso e o valor 1 em caso de fracasso. Para que X seja igual a k, deve ocorrer a seguinte situação: • primeiro experimento: fracasso � I = 0 • segundo experimento: fracasso � I = 0 • terceiro experimento: fracasso � I = 0 • ... • No experimento de número k-1: fracasso � I = 0 • No experimento de número k: sucesso � I = 1 Nos k-1 primeiros experimentos, temos fracasso. No último experimento, temos um sucesso. Para que X seja igual a k, queremos que ocorram k-1 fracassos e 1 sucesso, nesta seqüência. Como todos esses eventos são independentes, a probabilidade da intersecção é igual ao produto das probabilidades. P( X = k ) = 1( − p) k −1 × p Resposta: B. www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 17 PROFESSOR VÍTOR MENEZES EC 6 AFC/CGU - 2008. Área: Estatística e cálculos atuariais. [ESAF] Seja X uma variável aleatória discreta com função de probabilidade binomial f ( x) , onde (f k ) = Cn,k p x 1( p− ) n −k e Cn,k é o número de combinações de n elementos tomados k a k. Sendo n=6 e p=1/3, determine f(6). a) 1/729 b) 1 c) 0 d) 64/729 e) 8/729 Temos uma variável binomial. O exercício pediu para calcularmos a probabilidade de X=6. Basta aplicar a fórmula que vimos (e que o próprio exercício forneceu). P( X � n � = k ) = × p k × q n−k� k � � � � XP = = � − � 6� � × 1( ( )6 / )3 6 × (2 / )3 6 6 = 1( / )3 6 = 1 / 729 � 6 � � Resposta: A. EC 7 AFC/CGU - 2008. Área: Estatística e cálculos atuariais. [ESAF] Seja F(k) a função de distribuição da variável aleatória definida na questão anterior, determine F(0). a) 0 b) 1/729 c) 64/729 d) 243/729 e) 1. A função de distribuição nos fornece a probabilidade de X ser menor ou igual a um dado valor k. Se k=0, a função nos dirá qual a probabilidade de X ser menor ou igual a zero. Como X é uma variável binomial, ela só assume valores maiores ou iguais a zero. Lembrem-se de que a variável binomial tem relação com o número de casos favoráveis em um número ‘n’ de experimentos (não dá pra ter, por exemplo, menos dois casos favoráveis). Assim, F(0) corresponde à probabilidade de X=0. Aplicando a fórmula: P( X � n � = k ) = × p k × q n−k� k � � � � XP = = � − � 6� � × 1( ( )0 / )3 0 × (2 / )3 6 0 = (2 / )3 6 = 64 / 729 � 0 � � Resposta: C. EC 8 AFC/CGU - 2008. Área: Estatística e cálculos atuariais. [ESAF] www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 18 PROFESSOR VÍTOR MENEZES Seja X a soma de ‘n’ variáveis aleatóriasindependentes de Bernoulli, isto é, que assumem apenas os valores 1 e 0 com probabilidades p e 1-p, respectivamente. Assim, a distribuição de X é: a) binomial com parâmetros “n” e “p” b) gama com parâmetros “n” e “p” c) qui quadrado com “n” graus de liberdade d) laplace e) “t” de student com n-1 graus de liberdade Resposta: A. 2 Média e variância da variável binomial Vamos continuar com o lançamento do dado. O resultado é considerado favorável se sair um múltiplo de 3. É desfavorável se não sair um múltiplo de 3. Vamos lançar o dado 3 vezes. Nossa variável aleatória X vai representar o número de casos favoráveis nesses lançamentos. É, portanto, uma variável binomial. Vamos calcular a probabilidade de X assumir cada valor. Já até fizemos essa conta quando começamos a estudar a variável binomial. Mas ok, vamos lá de novo. Para X assumir valor zero, precisamos que os três lançamentos sejam desfavoráveis. · n = 3 · k = 0 · p = 1/3 · q = 2/3 ( 0) 0 3 � × 1 � × � 2 � 3−0 XP = �= � � � � � � � 3 � �0� � � 3 � � ( )0 0 !3 × � 1 � × � 2 � 3−0 = 8 XP = = �� � � !3 × !0 � 3 � � 3 � 27 Para X assumir valor 1, precisamos que exatamente um dos três lançamentos resulte em múltiplo de 3. · n = 3 · k = 1 · p = 1/3 · q = 2/3 ( )1 1 !3 × � 1 � × � 2 � 3 1− 1 = 3 × � 1 � 2 × � 2 � = 12 XP = = �� � � �� � � !2 × !1 � 3 � � 3 � � 3 � � 3 � 27 Para X assumir o valor 2, precisamos que exatamente dois dos três lançamentos resultem em múltiplo de 3. · n = 3 · k = 2 ESTATÍSTICA P/ ICMS-SP 19 PROFESSOR VÍTOR MENEZES · p = 1/3 · q = 2/3 ( )2 2 !3 × � 1 � × � 2 � 3−2 2 = 3 × � 1 � 1 × � 2 � = 6 XP = = �� � � �� � � !1× !2 � 3 � � 3 � � 3 � � 3 � 27 Por fim, para X assumir o valor 3, precisamos que todos os lançamentos resultem em múltiplo de 3. · n = 3 · k = 3 · p = 1/3 · q = 2/3 ( )3 3 !3 × � 1 � × � 2 � 3−3 3 = 1× � 1 � 0 × � 2 � = 1 XP = = �� � � �� � � !0 × !3 � 3 � � 3 � � 3 � � 3 � 27 Queremos calcular a média desta variável aleatória. Vimos como fazer isto na aula passada. Basta considerarmos que as probabilidades são freqüências relativas. PX X × P 0 8/27 0 1 12/27 12/27 2 6/27 12/27 3 1/27 3/27 Total 1 1 E a média da nossa variável X fica: μ = 1 = 1 1 Vamos agora calcular a sua variância. X e 2 P e 2 × P E a variância de X seria: σ 2 = 18 = 2 0 1 8/27 8/27 1 0 12/27 0 2 1 6/27 6/27 3 4 1/27 4/27 Total 1 18/27 27 3 Só que todo esse passo a passo dá muito trabalho. Quando X for uma variável aleatória binomial, um jeito mais rápido de calcular a sua média e sua variância é: μ = np σ 2 = npq Para calcular a média, basta multiplicar o número de experimentos (no nosso caso, lançamos o dado três vezes, n = 3) pela probabilidade de sucesso em um experimento (neste caso, em um lançamento, a probabilidade de sair um múltiplo de 3 é 1/3). www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 20 PROFESSOR VÍTOR MENEZES Logo: μ = np μ = 3 × 1 = 1 3 E para variância fazemos a mesma coisa. Só que, além dos passos acima, multiplicamos pela probabilidade de fracasso em um experimento (neste caso, em um lançamento, a probabilidade de sair um número que não seja múltiplo de 3 é 2/3). σ 2 = npq σ 2 = 3 × 1 × 2 = 2 33 3 Outro exemplo. EP 8 Seja X o número de resultados “coroa” em cinco lançamentos de uma moeda honesta. Calcule a média e a variância de X. RESOLUÇÃO DO EP 8. A cada lançamento da moeda, podemos ter um sucesso (sair coroa) ou um fracasso (sair cara). A variável X está relacionada com o número de sucessos. Portanto, é uma variável binomial. Temos as seguintes informações: · n = 5 (são 5 experimentos, ou cinco lançamentos da moeda) · p = 0,5 (a probabilidade de sucesso é 50%) · q = 0,5 (a probabilidade de fracasso é 50%) A média fica: μ = np μ = 5 × 0 5, = 2 5, . A variância é dada por: σ 2 = npq σ 2 = n × p × q = ,1 25 O que isto significa? Significa que, se fosse possível repetir este experimento inúmeras vezes (ou seja, se fosse possível fazer infinitas vezes a seqüência de 5 lançamentos da moeda), em média, obteríamos 2,5 coroas para cada seqüência de 5 lançamentos. Não estamos dizendo que, para um dado conjunto de 5 lançamentos, serão obtidas 2,5 coroas. Pra falar a verdade, isso é impossível (não dá para obter um número “quebrado” de coroas; não faz sentido dizer que obtivemos meia coroa). www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 21 PROFESSOR VÍTOR MENEZES Podemos pensar o seguinte. Por cem mil vezes nós fazemos os 5 lançamentos. Observem que cem mil é um número bem grandão. Em cada um destes cem mil conjuntos de 5 lançamentos, nós anotamos quantas caras foram obtidas (= valor de X, que pode variar de zero a 5). Obteremos cem mil valores para X. A média de todos esses cem mil valores de X será bem próxima de 2,5. É isto que estamos dizendo. E mais: quanto mais aumentarmos o número de experimentos, mais a média de X se aproxima de 2,5. O mesmo vale para a variância. A variância destes cem mil valores de X será bem próxima de 1,25. Média e variância da variável binomial μ = np σ 2 = npq 3 Proporções A distribuição binomial é muito aplicada quando estamos interessados em proporções de uma dada população. Considere uma cidade com 100.000 habitantes. Sabemos que 2/5 deles são favoráveis a uma dada política urbana. Ou ainda: a proporção de habitantes favoráveis à política urbana é de 40%. Vamos entrevistar cinco pessoas ao acaso. A nossa variável aleatória X vai designar o número de pessoas entrevistadas que são favoráveis à política urbana. Primeiramente, vamos supor que nosso processo ocorre com reposição. Como assim? O que significa “processo com reposição”? Listamos todas as pessoas. Sorteamos uma. Entrevistamos tal pessoa. E o nome dela volta para a lista, podendo ser sorteada novamente. A nossa variável X pode assumir os valores 0, 1, 2, 3, 4, 5. É um caso análogo ao lançamento do dado. São cinco experimentos independentes e, em cada um deles, a probabilidade de ocorrer o resultado favorável é de 2/5. Como X designa o número de pessoas favoráveis à política (= número de sucessos), X é uma variável binomial. Assim, temos: · n = 5 (número de experimentos) · p = 2/5 (probabilidade de resultado favorável em um experimento – é o mesmo valor da proporção de pessoas favoráveis à política) · q = 3/5 (probabilidade de resultado desfavorável em um experimento) A probabilidade de X assumir cada um dos valores possíveis é dada abaixo: X P 0 0,07776 1 0,2592 2 0,3456 3 0,2304 4 0,0768 5 0,01024 Todos os valores acima foram calculados com a fórmula da variável binomial dada abaixo. www.pontodosconcursos.com.brESTATÍSTICA P/ ICMS-SP 22 PROFESSOR VÍTOR MENEZES P( X � n � = k ) = × p k × q n−k� k � � � � É por isso que a proporção está relacionada com a variável binomial. Ela tem relação com a probabilidade de sucesso e fracasso (valores de p e q). Vamos agora mudar um pouco o exemplo. Poderíamos fazer a entrevista de um modo um pouco diferente. Podemos fazer um experimento sem reposição, o que é até mais comum. Não queremos entrevistar a mesma pessoa duas vezes. Uma vez que um nome é sorteado, ele não volta para lista, de modo que uma pessoa jamais poderia ser sorteada mais de uma vez. Neste caso, não temos mais uma variável binomial. Continuamos tendo cinco experimentos. Só que eles não são mais independentes entre si (e, para termos variável binomial, os n eventos têm que ser independentes). A probabilidade de, no segundo experimento, ser entrevistada uma pessoa favorável à política urbana depende do resultado do primeiro experimento. São 100.000 habitantes. 40.000 são favoráveis à referida política. 60.000 são contrários. Suponhamos que a primeira pessoa entrevistada foi favorável à política. Entrevistada a primeira pessoa, a situação é a seguinte: · temos agora 99.999 pessoas · restaram 39.999 favoráveis à política A probabilidade de a segunda pessoa também ser favorável é: 39.999/99.999. Este número é diferente de 2/5. De outro modo, se a primeira pessoa foi contrária à referida política, temos: · 99.999 pessoas ainda restam com chances de serem entrevistadas · todas as 40.000 favoráveis à política ainda podem ser entrevistadas A probabilidade da segunda pessoa ser favorável é: 40.000/99.999, que também é diferente de 2/5. Notem que a probabilidade de sucesso e fracasso no segundo experimento (na segunda entrevista) depende do resultado do experimento anterior. Ou seja, os experimentos não são independentes. Conclusão: não temos uma variável binomial. Mesmo nossa variável não sendo exatamente binomial, obedecidas algumas condições, podemos considerá-la aproximadamente binomial. É exatamente o caso acima. Para ficar mais claro, vamos para uma situação extrema. Suponha que as quatro primeiras pessoas entrevistadas foram favoráveis à política. Qual a probabilidade da quinta pessoa também ser? · restam 99.996 pessoas · destas, 39.996 são favoráveis à política urbana Portanto, a probabilidade procurada é: 39.996/99.996 = 0,399976. Este número é muito próximo de 2/5 (=0,4). A proximidade é tanta que podemos considerar que esta distribuição é praticamente binomial. Ou seja, mesmo que não haja reposição, podemos considerar que, a cada novo entrevistado, a probabilidade de a pessoa ser favorável à política urbana é de 2/5. Isto porque, mesmo na situação extrema acima, o valor obtido ainda foi muito próximo de 2/5. Utilizaremos esta propriedade nas próximas aulas. www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 23 PROFESSOR VÍTOR MENEZES Então, resumindo, temos que: • a variável binomial é útil para estudarmos proporções • as probabilidades de sucesso e fracasso têm relação com a proporção de ocorrência de um dado fenômeno/resultado/valor/etc. Vejamos praticar um pouco. EC 9 Prefeitura Municipal de Vila Velha – Técnico de Nível Superior. Área estatística. [CESPE] Determinado fornecedor informou que 5% dos produtos comercializados por ele apresentam algum tipo de defeito. Uma prefeitura efetuará uma compra desse fornecedor de um grande lote desses produtos. Como parte do procedimento de controle de qualidade dessa prefeitura, uma amostra aleatória de dez produtos do lote enviada pelo fornecedor será retirada. O lote só será aceito pela prefeitura se a amostra não apresentar produtos defeituosos. Caso a amostra apresente um ou mais produtos defeituosos, todo o lote será devolvido ao fornecedor. Com base nas informações apresentadas nessa situação hipotética, julgue os itens que se seguem. 1. A probabilidade de um lote ser devolvido é superior a 0,25. 2. A variância do número de produtos defeituosos na amostra é inferior a 0,40. 3. A moda da distribuição do número de produtos defeituosos na amostra é igual a 1. Questão do CESPE. A questão envolve proporção. Proporções estão relacionadas com variáveis binomiais. Seja X o número de produtos defeituosos na amostra. X é uma variável binomial. A probabilidade de sucesso é igual a 5% (probabilidade de um dado item ser defeituoso). A probabilidade de fracasso é 95%. Não custa nada relembrar o comentário que já fizemos na aula passada. Estamos interessados nos produtos defeituosos. Por isso, associamos a eles os casos favoráveis (ou sucessos). Não estamos fazendo qualquer juízo de valor. Até porque, em regra, um produto defeituoso não é algo bom. Mesmo assim, chamamos de casos favoráveis, pois neles é que estamos interessados. Continuando com o exercício. A probabilidade de sucesso coincide com a proporção de produtos defeituosos fabricados pelo fornecedor. No item 1, queremos calcular a probabilidade de X assumir algum dos valores: 1, 2, 3, 4, ..., 10. Isto porque se houver um ou mais produtos defeituosos, o lote será devolvido. Assim, se o número de produtos defeituosos (=X) não for zero, isto é, se nem todos os produtos funcionarem, o lote não será aceito. Lembrando a fórmula de cálculo vista no começo da aula: P( X � n � = k ) = × p k × q n−k� k � � � � Teríamos que aplicar esta fórmula dez vezes. Uma vez para X = 1. Outra para X = 2. Outra para X = 3. E assim por diante, até X = 10. Só que isto dá muito trabalho. É mais fácil fazer o seguinte. Em vez de calcularmos a probabilidade do lote se devolvido, vamos calcular a probabilidade do lote ser aceito. Para que o lote seja aceito, todos os produtos devem estar funcionando. Ou seja, queremos calcular a probabilidade de X ser igual a 0. www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 24 PROFESSOR VÍTOR MENEZES P( X = )0 = �10 � × 0 5, 0 × ,0 1095 � � � �0 � P( X P( X = )0 = )0 = !10 × 0 ( !10 ) × !0 5, = ,0 1095 0 × ,0 1095 P( X = )0 = 0 598737, Percebeu a diferença? Precisamos aplicar a fórmula uma só vez. Foi muito menos trabalhoso. A probabilidade do lote ser aceito é de 59,87%. Portanto, a probabilidade de ele ser devolvido é de 40,13%. O item está correto, pois a probabilidade de devolução é superior a 25%. Na versão da prova que eu tenho não consta nenhuma tabela de valores do tipo a b . Algo que permitisse que não fizéssemos a conta ,0 10 95 . Talvez, para esta prova, tenha sido distribuído calculadora. Isto porque não é típico do CESPE fazer os candidatos perderem tempo com contas. Caso não tenha sido fornecida calculadora, nem qualquer tabela que agilizasse as contas, destaco que não era necessário fazer o cálculo ,0 10 95 para responder à questão. Não se pediu a probabilidade do lote ser devolvido. Apenas precisávamos saber se a probabilidade de devolução do lote era maior ou menor que 0,25. Como descobrir se o item é falso ou verdadeiro, sem calculadora? É só adotar o seguinte procedimento: Partimos do valor 1. De 1, retiramos 5%. Ficamos com 0,95. Do valor 0,95, retiramos 5% (de 0,95). Ficamos com 0,9025.Do valor 0,9025 retiramos 5% (de 0,9025). Ficamos com 0,857375. Se repetirmos isto por 10 vezes, o valor final obtido será ,0 1095 . Isto porque retirar 5% é o mesmo que multiplicar por 0,95. Portanto, a conta que fizemos foi multiplicar o valor 1 por 0,9510. Pois bem, em vez de retirarmos 5% (o que dá muito trabalho, pois envolve contas de multiplicação), vamos retirar 0,025. Partimos do valor 1. Retiramos 0,025. Ficamos com 0,975. Do valor 0,975, retiramos 0,025. Ficamos com 0,95. Do valor 0,95, retiramos 0,025. Ficamos com 0,925. Se repetirmos isto dez vezes, o valor final obtido será 0,75. Em cada vez que retiramos 0,025, na verdade, nós retiramos menos que 5% do respectivo valor base. Portanto, o valor 0,75 é certamente maior que ,0 1095 . www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 25 PROFESSOR VÍTOR MENEZES Concluímos que: 0 95, 10 < 0 75, Nós queremos calcular a probabilidade do lote ser devolvido. Ou seja, queremos 1 − ,0 1095 . Partindo da desigualdade 0 95, 10 < 0 75, , ficamos com: 0 95, 10 < 0 75, � 0− 95, 10 > 0 − 75, − 0 95, 10 > 0 − 75, � 1 − 0 95, 10 > 1 − 0 75, 1 − 0 95, 10 > 1 − 0 75, � 1 − 0 95, 10 > ,0 25 Portanto: 1 − 0 95, 10 > ,0 25 Ou seja, mesmo sem calculadora, temos como afirmar que a referida probabilidade é superior a 25%. Este método é interessante por descartar as multiplicações, o que torna mais rápida a solução. Vamos para o segundo item. Pede-se a variância de uma variável binomial. Basta aplicar a fórmula. σ 2 = npq São 10 elementos na amostra. n = 10 Chamando a probabilidade de um produto ser defeituoso de p, temos: p = 0 05, q = 1 − p = 0 95, E a variância fica: σ 2 = 10 × 0 05, σ 2 = ,0 475 . × 0 95, A variância não é inferior a 0,40. O item está errado. Vamos ao terceiro item. Afirma-se que a moda da distribuição do número de produtos defeituosos é igual a 1. Nós vimos que a moda é o termo que mais se repete. Quando temos uma seqüência de números, a moda é o termo que tem maior freqüência. No caso de variável aleatória, temos probabilidades no lugar de freqüências. Vimos na aula anterior que a probabilidade corresponde à freqüência relativa que seria obtida num número muito grande de experimentos. Pois bem, para que um número seja a moda, a probabilidade de ele ocorrer tem que ser maior que a probabilidade de ocorrer qualquer outro número. www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 26 PROFESSOR VÍTOR MENEZES Para que a moda seja 1, a probabilidade de X ser igual a 1 tem que ser maior que a probabilidade de X assumir qualquer outro valor. Vamos calcular a probabilidade de X ser igual a 1. P( X � n � = k ) = × p k × q n−k� k � � � � P( X = )1 = �10 � × ,0 10 5 × 0 95, 9 � � � �1 � P( X = )1 = !10 × ,0 105 !1× !9 × 0 95, 9 P( X = )1 = 10 × ,0 10 5 × 0 95, 9 P( X = )1 = 0 3151, No primeiro item, vimos que a probabilidade de X assumir o valor zero é igual a 59,87%. A probabilidade de X assumir o valor 1 é 31,51%. Portanto a moda não é 1. Há pelo menos um valor cuja probabilidade é superior à probabilidade de 1 ocorrer. Caso não tenha sido fornecida calculadora, destaco, novamente, que não era preciso calcular 0 95, 9 . Bastava fazer o seguinte. P( X P( X = )1 = )0 = 10 × ,0 10 5 = ,0 1095 × 0 95, 9 Dividindo a segunda probabilidade pela primeira: ( 0) ,0 1095 XP = = P( X = )1 10 × ,0 05 × 0 95, 9 P( X = )0 = 0 95, P( X = )1 10 × 0 05, P( X = )0 = 0 95, P( X = )1 0 5, P( X P( X = )0 = 1 9, = )1 Portanto, a probabilidade de X assumir o valor 0 é maior que a probabilidade de X assumir o valor 1. O item está errado. XVII DISTRIBUIÇÃO DE POISSON Vimos que a distribuição binomial é útil para calcularmos a probabilidade de, em “n” experimentos, termos k casos favoráveis. A fórmula estudada foi: www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 27 PROFESSOR VÍTOR MENEZES P( X � n � = k ) = × p k × q n−k� k � � � � Vamos retomar o EC 9. Calculamos a probabilidade da variável binomial assumir o valor zero (ou seja, do lote ser aceito). Ela era, aproximadamente, igual a 0,598737. Para tanto, fizemos o seguinte cálculo: P( X = )0 = �10 � × 0 05, � 0 × ,0 1095 −0 � � 0 � � Pois bem. É possível demonstrar que, quando “n” é grande e “p” é pequeno, a fórmula P( X � n � = k ) = × p k × q n−k pode ser aproximada por:� k � P( X � � = k ) = e � − np × ( )knp k! O símbolo “ e ” representa um número real, que vale aproximadamente 2,7. Segundo Bussab e Morettin, no livro Estatística Básica, a aproximação é boa se np ≤ 7 . Vamos resolver o mesmo exercício, agora usando essa aproximação. Com o auxílio de uma calculadora, temos: e = −10×0,05 ( )0 P( X = )0 × 10 × 0 05, � 0 606531, !0 Muitos tipos de variáveis são bem descritas por meio da distribuição de probabilidades − = k ) = np × ( )k dada por P( X e np . Essa é a distribuição de Poisson. É comum substituir o !k produto np pela letra λ (lâmbda). Como a esperança da variável binomial é dada por np , dizemos que λ corresponde ao número esperado de ocorrências. A distribuição de Poisson descreve muito bem o número de ocorrências ao longo do tempo (ou ao longo de uma superfície). Alguns exemplos seriam: • O número de carros que passam por uma cabine de pedágio, durante 5 minutos; • O número de telefonemas recebido por uma central de atendimento, durante 2 horas; • O número de clientes que entram na fila de um banco, durante 1 hora. • O número de defeitos observados em 2 metros quadrados de material; www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 28 PROFESSOR VÍTOR MENEZES Distribuição de poisson. − = k ) = λ × (λ )k P( X e k! Pode ser usada no lugar da distribuição binomial, quando o número de experimentos é grande (n grande) e quando a probabilidade de sucesso é pequena (p pequeno). Muito útil para representar alguns tipos de ocorrências em um determinado tempo/superfície. EC 10 Analista Judiciário. Especialidade: estatística. TRF 1ª Região/2001 [FCC] A probabilidade de que um item produzido por uma máquina seja defeituoso é de 10%. Uma amostra de 30 itens produzidos por esta máquina é selecionada ao acaso. Use a aproximação pela distribuição de Poisson para determinar a probabilidade de que não mais do que um item defeituoso seja encontrado nesta amostra. a) 4e 3− b) 4e 2− c) 3e 3− d) 1 − 4e 3−e) 1 − 3e 3− Antes de resolvermos a questão da maneira solicitada pelo enunciado, vamos usar a distribuição binomial. Podemos considerar que, a cada item selecionado, temos um experimento. Estamos interessados nos itens defeituosos. Se o item sorteado for defeituoso, consideramos um caso favorável. Caso contrário, consideramos um caso desfavorável. A probabilidade de sucesso, em um experimento, é de 10% (p=0,1). O número de experimentos é de 30 (n=30). Seja X o número de itens defeituosos na amostra de 30 itens. Queremos a probabilidade de X ser igual a zero ou 1. Basta aplicar a fórmula: P( X � n � = k ) = × p k × q n−k� k � � � � P( X = )0 = � 30 � × ,0 01 × 0 9, 30 � � � �0 � Usando a calculadora: P( X P( X = )0 = )1 � 0 04239, = � 30 � × ,0 1 × 0 9, 29 � � �1 � � Novamente com o auxilio de calculadora: P( X = )1 = 30 × 0 1, 1 × 0 9, 29 � 0 14130, Assim, a probabilidade de termos um ou nenhum item defeituoso na amostra é de: 0 14130, + 0 04239, = 0 183 69, www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 29 PROFESSOR VÍTOR MENEZES Pronto. Achamos a probabilidade, considerando a distribuição binomial. Acontece que nós vimos que, em certas situações, a fórmula da distribuição binomial pode ser aproximada por: −λ = k ) = × ( )λ k P( X e k! Onde λ é o número esperado de ocorrências. Em média, 10% dos itens produzidos são defeituosos. Numa amostra com 30 itens, espera-se que existam 3 itens defeituosos ( λ = 3 ). Note que: λ = np = 30 × 0 1, = 3 . A probabilidade de termos zero itens defeituosos fica: ( ) 3 P( X = )0 3− 3 0× = e = e − !0 A probabilidade de termos 1 item defeituoso na amostra é de: ( ) 3 P( X = )1 1 = e 3− × 3 !1 = 3e − Assim, a probabilidade de termos zero ou um item defeituoso é de: e 3− + 3e 3− = 4e 3− Resposta: A Por curiosidade, usando a calculadora, temos: 4e 3− � 0 19915, O resultado foi relativamente próximo daquele calculado sem a aproximação (usando a distribuição binomial). Pergunta: Vítor, como vou saber quando é para usar a distribuição binomial e quando vou utilizar a distribuição de Poisson? Neste exercício em particular, era perfeitamente possível usar a distribuição binomial. Em geral, se for possível usar a binomial, use-a! Neste caso, só usamos a distribuição de Poisson porque a questão disse expressamente para fazer isso. Do contrário, usaríamos a distribuição binomial mesmo. EC 11 Analista Ministerial MPE PE/2006. Área: estatística [FCC] O número de falhas de certo tipo de placa térmica tem distribuição de Poisson, com taxa média de 0,1 defeitos por m2. Na confecção da superfície de um armário, é necessário cobrir uma superfície de 2m por 2m com essa placa. A probabilidade de que haja pelo menos uma falha nessa superfície é de: a) e 0− 1, b) 1 − e 0− 1, c) 1 − e 0− , 4 d) e 0− , 4 e) 1 − ,1 4e 0− , 4 www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 30 PROFESSOR VÍTOR MENEZES Exercício bem parecido com o anterior. Seja X a variável que designa o número de falhas. Vamos calcular a probabilidade de X seja igual a zero. −λ = k ) = × ( )λ k P( X e k! A taxa média é de 0,1 defeito por m2. Em 4 m2, o número esperado é de 0,4 defeitos ( λ = ,0 4 ). −λ = k ) = × ( )λ k P( X e k! ( ) 0, 4 P( X = )0 0− , 4 e = × ,0 4 0 0! = e − Portanto, a probabilidade que não haja defeitos na placa é de e 0− , 4 . Desse modo, a probabilidade de haver pelo menos uma falha nessa placa é de: 1 − e 0− , 4 Resposta: C. Interessante notar o seguinte. O exercício pediu para usarmos a distribuição de Poisson. Mas, mesmo que ele não tivesse dito nada a respeito, necessariamente teríamos que usar a distribuição de Poisson. Não dá para usar a distribuição binomial aqui. Por quê? Tanto na distribuição binomial quanto na de poisson, a variável de interesse é o número de ocorrências de alguma coisa. Vamos retomar o EC 10. Lá a variável de interesse era o número de itens defeituosos produzidos pela máquina. Trata-se de uma variável discreta, que pode assumir apenas os valores 0, 1, 2, 3, ...., 29, 30. Pois bem, a cada item analisado, temos um experimento. A probabilidade de sucesso (=item defeituoso) é de 10%. A probabilidade de fracasso é de 90%. Se, a título de exemplo, quisermos calcular a probabilidade de termos exatamente 1 item defeituoso, usamos a fórmula da variável binomial. Ela vai nos dar a probabilidade de haver exatamente zero 1 defeituoso (e, consequentemente, 29 itens sem defeito). Ficaria assim: P( X = )1 = 0 � ,0� 3 ×� � � � 1 × 0 9, 29 1 � Pois bem, estamos calculando a probabilidade de: www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 31 PROFESSOR VÍTOR MENEZES · Termos 1 item defeituoso · Termos 29 itens não defeituosos · Tudo isso, verificado em 30 experimentos Mudemos de exercício. Vamos agora para o EC 11. Vamos calcular a probabilidade de ter exatamente uma falha na superfície, usando a distribuição binomial. Vamos considerar sucesso sempre que observarmos uma falha. Vamos considerar fracasso sempre que não observarmos qualquer falha. Pergunta: quanto experimentos foram realizados? Não dá para saber. O que seria um experimento? Seria a análise de 1 m2 de superfície? Seria a análise de 1 cm2 de superfície? Não temos como contar quantos experimentos foram feitos. E mais: não sabemos quantos fracassos ocorreram. Estamos interessados em calcular a probabilidade de exatamente uma falha no material. Estamos considerando que cada falha é um caso favorável (=sucesso). Ou seja, queremos saber a probabilidade de, em uma placa de 4m2, termos exatamente 1 falha. Queremos a probabilidade de 1 caso favorável. Ok, para os casos favoráveis é tranqüilo. Contudo, não dá para contar quantos seriam os casos desfavoráveis. Quantas falhas deixaram de ocorrer? Outra vez, não temos resposta. Sempre que estivermos diante de situações assim, não dá para usar a distribuição binomial. Daí partimos para a distribuição de Poisson. A variável que apresenta distribuição de poisson é discreta. É sempre número de ocorrências de alguma coisa (portanto, só pode assumir os valores 0, 1, 2, 3, 4, ...). Mas, em geral, é um número de ocorrências contado sobre uma base contínua. Neste exercício, tínhamos o número de ocorrências de falhas em uma área (a área tem natureza contínua: pode assumir qualquer valor real maior que zero). Outro caso típico é o número de chamadas telefônicas numa central de atendimento. Novamente, estamos contando o número de ocorrências (a variável de interesse é discreta). Mas o tempo é contínuo. O tempo pode assumir qualquer valor real maior que zero. Novamente, teremos as mesmas dificuldades: como contar quantos experimentos aconteceram? Cada segundo é um experimento? Cada minuto? Cada hora? Como contar oscasos desfavoráveis? Como contar quantas chamadas não ocorreram? Como contar quantas ligações não foram feitas? Binomial versus Poisson Sempre que for possível usar a variável binomial, use-a (exceto se o exercício disser usar a variável de poisson). Há casos em que não é possível usar a distribuição binomial. São casos em que o número de ocorrências é contado num campo contínuo (como espaço/área e tempo). Nestas situações: use a distribuição de poisson Apenas por curiosidade, a idéia da distribuição de poisson é a seguinte. No caso das falhas na superfície de 4 m2, supõe-se que seria possível dividir esta superfície em áreas muito pequenas. Muito pequenas mesmo. Áreas infinitesimais. Isto www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 32 PROFESSOR VÍTOR MENEZES de tal forma que a probabilidade de ocorrência de duas ou mais falhas em cada uma destas pequenas áreas seja igual a zero. Cada “áreazinha” é analisada, para ver se contempla uma falha. Ou seja, a cada área temos um experimento. Se a área apresentar uma falha, temos sucesso. Do contrário, temos fracasso. Feito isso, aplica-se a fórmula da distribuição binomial. Só que como as áreas têm que ser bem pequenas mesmo, então o número de experimentos é bem grandão. Quando ‘n’ é bem grande e ‘p’ é pequeno, daí é possível demonstrar que a fórmula da variável − = k ) = λ × (λ )k binomial tende a P( X e . k! Ou seja: a fórmula da variável de poisson é baseada na distribuição binomial. Seria uma distribuição binomial “especial” (especial porque se aplica a casos em que o número de experimentos é bem grandão, uma vez que as ocorrências são contadas num campo contínuo). EC 12 Analista Ministerial MPE PE/2006. Área: estatística [FCC] Considerando os dados da questão anterior, responda ao que segue. Na confecção de 3 superfícies deste tipo, a probabilidade de que exatamente duas não apresentem defeito é: a) 3 1( − e −0, 4 ) 2 e 0− , 4 b) 3e 0− 1, c) 3 1( d) 3 1( e) 3 1( − e 0− , 2 ) − e 0− 1, ) 2 e 0− 1, − e −0, 4 ) 2 e 0− ,8 Já sabemos que a probabilidade de uma peça de 4 m2 ser defeituosa é de 1 − e 0− , 4 . Queremos saber a probabilidade de exatamente duas peças não serem defeituosas. Temos três possibilidades: • A primeira peça é defeituosa (e as demais são normais) • A segunda peça é defeituosa (e as demais são normais) • A terceira peça é defeituosa (e as demais são normais) • A primeira e a última são defeituosas Vamos trabalhar com a primeira hipótese. Queremos que três eventos, independentes, ocorram simultaneamente (a primeira peça é defeituosa, a segunda peça é normal, e a terceira peça é normal). Como os três eventos são independentes, a probabilidade da intersecção é igual ao produto das probabilidades: P( primeira _ defeituosa) = (1 − e 0− , 4 )× e 0− , 4 × e 0− , 4 = (1 − e 0− , 4 )× e 0− ,8 Para as duas outras hipóteses, as contas são análogas. Somando as probabilidades das três possibilidades, ficamos com: P(exatamente _ duas _ normais) = 3 × (1 − e 0− , 4 )× e 0− ,8 www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 33 PROFESSOR VÍTOR MENEZES Resposta: E. Outra forma de resolver é aplicar direto a fórmula da distribuição binomial. Note que aqui a situação muda completamente. No exercício anterior, estávamos contando quantas falhas ocorriam em uma área (contínua). Usamos a distribuição de Poisson. Agora mudou tudo. Estamos contando quantas placas de 4m2 apresentam defeitos. A contagem não se dá mais em função de uma superfície/área. A contagem é por placa de 4m2. Cada placa analisada corresponde a um experimento. Se a placa apresentar falhas, temos um caso favorável. Do contrário, temos um caso desfavorável. Dá para contar quantos são os experimentos, quantos são os sucessos e quantos são os fracassos. Temos: · n = 3 (são confeccionadas três placas) · p = 1 − e 0− , 4 (a probabilidade de caso favorável – placa defeituosa – foi calculada no exercício anterior. · q = e 0− , 4 (probabilidade de caso desfavorável – placa sem defeitos) · k = 1 (queremos exatamente uma placa com defeito – 1 caso favorável) Aplicando a fórmula da variável binomial: P( X � n � = k ) = × p k × q n−k� k � � � � P( X = )1 = � 3� × ( )1 − e −0, 4 1 × (e −0, 4 )3 1−� 1 � � � � P( X = )1 = 3 × ( )1 − e −0, 4 × (e −0, 4 )2 P( X = )1 = 3 × (1 − e 0− , 4 )× (e 0− ,8 ) E obtivemos o mesmo resultado. EC 13 Analista – Área documentação. Especialidade – Estatística – MPU/2007 [FCC] O número de pacientes atendidos por um clínico geral segue uma distribuição de Poisson com taxa de 4 pacientes por hora. A probabilidade de que pelo menos um paciente consulte o clínico geral em um período de 15 minutos é: a) 1 − e 1− b) 1 − e 4− c) e 4− d) e 4 e) e 1− Notem que a contagem de pacientes se dá por tempo (que é contínuo). É o caso típico de utilização da distribuição de poisson. www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 34 PROFESSOR VÍTOR MENEZES Antes de fazer qualquer conta, notem que a letra D é totalmente absurda. O número “e” é aproximadamente igual a 2,7. Quando elevado à quarta potência, fica ainda maior. Portanto, na letra D temos uma probabilidade maior que 1, o que é impossível. Uma probabilidade, no máximo, é de 100%. Se em uma hora, em média, são atendidos 4 pacientes, então o número esperado de pacientes no período de 15 minutos é 1 (basta fazer regra de três). Portanto, λ = 1 Seja X a variável que designa o número de pacientes atendidos. Queremos calcular a probabilidade de X ser maior que zero. Para tanto, primeiro vamos calcular a probabilidade de X ser igual a zero. −λ = k ) = × ( )λ k P( X e k! ( ) 1 P ( X = )0 = e −1 1 0 × !0 = e − Portanto: P( X ≠ )0 = 1 − e 1− Resposta: A. EC 14 Analista Judiciário. Área apoio especializado. Especialidade: Estatística. TRF 2ª Região/2007 [FCC] Sabe-se que a variável aleatória X é bi-modal para x=1 e x=2 e que tem distribuição de Poisson. Sabendo que X é diferente de zero, a probabilidade de X assumir um valor menor do que 3 é dada por: 4 a) b) 2e 4 e 2 − 1 2 c) e d) 1 − e) 4 e 2 4 1 − e 2 Exercício diferente dos anteriores. Acho que é uma questão muito boa porque cobra diversos conceitos (moda, distribuição de poisson e probabilidade condicional). Quando temos um conjunto de dados, a moda é o termo que mais se repete (matéria das duas primeiras aulas). Quando temos uma variável aleatória discreta, a moda é o valor que tem a maior probabilidade de ocorrer. Portanto, o exercício está nos dizendo que a probabilidade de X assumir os valores 1 e 2 são iguais entre si e, além disso, são maiores que as probabilidades de X assumir qualquer outro valor. −λ = k ) = × ( )λ k P( X e k! e −λ × ( )λ 1 P( X = )1 = !1 www.pontodosconcursos.com.br e −λ
Compartilhar