Baixe o app para aproveitar ainda mais
Prévia do material em texto
Universidade Federal de Lavras Departamento de Estatística Estatística GES101 Prof. Marcelo Oliveira Lista de exercícios 4 – Cálculo de probabilidades pela teoria básica. 1. Uma empresa fura poços artesianos numa região escolhendo aleatoriamente o ponto de furo. Não encontrando água nessa tentativa, sorteia outro local e, caso também não tenha sucesso, faz uma terceira e última tentativa. Admita probabilidade 0,7 de encontrar água em qualquer ponto dessa região. Calcule a probabilidade de: a) Encontrar água na segunda tentativa. b) Encontrar água em até duas tentativas. C) Encontrar água. 2. Um trabalho enviado para uma impressora compartilhada tem 60% de probabilidade de ser o primeiro da fila de impressão (impressão imediata) e 30% de probabilidade de ser o segundo da fila. Qual é a probabilidade de que: a) Um trabalho enviado para esta impressora seja o primeiro ou o segundo da fila? b) Seja o primeiro e o segundo da fila? c) Um trabalho seja do terceiro da fila em diante? 3. Numa fila bancária, há prioridade de atendimento para mulheres grávidas e para pessoas acima de 60 anos de idade. A população atendida tem 6% de grávidas e 12% de idosos (as) acima de 60 anos. Qual é a probabilidade de que uma pessoa tenha prioridade no atendimento? E se um terceiro critério de prioridade de atendimento fosse acrescentado (“ser mulher”), como seria feito o cálculo dessa probabilidade? 4. Há uma probabilidade de 1% para um HD falhar, e de 0,2% de um sistema de fita magnética falhar. Se uma empresa de logística faz seus backups diários em 2 sistemas de fita desses, qual é a probabilidade da empresa perder todos os seus dados? Compare esta probabilidade caso não houvesse os backups nas fitas – quanto aumentou? 5. Dois processadores tipos A e B são componentes de um sistema e trabalham juntos. Estuda-se a confiabilidade deste sistema em 50 mil horas de uso (funcionamento). Sabe-se, por testagens anteriores em sistemas desse tipo, que a probabilidade de que um erro de funcionamento aconteça no processador do tipo A é de 2,3%, no tipo B é de 1,4%, e, em ambos é de 0,1%. Qual é a probabilidade de que: a) Pelo menos um dos processadores tenha apresentado erro? b) Nenhum processador tenha apresentado erro? c) Apenas o processador A tenha apresentado erro? d) Sabendo que pelo menos um dos processadores tenha apresentado erro, seja o processador B? e) Sabendo que nenhum processador tenha apresentado erro, o B apresente erro? f) Sabendo que pelo menos um dos processadores tenha apresentado erro, apenas o processador A tenha apresentado erro? 6. Blackouts podem ocorrer numa certa semana do ano num certo lugar com probabilidades dadas por: Domingo Segunda Terça Quarta Quinta Sexta Sábado 0,02 0,07 0,07 0,06 0,06 0,05 0,02 Os blackouts são independentes. a) Qual é a probabilidade de que ocorram blackouts na Terça? b) Qual é a probabilidade de que ocorram blackouts na Segunda e na Terça? c) Qual é a probabilidade de que ocorram blackouts na Segunda ou na Terça? d) Qual é a probabilidade de que não ocorram blackouts na semana? e) Qual é a probabilidade de que ocorram blackouts de Segunda a Sexta todos os dias? f) Qual é a probabilidade de que não ocorram blackouts no final-de-semana? 7. Numa escola, 4% dos homens e 1% das mulheres têm mais de 1,75m de altura, e 60% dos estudantes são mulheres. Um estudante é escolhido ao acaso e tem mais de 1,75m. Qual a probabilidade de que seja homem? 8. Um sistema, para funcionar, precisa de um componente que realiza uma determinada função. Há 2 marcas diferentes desse componente a disposição da indústria. A marca A tem probabilidade de falha dada por 0,05% enquanto a marca B tem 0,01%. a) Monte o sistema com a marca A: Qual é a probabilidade do sistema falhar? b) Monte o sistema com a marca B: Qual é a probabilidade do sistema falhar? c) Monte o sistema com as 2 marcas ligadas em série: Qual é a probabilidade do sistema falhar? Obs. Quando a falha de apenas um componente basta para levar à falha do sistema como um todo (que é o caso aqui), denominamos tal sistema de componentes de sistema em série. d) Monte o sistema com as 2 marcas ligadas em paralelo: Qual é a probabilidade do sistema falhar? Obs. Quando o sistema não funciona somente se A e B ambos não funcionam conjuntamente, denominamos essa configuração de sistema em paralelo. e) Se desejamos diminuir a probabilidade de falha do sistema, qual é a melhor maneira de montar o sistema? 9. Há sistemas com vários componentes, podendo chegar a centenas e até milhares. a) Como já vimos, quando a falha de um componente necessariamente leva à falha do sistema como um todo, denominamos tal sistema de componentes de sistema em série: A confiabilidade de um sistema em série é o produto da confiabilidade dos componentes. Consideremos, por exemplo, um sistema composto de 14 componentes do tipo A (probabilidade de falha de 5%) e 5 componentes do tipo B (probabilidade de falha de 1%), ligados em série. Qual a confiabilidade para o sistema como em todo? b) Como sistemas em série frequentemente não oferecem um alto nível de confiança em situações de alto risco, inventou-se um método para superar este problema, através da criação de redundâncias: Ambos os componentes A e B estão ativos no sistema: se A e B funciona, o sistema todo funciona; se A funciona e B não, o sistema continua funcionando; se B funciona e A não, o sistema também funciona; o sistema não funciona somente se A e B ambos não funcionarem. Esta configuração é chamada de sistema em paralelo. Qual é a probabilidade do sistema funcionar se os 14 componentes A são ligados A B A B em paralelo entre si, os 5 também são ligados em paralelo entre si, e os 2 conjuntos em série (veja esquema abaixo)? 10. Problemas de probabilidade relacionados a coincidência de aniversários: a) Qual é a probabilidade de que, em um grupo de n pessoas ( 365n≤ ), haja pelo menos uma coincidência de aniversários? b) Calcule agora a probabilidade de que, num grupo de m pessoas (com você excluído, isto é, m = n - 1), se encontre pelo menos uma pessoa com o aniversário na mesma data que você. c) Digamos que você queira encontrar k pessoas com a mesma data de aniversário que a sua. Admita que você perguntará m pessoas sobre a data de aniversário até que você consiga as k coincidências desejadas – ao encontrar a k-ésima coincidência você pára de procurar. Qual é a probabilidade de que você tenha que perguntar m=10 pessoas até encontrar k=1 coincidência? E para encontrar k=2 coincidências? Quantas pessoas m você terá que perguntar até encontrar k=1 pessoa com mesma data de aniversário que a sua, com probabilidade de 99%? E para encontrar k=2 coincidências? 11. Fulano está sendo apontado como o pai de uma criança, mas ele nega. Decide-se então partir para o teste de paternidade pelo DNA. Inicialmente optou-se pela análise de apenas um loco genético. O laboratório de genética molecular que recebeu o material do homem, da mãe, e da criança, identificou as seguintes informações: A1 A2 A14 ......... B1 B5 B2 ......... Pessoa Loco Alelos Mãe D13S308 14, 17 Criança D13S308 13, 17 Suposto pai D13S308 10, 13 A frequência do alelo 13 na população sob análise é sabido ser 7,5%. a) Qual é a probabilidade de Fulano ser o pai da criança? b) Qual é a probabilidade se o número de locos aumenta para 3? Considere independentes as segregações genéticas entre os locos. PessoaLoco1 Alelos Loco 2 Alelos Loco 3 Alelos Mãe D13S308 14, 17 aaaaaaa 2, 4 bbbbbbb 1, 2 Criança D13S308 13, 17 aaaaaaa 2, 6 bbbbbbb 2, 9 Suposto pai D13S308 10, 13 aaaaaaa 6, 11 bbbbbbb 5, 9 A freqüência do alelo 13 Loco 1 na população sob análise é sabido ser 7,5%. A freqüência do alelo 6 Loco 2 na população sob análise é sabido ser 1,2%. A freqüência do alelo 9 Loco 3 na população sob análise é sabido ser 0,5%. c) E para 12 locos? Pessoa Loco1 Alelos Loco 2 Alelos Loco 3 Alelos ... Loco 12 Alelos Mãe D13S308 14, 17 aaaaaaa 2, 4 bbbbbbb 1, 2 kkkkkkk _, _ Criança D13S308 13, 17 aaaaaaa 2, 6 bbbbbbb 2, 9 kkkkkkk _, x12 Suposto pai D13S308 10, 13 aaaaaaa 6, 11 bbbbbbb 5, 9 kkkkkkk _, x12 A freqüência do alelo 13 Loco 1 na população sob análise é sabido ser 7,5%. A freqüência do alelo 6 Loco 2 na população sob análise é sabido ser 1,2%. A freqüência do alelo 9 Loco 3 na população sob análise é sabido ser 0,5%. A freqüência do alelo x4 Loco 4 na população sob análise é sabido ser 25,0%. A freqüência do alelo x5 Loco 4 na população sob análise é sabido ser 9,0%. A freqüência do alelo x6 Loco 4 na população sob análise é sabido ser 9,8%. A freqüência do alelo x7 Loco 4 na população sob análise é sabido ser 18,7%. A freqüência do alelo x8 Loco 4 na população sob análise é sabido ser 20,5%. A freqüência do alelo x9 Loco 4 na população sob análise é sabido ser 9,0%. A freqüência do alelo x10 Loco 4 na população sob análise é sabido ser 1,9%. A freqüência do alelo x11 Loco 4 na população sob análise é sabido ser 9,9%. A freqüência do alelo x12 Loco 12 na população sob análise é sabido ser 9,0%. 12. Um relatório do setor de controle da qualidade de recepção de componentes de uma indústria de sistemas eletrônicos, relativo aos transistores adquiridos dos fornecedores, mostra os seguintes resultados por fabricante e por nível de qualidade: Tabela. Distribuição de frequências conjuntas das variáveis Fabricante e Qualidade de transistores. Fabricante Qualidade Aceitável Retrabalho Refugo A 128 10 2 B 97 5 3 C 110 5 5 Calcule: (a) A probabilidade de um transistor adquirido provir do fabricante A e ser de qualidade aceitável (esta é uma probabilidade conjunta). (b) A probabilidade de um transistor adquirido ser de qualidade aceitável, dado que provém do fabricante A (esta é uma probabilidade condicional). (c) A probabilidade de um transistor adquirido provir do fabricante A, dado que é de qualidade aceitável (esta também é uma probabilidade condicional). (d) A probabilidade de um transistor adquirido provir do fabricante B, dado que é de qualidade retrabalho (esta também é uma probabilidade condicional). (e) A probabilidade de um transistor adquirido provir do fabricante B (esta é uma probabilidade marginal). (f) O valor esperado da qualidade dos transistores adquiridos. (g) O desvio-padrão da qualidade dos transistores adquiridos. (h) A correlação entre a qualidade dos transistores adquiridos e a proveniência. (i) Verifique se as duas variáveis aleatórias são independentes, ou não. O que sua conclusão significa na prática? 13. Um levantamento numa população determinou as seguintes probabilidades para a distribuição conjunta de probabilidades das variáveis U: Tempo transcorrido desde a última manutenção, e V: Número de defeitos encontrados. Tabela. Distribuição de probabilidade conjunta das variáveis aleatórias U e V. Tempo transcorrido desde a última manutenção (anos arredondados) Número de defeitos encontrados 0 1 2 1 0,077 0,023 0,018 2 0,150 0,073 0,045 3 0,050 0,091 0,100 4 0,014 0,182 0,177 Calcule: (a) A probabilidade de um sistema apresente exatamente um defeito e estar a mais de um ano sem manutenção (esta é uma probabilidade conjunta). (b) A probabilidade de um sistema apresente exatamente um defeito sabendo que ele está a mais de um ano sem manutenção (esta é uma probabilidade condicional). (c) A probabilidade de um sistema apresente exatamente um defeito (esta é uma probabilidade marginal). (d) A probabilidade de que um sistema esteja a mais de um ano sem manutenção (esta também é uma probabilidade marginal). (e) A probabilidade de que um sistema esteja a mais de um ano sem manutenção sabendo que ela tem exatamente uma cárie (esta também é uma probabilidade condicional). Compare esta probabilidade com a alínea (b). (f) O valor esperado do número de defeitos no sistema. (g) O valor esperado do número de defeitos no sistema dado que o sistema está a 2 anos sem manutenção. (h) O desvio-padrão do número de defeitos no sistema. (i) O desvio-padrão do número de defeitos no sistema dado que o sistema está a 2 anos sem manutenção. (j) A correlação entre o número de defeitos e o tempo transcorrido sem manutenção. (k) Verifique se as duas variáveis aleatórias U e V são independentes, ou não. O que sua conclusão significa na prática? 14. Uma empresa que fura poços artesianos trabalha numa região perfurando pontos pré-definidos segundo uma geotécnica que se utiliza de modelagem, perfazendo no máximo 3 perfurações. Não encontrando água na primeira tentativa, os técnicos determinam outro local para perfurar e, caso também não tenham sucesso nessa segunda tentativa, fazem uma terceira e última tentativa num ponto determinado pela geotécnica. O modelo adotado para a probabilidade de encontrar água é dado por: m 510 ≤h ≤0 510 h 2 1 - 510 h 2 3 .0,7 m 510 ≥h 0,7 = p(h) 3 3 onde p(h) é a probabilidade de encontrar água em um ponto, dado que em um outro ponto a distância h não foi encontrado água. Calcule a probabilidade de: a) Encontrar água na segunda tentativa, perfurando em um ponto a 300 m do primeiro. b) Encontrar água na segunda tentativa, perfurando em um ponto a 600 m do primeiro. c) Encontrar água em até duas tentativas, perfurando a 300 m de distância um ponto do outro. d) Encontrar água, sempre perfurando a 300 m um ponto do outro. e) Sabendo que foi encontrada água, qual é a probabilidade de que foi até a segunda tentativa? Qual é a distância entre pontos de perfuração que maximiza a probabilidade de encontrar água? f) A empresa tem um custo fixo de R$ 2.500,00 por cada furo feito (pessoal, brocas, energia, etc) – qual é o preço que ela deve cobrar para ter um lucro de R$ 5.000,00 por poço perfurado (considere probabilidades máximas de achar água)? 15. Numa prova há 40 questões de múltipla escolha, com 4 alternativas A, B, C, e D. Como deve ser escolhida a ordem destas alternativas, ao se elaborar/montar a prova, para minimizar a probabilidade de acerto casual (acerto por “chute”)? 16. Um detector de mentiras será usado pela polícia para investigar 10 suspeitos de envolvimento em um determinado crime. Admita que entre eles 5 são culpados (mas alegarão inocência) e os outros 5 são realmente inocentes. Sabe-se também que: (i) Mesmo quando uma pessoa diz a verdade, o detector tem uma chance de 5% de falhar, indicando que ela mentiu; (ii) Mesmo quando ela mente, o detector tem uma chance de 30% de não conseguir detectar a mentira. Qual a probabilidade de que: (a) Todos os 10 diagnósticos obtidos através do detector estejam corretos? (b) O detector libere todos os 10 suspeitos? (c) Ao mesmo tempo, pelo menos 3 dos culpados sejam pegos e pelo menos 4 dos inocentes sejam liberados? 17. Dois amigos combinaram de se encontrar em determinado local entre 14:00 e 16:00, sendoque cada um deles esperaria pelo outro no máximo até 15 minutos. Qual é a probabilidade de que eles realmente se encontrem? 18. Exames, ou testes, para detecção de doenças em seres humanos podem ser de 4 tipos (clínico, laboratorial, anátomo-patológico, e imagem). Exames ou testes podem também ser aplicados a outros seres vivos (animais e plantas), ou mesmo para detecção de deficiências ou anomalias em sistemas mecânicos e ou em sistemas eletro- eletrônicos. Os exames não são, na maioria das vezes, perfeitos, podendo errar. Se um dado exame for perfeito (sem erro) para um dado indivíduo, então ele é dito fornecer um diagnóstico de certeza. Há basicamente 2 tipos de erros (falso-positivo e falso-negativo) nos exames, veja abaixo: Resultado de um exame que não fornece diagnóstico de certeza Resultado de outro exame que fornece diagnóstico de certeza Total TD: Tem a doença ND: Não tem a doença EP: Positivo p(EP,TD) p(EP,ND) p(EP) EN: Negativo p(EN,TD) p(EN,ND) p(EN) Total p(TD) p(ND) 100% Conceitos que são interessantes estudar: 1. Sensibilidade do exame. Responde a pergunta: que proporção de doentes o exame diagnosticou como doentes? É dada por p(EP/TD). Evidentemente, quanto mais próximo de 1 a sensibilidade, melhor o exame. Neste caso: p(EP/TD) 2. Especificidade do exame. Responde a pergunta: que proporção de sadios o exame diagnosticou como sadios? É dada por p(EN/ND). Evidentemente, quanto mais próximo de 1 a especificidade, melhor o exame. Neste caso: p(EN/ND) 3. Falso-positivo. Responde a pergunta: que proporção de indivíduos com exame resultando positivo (isto é, diagnosticados como doentes) estão, de fato, sadios? (Isto é, um erro de diagnóstico foi cometido). É dado por p(ND/EP). ). Evidentemente, quanto mais próximo de 0 o falso-positivo, melhor o exame. Neste caso: p(ND/EP) 1 – p(ND/EP) = p(TD/EP) é chamada de Valor preditivo positivo (VP+) do exame. 4. Falso-negativo. Responde a pergunta: que proporção de indivíduos com exame resultando negativo (isto é, diagnosticados como sadios) estão, de fato, doentes? (Isto é, um erro de diagnóstico foi cometido). É dado por p(TD/EN). Evidentemente, quanto mais próximo de 0 falso-positivo, melhor o exame. Evidentemente, quanto mais próximo de 0 a probabilidade de falso-negativo, melhor o exame. Neste caso: p(TD/EN) 1 – p(TD/EN) = p(ND/EN) é chamada de Valor preditivo negativo (VP-) do exame. Pergunta-se: a) Qual é a probabilidade de que uma pessoa com exame resultando positivo tenha a doença? Use o teorema de Bayes. b) Qual é a probabilidade de que uma pessoa escolhida ao acaso tenha resultado EP? c) Qual é a probabilidade de que uma pessoa escolhida ao acaso tenha a doença? d) Qual é a probabilidade de que uma pessoa escolhida ao acaso tenha resultado EP ou tenha a doença? e) Qual é a probabilidade de que uma pessoa escolhida ao acaso tenha resultado EP e tenha a doença? f) Um exame de sangue mostrou os resultados abaixo: f.1) Qual é a probabilidade de falso-positivo e de falso-negativo neste método? f.2) Analise probabilisticamente o resultado encontrado para o indivíduo analisado. 19. Em uma questão de um teste/prova de múltipla escolha, a probabilidade de um aluno/candidato saber a resposta é . Havendo alternativas, se ele sabe a resposta correta ele escolhe a alternativa correta com probabilidade 1, senão ele escolhe uma ao acaso e acerta com probabilidade . a) Quanto é a probabilidade de que ele saiba a resposta correta se ela acerta a questão? b) Calcule o limite da probabilidade da letra (a) para fixo e . Interprete. c) Calcule o limite da probabilidade da letra (a) para fixo e . Interprete. 20. Digamos que você queira calcular quantos peixes há num lago, sem esvaziar o lago e sem ter que pescar todos os peixes. Então você planeja o seguinte método: você pesca peixes e os marca com pecinhas de plástico que não os prejudicam e nem se soltam deles, soltando-os em seguida de volta ao lago. Depois de algum tempo, você volta a pescar peixes e conta que há peixes marcados nesta nova amostra (obviamente ). Quantos peixes há no lago? 21. Problema de Monty Hall. Num programa de TV, o apresentador faz o seguinte jogo com seu convidado: 3 portas fechadas são apresentadas ao convidado, atrás das quais há 2 bodes e 1 carrão; o convidado deve escolher uma porta para abrir, e ele receberá como seu prêmio o que estiver atrás da porta; obviamente o convidado não sabe o que há por trás das portas; o apresentador pede ao convidado para escolher uma das portas e ele escolhe a porta ; o apresentador, que sabe o que há por trás de cada porta, antes de abrir a porta escolhida pelo convidado, abre então uma das 2 portas restantes não escolhidas, exatamente a que tem um bode, e dá ao convidado a chance de trocar a porta escolhida. Mostre que, se o convidado trocar, ele dobra sua probabilidade de ganhar o carrão. 22. Paradoxo de Bertrand. Considere um círculo onde uma corda é escolhida ao acaso. Quanto é a probabilidade de que o comprimento da corda aleatória seja maior do que o comprimento do lado do triângulo equilátero inscrita no círculo? Mostre que há 3 respostas diferentes para esta probabilidade ( , e ) e que todas estão corretas. Explique o porque deste paradoxo. 23. A distribuição Normal Bivariada é uma distribuição de probabilidade para um par de variáveis aleatórias ( , ). Um exemplo seria : proporção de mistura de biodiesel ao combustível do trator ( ) e : consumo específico de combustível por parte do trator ( ). Neste caso, a proporção é uma variável aleatória e o consumo também, e ambos variam conjuntamente. Sua função de densidade de probabilidade é dada por ( , ) √ ( ) {( ) ( ) ( )( )} onde: e são a média e o desvio-padrão de e são a média e o desvio-padrão de é o coeficiente de correlação linear entre e , dado por ( , ) [( )( )] ( ) ( ) ( ) é a covariância entre e ( , ) ∫ ∫ ( , ) a) Demonstre que tem distribuição também Normal (univariada) com média e desvio-padrão , e que tem distribuição também Normal (univariada) com média e desvio-padrão . b) Demonstre que a densidade de probabilidade condicional abaixo também é Normal: ⁄ ( ) , ( , ) ( ) onde , ( , ) é a densidade da Normal bivariada, e ( ) é a densidade de . c) Qual é a média e o desvio-padrão de ⁄ ? Nota. Esta média é chamada “a regressão de contra ”. Observe que o desvio-padrão de ⁄ é menor do que de : qual seria a explicação? d) Calcule ( , , ) se a regressão de contra é ( ⁄ ) , , e , . Sabe-se também que , e que , . e) Quando e serão independentes? 24. Demonstre a desigualdade de Chebyshev. 25. Demonstre o teorema da probabilidade total. 26. Demonstre o teorema de Bayes.
Compartilhar