Baixe o app para aproveitar ainda mais
Prévia do material em texto
Universidade Federal do Cariri - UFCa INTRODUÇÃO À ESTATÍSTICA Prof. Paulo Renato Alves Firmino Lista de exercícios resolvidos – Probabilidade 1 1. Dois alunos (A1 e A2) são convidados a responder ao mesmo teste, envolvendo duas questões de tripla escolha (a, b ou c), cada. Seu domínio sobre o conteúdo leva A1 a crer que a probabilidade de ele errar cada questão seja metade da de acertar. Já A2 não tem qualquer domínio sobre o conteúdo. (a) Qual é o espaço amostral associado às respostas de A1 ao teste? (b) Qual é a probabilidade de A1 acertar uma dada questão? (c) Qual é a distribuição de probabilidades associada ao nº de acertos de A2 no teste? (d) Qual é a probabilidade de A2 errar a todas as questões? E de A2 acertar ao menos uma questão? 2. Um Cientista Social estuda o problema do ensino público de dada região. A partir dos seus estudos, ele infere que apenas 25% dos alunos de pais analfabetos apresentam desempenho satisfatório. Por outro lado, ele infere que a probabilidade de um aluno apresentar bom desempenho dado que este possui pais alfabetizados é de 50%. O Cientista acredita que a proporção de alunos com pais alfabetizados seja de 60% a priori, de acordo com o último senso educacional. Diante destas informações: (a) Quais eventos e quais relações de causa-e-efeito foram destacados pelo Cientista? (b) Qual é a probabilidade de que um aluno da região apresente um bom desempenho escolar? (c) Diante do fato de que dado aluno (mantido pelo governo) venha apresentando desempenho escolar insatisfatório, qual é a probabilidade de ele ter pais analfabetos? 3. Um médico veterinário é solicitado a diagnosticar a doença que acomete um animal. Estudando o perfil do paciente, ele imagina inicialmente duas doenças (D1 ou D2), onde ele infere, a priori, que a probabilidade de o animal estar com D1 seja de 50%, enquanto que a de estar com D2 seja de 40%. Desta forma, o veterinário deixa margem para outra eventual doença. O veterinário decide então recorrer a um teste diagnóstico voltado à incidência de D1. O teste aponta corretamente a incidência de D1 em 95% dos casos, enquanto que aponta tal incidência erradamente em 20% das vezes. Diante destas informações: (a) Qual é a probabilidade, a priori, de que o paciente não esteja nem com D1 nem com D2? (b) Qual é a probabilidade de que o teste aponte para a incidência de D1? (c) Diante do fato de que o teste apontou para a não-incidência de D1, qual é a probabilidade de o animal não estar com D1? (d) O veterinário teria trabalhado sobre uma partição do espaço de possibilidades quanto às doenças que acometeriam o paciente? Isto seria importante? Por quê? (e) Se o teste for aplicado por duas vezes, de forma independente, qual será a probabilidade de ambos os resultados serem iguais? 4. Investiga-se o problema da avaliação do conhecimento. Antes da avaliação, o professor acredita que a probabilidade de o estudante dominar o conteúdo é igual à de não dominar. Contudo, o professor infere que a probabilidade de o aluno acertar uma questão dado que ele não domina o conteúdo é de 25%, enquanto que a probabilidade de ele acertar dado que ele domina o conteúdo é de 90%. (a) Qual é a probabilidade de o aluno acertar a questão? (b) Diante do fato de que o aluno acertou, qual é a probabilidade de ele dominar o conteúdo? 5. Uma rede local de computadores é composta por um servidor e três clientes (A, B e C). Registros anteriores indicam que das consultas realizadas ao servidor 10% vêm do cliente A, 40% de B e o restante de C. Se o pedido de consulta do cliente for feito inadequadamente, um erro de processamento no servidor será gerado. Usualmente ocorrem os seguintes percentuais de pedidos de consulta inadequados: 6% do cliente A, 4% de B e 2% de C. (a) Qual é a probabilidade de que dada consulta tenha sido realizada pelo cliente C? (b) Qual é a probabilidade de que o servidor apresente erro de processamento de um pedido? (c) Diante do fato de que o servidor apresentou um erro de processamento, qual é a probabilidade de o pedido de consulta ter sido proveniente do cliente C? Thiago Luiz Nota Parei aqui Universidade Federal do Cariri - UFCa INTRODUÇÃO À ESTATÍSTICA Prof. Paulo Renato Alves Firmino Lista de exercícios resolvidos – Probabilidade 2 6. Investiga-se o consumo de dada substância proibida por parte de atletas de alto nível. A priori, infere-se que a probabilidade de que um dado atleta a consuma (tentando burlar a lei) é de 1%. Por outro lado, estudos indicam que caso tal droga seja consumida, a probabilidade de que o atleta quebre o recorde atual é de 30%, enquanto que caso ele não a consuma esta probabilidade cai para 10%. Pergunta-se: (a) Qual é a probabilidade de tal atleta quebrar o recorde atual? (b) Diante do fato de que o atleta quebrou o recorde, qual é a probabilidade de ele ter consumido a substância proibida? 7. Um pesquisador estuda as relações de causa-e-efeito entre a incidência de Leucose Enzoótica de Bovinos (LEB) e o nº de leucócitos por mm3 de sangue destes ruminantes. A LEB trata-se de uma doença transmissível e de grande impacto socioeconômico. A priori a qualquer evidência sobre o nº de leucócitos de um bovino, o pesquisador infere que a probabilidade de este estar com LEB é de 5%. Por outro lado, de maneira a refletir a causalidade exercida pela presença da LEB no nº de leucócitos por mm3 de sangue, o pesquisador infere que dentre os animais com LEB esta quantidade ultrapassa 12·106 com uma probabilidade de 60%, enquanto que dentre os animais sem LEB o nº de leucócitos por mm3 ultrapassa 12·106 com uma probabilidade de 20%. Diante destas informações: (a) Qual é a probabilidade, a priori a qualquer informação sobre a incidência da LEB, de que o paciente apresente um nº de leucócitos por mm3 de sangue maior que 12·106? (b) Diante de uma amostra de sangue cujo nº de leucócitos por mm3 foi maior que 12·106, qual é a probabilidade de que o paciente esteja com LEB? (c) Considerando-se dois animais supostamente independentes, qual é a probabilidade de que ambos estejam com LEB, a priori a qualquer evidência do nº de leucócitos por mm3 de sangue? (d) Considerando-se dois animais supostamente independentes, qual é a probabilidade de que ambos estejam com LEB, dado que o nº de leucócitos por mm3 em suas respectivas amostras de sangue ultrapassou 12·106? 8. Estudos indicam que o gasto mensal de uma clínica veterinária segue uma distribuição Normal com média de R$20000.00 e desvio-padrão de R$1000.00. Pergunta-se: (a) Qual é o risco (≡ probabilidade) de que o gasto mensal da clínica ultrapasse os R$22000.00 em todos os meses do ano? (b) Qual é a probabilidade de que nos próximos 4 meses o gasto mensal da clínica ultrapasse os R$22000.00 apenas no 4º mês? (c) Qual é o risco de que ao longo do ano, o gasto mensal da clínica seja superior a R$22000.00 em apenas 2 meses? (d) Quais suposições embasam suas análises nesta questão? 9. Para selecionar seus funcionários, uma empresa oferece aos candidatos um curso de treinamento durante uma semana. No final do curso, eles são submetidos a uma prova, onde 25% são classificados como bons (B), 50% como medianos (M) e os 25% restantes como fracos (F). Para simplificar a seleção, a empresa pretende substituir o treinamento por um teste contendo questões referentes a conhecimentos gerais e específicos. Assim, neste ano, antes do início do curso, os candidatos foram submetidos ao teste e receberam o conceito aprovado (A) ou reprovado (R). No final do curso, as seguintes probabilidades condicionais foram obtidas: P(A|B) = 0.8; P(A|M)=0.5; P(A|F)=0.2. Especificamente, a empresa gostaria de saber: (a) Qual é a probabilidade de um candidato qualquer ser aprovado no teste? Você diria que é um teste rigoroso? (b) Qual é a probabilidade de um indivíduo aprovado no teste ser,na verdade, fraco caso fizesse o curso? 10. De maneira a apresentar um diferencial competitivo diante dos seus concorrentes, dado site de buscas da internet tem estudado a relação de causa-e-efeito entre as palavras- chave digitadas pelos usuários e seus reais temas de interesse. Dos estudos envolvendo temas de Educação (E), Saúde (S) e Outros (O), sabe-se que, a priori a qualquer evidência, os internautas se interessam por Educação em 20% das pesquisas, por Saúde em 30% e por Outros em 50%. Por outro lado, infere-se que a probabilidade de a Universidade Federal do Cariri - UFCa INTRODUÇÃO À ESTATÍSTICA Prof. Paulo Renato Alves Firmino Lista de exercícios resolvidos – Probabilidade 3 palavra-chave “Justiça (J)” ser usada dentre os interessados por Educação é de 7%, enquanto que essa probabilidade é de 9% entre os interessados por Saúde e de 5% dentre os interessados por Outros temas. Diante destas informações: (a) Qual é a probabilidade de que uma pesquisa no buscador envolva a palavra-chave “Justiça”? (b) Diante do fato de que a palavra “Justiça” foi digitada, para qual dos temas você daria o maior destaque (Educação, Saúde ou Outros)? 11. Para cada uma das afirmações a seguir, diga se ela está correta e justifique sua resposta: (a) O espaço amostral associado a dado experimento aleatório é a quantidade de seus possíveis resultados. (b) Dois eventos são mutuamente exaustivos se a interseção entre eles leva a todos os possíveis resultados de um experimento aleatório. (c) Dois eventos mutuamente exclusivos são também mutuamente independentes. (d) Se dois eventos, digam-se A e B, são independentes entre si então tem-se a relação entre probabilidades: P(A∪B) = P(A)+P(B). (e) A probabilidade de ocorrer ao menos um dentre dois eventos, digam-se A ou B, equivale à soma da probabilidade de ocorrência de A com a de ocorrência de B. (f) A probabilidade de ocorrerem dois eventos, digam-se A e B, equivale ao produto da probabilidade de ocorrência de A pela de ocorrência de B. (g) Uma partição envolve eventos independentes entre si e cuja união leva ao espaço amostral do respectivo experimento. 12. Uma empresa, E, deseja gerenciar dois dos seus sistemas, digam-se I e A, que operam de maneira independente. I representa o sistema de conexão de rede de internet e intranet, enquanto que A representa o sistema de arquivamento físico, a partir de impressões, escaneamentos e cópias de documentos e relatórios. Dos seus estudos, E infere que a probabilidade de falha de cada um, I e A, ao longo de um dia de trabalho, é de 0.02% e 21.34%, respectivamente. Em um dia de trabalho, E operará plenamente apenas se ambos os sistemas, I e A, o fizerem. (a) Qual é a probabilidade de E operar plenamente durante um dia de trabalho? (b) Supondo que o sucesso em um dia de trabalho não interfere no sucesso em outro dia, qual é a probabilidade de que E opere com sucesso durante 5 dias de trabalho seguidos? Universidade Federal do Cariri - UFCa INTRODUÇÃO À ESTATÍSTICA Prof. Paulo Renato Alves Firmino Lista de exercícios resolvidos – Probabilidade 4 GABARITO 1.a) O espaço amostral de um dado experimento é o conjunto que envolve todos os seus possíveis resultados. O espaço amostral associado às respostas de A1 ao teste pode ser descrito por Ωrespostas = {a1∩ a2, a1∩ b2, a1∩ c2, b1∩ a2, b1∩ b2, b1∩ c2, c1∩ a2, c1∩ b2, c1∩ c2}, onde ai ≡ A1 assinala a alternativa (a) para a iª questão (i =1, 2); bi ≡ A1 assinala a alternativa (b) para a iª questão; ci ≡ A1 assinala a alternativa (c) para a iª questão; 1.b) Do enunciado, diz-se que a probabilidade de A1 errar cada questão é metade da de acertar. Isto é, P(Ei) = P(Ci)/2, onde Ci ≡ A1 acerta a iª questão (i =1, 2); Ei ≡ complementar de (A1 não acerta a iª questão). Dos axiomas da probabilidade, temos que P(Ci∪Ei) = P(Ci)+P(Ei), já que Ci e Ei são eventos mutuamente exclusivos (ou aluno acerta ou não a questão). Temos ainda que P(Ci∪ Ei) = P(Ci)+P(Ei) = 1, já que {Ci, Ei} trata-se de uma partição do espaço de possibilidades sobre o desempenho do aluno na iª questão. Fazendo uso da igualdade P(Ei) = P(Ci)/2, temos que P(Ci∪ Ei) = P(Ci)+P(Ei) = P(Ci) + P(Ci)/2 = 1. Logo, P(Ci) = 2/3. Assim, a probabilidade de A1 acertar a uma dada questão é de 2/3 (cerca de 67%). 1.c) Para este quesito, construamos o espaço amostral associado aos acertos (e não-acertos) de A2: Ωdesempenho = {C1∩ C2, C1∩ E2, E1∩ C2, E1∩ E2}, onde Ci e Ei são definidos tal como em 2.b. Como A2 não tem qualquer domínio sobre o conteúdo, considera-se que ele optará aleatoriamente em cada resposta. Assim, P(Ci) = 1/3 ∴ P(Ei) = 2/3. Seja X≡ Número de acertos de A2 no teste (envolvendo as duas questões). Deseja-se obter a distribuição de probabilidades de X. Para tanto, devemos determinar qual é a probabilidade de ocorrência de cada um dos valores que X pode assumir. O espaço de possibilidades de X pode se descrito como ΩX = {0, 1, 2}; isto é, o aluno acertará 0, 1 ou 2 questões. Logo, devemos obter P(X=0), P(X=1), P(X=2). P(X=0): Para calcular esta probabilidade, vemos que o evento {X=0} equivale ao evento associado a Ωdesempenho {E1∩ E2}. Isto é, A2 acertará 0 questões se ocorrer o evento {E1∩ E2} do conjunto Ωdesempenho. Logo, P(X=0) = P(E1∩ E2). Pela regra do produto, temos que P(E1∩ E2) = P(E1)P(E2|E1). Como A2 estará sempre "chutando", independente de ele ter acertado ou não à 1ª questão, a probabilidade de ele não acertar a seguinte continuará sendo 2/3. Assim, P(E2|E1) = 2/3. Logo, P(X = 0) = (2/3)2 = 4/9 = 44.4%. P(X=1): Para calcular esta probabilidade, vemos que o evento {X=1} ocorre se ocorrer o evento {C1∩ E2} ou o evento {E1∩ C2} (associados a Ωdesempenho). Em outros termos, {X=1} = {C1∩ E2} ∪ {E1∩ C2}. Logo, P(X=1) = P((C1∩ E2) ∪ (E1∩ C2)). Como {C1∩ E2} e {E1∩ C2} são eventos mutuamente exclusivos, dos axiomas da probabilidade temos que P((C1∩ E2) ∪ (E1∩ C2)) = P(C1∩ E2) + P(E1∩ C2), onde P(C1∩ E2) = P(C1)P(E2|C1). Como A2 estará sempre "chutando", independente de ele ter acertado ou não à 1ª questão, a probabilidade de ele não acertar a seguinte continuará sendo Universidade Federal do Cariri - UFCa INTRODUÇÃO À ESTATÍSTICA Prof. Paulo Renato Alves Firmino Lista de exercícios resolvidos – Probabilidade 5 2/3. Assim, P(E2|C1) = 2/3. Logo, P(C1∩ E2) = (1/3)(2/3). Pelo mesmo raciocínio, temos que P(E1∩ C2) = (1/3)(2/3). Assim, P(X=1) = (2/9) + (2/9) = 4/9 = 44.4%. Por fim, como P(X=0) + P(X=1) + P(X=2) = 1 (uma vez que envolve-se uma partição de ΩX), temos que P(X=2) = 1- P(X=0) - P(X=1) = 1 - 44.4% - 44.4% = 1 - 88.8% = 11.12%. Logo, a distribuição de probabilidades associada ao nº de acertos de A2 no teste é dada por X P(X = x) 0 0.444 1 0.444 2 0.112 1.d) Pergunta-se sobre a probabilidade de A2 errar a todas as questões. Em outros termos, pede-se P(X = 0) = 44.4%. Assim, a probabilidade de A2 não pontuar na prova é de 44.4%. Pede-se ainda a probabilidade de A2 acertar ao menos uma questão, ou seja P(X ≥ 1) = P(X=1) + P(X=2)= 0.444 + 0.112 = 55.6%. Logo, a probabilidade de A2 acertar ao menos uma questão é de 55.6%. █ 2.a) O Cientista destacou duas classes de eventos: A ≡ Ter pais analfabetos Ac ≡ Evento complementar a A (Não ter pais analfabetos) e B ≡ Ter bom desempenho escolar Bc ≡ Evento complementar a B (Não ter bom desempenho escolar) O cientista considera que existe uma relação de causa-e-efeito entre o analfabetismo dos pais e o desempenho escolar do aluno. Isto é, o analfabetismo dos pais exerce causalidade sobre o desempenho escolar. 2.b) As probabilidades que estruturam o problema são: A priori: P(Ac) = 0.6∴P(A) = 1- P(Ac) = 0.4; As verossimilhanças: P(B|A) = 0.25 e P(B|Ac) = 0.5 Pede-se P(B). Pelo teorema da probabilidadetotal, tem-se que P(B) = P((B∩A) ∪ (B∩Ac)) = P(B∩A) + P(B∩Ac), já que (B∩ A) e (B∩Ac) são eventos mutuamente exclusivos. Seguindo, tem-se que (pela regra do produto) P(B∩A) = P(A)P(B|A) = 0.4•0.25 = 0.1 P(B∩Ac) = P(Ac)P(B|Ac) = 0.6•0.5 = 0.3 Logo, P(B) = 0.1 + 0.3 = 0.4. Assim, a probabilidade de um aluno da rede pública da região apresentar bom desempenho escolar é de 40%. 2.c) Pede-se a probabilidade de o aluno ter pais analfabetos, dado que ele tem apresentado desempenho escolar insatisfatório. Trata-se de um problema de diagnóstico. Matematicamente, pede-se P(A|Bc). Pelo teorema de Bayes, tem-se que P(A|Bc) = P(A)P(Bc|A)/P(Bc). Como P(B) = 0.4, P(Bc) = 1 - 0.4 = 0.6. Por outro lado, tem-se que como P(B|A) = 0.25, P(Bc|A) = 0.75. Assim, P(A|Bc) = 0.4.0.75/0.6 = 0.5. Assim, a probabilidade de o aluno ter pais analfabetos, dado o seu baixo desempenho escolar é de 50%. █ Universidade Federal do Cariri - UFCa INTRODUÇÃO À ESTATÍSTICA Prof. Paulo Renato Alves Firmino Lista de exercícios resolvidos – Probabilidade 6 3) Considere-se ΩD como sendo o conjunto envolvendo todas as possíveis doenças que podem estar acometendo o animal, isto é, o espaço amostral da doença que o acomete. 3.a) O médico considera inicialmente duas doenças, D1 (o paciente está com D1) e D2 (o paciente está com D2), onde a priori a probabilidade de o paciente estar com uma delas é de P(D1) = 0.5 e P(D2) = 0.4. Dos axiomas da probabilidade, tem-se que P(ΩD) = 1. Contudo, caso envolvam-se apenas ΩD ={D1, D2}, tem-se que P(ΩD) = P(D1∪ D2) < 1. Isto ocorrerá mesmo considerando que D1 e D2 são mutuamente exclusivos (isto é, supondo que é impossível que o paciente esteja simultaneamente com D1 e D2). Supondo mutua exclusão entre D1 e D2, tem-se (dos axiomas da probabilidade) que P(D1∪D2) = P(D1) + P(D2) = 0.5 + 0.4 = 0.9. Logo, deve-se considerar mais uma modalidade de doença, diga-se D3 (o paciente está com outra doença complementar a D1 e D2). Agora, considerando ΩD ={D1, D2, D3}, onde D1, D2 e D3 são eventos mutuamente exclusivos, obtém-se P(ΩD) = 1 = P(D1) + P(D2) + P(D3) = 0.5 + 0.4 + P(D3). Logo, P(D3) = 1 - 0.9 = 0.1. Assim, a probabilidade de o animal estar com outra doença, que não D1 nem D2, é de 10%, a priori. 3.b) Envolve-se o poder de causa-e-efeito entre D1 (o paciente estar acometido por D1) e o resultado de um teste diagnóstico. As probabilidades que estruturam o problema, do enunciado, são dadas por: A priori: P(D1) = 0.5∴P(D1c) = 1- P(D1) = 0.5 (D1c≡"evento complementar a D1", isto é, o paciente não está acometido por D1"). As verossimilhanças: P(S|D1) = 0.95 e P(S|D1c) = 0.2. Note-se que o poder de causa-e-efeito é medido a partir das verossimilhanças, onde S≡"O resultado do teste aponta para a incidência de D1" e Sc≡"evento complementar a S" (O resultado do teste aponta para a não-incidência de D1)". Pede-se P(S). Pelo teorema da probabilidade total, tem-se que P(S) = P((S∩D1) ∪ (S∩D1c)) = P(S∩D1) + P(S∩D1c), já que (S∩D1) e (S∩D1c) são eventos mutuamente exclusivos. Seguindo, tem-se que (pela regra do produto) P(S∩D1) = P(D1)P(S|D1) = 0.5•0.95 = 0.475 P(S∩D1c) = P(D1c)P(S|D1c) = 0.5•0.2 = 0.1. Logo, P(S) = 0.475 + 0.1 = 0.575. Assim, a probabilidade de o resultado do teste apontar para a incidência de D1 é de 57.5%. 3.c) Pede-se a probabilidade de o indivíduo não estar com D1, dado que o teste aponta para não-incidência desta doença. Matematicamente, pede-se P(D1c|Sc). Pelo teorema de Bayes, tem-se que P(D1c|Sc) = P(D1c)P(Sc| D1c)/P(Sc). Como P(S) = 0.575, P(Sc) = 1 - 0.575 = 0.425, já que S e Sc tratam-se de uma partição do espaço de possibilidades do resultado do teste. Da mesma forma, tem-se que como P(S|D1c) = 0.2, P(Sc|D1c) = 0.8. Assim, P(D1c|Sc) ) = P(D1c)P(Sc| D1c)/P(Sc) = 0.5•0.8/0.425 = 0.9412. Assim, diante do resultado negativo do teste para a incidência de D1, defende-se com 94.12% de probabilidade (segurança) que o animal não esteja com D1. Universidade Federal do Cariri - UFCa INTRODUÇÃO À ESTATÍSTICA Prof. Paulo Renato Alves Firmino Lista de exercícios resolvidos – Probabilidade 7 3.d) A resposta é sim. De fato, todos os cálculos realizados nesta questão são baseados na suposição de que não é possível que o paciente esteja simultaneamente acometido por mais que uma das classes de doença investigadas (D1, D2 e D3) e que todas as doenças possíveis estão sendo consideradas. Isto torna o conjunto {D1, D2, D3} uma partição do espaço de possibilidades (espaço amostral) das doenças que podem estar acometendo o animal. Isto mostra-se importante à medida que pode distanciar a abordagem adotada da realidade em questão. Caso seja possível que o animal seja acometido simultaneamente por mais que uma das doenças envolvidas, por exemplo, a abordagem adotada pode levar a resultados equivocados. P(D1c|Sc) poderia ser bem menor que 0.9412, por exemplo. Assim, defender a não-incidência de D1 diante do resultado Sc do teste poderia levar ao agravamento da doença em um maior percentual de casos (algo maior que 1 - 0.9412 = 5.88%). 3.e) Para este quesito, seja Si≡"o resultado da iª aplicação do teste aponta para a incidência de D1" e seja Sic≡"o evento complementar a Si". Tem-se o seguinte espaço amostral associado ao resultado de duas aplicações do teste: Ω2 aplic = {S1∩ S2, S1∩ S2c, S1c∩ S2, S1c∩ S2c}. Como pede-se a probabilidade de o resultado de dois testes serem iguais, o interesse recai sobre (S1∩ S2) ou ( S1c∩ S2c). Matematicamente, pede-se P((S1∩ S2)∪ ( S1c∩ S2c)). Como (S1∩ S2) e ( S1c∩ S2c) são dois eventos mutuamente exclusivos, tem-se que P((S1∩ S2)∪ ( S1c∩ S2c)) = P(S1∩ S2) + P( S1c∩ S2c). Pela regra do produto, tem-se que P(S1∩ S2) = P(S1)P(S2|S1). Como supõe-se, do enunciado, que os testes são independentes entre si, P(S2|S1) = P(S2) e assume-se que a probabilidade de o teste dar positivo para a incidência de D1 se dá por P(S1) = P(S2) = P(S), onde P(S) = 0.575 foi calculado em 3.b). Assim, P(S1∩ S2) = P(S1)P(S2) = 0.5752 = 0.3306. Seguindo o mesmo raciocínio, tem-se que P(S1c∩ S2c) = 0.4252 =0.1806. Logo, P((S1∩ S2)∪ ( S1c∩ S2c)) = 0.3306 + 0.1806 = 0.5112. Assim, a probabilidade de que ambos os resultados dos dois testes aplicados independentemente sejam iguais (ambos positivos ou ambos negativos para a incidência de D1) é de 51.12%. █ 4) O pesquisador destacou duas classes de eventos: A ≡ O aluno dominar o conteúdo Ac ≡ Evento complementar a A (o aluno não dominar o conteúdo) e B ≡ O aluno acertar determinada questão Bc ≡ Evento complementar a B (o aluno não acertar determinada questão) O pesquisador considera que existe uma relação de causa-e-efeito entre o domínio do aluno acerca do conteúdo e o seu desempenho diante da questão. Contudo, o pesquisador admite que tal relação não é determinística, que ela envolve incerteza. Isto é, o domínio do conteúdo envolvido eleva a probabilidade de o aluno acertar e a falta de domínio reduz a probabilidade de acerto. Por outro lado, é também possível que um aluno que domine o conteúdo erre a questão, assim como que um que não domine acerte a sua resposta. Tais relações incertas são medidas a partir de probabilidades condicionais, também chamadas de verossimilhanças: P(B|A) = 0.9 e P(B|Ac) = 0.25. Por outro lado, devido ao desconhecimento inicial acerca do domínio do aluno sobre o conteúdo, atribuiu-se a priori as probabilidades: P(A) = 0.5∴P(Ac) = 1- P(Ac) = 0.5; 4.a) Pede-se P(B). Pelo teorema da probabilidade total, tem-se que Universidade Federal do Cariri - UFCa INTRODUÇÃO À ESTATÍSTICA Prof. Paulo Renato Alves Firmino Lista de exercícios resolvidos – Probabilidade 8 P(B) = P((B∩A) ∪ (B∩ Ac)) = P(B∩ A) + P(B∩Ac), já que (B∩ A) e (B∩Ac) são eventos mutuamente exclusivos. Seguindo, tem-se que (pelaregra do produto) P(B∩A) = P(A)P(B|A) = 0.5•0.9 = 0.45 P(B∩Ac) = P(Ac)P(B|Ac) = 0.5•0.25 = 0.125 Logo, P(B) = 0.45 + 0.125 = 0.575. Assim, a probabilidade de o aluno acertar a questão, independentemente de ele dominar ou não o conteúdo envolvido, é de 57.5%. 4.b) Pede-se a probabilidade de o aluno dominar o conteúdo, dado que ele acertou a questão. Trata-se de um problema de diagnóstico (util inclusive para estudar a qualidade da avaliação). Matematicamente, pede-se P(A|B). Pelo teorema de Bayes, tem-se que P(A|B) = P(A)P(B|A)/P(B) = 0.5.0.9/0.575 = 0.783. Assim, a probabilidade de o aluno estar de fato dominando o conteúdo dado que ele acertou a questão sobe de 50%, a priori, para 78.3% a posteriori. █ 5) Estuda-se aqui as relações de dependência entre os clientes de um servidor e a ocorrência de erro no processamento de pedidos de consulta a tal servidor. O investigador destacou neste sentido a variável X e o evento Y, definidos a seguir: X ≡ "O cliente do servidor que realizou dada consulta", cujo espaço de possibilidades (amostral) é dado por ΩX={A, B, C}; Y ≡ "O servidor apresentar erro de processamento diante de um pedido". O investigador considera que existe uma relação de causa-e-efeito entre X e Y. Isto é, a depender do cliente, a probabilidade de ocorrência de erro de processamento de um pedido varia. Matematicamente, o poder de causalidade entre X e Y é medido a partir das seguintes probabilidades de verossimilhança: P(Y|X=A)=0.06; P(Y|X=B)=0.04; P(Y|X=C)=0.02. A título de ilustração, lê-se que dentre os pedidos realizados pelo cliente B, isto é, dado que tratam-se apenas dos pedidos realizados por B, 4% são feitos inadequadamente, gerando erros de processamento no servidor. 5.a) Do enunciado tem-se, para uma dada consulta ao servidor, parte da distribuição de probabilidades de X, a priori de qualquer informação sobre Y: P(X=A)= 0.1; P(X=B)=0.4. Neste quesito pergunta-se sobre P(X=C), a ser obtida a partir dos axiomas da probabilidade de Kolmogorov. Primeiramente usa-se o axioma que define que P(ΩX)=1. Recorre-se ainda a conceitos de álgebra booleana, de onde percebe-se que o conjunto ΩX equivale à união entre os eventos (X=A), (X=B) e (X=C): ΩX=[(X=A)∪ (X=B)∪ (X=C)]. Logo, P(ΩX)=1=P[(X=A)∪ (X=B)∪ (X=C)]. Agora, como os eventos (X=A), (X=B) e (X=C) são mutuamente exclusivos (isto é, considera-se impossível que um mesmo pedido seja oriundo de mais que um cliente), usa-se o axioma que define que a união entre eventos mutuamente disjuntos equivale à soma de suas probabilidades de ocorrência individuais: P[(X=A)∪ (X=B)∪ (X=C)] = P(X=A)+P(X=B)+P(X=C) = 1→ P(X=C)=1-[P(X=A)+P(X=B)] = 1 - 0.5 = 0.5. Assim, a priori de qualquer informação sobre Y, a probabilidade de que dada consulta seja oriunda do cliente C equivale a 50%, isto é, metade das consultas realizadas provém de C. Universidade Federal do Cariri - UFCa INTRODUÇÃO À ESTATÍSTICA Prof. Paulo Renato Alves Firmino Lista de exercícios resolvidos – Probabilidade 9 5.b) Pede-se P(Y). Pelo teorema da probabilidade total, tem-se que Y = {[Y∩ (X=A)] ∪ [Y∩ (X=B)] ∪ [Y∩ (X=B)]}. Graficamente, via diagrama de Venn, tem-se algo tal como esboçado abaixo: Lê-se que Y só pode acontecer se simultaneamente a exatamente um dos elementos amostrais de X, ou seja, considera-se impossível que ocorra erro de processamento do sistema se o pedido não provier de A ou B ou C. Matematicamente, do enunciado pede-se P(Y) = P{[Y∩ (X=A)] ∪ [Y∩ (X=B)] ∪ [Y∩ (X=B)]} = P[Y∩ (X=A)] + P[Y∩ (X=B)] +P [Y∩ (X=B)], já que trata-se da união entre eventos mutuamente exclusivos. Seguindo, tem-se que (pela regra do produto) P[Y∩ (X=A)] = P(X=A)·P(Y|X=A) = 0.1·0.06=0.006 P[Y∩ (X=B)] = P(X=B)·P(Y|X=B) = 0.4·0.04=0.016 P[Y∩ (X=C)] = P(X=C)·P(Y|X=C) = 0.5·0.02=0.010 Logo, P(Y) = 0.006 + 0.016 + 0.010 = 0.032. Assim, a probabilidade de que o servidor apresente erro de processamento de um dado pedido é de 3.2%, a priori a qualquer evidência sobre sua origem. 5.c) Pede-se a probabilidade de a consulta ter sido realizada pelo cliente C, diante do fato de que tal consulta gerou um erro de processamento. Trata-se de um problema de diagnóstico. Matematicamente, pede-se P(X=C|Y). Pelo teorema de Bayes, tem-se que P(X=C|Y) = P(X=C)·P(Y|X=C)/P(Y) = 0.5·0.02/0.032 = 0.313. Assim, a probabilidade de o pedido ter sido realizado por C dado que este gerou erro de processamento é de 31.3%. Note-se que a priori à evidência de se ter gerado erro de pedido, a probabilidade de o pedido ser proveniente de C era de 50% e que tal probabilidade foi reduzida a posteriori da evidência para 31.3%. Por outro lado, seguindo o mesmo raciocínio obter-se-ia que P(X=B|Y)=50%, o que levaria uma análise de diagnóstico Bayesiana a apontar como mais provável gerador do pedido o cliente B. █ 6) O pesquisador destacou duas classes de eventos: A ≡ O atleta consumir a droga Ac ≡ Evento complementar a A (o atleta consumir a droga) e B ≡ O atleta quebrar o recorde atual Bc ≡ Evento complementar a B (o atleta quebrar o recorde atual) A 10% B 40% C 50% ΩX Y 6% 4% 2% Universidade Federal do Cariri - UFCa INTRODUÇÃO À ESTATÍSTICA Prof. Paulo Renato Alves Firmino Lista de exercícios resolvidos – Probabilidade 10 O pesquisador considera que existe uma relação de causa-e-efeito entre o consumo da droga por parte do atleta e o seu desempenho. Contudo, o pesquisador admite que tal relação não é determinística, isto é, que ela envolve incerteza. Em outros termos, o consumo da droga eleva a probabilidade de o atleta quebrar o recorde atual e o não-consumo reduz tal probabilidade. De qualquer forma, é possível que ele quebre o recorde tendo consumindo ou não a droga, sempre dando-se margem à dúvida. Tais relações incertas são medidas a partir de probabilidades condicionais, também chamadas de verossimilhanças: P(B|A) = 0.3 e P(B|Ac) = 0.1. Por outro lado, de forma a expressar as incertezas (a priori ao resultado da prova) quanto ao consumo da droga pelo atleta, atribuiu-se as probabilidades: P(A) = 0.01∴P(Ac) = 1- P(Ac) = 0.99; 6.a) Pede-se P(B). Pelo teorema da probabilidade total, tem-se que P(B) = P((B∩A) ∪ (B∩ Ac)) = P(B∩ A) + P(B∩Ac), já que (B∩ A) e (B∩Ac) são eventos mutuamente exclusivos. Seguindo, tem-se que (pela regra do produto) P(B∩A) = P(A)P(B|A) = 0.01.0.3 = 0.003 P(B∩Ac) = P(Ac)P(B|Ac) = 0.99.0.1 = 0.099. Logo, P(B) = 0.003 + 0.099 = 0.102. Assim, a probabilidade de o atleta quebrar o atual recorde, independentemente de ele consumir ou não a droga, é de 10.2%. 6.b) Pede-se a probabilidade de atleta ter se drogado, dado que ele quebrou o recorde. Trata-se de um problema de diagnóstico. Matematicamente, pede-se P(A|B). Pelo teorema de Bayes, tem-se que P(A|B) = P(B∩A)/P(B)=P(A)P(B|A)/P(B) = 0.01.0.3/0.102 = 0.0294. Assim, a probabilidade de o atleta ter se dopado dado que ele quebrou o recorde atual sobe de 1%, a priori, para 2.94% a posteriori. █ 7) Considere-se Ω como sendo o conjunto envolvendo as possíveis condições de saúde de um ruminante em relação à LEB. O pesquisador considera duas condições, A1 (o bovino estar com LEB) e A2 (o bovino não estar com LEB), de forma que Ω = {A1, A2}. O pesquisador constata uma relação de causa-e-efeito entre a presença(ausência) de LEB e o evento D≡"O nº de leucócitos por mm3 de sangue ultrapassar 12·106". A priori (alheio, leigo) a qualquer informação sobre a ocorrência de D em dado bovino, o pesquisador infere que a probabilidade deste bovino estar com LEB é de 5%, isto é, P(A1)=0.05. Devido a um dos axiomas da probabilidade, tem-se que P(Ω) = 1, já que Ω envolve todos os possíveis resultados da condição de saúde do bovino em relação à LEB. Tem-se ainda que Ω = A1∪A2 e que, assim,P(Ω) = P(A1∪A2). Devido a um outro axioma da probabilidade, tem-se que como A1 e A2 são mutuamente exclusivos, isto é, é impossível que um dado bovino esteja ao mesmo tempo com LEB e sem LEB, P(A1∪A2) = P(Ω) = P(A1)+P(A2) = 0.05 + P(A2) = 1. Assim, P(A1) = 0.05, P(A2) = 0.95. Além da distribuição a priori sobre o estado de saúde de um bovino em relação à LEB, P(A1) e P(A2), o enunciado descreve probabilisticamente o poder de causalidade de A1 e A2 sobre D, a partir das probabilidades (condicionais) de verossimilhança: Universidade Federal do Cariri - UFCa INTRODUÇÃO À ESTATÍSTICA Prof. Paulo Renato Alves Firmino Lista de exercícios resolvidos – Probabilidade 11 P(D|A1)=0.6, P(D|A2)=0.2. Em outros termos, a probabilidade de o nº de leucócitos ultrapassar 12·106 dentre os bovinos com LEB (0.6) equivale a três vezes tal probabilidade dentre os sem LEB (0.2). 7.a) A priori (alheio, leigo) a qualquer informação sobre A1 (e, desta forma, sobre A2), pede-se P(D). Pelo teorema da probabilidade total, tem-se que D = [(D∩A1) ∪ (D∩A2)]. Graficamente, via diagrama de Venn, tem-se algo tal como esboçado abaixo: Lê-se que D só pode acontecer se simultaneamente a exatamente um dos elementos de Ω, ou seja, só é logicamente possível que o nº de leucócitos por mm3 ultrapasse 12·106 em interseção ao bovino estar sem LEB ou com LEB. Matematicamente, do enunciado, pede-se P(D) = P[(D∩A1) ∪ (D∩A2)] = P(D∩ A1) +P(D∩A2), já que trata-se da probabilidade de união entre eventos mutuamente exclusivos. Seguindo, tem-se que (pela regra do produto) P(D∩A1) = P(A1)·P(D|A1) = 0.05·0.6=0.03 P(D∩A2) = P(A2)·P(D|A2) = 0.95·0.2=0.19 Logo, P(D) = 0.03 + 0.19 = 0.22. Assim, a probabilidade de que o nº de leucócitos por mm3 de sangue do bovino ultrapasse 12·106 é de 22%, a priori a qualquer evidência sobre A1 (e A2). 7.b) Pede-se a probabilidade de um bovino estar com LEB dado que uma amostra de sangue sua resultou em um nº de leucócitos maior que 12·106. Trata-se de um problema de diagnóstico. Matematicamente, pede-se P(A1|D). Pelo teorema de Bayes, tem-se que P(A1|D) = P(A1)·P(D|A1)/P(D) = 0.05·0.6/0.22 = 0.136. Assim, a probabilidade de um bovino estar com LEB dado que uma amostra de sangue sua resultou em um nº de leucócitos maior que 12·106 é de 13.6%. Note-se que a priori à evidência do nº de leucócitos, a probabilidade de o bovino estar com LEB era de 5%, apenas, e que tal probabilidade foi elevada a posteriori da evidência da ocorrência de D para 13.6%. 7.c) Pede-se a probabilidade de que dois bovinos independentes entre si estejam com LEB, a priori (estando leigo, alheio) a qualquer evidência sobre o nº de leucócitos por mm3 de sangue. Considere o evento Xi≡"O iº bovino estar com LEB". Matematicamente pede-se P(X1∩X2). Pela regra do produto, tem-se que P(X1∩X2) = P(X1)·P(X2|X1). Como o A1 5% A2 95% Ω D 60% 20% Universidade Federal do Cariri - UFCa INTRODUÇÃO À ESTATÍSTICA Prof. Paulo Renato Alves Firmino Lista de exercícios resolvidos – Probabilidade 12 enunciado destaca que ambos os animais são independentes entre si, tem-se que P(X2|X1) = P(X2). Logo, P(X1∩ X2) = P(X1)·P(X2) Também do enunciado, tem-se que P(Xi)=P(A1)=0.05. Assim, P(X1∩ X2) = P(X1)·P(X2) = 0.05·0.05 = 0.0025 = 0.25%. Logo, a probabilidade de que dois bovinos quaisquer independentes entre si estejam acometidos pela LEB, a priori a qualquer evidência sobre D, é de apenas 0.25%. 7.d) Pede-se a probabilidade de que dois bovinos independentes entre si estejam com LEB, dado que o nº de leucócitos por mm3 de uma amostra de sangue de cada um deles ultrapassou 12·106. Considere o evento Zi≡"O iº bovino estar com LEB dado que sua amostra de sangue apresentou um nº de leucócitos maior que 12·106 ", isto é, Zi equivale ao evento (A1|D) associado ao iº bovino. Matematicamente pede-se P(Z1∩ Z2). Pela regra do produto, tem-se que P(Z1∩ Z2) = P(Z1)·P(Z2|Z1). Como o enunciado destaca que ambos os animais são independentes entre si, tem-se que P(Z2|Z1) = P(Z2). Logo, P(Z1∩ Z2) = P(Z1)·P(Z2) Das contas que se desenrolaram do enunciado, tem-se que P(Zi)=P(A1|D)= 0.136. Assim, P(Z1∩ Z2) = P(Z1)·P(Z2) = 0.136·0.136 = 0.0186 = 1.86%. Logo, a probabilidade de que dois bovinos quaisquer independentes entre si estejam acometidos pela LEB, dado que suas respectivas amostras de sangue envolveram um nº de leucócitos por mm3 maior que 12·106, é de 1.86%. █ 8) Do enunciado, tem-se que Xi~Normal(μ = R$ 20000.00; σ = R$ 1000.00), onde Xi ≡ "gasto da clínica no mês i"; isto é, as incertezas quanto ao gasto mensal da clínica no iº mês podem ser modeladas por uma distribuição Normal, com média de μ = R$ 20000.00 e um desvio-padrão de σ = R$ 1000.00. 8.a) Pede-se a probabilidade de que o gasto mensal ultrapasse R$22000.00 em todos os meses do ano, ou seja, que Xi > 22000.00, para i=1, 2, ..., 12. Em outros termos, pede-se a probabilidade de que ocorra de: X1>22000 e X2>22000 e X3>22000 e ... e X12>22000. Matematicamente, pede-se então: )22000X...22000X22000X22000X(P 12321 >∩∩>∩>∩> . Aplicando a regra do produto e supondo que: (I) o gasto da clínica em dado mês é independente do dos demais meses e (II) tais gastos apresentam a mesma variabilidade ao longo dos meses (com mesma média e variância), chega-se a [ ] .)22000X(P)22000X(P...)22000X(P)22000X(P)22000X(P )22000X...22000X22000X22000X(P 12 112321 12321 >=>⋅⋅>⋅>⋅> =>∩∩>∩>∩> Seguindo, como X1 segue uma distribuição normal, tem-se que P(X1 >22000) = P(Z1> (22000-μ)/σ), onde Z1 = (X1-μ)/σ é uma variável que segue uma normal-padrão (com média=0 e variância=1). Seguindo, P(X1 >22000) = P(Z1> (22000-20000)/1000) = P(Z1 > 2.00) = 1 - P(Z1 ≤ 2.00). De uma tabela da normal-padrão, tem-se que P(Z1 ≤ 2.00)=0.9772: Universidade Federal do Cariri - UFCa INTRODUÇÃO À ESTATÍSTICA Prof. Paulo Renato Alves Firmino Lista de exercícios resolvidos – Probabilidade 13 Assim, P(X1 >22000) = P(Z1 > 2.00) = 1 - P(Z1 ≤ 2.00) = 1 - 0.9772 = 0.0228; isto é, a probabilidade de o gasto da clínica em dado mês ultrapassar R$22000 é de 2.28%. Logo, .1097.1)0228.0( )22000X...22000X22000X22000X(P 2012 12321 −⋅== =>∩∩>∩>∩> Logo, o risco (a probabilidade) de que o gasto mensal ultrapasse R$22000.00 em todos os meses do ano é consideravelmente baixo (na ordem de 10-20). 8.b) Pede-se a probabilidade de que ocorra de: X1 ≤ 22000 e X2 ≤ 22000 e X3 ≤ 22000 e X4 >22000, uma vez que estuda-se o evento de que apenas no 4º, dos próximos 4 meses, o gasto mensal ultrapasse os R$22000.00. Matematicamente, pede-se então )22000X22000X22000X22000X(P 4321 >∩≤∩≤∩≤ . Aplicando a regra do produto e supondo que o gasto da clínica em dado mês é independente do dos demais meses, chega-se a [ ] ).22000X(P)22000X(P )22000X(P)22000X(P)22000X(P)22000X(P i 3 i 4321 >⋅≤ =>⋅≤⋅≤⋅≤ Como do quesito anterior sabe-se que P(Xi >22000) = 0.0228 e que, consequentemente, P(Xi ≤22000) = 0.9772 , tem-se que )22000X22000X22000X22000X(P 4321 >∩≤∩≤∩≤ = (0.9772)3.(0.0228)1 = 0.021. Assim, a probabilidade de que apenas no 4º, dos próximos 4 meses, o gasto mensal ultrapasse os R$22000.00 é de 2.1%, apenas. Vale salientar que este quesito poderia também ter sido resolvido a partir da distribuição geométrica. De fato, deseja-se a probabilidade de que ocorra dado evento de interesse E≡ "O gasto mensal ultrapassar R$22000.00" apenas na "4ª tentativa" (isto é, no 4º mês). Logo, considerando W≡"O nº de meses até a ocorrência de E", tem-se que W~geométrica(p=0.0228), supondo-se independência entre os gastos mensais e que p se mantém constante ao longo dos meses: P(W=w) = (1-p)w-1.p. De W, pede-se matematicamente, P(W=4)=(1-p)3.p= (0.9772)3.(0.0228)1 = 0.021, tal como obtidoa partir da abordagem anterior. 8.c) Deseja-se estudar a distribuição de probabilidades de Y≡ "O nº de meses, dentre 12, nos quais o gasto mensal ultrapassa os R$22000.00". Aqui, supondo que o gasto da clínica em dado mês é independente do dos demais meses e que tais gastos apresentam a mesma variabilidade ao longo dos meses (assim como no quesito anterior), pode-se concluir que Y~Binomial (n=12, p), onde p≡ "probabilidade de que em dado mês o gasto ultrapasse os R$22000.00" (perceba-se que tratam-se de 12 oportunidades, onde a probabilidade de Universidade Federal do Cariri - UFCa INTRODUÇÃO À ESTATÍSTICA Prof. Paulo Renato Alves Firmino Lista de exercícios resolvidos – Probabilidade 14 ocorrer o evento de interesse em cada uma, Xi >22000, é p). Isto é, p = P(Xi >22000) = 0.0228. A probabilidade de Y assumir um valor y entre 0 e 12 (a distribuição de probabilidades de Y) é dada por P(Y=y) = ⎟⎟⎠ ⎞ ⎜⎜⎝ ⎛ y 12 (0.02287)y(1-0.0228)12-y. Do enunciado, pede-se P(Y= 2) = ⎟⎟⎠ ⎞ ⎜⎜⎝ ⎛ 2 12 (0.02287)2(1-0.0228)12-2 = 0.0272. Logo, o risco de que ao longo do ano o gasto mensal da clínica seja superior a R$22000.00 em apenas 2 meses é de 2.72%. 8.d) Para esta questão, as principais suposições são de que (i) o gasto da clínica em dado mês é independente do dos demais meses e, do próprio enunciado, de que (ii) as incertezas quanto ao gasto mensal da clínica em qualquer mês podem ser modeladas por uma distribuição Normal, com média de μ = R$ 20000.00 e um desvio-padrão de σ = R$ 1000.00. █ 9) O investigador destacou a relação de causa e efeito entre A≡“o candidato ser aprovado no teste” e sua real condição diante de um curso, diga-se a variável ⎪⎩ ⎪⎨ ⎧ = Fraco é ele se ,F Mediano é ele se ,M Bom é indivíduo o se ,B X Considera-se que X exerce causalidade sobre a ocorrência de A. Isto é, a depender da real condição do candidato (X), a probabilidade de ele ser aprovado no teste é maior ou menor. Isto torna-se explícito a partir das probabilidades condicionais de verossimilhança: P(A|B) = 0.8; P(A|M)=0.5; P(A|F)=0.2. Por outro lado, a priori a qualquer evidência sobre a ocorrência de A, sabe-se que P(B)=0.25; P(M)=0.5 e P(F)=0.25. 9.a) Pede-se P(A). Pelo teorema da probabilidade total, tem-se que P(A) = P((A∩B) ∪ (A∩M) ∪ (A∩ F)) = P(A∩B) + P(A∩M) + P(A∩ F), já que (A∩B), (A∩M) e (A∩ F) são considerados eventos mutuamente exclusivos entre si. Seguindo, tem-se que (pela regra do produto) P(A∩B) = P(B)P(A|B) = 0.25.0.8 = 0.2 P(A∩ M) = P(M)P(A|M) = 0.5.0.5 = 0.25 P(A∩ F) = P(F)P(A|F) = 0.25.0.2 = 0.05 Logo, P(A) = 0.2 + 0.25 + 0.05 = 0.5. Assim, a probabilidade de dado candidato ser aprovado no teste é de 50%. Quanto à interpretação sobre o nível de rigor do teste, esta depende do perfil do decisor. Sob uma probabilidade de aprovação de 50% um decisor mais exigente pode concluir que o teste não é rigoroso, enquanto que para um decisor menos exigente o teste pode ser considerado muito rigoroso. 9.b) Pergunta-se a probabilidade de um candidato ser considerado fraco se fizesse o curso diante do fato de que ele foi aprovado no teste. Trata-se de um problema de diagnóstico Universidade Federal do Cariri - UFCa INTRODUÇÃO À ESTATÍSTICA Prof. Paulo Renato Alves Firmino Lista de exercícios resolvidos – Probabilidade 15 sobre a real condição do candidato diante do seu bom desempenho no teste. Matematicamente, deve-se calcular P(F|A). Pelo teorema de Bayes, tem-se que P(F|A)= P(F)P(A|F)/P(A)= 0.05/0.5 = 0.1. Assim, a probabilidade de o candidato ser, na verdade, fraco dado que foi aprovado no teste é de 10%. █ 10) O investigador destacou a relação de causa e efeito entre J≡“digitar a palavra-chave Justiça” e seu real tema de interesse, diga-se a variável ⎪⎩ ⎪⎨ ⎧ = temasOutros é interesse o se ,O Saúde é interesse o se ,S Educação é interesse o se ,E X Considera-se que X exerce causalidade sobre a ocorrência de J. Isto é, a depender do real interesse do internauta (X), a probabilidade de ele recorrer à palavra-chave J é maior ou menor. Isto torna-se explícito a partir das probabilidades condicionais de verossimilhança: P(J|E)=7%; P(J|S)=9%; P(J|O)=5%. Por outro lado, sem qualquer evidência sobre a ocorrência de J, sabe-se que P(E)=20%; P(S)=30% e P(O)=50%. 10.a) Pede-se P(J). Pelo teorema da probabilidade total, tem-se que P(J) = P((J∩ E) ∪ (J∩ S) ∪ (J∩O)) = P(J∩ E) + P(J∩ S) + P(J∩O), já que (J∩ E), (J∩ S) e (J∩O) são considerados eventos mutuamente exclusivos entre si. Seguindo, tem- se que (pela regra do produto) P(J∩ E) = P(E)P(J|E) = 0.2.0.07 = 0.014 P(J∩ S) = P(S)P(J|S) = 0.3.0.09 = 0.027 P(J∩O) = P(O)P(J|O) = 0.5.0.05 = 0.025 Logo, P(J) = 0.014 + 0.027 + 0.025 = 0.066. Assim, a probabilidade de a palavra-chave “Justiça” ser usada em dada busca é de 6.6%. 10.b) Pergunta-se sobre qual tema deveria ser destacado diante do fato de que a palavra- chave “Justiça” foi digitada. Trata-se de um problema de diagnóstico onde pode-se priorizar aquele tema que mais provavelmente teria motivado o usuário a recorrer a tal palavra- chave. Logo, pode-se decidir baseando-se na moda da distribuição de [X|J]. Matematicamente, deve-se calcular P(X|J). Pelo teorema de Bayes, tem-se que P(E|J) = P(E)P(J|E)/P(J)= 0.014/0.066 = 0.2121, P(S|J) = P(S)P(J|S)/P(J) = 0.027/0.066 = 0.4091, P(O|J)= P(O)P(J|O)/P(J)= 0.025/0.066 = 0.3788. Assim, baseando-se na moda, dar-se-ia maior destaque ao tema de Saúde e menor ao tema Educação. █ 11) Esta questão relaciona-se a conceitos básicos necessário ao cálculo de probabilidades. 11.a) O espaço amostral (Ω) associado a um experimento aleatório (ε) é o conjunto de todos os possíveis resultados de ε. Note-se, dessa forma, que não se trata apenas de quantos são os possíveis resultados de ε, mas, de maneira muito mais informativa, dos seus possíveis resultados. Assim, se ε≡”lançar uma moeda e registrar a face voltada pra cima”, Ω = {cara, coroa}. Note-se que o nº de possíveis resultados de ε trata-se apenas da cardinalidade de Ω. Assim, a afirmação está INCORRETA. Universidade Federal do Cariri - UFCa INTRODUÇÃO À ESTATÍSTICA Prof. Paulo Renato Alves Firmino Lista de exercícios resolvidos – Probabilidade 16 11.b) Dois eventos, digam-se A e B, são ditos exaustivos quando sua união equivale ao espaço amostral (Ω) de dado experimento ε. Matematicamente, tem-se a relação A ∪ B = Ω. Assim, qualquer que seja o resultado de ε, ele levará à ocorrência de ao menos um dos eventos A ou B. Dessa forma, note-se que não há qualquer restrição em relação à interseção entre A e B. Assim, a afirmação está INCORRETA. 11.c) Este item envolve um problema conceitual do cálculo das probabilidades a partir do estudo das relações entre dois eventos, digam-se A e B. Por um lado, A e B são ditos mutuamente exclusivos caso P(A∩B)=0; isto é, caso seja impossível que A e B ocorram simultaneamente (ou em sequência). Por outro lado, A e B são ditos mutuamente independentes caso P(A|B) = P(A), assim como P(B|A)=P(B); isto é, se o fato de B ter ocorrido não alterar em nada a probabilidade de que A ocorra (e vice-versa). Assim, confrontando os dois conceitos, vê-se que se A e B são mutuamente exclusivos, P(A|B)= P(A∩B)/P(B)=0. Pragmaticamente, P(A|B)= 0 traduz o fato de que é impossível que A ocorra dada a ocorrência de B. Note-se que, a princípio, P(A)≠0. Logo, pode-se concluir que se A e B são mutuamente exclusivos eles são, também, mutuamente DEPENDENTES, já que P(A|B) ≠P(A). A exceção a esta regra é o caso onde P(A)=0, situação sem qualquer apelo prático. Assim, a afirmação é INCORRETA. 11.d) Estuda-se a probabilidade de ocorrer ao menos um dos eventos, A ou B, quando estes são independentes entre si. O diagrama deVenn, abaixo, ilustra a eventual relação entre os dois eventos. Note-se que se ocorrer A, B ou mesmo A∩B, ocorre "A ou B". De fato, ocorrer "A ou B" equivale a ocorrer ao menos um destes dois eventos. Matematicamente, pede-se P(A ∪ B) = P(A) + P(B) - P(A∩B), já que ao somarmos P(A) com P(B) adicionamos P(A∩B) por duas vezes. Assim, P(A ∪ B) = P(A) + P(B) apenas nos casos (muito especiais) onde os eventos A e B são mutuamente exclusivos (e dependentes), isto é, quando o conjunto A∩B equivale ao conjunto vazio, levando a P(A∩B) = 0. Ω A BΩ A BΩΩ A B Por outro lado, se A e B são independentes, P(A∩B) = P(A)P(B), como visto no quesito anterior. Assim, se A e B são independentes entre si, P(A ∪ B) = P(A) + P(B) - P(A)P(B). Note-se que P(A ∪ B) = P(A) + P(B) apenas nos casos em que P(A)=0 ou P(B)=0, situações sem qualquer apelo prático. Logo, a afirmação está INCORRETA. 11.e) Pede-se a probabilidade de ocorrer ao menos um dos eventos, A ou B. O diagrama de Venn, abaixo, ilustra a eventual relação entre os dois eventos. Note-se que se ocorrer A, B ou mesmo A∩B, ocorre "A ou B". De fato, ocorrer "A ou B" equivale a ocorrer ao menos um destes dois eventos. Matematicamente, pede-se P(A ∪ B) = P(A) + P(B) - P(A∩B), já que ao somarmos P(A) com P(B) adicionamos P(A∩B) por duas vezes. Trata-se da regra da adição. Assim, P(A ∪ B) = P(A) + P(B) apenas nos casos (muito Universidade Federal do Cariri - UFCa INTRODUÇÃO À ESTATÍSTICA Prof. Paulo Renato Alves Firmino Lista de exercícios resolvidos – Probabilidade 17 especiais) onde os eventos A e B são mutuamente exclusivos, isto é, quando o conjunto A∩B equivale ao conjunto vazio. Logo, a afirmação está INCORRETA. Ω A BΩ A BΩΩ A B 11.f) Pede-se a probabilidade de ocorrerem A e, também, B. Trata-se matematicamente de P(A∩B) que, pela regra do produto, equivale a P(A∩B) = P(A).P(B|A). Como P(B|A)=P(B) apenas para os casos onde A e B são independentes entre si, P(A∩B) = P(A).P(B) somente sob esta condição (muito especial). Logo, a afirmação está INCORRETA. 11.g) Uma partição é um conjunto, diga-se Ω’={E1, E2, ... , Er}, cujos elementos são eventos associados ao espaço amostral Ω (conjunto de possíveis resultados) de dado experimento (ε). Especificamente, os eventos que compõem Ω’ são mutuamente exclusivos e exaustivos; isto é, a interseção entre eles leva ao vazio (Ei∩Ej={φ }) e a união entre eles leva a todos os possíveis resultados de ε (E1∪ E2∪ ... ∪ Er= Ω). O conceito de partição é fundamental para a probabilidade e estatística. Por exemplo, ele dá suporte na formulação de: (i) questionários, a partir das questões envolvendo resposta única, (ii) variáveis aleatórias, a partir dos seus eventos elementares, (iii) teorermas tais como o de Bayes, a partir da regra da Probabilidade Total. Quanto à afirmação do quesito, note-se que embora a união entre os eventos de uma partição leve ao espaço amostral, eles não são independentes, uma vez que são mutuamente exclusivos. Logo, a afirmação está INCORRETA. █ 12) Para esta questão, vale destacar do enunciado os eventos FI ≡ "O sistema I falha ao longo de um dia de trabalho” e FA≡ " O sistema A falha ao longo de um dia de trabalho ". Do enunciado tem-se ainda que P(FI)=0.0002≈0.0 (considerando-se 3 casas decimais) e P(FA)=0.2134≈0.213 (considerando-se 3 casas decimais). 12.a) Pede-se a probabilidade de que ocorra o evento S≡ “E operar plenamente ao longo de um dia de trabalho”. Sejam os eventos SI e SA respectivamente os complementares de FI e FA (SI≡”I opera adequadamente durante um dia de trabalho” e SA≡”A opera adequadamente durante um dia de trabalho”). Seguindo o enunciado, o evento S só ocorrerá se acontecerem ambos SI e SA. Matematicamente, tem-se que S = SI ∩ SA. Assim, P(S) = P(SI ∩ SA) = P(SI) P(SA|SI) = P(SI) P(SA). A penúltima igualdade acima decorre da regra do produto, enquanto que a última é devido a SI e SA serem eventos independentes entre si, de acordo com o enunciado (I e A operam independentemente). Seguindo os axiomas 2 e 3 de Kolmogorov para o cálculo de probabilidades, P(SI) = 1 – P(FI) ≈ 1 e P(SA) = 1- P(FA) ≈ 0.787, do quesito anterior. Logo, P(S) = P(SI)(SA)≈ (1)(0.787) = 0.787. Portanto, a probabilidade de E operar plenamente durante um dia de trabalho é de aproximadamente 78.7% (para ser mais preciso, sem arredondamentos, concluir-se-ia que P(S) = (0.9998)(0.7866)=0.7864). Universidade Federal do Cariri - UFCa INTRODUÇÃO À ESTATÍSTICA Prof. Paulo Renato Alves Firmino Lista de exercícios resolvidos – Probabilidade 18 12.b) Neste quesito, estuda-se a probabilidade de ocorrência da sequência de eventos S1 e S2 e S3 e S4 e S5, onde Sj ≡ “E operar plenamente ao longo do dia de trabalho j”. Matematicamente, pede-se P(S1∩ S2∩ S3∩ S4∩ S5) = P(S1)P(S2|S1)P(S3|S1∩ S2)P(S4|S1∩ S2∩ S3)P(S5| S1∩ S2∩ S3∩ S4)= P(S1)P(S2)P(S3)P(S4)P(S5). A exemplo do quesito anterior, a penúltima igualdade acima decorre da regra do produto, enquanto que a última é devido aos eventos S1,..., S5 serem independentes entre si, de acordo com o enunciado (o sucesso em um dia de trabalho não interfere no sucesso em outro dia). Como, do quesito anterior, P(Sj)= 0.7864, P(S1∩ S2∩ S3∩ S4∩ S5) =(0.7864)5 ≈ 0.301=30.1%. Logo, a probabilidade de que E opere com sucesso durante 5 dias de trabalho seguidos é de 30.1%, algo relativamente pequeno. █
Compartilhar