Prévia do material em texto
ESTATÍSTICA E PROBABILIDADE “Miscelânea de Exercícios Resolvidos” Profa. Tânia F Bogutchi 2013 1 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios Conteúdo Unidade 1 .................................................................................................................... 3 Unidade 2 .................................................................................................................. 15 Unidade 3 .................................................................................................................. 26 Unidade 4 .................................................................................................................. 45 Unidade 5 .................................................................................................................. 64 Tabela 3 – Distribuição NORMAL ................................................................................. 79 Tabela 4 – Distribuição t-Student ................................................................................ 80 2 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios Aos alunos: Esses exercícios foram colados diretamente das resoluções que foram publicadas em seus respectivos semestres. Algumas resoluções encontram-se ao final de cada uma das Anotações de Aula de suas respectivas Unidades. Pode ser que algumas correções tenham sido feitas posteriormente por intermédio das leituras que os alunos fizeram. Caso encontre alguma discrepância de digitação que lhe cause dúvida, por favor, comunique ok? Essa versão foi feita de urgência para possibilitar o estudo da turma em reavaliação. Podem ser encontrados alguns exercícios muito similares. Todas essas resoluções foram coladas no mesmo formato que se encontravam. Espero que ajude no entendimento do conteúdo. Bom estudo! Abs, Tânia 3 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios Unidade 1 Questão 1: A área hachurada (cinza) dos eventos A, B e C de um espaço amostral mostrada no diagrama de Venn abaixo corresponde ao evento que pode ser escrito por: a) CA b) BA c) CB d) BA Solução: Os elementos estão em A (não estão em A) OU em B. Questão 2: Um fabricante de faróis para automóveis testa lâmpadas sob ambientes com alta umidade e com alta temperatura, usando intensidade e vida útil como as respostas de interesse. A seguinte tabela mostra o desempenho de 130 lâmpadas: Intensidade Vida útil satisfatória insatisfatória satisfatória 117 3 insatisfatória 8 2 Calcule a probabilidade de uma lâmpada selecionada aleatoriamente fornecer resultados insatisfatórios sob qualquer critério. Solução: Intensidade vida útil satisfatória (VS) insatisfatória (VI) Total satisfatória (IS) 117 3 120 insatisfatória (II) 8 2 10 Total 125 5 130 Se definirmos os eventos (em vermelho) tem-se que o evento “Resultados Insatisfatórios” pode ser escrito como: II ou VI 4 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios Então, P(resultados insatisfatórios) = = 10,0 130 13 130 2 130 5 130 10 )()()()( VIIIPVIPIIPVIIIP Questão 3: Falhas em teclados de computadores ocorrem devido a conexões elétricas imperfeitas (12%) ou a defeitos mecânicos (88%). Defeitos mecânicos estão relacionados a teclas soltas (27%) ou a montagens impróprias (73%). Defeitos de conexão elétrica são causados por fios defeituosos (35%), por conexões impróprias (13%) ou por fios mal soldados (52%). Qual é a probabilidade de uma falha ocorrer devido a: (1) teclas soltas? (2) fios conectados impropriamente ou mal soldados? Solução: Esquematizando as probabilidades de cada tipo de falha, podemos escrever: (1) P(teclas soltas) = (0,88)(0,27) = 0,2376 (2) P(conexão imprópria ou fios mal soldados) = (0,12)[0,13+0,52] = (0,12)(0,65) = 0,078 Questão 4: Um circuito opera somente se houver um caminho de dispositivos funcionais da esquerda para a direita. A probabilidade de cada dispositivo funcionar é mostrada no gráfico a seguir. Falha Mecânica Elétrica Teclas soltas Montagem imprópria Defeito fio Conexão imprópria Fios mal soltados 0,88 0,12 0,27 0,73 0,35 0,13 0,52 Falha Mecânica Elétrica Teclas soltas Montagem imprópria Defeito fio Conexão imprópria Fios mal soltados 0,88 0,12 0,27 0,73 0,35 0,13 0,52 Falha Mecânica Elétrica Teclas soltas Montagem imprópria Defeito fio Conexão imprópria Fios mal soltados 0,88 0,12 0,27 0,73 0,35 0,13 0,52 Falha Mecânica Elétrica Teclas soltas Montagem imprópria Defeito fio Conexão imprópria Fios mal soltados 0,88 0,12 0,27 0,73 0,35 0,13 0,52 0,85 0,960,85 0,96 5 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios Supondo que os dispositivos falhem independentemente, calcule a probabilidade de o circuito operar. Solução: A B Sejam os dispositivos A e B. São independentes e estão ligados em série, logo o circuito opera se A e B funcionarem. Então, a probabilidade de operar: P(A e B) = P(A)P(B) = (0,85)(0,96) = 0,816 Questão 5: Um circuito opera somente se houver um caminho de dispositivos funcionais da esquerda para a direita. A probabilidade de cada dispositivo falhar é mostrada no gráfico a seguir. Supondo que os dispositivos falhem independentemente, calcule a probabilidade de o circuito operar. Solução: A B Os dispositivos A e B estão ligados em paralelo. O circuito opera se A ou B não falharem, sendo que as falhas são independentes. Logo, Logo, a probabilidade de não falhar: P(A ou B) =P(A) + P(B) – P(A e B) = 0,80 + 0,90 – (0,80)(0,90) = 1,7 – 0,72 = 0,98 0,1 0,2 0,85 0,960,85 0,96 0,1 0,2 6 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios Questão 6: Um circuito opera somente se houver um caminho de dispositivos funcionais da esquerda para a direita. A probabilidade de cada dispositivo falhar é mostrada no gráfico a seguir. Supondo que os dispositivos falhem independentemente, calcule a probabilidade de o circuito operar. Solução: A B C O circuito opera se os dispositivos A e B ou C não falharem. A, B e C são independentes na falha, então: P[(A e B) ou C] = P(A e B) + P(C) – P[(A e B) e C] = P(A)P(B) + P(C) – P(A)P(B)P(C) = (0,99)(0,99) + 0,90 – (0,99)(0,99)(0,90) = 0,9801 + 0,90 – 0,8821 = 0,998 Questão 7: Em uma prova caíram dois problemas. Sabe-se que 132 alunos acertaram o primeiro, 86 erraram o segundo, 120 acertaram os dois e 54 acertaram apenasum problema. Qual é a probabilidade de que um aluno, escolhido ao acaso tenha acertado apenas o segundo problema? Solução: Sejam: P1 : resolveu (acertou) somente o problema 1 P2 : resolveu somente o problema 2 1P : não resolveu o problema 1 2P : não resolveu o problema 2 Dados: P1 = 12 ; P1 e P2 = 120 ; 2P =86 ; P1 ou P2 = 54 0,01 0,01 0,1 0,01 0,01 0,1 0,01 0,01 0,1 0,01 0,01 0,1 7 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios (1) De P1 ou P2 = 54, tem-se 12 acertaram somente P1, então 42 acertaram somente P2. (2) 1P e 2P = 86 – 12 = 74 (3) Total de alunos: 248 Logo, P(P2) = 169,0 248 42 Questão 8: Em uma fabrica de dispositivos eletrônicos, as máquinas A, B e C produzem 25%, 35% e 40% do total, respectivamente. Da produção de cada máquina 5%, 4% e 2%, respectivamente, são dispositivos defeituosos. Escolhe-se ao acaso um dispositivo e verifica-se que é defeituoso. A probabilidade de que o dispositivo venha da máquina B é aproximadamente: a) 40,6% b) 36,2% c) 52,3% d) 14,0% Solução: Sejam os eventos: A, B, C : fábricas D: dispositivos defeituosos. Foram dados: P(A) = 0,25 e P(D|A) = 0,05; P(B) =0,35 e P(D|B) = 0,04; P(C) = 0,40 e P(D|C) = 0,02 Problema quer saber: DP DBP DBP 1º passo: calcular, P(D). 12012 42 74 P1 P2 12012 42 74 P1 P2 8 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios O evento D pode ser escrito: D = (D A) (D B) (D C) Tem-se: P(D) = P[(D A) (D B) (D C)] P(D) = P(A)P(D|A) + P(B)P(D|B) + P(C)P(D|C) Utilizando um Diagrama em árvore: Logo, %6,40406,04058,0 0345,0 014,0 DP DBP DBP Questão 9: A porcentagem de carros com defeito entregue no mercado por certa montadora é historicamente estimada em 8%. A produção da montadora vem de três fabricas distintas, da matriz A e das filiais B e C, nas seguintes proporções: 55%, 30% e 15%, respectivamente. Sabe- se que a proporção de defeitos da matriz A é o dobro da filial B e, da filial B é o triplo da filial C. A porcentagem de defeito da matriz A é aproximadamente: a) 18,43% b) 5,52% c) 8,32% d) 11,04% Solução: Dispositivo DA B C 0,25 0,40 0,05 0,04 0,02 A e D 0,35 D D B e D C e D 0,0125 0,014 0,008 P( D) = 0,0345 9 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios Sejam os eventos: A, B, C : fábricas D: dispositivos defeituosos. P(D) = 8% = 0,08 P(A) = 55% = 0,55 e P(D|A) = 2 P(D|B) P(B) = 30% = 0,30 e P(D|B) = 4 P(D|C) P(C) = 15% = 0,15 e P(D|C) Podemos escrever o evento D como: D = (A e D) ou (B e D) ou (C e D) Então, P(D) = P(A)P(D|A) + P(B)P(D|B) + P(C)P(D|C) P(D) = 8 P(A)P(D|C) + 4 P(B)P(D|C) + P(C)P(D|C) 0,08 = (8)(0,55)P(D|C) + (4)(0,30)P(D|C)+0,15P(D|C) 0,08 = 5,75 P(D|C) => P(D|C)= 0,0139 (1,39%) P(D|B)=0,0557 (5,57%) e P(D|A)= 0,1104 (11,04%) Questão 10: Uma urna contém 5 bolas brancas, 4 vermelhas e 3 azuis. Extraem-se simultaneamente 3 bolas. A probabilidade de que todas as bolas sejam da mesma cor é aproximadamente: a) 25,0% b) 35,2% c) 6,8% d) 12,4% Solução: Sejam os eventos: B: a bola é branca; V: a bola é vermelha e A: a bola é azul Retirar 3 bolas simultaneamente é similar a retirar 3 bolas sem reposição. O evento todas as bolas da mesma cor poderá ser definido: BBB ou VVV ou AAA, ou seja, )()()( AAAVVVBBB . Então, 10 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios P(todas da mesma cor)= P[ )()()( AAAVVVBBB ] = P(BBB)+P(VVV)+P(AAA) As probabilidades são condicionais, dado que a retirada é simultânea, ou seja, P(BBB) = (primeira bola é branca: 5/12; a segunda é branca dado que a primeira é branca: 4/11 e a terceira é branca dado que a primeira e a segunda o são: 3/10). Com raciocínio análogo temos então que, P(todas da mesma cor)= 10 3 11 4 12 5 + 10 2 11 3 12 4 + 10 1 11 2 12 3 = 0682,0 1320 62460 Outras maneiras de resolver: 1) podemos calcular a soma de cada uma delas no formato de proporção: 0,04545+0,0845+0,004545 = 0,06845 2) ou no formato de contagens dos eventos – utilizando a definição clássica de probabilidade: Espaço amostral: 3 12 Evento 3 bolas brancas: 3 5 ; Evento 3 bolas vermelhas: 3 4 ; Evento 3 bolas azuis: 3 3 Logo, P(todas da mesma cor): 3 12 3 3 3 4 3 5 Questão 11: Um júri coloca 15% dos culpados em liberdade e 2% dos inocentes em prisão. No próximo julgamento um suspeito vindo de um grupo com 90% de culpados será submetido a esse júri. A probabilidade do suspeito não ser posto em liberdade é: a) 76,7% b) 75,2% c) 90,0% d) 85,0% Solução: Sejam os eventos: C : o suspeito é culpado; C : o suspeito não é culpado (é inocente) L : o suspeito é posto em liberdade; L : o suspeito não é posto em liberdade 11 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios A probabilidade de um suspeito não ser posto em liberdade por ser calculada pelo diagrama em árvore: OU )02,0)(10,0()85,0)(90,0()C|L(P)C(P)C|L(P)C(P)LC(P)LC(P)L(P Questão 12: Um time de futebol ganha com probabilidade 0,7 se chove e com 0,8 se não chove. Em setembro a probabilidade de chuva é de 0,3. O time de futebol ganhou uma partida em setembro, a probabilidade de ter chovido nesse dia é: a) 77,0% b) 27,3% c) 70,0% d) 56,0% Solução: Sejam os eventos: G: time de futebol ganha A : chuva em setembro Queremos: P(A|G) Temos: Por definição de probabilidade condicional temos que: Precisamos então calcular P(G). Utilizando o diagrama em árvore, para um dia de setembro: L L L C 765,0 002,0 90,0 10,0 85,0 02,0 )( LCP )( LCP 767,0)L(P C )|( CLP Suspeito L L L C 765,0 002,0 90,0 10,0 85,0 02,0 )( LCP )( LCP 767,0)L(P C )|( CLP Suspeito 3,0)( 8,0)|( 7,0)|( AP AGP AGP )( )( )|( GP GAP GAP 12 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios Utilizando a definição, temos: Conclusão: Se o time de futebol ganhou a partida, a probabilidade de ter chovido nesse dia é de 27,3%. Questão 13: A probabilidade de que um automóvel sendo abastecidocom gasolina também necessite de uma troca de óleo é de 0,25; a probabilidade de que ele precise de um novo filtro de óleo é de 0,40; e a probabilidade de que sejam necessárias tanto a troca de óleo quanto a de filtro é de 0,14. Se o óleo tiver de ser trocado, a probabilidade de que o filtro também tenha de ser trocado é: a) 40,0% b) 75,0% c) 56,0% d) 14,0% Solução: Seja um carro abastecido com gasolina, e os eventos: O = Trocar óleo: 25% F = Trocar filtro: 40% O F =Trocar óleo e filtro: 14% 56,0 25,0 14,0 )( )( )|( OP FOP OFP A A G G G G GA GA 21,0)7,0)(3,0( 56,0)8,0)(7,0( 8,0 7,0 7,0 3,0 Um dia em setembro + 77,0)G(P A A G G G G GA GA 21,0)7,0)(3,0( 56,0)8,0)(7,0( 8,0 7,0 7,0 3,0 Um dia em setembro + 77,0)G(P (27,3%) 273,0 77,0 21,0 )( )( )|( GP GAP GAP 13 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios Questão 14: Um circuito opera somente se houver um caminho de dispositivos funcionais da esquerda para a direita. Assuma que os componentes falham independentemente. A probabilidade de cada dispositivo funcionar é mostrada no próximo esquema: Dado que o sistema funciona, a probabilidade de que o componente A não esteja funcionando é: a) 0,751 b) 0,512 c) 0,300 d) 0,205 Solução: Sejam os dispositivos: I= A e B (em série) ; II = C e D e E (em série) Probabilidade de I funcionar: 49,07,0)BA(P 2 Probabilidade de II funcionar: 512,08,0)EDC(P 3 O circuito (ou sistema) funciona se I ou II funcionarem (em paralelo), logo P(I ou II) = P(I) + P(II) – P(I e II), então P(I ou II) = 0,49 + 0,512 – (0,49)(0,512) = 0,75112 Temos que a probabilidade de o sistema funcionar, mas de o dispositivo A não funcionar é calculada pelas seguintes suposições: I não funciona e II funciona. Temos: 1) I não funciona devido ao não funcionando de A ou de (A e B), ou seja, 30,0)30,0)(30,0()70,0)(30,0()BA(P)BA(P)|I(P A 2) O sistema funciona, mas A não – por (1) e por II funcionar, logo: 1536,0)512,0)(30,0()II|I(P A A questão pergunta: P(A não funcione | sistema funciona)= funciona) P(sistema não) A masfunciona, sistema( funciona) P(sistema funciona) sistema e ( PAP 0,70 0,80 0,80 0,70 0,80 A C D E B 0,70 0,80 0,80 0,70 0,80 A C D E B 14 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios Ou simbolicamente: 205,02045,0 75112,0 1536,0 )III(P )II|I(P funciona) P(sistema não) A masfunciona, sistema(P A Questão 15: Um circuito opera somente se houver um caminho de dispositivos funcionais da esquerda para a direita. Assuma que os componentes falham independentemente. A probabilidade de cada dispositivo funcionar é mostrada no próximo esquema: Dado que o sistema funciona, a probabilidade de que o sistema todo funcione é aproximadamente: a) 0,958 b) 0,751 c) 0,854 d) 0,490 Solução: Sejam os dispositivos: I= A e B (em série) ; II = C e D e E (em série) Probabilidade de I funcionar: 49,07,0)BA(P 2 Probabilidade de II funcionar: 512,08,0)EDC(P 3 O circuito (ou sistema) funciona se I ou II funcionarem (em paralelo), logo P(I ou II) = P(I) + P(II) – P(I e II), então P(I ou II) = 0,49 + 0,512 – (0,49)(0,512) = 0,75112 OUTRA SOLUÇÃO: Utilizando as propriedades da probabilidade; a lei de Morgan e a independência dos componentes: 75112,024888,01)488,0)(51,0(1)(1)(1)( IIIPIIIPIIIP 0,70 0,80 0,80 0,70 0,80 A C D E B 0,70 0,80 0,80 0,70 0,80 A C D E B 15 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios Unidade 2 Questão 1: Dada a tabela: x 4 5 6 7 8 p(x) p2 p2 p p p2 Calcule: a) O valor de p; b) P(5 X 7); c) o valor esperado (média) de X Solução: (a) Sabemos que 1)x(p i , logo 3p2 + 2p = 1 → 3p2 + 2p – 1 = 0 , resolvendo essa equação do 2º grau obtemos: 3 1 p ou 1- p 6 )1)(3(442 p , com p é uma probabilidade, valores negativos não servem, então 3 1 p =0,333. (b) P(5 X 7) = P(X=5) + P(X=6) + P(X= 7) = p2 +2 p = 9 7 3 1 2 9 1 =0,778 (c) E(X) = n i ii xpx 1 = 22,6 9 56 3 13 9 17 9 1 8 3 1 7 3 1 6 9 1 5 9 1 4 Questão 2: Em seu caminho matinal, você se aproxima de um determinado sinal de trânsito, que está verde 20% do tempo. Suponha que cada manhã represente uma tentativa independente. Calcule as probabilidades para as seguintes situações: (1) em 5 manhãs a luz esteja verde exatamente um dia; e (2) em 20 manhãs a luz esteja verde em mais de 4 dias Solução: Seja a variável aleatória X: sinal verde numa manhã , então X ~ Bin ( n; 0,20) (1) X ~ Bin(5 ; 0,20) 16 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios P(X= 1) = 4096,0)80,0()20,0( 1 5 41 (2) X ~Bin (20 ; 0,20) P(X > 4) = 1 – P(X ≤ 4) = 1 – 0,6296 = 0,3704 Pois, P(X= 0) = 0115,0)80,0()20,0( 0 20 200 P(X= 1) = 0576,0)80,0()20,0( 1 20 191 P(X= 2) = 1369,0)80,0()20,0( 2 20 182 P(X= 3) = 2054,0)80,0()20,0( 3 20 173 P(X= 4) = 2182,0)80,0()20,0( 4 20 164 Questão 3: Lotes de 40 peças são considerados aceitáveis se contém, no máximo, três peças defeituosas. O processo de amostragem consiste em extrair aleatoriamente cinco peças de cada lote e rejeita-lo se for encontrada pelo menos uma peça defeituosa nas cinco peças extraídas. Calcule a probabilidade de se encontrar exatamente uma peça defeituosa se há três peças defeituosas em todo o lote. Solução: A variável aleatória X é hipergeométrica com N = 40; n = 5; k = 3 e x = 1 P(X= 1) = 304,0 008.658 )045.66)(3( 5 40 4 37 1 3 Questão 4: Um técnico de instalação de um sistema especializado de comunicação é enviado para uma cidade somente quando existirem três ou mais ordens de serviço. Suponha que as ordens de serviço sigam a distribuição de Poisson, com uma média de 0,25 por semana, para uma 17 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios cidade com uma população de 100.000 e suponha que sua cidade contenha uma população de 800.000. Qual é a probabilidade de que um técnico seja requisitado depois de um período de uma semana para essa cidade? Solução: Seja X: numero de ordens de serviço por cidade com população de 100.000 habitantes X ~ Pois (0,25) Se cidade contém uma população de 800.000 habitantes, então X ~ Pois (2) (por regra de 3 simples). Técnico é requisitado se existirem 3 ou mais ordens de serviço, logo P(X ≥ 3) = 1 – P(X ≤ 2) = 1 – [P(X=0) + P(X=1) +P(X=2)] = 1 - 0,676677 = 0,323323 (≈ 32,3%) Pois tem-se: 135335,0 !0 2 )0( 02 e XP 270671,0 !1 2 )1( 12 e XP 270671,0 !2 2 )2( 22 e XP Questão 5: Mensagens chegam a um servidor de computadores, de acordo com a distribuição de Poisson, com uma taxa média de 10 por hora. Qual o intervalo de tempo, em segundos, tal que a probabilidade de nenhuma mensagem chegar seja de 90%? Solução: Seja X: numero de mensagens que chegam, em horas, no tempo t X ~ Pois(10t) P(X=0) = 0,90 90,090,0 !0 )10( 10 010 t t e te Logo, -10t = ln(0,90) -10t = -0,10536 t = 1,0536 x 10-2 horas Ou, t = (0,01054)(3.600) segundos t = 37,9 segundos. 18 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios Questão 6: A função, 2 xou 0 xse , 0 2x 0 se ,32 )( x xf é uma função de densidade de probabilidade se, e somente se, ela for: a) Multiplicada pela constante 0,10 b) Adicionada da constante 0,10 c) Multiplicada pela constante 10 d) Adicionada da constante 10 Solução: 2x ou 0x ,0 2x0 ,3x2 xf 1) f(x) > 0 suposição confirmada sempre 2) 1dxxf , tem-se: 2 0 2 2 0 2 2 0 0 x3 2 x 2 dx3x2 dx0dx3x2dx3x2dx3x2 11064 f(x) não é uma probabilidade 19 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios Para ser uma probabilidade, f(x) pode ser definida: 2x ou 0x ,0 2x0 ,3x2 10 1 xf Logo, se f(x) for multiplicada por 0,10 então ela será uma f.d.p. Questão 7: O tempo entre as chegadas de táxi a um movimento cruzamento é distribuído exponencialmente com uma média de 10 minutos. a) Suponha que você já estivesse esperando uma hora por um taxi, qual a probabilidade de que o taxi chegue dentro dos próximos 10 minutos? b) A probabilidade de você esperar menos que x minutos é 0,50. Qual é o valor aproximado de x, em minutos? Solução: Seja X: tempo entre as chegadas de táxi, em minutos. X ~ exp ( ) = E(X) = 10 1,0 10 1 a) A primeira hora de espera é esquecida e passa a ser o ponto inicial de espera. Portanto, quer- se: P(X < 10) = 1 – e-0,1(10) = 1 – e-1 = 1 – 0,367879 0,6321 b) P(X < x) = 0,50 1 - 50,0e x 50,0e x1,0 -0,1x = ln(0,50)= -0,693 x = 6,93 min. Questão 8: A velocidade de transferência de um arquivo de um servidor da universidade para um computador pessoal na casa de um estudante, em uma noite de dia de semana, é normalmente distribuída, com média de 60 kbits por segundo e um desvio-padrão de 4 kbits por segundo. A probabilidade de o arquivo se transferir a uma velocidade entre 58 e 70 kbits por segundo é aproximadamente: a) 0,298 b) 0,685 c) 0,542 d) 0,320 20 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios Solução: X: velocidade de transferência arquivos, em kbits/seg X ~ N (60; 4) P(58 ≤ X ≤ 70) = 4 6070 4 6058 ZP = P(-0,5 ≤ Z ≤ 2,5) A área em amarelo: P(-0,5 < Z < 0) = P(0 < Z < 0,5) (por simetria) Pela Tabela 3, em anexo, tem-se que: P(0 < Z < 0,5) = 0,1915 Analogamente, 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359 0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0754 0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141 0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517 0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879 0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224 0,6 0,2258 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2518 0,2549 0,7 0,2580 0,2612 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852 0,8 0,2881 0,2910 0,2939 0,2967 0,2996 0,3023 0,3051 0,3079 0,3106 0,3133 0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389 1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621 1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015 1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177 1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319 1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4430 0,4441 1,6 0,4452 0,4463 0,4474 0,4485 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545 1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633 1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4700 0,4706 1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4762 0,4767 2,0 0,4773 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817 2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857 2,2 0,4861 0,4865 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890 2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916 2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936 2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952 2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964 2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974 2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4980 0,4980 0,4981 2,9 0,4981 0,4982 0,4983 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986 3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990 3,1 0,4990 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993 3,2 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995 3,3 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997 3,4 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998 0,4998 3,5 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 3,6 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 3,7 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 3,8 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,5000 0,5000 0,5000 3,9 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 z segunda casa decimal de z u n i d a d e e p r i m e i r a c a s a d e c i m a l d e z 21 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios P(0 < Z < 2,5) = 0,4938 Logo, P(-0,5 ≤ Z ≤ 2,5) = P(0 ≤ Z ≤ 0,5) + P(0 ≤ Z ≤ 2,5) = 0,1915 + 0,4938 = 0,6853 Questão 9: O tempo de reação de um motorista para o estímulo visual é normalmente distribuído, com uma média de 0,4 s e um desvio-padrão de 0,05 s. As probabilidades para: (1) de que uma reação requeira entre 0,4 s e 0,5 s; (2) de que uma reação requeira mais de 0,5 s; (c) o tempo de reação que é excedido em 90% do tempo; são dadas, respectivamente,por: a) 0,47725 ; 0,02275 ; 0,336 b) 0,02275 ; 0,47725 ; 0,336 c) 0,97725 ; 0,02275 ; 0,500 d) 0,97725 ; 0,47725 ; 0,336 Solução: Seja X: tempo de reação do motorista ao estímulo visual, em segundos X ~ N (0,4; 0,05) (1) P (0,4 X 0,5) = P 05,0 4,05,0 0 Z = P (0 Z 2) = 0,4773 (Tabela 3) (2) P (X 0,5) = P (Z 2) = 0,5 – P (0 Z 2) = 0,5 – 0,4773 = 0,0227 22 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios (3) P (X x) = 0,90 P (Z z) = 0,90 P (Z z) = 0,10 = P (Z ≥ z) z = -1,28 x z x = zσ + μ = (- 1,28) (0,05) + 0,4 = - 0,064 +0,4 = 0,336 segundos Questão 10: As linhas telefônicas em um sistema de reservas de uma companhia aérea estão ocupadas em 40% do tempo. Suponha que os eventos em que as linhas estejam ocupadas em sucessivas chamadas sejam independentes. As probabilidades para as seguintes situações: (1) que 10 chamadas aconteçam e em exatamente três chamadas as linhas estejam ocupadas; e (2) que 5 chamadas sejam feitas e no mínimo em uma chamada as linhas não estejam ocupadas, são aproximadas respectivamente por: a) 0,0425; 0,9940 b) 0,4096; 0,8180 c) 0,2150; 0,9898 d) 0,3456; 0,9744 Solução: Seja X: número de linhas ocupadas X ~ Bin (n; 0,40) (1) n = 10 → X ~ Bin (10; 0,40) → P(X = 3 ) = 73 )60,0()40,0( 3 10 = 0,2150 (2) n = 5 → X ~ Bin (5; 0,60) P( X ≥ 1) = 1 – P( X < 1) = 1 – P( X= 0) =1 - 100 )60,0()40,0( 0 10 = 1 – 0,0102 = 0,9898 23 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios Questão 11: Em uma autoestrada, o número de buracos, que é bastante significante para requerer reparo, é suposto seguir uma distribuição de Poisson, com uma média de dois buracos por quilometro. As probabilidades para as seguintes situações: (1) não há buracos que requeiram reparos em 5 quilômetros; e (2) no mínimo um buraco requeira reparo em meio quilometro de auto estrada, são aproximadas respectivamente por: a) 13,5%; 4,9% b) 0,01%; 63,2% c) 21,5%; 98,1% d) 0,01%; 27,8% Solução: Seja X : número de buracos em uma autoestrada, em β quilômetros. Se β = 1 então X ~ Pois (2) (1) Se β = 5 então X ~ Pois (10) temos 2 buracos a cada quilometro, então teremos 10 buracos em 5 km (regra de 3 simples), logo X ~ Pois (10) P(X = 0) 0,00005 0,0001 0,01% (2) Se temos 2 buracos a cada quilometro, então teremos 1 buracos em 0,5 km (regra de 3 simples), logo X ~ Pois (1) P( X ≥ 1) = 1 – P( X = 0) = 1 – 0,36788 0,63212 63,2% Questão 12: O tempo até a falha, em horas, de um importante componente de um equipamento eletrônico usado na fabricação de um aparelho DVD é distribuído exponencialmente com uma média de 2000 horas. A probabilidade de que o componente (e, consequentemente o aparelho DVD) dure mais do que 1000 horas antes que o componente tenha de ser substituído é aproximadamente: a) 0,6321 b) 0,3935 c) 0,3679 d) 0,6065 Solução: Seja X: tempo até a falha do componente eletrônico, em horas 24 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios X ~ exp ( ) = E(X) = 2000 0005,0 2000 1 P(X > 1000) = )1000)(0005,0(e = e-0,5 0,6065 Questão 13: O tempo de vida de um arranjo mecânico em um teste vibracional é distribuído exponencialmente, com uma média de 400 horas. Se um arranjo estiver em teste por 400 horas sem apresentar falha, a probabilidade de uma falha ocorrer nas próximas 100 horas é aproximadamente: a) 0,7788 b) 0,2212 c) 0,2865 d) 0,7135 Solução: Defina X: tempo de vida de um arranjo mecânico, em horas X ~ Exp( ) E(X)=400 , mas 400 1 1 )( XE Probabilidade de falhar nas próximas 100 horas: 22119,07788,011)100()100( 400 100 eFXP Questão 14: A vida de um semicondutor a laser, a uma potência constante, é normalmente distribuída com média de 7.000 horas e desvio-padrão de 600 horas. As probabilidades para: (1) que um semicondutor a laser falhe em menos de 5.000 horas; e (2) o tempo de vida em horas que 95% dos lasers excedem; são dadas, respectivamente, por: a) 0,71 ; 5800 b) 1,0 ; 6016 c) 0,0 ; 6016 d) 0,50 ; 5800 Solução: Seja a variável aleatória X: vida de um semicondutor a laser, em horas 25 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios X ~ N (7000; 600) (1) que um semicondutor a laser falhe em menos de 5.000 horas: P(X< 5000) = 600 70005000 XP = P(Z < -3,33) = P( Z > 3,33 0,0 (2) o tempo de vida em horas que 95% dos lasers excedem: P (X > x) = 0,95 P (Z > z) = 0,95 P (Z < z) = P(Z > z) = 0,05 z = - 1,64 x = zσ + μ = (- 1,64) (600) + 7000 = 6.016 horas Questão 15: A resistência à tração do papel pode ser modelada por uma distribuição normal, com média de 35 libras por polegada quadrada e um desvio-padrão de 2 libras por polegada quadrada. Se as especificações requererem que a resistência à tração exceda 30 libras por polegada quadrada, o percentual de amostras que serão rejeitadas será aproximadamente: a) 99,4% b) 0,62% c) 98,2% d) 1,8% Solução: Seja X: resistência à tração do papel, em libras/polegada2 X ~N(35; 2) Podemos fazer diretamente: - Dentro das especificações: X > 30 - Fora das especificações: X < 30. Logo, P(X<30)=P(Z<-2,5)=P(Z > 2,5) = 0,0062 ( 0,62%) OU: P(X > 30) = 2 3530 ZP = P(Z > -2,5) =0,5 + P(0 <Z < 2,5) =0,5 + 0,4938 0,9938 Ou seja, temos que 99,38% estarão dentro da especificação, logo, 0,62% estarão fora da especificação e, portanto serão rejeitadas. 26 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios Unidade 3 Questão 1: Para se estudar o desempenho de duas corretoras de ações, foram selecionadas, de cada uma delas, amostras aleatórias das ações negociadas. Para cada ação selecionada computou- se a porcentagem de lucro apresentada durante um período fixado de tempo: Corretora Percentual de Lucro Média (%) Desvio-padrão (%) A 56,52 5,64 B 55,93 4,72 Com base nesses dados podemos responder as seguintes questões: a) Qual corretora trabalhou com percentual de lucro mais homogêneo? b) Suponha que uma ação teve percentual de lucro de 60% tanto na corretora A quanto na corretora B. Em qual das corretoras ela representou maior lucro relativo? Solução: Corretora Percentual de Lucro CV Ação z-escore Média (%) Desvio-padrão (%) A 56,52 5,64 0,0998 60 0,617 B 55,93 4,72 0,0844 60 0,8623 a) A corretora B, pois CVB < CVA b) A corretora B, pois zB > zA Questão 2: Prevenir a propagação de trinca de fadiga em estruturas de aviões é um importante elemento de segurança em aeronaves. Um estudo de engenharia para investigar a trinca de fadiga em n=9 asas carregadas ciclicamente reportou os seguintes comprimentos (em mm) de trinca: 2,13 2,96 3,02 1,82 1,15 1,37 2,04 2,47 2,6 a) Calcule a média e o desvio-padrão das trincas b) Se uma trinca apresentar z-escore de 2, qual o comprimentoda trinca? 27 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios Solução: ordem Trincas (xi) (xi-media) 2 1 2,13 0,0018 2 2,96 0,6194 3 3,02 0,7174 4 1,82 0,1246 5 1,15 1,0465 6 1,37 0,6448 7 2,04 0,0177 8 2,47 0,0882 9 2,6 0,1823 Total 19,56 3,4428 a) Média: 1732 9 5619 , , n x x i mm Desvio-padrão: 6560 8 44283 1 2 , ,)( )( n xx Xdp i mm b) z = 2 e 485317326560222 ,,),)(()( )( ii i xxxdpx xdp xx mm Questão 3: O histograma a seguir apresenta os valores das compras, em reais, dos clientes de um supermercado. 28 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios Considerando esses dados calcule: a) A média dos valores das compras; b) O desvio-padrão; c) Os quartis 1, 2 e 3; d) O desvio-interquartílico; e) Qual o percentual de clientes que compram entre R$ 100,00 e R$ 150,00? f) Qual o valor mínimo da compra para os 10% dos clientes que mais gastam nesse supermercado? Solução: Para o cálculo dos itens (a) e (b) precisamos transformar o histograma em uma tabela de frequências: 250200150100500 100 90 80 70 60 50 40 30 20 10 0 Valores das compras (R$) Fr eq ue nc ia 20 45 77 62 25 Histograma das Compras em um Supermercado 29 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios Faixa Freq (fi) xi (ponto médio da faixa) xifi (xi-media) 2*fi 0 a 50 25 25 625 221392,851 50 a 100 62 75 4650 120604,4889 100 a 150 77 125 9625 2676,007323 150 a 200 45 175 7875 140592,2847 200 a 250 20 225 4500 224275,8529 Total 229 27275 709541,4847 a) Média: 10,119 229 27275 n fx x ii b) Desvio-padrão: 79,55 228 4847,709541 1 )( )( 2 n fxx Xdp ii Para o cálculo do item (c) precisamos transformar o histograma em uma tabela de frequências absoluta e relativa simples e acumulada: Faixa Freq. simples Freq. acum Perc. acum 0 a 50 25 25 10,9% 50 a 100 62 87 38,0% Q1 100 a 150 77 164 71,6% Q2 150 a 200 45 209 91,3% Q3 200 a 250 20 229 100,0% Total 229 Q1 é o percentil 25 (P25) , ou seja, deixa nele e abaixo dele 25% dos dados. Na primeira faixa tem-se 10,9% dos dados e até a segunda faixa, ou seja, de 0 a R$100,00 tem-se uma concentração de 38,0% dos valores das compras. Então o P25 encontra-se na faixa entre R$50,00 e R$100,00. Analogamente, encontramos as faixas de Q2 e Q3. Utilizando a fórmula da interpolação, temos, para 0 < p < 1; H C BA LP ip 100 30 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios Resumindo os cálculos: Q1 Q2 Q3 P90 p 0,25 0,5 0,75 0,90 Li 50 100 150 150 A 57,25 114,5 171,75 206,10 B 25 87 164 164 C 62 77 45 45 H 50 50 50 50 Valor de Qi 76,01 117,86 158,61 196,78 Logo, c) Q1 = R$ 76,01 ; Q2 =R$ 117,86 e Q3= R$ 158,61 d) Desvio interquartílico: DQ = Q3 – Q1 = R$ 158,61 – R$ 76,01 = R$ 82,60 e) No histograma observa-se que 77 dos 229 clientes fizeram compras entre R$ 100,00 e R$ 150,00, logo o percentual é de aproximadamente 33,6% f) O percentil 90 (P90) fornece o valor da compra que até 90% dos clientes fazem, logo esse será o valor mínimo para os 10% que mais gastam. Calculando o valor desse percentil de maneira análoga ao item (c), verifica-se que esse valor é de R$ 196,78. Questão 4: Prevenir a propagação de trinca de fadiga em estruturas de aviões é um importante elemento de segurança em aeronaves. Um estudo de engenharia para investigar a trinca de fadiga em n=9 asas carregadas ciclicamente reportou os seguintes comprimentos (em mm) de trinca: 2,13; 2,96; 3,02; 1,82; 1,15; 1,37; 2,04; 2,47; 2,60. Os valores calculados para essa amostra da: (1) média, (2) variância e (3) coeficiente de variação (CV) são, respectivamente, aproximados por: a) 2,173; 0,656; 0,302 b) 2,173; 0,430; 0,198 c) 2,173; 0,430; 0,302 Li = limite inferior da classe que contem o percentil desejado; A = np B = Freqüência acumulada da classe anterior C = freqüência da classe que contem o percentil desejado H = Tamanho da classe que contem o percentil 31 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios d) 2,173; 0,656; 0,198 Solução: Média: mm173,2 9 6,19 n x x n 1i i Variância: 2 2 2 n 1i in 1i 2 i 2 9 1i 2 i 9 1i i )mm(4303.0 8 443.3 19 9 56.19 953.45 1n n x x s 953.45x 56.19x Coeficiente de variação: 3018,0 173,2 430,0 x s CV Questão 5: Prevenir a propagação de trinca de fadiga em estruturas de aviões é um importante elemento de segurança em aeronaves. Um estudo de engenharia para investigar a trinca de fadiga em n=9 asas carregadas ciclicamente reportou os seguintes comprimentos (em mm) de trinca: 2,13; 2,96; 3,02; 1,82; 1,15; 1,37; 2,04; 2,47; 2,60. Os valores calculados para essa amostra da: (1) mediana; (2) primeiro quartil; (3) terceiro quartil e (4) desvio-interquartílico, são, respectivamente, aproximados por: a) 2,173; 1,656; 3,02; 2,05 b) 2,13; 1,595; 2,78; 1,185 c) 2,13; 2,04; 2,60; 0,56 d) 2,173; 1,595; 3,02; 2,04 Solução: Dados ordenados: 32 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios Ordem Trinca aviões 1 1,15 2 1,37 3 1,82 4 2,04 5 2,13 6 2,47 7 2,6 8 2,96 9 3,02 1) Mediana – posição 5ª., pois 50% de 9 = 4,5. Logo mediana = 2,13 2) Primeiro quartil: do menor para o maior: 25% de 9 = 2,25, logo 2ª. posição. do maior para o menor: 75% de 9 = 6,75, logo 7ª. posição. Valor da 2ª. posição (do menor para o maior): 1,37 Valor da 7ª. posição (do maior para o menor): 1,82 Então, o valor do percentil 25, ou seja, do quartil 1 é obtido pela média aritmética desses dois valores: 1,595 3) Analogamente, faz-se o cálculo para o quartil 3 – percentil 75%. São encontrados: Valor da 7ª. posição (do menor para o maior): 2,6 Valor da 2ª. posição (do maior para o menor): 2,96 Então, o valor do percentil 75 ou do quartil 3 é obtido pela média aritmética desses dois valores: 2,78 4) O desvio-interquartílico (DI) é a diferença entre os quartis 3 (Q3) e 1 (Q1): DI = Q3 – Q1, Então, DI = 2,78 – 1,595 = 1,185. Questão 6: Dois grupos de pessoas acusam os seguintes dados: Grupo Peso Médio (Kg) Desvio-padrão (Kg) A 66,5 6,4 B 62,7 9,8 33 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios Com base nesses dados podemos responder as seguintes questões: (1) qual o grupo mais homogêneo?; (2) se no grupo A tiver uma pessoa que pesa 78,0 Kg e no grupo B outra pessoa que pesa 71,0 Kg,qual delas revela menor excesso relativo de peso? a) Grupo A ; pessoa do grupo A b) Grupo B ; pessoa do grupo B c) Grupo B; pessoa do grupo A d) Grupo A; pessoa do grupo B Solução: Grupo Peso Médio (Kg) Desvio-padrão (Kg) CV Pessoa z-escore A 66,5 6,4 0,0962 78 1,7969 B 62,7 9,8 0,1563 71 0,8469 Coeficiente de variação: média padrãodesvio x s CV - grupo mais homogêneo: Grupo A z-escore: dp xx z ii : pessoa com menor excesso relativo de peso: pessoa do Grupo B Questão 7: Cada uma das afirmações abaixo é Verdadeira (V) ou Falsa (F) para a seguinte frase: a forma de uma distribuição de frequência pode ser descrita usando a) um gráfico de box-plot ou box-whisker b) um histograma; c) um gráfico de ramo e folhas; d) a média e a variância; e) uma tabela de frequências. Respostas: a) V b) V c) V d) F e) V Justificativa da letra d): 34 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios - As medidas resumo de uma característica informam apenas sua locação e oscilação (espalhamento, dispersão) em torno da média. Para informação sobre a forma da distribuição (simetria, assimetria) elas precisam agregar outras medidas, tais como os quartis. Questão 8: Cada uma das afirmações abaixo é Verdadeira (V) ou Falsa (F) para o seguinte conjunto de dados: 3, 1, 7, 2, 2 a) a média é 3; b) a mediana é 7; c) a moda é 2; d) a amplitude é 1; e) a variância é 5,5. Respostas: a) V b) F c) V d) F e) V Justificativa das letras (b) e (d): b) mediana = 2, pois ao ordenarmos os dados ele é o valor que separa os dados em duas partes iguais (50% para cada lado): 1 2 2 3 7 d) Amplitude (A) é a diferença entre o maior e o menor valor do conjunto de dados, logo, A = 7 – 1 = 6 Questão 9: O histograma abaixo apresenta a distribuição dos valores, em reais, em poder de uma amostra de estudantes de certa universidade. Os dados coletados foram armazenados em uma variável chamada Dinheiro. Com base nas informações do histograma responda Verdadeiro (V) ou Falso (F) para cada uma das frases seguintes: 35 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios a) O número de classes é 8 b) 10 e 20 são os limites da primeira classe c) Os limites da classe de maior frequência são: 40 e 50 d) A classe com maior frequência tem 24 alunos e) 40% dos estudantes estavam com até R$ 30,00 no bolso; f) A mediana está na 3ª. Classe e é aproximadamente R$ 36,32 g) A mediana está na 4ª. Classe e é aproximadamente R$ 35,00 h) A média é aproximadamente R$ 35,00 Respostas: a) V b) F c) F d) V e) V f) F g) V h) V Justificativas das letras (b), (c) e (f): - Primeiramente, para facilitar a visualização do histograma, vamos transformá-lo em uma tabela de dupla entrada: 80706050403020100 30 20 10 0 Dinheiro Fr eq ue nc ia 5 4 19 20 24 19 16 13 36 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios nº Classes Ponto xi fi Xi . fi Fi% Perc. Acum. 1 0 ⊢ 10 5 13 65 10,83 10,83 2 10 ⊢ 20 15 16 240 13,33 24,16 3 20 ⊢ 30 25 19 475 15,83 39,99 4 30 ⊢ 40 25 24 840 20 59,99 mediana 5 40 ⊢ 50 45 20 900 16,67 76,66 6 50 ⊢ 60 55 19 1045 15,83 92,49 7 60 ⊢ 70 65 4 260 3,33 95,82 8 70 ⊢ 80 75 5 375 4,17 99,99 120 4200 99,99 (b) A 1ª classe é 0 ⊢ 10 , logo seus limites são 0 e 10. (c) A classe de maior frequência é a 4ª classe, com limites 30 e 40 e com 24 alunos (f) A mediana está na 4ª classe e é aproximadamente R$ 35,00. Pode-se verificar pelo percentual acumulado que até o limite superior dessa classe, 40, tem-se 59,99% dos dados. O valor pode ser estimado pela ogiva: 37 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios ou calculado por interpolação: , 0 < p <1 Logo, Questão 10: Por engano o professor omitiu uma nota no grupo dos 7 alunos que não praticam exercícios físicos. As notas dos seis alunos restantes são: 72, 76, 82, 74, 65 e 64. A média das 7 notas é 72,86. O valor da nota omitida é: a) 72,86 b) 85,07 c) 77,02 d) 69,89 Solução: Li = limite inferior da classe que contem o percentil desejado; A = np B = Freqüência acumulada da classe anterior C = freqüência da classe que contem o percentil desejado H = Tamanho da classe que contem o percentil 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% 0 10 20 30 40 50 60 70 80 Dinheiro (R$) Pe rc A cu m ul ad o H C BA LP ip 100 3553010 24 4860 30P50 38 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios Vamos supor que ele tenha esquecido a x7 . Temos: 02,77 43302,510 43302,510 7 646574827672 86,72 86,72 7 7 7 7 x x x x n x x x i∑ Questão 11: Em certo ano, uma universidade pagou a cada um de seus 45 professores auxiliares um salário médio mensal de R$1.500,00, a cada um de seus 67 professores assistentes R$2.000,00, a cada um de seus 58 professores adjuntos R$2.600,00, e a cada um de seus 32 professores titulares R$3.000,00. Qual o salário médio mensal dos docentes dessa universidade? a) R$2.275,00 b) R$2.219,31 c) R$2.000,00 d) R$1.875,56 Solução: A média do salário é ponderada pela categoria do professor. Temos: 31,2219 202 448300 x 32586745 )32)(3000()58)(2600()67)(2000()45)(1500( p px x i ii ∑ Questão 12: Certa marca de lâmpada que dura 1020 horas tem escore padronizado z = 2. Sabendo-se que as vidas dessas lâmpadas têm coeficiente de variação (CV) de 14%, a média e o desvio-padrão das vidas das lâmpadas, são respectivamente: a) 796,88 ; 58,96 b) 720,85 ; 58,96 c) 510 ; 14,0 d) 796,88 ; 111,56 39 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios Solução: Temos as seguintes fórmulas do escore padronizado (z) e do coeficiente de variação (CV), respectivamente: )X(dp xx z ii ; x )X(dp CV , as quais relacionam as duas incógnitas – média ( x ) e desvio-padrão (dp(X)) Seja a v.a. X: tempo de vida das lâmpadas, em horas. Xi =1020 Temos: (3) x0,14dp(X) (2) de x )X(dp 14,0 )2( )X(dp xx 2 )1( i Levando a equação obtida em (3) em (1) temos: 796,88x1020x1,28 x1020)x14,0(2 Logo, em (3) obtemos dp(X) =111,56 Questão 13: O gráfico a seguir, apresenta as medidas do tórax dos ursos de certa área de preservação. Essas medidas são feitas para facilitar a estimação dos pesos dos ursos, em kg, por meio de um modelo estatístico. Os valores estimados para a mediana e o terceiro quartil são respectivamente: Ogiva: Tórax dos Ursos 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% 5060 70 80 90 100 110 120 130 140 toráx (cm) P er ce n tu al A cu m u la d o 40 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios a) 87 ; 106 b) 50 ; 75 c) 95 ; 130 d) 75 ; 125 Solução: Os valores estimados são obtidos diretamente no gráfico: Mediana é o percentil 50, logo traçando uma reta paralela ao eixo das abscissas – tórax -, no valor 50% do eixo das ordenadas – percentual acumulado - , até encontrar a curva, e projetando esse ponto encontrado, obtemos aproximadamente 87 (vide figura) Analogamente, o terceiro quartil é o percentil 75% - 75% dos dados nele ou abaixo dele. Repetindo o mesmo processo para ele, obtemos o ponto aproximado: 106 (vide figura) Questão 14: O gráfico a seguir, apresenta as medidas do tórax dos ursos de certa área de preservação. Essas medidas são feitas para facilitar a estimação dos pesos dos ursos, em kg, por meio de um modelo estatístico. Ogiva: Tórax dos Ursos 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% 50 60 70 80 90 100 110 120 130 140 toráx (cm) Pe rc en tu al A cu m ul ad o 41 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios Um urso com 90 cm de tórax está aproximadamente no percentil: a) 50 b) 75 c) 58 d) 25 Solução: Repita o processo da questão 13, invertendo o sentido. A seta agora parte do ponto 90 do eixo das abscissas e encontra o ponto da curva e o mesmo é projetado no eixo das ordenadas, encontrando assim o valor aproximado de 58% - Percentil 58 (ou seja, 58% dos dados estão nele ou abaixo dele) Questão 15: O gráfico a seguir, apresenta as medidas do tórax dos ursos de certa área de preservação. Essas medidas são feitas para facilitar a estimação dos pesos dos ursos, em kg, por meio de um modelo estatístico. Ogiva: Tórax dos Ursos 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% 50 60 70 80 90 100 110 120 130 140 toráx (cm) P er ce n tu al A cu m u la d o 42 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios O percentual estimado de ursos com tórax medindo acima de 115 cm é: a) 82% b) 18% c) 68% d) 25% Solução: Repita o processo da questão 138, invertendo o sentido. A seta agora parte do ponto 115 do eixo das abscissas e encontra o ponto da curva e o mesmo é projetado no eixo das ordenadas, encontrando assim o valor aproximado de 82% - Percentil 82. Como queremos o percentual estimado acima dele, temos que 100% - 82% = 18%. Questão 16: Se multiplicarmos cada um dos n elementos de um conjunto de dados X por uma constante b, podemos concluir que a nova média e a nova variância calculadas serão, respectivamente: a) adicionada de b; adicionada de b b) multiplicada por 2b ; multiplicada por 2b c) multiplicada por b; multiplicada por 2b Ogiva: Tórax dos Ursos 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% 50 60 70 80 90 100 110 120 130 140 toráx (cm) P er ce n tu al A cu m u la d o 43 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios d) multiplicada por (nb); adicionada de (nb) Solução: Seja o conjunto de dados X = {x1, x2,..., xn}, com n elementos. Temos, para esse conjunto: a média é dada por: n x x n i i 1 e a variância por: 1n )xx( )X(Var n 1i 2 i , que também pode ser escrita por: 1n xnx )X(Var 2 n 1i 2 i Seja o conjunto de dados, Y = bX ={bx1, bx2, ..., bxn} A média de Y: xb n xb n bx y n ii i n ii i E a variância de Y: )X(Varb 1n xnx b 1n xnbxb 1n )xb(n)bx( )Y(Var 2 2 n 1i 2 i 2 22 n 1i 2 i 22 n 1i 2 i Questão 17: Se adicionarmos uma constante b a cada um dos n elementos de um conjunto de dados X, podemos concluir que a nova média e a nova variância calculadas serão respectivamente: a) adicionada de b; multiplicada por 2b b) adicionada de b; não se altera c) não se altera; adicionada de b d) adicionada de (nb); multiplicada por (nb) Solução: Seja o conjunto de dados X = {x1, x2,..., xn}, com n elementos. 44 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios Temos, para esse conjunto: a média é dada por: n x x n 1i i e a variância por: 1n )xx( )X(Var n 1i 2 i , que também pode ser escrita por: 1n xnx )X(Var 2 n 1i 2 i Seja o conjunto de dados, Y = X+b ={x1+b, x2 +b, ..., xn+b} A média de Y: bx n nbx n )bx( y n ii i n ii i E a variância de Y: )X(Var 1n xnx 1n )bxb2x(nbxb2x 1n )bx(n)bx( )Y(Var 2 n 1i 2 i 22 n 1i 2 n 1i i n 1i 2 i 2 n 1i 2 i 45 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios Unidade 4 Questão 1: Com base em experiências passadas, sabe-se que a resistência à quebra de um fio usado na fabricação de material moldável é normalmente distribuída com desvio-padrão = 2 psi. Uma amostra aleatória de nove espécimes é testada e a resistência média à quebra é 98 psi. Uma estimativa intervalar, com 95% de confiança, para a resistência média da população é aproximadamente: a) 96,7 a 99,3 b) 93,1 a 102,9 c) 95,3 a 95,7 d) 96,0 a 100,0 Solução: Seja X: resistência à quebra do fio, em psi X ~ N( ; 2) Dados do problema: n = 9; x = 98; = 2 Para 95% de confiança, o nível de significância, = 5%, logo, 025,0 2 zz = 1,96 O erro máximo provável ou margem de erro amostral: E = 9 2 96,1 1,307 I.C. com 95% de confiança: Ex 98 ± 1,307 (96,7; 99,3) Questão 2: De 1000 casos selecionados aleatoriamente de câncer de pulmão, 823 resultaram em morte dentro de 10 anos. Considerando esses dados, temos: (1) a estimativa pontual para a verdadeira proporção (p) de mortes nesse período e (2) o tamanho necessário da amostra para estar 95% confiante de que o erro em estimar o valor verdadeiro de p seja no máximo de 0,03 são, respectivamente, aproximados por: a) 0,0823 e 622 b) 0,823 e 500 c) 0,0823 e 500 d) 0,823 e 622 Solução: 46 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios 1) Estimativa pontual para a verdadeira proporção: 1000 823 pˆ = 0,823/10 anos 2) Para = 5%, 025,0 2 zz = 1,96; o erro máximo provável: E = 0,03 Da fórmula do cálculo de E, temos: E = n )pˆ1(pˆ z 2 , donde obtemos: )177,0)(823,0( 03,0 96,1 )p1(p E z n 2 2 2 = 621,789 622 Questão 3: Um sistema operacional de um computador pessoal tem sido estudado extensivamente. Sabe-se que o desvio-padrão do tempo de resposta seguinte a um comando particular é = 8 milissegundos. Uma nova versão do sistema operacional é instalada e desejamos estimar o tempo médio de resposta do novo sistema, de modo a assegurar que um intervalo de confiança de 95% para a verdadeira média tenha um comprimento de no máximo 5 milissegundos. Se puder considerar que o tempo de resposta é normalmente distribuído e que = 8 milissegundos par ao novo sistema, o tamanho da amostra recomendado é de aproximadamente: a) 100 b) 72 c) 40 d) 10 Solução: Seja X: tempo de resposta a um comando particular, em milisegundos X ~ N( ; 8) Para 95% de confiança, o nível de significância, = 5%, logo, 025,0 2 zz = 1,96 I.C. com 95% de confiança: Ex )Ex( )Ex( = 5 E = 2,5 De E, temos: 22 2 5,2 8 96,1 E zn 40 47 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios Questão 4: O calor liberado, em calorias por grama, de uma mistura de cimento tem distribuição aproximadamente normal. A média deve ser 100 e o desvio-padrão é 2. Deseja-se testar as hipóteses: 100:H0 versus 100:H1 com uma amostra de 9 espécimes. Se a região de aceitação da hipótese nula for definida como 98,5 ≤ x ≤ 101,5, a probabilidade do erro tipo I é aproximadamente: a) 0,05 b) 0,024 c) 0,012 d) 0,09 Solução: X: calor liberado em calorias por grama X ~ N (100; 2) n =9 e x =100 I.C. com 95%: x ± E Mas, I.C. com 95%: 98,5 ≤ x ≤ 101,5 Logo, a amplitude do intervalo de confiança é 101,5 – 98,5 = 3 = 2E, donde E = 1,5 Por definição, 25,2 2 9 5,1 n Ez n zE 22 E a P(Z < -2,25) = P(Z > 2,25) = 0,01224 – da tabela da normal Dessa maneira, = P(Rejeitar H0 | H0 é verdadeira) = p-valor = 2(0,01224) = 0,024448 2,4% Questão 5: O calor liberado, em calorias por grama, de uma mistura de cimento tem distribuição aproximadamente normal. A média deve ser 100 e o desvio-padrão é 2. Deseja-se testar as hipóteses: 100:H0 versus 100:H1 com uma amostra de 9 espécimes. Se a região de aceitação da hipótese nula for definida como 98,5 ≤ x ≤ 101,5, o valor da probabilidade do erro tipo II para o caso em que o verdadeiro calor médio liberado seja de 103, é aproximadamente: a) 0,05 b) 0,024 c) 0,012 d) 0,09 48 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios Solução: X: calor liberado em calorias por grama X ~ N (100; 2) Para =103, temos =P(98,5 ≤ x ≤ 101,5 | =103) 9 2 1035,101 9 2 103x 9 2 1035,98 P = P(-6,75 ≤ Z ≤ -2,25) = P(Z ≤ -2,25) - P(Z ≤ -6,75) = 0,01222 – 0 Logo, 0,012 Questão 6: Um fabricante está interessado na voltagem de saída de um fornecimento de energia usado em um computador pessoal. A voltagem de saída é considerada normalmente distribuída com desvio-padrão de 0,25 V. O fabricante deseja testar 5:0 H V contra 5:1 H V., usando uma amostra com 8 unidades. Decida se cada uma das afirmativas a seguir é Verdadeira (V) ou Falsa (F): Solução: Seja X : voltagem de saída, em V. X ~ N ( ; 0,25) n=8, 088,0;N~X 8 25,0 ;N~X a) Se a região de aceitação for de 4,85 ≤ x ≤ 5,15. Podemos afirmar que a probabilidade do erro tipo I ( ) é 0,089; Correta: V Solução: 49 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios 08913,0044565,0270,1270,170,1 8 25,0 15,0 8 25,0 15,0 8 25,0 515,5 8 25,0 585,4 515,585,45I tipo erro ZPZPZP ZPZPZPZP XPXPP b) A potência (ou poder) do teste para detectar uma voltagem de saída média verdadeira de 5,1 V é de 28,7%; Correta: V Solução: Região de aceitação de H0: 4,85 ≤ x ≤ 5,15 Para =5,1, temos =P(4,85 ≤ x ≤ 5,15 | =5,1) 088,0 1,515,5 088,0 1,5x 088,0 1,585,4 P = P(-2,84 ≤ Z ≤ 0,57) = P(Z ≤ 0,57) - P(Z ≤ -2,84) = 0,715661 – 0,002256 = 0,713405 Logo, Poder do teste é 1 - 1 – 0,713405 0,2866 (28,7%) c) Se a amostra selecionada for de 16 unidades e a região de aceitação de (a) for Correta: F Solução: Se n = 16 então 16 25,0 ;N~X 0625,0;N~X Por Simetria 50 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios 0164,00082,024,22 0625,0 15,0 0625,0 15,0 16 25,0 515,5 16 25,0 585,4 ZP ZPZPZPZP Logo é menor. d) Se a amostra selecionada for de 16 unidades e a região de aceitação de (a) for Correta: V Solução: Correta, pois em (a) n = 8 e = 0,089; E em (c) n = 16 e = 0,0164. Logo é menor. Questão 7: Uma amostra aleatória de 300 circuitos apresentou 13 defeituosos. O fabricante deseja testar 05,0:1 pH , com um nível de significância de 5% ( = 0,05). O valor p para a estatística do teste Z0, considerando n pp pp Z )1( ˆ 00 0 0 , é aproximadamente: a) 0,425 b) 0,050 c) 0,950 d) 0,575 Solução: A proporção de defeituosos estimados nessa amostra: 043,0 300 13 p A hipótese levantada pelo fabricante é que a proporção de defeituosos na população é diferente de 5% - não importando se ela é maior ou menor - : H1: p p0 = 0,05, Por outro lado, a hipótese nula irá afirmar que a verdadeira proporção é de exatamente 5% - e ela será julgada para sabermos se é Falsa (rejeitar) ou Verdadeira (aceitar) considerando um nível de confiança de 95%. Ter uma confiabilidade de 95% significa que a probabilidade máxima que se 0 (dizer que ela é falsa quando na realidade ela é verdadeira). 51 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios Logo, H0: p = p0 = 0,05 = 5% 96,1z 2 56,0 01258,0 007,0 300 95,005,0 05,0043,0 z bs0 p–valor = 2P (Z z0bs) = 2P (Z - 0,56) = 2 (0,28774) = 0,57548 0,575 Questão 8: As medidas de alcatrão em um cigarro da marca X obtidas de uma amostra acusou uma média amostral de 14,4 e um erro padrão de 0,12 miligramas por cigarro. Um serviço de defesa do consumidor pretende provar que o conteúdo médio de alcatrão por cigarro é maior que 14,1. Suponhaque o conteúdo de alcatrão por cigarro tenha distribuição normal. Faça o teste estatístico adequado usando um nível de significância de 5%. Decida se cada uma das afirmações a seguir é Verdadeira (V) ou Falsa (F): a) O serviço de defesa do consumidor está correto, pois o teste indica rejeição de H0 b) O serviço de defesa do consumidor está incorreto, pois o teste indica aceitação de H0 c) O serviço de defesa do consumidor está correto, pois p-valor = 0,006 d) O serviço de defesa do consumidor está incorreto, pois p-valor é maior que 0,05 Solução: X: conteúdo de alcatrão por cigarro 1,14:H 1,14:H 1 0 50,2 12,0 1,144,14 zobs Teste unilateral, então p-valor = P(Z > zobs) = P(Z > 2,50) = 0,0062110 0,006 Conclusão: p-valor < 0,05 a hipótese nula é rejeitada (ela é falsa) hipótese alternativa é aceita como verdadeira a) O serviço de defesa do consumidor está correto, pois o teste indica rejeição de H0 VERDADEIRA b) O serviço de defesa do consumidor está incorreto, pois o teste indica aceitação de H0 FALSA 52 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios c) O serviço de defesa do consumidor está correto, pois p-valor = 0,006 VERDADEIRA d) O serviço de defesa do consumidor está incorreto, pois p-valor é maior que 0,05 FALSA Questão 9: Uma indústria deseja avaliar se o detergente líquido neutro e o limão são igualmente preferidos pelos consumidores. Em uma amostra de 250 consumidores, 145 expressaram sua preferência pelo detergente líquido neutro, enquanto os 105 restantes preferem o detergente líquido limão. Com base nessa amostra e considerando =0,05, escolha a alternativa correta para as seguintes questões: (1) a estimativa pontual da proporção de consumidores que preferem o detergente líquido neutro e (2) o erro máximo cometido na estimação da verdadeira proporção de consumidores que preferem o detergente líquido neutro são respectivamente: a) 42% e 6,12% b) 58% e 6,12% c) 42% e 3,1% d) 58% e 3,1% Correta: B Solução: H0 : p = 0,50 (os detergentes são igualmente preferidos) H1 : p 0,50 (as preferências pelos detergentes são diferentes) (1) Proporção estimada para detergente liquido neutro: 58,0 250 145 pˆ (2) 06118,0 250 )58,01(58,0 96,1E ( 6,12%) Questão 10: Em um estudo para estimar a fração (proporção) de circuitos integrados defeituosos produzidos em um processo de fotolitografia foi retirada uma amostra de 300 circuitos para serem testados e foram encontrados 13 defeitos. Utilizando a estimativa pontual de p, obtida nessa amostra preliminar, o tamanho necessário da amostra para se estar 95% confiante de que o erro em estimar o verdadeiro valor de p seja no máximo 0,03. a) 176 53 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios b) 246 c) 150 d) 285 Correta: A Solução: A proporção de defeituosos estimados nessa amostra: 043,0 300 13 p = 5% 96,1z 2 Do erro máximo provável temos: n pp z n pp zE )ˆ1(ˆ)ˆ1(ˆ 22 . Isolando o valor de n dessa fórmula obtemos: . )ˆ1(ˆ 2 2 E pp zn 20286,0041151,0)043,01(043,0)ˆ1(ˆ pp Então, .7,175)25,13( 03,0 20286,0 96,1 )ˆ1(ˆ 2 22 2 E pp zn Conclusão: o tamanho da amostra necessário será de no mínimo 176 circuitos. Questão 11: Uma indústria deseja avaliar se o detergente líquido neutro e o limão são igualmente preferidos pelos consumidores. Em uma amostra de 250 consumidores, 145 expressaram sua preferência pelo detergente líquido neutro, enquanto os 105 restantes preferem o detergente líquido limão. Com base nessa amostra e considerando =0,05, escolha a alternativa correta para as seguintes questões: (1) a estimativa pontual da proporção de consumidores que preferem o detergente líquido limão; e (2) o p-valor indicando a existência de diferença significativa entre a popularidade dos dois tipos de detergente líquido; são respectivamente: a) 58% e 1,1% b) 42% e 1,1% c) 42% e 0,57% 54 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios d) 58% e 0,57% e) 58% e 3,1% Correta: B Solução: Hipóteses: H0 : p = 0,50 (os detergentes são igualmente preferidos) H1 : p 0,50 (as preferências pelos detergentes são diferentes) (1) Proporção estimada para detergente liquido limão: 42,0 250 105 pˆ (2) Estatística do teste: 53,2 250 )50,01(50,0 50,042,0 n )p1(p ppˆ z 00 0 obs Teste bilateral, então p-valor = 2P(Z < zobs) = 2P(Z < -2,53= 2(0,005703)=0,011406 ( 1,1%) Conclusão: p-valor < 0,05 a hipótese nula é rejeitada (ela é falsa) hipótese alternativa é aceita como verdadeira, ou seja, a preferência pelos detergentes é diferente. Questão 12: Um engenheiro do controle de qualidade mediu a espessura da parede de 25 garrafas de 2 litros e encontrou uma média de 4,05 milímetros e um desvio-padrão de 0,08 milímetros. Dessa maneira, o engenheiro conclui, com 95% de confiança, que a verdadeira média da produção de garrafas possui espessura, em milímetros, entre: a) 4,15 e 4,25 b) 5,05 e 6,01 c) 4,02 e 4,08 d) 4,03 e 5,03 Correta: C Solução: Seja X: espessura das garrafas, em mm Temos: n=25 ; ;05,4x 08,0)X(dp = 5% 96,1z 2 03136,0)016,0)(96,1( 25 08,0 96,1E 55 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios Estimativa intervalar com 95% de confiança: 4,05 0,03136 (4,02 ; 4,08) Questão 13: Em uma amostra aleatória de 85 mancais de eixos de manivelas de motores de automóveis, 10 têm um acabamento de superfície que é mais rugoso que as especificações permitidas. O tamanho da amostra que deverá ser utilizada no caso de se querer estar com uma confiabilidade de 95% de que o erro em usar essa proporção para estimar a proporção verdadeira de superfícies fora das especificações seja menor que 5% é aproximadamente: a) 385 b) 176 c) 185 d) 160 Correta: D Solução: A proporção de defeituosos estimados nessa amostra: 1176,0 85 10 p = 5% 96,1z 2 E = 5% = 0,05 Do erro máximo provável temos: n pp z n pp zE )ˆ1(ˆ)ˆ1(ˆ 22 . Isolando o valor de n dessa fórmula obtemos: . )ˆ1(ˆ 2 2 E pp zn 3221,010376,0)1176,01(1176,0)pˆ1(pˆ Então, .46,159)627,12( 05,0 3221,0 96,1 E )pˆ1(pˆ zn 2 22 2 Conclusão: o tamanho da amostra necessário será de no mínimo 160 mancais. 56 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios Questão 14: Em certo banco de dados, o tempo para a realização das buscas é aproximadamente normal, com médiade 53 segundos e desvio-padrão de 14 segundos. Depois de realizadas algumas modificações no sistema, foram observadas que, em 30 consultas, o tempo médio caiu para 45 segundos. Há evidência de melhora? Admita que as 30 observações possam ser consideradas uma amostra aleatória e que não houve alteração na variância. Use =1%. Solução: Seja X: tempo para realização das tarefas, em segundos (s) X ~ N(53; 14) Após modificações: n = 30 e x =45 s Hipóteses: H0 : = 53 vs H1 : < 53 Estatística do teste: 13,3 30 14 5345 n x zobs Teste unilateral para = 1% 32,2z 0,01 Indicação do teste: rejeição de H0 , pois zobs < z0,01 p-valor = P(Z < zobs) = P(Z < -3,13)= P(Z > 3,13)= 0,5 - 0,4991=0,0009 ( 0,09%) Conclusão: p-valor < 0,05 a hipótese nula é rejeitada (ela é falsa) hipótese alternativa é aceita como verdadeira, ou seja, o tempo médio realmente diminuiu. Questão 15: Padrões técnicos exigem que o nível de ruído em CPDs seja de, no máximo, 70 dB. Foram analisados 16 CPDs de várias organizações, obtendo-se os seguintes valores máximos de ruído: 78 73 68 65 72 64 77 80 82 78 65 72 61 79 58 65 a) Calcule a intensidade de ruído média e o desvio-padrão para esses 16 CPDs. Solução: Tem-se: n = 16; x = 1137 ; 2x = 81639 16 1137 x 71,06 57 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios 49,7 15 16 1137 81639 1 22 2 n n x x s b) Suponha que os 16 CPDs analisados são uma amostra aleatória de CPDs do país e que sejam normalmente distribuídos. Para verificar se na média os CPDs atendem aos padrões técnicos, como você construiria as hipóteses? Solução: As hipóteses a serem testadas são: H0 : 70 vs H1 : 70 c) Você pode concluir que a intensidade de ruído média dos CPDs nos horários críticos é superior ao especificado? Faça o teste adequado ao nível de significância de 5%. Solução: Considerações: amostra proveniente de uma população normal com variância desconhecida e n<30 → teste a ser aplicado: T Para verificar se a amostra tem intensidade superior a especificado podemos verificar as hipóteses: 57,0 16 49,7 7006,71 n s x tobs Para o teste do item (b), unilateral à esquerda, e ao nível de significância de 5%, com 15 graus de liberdade, tem-se o tcrítico = t0,05; 15 = 1,753 Como tobs < tcritico a indicação do teste é aceitação da hipótese nula, ou seja, a intensidade de ruído média dos CPDs não é superior ao especificado, com 95% de confiabilidade. d) Sob o ponto de vista dos que trabalham nos CPDs, qual o pior erro? Explique. Solução: 58 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios Do ponto de vista dos que trabalham o pior erro é aceitar H0 (dizer que é verdadeira) quando na realidade ela é falsa, que é o erro tipo II com probabilidade . Questão 16: Foram realizados 10 ensaios aleatórios para verificar se os catalisadores A e B têm efeitos diferentes no rendimento, em percentual, de certa reação química, considerando um nível de significância de 5%. Sabe-se que as duas amostras são provenientes de populações normais com variâncias iguais, porém desconhecidas. Os resultados estão apresentados na tabela a seguir: Catalisador Amostra n Rendimento (%) Média Variância A 1 10 49,9 35,656 B 2 10 44,7 42,233 Solução: As hipóteses são: 0: 0: 211 210 H H Em que, H0 significa que em média, os dois catalisadores são iguais em termos de rendimento e, H1 significa que em média, os dois catalisadores são diferentes em termos de rendimento e A variância amostral combinada ( 2 cs ) é obtida por: 945,38 21010 )233,42)(110()656,35)(110( 2 )1()1( 21 2 21 2 112 nn snsn sc Logo, sc≈ 6,241 E a estatística do teste: 86,1 791,2 2,5 10 1 10 1 241,6 7,449,49 tbst Pela tabela tem-se que o valor crítico é 18;025,0t = 2,101 . Como tobs < tcrítico a indicação do teste é a aceitação da hipótese nula (ela é verdadeira), ou seja, os dois catalisadores tem rendimentos médios iguais, com 95% de confiabilidade. O p-valor não pode ser obtido diretamente na tabela, mas o p-valor = 2P(T >1,86), logo 0,05 < p-valor < 0,10, pois 1,86 está entre os valores: 1,734 e 2,101, com 18 graus de liberdade. 59 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios Obs: o p-valor exato, obtido por meio de software estatístico, é 0,079 > 0,05, indicando a aceitação da hipótese nula ao nível de 5% de significância. Questão 17: Dois fornecedores fabricam uma engrenagem de plástico usada em uma impressora a laser. A resistência do impacto (medida em lbf-ft) dessas engrenagens é uma característica importante. Uma amostra aleatória de 10 engrenagens do fornecedor 1 resulta em 1x = 290 e 1s = 12, enquanto a outra amostra aleatória de 16 engrenagens do segundo fornecedor resulta em 2x = 321 e 2s = 22. a) Há evidência confirmando a afirmação de que o fornecedor 2 fornece engrenagens com maiores resistências medias ao impacto? Use = 0,05 e considere que ambas as populações sejam normalmente distribuídas com variâncias desconhecidas. b) Aproxime o p-valor do teste. Solução: As máquinas são provenientes de população com variâncias desconhecidas, logo o teste a ser aplicado é o T. Os dados fornecidos: Fornecedor Média Desvio-padrão (s) Variância (s2) n 1 290 12 144 10 2 321 22 484 16 a) As hipóteses a serem testadas: Solução: H0: μ1 – μ2 = 0 vs H1: μ1 – μ2 < 0 ( μ1 < μ2) Temos que a variância combinada para as duas amostras é: 8812,185,356 24 8556 21610 )484)(116()144)(110(2 cc ss A estatística do teste: 60 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios 07,4 6113,7 31 10 1 10 1 8812,18 321290 obst O valor crítico para a área de rejeição de H0 é tc = -t0,05; 24 =-1,711 Como tobs < tc o teste indica a rejeição de H0 Então, pode-se concluir, com 95% de confiabilidade, que existem evidências que o fornecedor 2 fornece as engrenagens com maior resistência média ao impacto que o fornecedor 1. b) Estimativa do p-valor = P(T < -4,07) 0,000, pois P(T > t24 = 3,745)= 0,0005. Questão 18: Uma empresa de cerveja, após uma grande fusão, estuda a possibilidade de alterar o rótulo de uma de suas marcas, usando formas e cores mais vivas. Para avaliar se existe vantagem em alterar o rótulo, a empresa realizou uma pesquisa de marketing. Enlatou a cerveja com o rótulo tradicional e com o rótulo novo. A pesquisa foi feita em 12 estabelecimentos comerciais com apresentação das duas embalagens do produto feitas de maneiras idênticas. Em 6 deles, extraídos por sorteio, colocou-se o produto com o rótulo novo e, nos outros 6, manteve-se o produto com o rótulo tradicional. Após um mês avaliou-se a quantidade, em milhares de unidades, vendida em cada estabelecimento. Os estabelecimentos queusaram o rótulo novo, grupo 1, tiveram uma venda média de 1x = 26 e desvio-padrão de s1 = 10,5 e os com rótulo tradicional, grupo 2, obtiveram uma venda média de 2x = 22 e desvio-padrão de s2 = 7,6. Os dados mostram evidência suficiente de que a média de vendas é superior com o rótulo novo ao nível de significância de 5%? Solução: As vendas nos estabelecimentos são provenientes de populações com variâncias desconhecidas, logo o teste a ser aplicado é o T. Os dados fornecidos: Estabelecimento - Rótulo Média Desvio-padrão (s) Variância (s2) n 1 – Novo 26 10,5 110,25 6 2 – Tradicional 22 7,6 57,76 6 As hipóteses a serem testadas: 61 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios Solução: H0: μ1 – μ2 = 0 vs H1: μ1 – μ2 > 0 ( μ1 > μ2) Temos que a variância combinada para as duas amostras é: 165,9005,84 10 05,840 266 )76,57)(16()25,110)(16(2 cc ss A estatística do teste: 76,0 291,5 4 6 1 6 1 165,9 2226 obst O valor crítico para a área de rejeição de H0 é tc = t0,05; 10 =1,812 Como tobs < tc o teste indica a não rejeição de H0, ou seja, H0 é verdadeira. Então, pode-se concluir, com 95% de confiabilidade, que não existem evidências que o rótulo novo (amostra 1) tenha valor médio de vendas superior ao dos rótulos tradicionais. Estimativa do p-valor = P(T > 0,76), como com 10 graus de liberdade, tem-se 0,70 < 0,76 < 0,879 então 0,25 < p-valor < 0,20, ou seja p-valor é maior que 5%. Obs: o p-valor exato, obtido por meio de software estatístico, é 0,234 > 0,05, indicando a aceitação da hipótese nula ao nível de 5% de significância. Questão 19 (Variação do experimento da Questão 18): Uma empresa de cerveja, após uma grande fusão, estuda a possibilidade de alterar o rótulo de uma de suas marcas, usando formas e cores mais vivas. Para avaliar se existe vantagem em alterar o rótulo, a empresa realizou uma pesquisa de marketing. Enlatou a cerveja com o rótulo tradicional e com o rótulo novo. A pesquisa foi feita em 6 estabelecimentos comerciais e as duas embalagens, rótulo tradicional e rótulo novo, foram apresentadas de maneiras idênticas. Após um mês 62 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios avaliou-se o resultado das vendas, em milhares de unidades, vendida em cada estabelecimento e em cada embalagem. Foram obtidos os seguintes dados: Estabelecimento 1 2 3 4 5 6 Rótulo Novo 20 11 33 40 21 31 Rótulo Tradicional 16 12 28 32 19 25 Os dados mostram evidência suficiente de que a média de vendas é superior com o rótulo novo ao nível de significância de 5%? Solução: Nesse caso, as amostras apresentadas nos estabelecimentos são pareadas, ou seja, elas possuem um grau de dependência entre elas. Para analisar, o procedimento é feito por meio da diferença entre os valores das vendas dos rótulos e essa nova variável passa a ser analisada como se fosse apenas uma, ou seja, Estabelecimento 1 2 3 4 5 6 Rótulo Novo 20 11 33 40 21 31 Rótulo Tradicional 16 12 28 32 19 25 Diferença (D) 4 -1 5 8 2 6 O teste é feito considerando a variável D = vendas do rótulo novo – vendas do rótulo tradicional. As hipóteses a serem testadas: Solução: H0: d = 0 vs H1: d > 0 (o que significa que μ1 > μ2: média das vendas do rótulo novo maior que média das vendas do rótulo tradicional) Calculando as média é o desvio-padrão para D, obtém-se Temos que a variância combinada para as duas amostras é: d = 4,0 e sd = 3,16 A estatística do teste será: 10,3 29,1 0,4 n s d t d obs 63 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios O valor crítico para a área de rejeição de H0 é tc = t0,05; 5 =2,015 Como tobs > tc o teste indica a rejeição de H0, ou seja, H0 é falsa. Então, pode-se concluir, com 95% de confiabilidade, que existem evidências que o rótulo novo (amostra 1) tenha valor médio de vendas superior a dos rótulos tradicionais. Estimativa do p-valor = P(T > 3,10), como com 5 graus de liberdade, tem-se 2,571 < 3,10 < 3,365 então 0,025 < p-valor < 0,001 , ou seja p-valor é menor que 5%. Obs: o p-valor exato, obtido por meio de software estatístico, é 0,013 < 0,05, indicando a rejeição da hipótese nula ao nível de 5% de significância. 64 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios Unidade 5 Questão 1: Com o objetivo de verificar se em uma certa região existe correlação entre o nível de escolaridade médio dos pais e o nível de escolaridade dos filhos, observou-se uma amostra aleatória de 8 indivíduos adultos. Foram verificados o número de anos que estes frequentaram (e tiveram aprovação) em escolas regulares (Y) e o número médio de anos que os seus pais frequentaram (e tiveram aprovação) em escolas regulares (X). Os resultados são apresentados na tabela: X 0 0 2 3 4 4 5 7 Y 2 3 2 5 9 8 8 15 Com base nesses dados: Solução: Y: no. de anos que freqüentaram escola (filhos) X: no. de anos que os pais freqüentaram a escola Temos: n = 8; 25x ; 52y ; 232yx ; 119x2 ; 476y2 ; 125,3x ; 5,6y a) Calcule e interprete o coeficiente de correlação de Pearson. Solução: Coeficiente de correlação de Pearson: Txx xy SQS S r 5,69 8 )52)(25( 232 n yx yxS n 1i i n 1i i n 1i iixy 875,40 8 )25( 119 n x xS 2 2 n 1i i n 1i 2 ixx 138)5,6)(8(476ynySQ 22 n 1i 2 iT Logo, o coeficiente de correlação de Pearson é 925,0 )138)(875,40( 5,69 r 65 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios Esse coeficiente indica correlação positiva forte. b) Calcule e interprete os coeficientes estimados da reta de regressão de Y em relação a X. Solução: 70,1 875,40 5,69 S S ˆ xx xy 1 19,1)125,3)(70,1(5,6xˆyˆ 10 x70,119,1xˆˆyˆ 10 Interpretação: 19,1ˆ0 - indica o número médio de anos que os filhos estudam na ausência da frequência à escola dos pais (x=0). 70,1ˆ1 - indica a taxa de acréscimo no numero médio de anos que os filhos estudam para cada ano que os pais freqüentaram a escola. Questão 2: Modelos de regressão foram utilizados para analisar dados provenientes de um estudo de investigação da relação entre a temperatura (x) da superfície da estrada e a deflexão do pavimento (y). Um resumo das grandezas encontradas é: n =20; iy =12,75; 2iy =8,86; ix =1478; 2ix =143.215,8 e ii yx =1.083,67. Considerando esses dados, as estimativas de mínimos quadrados para a inclinação, intercepto e a mudança esperada para a deflexão média do pavimento para uma variação de 33,8ºC na temperatura da superfície são dadas, respectivamente, por: a) 73,29 ; 0,6375 e 0,33008 b) 0,00416 ; 0,33008 e 0,47068 c) 0,33008 ; 0,00416 e 0,47068 d) 0,6375 ; 0,00416 e 0,33008 Solução: (i) inclinação:00416,0 6,33991 445,141ˆ 1 xx xy S S ; pois 66 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios 445,141 20 )1478)(75,12( 67,1083 11 1 n yx yxS n i i n i i n i iixy ; 6,33991 20 )1478( 8,143215 2 2 1 1 2 n x xS n i i n i ixx (ii) intercepto: 330076,0 20 1478 )00416,0( 20 75,12ˆˆ 10 xy (iii) reta estimada por (i) e (ii): xy )00416,0(33008,0ˆ - para uma temperatura x=33,80C a deflexão média estimada do pavimento é: 470688,0)8,33)(00416,0(33008,0ˆ y Questão 3: Um artigo em uma conceituada revista cientifica americana descreveu um estudo que investigava a relação entre exposição ao barulho e hipertensão. Os dados do estudo estavam associados linearmente e a reta de regressão ajustada foi: xy 17429,0132,10ˆ , em que y representa o aumento da pressão sangüínea e x o nível da pressão sonora. O aumento médio previsto para a pressão sangüínea, associado com um nível de pressão sonora de 85 decibéis é: a) 1,737 b) 0,17429 c) -10,132 d) 4,68265 Solução: Basta substituir o valor de x=85 decibéis na reta de regressão estimada: 68265,4)85)(17429,0(132,1017429,0132,10ˆ xy Questão 4: Um motor de um foguete é fabricado ligando-se dois tipos de proprlentes: um iniciador e um mantenedor. Pensa-se que a tensão cisalhante na ligação, Y, seja uma função linear da idade do propelente, x, quando o motor for moldado. Vinte observações são apresentadas na tabela a seguir: Observação Resistência, psi (Y) Idade, semanas Observação Resistência, psi (Y) Idade, semanas 67 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios (X) (X) 1 2158,70 15,50 11 2165,20 13,00 2 1678,15 23,75 12 2399,55 3,75 3 2316,00 8,00 13 1779,80 25,00 4 2061,30 17,00 14 2336,75 9,75 5 2207,50 5,00 15 1765,30 22,00 6 1708,30 19,00 16 2053,50 18,00 7 1784,70 24,00 17 2414,40 6,00 8 2575,00 2,50 18 2200,50 12,50 9 2357,90 7,50 19 2654,20 2,00 10 2277,70 11,00 20 1753,70 21,50 Os resultados obtidos no software Minitab® para esses dados estão reproduzidos abaixo: Correlação de Pearson: Resistência, psi e Idade, semanas = -0,947 P-Valor = 0,000 Equação da regressão: Resistência, psi = 2625 - 37,0 Idade, semanas Preditor Coef SE Coef T P 2520151050 2600 2400 2200 2000 1800 1600 Idade, semanas Re si st ên ci a, p si Diagrama de Dispersão: Resistência, psi vs Idade, semanas 68 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios Constant 2625,39 45,35 57,90 0,000 Idade, semanas -36,962 2,967 -12,46 0,000 S = 99,0516 R-Sq = 89,6% R-Sq(adj) = 89,0% Análise de Variância Fonte DF SS MS F P Regressão 1 1522819 1522819 155,21 0,000 Erro Residual 18 176602 9811 Total 19 1699421 Com base nesses dados e resultados, decida se cada um dos itens a seguir é Verdadeiro (V) ou Falso (F): a) O coeficiente de correlação de Pearson indica existência de forte relação linear positiva entre essas duas variáveis. Resposta: F , pois correlação é forte, mas negativa! b) O coeficiente de correlação de Pearson não é significativo para essas duas variáveis, pois o p-valor (ou valor p) calculado é igual a zero; Resposta: F , pois esse p-valor indica que a correlação não é nula. c) A reta de regressão linear estimada é: xy 962,3639,2625ˆ ; Resposta: V d) O diagrama de dispersão indica que a técnica de regressão linear não é adequada para esses dados; Resposta: F , pois o diagrama indica a presença de uma associação linear e negativa. e) A taxa de acréscimo que 1 semana produz, em média, na tensão cisalhante é 36,962; 69 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios Resposta: F , pois a taxa é de DECRESCIMO f) A taxa de decréscimo que 1 semana produz, em média, na tensão cisalhante é 2625,39; Resposta: F , pois esse é o intercepto. Indica a taxa média da tensão na ausência da influência da idade (item h) g) O diagrama de dispersão indica que existe uma forte tendência linear negativa entre essas variáveis; Resposta: V h) A média da resistência estimada é 2625,39 psi na ausência da influência da idade, em semanas. Resposta: V i) A taxa de decréscimo estimada é 36,962, na média da resistência a cada 1 semana; Resposta: V j) A estimativa para a variância do termo do erro da regressão linear, 2 é 9811 Resposta: V Questão 5: Um estudo foi conduzido pelo Instituto Politécnico e pela Universidade Estadual da Virgínia (USA) para determinar se certa medida estática da força do braço tem influência nas características da “suspensão dinâmica” de certo indivíduo. Vinte e cinco indivíduos foram submetidos a testes de força e, depois, desempenharam um teste de levantamento de peso no qual o peso foi levantado dinamicamente sobre a cabeça. Os estão apresentados na tabela seguinte: 70 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios SOLUÇÕES: - tabela contendo os cálculos necessários: Indivíduo Força braçal (X) Levantamento dinâmico (Y) X 2 Y 2 XY 1 17,3 71,7 299,3 5140,9 1240,41 2 19,3 48,3 372,5 2332,9 932,19 3 19,5 88,3 380,3 7796,9 1721,85 4 19,7 75,0 388,1 5625,0 1477,5 5 22,9 91,7 524,4 8408,9 2099,93 6 23,1 100,0 533,6 10000,0 2310 7 26,4 73,3 697,0 5372,9 1935,12 8 26,8 65,0 718,2 4225,0 1742 9 27,6 75,0 761,8 5625,0 2070 10 28,1 88,3 789,6 7796,9 2481,23 11 28,2 68,3 795,2 4664,9 1926,06 12 28,7 96,7 823,7 9350,9 2775,29 13 29,0 76,7 841,0 5882,9 2224,3 14 29,6 78,3 876,2 6130,9 2317,68 15 29,9 60,0 894,0 3600,0 1794 16 29,9 71,7 894,0 5140,9 2143,83 17 30,3 85,0 918,1 7225,0 2575,5 18 31,3 85,0 979,7 7225,0 2660,5 19 36,0 88,3 1296,0 7796,9 3178,8 20 39,5 100,0 1560,3 10000,0 3950 21 40,4 100,0 1632,2 10000,0 4040 22 44,3 100,0 1962,5 10000,0 4430 23 44,6 91,7 1989,2 8408,9 4089,82 24 50,4 100,0 2540,2 10000,0 5040 25 55,9 71,7 3124,8 5140,9 4008,03 Total 778,70 2.050,00 26.591,63 172.891,46 65.164,04 Faça o que se pede: a) Verifique graficamente se existe tendência linear entre Y e X; Solução: 71 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios 6050403020 100 90 80 70 60 50 Força braçal (X) Le va nt am en to d in âm ic o (Y ) Gráfico de Dispersão: Levantamento dinâmico (Y) vs Força braçal (X) O gráfico de dispersão indica uma tendência linear leve, ou seja, não apresenta uma nuvem de pontos muito linear, provavelmente por influência de um ponto discrepante – valor alto de força braçal com valor mais baixo de levantamento dinâmico. b) Calcule a covariânciaentre Y e X; Solução: Utilizando os totais previamente calculados, tem-se: c) Calcule o coeficiente de correlação linear entre Y e X; 111 n S n n yx xy n yyxx YX xy ),cov( 641310 25 020507778 0465164 , ),)(,( , n yx xySxy 6154 125 641310 1 , , ),cov( n S YX xy 72 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios Solução: Tem-se: ; n x xS n i i n i ixx 2 1 1 2 2 1 2 ynySQ n i iT 682336 25 7778 6326591 2 2 1 1 2 , ),( , n x xS n i i n i ixx 464791822546172891 22 1 2 ,))((, ynySQ n i iT Logo, Como o valor do coeficiente de correlação linear é menor ou praticamente igual a 0,40, ele indica que a força da tendência linear entre Y e X é fraca. d) Ajuste um modelo de regressão linear simples; Solução: Para o ajuste do modelo de regressão é preciso estimar os coeficientes 0 – intercepto e 1 – angular ou inclinação ou taxa: 5610 682336 641310 1 , , ,ˆ xx xy S S 564153156108210 ,),)(,( ˆˆ xy A equação da reta ajustada pelo modelo de regressão linear é: Txx xy SQS S r ˆ 82 25 02050 , n y y 3920 464791682336 641310 , ,)(,( , ˆ Txx xy SQS S r 1531 25 7778 , , n x x 73 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios xy 5610564 ,,ˆ e) Interprete os resultados do item (d); Solução: O valor do intercepto indica a média de 64,5 unidades de medida para o levantamento dinâmico de peso na ausência da força estática braçal – não apresenta, portanto, sentido físico ou real. O valor de 1 indica a taxa de acréscimo no levantamento dinâmico de peso produzido para cada unidade de medida da força braçal. f) Teste a significância da regressão ao nível de significância de 5%, considerando que o valor tabelado da estatística F é 4,28; Solução: Calculando a tabela ANOVA da regressão: Causa da g.l. Soma de quadrados Quadrado Médio F0 Rejeita Variação H0 se Regressão 1 SQR QMR = SQR/1 QMR/QME F0 > Fa;1;n-2 Resíduos n-2 SQE QME =SQE/(n-2) ou p-valor < 0,05 Total n-1 STotal * Causa da g.l. Soma de quadrados Quadrado Médio F0 Conclusão Variação Não rejeita H0 Regressão 1 735,16 735,1 4,17 F0 < 4,28 Resíduos 23 4056,33 176,36 p-valor > 0,05 Total 24 4791,46 Pois, Obs.: 33405664131056104647911 ,),)(,(, ˆ xyTE SSQSQ 16735334056464791 ,,, ETR SQSQSQ 284050231 ,,)( ; xxFP x 74 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios A estatística F0 testa a significância da regressão utilizando a distribuição de Fisher. A hipótese nula desse teste é: H0 : 1 =0, logo, pode-se concluir que ao nível de significância de 5% ou com 95% de confiança, a regressão não é significativa, ou seja, ela não representa um bom ajuste dos dados. Lembre-se que o coeficiente de correlação linear era fraco!!! g) Estime a variância residual, 2; Solução: h) Encontre o levantamento dinâmico médio previsto para uma força braçal de 30. Solução: 3381305610564 ,))(,(,ˆ y para uma força braçal de 30 u.m. (unidade de medida) o levantamento dinâmico é de 81,33 u.m. de peso. Questão 6: Um administrador de marketing conduz um estudo para determinar se existe uma relação linear entre o dinheiro gasto em propaganda (X) e as vendas de uma companhia (Y), em milhares de dólares. Modelos de regressão foram utilizados para analisar esses dados. Um resumo das grandezas encontradas é: n =8; iy =1634; 2iy =337558; ix =15,8; 2ix =32,44 e ii yx =3289,8. Considerando esses dados, responda as questões que se seguem: (obs: os cálculos foram feitos considerando 4 casas decimais, por arredondamento) Solução: 1) Cálculos intermediários: 36176 2 2 ,ˆ E E QM n SQ 25,204 8 1634 n y y 75 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios 65,62 8 )1634)(8,15( 8,3289 11 1 n yx yxS n i i n i in i iixy 235,1 8 )8,15( 44,32 2 2 1 1 2 n x xS n i in i ixx 50,3813)25,204)(8(337558 22 1 2 ynySSQ n i iyyT a) A covariância estimada entre esses dados é aproximadamente: e) 104,06 f) 62,65 g) 105,89 h) 8,95 Solução: 95,8 7 65,62 1 ),cov( n S YX xy b) O coeficiente de correlação linear de Pearson para esses dados é aproximadamente: a) 8,95 b) 0,62 c) 0,91 d) 1,0 Solução: 913,0 )50,3813)(235,1( 65,62 Txx xy SQS S r c) A taxa de acréscimo que 1 milhar de dólar investido em propaganda produz na venda estimada, em milhares de dólares, é aproximadamente: a) 104,06 975,1 8 8,15 n x x 76 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios b) 50,73 c) 62,65 d) 204,25 Solução: A taxa é dada por: 73,507587,50 235,1 65,62ˆ 1 xx xy S S d) O valor estimado médio das vendas da companhia, em milhares de dólares, obtido na ausência de investimento em propaganda é aproximadamente: a) 104,06 b) 62,65 c) 50,73 d) 204,25 Solução: Na ausência de investimento em propaganda, significa x = 0, é o intercepto: 06,1040608,104)975,1)(7287,50(25,204ˆˆ 10 xy e) A estimativa para a variância do termo do erro da regressão linear, 2 é aproximadamente: a) 635,34 b) 62,65 c) 23,34 d) 105,89 Solução: 89,105 6 35,635 2 ˆ 2 n SQE 35,6353469,635)65,62)(7287,50(50,3813ˆ1 xyTE SSQSQ f) Se a empresa investir 3,8 milhares de dólares em propaganda ela espera obter de retorno das vendas, em milhares de dólares, aproximadamente: a) 104,76 b) 296,83 c) 50,73 d) 204,25 77 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios Solução: Modelo estimado: yˆ = 104,06 + 50,73 x Então para x = 3,8 , tem-se uma previsão média para vendas de : yˆ = 104,06 + (50,73)(3,8) 296,8299 296,83 milhares de dólares. g) Se a empresa espera obter um retorno de vendas de 350 milhares de dólares então ela deverá investir em propaganda, em milhares de dólares, aproximadamente; a) 4,85 b) 50,73 c) 104,76 d) 8,95 Solução: Modelo estimado:yˆ = 104,06 + 50,73 x Então para y = 350 , tem-se uma previsão média para investimento em propagandas de : 350 = 104,06 + 50,73x 73,50 06,104350 x 4,85 milhares de dólares. h) A estatística F0 , que testa a significância da regressão utilizando a distribuição de Fisher, calculada para esses dados, é aproximadamente: a) 50,73 b) 105,89 c) 30,01 d) 62,65 Solução: 01,30 89,105 15,3178 0 E R QM QM F Pois, 78 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios 89,105 2 ˆ 2 E E QM n SQ 15,317835,63550,3813 ETR SQSQSQ RR SQQM 79 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios Tabela 3 – Distribuição NORMAL 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359 0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0754 0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141 0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517 0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879 0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224 0,6 0,2258 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2518 0,2549 0,7 0,2580 0,2612 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852 0,8 0,2881 0,2910 0,2939 0,2967 0,2996 0,3023 0,3051 0,3079 0,3106 0,3133 0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389 1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621 1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015 1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177 1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319 1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4430 0,4441 1,6 0,4452 0,4463 0,4474 0,4485 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545 1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633 1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4700 0,4706 1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4762 0,4767 2,0 0,4773 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817 2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857 2,2 0,4861 0,4865 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890 2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916 2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936 2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952 2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964 2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974 2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4980 0,4980 0,4981 2,9 0,4981 0,4982 0,4983 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986 3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990 3,1 0,4990 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993 3,2 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995 3,3 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997 3,4 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998 0,4998 3,5 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 3,6 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 3,7 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 3,8 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,5000 0,5000 0,5000 3,9 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 z segunda casa decimal de z u n i d a d e e p r i m e i r a c a s a d e c i m a l d e z 80 © Tânia F Bogutchi – PUC Minas – Revisão em 2013 Estatística e Probabilidade Unidade Geral: Miscelânea de Exercícios Tabela 4 – Distribuição t-Student ptTP gl )(