Baixe o app para aproveitar ainda mais
Prévia do material em texto
Preencha a ficha de cadastro no final deste livro e receba gratuitamente informações sobre os lançamentos e as promoções da Elsevier. Consulte também nosso catálogo completo, últimos lançamentos e serviços exclusivos no site www.elsevier.com.br Nocoes_estatistica.indb 2 17/5/2010 15:49:56 S É R I E P RO VA S E CONCURSOS C O N C U R S O S Anderson Meneses Fabrício Mariano TEORIA, QUESTÕES RESOLVIDAS E MAIS DE 230 QUESTÕES COM GABARITO Noções de Estatística para Concursos CIP-Brasil. Catalogação-na-fonte. Sindicato Nacional dos Editores de Livros, RJ _____________________________________________________________________ 10-2005. CDD: 519.5 CDU: 519.2 _____________________________________________________________________ Mariano, FabrícioMariano, Fabrício Noções de estatísticas para concursos: teoria, questões resolvidas Noções de estatísticas para concursos: teoria, questões resolvidas e mais de 230 questões com gabarito / Fabrício Mariano e Anderson e mais de 230 questões com gabarito / Fabrício Mariano e Anderson Meneses. – Rio de Janeiro: Elsevier, 2010.Meneses. – Rio de Janeiro: Elsevier, 2010. 160 p. – (Provas e concursos)160 p. – (Provas e concursos) ApêndiceApêndice Inclui bibliografiaInclui bibliografia ISBN 978-85-352-3906-5ISBN 978-85-352-3906-5 1. Estatística – Problemas, questões, exercícios. 2. Serviço público 1. Estatística – Problemas, questões, exercícios. 2. Serviço público – Brasil – Concursos. I. Meneses, Anderson. II. Título. III. Título: – Brasil – Concursos. I. Meneses, Anderson. II. Título. III. Título: teoria, questões resolvidas e mais de duzentos e trinta questões com teoria, questões resolvidas e mais de duzentos e trinta questões com gabaritos. IV. Série.gabaritos. IV. Série. M286nM286n © 2010, Elsevier Editora Ltda. Todos os direitos reservados e protegidos pela Lei no 9.610, de 19/02/1998. Nenhuma parte deste livro, sem autorização prévia por escrito da editora, poderá ser reproduzida ou transmitida sejam quais forem os meios empregados: eletrônicos, mecânicos, fotográficos, gravação ou quaisquer outros. Copidesque: Maria da Glória Silva de Carvalho Revisão: Hugo de Lima Corrêa Editoração Eletrônica: SBNIGRI Artes e Textos Ltda. Coordenador da Série: Sylvio Motta Elsevier Editora Ltda. Conhecimento sem Fronteiras Rua Sete de Setembro, 111 – 16o andar 20050-006 – Centro – Rio de Janeiro – RJ – Brasil Rua Quintana, 753 – 8o andar 04569-011 – Brooklin – São Paulo – SP – Brasil Serviço de Atendimento ao Cliente 0800-0265340 sac@elsevier.com.br ISBN 978-85-352-3906-5 Nota: Muito zelo e técnica foram empregados na edição desta obra. No entanto, podem ocorrer erros de digitação, impressão ou dúvida conceitual. Em qualquer das hipóteses, solicitamos a comunicação ao nosso Serviço de Atendimento ao Cliente, para que possamos esclarecer ou encaminhar a questão. Nem a editora nem o autor assumem qualquer responsabilidade por eventuais danos ou perdas a pessoas ou bens, originados do uso desta publicação. Nocoes_estatistica.indb 4 17/5/2010 15:49:56 Dedicatórias Anderson Meneses À minha esposa Heloísa, por sempre me apoiar, e a toda a minha família, es- pecialmente ao meu sobrinho Daniel, motivo de muitas alegrias em nossas vidas. A mais profunda raiz do fracasso em nossas vidas é pensar “como sou inútil e fraco”. É essencial pensar poderosa e fi rmemente “eu consigo” sem ostentação ou preocupação. Dalai Lama Fabrício Mariano À minha namorada Marinéa, pelo amor, incentivo e presença. Aos meus pais, Salete (in memorian) e Geraldo, pela educação, exemplo e incentivo ao estudo, que foi a base para me tornar a pessoa que sou. À minha irmã Cristiani, pelo amor, companheirismo e amizade que sempre me acompanham. Aqueles que dizem que algo não pode ser feito deveriam sair do ca- minho daqueles que estão fazendo. Joel Arthur Barke Nocoes_estatistica.indb 5 17/5/2010 15:49:56 Agradecimentos Anderson Meneses Ao grande amigo Fabrício Mariano. Ao professor Sylvio Motta e a todos os colaboradores da Editora Campus/ Elsevier pela atenção, pela presteza e pelo profi ssionalismo. Fabrício Mariano À minha namorada Marinéa pelo auxílio técnico. Ao amigo Anderson Meneses pela parceria em dividir comigo este projeto. Ao professor Sylvio Motta pelo forta- lecimento da parceria ao lançarmos mais uma obra. Aos colaboradores da Editora Campus/Elsevier, pela presteza e atenção dispensadas e por estarmos juntos mais uma vez. Nocoes_estatistica.indb 7 17/5/2010 15:49:56 Os Autores Anderson Meneses • Doutor em Engenharia Nuclear pela Coppe/UFRJ e IDSIA/Universidade de Lugano (Suíça). • Mestre em Engenharia Nuclear pela Coppe/UFRJ. • Especialista em Análise, Projeto e Gerência de Sistemas pela PUC-Rio. • Graduado em Física pela UFRJ. • Ex-aluno do Colégio Pedro II. • Atua há mais de dez anos como professor, sete dos quais também dedicados ao ensino superior. • Membro da IEEE Nuclear and Plasma Sciences Society. • Autor de publicações internacionais na área de Engenharia Nuclear. • Palestrante em congressos no Brasil, Itália, Espanha, Alemanha e Estados Unidos. Fabrício Mariano • Mestrado em Economia pela Wisconsin International University. • Pós-graduação em Finanças e Gestão Corporativa pela Ucam – Universidade Cândido Mendes. • Graduação em Física pela Universidade Federal do Rio de Janeiro – UFRJ. • Ensino Fundamental e Médio – Colégio Pedro II. • Professor da Academia do Concurso Público; • Professor da Fabec (Faculdade da Academia Brasileira de Educação e Cultura). • Professor do Curso Companhia dos Módulos. • Professor do Curso Debret. Nocoes_estatistica.indb 9 17/5/2010 15:49:56 • Ex-professor do União Concursos. • Ex-professor do Degrau Concursos. • Ex-professor de Radiologia, Biofísica e Proteção Radiológica do Curso Henry Dunant. • Cursos de aperfeiçoamento nas áreas de: – Derivativos (Associação Nacional das Instituições do Mercado Financeiro – Andima). – Finanças Empresariais (Fundação Getulio Vargas – FGV). – Gestão do serviço público (Fundação Getulio Vargas – FGV). – Atendimento ao Público (Interlegis). – Lei de Responsabilidade Fiscal (Unilegis). – Estatísticas I e II (Cecierj – UERJ). – Análises combinatórias I e II (Cecierj – UERJ). – Educação Matemática (Instituto de Matemática – UFRJ). – Magnetismo Experimental (CBPF – Centro Brasileiro de Pesquisas Físicas). – Física Moderna e Contemporânea (UFF – Universidade Federal Fluminense). Nocoes_estatistica.indb 10 17/5/2010 15:49:56 Apresentação Nesta obra, procuramos abordar o conteúdo de modo a evidenciar as noções fundamentais dos principais tópicos pedidos em concurso, dando uma atenção especial às questões de prova e sua resolução, sempre seguindo a fi losofi a da Série Provas e Concursos da Editora Campus/Elsevier. Assim, os Capítulos 1, 2 e 3 (respectivamente Estatística Descritiva, Probabilidades e Variáveis Aleatórias e Distribuições de Probabilidades) permitem uma revisão de importantes conceitos, procurando trazer tanto base ao estudo quanto um meio de acesso ao entendimento de assuntos posteriores. Os Capítulos 4, 5, 6 e 7 (respectivamente Distribuições Teóricas de Probabilidades, Inferência Estatística, Teoria das Pequenas Amostras e Regressão Estatística), trazem os principais conceitos de nível intermediário seja para concursos ou para a com- preensão das importantes e poderosas ferramentas estatísticas, nos mais diversos ramos de ciência aplicada que as utilizam. Tradicionalmente, o último capítulo traz questões de importantes concursos, de bancas de todo o Brasil. A abordagem aqui apresentada, com foco nos principais conceitos e na resolução de questões, pode ser uma grande aliada dos candidatos, e esperamos que se torne decisiva na conquista de seus objetivos. Desejamos sucesso a todos. Os autores Nocoes_estatistica.indb 11 17/5/2010 15:49:56 Capítulo 1 Estatística Descritiva 1.1. INTRODUÇÃO À ESTATÍSTICA 1.1.1. A Estatística A Estatística se dedica à coleta, análise,apresentação e interpretação dos da- dos. É um ramo da matemática aplicada cujos métodos possuem aplicação nos mais diversos setores. Estatística se origina do vocábulo latino status, que signifi ca estado. 1.1.2. Ramos da Estatística Estatística Descritiva O objetivo da Estatística Descritiva é obter uma descrição do comportamento da variável em estudo por meio de um tratamento adequado dos dados. Medidas de tendência central, dispersão, assimetria e curtose são recursos da Estatística Descritiva. Teoria da Probabilidade De um modo geral, por meio da Teoria da Probabilidade faz-se o estudo de experimentos aleatórios, ou seja, processos de observação cujos resultados não podem ser previstos. Porém, apesar de não se poder fazer uma previsão dos resultados, podem ser calculadas “medidas” de chances de que tais resultados ocorram, as chamadas probabilidades. Inferência Estatística Com a Inferência Estatística, por meio da análise de partes ou porções (amos- tras), é possível fazer generalizações a respeito do todo (população). Com méto- dos de Inferência Estatística também é possível analisar a representatividade dos resultados, a signifi cância e a confi abilidade dos estudos realizados. Nocoes_estatistica.indb 1 17/5/2010 16:09:26 2 Sé rie P ro va s e Co nc ur so s Noções de Estatística para Concursos — Anderson Meneses e Fabrício Mariano ELSEVIER 1.1.3. Conceitos Fundamentais População É a coleção de todos os elementos (objetos) estudados, relativos a uma deter- minada pesquisa. Parâmetro Populacional A expressão parâmetro populacional representa uma medida numérica utiliza- da para a descrição de uma dada população. Amostra É um subconjunto de uma determinada população. Estatística Amostral A expressão estatística amostral representa uma medida numérica que descre- ve uma característica relativa a uma amostra da população. Censo É a coleção de dados referentes a todos os elementos de uma população. Variável É qualquer característica de um indivíduo de uma população, que caracteriza- rá ou descreverá um fenômeno ou fato de uma população. Uma variável assumirá valores no espaço e no tempo. Dados Qualitativos Dados qualitativos ou categóricos ou atributos descrevem condições particu- lares e se distinguem por alguma característica não numérica. Como exemplo, temos dados caracterizados como nominais, como sexo (descrito por masculino ou feminino), nacionalidade (brasileira, chilena, francesa etc.), ou ainda, dados que podem ser caracterizados como ordinais, ou seja, aos quais poderá ser atribuída uma ordem, como classifi cação em torneios (1o lugar, 2o lugar etc.), ou conceitos relativos ao desempenho de alunos (muito bom, regular ou insufi ciente). No caso de dados ordinais, pode-se ter ou não uma distância (ou métrica) entre os valores. Dados Quantitativos Dados quantitativos se originam de contagens, medições, cálculos ou enume- rações. Como exemplo, temos dados quantitativos discretos ou contínuos. São Nocoes_estatistica.indb 2 17/5/2010 16:09:26 3 Série Provas e Concursos Capítulo 1 — Estatística DescritivaCAMPUS discretos quando estão associados a um conjunto fi nito ou enumerável de valores (como número de acertos de alunos de uma turma em um determinado exame). São contínuos quando estão associados a uma escala contínua de valores (como medições relativas a tempo, comprimento etc.). Estudo observacional Em estudos observacionais, características específi cas são verifi cadas e medi- das, mas não se manipula ou modifi ca elementos. Por exemplo, a determinação do índice pluviométrico em uma determinada época do ano, em uma dada região do país. Experimentos Nos experimentos ocorre o planejamento da execução, de modo a se mani- pular condições ou conduzir procedimentos com alguma fi nalidade específi ca. Por exemplo, podem-se realizar testes e posteriormente passa-se a observar os efeitos sobre elementos a serem pesquisados. Por exemplo, algum estudo relativo ao tratamento médico com um remédio dado a um grupo de pacientes a fi m de determinar sua efi ciência na cura. Modelos Matemáticos Modelos matemáticos representam os fenômenos de maneira abstrata. Nesta representação são utilizadas funções defi nidas, com constantes e variáveis. 1.1.4. Fases do Trabalho Estatístico As fases do trabalho estatístico são Defi nição do Problema, Planejamento, Co- leta dos Dados, Apuração dos Dados, Apresentação dos Dados e Análise e Inter- pretação dos Dados. Definição do Problema Nesta fase, busca-se formular corretamente o problema, procurando-se saber exatamente o que se pretende estudar. Planejamento Com o planejamento, defi nem-se os procedimentos a serem adotados para a realização do trabalho, como, por exemplo, as perguntas que deverão ser feitas nos questionários, quando a pesquisa deverá estar concluída, defi nição da popu- lação etc. Nocoes_estatistica.indb 3 17/5/2010 16:09:26 4 Sé rie P ro va s e Co nc ur so s Noções de Estatística para Concursos — Anderson Meneses e Fabrício Mariano ELSEVIER Coleta dos Dados Esta é a fase de obtenção dos dados, que pode ser feita de maneira direta, quando levantam-se os dados primitivos, ou seja, a partir de fontes originais (como recenseamentos), ou de maneira indireta, de modo contrário. Quanto ao tempo, a coleta de dados pode ser contínua, periódica ou ocasional. Apreciação ou Crítica dos Dados Verifi cação de erros ou enganos em marcações que levariam a conclusões er- rôneas, prejudicando o estudo realizado. Apuração dos Dados É a contagem dos dados propriamente dita, somando-se ou classifi cando-se os dados adquiridos. Apresentação ou Exposição dos Dados Nesta fase, publicam-se ou mostram-se os resultados obtidos nas fases ante- riores. Análise e Interpretação dos Dados Fase em que se fazem as medidas estatísticas, com métodos de estatística des- critiva ou indutiva (inferência estatística). 1.2. MEDIDAS DE TENDÊNCIA CENTRAL (POSIÇÃO OU LOCALIZAÇÃO) As mais importantes medidas de tendência central são a média aritmética, média harmônica, média geométrica, moda e mediana, que serão descritas nos itens a seguir. 1.2.1. Média Aritmética Podemos nos referir à média aritmética como o primeiro momento de uma distribuição. Cálculo da Média Aritmética para dados não agrupados Para populações, a média é denotada por μ. Para amostras, representa-se a média por X. Para dados não agrupados em distribuições de frequências, podem ser calculados N X∑=μ e n X X ∑= , Nocoes_estatistica.indb 4 17/5/2010 16:09:26 5 Série Provas e Concursos Capítulo 1 — Estatística DescritivaCAMPUS em que, para efeito de simplifi cação de notação, ∑∑ = = N i iXX 1 para popula- ções e ∑∑ = = n i iXX 1 para amostras. N e n é o número total de observações para populações e amostras, respectivamente. Cálculo da Média Aritmética para dados agrupados Para dados agrupados em distribuições de frequências, pode-se calcular N Xf∑ ⋅=μ e n Xf X ∑ ⋅= , em que as parcelas do somatório ∑ ⋅ Xf são as frequências fi das classes i vezes o ponto médio X i de cada classe. Vale notar que Nf i i =∑ para populações e nf i i =∑ para amostras. 1.2.2. Média Geométrica Cálculo da Média Geométrica para dados não agrupados A média geométrica ou proporcional entre dois números a e b é um terceiro número μG tal que b a G G μ μ = . Logo: baG ⋅= 2μ ou ainda: baG ⋅=μ . De uma maneira geral, a média geométrica entre os números X 1 , X 2 , ..., X n é dada por: n nG XXX ⋅⋅⋅= ...21μ . Cálculo da Média Geométrica para dados agrupados Para dados agrupados, ou seja, quando a distribuição das frequências para os k números X 1 , X 2 , ..., X k (k linhas da tabela de distribuição de frequências) é dada, correspondendo respectivamente aos valores f 1 , f 2 , ..., fk, a média geo- métrica é: n f k ff G kXXX ⋅⋅⋅= ...21 21μ , Nocoes_estatistica.indb 5 17/5/2010 16:09:27 6 Sé rie P ro va s e Co nc ur so s Noções de Estatísticapara Concursos — Anderson Meneses e Fabrício Mariano ELSEVIER lembrando que n = f 1 + f 2 + ... + f k . Aplicando o logaritmo em ambos os mem- bros da equação supra, tem-se que: ( )kfkffG XXXn ⋅⋅⋅= ...log 1log 21 21μ . No 2o membro, o logaritmo do produto é a soma dos logaritmos, e isto leva a: [ ]kfkffG XXXn log...loglog 1log 21 21 +++=μ , de modo que: [ ]kkG XfXfXfn log...loglog 1log 2211 +++=μ , o que resulta fi nalmente em: ∑ = = k i iiG Xfn 1 log1log μ . Exemplo: Seja a distribuição de frequências dada na tabela a seguir. X i f i 3 1 4 2 5 4 6 3 7 5 Σ 15 Calcular sua média geométrica. Solução: 1o modo de resolução: Utilizando n fk ff kXXXG ⋅⋅⋅= ...21 21 , tem-se que 76543 15 53421 ⋅⋅⋅⋅=G ⇒ G ≅ 5,44. 7358.,0 15 037,11log ≅≅⇒ G [ ]7log56log35log44log23log1 15 1log ⋅+⋅+⋅+⋅+⋅=G 2o modo de resolução: Utilizando ∑ = = k i ii Xfn G 1 log1log , tem-se que de forma que G ≅ 100,7358 ⇒ G ≅ 5,44. Nocoes_estatistica.indb 6 17/5/2010 16:09:27 7 Série Provas e Concursos Capítulo 1 — Estatística DescritivaCAMPUS 1.2.3. Média Harmônica Cálculo da Média Harmônica para dados não agrupados Em geral, a média harmônica envolve grandezas inversamente proporcionais. É dada por: ∑ ⎟⎟⎠ ⎞ ⎜⎜⎝ ⎛ = i i H X N 1 μ . Cálculo da Média Harmônica para dois valores Para dois valores X1 = a e X2 = b (N = 2), temos: ba H 11 2 + =μ , cujo desenvolvimento resulta em: ba ab H + = 2μ . Cálculo da Média Harmônica para dados agrupados No caso de distribuições de frequências, em que cada classe está associada a um valor de frequência fi , a média harmônica é dada por: ∑ ⎟⎟⎠ ⎞ ⎜⎜⎝ ⎛ = i i i H X f Nμ , em que ∑ = = k i ifN 1 (em que k é o número de classes) e Xi é o valor médio de cada intervalo de classe. Exemplo 1: Calcule a média harmônica entre os valores a = 4 e b = 9. Solução: Substituindo os valores dados em ba ab H + = 2μ , temos 54,5 94 942 =⇒ + ⋅⋅= HH μμ . Exemplo 2: Calcule a média harmônica da distribuição de classes dada na tabela a seguir: Nocoes_estatistica.indb 7 17/5/2010 16:09:29 8 Sé rie P ro va s e Co nc ur so s Noções de Estatística para Concursos — Anderson Meneses e Fabrício Mariano ELSEVIER X i Frequências 15 |— 17 12 17 |— 19 84 19 |— 21 265 21 |— 23 281 23 |— 25 260 25 |— 27 83 27 |— 29 15 Total 1000 Solução: Substituindo os valores para cálculo da média em ∑ ⎟⎟⎠ ⎞ ⎜⎜⎝ ⎛ = i i i H X f Nμ , obtemos 28 15 26 83 24 260 22 281 20 265 18 84 16 12 1000 ++++++ =Hμ , cujo desenvolvimento resulta em μ H ≅ 21,74. 1.2.4. Moda A moda é o valor que ocorre com maior frequência, ou seja, o valor prevalente de uma distribuição. Costuma-se distinguir moda absoluta e relativa. O termo foi introduzido por Pearson. Signifi ca que o valor que é mais típico ou frequente. Cálculo da moda para não agrupados Para uma lista de dados a moda é o valor que aparece com maior frequência. Por exemplo, para os valores observados 25, 35, 35, 35, 40, 45 a moda é 35. Cálculo da moda para dados agrupados (Fórmula de Czuber) Das várias fórmulas utilizadas para o cálculo aproximado da moda em uma distribuição de frequências, a mais utilizada é a fórmula de Czuber. 21 1 0 dd dhLM + += , em que: d 1 é a diferença absoluta entre as frequências das classes modal e pré-modal; d 2 é a diferença absoluta entre as frequências das classes modal e pós-modal; h é o intervalo de classe; e L é limite inferior da classe modal. Nocoes_estatistica.indb 8 17/5/2010 16:09:30 9 Série Provas e Concursos Capítulo 1 — Estatística DescritivaCAMPUS Exemplo: Seja a distribuição de frequências dada a seguir. Diâmetro (cm) Freq. simples absoluta 4 |— 6 6 6 |— 8 8 8 |— 10 12 10 |— 12 10 12 |— 14 4 O valor aproximado da moda da distribuição é igual a: a) 9,7cm; b) 9,3cm; c) 9,6cm; d) 9,4cm; e) 9,5cm. Solução: De acordo com a tabela de distribuição de frequências dada no pro- blema, temos d1 = 4, d2 = 2, h = 2 e L = 8. Substituindo tais valores na fórmula de Czuber, obtemos: 24 4280 + +=M , o que resulta em: M 0 ≅ 9,3cm. Gabarito: letra B. 1.2.5. Mediana A Mediana é o valor que divide a coleção estudada em duas partes com o mesmo número de valores observados. Cálculo da mediana para dados não agrupados Para dados não agrupados dispostos em ordem crescente ou decrescente em uma lista, a mediana será o valor 2 1+N (para uma amostra, usar n em vez de N). Exemplo: Sejam os valores observados 3, 7, 10, 12, 18, 21, 23 e 25. Deter- mine a mediana. Nocoes_estatistica.indb 9 17/5/2010 16:09:31 10 Sé rie P ro va s e Co nc ur so s Noções de Estatística para Concursos — Anderson Meneses e Fabrício Mariano ELSEVIER Solução: Como N = 8, temos que 5,4 2 18 =+ , então a mediana será dada pela média aritmética simples dos 4o e 5o termos, ou seja, 15 2 1812 =⇒+= medianamediana Cálculo da mediana para dados agrupados Para dados agrupados, utiliza-se mf FNhLmediana −+= 2/ , em que: L é limite inferior da classe mediana; h é o intervalo de classe; N é o número de observações na população (n para amostras); F é a soma de frequências até a classe mediana, sem contar com a mesma; e fm é a frequência da classe mediana. Exemplo: Considere a distribuição de frequência. Peso (kg) Frequência absoluta 2 |— 4 9 4 |— 6 12 6 |— 8 6 8 |— 10 2 10 |— 2 1 A mediana da distribuição, em kg, é igual a: a) 5,27; b) 5,00; c) um valor inferior a 5,00; d) 5,10; e) 5,20. Solução: Pela tabela de distribuição de frequências, notamos que a classe modal é a classe 4 |— 6, então L = 4. Além disto, h = 2, N = 30, F = 9 e fm = 12, substituindo na fórmula da mediana para distribuições de classes segue que: 12 9)2/30(28 −+=mediana , Nocoes_estatistica.indb 10 17/5/2010 16:09:31 11 Série Provas e Concursos Capítulo 1 — Estatística DescritivaCAMPUS que resulta em: mediana = 5 Gabarito: letra B. Relação entre a Média Aritmética, a Moda e a Mediana Quando tratamos de distribuições assimétricas podemos nos valer da relação de Pearson XMM d 230 −= , em que M d é a Mediana e X é a média aritmética. 1.3. MEDIDAS DE DISPERSÃO As mais importantes medidas de dispersão são o desvio médio, a variância, o desvio padrão e o coefi ciente de variação, que serão descritos nos itens a seguir. 1.3.1. Desvio Médio Cálculo do Desvio Médio para dados não agrupados O desvio médio (DM) para dados não agrupados de uma população é dado por: N X DM ∑ −= μ . Já para uma amostra, n XX DM ∑ −= . Cálculo do Desvio Médio para dados agrupados Quando os dados de uma população estiverem agrupados o desvio médio será dado por: N Xf DM ∑ −= μ . De modo similar, para uma amostra, n XXf DM ∑ −= , e da mesma maneira que outros casos que envolvam dados agrupados, X estará representando o ponto médio da classe i e f será a respectiva frequência. Nocoes_estatistica.indb 11 17/5/2010 16:09:32 12 Sé rie P ro va s e Co nc ur so s Noções de Estatística para Concursos — Anderson Meneses e Fabrício Mariano ELSEVIER 1.3.2. Variância A variância de uma população é representada por σ2. Já a variância de uma amostra é representada por S2. Podemos nos referir à variância como o segundo momento de uma distribuição. Cálculo da Variância para dados não agrupados Para uma população, a variância é dada por: ( ) N X∑ −= 2 2 μσ . Para uma amostra, a variância é dada por: ( ) 1 2 2 − − = ∑ n XX S . Cálculo da Variância para dados agrupados Para uma população que tenha seus dados apresentados em uma tabela de distribuição de frequências, a variância é dada por: ( ) N Xf∑ −= 2 2 μσ . Para uma amostra, a variância para dados agrupados é dada por: ( ) 1 2 2 − − = ∑ n XXf S . Outra maneira de obter a variância A variância (também representada por V[X]) pode ser calculada em função dos somatórios dos valores observados (ΣX) e de seus quadrados (ΣX2), como exemplifi cado na fórmula: ( ) ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎣ ⎡ −= ∑ ∑n X X n XV 2 21][ . Cálculo da Variância Combinada A variância combinada é dadapor: ( ) ( ) ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎣ ⎡ + + −+ + =+ ∑∑∑∑ BABA nn BA BA nn BAV 2 221][ , em que ΣA é o somatório dos valores observados A, ΣB é o somatório dos valores observados B, ΣA2 é o somatório dos quadrados dos valores observados Nocoes_estatistica.indb 12 17/5/2010 16:09:33 13 Série Provas e Concursos Capítulo 1 — Estatística DescritivaCAMPUS A, ΣB2 é o somatório dos quadrados dos valores observados B, nA e nB são os números de valores observados A e B, respectivamente. 1.3.3. Desvio padrão Cálculo do desvio padrão para dados não agrupados Para uma população, o desvio padrão σ é dado por: ( ) N X∑ −= 2μ σ . Para uma amostra, o desvio padrão é representado por S e é dado por: ( ) 1 2 − − = ∑ n XX S . Cálculo do desvio padrão para dados agrupados Para uma população que tenha seus dados apresentados em uma tabela de distribuição de frequências, o desvio padrão σ é dado por: ( ) N Xf∑ −= 2μ σ . Para uma amostra, o desvio padrão S para dados agrupados é representado por: ( ) 1 2 − − = ∑ n XXf S . 1.3.4. Coeficiente de Variação (CV) Coeficiente de Variação para uma população μ σ=CV Coeficiente de Variação para uma amostra X SCV X= 1.4. MEDIDA DE ASSIMETRIA E MEDIDA DE ACHATAMENTO As medidas de assimetria e de achatamento dizem respeito à forma de uma distribuição. Nocoes_estatistica.indb 13 17/5/2010 16:09:33 14 Sé rie P ro va s e Co nc ur so s Noções de Estatística para Concursos — Anderson Meneses e Fabrício Mariano ELSEVIER 1.4.1. Medida de Assimetria Coeficiente de Assimetria O coefi ciente de assimetria (CA) de Pearson mede a assimetria de uma distri- buição. Para uma população, ele é dado por: ( ) σ μ medianaCA −= 3 . Para uma amostra, temos: ( ) S medianaXCA −= 3 . Uma distribuição normal é simétrica. Neste caso é fácil ver que CA = 0. Assimetria e sua relação com o terceiro momento de uma distribuição O coefi ciente de assimetria (CA) pode ser calculado como o terceiro momento de uma distribuição dividido pelo cubo do desvio padrão. Para uma população, 3 3)( σ μ∑ −= XfCA . Para uma amostra, 3 3)( S XXf CA ∑ −= . 1.4.2. Medida de Achatamento ou Curtose Uma medida de curtose ou achatamento, assim como a medida de assimetria, também se refere à forma da distribuição. Uma distribuição achatada é chamada platicúrtica. Já uma distribuição que apresenta um pico é denominada leptocúr- tica. Uma distribuição normal é chamada mesocúrtica. O Coefi ciente de Curtose (CC) pode ser calculado como o quarto momento da distribuição dividido pelo desvio padrão elevado à 4a potência. Para populações, tem-se: 4 4)( σ μ∑ −= XfCC . Para uma amostra, 4 4)( S XXf CC ∑ −= . 1.5. QUESTÕES RESOLVIDAS 1. (Esag/TJ-MA – Analista Judiciário/2005) Utilizando-se o arredondamento estatístico em duas casas decimais, em qual das alternativas o arredon- damento está incorreto? a) 68,485 = 68,49; c) 187,775 = 187, 78; b) 131,999 = 132,00; d) 74,445 = 74, 44. Nocoes_estatistica.indb 14 17/5/2010 16:09:34 15 Série Provas e Concursos Capítulo 1 — Estatística DescritivaCAMPUS Solução: O arredondamento estatístico deve ser feito da seguinte forma: (1) para os casos em que o último algarismo é 1, 2, 3, ou 4, o penúltimo algarismo permanece; (2) para os casos em que o último algarismo é 6, 7, 8 ou 9, o penúltimo algarismo é acrescido de uma unidade (como o caso da letra B, que está correto); (3) para os casos em que o último algarismo é 5, se o penúltimo algarismo for ím- par, acresenta-se a ele uma unidade (como o caso da letra C, que está correto). Se o penúltimo algarismo for par, ele é mantido (como o caso da letra D, que está correto, e como deveria ser feito na letra A, que é o item incorreto). Gabarito: letra A. 2. (Esag/TJ-MA – Analista Judiciário/2005) Associe a série de dados estatís- ticos com o tipo de gráfi co mais adequado para representá-la. Série de dados: S1: Evolução do consumo mensal de materiais. S2: Participação percentual de cada sócio no capital de uma empresa. S3: Quantidade de alunos de uma escola por faixa etária. Gráfi cos: G1: Histograma G2: Gráfi co de Linhas G3: Gráfi co Setorial (Pizza) A alternativa correta é: a) (S1, G2); (S2, G1); (S3, G3); c) (S1, G2); (S2, G3); (S3, G1); b) (S1, G3); (S2, G1); (S3, G2); d) (S1, G1); (S2, G2); (S3, G3). Solução: De um modo geral, gráfi cos representam visualmente relações entre variá- veis envolvidas em uma determinada modelagem matemática. No caso da evo- lução do consumo mensal de materiais (S1), o fenômeno modelado diz respeito a uma evolução temporal, que nem o histograma nem gráfi co de setores repre- sentariam de modo adequado, de forma que o gráfi co de linhas (G2) é o mais apropriado. O gráfi co de setores (G3), por sua vez, é útil para representar, por exemplo, as participações percentuais dos sócios de uma empresa (S2). Para as quantidades de alunos de uma escola por faixa etária (S3), o histograma (G1) é o mais adequado. Gabarito: letra C. 3. (Esag/TJ-MA – Analista Judiciário/2005) Um aluno obteve as notas 4,5; 8,0 e 7,0 nas três avaliações realizadas durante o semestre. O aluno que não consegue a média 7,0 nas três avaliações mensais deve realizar a prova fi nal. Na composição da média fi nal, a média das três ava- liações tem peso 4, e a nota da prova fi nal tem peso 6. Nocoes_estatistica.indb 15 17/5/2010 16:09:36 16 Sé rie P ro va s e Co nc ur so s Noções de Estatística para Concursos — Anderson Meneses e Fabrício Mariano ELSEVIER O aluno será considerado aprovado com a média fi nal superior ou igual a 5. Para obter aprovação, o aluno citado deverá conseguir no exame fi nal, nota mínima igual a: a) 5,0; b) 3,5; c) 4,0; d) 7,0. Solução: De acordo com os dados do problema, pode-se montar a seguinte equação, com a representação do cálculo da média fi nal ponderada pelos pesos 4 e 6, na qual 6,5 representa a média das notas nas três avaliações realizadas durante o semestre, x representa a nota do exame fi nal e o valor 5, a média fi nal mínima para aprovação, 5 10 65,64 =+× x Resolvendo-se esta equação, obtém-se x = 4. Gabarito: letra C. 4. (Esag/TJ-MA – Analista Judiciário/2005) Observe a tabela a seguir: TEMPO DE MONTAGEM DE EQUIPAMENTO TEMPO (MIN) (x) N. EQUIPAMENTOS (f) 50 5 51 10 52 8 53 5 54 2 TOTAL 30 Determinando-se a média e a mediana, chega-se aos seguintes resultados: a) Média = 50,52 minutos/equipamento; Mediana = 52,00 minutos. b) Média = 51,63 minutos/equipamento; Mediana = 51,50 minutos. c) Média = 51,36 minutos/equipamento; Mediana = 51,00 minutos. d) Média = 51,88 minutos/equipamento; Mediana = 52,50 minutos. Solução: a) Estimando a média: A média do tempo de montagem x será ponderada pelos respectivos números de equipamentos, representando as frequências f i das observações de cada x i . Desta forma, 30 5425355285110505 5 1 ×+×+×+×+×== ∑ = N xf x i ii Assim, x ≅ 516,3 minutos. Nocoes_estatistica.indb 16 17/5/2010 16:09:36 17 Série Provas e Concursos Capítulo 1 — Estatística DescritivaCAMPUS b) Estimando a mediana: Como N = 30, então teremos que achar o valor de mediana que nos fornece 15 valores de x i maiores e 15, menores. No entanto, os dados estão agrupados. As- sim, o valor se situaria entre os valores de x 2 = 51 e x 3 = 52. Neste caso, podemos estimar a mediana como a média de x 1 e x 2 , que nos dá o valor 51,50 minutos. Gabarito: letra B. 6. (FCC/Bacen – Analista/2005) A média aritmética dos valores das vendas diárias realizadas pelas 50 empresas do setor A é de R$ 1.000,00, com desvio padrão de R$ 100,00. Sabe-se ainda que a média aritmética dos valores das vendas diárias realizadas pelas 200 empresas do setor B é R$ 2.000,00, com desvio padrão de R$ 200,00. A variância em (R$)2 dos valores das vendas diárias realizadas pelos 2 setores reunidos é: a) 288.000,00; b) 207.500,00; c) 194.000,00; d) 50.000,00; e) 34.000,00. Solução: Trata-se de um problema de variância conjunta, portanto utilizaremos ( ) ( ) ⎥ ⎥⎦ ⎤ ⎢ ⎢ ⎣ ⎡ + + −+ + =+ ∑∑∑∑ BABA nn BA BA nn BAV 2 221][ , em que nA = 50 e nB = 200. Falta então determinarmos ΣA, ΣB, ΣA2 e ΣB2. Para determinarmos ΣA e ΣB, utilizaremos nA, nB e os valores das médias da- dos no problema (A = 1000 e B = 2000). Assim, 100050 ⋅=⇒⋅=⇒= ∑∑∑ AAnAn A A A A 4105×=⇒ ∑ A . De modo similar, 2000200 ⋅=⇒⋅=⇒= ∑∑∑ BBnBn B B A B 5104×=⇒ ∑B . Para determinarmos ΣA2 e ΣB2, utilizaremos os desvios padrão dados SA = 100 e S B = 200, os valores n A , n B e os valores das médias que acabamos de achar, usando: ( ) ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎣ ⎡ −= ∑ ∑ AA n A A n AV 2 21][ , Nocoes_estatistica.indb 17 17/5/2010 16:09:37 18 Sé rie P ro va s e Co nc ur so s Noções de Estatística para Concursos — Anderson Meneses e Fabrício Mariano ELSEVIER em que V[A] = S A 2 = 1002 = 104. Assim, ( ) 722424 1005,5 50 105 50 110 ×=⇒ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎣ ⎡ ×−= ∑∑ AA . De modo similar, ( ) ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎣ ⎡ −= ∑ ∑ BB n B B n BV 2 21][ , em que V[B] = S B 2 = 2002 = 4 × 104, e então temos: ( ) 822524 1008,8 200 104 200 1104 ×=⇒ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎣ ⎡ ×−=× ∑∑ BB . Substituindo então os valores determinados na equação para a variância con- junta, temos: ( ) ( ) ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎣ ⎡ + ×+×−×+× + =+ 20050 1041051008,81005,5 20050 1][ 254 87BAV , o que resulta em: V[A + B] = 194000. Gabarito: letra C. 1.6. QUESTÕES PROPOSTAS 1. (Esag/TJ-MA – Analista Judiciário/2005) Relacione cada série histórica com o tipo de função mais adequada para explicar seu movimento de tendência: Séries: S1: 6; 12; 20; 30 S2: 7; 21; 63; 189 S3: 4, 8, 12, 16 Funções: F1: Linear F2: Parabólica (do 2o grau) F3: Exponencial Está correta a alternativa: a) (S1, F1); (S2, F2); (S3, F3); c) (S1, F2); (S2, F1); (S3, F3); b) (S1, F2); (S2, F3); (S3, F1); d) (S1, F3); (S2, F2); (S3, F1). Considere a situação-problema relatada na tabela a seguir para responder às questões 2 e 3, mantendo a precisão dos dados na casa decimal. A Secretaria de Educação, em 2007, fez um levantamento sobre o tempo gasto na realização do ensino fundamental pelos alunos da cidade “A”. O resultado do levantamento dos dados consta na tabela a seguir: Tempo em anos (xi) 6 7 8 9 10 11 12 No de alunos (fi) 20 55 32 13 9 10 11 Com base nas informações, pode-se afi rmar que: Nocoes_estatistica.indb 18 17/5/2010 16:09:38 19 Série Provas e Concursos Capítulo 1 — Estatística DescritivaCAMPUS 2. (Unama/Seduc-PA – Técnico em Gestão Pública/2008) O tempo médio gas- to na realização do ensino fundamental na cidade “A” é de: a) 7,0 anos; b) 7,5 anos; c) 8,1 anos; d) 8,5 anos. 3. (Unama/Seduc-PA – Técnico em Gestão Pública/2008) O tempo mais fre- quente e o tempo mediano gasto na realização do ensino fundamental na cidade “A” são, respectivamente: a) 7,0 e 7,5 anos; b) 7,5 e 8,0 anos; c) 8,1 e 7,5 anos. d) Ambos 7,0 anos. 4. (FCC/MPE-PE – Analista Ministerial/2006) Em uma linha de produção de montadoras de tratores existem 5 verifi cações realizadas pela equipe de controle de qualidade. Foram sorteados alguns dias do mês e anotados os números de controles em que o trator produzido foi aprovado nestes dias. Aprovações No de tratores 3 250 4 500 5 1250 Total 2000 A tabela supra descreve estes dados coletados. Sabe-se que cada repro- vação implica custos adicionais para a montadora. Admitindo-se um valor básico de R$ 10,00 por cada item reprovado no trator produzido, a média da despesa adicional por trator produzido será: a) R$ 1,00; b) R$ 10,00; c) R$ 6,00; d) R$ 5,00; e) R$ 7,00. 5. (Esag/TJ-MA – Analista Judiciário/2005) Considerando-se o ano de 2003 em relação ao ano de 2002, um produto apresentou um aumento de 10% no seu preço unitário. Na sequência, de 2004 em relação a 2003, houve uma redução de 5% no preço unitário do mesmo produto. Considerando-se o perído completo de 2002 a 2004, pode-se afi rmar que houve: a) um aumento geral de 2,5%; b) um aumento geral de 4,5%; c) uma redução geral de 5%; d) um aumento geral de 5%. 6. (FCC/Metro-SP – Analista/2008) O histograma de frequências absolutas abaixo apresenta a distribuição dos salários dos empregados de uma em- presa no mês de dezembro de 2007. Nocoes_estatistica.indb 19 17/5/2010 16:09:39 20 Sé rie P ro va s e Co nc ur so s Noções de Estatística para Concursos — Anderson Meneses e Fabrício Mariano ELSEVIER 30 10 0,5 1,0 1,5 2,0 2,5 3,0 Salários (R$ 1.000,00) Frequências 40 20 Dado: Considere que os intervalos de classe deste histograma são fechados à esquerda e abertos à direita. Encontrou-se a média aritmética dos salários dos empregados, conside- rando que todos os valores incluídos em um certo intervalo de classe são coincidentes com o ponto médio deste intervalo. Obteve-se também a mediana dos salários utilizando o método da interpolação linear. O valor da moda dos salários (Mo) calculada conforme a fórmula Mo = 3Md – 2Me, sendo Md a mediana e Me a média aritmética, é igual a: a) R$ 2.125,00; d) R$ 1.750,00; b) R$ 1.950,00; e) R$ 1.625,00. c) R$ 1.875,00; 7. (Esag/TJ-MA – Analista Judiciário/2005) Referindo-se ao formato das cur- vas de frequência, considere as características descritas nos próximos 3 itens para identifi car as alternativas corretas: I. As distribuições de frequência que têm a maior concentração de da- dos à esquerda são denominadas assimétricas negativas. II. As distribuições leptocúrticas apresentam alta concentração de fre- quência numa faixa estreita de valores. III. As distribuições normais são mesocúrticas e simétricas. A alternativa contendo sentenças corretas: a) Somente I e II. c) Somente I e III. b) Somente II e III. d) I, II e III. 8. (Esag/TJ-MA – Analista Judiciário/2005) A tabela a seguir apresenta a distribuição de frequência por classes de pontos obtidos por candidatos em um concurso. PONTOS No EQUIPAMENTOS (f) 39 – 50 8 50 – 61 19 61 – 72 10 72 – 83 5 83 – 94 3 TOTAL 45 Nocoes_estatistica.indb 20 17/5/2010 16:09:39 21 Série Provas e Concursos Capítulo 1 — Estatística DescritivaCAMPUS Determinando-se as estimativas da Mediana (por interpolação) e Moda (modelo de Czuber) chega-se aos resultados: a) Mediana = 58,68 pontos; Moda = 55,50 pontos. b) Mediana = 66,50 pontos; Moda = 61,00 pontos. c) Mediana = 58,39 pontos; Moda = 56,05 pontos. d) Mediana = 55,50 pontos; Moda = 56,11 pontos. 9. (FCC/Bacen – Analista/2005) Em uma instituição bancária, o salário médio dos 100 empregados do sexo masculino é de R$ 1.500,00, com desvio padrão de R$ 100,00. O salário médio dos 150 empregados do sexo femi- nino é de R$ 1.000,00, com desvio padrão de R$ 200,00. A variância em (R$)2 dos dois grupos reunidos é de: a) 25.600,00; b) 28.000,00; c) 50.000,00; d) 62.500,00; e) 88.000,00. 10. (Cespe-UnB/CPCRC-PA – Perito/2007) Variável X Frequência relativa 0 0,10 1 0,20 2 0,30 3 0,40 Considerando a tabela supra, que apresenta as frequências relativas de uma variável X, relativa a uma contagem, assinale a opção correta. a) A média de X é inferior a 1,5. b) O desvio padrão de X é inferior a 1,5. c) A moda e a mediana de X são iguais a 3. d) O coefi ciente de variação de X é superior a 1. Gabarito: 1. B 2. C 3. A 4. D 5. B 6. C 7. B 8. C 9. E 10. B Nocoes_estatistica.indb 21 17/5/2010 16:09:39 Capítulo 2 Probabilidades 2.1. PROBABILIDADE DE UM EVENTO Espaço Amostral É o conjunto de todos os possíveis resultados de uma experiência aleatória. Será representado por Ω. 2.1.1. Evento Um evento é um subconjunto qualquer de Ω. Será representado por E. Medida de Probabilidade de um Evento A medida de probabilidade de um Evento E é a razão entre o número de elemen- tos do conjunto E, designado por n(E), e o número de elementos do espaço amostral, designado por n(Ω). A probabilidade de um evento E será representada por P(E). )( )()( Ω = n EnEP . Também pode-se interpretar n(E) como o número de resultados ditos favorá- veis e n(Ω) como o número de possíveis resultados do espaço amostral. Exemplo 1: Uma moeda é viciada de modo que a probabilidadede observar- mos a face cara é 3 vezes mais provável do que observarmos a face coroa. Calcule a probabilidade de sair cara num lançamento dessa moeda. Solução: Em um lançamento de uma moeda não viciada, a probabilidade de sair cara (evento C) é igual à probabilidade de sair a face coroa (evento K). No entanto, para a moeda viciada do problema, a probabilidade de que a face cara seja obtida é 3 vezes maior que a probabilidade de se obter a face coroa. Logo P(C) = 3P(K), e daí obtemos P(K) = P(C) 3 . As probabilidades de se obter cara e coroa em um lan- Nocoes_estatistica.indb 23 17/5/2010 16:09:39 24 Sé rie P ro va s e Co nc ur so s Noções de Estatística para Concursos — Anderson Meneses e Fabrício Mariano ELSEVIER çamento da moeda viciada, somadas, devem totalizar uma unidade, então P(C) + P(K) = 1. Substituindo o valor achado de P(K) em função de P(C) nesta última equação tem-se P(C) + P(C) 3 = 1 , que resulta em P(C) = 75%. Exemplo 2: Ao entrar em uma casa de amigos, 5 pessoas deixam seus guarda- chuvas com a dona da casa. Quatro pessoas resolvem pedi-los de volta para sair, a dona da casa constata que todos eles são aparentemente iguais, e resolve dis- tribuí-los ao acaso. Qual a probabilidade de que exatamente 3 pessoas recebam cada uma o seu próprio guarda-chuva? Solução: Existe um total de 5! = 120 possibilidades para a distribuição de guarda- chuvas pela dona da casa, logo n(Ω) = 120. Porém, procura-se a probabilidade referente à devolução correta de grupos de 3 guarda-chuvas. Para tal evento exis- tem n(E) = C 5,3 = 10 possibilidades. Sendo assim, a probabilidade do evento é dada por: 12 1)( 120 10 )( )()( =⇒= Ω = EP n EnEP . Exemplo 3: Uma moeda honesta é arremessada 6 vezes. Qual a probabilidade de obter exatamente 3 caras? Solução: 1o modo de resolução: Em 6 lançamentos da moeda do problema existem 26 possibilidades de resul- tados diferentes, logo n(Ω) = 64. No entanto, 3 resultados caras em 6 lançamen- tos podem ser obtidos de n(E) = C 6,3 = 20 maneiras diferentes, logo: %25,31)( 64 20 )( )()( =⇒= Ω = EP n EnEP . 2o modo de resolução: Existe a possibilidade de resolução deste exercício utilizando um princípio básico da distribuição binomial, que será discutida no Capítulo 4. Para repetições do mesmo experimento aleatório, neste caso em N = 6 tentativas, a probabilidade de obtenção de X = 3 caras, dadas a probabilidade de obtenção de cara (sucesso) p = 0,5 e a probabilidade de insucesso q = 0,5 é: P(E) = C N,X px qN–X Nocoes_estatistica.indb 24 17/5/2010 16:09:39 25 Série Provas e Concursos Capítulo 2 — ProbabilidadesCAMPUS ⇒ P(E) = C 6,3 (0,5)3 (0,5)6-3 ⇒ P(E) = 31,25%. 2.2. PROBABILIDADE CONDICIONAL E REGRA DE BAYES Probabilidade Condicional A probabilidade condicional P(B | A) de que um evento B ocorra dado que um evento A tenha ocorrido é dada por: 0.)(, )( )()|( >∩= AP AP BAPABP Regra da Multiplicação para Eventos Dependentes De maneira similar para a equação supra, temos: 0.)(, )( )()|( >∩= BP BP BAPBAP Assim, podemos escrever a probabilidade conjunta P(A ∩ B) como: P(A ∩ B) = P(B | A) P(A) = P(A | B) P(B). Regra de Bayes Da equação supra, obtém-se imediatamente que: )|( )()|()( ABP BPBAPAP = , que é muitas vezes chamada de regra de Bayes. Exemplo 1 (UERJ): Um instituto de pesquisa colheu informações para saber as intenções de votos no segundo turno das eleições para governador de um de- terminado estado. Intenção de voto % Candidato A 26% Candidato B 40% Voto nulo 14% Voto branco 20% Escolhendo-se aleatoriamente um dos entrevistados, verifi cou-se que ele não vota no candidato B. Qual a probabilidade de que esse eleitor vote em branco? Solução: Nocoes_estatistica.indb 25 17/5/2010 16:09:40 26 Sé rie P ro va s e Co nc ur so s Noções de Estatística para Concursos — Anderson Meneses e Fabrício Mariano ELSEVIER Sejam os conjuntos B, de eleitores que não votam no candidato B, e C, dos eleitores que votam em branco. O problema pede a probabilidade de que um eleitor vote em branco dado que ele não vota no candidato B. Utilizando-se a no- tação de conjuntos, pede-se para calcular P(B | C) e pelo teorema de Bayes tem-se: )( )()|( BP BCPBCP ∩= . Pela tabela, pode ser verifi cado que P(C ∩ B) = 20/100 e que P(B) = 60/100. Assim, temos 100/60 100/20)|( =BCP 3 1)|( =⇒ BCP . Exemplo 2 (FTSM – 1995): Uma eleição é disputada por dois candidatos X e Y. Sabe-se que 60% dos eleitores preferem o candidato X, 20% preferem o Y e os demais eleitores estão indecisos. Entre os eleitores que já se decidiram, qual a porcentagem dos que preferem Y? Solução: A porcentagem pedida no problema é referente aos eleitores que preferem o candidato Y, dado que se trata de eleitores que já se decidiram. Sendo I o conjun- to dos eleitores indecisos e I o conjunto dos eleitores que já se decidiram, pede-se P(Y | I). Pelo Teorema de Bayes, temos: )( )()|( IP IYPIYP ∩= . Pelos dados do enunciado do problema, sabemos que P(Y ∩ I) = 20% e que P(I) = 80%. Sendo assim, %80 %20)|( =IYP 4 1)|( =⇒ IYP . Exemplo 3: Suponha que um escritório possua 100 computadores, entre no- vos e antigos. Algumas dessas máquinas possuem o processador da marca A, enquanto outras possuem o processador da marca B, conforme mostra a tabela a seguir: Nocoes_estatistica.indb 26 17/5/2010 16:09:41 27 Série Provas e Concursos Capítulo 2 — ProbabilidadesCAMPUS Proc. A Proc. B Total Novos 40 30 70 Usados 20 10 30 Total 60 40 100 Uma pessoa entra no escritório, escolhe um computador ao acaso e descobre que é novo. Qual é a probabilidade de que ela possua o processador A? Solução: Está sendo pedida a probabilidade de que o computador possua o processa- dor A dado que ele é novo. Pede-se então P(A | N) e pelo Teorema de Bayes )( )()|( NP NAPNAP ∩= 100/70 100/40)|( =⇒ NAP 7 4)|( =⇒ NAP . Exemplo 4: Um grupo de pessoas está classifi cado de acordo com o sexo e o idioma que fala, conforme mostra a tabela abaixo. Inglês Alemão Francês Homens 92 35 47 Mulheres 101 33 52 Escolhendo-se uma pessoa ao acaso e sabendo-se que esta pessoa fala francês, qual é a probabilidade de que seja homem? Solução: Está sendo pedida a probabilidade de que uma pessoa escolhida ao acaso seja homem, dado que a pessoa escolhida fala francês, ou seja, pede-se P(H | F). Pelo Teorema de Bayes, P(H | F) = P(H ∩ F) P(F) , e pelos dados da tabela, P(H | F) = 47/360 99/360 , que resulta em P(H | F) ≅ 47,5%. 2.3. PROBABILIDADE TOTAL E TEOREMA DE BAYES Sejam os eventos A 1 , A 2 , ..., A n , de modo que A i ∩ A j = ∅ ∀ i ≠ j (eventos disjun- tos) e que Ω = n U i = 1 A i = A 1 ∪ A 2 ∪ ... ∪ A n . Já o evento B é tal que B ⊂ Ω, conforme mostra a fi gura a seguir. Nocoes_estatistica.indb 27 17/5/2010 16:09:42 28 Sé rie P ro va s e Co nc ur so s Noções de Estatística para Concursos — Anderson Meneses e Fabrício Mariano ELSEVIER A1 Ω A2 An ... ... ... ... B Podemos observar pela fi gura que a chamada probabilidade total de B é dada por ∑ = ∩= n i iABPBP 1 )()( . Da regra da multiplicação para eventos dependentes sabe-se que P(B ∩ A) = P(B | A) P(A). Assim, podemos reescrever a equação para a probabilidade total de B como: ∑ = = n i ii APABPBP 1 )()|()( . Mas da regra de Bayes mostrada na seção (2.2), sabemos que: )( )()|()|( BP APABPBAP iii = e substituindo a expressão com o somatório referente a P(B) no denominador, temos a expressão que geralmente é denominada Teorema de Bayes ∑ = = n i ii ii i APABP APABPBAP 1 )()|( )()|()|( . Exemplo 1: Durante o mês de agosto a probabilidade de chuva em um de- terminado dia é 4/10. O Fluminense ganha um jogo em um dia de chuva com probabilidade 6/10 e em um dia sem chuva com probabilidade 4/10. Sabendo-se que o Fluminense ganhou um jogo naquele dia de agosto, qual a probabilidade de que choveu nesse dia? Solução: Seja a vitória do Fluminense o evento B. Seja a chuva no dia do jogo o evento A 1 . Procura-sedeterminar P(A 1 | B) (probabilidade de ter chovido, dado que o Fluminense ganhou o jogo). E pelo Teorema de Bayes, Nocoes_estatistica.indb 28 17/5/2010 16:09:43 29 Série Provas e Concursos Capítulo 2 — ProbabilidadesCAMPUS ∑ = = n i ii APABP APABPBAP 1 11 1 )()|( )()|()|( , em que A 2 será o evento não chuva no dia do jogo. Desenvolvendo o somató- rio no denominador, temos: )()|()()|( )()|()|( 2211 11 1 APABPAPABP APABPBAP + = , em que: P(B | A 1 ) é a probabilidade de que o time ganhou, dado que choveu; e P(B | A 2 ) é a probabilidade de que o time ganhou, dado que não choveu. Pelo enunciado, P(B | A 1 ) = 6/10, P(B | A 2 ) = 4/10, P(A 1 ) = 4/10 e P(A 2 ) = 6/10. Substituindo tais valores na expressão para P(A 1 | B), temos: 10 6 10 4 10 4 10 6 10 4 10 6 )|( 1 ⋅+⋅ ⋅ =BAP , o que resulta fi nalmente em: 2 1)|( 1 =BAP . Exemplo 2: Num exame há 3 respostas para cada pergunta e apenas uma delas está certa, portanto, para cada pergunta, um aluno tem probabilidade 1/3 de escolher a resposta certa, se ele está adivinhando, e 1, se sabe a resposta. Um estudante sabe 30% das respostas do exame. Se ele deu a resposta correta para uma das perguntas, qual é a probabilidade de que adivinhou? Solução: Sejam: B: o evento em que o aluno acerta a resposta; A 1 : o evento em que o aluno não sabe (adivinha) a resposta; A 2 : o evento em que o aluno sabe a resposta; B | A 1 : o evento em que o aluno acerta a resposta, dado que ele adivinhou a resposta; e B | A 2 : o evento em que o aluno acerta a resposta, dado que ele sabia a resposta. Pede-se, neste problema, a probabilidade de o aluno ter adivinhado (A 1 ), dado que o aluno deu a resposta correta b). Assim, Nocoes_estatistica.indb 29 17/5/2010 16:09:43 30 Sé rie P ro va s e Co nc ur so s Noções de Estatística para Concursos — Anderson Meneses e Fabrício Mariano ELSEVIER )()|()()|( )()|()|( 2211 11 1 APABPAPABP APABPBAP + = . Pelo enunciado do problema, P(B | A 1 ) = 1/3, P(A 1 ) = 70%, P(B | A 2 ) = 1 e P(A 2 ) = 30%. Substituindo tais dados na expressão para P(A 1 | B), temos: 3,017,0 3 1 7,0 3 1 )|( 1 ×+× × =BAP , que resulta em: P(A 1 | B) = 0,4375. Exemplo 3: Tem-se três urnas absolutamente iguais U 1 , U 2 e U 3 , contendo bolas brancas e pretas da seguinte forma: U 1 : Contém 3 bolas brancas e 4 bolas pretas. U 2 : Contém 5 bolas brancas e 3 bolas pretas. U 3 : Contém 4 bolas brancas e 2 bolas pretas. Seleciona-se ao acaso uma urna e dela se extrai uma bola que se constata ser branca. Qual a probabilidade de que a urna selecionada seja U 2 ? Solução: Como a urna foi selecionada ao acaso, então P(U 1 ) = P(U 2 ) = P(U 3 ) = 1/3. Além disto, sejam: B | U 1 : evento no qual a bola selecionada foi branca, dado que a mesma per- tencia à urna 1; B | U 2 : evento no qual a bola selecionada foi branca, dado que a mesma per- tencia à urna 2; e B | U 3 : evento no qual a bola selecionada foi branca, dado que a mesma per- tencia à urna 3. O que o problema pede é a probabilidade de que a urna selecionada foi a urna 2 (U 2 ), sabendo-se que a bola selecionada foi branca b). Assim, pede-se P(U 1 | B), e pelo Teorema de Bayes tem-se: )()|()()|()()|( )()|()|( 332211 22 2 UPUBPUPUBPUPUBP UPUBPBUP ++ = . Do enunciado do problema tem-se P(B | U 1 ) = 3/7, P(B | U 2 ) = 5/8 e P(B | U 3 ) = 4/6. Substituindo tais valores, temos Nocoes_estatistica.indb 30 17/5/2010 16:09:44 31 Série Provas e Concursos Capítulo 2 — ProbabilidadesCAMPUS 3 1 6 4 3 1 8 5 3 1 7 3 3 1 8 5 )|( 1 ⋅+⋅+⋅ ⋅ =BUP , que resulta em: P(B | U 1 ) ≅ 0,3633. Independência de Dois Eventos Dois eventos A e B são chamados independentes estatisticamente se e somente se P(A ∩ B) = P(A) ⋅ P(B). Em palavras, dois eventos são independentes se a ocorrência de um evento A não implica informação para predizer a probabilidade da ocorrência de um evento B, e vice-versa. Neste caso, dizemos que a probabilidade condicional de B dado A é simplesmente igual à probabilidade de B, ou seja, P(B | A) = P(B). De modo similar para o evento A, temos: P(A | B) = P(A). Observações 1) Não confundir eventos mutuamente exclusivos e eventos independentes. Note que: a) Se eventos A 1 , A 2 , ..., A n são mutuamente exclusivos, então: P(A 1 ∪ A 2 ∪ ... ∪ A n ) = P(A 1 ) + P(A 2 ) + ... + P(A n ). b) Se eventos A 1 , A 2 , ..., A n são independentes, então: P(A 1 ∩ A 2 ∩ ... ∩ A n ) = P(A 1 ) ⋅ P(A 2 ) ⋅ ... ⋅ P(A n ). 2) Lei dos Grandes Números Pela resolução de problemas anteriores, podemos notar que com auxílio do cálculo das probabilidades é possível fazer uma certa previsão dos fatos reais. E essa previsão é tanto mais segura quanto maior for o número de experiências. Nocoes_estatistica.indb 31 17/5/2010 16:09:44 32 Sé rie P ro va s e Co nc ur so s Noções de Estatística para Concursos — Anderson Meneses e Fabrício Mariano ELSEVIER Quanto maior o número de provas, mais a nossa previsão se aproximará da rea- lidade. Esta é a lei dos grandes números, que liga os cálculos da probabilidade à estatística. Como veremos adiante, num experimento aleatório, uma variável aleatória assume um valor com uma determinada frequência relativa, cujo valor é uma aproximação da probabilidade. Tal aproximação é mais precisa quanto maior for o número de observações. Assim, os valores que em estatísticas se chamam médias encontram corres- pondências no cálculo das probabilidades nas esperanças matemáticas. Maiores explicações e detalhes serão dados nos capítulos seguintes. 2.4. QUESTÕES RESOLVIDAS 1. (FCC/Metro-SP – Analista/2008) Dois irmãos investem no mercado fi nan- ceiro. Em um determinado período, sabe-se que o primeiro tem 80% de probabilidade de apresentar um ganho positivo e o segundo tem 90%. A probabilidade de nenhum deles apresentar um ganho positivo, neste período, é igual a: a) 2%; b) 3%; c) 10%; d) 20%; e) 25%. Solução: A probabilidade de que o primeiro irmão não tenha um ganho positivo (even- to E 1 ) é P(E 1 ) = 1 – 0,8 = 0,2. A probabilidade de que o segundo irmão não tenha um ganho positivo (evento E 2 ) é P(E 2 ) = 1 – 0,9 = 0,1. Neste problema é pedida a probabilidade de que o primeiro não tenha lucro positivo e que o segundo não tenha lucro positivo. Logo, procura-se P(E 1 ∩ E 2 ). Como os eventos são indepen- dentes, P(E 1 ∩ E 2 ) = P(E 1 ) ⋅ P(E 2 ) = 0,2 ⋅ 0,1 = 0,02. Gabarito: letra A. 2. (Esag/TJ-MA – Analista Judiciário/2005) De 240 empregados, 120 do- minam a matemática, 100 dominam o português e 40 dominam as duas áreas. Considerando-se que um empregado seja escolhido ao acaso, pergunta- se: qual a probabilidade de esse empregado não dominar nem matemática nem português? a) 1/36; b) 7/24; c) 3/4; d) 1/4. Nocoes_estatistica.indb 32 17/5/2010 16:09:44 33 Série Provas e Concursos Capítulo 2 — ProbabilidadesCAMPUS Solução: Sejam: U: o conjunto universo; M: o conjunto dos empregados que dominam matemática; P: o conjunto dos empregados que dominam português; M ∩ P: o conjunto dos empregados que dominam matemática e português; M ∪ P: o conjunto dos empregados que dominam matemática ou português; M ∪ P: o conjunto dos empregados que não dominam matemática nem por- tuguês; e n(A): o número de elementos de um conjunto A qualquer dentre os supramen- cionados. Tais conjuntos podem ser representados pelo diagrama a seguir: M U P M ∩ P Das relações entre os conjuntos apresentados podemos observar que: (i) o número de elementos do conjunto universo (total de empregados) é a soma dos números de elementos dos conjuntos que representam os empre- gados que dominam português ou matemática com os que não dominam nem a primeira nem a segunda matéria, ou seja, n(U) = n(M ∪ P) + n(M ∪ P); e (ii) n(M ∪ P) = n(M) + n(P) – n (M ∩ P) e Pelo enunciado do problema, n(M) = 120, n(P) = 100 e n(M ∩ P) = 40, e após sua substituição na equação do item (ii) temos: (iii) n(M ∪ P) = 120+ 100 – 40 ⇒ n (M ∩ P) = 180 Substituindo o resultado obtido em (iii) na equação apresentada no item (i) sabendo que n(U) = 240, temos: 240 = 180 + n(M ∪ P) ⇒ n(M ∪ P) = 60 Ao escolher ao acaso um empregado, a probabilidade de que o mesmo não domine português nem matemática é dada por: Nocoes_estatistica.indb 33 17/5/2010 16:09:44 34 Sé rie P ro va s e Co nc ur so s Noções de Estatística para Concursos — Anderson Meneses e Fabrício Mariano ELSEVIER P(M ∪ P) = n(M ∪ P) n(U) P(M ∪ P) = 60 240 ⇒ P(M ∪ P) = 1 4 Gabarito: letra D. 3. (Esag/TJ-MA – Analista Judiciário/2005) Uma caixa contém 8 cilindros, sendo 5 brancos e 3 verdes. A caixa também contém 6 cubos, sendo 4 brancos e 2 verdes. Retirando-se apenas uma peça de forma aleatória, a probabilidade de encontrar um cubo ou uma peça qualquer da cor verde é: a) 10/14; b) 45/56; c) 9/14; d) 11/14. Solução: Sejam os eventos: A: retirar um cubo; e B: retirar uma peça da cor verde. Tais eventos não são mutuamente exclusivos, pois podemos retirar uma peça verde que seja um cubo. O que é pedido no problema é P(A ∪ B) (retirar um cubo ou uma peça qualquer da cor verde). Tal probabilidade (para eventos que não sejam mutamente exclusivos) é dada por: P(A ∪ B) = P(A) + P(B) – P(A ∩ B) Pelo enunciado do problema, P(A) = 6/14 (6 cubos em 14 peças), P(B) = 5/14 (5 peças de cor verde em 14 peças) e P(A ∩ B) = 2/14 (2 cubos verdes em 14 peças). Substituindo, temos: P(A ∪ B) = 6 14 + 5 14 – 2 14 , que resulta em: P(A ∪ B) = 9 14 . Gabarito: letra C. Nocoes_estatistica.indb 34 17/5/2010 16:09:44 35 Série Provas e Concursos Capítulo 2 — ProbabilidadesCAMPUS 4. (Esaf/Bacen – Analista/2005) Do total de títulos em poder de um inves- tidor, 1 8 é do tipo T1, 1 4 é do tipo T2 e o restante do tipo T3. Sabe-se que as probabilidades de se obter uma taxa real de juros positiva com essas aplicações são 0,60 com T1, 0,70 com T2 e 0,80 com T3. Se for escolhido um título aleatoriamente entre estes em poder do investidor e verifi car-se que apresentou uma taxa real de juros não positiva, a probabilidade de ele ser do tipo T3 é: a) 50%; d) 20%; b) 40%; e) 10%. c) 30%; Solução: A probabilidade pedida é a probabilidade condicional de que o título perten- cente ao investidor seja do tipo 3, sabendo-se que ele apresentou uma taxa de juros não positiva. Esta probabilidade condicional é dada pelo Teorema de Bayes, de modo que: )()|()()|()()|( )()|()|( 332211 33 3 TPTNPTPTNPTPTNP TPTNPNTP ++ = . Pelo enunciado, P(T 1 ) = 1/8, P(T 2 ) = 1/4, P(T 3 ) = 1 – 1 4 – 1 8 = 5 8 . Também podemos calcular as probabilidades P(N | T 1 ) = 1 – 0,6 = 0,4, P(N | T 2 ) = 1 – 0,7 = 0,3 e P(N | T 3 ) = 1 – 0,8 = 0,2. Substituindo tais valores na expressão para P(T 3 | N), segue que: 8 52,0 4 13,0 8 14,0 8 52,0 )|( 3 ×+×+× × =NTP , de modo que: P(T 3 | N) = 0,50. Gabarito: letra A. 5. (NCE/Anac – Estatística/2007) Uma moeda honesta é lançada duas vezes. A probabilidade condicional de que ocorram duas caras, dado que ao me- nos uma cara ocorre, é igual a: a) 1/3; b) 1/2; c) 3/5; d) 3/4; e) 4/5. Nocoes_estatistica.indb 35 17/5/2010 16:09:44 36 Sé rie P ro va s e Co nc ur so s Noções de Estatística para Concursos — Anderson Meneses e Fabrício Mariano ELSEVIER Solução: Sejam os eventos: A a ocorrência de duas caras; e B a ocorrência de ao menos 1 cara. A probabilidade condicional que está sendo pedida é P(A | B) que pela regra de Bayes é dada por: )( )()|( BP BAPBAP ∩= . Calculemos então a probabilidade P(A) do evento A. Para que ocorram duas caras, teremos que obter cara no primeiro lançamento e cara no segundo, o que signifi ca que 4 1 2 1 2 1)( =⋅=AP . A probabilidade P(B), relativa ao evento B, será a probabilidade de obtermos uma cara (no 1o ou no 2o lançamento, lembrando que as possibilidades são CC, KK, KC ou CK, então tal probabilidade é 2 4 = 1 2 ) ou cara nos dois lançamentos (já calculado e equivalente a 1 4 ). Assim, 4 3)( 4 1 2 1)( =⇒+= BPBP . Porém deve-se notar que o evento A está contido no evento B e, nesse caso, P(A ∩ B) = P(A) (pois B é obtenção de 1 cara ou 2 caras e A é a obtenção de 1 cara). Assim, voltando à expressão para P(A | B) , podemos reescrevê-la como: )( )()|( BP APBAP = , o que, pelos cálculos, resulta em: 3/1 4/3 4/1)|( ==BAP . Gabarito: letra A. 2.5. QUESTÕES PROPOSTAS 1. (Esag/TJ-MA – Analista Judiciário/2005) Uma caixa de ferramentas con- tém 5 martelos, sendo 3 com cabo de madeira e 2 com cabo de borracha. A caixa também contém 7 limas, sendo 3 com cabo de madeira e 4 com cabo de borracha. Retirando-se 2 ferramentas de forma aleatória e sem reposição, a proba- bilidade de que uma seja martelo com cabo de madeira e a outra uma lima com cabo de borracha é: a) 2/11; c) 7/12; b) 12/35; d) 1/11. Nocoes_estatistica.indb 36 17/5/2010 16:09:45 37 Série Provas e Concursos Capítulo 2 — ProbabilidadesCAMPUS 2. (Esag/TJ-MA – Analista Judiciário/2005) Uma caixa contém 4 peças, sendo 3 perfeitas e 1 defeituosa. Uma segunda caixa contém 6 peças sendo 4 perfeitas e 2 defeituosas. Uma experiência consiste em retirar uma peça de cada caixa com a expec- tativa de que ambas as peças selecionadas sejam perfeitas. Após a reali- zação de cada experiência, as peças retiradas voltam à caixa de origem. Se a experiência for realizada 3 vezes, a probabilidade de que a expectativa seja satisfeita em duas oportunidades é: a) 1/2; c) 3/8; b) 1/8; d) 7/10. 3. (FCC/Bacen – Analista/2005) Uma pessoa poderá investir seu dinheiro em três setores (A, B e C) da economia. Sabe-se que a probabilidade de uma empresa apresentar lucro é de 0,70 sendo empresa do setor A; 0,80 sendo empresa do setor B e 0,90 sendo empresa do setor C. Tem-se ainda que nesta economia existem 750 empresas do setor A, 300 do setor B e 150 do setor C. Escolhendo aleatoriamente uma empresa pertencente a esses três setores e detectando-se que ela não apresenta lucro, a probabilidade de ela pertencer ao setor A é de: a) 30%; d) 75%; b) 40%; e) 80%. c) 50%; 4. (FCC/Metro-SP – Analista/2008) Em uma assembléia com 25 participantes, sabe-se que 5 deles são contra a realização de determinado projeto e o restante a favor. Extraindo ao acaso uma amostra de 3 participantes desta assembléia, sem reposição, a probabilidade (P) de todos os 3 participan- tes serem a favor do projeto é tal que: a) P < 50%; d) 70% < P < 80%; b) 50% < P < 60%; e) 80% < P < 90%. c) 60% < P < 70%; 5. (Esaf/Auditor-Fiscal – Previdência Social/2002) Considere um ensaio alea- tório com espaço amostral {T, U, V, W}. Considere os eventos M = {T}, N = {U, V} e S = {W}. Assinale a opção correta relativamente à probabilidade de M ∩ N ∩ S. a) Não se pode determinar a probabilidade de intersecção sem maiores informações. b) É o produto das probabilidades de M, N e S, pois os eventos são estatisticamen- te independentes. c) A probabilidade é um, pois pelo menos um dos três eventos deve ocorrer. d) A probabilidade da intersecção é 1/3 se os eventos elementares forem igual- mente prováveis. e) A probabilidade da intersecção é nula, pois os eventos são mutuamente exclu- sivos. 6. (NCE/Anac – Estatística/2007) Avalie as afi rmativas a seguir, acerca de probabilidades de eventos: I. Se dois eventos, de probabilidades não nulas, não têm interseção, então eles são independentes. II. Dois eventos independentes, de probabilidades não nulas, podem ser mutuamente exclusivos. Nocoes_estatistica.indb 37 17/5/2010 16:09:45 38 Sé rie P ro va s e Co nc ur so s Noções de Estatística para Concursos — Anderson Meneses e Fabrício Mariano ELSEVIER III. Se A e B são eventos, 0 < P [B] < 1, e se B é o complemento de B, então P [A] = P [A | B] P [B] + P [A | B] P [B]. IV. Se A e B são eventos de probabilidades não nulas tais que a probabi- lidade condicional de A ocorrer dado que B ocorre é igual à probabili- dade incondicional de A ocorrer, então A e B são independentes. Estão corretasas afi rmativas: a) I e II, apenas; d) II, III e IV, apenas; b) III e IV, apenas; e) I, II, III e IV. c) I, II e IV, apenas; 7. (FCC/TRF/2 – Analista/2007) Sejam A e B dois eventos associados a um experimento. Supondo que Pa) = 0,4 e P(A ∪∪ B) = 0,7 e Pb) = p. Os valores de p que fazem com que A e B sejam mutuamente exclusivos e A e B sejam independentes são, respectivamente: a) 0,3 e 0,5; d) 0,6 e 0,2; b) 0,4 e 0,2; e) 0,3 e 0,4. c) 0,5 e 0,2; 8. (FCC/TRF/2 – Analista/2007) Uma fábrica de chocolate produz dois tipos de caixas de bombons: com e sem açúcar. Cada caixa contém 10 bombons. Por descuido, foram misturados 3 bombons sem açúcar em uma caixa de bombons doces. A caixa foi oferecida a uma criança que retirou 2 bom- bons. A probabilidade de estes dois bombons serem sem açúcar é: a) 1/15; d) 3/15; b) 1/20; e) 1/5. c) 3/20; As informações a seguir referem-se às questões de números 9 e 10. Em um jogo, um participante seleciona sucessivamente ao acaso duas bolas de uma urna que contém 10 bolas sendo: 4 pretas, 3 vermelhas e 3 brancas. O esquema de premiação do jogo consiste das seguintes regras: para cada bola vermelha sorteada o participante ganha um real, para cada bola preta sorteada ele perde um real e para cada bola branca sorteada ele não ganha e nem perde nada. 9. (FCC/TRF/2 – Analista/2007) Se a seleção for realizada sem reposição, a probabilidade de o participante não ganhar nada neste jogo é: a) 1/6; d) 1/3; b) 1/5; e) 1/8. c) 1/4; 10. (FCC/TRF/2 – Analista/2007) Se a seleção for realizada com reposição, a probabilidade de o participante ganhar R$ 1,00 neste jogo é: a) 0,25; d) 0,12; b) 0,18; e) 0,10. c) 0,15; Gabarito: 1. A 2. C 3. D 4. A 5. E 6. B 7. A 8. A 9. D 10. B Nocoes_estatistica.indb 38 17/5/2010 16:09:45 Capítulo 3 Variáveis Aleatórias e Distribuições de Probabilidades 3.1. VARIÁVEIS ALEATÓRIAS É uma função que associa um único valor real (na reta ℜ) para cada ponto A 1 , A 2 , ..., A n pertencente ao espaço amostral Ω, como mostrado a seguir. A 1 Ω ℜ A 2 A 3 Assim, podemos defi nir eventos tendo em vista variáveis aleatórias, como nos exemplos a seguir. Exemplo 1: Em dois lançamentos sucessivos de uma moeda honesta, sendo a variável aleatória X o número de caras obtidas, quais são os valores que X pode assumir? Solução: É simples ver que o espaço amostral é Ω = {CC, KC, CK, KK}. Assim, X pode assumir os valores 0, 1 ou 2, o que soluciona o exemplo. No entanto, para cálculos e modelagens mais complexas é importante com- preender que poderíamos passar a fazer referência aos eventos tendo em vista os valores que podem ser assumidos pelas variáveis aleatórias. Um caso poderia ser: seja o evento E 1 a obtenção de uma cara em dois lançamentos de uma moeda honesta. A probabilidade P(E 1 ), então, é equivalente a P(X = 1). Em outro caso, se for pedida a probabilidade do evento E 2 de obtenção de pelo menos uma cara, a mesma será P(E 2 ) = P(X ≥ 1). Nocoes_estatistica.indb 39 17/5/2010 16:09:45 40 Sé rie P ro va s e Co nc ur so s Noções de Estatística para Concursos — Anderson Meneses e Fabrício Mariano ELSEVIER Exemplo 2: Lança-se uma moeda honesta 3 vezes seguidas. Seja X a variável aleatória associada ao número de caras. Determine a probabilidade associada aos eventos (a) (X = 0), (b) (X = 1), (c) (X = 2), (d) (X = 3), (e) (X ≥ 2), (f) (X ≥ 0) e (g) (X ≥ 4). Solução: Para este caso, o espaço amostral é Ω = {CCC, CCK, CKC, CKK, KKK, KKC, KCK, KCC}, em que C representa cara e K representa coroa. (a) Nenhuma cara é obtida apenas no evento {KKK}. Então P(X = 0) = 1/8. (b) Exatamente uma cara é obtida nos eventos {CKK}, {KKC} e {KCK}. Então P(X = 1) = 3/8. (c) Exatamente duas caras são obtidas nos eventos {CCK}, {CKC} e {KCC}. En- tão P(X = 2) = 3/8. (d) Exatamente três caras são obtidas no evento {CCC}. Então P(X = 3) = 1/8. (e) Duas caras ou três caras são obtidas nos eventos {CCK}, {CKC}, {KCC} e {CCC}, ou seja, P(X ≥ 2) = 4 8 = 1 2 , ou então P(X ≥ 2) = P(X = 2) + P(X = 3) = 3 8 + 1 8 = 4 8 + 1 2 . (f) P(X ≥ 0) = P(X = 1) + P(X = 2) + P(X = 3) + P(X = 4) = 1 8 + 3 8 + 3 8 + 1 8 = 1. Ou seja, temos total certeza de que obteremos zero ou mais caras em três lançamentos da moeda. (g) De modo contrário ao caso da letra (f), temos certeza de que não será possí- vel a obtenção de quatro ou mais caras no lançamento de três moedas, logo (X ≥ 4) = 0. Variável Aleatória Discreta Uma variável aleatória discreta é aquela que somente pode assumir valores fi nitos e discretos. As variáveis aleatórias associadas à observação do número de caras em dois ou três lançamentos de uma moeda honesta (exemplos 1 e 2, su- pra) são variáveis aleatórias contínuas. Variável Aleatória Contínua Uma variável aleatória contínua é aquela que pode assumir um número infi ni- to de valores em um dado intervalo. Por exemplo, a variável aleatória associada à medição das alturas dos alunos de uma turma é uma variável aleatória contínua. Nocoes_estatistica.indb 40 17/5/2010 16:09:45 41 Série Provas e Concursos Capítulo 3 — Variáveis Aleatórias e Distribuições de ProbabilidadesCAMPUS 3.2. VARIÁVEIS ALEATÓRIAS DISCRETAS 3.2.1. Função de Distribuição de Probabilidades Acumuladas para Variáveis Aleatórias Discretas A Função de Distribuição de Probabilidades Acumulada ou somente Função de Distribuição de uma variável aleatória discreta X é defi nida por: F X (x) = P(X ≤ x), com – ∞ < x < ∞. Exemplo 1: Uma variável aleatória discreta X pode assumir os valores x con- forme a tabela a seguir, que também contém as respectivas probabilidades: x i P(X = x i ) 1 0,1 2 0,2 3 0,4 4 0,2 5 0,1 Determine FX(x). Solução: Pela defi nição, F X (x) = P(X ≤ x), e para solucionar a questão, podemos utilizar F X (x) = P(X ≤ x) = Σ i P(X ≤ x i ) , com x i ≤ x, como mostrado abaixo. Para x = 1, temos F X (1) = P(X ≤ 1) = P(X = 1) ⇒ F X (1) = 0,1. Para x = 2, temos F X (2) = P(X ≤ 2) = P(X = 1) + P(X = 2) ⇒ F X (2) = 0,1 + 0,2 = 0,3. Para x = 3, temos F X (3) = P(X ≤ 3) = P(X = 1) + P(X = 2) + P(X = 3) ⇒ F X (3) = 0,1 + 0,2 + 0,4 = 0,7. Para x = 4, temos F X (4) = P(X ≤ 4) = P(X = 1) + P(X = 2) + P(X = 3) + P(X = 4) ⇒ F X (4) = 0,1 + 0,2 + 0,4 + 0,2 = 0,9. Para x = 5, temos F X (5) = P(X ≤ 5) = P(X = 1) + P(X = 2) + P(X = 3) + P(X = 4) + P(X = 5) ⇒ F X (5) = 0,1 + 0,2 + 0,4 + 0,2 + 0,1 = 1,0. Os valores de F X (x) para valores não inteiros de x deverão ter o mesmo valor que o referente ao valor inteiro de x mais próximo à esquerda, o que resulta na função de distribuição ⎪ ⎪ ⎪ ⎪ ⎩ ⎪⎪ ⎪ ⎪ ⎨ ⎧ ≥ <≤ <≤ <≤ <≤ < = 5,0,1 54,9,0 43,7,0 32,3,0 21,1,0 1,0 )( xse xse xse xse xse xse xFX . Nocoes_estatistica.indb 41 17/5/2010 16:09:45 42 Sé rie P ro va s e Co nc ur so s Noções de Estatística para Concursos — Anderson Meneses e Fabrício Mariano ELSEVIER Exemplo 2: Para uma variável aleatória discreta X obteve-se a seguinte função de distribuição de probabilidades acumulada: ⎪ ⎪ ⎪ ⎪ ⎩ ⎪⎪ ⎪ ⎪ ⎨ ⎧ ≥ <≤ <≤ <≤ <≤ < = 4,0,1 43,8,0 32,5,0 21,3,0 10,1,0 0,0 )( xse xse xse xse xse xse xFX . Pede-se: (a) Calcule a probabilidade para (X ≤ 2). (b) Calcule a probabilidade para (X < 4). (c) Calcule a probabilidade para (X > 3). (d) Calcule a probabilidade para (X = 3). Solução: (a) Temos que P(X ≤ 2) = F X (2) = 0,5. (b) Se estivesse sendo pedido P(X ≤ 4), então teríamos P(X ≤ 4) = 1,0, pois F X (4) = 1,0. Mas, em vez disso, estamos determinando P(X < 4) e devemos procurar o valor da função de distribuição referente ao inteiro mais próximo à esquerda de x = 4, que é x = 3. Ou seja, P(X < 4) = F X (3) = 0,8. (c) A probabilidade P(X ≤ 3) = F X (3) = 0,8. Como procura-se P(X < 3), podemos calcular P(X < 3) = 1 – 0,8 = 0,2. (d) Como mencionado anteriormente, P(X ≤ 3) = F X (3) = 0,8. Mas para P(X < 3) temos P(X < 3) = F X (2) = 0,5 (pois 2 é o maior inteiro à esquerda de 3). Para determinarmos exatamente P(X = 3), devemos calcular P(X =3) = P(X ≤ 3) – P(X < 3) ⇒ P(X = 3) = 0,8 – 0,5 = 0,3. 3.2.2. Função de Massa de Probabilidade para Variáveis Aleatórias Discretas Os “saltos” (descontinuidades) existentes nas funções de distribuição corres- pondem a variações para valores específi cos das variáveis aleatórias discretas. Como no item (d) do exemplo anterior, ao determinarmos especifi camente um valor de probabilidade para uma variável X (no item d do exemplo 2, dado na subseção 3.2.1, para P(X = 3)), na verdade calculamos a subtração entre dois valores de F x (x) para dois valores de x consecutivos x i – 1 e x i , ou seja, F X (x i ) – F X (x i – 1 ) = P(X ≤ x i ) – P(X ≤ x i – 1 ) = P(X = x i ) Nocoes_estatistica.indb 42 17/5/2010 16:09:45 43 Série Provas e Concursos Capítulo 3 — Variáveis Aleatórias e Distribuições de ProbabilidadesCAMPUS A função de massa de probabilidade p X (x i ) denota p X (x i ) = P(X = x i ). No exem- plo 1 do item 3.2.1, a tabela dada representa os valores de uma função de massa de probabilidade para uma variável aleatória discreta. 3.3. VARIÁVEIS ALEATÓRIAS CONTÍNUAS 3.3.1. Função Densidade de Probabilidade para Variáveis Aleatórias Contínuas Também chamada de função de probabilidade, a função de densidade de probabi- lidade se refere a variáveis aleatórias contínuas. Geralmente denotada por f X (X), seu gráfi co será uma curva suave e a área sob a curva será equivalente a 1. Além disso, dx xdFXf XX )()( = . Com a função de densidade de probabilidade, pode-se calcular a probabili- dade de que a variável aleatória contínua X assuma valores entre a e b por meio da integral )()()()( aFbFdxxfbXaP XX b a X −==<< ∫ . Além disto, pode-se afi rmar que: P(a < X < b) = P(a < X ≤ b) = P(a ≤ X < b) = P(a ≤ X ≤ b), pois vale lembrar que para uma variável aleatória contínua P(X = x) = 0, em- bora não se trate do evento ∅. Para variáveis aleatórias contínuas em geral esta- remos interessados em calcular a probabilidade para intervalos de X, e não para valores específi cos, como já foi feito para variáveis aleatórias discretas. 3.4. MÉDIA, MOMENTO E VARIÂNCIA PARA VARIÁVEIS ALEATÓRIAS 3.4.1. Média Cálculo da Média para Variáveis Aleatórias Discretas ∑== k kXkX xpxXE )()(μ Cálculo da Média para Variáveis Aleatórias Contínuas ∫ ∞ ∞− == dxxfxXE XX )()(μ Nocoes_estatistica.indb 43 17/5/2010 16:09:46 44 Sé rie P ro va s e Co nc ur so s Noções de Estatística para Concursos — Anderson Meneses e Fabrício Mariano ELSEVIER 3.4.2. Momento Cálculo do Momento para Variáveis Aleatórias Discretas ∑= k kX n k n xpxXE )()( Cálculo do Momento para Variáveis Aleatórias Contínuas ∫ ∞ ∞− = dxxfxXE X nn )()( 3.4.3. Variância A variância pode ser calculada como [ ]{ }22 )(][ XEXEXVARX −==σ , o que resulta nas fórmulas a seguir para os casos discreto e contínuo. Cálculo da Variância para Variáveis Aleatórias Discretas ∑ −= k kXkkX xpx )()( 22 μσ Cálculo da Variância para Variáveis Aleatórias Contínuas ∫ ∞ ∞− −= dxxfx XXX )()( 22 μσ 3.5. QUESTÕES RESOLVIDAS 1. (Esaf/Prefeitura de Recife – Auditor do Tesouro/2003) Para uma amostra de tamanho 100 de um atributo discreto X, obteve-se a função de distri- buição empírica seguinte: Assinale a opção que corresponde à frequência de observações de X iguais a 3. a) 55; b) 35; c) 20; d) 30; e) 85. ⎪ ⎪ ⎪ ⎪ ⎩ ⎪⎪ ⎪ ⎪ ⎨ ⎧ ≥ <≤ <≤ <≤ <≤ < = 51 5485,0 4355,0 3235,0 2115,0 10 )( xse xse xse xse xse xse xF Nocoes_estatistica.indb 44 17/5/2010 16:09:48 45 Série Provas e Concursos Capítulo 3 — Variáveis Aleatórias e Distribuições de ProbabilidadesCAMPUS Solução: A probabilidade que está sendo pedida é P(X = 3), que é dada por: P(X = 3) = P(X ≤ 3) – P(X ≤ 2) = F X (3) – F X (2) ⇒ P(X = 3) = 0,55 – 0,35 ⇒ P(X = 3) = 0,20. Gabarito: letra C. 2. (FCC/Bacen – Analista/2005) Uma variável aleatória contínua X tem a se- guinte função densidade de probabilidade: Sendo K uma constante, seu valor é igual a: a) 5 24 ; d) 3 4 ; b) 7 30 ; e) 1. c) 2 3 ; Solução: A integração de uma função de densidade de probabilidade de uma variável aleatória contínua no intervalo (-∞, +∞) tem como resultado a unidade, ou seja, ∫ +∞ ∞− =1)( dxxf . E neste caso, como a função é nula para x < 0 e para x > 3, podemos escrever: ∫ =⎟⎠ ⎞⎜ ⎝ ⎛ + 3 0 1 12 dxKx . Integrando na variável x, obtemos: 1 24 3 0 2 =⎥ ⎦ ⎤ ⎢ ⎣ ⎡ + Kxx . E resolvendo a equação supra com os limites de integração, temos: 10. 24 03. 24 3 0 22 = ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ ⎟⎟⎠ ⎞ ⎜⎜⎝ ⎛ +−⎟⎟⎠ ⎞ ⎜⎜⎝ ⎛ + ����� KK , o que resulta em: 24 513. 24 32 =⇒=+ KK . Gabarito: letra A. ⎪ ⎩ ⎪ ⎨ ⎧ > ≤≤+ < = 30 30 12 00 )( xse xseK x xse xf Nocoes_estatistica.indb 45 17/5/2010 16:09:49 46 Sé rie P ro va s e Co nc ur so s Noções de Estatística para Concursos — Anderson Meneses e Fabrício Mariano ELSEVIER 3. (FCC/MPE-PE – Analista Ministerial/2006) A função de densidade de pro- babilidade do tempo, em segundos, requerido para completar uma opera- ção de montagem é: Sabendo que a segundos é o tempo que é precedido por 25% das monta- gens, o valor de a é: a) 20; b) 18,5; c) 17,8; d) 17,2; e) 16. Solução: Sabe-se que a probabilidade para determinado intervalo [a, b] será obtida por meio da integração da função de densidade de probabilidade com relação à variável em questão. Dessa forma, ∫=≤≤ 2 1 )()( 21 x x X dx.xfxXxP Note que, para este caso, os limites de integração serão x 1 (que será substituí- do por 10) e x 2 (que será substituído por a). Assim, a função de probabilidade dependerá de a, que poderia ser qualquer para 10 < x < 50. Ao fazermos a inte- gração, ainda sem aplicarmos os limites x0 e x 1 , obtemos: 1 0 40 1)( 21 x x xxXxP ⎥⎦ ⎤ ⎢⎣ ⎡=≤≤ . (Como exercício, verifi que que: (1) a substituição de x 1 = 10 e x 2 = 10 dá zero, ou seja, neste intervalo nulo, a probabilidade é de que 0% das montagens seja realizada; (2) a substituição de x 1 = 10 e x 2 = 50 dá a unidade, o que signifi ca que, neste intervalo de tempo, a probabilidade é de que 100% das montagens sejam realizadas.) Então, para determinarmos o tempo a que será precedido por 25% das mon- tagens basta substituirmos x 1 = 10, x 2 = a e igualarmos a 25%. Assim, %25 40 1 10 =⎥⎦ ⎤ ⎢⎣ ⎡ a x . E desta forma, 100 2510 40 1 40 1 =⎥⎦ ⎤ ⎢⎣ ⎡ −a . Isolando-se a, obtemos a = 20. Gabarito: letra A. ⎪⎩ ⎪ ⎨ ⎧ <<= caso contrário xsexf ,0 5010, 40 1 )( Nocoes_estatistica.indb 46 17/5/2010 16:09:51 47 Série Provas e Concursos Capítulo 3 — Variáveis Aleatórias e Distribuições de ProbabilidadesCAMPUS 4. (FCC/Bacen – Analista/2005) O número de televisores modelo M vendidos diariamente numa loja é uma variável aleatória discreta (X) com a seguin- te distribuição de probabilidades: X 0 1 2 3 P(X) p 1,5p 1,5p p O preço unitário de venda do televisor modelo M é R$ 1.000,00. Se num determinado dia a receita de vendas referente a este modelo for inferior a R$ 3.000,00, a probabilidade de ela ser positiva é: a) 20%; d) 60%; b) 30%; e) 75%. c) 50%; Solução: Trata-se de um problema de probabilidade condicional, em cuja solução será usado o Teorema de Bayes (ver Capítulo 3). O que está sendo pedido é a probabilidade de a receita ser positiva, dado que a receita foi menor do que R$ 3.000,00. Isto colocado em termos de unidades de televisores vendidos (variável aleatória X) signifi ca que o que está sendo pedido é a probabilidade de que X seja maior do que zero (receita positiva) dado que X é menor que 3 (receita menor que R$ 3.000,00), ou seja, pede-se P(X > 0 | X < 3). E pelo Teorema de Bayes: )3( )3()0()3|0( < <∩>=<> XP XPXPXXP . Devemos então calcular as probabilidades P(X > 0) ∩ P(X < 3) e P(X < 3). No entanto, os valores de probabilidade dados na tabela encontram-se em função de p, e, para resolver o problema, devemos determinar o seu valor. Sabe-se que a soma das probabilidades P(X i ) da tabela deve totalizar uma unidade, ou seja, ∑ =
Compartilhar