Prévia do material em texto
NOÇÕES DE PROBABILIDADE E ESTATÍSTICA NOÇÕES DE ESTATÍSTICA 1. O QUE É ESTATÍSTICA? Durante um telejornal, o repórter divulgou uma pesquisa segundo a qual apenas 5% dos brasileiros têm o hábito de ler jornal diariamente. Você já pensou em como são feitas pesquisas como essa? Como é possível entrevistar toda a população brasileira para se saber a porcentagem de leitores de jornal? O uso da pesquisa é bastante comum nas várias atividades humanas. Exemplos: 1°) As indústrias costumam realizar pesquisas entre os consumidores antes do lançamento de um novo produto no mercado. 2°) As pesquisas eleitorais fornecem elementos para que os candidatos direcionem a campanha. 3°) A pesquisa do desempenho dos atletas ou das equipes em uma partida ou em um campeonato interfere no planejamento dos treinamentos. 4°) Emissoras de tevê utilizam pesquisas que mostram a preferência dos espectadores para organizar sua programação. A realização de uma pesquisa envolve muitas etapas, como a escolha da amostra, a coleta e organização dos dados (informações), o resumo desses dados (em tabelas, gráficos, etc.) e a interpretação dos resultados. A parte da Matemática que trata desses assuntos é a ESTATÍSTICA. Como uma primeira idéia, podemos entender a estatística como sendo um método de estudo de comportamentos coletivos cujas conclusões são traduzidas em resultados numéricos. 2. POPULAÇÃO A Estatística parte da observação de grupos, geralmente numerosos, aos quais damos o nome de população ou universo estatístico. Cada elemento da população estudada é denominado unidade estatística. Veja: POPULAÇÃO ESTATÍSTICA UNIDADE ESTATÍSTICA 48 alunos que estudam na 5ª série de uma escola Cada aluno que estuda na 5ª série dessa escola Clubes campeões paulistas de futebol Cada clube campeão paulista de futebol 3. AMOSTRA A população estatística pode ser finita ou infinita. • Finita: quando apresenta um número finito de elementos. Por exemplo: – Um número de operários que trabalham em uma fábrica em uma determinada data. – As notas de Matemática dos alunos do ensino médio em um determinado bimestre. • Infinita: quando apresenta um número infinito de elementos. Por exemplo: – as temperaturas nos diversos pontos do Brasil em determinado momento. Quando o universo estatístico é infinito, não é possível fazer uma observação que abranja todos os seus elementos. Nesse caso, recorre-se a um subconjunto do universo estudado que chamamos de amostra. Mesmo quando o universo é finito, há razões que nos levam à utilização da técnica de amostragem, tais como: - razões econômicas, por ser dispendioso observar grande número de elementos; - razões de tempo, pois uma observação demorada pode levar a resultados desatualizados. 4. VARIÁVEL A observação da população é dirigida ao estudo de uma dada propriedade ou característica dos elementos dessa população. Essa característica pode ser: • Qualitativa: se os valores tomados não são numéricos, como: raça, área de estudos, meio de transporte etc. • Quantitativa: se os valores tomados são numéricos, como a altura, o peso, o preço de um produto etc. Uma característica quantitativa também se chama variável estatística ou simplesmente variável. Cada valor que essa variável pode assumir chama-se dado estatístico. As variáveis estatísticas podem ser: – Contínuas: quando podem assumir qualquer valor do intervalo da variação. Por exemplo, na determinação das alturas dos adolescentes de uma escola, a variável "altura" é contínua. – Discretas: quando só podem assumir valores inteiros. Por exemplo, na determinação do número de sócios de um certo clube, a variável "número de sócios" é discreta. 5. ROL É toda sequência (a1; a2; a3; ...; a4,) de dados numéricos tal que: 1 • cada termo, a partir do segundo, é maior ou igual ao seu antecessor; • ou cada termo, a partir do segundo, é menor ou igual ao seu antecessor. Exemplo: os cinco alunos de uma amostra apresentaram as seguintes notas na prova bimestral de matemática 6; 4; 8; 7; 8. Apresentando esses dados em rol, temos: (4; 6; 7; 8; 8) ou (8; 8; 7; 6; 4). 6. CLASSES Em uma mostra de latas de óleo comestível, foram constatados os seguintes volumes em mililitros: 980; 990; 1.000; 970; 980; 1.000; 1.010; 950; 970; 940; 1.020; 1.010; 920; 990; 950; 900; 1.000; 950; 970; 1.010. Podemos separar os elementos dessa amostra em róis disjuntos (sem elementos comuns). Por exemplo: I. 900;920 II. 940 III. 950; 950; 950 IV. 970; 970; 970; 980; 980 V. 990; 990; 1.000; 1.000; 1.000 VI. 1.010; 1.010; 1.010; 1.020 Qualquer intervalo real que contenha um rol da amostra é chamado de classe. Por exemplo, podemos formar as seguintes classes com os elementos dessa amostra: • o intervalo [900, 940[ contém o rol (I); • o intervalo [940, 950[ contém o rol (II); • o intervalo [950, 970[ contém o rol (III); • o intervalo [970, 990[ contém o rol (IV); • o intervalo [990, 1.010[ contém o rol (V); • o intervalo [1.010, 1.020] contém o rol (VI). A diferença entre o maior e o menor elemento de uma classe, nessa ordem, é chamada de amplitude da classe. Por exemplo: A amplitude da classe [900, 940[ é 940 – 900 = 40. ► NOTAS 1. Os extremos de cada classe não precisam ser, necessariamente, elementos da amostra, mas se o forem, deve-se tomar o cuidado de não permitir que um mesmo elemento pertença a duas classes simultaneamente; por isso, no exemplo anterior, com exceção do último intervalo, consideramos os demais abertos à direita. 2. Embora não seja obrigatório, é conveniente que, dentre duas classes consecutivas, o extremo à direita (aberto) da primeira coincida com o extremo à esquerda (fechado) da segunda, como fizemos no exemplo ar tenor. 7. DISTRIBUIÇÃO DE FREQUÊNCIA A quantidade de elementos da amostra que pertencem a uma determinada classe é chamada de frequência dessa classe. No exemplo anterior: • a frequência da classe [900, 940[ é igual a 2, pois 2 elementos da amostra pertencem a essa classe; • a frequência da classe [940, 950[ é igual a 1, pois apenas 1 elemento da amostra pertence a essa classe; • analogamente, as classes [950, 970[; [970, 990[; [990, 1.010[ e [1.010, 1.020] têm frequências, respectivamente, iguais a 3, 5, 5 e 4. Podemos apresentar as classes com suas respectivas frequências através de uma tabela chamada de tabela de distribuição de frequência: Classe (volume em mililitros) F [900, 940[ 2 [940, 950[ 1 [950, 970[ 3 [970, 990[ 5 [990, 1.010[ 5 [1.010, 1.020] 4 A soma de todas as frequências, 2+1+3+5+5+4=20, é chamada de frequência total (Ft) da distribuição. Dividindo a frequência F de uma classe pela frequência total Ft, obtemos um número chamado de frequência relativa da classe. É usual apresentar-se a frequência relativa em porcentagem. Indicando a frequência relativa de uma classe por F%, tem-se que: %100 F F %F Assim, da tabela anterior, temos que: • a classe [900, 940[ tem frequência relativa igual a %10%1001,0%100 20 2 • a classe [940, 950[ tem frequência relativa igual a %5%10005,0%100 20 1 • a classe [950, 970[ tem frequência relativa igual a %15%10015,0%100 20 3 • a classe [970, 990[ tem frequência relativa igual a %25%10025,0%100 20 5 • a classe [990, 1.010[ tem frequência relativa igual a %25%10025,0%100 20 5 • a classe [1.010, 1.020] tem frequência relativa igual a %20%10020,0%100 20 4 Assim, temos a tabela de distribuição de frequência e de frequência relativa: Classe (volume em mililitros) F F% [900, 940[ 2 10% [940, 950[ 1 5% [950, 970[ 3 15% [970, 990[ 5 25% [990, 1.010[ 5 25% [1.010, 1.020] 4 20% F1 = F =20 2 8. CLASSES UNITÁRIAS Podemos considerar uma classe como sendo um único número real. Esse tipo de classe é denominado classe unitária. Exemplo: Para avaliar o nível de ensino em uma região, escolheu-se uma amostra de trezentos alunosda primeira série do ensino médio e aplicou-se uma prova. A tabela de distribuição de frequência abaixo mostra o resultado dessa prova. As notas representam classe unitárias. Classe (nota) Freqüência (nº. de alunos) 2,0 40 3,0 85 5,0 75 6,0 50 7,0 30 8,0 20 9. REPRESENTAÇÃO GRÁFICA DA DISTRIBUIÇÃO DE FREQÜÊNCIAS Em muitos casos, uma representação gráfica de uma distribuição de frequências nos dá uma idéia melhor de um levantamento estatístico do que um quadro com números. Nesse item, estudaremos as representações gráficas mais usadas em Estatística. Gráfico de barras Os dados de uma tabela podem ser representados graficamente por retângulos paralelos, horizontais ou verticais, todos de mesma largura e comprimentos proporcionais às frequências. Esses gráficos, chamados gráficos de barras, permitem uma rápida exploração visual e uma comparação entre a variável em estudo e suas frequências. O gráfico de barras verticais é também chamado de gráfico de colunas. Gráfico de Setores O gráfico de setores é um círculo dividido em partes (setores), cujas medidas são proporcionais às frequências relativas, como nos dois exemplos a seguir: Gráfico poligonal ou de linha Traçado no plano cartesiano, esse tipo de gráfico é usado geralmente para identificar tendências de aumento ou diminuição de valores numéricos de uma variável: índices de audiência de programas de televisão, lucros de empresas, desempenho de atletas etc. O gráfico poligonal é chamado também de gráfico de linha. 10. ANÁLISE E INTERPRETAÇÃO DE GRÁFICOS Observe o gráfico abaixo sobre abate de animais. Vamos responder às seguintes perguntas: 3 ► Qual a porcentagem de animais abatidos de cada espécie? ► Supondo que a produção de carne bovina foi obtida de 20 mil animais, qual a quantidade de aves abatidas? O gráfico ilustra a porcentagem de abate em 3 espécies de animais em um frigorífico. Projetando cada barra no eixo horizontal lemos que foram abatidos 48% de suínos, 36% de aves e 16% de bovinos. Para sabermos a quantidade de aves abatidas, temos: 20000 16% x(aves) 36% 45000x 16 3620000 x Portanto, foram abatidas 45 mil aves. Veja, agora, outra situação: Foi feita uma pesquisa com os 1200 alunos de uma escola sobre as atividades esportivas que gostariam de praticar. O resultado foi o seguinte: ATIVIDADE ESPORTIVA N° DE ALUNOS vôlei 600 basquete 180 futebol 120 natação 60 outras 240 Vamos construir o gráfico de setores correspondente a essa tabela. Lembrando que uma circunferência tem 360°, podemos calcular, usando uma regra de três simples e direta, o ângulo central correspondente a cada uma das atividades escolhidas pelos alunos. Veja: ► VÔLEI 1200 360° 600 V 180V 1200 360600 V ► BASQUETE 1200 360° 180 B 54B 1200 360180 B ► FUTEBOL 1200 360° 120 F 36x 1200 360120 F ► NATAÇÃO 1200 360° 60 N 18x 1200 36060 x ► OUTRAS ATIVIDADES 1200 360° 240 O 72x 1200 360240 x Uma vez calculados os ângulos de cada setor, basta demarcar as áreas no círculo, usando o transferidor. Assim: Como as áreas de cada setor devem ser proporcionais às frequências relativas percentuais, é comum, nesse tipo de gráfico, as porcentagens virem expressas dentro dos setores. Veja a tabela abaixo. ATIVIDADE ESPORTIVA N° DE ALUNOS (fi) fr fr(%) vôlei 600 0,50 50 basquete 180 0,15 15 futebol 120 0,10 10 natação 60 0,05 5 outras 240 0,20 20 9. HISTOGRAMA O histograma é um gráfico utilizado para representar uma distribuição de frequência em que as classes não são unitárias. Veja, a seguir como esse gráfico é construído. 1º. Separam-se os elementos da amostra em classes de mesma amplitude e representam-se essas classes no eixo das abscissas: 4 Classe Freqüência [x1, x2[ F1 [x2, x3[ F2 [x3, x4[ F3 [xn-1, xn] Fn 2°. Constroem-se retângulos cujas bases coincidem com as classes; a altura de cada retângulo representa a frequência da classe correspondente. ► NOTA: Podem-se construir histogramas com classes de amplitudes diferentes, porém, a altura de cada retângulo não representará a frequência da classe. Por isso, é mais usual adotar uma mesma amplitude para as classes. Exemplo: Os alunos de uma amostra apresentaram as seguintes estaturas, em centímetros: 165 170 165 177 169 180 162 171 178 173 164 172 181 166 168 170 Vamos separar os elementos da amostra em quatro classes de mesma amplitude: Classe (estatura em cm) Freqüência [161,5; 166,5[ 4 [165,5; 171,5[ 6 [171,5; 176,5[ 2 [176,5; 181,5] 4 ► NOTA: Lembre-se que os extremos de classe não precisam ser, necessariamente, elementos da amostra. Começamos da medida 161,5 cm, mas poderíamos ter começado de outra medida, por exemplo, 161,8 cm ou de 162 cm, que é o menor elemento da amostra. Se você optar por começar de valores não pertencentes à amostra, procure sempre começar de um valor a menos de uma unidade do menor elemento da amostra. O histograma correspondente a essa distribuição é: EXERCÍCIOS RESOLVIDOS 01 (BB – Fundação Carlos Chagas). O supervisor de uma agência bancária obteve dois gráficos que mostravam o número de atendimentos realizados por funcionários. O Gráfico I mostra o número de atendimentos realizados pelos funcionários A e B, durante 2 horas e meia, e o Gráfico II mostra o número de atendimentos realizados pelos funcionários C, D e E, durante 3 horas e meia. Observando os dois gráficos, o supervisor desses funcionários calculou o número de atendimentos, por hora, que cada um deles executou. O número de atendimentos, por hora, que o funcionário B realizou a mais que o funcionário C é: (A) 4. (B) 3. (C) 10. (D) 5. (E) 6. Resolução Funcionário B: 25 atendimentos / 2,5 horas = 10 clientes por hora Funcionário C: 21 atendimentos / 3,5 horas = 6 clientes por hora Diferença: 10 – 6 = 4 Resposta: A 02. ( Cesgranrio). Os gráficos abaixo apresentam dados sobre a produção e a reciclagem de lixo em algumas regiões do planeta. B aseando-se nos dados apresentados, qual é, em milhões de toneladas, a diferença entre as quantidades de lixo recicladas na China e nos EUA em um ano? (A) 9,08 (B) 10,92 (C) 12,60 (D) 21,68 (E) 24,80 0 x1 x2 x3 x4 | xn ... Classe F F2 F1 F3 ... 0 161,5 166,5 171,5 176,5 181,5 Classe F 8 4 2 5 https://cdn-0.sabermatematica.com.br/wp-content/uploads/2013/03/prova-resolvida-bb-2013-questao-21.jpg https://cdn-0.sabermatematica.com.br/wp-content/uploads/2013/03/prova-resolvida-bb-2012-2.jpg Resolução: A China produz 300 milhões e recicla 30%, ou seja, recicla 90 milhões. Os EUA produzem 238 milhões e recicla 34%, ou seja, reciclam 80,92 milhões. China – EUA = 90 – 80,92 = 9,08 milhões de toneladas. Resposta: A 03. (FCC) O gráfico mostra o número de pontos de uma equipe de futebol nas 12 primeiras rodadas de um campeonato. Sabendo que, nesse campeonato, em caso de vitória a equipe soma três pontos, em caso de empate soma um ponto e em caso de derrota não soma ponto, assinale a alternativa correta. a) A equipe perdeu os jogos da segunda, terceira e quarta rodadas. b) Nas doze rodadas, o número de vitórias foi igual ao número de derrotas. c) A média de pontos obtidos por rodada, nessas doze rodadas, é igual a 1,5 pontos. d) A equipe conseguiu dois empates entre a sétima e a nona rodadas. e) Nas doze rodadas, a equipe empatou três vezes. Solução: a) Incorreta! Na segunda rodada, a equipe venceu o jogo, subindo seu ranking para 4 pontos. b) Correta! c) Incorreto! A média dos pontos obtidos por rodada é a soma de todos os pontos obtidos, dividida pelo número de rodadas jogadas. Pela tabela, o time alcançou 17 pontos em 12 rodadas: 17/12 = 1,42 aproximadamente. d) Incorreta! A equipe venceu o jogo da sétima rodada e perdeu os jogos da oitava e nona. e) Incorreta! A equipe empatou em duas rodadas: primeira e décima.Alternativa B 04.( Cesgranrio) Para construir um gráfico de setores, representando alguma estatística a respeito de sua turma, um estudante fez a divisão ilustrada na imagem e colocou nele um número referente a um dos setores do gráfico. A respeito dessa construção, assinale a alternativa correta. a) O maior ângulo central nesse gráfico mede 150°. b) O número total de alunos nessa turma é 62. c) O menor setor do gráfico está relacionado a 9 alunos. d) Não é possível garantir que os setores são proporcionais aos números que representam. e) O maior setor desse gráfico representa 20 alunos. Solução: Observe que as medidas do lado direito desse gráfico são ambas com 90°, totalizando 180°. Para os dois outros ângulos, sobram apenas 180°. Como 30° é a medida do ângulo do menor setor, então 150° é a medida do ângulo do maior setor. Portanto, a alternativa correta é a letra A. Para mostrar que as outras alternativas estão erradas, basta usar regra de três e descobrir os valores específicos de cada parte do gráfico. Alternativa A EXERCÍCIOS PROPOSTOS 01. Um estudo sobre o problema do desemprego na Grande São Paulo, no período 1985-1996, realizado pelo SEADE-DIEESE, apresentou o seguinte gráfico sobre taxa de desemprego. MÉDIAS ANUAIS DA TAXA DE DESEMPREGO TOTAL GRANDE SÃO PAULO 1985-1996 Fonte: SEP, Convênio SEADE-DIEESE Pela análise do gráfico, é correto afirmar que, no período considerado: a) a maior taxa de desemprego foi de 14%. b) a taxa de desemprego no ano de 1995 foi a menor do período. c) a partir de 1992, a taxa de desemprego foi decrescente. d) no período 1985-1996, a taxa de desemprego esteve entre 8% e 16%. e) a taxa de desemprego foi crescente no período compreendido entre 1988 e 1991. 02. (Enem) Uma pesquisa de opinião foi realizada para avaliar os níveis de audiência de alguns canais de televisão, entre 20h e 21h, durante uma determinada noite. Os resultados obtidos estão representados no gráfico de barras a seguir: 6 https://exercicios.brasilescola.uol.com.br/exercicios-matematica/exercicios-sobre-os-graficos.htm I. O número de residências atingidas nessa pesquisa foi, aproximadamente, de: a)100 b) 135 c)150 d)200 e)220 II. A percentagem de entrevistados que declararam estar assistindo à TvB é aproximadamente igual a: a)15% b) 20% c)22% d)27% e)30% 03. O gráfico de setores representado a seguir mostra a distribuição de uma amostra de alunos e suas respectivas notas na prova de português. Sabendo que a amostra é composta de sessenta alunos, responda: a) Quantos alunos tiveram nota 3? b) Quantos alunos tiveram nota 5? c) Qual a frequência relativa da classe "nota 6"? 04. O gráfico mostra a distribuição de uma amostra de garrafas de refrigerantes e seus respectivos volumes em mililitros: a) Quantas garrafas compõem essa amostra? b) Qual a freqüência relativa da classe "300 ml"? 05. (CEF) O gráfico mostra as vendas de televisores em uma loja: Pode-se afirmar que: a) as vendas aumentaram mês a mês. b) foram vendidos 100 televisores até junho. c) as vendas do mês de maio foram inferiores à soma das vendas de janeiro e fevereiro. d) foram vendidos 90 televisores até abril. e) se cada televisor é vendido por R$ 240,00, em maio a loja faturou, com as vendas desse produto, R$ 7.200,00. 06. (Enem) Para convencer a população local da ineficiência da Companhia Telefônica Vilatel na expansão da oferta de linhas, um político publicou no jornal local o gráfico I, abaixo representado. A Companhia Vilatel respondeu publicando dias depois o gráfico II, onde pretende justificar um grande aumento na oferta de linhas. O fato é que, no período considerado, foram instaladas, efetivamente, 200 novas linhas telefônicas. Gráfico I Gráfico II Analisando os gráficos, pode-se concluir que: a) o gráfico II representa um crescimento real maior do que o do gráfico I. b) o gráfico I apresenta o crescimento real, sendo o II incorreto. c) o gráfico II apresenta o crescimento real, sendo o gráfico I incorreto. d) a aparente diferença de crescimento nos dois gráficos decorre da escolha das diferentes escalas. e) os dois gráficos são incomparáveis, pois usam escalas diferentes. 07. (Cesgranrio) O gráfico representa, em milhares de toneladas, a produção no estado de São Paulo de um 42º 48º 30º 30º 90º 120º Nota 5 Nota 2 Nota 8 Nota 3 Nota 6 Nota 4 7 determinado produto agrícola entre os anos de 1990 a 1998. Analisando o gráfico, observa-se que a produção: a) foi crescente entre 1992 e 1995. b) teve média de 40 mil toneladas ao ano. c) em 1993 teve acréscimo de 30% em relação ao ano anterior. d) a partir de 1995 foi decrescente. e) teve média de 50 mil toneladas ao ano. 08. (FCC) O gráfico a seguir representa o resultado de uma pesquisa feita em um município, no mês de junho de 2001, a fim de analisar a redução do consumo de energia em residências, tendo em vista a meta fixada pelo governo, e com base na seguinte pergunta: "Qual a redução conseguida em relação à meta"? A partir dessa informação e sabendo que o percentual para cada resposta é proporcional à área do setor que o representa, o ângulo do setor correspondente à resposta "Menor" é igual a: a) 108,3° b) 118,8° c) 142° d)151,2° e) 160° GABARITO 01 D 02 I – D; II – A 03 a) 7; b) 20; c) 25% 04 a) 700; b) 57,14% 05 D 06 D 07 E 08 D MEDIDAS ESTATÍSTICAS 1. INTRODUÇÃO Dividindo a renda nacional anual de um país pelo número de habitantes, obtém-se a renda per capita, isto é, a renda por pessoa. Supondo que a renda per capita de um país é de 5.000 dólares, pode-se concluir que a distribuição de renda nesse país é equitativa? É claro que não, pois pode-se ter, por exemplo, metade da população não ganhando nada, e cada cidadão da outra metade ganhando 10.000 dólares; a renda per capita continuaria sendo 5.000 dólares. Esse exemplo ajuda a entender que é necessário mais de um parâmetro para avaliar a distribuição dos valores de uma amostra de números. Vamos estudar alguns desses parâmetros, denominados medidas estatísticas. 2. MEDIDAS DE POSIÇÃO 2.1. Mínimo e Máximo Um conjunto de dados quantitativos possui muitos recursos. Um dos objetivos das estatísticas é descrever esses recursos com valores significativos e fornecer um resumo dos dados sem listar todos os valores do conjunto de dados. Algumas dessas estatísticas são bastante básicas e quase parecem triviais. O máximo e o mínimo fornecem bons exemplos do tipo de estatística descritiva que é fácil de marginalizar. Apesar de esses dois números serem extremamente fáceis de determinar, eles aparecem no cálculo de outras estatísticas descritivas. Como vimos, as definições de ambas as estatísticas são muito intuitivas. O mínimo Começamos examinando mais de perto as estatísticas conhecidas como o mínimo. Este número é o valor dos dados que é menor ou igual a todos os outros valores em nosso conjunto de dados. Se tivéssemos que ordenar todos os nossos dados em ordem crescente, o mínimo seria o primeiro número em nossa lista. Embora o valor mínimo possa ser repetido em nosso conjunto de dados, por definição, este é um número único. Não pode haver dois mínimos porque um desses valores deve ser menor que o outro. O máximo Agora voltamos ao máximo. Este número é o valor dos dados que é maior ou igual a todos os outros valores em nosso conjunto de dados. Se ordenássemos todos os nossos dados em ordem crescente, o máximo seria o último número listado. O máximo é um número exclusivo para um determinado conjunto de dados. Esse número pode ser repetido, mas há apenas um máximo para um conjunto de dados. Não pode haver dois máximos porque um desses valores seria maior que o outro. Exemplo A seguir está um exemplo de conjunto de dados: 23, 2, 4, 10, 19, 15, 21, 41, 3, 24, 1, 20, 19, 15, 22, 11, 4 Ordenamos os valores em ordem crescente e vemos que 1 é o menor da lista. Isso significa que 1 é o mínimo do conjunto de dados.Também vemos que 41 é maior do que todos os outros valores da lista. Isso significa que 41 é o máximo do conjunto de dados 8 2.2. Média Aritmética ( x ) Os conteúdos de 4 baldes de água são: 3l, 5l, 2l e 1l. Se toda essa água fosse distribuída igualmente entre esses baldes, com quantos litros de água ficaria cada um? A quantidade de água de cada um seria razão da quantidade total de água para o número de baldes, isto é: 75,2 4 1253 O resultado 2,75l é chamado de média aritmética dos valores 3l, 5l, 2l e 1l. Podemos entender a média aritmética de duas ou mais quantidades como sendo o valor que cada uma delas teria se, mantendo-se a soma delas, todas fossem iguais. A média aritmética dos números x1, x2, x3, ..., xn, que se indica por x , é dada por: n xxxx x n321 ou, usando o símbolo de somatório: n x x n 1i i 2.3. Média aritmética ponderada Cinco baldes contêm 4 litros de água cada um, três outros contêm 2l de água cada um, e, ainda, dois outros contêm 5l de água cada um. Se toda essa água fosse distribuída igualmente entre esses baldes, com quantos litros ficaria cada um? A quantidade de água de cada balde seria a razão da quantidade total de água para o número de baldes, isto é: 6,3 10 253254 O resultado 3,6l é chamado de média aritmética ponderada dos valores 4l, 2l e 5l, com pesos (fatores de ponderação) 5, 3 e 2, respectivamente. A média aritmética ponderada dos números x1, x2, x3, ... , xn, com pesos, p1, p2, p3, ..., pn, respectivamente, é o número x tal que: n321 nn332211 pppp pxpxpxpx x ou, usando o símbolo de somatório; n 1i i n 1i ii p px x Consideremos a distribuição relativa a 34 famílias de quatro filhos, tomando para variável o número de filhos do sexo masculino. Calcularemos a quantidade média de meninos por família: Nº de meninos freqüência = fi 0 2 1 6 2 10 3 12 4 4 total 34 Como as frequências são números indicadores da intensidade de cada valor da variável, elas funcionam como fatores de ponderação, o que nos leva a calcular a média aritmética ponderada. ..xi. ..fi. ..xi.fi . 0 2 0 1 6 6 2 10 20 3 12 36 4 4 16 total 34 78 onde 78 / 34 = 2,3 meninos por família 2.4. Moda ( Mo) É o valor que ocorre com maior frequência em uma série de valores. Desse modo, o salário modal dos empregados de uma fábrica é o salário mais comum, isto é, o salário recebido pelo maior número de empregados dessa fábrica. A Moda quando os dados não estão agrupados A moda é facilmente reconhecida: basta, de acordo com definição, procurar o valor que mais se repete. Ex: Na série { 7 , 8 , 9 , 10 , 10 , 10 , 11 , 12 } a moda é igual a 10. Há séries nas quais não exista valor modal, isto é, nas quais nenhum valor apareça mais vezes que outros. Ex: { 3 , 5 , 8 , 10 , 12 } não apresenta moda. A série é amodal. Em outros casos, pode haver dois ou mais valores de concentração. Dizemos, então, que a série tem dois ou mais valores modais. Ex: { 2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9 } apresenta duas modas: 4 e 7. A série é bimodal. . A Moda quando os dados estão agrupados Sem intervalos de classe: Uma vez agrupados os dados, é possível determinar imediatamente a moda: basta fixar o valor da variável de maior frequência. Ex: Qual a temperatura mais comum medida no mês abaixo: Temperaturas Freqüência 0º C 3 1º C 9 2º C 12 3º C 6 Resp: 2º C é a temperatura modal, pois é a de maior frequência. 2.5. MEDIANA - Md Mediana de um conjunto de valores, dispostos segundo uma ordem ( crescente ou decrescente), é o valor situado 9 de tal forma no conjunto que o separa em dois subconjuntos de mesmo número de elementos. A mediana em dados não-agrupados Dada uma série de valores como, por exemplo: { 5, 2, 6, 13, 9, 15, 10 } De acordo com a definição de mediana, o primeiro passo a ser dado é o da ordenação (crescente ou decrescente) dos valores: { 2, 5, 6, 9, 10, 13, 15 } O valor que divide a série acima em duas partes iguais é igual a 9, logo a Md = 9. . Método prático para o cálculo da Mediana: Se a série dada tiver número ímpar de termos: O valor mediano será o termo de ordem dado pela fórmula : ( n + 1 ) / 2 Ex: Calcule a mediana da série { 1, 3, 0, 0, 2, 4, 1, 2, 5 } 1º - ordenar a série { 0, 0, 1, 1, 2, 2, 3, 4, 5 } n = 9 logo (n + 1)/2 é dado por (9+1) / 2 = 5, ou seja, o 5º elemento da série ordenada será a mediana A mediana será o 5º elemento = 2 . Se a série dada tiver número par de termos: O valor mediano será o termo de ordem dado pela fórmula : .[( n/2 ) +( n/2+ 1 )] / 2 Obs: n/2 e (n/2 + 1) serão termos de ordem e devem ser substituídos pelo valor correspondente. Ex: Calcule a mediana da série { 1, 3, 0, 0, 2, 4, 1, 3, 5, 6 } 1º - ordenar a série { 0, 0, 1, 1, 2, 3, 3, 4, 5, 6 } n = 10 logo a fórmula ficará: [( 10/2 ) + (10/2 + 1)] / 2 [( 5 + 6)] / 2 será na realidade (5º termo+ 6º termo) / 2 5º termo = 2 6º termo = 3 A mediana será = (2+3) / 2 ou seja, Md = 2,5 . A mediana no exemplo será a média aritmética do 5º e 6º termos da série. Notas: Quando o número de elementos da série estatística for ímpar, haverá coincidência da mediana com um dos elementos da série. Quando o número de elementos da série estatística for par, nunca haverá coincidência da mediana com um dos elementos da série. A mediana será sempre a média aritmética dos 2 elementos centrais da série. Em uma série a mediana, a média e a moda não têm, necessariamente, o mesmo valor. A mediana, depende da posição e não dos valores dos elementos na série ordenada. Essa é uma da diferenças marcantes entre mediana e média ( que se deixa influenciar, e muito, pelos valores extremos). Vejamos: Em { 5, 7, 10, 13, 15 } a média = 10 e a mediana = 10 Em { 5, 7, 10, 13, 65 } a média = 20 e a mediana = 10 isto é, a média do segundo conjunto de valores é maior do que a do primeiro, por influência dos valores extremos, ao passo que a mediana permanece a mesma. A mediana em dados agrupados a) Sem intervalos de classe: Neste caso, é o bastante identificar a frequência acumulada imediatamente superior à metade da soma das frequências. A mediana será aquele valor da variável que corresponde a tal frequência acumulada. Ex.: conforme tabela abaixo: Variável xi Frequência fi Frequência acumulada 0 2 2 1 6 8 2 9 17 3 13 30 4 5 35 total 35 Quando o somatório das frequências for ímpar o valor mediano será o termo de ordem dado pela fórmula : . Como o somatório das frequências = 35, a fórmula ficará: ( 35+1 ) / 2 = 18º termo = 3.. Quando o somatório das frequências for par o valor mediano será o termo de ordem dado pela fórmula: Ex: Calcule Mediana da tabela abaixo: Variável xi Frequência fi Frequência acumulada 12 1 1 14 2 3 15 1 4 16 2 6 17 1 7 20 1 8 Total 8 Aplicando fórmula acima teremos:[(8/2)+ (8/2+1)]/2 = (4º termo + 5º termo) / 2 = (15 + 16) / 2 = 15,5 EXERCÍCIOS RESOLVIDOS 01. No ano 2000, o número de nascimentos, por mês, em uma maternidade foi: MÊS NASCIMENTO Janeiro 38 Fevereiro 25 Março 42 10 Abril 30 Maio 29 Junho 47 Julho 18 Agosto 36 Setembro 38 Outubro 43 Novembro 49 Dezembro 37 a) Calcule a média mensal de nascimentos. b) Em que meses o número de nascimentos ficou acima da média? Solução: a) A media mensal de nascimentos em 12 meses é dada por: 12 374943383618472930422538 x 36x 12 432 x Portanto a média de nascimentos foi de 36 nascimentos por mês. b) O número de nascimentos ficou acima da média nos seguintes meses: janeiro, março, junho, setembro, outubro, novembro e dezembro. 02. A classificação final para um determinado curso é a média ponderada das provas de capacidade geral, com peso 3, e das provas de capacidade específica, com peso 2. Nessas condições, qual é a classificaçãofinal de um aluno que obteve 162 pontos na prova de capacidade geral e 147 pontos na prova de capacidade específica? A classificação final é obtida pela média ponderada: 156 5 780 5 294486 23 21473162 x Portanto, o aluno será classificado com 156 pontos. 03. O quadro de distribuição de frequências representa os salários mensais de 40 empregados de uma firma. CLASSE (EM REAIS) PONTO MÉDIO DA CLASSE ( ix ) FREQÜÊNCIA (fi) [180; 200[ 190 4 [200; 220[ 210 18 [220; 240[ 230 10 [240; 260[ 250 5 [260; 280[ 270 3 Calcule o salário médio mensal dos empregados dessa firma. Quando os dados estão agrupados, aceita-se por convenção, que as frequências se distribuem uniformemente ao longo da classe e que, portanto, o ponto médio da classe é o valor representativo do conjunto. Nesse caso, a média é calculada partindo-se do ponto médio da classe. Para calcular o salário médio, devemos fazer 3510184 3270525010230182104190 x 50,222 40 8900 x 40 810175023003780760 x Portanto, o salário médio é de R$ 222,50. 04. O gráfico apresenta o comportamento de emprego formal surgido, segundo o CAGED, no período de janeiro de 2010 a outubro de 2010. Com base no gráfico, o valor da parte inteira da mediana dos empregos formais surgidos no período é a) 212.952 b) 229.913 c) 240.621 d) 255.496 e) 298.041 Solução: Para calcular a mediana, devemos escrever todos os números referentes ao comportamento de emprego formal em ordem crescente: 181.419 181.719 204.804 209.425 212.952 246.875 266.415 298.041 299.415 305.068 Observe que os valores centrais dessa lista são: 212.952 e 246.875. A média entre eles é: Mediana = 212.952 + 246.875 2 Mediana = 459.827 2 Mediana = 229.913,05 A parte inteira desse resultado é 229.913. Gabarito: letra B. 05. Quais valores são, respectivamente, a moda, média e mediana dos números da lista a seguir? 133, 425, 244, 385, 236, 236, 328, 1000, 299, 325 a) 236; 361,1 e 312 b) 244; 361 e 312 c) 236; 360 e 312 d) 236; 361,1 e 310 e) 236; 361,1 e 299 11 Solução: A moda é o número que aparece com maior frequência. Observe que todos os números aparecem apenas uma vez na lista, exceto 236, que aparece duas vezes. Assim, a moda é 236. A média é obtida pela soma de todos os números e dividindo o resultado pela quantidade de números somados: M = 133 + 425 + 244 + 385 + 236 + 236 + 328 + 1000 + 299 + 325 10 M = 3611 10 M = 361,1 A mediana é o número central de uma lista em ordem crescente. Caso a lista tenha um número par de elementos, é a média entre os dois números centrais. 133, 236, 236, 244, 299, 325, 328, 385, 425, 1000 299 + 325 = 624 = 312 2 2 Assim, moda, média e mediana são: 236; 361,1 e 312. Gabarito: letra A. 06. (Cesgranrio) João tem 5 filhos, sendo que dois deles são gêmeos. A média das idades deles é 8,6 anos. Porém, se não forem contadas as idades dos gêmeos, a média dos demais passa a ser de 9 anos. Pode-se concluir que a idade dos gêmeos, em anos, é a) 6,5. b) 7,0. c) 7,5. d) 8,0. e) 8,5. Solução: Chamaremos de x a idade de cada um dos gêmeos. Temos que a média das idades dos outros 3 filhos é 9 anos. Assim, a soma das idades dos 3 irmãos (sem os gêmeos) é 27 anos. Sabendo que a média dos 5 filhos é 8,6 temos: 8,6 = (27 + 2x)/5 8,6 ∙ 5 = 27 + 2x 2x = 43 – 27 2x = 16 x = 16/2 x = 8 anos 07. (BB – FCC) Nos quatro primeiros dias úteis de uma semana o gerente de uma agência bancária atendeu 19, 15, 17 e 21 clientes. No quinto dia útil dessa semana esse gerente atendeu n clientes. Se a média do número diário de clientes atendidos por esse gerente nos cinco dias úteis dessa semana foi 19, a mediana foi a) 21. b) 19. c) 18. d) 20. e) 23. Solução: Conhecendo a média, vamos calcular o número de clientes no quinto dia útil: Média = (19 + 15 + 17 + 21 + n) / 5 = 19 19 + 15 + 17 + 21 + n = 19 ∙ 5 72 + n = 95 n = 95 – 72 n = 23 clientes Ordenando a sequência de forma crescente: 15, 17, 19, 21, 23 A mediana é 19. 3. MEDIDAS DE DISPERSÃO 3.1. AMPLITUDE TOTAL: É a única medida de dispersão que não tem na média o ponto de referência. Quando os dados não estão agrupados a amplitude total é a diferença entre o maior e o menor valor observado: AT = X máximo - X mínimo. Ex: Para os valores 40, 45, 48, 62 e 70 a amplitude total será: AT = 70 - 40 = 30 Quando os dados estão agrupados sem intervalos de classe ainda temos : AT = X máximo - X mínimo. Ex: AT = 4 - 0 = 4 * Com intervalos de classe a AMPLITUDE TOTAL é a diferença entre o limite superior da última classe e o limite inferior da primeira classe. Então: AT = L máximo - L mínimo Ex: Classes fi 4 |------------- 6 6 6 |------------- 8 2 8 |------------- 10 3 AT = 10 - 4 = 6 A amplitude total tem o inconveniente de só levar em conta os dois valores extremos da série, descuidando do conjunto de valores intermediários. Faz-se uso da amplitude total quando se quer determinar a amplitude da temperatura em um dia, no controle de qualidade ou como uma medida de cálculo rápido sem muita exatidão. 3.2. A mediana e a amplitude inter-quartis Uma outra forma de sumarizar dados é em termos dos quantis ou percentis. Essas medidas são particularmente úteis para dados não simétricos. A mediana (ou percentil 50) é definida como o valor que divide os dados ordenados ao meio, i.e. metade dos dados têm valores maiores do que a mediana, a outra metade tem valores menores do que a mediana. Adicionalmente, os quartis inferior e superior, Q1 e Q3, são definidos como os valores abaixo dos quais estão um quarto e três quartos, respectivamente, dos dados. Estes três valores são frequentemente usados para resumir os dados juntamente com o mínimo e o máximo. Eles são obtidos ordenando os dados do menor para o maior, e então conta-se o número apropriado de observações: ou seja é , e para o quartil inferior, mediana e quartil superior, respectivamente. xi fi 0 2 1 6 3 5 4 3 12 Para um número par de observações, a mediana é a média dos valores do meio (e analogamente para os quartis inferior e superior). A medida de dispersão é a amplitude inter- quartis, IQR = Q3 - Q1, isto é, é a diferença entre o quartil superior e o inferior. Exemplo. O número de crianças em 19 famílias foi 0, 1, 1, 2, 2, 2, 2, 2, 3, 3, 3, 4, 4, 5, 6, 6, 7, 8, 10 A mediana é o (19+1) / 2 = valor, isto é, 3 crianças. O quartil inferior e superior são os valores e , isto é, 2 e 6 crianças, portanto amplitude inter-quartil é de 6-2=4 crianças. Note que 50% dos dados estão entre os quartis inferior e superior. DESVIO. Para preencher uma vaga de gerente de produção, o departamento de recursos humanos de uma empresa realizou um teste com vários candidatos, selecionando os dois melhores: Leonor e Felipe. A tabela abaixo mostra os desempenhos dos dois candidatos nas provas a que se submeteram: Candidato Assunto LEONOR FELIPE Conhecimento de informática 8,5 9,5 Língua Portuguesa 9,5 9,0 Língua Inglesa 8,0 8,5 Matemática 7,0 8,0 Conhecimentos de Economia 7,0 5,0 MÉDIA 8,0 8,0 Os dois candidatos obtiveram a mesma média. Como proceder, cientificamente, para determinar qual dos dois teve o melhor desempenho nessa avaliação? A comparação entre os desempenhos desse dois candidatos pode ser feita através de medidas estatísticas como: o desvio absoluto médio, a variância ou o desvio padrão. Essas medidas, chamadas medidas de dispersão, indicam o quanto os elementos de uma amostra estão afastados da média aritmética. Calculando, uma dessas medidas, em cada uma de duas amostras de mesma média aritmética, será considerada a amostra menos dispersa aquela que apresentar a menor medida. No caso de Felipe e Leonor, a amostra de notas menos dispersas em relação à média aritmética corresponde ao melhor desempenho e, portanto, ao merecedor da vaga. 3.3. Desvio absoluto médio(Dam) Nas cinco provas realizadas, Leonor obteve; 8 de média aritmética e suas notas foram: 8,5; 9,5; 8,0; 7,0 e 7,0, conforme a tabela anterior. Para determinar o quanto cada nota está afastada da média aritmética, basta efetuar a diferença entre a nota e a média, nessa ordem; essa diferença é chamada de desvio da nota. Esses desvios são: • 8,5 – 8,0 = 0,5 (a nota 8,5 está 0,5 acima da média) • 9,5 – 8,0 = 1,5 (a nota 9,5 está 1,5 acima da média) • 8,0 – 8,0 = 0,0 (a nota 8,0 coincide com a média) • 7,0 – 8,0 = –1,0 (as duas últimas notas, 7,0, estão 1,0 abaixo da média) O módulo de cada um desses desvios é chamado de desvio absoluto da nota correspondente: • o desvio absoluto da nota 8,5 é | 0,5 | = 0,5; • o desvio absoluto da nota 9,5 é | 1,5 | = 1,5; • o desvio absoluto da nota 8,0 é | 0,0 | = 0,0; • o desvio absoluto de cada uma das duas últimas notas, 7,0, é | –1, 0 |= 1,0. A média aritmética entre esses desvios absolutos é chamada de desvio absoluto médio, que se indica por Dam: 5 |0,1||0,1||0,0||5,1||5,0| Dam 5 0,10,10,05,15,0 Dam 8,0 5 0,4 Dam Analogamente obtém-se o desvio absoluto médio das notas obtidas por Felipe, D’am, no conjunto de provas: D’am = 1,2 O desvio absoluto médio mede o afastamento médio dos elementos da amostra em relação à média aritmética. Assim, temos que as notas de Leonor estão, em média, 0,8 acima ou abaixo da média aritmética 8; enquanto as notas de Felipe estão, em média, 1,2 acima ou abaixo da média aritmética 8. Como Dam < D’am, conclui-se que Leonor teve um desempenho mais regular que Felipe, e, por isso, merece a vaga. Sendo x a média aritmética de uma amostra de números x1, x2, x3,..., xn, chama-se desvio absoluto médio, que se indica por Dam, o número: , n |xx||xx||xx||xx| Dam n321 ou, usando o símbolo de somatório: n |xx| Dam n 1i i 3.4. Variância (δ 2 ) Uma outra medida que indica o afastamento dos ele- mentos de uma amostra, em relação à média aritmética, é a variância, que se representa por δ 2 . Define-se essa medida como a média aritmética entre os quadrados dos desvios dos elementos da amostra, isto é: n )xx()xx()xx()xx( 2 n 2 3 2 2 2 12 ou, usando o símbolo de somatório: n )xx( n 1i 2 1 2 13 Calculando as variâncias dos conjuntos de notas de Leonor, 2 )L( , e de Felipe, 2 )F( , citados anteriormente, temos: 9,0 5 )0,1()0,1()0,0()5,1()5,0( 22222 2 )L( ] e 5,2 5 )0,3()0,0()5,0()0,1()5,1( 22222 2 )F( Como 2 )L( < 2 )F( , conclui-se que Leonor teve um desempenho, nas provas, mais regular do que Felipe. 3.5. Desvio padrão (δ) Na interpretação da variância podem surgir algumas dificuldades em relação à unidade de medida dos elementos da amostra. Por exemplo, se os elementos da amostra representam capacidades em litros (l), a variância representará um resultado em l 2 ; como essa unidade não tem significado físico, não é conveniente utilizar a variância nesse caso. Por causa de dificuldades como essa, foi criado o desvio padrão, representado por δ, e definido como a raiz quadrada da variância. Calculando o desvio padrão do conjunto de notas de Leonor, δ(L), e de Felipe, δ(F), citados anteriormente, temos: 948,09,0)L( e 581,15,2)F( Como δ (L) < δ (F), concluímos que Leonor teve um desempenho, nas provas, mais regular do que Felipe. ► NOTA: Não perca de vista que a comparação da dispersão de duas amostras pode ser feita com o desvio absoluto médio, ou com a variância ou com o desvio padrão. EXERCÍCIOS RESOLVIDOS 01) A tabela mostra o total de pontos obtidos por dois times de futebol no período de 1996 a 2000. 1996 1997 1998 1999 2000 TIME A 7 12 20 16 10 TIME B 18 16 15 9 12 a) Qual o desvio médio de cada um desses times? b) Qual o time mais regular nesse período? Solução: a) Time A vamos calcular a média aritmética dos dados: 13 5 65 5 101620127 x Vamos calcular os desvios para a média, ou seja, xxi : 6137xx1 11312xx2 71320xx3 31316xx4 31310xx5 Finalmente vamos calcular o desvio médio 4 5 20 5 |3||3||7||1||6| dm Logo, o desvio médio do time A é 4. Time B A média aritmética é igual a: 14 5 70 5 129151618 x Os desvios para as médias são iguais a: 18 – 14 = 4 16 – 14 = 2 15 – 14 = 1 9 – 14 = – 5 12 – 14 = – 2 O desvio médio é igual a: 8,2 5 14 5 |2||5||1||2||4| dm Logo, o desvio médio do time B é 2,8. b) Como o desvio médio do time B é menor que o desvio médio do time A (2,8 < 4), o time B é o mais regular. 02) A tabela a seguir mostra o número de votos por classe de dois candidatos que estão concorrendo a uma vaga de representante no conselho da escola. CLASSE CANDIDATO 3ª A 3ª B 3ª C 3ª D 3ª E 3ª F Vítor 12 15 12 16 14 15 Rafael 12 11 18 9 19 15 a) Calcule o desvio padrão de cada um desses candidatos. b) Qual dos dois candidatos é o mais regular? Solução: a) Inicialmente vamos calcular a média dos candidatos 14 6 84 6 151416121512 xV 14 6 84 6 15199181112 xR Em seguida, vamos calcular os desvios e os quadrados dos desvios. VÍTOR xxi 2 i )xx( 21412 4)2( 2 11415 1)1( 2 21412 4)2( 2 21416 4)2( 2 01414 0)0( 2 11415 1)1( 2 RAFAEL xxi 2 i )xx( 21412 4)2( 2 31411 9)3( 2 41418 16)4( 2 5149 25)5( 2 51419 25)5( 2 11415 1)1( 2 Agora, vamos calcular as variâncias: 33,2 6 14 6 104414 V Va 14 33,13 6 80 6 125251694 V Ra Por último, vamos calcular os desvios padrões extraindo a raiz quadrada das variâncias: 53,1s33,2s VV 53,1s33,2s V b) Observe que as médias de Vítor e Rafael são iguais a 14. Note também que Rafael tem um desvio padrão superior ao de Vítor (3,65 > 1,53), isto é, a dispersão dos votos relativamente à média é maior no caso de Rafael. Por isso, Vítor é o aluno mais regular. 03. (FCC). Ao considerar uma curva de distribuição normal, com uma média como medida central, temos a variância e o desvio padrão referentes a esta média. Em relação a estes parâmetros, a) a variância é uma medida cujo significado é a metade do desvio padrão. b) a variância é calculada com base no dobro do desvio padrão. c) o desvio padrão é a raiz quadrada da variância. d) a média dividida pelo desvio padrão forma a variância. e) a variância elevada ao quadrado indica qual é o desvio padrão. Solução: O desvio padrão é a raiz quadrada da variância. Veja a fórmula: Resposta: C 04.(FGV). Os dados a seguir são as quantidades de empregados de cinco pequenas empresas: 6, 5, 8, 5, 6. A variância da quantidade de empregados dessas cinco empresas é igual a: a) 0,8 b) 1,2 c) 1,6 d) 2,0 e) 2,4 Resolução O primeiro passo será calcular a média aritmética: Sabendo o valor da média, podemos calcular o valor da variância: Resposta: B 05. Marco e Paulo foram classificados em um concurso. Para classificação no concurso o candidato deveria obter média aritmética na pontuação igual ou superior a 14. Em caso de empate na média, o desempate seria em favor da pontuação mais regular. No quadro a seguir são apresentados os pontos obtidos nas provas de Matemática, Português e Conhecimentos Gerais, a média, a mediana e o desvio padrão dos dois candidatos. Dados dos candidatos no concurso O candidato com pontuação mais regular, portanto mais bem classificado no concurso, é a) Marco, pois a média e a mediana são iguais. b) Marco, pois obteve menor desvio padrão. c) Paulo, pois obteve a maior pontuação da tabela, 19 em Português. d) Paulo, pois obteve maior mediana. e) Paulo, pois obteve maior desvio padrão. Solução: Como a média de Marco e Paulo foram iguais, o desempate será feito pelo menor valor do desvio padrão, pois é o que indica pontuação mais regular. Alternativa correta b: Marco, poisobteve menor desvio padrão. EXERCÍCIOS PROPOSTOS 01.As idades dos jogadores de um time de basquetebol são 18, 23, 19, 20 e 21 anos. Qual é a média de idade desses jogadores? a) 18 b) 20 c) 20,2 d) 20,5 02. Entre sessenta números, vinte são iguais a 5, dez são iguais a 6, quinze são iguais a 8, dez são iguais a 12, e cinco são iguais a 16. Determine a média aritmética desses números. 03. Quatro funcionários A, B, C e D de uma empresa têm respectivamente 8, 6, 10 e 16 anos de trabalho nessa empresa. O funcionário A recebeu um prêmio de R$ 500,00 por ano de casa; B recebeu um prêmio de R$ 600,00 por ano de casa; e C e D receberam, cada um, R$ 800,00 de prêmio por ano de casa. Qual foi o prêmio médio recebido por ano de casa por esses funcionários? 04. As classes A, B e C da segunda série do ensino médio tiveram respectivamente as seguintes médias na prova de matemática: 6,5; 6,0 e 7,0. Sabendo que a classe A é formada por 28 alunos, B é formada por 25 alunos e C, por 22 alunos, calcule a nota média de todos os 75 alunos. 15 05. (UFRJ) O gráfico mostra a distribuição de uma prova de matemática. a) Quantos alunos fizeram a prova? b) Sendo x1, x2, x3, ..., xn as notas obtidas pelos n alunos nessa prova (n é o número de alunos que fizeram a prova), determine o número: n xxxx x n321 denominado média aritmética das notas dessa prova. 06. O gráfico, em forma de pizza, representa as notas obtidas em uma questão pelos 32.000 candidatos presentes à primeira fase de uma prova de vestibular. Ele mostra, por exemplo, que 32% desses candidatos, tiveram nota 2 nessa questão. Pergunta-se; a) Quantos candidatos tiveram nota 3? b) É possível afirmar que a nota média, nessa questão, foi 2? Justifique sua resposta. 07. Observando o gráfico do exercício anterior, responda: a) Qual é a moda do conjunto das notas de todos os alunos? b) Qual é a mediana do conjunto das notas de todos os alunos? 08. A tabela mostra a distribuição de frequência da carga, em toneladas, dos caminhões que passaram por uma estrada num certo período. Carga (em toneladas) Nº. de caminhões [9,5; 14,5[ 18 [14,5; 19,5[ 33 [19,5; 25,5] 9 Calcule a carga média desses caminhões. 09. A distribuição dos salários de uma empresa é dada na seguinte tabela: Salário em R$ Nº. de funcionários 500,00 10 1.000,00 5 1.500,00 1 2.000,00 10 5.000,00 4 10.500,00 1 TOTAL 31 a) Qual é a média e qual é a mediana dos salários dessa empresa? b) Suponha que sejam contratados dois novos funcionários com salário de R$ 2.000,00 cada. A variância da nova distribuição de salários ficará menor, igual ou maior do que a anterior? 10. (Fuvest) Dois atiradores x e y obtiveram numa série de vinte tiros, num alvo da forma indicada na figura, os seguintes resultados: atirador resultado 50 30 20 10 0 x 4 6 5 4 1 y 6 3 5 3 3 a) Qual é a média de pontos por tiro de cada um dos atiradores? b) Compare os desvios padrão de cada uma das séries de tiros e decida qual é o atirador com desempenho mais regular; 11.(Unicamp-SP) A média aritmética das idades de um grupo de 120 pessoas é 40 anos. Se a média aritmética das idades das mulheres é 35 anos e a dos homens é 50 anos, qual o número de pessoas de cada sexo, no grupo? 12. O gráfico abaixo mostra a distribuição de frequência das notas obtidas pelos alunos da segunda série do ensino médio numa prova de educação física. Determinar: a) a nota média desses alunos; b) a mediana dessa distribuição; c) a moda dessa distribuição. 2 (32%) 5 (10%) 0 (10%) 3 (16%) 1 (20%) 4 (12%) 50 30 20 10 0 16 13.( Cesgranrio) Suponhamos que nos vestibulares desse ano uma universidade tivesse tido, para os seus diversos cursos, uma média de 3,60 candidatos por vaga oferecida. Se para os vestibulares do ano que vem o número de vagas for aumentado de 20% e o número de candidatos aumentar em 10%, qual a média de candidatos por vaga que essa universidade terá no próximo ano? a)3,24 b) 3,30 c)3,36 d)3,40 e)3,46 14. A distribuição das idades dos alunos de uma classe é dada pelo seguinte gráfico: Qual das alternativas representa melhor a média de idades dos alunos? a) 16 anos e 10 meses b) 17 anos e 1 mês c) 17 anos e 5 meses d) 18 anos e 6 meses e) 19 anos e 2 meses 15.( FCC) Um sistema de radar e programado para registrar automaticamente a velocidade de todos os veículos trafegando por uma avenida, onde passam em média 300 veículos por hora, sendo 55 km/h a máxima velocidade permitida. Um levantamento estatístico dos registros do radar permitiu a elaboração da distribuição percentual de veículos de acordo com sua velocidade aproximada. A velocidade média dos veículos que trafegam nessa avenida é de: a)35 km/h b)44 km/h c)55 km/h d)76 km/h e)85 km/h 16. Às vésperas de um jogo decisivo, o técnico de uma equipe de basquetebol deve optar pela escalação de um dentre dois jogadores A e B. As duas tabelas seguintes mostram o desempenho de cada jogador nos últimos cinco jogos dos quais participou: jogador A jogador B jogo nº. de pontos jogo nº. de pontos 1 20 1 50 2 22 2 14 3 18 3 20 4 20 4 12 5 20 5 24 a) Calcular a média de cada um por jogo. b) Calcular o desvio padrão de cada um nesses cinco jogos. c) Você, como técnico desse time, se tivesse que escalar um desses jogadores, num jogo onde a simples vitória lhe daria o título de campeão, qual deles escalaria? 17. Segundo a Organização das Nações Unidas (ONU), o mundo não conseguirá atingir a meta de reduzir a fome pela metade em 2015. Nem mesmo em 2030 esse objetivo poderá ser alcançado. O gráfico a seguir mostra o número de pessoas com fome, em milhões, em cinco regiões do mundo, em diferentes anos (1992, 1999, 2015 e 2030), segundo dados e estimativas da ONU. Com base nos dados fornecidos pelo gráfico, pode-se afirmar que: a) em 2030, haverá mais de 700 milhões de pessoas com fome nas regiões destacadas no gráfico. b) em cada região destacada no gráfico, o número de pessoas com fome em 2030 será menor do que em 1992. c) em cada região destacada no gráfico, o número de pessoas com fome em 2030 será menor do que em 2015. d) em cada região destacada no gráfico, o número de pessoas com fome em 2015 será menor do que em 1999. e) em 2030, o número de pessoas com fome no Sul da África será maior do que três vezes o número de pessoas com fome no Sul da Ásia. 18. Em uma pesquisa de opinião, feita para verificar o nível de aprovação de um governante, foram entrevistadas 1000 pessoas, que responderam sobre a administração da cidade, escolhendo uma — e apenas uma — entre as possíveis respostas: ótima, boa, regular, ruim e indiferente. O gráfico abaixo mostra o resultado da pesquisa. 17 De acordo com o gráfico, pode-se afirmar que o percentual de pessoas que consideram a administração ótima, boa ou regular é de: a)28% b)65% c)71% d)84% 19.( Cesgranrio) Uma escola em Belém atribui pesos para o cálculo das quatro avaliações anuais. A primeira avaliação tem peso 1; a segunda, peso 2; a terceira, peso 3; a quarta, peso 4. Considerando as quatro avaliações de um aluno que obteve as notas 6,0; 4,0; 7,0 e 9,5 para as 1ª, 2ª, 3ª e 4ª avaliações, respectivamente, a média foi exatamente: a) 6,6 b) 6,9 c) 7,1 d) 7,3 e) 7,6 20. ( Cesgranrio) O professor Joelson aplicou uma prova de Matemática a 25 alunos, contendo 5 questões, valendo 1 ponto cada uma. Após fazer a correção, o professor construiu o gráfico abaixo, que relaciona o número de alunos às notas obtidas por eles. Observando o gráfico, conclui-se que a moda e a mediana das notas obtidas pelos 25 alunos correspondem, respectivamente, a: a) 2,0 e 3,0 b) 2,0 e 4,0 c) 2,0 e 5,0 d) 3,0 e 4,0 e) 3,0 e 5,0 21.( Cesgranrio) O gráfico de setores abaixo ilustra o resultado de uma pesquisa feita com um grupo de 1280 eleitores sobre a manutenção do horário político no rádio e na TV, em períodos que antecedem as eleições. Se o setor A corresponde às 576 pessoas que acham que o horáriopolítico deve acabar, o setor 5 corresponde ao número de pessoas que acham que esse horário deve continuar e o setor C corresponde ao número de pessoas que não tem opinião formada. Então o número de pessoas que compõem o setor C é igual a: a)224 b)342 c)386 d)458 e)480 22. A média aritmética das notas dos alunos de uma turma formada por 25 meninas e 5 meninos é igual a 7. Se a média aritmética das notas dos meninos é igual a 6, a média aritmética das notas das meninas é igual a: a) 6,5 b)7,2 c)7,4 d)7,8 e)8,0 23. (FCC) O histograma abaixo apresenta as alturas de 30 atletas de uma equipe de futebol. Com esses dados, podemos concluir que a média das alturas dos atletas é aproximadamente: a) 1,58 b) 1,65 c) 1,74 d) 1,81 e) 1,92 (Observação: Para o cálculo da média, considere o ponto médio de cada classe de intervalo.) 24.( FCC) Uma empresa tem 18 funcionários. Um deles pede demissão e é substituído por um funcionário de 22 anos de idade. Com isso, a média das idades dos funcionários diminui dois anos. Assim, a idade do funcionário que se demitiu é: a)54 anos b) 56 anos c)58 anos d)50 anos e)48 anos 25.( Cesgranrio) Para que fosse feito um levantamento sobre o número de infrações de trânsito, foram escolhidos 50 motoristas. O número de infrações cometidas por esses motoristas nos últimos cinco anos produziu a seguinte tabela: N° de infrações N° de motoristas de 1 a 3 7 de 4 a 6 10 de 7 a 9 15 18 de 10 a 12 13 de 13 a 15 5 maior ou igual a 16 0 Pode-se então afirmar que a média do número de infrações, por motorista, nos últimos cinco anos, para esse grupo, está entre: a) 6,9 e 9,0 b) 7,2 e 9,3 c) 7,5 e 9,6 d) 7,8 e 9,9 e) 8,1 e 10,2 27. Seis caixas d'água cilíndricas iguais estão assentadas no mesmo piso plano e ligadas por registros (R) situados nas suas bases, como sugere a figura abaixo. Após a abertura de todos os registros, as caixas ficaram com os níveis de água no mesmo plano. A altura desses níveis, em dm, equivale a: a) 6,0 b) 6,5 c) 7,0 d) 7,5 29. O histograma representa a distribuição dos diâmetros de 65 peças de uma loja. Se fi são as frequências absolutas, então o número de peças com diâmetro não inferior a 20 mm é a) 30. b) 35. c) 40. d) 45. 30. A tabela mostra as idades dos alunos matriculados no Centro de Educação Infantil “X”. A média das idades dessa escola, em anos, é, aproximadamente: a) 4,1 b) 4,5 c) 5,1 d) 5,6 31. (Cesgranrio) Uma pesquisa com 27 crianças, realizada por psicólogos em um ambiente hospitalar, avalia a redução dos custos hospitalares mensais individuais em função do bem estar emocional promovido pela vivência de atividades artísticas. Com base nos dados descritos na tabela, a soma da média aritmética e da mediana correspondente à distribuição de redução dos custos mencionada é igual a a) 2900. b) 3400. c) 3200. d) 3700. 32. (Cesgranrio) Para um candidato ser classificado em um concurso, é necessário que ele obtenha classificações parciais em três áreas. Certo candidato obteve na área A 18 pontos; na área B 26 pontos e na área C, 10 pontos. Sabendo-se que os pesos são 5 para a área A, 2 para a área B e 3 para a área C, esse candidato obteve classificação final igual a: a) 17,2 pontos b) 18,3 pontos c) 18,6 pontos d) 19,1 pontos e) 19,3 pontos 33. (Cesgranrio) A média aritmética de um conjunto de 15 números é 12. Se os números 10, 16, 25 e 30 forem retirados do conjunto, a média aritmética dos números restantes é: a) 15 b) 12 c) 8 d) 7 e) 9 34. (Cesgranrio) Quatro amigos calcularam a média e a mediana de suas alturas, tendo encontrado como resultado 1,72 m e 1,70 m, respectivamente. A média entre as alturas do mais alto e do mais baixo, em metro, é igual a: a) 1,70 b) 1,71 c) 1,72 d) 1,73 e) 1,74 GABARITO 01 C 02 8 03 710,00 04 6,48 05 a) 31; b) 5,77 06 a) 5150; b) não pois a nota média é 2,3 07 a) 2; b) 2 08 16,325 09 a) Me = 2000,00; b) Md = 1500,00 10 a) x = 26, y = 26; b) dx = 14,6, dy = 18 11 80 mulheres, 40 homens 19 https://1.bp.blogspot.com/-hoDOI3S3NQI/XieXbTXyTaI/AAAAAAAAIxU/6ck5nVZ9mdoObxfg2rpjaC3RIvWrijRTgCLcBGAsYHQ/s1600/exercicio-media-moda-mediana.PNG https://1.bp.blogspot.com/-hoDOI3S3NQI/XieXbTXyTaI/AAAAAAAAIxU/6ck5nVZ9mdoObxfg2rpjaC3RIvWrijRTgCLcBGAsYHQ/s1600/exercicio-media-moda-mediana.PNG 12 a) 6,6; b) 7; c) 7 13 a 14 c 15 b 16 a) A=20, B=20; b) dA = 1,6, dB = 43,2 17 c 18 d 19 d 20 d 21 a 22 b 23 c 24 c 25 a 26 d 27 c 28 b 29 b 30 c NOÇÕES DE PROBABILIDADE PROBABILIDADE A que temperatura a água entra em ebulição? Se largarmos uma bola, com que velocidade ela atinge o chão? Conhecidas certas condições, é perfeitamente possível responder a essas duas perguntas, antes mesmo da realização desses experimentos. Esses experimentos são denominados determinísticos, pois neles os resultados podem ser previstos. Considere agora os seguintes experimentos: No lançamento de uma moeda, qual a face voltada para cima? No lançamento de um dado, que número saiu? Uma carta foi retirada de um baralho completo. Que carta é essa? No lançamento de uma moeda, podemos obter cara ou coroa; no lançamento do dado, os resultados possíveis são 1, 2, 3, 4, 5 ou 6; e para as cartas temos 52 resultados possíveis (o baralho tem 52 cartas diferentes). Mesmo se esses experimentos forem repetidos várias vezes, nas mesmas condições, não poderemos prever o resultado. Um experimento cujo resultado, embora único, é imprevisível, é denominado experimento ALEATÓRIO. Um experimento ou fenômeno aleatório apresenta as seguintes características: Pode se repetir várias vezes nas mesmas condições; É conhecido o conjunto de todos os resultados possíveis; Não se pode prever o resultado. Como não podemos prever o resultado de um experimento aleatório, procuraremos descobrir as possibilidades de ocorrência de cada um. A teoria da probabilidade surgiu para tentar medir a "chance" de ocorrer um determinado resultado num experimento aleatório. 1. ESPAÇO AMOSTRAL O conjunto de todos os possíveis resultados de um experimento aleatório é chamado espaço amostral e vamos indicar por U. O número de elementos do espaço amostral de um experimento aleatório é indicado por n (U). Exemplo 1: O Dr. Freitas vai sortear um tablet entre seus cinco netos: Alberto (A), Breno (B), Cláudio (C), Danilo (D) e Edson (E). O espaço amostral relativo a esse sorteio é: U = {A, B, C, D, E} Cada um dos cindo elementos de U recebe o nome de ponto amostral. Exemplo 2: Jogar duas moedas e observar o resultado. O espaço amostral relativo a esse sorteio é: U = {(cara, cara), (cara, coroa),(coroa, cara),(coroa, coroa)} Exemplo 3: O experimento jogar um dado tem seis resultados possíveis: 1, 2, 3, 4, 5 e 6. Logo, o espaço amostral é U = {1, 2, 3, 4, 5, 6}. Exemplo 4: Um dado é lançado duas vezes sucessivamente e é observada a sequência das faces obtidas. Usando o PFC (princípio fundamental da contagem), o número de resultados possíveis de ocorrer nesse experimento é 66 = 36. Veja, a seguir, uma forma de representar os 36 pares ordenados: Lançamentos 2° 1° 1 2 3 4 5 6 1 1,1 1,2 1,3 1,4 1,5 1,6 2 2,1 2,2 2,3 2,4 2,5 2,6 3 3,1 3,2 3,3 3,4 3,5 3,6 4 4,1 4,2 4,3 4,4 4,5 4,6 5 5,1 5,2 5,3 5,4 5,5 5,6 6 6,1 6,2 6,3 6,4 6,5 6,6 Assim, U = {(1, 1), (1, 2),..., (2,1),.... (3,1),.... (4,1),..., (5, 1),..., (6,1),..., (6, 6)}. Cada par ordenado corresponde a um ponto amostral. Exemplo 5 : Número de ovos de determinada lagarta. U = {0, 1, 2, 3, 4, . . .}. Temos nesse caso um espaço amostral infinito. 2. EVENTO Qualquer subconjunto do espaço amostral (U) de um experimento aleatório recebe o nome de evento. Veremos a seguir como "construir" alguns eventos. Exemplo 1: Um dado é lançado duas vezes sucessivamente. Quais resultados têm soma dos pontos igual a 6? Devemos "percorrer" a tabela anterior e verificar quais são os pares ordenados (a, b) tais que a+ b = 6. Assim, temos: (5, 1), (1, 5), (2, 4), (4, 2) e (3, 3). Desse modo, construímos o evento E "a soma dos pontos obtidos é igual a 6". E = {(5, 1), (1, 5), (2, 4), (4, 2), (3, 3)} Observe que E U Exemplo 2: Uma caixa tem 30 bolas numeradas de 1 a 30. Uma bola é retirada ao acaso da caixa. Qual é o evento E "ocorre um múltiplo de 4"? O conjunto dos resultados possíveis desse experimento é: U = {1, 2, 3,..., 29, 30}. 20 Para obter E, devemos selecionar os elementos de U que são múltiplos de 4, isto é, E = {4, 8, 12, 16, 20, 24, 28}. Observe que E U Exemplo 3: Uma urna contém 10 bolas numeradas de 1 a 10. Retira-se uma bola ao acaso e observa-se o número indicado. Descrever de forma explícita os seguintes conjuntos e dar o número de elementos de cada um: a) O espaço amostral U. b) O evento A: o número da bola é ímpar. c) O evento B: o número da bola é maior que 6. a) O conjunto de todos os resultados possíveis é representado pelo seguinte espaço amostral U = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10} O número de elementos desse conjunto é n(U) = 10 b) Se o número da bola é ímpar, temos o evento: A = {1, 3, 5, 7, 9} Esse conjunto possui 5 elementos. Logo, n(A) = 5 c) Se o número da bola é maior que 6, temos o evento: B = {7, 8, 9, 10}, em que n(B) = 4 Observe que A U e B U Exemplo 4 : Em um cesto há 6 bolas de vôlei, sendo 3 pretas e 3 vermelhas. Desse cesto são retiradas, sucessivamente, 3 bolas. Calcular o número de elementos dos seguintes eventos: a) As três bolas têm a mesma cor. b) Duas das bolas são pretas. c) As três bolas são vermelhas. d) O número de bolas pretas é igual ao número de bolas vermelhas. a) Chamando a bola preta de P e a vermelha de V e construindo a árvore das possibilidades temos: O espaço amostral desse experimento é: U = {(BBB), (BBV), (BVB), (BVV), (VBB). (VBV), (VVB), (VVV)} → n(U) = 8 Se as três bolas têm a mesma cor, o evento é: A = {(BBB), (VVV)} → n (A) = 2 b) Se duas das bolas são pretas, temos: B = {(BBV), (BVB), (VBB)} → n = (3) c) O evento três bolas são vermelhas é: C = {(VVV)} → n(C) = 1 d) Observando o espaço amostral, verifica-se que o número de bolas pretas nunca é igual ar número de bolas vermelhas. Logo, esse evento é representado pelo conjunto vazio: D = → n(D) = 0 2.1. Classificação de Eventos Podemos classificar os eventos por vários tipos. Vejamos alguns deles: Evento Simples Classificamos assim os eventos que são formados por um único elemento do espaço amostral. A = { 5 } é a representação de um evento simples do lançamento de um dado cuja face para cima é divisível por 5. Nenhuma das outras possibilidades são divisíveis por 5. Evento Certo Ao lançarmos um dado é certo que a face que ficará para cima, terá um número divisor de 720. Este é um evento certo, pois 720 = 6! = 6 . 5 . 4 . 3 . 2 . 1, obviamente qualquer um dos números da face de um dado é um divisor de 720, pois 720 é o produto de todos eles. O conjunto A = { 2, 3, 5, 6, 4, 1 } representa um evento certo pois ele possui todos os elementos do espaço amostral U = { 1, 2, 3, 4, 5, 6 }. Evento Impossível No lançamento conjunto de dois dados qual é a possibilidade de a soma dos números contidos nas duas faces para cima, ser igual a 15? Este é um evento impossível, pois o valor máximo que podemos obter é igual a doze. Podemos representá- lo por A=Ø, ou ainda por A = { }. Evento União Seja A o evento de ocorrência da face superior no lançamento de um dado, ímpar e menor ou igual a 3, então A = {1,3} e B o evento de ocorrência da face superior, ímpar e maior ou igual a 3, então B = {3,5}, com isso C = { 1, 3, 5 } representa o evento de ocorrência da face superior ímpar, que é a união dos conjuntos A e B, ou seja, C=AB. Note que o evento C contém todos os elementos de A ou B. Evento Intersecção Seja o evento de ocorrência da face superior no lançamento de um dado, par e menor ou igual a 4, então A = {2,4} e B o evento de ocorrência da face superior, par e maior ou igual a 4, então B = {4,6}, com isso C = { 4 } representa o evento de ocorrência da face superior par, que é a intersecção dos conjuntos A e B, ou seja, C = A ∩ B. Veja que o evento C contém apenas os elementos comuns a A e B. Eventos Mutuamente exclusivos Seja A = { 1, 2, 3, 6 } o evento de ocorrência da face superior no lançamento de um dado, um número divisor de 6 e B = { 5 }, o evento de ocorrência da face superior, um divisor de 5, os eventos A e B são mutuamente exclusivos, pois A ∩ B = Ø, isto é, os eventos não possuem elementos em comum. Evento Complementar Seja A = { 1, 3, 5 } o evento de ocorrência da face superior no lançamento de um dado, um número ímpar, o seu evento complementar é = { 2, 4, 6 } o evento de ocorrência da face superior no lançamento de um dado, um número par. 21 http://www.matematicadidatica.com.br/CriteriosDeDivisibilidade.aspx http://www.matematicadidatica.com.br/Divisores.aspx Os elementos de são todos os elementos do espaço amostral U que não estão contidos em A, então temos que = U - A e ainda que S = A + . 3. PROBABILIDADES DE UM EVENTO EM UM ESPAÇO AMOSTRAL FINITO Considere as seguintes situações em que os eventos são eventos simples. 1ª) No lançamento de um dado, qual a probabilidade de cair "3"? Espaço amostral: U = {1, 2, 3, 4, 5, 6} Evento A: cair 3 A = {3} ,A é um evento simples, n(A) = 1. Portanto, a probabilidade de "cair 3" é de "1 em 6" ou de 6 1 ou, ainda, de 16,66...% Para cada um dos outros números do espaço amostral, a probabilidade continua a mesma: 6 1 . 2ª) No lançamento de uma moeda, qual a probabilidade de sair cara? Temos: U = {cara, coroa} Evento B: sair cara B = {cara} , B é um evento simples, n(B) = 1. Nesse caso, a probabilidade de sair cara é de "1 em 2" ou de 2 1 ou, ainda, de 50%.Observe que a probabilidade de sair coroa também é de 2 1 . 3ª) Ao retirar uma carta de um baralho de 52 cartas, qual a probabilidade de ser um "rei de copas"? Neste caso, a probabilidade é de "1 em 52" ou de 52 1 ou, ainda, de aproximadamente 1,9%. Também, nesse caso, a probabilidade de ser retirada ao acaso qualquer uma das outras 51 cartas do baralho é 52 1 . Considere um experimento aleatório em que para cada um dos n eventos simples, do espaço amostral U, a chance de ocorrência é a mesma. Nesse caso, dizemos que o espaço amostral é um espaço equiprovável e que a probabilidade de cada evento simples é n 1 . Para um evento simples A, indicamos: )U(n 1 )A(P Podemos ampliar essa definição de probabilidade de um evento simples para a probabilidade de um evento qualquer. )U(n )A(n )A(P Na expressão, n(U) é o número de elementos do espaço amostral U e n(A), o número de elementos do evento A. Exemplo 1: No lançamento de um dado, determinar a probabilidade de se obter: a) o número 2 b) um número par c) um número múltiplo de 3 O espaço amostral é U = {1, 2, 3, 4, 5, 6}, portanto n(U) = 6. a) A=ocorrência do número 2: A = {2}, portanto n(A) = 1 1666,0 6 1 )B(n )A(n )A(P %66,16)A(P b) B= ocorrência de número par: B = {2, 4, 6}, portanto n(B) = 3 50,0 2 1 6 3 )U(n )B(n )B(P P(B) = 50% c) C= ocorrência de número múltiplo de 3: C = {3, 6}, portanto n(C) = 2 3333,0 3 1 6 2 )U(n )C(n )C(P %33,33)C(P Exemplo 2: Um dado é lançado duas vezes sucessivamente. Qual é a probabilidade de: a) ocorrer 5 no primeiro lançamento e um número par no segundo? b) o produto dos pontos obtidos ser maior que 12? Como vimos no exemplo 2, o conjunto dos resultados possíveis é formado por 6 . 6 = 36 pontos amostrais, isto é: U = {(1, 1), (1, 2), ..., (6,6)} a) O evento que nos interessa é E = {(5,2), (5,4), (5,6)}. Assim, 12 1 36 3 )U(n )E(n )E(p b) O evento que nos interessa é: E ={(3, 5), (3, 6), (4, 4), (4, 5), (4, 6), (5, 3), (5,4), (5, 5), (5, 6), (6, 3), (6,4), (6, 5), (6,6)}.Então, p(E) = 36 13 Exemplo 3: Na tabela seguinte está representada a distribuição por turno dos 80 alunos do curso de Economia de uma faculdade. Escolhendo ao acaso um aluno desse grupo, qual é a probabilidade de que seja: a) mulher? b) do curso noturno? c) homem do curso diurno? Vejamos: o número total de alunos no curso é: 20 + 23 + 25 + 12 = 80. a) O número total de mulheres é 25 + 12 = 37, e a probabilidade pedida é 80 b) Há 23 + 12 = 35 alunos do curso noturno, e a probabilidade de o aluno ser do curso noturno é 80 37 manhã noite homens 20 23 mulheres 25 12 22 c) O número de casos favoráveis é 20 e a probabilidade pedida é 4 1 80 20 Exemplo 4: Retiram-se 3 bolas de uma urna que contém 4 bolas verdes, 5 bolas azuis e 7 bolas brancas. Se P1 é a probabilidade de não sair bola azul e P2 é a probabilidade de todas as bolas saírem com a mesma cor, então a alternativa que mais se aproxima de P1+ P2 é: a) 0,21 b) 0,25 c) 0,28 d) 0,35 e) 0,40 Solução: Do que foi proposto, segue: Espaço Amostral (U): Retirar 3 bolas de uma urna que contém 16 bolas (4 bolas verdes, 5 bolas azuis e 7 bolas brancas). Isso pode ser feito de C16,3 modos distintos. Logo, n(U) = C16,3 = 16!/3!.13! =560. Cálculo de P1: Queremos, inicialmente, determinar a probabilidade de não sair bola azul. Evento (A1): Retirar 3 bolas (não pode ser azul) de uma urna que contém 4 bolas verdes, 5 bolas azuis e 7 bolas brancas, ou seja, retirar 3 bolas dentre11 bolas (4 bolas verdes e 7 bolas brancas).Isso pode ser feito de C11,3 formas diferentes. Logo, n(A1) = C11,3= 11!/3!.8! = 165. Assim, temos que P(A1) = P1= 165/560 = 0,295. Cálculo de P2: Agora, iremos determinar a probabilidade de todas as bolas saírem com a mesma cor. Evento (A2): Retirar 3 bolas da mesma cor de uma urna que contém 4 bolas verdes, 5 bolas azuis e 7 bolas brancas, ou seja, retirar 3 bolas verdes, 3 bolas azuis ou 3 bolas brancas dentre 4 bolas verdes, 5 bolas azuis e 7 bolas brancas. Podemos fazer isso de C4,3+ C5,3 + C7,3 formas distintas. Logo, n(A2) = C4,3+ C5,3 + C7,3 = 4 + 10 + 35 = 49. Com isso, segue que P(A2) = P2 = 49/560 = 0,087. Portanto, P1+ P2 = 0,382 Alternativa e 5. ADIÇÃO DE PROBABILIDADES Se A e B são dois eventos do mesmo espaço amostral, podemos escrever: P(A B) = P(A) + P(B) – P(A B) Observação: Se A B = P(A B) = P(A) + P(B) Exemplo: Em uma certa comunidade existem dois jornais J e P. Sabe-se que 5000 pessoas são assinantes do jornal J, 4000 são assinantes de P, 1200 são assinantes de ambos e 800 não leem jornal. Qual a probabilidade de que uma pessoa escolhida ao acaso seja assinante de ambos os jornais? Solução: Precisamos calcular o número de pessoas do conjunto universo, ou seja, nosso espaço amostral. Teremos: n(U) = N(J U P) + N.º de pessoas que não leem jornais. n(U) = n(J) + N(P) – N(J ÇP) + 800 n(U) = 5000 + 4000 – 1200 + 800 n(U) = 8600 Portanto, a probabilidade procurada será igual a: p = 1200/8600 = 12/86 = 6/43. Logo, p = 6/43 = 0,1395 = 13,95%. A interpretação do resultado é a seguinte: escolhendo-se ao acaso uma pessoa da comunidade, a probabilidade de que ela seja assinante de ambos os jornais é de aproximadamente 14%.(contra 86% de probabilidade de não ser). Exemplo: Um número inteiro é escolhido ao acaso numa urna que contém números de 1 a 50. Qual a probabilidade de ser divisível por 6 ou por 8? Solução: O espaço amostral U é dado por: U={1,2,3…49,50}, com isso n(U) = 50. Considere o evento A= Múltiplo de 6, temos que: A={6,12,18,24,30,36,42,48}, com isso n(A) = 8. Considere o evento B= Múltiplo de 8, temos que: B={8,16,24,32,40,48}, com isso n(B) = 6. Observe que existe o evento interseção de A e B. A B= {24,48}, com isso n(AB)=2. Daí teremos: P(A)=8/50 ; P(B)=6/50 ; P(AB)= 2/50 P(AUB)= P (A)+P(B)- P(AB) P (AUB)= 8/50+6/50-2/50= 6/25 6. PROBABILIDADE DO EVENTO COMPLEMENTAR Sejam: A = evento de um espaço amostral U. = evento complementar de A. Então: P(A) + P( ) = 1 Exemplo: No lançamento simultâneo de dois dados, vamos determinar a probabilidade de não sair soma 4. Solução: No lançamento de dois dados temos o espaço amostral de 36 elementos. Considerando os eventos em que a soma seja quatro, temos: {(1, 3), (3, 1), (2, 2)}. Probabilidade de sair soma quatro é igual a: 3 em 36, que corresponde a 3/36 = 1/12. Para determinarmos a probabilidade de não sair soma quatro realizamos o seguinte cálculo: Na expressão, temos que o valor 1 refere-se ao espaço amostral (100%). Temos que a probabilidade de não sair soma quatro no lançamento de dois dados é de 11/12. Exemplo: Numa caixa existem 6 canetas pretas, 4 azuis e 3 vermelhas. Se 3 canetas são retiradas ao acaso, e sem reposição, a probabilidade de que pelo menos duas tenham cores distintas é: Solução: Do que foi proposto, segue: Espaço Amostral (U): Retirar 3 canetas de uma caixa que contém 13 canetas (6 canetas pretas, 4 azuis e 3 vermelhas). Isso pode ser feito de C13,3 modos distintos. Logo, n(U) = C13,3= 286. 23 Evento (A): Retirar 3 canetas, pelo menos duas com cores distintas, de uma caixa que contém 6 canetas pretas, 4 azuis e 3 vermelhas. Evento Complementar ( ): Retirar 3 canetas com cores iguais de uma caixa que contém 6 canetas pretas, 4 azuis e 3 vermelhas, ou seja, deve se escolher 3 canetas pretas, 3 canetas azuis ou 3 canetas vermelhas de um total de 6 canetas pretas, 4 azuis e 3 vermelhas. Isso pode ser feito de C6,3+ C4,3+ C3,3= 20 + 4 + 1 = 25 modos distintos. Logo, n( ) = 25. Com isso, segue que P( ) = 25/286 Como P(A) = 1 – P( ) segue que P(A) = 1 – 25/286 = 265/286. 7. PROBABILIDADE CONDICIONAL TEOREMA DE BAYES E PROBABILIDADE CONDICIONAL Através da fórmula da probabilidade condicional determinamos a fórmula para o cálculo da probabilidade de dois eventos simultâneos, que é dada por: Note que para se obter a probabilidade de ocorrerem dois eventos sucessivos, que é p(A∩B), basta multiplicar a probabilidade de um deles ocorrer pela probabilidade de ocorrer o outro, sabendo que o primeiro já ocorreu. Quando o fato de ter ocorrido o evento B não alterar a probabilidade de ocorrer o evento A, ou seja, quando A e B forem eventos independentes, a fórmula se reduz a: P(A∩B)=p(A)*p(B) Vejamos alguns exemplos de aplicação dessas fórmulas. Exemplo 1. Uma moeda e um dado são lançados simultaneamente. Qual a probabilidade de ocorrer coroa e número primo? Solução: Primeiro, vamos determinar o espaço amostral S, que é o conjunto com todos os possíveis resultados. Para melhor compreensão, iremos denominar cara de C e coroa de K. Assim, S = {(C, 1); (C; 2); (C, 3); (C, 4); (C, 5); (C, 6); (K; 1), (K, 2); (K, 3); (K, 4); (K, 5); (K, 6)} n(S) = 12 Vamos descrever os eventos A e B. A: ocorrer coroa B: ocorrer número primo É fácil ver que esses dois eventos são independentes, um pode ocorrer sem a interferência do outro. Dessa forma, para resolução, utilizaremos a fórmula: P(A∩B)=p(A)∙p(B) p(A) = ½, pois no lançamento de uma moeda há metade de chance de sair cara e metade de sair coroa. p(B) = 3/6 = ½, pois dos 6 possíveis resultados no lançamento de um dado, três deles são números primos. Logo, P(A∩B)=1/2*1/2=1/4 Exemplo 2. Uma urna contém 10 etiquetas identificadas pelas letras A, B, C, D, ..., I, J. Duas delas são retiradas ao acaso, sucessivamente. Qual a probabilidade de saírem duas vogais, se a extração é feita sem reposição? Solução: Vamos determinar os dois eventos envolvidos. Evento A: sair uma vogal Evento B: sair uma vogal O fato de não haver reposição das etiquetas indica que a ocorrência de um evento interfere na ocorrência do outro, pois não haverá a mesma quantidade de etiquetas após a ocorrência de um deles. Dessa forma, utilizaremos a expressão: P(A∩B)=p(A│B)∙p(B) Vamos então calcular p(B) e p(A|B). p(B)= 3/10, pois, das dez letras,