Baixe o app para aproveitar ainda mais
Prévia do material em texto
Livro Eletrônico Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital Vitor Menezes, Gustavo Menezes Santana Sumário 1 ʹ Quantis ........................................................................................................................ 2 1.1 ?Introdução ................................................................................................................................ 2 1.2 ?Mediana para dados em Rol .................................................................................................... 3 1.3 ?Mediana para dados agrupados por valor .............................................................................. 8 1.4 ?Demais medidas separatrizes para dados em Rol ou agrupados por valor .......................... 11 1.5 ?Medidas separatrizes para dados em classe.......................................................................... 16 1.6 - Propriedades das medidas separatrizes ................................................................................. 35 2 ʹModa ......................................................................................................................... 37 2.1 ?Introdução ..............................................................................................................................37 2.2 ?Moda para dados em rol ou agrupados por valor ................................................................. 37 2.3 ?Moda para dados em classe................................................................................................... 40 2.4 - Moda bruta, moda de king e moda de pearson ..................................................................... 52 2.5 ?Moda quando as amplitudes de classe são diferentes .......................................................... 57 2.6 - Propriedades da moda ............................................................................................................61 Caderno no Tec Concursos ............................................................................................... 61 Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 1 ʹQUANTIS 1.1 ʹ INTRODUÇÃO Medidas separatrizes à?ŽƵà“ƋƵĂŶƚŝƐà弃?são medidas que separam os dados de forma bem específica, de modo que cada parte tenha a mesma quantidade de elementos das demais. Uma medida separatriz que nós já mencionamos é a mediana, que separa o conjunto de dados em ĚƵĂƐ à“ŵĞƚĂĚĞƐà弃? ŽƵ ƐĞũĂà? Ğŵ ĚŽŝƐ ďůŽĐŽƐ ĐŽŵ ŵĞƚĂĚĞ ĚŽƐ ĞůĞŵĞŶƚŽƐ ĐĂĚĂ Ƶŵà? MedianaÎ divide os dados em 2 partes Quando a vimos pela primeira vez, dissemos que a mediana era uma medida de tendência central. �ůĂà? ĂƐƐŝŵ ĐŽŵŽ Ă ŵĠĚŝĂ Ğ Ă ŵŽĚĂà? ŶŽƐ ŝŶĚŝĐĂ Ƶŵ ǀĂůŽƌ Ğŵ ƚŽƌŶŽ ĚŽ ƋƵĂů ŽƐ ĚĂĚŽƐ à“ŐŝƌĂŵà弃? Mas, além de ser uma medida de tendência central, ela também é uma medida separatriz. Isto porque ela separa os dados de uma forma bem específica: metade de cada lado. Sendo a mediana o termo do meio, ela deixa metade dos dados à sua esquerda e a outra metade à sua direita. Outra medida separatriz é o quartil. São três quartis, dividindo a sequência de dados em quatro partes iguais (em quatro partes com o mesmo número de termos). O primeiro quartil separa a sequência de dados de forma que à sua esquerda fiquem 25% dos valores e à sua direita 75%. Assim, o primeiro quartil é o valor que não é superado por 25% das observações. O segundo quartil coincide com a mediana, deixando 50% dos valores de cada lado. O terceiro quartil deixa à sua esquerda 75% dos valores e à sua direita 25%. Logo, o terceiro quartil é o valor que não é superado por 75% das observações. QuartisÎ dividem os dados em 4 partes Outra medida separatriz é o decil. São nove decis que dividem a série em dez partes iguais. O primeiro decil deixa à sua esquerda 10% dos valores; à sua direita 90% (ou seja, não é superado por 10% das observações). O segundo decil deixa à sua esquerda 20% dos valores; à sua direita 80%. E assim por diante. Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 1 àWtomamos os dois termos centrais (neste caso, o quinto e o sexto elemento) 2 àWfazemos a média entre eles. O quinto elemento é 3 (ܺହ � ൌ � ?). O sexto elemento é 4 (ܺ � ൌ � ?). A mediana fica: ܦ ൌ � ? ? ? Quando a série tem um número ímpar de elementos, fatalmente a mediana fará parte do conjunto de dados. Como existirá um termo do meio, ele será a mediana. Quando a série tem um número par de elementos, a mediana não necessariamente fará parte do conjunto de dados. Ela foi simplesmente resultado de uma conta. A mediana, além de ser uma medida de tendência central, também é uma medida separatriz. Ela separa a série de dados de forma bem específica, em duas partes com mesmo número de elementos. Exemplo Encontre a mediana para os seguintes conjuntos de dados: a) 1, 2, 5, 4, 6, 2, 3, 3, 3 b) 2, 8, 5, 1 c) 1, 1, 1, 1, 2, 2 ,2, 2, 2, 2, 3, 3, 4, 5, 5, 6, 8, 9, 19, 40, 40 Resolução: Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 a) A sequência tem nove termos. A mediana é simplesmente o termo central, ou seja, o quinto termo. O quinto termo é o seis. Portanto: ܦ ൌ ? Certo??? ERRADO! Antes de fazermos qualquer coisa com a série de dados, temos que passá-la para um rol, colocando os termos em ordem crescente. ROL: 1, 2, 2, 3, 3, 3, 4, 5, 6 WƌŽŶƚŽà? �ŐŽƌĂ Ă ƐĞƋƵġŶĐŝĂ ĞƐƚĄ ŽƌĚĞŶĂĚĂà? K ƋƵŝŶƚŽ ƚĞƌŵŽ Ġ Ž à‘à嬃? ܦ ൌ ? b) Primeiro achamos o rol: ROL: 1, 2, 5, 8. A sequência tem quatro termos (número par). Não há termo central. Fazemos a média dos dois termos centrais. ܦ ൌ � ? ? ? ൌ ?ǡ ? c) ROL: 1, 1, 1, 1, 2, 2 ,2, 2, 2, 2, 3, 3, 4, 5, 5, 6, 8, 9, 19, 40, 40 São vinte e um termos. O do meio é o décimo primeiro. Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 ܦ ൌ ? Apenas por curiosidade, vamos calcular a média deste conjunto. തܺ ൌ ? ܺ 球? ൌ 猃眃? 球? ൌ ?ǡ 眃? A mediana deu 3. É uma medida de tendência central. Medidas de tendência central nos dão um indicativo de valores em torno dos quais os dados giram. Portanto, tomando a mediana, dizemos que os dados giram em torno de 3. Mas a média também é uma medida de tendência central. Tomando apenas a média, dizemos que os dados giram em torno de 7,52. Como pode? Os dados giram em torno de 3 ou 7,52??? Na verdade, as medidas de tendência central não precisam necessariamente coincidir. Elas coincidem quando a sequência for simétrica. Média e mediana são obtidas por meios diferentes. A primeira resulta da soma de todos os valores, dividido pelo número de dados. A segunda resulta de uma contagem, em que tomamos o termo do meio. Cada uma delas procura expressar a tendência central, mas de forma distinta. Suponha que esta série de dados da letra C represente os salários dos funcionários de uma dada empresa, em números de salários mínimos. Assim, os quatro primeiros funcionários ganhariam 1 salário mínimo. Os seis seguintes, dois salários mínimos. E assim por diante, até os dois últimos, que ganham quarenta salários mínimos. Olha como a coisa é interessante. Nesta empresa, como em qualquer outra, a maior parte dos funcionários recebe um salário mais baixo. São operários, técnicos, secretárias etc. E poucos funcionários recebem um salário muito alto. São diretores, gerentes, etc. Se a empresa quiser fazer uma propaganda sua, dizendo que é um ótimo lugar para trabalhar, diráque o salário médio por ela pago é de mais de 7 salários mínimos. É que, mesmo com a grande ŵĂŝŽƌŝĂ ĚŽƐ ĨƵŶĐŝŽŶĄƌŝŽƐ ŐĂŶŚĂŶĚŽ Ƶŵ ƐĂůĄƌŝŽ ŵƵŝƚŽ ďĂŝdžŽà? ƚĞŵŽƐ ƵŶƐ ƉŽƵĐŽƐ à‘ĨĞůŝnjĂƌĚŽƐà? ƋƵĞ ganham um salário tão alto a ponto de fazer com que a média não seja assim tão baixa. Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 Por outro lado, se os funcionários quiserem fazer uma campanha para aumento salarial, poderão dizer que o salário mediano na empresa é de apenas 3 salários mínimos. Suponha que, por algum motivo, a gente exclua dos nossos dados os dois funcionários que ganham 40 salários mínimos. Ficaríamos com o seguinte conjunto: 1, 1, 1, 1, 2, 2 ,2, 2, 2, 2, 3, 3, 4, 5, 5, 6, 8, 9, 19. A mediana agora é igual a 2. E a média passa a ser igual a 4,1. A mediana variou bem menos que a média. Isso porque a mediana é menos influenciada por valores extremos. Ela é pouco sensível a tais valores. A média, contrariamente, é mais influenciada por valores muito grandes (ou muito pequenos). Dizemos que a média é mais sensível que a mediana. Por isso, em pesquisas de distribuição de renda, muitas vezes é utilizada a mediana como medida de tendência central. Geralmente poucas pessoas têm renda extremamente alta. Estas pessoas contribuem para aumentar a renda média, num quadro em que grande parte da população tem renda baixa. A mediana, nesses casos, tende a fornecer valores mais baixos, que descrevem melhor a população pesquisada. Vamos praticar agora com uma questão da Esaf: (Esaf) Determine a mediana do seguinte conjunto de dados: 58, 95, 17, 44, 63, 9, 57, 21, 88, 12, 31, 28, 73, 5 e 56. a) 28 b) 31 c) 44 d) 50 e) 56 Resolução: Primeiro ordenamos os valores: 5, 9, 12, 17, 21, 28, 31, 44, 56, 57, 58, 63, 73, 88, 95 São 15 termos. O do meio é o oitavo, destacado em vermelho acima. Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 Resposta: C 1.3 ʹMEDIANA PARA DADOS AGRUPADOS POR VALOR Relembrando, a mediana é o termo que divide a série em duas partes com o mesmo número de termos. Ou ainda, é o valor que não é superado por 50% das observações. Considere como exemplo a pesquisa salarial feita com dez moradores do bairro Alfa. Salários (em 1.000,00 reais): 1, 2, 2, 2, 3, 4, 4, 5, 6, 7 Convertendo este Rol em uma tabela de frequências simples: Salário em R$ 1.000,00 (X) frequência absoluta simples 1 1 2 3 3 1 4 2 5 1 6 1 7 1 Ao contrário da média e da moda, para encontrar a mediana não trabalhamos com frequências simples. Trabalhamos sempre com frequências acumuladas (tanto faz ser relativa ou absoluta). Então, o primeiro passo para encontrar a mediana é encontrar a coluna de frequências absolutas acumuladas. Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 Salário em R$ 1.000,00 (X) frequência absoluta simples Frequência absoluta acumulada 1 1 1 2 3 4 3 1 5 4 2 7 5 1 8 6 1 9 7 1 10 Segundo passo: determinar qual o termo do meio (ou quais são). Neste caso, como são 10 elementos (ou seja, o número total de dados é par), não temos um termo do meio. Temos dois termos centrais. Numa sequência de 10 termos, os centrais são o quinto e o sexto elementos. Temos, portanto que determinar quem é o quinto elemento e quem é o sexto elemento. Para tanto, basta encontrar a quais valores de salários correspondem as frequências acumuladas 5 e 6. Dirigindo-nos à coluna de frequência acumulada, procuramos pelo número 5 (ver linha em vermelho). Qual valor de salário corresponde à frequência acumulada 5? Resposta: 3 (R$ 3.000,00). Pronto, encontramos o quinto elemento. Agora, encontremos o sexto elemento. Dirigindo-nos à coluna de frequência acumulada, procuramos pelo número 6. Só que não há nenhum valor de frequência acumulada igual a 6. Adotamos o número imediatamente superior, no caso, 7 (ver linha em azul). Qual o valor de salário correspondente à frequência acumulada 7? Resposta: 4 (R$ 4.000,00). Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 Pronto, encontramos o sétimo elemento (que é igual ao sexto elemento). Num caso de número par de dados, a mediana é dada pela média entre os dois termos centrais. ܦ ൌ � ? ? ? ൌ ?ǡ ? Talvez tenha ficado a dúvida de por que utilizamos a frequência acumulada 7 em vez de 6. Tentando explicar um pouco melhor, podemos pensar o seguinte. A frequência acumulada do valor 3 é 5. O que significa isto? Significa que 5 pessoas ganham salários menores ou iguais a R$ 3.000,00. A frequência acumulada do valor 4 é 7. O que significa isto? Significa que 7 pessoas ganham salários menores ou iguais a R$ 4.000,00. Ou seja, cinco pessoas ganham até R$ 3.000,00. Sete pessoas ganham até R$ 4.000,00. Eu estou procurando pela sexta pessoa. Eu sei que esta sexta pessoa ganha mais de R$ 3.000,00, pois apenas as cinco primeiras ganham até R$ 3.000,00. Logo, a sexta e a sétima pessoas ganham salários de R$ 4.000,00. Ou seja, o sexto e o sétimo valores são iguais. (Universa) Em uma licitação para aquisição de lotes destinados à construção de residências, quinze propostas foram apresentadas. Os valores das propostas e a frequência com que apareceram se encontram na tabela a seguir. Valor (R$) Frequência 100.000,00 1 105.000,00 2 110.000,00 5 112.000,00 4 115.000,00 3 A mediana de um conjunto de dados é uma medida de tendência central cuja característica principal é a divisão do conjunto em dois grupos com mesmo número de valores cada. O Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 primeiro grupo apresenta valores inferiores à mediana e o segundo, valores superiores. Para o conjunto de dados apresentados, o valor da mediana é, em R$, (A) 100.000,00. (B) 105.000,00. (C) 110.000,00. (D) 112.000,00. (E) 115.000,00. Resolução: Calculando as frequências acumuladas: Valor (R$) Frequência Frequência acumulada 100.000,00 1 1 105.000,00 2 3 110.000,00 5 8 112.000,00 4 12 115.000,00 3 15 São 15 termos. O do meio é o oitavo, ou seja, aquele que tem frequência acumulada 8. Conforme destaque em vermelho, notamos que este termo é o 110.000,00. Resposta: C. 1.4 ʹDEMAIS MEDIDAS SEPARATRIZES PARA DADOS EM ROL OU AGRUPADOS POR VALOR Quando os dados estão em ROL ou agrupados por valor, o cálculo das medidas separatrizes pode ser meio complicado. Para a mediana, nós vimos no tópico anterior que bastava identificar o termo central. Ou, caso o conjunto tivesse um número par de termos, bastava identificar os dois termos centrais e fazer a média. WĂƌĂ ĂƐ ĚĞŵĂŝƐ ŵĞĚŝĚĂƐà? Ă ŵĂŶĞŝƌĂ ĚĞ ĐĂůĐƵůĂƌ ǀĂƌŝĂ ďĂƐƚĂŶƚĞà? �ŽƐƚƵŵŽ ĚŝnjĞƌ ƋƵĞ à“ǀĂŝ ĚŽ ŐŽƐƚŽ ĚŽ ĨƌĞŐƵġƐà?à? dĂůǀĞnj ƉŽƌ ŝƐƐŽ ĚŝĨŝĐŝůŵĞŶƚĞ ĐĂŝĂ Ğŵ ƉƌŽǀĂà? Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 Vejamos um exemplo. Neste ponto específico, vou utilizar a mesma ideia apresentada no livro à“�ƐƚĂƚşƐƚŝĐĂ �ƉůŝĐĂĚĂ ă �ĐŽŶŽŵŝĂà? �ĚŵŝŶŝƐƚƌĂĕĆŽ Ğ �ŽŶƚĂďůŝŝĚĂĚĞà弃? ĚŽƐ ĂƵƚŽƌĞƐ :ŽŚŶ &ƌĞƵŶĚ Ğ 'ĂƌLJ ^ŝŵŽŶà? KƐ ĂƵƚŽƌĞƐ ƚƌĂďĂůŚĂŵ ĐŽŵ Ƶŵ ĞdžĞŵƉůŽ ĞŶǀŽůǀĞŶĚŽ ƋƵĂƌƚŝƐà? ĚĞŵŽŶƐƚƌĂŶĚŽ ƋƵĞ à“há vasto campo para a arbitrariedade na ĚĞĨŝŶŝĕĆŽ�ĚŽ�ƋƵĂƌƚŝů�ŝŶĨĞƌŝŽƌ�Y ?�Ğ�ĚŽ�ƋƵĂƌƚŝů�ƐƵƉĞƌŝŽƌ�Y ? 弃? Então é isso.O que vem abaixo é uma adaptação dos exemplos do livro citado. Estamos pesquisando as alturas das crianças de uma escola. Selecionamos doze crianças. Medimos suas alturas, obtendo o seguinte rol (valores em metros): 1,40; 1,41; 1,44; 1,45; 1,46; 1,47; 1,49; 1,51; 1,52; 1,53; 1,55; 1,56. Muito bem. Nossa tarefa agora é encontrar os quartis. São doze valores. Se vamos dividir o ROL em quatro partes iguais, cada parte terá três elementos. Ficaremos com: ?ǡ 瘃?Ǣ ?ǡ 瘃?Ǣ ?ǡ 瘃?ᇣᇧᇧᇧᇧᇤᇧᇧᇧᇧᇥ Ǣ ?ǡ 瘃?Ǣ ?ǡ 瘃?Ǣ ?ǡ 瘃?ᇩᇭᇭᇭᇭᇪᇭᇭᇭᇭᇫ Ǣ ?ǡ 瘃?Ǣ ?ǡ 眃?Ǣ ?ǡ 眃?ᇣᇧᇧᇧᇧᇤᇧᇧᇧᇧᇥ Ǣ ?ǡ 眃?Ǣ ?ǡ 眃?Ǣ ?ǡ 眃?ᇩᇭᇭᇭᇭᇪᇭᇭᇭᇭᇫ Acima temos as quatro partes de três elementos. Portanto, quatro partes iguais. Neste exemplo, uma forma de determinar os quartis poderia ser a que segue: tomamos os números ƋƵĞ ĨŝĐĂŵ ƉĞƌƚŽ ĚĂƐ à“ĨƌŽŶƚĞŝƌĂƐà? ĞŶƚƌĞ ĂƐ ƉĂƌƚĞƐ Ğ ĨĂnjĞŵŽƐ Ă ŵĠĚŝĂ ĞŶƚƌĞ ĞůĞƐà? A primeira parte termina no 1,44. A segunda parte começa no 1,45. Fazendo a média entre eles temos: � ?ǡ 瘃? ?ǡ 瘃? ? ൌ ?ǡ 瘃瘃? Assim, o primeiro quartil seria 1,445 (ܳଵ ൌ ?ǡ 瘃瘃?) Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 A segunda parte termina no 1,47. A terceira parte começa no 1,49. Fazendo a média entre eles temos: � ?ǡ 瘃? ?ǡ 瘃? ? ൌ ?ǡ 瘃? O segundo quartil (que coincide com a mediana) é 1,48. ܦ ൌ ܳଶ ൌ ?ǡ 瘃? A terceira parte termina no 1,52. A quarta parte começa no 1,53. Fazendo a média entre eles temos: � ?ǡ 眃? ?ǡ 眃? ? ൌ ?ǡ 眃球? E o terceiro quartil é 1,525 (ܳଷ ൌ ?ǡ 眃球?) Pronto, descobrimos os três quartis. Três valores que separam a série de dados em quatro partes iguais. Agora vamos mudar a situação. Em vez de 12 crianças, medimos altura de apenas 11. A criança mais baixa, com 1,40, não foi analisada. O novo ROL, com 11 termos, fica: 1,41; 1,44; 1,45; 1,46; 1,47; 1,49; 1,51; 1,52; 1,53; 1,55; 1,56. E agora? 11 não é múltiplo de 4. Como separar a sequência em quatro partes iguais? Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 Bom, o segundo quartil sempre coincide com a mediana. Agora temos um número ímpar de elementos. Há um termo do meio, que é o sexto. A mediana é igual a 1,49. Portanto, o segundo quartil também é igual a 1,49. O problema é achar os demais quartis. Neste caso, podemos pensar que: x à direita do primeiro quartil existem três vezes mais termos que à sua esquerda; à esquerda do terceiro quartil existem três vezes mais termos que à sua direita; x o número de elementos entre ܳଵ e ܳଶ é igual ao número de elementos entre ܳଶ e ܳଷ, que é igual ao número de elementos à esquerda de ܳଵ, que é igual ao número de elementos à direita de ܳଷ; x metade dos dados está entre ܳଵ e ܳଷ. Quando a sequência tinha 12 termos (12 é múltiplo de quatro) todas estas propriedades foram satisfeitas (pode conferir). Agora, quando a sequência tem apenas 11 termos, não é possível fazer com que todas sejam observadas ao mesmo tempo. Adotando a segunda propriedade, poderíamos determinar os quartis do seguinte modo: Mas observe que as demais propriedades não foram satisfeitas. Pois bem, este mesmo problema enfrentado com os quartis acontece com todas as demais medidas separatrizes (decis e percentis). Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 Talvez, devido a este tipo de problema, não seja comum a cobrança de tais medidas em provas de concursos (para dados em ROL ou agrupados por valor). No caso específico de quartis, ainda se vê cobrança vez ou outra (seguem exemplos na sequência). E o método que se costuma utilizar para determinar o valor dos quartis é sempre o mesmo e acaba correspondendo à aplicação da segunda propriedade. O segundo quartil divide a sequência em duas partes iguais. Consideramos que o primeiro quartil é a mediana da primeira parte. E o terceiro quartil é a mediana da segunda parte. Vejamos como isso foi aplicado numa questão de prova: (Esaf) [Conjunto de dados da questão anterior: 58, 95, 17, 44, 63, 9, 57, 21, 88, 12, 31, 28, 73, 5 e 56]. Dado o conjunto de dados da questão anterior, determine a amplitude interquartilica Q3 àWQ1. a) 33. b) 37. c) 40. d) 46. e) 51. Resolução Primeiro ordenamos os dados e localizamos o termo central, que é a mediana: 5, 9, 12, 17, 21, 28, 31, 44, 56, 57, 58, 63, 73, 88, 95 A mediana é o 44, em vermelho. Ela divide a sequência em dois blocos de 7 elementos cada: um azul e outro verde. No bloco azul, o termo do meio é o 4º, que vale 17. Tomaremos este valor como primeiro quartil.ܳଵ ൌ 猃? No bloco verde, o quarto termo vale 63. Tomaremos este termo como terceiro quartil.ܳଷ ൌ 砃? Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 Finalmente: ܳଷ െ ܳଵ ൌ 砃?െ 猃?ൌ 瘃? Resposta: D Existe uma forma sistemática de cálculo de medidas separatrizes para dados em rol ou agrupados por valor, que retira totalmente o caráter arbitrário a que nos referimos acima. Esta forma é muito bem detalhada no livro "Estatística Básica", dos autores Bussab e Morettin. No entanto, como nunca vi uma única questão cobrando tal assunto, vou deixar de apresentá-lo. Quem quiser conhecer tal método, recomendo a leitura deste artigo aqui: https://www.tecconcursos.com.br/avisos-da-coordenacao/quantis-para-dados-agrupados-por- valor-ou-dados-em-rol 1.5 ʹMEDIDAS SEPARATRIZES PARA DADOS EM CLASSE Costumo dizer que este é o tópico mais importante de estatística descritiva. Se você considerar provas anteriores das mais importantes bancas, este é o assunto mais cobrado. � ƌĞƉƌĞƐĞŶƚĂĕĆŽ ĚŽƐ ĚĂĚŽƐ ŶĂ ĨŽƌŵĂ à“ĂŐƌƵƉĂĚŽƐ Ğŵ ĐůĂƐƐĞƐà? Ġ ĐŽŵƵŵ ƋƵĂŶĚŽ Ž ŶƷŵĞƌŽ ĚĞ observações é muito grande. Nestas situações, os problemas que vimos na determinação das medidas separatrizes tornam-se irrelevantes. Especialmente levando-se em conta que nem acesso a todos os dados nós temos (ou seja, obrigatoriamente considerações têm que ser feitas). Quando os dados estão agrupados em classes, não há mais ?ǀĂƐƚŽ�ĐĂŵƉŽ�ĚĞ�ĂƌďŝƚƌĂƌŝĞĚĂĚĞ ?na determinação dos quartis (ou dos decis, ou dos percentis). O método é sempre o mesmo. Para resolver exercícios de medidas separatrizes para dados agrupados em classes, utilizamos interpolação linear. Vai funcionar mais ou menos assim. Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 Precisamos trabalhar com valores de frequências acumuladas (não importa se absolutas ou relativas, importa que sejam acumuladas). Neste ponto a conta é diferente de média e moda. Para média e moda sempre usamos frequências simples. Para medidas separatrizes (incluindo mediana) é o contrário: frequências acumuladas. Para determinados valores de frequências acumuladas, saberemos muito bem quais os valores da nossa sequência de dados são correspondentes. Para outros, não. Estes outros valores nós determinaremos por meio da interpolação linear. Novamente: se tivéssemos que apontar um tópico de estatística descritiva como o mais cobrado em concursos, seria exatamente este: o cálculo de medidas separatrizes para dados agrupados em classes utilizando interpolação linear. Vamos a alguns exercícios para ver como fica. (Esaf) Considere a tabela de frequências seguinte correspondente a uma amostra da variável X. Não existem observações coincidentes com os extremos das classes. Classes Frequências acumuladas 2.000 - 4.000 5 4.000 - 6.000 16 6.000 - 8.000 42 8.000- 10.000 77 10.000 - 12.000 89 12.000 - 14.000 100 Assinale a opção que corresponde à estimativa do valor x da distribuição amostral de X que não é superado por cerca de 80% das observações. a) 10.000 b) 12.000 c) 12.500 d) 11.000 e) 10.500 Resolução: Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 A pergunta pode ser resumida como: qual o valor do oitavo decil? Ou seja, quer se saber qual valor deixa à sua esquerda 80% dos dados. Ou ainda, qual valor não é superado por 80% das observações. O primeiro passo é verificar se as frequências dadas são acumuladas. Para medidas separatrizes, sempre devemos utilizar frequências acumuladas. Não importa se forem absolutas ou relativas. Basta que sejam acumuladas. Lembre que aqui é o contrário do cálculo para média e moda. Para média e moda sempre utilizamos frequências simples. No caso, o exercício já deu as frequências acumuladas. Não temos que fazer nenhuma transformação. Antes de responder à pergunta, vamos relembrar um pouco do significado de uma tabela de frequências acumuladas. Observe a linha em vermelho. Classes Frequências acumuladas 2.000 - 4.000 5 4.000 - 6.000 16 6.000 - 8.000 42 8.000 - 10.000 77 10.000 - 12.000 89 12.000 - 14.000 100 O que ela significa? O que significa dizer que a frequência acumulada da classe 8.000 àW10.000 é igual a 77? Significa que temos 77 valores de X nesta classe ou nas classes anteriores. Significa que temos 77 valores de X entre 2.000 e 10.000. E se a pergunta fosse: qual o valor que não é superado por 77% das observações? Se a pergunta fosse essa, não precisaríamos fazer nenhuma conta. Bastaria olhar direto na tabela. Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 Se 77 valores de X estão entre 2.000 e 10.000, concluímos que o valor de X que não é superado por 77% das observações é justamente 10.000. Classes Frequências acumuladas 2.000 - 4.000 5 4.000 - 6.000 16 6.000 - 8.000 42 8.000 - 10.000 77 10.000 - 12.000 89 12.000 - 14.000 100 O valor 10.000 não é superado por 77% das observações E se a pergunta fosse: qual o valor não é superado por 89% das observações? Novamente, não precisaríamos fazer nenhuma conta. Bastaria olhar na tabela. Veja a linha em vermelho. Classes Frequências acumuladas 2.000 - 4.000 5 4.000 - 6.000 16 6.000 - 8.000 42 8.000 -10.000 77 10.000 - 12.000 89 12.000 - 14.000 100 O valor 12.000 não é superado por 89% das observações Temos 89 valores entre 2.000 e 12.000. Ou seja, 12.000 não é superado por 89% das observações. O problema é que a pergunta foi qual o valor não é superado por 80% das observações. E na coluna de frequências acumuladas não temos o valor 80. Logo, não temos como saber qual é o valor de X que não é superado por 80% das observações. O que faremos? Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 sĂŵŽƐ à“ĐŚƵƚĂƌà弃? sĂŵŽƐ ĨĂnjĞƌ ƵŵĂ ĐŽŶƐŝĚĞƌĂĕĆŽà? sĂŵŽƐ ĐŽŶƐŝĚĞƌĂƌ ƋƵĞ Ž ŐƌĄĨŝĐŽ ĚŽƐ ǀĂůŽƌĞƐ ĚĞ frequências acumuladas versus valores de X se comporta como um conjunto de segmentos de reta. Neste curso nós não vamos ficar desenhando gráficos de segmentos de reta. Vamos só utilizar o resultado destes gráficos. Classes Frequências acumuladas 2.000 - 4.000 5 4.000 - 6.000 16 6.000 - 8.000 42 8.000 -10.000 77 10.000 - 12.000 89 12.000 - 14.000 100 Sabemos que o valor 10.000 corresponde a uma frequência acumulada de 77. Sabemos que o valor 12.000 corresponde a uma frequência acumulada de 89. A pergunta é: quem corresponde a 80? (vamos chamar de Z) Sabemos que 80 está entre 77 e 89. Portanto, o valor que a ele corresponde tem que estar entre 10.000 e 12.000. 10.000 77 10.000 corresponde a 77 Z=? 80 Quem corresponde a 80? 12.000 89 12.000 corresponde a 89 Na interpolação linear, nós vamos fazer o seguinte. Fazemos a segunda linha menos a primeira. Fazemos a terceira linha menos a primeira. Primeira linha 10.000 77 Segunda linha Z 80 Terceira linha 12.000 89 Subtraindo, ficamos com: Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 ܼ െ 猃?Ǥ 爃爃? 稃?െ 礃? 猃?Ǥ 爃爃?െ 猃?Ǥ 爃爃? 稃?െ 礃? A interpolação linear nos diz que as diferenças das linhas de baixo com a linha de cima são proporcionais. ܼ െ 猃?Ǥ 爃爃? 猃?Ǥ 爃爃?െ 猃?Ǥ 爃爃?ൌ 稃?െ 礃? 稃?െ 礃? Isolando o Z, temos: ܼ ൌ 猃?Ǥ 爃爃? ?Ǥ 爃爃?ൈ ? 猃?ܼ ൌ 猃?Ǥ 眃爃? Concluindo: O valor 10.500 não é superado por 80 observações. Gabarito: E. Antes de passarmos para o próximo exercício, vamos mostrar graficamente o que foi feito. Para os dados fornecidos, podemos construir a seguinte tabela de frequências acumuladas: Valores F 2.000 0 4.000 5 6.000 16 8.000 42 10.000 77 12.000 89 14.000 100 Podemos plotar estes valores num gráfico. Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 Ou seja, para alguns valores, sabemos exatamente as respectivas frequências acumuladas. Mas não sabemos qual valor corresponde à frequência acumulada 80 (ou qual o oitavo decil). Assim, supomos que o gráfico acima é composto por diversos segmentos de retas que unem os pontos conhecidos. Com esta suposição, passamos a ter, para qualquer frequência acumulada, a respectiva observação. E vice-versa. Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 Esta suposição de que o gráfico é formado por segmentos de reta é justamente a interpolação linear. O gráfico acima é por vezes chamado de ogiva de Galton. E a interpolação linear acaba sendo chamada de interpolação da Ogiva. Mas estes são só nomes diferentes para a mesma coisa. Assim, em vez de resolvermos o exercício da forma como fizemos, poderíamos trabalhar diretamente com o gráfico. Mas como ficar desenhando gráfico é meio trabalhoso, vou fazer uma vez só. A pergunta é: qual valor corresponde à frequência acumulada 80? Ou ainda: qual o valor de Z da figura acima? Vamos analisar apenas uma parte do gráfico. Vamos olhar apenas para o penúltimo segmento de reta. Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 Podemos visualizar dois triângulos no gráfico acima. O primeiro, menor, destacado em verde: A altura deste triângulo mede 3 ( 稃?� െ � 礃?� ൌ � ?). A base deste triângulo mede ܼ െ 猃?Ǥ 爃爃?. Há outro triângulo, maior, destacado em azul. Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 A altura deste triângulo maior é 12 ሺൌ � 稃?� െ � 礃?ሻǢ Sua base mede 2.000 ሺൌ 猃?Ǥ 爃爃?� െ � 猃?Ǥ 爃爃?ሻǤ Estes dois triângulos são semelhantes. Portanto, a relação entre as alturas é igual à relação entre as bases. Assim: ���� ൌ ���� ܼ െ 猃?Ǥ 爃爃? ?Ǥ 爃爃? ൌ ? 猃? E foi exatamente desta igualdade que partimos para resolver o problema. Ou seja, esta igualdade nada mais é que o resultado da semelhança de triângulos, triângulos estes obtidos por causa da interpolação linear. Vitor Menezes, GustavoMenezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 Aqui em nosso curso, acho que não é muito proveitoso ficar resolvendo os exercícios diretamente no gráfico. Portanto, nos próximos exercícios de concursos, faremos o primeiro procedimento visto, achando as três linhas, subtraindo as duas de baixo pela de cima. Para encerrar o exercício, destaco que, por causa das alternativas, há uma solução mais rápida. Olhando a tabela do enunciado, temos que: 10.000 77 10.000 corresponde a 77ܼ ൌǫ 80 Quem corresponde a 80? 12.000 89 12.000 corresponde a 89 80 está entre 77 e 89. O número que a ele corresponde (ൌ ܼ), portanto, está entre 10.000 e 12.000. Logo, não pode ser o próprio 10.000, nem o próprio 12.000. Já descartamos as letras A e B. a) 10.000 b) 12.000 c) 12.500 d) 11.000 e) 10.500 Se o número procurado está entre 10.000 e 12.000, então ele também não pode ser igual a 12.500. Descartamos a letra C. a) 10.000 b) 12.000 c) 12.500 Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 d) 11.000 e) 10.500 Como 80 está mais próximo de 77 do que de 89, o número a ele correspondente deve estar mais próximo de 10.000 do que de 12.000. Assim, descartamos a letra D, pois 11.000 está exatamente no meio entre 10.000 e 12.000. a) 10.000 b) 12.000 c) 12.500 d) 11.000 e) 10.500 E marcamos a letra E. (FCC) Salários (R$) Frequências simples absolutas 500 a 1.000 100 1.000 a 1.500 300 1.500 a 2.000 500 2.000 a 2.500 400 2.500 a 3.000 300 O valor da mediana dos salários dos empregados, obtido pelo método da interpolação linear, é igual a (A) R$ 1.750,00 Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 (B) R$ 1.800,00 (C) R$ 1.850,00 (D) R$ 1.900,00 (E) R$ 1.950,00 Resolução Primeiro determinamos as frequências acumuladas: Salários (R$) f F 500 a 1.000 100 100 1.000 a 1.500 300 400 1.500 a 2.000 500 900 2.000 a 2.500 400 1.300 2.500 a 3.000 300 1.600 O total de observações é 1.600 (vide última frequência acumulada). A mediana corresponde à frequência acumulada F = 800 (pois ela não é superada por metade das observações. Notem que na coluna de frequências acumuladas àWF àWnão há o valor 800. Então tomamos os valores que o circundam, quais sejam, 400 e 900: 1.500 400 1.500 corresponde a F = 400ܦ ൌǫ 800 Quem corresponde a 800? 2.000 900 2.000 corresponde a F = 900 Agora basta subtrair as linhas e montar as frações:ܦ െ ?Ǥ 眃爃? ?Ǥ 爃爃?െ ?Ǥ 眃爃?ൌ 稃爃?െ 瘃爃? 笃爃?െ 瘃爃?ܦ െ ?Ǥ 眃爃? 眃爃? ൌ 瘃爃? 眃爃? Cancelando 500 com 500: ܦ െ ?Ǥ 眃爃?ൌ 瘃爃?ܦ ൌ ?Ǥ 笃爃? Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 Resposta: D Para encerrar o assunto, falta ver um resultado muito interessante, envolvendo medidas separatrizes e o histograma. Vamos tratar disso diretamente nas questões: (FCC) Considere o histograma da variável X a seguir, em que as frequências simples absolutas foram anotadas no interior dos retângulos. O valor do terceiro quartil de X é: a) 40 b) 35 c) 30 d) 25 e) 12 Resolução: Vamos achar qual a tabela de frequências simples que corresponde ao histograma acima. O histograma dado corresponde à seguinte tabela: Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 Classes Frequência absoluta simples 20 - 25 5 25 - 30 15 30 - 35 25 35 - 40 8 40 - 45 7 Total 60 O terceiro quartil é o valor que não é superado por 75% das observações. Como são 60 dados, o terceiro quartil é valor que não é superado a 45 observações. Ou seja, é o valor que corresponde à frequência acumulada 45. Abaixo segue a tabela de frequências acumuladas: Classes Frequência simples Frequência acumulada 20 - 25 5 5 25 - 30 15 20 30 - 35 25 45 35 - 40 8 53 40 - 45 7 60 E nem precisamos fazer a interpolação linear. Na tabela acima temos direto o valor que corresponde à frequência acumulada 45. Este valor é 35. Ou seja, 35 é o terceiro quartil. Gabarito: B. Agora eu queria chamar a atenção para um detalhe. Voltemos ao histograma. Considere apenas a área à esquerda do terceiro quartil. É a área destacada em verde na figura abaixo. Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 Temos três retângulos verdes. O primeiro tem altura igual a 5. O segundo tem altura igual a 15. O terceiro tem altura igual a 25. Todos eles têm base igual a 5. A área total desses três retângulos fica: �� ൌ ? ൈ ? ? ൈ 猃? ? ൈ 球?ൌ 球球? Agora vejamos qual a área total de todos os retângulos (área amarela da figura abaixo). Temos cinco retângulos, todos com base 5. Os três primeiros nós já analisamos. Juntos, eles têm área de 225. Os dois últimos têm alturas de 8 e 7. A área dos dois últimos fica: ? ൈ ? ? ൈ ? ൌ 礃? Portanto, a área amarela é de: Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 �� ൌ 球球? 礃?ൌ 甃爃? Vamos dividir as áreas? ���� ൌ 球球? 甃爃?ൌ ?ǡ 礃?ൌ 礃眃? A área à esquerda de 35 (=área verde) é igual a 75% da área total. E 35 é justamente o terceiro quartil, ou seja, o valor que não é superado por 75% das observações. Isso não é coincidência. Um histograma também pode ser útil para achar medidas separatrizes. As áreas a esquerda de um dado valor têm íntima relação com a posição que este valor ocupa. Por exemplo, a área à esquerda da mediana será sempre igual a 50% da área total. A área à esquerda do primeiro quartil será sempre igual a 25% da área total. A área à esquerda do terceiro quartil será sempre igual a 75% da área total. E assim por diante. (FCC) A distribuição dos salários dos 200 funcionários, em R$ 1.000,00, de determinada carreira profissional em um órgão público está representada pelo histograma abaixo. No eixo vertical estão assinaladas as respectivas densidaĚĞƐ ĚĞ ĨƌĞƋƵġŶĐŝĂƐà? Ğŵ à縀‘à? à堃?à唃?à?á㸃?à? �ĞĨŝŶĞ-se densidade de frequência de um intervalo de classe como sendo o quociente da divisão da respectiva frequência relativa pela correspondente amplitude do intervalo. Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 O terceiro retângulo tem base 3 e altura 0,15. Área: ? ൈ � ?ǡ 猃?ൌ ?ǡ 瘃? O último retângulo tem base 2 e altura 0,05. Área: ? ൈ � ?ǡ 爃?ൌ ?ǡ ? Somando todas as áreas: ?ǡ ? ?ǡ 球? ?ǡ 瘃? ?ǡ ? ൌ ? Isso vale sempre. Se o histograma for baseado em densidades de frequências, a área total é 1. A área entre os salários de 4.000 e 8.000 está destacada abaixo: Esta área corresponde à soma das áreas de 0,25 e 0,45. A área verde é igual a: ?ǡ 球? ?ǡ 瘃?ൌ ?ǡ ? 70% dos funcionários têm salários entre R$4.000,00 e R$8.000,00. Lembrando que ao todo são 200 funcionários. Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 礃爃? �݀݁� 球爃?ൌ ?ǡ ? ൈ 球爃?ൌ 猃瘃? 140 funcionários têm salários entre R$ 4.000,00 e R$8.000,00. Gabarito: D Muitos alunos, depois de estudarem o cálculo de quantis para dados em classe, passam a confundir a matéria. Eles passam a querer usar a interpolação linear para tudo, mesmo para o caso em que os dados não estiverem em classe. Não podemos fazer isso, vai dar errado! Nós vimos formas diferentes e cálculo para dados agrupados por valor e para dados em classe, e elas devem ser respeitadas. Para quem tiver interesse em entender o motivo disso, gravei o vídeo a seguir. Ele é totalmente opcional, é só uma curiosidade. Para a sua prova basta você saber que a interpolação linear só pode ser usada para o caso de dados em classe. https://vimeo.com/137722362 1.6 - PROPRIEDADES DAS MEDIDAS SEPARATRIZES Nós estudamos as seguintes propriedades para a média: Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 x somando ou subtraindo uma constante c de cada elemento do conjunto de dados, a média do novo conjunto fica aumentada ou diminuída de c. x multiplicando ou dividindo cada elemento do conjunto de dados por uma constante c, a média do novo conjunto fica multiplicada ou dividida por c. Estas mesmas propriedades valem para a mediana (e para qualquer outra medida separatriz). Contudo, as questões só costumam cobrar tais propriedades aplicadas à média aritmética. Ou seja, se multiplicarmos todo o conjunto de dados por 3, a mediana será triplicada. Se dividirmos todo o conjunto de dados por 4, a mediana será dividida por 4. Se somarmos 5 a todos os dados, a mediana será aumentada em 5. Se subtrairmos 8 de todos os dados, a mediana será reduzida em 8. Vimos também que outras duas propriedades da média são: x a média aritmética é o valor em relação ao qual é mínima a soma dos quadrados dos desvios x a soma dos desvios em relação à média é igual a zero. Estas propriedades são melhor estudadas dentro de "medidas de dispersão". Pois bem, para a mediana existe uma propriedade parecida. A soma dos módulos dos desvios é mínima quando eles são calculados em relação à mediana. Tal propriedade é detalhada dentro de "medidas de dispersão". Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 2 ʹMODA 2.1 ʹ INTRODUÇÃO A moda é mais uma medida de tendência central. De forma bem simples e direta, dizemos que: A moda é o termo que mais se repete. Fácil, não? Podemos até nos lembrar do uso comum da palavra. Geralmente Ž ƋƵĞ ĞƐƚĄ ŶĂ à‘ŵŽĚĂà? Ġ o que todo mundo usa. Pois bem, o termo que aparecer mais vezes na nossa série de dados será a moda. 2.2 ʹMODA PARA DADOS EM ROL OU AGRUPADOS POR VALOR Considere a seguinte pesquisa salarial com dez moradores do bairro Alfa. Rol (dados em R$ 1.000,00): 1, 2, 2, 2, 3, 4, 4, 5, 6, 7. Qual o salário que mais se repetiu? Foi o salário de R$ 2.000,00. Três pessoas ganham um salário de R$ 2.000,00. Este valor é justamente a moda. ܯ ൌ ? Comparada às demais medidas de posição, a moda tem o inconveniente de não se prestar à análise matemática. Tanto a mediana quanto a média (principalmente a média!) possuem propriedades matemáticas que as tornam mais úteis. �ŵ ƌĞůĂĕĆŽ ă ŵŽĚĂà? Ž ĂƵƚŽƌ tŝůůŝĂŵ ^ƚĞǀĞŶƐŽŶà? Ğŵ ƐĞƵ ůŝǀƌŽ à“�ƐƚĂƚşƐƚŝĐĂ �ƉůŝĐĂĚĂ ă �ĚŵŝŶŝƐƚƌĂĕĆŽà弃? traz: Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 à“dŽĚĂǀŝĂà? ĚĞ Ƶŵ ƉŽŶƚŽ ĚĞ ǀŝƐƚĂ ƉƵƌĂŵĞŶƚĞ ĚĞƐĐƌŝƚŝǀŽà? Ă ŵŽĚĂŝŶĚŝĐĂ Ž ǀĂůŽƌ à‘ƚşƉŝĐŽà? Ğŵ ƚĞƌŵŽƐ ĚĂ maior ocorrência. A utilidade da moda se acentua quando um ou dois valores, ou um grupo de valores, ocorrem com muito maior frequência que outros. Inversamente, quando todos ou quase todos os valores ocorrem aproximadamente com a mesma frequência, a moda nada acrescenta em ƚĞƌŵŽƐ ĚĞ ĚĞƐĐƌŝĕĆŽ ĚŽƐ ĚĂĚŽƐà堃? Assim como no caso da média, para determinação da moda sempre utilizamos frequências simples. Tanto faz ser absoluta ou relativa, mas tem que ser simples. Exemplo: Encontre a moda para os seguintes conjuntos de dados: a) 1, 2, 5, 4, 6, 2, 3, 3, 3 b) 1, 2, 2, 3, 3, 4 c) 2, 8, 5, 1 d) 1, 1, 1, 1, 2, 2 ,2, 2, 2, 3, 4, 4, 4, 5, 5, 6, 8, 9, 19, 20, 20 Resolução: a) O termo que mais se repete é o três. ܯ ൌ ? b) Há dois termos que se repetem mais vezes. Tanto o 2 quanto o 3 ocorrem duas vezes. Dizemos que o conjunto tem duas modas. É bimodal. Um conjunto não precisar ter uma única moda. Pode ter duas, três, quatro, ou mais modas. c) Note que todos os termos da sequência ocorrem com a mesma frequência. Dizemos que o conjunto é amodal. Não tem moda. d) O termo que mais se repete é o 2. Ocorre cinco vezes. Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 ܯ ൌ ? Exemplo: Considere a seguinte tabela: Valor observado Frequência relativa acumulada 10 0,1 15 0,2 18 0,5 20 0,7 21 1 Calcule a moda para os dados agrupados acima representados. Resolução: Foram fornecidas frequências acumuladas. Para calcular média e moda, sempre trabalhamos com frequências simples (relativas ou absolutas, tanto faz). Encontremos então as frequências relativas simples correspondentes. Valor observado Memória de cálculo Frequência relativa simples Frequência relativa acumulada 10 = 0,1 0,1 0,1 15 = 0,2 - 0,1 = 0,1 0,1 0,2 18 = 0,5 - 0,2 = 0,3 0,3 0,5 20 = 0,7 - 0,5 = 0,2 0,2 0,7 21 = 1 - 0,7 = 0,3 0,3 1 Para encontrar a moda, basta tomarmos o valor que corresponde à maior frequência simples. No caso, as maiores frequências são iguais a 0,3. Há duas modas. O conjunto é bimodal. As modas são 18 e 21. Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 2.3 ʹMODA PARA DADOS EM CLASSE Quando os dados estão agrupados em classes, perdemos informação. Deste modo, a exemplo do que fizemos com a média, para deterŵŝŶĂĕĆŽ ĚĂ ŵŽĚĂ ƉƌĞĐŝƐĂƌĞŵŽƐ ĚĂƌ Ƶŵ à“ĐŚƵƚĞà?à? /ƐƐŽ ŵĞƐŵŽà? Precisaremos fazer algumas considerações. Vejamos como fica por meio de um exercício. (Fundação Carlos Chagas) Considere a tabela abaixo, que mostra a distribuição de salários (em reais) de 160 funcionários de determinada empresa, com suas respectivas frequências relativas acumuladas. Classes em reais Frequência relativa acumulada (%) [600, 1.000) 10 [1.000, 1.400) 30 [1.400, 1.800) 70 [1.800, 2.200) 95 [2.200, 2.600) 100 O valor modal dos salários (desprezando os centavos), é: a) 1784 b) 1666 c) 1648 d) 1636 e) 1628 Resolução: Antes de mais nada vamos determinar as frequências simples Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 Classes em reais Frequência relativa acumulada (%) Frequência relativa simples (%) Memória de cálculo [600, 1.000) 10 10 =10 [1.000, 1.400) 30 20 =30-10 [1.400, 1.800) 70 40 =70-30 [1.800, 2.200) 95 25 =95-70 [2.200, 2.600) 100 5 =100-95 Vamos começar o cálculo da moda. Primeiro passo: encontrar a classe modal. Classe modal é a classe que contém a moda. Note que não temos como saber em qual classe a moda está. Isto porque apenas temos acesso à quantidade de salários em cada classe de valores. Não sabemos quanto, exatamente, cada um dos 160 funcionários desta empresa ganha. Se não sabemos disto, não temos como ver qual o salário que mais se repete. Portanto, não temos como calcular a moda. O que faremos?sĂŵŽƐ à“ĐŚƵƚĂƌà弃? � ŝƐƐŽ ŵĞƐŵŽà? EĆŽ ƚĞŵŽƐ ĐŽŵŽ ƐĂďĞƌ ƋƵĂů Ă ŵŽĚĂ ǀĞƌĚĂĚĞŝƌĂà? K ŵĄdžŝŵŽ ƋƵĞ podemos fazer é, a partir de algumas cŽŶƐŝĚĞƌĂĕƁĞƐà? ĚĞƚĞƌŵŝŶĂƌ Ƶŵ à“ƉƌŽǀĄǀĞůà? ǀĂůŽƌ ƉĂƌĂ Ă ŵŽĚĂà? EŽ ĐĄůĐƵůŽ ĚĂ ŵŽĚĂ ƐĆŽ ĚŽŝƐ à“ĐŚƵƚĞƐà? à縁?Ƶ ĚƵĂƐ ĐŽŶƐŝĚĞƌĂĕƁĞƐà?à? � ƉƌŝŵĞŝƌĂ ĚĞůĂƐ Ġ ĚŝnjĞƌ ƋƵĞ Ă ŵŽĚĂ está na classe [1400;1800). Por quê? Porque esta é a classe com maior frequência simples. Chamamos de classe modal. A classe com maior frequência simples é a classe modal. Vamos supor que a moda pertence a esta classe. Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 EŽǀĂŵĞŶƚĞà? ŝƐƚŽ Ġ ĂƉĞŶĂƐ Ƶŵ à“ƉĂůƉŝƚĞà弃? ^ĞƌŝĂ ƉĞƌĨĞŝƚĂŵĞŶƚĞ ƉŽƐƐşǀĞů ƋƵĞ ƚŽĚĂƐ ĂƐ à? ƉĞƐƐŽĂƐ à縃?à? á? 40% de 160) que pertencem à classe [1400,1800) ganhem cada uma um salário diferente. Ou seja, cada uma das ocorrências nesta classe teria frequência simples absoluta igual a 1. E seria possível que todas as oito pessoas (5% de 160) que pertencem à classe [2200,2600) ganhem exatamente o mesmo salário de R$ 2.300,00. Justamente a classe com menor frequência poderia conter a moda. Esta situação seria perfeitamente possível. Contudo, o palpite que se faz, por ser mais razoável, é o de que a moda pertença à classe que tem a maior frequência. Classes em reais Frequência relativa simples (%) [600, 1.000) 10 Classe anterior [1.000, 1.400) 20 Classe modal [1.400, 1.800) 40 Classe posterior [1.800, 2.200) 25 [2.200, 2.600) 5 Uma outra interpretação para classe modal é a que segue. Quando os dados estão agrupados em classes, perdemos informação. Não sabendo mais quais os valores foram observados, só podemos nos referir aos intervalos de classe. Considerando os intervalos, aquele que abriga mais ocorrências ƐĞƌŝĂ Ă à“ŵŽĚĂà? ĚĂƐ Đlasses, ou ainda, a classe modal. Segundo passo: determinar os valores de amplitude, frequência e limite inferior da classe modal. A classe modal é a de [1400,1800). Qual sua amplitude? A amplitude da classe é a diferença entre o limite superior e o limite inferior. No caso: ݄ ൌ ?Ǥ 稃爃?െ ?Ǥ 瘃爃?ൌ 瘃爃? Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 Logo, sua amplitude é de 400 (݄� ൌ � 瘃爃?). A frequência da classe modal é de 40% ሺ ݂ � ൌ � ?ǡ ?ሻǤ�Basta olhar na tabela fornecida acima. O limite inferior da classe modal é 1400 ሺ݈ெ � ൌ � 猃瘃爃?ሻ. Terceiro passo: determinar os valores das frequências das classes anterior e posterior. A classe que vem logo antes da classe modal é a classe [1000,1400). Esta é a classe anterior. A frequência da classe anterior é 20% ݂௧ � ൌ � ?ǡ ? A classe que vem logo depois da classe modal é a classe [1800,2200). Esta é a classe posterior. A frequência da classe posterior é 25% ݂௦௧ � ൌ � ?ǡ 球? Identificados todos esses elementos, basta aplicar uma fórmula. É a chamada fórmula de Czuber. Esta fórmula é fruto de uma segunda consideração. Ela considera que os valores das frequências se comportam segundo uma parábola. É claro que nós não vamos ficar desenhando gráficos de parábola. Para concurso, é muito mais prático gravar logo a fórmula de Czuber. Resumindo: quando os dados estão em classes, o cálculo da moda se resume à aplicação da seguinte fórmula (de Czuber): ܯ ൌ ݈ெ ݄ ൈ� ெ݂ െ ݂௧ሺ ெ݂ � െ � ݂௧ሻ � ൫ ெ݂ � െ � ݂௦௧൯ Onde: x ݈ெ é o limite inferior da classe modal x ݄ é a amplitude da classe modal x ெ݂ é a frequência da classe modal x ݂௧ é a frequência da classe anterior Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 x ݂௦௧ é a frequência da classe posterior Substituindo os valores: ܯ ൌ ?Ǥ 瘃爃? 瘃爃?ൈ� ?ǡ ? െ ?ǡ ?ሺ ?ǡ ? െ ?ǡ ?ሻ ሺ ?ǡ ? െ ?ǡ 球?ሻൎ ?Ǥ 砃球?ǡ 眃?��� Gabarito: E Vamos tentar entender um pouquinho da fórmula, pois assim fica mais fácil gravá-la. Sabemos que a moda está na classe [1400; 1800), que é a classe modal. Na figura abaixo, representamos o intervalo que contém a moda: Assim, a moda será igual a 1400 mais alguma coisa. Por isso a fórmula começa com o limite inferior da classe modal. ܯ ൌ ݈ெ ڮ ܯ ൌ ?Ǥ 瘃爃? ڮ (a moda é igual a 1400 mais alguma coisa) Em seguida, temos a amplitude de classe. ܯ ൌ ݈ெ � �݄ ൈ�ǫ ܯ ൌ ?Ǥ 瘃爃? 瘃爃?ൈ�ǫ Assim, ao 1400 nós somaremos a amplitude de classe, que será multiplicada por um número ainda desconhecido (é a interrogação da equação acima). Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 Esse número desconhecido varia entre 0 e 1. Se ele valesse zero, então a moda seria exatamente igual a 1.400. ܯ ൌ ?Ǥ 瘃爃?� � 瘃爃?ൈ � ?� ൌ � ?Ǥ 瘃爃? (se a interrogação valesse 0, a moda seria igual a 1.400) Se o número desconhecido valesse 1, a moda seria exatamente igual a 1.800: ܯ ൌ ?Ǥ 瘃爃? 瘃爃?ൈ � ?� ൌ � ?Ǥ 稃爃? (se a interrogação valesse 1, a moda seria 1.800) Sabemos que a moda vai estar no intervalo entre 1.400 e 1.800. O valor da interrogação pode variar entre zero e 1. À medida que ele varia, a moda pode assumir qualquer valor nesse intervalo, partindo de um extremo (1.400) ao outro (1.800). E, finalmente, vamos ver quem é a tal da interrogação. O número que multiplica a amplitude de ĐůĂƐƐĞ ǀĂŝ ƌĞƉƌĞƐĞŶƚĂƌ ƵŵĂ à“ďĂƚĂůŚĂà? ĞŶƚƌĞ ĂƐ ĐůĂƐƐĞƐ ĂŶƚĞƌŝŽƌ Ğ ƉŽƐƚĞƌŝŽƌà? �ŵďĂƐ ǀĆŽ ƚĞŶƚĂƌ à“ƉƵdžĂƌà? a moda para o seu lado. E quem ganha a batalha? Aquela que apresentar uma frequência mais próxima da frequência da ĐůĂƐƐĞ ŵŽĚĂůà? WŽƌ ŝƐƐŽà? Ž ŵƵůƚŝƉůŝĐĂĚŽƌ ƋƵĞ ĞƐƚĄǀĂŵŽƐ ƉƌŽĐƵƌĂŶĚŽ Ġ ďĂƐĞĂĚŽ Ğŵ à“ĚŝĨĞƌĞŶĕĂƐà?à? �ůĞ Ġ baseado nas diferenças entre a frequência da classe modal e as frequências anterior e posterior. Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 ǫ ൌ ெ݂ െ ݂௧ሺ ெ݂ � െ � ݂௧ሻ � ൫ ெ݂ � െ � ݂௦௧൯ E a fórmula da moda fica: ܯ ൌ ݈ெ ݄ ൈ� ெ݂ െ ݂௧ሺ ெ݂ � െ � ݂௧ሻ � ൫ ெ݂ � െ � ݂௦௧൯ Para este exercício, temos: Frequência da classe anterior 20 Frequência da classe modal 40 Frequência da classe posterior 25 Ok, isso é o que foi dado na questão. Agora, vamos mudar um pouquinho esses valores. Vamos pensar nos casos extremos. Se a frequência da classe anterior fosse bem próxima de 40, como ficaria o cálculo da moda? Ou seja, estamos imaginando a seguinte situação: Frequência da classe anterior 39,999 Frequência da classe modal 40 Frequência da classe posterior 25 Nesse caso, a frequência da classe anterior seria bem próxima da frequência da classe modal. Assim, a classe anterior puxaria a moda para seu lado. ெ݂ െ ݂௧ ൌ 瘃?െ 甃?ǡ 笃笃?ൎ ? Assim: ܯ ൌ ݈ெ ݄ ൈ� ெ݂ െ ݂௧ሺ ெ݂ � െ � ݂௧ሻ � ൫ ெ݂ � െ � ݂௦௧൯ Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 ܯ ൌ ?Ǥ 瘃爃? 瘃爃?ൈ � ?ሺ ெ݂ � െ � ݂௧ሻ � ൫ ெ݂ � െ � ݂௦௧൯ ൌ ?Ǥ 瘃爃? A classe anterior ganharia a batalha, trazendo a moda para algo bem próximo de 1400. Por definição, a maior frequência deve ser a da classe modal. Mas se fosse possível ter a frequência anterior exatamente igual a 40, aí a moda seria exatamente igual a 1400. A classe anterior ganharia Ă ďĂƚĂůŚĂà? ĐŽŵ ĨŽůŐĂà? à“ƉƵdžĂŶĚŽà? Ă ŵŽĚĂ ƉĂƌĂ ƵŵĂ ĚĂƐ ĞdžƚƌĞŵŝĚĂĚĞƐà? Pensemos agora no outro caso extremo. Vamos imaginar a seguinte situação: Frequência da classe anterior 20 Frequência da classe modal 40 Frequência da classe posterior 39,999 Se a frequência posterior fosse bem próxima de 40, aí aclasse posterior é que puxaria a moda para o seu lado. Ficaria assim: ெ݂ െ ݂௦௧ � ൌ � 瘃?െ 甃?ǡ 笃笃?ൎ � ? Logo: ܯ ൌ ݈ெ ݄ ൈ� ெ݂ െ ݂௧ሺ ெ݂ � െ � ݂௧ሻ � ൫ ெ݂ � െ � ݂௦௧൯ ܯ ൌ ?Ǥ 瘃爃? 瘃爃?ൈ � ெ݂ െ ݂௧ሺ ெ݂ � െ � ݂௧ሻ � ? ܯ ൌ ?Ǥ 瘃爃? 瘃爃?ൈ � ெ݂ െ ݂௧ሺ ெ݂ � െ � ݂௧ሻ� ൌ ?Ǥ 瘃爃? 瘃爃?ൈ ? ൌ ?Ǥ 稃爃? Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 Nessa segunda situação, a classe posterior ganha a batalha, trazendo a moda para próximo de 1800. Se fosse possível ter a frequência posterior igual a 40, aí a moda seria exatamente igual a 1800. A classe posterior ganharia a batalha com folga, puxando a moda para a sua extremidade. Um terceiro caso notável acontece quando as frequências anterior e posterior são iguais. Vamos imaginar o seguinte quadro: Frequência da classe anterior 28 Frequência da classe modal 40 Frequência da classe posterior 28 Agora, as duas classes empatam na batalha. Ninguém ganha a briga. Ninguém puxa a moda para o seu lado. Assim, a moda ficará exatamente no meio do intervalo entre 1400 e 1800. ܯ ൌ ݈ெ ݄ ൈ� ெ݂ െ ݂௧ሺ ெ݂ � െ � ݂௧ሻ � ൫ ெ݂ � െ � ݂௦௧൯ ܯ ൌ ?Ǥ 瘃爃? 瘃爃?ൈ � 瘃?െ 球?ሺ 瘃?� െ � 球?ሻ � ሺ 瘃?� െ � 球?ሻ ܯ ൌ ?Ǥ 瘃爃?� � 瘃爃?ൈ � ?ǡ ? ൌ ?Ǥ 砃爃? Acontece que, neste exercício (como acontece na grande maioria das questões), não temos ŶĞŶŚƵŵĂ ĚĂƐ ƐŝƚƵĂĕƁĞƐ à“ŶŽƚĄǀĞŝƐà弃? �ƉĞƐĂƌ ĚŝƐƐŽà? ĞŶƚĞŶĚġ-las pode ser bem útil para resolver as questões com maior rapidez. Em geral, as questões apresentam números que se aproximam mais desta última situação apresentada, o que pode facilitar bastante as coisas para gente. Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 No próximo exercício veremos um caso muito interessante, em que dava para matar a questão sem fazer conta alguma. (Fundação Carlos Chagas) Salários dos empregados da empresa XYZ em dezembro de 2005 Salários (R$) Frequências simples absolutas 1.000 ٟ� 2.000 2 2.000 ٟ 3.000 8 3.000 ٟ 4.000 16 4.000 ٟ 5.000 10 5.000 ٟ 6.000 4 O valor da moda, obtida com a utilização da fórmula de Czuber, é igual a (desprezar os centavos na resposta): a) R$ 3.201,00 b) R$ 3.307,00 c) R$ 3.404,00 d) R$ 3.483,00 e) R$ 3.571,00 Resolução Vamos destacar as classes: Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 Salários (R$) Frequências simples absolutas 1.000 ٟ� 2.000 2 Classe anterior 2.000 ٟ 3.000 8 Classe modal 3.000 ٟ 4.000 16 Classe posterior 4.000 ٟ 5.000 10 5.000 ٟ 6.000 4 A classe modal vai de 3.000 a 4.000, ou seja, tem seu ponto médio em 3.500. Notem que a classe posterior ganha o cabo de guerra, pois sua frequência é maior que da classe anterior (10 > 8). Assim, a moda deve ser um pouco maior que 3.500. Só temos uma alternativa possível, a letra E. Resposta: E Finalmente, é interessante analisarmos o caso em que a classe modal é a primeira classe ou a última classe. No primeiro caso, não existe classe anterior, já que a classe modal é a primeira. No segundo caso, não existe classe posterior, já que a classe modal é a última. Para contornar esse problema, basta zerar a frequência da classe que não existe. Veja como foi cobrado! (Esaf) A questão diz respeito à distribuição de frequências seguinte associada ao atributo de interesse X. Não existem observações coincidentes com os extremos das classes. Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 Classes Frequências simples 0 - 10 120 10 - 20 90 20 - 30 70 30 - 40 40 40 - 50 20 Assinale a opção que dá a moda no conceito de Czuber. a) 5 b) 4 c) 8 d) 10 e) 15 Resolução: O primeiro passo é identificar a classe modal, ou seja, a classe com maior frequência: Classes Frequências simples 0 - 10 120 10 - 20 90 20 - 30 70 30 - 40 40 40 - 50 20 A classe modal tem frequência 120 ሺ ݂ ൌ 猃球?ሻe amplitude 10 ሺ݄ ൌ 猃?ሻ. Seu limite inferior é 0 ሺ݈ ൌ ?ሻ A classe posterior, ou seja, a classe que vem logo depois, tem frequência 90 ሺ ݂௦௧ ൌ 笃?ሻ A classe anterior não existe, já que a classe modal é a primeira. Para contornar isso, basta considerarmos uma classe fictícia, de -10 a 0, com frequência 0. O que nos dá frequência anterior igual a 0 ሺ ݂௧ ൌ ?ሻ Agora basta aplicar a fórmula: Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 ܯ ൌ ݈ ݄ ൈ � ெ݂ െ ݂௧ሺ ெ݂ � െ � ݂௧ሻ � ൫ ெ݂ � െ � ݂௦௧൯ ܯ ൌ ? 猃?ൈ� 猃球? 猃球?� ሺ 猃球?� െ � 笃?ሻ ܯ ൌ 猃?ൈ � 猃球? 猃球?� 甃? ܯ ൌ ? Gabarito: C 2.4 - MODA BRUTA, MODA DE KING E MODA DE PEARSON Além da muda de Czuber, que é a mais cobrada em provas, existem outras: a moda bruta, a moda de King e a moda de Pearson. Vamos ver duas questões para exemplificar o cálculo. Exemplo: Considere a distribuição de frequências abaixo. Classe Frequência 0 a 5 5 5 a 10 7 10 a 15 12 15 a 20 9 20 a 25 2 Calcule a moda Bruta, a moda de King e a moda de Czuber. Resolução: Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 Nós vimos um único cálculo de moda para dados em classes: a moda de Czuber. E ela, sem dúvidas, é a mais cobrada em provas. Além da moda de Czuber, há a moda de King, a de Pearson e a Moda bruta. A fórmula de Czuber é: ܯ ൌ ݈ெ ݄ ൈ� ெ݂ െ ݂௧ሺ ெ݂ � െ � ݂௧ሻ � ൫ ெ݂ � െ � ݂௦௧൯ Onde: x M é a moda݈ெ é o limite inferior da classe modal x ݄ é a amplitude da classe modal x ெ݂ é a frequência da classe modal x ݂௧ é a frequência da classe anterior x ݂௦௧ é a frequência da classe posterior A classe modal é aquela com maior frequência. No caso, é a classe 10 - 15, que tem frequência 12. ெ݂ ൌ 猃? A amplitude da classe modal é a diferença entre seus limites superior e inferior: ݄ ൌ 猃?െ 猃?ൌ ? A classe anterior tem frequência ݂௧ ൌ ? A classe posterior tem frequência ݂௦௧ ൌ ? O limite inferior da classe modal é 10. A moda de Czuber fica: Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 ܯ ൌ 猃? ? ൈ � 猃?െ ?ሺ 猃?� െ � ?ሻ � ሺ 猃?� െ � ?ሻ ܯ ൌ 猃? ? ൈ � ? ?ܯ ൌ 猃?ǡ 猃球? Ok, agora vamos à moda de King. Ela tem uma fórmula muito parecida com a de Czuber. A diferença é que no cálculo entram apenas as frequências posterior e anterior, ignorando-se ெ݂. A fórmula é: ܯ ൌ ݈ெ ݄ ൈ � ݂௦௧݂௧ ݂௦௧ ܯ ൌ 猃? ? ൈ� ? ? ? ܯ ൌ 猃?ǡ 稃猃球? A moda Bruta é a mais simples de todas. Basta tomar o ponto médio da classe modal: ܯ ൌ � 猃? 猃? ? ൌ 猃?ǡ ? A moda de Pearson tem um cálculo diferente. Vamos deixar para falar dela na questão abaixo, retirada do concurso do Tribunal de Contas de Minas Gerais, elaborado pela Fundação Carlos Chagas. (Fundação Carlos Chagas) O histograma de frequências absolutas a seguir demonstra a distribuição dos salários dos empregados de uma empresa em dezembro de 2006: Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 Classes Frequências 0,5 a 1,5 40 1,5 a 2,5 50 2,5 a 3,5 100 3,5 a 4,5 40 4,5 a 5,5 20 Primeiro vamos calcular a média: Classes Pontosmédiosሺܺሻ Frequênciasሺ݂ሻ ܺ ൈ �݂ 0,5 a 1,5 1 40 40 1,5 a 2,5 2 50 100 2,5 a 3,5 3 100 300 3,5 a 4,5 4 40 160 4,5 a 5,5 5 20 100 Total 250 700 A média de X fica: തܺ ൌ � 礃爃? 球眃?ൌ ?ǡ ? Para encontrar a mediana, precisamos das frequências acumuladas. Classes Frequências Frequências acumuladas 0,5 a 1,5 40 40 1,5 a 2,5 50 90 2,5 a 3,5 100 190 3,5 a 4,5 40 230 4,5 a 5,5 20 250 A mediana não é superada por 125 observações (metade de 250 ൌ�125) Podemos montar o seguinte quadro: Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 Primeira linha 2,5 90 2,5 corresponde a 90 Segunda linha D 125 quem corresponde a 125? Terceira linha 3,5 190 3,5 corresponde a 190 Agora aplicamos a interpolação linear. Basta subtrair as linhas e montar a proporção: ܦ െ ?ǡ ? ?ǡ ? െ ?ǡ ?ൌ 猃球?െ 笃? 猃笃?െ 笃? ܦ െ ?ǡ ? ൌ 甃? 猃爃?ܦ ൌ ?ǡ ? ?ǡ 甃?ൌ ?ǡ 稃? A mediana é igual a 2,85. Portanto, a moda de Pearson fica: ܯ ൌ ? ൈ � ?ǡ 稃?െ ? ൈ � ?ǡ ? ൌ ?ǡ 笃? 2.5 ʹMODA QUANDO AS AMPLITUDES DE CLASSE SÃO DIFERENTES Quando os dados estão em classes, não temos acesso a todas as observações. Assim, para calcular média, mediana e moda, algumas considerações são feitas. No caso da média, a consideração é sempre a mesma: consideramos que todas as observações correspondem ao ponto médio de cada classe. No caso de mediana, a consideração é sempre a mesma: consideramos que o gráfico de frequências acumuladas é composto por segmentos de reta (interpolação linear). No caso de moda, há várias formas de cálculo, conforme mencionamos anteriormente. Cada uma leva em consideração uma coisa diferente. Focamos apenas na moda de Czuber porque é a que é Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 cobrada. Pode uma prova exigir outro cálculo de moda? Poder pode. Por enquanto a gente vai se baseando no que tem caído. Agora o grande detalhe: os métodos vistos para as modas de Czuber, King e moda bruta só valem se as amplitudes de classes forem todas iguais. Pergunta: e se as amplitudes não forem todas iguais? Vamos ver como fica. Quando organizamos os dados para montar uma tabela de valores agrupados em classes, é comum que o façamos de forma que todas as classes tenham a mesma amplitude. Caso as classes não tenham a mesma amplitude, as fórmulas vistas para a moda perdem um pouco o sentido. Precisam ser adaptadas. Para ilustrar o problema, trago um caso exagerado, em que as amplitudes de classes são muito diferentes. Imaginem a seguinte tabela: Classes Frequência absoluta simples 1 - 2 10 2 - 10 16 10 - 11 8 11 - 12 6 12 - 13 4 KůŚĂ ƋƵĞ ƚĂďĞůĂ à“ƉŽƵĐŽ ƵƐƵĂůà弃? Se fôssemos achar a moda, do jeito que vimos anteriormente, diríamos que a classe modal é a 2 àW 10, porque tem a maior frequência. Mas será que é mesmo adequado considerar que a moda está nesta classe? Esta classe é muito maior que as demais. Muito mesmo. Tem uma amplitude de 8. Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 Não, não é razoável supor que a moda esteja esta classe. É mais razoável supor que a moda esteja na classe 1 àW2, que, tendo uma amplitude de apenas 1, contém 10 observações. Talvez a tabela abaixo permita visualizar melhor o porquê disso: Classes Frequência absoluta simples Amplitude de classe (h) ݂ ൊ �݄ 1 - 2 10 1 10 2 - 10 16 8 2 10 - 11 8 1 8 11 - 12 6 1 6 12 - 13 4 1 4 Num caso assim, é mais adequado supor que a moda está na classe com maior valor de ݂ ൊ �݄. Este valor é denominado densidade de frequência. Assim, quando as classes não têm a mesma amplitude, a determinação da moda leva em conta não as frequências das classes; sim as densidades de frequência. E, para encontrar a moda, podemos usar o conceito de moda bruta (considerando que a moda corresponde ao ponto médio da classe 1-2). Ou então, poderíamos modificar as fórmulas de Czuber e King, trocando todas as frequências (f) pelo respectivo valor de (f/h). Aí vem a pergunta: já caiu alguma questão para cálculo de moda em que as amplitudes de classes não eram iguais? Não, confesso que nunca vi. O mais próximo disso foi a questão a seguir, elaborada pelo Cespe no concurso do INSS: Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 (Cespe) i massa do ovo produzido (T) em gramas Percentual (Pi) 1 眃? �ܶ � 球爃? 48% 2 球爃?� ൏ �ܶ � 甃爃? 36% 3 甃爃?� ൏ �ܶ � 眃爃? 12% 4 眃爃?� ൏ �ܶ � ?Ǥ 爃爃? 4% Total Segundo uma associação de indústrias de chocolate, em 2008 serão produzidos 100 milhões de ovos de Páscoa. A tabela acima apresenta a distribuição dos ovos segundo a massa de cada ovo e as quantidades produzidas nos anos anteriores. Com base nessas informações, julgue o item subsequente. A moda da distribuição T é superior a 49,9 e inferior a 200,1. Resolução: Vejas que as classes têm amplitudes diferentes. Quando isso ocorre, a classe modal é aquela que tem maior densidade de frequência. Classe Amplitude Frequência Densidade de frequência 眃? �ܶ � 球爃? 150 48 0,32 球爃?� ൏ �ܶ � 甃爃? 100 36 0,36 甃爃?� ൏ �ܶ � 眃爃? 200 12 0,06 眃爃?� ൏ �ܶ � ?Ǥ 爃爃? 500 4 0,08 Lembrando, a densidade de frequência é a relação entre a frequência e a amplitude de classe. A maior densidade de frequência ocorre na segunda classe. Logo, a moda está entre 200 e 300. Item errado. Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 Gabarito: errado 2.6 - PROPRIEDADES DA MODA Nós estudamos as seguintes propriedades para a média: x somando ou subtraindo uma constante c de cada elemento do conjunto de dados, a média do novo conjunto fica aumentada ou diminuída de c. x multiplicando ou dividindo cada elemento do conjunto de dados por uma constante c, a média do novo conjunto fica multiplicada ou dividida por c. Estas mesmas propriedades valem para a moda. Ou seja, se multiplicarmos todo o conjunto de dados por 3, a moda será triplicada. Se dividirmos todo o conjunto de dados por 4, a moda será dividida por 4. Se somarmos 5 a todos os dados, a moda será aumentada em 5. Se subtrairmos 8 de todos os dados, a moda também será reduzida em 8. Contudo, as questões só costumam cobrar tais propriedades aplicadas à média aritmética. CADERNO NO TEC CONCURSOS A seguir nossa lista de questões comentadas. Para quem quiser treinar com um volume ainda maior, segue cadernos no Tec Concursos: Caderno para Quantis: https://www.tecconcursos.com.br/caderno/QV1AP Caderno para Moda: https://www.tecconcursos.com.br/caderno/QV3Pc/ Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 Sumário Lista de exercícios.............................................................................................................. 2 Quantis .............................................................................................................................................. 2 Moda ...............................................................................................................................................12 Questões mescladas de medidas de posição .................................................................................. 15 Gabaritos.........................................................................................................................21 Questões comentadas ..................................................................................................... 22 Quantis ............................................................................................................................................22 Moda ...............................................................................................................................................60 Questões mescladas de medidas de posição .................................................................................. 68 Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 LISTA DE EXERCÍCIOS QUANTIS 1. (FCC / SEFAZ MA - 2016) Os registros da temperatura máxima diária dos primeiros 6 dias de uma semana foram: 25 °C; 26 °C, 28,5 °C; 26,8 °C; 25 °C; 25,6 °C. Incluindo também o registro da temperatura máxima diária do 7º dia dessa semana, o conjunto dos sete dados numéricos será unimodal com moda igual a 25 °C, e terá mediana igual a 26 °C. De acordo com os dados, é correto afirmar que, necessariamente, a temperatura máxima diária do 7º dia foi a) inferior a 25 °C. b) superior a 26,8 °C. c) igual a 26 °C. d) inferior a 25,6 °C. e) superior a 26 °C. 2. (FCC / TRE RR - 2015) A distribuição dos valores dos salários, em dezembro de 2014, dos 200 funcionários em um órgão público é representada por uma tabela de frequências absolutas, com todos os intervalos de classe apresentando a mesma amplitude, sendo fechados à esquerda e abertos à direita. O valor da mediana, obtido pelo método da interpolação linear, foi igual a R$ 5.600,00 e pertencente ao intervalo de classe, em reais, [ 5.000,00 ; 6.500,00 ). Se 80 funcionários possuem um salário inferior a R$ 5.000,00, então a porcentagem dos funcionários que apresentam um salário igual ou superior a R$ 6.500,00 é, em %, igual a a) 45. b) 30. c) 50. d) 25. e) 35. 3. (FCC / TRE RR - 2015) Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 O histograma abaixo representa a distribuição dos preços unitários de custo, em R$, de determinado equipamento de informática no mercado. No eixo das abscissas constam os intervalos de classe, em R$, e no eixo das ordenadas as respectivas densidades de frequências em (R$)A?1. Considerando os intervalos de classe fechados à esquerda e abertos à direita, se 105 preços apresentam valores menores que R$ 6,00, então o número de preços que apresentam valores iguais ou superiores a R$ 4,00 é a) 240. b) 195. c) 215. d) 230. e) 255. 4. (FCC / TRT 3ª Região - 2015) A tabela de frequências relativas abaixo refere-se à distribuição dos salários dos empregados de uma empresa no mês de maio de 2015. Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 resultado da divisão da respectiva frequência relativa pela correspondente amplitude do intervalo. Considerando que todos os intervalos classe são fechados à esquerda e abertos à direita, a porcentagem P dos funcionários que ganham no mínimo R$ 2.000,00 e menos que R$ 6.000,00 é tal que a) W�A䜀 ?A? ? b) ?A㤀 AM�W�A䜀 ? ? c) ?A㤀 AM�W�A䜀 ? ? d) ?A㤀 AM�W�A䜀 ? ? e) P > 80%. 8. (FCC / SERGAS - 2013) A tabela a seguir apresenta a distribuição de frequências do consumo mensal de gás natural, em m3, dos domicílios residenciais de determinado município. Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 Salários (em número de SM) Frequência absoluta 4 ٟ 6 48 6 ٟ 8 100 8 ٟ 10 x 10 ٟ 12 y 12 ٟ 16 40 Total 400 Sabe-se que a mediana dos salários desses funcionários calculada por meio dessa tabela pelo método da interpolação linear é igual a 8,8 SM. Nessas condições, o salário médio desses 400 funcionários, em número de salários mínimos, considerando que todos os valores incluídos em um intervalo de classe são coincidentes com o ponto médio do intervalo, é igual a a) 8,54 b) 8,83 c) 8,62 d) 8,93 e) 8,72 10. (FCC / TRT 5ª Região - 2013) Atenção: Para resolver a questão considere a tabela abaixo, referente à distribuição de frequências relativas dos salários dos 400 empregados de uma empresa no mês de agosto de 2013, sabendo-se que (m + n) = 10%. CLASSE DE SALÁRIOS (R$) FREQUÊNCIA RELATIVA (%) 2.500 |²² 3.500 3.500 |²² 4.500 4.500 |²² 5.500 5.500 |²² 6.500 6.500 |²² 7.500 2 m 5 n 4 m 6 n 3 m TOTAL 100 Considerando que a mediana (md) e o primeiro quartil (q1) da distribuição foram obtidos pelo método da interpolação linear, tem-se que a amplitude do intervalo [q1, md] é a) R$ 1.350,00. Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 b) R$ 1.200,00. c) R$ 1.250,00. d) R$ 1.300,00. e) R$ 1.150,00. 11. (FCC / TRT 5ª Região - 2013) A distribuição das medidas em metros (m) dos comprimentos dos cabos no estoque de uma fábrica está representada pelo histograma mostrado abaixo, em que no eixo vertical constam ĂƐ�ĚĞŶƐŝĚĂĚĞƐ�ĚĞ�ĨƌĞƋƵġŶĐŝĂƐ 唀 Ğŵ� 縁甃缄? 唀 Ğ�ŶŽ�ĞŝdžŽ�ŚŽƌŝnjŽŶƚĂů�ŽƐ�ŝŶƚĞƌǀĂůŽƐ�ĚĞ�ĐůĂƐƐĞ ?��ĞĨŝŶĞ-se densidade de frequência de um intervalo de classe como sendo o resultado da divisão da respectiva frequência relativa pela correspondente amplitude do intervalo. Sabendo-se que todos os intervalos de classe são fechados à esquerda e abertos à direita, então a porcentagem dos cabos que apresentam uma medida de comprimento de pelo menos igual a 4 m e inferior a 10 m é de a) 50%. b) 60%. c) 70%. d) 80%. e) 90%. 12. (FCC / TCE-PR - 2011) Atenção: Considere as informações a seguir para responder à questão. Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 A distribuição dos salários dos 1000 funcionários da companhia A, em número de salários mínimos, está apresentada na tabela abaixo: Dados: md = Mediana dos salários calculada pelo método da interpolação linear; X = Valor que separa os 15% salários mais altos, calculado pelo método da interpolação linear. O valor de X-md, em número de salários mínimos, é a) 4,00. b) 3,25. c) 3,50. d) 3,75. e) 3,00. 13. (FCC / TRE SP - 2012) A distribuição de frequências absolutas abaixo refere-se aos salários dos 200 funcionários de um setor público no mês de dezembro de 2011. Vitor Menezes, Gustavo Menezes Santana Aula 03 Estatística e Probabilidade p/ BANRISUL (Escriturário) Com Videoaulas - Pós-Edital www.estrategiaconcursos.com.br 7 Sabe-se que C = R$ 2.500,00 e que o valor da mediana, obtido por interpolação linear, é igual a R$ 2.820,00. Então, utilizando interpolação linear, obtém-se o valor do primeiro quartil da distribuição que é igual a a) R$ 1.600,00. b) R$ 1.700,00. c) R$ 1.800,00. d) R$ 1.900,00. e) R$ 2.000,00. 15. (FCC / BB - 2012) Nos quatro primeiros dias úteis de uma semana o gerente de uma agência bancária atendeu 19, 15, 17 e 21 clientes. No quinto dia útil dessa semana esse gerente atendeu n clientes. Se a média do número diário de clientes atendidos por esse gerente nos cinco dias úteis dessa semana foi 19, a mediana foi a) 19. b) 18. c) 20. d) 23. e) 21. MODA 16. (FCC / SEFAZ MA ʹ 2016) Atenção: Para responder à questão, considere as informações
Compartilhar