Baixe o app para aproveitar ainda mais
Prévia do material em texto
CURSO ON-LINE – ESTATÍSTICA P/ RECEITA FEDERAL PROFESSOR: VÍTOR MENEZES www.pontodosconcursos.com.br 1 Aula 3 – Medidas separatrizes e histograma I MEDIDAS SEPARATRIZES ..................................................................................................................... 2 1 Medidas separatrizes para dados em ROL e Agrupados por Valor .......................................................... 3 2 Medidas separatrizes para dados em classes ............................................................................................ 8 II FORMAS DE APRESENTAÇÃO DOS DADOS AGRUPADOS EM CLASSES................................ 58 1 Histograma.............................................................................................................................................. 58 2 Polígono de freqüências .......................................................................................................................... 73 LISTA DAS QUESTÕES DE CONCURSOS ................................................................................................... 74 GABARITO DAS QUESTÕES DE CONCURSOS ......................................................................................... 90 ANEXO ................................................................................................................................................................ 92 CURSO ON-LINE – ESTATÍSTICA P/ RECEITA FEDERAL PROFESSOR: VÍTOR MENEZES www.pontodosconcursos.com.br 2 I MEDIDAS SEPARATRIZES Medidas separatrizes são medidas que separam os dados de formas bem específicas. Uma medida separatriz que nós já estudamos é a mediana. Quando a vimos pela primeira vez, dissemos que ela era uma medida de tendência central. Ela, assim como a média e a moda, nos indica um valor em torno do qual os dados “giram”. Além de ser uma medida de tendência central, ela também é uma medida separatriz. Isto porque ela separa os dados de uma forma bem específica. Sendo a mediana o termo do meio, ela deixa metade dos dados à sua esquerda e a outra metade à sua direita. O nosso ROL do começo do curso (pesquisa salarial no bairro Nova Vila) era: 1, 2, 2, 2, 3, 4, 4, 5, 6, 7. A mediana foi calculada com sendo 3,5. Ora, temos 5 valores menores que 3,5 (são eles: 1, 2, 2, 2, 3). E temos outros 5 valores maiores que 3,5 (4, 4, 5, 6, 7). Por isto a mediana é uma medida separatriz. Ela separa os dados em duas partes iguais. E esta foi a única medida separatriz que nós vimos. Outra medida separatriz é o quartil. São três quartis, dividindo a seqüência de dados em quatro partes iguais (em quatro partes com o mesmo número de termos). O primeiro quartil separa a seqüência de dados de forma que à sua esquerda fiquem 25% dos valores e à sua direita 75%. Assim, o primeiro quartil é o valor que não é superado por 25% das observações. O segundo quartil coincide com a mediana, deixando 50% dos valores de cada lado. O terceiro quartil deixa à sua esquerda 75% dos valores e à sua direita 25%. Logo, o terceiro quartil é o valor que não é superado por 75% das observações. Outra medida separatriz é o decil. São nove decis que dividem a série em dez partes iguais. O primeiro decil deixa à sua esquerda 10% dos valores; à sua direita 90% (ou seja, não é superado por 10% das observações). O segundo decil deixa à sua esquerda 20% dos valores; à sua direita 80%. E assim por diante. O quinto decil coincide com a mediana, deixando 50% dos valores de cada lado. A última medida separatriz que veremos é o percentil. O primeiro percentil deixa à sua esquerda 1% dos valores e à sua direita 99% (ou seja, não é superado por 1% das observações). O segundo percentil deixa à sua esquerda 2% dos valores e à sua direita 98%. E assim por diante. O qüinquagésimo percentil coincide com a mediana, deixando 50% dos valores de cada lado. Então, resumindo as medidas separatrizes que estudaremos, temos: a mediana, os quartis, os decis, os percentis. CURSO ON-LINE – ESTATÍSTICA P/ RECEITA FEDERAL PROFESSOR: VÍTOR MENEZES www.pontodosconcursos.com.br 3 1 Medidas separatrizes para dados em ROL e Agrupados por Valor Quando os dados estão em ROL ou agrupados por valor, o cálculo das medidas separatrizes pode ser meio complicado. Para a mediana, nós vimos, lá na aula 1, que bastava identificar o termo central. Ou, caso o conjunto tivesse um número par de termos, bastava identificar os dois termos centrais e fazer a média. Para as demais medidas, a maneira de calcular varia bastante. Costumo dizer que “vai do gosto do freguês”. Talvez por isso dificilmente caia em prova. Vejamos um exemplo. Neste ponto específico, vou utilizar a mesma idéia apresentada no livro “Estatística Aplicada à Economia, Administração e Contablidade”, dos autores John Freund e Gary Simon. Os autores trabalham com um exemplo envolvendo quartis, demonstrando que “há vasto campo para a arbitrariedade na definição do quartil inferior Q1 e do quartil superior Q3”. Então é isso. O que vem abaixo é uma adaptação dos exemplos do livro citado. Estamos pesquisando as alturas das crianças de uma escola. Selecionamos doze crianças. Medimos suas alturas, obtendo o seguinte rol (valores em metros): 1,40; 1,41; 1,44; 1,45; 1,46; 1,47; 1,49; 1,51; 1,52; 1,53; 1,55; 1,56. Muito bem. Nossa tarefa agora é encontrar os quartis. São doze valores. Se vamos dividir o ROL em quatro partes iguais, cada parte terá três elementos. Ficaremos com: 1,40; 1,41; 1,44; 1,45; 1,46; 1,47; 1,49; 1,51; 1,52; 1,53; 1,55; 1,56 Acima temos as quatro partes de três elementos. Portanto, quatro partes iguais. Neste exemplo, uma forma de determinar os quartis poderia ser a que segue: tomamos os números que ficam perto das “fronteiras” entre as partes e fazemos a média entre eles. A primeira parte termina no 1,44. A segunda parte começa no 1,45. Fazendo a média entre eles temos: 445,1 2 45,144,1 =+ Assim, o primeiro quartil seria 1,445 ( 445,11 =Q ). A segunda parte termina no 1,47. A terceira parte começa no 1,49. Fazendo a média entre eles temos: 48,1 2 49,147,1 =+ O segundo quartil (que coincide com a mediana) é 1,48 ( 48,12 =Q ). CURSO ON-LINE – ESTATÍSTICA P/ RECEITA FEDERAL PROFESSOR: VÍTOR MENEZES www.pontodosconcursos.com.br 4 A terceira parte termina no 1,52. A quarta parte começa no 1,53. Fazendo a média entre eles temos: 525,1 2 53,152,1 =+ E o terceiro quartil é igual a 1,525 ( 525,13 =Q ). Pronto, descobrimos os três quartis. Três valores que separam a série de dados em quatro partes iguais. 1,40; 1,41; 1,44; 1,45; 1,46; 1,47; 1,49; 1,51; 1,52; 1,53; 1,55; 1,56 Q1=1,445 Q2=1,48 Q3=1,525 Agora vamos mudar a situação. Em vez de 12 crianças, medimos altura de apenas 11. A criança mais baixa, com 1,40, não foi analisada. O novo ROL, com 11 termos, fica: 1,41; 1,44; 1,45; 1,46; 1,47; 1,49; 1,51; 1,52; 1,53; 1,55; 1,56. E agora? 11 não é múltiplo de 4. Como separar a seqüência em quatro partes iguais? Bom, o segundo quartil sempre coincide com a mediana. Agora temos um número ímpar de elementos. Há um termo do meio, que é o sexto. A mediana é igual a 1,49. Portanto, o segundo quartil também é igual a 1,49. O problema é achar os demais quartis. Neste caso, podemos pensar que: · à direita do primeiro quartil existem três vezes mais termos que à sua esquerda; à esquerda do terceiro quartil existem três vezes mais termos que à sua direita; · o número de elementos entre Q1 e Q2 é igual ao número de elementos entre Q2 e Q3, que é igual ao número de elementos à esquerda de Q1, que é igual ao número de elementos à direita de Q3; · metade dos dados está entre Q1 e Q3. Quando a seqüência tinha 12termos (múltiplo de quatro) todas estas propriedades foram satisfeitas (pode conferir). Agora, quando a seqüência tem apenas 11 termos, não é possível fazer com que todas sejam observadas ao mesmo tempo. Adotando a segunda propriedade, poderíamos determinar os quartis do seguinte modo: 1,41; 1,44; 1,45; 1,46; 1,47; 1,49; 1,51; 1,52; 1,53; 1,55; 1,56 Q1=1,45 Q2=1,49 Q3=1,53 Mas observe que as demais propriedades não foram satisfeitas. Pois bem, este mesmo problema enfrentado com os quartis acontece com todas as demais medidas separatrizes (decis e percentis). Foi por isso que não estudamos as medidas separatrizes nas aulas anteriores, quando vimos dados em ROL e agrupados por valor. CURSO ON-LINE – ESTATÍSTICA P/ RECEITA FEDERAL PROFESSOR: VÍTOR MENEZES www.pontodosconcursos.com.br 5 Talvez, devido a este tipo de problema, não seja comum a cobrança de tais medidas em provas de concursos (para dados em ROL ou agrupados por valor). No caso específico de quartis, ainda se vê cobrança vez ou outra (seguem exemplos na seqüência). E o método que se costuma utilizar para determinar o valor dos quartis é sempre o mesmo e acaba correspondendo à aplicação da segunda propriedade. O segundo quartil divide a seqüência em duas partes iguais. Consideramos que o primeiro quartil é a mediana da primeira parte. E o terceiro quartil é a mediana da segunda parte. EXERCÍCIOS DE CONCURSOS EC 1. AFC/CGU - 2008. Área: Estatística e cálculos atuariais. [ESAF] [Conjunto de dados da questão anterior: 58, 95, 17, 44, 63, 9, 57, 21, 88, 12, 31, 28, 73, 5 e 56]. Dado o conjunto de dados da questão anterior, determine a amplitude interquartilica Q3 – Q1. a) 33. b) 37. c) 40. d) 46. e) 51. Resolução: Vamos obter o ROL. ROL: 5, 9, 12, 17, 21, 28, 31, 44, 56, 57, 58, 63, 73, 88, 95. Amplitude interquartílica ou intervalo interquartil nada mais é que a diferença entre o terceiro quartil )( 3Q e o primeiro quartil )( 1Q . Este conceito é muito importante, pois não são raras as questões que exigem seu conhecimento. → AMPLITUDE INTERQUARTÍLICA (OU INTERVALO INTERQUARTÍLICO): É a diferença entre o terceiro quartil e o primeiro quartil. Vamos encontrar os quartis Q3 e Q1. O primeiro quartil é o valor que deixa à sua esquerda 25% dos dados e à sua esquerda 75%. O terceiro quartil é o valor que deixa à sua esquerda 75% dos dados e à sua direita 25%. Só que a série tem 15 dados. 25% de 15 é um número quebrado. Da mesma forma, 75% de 15 também não é um número inteiro. Como fazer? Nestes casos, como já dissemos, há diferentes formas de se encontrar os quartis. Vai “do gosto do freguês”. A forma necessária para resolver a questão era: CURSO ON-LINE – ESTATÍSTICA P/ RECEITA FEDERAL PROFESSOR: VÍTOR MENEZES www.pontodosconcursos.com.br 6 Primeiro: encontramos a mediana. A mediana deste conjunto nós já calculamos na aula 1, em que resolvemos um outro exercício da mesma prova. Foi lá no EC 18. A mediana é 44. A mediana separa os dados em duas partes iguais (com sete termos cada uma). Segundo: assumimos que o primeiro quartil é a mediana da primeira parte. A primeira parte tem os seguintes termos: 5, 9, 12, 17, 21, 28, 31. São sete termos. O do meio é o quarto (=17). O primeiro quartil é igual a 17. 171 =Q Terceiro: assumimos que o terceiro quartil é a mediana da segunda parte. A segunda parte tem os seguintes termos: 56, 57, 58, 63, 73, 88, 95 São sete termos. O do meio é o quarto. O terceiro quartil é 63. 633 =Q A amplitude interquartílica fica: 46176313 =−=−QQ Gabarito: D Mais um exemplo: EC 2. Analista CVM 2001 [ESAF] Uma firma distribuidora de eletrodomésticos está interessada em estudar o comportamento de suas contas a receber em dois meses consecutivos. Com este objetivo, seleciona, para cada mês, uma amostra de 50 contas. As observações amostrais constam da tabela seguinte: Valor (R$) Freqüência de março Freqüência de abril 1.000,00 6 10 3.000,00 13 14 5.000,00 12 10 7.000,00 15 13 9.000,00 4 - 11.000,00 - 3 Assinale a opção que corresponde ao intervalo interquartílico, em reais, para o mês de março. a) 3.250,00 b) 5.000,00 CURSO ON-LINE – ESTATÍSTICA P/ RECEITA FEDERAL PROFESSOR: VÍTOR MENEZES www.pontodosconcursos.com.br 7 c) 4.000,00 d) 6.000,00 e) 2.000,00 Resolução: Intervalo interquartílico corresponde à diferença entre o terceiro quartil e o primeiro quartil. Valor (R$) Freqüência de março Freqüência acumulada de março 1.000,00 6 6 3.000,00 13 19 5.000,00 12 31 7.000,00 15 46 9.000,00 4 50 Vamos encontrar a mediana. São 50 termos. Temos dois elementos centrais: o 25º e o 26º. O 19º termo é igual a 3.000. O 20º, o 21º, o 22º, .... e o 31º termo são iguais a 5.000. Portanto, o 25º e o 26º termos são iguais a 5.000. A mediana fica: 000.5=D A mediana divide o conjunto de dados em duas partes. A primeira parte tem 25 termos. O termo do meio é o 13º. O 13º termo é igual a 3.000. Assumimos que a mediana da primeira parte é o primeiro quartil. 000.31 =Q A segunda parte tem 25 termos. O do meio é o 13º. O 1º termo da segunda parte é o 26º termo da seqüência inteira. Portanto, o 13º termo da segunda parte é o 38º termo da seqüência inteira. O 38º termo é igual a 7.000. Vamos assumir que a mediana da segunda parte corresponde ao terceiro quartil. 000.73 =Q Logo, o intervalo interquartil fica: 000.4000.3000.713 =−=−QQ Gabarito: C. Pronto. Vimos exemplos de exercícios de cálculo de medidas separatrizes para dados em ROL e dados agrupados por valor. Pelas dificuldades já comentadas, acaba sendo um assunto pouco cobrado. De qualquer modo, faço alguns comentários adicionais em anexo. CURSO ON-LINE – ESTATÍSTICA P/ RECEITA FEDERAL PROFESSOR: VÍTOR MENEZES www.pontodosconcursos.com.br 8 O que realmente cai em prova, e cai bastante, é o cálculo de medidas separatrizes para dados agrupados em classes. Eu diria que, de toda a estatística descritiva, este é o assunto mais importante, justamente porque é o mais cobrado em concursos. 2 Medidas separatrizes para dados em classes Como dissemos acima, o que cai bastante em prova é o cálculo de medidas separatrizes para dados em classes. Costumo dizer que este é o tópico mais importante de estatística descritiva. Se você considerar provas anteriores das mais importantes bancas, este é o assunto mais cobrado. A representação dos dados na forma “agrupados em classes” é comum quando o número de observações é muito grande. Nestas situações, os problemas que vimos na determinação das medidas separatrizes tornam-se irrelevantes. Especialmente levando-se em conta que nem acesso a todos os dados nós temos (ou seja, obrigatoriamente considerações têm que ser feitas). Quando os dados estão agrupados em classes, não há mais “vasto campo de arbitrariedade” na determinação dos quartis (ou dos decis, ou dos percentis). O método é sempre o mesmo. Para resolver exercícios de medidas separatrizes para dados agrupados em classes, utilizamos interpolação linear. Vai funcionar mais ou menos assim. Precisamos trabalhar com valores de freqüências acumuladas (não importa se absolutas ou relativas, importa que sejam acumuladas). Neste ponto a conta é diferente de média e moda. Lembram? Para média e moda sempre usamos freqüências simples. Para medidas separatrizes (incluindo mediana) é o contrário: freqüências acumuladas. Para determinados valores de freqüências acumuladas, saberemos muito bem quais os valores da nossa seqüência de dados são correspondentes. Para outros, não. Estes outros valores nós determinaremos por meio da interpolação linear. Novamente: se tivéssemosque apontar um tópico de estatística descritiva como o mais cobrado em concursos, seria exatamente este: o cálculo de medidas separatrizes para dados agrupados em classes utilizando interpolação linear. Vamos a alguns exercícios para ver como fica. EC 3. AFRF – 2003 [ESAF] Considere a tabela de freqüências seguinte correspondente a uma amostra da variável X. Não existem observações coincidentes com os extremos das classes. Classes Freqüências Acumuladas 2.000 – 4.000 5 4.000 – 6.000 16 6.000 – 8.000 42 8.000 – 10.000 77 10.000 – 12.000 89 12.000 – 14.000 100 Assinale a opção que corresponde à estimativa do valor x da distribuição amostral de X que não é superado por cerca de 80% das observações. a) 10.000 b) 12.000 CURSO ON-LINE – ESTATÍSTICA P/ RECEITA FEDERAL PROFESSOR: VÍTOR MENEZES www.pontodosconcursos.com.br 9 c) 12.500 d) 11.000 e) 10.500 Resolução: A pergunta pode ser resumida como: qual o valor do oitavo decil? Ou seja, quer se saber qual valor deixa à sua esquerda 80% dos dados. Ou ainda, qual valor não é superado por 80% das observações. O primeiro passo é verificar se as freqüências dadas são acumuladas. Para medidas separatrizes, sempre devemos utilizar freqüências acumuladas. Não importa se forem absolutas ou relativas. Basta que sejam acumuladas. Lembre que aqui é o contrário do cálculo para média e moda. Para média e moda sempre utilizamos freqüências simples. No caso, o exercício já deu as freqüências acumuladas. Não temos que fazer nenhuma transformação. Antes de responder à pergunta, vamos relembrar um pouco do significado de uma tabela de freqüências acumuladas. Observe a linha em vermelho. Classes Freqüências Acumuladas 2.000 – 4.000 5 4.000 – 6.000 16 6.000 – 8.000 42 8.000 – 10.000 77 10.000 – 12.000 89 12.000 – 14.000 100 O que ela significa? O que significa dizer que a freqüência acumulada da classe 8.000 – 10.000 é igual a 77? Significa que temos 77 valores de X nesta classe ou nas classes anteriores. Significa que temos 77 valores de X entre 2.000 e 10.000. E se a pergunta fosse: qual o valor que não é superado por 77% das observações? Se a pergunta fosse essa, não precisaríamos fazer nenhuma conta. Bastaria olhar direto na tabela. Se 77 valores de X estão entre 2.000 e 10.000, concluímos que o valor de X que não é superado por 77% das observações é justamente 10.000. Classes Freqüências Acumuladas 2.000 – 4.000 5 4.000 – 6.000 16 6.000 – 8.000 42 8.000 – 10.000 77 10.000 – 12.000 89 12.000 – 14.000 100 O valor 10.000 não é superado por 77% observações CURSO ON-LINE – ESTATÍSTICA P/ RECEITA FEDERAL PROFESSOR: VÍTOR MENEZES www.pontodosconcursos.com.br 10 E se a pergunta fosse: qual o valor não é superado por 89% das observações? Novamente, não precisaríamos fazer nenhuma conta. Bastaria olhar na tabela. Veja a linha em vermelho. Classes Freqüências Acumuladas 2.000 – 4.000 5 4.000 – 6.000 16 6.000 – 8.000 42 8.000 – 10.000 77 10.000 – 12.000 89 12.000 – 14.000 100 Temos 89 valores entre 2.000 e 12.000. Ou seja, 12.000 não é superado por 89% das observações. Classes Freqüências Acumuladas 2.000 – 4.000 5 4.000 – 6.000 16 6.000 – 8.000 42 8.000 – 10.000 77 10.000 – 12.000 89 12.000 – 14.000 100 O valor 12.000 não é superado por 89% observações O problema é que a pergunta foi qual o valor não é superado por 80% das observações. E na coluna de freqüências acumuladas não temos o valor 80. Logo, não temos como saber qual é o valor de X que não é superado por 80% das observações. O que faremos? Vamos “chutar”. Vamos fazer uma consideração. Vamos considerar que o gráfico dos valores de freqüências acumuladas versus valores de X se comporta como um conjunto de segmentos de reta. Neste curso nós não vamos ficar desenhando gráficos de segmentos de reta. Vamos só utilizar o resultado destes gráficos. Classes Freqüências Acumuladas 2.000 – 4.000 5 4.000 – 6.000 16 6.000 – 8.000 42 8.000 – 10.000 77 10.000 – 12.000 89 12.000 – 14.000 100 Sabemos que o valor 10.000 corresponde a uma freqüência acumulada de 77. Sabemos que o valor 12.000 corresponde a uma freqüência acumulada de 89. A pergunta é: quem corresponde a 80? (vamos chamar de Z) Sabemos que 80 está entre 77 e 89. Portanto, o valor que a ele corresponde tem que estar entre 10.000 e 12.000. CURSO ON-LINE – ESTATÍSTICA P/ RECEITA FEDERAL PROFESSOR: VÍTOR MENEZES www.pontodosconcursos.com.br 11 10.000 77 10.000 corresponde a 77 Z = ? 80 Quem corresponde a 80? 12.000 89 12.000 corresponde a 89 Na interpolação linear, nós vamos fazer o seguinte. Fazemos a segunda linha menos a primeira. Fazemos a terceira linha menos a primeira. Primeira linha 10.000 77 Segunda linha Z 80 Terceira linha 12.000 89 Subtraindo, ficamos com: 000.10−Z 7780 − 000.10000.12 − 7789 − A interpolação linear nos diz que as diferenças das linhas de baixo com a linha de cima são proporcionais. 7789 7780 000.10000.12 000.10 − −=− −Z Isolando o Z, temos: 12 3000.2000.10 ×+=Z 500.10=Z Concluindo: O valor 10.500 não é superado por 80 observações. Gabarito: E. Antes de passarmos para o próximo exercício, vamos mostrar graficamente o que foi feito. Para os dados fornecidos, podemos construir a seguinte tabela de freqüências acumuladas: Valores F 2.000 0 4.000 5 6.000 16 8.000 42 10.000 77 12.000 89 14.000 100 Podemos plotar estes valores num gráfico. CURSO ON-LINE – ESTATÍSTICA P/ RECEITA FEDERAL PROFESSOR: VÍTOR MENEZES www.pontodosconcursos.com.br 12 Ou seja, para alguns valores, sabemos exatamente as respectivas freqüências acumuladas. Mas não sabemos qual valor corresponde à freqüência acumulada 80 (ou qual o oitavo decil). Assim, supomos que o gráfico acima é composto por diversos segmentos de retas que unem os pontos conhecidos. Com esta suposição, passamos a ter, para qualquer freqüência acumulada, a respectiva observação. E vice-versa. Esta suposição de que o gráfico é formado por segmentos de reta é justamente a interpolação linear. O gráfico acima é por vezes chamado de ogiva de Galton. E a interpolação linear acaba sendo chamada de interpolação da Ogiva. Mas estes são só nomes diferentes para a mesma coisa. Assim, em vez de resolvermos o exercício da forma como fizemos, poderíamos trabalhar diretamente com o gráfico. Mas como ficar desenhando gráfico é meio trabalhoso, vou fazer uma vez só. A pergunta é: qual valor corresponde à freqüência acumulada 80? CURSO ON-LINE – ESTATÍSTICA P/ RECEITA FEDERAL PROFESSOR: VÍTOR MENEZES www.pontodosconcursos.com.br 13 Ou ainda: qual o valor de Z da figura acima? Vamos analisar apenas uma parte do gráfico. Vamos olhar apenas para o penúltimo segmento de reta. Podemos visualizar dois triângulos no gráfico acima. O primeiro, menor, destacado em verde: CURSO ON-LINE – ESTATÍSTICA P/ RECEITA FEDERAL PROFESSOR: VÍTOR MENEZES www.pontodosconcursos.com.br 14 A altura deste triângulo é igual a 3 ( 7780 −= ). A base deste triângulo é igual a ( 000.10−Z ). Há um outro triângulo, maior, destacado em azul: A altura deste triângulo maior é 12 ( 7789 −= ). Sua base é igual a 2.000 ( 000.10000.12 −= ). Esses dois triângulos são semelhantes. Portanto, a relação entre as alturas é igual à relação entre as bases. Assim: azultrianguloaltura verdetrianguloaltura azultriangulobase verdetriangulobase __ __ __ __ = CURSO ON-LINE – ESTATÍSTICA P/ RECEITA FEDERAL PROFESSOR: VÍTOR MENEZES www.pontodosconcursos.com.br 15 123 000.2 000.10 =−Z E foi exatamente desta igualdade que partimos para resolver o problema. Ou seja, esta igualdade nada mais é que o resultado da semelhança de triângulos, triângulos estes obtidos por causa da interpolação linear. Aqui no curso on line, acho que não é muito proveitoso ficar resolvendo os exercícios diretamente no gráfico. Portanto, nos próximos exercícios de concursos, faremos o primeiro procedimento visto, achando as três linhas, subtraindo as duas de baixo pela de cima. Para encerrar o exercício, destaco que, por causa das alterantivas, há uma solução mais rápida. Olhando a tabela do enunciado, temos que: 10.000 77 10.000 corresponde a 77 Z = ? 80 Quem corresponde a 80? 12.000 89 12.000 corresponde a 89 80 está entre 77 e 89. O número que a ele corresponde (=Z), portanto, está entre 10.000 e 12.000. Logo, não pode ser o próprio 10.000, nem o próprio 12.000. Já descartamos as letras A e B. a) 10.000 b) 12.000 c) 12.500 d) 11.000 e) 10.500 Se o número procurado está entre 10.000 e 12.000, então ele também não pode ser igual a 12.500. Descartamos a letra C. a) 10.000 b) 12.000 c) 12.500 d) 11.000 e) 10.500 Como 80 está mais próximo de 77 do que de 89, o número a ele correspondente deve estar mais próximo de 10.000 do que de 12.000. Assim, descartamos a letra D, pois 11.000 está exatamente no meio entre 10.000 e 12.000. a) 10.000 b) 12.000 c) 12.500 d) 11.000 e) 10.500 CURSO ON-LINE – ESTATÍSTICA P/ RECEITA FEDERAL PROFESSOR: VÍTOR MENEZES www.pontodosconcursos.com.br 16 E marcamos a letra E. EC 4. AFRF/2002-2 [ESAF] O atributo do tipo contínuo X, observado como um inteiro, numa amostra de tamanho 100 obtida de uma população de 1000 indivíduos, produziu a tabela de freqüências seguinte: Classes Freqüência ( f ) 29,5-39,5 4 39,5-49,5 8 49,5-59,5 14 59,5-69,5 20 69,5-79,5 26 79,5-89,5 18 89,5-99,5 10 Assinale a opção que corresponde à estimativa da mediana amostral do atributo X. a) 71,04 b) 65,02 c) 75,03 d) 68,08 e) 70,02 Resolução: A pergunta é: qual a mediana? Ou seja, temos que calcular o valor que deixa à sua esquerda 50% das observações. Ou ainda: o valor que não é superado por 50% das observações. Antes de começar qualquer conta, vejamos as freqüências fornecidas. São freqüências simples. Temos que passá-las para freqüências acumuladas. Classes Freqüência simples ( f ) Freqüência acumulada (F) 29,5-39,5 4 4 39,5-49,5 8 12 49,5-59,5 14 26 59,5-69,5 20 46 69,5-79,5 26 72 79,5-89,5 18 90 89,5-99,5 10 100 Não temos o valor 50 na coluna de freqüências acumuladas. CURSO ON-LINE – ESTATÍSTICA P/ RECEITA FEDERAL PROFESSOR: VÍTOR MENEZES www.pontodosconcursos.com.br 17 E se a pergunta fosse: qual o valor que não é superado por 46 observações? A resposta seria: 69,5. Sem fazer contas. Basta a leitura da tabela. Se a pergunta fosse: qual o valor que não é superado por 72 observações? A resposta seria: 79,5. Também, sem contas. Classes Freqüência acumulada (F) 29,5-39,5 4 39,5-49,5 12 49,5-59,5 26 59,5-69,5 46 69,5-79,5 72 79,5-89,5 90 89,5-99,5 100 Mas a pergunta é sobre o valor que não é superado por 50 observações. Este dado não tem na tabela. Mas sabemos que 50 está entre 46 e 72. Portanto, o valor procurado está entre 69,5 e 79,5. 69,5 46 69,5 corresponde a 46 Z 50 Quem corresponde a 50? 79,5 72 79,5 corresponde a 72 Primeira linha 69,5 46 Segunda linha Z 50 Terceira linha 79,5 72 Subtraindo as linhas: 5,69−Z 4650 − 5,695,79 − 4672 − Essas diferenças são proporcionais: 4672 4650 5,695,79 5,69 − −=− −Z 04,71 26 4105,69 ≅×+=Z Gabarito: A. Para fugir do denominador 26, dava para aproximar a fração. Ficaria assim: 10,716,15,69 5 85,69 25 4105,69 26 4105,69 =+=+=×+≅×+=Z Quando trocamos o denominador 26 por 25, nós aumentamos um pouco o valor de Z. Portanto, Z é, na verdade, um pouco menor que 71,10. CURSO ON-LINE – ESTATÍSTICA P/ RECEITA FEDERAL PROFESSOR: VÍTOR MENEZES www.pontodosconcursos.com.br 18 Nesta questão valem os mesmos comentários da anterior. De cara, sem muitas contas, dava para descartar algumas alternativas. Sabemos que: 69,5 46 69,5 corresponde a 46 Z 50 Quem corresponde a 50? 79,5 72 79,5 corresponde a 72 O número Z deve estar entre 69,5 e 79,5. Já descartamos as letras B e D. a) 71,04 b) 65,02 c) 75,03 d) 68,08 e) 70,02 Como 50 está mais próximo de 46 do que de 72, o número procurado está mais próximo de 69,5 do que de 79,5. Descartamos a letra C. a) 71,04 b) 65,02 c) 75,03 d) 68,08 e) 70,02 Ficaríamos entre duas alternativas. Ou seja, aqui não deu para resolver a questão sem fazer contas, da forma como fizemos na questão anterior. Mas já ficamos entre duas alternativas. Numa eventual falta de tempo na hora da prova, isso pode ser útil para, pelo menos, aumentar a chance de acerto num chute. Vejamos a questão a seguir, ligeiramente diferente. EC 5. Auditor Fiscal ICMS/BA – 2004 [FCC] Considere a tabela abaixo que mostra a distribuição de salários (em reais) de 160 funcionários de determinada empresa, com suas respectivas freqüências relativas acumuladas. Classes em reais Freqüência relativa acumulada (%) [600,1000) 10 [1000,1400) 30 [1400,1800) 70 [1800,2200) 95 [2200,2600) 100 Utilizando a interpolação linear, o número de funcionários que ganham salários menores ou iguais a R$ 1.700,00 é: a) 96 b) 84 CURSO ON-LINE – ESTATÍSTICA P/ RECEITA FEDERAL PROFESSOR: VÍTOR MENEZES www.pontodosconcursos.com.br 19 c) 72 d) 64 e) 56 Resolução: E se a pergunta fosse qual o valor de freqüência acumulada corresponde a 1.400? Neste caso, não precisaríamos fazer contas. A resposta seria 30%. E se a pergunta fosse: qual o valor de freqüência acumulada corresponde a 1.800? Também não precisaríamos de contas. A resposta seria 70%. Classes em reais Freqüência relativa acumulada (%) [600,1000) 10 [1000,1400) 30 [1400,1800) 70 [1800,2200) 95 [2200,2600) 100 Só que queremos saber o valor de freqüência acumulada que corresponde a 1.700. Sabemos que 1.700 está entre 1.400 e 1.800. Logo, o valor de freqüência acumulada correspondente deve estar entre 30% e 70%. 1.400 30% 1.400 corresponde a 30% 1.700 W 1.700 corresponde a quem? 1.800 70% 1.800 corresponde a 70% Primeira linha 1.400 30% Segunda linha 1.700 W Terceira linha 1.800 70% Subtraindo as linhas: 400.1700.1 − 3,0−W 400.1800.1 − 3,07,0 − Fazendo as razões: 3,07,0 3,0 400.1800.1 400.1700.1 − −=− − W Isolando o W: 6,03,0 400 3004,0 =+×=W CURSO ON-LINE – ESTATÍSTICA P/ RECEITA FEDERAL PROFESSOR: VÍTOR MENEZES www.pontodosconcursos.com.br 20 Ou seja, sabemos que a freqüência acumulada correspondente a 1.700 é de 60%. O que isso significa? Que 60% das pessoas ganham R$ 1.700,00 ou menos. Como foram entrevistados 160 funcionários, temos: 96160 100 60 =× 96 funcionários ganham R$ 1.700 ou menos. Gabarito: A. EC 6. Auditor Fiscal ICMS/BA – 2004 [FCC] Considere a tabela abaixo que mostra a distribuição de salários (em reais) de 160 funcionários de determinada empresa, com suas respectivas freqüências relativas acumuladas. Classes em reais Freqüência relativa acumulada (%) [600,1000) 10 [1000,1400) 30 [1400,1800) 70 [1800,2200) 95 [2200,2600) 100 O valor absoluto da diferença entre a mediana, obtida por interpolação linear, e a média aritmética dos salários, em reais, é [considere que vocêjá sabe que a média é 1580]: a) 20 b) 80 c) 100 d) 200 e) 300 Resolução: A média desta seqüência de dados nós já achamos. Ela vale 1580 (ver EC 4 da aula passada). Passemos à mediana de X. Classes em reais Freqüência relativa acumulada (%) [600,1000) 10 [1000,1400) 30 [1400,1800) 70 [1800,2200) 95 [2200,2600) 100 Podemos montar o seguinte quadro: CURSO ON-LINE – ESTATÍSTICA P/ RECEITA FEDERAL PROFESSOR: VÍTOR MENEZES www.pontodosconcursos.com.br 21 1400 30% 1400 corresponde a 30% D 50% Quem corresponde a 50%? 1800 70% 1800 corresponde a 70% Olha como a questão veio generosa. 50% está exatamente no meio, entre 30% e 70%. Consequentemente, a mediana (=D) estará bem no meio entre 1400 e 1800. 1600 2 18001400 =+=D De todo modo, vamos manter o procedimento de sempre. Primeira linha 1400 30% Segunda linha D 50% Terceira linha 1800 70% Subtraindo as linhas: 1400−D 3050 − 14001800 − 3070 − Fazendo as razões: 3070 3050 14001800 1400 − −=− −D Isolando o D: 16001400 40 20400 =+×=D A diferença entre a mediana e a média é: 2015801600 =−=− XD Gabarito: A. EC 7. Fiscal ICMS/PA – 2002 [ESAF] A tabela de freqüências abaixo apresenta as freqüências acumuladas (F) correspondentes a uma amostra da distribuição dos salários anuais de economistas (Y) – em R$ 1.000,00, do departamento de fiscalização da Cia. X. Não existem realizações de Y coincidentes com as extremidades das classes salariais. Classes F 29,5 – 39,5 2 39,5 – 49,5 6 49,5 – 59,5 13 59,5 – 69,5 23 69,5 – 79,5 36 79,5 – 89,5 45 89,5 – 99,5 50 CURSO ON-LINE – ESTATÍSTICA P/ RECEITA FEDERAL PROFESSOR: VÍTOR MENEZES www.pontodosconcursos.com.br 22 Assinale a opção que corresponde ao valor z, obtido por interpolação da ogiva, que, estima-se, não é superado por 80% das realizações de Y. a) 82,0 b) 80,0 c) 83,9 d) 74,5 e) 84,5 Resolução: As freqüências fornecidas são acumuladas. Como o problema é de medidas separatrizes, não precisamos fazer nenhuma transformação. O valor Z que não é superado por 80% das observações é o oitavo decil. Ou ainda, o 80º percentil. São 50 observações ao todo. Como sabemos disto? Basta ver a última linha de freqüência acumulada. Lembrem-se de que o último valor de freqüência acumulada é sempre igual a n. Portanto, 50=n . São 50 valores na amostra. 80% de 50 é igual a 40. Assim, queremos saber qual o valor Z que não é superado por 40 observações. Se a pergunta fosse sobre o valor que não é superado por 45 observações, não precisaríamos fazer conta. A resposta seria 89,5. Bastava consultar a tabela fornecida. Se a pergunta fosse qual o valor que não é superado por 36 observações, também bastaria consulta direta à tabela. A resposta seria 79,5. Mas a pergunta foi qual o valor que não é superado por 40 observações. E 40 não tem na nossa coluna de freqüência acumulada. Vamos, portanto, fazer a interpolação linear. Classes F 29,5 – 39,5 2 39,5 – 49,5 6 49,5 – 59,5 13 59,5 – 69,5 23 69,5 – 79,5 36 79,5 – 89,5 45 89,5 – 99,5 50 Sabemos que: 79,5 36 79,5 corresponde a 36 Z 40 Quem corresponde a 40??? 89,5 45 89,5 corresponde a 45 Ou seja: Primeira linha 79,5 36 Segunda linha Z 40 Terceira linha 89,5 45 CURSO ON-LINE – ESTATÍSTICA P/ RECEITA FEDERAL PROFESSOR: VÍTOR MENEZES www.pontodosconcursos.com.br 23 Subtraindo as linhas: Z – 79,5 40 – 36 89,5 – 79,5 45 - 36 A interpolação linear nos diz que estas diferenças são proporcionais: 3645 3640 5,795,89 5,79 − −=− −Z 9 4 10 5,79 =−Z 944,835,79 9 40 =+=Z Gabarito: C. Para fugir do denominador 9 dava para aproximar a fração. 5,835,79 10 405,79 9 40 =+≅+=Z Quando nós trocamos o denominador 9 por 10, nós diminuímos um pouco o valor de Z. Portanto, na verdade, Z é um pouco maior que 83,5. Esta é outra questão que, de cara, dava para eliminar várias alternativas. Sabemos que: 79,5 36 79,5 corresponde a 36 Z 40 Quem corresponde a 40??? 89,5 45 89,5 corresponde a 45 O número procurado está entre 79,5 e 89,5. Já descartamos a letra D. a) 82,0 b) 80,0 c) 83,9 d) 74,5 e) 84,5 Exatamente no meio entre 36 e 45 está o número 40,5. E exatamente no meio entre 79,5 e 89,5 está o 84,5. Assim, temos que: 84,5 corresponde a 40,5 O número 40, portanto, é um pouquinho (mas bem pouquinho mesmo) menor que 40,5. Assim, o número que corresponde a 40 deve ser só um pouquinho menor que 84,5. Já descartamos a letra E. a) 82,0 CURSO ON-LINE – ESTATÍSTICA P/ RECEITA FEDERAL PROFESSOR: VÍTOR MENEZES www.pontodosconcursos.com.br 24 b) 80,0 c) 83,9 d) 74,5 e) 84,5 E, dentre as alternativas restantes, eu, particularmente, marcaria sim a letra C, que é a única que traz um valor bem próximo de 84,5. Eu me sentiria seguro para marcar a resposta sem contas adicionais. EC 8. Fiscal ICMS PI - 2001 [ESAF] A tabela abaixo mostra a distribuição de freqüência obtida de uma amostra aleatória dos salários anuais em reais de uma firma. As freqüências são acumuladas. Classes de salário Freqüências 5.000 – 6.500 12 6.500 – 8.000 28 8.000 – 9.500 52 9.500 – 11.000 74 11.000 – 12.500 89 12.500 – 14.000 97 14.000 – 15.000 100 Deseja-se estimar, via interpolação da ogiva, o nível salarial populacional que não é ultrapassado por 79% da população. Assinale a opção que corresponde a essa estimativa. a) R$ 10.000,00 b) R$ 9.500,00 c) R$ 12.500,00 d) R$ 11.000,00 e) R$ 11.500,00 Resolução: As freqüências fornecidas são acumuladas. Como o problema é de medidas separatrizes, não precisamos fazer nenhuma transformação. O valor Z que não é superado por 79% das observações é o 79º percentil. São 100 observações ao todo. Como sabemos disto? Basta ver a última linha de freqüência acumulada. Lembrem-se de que o último valor de freqüência acumulada é sempre igual a n. Portanto, 100=n . São 100 valores na amostra. 79% de 100 é igual a 79. Assim, queremos saber qual o valor Z que não é superado por 79 observações. Se a pergunta fosse qual o valor que não é superado por 74 observações, não precisaríamos fazer conta. A resposta seria 11.000. Direto, sem fazer contas. Bastava consultar a tabela fornecida. CURSO ON-LINE – ESTATÍSTICA P/ RECEITA FEDERAL PROFESSOR: VÍTOR MENEZES www.pontodosconcursos.com.br 25 Se a pergunta fosse qual o valor que não é superado por 89 observações, também bastaria consulta direta à tabela. A resposta seria 12.500. Mas a pergunta foi qual o valor que não é superado por 79 observações. E 79 não tem na nossa coluna de freqüência acumulada. Vamos, portanto, fazer a interpolação linear. Classes de salário Freqüências 5.000 – 6.500 12 6.500 – 8.000 28 8.000 – 9.500 52 9.500 – 11.000 74 11.000 – 12.500 89 12.500 – 14.000 97 14.000 – 15.000 100 Sabemos que: 11.000 74 11.000 corresponde a 74 Z 79 Quem corresponde a 79??? 12.500 89 12.500 corresponde a 89 Antes de continuarmos as contas, olha só que interessante. 79 está entre 74 e 89. Portanto, o número que corresponde a 79 (que estamos chamando de Z) está entre 11.000 e 12.500. Pronto. Só aí já eliminamos as alternativas A, B, C e D. A resposta só pode ser letra E. Continuando com a resolução: Primeira linha 11.000 74 Segunda linha Z 79 Terceira linha 12.500 89 Subtraindo as linhas: Z – 11.000 79-74 12.500 – 11.000 89 - 74 A interpolação linear nos diz que estas diferenças são proporcionais: 7489 7479 000.11500.12 000.11 − −=− −Z 15 5 500.1 000.11 =−Z 500.11000.11500=+=Z Gabarito: E. EC 9. Auditor ISS/Recife - 2003 [ESAF] CURSO ON-LINE – ESTATÍSTICA P/ RECEITA FEDERAL PROFESSOR: VÍTOR MENEZES www.pontodosconcursos.com.br 26 O quadro seguinte apresenta a distribuição de freqüências da variável valor do aluguel (X) para uma amostra de 200 apartamentos de uma região metropolitana de certo município. Não existem observações coincidentes com os extremos das classes. Assinale a opção que corresponde à estimativa do valor Z tal que a freqüência relativa de observações de X menores ou iguais a Z seja 80%. Classes R$ Freqüências 350 – 380 3 380 – 410 8 410 – 440 10 440 – 470 13 470 – 500 33 500 – 530 40 530 – 560 35 560 – 590 30 590 – 620 16 620 – 650 12 a) 530 b) 560 c) 590 d) 578 e) 575 Resolução: No fundo, o que se pede é o oitavo decil (ou ainda, o octogésimo percentil). Ou seja, é um problema de medidas separatrizes, que é resolvido por interpolação linear, baseada em freqüências acumuladas. Foram fornecidas freqüências simples. Precisamos passá-las para acumuladas. Classes R$ Freqüências Simples Freqüências Acumuladas Memória de cálculo 350 – 380 3 3 =3 380 – 410 8 11 =3+8 410 – 440 10 21 =11+10 440 – 470 13 34 =21+13 470 – 500 33 67 =34+33 500 – 530 40 107 =67+40 530 – 560 35 142 =107+35 560 – 590 30 172 =142+30 590 – 620 16 188 =172+16 620 – 650 12 200 =188+12 São 200 observações ao todo. 80% de 200 é igual a 160. Assim, queremos saber qual o valor Z que não é superado por 160 observações. CURSO ON-LINE – ESTATÍSTICA P/ RECEITA FEDERAL PROFESSOR: VÍTOR MENEZES www.pontodosconcursos.com.br 27 Se a pergunta fosse qual o valor que não é superado por 142 observações, não precisaríamos fazer conta. A resposta seria 560. Consulta direta à tabela. Se a pergunta fosse qual o valor que não é superado por 172 observações, também bastaria consulta direta à tabela. A resposta seria 590. Mas a pergunta foi qual o valor que não é superado por 160 observações. E 160 não tem na nossa coluna de freqüência acumulada. Vamos, portanto, fazer a interpolação linear. Classes R$ Freqüências Acumuladas 350 – 380 3 380 – 410 11 410 – 440 21 440 – 470 34 470 – 500 67 500 – 530 107 530 – 560 142 560 – 590 172 590 – 620 188 620 – 650 200 Sabemos que: 560 142 560 corresponde a 142 Z 160 Quem corresponde a 160??? 590 172 590 corresponde a 172 Antes de continuarmos as contas, vamos fazer uma rápida análise das alternativas. O número procurado está entre 560 e 590. Já descartamos as alternativas A, B e C. a) 530 b) 560 c) 590 d) 578 e) 575 E se a pergunta fosse: que corresponde a 157? 157 está bem no meio entre 142 e 172. Portanto, o número que corresponde a 157 está bem no meio entre 560 e 590. Assim, o número que corresponde a 157 é 575. Mas nós estamos procurando quem corresponde a 160. 160 é um pouquinho maior que 157. Portanto, o número que corresponde a 160 deve ser um pouquinho maior que 575. Já descartamos a letra E. a) 530 b) 560 CURSO ON-LINE – ESTATÍSTICA P/ RECEITA FEDERAL PROFESSOR: VÍTOR MENEZES www.pontodosconcursos.com.br 28 c) 590 d) 578 e) 575 E só sobra a letra D. Vamos continuar com a resolução usual: Primeira linha 560 142 Segunda linha Z 160 Terceira linha 590 172 Subtraindo as linhas: Z-560 160-142 590-560 172-142 A interpolação linear nos diz que estas diferenças são proporcionais: 142172 142160 560590 560 − −=− −Z 30 18 30 560 =−Z 57856018 =+=Z Gabarito: D. AFRF/96 [ESAF] Texto para as questões EC 10 e EC 11 Distribuição de Freqüências das Idades dos funcionários da Empresa Alfa, em 1/1/90. Classes de idades (anos) if Ptos médios ( )iX i i d X =− 5 37 ii fd × ii fd ×2 ii fd ×3 ii fd ×4 19,5-24,5 2 22 -3 -6 18 -54 162 24,5-29,5 9 27 -2 -18 36 -72 144 29,5-34,5 23 32 -1 -23 23 -23 23 34,5-39,5 29 37 0 0 0 0 0 39,5-44,5 18 42 1 18 18 18 18 44,5-49,5 12 47 2 24 48 96 192 49,5-54,5 7 52 3 21 63 189 567 TOTAL 100 16 206 154 1106 EC 10. AFRF 96 [ESAF] Marque a opção que representa a mediana das idades dos funcionários em 1/1/90. a) 35,49 CURSO ON-LINE – ESTATÍSTICA P/ RECEITA FEDERAL PROFESSOR: VÍTOR MENEZES www.pontodosconcursos.com.br 29 b) 35,73 c) 35,91 d) 37,26 e) 38,01 Resolução: Foram fornecidas freqüências simples. Precisamos passar para freqüências acumuladas. Classes de idades (anos) if iF Memória de cálculo 19,5-24,5 2 2 =2 24,5-29,5 9 11 =2+9 29,5-34,5 23 34 =11+23 34,5-39,5 29 63 =34+29 39,5-44,5 18 81 =63+18 44,5-49,5 12 93 =81+12 49,5-54,5 7 100 =93+7 Precisamos saber qual o valor não é superado por 50% das observações (=mediana). Como são 100 observações, precisamos saber qual valor não é superado por 50 observações. Classes de idades (anos) iF 19,5-24,5 2 24,5-29,5 11 29,5-34,5 34 34,5-39,5 63 39,5-44,5 81 44,5-49,5 93 49,5-54,5 100 Sabemos que: 34,5 34 34,5 corresponde a 34 Z 50 Quem corresponde a 50??? 39,5 63 39,5 corresponde a 63 Ou seja: Primeira linha 34,5 34 Segunda linha Z 50 Terceira linha 39,5 63 Subtraindo as linhas: Z-34,5 50-34 39,5-34,5 63-34 A interpolação linear nos diz que estas diferenças são proporcionais: 3463 3450 5,345,39 5,34 − −=− −Z CURSO ON-LINE – ESTATÍSTICA P/ RECEITA FEDERAL PROFESSOR: VÍTOR MENEZES www.pontodosconcursos.com.br 30 29 16 5 5,34 =−Z 26,37 29 805,34 ≅+=Z Note que o denominador 29 atrapalha as contas. Tentando fugir do denominador 29, podemos aproximar a fração: 16,3766,25,34 30 805,34 29 805,34 =+≅+≅+=Z Quando trocamos o denominador 29 por 30, nós diminuímos um pouco o valor de Z. Portanto, na verdade, Z é um pouco maior que 37,16. Gabarito: D EC 11. AFRF 96 [ESAF] Sabe-se que o quadro de pessoal da empresa continua o mesmo em 1/1/96. Marque a opção que representa a mediana das idades dos funcionários em 1/1/96 a) 35,49 b) 36,44 c) 41,49 d) 41,91 e) 43,26 Resolução: Agora nem precisa fazer muita conta. Se todos os valores foram aumentados em seis anos, a mediana também é aumentada em seis anos. A nova mediana fica: 37,26+6= 43,26 Gabarito: E Algumas propriedades que vimos para média valem para mediana e moda. Se adicionarmos ou subtrairmos uma constante c em todos os valores da série de dados, a mediana e a moda sofrem a mesma alteração. Se multiplicarmos ou dividirmos todos os dados por uma constante c, a mediana e a moda sofrem a mesma alteração. O detalhe é que estas propriedades (aplicadas à mediana e moda) raramente são exigidas em prova. O que cai mesmo é saber as propriedades para a média. Este exercício do AFRF 96 é que foi uma exceção. CURSO ON-LINE – ESTATÍSTICA P/ RECEITA FEDERAL PROFESSOR: VÍTOR MENEZES www.pontodosconcursos.com.br 31 EC 12. AFRF/2002-1 [ESAF] Em um ensaio para o estudo da distribuição de um atributo financeiro (X) foram examinados 200 itens de natureza contábil do balanço de uma empresa. Esse exercício produziu a tabela de freqüências abaixo. A coluna Classes representa intervalos de valores de X em reais e a coluna P representa a freqüência relativa acumulada. Não existem observações coincidentes com os extremos das classes. Classes P (%) 70-90 5 90-110 15 110-130 40 130-150 70 150-170 85 170-190 95 190-210 100 Assinale a opção que corresponde à estimativa do quinto decil da distribuição de X. a) 138,00 b) 140,00 c) 136,67 d) 139,01 e) 140,66 Resolução: Quinto decilé sinônimo de mediana. É o valor que não é superado por 50% das observações. Foram dadas freqüências acumuladas. Não importa que sejam relativas. Basta que sejam acumuladas. Podemos começar a resolver a questão. Classes P (%) 70-90 5 90-110 15 110-130 40 130-150 70 150-170 85 170-190 95 190-210 100 Sabemos que: 130 40 130 corresponde a 40 Z 50 Quem corresponde a 50??? 150 70 150 corresponde a 70 Ou seja: Primeira linha 130 40 Segunda linha Z 50 Terceira linha 150 70 CURSO ON-LINE – ESTATÍSTICA P/ RECEITA FEDERAL PROFESSOR: VÍTOR MENEZES www.pontodosconcursos.com.br 32 Subtraindo as linhas: Z-130 50-40 150-130 70-40 A interpolação linear nos diz que estas diferenças são proporcionais: 4070 4050 130150 130 − −=− −Z 30 10 20 130 =−Z 66,136 30 20130 ≅+=Z Gabarito: C. Note que 50 está a uma distância de 10 em relação a 40 (50-40=10). E 50 está a uma distância de 20 em relação a 70 (70-50=20). A primeira distância é metade da segunda. Por isso, a distância de Z em relação a 130 (=6,66) é metade da distância de Z em relação a 150 (=13,34). EC 13. AFRF - 2001 [ESAF] Freqüências Acumuladas de Salários Anuais, em Milhares de Reais, da Cia. Alfa Classes de Salário Freqüências Acumuladas ( 3 ; 6] 12 ( 6 ; 9] 30 ( 9 ; 12] 50 (12 ; 15] 60 (15 ; 18] 65 (18 ; 21] 68 Suponha que a tabela de freqüências acumuladas tenha sido construída a partir de uma amostra de 10% dos empregados da Cia. Alfa. Deseja-se estimar, utilizando interpolação linear da ogiva, a freqüência populacional de salários anuais iguais ou inferiores a R$ 7.000,00 na Cia. Alfa. Assinale a opção que corresponde a este número. a) 180 b) 120 c) 150 d) 160 e) 130 Resolução: CURSO ON-LINE – ESTATÍSTICA P/ RECEITA FEDERAL PROFESSOR: VÍTOR MENEZES www.pontodosconcursos.com.br 33 Foram dadas freqüências acumuladas. Não precisamos fazer nenhuma transformação. Se a pergunta fosse: quantos empregados, na amostra feita, têm salários menores ou iguais a R$ 6.000, a resposta seria: 12. Basta consulta à tabela. Se a pergunta fosse: quantos empregados, na amostra feita, têm salários menores ou iguais a R$ 9.000,00, a resposta seria: 30. Novamente, basta consulta à tabela. Mas a pergunta foi: quantos funcionários têm salários menores ou iguais a R$ 7.000,00. Para este valor não temos informação na tabela. Precisamos fazer uma interpolação linear. Classes de Salário Freqüências Acumuladas ( 3 ; 6] 12 ( 6 ; 9] 30 ( 9 ; 12] 50 (12 ; 15] 60 (15 ; 18] 65 (18 ; 21] 68 Sabemos que: 6 12 6 corresponde a 12 7 W 7 corresponde a quem??? 9 30 9 corresponde a 30 Ou seja: Primeira linha 6 12 Segunda linha 7 W Terceira linha 9 30 Subtraindo as linhas: 7-6 W-12 9-6 30-12 A interpolação linear nos diz que estas diferenças são proporcionais: 1230 12 69 67 − −=− − W W=+12 3 18 18=W Ou seja, na amostra selecionada, 18 funcionários têm salários menores ou iguais a R$ 7.000,00. Só que não tem nenhuma opção com 18. Erramos em alguma coisa?? Não, nós não erramos nada. Os cálculos feitos foram todos referentes à amostra de 10% dos funcionários. Dentro desta amostra, 18 pessoas têm salários menores ou iguais a R$ 7.000,00. CURSO ON-LINE – ESTATÍSTICA P/ RECEITA FEDERAL PROFESSOR: VÍTOR MENEZES www.pontodosconcursos.com.br 34 Só que a pergunta do exercício foi outra. Considerando toda a empresa (e não apenas a amostra feita), quantos funcionários têm salários menores ou iguais a R$ 7.000,00? (contando inclusive os que não foram pesquisados). Nós só sabemos os salários daqueles que foram pesquisados. Ou seja, para responder à questão, vamos “dar um chute”. Vamos considerar que a proporção de pessoas que ganham salários menores ou iguais a R$ 7.000,00 seja a mesma, tanto na amostra, quanto na população. É como se fôssemos fazer uma regra de três: Em 10% dos funcionários ...... 18 funcionários ganham menos de 7 mil Em 100% dos funcionários ...... X ganham menos de 7 mil 10% ---- 18 100% ---- X Multiplicando cruzado: 1801001810 =⇒×=× XX Gabarito: A EC 14. Analista IRB 2006 [ESAF] No campo estatístico, ogivas são: a) polígonos de freqüência acumulada b) polígonos de freqüência acumulada relativa ou percentual. c) histograma de distribuição de freqüência d) histograma de distribuição de freqüência relativa ou percentual e) o equivalente à amplitude do intevalo. Resolução: Nós vimos que o gráfico de freqüência acumulada também é chamado de ogiva. Gabarito: A Texto para as questões EC 15 e EC 16. Analista MPU 2004 – Área Pericial. Especialidade: Estatística [ESAF] A distribuição de freqüências de determinado atributo X é dada na tabela abaixo. Não existem observações coincidentes com os extremos das classes. Classes Freqüências 2.000 – 4.000 18 CURSO ON-LINE – ESTATÍSTICA P/ RECEITA FEDERAL PROFESSOR: VÍTOR MENEZES www.pontodosconcursos.com.br 35 4.000 – 6.000 45 6.000 – 8.000 102 8.000 – 10.000 143 10.000 – 12.000 51 12.000 – 14.000 41 EC 15. Analista MPU 2004 – Área Pericial. Especialidade: Estatística [ESAF] Assinale a opção que corresponde à amplitude interquartílica. a) 4.500,1 b) 6.200,2 c) 3.000,4 d) 3.162,6 e) 2.400,0 Resolução: Foram dadas freqüências simples. Precisamos de freqüências acumuladas. Classes Freqüências Simples Freqüências acumuladas 2.000 – 4.000 18 18 4.000 – 6.000 45 63 6.000 – 8.000 102 165 8.000 – 10.000 143 308 10.000 – 12.000 51 359 12.000 – 14.000 41 400 Encontremos o terceiro quartil. O terceiro quartil é o valor que não é superado por 75% das observações. 75% de 400 equivale a 300. Classes Freqüências acumuladas 2.000 – 4.000 18 4.000 – 6.000 63 6.000 – 8.000 165 8.000 – 10.000 308 10.000 – 12.000 359 12.000 – 14.000 400 Sabemos que: 8.000 165 8.000 corresponde a 165 Z 300 Quem corresponde a 300??? 10.000 308 10.000 corresponde a 308 Ou seja: Primeira linha 8.000 165 CURSO ON-LINE – ESTATÍSTICA P/ RECEITA FEDERAL PROFESSOR: VÍTOR MENEZES www.pontodosconcursos.com.br 36 Segunda linha Z 300 Terceira linha 10.000 308 Subtraindo as linhas: Z – 8.000 300-165 10.000 – 8.000 308-165 A interpolação linear nos diz que estas diferenças são proporcionais: 165308 165300 000.8000.10 000.8 − −=− −Z 143 135 000.2 000.8 =−Z 000.8 143 000.2135 +×=Z O terceiro quartil vale: 000.8 143 000.2135 3 +×=Q Encontremos o primeiro quartil. O primeiro quatil é o valor que não é superado por 25% das observações. 25% de 400 equivale a 100. Classes Freqüências Acumuladas 2.000 – 4.000 18 4.000 – 6.000 63 6.000 – 8.000 165 8.000 – 10.000 308 10.000 – 12.000 359 12.000 – 14.000 400 Sabemos que: 6.000 63 6.000 corresponde a 63 Z 100 Quem corresponde a 100??? 8.000 165 8.000 corresponde a 165 Ou seja: Primeira linha 6.000 63 Segunda linha Z 100 Terceira linha 8.000 165 Subtraindo as linhas: Z – 6.000 100-63 8.000-6.000 165-63 CURSO ON-LINE – ESTATÍSTICA P/ RECEITA FEDERAL PROFESSOR: VÍTOR MENEZES www.pontodosconcursos.com.br 37 A interpolação linear nos diz que estas diferenças são proporcionais: 63165 63100 000.6000.8 000.6 − −=− −Z 102 37 000.2 000.6 =−Z 102 000.237000.6 ×+=Z O primeiro quartil é igual a: 102 000.237000.61 ×+=Q A amplitude interquartílica é igual à diferença entre o terceiro e o primeiro quartis. 102 000.237000.6143 000.2135000.813 ×−−×+=−QQ 62,316213 =−QQ Gabarito: D. Questão chata, hein. Com muita conta pra fazer. A ESAF muitas vezes exagera nas contas. Vejamos uma solução “alternativa”, fazendo aproximações. Vamos começar pelo terceiro quartil. Tínhamos o seguinte quadro: 8.000 165 8.000 corresponde a 165 Z 300 Quem corresponde a 300??? 10.000 308 10.000 corresponde a 308 Ou seja: Primeira linha 8.000 165 Segunda linha Z 300 Terceira linha 10.000 308 Procuramos quem corresponde a 300. Mas 300 é bem próximo de 308. 300 é um pouquinho menor que 308. Sabemos que 308 corresponde a 10.000. Portanto, o número que corresponde a 300 deve ser bem próximo a 10.000. O número que corresponde a 300 deve ser um pouquinho menor que 10.000. Vamos aproximar? Vamos dizer que o terceiro quartil é aproximadamente 10.000. 000.103 ≅Q Agora vamos para o primeiro quartil. Sabemos que: 6.000 63 6.000 corresponde a 63 Z 100 Quem corresponde a 100??? CURSO ON-LINE – ESTATÍSTICA P/ RECEITA FEDERAL PROFESSOR: VÍTOR MENEZES www.pontodosconcursos.com.br 38 8.000 165 8.000 corresponde a 165 Ou seja: Primeira linha 6.000 63 Segunda linha Z 100 Terceira linha 8.000 165 Subtraindo as linhas: Z – 6.000 100-63 8.000-6.000 165-63 A interpolação linear nos diz que estas diferenças são proporcionais: 63165 63100 000.6000.8 000.6 − −=− −Z 102 37 000.2 000.6 =−Z 102 000.237000.6 ×+=Z O denominador 102 é muito ruim. Vamos aproximar? Vamos trocá-lo por 100. 740.62037000.6 100 000.237000.6 =×+=×+≅Z O primeiro quartil vale, aproximadamente, 6.740. 740.61 ≅Q A amplitude interquartílica fica, aproximadamente, igual a: 260.3740.6000.1013 =−≅−QQ E a alternativa mais próxima é a letra D. EC 16. Analista MPU 2004 – Área Pericial. Especialidade: Estatística [ESAF] Assinale a opção que corresponde à estimativa do valor de X que não é superado por 80% das observações do atributo X a) 12.000 b) 10.000 c) 10.471 d) 9.000 e) 11.700 Resolução: Oitenta por cento de 400 corresponde a 320. Assim, estamos buscando pelo valor que não é superado por 320 observações. CURSO ON-LINE – ESTATÍSTICA P/ RECEITA FEDERAL PROFESSOR: VÍTOR MENEZES www.pontodosconcursos.com.br 39 Classes Freqüências acumuladas 2.000 – 4.000 18 4.000 – 6.000 63 6.000 – 8.000 165 8.000 – 10.000 308 10.000 – 12.000 359 12.000 – 14.000 400 Sabemos que: 10.000 308 10.000 corresponde a 308 Z 320 Quem corresponde a 320??? 12.000 359 12.000 corresponde a 359 Ou seja: Primeira linha 10.000 308 Segunda linha Z 320 Terceira linha 12.000 359 Antes de continuarmos as contas, olha que detalhe interessante. 320 está entre 308 e 359. Portanto, o número que corresponde a 320 (que estamos chamando de Z), está entre 10.000 e 12.000. Já dá para descartar as letras A, B e D. 320 está mais próximo de 308 do que de 359. Portanto, Z está mais próximo de 10.000 do que de 12.000. Com isso, descartamos a letra E e ficamos com a letra C. De todo modo, vamos continuar com a resolução de sempre. Subtraindo as linhas: Z – 10.000 320-308 12.000-10.000 359-308 A interpolação linear nos diz que estas diferenças são proporcionais: 308359 308320 000.10000.12 000.10 − −=− −Z 51 12 000.2 000.10 =−Z 58,470.10000.10 51 12000.2 ≅+×=Z Note como o denominador 51 dificulta as contas. Vamos tentar “fugir” dele. Aproximando a fração: CURSO ON-LINE – ESTATÍSTICA P/ RECEITA FEDERAL PROFESSOR: VÍTOR MENEZES www.pontodosconcursos.com.br 40 480.10000.10 50 12000.2000.10 51 12000.2 =+×≅+×=Z Quando trocamos o denominador 51 por 50, nós aumentamos um pouco o valor de Z. Portanto, na verdade Z, é um pouco menor que 10.480. Gabarito: C Texto para as questões EC 17 e EC 18 Analista IRB 2004 [ESAF] As questões seguintes dizem respeito à distribuição de freqüências conforme o quadro abaixo, no qual não existem observações coincidentes com os extremos das classes. Classe Freqüência acumulada 129,5 – 139,5 4 139,5 – 149,5 12 149,5 – 159,5 26 159,5 – 169,5 46 169,5 – 179,5 72 179,5 – 189,5 90 189,5 – 199,5 100 EC 17. Analista IRB 2004 [ESAF] Assinale a opção que corresponde ao oitavo decil a) 179,5 b) 189,5 c) 183,9 d) 184,5 e) 174,5 Resolução: O oitavo decil é o valor que não é superado por 80% das observações. Como foram dadas freqüências acumuladas, não precisamos fazer nenhuma transformação. Classe Freqüência acumulada 129,5 – 139,5 4 139,5 – 149,5 12 149,5 – 159,5 26 159,5 – 169,5 46 169,5 – 179,5 72 179,5 – 189,5 90 189,5 – 199,5 100 Sabemos que: 179,5 72 179,5 corresponde a 72 Z 80 Quem corresponde a 80??? CURSO ON-LINE – ESTATÍSTICA P/ RECEITA FEDERAL PROFESSOR: VÍTOR MENEZES www.pontodosconcursos.com.br 41 189,5 90 189,5 corresponde a 90 Ou seja: Primeira linha 179,5 72 Segunda linha Z 80 Terceira linha 189,5 90 Antes de iniciarmos as contas, vamos olhar as alternativas. Z está entre 179,5 e 189,5. Já descartamos as letras “A” e “B”. 81 está no exatamente no meio entre 72 e 90. O número que corresponde a 81, portanto, está bem no meio entre 179,5 e 189,5. Logo, o número que corresponde a 81 é 184,5. 80 é um pouquinho menor que 81. Portanto, o número que corresponde a 80 (que estamos chamando de Z), é um pouquinho menor que 184,5. Descartamos a letra “D”. E entre as letras “C” e “E”, ficamos com certeza com a letra “C”. Retomemos nossa resolução usual. Subtraindo as linhas: Z – 179,5 80-72 189,5-179,5 90-72 A interpolação linear nos diz que estas diferenças são proporcionais: 7290 7280 5,1795,189 5,179 − −=− −Z 18 8 10 5,179 =−Z 94,183 18 805,179 ≅+=Z Note como a fração 80/18 não é muito “amigável”. Aproximando a fração: 1845,45,179 2 95,179 18 815,179 18 805,179 =+=+=+≅+=Z Quando nós trocamos o numerador 80 por 81, nós aumentamos um pouco o valor de Z. Z é na verdade um pouco menor que 184. Gabarito: C EC 18. Analista IRB 2004 [ESAF] Assinale a opção que corresponde à estimativa, via interpolação da ogiva, do número de observações menores ou iguais ao valor 164. a) 46 CURSO ON-LINE – ESTATÍSTICA P/ RECEITA FEDERAL PROFESSOR: VÍTOR MENEZES www.pontodosconcursos.com.br 42 b) 26 c) 72 d) 35 e) 20 Resolução: Classe Freqüência acumulada 129,5 – 139,5 4 139,5 – 149,5 12 149,5 – 159,5 26 159,5 – 169,5 46 169,5 – 179,5 72 179,5 – 189,5 90 189,5 – 199,5 100 Sabemos que: 159,5 26 159,5 corresponde a 26 164 W 164 corresponde a quem??? 169,5 46 169,5 corresponde a 46 Ou seja: Primeira linha 159,5 26 Segunda linha 164 W Terceira linha 169,5 46 Novamente, antes de iniciarmos as contas, vamos ver as alternativas. W está entre 26 e 46. Já descartamos as letras A, B, C e E. E marcamos a letra D. Marcada a resposta correta, vejamos as contas. Subtraindo as linhas: 164-159,5 W-26 169,5-159,5 46-26 A interpolação linear nos diz que estas diferenças são proporcionais: 2646 26 5,1595,169 5,159164 − −=− − W 20 26 10 5,4 −= W 352692620 10 5,4 =+=+×=W Gabarito: D CURSO ON-LINE – ESTATÍSTICA P/ RECEITA FEDERAL PROFESSOR: VÍTOR MENEZES www.pontodosconcursos.com.br 43 EC 19. AFRF - 2002-2 – [ESAF] O atributo do tipo contínuo X, observado como um inteiro, numa amostra de tamanho 100 obtida de uma população de 1000 indivíduos, produziu a tabela de freqüências seguinte: Classes Freqüência ( f ) 29,5-39,5 4 39,5-49,5 8 49,5-59,514 59,5-69,5 20 69,5-79,5 26 79,5-89,5 18 89,5-99,5 10 Assinale a opção que corresponde à estimativa do número de indivíduos na população com valores do atributo X menores ou iguais a 95,5 e maiores do que 50,5. a) 700 b) 638 c) 826 d) 995 e) 900 Resolução: Questão um pouco mais trabalhosa, pois precisamos fazer duas interpolações. Primeira interpolação: vamos encontrar quantas observações são menores ou iguais a 95,5. Para tanto, precisamos das freqüências acumuladas. Classes Freqüência ( f ) Freqüência acumulada (F) 29,5-39,5 4 4 39,5-49,5 8 12 49,5-59,5 14 26 59,5-69,5 20 46 69,5-79,5 26 72 79,5-89,5 18 90 89,5-99,5 10 100 Classes Freqüência acumulada (F) 29,5-39,5 4 39,5-49,5 12 49,5-59,5 26 59,5-69,5 46 69,5-79,5 72 79,5-89,5 90 CURSO ON-LINE – ESTATÍSTICA P/ RECEITA FEDERAL PROFESSOR: VÍTOR MENEZES www.pontodosconcursos.com.br 44 89,5-99,5 100 Sabemos que: 89,5 90 89,5 corresponde a 90 95,5 W 95,5 corresponde a quem??? 99,5 100 99,5 corresponde a 100 Ou seja: Primeira linha 89,5 90 Segunda linha 95,5 W Terceira linha 99,5 100 Subtraindo as linhas: 95,5-89,5 W-90 99,5-89,5 100-90 A interpolação linear nos diz que estas diferenças são proporcionais: 90100 90 5,895,99 5,895,95 − −=− − W 96 10 90 10 6 =⇒−= WW Segunda interpolação: vamos encontrar quantas observações são menores ou iguais a 50,5. Classes Freqüência acumulada (F) 29,5-39,5 4 39,5-49,5 12 49,5-59,5 26 59,5-69,5 46 69,5-79,5 72 79,5-89,5 90 89,5-99,5 100 Sabemos que: 49,5 12 49,5 corresponde a 12 50,5 W’ 50,5 corresponde a quem??? 59,5 26 59,5 corresponde a 26 Ou seja: Primeira linha 49,5 12 Segunda linha 50,5 W’ Terceira linha 59,5 26 CURSO ON-LINE – ESTATÍSTICA P/ RECEITA FEDERAL PROFESSOR: VÍTOR MENEZES www.pontodosconcursos.com.br 45 Subtraindo as linhas: 50,5-49,5 W’-12 59,5-49,5 26-12 A interpolação linear nos diz que estas diferenças são proporcionais: 1226 12' 5,495,59 5,495,50 − −=− − W 4,13' 14 12' 10 1 =⇒−= WW Ou seja, 13,4 observações são menores ou iguais a 50,5. Eu sei que não faz sentido falar em 13,4 observações (pois deveríamos apenas ter números naturais quando nos referimos a observações). Mas tudo bem, continuemos o exercício. Feitas as duas interpolações, sabemos que: 96 observações são menores ou iguais a 95,5. Isto na amostra de tamanho 100. Na população de tamanho 1.000, são 960 observações menores ou iguais a 95,5. É como se fôssemos fazer uma regra de três, a exemplo da que fizemos no EC 13 (fl. 32). Na amostra de tamanho 100 , temos 96 observações são menores ou iguais a 95,5. Na população de tamanho 1.000 , são X observações são menores ou iguais a 95,5 100 - 96 1.000 - X Multiplicando cruzado: 960000.196100 =⇒×=× XX Sabemos também que 13,4 observações são menores ou iguais a 50,5. Isto na amostra de tamanho 100. Na população de tamanho 1.000 são 134 observações menores ou iguais a 50,5. Basta fazer outra regra de três. Na amostra de tamanho 100 são 13,4 observações são menores ou iguais a 50,5 Na população de tamanho 1.000 são X’ observações são menores ou iguais a 50,5 134'000.14,13100' =⇒×=× XX Assim, sabemos que, na população, temos 960 observações menores ou iguais a 95,5. Destas 960, 134 são menores ou iguais a 50,5. Portanto, 826 ( 134960 −= ) observações são menores ou iguais a 95,5 e maiores que 50,5. Gabarito: C. Muita conta, né? Vamos ver uma solução alternativa, fazendo aproximações. Na primeira interpolação nós tínhamos: Primeira linha 89,5 90 Segunda linha 95,5 W CURSO ON-LINE – ESTATÍSTICA P/ RECEITA FEDERAL PROFESSOR: VÍTOR MENEZES www.pontodosconcursos.com.br 46 Terceira linha 99,5 100 Sabemos que 94,5 está bem no meio entre 89,5 e 99,5. Portanto, ele corresponde a 95, que está bem no meio entre 90 e 100. 95,5 é um pouquinho maior que 94,5. Logo, o número que corresponde a 95,5 (que estamos chamando de W) é um pouquinho maior que 95. Vamos aproximar? 95≅W Na segunda interpolação nós tínhamos: 49,5 12 49,5 corresponde a 12 50,5 W’ 50,5 corresponde a quem??? 59,5 26 59,5 corresponde a 26 49,5 corresponde a 12. 50,5 é um pouquinho maior que 49,5. Portanto, o número que corresponde a 50,5 (que estamos chamando de W’) é um pouco maior que 12. Vamos aproximar? 12'≅W E a diferença entre os resultados das interpolações fica: 831295' =−=−WW Isso na amostra. Na população, temos que multiplicar esse valor por 10. 8301083 =× E novamente marcamos a letra C. EC 20. Técnico Municipal de Nível Superior – Estatística – Prefeitura Municipal de Vila Velha [CESPE] Uma prefeitura registrou o aumento do valor venal V (em R$ por metro quadrado) de 200 imóveis localizados em certo bairro residencial, conforme apresentado na tabela a seguir: Valor V (R$/m2) Número de imóveis V = 0 80 0 < V ≤ 10 50 10 < V ≤ 20 35 20 < V ≤ 30 25 30 < V ≤ 50 10 Total 200 Com base nessas informações, julgue os itens a seguir. CURSO ON-LINE – ESTATÍSTICA P/ RECEITA FEDERAL PROFESSOR: VÍTOR MENEZES www.pontodosconcursos.com.br 47 99. A mediana, que é igual a R$ 25,00/m2, divide os 50% valores mais baixos dos 50% valores mais altos. Resolução: Como as freqüências fornecidas são simples, calculemos as freqüências acumuladas. Valor V (R$/m2) f F V = 0 80 80 0 < V ≤ 10 50 130 10 < V ≤ 20 35 165 20 < V ≤ 30 25 190 30 < V ≤ 50 10 200 Note que na primeira linha nem temos realmente uma classe. Sabemos que todas as 80 observações da primeira linha são exatamente iguais a 0. Não é uma classe, é um valor único. A pergunta é sobre a mediana. Ou seja, o valor que não é superado por 100 observações (= 50% de 200). Sabemos que a freqüência acumulada que corresponde ao valor 0 é 80. A freqüência acumulada que corresponde ao valor 10 é 130. Sabemos que 100 está entre 80 e 130. Portanto, o valor procurado está entre 0 e 10. 0 80 0 corresponde a 80 Z 100 Quem corresponde a 100? 10 130 10 corresponde a 130 Ora, se sabemos que 0 < Z < 10, concluímos que o valor procurado não pode ser igual a 25. Portanto, a questão está incorreta. Gabarito: Errado EC 21. Analista Previdenciário Pleno – Área de Estatística – Paraná Previdência – 2002 [CESPE] Texto II Em estudos previdenciários, é importante avaliar estatisticamente o tempo de sobrevida dos beneficiários. O tempo de sobrevida, em geral, depende do perfil do beneficiário, que abrange um conjunto de características como idade, espécie de benefícios (aposentadoria por idade, invalidez etc.), tipo de clientela (urbana/rural) etc. Para um estudo realizado acerca do tempo de sobrevida de beneficiários com um certo perfil, foram obtidos os resultados apresentados na tabela abaixo. Tempo de sobrevida T em anos 0≤ T < 5 5≤ T < 10 10≤T< 20 20≤T< 40 Total Freqüência de beneficiários falecidos (%) 20 40 30 10 100 CURSO ON-LINE – ESTATÍSTICA P/ RECEITA FEDERAL PROFESSOR: VÍTOR MENEZES www.pontodosconcursos.com.br 48 Com base nos estudos obtidos para o estudo apresentado no texto II, julgue o item que se segue. 1. O primeiro quartil da distribuição é inferior a 5 anos. Resolução: Outra questão do CESPE. Também, não precisa de muita conta. Foram fornecidas freqüências relativas simples. Precisamos achar as freqüências acumuladas. Classes Freqüência relativa simples (fr) Freqüência relativa acumulada (Fr) [0;5) 20 20 [5;10) 40 60 [10;20) 30 90 [20;40) 10 100 O primeiro quartil é o valor que não é superado por25% das observações. Portanto, temos que achar o valor que corresponde à freqüência acumulada de 25%. Só que na tabela acima não tem o valor 25%. Sabemos que 25 está entre 20 e 60. Portanto o valor procurado está entre 5 e 10. 5 20 5 corresponde a 20 Z 25 Quem corresponde a 25? 10 60 10 corresponde a 60 Se o valor procurado está entre 5 e 10, então não pode ser inferior a 5. A questão está errada. Gabarito: Errado EC 22. Analista de Regulação – Economista – ARCE/2006 [FCC] Uma empresa tem 1.000 empregados, classificados conforme a tabela abaixo: Salários (R$) Homens Mulheres Total (500; 1.500] 40 40 80 (1.500; 2.500] 140 100 240 (2.500; 3.500] 180 120 300 (3.500; 4.500] 140 80 220 (4.500; 5.500] 100 60 160 Total 600 400 1000 Observação: calculou-se as médias aritméticas correspondentes para grupo e geral considerando que todos os valores incluídos num certo intervalo de classe são coincidentes com o ponto médio deste intervalo. Para o cálculo das medianas utilizou-se o método da interpolação linear. Analisando os valores obtidos com relação aos empregados desta empresa, tem-se que: a) a média aritmética e a mediana dos salários dos homens são iguais a R$ 3.250,00 e R$ 3.000,00, respectivamente. CURSO ON-LINE – ESTATÍSTICA P/ RECEITA FEDERAL PROFESSOR: VÍTOR MENEZES www.pontodosconcursos.com.br 49 b) a média aritmética e a mediana dos salários das mulheres são iguais a R$ 3.200,00 e R$ 3.000,00, respectivamente. c) o valor encontrado para a média aritmética dos salários dos empregados de toda a empresa é igual a 3.125,00. d) o módulo da diferença entre as médias aritméticas dos salários dos 2 grupos é igual a R$ 150,00 e) o módulo da diferença entre os valores das medianas dos salários entre os 2 grupos é inferior a R$ 150,00. Resolução: Comecemos pela letra A. Segue a tabela salarial dos homens, considerando freqüências acumuladas: Salários (R$) f F (500; 1.500] 40 40 (1.500; 2.500] 140 180 (2.500; 3.500] 180 360 (3.500; 4.500] 140 500 (4.500; 5.500] 100 600 Vamos achar a mediana dos homens. A mediana é o valor salarial que não é superado por 300 observações (são 600 homens; 50% de 600 = 300). Sabemos que: 2.500 180 2500 corresponde a 180 Z 300 quem corresponde a 300? 3.500 360 3500 corresponde a 360 Ficamos com: Primeira linha 2500 180 Segunda linha Z 300 Terceira linha 3500 360 Subtraindo as linhas: Z-2500 300-180 3500-2500 360-180 A interpolação linear nos diz que estas diferenças são proporcionais. 180360 180300 25003500 2500 − −=− −Z Isolando o Z: 166.325006662500 180 1201000 =+≅+×=Z A mediana salarial masculina não é de R$ 3.000. Descartamos a letra A. CURSO ON-LINE – ESTATÍSTICA P/ RECEITA FEDERAL PROFESSOR: VÍTOR MENEZES www.pontodosconcursos.com.br 50 Vejamos a mediana feminina. Salários (R$) f F (500; 1.500] 40 40 (1.500; 2.500] 100 140 (2.500; 3.500] 120 260 (3.500; 4.500] 80 340 (4.500; 5.500] 60 400 São 400 mulheres. A mediana é o valor que não é superado por 200 observações (200 = 50% de 400). Podemos montar o seguinte quadro: 2.500 140 2500 corresponde a 140 Z’ 200 quem corresponde a 200? 3.500 260 3500 corresponde a 260 Ficamos com: Primeira linha 2500 140 Segunda linha Z’ 200 Terceira linha 3500 260 Observe que 200 está bem no meio entre 140 e 260. Portanto, Z’ está bem no meio entre 2500 e 3500. Temos que: 3000'=Z A mediana feminina é de R$ 3.000,00. Ainda não deu para descartar a letra B. Vamos calcular a média das mulheres. Para tanto, façamos uso da variável transformada. Classes Pontos médios ( X ) 1000 1000−= Xd f fd × (500; 1.500] 1.000 0 40 0 (1.500; 2.500] 2.000 1 100 100 (2.500; 3.500] 3.000 2 120 240 (3.500; 4.500] 4.000 3 80 240 (4.500; 5.500] 5.000 4 60 240 TOTAL 400 820 E a média de d fica: 400 820=d Vamos achar a média de X: 10001000 +×= dX CURSO ON-LINE – ESTATÍSTICA P/ RECEITA FEDERAL PROFESSOR: VÍTOR MENEZES www.pontodosconcursos.com.br 51 10001000 +×= dX 050.31000 400 8201000 =+×=X Descartamos a letra B. A letra E também está errada. A mediana dos homens é de R$ 3.166,00. A mediana das mulheres é R$ 3.000,00. A diferença entre ambas é maior que R$ 150,00. Sobraram as letras C e D. Vamos achar a média dos homens. Classes Pontos médios ( X ) 1000 1000−= Xd f fd × (500; 1.500] 1.000 0 40 0 (1.500; 2.500] 2.000 1 140 140 (2.500; 3.500] 3.000 2 180 360 (3.500; 4.500] 4.000 3 140 420 (4.500; 5.500] 5.000 4 100 400 TOTAL 600 1320 A média de d fica: 2,2 600 1320 ==d Sabemos que: dX ×+= 10001000 Portanto: 200.32,21000100010001000 =×+=×+= dX A média salarial dos homens é de 3.200,00 A diferença entre as médias dos homens e das mulheres, de fato, é de R$ 150,00. Gabarito: D. Vejam que a questão não é difícil. Mas é trabalhosa. Tomou muito tempo. Foi preciso calcular várias medidas (médias e medianas para cada grupo). Na hora da prova, se você se deparar com algo desse tipo, pense na hipótese de deixar a questão para depois. Principalmente se você não for muito rápido em contas. Se sobrar tempo, ao final da prova você volta e resolve. Você não vai para uma prova para fazer todas as questões. Você vai para tentar fazer o maior número de pontos possível. Às vezes compensa pular uma questão muito trabalhosa, poupando tempo, para fazer muitas questões fáceis. Texto para as questões EC 23 e EC 24 A tabela abaixo apresenta a distribuição de freqüências das notas obtidas num teste de matemática, realizado por 50 estudantes. Notas Freqüência absoluta 0 │− 2 4 CURSO ON-LINE – ESTATÍSTICA P/ RECEITA FEDERAL PROFESSOR: VÍTOR MENEZES www.pontodosconcursos.com.br 52 2 │− 4 12 4 │− 6 15 6 │− 8 13 8 │− 10 6 EC 23. Analista Judiciário. Especialidade: estatística. TRF 1ª Região [FCC] Se a nota mínima para aprovação no teste é 5,8, a porcentagem de aprovação é de: a) 51% b) 48% c) 45% d) 41% e) 38% EC 24. Analista Judiciário. Especialidade: estatística. TRF 1ª Região [FCC] A nota mediana desses estudantes é: a) 4,8 b) 5,0 c) 5,2 d) 5,5 e) 5,8 Resoluções: Comecemos pelo EC 23: Vamos achar as freqüências acumuladas. Notas Freqüência simples Freqüência acumulada 0 │− 2 4 4 2 │− 4 12 16 4 │− 6 15 31 6 │− 8 13 44 8 │− 10 6 50 Queremos saber qual a freqüência acumulada que corresponde a 5,8. Podemos montar o seguinte quadro: 4 16 4 corresponde a 16 5,8 W 5,8 corresponde a quem? 6 31 6 corresponde a 31 Ficamos com: CURSO ON-LINE – ESTATÍSTICA P/ RECEITA FEDERAL PROFESSOR: VÍTOR MENEZES www.pontodosconcursos.com.br 53 Primeira linha 4 16 Segunda linha 5,8 W Terceira linha 6 31 Subtraindo as linhas: 5,8-4 W-16 6-4 31-16 A interpolação linear nos garante que estas diferenças são proporcionais. 1631 16 46 48,5 − −=− − W Isolando o W: 5,291615 2 8,1 =+×=W Então 29,5 alunos tiraram notas menores ou iguais a 5,8. Eu sei que não faz sentido falar em 29,5 alunos (pois só podemos ter um número inteiro de alunos). Mas vamos continuar. Se 29,5 alunos tiraram menos que 5,8 e, ao todo, são 50 alunos, então 20,5 alunos tiraram mais que 5,8. O percentual de alunos aprovados é: %41 50 5,20 = Gabarito: D. Agora vamos para o EC 24. A mediana é o valor que não é superado por 50% das observações. Ou seja, é o valor que não é superado por 25 observações. Podemos montar o seguinte quadro: 4 16 4 corresponde a 16 Z 25 quem corresponde a 25? 6 31 6 corresponde a 31 Ficamos com:
Compartilhar