Baixe o app para aproveitar ainda mais
Prévia do material em texto
Prof. Arthur Lima Aula 08 1 de 122| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 Aula 08 – Medidas de Dispersão Raciocínio Analítico, Matemática Financeira e Estatística p/ Auditor do TCU – 2019 Prof. Arthur Lima Prof. Arthur Lima Aula 08 2 de 122| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 Sumário MEDIDAS DE DISPERSÃO OU VARIABILIDADE ................................................................................................... 3 MEDIDAS SEPARATRIZES – QUARTIS ................................................................................................................ 3 MEDIDAS DE DISPERSÃO OU VARIABILIDADE .................................................................................................. 8 Variância ......................................................................................................................................................... 8 Desvio padrão ............................................................................................................................................... 12 Coeficiente de variação .................................................................................................................................. 17 TÉCNICAS DE AMOSTRAGEM .......................................................................................................................... 19 Técnicas casuais de amostragem (probabilísticas) ........................................................................................... 20 Técnicas não-casuais de amostragem (não probabilísticas) .............................................................................. 21 QUESTÕES COMENTADAS PELO PROFESSOR ................................................................................................. 24 LISTA DE QUESTÕES DA AULA ........................................................................................................................ 90 GABARITO ..................................................................................................................................................... 119 RESUMO DIRECIONADO ................................................................................................................................ 120 Prof. Arthur Lima Aula 08 3 de 122| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 Medidas de Dispersão Olá, tudo bem? Aqui é o professor Arthur Lima. É com muita alegria que inicio mais essa aula. Vamos tratar sobre os seguintes tópicos do seu edital neste encontro: Medidas de dispersão: desvio-padrão, variância, coeficiente de variação. Correlação. Histogramas e curvas de frequência. Diagrama box-plot. Avaliação de outliers. Análise de dados categorizados. Aproveito para lembrá-lo de seguir as minhas redes sociais e acompanhar de perto o trabalho que desenvolvo: MEDIDAS SEPARATRIZES – QUARTIS Assim como a mediana divide os dados em 2, os quartis dividem os dados em 4. Isto é, abaixo do primeiro quartil estão ¼, ou 25% das observações. Dele até o segundo quartil, outros 25%. E assim por diante. Note que o segundo quartil é a própria mediana, pois 50% dos dados são inferiores a ele. Para exemplificar, vamos utilizar a tabela abaixo: Valor da variável Frequências (Fi) 1,50m 15 1,51m 5 1,53m 4 1,57m 2 1,60m 10 1,63m 8 Prof. Arthur Lima Aula 08 4 de 122| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 1,65m 1 1,71m 20 1,73m 10 1,75m 3 1,83m 2 Veja que temos 80 observações (frequências), isto é, n = 80. O primeiro quartil (Q1) está localizado na posição (n+1)/4, que neste caso é (80+1)/4 = 20,25. Veja que não existe a posição 20,25. Precisamos, portanto, fazer a média entre o valor da posição 20 e o da posição 21. Na posição 20 temos 1,51m, e na posição 21 temos 1,53m. Portanto, Q1 = (1,51 + 1,53)/2 = 1,52m. Ou seja, 25% dos indivíduos observados possuem altura inferior a 1,52m. Já o segundo quartil (Q2) é a própria mediana, localizada na posição 2(n+1)/4, ou simplesmente (n+1)/2. Com n = 80, o Q2 está na posição 40,5. Como essa posição não existe, precisamos fazer a média entre o valor da posição 40 (que é 1,63m) e o da posição 41 (que também é 1,63m). Portanto, Q2 = (1,63 + 1,63)/2 = 1,63m. Isto é, 50% dos dados encontram-se abaixo de 1,63m. O terceiro quartil (Q3) está na posição 3(n+1)/4, que neste caso é igual a 60,75. Fazendo a média entre o valor da posição 60 (1,71) e o da posição 61 (também 1,71), temos que Q3 = 1,71m. Isto é, 75% das observações encontram-se abaixo de 1,71m. Resumindo, temos: Quartil Posição 1 (n+1)/4 2 2(n+1)/4 3 3(n+1)/4 Analogamente aos quartis, que dividem os dados em 4 grupos, temos os decis (que dividem em 10 grupos) e os percentis (que dividem em 100 grupos). Veja que a mediana, o 2º quartil, o 5º decil e o 50º percentil são o mesmo valor. Chamamos de amplitude interquartílica a distância entre o 1º e o 3º quartis de uma distribuição, ou seja: AI = Q3 – Q1 Prof. Arthur Lima Aula 08 5 de 122| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 O método da interpolação linear usado para o cálculo da mediana pode ser aplicado aqui, com as devidas adaptações. Observe isso na questão abaixo: ESAF – AFRFB – 2003) Considere a tabela de frequências seguinte correspondente a uma amostra da variável X. Não existem observações coincidentes com os extremos das classes. Assinale a opção que corresponde à estimativa do valor x da distribuição amostral de X que não é superado por cerca de 80% das observações. a) 10.000 b) 12.000 c) 12.500 d) 11.000 e) 10.500 RESOLUÇÃO: Para resolver essa questão vamos usar os mesmos conceitos de interpolação linear que vimos no estudo da mediana. Através da coluna de frequências relativas (%) acumuladas, veja que a observação que se encontra na posição 80% está na classe de 10.000 – 12.000. Assim, podemos montar a seguinte proporção: Frequência: 77% 80% 89% |-----------------------------|----------------| Valores: 10000 X 12000 |-----------------------------|----------------| Assim, temos a proporção: 0,89 0,80 12000 0,89 0,77 12000 10000 X− − = − − 0,09 12000 0,12 2000 X− = Prof. Arthur Lima Aula 08 6 de 122| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 X = 10500 Portanto, podemos dizer que 80% das observações são iguais ou inferiores a 10500. Resposta: E Obs.: observe que nessa questão o que obtivemos foi o valor do 8º decil (D8), ou do 80º percentil (P80) da distribuição. Desta mesma forma você consegue obter qualquer quartil, decil ou percentil solicitado por uma questão. Chamamos de Box-Plot a representação gráfica abaixo. Ela nos permite visualizar rapidamente os limites inferior e superior de uma distribuição, além do 1º quartil, mediana e 3º quartil: É importante saber que os limites inferior e superior não são, necessariamente, os pontos mínimo e máximo da distribuição. Devemos calculá-los da seguinte forma: a) Limite inferior: é o maior valor entre os dois abaixo: Valor mínimo da distribuição ou Q1 – 1,5 x (Q3 – Q1) b) Limite superior: é o menor valor entre os dois abaixo: Valor máximo da distribuição ou Q3 + 1,5 x(Q3 – Q1) Prof. Arthur Lima Aula 08 7 de 122| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 Este procedimento é necessário para não representarmos no Box-Plot os “pontos fora da curva”, isto é os valores extremamente baixos ou extremamente altos na distribuição, que representam verdadeiras exceções. Em nosso exemplo (distribuição de alturas), obtivemos os seguintes valores: - máximo = 1,83m - 3º quartil = 1,71m - Mediana = 1,63m - 1º quartil = 1,52m - mínimo = 1,50m Portanto, podemos ver que: Q1 – 1,5 x (Q3 – Q1) = 1,52 – 1,5 x (1,71 – 1,52) = 1,23m Como o mínimo é maior que este valor, devemos adotar como limite inferior o próprio valor mínimo, isto é, 1,50m. Da mesma forma: Q3 + 1,5 x (Q3 – Q1) = 1,71 + 1,5 x (1,71 – 1,52) = 1,99m Como o valor máximo é menor que este valor, podemos adotar como limite superior o próprio valor máximo, isto é, 1,83m. Em outras palavras, estamos dizendo que esta distribuição de alturas não tem “pontos fora da curva”, ou outliers. Assim, nosso box-plot é: A visualização do Box-Plot é muito útil, pois permite ao pesquisador experiente obter rapidamente um “resumo” das principais características de uma distribuição. Prof. Arthur Lima Aula 08 8 de 122| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 MEDIDAS DE DISPERSÃO OU VARIABILIDADE As medidas de dispersão (ou variabilidade) medem o grau de espalhamento dos dados de uma distribuição. Se você anotar as idades dos seus colegas de faculdade, provavelmente verá que a maioria deles se concentra numa faixa muito estreita (talvez entre 19 e 24 anos), com evidente predominância dos jovens, havendo um ou outro caso que destoa dessa faixa. Agora, se você tentar anotar as idades das pessoas que frequentam uma determinada praia, verá que a dispersão é muito maior, isto é, existem quantidades significativas de crianças, jovens, adultos e idosos. Para quantificar essa dispersão (ou variabilidade) existem diversas medidas, dentre as quais as principais são: a variância, o desvio padrão e o coeficiente de variação. Variância Chamamos de variância a média do quadrado das distâncias de cada observação até a média aritmética. Complicado? Vamos por partes... A distância de uma observação Xi até a média aritmética X é dada pela subtração iX X− . O quadrado desta distância é 2( )iX X− . A média do quadrado dessas distâncias é dado pelo somatório de todos os valores 2( )iX X− , dividido pelo total de observações (n). Portanto, a fórmula da variância é: 2 2 1 ( ) n iX X Variancia n − = = Como você viu nesta fórmula, costumamos simbolizar a variância por 2 . Exemplificando, vamos calcular a variância do seguinte conjunto de dados: {1, 3, 5, 5, 8, 9}. Repare que temos n = 6 elementos, cuja média é: 1 3 5 5 8 9 6 6 X + + + + + = = Assim, a variância é: 2 2 2 2 2 2 2 2 1 2 ( ) (1 6) (3 6) (5 6) (5 6) (8 6) (9 6) 6 25 9 1 1 4 9 8,16 6 n iX X n − − + − + − + − + − + − = = + + + + + = = Esta é a fórmula básica da variância. Entretanto, dependendo do exercício pode ser que seja mais conveniente usar alguma das fórmulas a seguir, que são meras variações desta primeira: Caso os dados estejam em uma tabela de frequências (fi): Prof. Arthur Lima Aula 08 9 de 122| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 2 2 1 1 [ ( ) ] n i i n i f X X f − = Caso os dados estejam em uma tabela de frequências, porém agrupados em intervalos de classes, devemos usar os pontos médios PMi no lugar dos valores individuais Xi: 2 2 1 1 [ ( ) ] n i i n i f PM X f − = Veja que em todas as fórmulas para cálculo da variância é preciso inicialmente obter o valor da média da população. Entretanto, a fórmula abaixo nos permite encontrar a variância sem precisar calcular a média: 2 2 1 12 1n n i i i i X X n n = = − = Veja que, nesta fórmula, só é preciso obter o valor do somatório das observações ( 1 n i i X = ), bem como o somatório dos quadrados das observações ( 2 1 n i i X = ), que são cálculos relativamente fáceis. Se os dados estiverem agrupados, você pode alterar esta última fórmula, utilizando a seguinte: 2 2 1 12 1 ( ) ( ) n n i i i i i i X f X f n n = = − = E se estiverem em intervalos de classes, você pode utilizar os pontos médios: 2 2 1 12 1 ( ) ( ) n n i i i i i i PM f PM f n n = = − = ATENÇÃO: todas as fórmulas vistas acima permitem calcular a variância de uma POPULAÇÃO. Caso o exercício apresente apenas uma amostra da população, devemos fazer uma pequena alteração nas fórmulas acima, calculando a variância AMOSTRAL, que é simbolizada por s2. Esta alteração consiste em subtrair uma unidade (1) no denominador das fórmulas. Prof. Arthur Lima Aula 08 10 de 122| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 Exemplificando, ao invés de 2 2 1 ( ) n iX X n − = , teremos: 2 2 1 ( ) 1 n iX X s n − = − Analogamente, ao invés de 2 2 1 1 [ ( ) ] n i i n i f X X f − = , teremos: 2 2 1 1 [ ( ) ] 1 n i i n i f X X s f − = − E ao invés de 2 2 1 12 1 ( ) ( ) n n i i i i i i PM f PM f n n = = − = , usaremos: 2 2 1 12 1 ( ) ( ) 1 n n i i i i i i PM f PM f n s n = = − = − Resolva as questões abaixo antes de prosseguir: ESAF – ATRFB – 2009) Obtenha o valor mais próximo da variância amostral da seguinte distribuição de frequências, onde xi representa o i-ésimo valor observado e fi a respectiva frequência. xi : 5 6 7 8 9 fi : 2 6 6 4 3 a) 1,429. b) 1,225. c) 1,5. d) 1,39. e) 1,4. RESOLUÇÃO: Prof. Arthur Lima Aula 08 11 de 122| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 Aqui temos uma amostra, e não uma população. Portanto, a fórmula da variância é: 2 2 1 ( ) ( ) 1 n Xi X Variancia amostra S n − = = − O primeiro passo é calcular a média, que é dada por: 1 1 ( ) n i n i Xi Fi Média Fi = = = 5 2 6 6 7 6 8 4 9 3 147 7 2 6 6 4 3 21 Média + + + + = = = + + + + Para o cálculo da variância, temos: 2 2 2 2 2 2 (5 7) 2 (6 7) 6 (7 7) 6 (8 7) 4 (9 7) 3 30 1,5 21 1 20 S − + − + − + − + − = = = − Resposta: C ESAF – SEFAZ/SP – 2009 – Adaptada) Considerando que uma série de observações constituem uma amostra aleatória simples X1, X2, ..., Xn de uma variável aleatória X, determine o valor mais próximo da variância amostral, usando um estimador não tendencioso da variância de X. Considere que: a) 96,85 b) 92,64 c) 94,45 d) 90,57 Prof. Arthur Lima Aula 08 12 de 122| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 e) 98,73 RESOLUÇÃO: Para resolver essa questão é preciso lembrar que a variância pode ser calculada com a seguinte fórmula, sem a necessidade de obtenção da média amostral: 2 2 1 12 1 1 = = − = − n n i i i i X X n s n Veja que foi dado que n = 23, e que: 2 1 8676 = = n i i X e 1 388 = = n i i X Portanto, ( ) 2 2 2 1 12 2 1 1 8676 388 23 1 23 1 96,84 = = − − = = − − = n n i i i i X X n s n s Resposta: A Desvio padrão Obtida a variância, fica fácil calcular o desvio-padrão de uma população ou amostra. Basta tirar a raiz quadrada da variância. Isto é: Desvio padrão Variância= Assim, podemos dizerque 2 = (desvio padrão populacional) e que 2s s= (desvio padrão amostral). Lembrando que o desvio-padrão e a variância são medidas de dispersão dos dados, é bom você saber que, quanto maiores estes valores forem, mais espalhados estão os dados (caso da praia), e quanto menor, mais próximos estão os dados (caso da faculdade). Resolva a questão a seguir: Prof. Arthur Lima Aula 08 13 de 122| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 CESPE – MEC – 2009) Merendas escolares demandadas em 10 diferentes escolas: 200, 250, 300, 250, 250, 200, 150, 200, 150, 200. Com base nessas informações, julgue os próximos itens. ( ) A mediana da distribuição do número diário de merendas escolares é igual a 225. ( ) O desvio padrão amostral dos números diários de merendas escolares é superior a 50. RESOLUÇÃO: ( ) A mediana da distribuição do número diário de merendas escolares é igual a 225. Para obter a mediana, o primeiro passo é colocar os dados em ordem crescente. Veja isso abaixo: 150, 150, 200, 200, 200, 200, 250, 250, 250, 300. Temos 10 elementos, portanto n = 10. A seguir devemos calcular o valor de (n+1)/2, que neste caso será (10+1)/2 = 5,5. Veja que não obtivemos um valor exato, pois n é par. Assim, a mediana será a média aritmética dos dois termos centrais da amostra, que são aqueles mais próximos da “posição” 5,5, ou seja, o 5º e o 6º termo: 200 200 200 2 Mediana + = = Item ERRADO. ( ) O desvio padrão amostral dos números diários de merendas escolares é superior a 50. O desvio padrão amostral é dado por: 2 1 ( ) 1 n i i X X s n = − = − onde n é o número de elementos (n = 10), Xi representa cada elemento da amostra e X é a média da amostra. A média, neste caso, é: 150 150 200 200 200 200 250 250 250 300 215 10 X + + + + + + + + + = = Portanto, o desvio padrão será: Prof. Arthur Lima Aula 08 14 de 122| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 2 1 2 2 2 2 2 2 2 2 ( ) 1 2 (150 215) 4 (200 215) 3 (250 215) 1 (300 215) 10 1 2 ( 65) 4 ( 15) 3 (35) 1 (85) 9 8450 900 3675 7225 2250 9 n i i X X s n s s s = − = − − + − + − + − = − − + − + + = + + + = = Observe que esse número é inferior a 50, pois 50 = 2500 . Assim, o item está ERRADO. Resposta: E E É importante você conhecer as seguintes propriedades do desvio padrão e da variância (caem bastante!): - se somarmos ou subtrairmos um mesmo valor de todos os elementos de uma amostra, o desvio padrão e a variância permanecem inalterados. Isso porque essas são medidas de dispersão. Ao somar o mesmo número em todos os elementos, eles não se tornam mais dispersos (mais espalhados), apenas deslocam-se juntos para valores mais altos. - se multiplicarmos ou dividirmos todos os elementos da amostra pelo mesmo valor, o desvio padrão é multiplicado/dividido por este mesmo valor. Já a variância é multiplicada/dividida pelo quadrado desse valor (pois ela é igual ao quadrado do desvio padrão). Assim, se temos uma variável X, com desvio padrão x , e definimos uma variável Y como sendo Y = a.X + b (ou seja, a distribuição Y é formada pelos mesmos termos da distribuição X, porém multiplicados por a e depois somados com b), podemos dizer que: - o desvio padrão de Y será: y xa = (veja que o b nem aparece aqui); - a variância de Y será 2 2 2 y xa = Em alguns casos, você pode ser apresentado a dois grupos diferentes (ex.: moradores da cidade A e da cidade B), sendo fornecidos o número de elementos de cada um deles (nA e nB), a média de cada um deles ( AX e BX ), bem como a variância de cada ( 2 A e 2 B ). Com isso em mãos, é possível calcular a variância que teria o grupo composto pela união dos indivíduos de A com os indivíduos de B. Para isso, devemos considerar 3 casos principais: Se as médias são iguais e estamos diante de populações: 2 2 2 A A B B A B A B n n n n + = + Prof. Arthur Lima Aula 08 15 de 122| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 Se as médias são iguais e estamos diante de amostras: 2 2 2 ( 1) ( 1) ( 1) ( 1) A A B B A B A B s n s n s n n − + − = − + − Se as médias são distintas e estamos diante de populações: Aqui o caso é mais complicado. Devemos começar lembrando a fórmula da variância sem a necessidade do cálculo da média: 2 2 1 12 1n n i i i i X X n n = = − = Unindo as populações A e B, teremos: ( ) ( ) 2 2 2 2 1 A B A B A B A B A B X X X X n n n n + − + + = + Observe que, tendo a média AX e o número de elementos nA, é fácil calcular AX , pois: A A AX X n= Analogamente, B B BX X n= . A dificuldade maior é para calcular os termos 2 AX e 2 BX . Isolando esses termos na fórmula básica 2 2 1 12 1n n i i i i X X n n = = − = , vemos que: 2 2 2 X X n n = + Assim, 2 2 2 A A A A A X X n n = + e 2 2 2 B B B B B X X n n = + Prof. Arthur Lima Aula 08 16 de 122| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 Confuso? Vamos trabalhar uma questão sobre isso: CEPERJ – SEPLAG/RJ – 2013) Examinando a relação dos 30 candidatos aprovados e convocados, que fi zeram o Curso de Formação no concurso para Analista de Planejamento e Orçamento da SEPLAG em 2011, e pesquisando, com estratifi cação por sexo, o arquivo de Resultado para a Prova Objetiva realizada em 08.01.2012, o número de acertos para as 5 questões de Estatística desses 30 candidatos, obtivemos as seguintes informações: A média e a variância do número de acertos, sem distinção de sexo, para os 30 candidatos foram, respectivamente: A) 3,4 e 1,32 B) 3,5 e 1,32 C) 3,4 e 1,56 D) 3,5 e 1,68 E) 3,4 e 1,68 RESOLUÇÃO: Veja que temos duas populações, a feminina (F) e a masculina (M), e para os quais foram fornecidos os números de elementos, as médias populacionais e as variâncias populacionais. São solicitadas a média e variância da união das duas populações. Vejamos: 2 12 4 1,2 F F F n X = = = 2 18 3 1, 4 M M M n X = = = A média pode ser facilmente calculada: F F M M F M F M X n X n X n n + = + 4 12 3 18 3,4 12 18 F MX + = = + Para calcularmos a variância combinada, vamos usar a fórmula: Prof. Arthur Lima Aula 08 17 de 122| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 ( ) ( ) 2 2 2 2 1 F M F M F M F M F M X X X X n n n n + − + + = + Veja que: 4 12 48F F FX X n= = = 3 18 54M M MX X n= = = Além disso, 2 2 2 2 481,2 12 206,4 12 F F F F F X X n n = + = + = 2 2 2 2 541,4 18 187,2 18 M M M M M X X n n = + = + = Assim, ( ) ( ) 2 2 2 2 1 F M F M F M F M F M X X X X n n n n + − + + = + ( ) ( ) 2 2 1 206,4 187,2 48 54 12 18 1,56 12 18 F M + − + += = + Resposta: C Coeficiente de variação Trata-se da razão entre o desvio padrão e a média, sendo normalmente expresso na forma percentual: CV = Veja essa questão sobre o CV: Prof. Arthur Lima Aula 08 18 de 122| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 FCC – BACEN – 2006) Em um colégio, a média aritmética das alturas dos 120rapazes é de m centímetros com uma variância de d2 centímetros quadrados (d > 0). A média aritmética das alturas das 80 moças é de (m – 8) centímetros com um desvio padrão igual a 20 21 d centímetros. Se o correspondente coeficiente de variação encontrado para o grupo de rapazes é igual ao coeficiente de variação encontrado para o grupo de moças, tem- se que a média aritmética dos dois grupos reunidos é de a) 162,0 cm b) 164,6 cm c) 164,8 cm d) 166,4 cm e) 168,2 cm RESOLUÇÃO: O coeficiente de variação é dado por CV = (desvio padrão dividido pela média). O enunciado nos disse que, para os rapazes, m = e 2 2d = (portanto, d = ). Portanto, o coeficiente de variação para os rapazes é: rapazes d CV m = = Para as moças, foi dito que 8m = − e 20 21 d = , levando ao seguinte coeficiente de variação: 20 21 8 moças d CV m = = − Como foi dito que rapazes moçasCV CV= , então: 20 21 8 d d m m = − Logo, 20 1 21 8m m = − 20 8 21 m m− = 20 8 21 m m− = Prof. Arthur Lima Aula 08 19 de 122| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 1 8 21 m = 168m = Portanto, a média de altura dos 120 rapazes é de 168cm, e a média de altura das 80 moças é 160cm. Calculando a média do grupo inteiro, temos: 120 168 80 160 164,8 120 80 Média cm + = = + Resposta: C Repare que o coeficiente de variação é uma medida de dispersão relativa, isto é, ele nos dá uma relação entre o desvio padrão (que é uma medida de dispersão absoluta, assim como a variância) e uma característica da população ou amostra (no caso, a média). Por ser uma medida relativa, expressa na forma percentual, o coeficiente de variação é ideal para comparar duas amostras ou populações. Basta você imaginar as amostras de idades abaixo: A = {81, 85, 89} B = {1, 5, 9} Essas duas amostras tem o mesmo desvio padrão, que é igual a 4. Ocorre que a primeira tem uma média de idades (85) bem maior que a segunda (5). Assim, aquele desvio padrão de 4 anos é bem pequeno, quando comparado com as idades da primeira amostra, mas é bem grande quando comparado com as idades da segunda amostra. Os coeficientes de variação são: CVA = 4 / 85 = 4,7% CVB = 4 / 5 = 80,0% Assim sendo, podemos afirmar que a amostra B é bem mais dispersa/variada que a amostra A. De fato, se imaginarmos um conjunto de crianças com 1, 5 e 9 anos, temos uma dispersão muito maior do que quando vemos 3 idosos de 81, 85 e 89 anos. Enquanto a criança de 1 ano nem fala direito, a de 9 anos já lê e escreve! Já os idosos de 81 a 89 anos tem características bem mais parecidas entre si. TÉCNICAS DE AMOSTRAGEM Chamamos de técnicas de amostragem aquelas técnicas utilizadas para selecionar, dentre os indivíduos de uma população, aqueles que farão parte de nossa amostra, sobre a qual calcularemos os dados estatísticos de nosso interesse. Existem diversas formas de se formar uma Amostra de uma determinada população. Algumas dessas formas são chamadas de probabilísticas (casuais), pois permitem (cientificamente) que utilizemos as técnicas de inferência estatística, extrapolando os resultados para o restante da população, calculando margens de erros etc. As demais formas são chamadas de não-probabilísticas (não casuais). Apesar de muito utilizadas, elas não permitem (com o mesmo rigor) a utilização das técnicas de inferência que estudaremos. Prof. Arthur Lima Aula 08 20 de 122| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 Técnicas casuais de amostragem (probabilísticas) Digamos que queremos estimar o percentual de homens residentes em um determinado bairro. Vejamos técnicas probabilísticas para escolher uma amostra desta população, evitando ter que analisar cada um dos moradores daquele bairro. Amostragem aleatória simples Uma primeira forma de amostragem probabilística é a escolha aleatória dos indivíduos da população que farão parte da amostra (em uma lista, por exemplo). Trata-se da amostragem aleatória (ou casual) simples. Esta amostragem pode ser feita com reposição (onde um mesmo indivíduo pode ser escolhido mais de uma vez para a amostra) ou sem reposição (onde cada indivíduo só pode ser escolhido uma vez). Repare que, para fazer uma amostragem aleatória, é preciso que você tenha acesso aos dados de todos os indivíduos da população, para, a partir dessa listagem, efetuar uma seleção aleatória de indivíduos. Amostragem sistemática Uma outra forma de escolher os indivíduos do bairro que farão parte da amostra é utilizando a amostragem sistemática. Tendo a lista de todos os indivíduos em mãos, e algumas características destes indivíduos, podemos criar um critério para a escolha dos selecionados. Exemplificando, imagine que decidimos visitar apenas os moradores das casas cujo número é múltiplo de 10. Veja que criamos um sistema de escolha, motivo pelo qual esse tipo de amostragem é conhecido como sistemático. Amostragem por conglomerados (agrupamentos) Ao invés de criar um sistema de escolha, como fizemos na amostragem sistemática, podemos decidir analisar subgrupos inteiros da população. Trata-se da amostragem por conglomerados (ou agrupamentos). Ex.: podemos selecionar, aleatoriamente, quarteirões inteiros daquele bairro, e verificar todos os indivíduos que ali residem. Repare que neste exemplo, os conglomerados foram definidos como sendo quarteirões inteiros do bairro. Esta é uma boa forma de escolha, pois os conglomerados são mutuamente exclusivos, isto é: cada indivíduo só fará parte de 1 conglomerado. Amostragem estratificada Em alguns casos, podemos dividir a população em estratos, que são subconjuntos da população compostos por indivíduos com algumas semelhanças entre si. A diferença entre estratos e conglomerados é que, nos estratos, os indivíduos devem ter alguma característica em comum que os torna mais semelhantes, enquanto os conglomerados são meros agrupamentos com base em um critério qualquer. Os estratos também devem ser mutuamente exclusivos, para que cada indivíduo participe de apenas 1 estrato. Feito isso, podemos Prof. Arthur Lima Aula 08 21 de 122| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 selecionar uma quantidade de indivíduos dentro de cada estrato para efetuar a nossa análise. Por exemplo, podemos dividir todos os moradores em intervalos de idades (estratos): de 0 a 15 anos, de 15 a 30, de 30 a 45 etc. Feito isso, podemos analisar uma quantidade de indivíduos dentro de cada estrato. Como escolher a quantidade de indivíduos de cada estrato que será analisada? Os principais métodos de escolha são: - alocação uniforme: neste caso, escolhe-se uma quantidade igual de indivíduos dentro de cada estrato. - alocação proporcional: neste caso, escolhe-se quantidades de indivíduos dentro de cada estrato de maneira proporcional à representatividade daquele estrato na população inteira. - alocação de Neyman (ou repartição ótima): leva em conta a variância dentro de cada estrato da população para decidir o tamanho de cada estrato. Não precisamos entrar em maiores detalhes sobre o cálculo desta alocação. Técnicas não-casuais de amostragem (não probabilísticas) Um exemplo de técnica não-probabilística é aquela usada em algumas pesquisas de opinião, onde o pesquisador fica em um local com grande circulação de pessoas (ex.: estação de metrô) e vai entrevistando pessoas ao acaso (acidentalmente). Trata-se da amostragem acidental. Outro exemplo seria a escolha intencional, por parte do entrevistador, de pessoas que ele acredita serem relevantes para a sua pesquisa. Trata-se da amostragem intencional. Outra conhecida forma de amostragem não probabilística é a amostragem por cotas.Nela, o primeiro passo é dividir a população em grupos – como é feito nas amostragens estratificada ou por conglomerados – e, a seguir, extrair quantidades pré-definidas (“cotas”) de indivíduos de cada grupo para se montar a amostra. Veja que a diferença deste tipo de amostragem para os tipos probabilísticos é que as quantidades de indivíduos em cada grupo/estrato são pré-definidas, não obedecendo qualquer critério estatístico. Também temos a amostragem de voluntários. Imagine que você pretende fazer experiências de um novo remédio, e para isso precise de cobaias. Como você não pode obrigar pessoas a participarem do experimento, você precisa contar com voluntários. Assim, a amostra de indivíduos que você vai utilizar não tem fundamento estatístico. Note que escolhas ruins do tipo de amostragem podem levar a conclusões absurdas. Exemplificando, digamos que queremos estimar o percentual de homens na população de nosso bairro. Para isso, decidimos criar nossa amostra da seguinte forma: percorrer todos os salões de beleza do bairro, anotando o número de homens e o número de mulheres. Veja que provavelmente chegaremos a uma conclusão absurda (muito mais mulheres do que homens). Essa distorção no resultado se deve ao fato de que, em regra, as mulheres costumam frequentar mais os salões de beleza do que os homens. Portanto, a nossa técnica de amostragem foi falha. Antes de prosseguir, resolva essas questões abaixo: Prof. Arthur Lima Aula 08 22 de 122| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 FGV – Senado Federal – 2008) A respeito dos principais tipos de amostragem, é correto afirmar que: a) a amostragem sistemática possui caráter não-probabilístico. b) na amostragem aleatória estratificada há a possibilidade de que nenhuma unidade de um ou mais estratos sejam selecionadas. c) as informações obtidas através de uma amostragem acidental permitem a obtenção de inferências científicas de características da população. d) na amostragem de conglomerados todos os conglomerados são sempre selecionados. e) a amostragem estratificada é geralmente mais eficiente do que a amostragem aleatória simples de mesmo tamanho. RESOLUÇÃO: a) a amostragem sistemática possui caráter não-probabilístico. Falso. A técnica de amostragem sistemática é científica, isto é, probabilística (ou casual). b) na amostragem aleatória estratificada há a possibilidade de que nenhuma unidade de um ou mais estratos sejam selecionadas. Falso. Na amostragem estratificada é preciso selecionar indivíduos de todos os estratos. c) as informações obtidas através de uma amostragem acidental permitem a obtenção de inferências científicas de características da população. Falso. A amostragem acidental é considerada não-probabilística, não permitindo a obtenção científica de características da população. d) na amostragem de conglomerados todos os conglomerados são sempre selecionados. Falso. Ao criar os conglomerados (ex.: quarteirões de um bairro), selecionaremos apenas alguns deles, aleatoriamente, para a nossa análise. e) a amostragem estratificada é geralmente mais eficiente do que a amostragem aleatória simples de mesmo tamanho. Verdadeiro. A amostragem estratificada é mais elaborada, pois nos “obriga” a selecionar indivíduos de todos os estratos, tendo uma visão melhor do total da população. Ex.: na pesquisa sobre o percentual de homens no bairro, fomos obrigados a analisar indivíduos de todas as idades presentes na população. Resposta: E Prof. Arthur Lima Aula 08 23 de 122| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 FCC – TRT/3ª – 2009) O objetivo de uma pesquisa era o de se obter, relativamente aos moradores de um bairro, informações sobre duas variáveis: nível educacional e renda familiar. Para cumprir tal objetivo, todos os moradores foram entrevistados e arguídos quanto ao nível educacional, e, dentre todos os domicílios do bairro, foram selecionados aleatoriamente 300 moradores para informar a renda familiar. As abordagens utilizadas para as variáveis nível educacional e renda familiar foram, respectivamente, (A) censo e amostragem por conglomerados. (B) amostragem aleatória e amostragem sistemática. (C) censo e amostragem casual simples. (D) amostragem estratificada e amostragem sistemática. (E) amostragem sistemática e amostragem em dois estágios. RESOLUÇÃO: No caso do nível educacional, analisou-se todos os indivíduos da população. Portanto, efetuou-se um censo. No caso da renda, selecionou-se aleatoriamente (isto é, ao acaso) 300 indivíduos, que serviram de amostra. Trata-se, portanto, da técnica de amostragem aleatória (ou casual) simples. Resposta: C Chega de teoria! Vamos praticar tudo o que vimos até aqui? Prof. Arthur Lima Aula 08 24 de 122| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 Questões comentadas pelo professor 1. IAUPE – CBM/PE – 2018) A média aritmética dos quadrados dos desvios de um conjunto de dados é denominada de A) Mediana. B) Desvio-padrão. C) Variância. D) Moda. E) Média. RESOLUÇÃO: Essa é a definição de variância, cuja fórmula é dada por: Variância = ∑(xi−x)² n Resposta: C 2. CESGRANRIO – BANCO DO BRASIL – 2018) Define-se como desvio interquartílico a distância entre o 1º e o 3º Quartis. É usado para avaliar a existência de possíveis valores atípicos em um conjunto de dados. Valores aquém ou além de limites estabelecidos com base nessa medida devem ser investigados quanto à sua tipicidade em relação à distribuição. Geralmente o limite inferior é estabelecido como 1 vez e meia o valor desse desvio, abaixo do primeiro Quartil, enquanto o limite superior, como 1 vez e meia acima do terceiro Quartil. Considere os resumos estatísticos das três distribuições de consumo de energia elétrica, em kW, dos 50 apartamentos com mesma planta, de um edifício, em três períodos diferentes ao longo de um ano, conforme abaixo: Conclui-se, a partir desses resumos, que (A) um período apresenta pelo menos um apartamento com consumo abaixo, e dois períodos apresentam pelo menos um apartamento com consumo acima da tipicidade estabelecida. Prof. Arthur Lima Aula 08 25 de 122| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 (B) um período apresenta pelo menos um apartamento com consumo abaixo, e um período apresenta pelo menos um apartamento com consumo acima da tipicidade estabelecida. (C) em nenhum período foram observados possíveis consumos atípicos. (D) apenas um período apresenta pelo menos um apartamento com consumo abaixo da tipicidade estabelecida. (E) apenas um período apresenta pelo menos um apartamento com consumo acima da tipicidade estabelecida. RESOLUÇÃO: Podemos calcular os limites inferior e superior para cada período. Veja: Janeiro-Abril: Limite inferior = Q1 – 1,5.(Q3 – Q1) = 80 – 1,5.(90-80) = 65 Limite superior = Q1 + 1,5.(Q3 – Q1) = 90 + 1,5.(90-80) = 105 Note que o menor valor (75) e o maior valor (102) estão dentro deste intervalo, não sendo atípicos. Maio-Agosto: Limite inferior = Q1 – 1,5.(Q3 – Q1) = 68 - 1,5.(80-68) = 50 Limite superior = Q1 + 1,5.(Q3 – Q1) = 80 + 1,5.(80-68) = 98 Note que o menor valor (49) é atípico, pois está ABAIXO da tipicidade estabelecida, mas o maior valor (92) está dentro deste intervalo, não sendo atípico. Setembro-Dezembro: Limite inferior = Q1 – 1,5.(Q3 – Q1) = 75 – 1,5.(85-75) = 60 Limite superior = Q1 + 1,5.(Q3 – Q1) = 85 + 1,5.(85-75) = 100 Note que o menor valor (62) e o maior valor (99) estão dentro deste intervalo, não sendo atípicos. Resposta: D3. CESGRANRIO – BANCO DO BRASIL – 2018) Há dez anos a média das idades, em anos completos, de um grupo de 526 pessoas era de 30 anos, com desvio padrão de 8 anos. Considerando-se que todas as pessoas desse grupo estão vivas, o quociente entre o desvio padrão e a média das idades, em anos completos, hoje, é (A) 0,45 (B) 0,42 (C) 0,20 (D) 0,27 Prof. Arthur Lima Aula 08 26 de 122| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 (E) 0,34 RESOLUÇÃO: Com a soma de 10 anos na idade de cada pessoa, a média é acrescida também em 10 unidades, passando a ser de 40 anos. Já o desvio padrão não sofre alteração, permanecendo em 8 anos. Assim, Desvio padrão / média = 8 / 40 = 1/5 = 0,20 Resposta: C 4. CESGRANRIO – PETROBRÁS – 2018) Dados sobre Precipitação Pluviométrica em cinco regiões do estado do Rio de Janeiro foram coletados para os meses de verão (janeiro a março) entre 1968 e 2017. Os resultados permitiram os cálculos das estatísticas e a elaboração do Box Plot apresentados abaixo. De acordo com os resultados acima, observe as afirmações a seguir. I - A média das precipitações pluviométricas é uma medida representativa da quantidade de chuva média mensal no verão em cada região, devido à baixa variabilidade das medidas. II - A variação das médias das precipitações dentro de cada região é inferior à variação das médias das precipitações entre as regiões. Prof. Arthur Lima Aula 08 27 de 122| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 III - Em pelo menos um ano, a precipitação média no verão ficou abaixo do índice de 1,5 desvio quartílico da distribuição em duas regiões. Está correto APENAS o que se afirma em (A) I (B) II (C) III (D) I e II (E) I e III RESOLUÇÃO: Vamos analisar cada alternativa: I - A média das precipitações pluviométricas é uma medida representativa da quantidade de chuva média mensal no verão em cada região, devido à baixa variabilidade das medidas. A banca definiu o item como incorreto, pois considera que a média sozinha não pode unicamente representar um conjunto de dados, sempre precisará estar acompanhada de uma medida de variabilidade. Mas essa é uma posição questionável, já que calculando os coeficientes de variação, eles resultam em valores baixos. Veja: CV = Desvio Padrão Média CV1 = 6,5 149 ≅ 0,044 CV2 = 10,2 159 ≅ 0,064 CV3 = 5,7 170 ≅ 0,034 CV4 = 5,9 165 ≅ 0,036 CV5 = 7,0 177 ≅ 0,040 II - A variação das médias das precipitações dentro de cada região é inferior à variação das médias das precipitações entre as regiões. A variação das médias para cada região foi calculada no item I. Ficaram: 0,044; 0,064; 0,034; 0,036; 0,040. Vamos analisar a variação das médias entre as regiões. Para isso, devemos calcular a média entre as regiões: Média = 149 +159 +170 +165 + 177 5 = 820 5 = 164 O desvio padrão entre as regiões é dado por: Desvio Padrão = √ (149−164)2+(159−164)2+(170−164)2 +(165−164)² +(177−164)² 5 Desvio Padrão =√ 225 + 25 +36+1 + 169 5 = √ 456 5 ≅ 9,5 Prof. Arthur Lima Aula 08 28 de 122| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 Portanto, o coeficiente de variação entre as regiões será: CV = 9,5 164 = 0,058 Veja que a variação da média para a região II não é inferior à variação das médias entre as regiões (0,064 > 0,058). Item incorreto. III - Em pelo menos um ano, a precipitação média no verão ficou abaixo do índice de 1,5 desvio quartílico da distribuição em duas regiões. O limite inferior é dado pela fórmula: Q1 − 1,5(Q3 − Q1). Vamos analisar os limites para cada região: Região 1: 142 – 1,5(152 – 142) = 127. Esse valor é inferior ao mínimo da região (138). Região 2: 158 – 1,5(162 – 158) = 152. Note que o mínimo dessa região é 142, portanto é inferior ao limite. Região 3: 170 – 1,5(174 – 170) = 164. Note que o mínimo dessa região é 157, portanto é inferior ao limite. Região 4: 159 – 1,5(170 – 159) = 142,5. Esse valor é inferior ao mínimo da região (148). Região 5: 170 – 1,5(180 – 170) = 155. Esse valor é inferior ao mínimo da região (161). Portanto, nas regiões 2 e 3 as precipitações médias ficaram abaixo do limite. Item correto. Resposta: C 5. CESGRANRIO – BANCO DO BRASIL – 2018) Uma amostra aleatória de tamanho 5 é retirada de uma população e observa-se que seus valores, quando postos em ordem crescente, obedecem a uma Progressão Aritmética. Se a variância amostral não viciada vale 40, qual é o valor da razão da Progressão Aritmética? (A) 3 (B) 5√2 (C) 4. (D) 2√5 (E) 1 RESOLUÇÃO: A média de 5 termos de uma PA é exatamente o termo do meio, ou seja, o 3º termo. Sendo M o valor do termo do meio (média), e R a razão, podemos escrever os cinco termos assim: M-2R, M-R, M, M+R, M+2R Para calcular a variância, podemos primeiramente subtrair M de todos os termos, ficando com: -2R, -R, 0, R, 2R Prof. Arthur Lima Aula 08 29 de 122| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 A soma desses valores é zero. A soma dos quadrados é: 4R2 + R2 + 0 + R2 + 4R2 = 10R2 Logo, a variância amostral é: 𝑠2 = 𝑠𝑜𝑚𝑎 𝑑𝑜𝑠 𝑞𝑢𝑎𝑑𝑟𝑎𝑑𝑜𝑠 − 1 𝑛 . (𝑠𝑜𝑚𝑎 𝑑𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠)2 𝑛 − 1 40 = 10𝑅2 − 1 5 . 02 5 − 1 40.4 = 10R2 16 = R2 R = 4 Veja que eu só usei o valor positivo da raiz quadrada de 16, pois a PA é crescente. Resposta: C 6. CESGRANRIO – BANCO DO BRASIL – 2018) Uma escola de Ensino Médio decide pesquisar o comportamento de seus estudantes quanto ao número de refrigerantes consumidos semanalmente por eles. Para isso, uma amostra aleatória de 120 estudantes foi selecionada, e os dados foram sintetizados no histograma abaixo, em classes do tipo [0, 5), [5, 10), [10, 15), [15, 20), [20, 25) e [25, 30]. Qual o valor da amplitude interquartílica, obtido por meio do método de interpolação linear dos dados agrupados em classes? a) 15 Prof. Arthur Lima Aula 08 30 de 122| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 b) 15/2 c) 29/5 d) 47/7 e) 10 RESOLUÇÃO: Podemos montar a tabela: Classe Frequência Freq. Acumulada 0-5 35 35 5-10 50 85 10-15 25 110 15-20 5 115 20-25 3 118 25-30 2 120 O primeiro quartil está associado com a posição n/4 = 120/4 = 30. E o terceiro quartil está associado com a posição 3.(n/4) = 3.30 = 90. O primeiro quartil está na primeira classe. Montando a interpolação: 0 30 35 Frequências |-------------|-------------------| Valores |-------------|-------------------| 0 Q1 5 𝑄1 − 0 5 − 0 = 30 − 0 35 − 0 Q1 = 5.(30/35) Q1 = 30/7 O terceiro quartil está na classe 10-15. Montando a interpolação: 85 90 110 Frequências |-------------|-------------------| Prof. Arthur Lima Aula 08 31 de 122| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 Valores |-------------|-------------------| 10 Q3 15 𝑄3 − 10 15 − 10 = 90 − 85 110 − 85 𝑄3 − 10 5 = 5 25 𝑄3 − 10 = 25 25 𝑄3 − 10 = 1 𝑄3 = 11 Logo, a amplitude interquartílica é: Q3 – Q1 = 11 – 30/7 = 77/7 – 30/7 = 47/7. Resposta: D 7. FCC – TRT/SP – 2018) Seja uma população {x1, x2, x3, ... , x20} formada pela renda em unidades monetárias de 20 pessoas, sendo xi > 0 a renda da i-ésima pessoa(1 ≤ i ≤ 20). O coeficiente de variação desta população é igual a 20%. Sabendo-se que (x2 − x10) = 2 com x10 > 4, subtrai-se de x10 um montante igual a 4 e acrescenta-o a x2. Após esta transferência, a nova variância fica igual a Dado: a) 4,09 b) 2,49 c) 1,69 d) 4,00 e) 2,56 RESOLUÇÃO: Prof. Arthur Lima Aula 08 32 de 122| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 Essa é uma questão mais complexa. Um primeiro passo é observar que ao subtrair 4 de X10 e acrescentar 4 a X2 o valor da média da variável X não se altera, pois sendo a média igual à soma dos elementos dividida pelo número de elementos, o número de elementos permanece o mesmo, continua sendo 20, só se alteram X10 e X2, porém reparem que a soma de X10 e X2 continua sendo a mesma, já que X10 passa a ser igual a X10 - 4 e X2 passa a ser igual a X2 + 4, logo ao somar os novos valores passamos a ter X10 - 4 + X2 + 4 = X10 + X2. Assim, se a soma desses valores permanece a mesma e esses foram os únicos valores que sofreram alguma alteração, então a média também permanece a mesma após essa alteração dos dados. Mas queremos o valor da variância após essa alteração, e essa sim pode variar. Sendo E(X²) a média dos quadrados da variável X e E(X) a média da variável X, sabemos que a variância de X pode ser dada por: Var(X) = E(X²) – E²(X) O enunciado nos informa que antes da alteração dos valores de X10 e X2 o coeficiente de variação de X (CV(X)) é igual a 20% (0,2). Logo, sendo DP(X) o desvio padrão de X, antes da alteração dos valores de X10 e X2 temos que: 𝐷𝑃(𝑋) 𝐸(𝑋) = 𝐶𝑉(𝑋) Sabemos que o quadrado do desvio padrão é igual à variância, logo podemos elevar os dois lados da igualdade acima ao quadrado (já que estamos interessados na variância), obtendo: 𝑉𝑎𝑟(𝑋) 𝐸²(𝑋) = 𝐶𝑉²(𝑋) Substituindo Var(X) por E(X²) – E²(X) e CV²(X) por 0,2², temos que: E(X²) – E²(X) 𝐸²(𝑋) = 0,2² Sabemos que E(X2) = ∑ 𝑋𝑖 220 𝑖=1 𝑛 e o enunciado nos diz que ∑ 𝑋𝑖 220 𝑖=1 =878,80 e que n = 20. Logo, temos que: 878,80 20 – E²(X) 𝐸²(𝑋) = 0,04 43,94 – E²(X) = 0,04 ∙ 𝐸²(𝑋) 43,94 = 0,04 ∙ 𝐸2(𝑋) + E²(X) 43,94 = 1,04 ∙ 𝐸2(𝑋) 𝐸2(𝑋) = 43,94 1,04 = 42,25 E²(X) = 42,25 é igual ao quadrado da média da variável e, conforme explicado acima, sabemos que a média não se alterou após a alteração nos valores de X10 e X2, mas não podemos dizer o mesmo de E(X²). Logo, precisamos calcular o novo valor de E(X²)= ∑ 𝑋𝑖 220 𝑖=1 20 para finalmente calcularmos a variância após a alteração. Vamos nos concentrar em ∑ 𝑋𝑖 220 𝑖=1 . Reparem que antes da alteração poderíamos dizer que: Prof. Arthur Lima Aula 08 33 de 122| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 ∑ 𝑋𝑖 2 20 𝑖=1 = ∑ 𝑋𝑖 2 20 𝑖≠2,10 + 𝑋2 2 + 𝑋10 2 = 878,80 Entenderam o que eu fiz? Foi um recurso visual, o somatório à direita da igualdade soma todos os quadrados de Xi para i diferente de 2 e de 10, ou seja, os quadrados de todos os Xi diferentes de X2 e X10, (logo temos que ∑ 𝑋𝑖 220 𝑖≠2,10 = 𝑋1 2 + 𝑋3 2 + ⋯ + 𝑋9 2 + 𝑋11 2 + ⋯ + 𝑋20 2 ) e os quadrados de X2 e X10 vem somados em seguida, procedi assim porque esses valores que se alteram, precisamos trabalhar com eles separadamente para verificar o impacto da sua alteração na soma dos quadrados de X, já que os demais valores Xi permanecem os mesmos. O enunciado nos diz que antes da alteração, tínhamos que X2 - X10 = 2, logo antes da alteração poderíamos dizer que X2 = X10 + 2. Portanto, voltando à equação acima, temos que: ∑ 𝑋𝑖 2 20 𝑖≠2,10 + (𝑋10 + 2)² + 𝑋10 2 = 878,80 Aplicando a regra dos produtos notáveis do quadrado da soma de 2 termos ((a + b)² = a² + 2ab + b²), temos que : ∑ 𝑋𝑖 2 20 𝑖≠2,10 + 𝑋10 2 + 4𝑋10 + 4 + 𝑋10 2 = 878,80 ∑ 𝑋𝑖 2 20 𝑖≠2,10 + 2𝑋10 2 + 4𝑋10 = 878,80 − 4 ∑ 𝑋𝑖 2 20 𝑖≠2,10 + 2𝑋10 2 + 4𝑋10 = 874,80 Agora sim, vamos pensar nos novos valores de X2 e X10. Se a X2 foi acrescentado o valor 4, então seu valor passou a ser dado por X2’ = X10 + 2 + 4 = X10 +6. Já de X10 foi subtraído o valor 4 , logo ele passa a ser dado por X10’ = X10 – 4. Assim, a soma dos quadrados de X após a alteração passa a ser dada por: ∑ 𝑋𝑖 2 20 𝑖=1 = ∑ 𝑋𝑖 2 20 𝑖≠2,10 + (𝑋10 + 6)² + (𝑋10 − 4)² Aplicando novamente as regras dos produtos notáveis ((a + b)² = a² + 2ab + b² e (a - b)² = a² - 2ab + b²) chegamos a: ∑ 𝑋𝑖 2 20 𝑖=1 = ∑ 𝑋𝑖 2 20 𝑖≠2,10 + 𝑋10 2 + 12𝑋10 + 36 + 𝑋10 2 − 8𝑋10 + 16 ∑ 𝑋𝑖 2 20 𝑖=1 = ∑ 𝑋𝑖 2 20 𝑖≠2,10 + 2𝑋10 2 + 4𝑋10 + 52 Reparem que já calculamos acima que ∑ 𝑋𝑖 220 𝑖≠2,10 + 2𝑋10 2 + 4𝑋10 = 874,80, logo temos que após a alteração a soma dos quadrados dos Xi passa a ser dada por : Prof. Arthur Lima Aula 08 34 de 122| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 ∑ 𝑋𝑖 2 20 𝑖=1 = 874,80 + 52 = 926,80 Agora sim, temos tudo que precisamos para calcular a variância de X após a alteração dos valores de X2 e X10 (lembrando que o quadrado da média de X não se alterou e já foi calculado acima): Var(X) = E(X2) − E²(X) Var(X) = ∑ 𝑋𝑖 220 𝑖=1 𝑛 − 42,25 Var(X) = 926,80 20 − 42,25 = 46,34 − 42,25 = 4,09 Finalmente, temos que a alternativa A é o gabarito da questão. Resposta: A 8. IBFC – EBSERH – 2017) Avalie a tabela a seguir. Três tipos de materiais são pesados diversas vezes. Assinale a alternativa correta que os elenque do menor para o maior quanto à menor dispersão. a) X, Y e Z b) Y, Z e X c) Z, X e Y d) Z, Y e X e) X, Z e Y RESOLUÇÃO: Para determinar a ordem dos materiais quanto à dispersão dos pesos obtidos podemos calcular o desvio médio dos pesos obtidos para cada material (seria possível também calcular a variância ou o desvio padrão, todas as medidas são aceitáveis, pois todas medem a variabilidade dos dados com relação à média, por uma questão de praticidade dos cálculos, vamos optar pelo desvio médio) e ordená-los, de forma que o material com menor desvio médio dos pesos apresenta menor dispersão e o material com maior desvio médio dos pesos apresenta maior dispersão. Desvio médio é uma medida de dispersão que para cada material é representada pela soma Prof. Arthur Lima Aula 08 35 de 122| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 da diferença absoluta (em módulo) entre cada um dos pesos e a média dos pesos dividida pela quantidade de pesos obtidos. Assim, sejam: X: média dos pesos do material X Y: média dos pesos do material Y Z: média dos pesos do material Z DM(X): desvio médio do material X DM(Y): desvio médio do material Y DM(Z): desvio médio do material Z Temos que: X = 5,5 + 6 + 6 + 6 + 6,5 5 = 30 5 = 6 Y = 4 + 5 + 6 + 6 + 9 5 = 30 5 = 6 Z = 5 + 6 + 6 + 6 + 7 5 = 30 5 = 6 DM(X) = |5,5 − 6| + 3 ∙ |6 − 6| + |6,5 − 6| 5 = 0,5 + 0,5 5 = 1 5 = 0,2 DM(Y) = |4 − 6| + |5 − 6| + 2 ∙ |6 − 6| + |9 − 6| 5 = 2 + 1 + 3 5 = 6 5 = 1,2 DM(Z) = |5 − 6| + 3 ∙ |6 − 6| + |7 − 6| 5 = 1 + 1 5 = 2 5 = 0,4 Assim, concluímos que DM(X) < DM(Z) < DM(Y) e, portanto, a alternativa E é o gabarito da questão. Resposta: E 9. IBFC – EBSERH – 2017) Representa o desvio-padrão populacional de uma série de dados: a) S b) D c) Var2 d) δ e) µ RESOLUÇÃO: Prof. Arthur Lima Aula 08 36 de 122| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 O desvio padrão populacional é representado pela letra grega δ (sigma), o que nos dá a alternativa D como gabarito da questão. É importante tomar cuidado para não confundi-lo com o desvio-padrão amostral, que é representado pela letraS (alternativa A). Resposta: D 10.IBFC – EBSERH – 2017) Um levantamento amostral sobre o número de filhos de 50 funcionários foi realizado em uma empresa localizada em um município. Esse levantamento gerou a tabela a seguir: O quartil médio do número de filhos dos funcionários da amostra é, aproximadamente: a) 1,50 b) 2,00 c) 0,00 d) 4,00 e) 1,85 RESOLUÇÃO: O quartil médio pode ser representado pela fórmula: Quartil Médio = 𝑄3 + 𝑄1 2 Onde Q3 representa o 3º quartil e Q1 representa o 1º quartil. Q1 é o número de filhos do funcionário que ocupa a posição 50+1 4 = 12,75. Ao arredondar, temos que Q1 representa o número de filhos do funcionário que ocupa a posição 13, ou seja, Q1=0, pois os 20 primeiros funcionários (ao serem ordenados por número de filhos) têm 0 filhos. Q3 é o número de filhos do funcionário que ocupa a posição 3∙(50+1) 4 = 38,25. Ao arredondar, temos que Q3 representa o número de filhos do funcionário que ocupa a posição 38, ou seja, Q3=4, pois os 20 primeiros Prof. Arthur Lima Aula 08 37 de 122| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 funcionários (ao serem ordenados por número de filhos) têm 0 filhos, o 21º funcionário até o 25º têm 1 filho, o 26º funcionário até o 33º têm 2 filhos, o 34º e o 35º funcionários têm 3 filhos e o 35º funcionário até o 39º têm 4 filhos. Por fim, temos que: Quartil Médio = 4 + 0 2 = 2 Portanto, a alternativa B é o gabarito da questão. Resposta: B 11.IBFC – EBSERH – 2017) O valor aproximado do desvio padrão da série se encontra descrito na alternativa: a) 11,9 b) 5,75 c) 14,3 d) 21,8 e) 18,5 RESOLUÇÃO: A fim de efetuar o cálculo do desvio padrão primeiro necessitamos calcular a média, já que ela é necessária para o cálculo do desvio padrão. Assim, temos: Média = 40 + 20 + 32 + 45 + 11 + 8 + 33 7 = 189 7 = 27 Agora, passamos a calcular a variância, pois o desvio padrão é igual à raiz quadrada da variância. Temos que a variância amostral é igual à soma das diferenças entre cada uma das observações e a média delas elevadas ao quadrado, dividida pelo número total de observações menos um. Assim, chamando a variância de Var, temos: Var = (40 − 27)2 + (20 − 27)2 + (32 − 27)2 + (45 − 27)2 + (11 − 27)2 + (8 − 27)2 + (33 − 27)2 7 − 1 Var = (13)2 + (−7)2 + (5)2 + (18)2 + (−16)2 + (−19)2 + (6)2 6 Var = 169 + 49 + 25 + 324 + 256 + 361 + 36 6 = 1220 6 = 203,33 Finalmente, chamando o desvio padrão de DP, temos que : Prof. Arthur Lima Aula 08 38 de 122| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 DP = √203,33 2 = 14,26 ≅ 14,3 Portanto, temos que a alternativa C é o gabarito da questão. É importante ressaltar que não é necessário calcular com exatidão a raiz quadrada do número 203,33, é possível utilizar aproximação, pois 203,33 é um pouco maior que o quadrado perfeito 196 (cuja raiz quadrada é 14), e é menor que o quadrado perfeito 225 (cuja raiz quadrada é 15), a partir daí já podemos inferir que a raiz quadrada de 203,33 é algum número maior que 14 e menor que 15, e saber disso já é suficiente para encontrarmos a alternativa correta. Resposta: C 12.FUNRIO – SESAU/RO – 2017) Considere a seguinte amostra de idades: 18, 15, 24, 20, 22, 21, 19, 30, 20 A estimativa não tendenciosa usual da variância populacional é aproximadamente igual a: (A) 15,8. (B) 17,8. (C) 20,1. (D) 22,2. (E) 23,1. RESOLUÇÃO: A variância populacional é dada pela expressão: 𝛿2 = ∑ (𝑥𝑖 − 𝑥 ) 21 𝑛 (𝑛−1) Calculando a média dessa população, teremos: 𝑥 = 15 +18 + 19 + 20 + 20 + 21 + 22 + 24 + 30 9 𝑥 = 189 9 𝑥 = 21 Assim, 𝛿2= (15 − 21)2 + (18 − 21)2 + (19 − 21)2 + 2 𝑥 (20 − 21)2 + 02 + (22 − 21)2 + (24 − 21)2 + (30 − 21)2 (9 − 1) 𝛿2= 36 + 9 + 4 + 2 + 0 + 1 + 9 + 81 8 𝛿2= 142 8 𝛿2= 17,75 (aproximadamente 17,8) Resposta: B Prof. Arthur Lima Aula 08 39 de 122| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 13. FUNRIO – SESAU/RO – 2017) Considere a seguinte amostra de idades: 18, 15, 24, 20, 22, 21, 19, 30, 20 Suponha que se note, posteriormente, que a idade 24 está erradamente registrada, sendo na verdade igual a 44. Nesse caso, avalie se essa substituição implica que: I. O valor da média amostral aumentará. II. O valor da mediana amostral aumentará. III. O valor da variância amostral aumentará. Assinale a alternativa correta. (A) apenas a afirmativa I está correta. (B) apenas a afirmativa II está correta. (C) apenas as afirmativas I e III estão corretas. (D) apenas as afirmativas II e III estão corretas. (E) as afirmativas I, II e III estão corretas. RESOLUÇÃO: Repare que os dados em ordem crescente são: 15, 18, 19, 20, 20, 21, 22, 30, 44 Note que, após essa mudança, a mediana continua valendo 20. Além disso, a nova média vale: 𝑥 = 15 +18 + 19 + 20 + 20 + 21 + 22 + 44 + 30 9 𝑥 = 209 9 𝑥 = 23,22 →Veja que a média amostral aumentou. Vamos calcular a variância amostral: 𝛿2= (15 − 21)2 + (18 − 21)2 + (19 − 21)2 + 2 𝑥 (20 − 21)2 + 02 + (22 − 21)2 + (44 − 21)2 + (30 − 21)2 (9 − 1) 𝛿2= 36 + 9 + 4 + 2 + 0 + 1 + 529 + 81 8 𝛿2= 662 8 𝛿2= 82,75 Observe que a variância aumentou. Prof. Arthur Lima Aula 08 40 de 122| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 Assim, apenas os itens I e III estão corretos. Resposta: E 14.FGV – MPE/BA – 2017) A distribuição de frequências do número de apreensões de valores (em milhões R$) realizadas pela Polícia Federal, em determinado período, é conforme a seguir: Assim sendo, é correto afirmar que: a) o último Decil está na penúltima classe; b) a mediana da distribuição está na 2ª classe; c) a média da distribuição está na 3ª classe; d) a moda exata da distribuição está na 1ª classe; e) a distribuição é assimétrica à esquerda. RESOLUÇÃO: Vamos avaliar as alternativas: a) O último decil corresponde ao 9º decil, é a observação que divide os dados de forma que 90% dos dados sejam menores que ele e 10% sejam maiores. Vamos acrescentar a coluna da frequência acumulada na tabela a fim de verificar a que classe o 9º decil pertence: Intervalo de Classe Frequências Frequência Acumulada 0 |-- 10 47 47 10 |-- 20 29 76 20 |-- 30 13 89 30 |-- 40 7 96 40 |-- 50 3 99 Mais de 50 1 100 Prof. Arthur Lima Aula 08 41 de 122| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 Ao observar a tabela acima, verificamos que há um total de 100 observações, portanto o 9º decil se encontra na classe em que a observação 90 (pois 90% de 100 observações = 90) se encontra. Da tabela, temos que até a terceira classe estão acumuladas 89 das observações, portanto a observação 90 (9º decil) pertence à classe seguinte (30 |-- 40), que é a antepenúltima classe, e não a penúltima. Portanto a alternativa A está incorreta. b) A mediana corresponde à observação de posição 100/2 = 50. Ao observar a tabela, verificamos que na primeira classe estão as 47 primeiras observações. E na segunda classe estão as 29 observações seguintes, totalizando 76 observações. Portanto, a observação 50, mediana, encontra-se na segunda classe de fato. Logo, concluímos que a alternativa B está correta e é o gabarito da questão. Para não restar dúvidas, vamos avaliar as demais alternativas: c) Como os dados estão organizados em classes, a fim de calcular a média precisamos calcular o ponto médio de cada um dos intervalos. Assim, temos: Ponto Médio Intervalo Frequências 5 47 15 29 25 13 35 7 45 3 55 1 A média é dada pela soma dos pontosmédios dos intervalos multiplicados pelas respectivas frequências, dividida pela frequência total (soma das frequências). Assim: Média = 5 ∙ 47 + 15 ∙ 29 + 25 ∙ 13 + 35 ∙ 7 + 45 ∙ 3 + 55 ∙ 1 47 + 29 + 13 + 7 + 3 + 1 Média = 235 + 435 + 325 + 245 + 135 + 55 100 = 1430 100 = 14,3 Logo, a média pertence à 2ª classe, e não à 3ª, pois 14,3 é um valor entre 10 e 20. Assim, concluímos que a alternativa C também está incorreta. d) Sabemos que a classe modal (classe de maior frequência) é a 1ª classe, entretanto isso não nos permite afirmar que a moda exata pertença a essa classe, só a análise dos dados brutos (não organizados em classes) nos permitiria verificar qual a moda exata e a que classe ela pertence. Logo, a alternativa D está incorreta. Prof. Arthur Lima Aula 08 42 de 122| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 e) Ao observar a tabela, notamos claramente que há uma concentração de apreensões nas primeiras classes, portanto há uma concentração de valores pequenos na distribuição, o que caracteriza uma distribuição assimétrica à direita, e não à esquerda. Portanto, a alternativa E também está incorreta. Resposta: B 15. FGV – MPE/BA – 2017) Em uma amostra desconfia-se de que três valores sejam, na verdade, “outliers” e que deveriam ser descartados. Para tal avaliação o estatístico dispõe apenas dos valores dos 1º e 3º quartil da distribuição. Os números são os seguintes: Q1(X) = 21, Q3(X) = 33, X1 = 58, X2 = 2 e X3 = 43 Onde Qis são os quartis e os Xis os valores em análise. Assim, é correto afirmar que: a) todos os valores são “outliers” ; b) os valores X1 e X3 são “outliers”; c) nenhum dos valores é “outliers”; d) apenas o valor X2 é “outlier”; e) os valores X1 e X2 são “outliers”. RESOLUÇÃO: Com os valores dos 1º e 3º quartil fornecidos pelo enunciado devemos calcular os limites inferior e superior, e compará-los com X1, X2 e X3. Valores menores que o limite inferior ou maiores que o limite superior são outliers, já valores maiores ou iguais ao limite inferior e menores ou iguais ao limite superior não são outliers. A fórmula para cálculo do limite inferior (LI) é: LI = Q1(X) – 1,5∙(Q3(X) - Q1(X)) LI = 21 – 1,5∙(33 – 21) = 21 - 1,5∙12 = 21 – 18 = 3 A fórmula para cálculo do limite superior (LS) é: LS = Q3(X) + 1,5∙(Q3(X) - Q1(X)) LS = 33 + 1,5∙(33 – 21) = 33 + 18 = 51 X1 = 58 é maior que LS = 51, portanto X1 é um outlier. X2 = 2 é menor que LI = 3, portanto X2 é um outlier. X3 = 43 é maior que LI e menor que LS, portanto X3 não é um outlier. Logo, temos que X1 e X2 são outliers, portanto a alternativa E é o gabarito da questão. Resposta: E Prof. Arthur Lima Aula 08 43 de 122| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 16.FCC – TRT/11 – 2017) O conjunto {X₁, X₂, X₃, ... , X₁₀ } refere-se a uma população de tamanho 10 de elementos estritamente positivos, em que Observação: log(N) é o logaritmo de N na base 10. Considere as seguintes afirmações com relação a esta população: I. O coeficiente de variação é igual a 1/7. II. A média geométrica é igual a raiz quadrada de 109,185. III. Multiplicando todos os elementos da população por 2, o coeficiente de variação da nova população formada não se altera. IV. Dividindo todos os elementos da população por 2, a variância da nova população formada é igual a 25% da variância anterior. Está correto o que se afirma APENAS em a) I, II e III. b) III e IV. c) I e III. d) II e IV. e) I, III e IV. RESOLUÇÃO: Vamos analisar os itens: I) O coeficiente de variação (CV) é a razão entre o desvio padrão e a média de uma variável aleatória. Chamando a média de X de X̅, a variância de X de 𝜎2, e seu desvio padrão de 𝜎, temos que: X̅ = ∑ Xi 10 i=1 n = 84 10 = 8,4 σ2 = ∑ Xi 2 − n ∙ X̅210i=1 n σ2 = 720 − 10 ∙ 8,42 10 σ2 = 720 − 705,6 10 = 1,44 σ = √1,44 = 1,2 Por fim, temos que: Prof. Arthur Lima Aula 08 44 de 122| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 CV = σ X̅ = 1,2 8,4 = 1 7 Portanto, o item I está correto. II) A média geométrica de X (vamos chama-la de MG), é dada por: 𝑀𝐺 = √∏ 𝑋𝑖 10 𝑖=1 10 𝑀𝐺 = 10 ∑ 𝑙𝑜𝑔𝑋𝑖 10 𝑖=1 10 𝑀𝐺 = 10 9,185 10 = 100,9185 Temos que 100,9185 é diferente de √109,185 e nem é necessário efetuar o cálculo exato para chegar a essa conclusão, pois sabemos que 100,9185 é algum número menor que 10, pois seu expoente 0,9185 é menor que 1, e se 10¹ é igual a 10, sabemos que 10 elevado a um valor menor que 1 resulta em um valor menor que 10. Já 109,185 é um número maior que 100, portanto sua raiz quadrada é maior que 10 (já que a raiz quadrada de 100 é 10). Assim, se sabemos que 100,9185 certamente é menor que 10, e que √109,185 com certeza é maior que 10, podemos concluir que são números diferentes. Portanto, o item II está incorreto. III) Ao multiplicar todos os elementos de X por 2, temos que: Média(2X) = 2 ∙ Média(X) = 2 ∙ X̅ Variância(2X) = 22 ∙ Variância(X) = 4 ∙ σ2 Desvio padrão(2X) = √4 ∙ σ2 = 2σ CV(2X) = 2σ 2X̅ = σ X̅ = 1 7 Logo, de fato o coeficiente de variação não se altera ao multiplicar todos os termos por 2, portanto o item III também está correto. IV) Dividindo todos os elementos da população por 2, temos que: Variância ( X 2 ) = ( 1 2 ) 2 ∙ Variância(X) = 1 4 ∙ σ2 = 0,25σ2 Portanto, de fato a variância da nova população é igual a 25% da variância anterior, logo o item IV também está correto. Por fim, apenas os itens I, III e IV estão corretos, assim a alternativa E é o gabarito da questão. Resposta: E Prof. Arthur Lima Aula 08 45 de 122| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 17. IBFC – EBSERH – 2016) São medidas de dispersão de dados, exceto: a) Amplitude total. b) Desvio Médio. c) Desvio Padrão. d) Amplitude Semi-Interquartílica. e) Mediana. RESOLUÇÃO: Apenas a mediana não é uma medida de dispersão, e sim uma medida de posição. As demais alternativas contém medidas de dispersão (que medem a dispersão ou variabilidade dos dados e são consideravelmente impactadas por valores discrepantes). Logo, concluímos que a alternativa E é o gabarito da questão. Resposta: E 18.IBFC – EBSERH – 2016) O Coeficiente de Variação da distribuição equivale a: a) 0,56% b) 5,6% c) 56% d) 0,56. e) 0,056. RESOLUÇÃO: Prof. Arthur Lima Aula 08 46 de 122| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 O coeficiente de variação é a razão entre o desvio padrão e a média dos dados. A tabela já nos fornece a soma das observações, que é igual a 1466,13. Pela tabela também, podemos ver que o número de observações é 10. Portanto, temos que: Média = 1466,13 10 = 146,613 O desvio padrão também nos é dado na tabela, representado por S, temos que S = 0,82 Por fim, chamando o coeficiente de variação de CV, temos que: CV = S média = 0,82 146,613 ≅ 0,0056 = 0,56% Logo, a alternativa A é o gabarito da questão. Resposta: A 19.IBFC – EBSERH – 2016) A média, a mediana e a variância da amostra equivalem a, aproximadamente e respectivamente: a) 146,61; 146,50; 0,82. b) 146,61; 146,50; 0,67. c) 146,61; 146,46; 0,82. d) 1.466,13; 146,50; 0,67. e) 1.466,13; 146,50; 0,82. RESOLUÇÃO: Já calculamos a média na questão anterior, logo já temos que a média é igual a 146,13. Prof. Arthur Lima Aula 08 47 de 122| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 A variância é o quadrado do desvio padrão e o desvio padrão S já nos édado na tabela (S = 0,82). Assim, chamando a variância de S2, temos que: S2 = 0,822 ≅ 0,67 A partir dos valores obtidos para a média e a variância já é possível concluir que a alternativa B é o gabarito da questão, pois é a única que apresenta os valores corretos para ambas. Ainda assim, para não restar dúvidas vamos calcular a mediana. Ao observar os dados, notamos que eles não estão ordenados, portanto um primeiro passo para o cálculo da mediana é ordená-los do menor para o maior número, obtendo: 1 2 3 4 5 6 7 8 9 10 145,52 145,54 146,21 146,28 146,47 146,53 146,64 147,37 147,57 148,00 Como o conjunto de dados tem 10 observações e 10 é um número par, temos que a mediana é média das observações que ocupam as posições 5 ( 10 2 ) = 146,47 e 6 ( 10 2 + 1) = 146,53 dos dados ordenados. Portanto, temos que: Mediana = 146,47 + 146,53 2 = 293 2 = 146,5 O que confirma que, conforme já havíamos concluído, a alternativa B é de fato o gabarito da questão. Resposta: B 20.IBFC – EBSERH – 2016) Se R$ 20,00 fossem adicionados a todos os valores da distribuição, o valor da media e o desvio-padrão da distribuição seriam alterados em : a) R$ 2,00; R$ 0,00. b) R$ 20,00; R$ 0,00. Prof. Arthur Lima Aula 08 48 de 122| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 c) R$ 0,00; R$ 20,00. d) R$ 166,00; R$ 20,00. e) R$ 0,20; R$ 10,00. RESOLUÇÃO: Seja X uma variável aleatória e a uma constante. Por uma propriedade da média (ou esperança), temos que: média(X+a) = média(X)+a Assim, para a = 20, temos: média(X+20) = média(X)+20 Logo, podemos concluir que se R$ 20,00 fossem adicionados a todos os valores da distribuição, o valor da média aumentaria em R$20,00. Há também uma propriedade da variância que nos diz que, sendo X uma variável aleatória e a uma constante: Variância(X+a) = Variância(X) Ou seja, a variância de uma variável aleatória (e consequentemente seu desvio-padrão também, já que o desvio padrão é igual à raiz quadrada da variância) não é alterada se for somada uma constante a cada um dos valores de um conjunto de dados. Portanto, podemos concluir que o desvio-padrão não se alteraria (que é o mesmo que ser alterado em R$0,00) se R$ 20,00 fossem adicionados a todos os valores da distribuição, e assim temos que a alternativa B é o gabarito da questão. Resposta: B 21.VUNESP – 2016) Na estatística, são considerados medidas de dispersão: a) média e moda. b) percentil e coeficiente de variação. c) amplitude total e percentil. d) amplitude total e desvio padrão. e) variância e média. RESOLUÇÃO: Vamos analisar as alternativas: A alternativa A está incorreta, pois média e moda são medidas de posição, e não de dispersão. As alternativas B e C também estão incorretas, pois percentil é uma medida separatriz, e não de dispersão. A alternativa D está correta, pois amplitude total (diferença entre a maior e a menor observação de um conjunto de dados) e desvio padrão de fato são medidas de dispersão. A alternativa E está incorreta porque, conforme já mencionado, média é uma medida de posição, e não de dispersão. Prof. Arthur Lima Aula 08 49 de 122| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 Portanto, concluímos que a alternativa D é o gabarito da questão. Resposta: D 22.IBFC – EBSERH – 2015) Dentre os dados brutos em cada item, o que possui maior desvio padrão é: a) 2,2,2,2,2,2,2,2 b) 1,1,2,2,3,3,4,4 c) 1,1,1,1,4,4,4,4 d) 1,2,2,2,2,2,2,4 e) 1,1,1,2,3,4,4,4 RESOLUÇÃO: De cara já podemos eliminar a alternativa A, pois todos seus elementos são iguais a 2 e portanto o desvio- padrão é zero. A alternativa D também certamente não é a que possui maior desvio, pois 6 de seus 8 elementos são iguais a 2, e os outros 2 elementos são 1 e 4 (que são elementos presentes nas demais séries de dados, exceto a da alternativa A), logo ela claramente é a série que apresenta menor desvio padrão depois da série da alternativa A. Resta então verificarmos as alternativas B, C e E. Como todas as séries tem o mesmo número de elementos (8) e a questão não nos pede o valor exato do desvio padrão, mas sim uma comparação entre os desvios, é possível simplificar os cálculos a fim de economizar tempo (que é fundamental na hora da prova). É válido, por exemplo, para cada série calcular a soma dos desvios absolutos (diferença absoluta) entre os elementos e a média da série, e comparar tal soma para cada uma das séries, a que obtiver maior soma de desvios absolutos possui consequentemente maior desvio padrão. E nem é necessário dividir tal soma de desvios absolutos pelo número de elementos da série a fim de compará-las, já que todas tem o mesmo número de elementos. Assim, para a série da alternativa B, temos a seguinte média: MédiaB = 1 + 1 + 2 + 2 + 3 + 3 + 4 + 4 8 = 20 8 = 2,5 Soma desvios abolutosB = 2 ∙ (|1 − 2,5| + |2 − 2,5| + |3 − 2,5| + |4 − 2,5|) Soma desvios abolutosB = 2 ∙ (1,5 + 0,5 + 0,5 + 1,5) = 2 ∙ 4 = 8 Já para a alternativa C, temos: MédiaC = 1 + 1 + 1 + 1 + 4 + 4 + 4 + 4 8 = 20 8 = 2,5 Soma desvios abolutosC = 4 ∙ (|1 − 2,5| + |4 − 2,5|) Soma desvios abolutosC = 4 ∙ (1,5 + 1,5) = 4 ∙ 3 = 12 Por fim, para a alternativa E, temos que: Prof. Arthur Lima Aula 08 50 de 122| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 MédiaE = 1 + 1 + 1 + 2 + 3 + 4 + 4 + 4 8 = 20 8 = 2,5 Soma desvios abolutosE = 3 ∙ (|1 − 2,5| + |4 − 2,5|) + |2 − 2,5| + |3 − 2,5| Soma desvios abolutosE = 3 ∙ (1,5 + 1,5) + 0,5 + 0,5 = 9 + 1 = 10 Portanto, a série de dados da alternativa C possui maior soma de desvios absolutos e consequentemente possui maior desvio padrão também, e por isso é o gabarito da questão. Resposta: C 23.VUNESP – TJ/SP – 2015) Utilize o texto e as tabelas para responder à questão. Duas amostras de 8 pessoas foram escolhidas em duas escolas, A e B, para a realização de um estudo sobre a obesidade entre adolescentes. As 16 pessoas foram pesadas, e o resultado está expresso nas tabelas a seguir: Escola A Escola B Pessoas Massa (kg) Pessoas Massa (kg) 1 62 1 73 2 63 2 66 3 65 3 70 4 60 4 71 5 64 5 72 6 63 6 71 7 66 7 72 8 61 8 73 A soma das variâncias obtidas em cada um dos grupos é igual a a) 7. b) 9. c) 8. d) 6. e) 10. RESOLUÇÃO: Precisamos calcular a variância dos pesos dos alunos de ambas as escolas e somá-las. A variância é dada pela soma do quadrado das diferenças entre os pesos e a média dos pesos, dividida pelo número de alunos. Na questão anterior já calculamos o peso médio dos 8 alunos da escola A (63 kg) e dos 8 alunos da escola B (71 kg). Agora, vamos calcular a variância dos pesos da escola A e a variância dos pesos da escola B: Prof. Arthur Lima Aula 08 51 de 122| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 Variância A = (62 − 63)² + (63 − 63)² + (65 − 63)² + (60 − 63)² + (64 − 63)² + (63 − 63)² + (66 − 63)² + (61 − 63)² 8 Variância A = (−1)² + 0² + 2² +
Compartilhar