Buscar

10 - Medidas de dispersão desvio-padrão, variância, coeficiente de variação Correlação Histogramas e curvas de frequência Diagrama box-plot Avaliação de outliers Análise de dados categorizados

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 122 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 122 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 122 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Prof. Arthur Lima 
 Aula 08 
 
1 de 122| www.direcaoconcursos.com.br 
Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Aula 08 – Medidas de 
Dispersão 
Raciocínio Analítico, Matemática Financeira e 
Estatística p/ Auditor do TCU – 2019 
Prof. Arthur Lima 
Prof. Arthur Lima 
 Aula 08 
 
2 de 122| www.direcaoconcursos.com.br 
Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 
Sumário 
MEDIDAS DE DISPERSÃO OU VARIABILIDADE ................................................................................................... 3 
MEDIDAS SEPARATRIZES – QUARTIS ................................................................................................................ 3 
MEDIDAS DE DISPERSÃO OU VARIABILIDADE .................................................................................................. 8 
Variância ......................................................................................................................................................... 8 
Desvio padrão ............................................................................................................................................... 12 
Coeficiente de variação .................................................................................................................................. 17 
TÉCNICAS DE AMOSTRAGEM .......................................................................................................................... 19 
Técnicas casuais de amostragem (probabilísticas) ........................................................................................... 20 
Técnicas não-casuais de amostragem (não probabilísticas) .............................................................................. 21 
QUESTÕES COMENTADAS PELO PROFESSOR ................................................................................................. 24 
LISTA DE QUESTÕES DA AULA ........................................................................................................................ 90 
GABARITO ..................................................................................................................................................... 119 
RESUMO DIRECIONADO ................................................................................................................................ 120 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Prof. Arthur Lima 
 Aula 08 
 
3 de 122| www.direcaoconcursos.com.br 
Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 
Medidas de Dispersão 
 
Olá, tudo bem? Aqui é o professor Arthur Lima. 
É com muita alegria que inicio mais essa aula. 
Vamos tratar sobre os seguintes tópicos do seu edital neste encontro: 
 
Medidas de dispersão: desvio-padrão, variância, coeficiente de variação. Correlação. Histogramas e curvas de 
frequência. Diagrama box-plot. Avaliação de outliers. Análise de dados categorizados. 
 
Aproveito para lembrá-lo de seguir as minhas redes sociais e acompanhar de perto o trabalho que desenvolvo: 
 
 
MEDIDAS SEPARATRIZES – QUARTIS 
Assim como a mediana divide os dados em 2, os quartis dividem os dados em 4. Isto é, abaixo do primeiro 
quartil estão ¼, ou 25% das observações. Dele até o segundo quartil, outros 25%. E assim por diante. Note que 
o segundo quartil é a própria mediana, pois 50% dos dados são inferiores a ele. Para exemplificar, vamos utilizar 
a tabela abaixo: 
Valor da variável Frequências (Fi) 
1,50m 15 
1,51m 5 
1,53m 4 
1,57m 2 
1,60m 10 
1,63m 8 
Prof. Arthur Lima 
 Aula 08 
 
4 de 122| www.direcaoconcursos.com.br 
Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 
1,65m 1 
1,71m 20 
1,73m 10 
1,75m 3 
1,83m 2 
 
Veja que temos 80 observações (frequências), isto é, n = 80. 
O primeiro quartil (Q1) está localizado na posição (n+1)/4, que neste caso é (80+1)/4 = 20,25. Veja que não 
existe a posição 20,25. Precisamos, portanto, fazer a média entre o valor da posição 20 e o da posição 21. Na 
posição 20 temos 1,51m, e na posição 21 temos 1,53m. Portanto, Q1 = (1,51 + 1,53)/2 = 1,52m. Ou seja, 25% dos 
indivíduos observados possuem altura inferior a 1,52m. 
Já o segundo quartil (Q2) é a própria mediana, localizada na posição 2(n+1)/4, ou simplesmente (n+1)/2. 
Com n = 80, o Q2 está na posição 40,5. Como essa posição não existe, precisamos fazer a média entre o valor 
da posição 40 (que é 1,63m) e o da posição 41 (que também é 1,63m). Portanto, Q2 = (1,63 + 1,63)/2 = 1,63m. 
Isto é, 50% dos dados encontram-se abaixo de 1,63m. 
O terceiro quartil (Q3) está na posição 3(n+1)/4, que neste caso é igual a 60,75. Fazendo a média entre o 
valor da posição 60 (1,71) e o da posição 61 (também 1,71), temos que Q3 = 1,71m. Isto é, 75% das observações 
encontram-se abaixo de 1,71m. 
Resumindo, temos: 
Quartil Posição 
1 (n+1)/4 
2 2(n+1)/4 
3 3(n+1)/4 
Analogamente aos quartis, que dividem os dados em 4 grupos, temos os decis (que dividem em 10 grupos) 
e os percentis (que dividem em 100 grupos). Veja que a mediana, o 2º quartil, o 5º decil e o 50º percentil são o 
mesmo valor. 
Chamamos de amplitude interquartílica a distância entre o 1º e o 3º quartis de uma distribuição, ou seja: 
AI = Q3 – Q1 
Prof. Arthur Lima 
 Aula 08 
 
5 de 122| www.direcaoconcursos.com.br 
Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 
O método da interpolação linear usado para o cálculo da mediana pode ser aplicado aqui, com as devidas 
adaptações. Observe isso na questão abaixo: 
ESAF – AFRFB – 2003) Considere a tabela de frequências seguinte correspondente a uma amostra da variável 
X. Não existem observações coincidentes com os extremos das classes. 
 
Assinale a opção que corresponde à estimativa do valor x da distribuição amostral de X que não é superado por 
cerca de 80% das observações. 
a) 10.000 
b) 12.000 
c) 12.500 
d) 11.000 
e) 10.500 
RESOLUÇÃO: 
Para resolver essa questão vamos usar os mesmos conceitos de interpolação linear que vimos no estudo da 
mediana. Através da coluna de frequências relativas (%) acumuladas, veja que a observação que se encontra na 
posição 80% está na classe de 10.000 – 12.000. 
Assim, podemos montar a seguinte proporção: 
 
Frequência: 77% 80% 89% 
 |-----------------------------|----------------| 
Valores: 10000 X 12000 
 |-----------------------------|----------------| 
Assim, temos a proporção: 
0,89 0,80 12000
0,89 0,77 12000 10000
X− −
=
− −
 
 
0,09 12000
0,12 2000
X−
= 
 
Prof. Arthur Lima 
 Aula 08 
 
6 de 122| www.direcaoconcursos.com.br 
Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 
X = 10500 
Portanto, podemos dizer que 80% das observações são iguais ou inferiores a 10500. 
Resposta: E 
 Obs.: observe que nessa questão o que obtivemos foi o valor do 8º decil (D8), ou do 80º percentil (P80) da 
distribuição. Desta mesma forma você consegue obter qualquer quartil, decil ou percentil solicitado por uma 
questão. 
 
Chamamos de Box-Plot a representação gráfica abaixo. Ela nos permite visualizar rapidamente os limites 
inferior e superior de uma distribuição, além do 1º quartil, mediana e 3º quartil: 
 
É importante saber que os limites inferior e superior não são, necessariamente, os pontos mínimo e 
máximo da distribuição. Devemos calculá-los da seguinte forma: 
 
a) Limite inferior: é o maior valor entre os dois abaixo: 
Valor mínimo da distribuição 
ou 
Q1 – 1,5 x (Q3 – Q1) 
 
b) Limite superior: é o menor valor entre os dois abaixo: 
Valor máximo da distribuição 
ou 
Q3 + 1,5 x(Q3 – Q1) 
 
Prof. Arthur Lima 
 Aula 08 
 
7 de 122| www.direcaoconcursos.com.br 
Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 
Este procedimento é necessário para não representarmos no Box-Plot os “pontos fora da curva”, isto é os 
valores extremamente baixos ou extremamente altos na distribuição, que representam verdadeiras exceções. 
Em nosso exemplo (distribuição de alturas), obtivemos os seguintes valores: 
- máximo = 1,83m 
- 3º quartil = 1,71m 
- Mediana = 1,63m 
- 1º quartil = 1,52m 
- mínimo = 1,50m 
 
Portanto, podemos ver que: 
Q1 – 1,5 x (Q3 – Q1) = 1,52 – 1,5 x (1,71 – 1,52) = 1,23m 
 
Como o mínimo é maior que este valor, devemos adotar como limite inferior o próprio valor mínimo, isto 
é, 1,50m. Da mesma forma: 
Q3 + 1,5 x (Q3 – Q1) = 1,71 + 1,5 x (1,71 – 1,52) = 1,99m 
Como o valor máximo é menor que este valor, podemos adotar como limite superior o próprio valor 
máximo, isto é, 1,83m. Em outras palavras, estamos dizendo que esta distribuição de alturas não tem “pontos 
fora da curva”, ou outliers. Assim, nosso box-plot é: 
 
A visualização do Box-Plot é muito útil, pois permite ao pesquisador experiente obter rapidamente um 
“resumo” das principais características de uma distribuição. 
Prof. Arthur Lima 
 Aula 08 
 
8 de 122| www.direcaoconcursos.com.br 
Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 
MEDIDAS DE DISPERSÃO OU VARIABILIDADE 
As medidas de dispersão (ou variabilidade) medem o grau de espalhamento dos dados de uma 
distribuição. Se você anotar as idades dos seus colegas de faculdade, provavelmente verá que a maioria deles 
se concentra numa faixa muito estreita (talvez entre 19 e 24 anos), com evidente predominância dos jovens, 
havendo um ou outro caso que destoa dessa faixa. Agora, se você tentar anotar as idades das pessoas que 
frequentam uma determinada praia, verá que a dispersão é muito maior, isto é, existem quantidades 
significativas de crianças, jovens, adultos e idosos. 
Para quantificar essa dispersão (ou variabilidade) existem diversas medidas, dentre as quais as principais 
são: a variância, o desvio padrão e o coeficiente de variação. 
Variância 
Chamamos de variância a média do quadrado das distâncias de cada observação até a média aritmética. 
Complicado? Vamos por partes... 
A distância de uma observação Xi até a média aritmética X é dada pela subtração iX X− . O quadrado 
desta distância é 
2( )iX X− . A média do quadrado dessas distâncias é dado pelo somatório de todos os valores 
2( )iX X− , dividido pelo total de observações (n). Portanto, a fórmula da variância é: 
2
2 1
( )
n
iX X
Variancia
n

−
= =

 
 
Como você viu nesta fórmula, costumamos simbolizar a variância por 2 . Exemplificando, vamos calcular 
a variância do seguinte conjunto de dados: {1, 3, 5, 5, 8, 9}. Repare que temos n = 6 elementos, cuja média é: 
1 3 5 5 8 9
6
6
X
+ + + + +
= = 
 
Assim, a variância é: 
2
2 2 2 2 2 2
2 1
2
( )
(1 6) (3 6) (5 6) (5 6) (8 6) (9 6)
6
25 9 1 1 4 9
8,16
6
n
iX X
n


−
− + − + − + − + − + −
= =
+ + + + +
= =

 
 
Esta é a fórmula básica da variância. Entretanto, dependendo do exercício pode ser que seja mais 
conveniente usar alguma das fórmulas a seguir, que são meras variações desta primeira: 
Caso os dados estejam em uma tabela de frequências (fi): 
Prof. Arthur Lima 
 Aula 08 
 
9 de 122| www.direcaoconcursos.com.br 
Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 
2
2 1
1
[ ( ) ]
n
i i
n
i
f X X
f

 −
=


 
 
Caso os dados estejam em uma tabela de frequências, porém agrupados em intervalos de classes, 
devemos usar os pontos médios PMi no lugar dos valores individuais Xi: 
2
2 1
1
[ ( ) ]
n
i i
n
i
f PM X
f

 −
=


 
Veja que em todas as fórmulas para cálculo da variância é preciso inicialmente obter o valor da média da 
população. Entretanto, a fórmula abaixo nos permite encontrar a variância sem precisar calcular a média: 
2
2
1 12
1n n
i i
i i
X X
n
n
 = =
 
−  
 =
 
 
 
Veja que, nesta fórmula, só é preciso obter o valor do somatório das observações (
1
n
i
i
X
=
 ), bem como o 
somatório dos quadrados das observações ( 2
1
n
i
i
X
=
 ), que são cálculos relativamente fáceis. 
Se os dados estiverem agrupados, você pode alterar esta última fórmula, utilizando a seguinte: 
2
2
1 12
1
( ) ( )
n n
i i i i
i i
X f X f
n
n
 = =
 
 −  
 =
 
 
 
E se estiverem em intervalos de classes, você pode utilizar os pontos médios: 
2
2
1 12
1
( ) ( )
n n
i i i i
i i
PM f PM f
n
n
 = =
 
 −  
 =
 
 
 
ATENÇÃO: todas as fórmulas vistas acima permitem calcular a variância de uma POPULAÇÃO. Caso o 
exercício apresente apenas uma amostra da população, devemos fazer uma pequena alteração nas fórmulas 
acima, calculando a variância AMOSTRAL, que é simbolizada por s2. Esta alteração consiste em subtrair uma 
unidade (1) no denominador das fórmulas. 
Prof. Arthur Lima 
 Aula 08 
 
10 de 122| www.direcaoconcursos.com.br 
Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 
Exemplificando, ao invés de 
2
2 1
( )
n
iX X
n

−
=

, teremos: 
2
2 1
( )
1
n
iX X
s
n
−
=
−

 
 
Analogamente, ao invés de 
2
2 1
1
[ ( ) ]
n
i i
n
i
f X X
f

 −
=


, teremos: 
2
2 1
1
[ ( ) ]
1
n
i i
n
i
f X X
s
f
 −
=
−


 
 
E ao invés de 
2
2
1 12
1
( ) ( )
n n
i i i i
i i
PM f PM f
n
n
 = =
 
 −  
 =
 
, usaremos: 
2
2
1 12
1
( ) ( )
1
n n
i i i i
i i
PM f PM f
n
s
n
= =
 
 −  
 =
−
 
 
 
Resolva as questões abaixo antes de prosseguir: 
ESAF – ATRFB – 2009) Obtenha o valor mais próximo da variância amostral da seguinte distribuição de 
frequências, onde xi representa o i-ésimo valor observado e fi a respectiva frequência. 
xi : 5 6 7 8 9 
fi : 2 6 6 4 3 
a) 1,429. 
b) 1,225. 
c) 1,5. 
d) 1,39. 
e) 1,4. 
RESOLUÇÃO: 
Prof. Arthur Lima 
 Aula 08 
 
11 de 122| www.direcaoconcursos.com.br 
Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 
 Aqui temos uma amostra, e não uma população. Portanto, a fórmula da variância é: 
2
2 1
( )
( )
1
n
Xi X
Variancia amostra S
n
−
= =
−

 
 O primeiro passo é calcular a média, que é dada por: 
1
1
( )
n
i
n
i
Xi Fi
Média
Fi
=
=

=


 
5 2 6 6 7 6 8 4 9 3 147
7
2 6 6 4 3 21
Média
 +  +  +  + 
= = =
+ + + +
 
 
 Para o cálculo da variância, temos: 
 
2 2 2 2 2
2 (5 7) 2 (6 7) 6 (7 7) 6 (8 7) 4 (9 7) 3 30 1,5
21 1 20
S
−  + −  + −  + −  + − 
= = =
−
 
Resposta: C 
 
ESAF – SEFAZ/SP – 2009 – Adaptada) Considerando que uma série de observações constituem uma amostra 
aleatória simples X1, X2, ..., Xn de uma variável aleatória X, determine o valor mais próximo da variância 
amostral, usando um estimador não tendencioso da variância de X. 
Considere que: 
 
a) 96,85 
b) 92,64 
c) 94,45 
d) 90,57 
Prof. Arthur Lima 
 Aula 08 
 
12 de 122| www.direcaoconcursos.com.br 
Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 
e) 98,73 
RESOLUÇÃO: 
 Para resolver essa questão é preciso lembrar que a variância pode ser calculada com a seguinte fórmula, 
sem a necessidade de obtenção da média amostral: 
2
2
1 12
1
1
= =
 
−  
 =
−
 
n n
i i
i i
X X
n
s
n
 
 Veja que foi dado que n = 23, e que: 
2
1
8676
=
=
n
i
i
X e 
1
388
=
=
n
i
i
X 
 Portanto, 
( )
2
2 2
1 12
2
1 1
8676 388
23
1 23 1
96,84
= =
 
− − 
 = =
− −
=
 
n n
i i
i i
X X
n
s
n
s
 
Resposta: A 
 
Desvio padrão 
Obtida a variância, fica fácil calcular o desvio-padrão de uma população ou amostra. Basta tirar a raiz 
quadrada da variância. Isto é: 
 Desvio padrão Variância= 
 
Assim, podemos dizerque 
2 = (desvio padrão populacional) e que 2s s= (desvio padrão 
amostral). 
Lembrando que o desvio-padrão e a variância são medidas de dispersão dos dados, é bom você saber que, 
quanto maiores estes valores forem, mais espalhados estão os dados (caso da praia), e quanto menor, mais 
próximos estão os dados (caso da faculdade). 
Resolva a questão a seguir: 
 
 
 
Prof. Arthur Lima 
 Aula 08 
 
13 de 122| www.direcaoconcursos.com.br 
Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 
CESPE – MEC – 2009) Merendas escolares demandadas em 10 diferentes escolas: 
200, 250, 300, 250, 250, 200, 150, 200, 150, 200. 
 
Com base nessas informações, julgue os próximos itens. 
( ) A mediana da distribuição do número diário de merendas escolares é igual a 225. 
( ) O desvio padrão amostral dos números diários de merendas escolares é superior a 50. 
RESOLUÇÃO: 
( ) A mediana da distribuição do número diário de merendas escolares é igual a 225. 
 Para obter a mediana, o primeiro passo é colocar os dados em ordem crescente. Veja isso abaixo: 
150, 150, 200, 200, 200, 200, 250, 250, 250, 300. 
 Temos 10 elementos, portanto n = 10. A seguir devemos calcular o valor de (n+1)/2, que neste caso será 
(10+1)/2 = 5,5. Veja que não obtivemos um valor exato, pois n é par. Assim, a mediana será a média aritmética 
dos dois termos centrais da amostra, que são aqueles mais próximos da “posição” 5,5, ou seja, o 5º e o 6º termo: 
200 200
200
2
Mediana
+
= = 
 Item ERRADO. 
 
( ) O desvio padrão amostral dos números diários de merendas escolares é superior a 50. 
 O desvio padrão amostral é dado por: 
2
1
( )
1
n
i
i
X X
s
n
=
−
=
−

 
 onde n é o número de elementos (n = 10), Xi representa cada elemento da amostra e X é a média da 
amostra. A média, neste caso, é: 
 
150 150 200 200 200 200 250 250 250 300
215
10
X
+ + + + + + + + +
= = 
 Portanto, o desvio padrão será: 
Prof. Arthur Lima 
 Aula 08 
 
14 de 122| www.direcaoconcursos.com.br 
Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 
2
1
2 2 2 2
2 2 2 2
( )
1
2 (150 215) 4 (200 215) 3 (250 215) 1 (300 215)
10 1
2 ( 65) 4 ( 15) 3 (35) 1 (85)
9
8450 900 3675 7225
2250
9
n
i
i
X X
s
n
s
s
s
=
−
=
−
 − +  − +  − +  −
=
−
 − +  − +  + 
=
+ + +
= =

 
 Observe que esse número é inferior a 50, pois 50 = 2500 . Assim, o item está ERRADO. 
Resposta: E E 
 
É importante você conhecer as seguintes propriedades do desvio padrão e da variância (caem bastante!): 
- se somarmos ou subtrairmos um mesmo valor de todos os elementos de uma amostra, o desvio padrão 
e a variância permanecem inalterados. Isso porque essas são medidas de dispersão. Ao somar o mesmo número 
em todos os elementos, eles não se tornam mais dispersos (mais espalhados), apenas deslocam-se juntos para 
valores mais altos. 
- se multiplicarmos ou dividirmos todos os elementos da amostra pelo mesmo valor, o desvio padrão é 
multiplicado/dividido por este mesmo valor. Já a variância é multiplicada/dividida pelo quadrado desse valor 
(pois ela é igual ao quadrado do desvio padrão). 
Assim, se temos uma variável X, com desvio padrão x , e definimos uma variável Y como sendo Y = a.X 
+ b (ou seja, a distribuição Y é formada pelos mesmos termos da distribuição X, porém multiplicados por a e 
depois somados com b), podemos dizer que: 
- o desvio padrão de Y será: 
y xa =  (veja que o b nem aparece aqui); 
- a variância de Y será 
2 2 2
y xa =  
 
Em alguns casos, você pode ser apresentado a dois grupos diferentes (ex.: moradores da cidade A e da 
cidade B), sendo fornecidos o número de elementos de cada um deles (nA e nB), a média de cada um deles ( AX 
e BX ), bem como a variância de cada (
2
A e 
2
B ). Com isso em mãos, é possível calcular a variância que teria o 
grupo composto pela união dos indivíduos de A com os indivíduos de B. Para isso, devemos considerar 3 casos 
principais: 
Se as médias são iguais e estamos diante de populações: 
2 2
2 A A B B
A B
A B
n n
n n
 
 
 + 
=
+
 
Prof. Arthur Lima 
 Aula 08 
 
15 de 122| www.direcaoconcursos.com.br 
Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 
Se as médias são iguais e estamos diante de amostras: 
2 2
2 ( 1) ( 1)
( 1) ( 1)
A A B B
A B
A B
s n s n
s
n n

 − +  −
=
− + −
 
 
Se as médias são distintas e estamos diante de populações: 
 
Aqui o caso é mais complicado. Devemos começar lembrando a fórmula da variância sem a necessidade 
do cálculo da média: 
2
2
1 12
1n n
i i
i i
X X
n
n
 = =
 
−  
 =
 
 
Unindo as populações A e B, teremos: 
( ) ( )
2
2 2
2
1
A B A B
A B
A B
A B
X X X X
n n
n n
 
+ − +
+
=
+
   
 
 
Observe que, tendo a média AX e o número de elementos nA, é fácil calcular AX , pois: 
A A AX X n=  
 
Analogamente, B B BX X n=  . A dificuldade maior é para calcular os termos 
2
AX e 
2
BX . 
Isolando esses termos na fórmula básica 
2
2
1 12
1n n
i i
i i
X X
n
n
 = =
 
−  
 =
 
, vemos que: 
2
2 2
X
X n
n

  
 = +      

 
Assim, 
2
2 2 A
A A A
A
X
X n
n

  
 = +      

 
e 
2
2 2 B
B B B
B
X
X n
n

  
 = +      

 
Prof. Arthur Lima 
 Aula 08 
 
16 de 122| www.direcaoconcursos.com.br 
Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 
Confuso? Vamos trabalhar uma questão sobre isso: 
CEPERJ – SEPLAG/RJ – 2013) Examinando a relação dos 30 candidatos aprovados e convocados, que fi zeram 
o Curso de Formação no concurso para Analista de Planejamento e Orçamento da SEPLAG em 2011, e 
pesquisando, com estratifi cação por sexo, o arquivo de Resultado para a Prova Objetiva realizada em 
08.01.2012, o número de acertos para as 5 questões de Estatística desses 30 candidatos, obtivemos as seguintes 
informações: 
 
A média e a variância do número de acertos, sem distinção de sexo, para os 30 candidatos foram, 
respectivamente: 
A) 3,4 e 1,32 
B) 3,5 e 1,32 
C) 3,4 e 1,56 
D) 3,5 e 1,68 
E) 3,4 e 1,68 
RESOLUÇÃO: 
 Veja que temos duas populações, a feminina (F) e a masculina (M), e para os quais foram fornecidos os 
números de elementos, as médias populacionais e as variâncias populacionais. São solicitadas a média e 
variância da união das duas populações. Vejamos: 
2
12
4
1,2
F
F
F
n
X

=


=

 =
2
18
3
1, 4
M
M
M
n
X

=


=

 =
 
 
 A média pode ser facilmente calculada: 
F F M M
F M
F M
X n X n
X
n n

 + 
=
+
 
4 12 3 18
3,4
12 18
F MX 
 + 
= =
+
 
 
 Para calcularmos a variância combinada, vamos usar a fórmula: 
Prof. Arthur Lima 
 Aula 08 
 
17 de 122| www.direcaoconcursos.com.br 
Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 
( ) ( )
2
2 2
2
1
F M F M
F M
F M
F M
X X X X
n n
n n
 
+ − +
+
=
+
   
 
 
 Veja que: 
4 12 48F F FX X n=  =  = 
3 18 54M M MX X n=  =  = 
 
 Além disso, 
2 2
2 2 481,2 12 206,4
12
F
F F F
F
X
X n
n

      
 = +  = +  =             

 
2 2
2 2 541,4 18 187,2
18
M
M M M
M
X
X n
n

      
 = +  = +  =             

 
 
 Assim, 
( ) ( )
2
2 2
2
1
F M F M
F M
F M
F M
X X X X
n n
n n
 
+ − +
+
=
+
   
 
( ) ( )
2
2
1
206,4 187,2 48 54
12 18 1,56
12 18
F M 
+ − +
+= =
+
 
Resposta: C 
 
Coeficiente de variação 
Trata-se da razão entre o desvio padrão e a média, sendo normalmente expresso na forma percentual: 
CV


= 
Veja essa questão sobre o CV: 
 
Prof. Arthur Lima 
 Aula 08 
 
18 de 122| www.direcaoconcursos.com.br 
Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 
FCC – BACEN – 2006) Em um colégio, a média aritmética das alturas dos 120rapazes é de m centímetros com 
uma variância de d2 centímetros quadrados (d > 0). A média aritmética das alturas das 80 moças é de (m – 8) 
centímetros com um desvio padrão igual a 
20
21
d centímetros. Se o correspondente coeficiente de variação 
encontrado para o grupo de rapazes é igual ao coeficiente de variação encontrado para o grupo de moças, tem-
se que a média aritmética dos dois grupos reunidos é de 
 a) 162,0 cm 
 b) 164,6 cm 
 c) 164,8 cm 
 d) 166,4 cm 
 e) 168,2 cm 
RESOLUÇÃO: 
 O coeficiente de variação é dado por CV


= (desvio padrão dividido pela média). O enunciado nos disse 
que, para os rapazes, m = e 
2 2d = (portanto, d = ). Portanto, o coeficiente de variação para os rapazes 
é: 
rapazes
d
CV
m


= = 
 Para as moças, foi dito que 8m = − e 
20
21
d = , levando ao seguinte coeficiente de variação: 
20
21
8
moças
d
CV
m


= =
−
 
 Como foi dito que 
rapazes moçasCV CV= , então: 
20
21
8
d
d
m m
=
−
 
 Logo, 
20
1 21
8m m
=
−
 
20
8
21
m m− = 
20
8
21
m m− = 
Prof. Arthur Lima 
 Aula 08 
 
19 de 122| www.direcaoconcursos.com.br 
Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 
1
8
21
m = 
168m = 
 Portanto, a média de altura dos 120 rapazes é de 168cm, e a média de altura das 80 moças é 160cm. 
Calculando a média do grupo inteiro, temos: 
120 168 80 160
164,8
120 80
Média cm
 + 
= =
+
 
Resposta: C 
Repare que o coeficiente de variação é uma medida de dispersão relativa, isto é, ele nos dá uma relação 
entre o desvio padrão (que é uma medida de dispersão absoluta, assim como a variância) e uma característica 
da população ou amostra (no caso, a média). 
Por ser uma medida relativa, expressa na forma percentual, o coeficiente de variação é ideal para 
comparar duas amostras ou populações. Basta você imaginar as amostras de idades abaixo: 
A = {81, 85, 89} 
B = {1, 5, 9} 
Essas duas amostras tem o mesmo desvio padrão, que é igual a 4. Ocorre que a primeira tem uma média 
de idades (85) bem maior que a segunda (5). Assim, aquele desvio padrão de 4 anos é bem pequeno, quando 
comparado com as idades da primeira amostra, mas é bem grande quando comparado com as idades da 
segunda amostra. Os coeficientes de variação são: 
CVA = 4 / 85 = 4,7% 
CVB = 4 / 5 = 80,0% 
Assim sendo, podemos afirmar que a amostra B é bem mais dispersa/variada que a amostra A. De fato, 
se imaginarmos um conjunto de crianças com 1, 5 e 9 anos, temos uma dispersão muito maior do que quando 
vemos 3 idosos de 81, 85 e 89 anos. Enquanto a criança de 1 ano nem fala direito, a de 9 anos já lê e escreve! Já 
os idosos de 81 a 89 anos tem características bem mais parecidas entre si. 
 
TÉCNICAS DE AMOSTRAGEM 
Chamamos de técnicas de amostragem aquelas técnicas utilizadas para selecionar, dentre os indivíduos 
de uma população, aqueles que farão parte de nossa amostra, sobre a qual calcularemos os dados estatísticos 
de nosso interesse. 
Existem diversas formas de se formar uma Amostra de uma determinada população. Algumas dessas 
formas são chamadas de probabilísticas (casuais), pois permitem (cientificamente) que utilizemos as técnicas 
de inferência estatística, extrapolando os resultados para o restante da população, calculando margens de erros 
etc. As demais formas são chamadas de não-probabilísticas (não casuais). Apesar de muito utilizadas, elas não 
permitem (com o mesmo rigor) a utilização das técnicas de inferência que estudaremos. 
 
Prof. Arthur Lima 
 Aula 08 
 
20 de 122| www.direcaoconcursos.com.br 
Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 
Técnicas casuais de amostragem (probabilísticas) 
Digamos que queremos estimar o percentual de homens residentes em um determinado bairro. Vejamos 
técnicas probabilísticas para escolher uma amostra desta população, evitando ter que analisar cada um dos 
moradores daquele bairro. 
 
Amostragem aleatória simples 
Uma primeira forma de amostragem probabilística é a escolha aleatória dos indivíduos da população que 
farão parte da amostra (em uma lista, por exemplo). Trata-se da amostragem aleatória (ou casual) simples. 
Esta amostragem pode ser feita com reposição (onde um mesmo indivíduo pode ser escolhido mais de uma vez 
para a amostra) ou sem reposição (onde cada indivíduo só pode ser escolhido uma vez). 
Repare que, para fazer uma amostragem aleatória, é preciso que você tenha acesso aos dados de todos 
os indivíduos da população, para, a partir dessa listagem, efetuar uma seleção aleatória de indivíduos. 
 
Amostragem sistemática 
Uma outra forma de escolher os indivíduos do bairro que farão parte da amostra é utilizando a 
amostragem sistemática. Tendo a lista de todos os indivíduos em mãos, e algumas características destes 
indivíduos, podemos criar um critério para a escolha dos selecionados. Exemplificando, imagine que decidimos 
visitar apenas os moradores das casas cujo número é múltiplo de 10. Veja que criamos um sistema de escolha, 
motivo pelo qual esse tipo de amostragem é conhecido como sistemático. 
 
Amostragem por conglomerados (agrupamentos) 
Ao invés de criar um sistema de escolha, como fizemos na amostragem sistemática, podemos decidir 
analisar subgrupos inteiros da população. Trata-se da amostragem por conglomerados (ou agrupamentos). Ex.: 
podemos selecionar, aleatoriamente, quarteirões inteiros daquele bairro, e verificar todos os indivíduos que ali 
residem. 
Repare que neste exemplo, os conglomerados foram definidos como sendo quarteirões inteiros do bairro. 
Esta é uma boa forma de escolha, pois os conglomerados são mutuamente exclusivos, isto é: cada indivíduo só 
fará parte de 1 conglomerado. 
 
Amostragem estratificada 
Em alguns casos, podemos dividir a população em estratos, que são subconjuntos da população 
compostos por indivíduos com algumas semelhanças entre si. A diferença entre estratos e conglomerados é 
que, nos estratos, os indivíduos devem ter alguma característica em comum que os torna mais semelhantes, 
enquanto os conglomerados são meros agrupamentos com base em um critério qualquer. Os estratos também 
devem ser mutuamente exclusivos, para que cada indivíduo participe de apenas 1 estrato. Feito isso, podemos 
Prof. Arthur Lima 
 Aula 08 
 
21 de 122| www.direcaoconcursos.com.br 
Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 
selecionar uma quantidade de indivíduos dentro de cada estrato para efetuar a nossa análise. Por exemplo, 
podemos dividir todos os moradores em intervalos de idades (estratos): de 0 a 15 anos, de 15 a 30, de 30 a 45 
etc. Feito isso, podemos analisar uma quantidade de indivíduos dentro de cada estrato. 
Como escolher a quantidade de indivíduos de cada estrato que será analisada? Os principais métodos de 
escolha são: 
 
- alocação uniforme: neste caso, escolhe-se uma quantidade igual de indivíduos dentro de cada estrato. 
 
- alocação proporcional: neste caso, escolhe-se quantidades de indivíduos dentro de cada estrato de 
maneira proporcional à representatividade daquele estrato na população inteira. 
- alocação de Neyman (ou repartição ótima): leva em conta a variância dentro de cada estrato da 
população para decidir o tamanho de cada estrato. Não precisamos entrar em maiores detalhes sobre o cálculo 
desta alocação. 
 
Técnicas não-casuais de amostragem (não probabilísticas) 
Um exemplo de técnica não-probabilística é aquela usada em algumas pesquisas de opinião, onde o 
pesquisador fica em um local com grande circulação de pessoas (ex.: estação de metrô) e vai entrevistando 
pessoas ao acaso (acidentalmente). Trata-se da amostragem acidental. 
Outro exemplo seria a escolha intencional, por parte do entrevistador, de pessoas que ele acredita serem 
relevantes para a sua pesquisa. Trata-se da amostragem intencional. 
Outra conhecida forma de amostragem não probabilística é a amostragem por cotas.Nela, o primeiro 
passo é dividir a população em grupos – como é feito nas amostragens estratificada ou por conglomerados – e, 
a seguir, extrair quantidades pré-definidas (“cotas”) de indivíduos de cada grupo para se montar a amostra. 
Veja que a diferença deste tipo de amostragem para os tipos probabilísticos é que as quantidades de indivíduos 
em cada grupo/estrato são pré-definidas, não obedecendo qualquer critério estatístico. 
Também temos a amostragem de voluntários. Imagine que você pretende fazer experiências de um novo 
remédio, e para isso precise de cobaias. Como você não pode obrigar pessoas a participarem do experimento, 
você precisa contar com voluntários. Assim, a amostra de indivíduos que você vai utilizar não tem fundamento 
estatístico. 
Note que escolhas ruins do tipo de amostragem podem levar a conclusões absurdas. Exemplificando, 
digamos que queremos estimar o percentual de homens na população de nosso bairro. Para isso, decidimos 
criar nossa amostra da seguinte forma: percorrer todos os salões de beleza do bairro, anotando o número de 
homens e o número de mulheres. Veja que provavelmente chegaremos a uma conclusão absurda (muito mais 
mulheres do que homens). Essa distorção no resultado se deve ao fato de que, em regra, as mulheres costumam 
frequentar mais os salões de beleza do que os homens. Portanto, a nossa técnica de amostragem foi falha. 
Antes de prosseguir, resolva essas questões abaixo: 
 
Prof. Arthur Lima 
 Aula 08 
 
22 de 122| www.direcaoconcursos.com.br 
Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 
FGV – Senado Federal – 2008) A respeito dos principais tipos de amostragem, é correto afirmar que: 
a) a amostragem sistemática possui caráter não-probabilístico. 
 b) na amostragem aleatória estratificada há a possibilidade de que nenhuma unidade de um ou mais estratos 
sejam selecionadas. 
 c) as informações obtidas através de uma amostragem acidental permitem a obtenção de inferências 
científicas de características da população. 
 d) na amostragem de conglomerados todos os conglomerados são sempre selecionados. 
 e) a amostragem estratificada é geralmente mais eficiente do que a amostragem aleatória simples de mesmo 
tamanho. 
RESOLUÇÃO: 
a) a amostragem sistemática possui caráter não-probabilístico. 
 Falso. A técnica de amostragem sistemática é científica, isto é, probabilística (ou casual). 
 
 b) na amostragem aleatória estratificada há a possibilidade de que nenhuma unidade de um ou mais estratos 
sejam selecionadas. 
 Falso. Na amostragem estratificada é preciso selecionar indivíduos de todos os estratos. 
 
 c) as informações obtidas através de uma amostragem acidental permitem a obtenção de inferências científicas 
de características da população. 
 Falso. A amostragem acidental é considerada não-probabilística, não permitindo a obtenção científica de 
características da população. 
 
 d) na amostragem de conglomerados todos os conglomerados são sempre selecionados. 
 Falso. Ao criar os conglomerados (ex.: quarteirões de um bairro), selecionaremos apenas alguns deles, 
aleatoriamente, para a nossa análise. 
 
 e) a amostragem estratificada é geralmente mais eficiente do que a amostragem aleatória simples de mesmo 
tamanho. 
 Verdadeiro. A amostragem estratificada é mais elaborada, pois nos “obriga” a selecionar indivíduos de 
todos os estratos, tendo uma visão melhor do total da população. Ex.: na pesquisa sobre o percentual de 
homens no bairro, fomos obrigados a analisar indivíduos de todas as idades presentes na população. 
Resposta: E 
 
 
Prof. Arthur Lima 
 Aula 08 
 
23 de 122| www.direcaoconcursos.com.br 
Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 
 
FCC – TRT/3ª – 2009) O objetivo de uma pesquisa era o de se obter, relativamente aos moradores de um bairro, 
informações sobre duas variáveis: nível educacional e renda familiar. Para cumprir tal objetivo, todos os 
moradores foram entrevistados e arguídos quanto ao nível educacional, e, dentre todos os domicílios do bairro, 
foram selecionados aleatoriamente 300 moradores para informar a renda familiar. As abordagens utilizadas 
para as variáveis nível educacional e renda familiar foram, respectivamente, 
(A) censo e amostragem por conglomerados. 
(B) amostragem aleatória e amostragem sistemática. 
(C) censo e amostragem casual simples. 
(D) amostragem estratificada e amostragem sistemática. 
(E) amostragem sistemática e amostragem em dois estágios. 
RESOLUÇÃO: 
 No caso do nível educacional, analisou-se todos os indivíduos da população. Portanto, efetuou-se um 
censo. 
 No caso da renda, selecionou-se aleatoriamente (isto é, ao acaso) 300 indivíduos, que serviram de 
amostra. Trata-se, portanto, da técnica de amostragem aleatória (ou casual) simples. 
Resposta: C 
 
Chega de teoria! Vamos praticar tudo o que vimos até aqui? 
 
 
 
 
 
 
 
 
 
 
 
 
 
Prof. Arthur Lima 
 Aula 08 
 
24 de 122| www.direcaoconcursos.com.br 
Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 
Questões comentadas pelo professor 
 
1. IAUPE – CBM/PE – 2018) 
A média aritmética dos quadrados dos desvios de um conjunto de dados é denominada de 
A) Mediana. 
B) Desvio-padrão. 
C) Variância. 
D) Moda. 
E) Média. 
RESOLUÇÃO: 
Essa é a definição de variância, cuja fórmula é dada por: 
Variância = 
∑(xi−x)²
n
 
Resposta: C 
 
2. CESGRANRIO – BANCO DO BRASIL – 2018) 
Define-se como desvio interquartílico a distância entre o 1º e o 3º Quartis. É usado para avaliar a existência de 
possíveis valores atípicos em um conjunto de dados. Valores aquém ou além de limites estabelecidos com base 
nessa medida devem ser investigados quanto à sua tipicidade em relação à distribuição. Geralmente o limite 
inferior é estabelecido como 1 vez e meia o valor desse desvio, abaixo do primeiro Quartil, enquanto o limite 
superior, como 1 vez e meia acima do terceiro Quartil. 
Considere os resumos estatísticos das três distribuições de consumo de energia elétrica, em kW, dos 50 
apartamentos com mesma planta, de um edifício, em três períodos diferentes ao longo de um ano, conforme 
abaixo: 
 
Conclui-se, a partir desses resumos, que 
(A) um período apresenta pelo menos um apartamento com consumo abaixo, e dois períodos apresentam 
pelo menos um apartamento com consumo acima da tipicidade estabelecida. 
Prof. Arthur Lima 
 Aula 08 
 
25 de 122| www.direcaoconcursos.com.br 
Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 
(B) um período apresenta pelo menos um apartamento com consumo abaixo, e um período apresenta pelo 
menos um apartamento com consumo acima da tipicidade estabelecida. 
(C) em nenhum período foram observados possíveis consumos atípicos. 
(D) apenas um período apresenta pelo menos um apartamento com consumo abaixo da tipicidade 
estabelecida. 
(E) apenas um período apresenta pelo menos um apartamento com consumo acima da tipicidade 
estabelecida. 
RESOLUÇÃO: 
Podemos calcular os limites inferior e superior para cada período. Veja: 
Janeiro-Abril: 
Limite inferior = Q1 – 1,5.(Q3 – Q1) = 80 – 1,5.(90-80) = 65 
Limite superior = Q1 + 1,5.(Q3 – Q1) = 90 + 1,5.(90-80) = 105 
Note que o menor valor (75) e o maior valor (102) estão dentro deste intervalo, não sendo atípicos. 
Maio-Agosto: 
Limite inferior = Q1 – 1,5.(Q3 – Q1) = 68 - 1,5.(80-68) = 50 
Limite superior = Q1 + 1,5.(Q3 – Q1) = 80 + 1,5.(80-68) = 98 
Note que o menor valor (49) é atípico, pois está ABAIXO da tipicidade estabelecida, mas o maior valor (92) está 
dentro deste intervalo, não sendo atípico. 
 
Setembro-Dezembro: 
Limite inferior = Q1 – 1,5.(Q3 – Q1) = 75 – 1,5.(85-75) = 60 
Limite superior = Q1 + 1,5.(Q3 – Q1) = 85 + 1,5.(85-75) = 100 
Note que o menor valor (62) e o maior valor (99) estão dentro deste intervalo, não sendo atípicos. 
Resposta: D3. CESGRANRIO – BANCO DO BRASIL – 2018) 
Há dez anos a média das idades, em anos completos, de um grupo de 526 pessoas era de 30 anos, com desvio 
padrão de 8 anos. Considerando-se que todas as pessoas desse grupo estão vivas, o quociente entre o desvio 
padrão e a média das idades, em anos completos, hoje, é 
(A) 0,45 
(B) 0,42 
(C) 0,20 
(D) 0,27 
Prof. Arthur Lima 
 Aula 08 
 
26 de 122| www.direcaoconcursos.com.br 
Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 
(E) 0,34 
RESOLUÇÃO: 
Com a soma de 10 anos na idade de cada pessoa, a média é acrescida também em 10 unidades, passando a ser 
de 40 anos. Já o desvio padrão não sofre alteração, permanecendo em 8 anos. Assim, 
Desvio padrão / média = 8 / 40 = 1/5 = 0,20 
Resposta: C 
 
4. CESGRANRIO – PETROBRÁS – 2018) 
Dados sobre Precipitação Pluviométrica em cinco regiões do estado do Rio de Janeiro foram coletados para os 
meses de verão (janeiro a março) entre 1968 e 2017. Os resultados permitiram os cálculos das estatísticas e a 
elaboração do Box Plot apresentados abaixo. 
 
De acordo com os resultados acima, observe as afirmações a seguir. 
I - A média das precipitações pluviométricas é uma medida representativa da quantidade de chuva média 
mensal no verão em cada região, devido à baixa variabilidade das medidas. 
II - A variação das médias das precipitações dentro de cada região é inferior à variação das médias das 
precipitações entre as regiões. 
Prof. Arthur Lima 
 Aula 08 
 
27 de 122| www.direcaoconcursos.com.br 
Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 
III - Em pelo menos um ano, a precipitação média no verão ficou abaixo do índice de 1,5 desvio quartílico da 
distribuição em duas regiões. 
Está correto APENAS o que se afirma em 
(A) I 
(B) II 
(C) III 
(D) I e II 
 (E) I e III 
RESOLUÇÃO: 
Vamos analisar cada alternativa: 
I - A média das precipitações pluviométricas é uma medida representativa da quantidade de chuva média mensal 
no verão em cada região, devido à baixa variabilidade das medidas. 
A banca definiu o item como incorreto, pois considera que a média sozinha não pode unicamente representar 
um conjunto de dados, sempre precisará estar acompanhada de uma medida de variabilidade. Mas essa é uma 
posição questionável, já que calculando os coeficientes de variação, eles resultam em valores baixos. Veja: 
CV = 
Desvio Padrão
Média
 
CV1 = 
6,5
149
 ≅ 0,044 
CV2 = 
10,2
159
 ≅ 0,064 
CV3 = 
5,7
170
 ≅ 0,034 
CV4 = 
5,9
165
 ≅ 0,036 
CV5 = 
7,0
177
 ≅ 0,040 
 
II - A variação das médias das precipitações dentro de cada região é inferior à variação das médias das precipitações 
entre as regiões. 
A variação das médias para cada região foi calculada no item I. Ficaram: 0,044; 0,064; 0,034; 0,036; 0,040. 
Vamos analisar a variação das médias entre as regiões. Para isso, devemos calcular a média entre as regiões: 
Média = 
149 +159 +170 +165 + 177 
5
 = 
820 
5
 = 164 
O desvio padrão entre as regiões é dado por: 
Desvio Padrão = √
(149−164)2+(159−164)2+(170−164)2 +(165−164)² +(177−164)²
5
 
Desvio Padrão =√
225 + 25 +36+1 + 169 
5
 = √
456 
5
 ≅ 9,5 
Prof. Arthur Lima 
 Aula 08 
 
28 de 122| www.direcaoconcursos.com.br 
Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 
Portanto, o coeficiente de variação entre as regiões será: 
CV = 
9,5
164
 = 0,058 
Veja que a variação da média para a região II não é inferior à variação das médias entre as regiões (0,064 > 
0,058). Item incorreto. 
 
III - Em pelo menos um ano, a precipitação média no verão ficou abaixo do índice de 1,5 desvio quartílico da 
distribuição em duas regiões. 
O limite inferior é dado pela fórmula: Q1 − 1,5(Q3 − Q1). Vamos analisar os limites para cada região: 
Região 1: 142 – 1,5(152 – 142) = 127. Esse valor é inferior ao mínimo da região (138). 
Região 2: 158 – 1,5(162 – 158) = 152. Note que o mínimo dessa região é 142, portanto é inferior ao limite. 
Região 3: 170 – 1,5(174 – 170) = 164. Note que o mínimo dessa região é 157, portanto é inferior ao limite. 
Região 4: 159 – 1,5(170 – 159) = 142,5. Esse valor é inferior ao mínimo da região (148). 
Região 5: 170 – 1,5(180 – 170) = 155. Esse valor é inferior ao mínimo da região (161). 
Portanto, nas regiões 2 e 3 as precipitações médias ficaram abaixo do limite. Item correto. 
Resposta: C 
 
5. CESGRANRIO – BANCO DO BRASIL – 2018) 
Uma amostra aleatória de tamanho 5 é retirada de uma população e observa-se que seus valores, quando 
postos em ordem crescente, obedecem a uma Progressão Aritmética. Se a variância amostral não viciada vale 
40, qual é o valor da razão da Progressão Aritmética? 
(A) 3 
(B) 5√2 
(C) 4. 
(D) 2√5 
(E) 1 
RESOLUÇÃO: 
A média de 5 termos de uma PA é exatamente o termo do meio, ou seja, o 3º termo. Sendo M o valor do termo 
do meio (média), e R a razão, podemos escrever os cinco termos assim: 
M-2R, M-R, M, M+R, M+2R 
 
Para calcular a variância, podemos primeiramente subtrair M de todos os termos, ficando com: 
-2R, -R, 0, R, 2R 
Prof. Arthur Lima 
 Aula 08 
 
29 de 122| www.direcaoconcursos.com.br 
Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 
 
A soma desses valores é zero. A soma dos quadrados é: 
4R2 + R2 + 0 + R2 + 4R2 = 10R2 
 
Logo, a variância amostral é: 
𝑠2 =
𝑠𝑜𝑚𝑎 𝑑𝑜𝑠 𝑞𝑢𝑎𝑑𝑟𝑎𝑑𝑜𝑠 −
1
𝑛 .
(𝑠𝑜𝑚𝑎 𝑑𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠)2
𝑛 − 1
 
 
40 =
10𝑅2 −
1
5
. 02
5 − 1
 
40.4 = 10R2 
16 = R2 
R = 4 
Veja que eu só usei o valor positivo da raiz quadrada de 16, pois a PA é crescente. 
Resposta: C 
 
6. CESGRANRIO – BANCO DO BRASIL – 2018) 
Uma escola de Ensino Médio decide pesquisar o comportamento de seus estudantes quanto ao número de 
refrigerantes consumidos semanalmente por eles. Para isso, uma amostra aleatória de 120 estudantes foi 
selecionada, e os dados foram sintetizados no histograma abaixo, em classes do tipo [0, 5), [5, 10), [10, 15), [15, 
20), [20, 25) e [25, 30]. 
 
Qual o valor da amplitude interquartílica, obtido por meio do método de interpolação linear dos dados 
agrupados em classes? 
a) 15 
Prof. Arthur Lima 
 Aula 08 
 
30 de 122| www.direcaoconcursos.com.br 
Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 
b) 15/2 
c) 29/5 
d) 47/7 
e) 10 
RESOLUÇÃO: 
Podemos montar a tabela: 
Classe Frequência Freq. Acumulada 
0-5 35 35 
5-10 50 85 
10-15 25 110 
15-20 5 115 
20-25 3 118 
25-30 2 120 
 
O primeiro quartil está associado com a posição n/4 = 120/4 = 30. E o terceiro quartil está associado com a 
posição 3.(n/4) = 3.30 = 90. 
O primeiro quartil está na primeira classe. Montando a interpolação: 
 0 30 35 
Frequências |-------------|-------------------| 
Valores |-------------|-------------------| 
 0 Q1 5 
 
𝑄1 − 0
5 − 0
=
30 − 0
35 − 0
 
Q1 = 5.(30/35) 
Q1 = 30/7 
 
O terceiro quartil está na classe 10-15. Montando a interpolação: 
 85 90 110 
Frequências |-------------|-------------------| 
Prof. Arthur Lima 
 Aula 08 
 
31 de 122| www.direcaoconcursos.com.br 
Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 
Valores |-------------|-------------------| 
 10 Q3 15 
 
𝑄3 − 10
15 − 10
=
90 − 85
110 − 85
 
 
𝑄3 − 10
5
=
5
25
 
 
𝑄3 − 10 =
25
25
 
 
𝑄3 − 10 = 1 
 
𝑄3 = 11 
 
Logo, a amplitude interquartílica é: Q3 – Q1 = 11 – 30/7 = 77/7 – 30/7 = 47/7. 
Resposta: D 
 
7. FCC – TRT/SP – 2018) 
Seja uma população {x1, x2, x3, ... , x20} formada pela renda em unidades monetárias de 20 pessoas, sendo xi > 
0 a renda da i-ésima pessoa(1 ≤ i ≤ 20). O coeficiente de variação desta população é igual a 20%. Sabendo-se 
que (x2 − x10) = 2 com x10 > 4, subtrai-se de x10 um montante igual a 4 e acrescenta-o a x2. Após esta 
transferência, a nova variância fica igual a 
Dado: 
 
 a) 4,09 
 b) 2,49 
 c) 1,69 
 d) 4,00 
 e) 2,56 
RESOLUÇÃO: 
Prof. Arthur Lima 
 Aula 08 
 
32 de 122| www.direcaoconcursos.com.br 
Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 
Essa é uma questão mais complexa. Um primeiro passo é observar que ao subtrair 4 de X10 e acrescentar 4 a X2 
o valor da média da variável X não se altera, pois sendo a média igual à soma dos elementos dividida pelo 
número de elementos, o número de elementos permanece o mesmo, continua sendo 20, só se alteram X10 e X2, 
porém reparem que a soma de X10 e X2 continua sendo a mesma, já que X10 passa a ser igual a X10 - 4 e X2 passa 
a ser igual a X2 + 4, logo ao somar os novos valores passamos a ter X10 - 4 + X2 + 4 = X10 + X2. Assim, se a soma 
desses valores permanece a mesma e esses foram os únicos valores que sofreram alguma alteração, então a 
média também permanece a mesma após essa alteração dos dados. 
Mas queremos o valor da variância após essa alteração, e essa sim pode variar. Sendo E(X²) a média dos 
quadrados da variável X e E(X) a média da variável X, sabemos que a variância de X pode ser dada por: 
Var(X) = E(X²) – E²(X) 
O enunciado nos informa que antes da alteração dos valores de X10 e X2 o coeficiente de variação de X (CV(X)) é 
igual a 20% (0,2). Logo, sendo DP(X) o desvio padrão de X, antes da alteração dos valores de X10 e X2 temos 
que: 
𝐷𝑃(𝑋)
𝐸(𝑋)
= 𝐶𝑉(𝑋) 
Sabemos que o quadrado do desvio padrão é igual à variância, logo podemos elevar os dois lados da igualdade 
acima ao quadrado (já que estamos interessados na variância), obtendo: 
 
𝑉𝑎𝑟(𝑋)
𝐸²(𝑋)
= 𝐶𝑉²(𝑋) 
Substituindo Var(X) por E(X²) – E²(X) e CV²(X) por 0,2², temos que: 
 
E(X²) – E²(X)
𝐸²(𝑋)
= 0,2² 
Sabemos que E(X2) =
∑ 𝑋𝑖
220
𝑖=1
𝑛
 e o enunciado nos diz que ∑ 𝑋𝑖
220
𝑖=1 =878,80 e que n = 20. Logo, temos que: 
878,80
20 – E²(X)
𝐸²(𝑋)
= 0,04 
43,94 – E²(X) = 0,04 ∙ 𝐸²(𝑋) 
43,94 = 0,04 ∙ 𝐸2(𝑋) + E²(X) 
43,94 = 1,04 ∙ 𝐸2(𝑋) 
𝐸2(𝑋) =
43,94
1,04
= 42,25 
E²(X) = 42,25 é igual ao quadrado da média da variável e, conforme explicado acima, sabemos que a média não 
se alterou após a alteração nos valores de X10 e X2, mas não podemos dizer o mesmo de E(X²). Logo, precisamos 
calcular o novo valor de E(X²)=
∑ 𝑋𝑖
220
𝑖=1
20
 para finalmente calcularmos a variância após a alteração. Vamos nos 
concentrar em ∑ 𝑋𝑖
220
𝑖=1 . Reparem que antes da alteração poderíamos dizer que: 
Prof. Arthur Lima 
 Aula 08 
 
33 de 122| www.direcaoconcursos.com.br 
Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 
∑ 𝑋𝑖
2
20
𝑖=1
= ∑ 𝑋𝑖
2
20
𝑖≠2,10
+ 𝑋2
2 + 𝑋10
2 = 878,80 
Entenderam o que eu fiz? Foi um recurso visual, o somatório à direita da igualdade soma todos os quadrados 
de Xi para i diferente de 2 e de 10, ou seja, os quadrados de todos os Xi diferentes de X2 e X10, (logo temos que 
∑ 𝑋𝑖
220
𝑖≠2,10 = 𝑋1
2 + 𝑋3
2 + ⋯ + 𝑋9
2 + 𝑋11
2 + ⋯ + 𝑋20
2 ) e os quadrados de X2 e X10 vem somados em seguida, 
procedi assim porque esses valores que se alteram, precisamos trabalhar com eles separadamente para 
verificar o impacto da sua alteração na soma dos quadrados de X, já que os demais valores Xi permanecem os 
mesmos. 
O enunciado nos diz que antes da alteração, tínhamos que X2 - X10 = 2, logo antes da alteração poderíamos dizer 
que X2 = X10 + 2. Portanto, voltando à equação acima, temos que: 
∑ 𝑋𝑖
2
20
𝑖≠2,10
+ (𝑋10 + 2)² + 𝑋10
2 = 878,80 
Aplicando a regra dos produtos notáveis do quadrado da soma de 2 termos ((a + b)² = a² + 2ab + b²), temos que 
: 
∑ 𝑋𝑖
2
20
𝑖≠2,10
+ 𝑋10
2 + 4𝑋10 + 4 + 𝑋10
2 = 878,80 
∑ 𝑋𝑖
2
20
𝑖≠2,10
+ 2𝑋10
2 + 4𝑋10 = 878,80 − 4 
∑ 𝑋𝑖
2
20
𝑖≠2,10
+ 2𝑋10
2 + 4𝑋10 = 874,80 
Agora sim, vamos pensar nos novos valores de X2 e X10. Se a X2 foi acrescentado o valor 4, então seu valor passou 
a ser dado por X2’ = X10 + 2 + 4 = X10 +6. Já de X10 foi subtraído o valor 4 , logo ele passa a ser dado por X10’ = X10 – 
4. Assim, a soma dos quadrados de X após a alteração passa a ser dada por: 
∑ 𝑋𝑖
2
20
𝑖=1
= ∑ 𝑋𝑖
2
20
𝑖≠2,10
+ (𝑋10 + 6)² + (𝑋10 − 4)² 
Aplicando novamente as regras dos produtos notáveis ((a + b)² = a² + 2ab + b² e (a - b)² = a² - 2ab + b²) chegamos 
a: 
∑ 𝑋𝑖
2
20
𝑖=1
= ∑ 𝑋𝑖
2
20
𝑖≠2,10
+ 𝑋10
2 + 12𝑋10 + 36 + 𝑋10
2 − 8𝑋10 + 16 
∑ 𝑋𝑖
2
20
𝑖=1
= ∑ 𝑋𝑖
2
20
𝑖≠2,10
+ 2𝑋10
2 + 4𝑋10 + 52 
Reparem que já calculamos acima que ∑ 𝑋𝑖
220
𝑖≠2,10 + 2𝑋10
2 + 4𝑋10 = 874,80, logo temos que após a alteração a 
soma dos quadrados dos Xi passa a ser dada por : 
Prof. Arthur Lima 
 Aula 08 
 
34 de 122| www.direcaoconcursos.com.br 
Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 
∑ 𝑋𝑖
2
20
𝑖=1
= 874,80 + 52 = 926,80 
Agora sim, temos tudo que precisamos para calcular a variância de X após a alteração dos valores de X2 e X10 
(lembrando que o quadrado da média de X não se alterou e já foi calculado acima): 
Var(X) = E(X2) − E²(X) 
Var(X) =
∑ 𝑋𝑖
220
𝑖=1
𝑛
− 42,25 
Var(X) =
926,80
20
− 42,25 = 46,34 − 42,25 = 4,09 
Finalmente, temos que a alternativa A é o gabarito da questão. 
Resposta: A 
 
8. IBFC – EBSERH – 2017) 
Avalie a tabela a seguir. Três tipos de materiais são pesados diversas vezes. Assinale a alternativa correta que 
os elenque do menor para o maior quanto à menor dispersão. 
 
 a) X, Y e Z 
 b) Y, Z e X 
 c) Z, X e Y 
 d) Z, Y e X 
 e) X, Z e Y 
RESOLUÇÃO: 
Para determinar a ordem dos materiais quanto à dispersão dos pesos obtidos podemos calcular o desvio médio 
dos pesos obtidos para cada material (seria possível também calcular a variância ou o desvio padrão, todas as 
medidas são aceitáveis, pois todas medem a variabilidade dos dados com relação à média, por uma questão de 
praticidade dos cálculos, vamos optar pelo desvio médio) e ordená-los, de forma que o material com menor 
desvio médio dos pesos apresenta menor dispersão e o material com maior desvio médio dos pesos apresenta 
maior dispersão. Desvio médio é uma medida de dispersão que para cada material é representada pela soma 
Prof. Arthur Lima 
 Aula 08 
 
35 de 122| www.direcaoconcursos.com.br 
Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 
da diferença absoluta (em módulo) entre cada um dos pesos e a média dos pesos dividida pela quantidade de 
pesos obtidos. 
Assim, sejam: 
X: média dos pesos do material X 
Y: média dos pesos do material Y 
Z: média dos pesos do material Z 
DM(X): desvio médio do material X 
DM(Y): desvio médio do material Y 
DM(Z): desvio médio do material Z 
Temos que: 
X =
5,5 + 6 + 6 + 6 + 6,5
5
=
30
5
= 6 
Y =
4 + 5 + 6 + 6 + 9
5
=
30
5
= 6 
Z =
5 + 6 + 6 + 6 + 7
5
=
30
5
= 6 
DM(X) =
|5,5 − 6| + 3 ∙ |6 − 6| + |6,5 − 6|
5
=
0,5 + 0,5
5
=
1
5
= 0,2 
DM(Y) =
|4 − 6| + |5 − 6| + 2 ∙ |6 − 6| + |9 − 6|
5
=
2 + 1 + 3
5
=
6
5
= 1,2 
DM(Z) =
|5 − 6| + 3 ∙ |6 − 6| + |7 − 6|
5
=
1 + 1
5
=
2
5
= 0,4 
Assim, concluímos que DM(X) < DM(Z) < DM(Y) e, portanto, a alternativa E é o gabarito da questão. 
Resposta: E 
 
9. IBFC – EBSERH – 2017) 
Representa o desvio-padrão populacional de uma série de dados: 
 a) S 
 b) D 
 c) Var2 
 d) δ 
 e) µ 
RESOLUÇÃO: 
Prof. Arthur Lima 
 Aula 08 
 
36 de 122| www.direcaoconcursos.com.br 
Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 
O desvio padrão populacional é representado pela letra grega δ (sigma), o que nos dá a alternativa D como 
gabarito da questão. É importante tomar cuidado para não confundi-lo com o desvio-padrão amostral, que é 
representado pela letraS (alternativa A). 
Resposta: D 
 
10.IBFC – EBSERH – 2017) 
Um levantamento amostral sobre o número de filhos de 50 funcionários foi realizado em uma empresa 
localizada em um município. Esse levantamento gerou a tabela a seguir: 
 
O quartil médio do número de filhos dos funcionários da amostra é, aproximadamente: 
a) 1,50 
b) 2,00 
c) 0,00 
d) 4,00 
e) 1,85 
RESOLUÇÃO: 
O quartil médio pode ser representado pela fórmula: 
Quartil Médio =
𝑄3 + 𝑄1
2
 
Onde Q3 representa o 3º quartil e Q1 representa o 1º quartil. 
Q1 é o número de filhos do funcionário que ocupa a posição 
50+1
4
= 12,75. Ao arredondar, temos que Q1 
representa o número de filhos do funcionário que ocupa a posição 13, ou seja, Q1=0, pois os 20 primeiros 
funcionários (ao serem ordenados por número de filhos) têm 0 filhos. 
Q3 é o número de filhos do funcionário que ocupa a posição 
3∙(50+1)
4
= 38,25. Ao arredondar, temos que Q3 
representa o número de filhos do funcionário que ocupa a posição 38, ou seja, Q3=4, pois os 20 primeiros 
Prof. Arthur Lima 
 Aula 08 
 
37 de 122| www.direcaoconcursos.com.br 
Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 
funcionários (ao serem ordenados por número de filhos) têm 0 filhos, o 21º funcionário até o 25º têm 1 filho, o 
26º funcionário até o 33º têm 2 filhos, o 34º e o 35º funcionários têm 3 filhos e o 35º funcionário até o 39º têm 4 
filhos. 
Por fim, temos que: 
Quartil Médio =
4 + 0
2
= 2 
Portanto, a alternativa B é o gabarito da questão. 
Resposta: B 
 
11.IBFC – EBSERH – 2017) 
 
O valor aproximado do desvio padrão da série se encontra descrito na alternativa: 
a) 11,9 
b) 5,75 
c) 14,3 
d) 21,8 
e) 18,5 
RESOLUÇÃO: 
A fim de efetuar o cálculo do desvio padrão primeiro necessitamos calcular a média, já que ela é necessária para 
o cálculo do desvio padrão. Assim, temos: 
Média =
40 + 20 + 32 + 45 + 11 + 8 + 33
7
=
189
7
= 27 
Agora, passamos a calcular a variância, pois o desvio padrão é igual à raiz quadrada da variância. Temos que a 
variância amostral é igual à soma das diferenças entre cada uma das observações e a média delas elevadas ao 
quadrado, dividida pelo número total de observações menos um. Assim, chamando a variância de Var, temos: 
 
Var =
(40 − 27)2 + (20 − 27)2 + (32 − 27)2 + (45 − 27)2 + (11 − 27)2 + (8 − 27)2 + (33 − 27)2
7 − 1
 
 
Var =
(13)2 + (−7)2 + (5)2 + (18)2 + (−16)2 + (−19)2 + (6)2
6
 
Var =
169 + 49 + 25 + 324 + 256 + 361 + 36
6
=
1220
6
= 203,33 
Finalmente, chamando o desvio padrão de DP, temos que : 
Prof. Arthur Lima 
 Aula 08 
 
38 de 122| www.direcaoconcursos.com.br 
Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 
DP = √203,33
2
= 14,26 ≅ 14,3 
Portanto, temos que a alternativa C é o gabarito da questão. É importante ressaltar que não é necessário 
calcular com exatidão a raiz quadrada do número 203,33, é possível utilizar aproximação, pois 203,33 é um 
pouco maior que o quadrado perfeito 196 (cuja raiz quadrada é 14), e é menor que o quadrado perfeito 225 (cuja 
raiz quadrada é 15), a partir daí já podemos inferir que a raiz quadrada de 203,33 é algum número maior que 14 
e menor que 15, e saber disso já é suficiente para encontrarmos a alternativa correta. 
Resposta: C 
 
12.FUNRIO – SESAU/RO – 2017) 
Considere a seguinte amostra de idades: 
18, 15, 24, 20, 22, 21, 19, 30, 20 
A estimativa não tendenciosa usual da variância populacional é aproximadamente igual a: 
(A) 15,8. 
(B) 17,8. 
(C) 20,1. 
(D) 22,2. 
(E) 23,1. 
RESOLUÇÃO: 
A variância populacional é dada pela expressão: 
𝛿2 = 
∑ (𝑥𝑖 − 𝑥 )
21
𝑛
(𝑛−1)
 
Calculando a média dessa população, teremos: 
𝑥 = 
15 +18 + 19 + 20 + 20 + 21 + 22 + 24 + 30 
9
 
𝑥 = 
189
9
 
𝑥 = 21 
Assim, 
𝛿2= 
(15 − 21)2 + (18 − 21)2 + (19 − 21)2 + 2 𝑥 (20 − 21)2 + 02 + (22 − 21)2 + (24 − 21)2 + (30 − 21)2 
(9 − 1)
 
𝛿2= 
36 + 9 + 4 + 2 + 0 + 1 + 9 + 81 
8 
 
𝛿2=
142 
8 
 
𝛿2= 17,75 (aproximadamente 17,8) 
Resposta: B 
Prof. Arthur Lima 
 Aula 08 
 
39 de 122| www.direcaoconcursos.com.br 
Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 
13. FUNRIO – SESAU/RO – 2017) 
Considere a seguinte amostra de idades: 
18, 15, 24, 20, 22, 21, 19, 30, 20 
Suponha que se note, posteriormente, que a idade 24 está erradamente registrada, sendo na verdade igual a 
44. Nesse caso, avalie se essa substituição implica que: 
I. O valor da média amostral aumentará. 
II. O valor da mediana amostral aumentará. 
III. O valor da variância amostral aumentará. 
Assinale a alternativa correta. 
(A) apenas a afirmativa I está correta. 
(B) apenas a afirmativa II está correta. 
(C) apenas as afirmativas I e III estão corretas. 
(D) apenas as afirmativas II e III estão corretas. 
(E) as afirmativas I, II e III estão corretas. 
RESOLUÇÃO: 
Repare que os dados em ordem crescente são: 
15, 18, 19, 20, 20, 21, 22, 30, 44 
Note que, após essa mudança, a mediana continua valendo 20. 
 
Além disso, a nova média vale: 
𝑥 = 
15 +18 + 19 + 20 + 20 + 21 + 22 + 44 + 30 
9
 
𝑥 = 
209
9
 
𝑥 = 23,22 
→Veja que a média amostral aumentou. 
Vamos calcular a variância amostral: 
𝛿2= 
(15 − 21)2 + (18 − 21)2 + (19 − 21)2 + 2 𝑥 (20 − 21)2 + 02 + (22 − 21)2 + (44 − 21)2 + (30 − 21)2 
(9 − 1)
 
𝛿2= 
36 + 9 + 4 + 2 + 0 + 1 + 529 + 81 
8 
 
𝛿2=
662 
8 
 
𝛿2= 82,75 
Observe que a variância aumentou. 
Prof. Arthur Lima 
 Aula 08 
 
40 de 122| www.direcaoconcursos.com.br 
Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 
Assim, apenas os itens I e III estão corretos. 
Resposta: E 
14.FGV – MPE/BA – 2017) 
A distribuição de frequências do número de apreensões de valores (em milhões R$) realizadas pela Polícia 
Federal, em determinado período, é conforme a seguir: 
 
Assim sendo, é correto afirmar que: 
 a) o último Decil está na penúltima classe; 
 b) a mediana da distribuição está na 2ª classe; 
 c) a média da distribuição está na 3ª classe; 
 d) a moda exata da distribuição está na 1ª classe; 
 e) a distribuição é assimétrica à esquerda. 
RESOLUÇÃO: 
Vamos avaliar as alternativas: 
a) O último decil corresponde ao 9º decil, é a observação que divide os dados de forma que 90% dos dados 
sejam menores que ele e 10% sejam maiores. Vamos acrescentar a coluna da frequência acumulada na tabela 
a fim de verificar a que classe o 9º decil pertence: 
Intervalo de 
Classe 
Frequências Frequência 
Acumulada 
0 |-- 10 47 47 
10 |-- 20 29 76 
20 |-- 30 13 89 
30 |-- 40 7 96 
40 |-- 50 3 99 
Mais de 50 1 100 
Prof. Arthur Lima 
 Aula 08 
 
41 de 122| www.direcaoconcursos.com.br 
Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 
Ao observar a tabela acima, verificamos que há um total de 100 observações, portanto o 9º decil se encontra 
na classe em que a observação 90 (pois 90% de 100 observações = 90) se encontra. Da tabela, temos que até a 
terceira classe estão acumuladas 89 das observações, portanto a observação 90 (9º decil) pertence à classe 
seguinte (30 |-- 40), que é a antepenúltima classe, e não a penúltima. Portanto a alternativa A está incorreta. 
 
b) A mediana corresponde à observação de posição 100/2 = 50. Ao observar a tabela, verificamos que na 
primeira classe estão as 47 primeiras observações. E na segunda classe estão as 29 observações seguintes, 
totalizando 76 observações. Portanto, a observação 50, mediana, encontra-se na segunda classe de fato. Logo, 
concluímos que a alternativa B está correta e é o gabarito da questão. 
 Para não restar dúvidas, vamos avaliar as demais alternativas: 
c) Como os dados estão organizados em classes, a fim de calcular a média precisamos calcular o ponto médio 
de cada um dos intervalos. Assim, temos: 
Ponto Médio 
Intervalo 
Frequências 
5 47 
15 29 
25 13 
35 7 
45 3 
55 1 
A média é dada pela soma dos pontosmédios dos intervalos multiplicados pelas respectivas frequências, 
dividida pela frequência total (soma das frequências). Assim: 
Média =
5 ∙ 47 + 15 ∙ 29 + 25 ∙ 13 + 35 ∙ 7 + 45 ∙ 3 + 55 ∙ 1
47 + 29 + 13 + 7 + 3 + 1
 
Média =
235 + 435 + 325 + 245 + 135 + 55
100
=
1430
100
= 14,3 
Logo, a média pertence à 2ª classe, e não à 3ª, pois 14,3 é um valor entre 10 e 20. Assim, concluímos que a 
alternativa C também está incorreta. 
 
d) Sabemos que a classe modal (classe de maior frequência) é a 1ª classe, entretanto isso não nos permite 
afirmar que a moda exata pertença a essa classe, só a análise dos dados brutos (não organizados em classes) 
nos permitiria verificar qual a moda exata e a que classe ela pertence. Logo, a alternativa D está incorreta. 
 
Prof. Arthur Lima 
 Aula 08 
 
42 de 122| www.direcaoconcursos.com.br 
Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 
e) Ao observar a tabela, notamos claramente que há uma concentração de apreensões nas primeiras classes, 
portanto há uma concentração de valores pequenos na distribuição, o que caracteriza uma distribuição 
assimétrica à direita, e não à esquerda. Portanto, a alternativa E também está incorreta. 
Resposta: B 
 
15. FGV – MPE/BA – 2017) 
Em uma amostra desconfia-se de que três valores sejam, na verdade, “outliers” e que deveriam ser descartados. 
Para tal avaliação o estatístico dispõe apenas dos valores dos 1º e 3º quartil da distribuição. Os números são os 
seguintes: 
Q1(X) = 21, Q3(X) = 33, X1 = 58, X2 = 2 e X3 = 43 
Onde Qis são os quartis e os Xis os valores em análise. 
Assim, é correto afirmar que: 
 a) todos os valores são “outliers” ; 
 b) os valores X1 e X3 são “outliers”; 
 c) nenhum dos valores é “outliers”; 
 d) apenas o valor X2 é “outlier”; 
 e) os valores X1 e X2 são “outliers”. 
RESOLUÇÃO: 
Com os valores dos 1º e 3º quartil fornecidos pelo enunciado devemos calcular os limites inferior e superior, e 
compará-los com X1, X2 e X3. Valores menores que o limite inferior ou maiores que o limite superior são 
outliers, já valores maiores ou iguais ao limite inferior e menores ou iguais ao limite superior não são outliers. 
A fórmula para cálculo do limite inferior (LI) é: 
LI = Q1(X) – 1,5∙(Q3(X) - Q1(X)) 
LI = 21 – 1,5∙(33 – 21) = 21 - 1,5∙12 = 21 – 18 = 3 
A fórmula para cálculo do limite superior (LS) é: 
LS = Q3(X) + 1,5∙(Q3(X) - Q1(X)) 
LS = 33 + 1,5∙(33 – 21) = 33 + 18 = 51 
X1 = 58 é maior que LS = 51, portanto X1 é um outlier. 
X2 = 2 é menor que LI = 3, portanto X2 é um outlier. 
X3 = 43 é maior que LI e menor que LS, portanto X3 não é um outlier. 
Logo, temos que X1 e X2 são outliers, portanto a alternativa E é o gabarito da questão. 
Resposta: E 
Prof. Arthur Lima 
 Aula 08 
 
43 de 122| www.direcaoconcursos.com.br 
Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 
 
16.FCC – TRT/11 – 2017) 
O conjunto {X₁, X₂, X₃, ... , X₁₀ } refere-se a uma população de tamanho 10 de elementos estritamente positivos, 
em que 
Observação: log(N) é o logaritmo de N na base 10. 
Considere as seguintes afirmações com relação a esta população: 
I. O coeficiente de variação é igual a 1/7. 
II. A média geométrica é igual a raiz quadrada de 109,185. 
III. Multiplicando todos os elementos da população por 2, o coeficiente de variação da nova população formada 
não se altera. 
IV. Dividindo todos os elementos da população por 2, a variância da nova população formada é igual a 25% da 
variância anterior. 
 
Está correto o que se afirma APENAS em 
 a) I, II e III. 
 b) III e IV. 
 c) I e III. 
 d) II e IV. 
 e) I, III e IV. 
RESOLUÇÃO: 
Vamos analisar os itens: 
I) O coeficiente de variação (CV) é a razão entre o desvio padrão e a média de uma variável aleatória. Chamando 
a média de X de X̅, a variância de X de 𝜎2, e seu desvio padrão de 𝜎, temos que: 
X̅ =
∑ Xi
10
i=1
n
=
84
10
= 8,4 
σ2 =
∑ Xi
2 − n ∙ X̅210i=1
n
 
σ2 =
720 − 10 ∙ 8,42
10
 
σ2 =
720 − 705,6
10
= 1,44 
σ = √1,44 = 1,2 
Por fim, temos que: 
Prof. Arthur Lima 
 Aula 08 
 
44 de 122| www.direcaoconcursos.com.br 
Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 
CV =
σ
X̅
=
1,2
8,4
=
1
7
 
Portanto, o item I está correto. 
II) A média geométrica de X (vamos chama-la de MG), é dada por: 
 
𝑀𝐺 = √∏ 𝑋𝑖
10
𝑖=1
10
 
𝑀𝐺 = 10
∑ 𝑙𝑜𝑔𝑋𝑖
10
𝑖=1
10 
𝑀𝐺 = 10
9,185
10 = 100,9185 
Temos que 100,9185 é diferente de √109,185 e nem é necessário efetuar o cálculo exato para chegar a essa 
conclusão, pois sabemos que 100,9185 é algum número menor que 10, pois seu expoente 0,9185 é menor que 1, 
e se 10¹ é igual a 10, sabemos que 10 elevado a um valor menor que 1 resulta em um valor menor que 10. Já 
109,185 é um número maior que 100, portanto sua raiz quadrada é maior que 10 (já que a raiz quadrada de 100 
é 10). Assim, se sabemos que 100,9185 certamente é menor que 10, e que √109,185 com certeza é maior que 
10, podemos concluir que são números diferentes. Portanto, o item II está incorreto. 
 
III) Ao multiplicar todos os elementos de X por 2, temos que: 
Média(2X) = 2 ∙ Média(X) = 2 ∙ X̅ 
Variância(2X) = 22 ∙ Variância(X) = 4 ∙ σ2 
Desvio padrão(2X) = √4 ∙ σ2 = 2σ 
CV(2X) =
2σ
2X̅
=
σ
X̅
=
1
7
 
Logo, de fato o coeficiente de variação não se altera ao multiplicar todos os termos por 2, portanto o item III 
também está correto. 
 
IV) Dividindo todos os elementos da população por 2, temos que: 
Variância (
X
2
) = (
1
2
)
2
∙ Variância(X) =
1
4
∙ σ2 = 0,25σ2 
Portanto, de fato a variância da nova população é igual a 25% da variância anterior, logo o item IV também está 
correto. 
 
Por fim, apenas os itens I, III e IV estão corretos, assim a alternativa E é o gabarito da questão. 
Resposta: E 
Prof. Arthur Lima 
 Aula 08 
 
45 de 122| www.direcaoconcursos.com.br 
Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 
17. IBFC – EBSERH – 2016) 
São medidas de dispersão de dados, exceto: 
a) Amplitude total. 
b) Desvio Médio. 
c) Desvio Padrão. 
d) Amplitude Semi-Interquartílica. 
e) Mediana. 
RESOLUÇÃO: 
Apenas a mediana não é uma medida de dispersão, e sim uma medida de posição. As demais alternativas 
contém medidas de dispersão (que medem a dispersão ou variabilidade dos dados e são consideravelmente 
impactadas por valores discrepantes). Logo, concluímos que a alternativa E é o gabarito da questão. 
Resposta: E 
 
18.IBFC – EBSERH – 2016) 
 
O Coeficiente de Variação da distribuição equivale a: 
a) 0,56% 
b) 5,6% 
c) 56% 
d) 0,56. 
e) 0,056. 
RESOLUÇÃO: 
Prof. Arthur Lima 
 Aula 08 
 
46 de 122| www.direcaoconcursos.com.br 
Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 
O coeficiente de variação é a razão entre o desvio padrão e a média dos dados. A tabela já nos fornece a soma 
das observações, que é igual a 1466,13. Pela tabela também, podemos ver que o número de observações é 10. 
Portanto, temos que: 
Média =
1466,13
10
= 146,613 
O desvio padrão também nos é dado na tabela, representado por S, temos que S = 0,82 
Por fim, chamando o coeficiente de variação de CV, temos que: 
CV =
S
média
=
0,82
146,613
≅ 0,0056 = 0,56% 
Logo, a alternativa A é o gabarito da questão. 
Resposta: A 
 
19.IBFC – EBSERH – 2016) 
 
A média, a mediana e a variância da amostra equivalem a, aproximadamente e respectivamente: 
a) 146,61; 146,50; 0,82. 
b) 146,61; 146,50; 0,67. 
c) 146,61; 146,46; 0,82. 
d) 1.466,13; 146,50; 0,67. 
e) 1.466,13; 146,50; 0,82. 
RESOLUÇÃO: 
Já calculamos a média na questão anterior, logo já temos que a média é igual a 146,13. 
Prof. Arthur Lima 
 Aula 08 
 
47 de 122| www.direcaoconcursos.com.br 
Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 
A variância é o quadrado do desvio padrão e o desvio padrão S já nos édado na tabela (S = 0,82). Assim, 
chamando a variância de S2, temos que: 
S2 = 0,822 ≅ 0,67 
A partir dos valores obtidos para a média e a variância já é possível concluir que a alternativa B é o gabarito da 
questão, pois é a única que apresenta os valores corretos para ambas. Ainda assim, para não restar dúvidas 
vamos calcular a mediana. Ao observar os dados, notamos que eles não estão ordenados, portanto um primeiro 
passo para o cálculo da mediana é ordená-los do menor para o maior número, obtendo: 
1 2 3 4 5 6 7 8 9 10 
145,52 145,54 146,21 146,28 146,47 146,53 146,64 147,37 147,57 148,00 
 Como o conjunto de dados tem 10 observações e 10 é um número par, temos que a mediana é média das 
observações que ocupam as posições 5 (
10
2
) = 146,47 e 6 (
10
2
+ 1) = 146,53 dos dados ordenados. 
Portanto, temos que: 
Mediana =
146,47 + 146,53
2
=
293
2
= 146,5 
O que confirma que, conforme já havíamos concluído, a alternativa B é de fato o gabarito da questão. 
Resposta: B 
 
20.IBFC – EBSERH – 2016) 
 
Se R$ 20,00 fossem adicionados a todos os valores da distribuição, o valor da media e o desvio-padrão da 
distribuição seriam alterados em : 
a) R$ 2,00; R$ 0,00. 
b) R$ 20,00; R$ 0,00. 
Prof. Arthur Lima 
 Aula 08 
 
48 de 122| www.direcaoconcursos.com.br 
Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 
c) R$ 0,00; R$ 20,00. 
d) R$ 166,00; R$ 20,00. 
e) R$ 0,20; R$ 10,00. 
RESOLUÇÃO: 
Seja X uma variável aleatória e a uma constante. Por uma propriedade da média (ou esperança), temos que: 
média(X+a) = média(X)+a 
Assim, para a = 20, temos: 
média(X+20) = média(X)+20 
Logo, podemos concluir que se R$ 20,00 fossem adicionados a todos os valores da distribuição, o valor da média 
aumentaria em R$20,00. 
Há também uma propriedade da variância que nos diz que, sendo X uma variável aleatória e a uma constante: 
Variância(X+a) = Variância(X) 
Ou seja, a variância de uma variável aleatória (e consequentemente seu desvio-padrão também, já que o desvio 
padrão é igual à raiz quadrada da variância) não é alterada se for somada uma constante a cada um dos valores 
de um conjunto de dados. Portanto, podemos concluir que o desvio-padrão não se alteraria (que é o mesmo 
que ser alterado em R$0,00) se R$ 20,00 fossem adicionados a todos os valores da distribuição, e assim temos 
que a alternativa B é o gabarito da questão. 
Resposta: B 
21.VUNESP – 2016) 
Na estatística, são considerados medidas de dispersão: 
 a) média e moda. 
 b) percentil e coeficiente de variação. 
 c) amplitude total e percentil. 
 d) amplitude total e desvio padrão. 
 e) variância e média. 
RESOLUÇÃO: 
Vamos analisar as alternativas: 
A alternativa A está incorreta, pois média e moda são medidas de posição, e não de dispersão. 
As alternativas B e C também estão incorretas, pois percentil é uma medida separatriz, e não de dispersão. 
A alternativa D está correta, pois amplitude total (diferença entre a maior e a menor observação de um conjunto 
de dados) e desvio padrão de fato são medidas de dispersão. 
A alternativa E está incorreta porque, conforme já mencionado, média é uma medida de posição, e não de 
dispersão. 
Prof. Arthur Lima 
 Aula 08 
 
49 de 122| www.direcaoconcursos.com.br 
Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 
Portanto, concluímos que a alternativa D é o gabarito da questão. 
Resposta: D 
22.IBFC – EBSERH – 2015) 
Dentre os dados brutos em cada item, o que possui maior desvio padrão é: 
a) 2,2,2,2,2,2,2,2 
b) 1,1,2,2,3,3,4,4 
c) 1,1,1,1,4,4,4,4 
d) 1,2,2,2,2,2,2,4 
e) 1,1,1,2,3,4,4,4 
RESOLUÇÃO: 
De cara já podemos eliminar a alternativa A, pois todos seus elementos são iguais a 2 e portanto o desvio-
padrão é zero. 
A alternativa D também certamente não é a que possui maior desvio, pois 6 de seus 8 elementos são iguais a 2, 
e os outros 2 elementos são 1 e 4 (que são elementos presentes nas demais séries de dados, exceto a da 
alternativa A), logo ela claramente é a série que apresenta menor desvio padrão depois da série da alternativa 
A. 
Resta então verificarmos as alternativas B, C e E. Como todas as séries tem o mesmo número de elementos (8) 
e a questão não nos pede o valor exato do desvio padrão, mas sim uma comparação entre os desvios, é possível 
simplificar os cálculos a fim de economizar tempo (que é fundamental na hora da prova). É válido, por exemplo, 
para cada série calcular a soma dos desvios absolutos (diferença absoluta) entre os elementos e a média da 
série, e comparar tal soma para cada uma das séries, a que obtiver maior soma de desvios absolutos possui 
consequentemente maior desvio padrão. E nem é necessário dividir tal soma de desvios absolutos pelo número 
de elementos da série a fim de compará-las, já que todas tem o mesmo número de elementos. 
Assim, para a série da alternativa B, temos a seguinte média: 
 
MédiaB =
1 + 1 + 2 + 2 + 3 + 3 + 4 + 4
8
=
20
8
= 2,5 
Soma desvios abolutosB = 2 ∙ (|1 − 2,5| + |2 − 2,5| + |3 − 2,5| + |4 − 2,5|) 
Soma desvios abolutosB = 2 ∙ (1,5 + 0,5 + 0,5 + 1,5) = 2 ∙ 4 = 8 
Já para a alternativa C, temos: 
MédiaC =
1 + 1 + 1 + 1 + 4 + 4 + 4 + 4
8
=
20
8
= 2,5 
Soma desvios abolutosC = 4 ∙ (|1 − 2,5| + |4 − 2,5|) 
Soma desvios abolutosC = 4 ∙ (1,5 + 1,5) = 4 ∙ 3 = 12 
Por fim, para a alternativa E, temos que: 
Prof. Arthur Lima 
 Aula 08 
 
50 de 122| www.direcaoconcursos.com.br 
Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 
MédiaE =
1 + 1 + 1 + 2 + 3 + 4 + 4 + 4
8
=
20
8
= 2,5 
Soma desvios abolutosE = 3 ∙ (|1 − 2,5| + |4 − 2,5|) + |2 − 2,5| + |3 − 2,5| 
Soma desvios abolutosE = 3 ∙ (1,5 + 1,5) + 0,5 + 0,5 = 9 + 1 = 10 
Portanto, a série de dados da alternativa C possui maior soma de desvios absolutos e consequentemente possui 
maior desvio padrão também, e por isso é o gabarito da questão. 
Resposta: C 
23.VUNESP – TJ/SP – 2015) 
Utilize o texto e as tabelas para responder à questão. Duas amostras de 8 pessoas foram escolhidas em duas 
escolas, A e B, para a realização de um estudo sobre a obesidade entre adolescentes. As 16 pessoas foram 
pesadas, e o resultado está expresso nas tabelas a seguir: 
 Escola A Escola B 
 Pessoas Massa (kg) Pessoas Massa (kg) 
 1 62 1 73 
 2 63 2 66 
 3 65 3 70 
 4 60 4 71 
 5 64 5 72 
 6 63 6 71 
 7 66 7 72 
 8 61 8 73 
A soma das variâncias obtidas em cada um dos grupos é igual a 
 a) 7. 
 b) 9. 
 c) 8. 
 d) 6. 
 e) 10. 
RESOLUÇÃO: 
Precisamos calcular a variância dos pesos dos alunos de ambas as escolas e somá-las. A variância é dada pela 
soma do quadrado das diferenças entre os pesos e a média dos pesos, dividida pelo número de alunos. Na 
questão anterior já calculamos o peso médio dos 8 alunos da escola A (63 kg) e dos 8 alunos da escola B (71 kg). 
Agora, vamos calcular a variância dos pesos da escola A e a variância dos pesos da escola B: 
Prof. Arthur Lima 
 Aula 08 
 
51 de 122| www.direcaoconcursos.com.br 
Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 
Variância A 
=
(62 − 63)² + (63 − 63)² + (65 − 63)² + (60 − 63)² + (64 − 63)² + (63 − 63)² + (66 − 63)² + (61 − 63)²
8
 
 
Variância A =
(−1)² + 0² + 2² +

Outros materiais