Prévia do material em texto
Índice
..............................................................................................................................................................................................1) Apresentação do Curso 3
..............................................................................................................................................................................................2) Aviso 4
..............................................................................................................................................................................................3) Introdução à estatística 5
..............................................................................................................................................................................................4) Noções Iniciais sobre Estatística 7
..............................................................................................................................................................................................5) Método Experimental x Método Estatístico 11
..............................................................................................................................................................................................6) Dados Estatísticos 12
..............................................................................................................................................................................................7) Variáveis Estatísticas 14
..............................................................................................................................................................................................8) Séries Estatísticas 19
..............................................................................................................................................................................................9) Distribuição de Frequências 24
..............................................................................................................................................................................................10) Representação Gráfica das Distribuições de Frequências 42
..............................................................................................................................................................................................11) Outros Gráficos e Representações 55
..............................................................................................................................................................................................12) Questões Comentadas - Introdução à Estatística - Multibancas 78
..............................................................................................................................................................................................13) Questões Comentadas - Conceitos Iniciais - Multibancas 79
..............................................................................................................................................................................................14) Questões Comentadas - Variáveis Estatísticas - Multibancas 84
..............................................................................................................................................................................................15) Questões Comentadas - Séries Estatísticas - Multibancas 102
..............................................................................................................................................................................................16) Questões Comentadas - Distribuições de Frequência - Multibancas 104
..............................................................................................................................................................................................17) Questões Comentadas - Representação Gráfica das Distribuições de Frequências - Multibancas 144
..............................................................................................................................................................................................18) Questões Comentadas - Outros Gráficos e Representações - Multibancas 152
..............................................................................................................................................................................................19) Lista de Questões - Introdução à Estatística - Multibancas 186
..............................................................................................................................................................................................20) Lista de Questões - Conceitos Iniciais - Multibancas 188
..............................................................................................................................................................................................21) Lista de Questões - Variáveis Estatísticas - Multibancas 191
..............................................................................................................................................................................................22) Lista de Questões - Séries Estatísticas - Multibancas 201
..............................................................................................................................................................................................23) Lista de Questões - Distribuições de Frequência - Multibancas 203
..............................................................................................................................................................................................24) Lista de Questões - Representação Gráfica das Distribuições de Frequências - Multibancas 224
..............................................................................................................................................................................................25) Lista de Questões - Outros Gráficos e Representações - Multibancas 230
APRESENTAÇÃO DO CURSO
Olá, pessoal! Tudo bem?
É com grande satisfação damos início ao nosso curso de Estatística!
Os professores Luana Brandão e Djefferson Maranhão ficarão responsáveis pela elaboração do Livro
Digital.
Antes de continuarmos, vamos apresentar os professores do material escrito:
Luana Brandão: Oi, pessoal! O meu nome é Luana Brandão e sou professora de Estatística do Estratégia
Concursos. Sou Graduada, Mestre e Doutora em Engenharia de Produção, pela Universidade Federal
Fluminense. Passei nos concursos de Auditor Fiscal (2009/2010) e Analista Tributário (2009) da Receita Federal
e de Auditor Fiscal do Estado do Rio de Janeiro (2010). Sou Auditora Fiscal do Estado do RJ desde 2010. Vamos
juntos nesse caminho até a aprovação? @professoraluanabrandao
Djefferson Maranhão: Olá, caros alunos! Meu nome é Djefferson Maranhão, sou professor de
Estatística do Estratégia Concursos. Graduado e Mestre em Ciência da Computação pela Universidade Federal
do Maranhão (UFMA). Desde 2015, sou Auditor da Controladoria Geral do Estado do Maranhão (2015 - 5º
lugar). Também exerci os cargos de Analista de Sistemas na UFMA (2010 - 1º lugar) e no TJ-MA (2011 - 1º
lugar). Sinto-me honrado em fazer parte de sua jornada rumo à aprovação.
O material escrito em PDF está sendo construído para ser sua fonte autossuficiente de estudos. Isso
significa que o livro digital será completo e voltado para o seu edital, justamente para que você não perca o
seu precioso tempo procurando o conteúdo que será cobrado na sua prova. Ademais, sempre que
necessário, você poderá fazer perguntas sobre as aulas no fórum de dúvidas. Bons estudos!
AVISO IMPORTANTE!
Olá, Alunos (as)!
Passando para informá-los a respeito da disposição das questões dentro do nosso material didático.
Informamos que a escolha das bancas,dentro dos nossos Livros Digitais, é feita de maneira estratégica
e pedagógica pelos nossos professores a fim de proporcionar a melhor didática e o melhor
direcionamento daquilo que mais se aproxima do formato de cobrança da banca do seu concurso.
Assim, o formato de questões divididas por tópico facilitará o seu processo de estudo, deixando mais
alinhado às disposições constantes no edital.
No mais, continuaremos à disposição de todos no Fórum de dúvidas!
Atenciosamente,
Equipe Exatas
Estratégia Concursos
INTRODUÇÃO À ESTATÍSTICA
A origem da estatística remonta às civilizações antigas, em que vários povos coletavam e registravam dados
populacionais e econômicos de interesse do Estado. Nessa época, também eram realizadas estimativas das
riquezas individuais e familiares, as quais eram utilizadas para determinar o montante de impostos a serem
pagos pela população.
O termo estatística se originou da palavra status, que significa Estado em latim. O termo era utilizado para
designar um conjunto de dados, relativos aos Estados, que os governantes utilizavam com a finalidade de
controle fiscal e segurança nacional. O primeiro a utilizar a palavra foi Schmeitzel, ainda no século XVII, em
latim. Depois, foi adotada pelo acadêmico alemão Godofredo Achenwall.
A Estatística pode ser definida como a ciência que estuda os processos de coleta, organização, análise e
interpretação de dados numéricos variáveis referentes a qualquer fenômeno. Ou ainda, podemos
conceituá-la como um conjunto de técnicas de coleta, organização, análise e interpretação de dados,
aplicáveis a várias áreas do conhecimento, que auxiliam no processo de tomada de decisão.
Os avanços computacionais tornaram a Estatística mais acessível e permitiram aplicações mais sofisticadas
em diferentes áreas do conhecimento. Nesse cenário, os softwares estatísticos passaram a disponibilizar
ferramentas antes inimagináveis, voltadas para planejamento de experimentos, teste de hipóteses, cálculos
de confiabilidade, criação de gráficos complexos e elaboração de modelos preditivos.
A Estatística pode ser dividida em três grandes ramos: Estatística Descritiva (ou dedutiva), Estatística
Probabilística e Estatística Inferencial (ou indutiva). Alguns autores, porém, consideram a Estatística
Probabilística como parte da Estatística Inferencial.
A Estatística Descritiva (ou Dedutiva) é responsável pela coleta, organização, descrição e resumo dos dados
observados. A partir de um determinado conjunto de dados, a Estatística Descritiva busca organizá-los em
tabelas (ou gráficos) e estabelecer um sumário por meio de medidas descritivas como a média, os valores
mínimo e máximo, o desvio padrão, entre outras.
A Estatística Probabilística é responsável por estabelecer o modelo matemático probabilístico adotado
para explicar os fenômenos aleatórios investigados pela Estatística. Os resultados desses fenômenos
aleatórios podem variar de uma observação para outra, o que dificulta muito a previsão de um resultado
futuro. Por isso, a Teoria da Probabilidade é usada para medir a chance de ocorrência de determinados
eventos.
A Estatística Inferencial (ou Indutiva) é responsável pela análise e interpretação dos dados. A partir da
análise de dados de uma amostra, a Estatística Indutiva estabelece inferências e previsões sobre a população,
auxiliando na tomada decisões. Além disso, busca generalizar conclusões a respeito da população a partir de
uma amostra, analisando a representatividade, a significância e a confiabilidade dos resultados obtidos.
jeffs
Destacar
jeffs
Destacar
(VUNESP/Câmara Municipal de São Carlos/2013) Trata-se da estatística que tem as atribuições de
obtenção, organização, redução e representação de dados estatísticos, bem como a obtenção de algumas
informações que auxiliam na descrição de um fenômeno observado. Esta estatística é denominada
a) Coletora.
b) Celetista.
c) Populacional.
d) Amostral.
e) Descritiva.
Comentários:
A Estatística está dividida em três grandes ramos, a saber:
a) Estatística Descritiva (ou Dedutiva) - responsável pela coleta (ou obtenção), organização, redução e
representação de dados estatísticos;
b) Estatística Probabilística - responsável por estabelecer o modelo matemático probabilístico adotado para
explicar os fenômenos aleatórios investigados pela Estatística; e
c) Estatística Inferencial (ou Indutiva) - responsável pela análise e interpretação dos dados.
Portanto, a alternativa correta é a letra E.
Gabarito: E.
É responsável pela coleta,
organização, descrição e resumo dos
dados observados.
É responsável pela análise e
interpretação dos dados.
É responsável por estabelecer o
modelo matemático adotado para
explicar fenômenos aleatórios.
jeffs
Destacar
CONCEITOS INICIAIS
Neste tópico, apresentaremos alguns conceitos iniciais da estatística que costumam ser abordados em
provas de concursos públicos, dentre os quais podemos citar: população, amostra, censo, amostragem,
parâmetros e estatísticas.
População
Uma POPULAÇÃO é um conjunto que contém TODOS OS INDIVÍDUOS, OBJETOS OU ELEMENTOS a serem
estudados, que apresentam uma ou mais características em comum. A população pode ser finita, quando
apresenta um número pequeno ou limitado de observações; ou infinita, quando apresenta um número muito
grande ou ilimitado de observações.
Amostra
Uma AMOSTRA é um SUBCONJUNTO EXTRAÍDO DA POPULAÇÃO para análise, devendo ser representativo
daquele grupo. A partir das informações colhidas da amostra, os resultados obtidos podem ser utilizados
para generalizar, inferir ou tirar conclusões acerca da população. Como exemplo, podemos citar as pesquisas
eleitorais, em que uma amostra de eleitores deve ser extraída de acordo com a proporcionalidade de gênero,
idade, grau de instrução e classe social.
Censo
O CENSO, ou recenseamento, é um estudo dos dados relativos a TODOS os elementos de uma população.
O censo pode custar muito caro e demandar um tempo considerável, de forma que um estudo considerando
apenas uma parcela da população pode ser uma alternativa mais simples, rápida e menos onerosa. Como
exemplos, podemos citar a pesquisa sobre o grau de escolaridade dos habitantes brasileiros, o estudo sobre
a renda dos brasileiros e a pesquisa de emprego.
Amostragem
A AMOSTRAGEM é um processo que consiste na SELEÇÃO CRITERIOSA dos elementos a serem submetidos
à investigação. Se forem cometidos erros no processo de seleção da amostra, muito provavelmente, o
estudo ficará comprometido e os resultados serão tendenciosos. Portanto, devemos garantir que a amostra
seja representativa da população. Isso significa que, com exceção de pequenas discrepâncias inerentes à
jeffs
Destacar
jeffs
Destacar
jeffs
Destacar
jeffs
Destacar
aleatoriedade existente no processo de amostragem, uma amostra deve possuir as mesmas características
básicas da população, no que diz respeito às variáveis que desejamos pesquisar.
Parâmetros
Os PARÂMETROS são DESCRIÇÕES NUMÉRICAS de CARACTERÍSTICAS POPULACIONAIS que raramente são
conhecidas. Em geral, é muito caro ou demorado obter os dados da população inteira. Assim, algumas
medidas precisam ser estimadas a partir de critérios ou métodos definidos pelo pesquisador, para
representar características desconhecidas de uma população (por exemplo, a proporção de homens e
mulheres na população brasileira). Normalmente, os parâmetros populacionais são constantes para uma
população.
Estatística (ou estimador)
As ESTATÍSTICAS são MEDIDAS NUMÉRICAS OBTIDAS DE AMOSTRAS representativas extraídas da
população. A partir das informações colhidas da amostra, as estatísticas amostrais obtidas podem ser
utilizadas para inferir ou tirar conclusões acerca dos parâmetros populacionais, como a proporção de
homens e mulheres na população brasileira. De forma resumida, as estatísticas (ou estimadores) são
descrições numéricasde características amostrais. Normalmente, as estatísticas amostrais diferem de uma
amostra para outra.
jeffs
Destacar
jeffs
Destacar
(VUNESP/Pref. Valinhos/2019) O grupo completo de unidades elementares de pessoas, objetos ou coisas
é denominado, para a estatística, de
a) Amostra.
b) Unidades.
c) Censo.
d) População.
e) Variáveis.
Comentários:
Para resolvermos a questão vamos conceituar cada uma das alternativas:
CONJUNTO de TODOS os elementos a
serem estudados, que apresentam uma
ou mais características em comum.
ESTUDO dos dados relativos a TODOS os
ELEMENTOS de uma população.
PROCESSO que consiste na seleção
criteriosa dos elementos a serem
submetidos à investigação.
SUBCONJUNTO extraído DA POPULAÇÃO
para análise, devendo ser representativo
daquele grupo
Medidas numéricas extraídas de
AMOSTRAS representativas extraídas da
população.
Descrições numéricas de características
da POPULAÇÃO, que normalmente
precisam ser estimadas.
jeffs
Destacar
• Letra A: amostra é um subconjunto de uma população. Os dados coletados e/ou selecionados de uma
população estatística por um procedimento definido, denotado de amostragem.
• Letra B: unidades são elementos da amostra (unidades amostrais) ou da população (unidade
populacional).
• Letra C: censo consiste na análise de todos os elementos da população.
• Letra D: população é o grupo completo de unidades elementares de pessoas, objetos ou coisas, ou
seja, constitui todo o universo de informações de que se necessita.
• Letra E: variável é a característica de relevância que é medida em cada componente da amostra ou
população. As variáveis podem ter valores numéricos (variáveis quantitativas) ou não numéricos (variáveis
qualitativas).
Gabarito: D.
(CESPE/DEPEN/2015) O diretor de um sistema penitenciário, com o propósito de estimar o percentual de
detentos que possuem filhos, entregou a um analista um cadastro com os nomes de 500 detentos da
instituição para que esse profissional realizasse entrevistas com os indivíduos selecionados.
A partir dessa situação hipotética e dos múltiplos aspectos a ela relacionados, julgue o item, referente a
técnicas de amostragem.
A diferença entre um censo e uma amostra consiste no fato de esta última exigir a realização de um número
maior de entrevistas.
Comentários:
Um censo é a análise de todos os elementos de determinada população. Trabalhamos com uma amostra
quando obtemos informações de apenas uma parte dessa população. Portanto, o censo requer a realização
de um número maior de entrevistas.
Gabarito: Errado.
1
MÉTODO EXPERIMENTAL X MÉTODO ESTATÍSTICO
Para a investigação de um fenômeno, temos a nossa disposição dois métodos: experimental e estatístico.
De forma resumida, o MÉTODO EXPERIMENTAL consiste em manter constantes as causas (fatores), com
exceção de uma, que é variada para que seus efeitos sejam descobertos. Contudo, nem sempre poderemos
aplicar o método experimental, pois os fatores que afetam um fenômeno podem não permanecer constantes
enquanto variamos a causa que nos interessa.
Por exemplo, para analisarmos uma queda nas vendas de uma empresa nacional que produz chocolates
finos, teríamos que considerar vários fatores que não necessariamente permanecerão constantes durante
toda a investigação do fenômeno, tais como a região, o fluxo de turistas na localidade; a temperatura média;
o preço do concorrente; o mês de férias; etc.
Assim, diante da impossibilidade de manter as causas ou fatores constantes, o MÉTODO ESTATÍSTICO
admite e registra todas as possíveis variações das causas presentes, procurando determinar a influência
de cada fator no resultado final. Dessa forma, o método estatístico busca descobrir relações entre os fatores,
como, por exemplo, a influência da temperatura média e do fluxo de turistas na venda de chocolates finos.
As CAUSAS são mantidas CONSTANTES,
COM EXCEÇÃO DE UMA, que é VARIADA
para que seus efeitos sejam descobertos.
Admite e REGISTRA TODAS AS POSSÍVEIS
VARIAÇÕES DAS CAUSAS PRESENTES,
procurando determinar a influência de
cada fator no resultado.
jeffs
Destacar
jeffs
Destacar
jeffs
Destacar
DADOS ESTATÍSTICOS
Os dados estatísticos constituem os valores resultantes da coleta de dados. Os dados referem-se a um
conjunto de valores, os quais são organizados por meio de variáveis (a característica está sendo medida) e
observações (elementos da amostra/população). É o caso, por exemplo, dos valores obtidos na pesquisa de
peso, altura, idade e sexo de uma determinada amostra de indivíduos/população.
Com relação ao número de observações coletadas, os dados são classificados em univariados, bivariados ou
multivariados:
a) dados univariados: quando uma única observação de cada indivíduo é registrada. Por exemplo: peso;
b) dados bivariados: quando duas observações de cada indivíduo são registradas. Por exemplo: peso e
altura;
c) dados multivariados: quando mais duas observações acerca de cada indivíduo são registradas. Por
exemplo: peso, altura, sexo e idade.
Quanto à forma de apresentação, os dados podem ser classificados em dados brutos ou rol.
Dados Brutos
Os dados brutos são aqueles que não foram numericamente organizados em ordem crescente ou
decrescente, ou seja, estão na forma como foram coletados. Como exemplo de dados brutos, podemos citar
uma relação dos tempos médios de estudo diário, em minutos, de 50 alunos do Estratégia, em que a seleção
dos alunos ocorreu de forma aleatória, não havendo qualquer ordenação de valores.
Aluno Tempo Aluno Tempo Aluno Tempo Aluno Tempo Aluno Tempo
1 143 11 113 21 170 31 124 41 105
2 142 12 143 22 158 32 137 42 154
3 161 13 159 23 123 33 153 43 99
4 126 14 168 24 96 34 129 44 114
5 134 15 123 25 98 35 148 45 161
6 137 16 135 26 135 36 173 46 128
7 171 17 135 27 129 37 126 47 175
8 85 18 175 28 126 38 104 48 137
9 155 19 115 29 103 39 157 49 165
10 171 20 89 30 171 40 127 50 115
Esse tipo de tabela, em que os elementos não aparecem numericamente ordenados, é denominada de
tabela primitiva. A tabela primitiva, em geral, oferece pouca ou nenhuma informação ao leitor, sendo
necessário haver uma organização dos dados, a fim de torná-los mais expressivos.
jeffs
Destacar
jeffs
Destacar
jeffs
Destacar
jeffs
Destacar
Rol
O rol é a organização dos dados brutos em ordem de grandeza crescente ou decrescente. Com os dados
organizados em rol, podemos saber, com facilidade, qual o menor e o maior elemento de um conjunto de
dados. Os dados do nosso exemplo, isto é, os tempos médios de estudo diário, podem ser organizados em
ordem crescente ou decrescente:
Rol (em ordem crescente)
85 115 129 143 161
89 115 129 143 165
96 123 134 148 168
98 123 135 153 170
99 124 135 154 171
103 126 135 155 171
104 126 137 157 171
105 126 137 158 173
113 127 137 159 175
114 128 142 161 175
Rol (em ordem decrescente)
175 161 142 128 114
175 159 137 127 113
173 158 137 126 105
171 157 137 126 104
171 155 135 126 103
171 154 135 124 99
170 153 135 123 98
168 148 134 123 96
165 143 129 115 89
161 143 129 115 85
Dados
Rol
Brutos
Os valores não são organizados por ordem de grandeza
crescente ou decrescente.
Fornece poucas informações úteis ao leitor (tabela
primitiva).
Os valores são organizados por ordem de grandeza em
crescente ou decrescente.
Facilita a identificação dos valores máximo e mínimo.
jeffs
Destacar
VARIÁVEIS ESTATÍSTICAS
A variável estatística consiste no conjunto de características que desejamos averiguar estatisticamente.
Ela também pode ser definida como o objeto da pesquisa estatística. Por exemplo, se nosso interesse é
conhecer quantas horas os alunos do Estratégia estudam diariamente, então nossa variável é o número de
horas estudadas por dia. As variáveis estatísticas podem ser classificadas, inicialmente, em duas categorias:qualitativas e quantitativas.
Variáveis Qualitativas
As variáveis qualitativas são as características que não podem ser descritas de forma numérica, mas que
podem ser definidas por meio de qualidades (atributos ou categorias) do indivíduo pesquisado. Elas podem
ser classificadas em nominais ou ordinais:
a) variável qualitativa nominal (ou categórica), as possíveis categorias não podem ser ordenadas. Por
exemplo, a cor dos olhos dos moradores de uma determinada cidade (pretos, castanhos, azuis e verdes);
b) variável qualitativa ordinal, as possíveis categorias podem ser ordenadas de alguma forma. Por
exemplo, o grau de instrução dos funcionários de um determinado órgão (fundamental, médio, superior).
Variáveis Quantitativas
As variáveis quantitativas são características que podem ser descritas em termos de quantidades (valores
numéricos), obtidas por meio de contagem ou mensuração. Elas podem ser classificadas em discretas e
contínuas:
a) variáveis quantitativas discretas, os possíveis valores formam um conjunto finito ou enumerável de
números e, geralmente, resultam de um processo de contagem. O número de ocorrências da
característica em análise pode ser contado. Por exemplo, o número de leitos abertos em hospitais de uma
determinada cidade;
b) variáveis quantitativas contínuas, os possíveis valores formam um intervalo de números reais e,
normalmente, resultam de um processo de mensuração. A característica pode ser medida em uma escala
contínua, a qual podem ser associados um número infinito de possíveis valores, de modo a não haver
lacunas ou interrupções. Por exemplo, a altura dos moradores de uma determinada cidade.
jeffs
Destacar
jeffs
Destacar
jeffs
Destacar
Variáveis
Qualitativas
Quantitativas
Ordinais
Nominais
Discretas
Contínuas
Os resultados obtidos não podem ser
ordenados/hierarquizados.
Ex: cor dos olhos; esporte praticado.
Os resultados obtidos podem ser
ordenados/hierarquizados.
Ex: nível de escolaridade.
Os possíveis valores formam um conjunto finito ou
enumerável; resultam de contagem.
Ex: número de leitos por cidade; idade.
Os possíveis valores formam um intervalo de números
reais; resultam de mensuração.
Ex: peso; altura.
jeffs
Destacar
(VUNESP/CM São Joaquim Barra/2018) A Estatística descritiva faz uso de variáveis, que são classificadas
como quantitativas ou qualitativas. Assinale a alternativa correta em relação a essas variáveis.
a) Quantitativas referem-se às variáveis ordinal ou discreta; as qualitativas referem-se às variáveis nominal
ou contínua.
b) Quantitativas referem-se às variáveis ordinal ou contínua; as qualitativas referem-se às variáveis nominal
ou discreta.
c) Quantitativas referem-se às variáveis nominal ou contínua; as qualitativas referem-se às variáveis discreta
ou ordinal.
d) Quantitativas referem-se às variáveis contínua ou discreta; as qualitativas referem-se às variáveis nominal
ou ordinal.
e) Quantitativas referem-se às variáveis nominal ou ordinal; as qualitativas referem-se às variáveis contínua
ou discreta.
Comentários:
As variáveis podem ser classificadas em:
a) variáveis quantitativas: são as características que podem ser medidas em uma escala quantitativa,
isto é, numérica. Elas podem ser contínuas ou discretas.
b) variáveis qualitativas (ou categóricas): são as características que não possuem valores
quantitativos. Nesse caso, são definidas por várias categorias, ou seja, representam uma classificação dos
indivíduos. Elas podem ser nominais ou ordinais.
Gabarito: D.
(CESPE/TCE-PA/2016)
Um indicador de desempenho X permite avaliar a qualidade dos processos de governança de instituições
públicas. A figura mostra, esquematicamente, a sua distribuição, obtida mediante estudo amostral feito
por determinada agência de pesquisa. A tabela apresenta estatísticas descritivas referentes a essa
distribuição.
Com base nessas informações, julgue o item a seguir.
X representa uma variável qualitativa ordinal.
Comentários:
As variáveis podem ser classificadas em:
a) variáveis quantitativas: são as características que podem ser representadas numericamente, isto é, podem
ser medidas em uma escala quantitativa, podendo ser contínuas ou discretas.
b) variáveis qualitativas (ou categóricas): são as características que não podem ser expressas
numericamente, ou seja, não possuem valores quantitativos. Elas são definidas por categorias que
classificam os indivíduos, podendo ser nominais ou ordinais.
Analisando as informações dadas na questão, percebemos que X pode adotar valores que vão de 0 (mínimo)
a 3,10 (máximo). Logo, como X assume valores numéricos, dizemos que ela é uma variável quantitativa.
Gabarito: Errado.
(CESPE/TELEBRAS/2015)
Uma empresa coletou e armazenou em um banco de dados diversas informações sobre seus clientes, entre
as quais estavam o valor da última fatura vencida e o pagamento ou não dessa fatura. Analisando essas
informações, a empresa concluiu que 15% de seus clientes estavam inadimplentes. A empresa recolheu
ainda dados como a unidade da Federação (UF) e o CEP da localidade em que estão os clientes. Do conjunto
de todos os clientes, uma amostra aleatória simples constituída por 2.175 indivíduos prestou também
informações sobre sua renda domiciliar mensal, o que gerou o histograma apresentado. Com base nessas
informações e no histograma, julgue o item a seguir.
O CEP da localidade dos clientes e o valor da última fatura vencida são variáveis quantitativas.
Comentários:
O CEP, embora possua uma representação numérica, não exprime quantidades e, portanto, não é uma
variável quantitativa. Esse código número apenas qualifica as ruas de um determinado endereço, podendo
ser classificada como uma variável qualitativa.
O valor da última fatura vencida, por sua vez, é sim uma variável quantitativa.
Gabarito: Errado.
(CESPE/TELEBRAS/2015) Roberto comprou, por R$ 2.800,00, rodas de liga leve para seu carro, e, ao
estacionar no shopping, ficou indeciso sobre onde deixar o carro, pois, caso o coloque no estacionamento
público, correrá o risco de lhe roubarem as rodas, ao passo que, caso o coloque no estacionamento
privado, terá de pagar R$ 70,00, com a garantia de que eventuais prejuízos serão ressarcidos pela empresa
administradora.
Considerando que p seja a probabilidade de as rodas serem roubadas no estacionamento público, que X
seja a variável aleatória que representa o prejuízo, em reais, ao deixar o carro no estacionamento público,
e que Y seja a variável aleatória que representa o valor, em reais, desembolsado por Roberto ao deixar o
carro no estacionamento pago, julgue o item subsequente.
A variável aleatória Y é contínua.
Comentários:
As variáveis quantitativas podem ser classificadas em:
a) variáveis contínuas: características mensuráveis que assumem valores em uma escala contínua, nesse
caso, valores fracionários fazem sentido;
b) variáveis discretas: características mensuráveis que podem assumir apenas um número finito ou infinito
contável de valores e, assim, somente fazem sentido valores inteiros.
No problema em questão, a variável aleatória Y pode assumir o valor R$ 70,00, se Roberto deixar o carro no
estacionamento pago; ou o valor R$ 0,00, se Roberto não deixar o carro no estacionamento pago. Portanto,
Y é uma variável aleatória discreta.
Gabarito: Errado.
SÉRIES ESTATÍSTICAS
Uma série estatística consiste em um conjunto de dados organizado com base em uma característica
comum, ou seja, uma mesma variável. Normalmente, uma série estatística é representada por meio de uma
tabela ou de um gráfico, conforme ficar melhor representado, a fim de sintetizar os dados estatísticos
observados e torná-los mais compreensivos.
Uma tabela é, basicamente, um quadro que resume um conjunto de observações, sendo composta de:
a) corpo – conjunto de linhas e colunascom as informações sobre a variável em estudo;
b) cabeçalho – parte superior que especifica o conteúdo das colunas;
c) coluna indicadora – parte que indica o conteúdo das linhas;
d) linhas – traços que facilitam a leitura dos dados;
e) célula – espaço onde os dados são armazenados;
f) título – identificação da tabela, contendo as informações sobre seu conteúdo;
g) fonte – referência de onde os dados foram obtidos, localizada no rodapé.
Um gráfico é uma forma clara e objetiva de apresentar uma série estatística. O objetivo é proporcionar uma
compreensão mais rápida do fenômeno em estudo. Para isso, o gráfico deve ser destituído de detalhes sem
importância (ser simples); permitir a correta intepretação dos valores representativos do fenômeno (ser
claro); e transmitir a verdade sobre o fenômeno (ser verossímil). A série estatística apresentada na tabela
anterior pode ser representada graficamente da seguinte forma:
jeffs
Destacar
jeffs
Destacar
jeffs
Destacar
Finalmente, podemos verificar a presença de três elementos nas séries estatística: o tempo, o espaço e a
espécie. Conforme os elementos variem, a série pode ser classificada em temporal (ou cronológica),
geográfica (ou territorial) e específica.
Séries Temporais (ou Cronológicas)
É a série cujos dados são dispostos segundo a época de ocorrência. Isto é, enquanto o tempo varia, o fato
e o local permanecem constantes. Também são chamadas de séries históricas ou evolutivas. A principal
característica é o fator cronológico variável.
A seguir temos a série histórica da população residente no Brasil no período de 1970 a 2010, com frequência
decenal. Percebam que o tempo varia; contudo, o fato que está sendo analisado (quantidade populacional)
e o local alvo da pesquisa (Brasil), continuam iguais.
População brasileira no período de 1970 a
2010 (x1000)
Anos População
1970 93.134
1980 119.011
1991 146.825
2000 169.799
2010 190.755
Fonte: Censo Demográfico (2010)
Tabela
•Quadro que resume um
conjunto de observações.
• Composta de cabeçalho,
corpo, coluna indicadora,
linhas, células, título e
fonte.
Gráfico
• Forma simples e clara de
apresentar uma série
estatística.
• Proporcionar uma
compreensão mais rápida
do fenômeno em estudo.
• Deve ser simples, claro e
verossímil.
jeffs
Destacar
Séries Geográficas (ou Territoriais)
É a série cujos dados são dispostos segundo a localidade de ocorrência. Isto é, enquanto o local varia, o
fato e o tempo permanecem constantes. Também são chamadas de séries espaciais ou de localização. A
principal característica é o fator geográfico variável.
A seguir temos a série geográfica da população urbana residente em cada uma das regiões brasileiras no ano
de 2010. Percebam que o local (região) varia; contudo, o fato que está sendo analisado (quantidade
populacional) e o tempo (ano de 2010) permanecem constantes.
População Urbana em 2010 (x1000)
Região População
Norte 11.664
Nordeste 38.821
Sudeste 74.696
Sul 23.260
Centro-Oeste 12.482
Fonte: Censo Demográfico (2010)
Séries Específicas
É a série cujos dados são dispostos segundo a modalidade de ocorrência. Isto é, enquanto o fato varia, a
época e o local permanecem constantes. Também são chamadas de séries categóricas. A principal
característica é o fator especificativo variável.
A seguir temos uma série específica das populações urbana e rural residentes no Brasil no ano de 2010.
Percebam que os fatos analisados variam (população urbana x população rural); contudo, o tempo (2010) e
o local de análise (Brasil) são constantes.
População Urbana e Rural em 2010 (x1000)
Zona População
Urbana 93.134
Rural 119.011
Total 190.755
Fonte: Censo Demográfico (2010)
jeffs
Destacar
jeffs
Destacar
Séries Mistas (ou Compostas)
Muitas vezes, podemos ter a necessidade de apresentar, em uma única tabela, a variação de valores de mais
de uma variável, isto é, combinar duas ou mais séries. As séries resultantes desse processo de combinação
são chamadas de séries mistas (ou compostas) e apresentadas por meio de tabelas de dupla entrada.
O nome da nova série deve levar em consideração pelo menos dois elementos. Assim, se for uma série mista
de fato e tempo, denominaremos de série específico-temporal. A seguir temos uma série específico-
temporal representando as populações de homens e mulheres residentes no brasil, no período de 1970 a
2010, com variação decenal.
População do Brasil por Sexo de 1970 a 2010 (x1000)
Anos
Sexo
Homens Mulheres
1970 46.327 46.807
1980 59.142 59.868
1991 72.485 74.340
2000 83.602 86.270
2010 93.406 97.348
Fonte: Censo Demográfico (2010)
Por sua vez, se tivermos uma série mista de local e tempo, denominaremos de série geográfica-temporal.
A seguir temos uma série geográfico-temporal representando as populações residentes em cada região
brasileira, no período de 1970 a 2010, com variação decenal.
População do Brasil por Região de 1970 a 2010 (x1000)
Anos
Regiões
N NE SE S CO
1970 3.603 28.111 39.850 16.496 5.072
1980 5.880 34.815 51.737 19.031 7.545
1991 10.030 42.497 62.740 22.129 9.427
2000 12.900 47.741 72.412 25.107 11.636
2010 15.864 53.081 80.364 27.386 14.058
Fonte: Censo Demográfico (2010)
Por fim, devemos notar que podem existir séries compostas de três ou mais entradas, embora isso raramente
aconteça, por conta da dificuldade de representação.
jeffs
Destacar
jeffs
Destacar
Séries
Temporais
Específicas
Também chamadas de HISTÓRICAS ou EVOLUTIVAS.
Geográficas
Mistas
Também chamadas de ESPACIAIS ou de LOCALIZAÇÃO.
Também chamadas de CATEGÓRICAS.
Combinação de duas ou mais séries.
Tabelas de dupla entrada
Se for uma série mista de FATO e TEMPO,
denominaremos de série específico-temporal.
Se tivermos uma série mista de LOCAL e TEMPO,
denominaremos de série geográfica-temporal.
Enquanto o TEMPO varia, o fato investigado e o local
permanecem constantes.
Enquanto o LOCAL varia, o fato investigado e o tempo
permanecem constantes.
Enquanto o FATO investigado varia, a época e o local
permanecem constantes.
jeffs
Destacar
DISTRIBUIÇÃO DE FREQUÊNCIAS
Vimos anteriormente que, logo após a coleta de dados, temos o que denominamos de dados brutos. Como
exemplo de dados brutos, citamos uma pesquisa de tempo médio de estudo diário, em minutos, envolvendo
50 alunos do Estratégia, em que os alunos foram escolhidos de maneira aleatória, não havendo qualquer
organização dos valores observados. Por terem sido apresentados na forma em que foram coletados, são
denominados de dados brutos.
Aluno Tempo Aluno Tempo Aluno Tempo Aluno Tempo Aluno Tempo
1 143 11 113 21 170 31 124 41 105
2 142 12 143 22 158 32 137 42 154
3 161 13 159 23 123 33 153 43 99
4 126 14 168 24 96 34 129 44 114
5 134 15 123 25 98 35 148 45 161
6 137 16 135 26 135 36 173 46 128
7 171 17 135 27 129 37 126 47 175
8 85 18 175 28 126 38 104 48 137
9 155 19 115 29 103 39 157 49 165
10 171 20 89 30 171 40 127 50 115
Normalmente, esses dados fornecem pouca informação ao leitor, sendo necessário organizá-los, com o
propósito de aumentar sua capacidade informativa. A simples organização dos dados em um rol crescente
já ajuda bastante nesse sentido. Com os dados organizados em rol, conseguimos verificar que o menor tempo
observado foi de 85 minutos, e o maior, de 175 minutos, o que nos fornece uma amplitude total (AT = 175 -
85 = 90) de variação da ordem de 90 minutos.
Rol Crescente
85 115 129 143 161
89 115 129 143 165
96 123 134 148 168
98 123 135 153 170
99 124 135 154 171
103 126 135 155 171
104 126 137 157 171
105 126 137 158 173
113 127 137 159 175
114 128 142 161 175
Outra informação que conseguimos extrair dos dados organizados em rol crescente é que alguns tempos,
como 126 min, 135 min, 137 min e 171 min, foram mais frequentes, ou seja, apareceram mais vezes durante
apesquisa.
Uma maneira mais concisa de mostrar os dados do rol é apresentar cada valor juntamente com o número
de vezes em que ocorre, em vez de repeti-los. O número de ocorrências de um determinado valor recebe o
nome de frequência. A tabela que contém todos os valores com suas respectivas frequências é
denominada de distribuição de frequências.
Uma distribuição de frequências também pode ser definida como uma série estatística na qual
permanecem constantes o fato, o local e a época. Ela pode ser classificada em dois tipos: distribuição de
frequências pontual (ou discreta) e distribuição de frequências intervalar (ou contínua).
Na distribuição de frequências pontual, são apresentados todos os dados coletados juntamente com suas
respectivas frequências, não havendo perda de valores. Contudo, esse processo pode exigir muito espaço,
especialmente quando o número de valores da variável tende a aumentar.
Tempo
(min)
Freq.
Tempo
(min)
Freq.
Tempo
(min)
Freq.
Tempo
(min)
Freq.
85 1 114 1 135 3 158 1
89 1 115 2 137 3 159 1
96 1 123 2 142 1 161 2
98 1 124 1 143 2 165 1
99 1 126 3 148 1 168 1
103 1 127 1 153 1 170 1
104 1 128 1 154 1 171 3
105 1 129 2 155 1 173 1
113 1 134 1 157 1 175 2
Nesse caso, quando a variável é contínua, o mais recomendável é agrupar os valores por intervalos de
classe. Desse modo, em vez de listar cada um dos valores que ocorrem, utilizamos uma distribuição de
frequências intervalar, listando os intervalos de classe e as frequências correspondentes.
Tempo médio (𝑿𝒊) Frequência (𝒇𝒊) 𝟖𝟓 ≤ 𝒙 < 𝟏𝟎𝟎 5 𝟏𝟎𝟎 ≤ 𝒙 < 𝟏𝟏𝟓 5 𝟏𝟏𝟓 ≤ 𝒙 < 𝟏𝟑𝟎 12 𝟏𝟑𝟎 ≤ 𝒙 < 𝟏𝟒𝟓 10 𝟏𝟒𝟓 ≤ 𝒙 < 𝟏𝟔𝟎 7 𝟏𝟔𝟎 ≤ 𝒙 < 𝟏𝟕𝟓 9 𝟏𝟕𝟓 ≤ 𝒙 < 𝟏𝟗𝟎 2
Procedendo dessa forma, perdemos a informação detalhada dos tempos médios, mas ganhamos em termos
de praticidade, o que simplifica o processo de análise de dados. Examinando a tabela acima, percebemos
facilmente que a maioria dos alunos estuda diariamente entre 115 e 130 minutos, enquanto uma minoria
alcança entre 175 e 190 minutos.
jeffs
Destacar
jeffs
Destacar
Para identificar uma classe, temos que conhecer os valores dos limites inferior e superior da classe, que
delimitam um intervalo de classe. Desse modo, precisamos definir a natureza do intervalo de classe, se
aberto ou fechado. Portanto, temos as seguintes notações para os diferentes tipos de intervalos:
Tipo de Intervalo
Notação
matemática
Notação
estatística
Significado
Intervalo aberto 𝑎 < 𝑥 < 𝑏 Engloba todos os elementos entre 𝑎 e 𝑏, mas não engloba 𝑎 nem 𝑏.
Intervalo fechado à
esquerda e aberto à
direita
𝑎 ≤ 𝑥 < 𝑏 Engloba todos os elementos entre 𝑎 e 𝑏, inclusive 𝑎 mas não 𝑏.
Intervalo aberto à
esquerda e fechado
à direita
𝑎 < 𝑥 ≤ 𝑏 Engloba todos os elementos entre 𝑎 e 𝑏, inclusive 𝑏 mas não 𝑎.
Intervalo fechado 𝑎 ≤ 𝑥 ≤ 𝑏 Engloba todos os elementos entre 𝑎 e 𝑏, inclusive 𝑎 e 𝑏.
Por fim, é importante salientarmos que, em análises estatísticas, constantemente encontramos distribuições
de frequências intervalares, pois o objetivo da estatística é justamente fazer um apanhado geral das
características de um conjunto de dados, sem adentrar em detalhes de casos particulares.
Elementos de uma Distribuição de Frequências
Agora, analisaremos de forma detalhada cada elemento de uma distribuição de frequências. Tomaremos
como referência a tabela apresentada anteriormente:
Tempo médio (𝑿𝒊) Frequência (𝒇𝒊) 𝟖𝟓 ≤ 𝒙 < 𝟏𝟎𝟎 5 𝟏𝟎𝟎 ≤ 𝒙 < 𝟏𝟏𝟓 5 𝟏𝟏𝟓 ≤ 𝒙 < 𝟏𝟑𝟎 12 𝟏𝟑𝟎 ≤ 𝒙 < 𝟏𝟒𝟓 10 𝟏𝟒𝟓 ≤ 𝒙 < 𝟏𝟔𝟎 7 𝟏𝟔𝟎 ≤ 𝒙 < 𝟏𝟕𝟓 9 𝟏𝟕𝟓 ≤ 𝒙 < 𝟏𝟗𝟎 2
jeffs
Destacar
jeffs
Destacar
Classe
As classes são os intervalos nos quais o fenômeno é subdividido. Podemos dizer que as classes são os
intervalos ou subdivisões dos elementos que compõem um conjunto de dados. Na tabela anterior, temos as
seguintes classes:
Classe Intervalo Frequência (𝒇𝒊)
1ª Classe 85 ≤ 𝑥 < 100 5
2ª Classe 100 ≤ 𝑥 < 115 5
3ª Classe 115 ≤ 𝑥 < 130 12
4ª Classe 130 ≤ 𝑥 < 145 10
5ª Classe 145 ≤ 𝑥 < 160 7
6ª Classe 160 ≤ 𝑥 < 175 9
7ª Classe 175 ≤ 𝑥 < 190 2
𝒏 = 𝟓𝟎
Existem duas maneiras de determinar o número "ideal" de classes, 𝑘, em função do número de dados da
tabela, 𝑛. A primeira consiste em utilizar a fórmula de Sturges: 𝒌 = 𝟏 + 𝟑, 𝟑 × 𝒍𝒐𝒈 𝒏
Outra abordagem, utilizada quando o número de dados é menor ou igual a 50, é por meio da fórmula: 𝒌 = √𝒏
Vamos aproveitar para calcular o número de classes do nosso exemplo:
a) pela fórmula de Sturges: 𝑘 = 1 + 3,3 × 𝑙𝑜𝑔 𝑛 𝑘 = 1 + 3,3 × 𝑙𝑜𝑔 50 𝑘 = 1 + 3,3 × 1,7 𝑘 = 1 + 5,61 = 6,61
b) pela outra fórmula: 𝑘 = √𝑛 𝑘 = √50 = 7,07
jeffs
Destacar
jeffs
Destacar
jeffs
Destacar
Limite de Classe
Cada classe tem um limite inferior de classe (𝒍𝒊𝒏𝒇), que é o menor número que pode pertencer à classe, e
um limite superior de classe (𝒍𝒔𝒖𝒑), que é o maior número que pode pertencer à classe. Os limites de uma
classe são seus valores extremos.
Vamos identificar os limites inferiores e superiores do nosso exemplo:
Classes
Limite Inferior
(𝒍𝒊𝒏𝒇) Limite Superior (𝒍𝒔𝒖𝒑) 𝟖𝟓 ≤ 𝒙 < 𝟏𝟎𝟎 85 100 𝟏𝟎𝟎 ≤ 𝒙 < 𝟏𝟏𝟓 100 115 𝟏𝟏𝟓 ≤ 𝒙 < 𝟏𝟑𝟎 115 130 𝟏𝟑𝟎 ≤ 𝒙 < 𝟏𝟒𝟓 130 145 𝟏𝟒𝟓 ≤ 𝒙 < 𝟏𝟔𝟎 145 160 𝟏𝟔𝟎 ≤ 𝒙 < 𝟏𝟕𝟓 160 175 𝟏𝟕𝟓 ≤ 𝒙 < 𝟏𝟗𝟎 175 190
Amplitude de um Intervalo de Classe
A amplitude de um intervalo de classe, ou simplesmente intervalo de classe, é a distância entre os limites
inferiores (ou superiores) de classes consecutivas. Ela é obtida pela diferença entre dois limites inferiores
(ou superiores) consecutivos: 𝒉 = 𝒍𝒔𝒖𝒑 − 𝒍𝒊𝒏𝒇
em que 𝑙𝑖𝑛𝑓 é o limite inferior do intervalo de classe e 𝑙𝑠𝑢𝑝 é o limite superior do intervalo de classe.
Dando continuidade ao nosso exemplo, vejamos como calcular as amplitudes dos intervalos:
Classes
Limite Inferior
(𝒍𝒊𝒏𝒇) Limite Superior (𝒍𝒔𝒖𝒑) Amplitude de Classe
(𝒉 = 𝒍𝒔𝒖𝒑 − 𝒍𝒊𝒏𝒇) 𝟖𝟓 ≤ 𝒙 < 𝟏𝟎𝟎 85 100 100 - 85 = 15 𝟏𝟎𝟎 ≤ 𝒙 < 𝟏𝟏𝟓 100 115 115 - 100 = 15 𝟏𝟏𝟓 ≤ 𝒙 < 𝟏𝟑𝟎 115 130 130 - 115 = 15
jeffs
Destacar
jeffs
Destacar
𝟏𝟑𝟎 ≤ 𝒙 < 𝟏𝟒𝟓 130 145 145 - 130 = 15 𝟏𝟒𝟓 ≤ 𝒙 < 𝟏𝟔𝟎 145 160 160 - 145 = 15 𝟏𝟔𝟎 ≤ 𝒙 < 𝟏𝟕𝟓 160 175 175 - 160 = 15 𝟏𝟕𝟓 ≤ 𝒙 < 𝟏𝟗𝟎 175 190 190 - 175 = 15
Embora seja desejável, a amplitude do intervalo de classe nem sempre será constante ao longo de toda a
distribuição de frequências intervalar.
Amplitude Total
A amplitude total é a diferença entre o limite superior da última classe (limite superior máximo) e o limite
inferior da primeira classe (limite inferior mínimo). Portanto, corresponde à diferença entre o último e o
primeiro elemento de um conjunto de dados ordenado de forma crescente: 𝑨𝑻 = 𝒍𝒎á𝒙 − 𝒍𝒎í𝒏
Note que, quando todas as classes possuem a mesma amplitude, também podemos determinar o valor da
amplitude total multiplicando o valor do intervalo de classe (ℎ) pela quantidade de classes da distribuição
(𝑘): 𝑨𝑻 = 𝒉 × 𝒌
Em nosso exemplo, a amplitude total é calculada da seguinte maneira: 𝐴𝑇 = 𝑙𝑚á𝑥 − 𝑙𝑚í𝑛 𝐴𝑇 = 190 − 85 = 105
Ponto médio de classe
O ponto médio é a média aritmética simples dos valores extremos de uma classe, ou seja, a soma dos limites
inferior e superior dividida por dois. Esse ponto divide a classe em duas partes iguais. Também costuma ser
chamado de marca ou representante da classe.
𝑷𝑴 = (𝒍𝒊𝒏𝒇 + 𝒍𝒔𝒖𝒑)𝟐
jeffs
Destacar
jeffs
Destacar
Para praticar, vamos calcular os pontos médios de nossa distribuição de frequências:
Tempo médio (𝑿𝒊) Ponto médio (𝑷𝑴𝒊) Frequência (𝒇𝒊)
85 ≤ 𝑥 < 100 85 + 1002 = 92,5 5 100 ≤ 𝑥 < 115 100 + 1152 = 107,5 5 115 ≤ 𝑥 < 130 115 + 1302 = 122,5 12 130 ≤ 𝑥 < 145 130 + 1452 = 137,5 10 145 ≤ 𝑥 < 160 145 + 1602 = 152,5 7 160 ≤ 𝑥 < 175 160 + 1752 = 167,5 9 175 ≤ 𝑥 < 190 175 + 1902 = 182,5 2
Veja que os pontosmédios formaram uma progressão aritmética, pois a diferença entre dois pontos médios
consecutivos foi constante e igual a 15. Isso ocorreu porque o intervalo de classe, ℎ, também foi constante
(e igual a 15) em toda a distribuição. Assim, quando o intervalo de classes é constante, a diferença entre os
pontos médios também será constante e igual ao intervalo de classe.
Adicionalmente, sabendo que o ponto médio divide a classe em duas partes iguais, podemos derivar outras
relações envolvendo o próprio ponto médio, a amplitude de classe e os limites inferior e superior.
Dada a figura anterior, podemos obter os limites de uma classe por meio das seguintes expressões:
𝒍𝒊𝒏𝒇 = 𝑷𝑴 − 𝒉𝟐
𝒍𝒔𝒖𝒑 = 𝑷𝑴 + 𝒉𝟐
jeffs
Destacar
jeffs
Destacar
Além disso, podemos encontrar o ponto médio de uma classe a partir das seguintes relações:
𝑷𝑴 = 𝒍𝒊𝒏𝒇 + 𝒉𝟐
𝑷𝑴 = 𝒍𝒔𝒖𝒑 − 𝒉𝟐
Frequência
Ao longo dessa aula, em várias oportunidades abordamos conceitos relacionados à frequência, isto é, ao
número de ocorrências de um determinado valor ou de uma certa classe. Esse conceito é de grande
relevância para a estatística descritiva e deve ser estudado de forma mais aprofundada. Nesse contexto, é
importante sabermos que existem quatro tipos de frequência, os quais serão analisados nas subseções
seguintes:
a) frequência absoluta simples (𝑓𝑖);
b) frequência absoluta acumulada (𝑓𝑎𝑐);
c) frequência relativa simples (𝐹𝑖);
d)frequência relativa acumulada (𝐹𝑎𝑐).
Frequência Absoluta Simples
A frequência absoluta simples corresponde ao número de observações correspondentes a uma determinada
classe ou a um determinado valor.
i Tempos (min) Frequência (𝒇𝒊)
1 85 ⊢ 100 5
2 100 ⊢ 115 5
3 115 ⊢ 130 12
4 130 ⊢ 145 10
5 145 ⊢ 160 7
6 160 ⊢ 175 9
7 175 ⊢ 190 2
A frequência simples é simbolizada por 𝑓𝑖. No exemplo anterior, temos: 𝑓1 = 5, 𝑓2 = 5, 𝑓3 = 12, 𝑓4 = 10, 𝑓5 = 7, 𝑓6 = 9 e 𝑓7 = 2.
jeffs
Destacar
jeffs
Destacar
jeffs
Destacar
A soma de todas as frequências é igual ao número total de dados analisados:
∑ 𝑓𝑖𝑘𝑖=1 = 𝑛
em que a notação ∑ 𝑓𝑖𝑘𝑖=1 representa o somatório das frequências de cada uma das 𝑘 classes.
Para a distribuição em análise, temos:
∑ 𝑓𝑖7𝑖=1 = 𝑓1 + 𝑓2 + 𝑓3 + 𝑓4 + 𝑓5 + 𝑓6 + 𝑓7 = 5 + 5 + 12 + 10 + 7 + 9 + 2 = 50
Agora, podemos incluir essa informação na representação tabular:
i Tempos (min) Frequência (𝒇𝒊)
1 85 ⊢ 100 5
2 100 ⊢ 115 5
3 115 ⊢ 130 12
4 130 ⊢ 145 10
5 145 ⊢ 160 7
6 160 ⊢ 175 9
7 175 ⊢ 190 2
∑ 𝑓𝑖7𝑖=1 = 50
Frequência Absoluta Acumulada
A frequência absoluta acumulada crescente (𝑓𝑎𝑐) é a soma das frequências de todos os valores inferiores ao
limite superior do intervalo de uma determinada classe. No exemplo apresentado anteriormente, a
frequência acumulada correspondente à quarta classe é: 𝑓𝑎𝑐4 = 𝑓1 + 𝑓2 + 𝑓3 + 𝑓4 = 5 + 5 + 12 + 10 = 32,
significando que 32 alunos estudam por um período igual ou superior a 85 minutos e inferior a 145 minutos
(limite superior da quarta classe). 𝒇𝒂𝒄𝒊 = 𝒇𝟏 + 𝒇𝟐 + 𝒇𝟑 + ⋯ + 𝒇𝒊
jeffs
Destacar
jeffs
Destacar
jeffs
Destacar
A frequência absoluta acumulada crescente é calculada de cima para baixo, da seguinte forma:
1) repetimos a frequência absoluta da primeira classe;
2) os demais valores da frequência absoluta são obtidos a partir da soma da frequência acumulada anterior
com a frequência absoluta da classe correspondente;
3) a frequência acumulada crescente sempre termina com o valor de n.
A frequência absoluta acumulada decrescente (𝑓𝑎𝑑) é a soma das frequências de todos os valores superiores
ao limite inferior do intervalo de uma determinada classe. No exemplo apresentado anteriormente, a
frequência acumulada correspondente à quarta classe é: 𝑓𝑎𝑑4 = 𝑓4 + 𝑓5 + 𝑓6 + 𝑓7 = 10 + 7 + 9 + 2 = 28,
significando que 28 alunos estudam por um período igual ou superior a 130 minutos (limite inferior da quarta
classe) e inferior a 190 minutos. 𝒇𝒂𝒅𝒊 = 𝒇𝒊 + 𝒇𝒊+𝟏 + 𝒇𝒊+𝟐 + ⋯ + 𝒇𝒌
A frequência absoluta acumulada decrescente é calculada de baixo para cima, da seguinte forma:
1) repetimos a frequência absoluta da última classe;
2) os demais valores da frequência acumulada decrescente são obtidos a partir da soma da frequência
acumulada anterior com a frequência absoluta da classe correspondente;
3) a frequência acumulada decrescente sempre termina com o valor de n.
jeffs
Destacar
jeffs
Destacar
jeffs
Destacar
Frequência Relativa Simples
A frequência relativa simples corresponde à proporção de dados existentes em uma determinada classe.
Para calcular a frequência relativa de uma classe, dividimos a frequência absoluta simples 𝑓𝑖 pela frequência
total (isto é, dividimos a parte pelo todo):
𝑭𝒊 = 𝒇𝒊∑ 𝒇𝒊 = 𝒇𝒊𝒏
Em nosso exemplo, as frequências relativas são:
i Tempos (min) Frequência Absoluta (𝒇𝒊) Frequência Relativa (𝑭𝒊)
1 85 ⊢ 100 5 𝐹1 = 550 = 0,10
2 100 ⊢ 115 5 𝐹2 = 550 = 0,10
3 115 ⊢ 130 12 𝐹3 = 1250 = 0,24
4 130 ⊢ 145 10 𝐹4 = 1050 = 0,20
5 145 ⊢ 160 7 𝐹5 = 750 = 0,14
6 160 ⊢ 175 9 𝐹6 = 950 = 0,18
7 175 ⊢ 190 2 𝐹7 = 250 = 0,04
jeffs
Destacar
Para representar esses valores em termos de porcentagem, basta multiplicarmos por 100%. A tabela ficaria
assim:
i Tempos (min) Frequência Absoluta (𝒇𝒊) Frequência Relativa (𝑭𝒊)
1 85 ⊢ 100 5 𝐹1 = 550 × 100% = 10%
2 100 ⊢ 115 5 𝐹2 = 550 × 100% = 10%
3 115 ⊢ 130 12 𝐹3 = 1250 × 100% = 24%
4 130 ⊢ 145 10 𝐹4 = 1050 × 100% = 20%
5 145 ⊢ 160 7 𝐹5 = 750 × 100% = 14%
6 160 ⊢ 175 9 𝐹6 = 950 × 100% = 18%
7 175 ⊢ 190 2 𝐹7 = 250 × 100% = 4%
O propósito das frequências relativas é facilitar a realização de comparações de classes individuais com o
total das observações. Na tabela anterior, por exemplo, conseguimos verificar facilmente que 24% das
observações pertencem à quarta classe e que 18% das observações pertencem à sexta classe.
Repare que a soma de todas as frequências relativas deve ser igual a 100%:
∑ 𝑭𝒊𝒌𝒊=𝟏 = 𝟏𝟎𝟎%
Podemos incluir essa informação na representação tabular:
i Tempos (min) Frequência Absoluta (𝒇𝒊) Frequência Relativa (𝑭𝒊)
1 85 ⊢ 100 5 10%
2 100 ⊢ 115 5 10%
3 115 ⊢ 130 12 24%
4 130 ⊢ 145 10 20%
5 145 ⊢ 160 7 14%
6 160 ⊢ 175 9 18%
7 175 ⊢ 190 2 4%
∑ 𝑓𝑖7𝑖=1 = 50 ∑ 𝐹𝑖7𝑖=1 = 100%
jeffs
Destacar
Frequência Relativa Acumulada
A frequência relativa acumulada crescente (𝐹𝑎𝑐) é a proporção de valores inferiores ao limite superior do
intervalo de uma dada classe. No exemplo apresentado anteriormente, a frequência acumulada
correspondente à quarta classe é: 𝐹𝑎𝑐4 = 𝐹1 + 𝐹2 + 𝐹3 + 𝐹4 = 10% + 10% + 24% + 20% = 64%,
significando que 64% dos alunos estudam por um período igual ou superior a 85 minutos e inferior a 145
minutos (limite superior da quarta classe). 𝑭𝒂𝒄𝒊 = 𝑭𝟏 + 𝑭𝟐 + 𝑭𝟑 + ⋯ + 𝑭𝒊
A frequência relativa acumulada crescente é calculada de cima para baixo, da seguinte forma:
1) repetimos a frequência relativa da primeira classe;
2) os demais valores são obtidos a partir da soma da frequência relativa acumulada anterior com a frequência
relativa da classe correspondente;
3) a frequência relativa acumulada sempre termina com o valor de 100%.
A frequência relativa acumulada decrescente (𝐹𝑎𝑑) a proporção de valores superiores ao limite inferior do
intervalo de uma dada classe. No exemplo apresentado anteriormente, a frequência acumulada
correspondente à quarta classe é: 𝐹𝑎𝑑4 = 𝐹4 + 𝐹5 + 𝐹6 + 𝐹7 = 20% + 14% + 18% + 4% = 56%,
significando que 56% dos alunos estudam por um período igual ou superior a 130 minutos (limite inferior da
quarta classe) e inferior a 190 minutos. 𝑭𝒂𝒅𝒊 = 𝑭𝒊 + 𝑭𝒊+𝟏 + 𝑭𝒊+𝟐 + ⋯ + 𝑭𝒌
A frequência relativa acumulada decrescente é calculada de baixo para cima, da seguinte forma:
1) repetimos a frequência relativa da última classe;jeffs
Destacar
2) os demais valores são obtidos a partir da soma da frequência acumulada anterior com a frequência relativa
da classe correspondente;
3) a frequência acumulada sempre termina com o valor de 100%.
Densidade de Frequência
A densidade de frequência de uma classe consiste no quociente entre a frequência da classe (absoluta ou
relativa) e sua amplitude: 𝒅𝒆𝒏𝒔𝒊𝒅𝒂𝒅𝒆 = 𝒇𝒓𝒆𝒒𝒖ê𝒏𝒄𝒊𝒂 𝒂𝒃𝒔𝒐𝒍𝒖𝒕𝒂 𝒐𝒖 𝒓𝒆𝒍𝒂𝒕𝒊𝒗𝒂𝒂𝒎𝒑𝒍𝒊𝒕𝒖𝒅𝒆
𝒅𝒊 = 𝒇𝒊𝒉𝒊
Para o nosso exemplo, as densidades de frequência são:
i Tempos (min) Frequência Absoluta (𝒇𝒊) Densidade de Frequência (d)
1 85 ⊢ 100 5 𝑑1 = 𝑓1ℎ1 = 515 = 0,33
2 100 ⊢ 115 5 𝑑2 = 𝑓2ℎ2 = 515 = 0,33
3 115 ⊢ 130 12 𝑑3 = 𝑓3ℎ3 = 1215 = 0,80
jeffs
Destacar
4 130 ⊢ 145 10 𝑑4 = 𝑓4ℎ4 = 1015 = 0,66
5 145 ⊢ 160 7 𝑑5 = 𝑓5ℎ5 = 715 = 0,46
6 160 ⊢ 175 9 𝑑6 = 𝑓6ℎ6 = 915 = 0,60
7 175 ⊢ 190 2 𝑑7 = 𝑓7ℎ7 = 215 = 0,13
Item Definição Símbolos e Fórmulas
Número de
Classes
As classes são os intervalos nos quais o
fenômeno é subdividido.
𝑘 = 1 + 3,3 × 𝑙𝑜𝑔 𝑛
ou 𝑘 = √𝑛
Limites de Classe Correspondem aos valores extremos. 𝑙𝑖𝑛𝑓 e 𝑙𝑠𝑢𝑝
Amplitude de um
Intervalo de Classe
Distância entre os limites inferiores (ou
superiores) de classes consecutivas.
ℎ = 𝑙𝑠𝑢𝑝 − 𝑙𝑖𝑛𝑓
Amplitude total
Diferença entre o limite superior da última
classe (limite superior máximo) e o limite
inferior da primeira classe (limite inferior
mínimo).
𝐴𝑇 = 𝑙𝑚á𝑥 − 𝑙𝑚í𝑛 𝐴𝑇 = ℎ × 𝑘
Ponto Médio
Média aritmética simples dos valores
extremos de uma classe.
𝑃𝑀 = (𝑙𝑖𝑛𝑓 + 𝑙𝑠𝑢𝑝)2 𝑃𝑀 = 𝑙𝑖𝑛𝑓 + ℎ2 𝑃𝑀 = 𝑙𝑠𝑢𝑝 − ℎ2
Frequência
Absoluta Simples
Número de observações correspondentes a
uma determinada classe ou a um
determinado valor.
𝑓𝑖
jeffs
Destacar
Frequência
Absoluta
Acumulada
Total das frequências de todos os valores
inferiores ao limite superior do intervalo de
uma dada classe
𝑓𝑎𝑐𝑖 = 𝑓1 + 𝑓2 + 𝑓3 + ⋯ + 𝑓𝑖
Frequência
Relativa Simples
Proporção de dados existentes em uma
determinada classe.
𝐹𝑖 = 𝑓𝑖∑ 𝑓𝑖 = 𝑓𝑖𝑛
Frequência
Relativa
Acumulada
Proporção de valores inferiores ao limite
superior do intervalo de uma dada classe.
𝐹𝑎𝑐𝑖 = 𝐹1 + 𝐹2 + 𝐹3 + ⋯ + 𝐹𝑖
Densidade de
Frequência
Quociente entre a frequência da classe
(absoluta ou relativa) e sua amplitude
𝑑 = 𝑓ℎ
(VUNESP/IPSM-SJC/2018) Considere as informações a seguir para construir uma distribuição de frequência
sem intervalo de classe e responder a questão.
Um dado foi lançado 50 vezes e foram registrados os seguintes resultados:
5 4 6 1 2 5 3 1 3 3
4 4 1 5 5 6 1 2 5 1
3 4 5 1 1 6 6 2 1 1
4 4 4 3 4 3 2 2 2 3
6 6 3 2 4 2 6 6 2 1
A frequência simples relativa do primeiro elemento é
a) 10%.
b) 20%.
c) 50.
d) 7.
e) 20.
Comentários:
jeffs
Destacar
A frequência absoluta é o número de vezes em que uma determinada variável assume um valor, enquanto a
frequência relativa é o quociente entre a frequência absoluta da classe correspondente e a soma das
frequências (total observado).
Para os dados apresentados, temos que :
Portanto, a frequência simples absoluta do primeiro elemento é igual a 20%.
Gabarito: B.
(CESPE/Polícia Federal/2018)
Tendo em vista que, diariamente, a Polícia Federal apreende uma quantidade X, em kg, de drogas em
determinado aeroporto do Brasil, e considerando os dados hipotéticos da tabela precedente, que
apresenta os valores observados da variável X em uma amostra aleatória de 5 dias de apreensões no citado
aeroporto, julgue o item.
A tabela em questão descreve a distribuição de frequências da quantidade de drogas apreendidas nos cinco
dias que constituem a amostra.
Comentários:
A tabela apenas registra as quantidades de drogas apreendidas por dia. Para que ela configurasse uma
distribuição de frequências da quantidade de drogas apreendidas nos cinco dias, era necessário que cada
valor estivesse associado a uma frequência, o que não ocorreu. Uma distribuição de frequência dos dados
acima seria assim:
Valor obtido no lançamento Frequência absoluta Frequência relativa
1 10 10/50 = 0,2 = 20%
2 9 9/50 = 0,18 = 18%
3 8 8/50 = 0,16 = 16%
4 9 9/50 = 0,18 = 18%
5 6 6/50 = 0,12 = 12%
6 8 8/50 = 0,16 = 16%
Total 50 100%
DIA
1 2 3 4 5
X (quantidade diária
de drogas
apreendidas, em kg)
10 22 18 22 28
Gabarito: Errado.
(CESPE/BACEN/2013)
2 4 8 4 8 1 2 32 12 1 5 7 5 5 3 4 24 19 4 14
Os dados mostrados acima representam uma amostra, em minutos, do tempo utilizado na armazenagem
de formulários no almoxarifado central de certa instituição por diversos funcionários.
Com base nesses dados, julgue o próximo item.
A distribuição de frequência acumulada para tempo de armazenagem observado na amostra inferior a 8
minutos é igual a 13, o que corresponde a uma frequência relativa superior a 0,60.
Comentários:
Não precisamos construir a distribuição de frequências para responder à questão. Sabemos que o total de
observações é 20, pois é esse o número de termos.
Vamos destacar as observações que são inferiores a 8:
2 4 8 4 8 1 2 32 12 1 5 7 5 5 3 4 24 19 4 14
São 13 números inferiores a 8. Portanto, a frequência acumulada para um tempo menor do que 8 é 13.
Para calcular a frequência relativa, basta dividir a frequência absoluta pelo total de observações: 1320 = 0,65
Logo, a frequência relativa acumulada é maior do que 0,60
Gabarito: Certo.
Valor Frequência
10 1
18 1
22 2
28 1
REPRESENTAÇÕES GRÁFICAS DAS DISTRIBUIÇÕES DE
FREQUÊNCIA
Gráfico de Hastes ou Bastões
O gráfico de hastes ou bastões é muito utilizado para representar dados não agrupados em classes, o que
normalmente ocorre com dados discretos. Nesse caso, não há perda de informação pois os valores da
variável aparecem individualmente, conforme constam da amostra. Com relação a sua construção, basta
representarmos as frequências simples absolutas ou relativas de cada elemento do conjunto de dados.
𝑿𝒊 Frequência (𝒇𝒊)
0 4
1 10
2 25
3 15
4 10
5 5
6 1
Repare que podemos reconstruir facilmente a tabela de frequências a partir do gráfico de hastes. De igual
modo, conhecendo a tabela de frequências, podemos construir rapidamente o gráfico de hastes.
Histogramas
O histograma é um gráfico destinado a representar dados agrupados em classe, sendo composto por um
conjunto de retângulos contíguos (justapostos) cujas bases ficam localizadas sobre o eixo horizontal (eixo
x), de forma que os seus pontos médios devem coincidir com os pontos médios dos intervalos de classe e
seus limites devem coincidir com os limites da classe.
A quantidade de retângulos em um histograma é equivalente ao número de intervalos de classe. A largura
de cada retângulo deve ser igual à amplitude do intervalo de classe, enquanto a altura precisa ser
proporcional à frequência do intervalo de classe. Além disso, a área do histograma é proporcional ao
somatório das frequências.
jeffs
Destacar
jeffs
Destacar
Tempo médio (𝑿𝒊) Frequência (𝒇𝒊) 𝟖𝟓 ≤ 𝒙 < 𝟏𝟎𝟎 5 𝟏𝟎𝟎 ≤ 𝒙 < 𝟏𝟏𝟓 5 𝟏𝟏𝟓 ≤ 𝒙 < 𝟏𝟑𝟎 12 𝟏𝟑𝟎 ≤ 𝒙 < 𝟏𝟒𝟓 10 𝟏𝟒𝟓 ≤ 𝒙 < 𝟏𝟔𝟎 7 𝟏𝟔𝟎 ≤ 𝒙 < 𝟏𝟕𝟓 9 𝟏𝟕𝟓 ≤ 𝒙 < 𝟏𝟗𝟎 2
A diferença básica entre um histograma e um gráfico de colunas (estudaremos na próxima seção) é a
separação entre os retângulos adjacentes. Veja que não existe separação entre os retângulos no caso do
histograma.
Dito isso, é importante mencionarmos a existência do gráfico denominado de poligonal característica, que
construímos utilizando apenas os contornos do histograma.
Por fim, o histograma pode ocasionar um certo nível de perda de informações, pois os elementos da
distribuição de frequência não são representados de forma individualizada, massim por meio de suas
classes.
Polígono de Frequências
O polígono de frequências é um gráfico em linha obtido por meio da ligação, por segmentos de reta, dos
pontos médios das bases superiores dos retângulos de um histograma. Também é necessário considerar a
existência de uma classe anterior à primeira e outra posterior à última, ambas com a frequência nula.
jeffs
Destacar
jeffs
Destacar
jeffs
Destacar
Assim como o histograma, o polígono de frequências apresenta área proporcional ao somatório das
frequências.
Tempo médio (𝑿𝒊) Ponto médio (𝑷𝑴𝒊) Frequência (𝒇𝒊) 𝟕𝟎 ≤ 𝒙 < 𝟖𝟓 77,5 0 𝟖𝟓 ≤ 𝒙 < 𝟏𝟎𝟎 92,5 5 𝟏𝟎𝟎 ≤ 𝒙 < 𝟏𝟏𝟓 107,5 5 𝟏𝟏𝟓 ≤ 𝒙 < 𝟏𝟑𝟎 122,5 12 𝟏𝟑𝟎 ≤ 𝒙 < 𝟏𝟒𝟓 137,5 10 𝟏𝟒𝟓 ≤ 𝒙 < 𝟏𝟔𝟎 152,5 7 𝟏𝟔𝟎 ≤ 𝒙 < 𝟏𝟕𝟓 167,5 9 𝟏𝟕𝟓 ≤ 𝒙 < 𝟏𝟗𝟎 182,5 2 𝟏𝟗𝟎 ≤ 𝒙 < 𝟐𝟎𝟓 197,5 0
Curva de Frequências
A curva de frequências é obtida a partir do polimento de um polígono de frequências. Em sentido
geométrico, o polimento corresponde à eliminação dos vértices (cantos) da linha poligonal. Esse processo
suaviza os contornos do polígono de frequências, o que evidencia a verdadeira natureza dos dados em
análise.
O polígono de frequências fornece a imagem real do fenômeno investigado, enquanto a curva de frequência
mostra sua tendência. Naturalmente, quando o conjunto de dados é grande, a linha poligonal se torna curva.
jeffs
Destacar
jeffs
Destacar
Por isso, podemos afirmar que a curva de frequência antecipa o comportamento da distribuição para um
número maior de dados.
O processo de polimento é realizado por meio da seguinte fórmula:
𝒇𝒄𝒊 = 𝒇𝒂𝒏𝒕 + 𝟐 × 𝒇𝒊 + 𝒇𝒑𝒐𝒔𝒕𝟒
em que 𝑓𝑐𝑖 é a frequência calculada da classe considerada (freq. polida); 𝑓𝑖 é a frequência simples da classe
considerada; 𝑓𝑎𝑛𝑡 é a frequência simples da classe anterior à da classe considerada; e 𝑓𝑝𝑜𝑠𝑡 é a frequência
simples da classe posterior à da classe considerada.
Vejamos como utilizá-la:
Tempo médio
(𝑿𝒊) Ponto médio (𝑷𝑴𝒊) Frequência (𝒇𝒊) Frequência Calculada (𝒇𝒄𝒊) 𝟕𝟎 ≤ 𝒙 < 𝟖𝟓 77,5 0 𝑓𝑐0 = 0 + 2 × 0 + 54 = 1,25 𝟖𝟓 ≤ 𝒙 < 𝟏𝟎𝟎 92,5 5 𝑓𝑐1 = 0 + 2 × 5 + 54 = 3,75 𝟏𝟎𝟎 ≤ 𝒙 < 𝟏𝟏𝟓 107,5 5 𝑓𝑐2 = 5 + 2 × 5 + 124 = 6,75 𝟏𝟏𝟓 ≤ 𝒙 < 𝟏𝟑𝟎 122,5 12 𝑓𝑐3 = 5 + 2 × 12 + 104 = 9,75 𝟏𝟑𝟎 ≤ 𝒙 < 𝟏𝟒𝟓 137,5 10 𝑓𝑐4 = 12 + 2 × 10 + 74 = 9,75 𝟏𝟒𝟓 ≤ 𝒙 < 𝟏𝟔𝟎 152,5 7 𝑓𝑐5 = 10 + 2 × 7 + 94 = 8,75 𝟏𝟔𝟎 ≤ 𝒙 < 𝟏𝟕𝟓 167,5 9 𝑓𝑐6 = 7 + 2 × 9 + 24 = 6,75 𝟏𝟕𝟓 ≤ 𝒙 < 𝟏𝟗𝟎 182,5 2 𝑓𝑐7 = 9 + 2 × 2 + 04 = 3,25 𝟏𝟗𝟎 ≤ 𝒙 < 𝟐𝟎𝟓 197,5 0 𝑓𝑐8 = 2 + 2 × 0 + 04 = 0,50
jeffs
Destacar
As curvas de frequências podem assumir as seguintes formas características:
a) curvas em forma de sino: são curvas que apresentam concentração de valores em torno da região central
da distribuição. Tais curvas podem ser simétricas ou assimétricas. Quando assimétricas, as curvas ainda
podem apresentar uma cauda mais alongada à esquerda (assimetria à esquerda) ou mais alongada à direita
(assimetria à direita). Assim, as possíveis configurações para as curvas em formas de sino são:
Curva Simétrica.
Curva assimétrica à direita. Curva assimétrica à esquerda.
jeffs
Destacar
b) curvas em forma de jota: são curvas que apresentam o ponto de ordenada máxima em uma das
extremidades, representando distribuições extremamente assimétricas. As possíveis configurações são:
Curva em formato de J. Curva em formato de J invertido.
c) curvas em forma de U: são curvas que apresentam as ordenadas máximas em ambas as extremidades.
Curva em formato de U.
Ogiva (Polígono de Frequências Acumuladas)
O gráfico de ogiva corresponde a um polígono de frequências acumuladas. Esse gráfico é empregado na
representação de distribuições de frequências acumuladas, sejam elas crescentes ou decrescentes. No eixo
horizontal, colocamos as extremidades de cada classe e no eixo vertical as frequências acumuladas.
Ao contrário do polígono de frequências, a ogiva utiliza os pontos extremos das classes, e não os pontos
médios. Na construção do polígono de frequências acumuladas, devemos considerar a existência de uma
classe anterior à primeira, com frequência nula.
jeffs
Destacar
jeffs
Destacar
jeffs
Destacar
Tempo médio (𝑿𝒊) Frequência (𝒇𝒊) Frequência Acumulada (𝒇𝒂𝒄) 𝟕𝟎 ≤ 𝒙 < 𝟖𝟓 0 0 𝟖𝟓 ≤ 𝒙 < 𝟏𝟎𝟎 5 5 𝟏𝟎𝟎 ≤ 𝒙 < 𝟏𝟏𝟓 5 10 𝟏𝟏𝟓 ≤ 𝒙 < 𝟏𝟑𝟎 12 22 𝟏𝟑𝟎 ≤ 𝒙 < 𝟏𝟒𝟓 10 32 𝟏𝟒𝟓 ≤ 𝒙 < 𝟏𝟔𝟎 7 39 𝟏𝟔𝟎 ≤ 𝒙 < 𝟏𝟕𝟓 9 48 𝟏𝟕𝟓 ≤ 𝒙 < 𝟏𝟗𝟎 2 50
Gráfico Definição
O gráfico de hastes ou bastões é muito utilizado para
representar dados não agrupados em classes, o que
normalmente ocorre com dados discretos.
O histograma é um gráfico destinado a representar dados
agrupados em classe, sendo composto por um conjunto de
retângulos contíguos (justapostos).
A poligonal característica é construída utilizando apenas os
contornos do histograma.
O polígono de frequências é um gráfico em linha obtido por
meio da ligação, por segmentos de reta, dos pontos médios
das bases superiores dos retângulos de um histograma.
jeffs
Destacar
A curva de frequências é obtida a partir do polimento de um
polígono de frequências.
O gráfico de ogiva é empregado na representação de
distribuições de frequências acumuladas, sejam elas
crescentes ou decrescentes
jeffs
Destacar
(FCC/SEDU-ES/2018) Depois da aplicação de uma prova para todos os alunos do 7º A, a professora Marli
fez um histograma com a distribuição das notas, conforme indicado abaixo.
Se a média de notas da sala foi igual a seis, a porcentagem dos alunos que tiraram nota maior ou igual a
média da sala nessa prova foi de
a) 54%.
b) 50%.
c) 56%.
d) 60%.
e) 52%.
Comentários:
Vamos, incialmente, calcular o total de alunos: 2 + 6 + 14 + 16 + 6 = 44
Reparem na notação intervalar adotada para as colunas, vamos relembrar o significado dela:
Agora, com base nas informações do gráfico, percebemos que existem 22 pessoas com média maior ou igual
a 6, representadas pelas duas últimas colunas do gráfico. Assim: 16 + 6 = 22
Logo, a porcentagem será de: 2244 = 0,5 = 50%
Gabarito: B.
(FCC/TRT 14ª Região/2018) De um histograma e uma tabela de frequências absolutas, elaborados para
analisar a distribuição dos salários dos empregados em uma empresa, obtém-se a informação que 24
empregados ganham salários com valores pertencentes ao intervalo (2.000; 4.000], em reais, que
apresenta uma densidade de frequência de 𝟎, 𝟕𝟓 × 𝟏𝟎−𝟒(𝑹$)−𝟏
Densidade de frequência de um intervalo é o resultado da divisão da respectiva frequência relativa pela
amplitude deste intervalo. Em um intervalo do histograma que está sendo analisado, com uma amplitude
de R$ 3.000,00 e uma densidade de frequência de 𝟏 × 𝟏𝟎−𝟒(𝑹$)−𝟏, tem-se que o correspondente número
de empregados é igual a
a) 40.
b) 36.
c) 30.
d) 48.
e) 42.
Comentários:
Vamos destacar os dados da questão:
- densidade de frequência: 0,75 × 10−4(𝑅$)−1;
- amplitude da classe: 4000 − 2000 = 2000;
- número de funcionários na classe: 24; e
- total de funcionários na classe: T.
A frequência relativa é calculada pela fórmula a seguir: 𝐹𝑟𝑒𝑞𝑢ê𝑛𝑐𝑖𝑎 𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑎 = 𝑁º 𝑑𝑒 𝑓𝑢𝑛𝑐𝑖𝑜𝑛á𝑟𝑖𝑜𝑠 𝑛𝑎 𝑐𝑙𝑎𝑠𝑠𝑒𝑇𝑜𝑡𝑎𝑙 𝑑𝑒 𝑓𝑢𝑛𝑐𝑖𝑜𝑛á𝑟𝑖𝑜𝑠 = 24𝑇
Então, pela fórmula da densidade de frequência, teremos: 𝐷𝑒𝑛𝑠𝑖𝑑𝑎𝑑𝑒 𝑑𝑒 𝑓𝑟𝑒𝑞𝑢ê𝑛𝑐𝑖𝑎 = 𝐹𝑟𝑒𝑞𝑢ê𝑛𝑐𝑖𝑎 𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑎𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑𝑒
0,75 × 10−4 = 24𝑇2000 0,15 = 24𝑇 𝑇 = 160
Agora, vamos aplicar a mesma metodologia para a classe do histograma com amplitude de 3000 e densidade
de frequência de 1 × 10−4. Considerando o número de funcionários na classe igual a 𝑁, teremos a seguinte
frequência relativa: 𝐹𝑟𝑒𝑞𝑢ê𝑛𝑐𝑖𝑎 𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑎 = 𝑁º 𝑑𝑒 𝑓𝑢𝑛𝑐𝑖𝑜𝑛á𝑟𝑖𝑜𝑠 𝑛𝑎 𝑐𝑙𝑎𝑠𝑠𝑒𝑇𝑜𝑡𝑎𝑙𝑑𝑒 𝑓𝑢𝑛𝑐𝑖𝑜𝑛á𝑟𝑖𝑜𝑠 = 𝑁160
Então, pela fórmula da densidade de frequência, teremos: 𝐷𝑒𝑛𝑠𝑖𝑑𝑎𝑑𝑒 𝑑𝑒 𝑓𝑟𝑒𝑞𝑢ê𝑛𝑐𝑖𝑎 = 𝐹𝑟𝑒𝑞𝑢ê𝑛𝑐𝑖𝑎 𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑎𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑𝑒
10−4 = 𝑁1603000 0,3 = 𝑁160 𝑁 = 48
Gabarito: D.
(CESPE/FUNPRESP/2016)
O gráfico ilustra cinco possibilidades de fundos de investimento com suas respectivas rentabilidades.
Considerando que as probabilidades de investimento para os fundos A, B, C e D sejam, respectivamente,
P(A) = 0,182; P(B) = 0,454; P(C)= 0,091; e P(D)= 0,182, julgue o item subsequente.
O gráfico apresentado é um histograma.
Comentários:
O gráfico não é um histograma por dois motivos: primeiro porque há uma separação entre as colunas, o que
não ocorre em um histograma, e sim em um gráfico de colunas; segundo porque um histograma representa
dados que estão agrupados em intervalos de classe, e não em categorias, como é o caso.
Gabarito: Errado.
OUTROS GRÁFICOS E REPRESENTAÇÕES
O principal objetivo dos gráficos estatísticos é proporcionar uma visualização mais rápida dos dados
estatísticos ou do fenômeno sob investigação. A seguir vamos ver as principais formas de representação de
dados estatísticos.
Gráficos em Linhas
Os gráficos em linha normalmente são usados para representar dados de séries temporais, com a finalidade
de mostrar a variação dos valores de uma variável ao longo do tempo. Esse tipo de gráfico permite-nos
comparar duas variáveis: uma é traçada no eixo x (horizontal) e a outra no eixo y (vertical). O eixo y
geralmente indica uma quantidade, enquanto o eixo x representa uma unidade de tempo.
Por exemplo, o gráfico a seguir mostra a evolução da população residente na Região Norte do Brasil no
período de 1970 a 2010. Veja que o eixo horizontal está indicando o decurso do tempo, enquanto o eixo
vertical apresenta a população residente na região.
População da região Norte, de 1970 a 2010 (x1000)
Fonte: Censo Demográfico 1970/2010 (IBGE)
jeffs
Destacar
Também podemos elaborar um gráfico de linhas múltiplas para comparar a evolução da população
residente nas Grandes Regiões do Brasil em diferentes períodos:
População brasileira, por Grandes Regiões, de 1970 a 2010 (x1000)
Fonte: Censo Demográfico 1970/2010 (IBGE)
Gráficos em Barras
Os gráficos em barra normalmente são usados para representar distribuições de dados categóricos ou
qualitativos. Uma série estatística é representada por um conjunto de retângulos dispostos
horizontalmente, cada um indicando uma categoria particular, os quais possuem a mesma altura e
comprimentos proporcionais aos respectivos dados.
Por exemplo, a distribuição da população residente em cada região brasileira, no ano de 2010, pode ser
representada por meio do seguinte gráfico:
População brasileira, por região, em 2010 (x1000)
Fonte: Censo Demográfico 1970/2010 (IBGE)
jeffs
Destacar
Adicionalmente, podemos utilizar um gráfico de barras justapostas para representar a evolução da
população residente em cada região brasileira, como o mostrado a seguir:
População brasileira, por região, de 1970 a 2010 (x1000)
Fonte: Censo Demográfico 1970/2010 (IBGE)
Gráficos em Colunas
Os gráficos em coluna também são usados para distribuições de dados categóricos ou qualitativos. A
diferença básica é que, agora, uma série estatística é representada por um conjunto de retângulos
dispostos verticalmente, cada um indicando uma categoria particular, todos com a mesma largura e alturas
proporcionais aos respectivos dados.
Por exemplo, a distribuição da população residente em cada região brasileira, no ano de 2010, pode ser
representada por meio do seguinte gráfico:
População brasileira, por região, em 2010 (x1000)
Fonte: Censo Demográfico 1970/2010 (IBGE)
jeffs
Destacar
Também podemos utilizar um gráfico de colunas justapostas para representar a evolução da população
residente em cada região brasileira, no período de 1970 a 2010. Dessa maneira, conseguimos apresentar
mais informações em um espaço consideravelmente menor. Vejamos o gráfico a seguir:
População brasileira, por região, de 1970 a 2010 (x1000)
Fonte: Censo Demográfico 1970/2010 (IBGE)
Adicionalmente, essas informações também podem ser representadas por meio de um gráfico de colunas
sobrepostas (ou gráfico de colunas empilhadas). Esse tipo de gráfico é considerado uma extensão do
formato tradicional, pois permite analisarmos duas dimensões de uma variável categórica, em vez de
apenas uma. Cada coluna é dividida em várias partes que ficam empilhadas umas sobre as outras, cada uma
correspondendo a um nível da segunda variável categórica.
População brasileira, por região, de 1970 a 2010 (x1000)
Fonte: Censo Demográfico 1970/2010 (IBGE)
Gráfico em Setores
O gráfico em setores (também conhecido como gráfico de pizza) é usado para representar a frequência
relativa (porcentagem) de uma variável categórica. Ele é formado por um círculo dividido em setores
circulares, cada um representando uma categoria, cujos ângulos centrais são proporcionais às frequências
relativas da categoria.
jeffs
Destacar
Para a construção do gráfico de setores, utilizaremos uma regra de três simples, em que as frequências
relativas de cada categoria correspondem ao ângulo central que desejamos representar em relação à
frequência total, que corresponde ao ângulo de 360°.
População Urbana e Rural do Brasil em 2010
Fonte: Sinopse do Censo Demográfico de 2010 (IBGE)
Gráfico Polar
O gráfico polar consiste em uma sequência de eixos igualmente espaçados (ângulos iguais), cada um
representando uma das variáveis. Uma linha é desenhada ligando os valores de cada eixo. Esse tipo de gráfico
é usado para representar séries temporais cíclicas, que apresentam uma determinada periodicidade, como
é o caso da precipitação pluviométrica mensal média:
Precipitação pluviométrica média do município de São Paulo
Fonte: Atlas Pluviométrico do Brasil (Serviço Geológico do Brasil)
jeffs
Destacar
Cartograma
O cartograma é empregado com a finalidade de apresentar dados estatísticos diretamente relacionados
com áreas geográficas. As áreas do cartograma podem ser preenchidas por pontos, hachuras ou cores. O
significado do preenchimento será indicado em uma legenda. Vejamos a população residente em cada
Estado brasileiro:
População residente no Brasil por Estado em 2010 (x1000)
Fonte: Sinopse do Censo Demográfico de 2010 (IBGE)
Pictograma
O pictograma substitui valores por ícones, tornando os dados mais atraentes e facilitando o entendimento
acerca de um determinado fenômeno. Normalmente, uma legenda é utilizada para indicar o que cada ícone
representa. Os ícones devem possuir o mesmo tamanho, mas podem aparecer fracionados para mostrar a
respectiva fração de uma determinada quantidade. A proporção de homens e mulheres na população
brasileira é apresentada no pictograma a seguir:
População residente no Brasil por Estado em 2010 (x1000)
Fonte: Sinopse do Censo Demográfico de 2010 (IBGE)
jeffs
Destacar
jeffs
Destacar
Gráfico de Dispersão
O gráfico de dispersão é uma representação de pares ordenados em um plano cartesiano, composto por
um eixo vertical (ordenada) e um eixo horizontal (abcissa). Os dados são representados como uma coleção
de pontos, cada um com o valor de uma variável determinando a posição no eixo horizontal e o valor da
outra variável determinando a posição no eixo vertical. É uma ferramenta poderosa para estudar a relação
entre duas variáveis.
Municípios criados e instalados na região Norte.
Fonte: Sinopse do Censo Demográfico de 2010 (IBGE)
Diagrama de Ramos e Folhas
O diagrama de ramos e folhas fornece uma maneira rápida de representar graficamente a distribuição dos
dados. Nesse diagrama, cada número é separado em duas partes. Em geral, de um lado ficam as unidades
do número e do outro ladofica o restante desse número. Consideremos o seguinte rol crescente:
85, 89, 96, 98, 99, 103, 104, 105, 113, 114, 115, 115, 123, 123, 124, 126, 126, 126, 127, 128, 129,
129, 134, 135, 135, 135, 137, 137, 137, 142, 143, 143, 148, 153, 154, 155, 157, 158, 159, 161,
161, 165, 168, 170, 171, 171, 171, 173, 175, 175
A representação utilizando um diagrama de ramos e folhas ficaria assim:
jeffs
Destacar
Repare que, no lado esquerdo, temos as centenas e as dezenas representando os ramos. Por sua vez, no lado
direito, temos as unidades representando as folhas. As folhas, portanto, estão vinculadas aos ramos. Dessa
maneira, a chave “9 | 6 8 9” significa que, no rol original, havia os números 96, 98 e 99.
Também é comum encontrarmos diagramas de ramos e folhas em que as unidades são separadas em dois
grupos: de 0 a 4 e de 5 a 9. Nesse caso, teríamos o seguinte diagrama:
Por fim, é importante observarmos que não existe uma regra única para a construção do diagrama de ramos
e folhas. O formato mais comumente encontrado é o que separa o número em duas partes, porém, a
depender da chave escolhida, o número pode ser separado em mais partes. Assim, ao resolver questões
que envolvem esse tipo de diagrama, devemos observar a chave adotada.
Gráfico Definição
Os gráficos em linha normalmente são usados para representar a
variação dos valores de uma variável ao longo do tempo. Esse tipo de
gráfico permite-nos comparar duas variáveis: uma é traçada no eixo x
(horizontal) e a outra no eixo y (vertical).
jeffs
Destacar
jeffs
Destacar
Os gráficos em barra normalmente são usados para representar
distribuições de dados categóricos ou qualitativos. Uma série
estatística é representada por um conjunto de retângulos dispostos
horizontalmente, cada um indicando uma categoria particular.
Os gráficos em coluna também são usados para distribuições de
dados categóricos ou qualitativos. A diferença básica é que, agora,
uma série estatística é representada por um conjunto de retângulos
dispostos verticalmente, cada um indicando uma categoria
particular.
O gráfico em setores é usado para representar a frequência relativa
(porcentagem) de uma variável categórica, sendo formado por um
círculo dividido em setores circulares, cada um representando uma
categoria.
O gráfico polar consiste em uma sequência de eixos igualmente
espaçados (ângulos iguais), cada um representando uma das
variáveis. Uma linha é desenhada ligando os valores de cada eixo.
O cartograma é empregado com a finalidade de apresentar dados
estatísticos diretamente relacionados com áreas geográficas.
O pictograma substitui valores por ícones, tornando os dados mais
atraentes e facilitando o entendimento acerca de um determinado
fenômeno.
jeffs
Destacar
O gráfico de dispersão é uma representação de pares ordenados em
um plano cartesiano, composto por um eixo vertical (ordenada) e
um eixo horizontal (abcissa). Os dados são representados como uma
coleção de pontos.
O diagrama de ramos e folhas fornece uma maneira rápida de
representar graficamente a distribuição dos dados. Nele, cada
número é separado em duas partes. Em geral, de um lado ficam as
unidades do número e do outro lado fica o restante desse número.
(VUNESP/UNICAMP/2019) Assinale dentre os exemplos a seguir, o gráfico de dispersão.
a)
b)
c)
d)
e)
Comentários:
Analisando cada gráfico, temos:
Letra A: Alternativa Errada. O gráfico de setores é formado por um círculo dividido em setores circulares,
cada um representando uma categoria, cujos ângulos centrais são proporcionais às frequências relativas da
categoria.
Letra B: Alternativa Correta. O gráfico de dispersão é uma representação gráfica que analisa a relação entre
duas variáveis quantitativas — uma de causa e outra de efeito, chamadas de variáveis independente e
dependente, respectivamente. Esse tipo de diagrama traz números simultâneos das duas variáveis, deixando
visível se o que acontece em uma variável interfere na outra.
Letra C: Alternativa Errada. O gráfico em linhas é o gráfico em que os pontos são geralmente usados para
controlar alterações ao longo do tempo e para facilitar a identificação de tendências ou de anomalias.
Letra D: Alternativa Errada. Os gráficos em colunas assim como os gráficos de barras são usados para
distribuições de dados categóricos ou qualitativos. A diferença básica é que, no primeiro, uma série
estatística é representada por um conjunto de retângulos dispostos verticalmente, cada um indicando uma
categoria particular, todos com a mesma largura e alturas proporcionais aos respectivos.
Letra E: Alternativa Errada. Os gráficos em barras normalmente são usados para representar distribuições de
dados categóricos ou qualitativos. Uma série estatística é representada por um conjunto de retângulos
dispostos horizontalmente, cada um indicando uma categoria particular, os quais possuem a mesma altura
e comprimentos proporcionais aos respectivos dados.
Gabarito: B.
(VUNESP/Pref. Campinas/2019) Uma empresa atua em três segmentos de mercado, A, B e C. O gráfico de
setores mostra a distribuição percentual, por segmento, da receita total obtida por essa empresa em 2018.
Sabendo-se que a receita obtida no segmento A superou a receita obtida no segmento B em R$ 64 milhões,
é correto afirmar que a receita obtida no segmento C foi igual a
a) R$ 98 milhões.
b) R$ 96 milhões.
c) R$ 94 milhões.
d) R$ 88 milhões.
e) R$ 86 milhões.
Comentários:
Consideremos T o total de receitas obtidas pela empresa em 2018. Pelas informações apresentadas no
gráfico de pizza, temos: 𝐴 = 0,48 × 𝑇
𝐵 = 0,4 × 𝑇 𝐶 = 0,12 × 𝑇
Sabendo que a receita obtida no segmento A superou a receita obtida no segmento B em R$ 64 milhões,
então: 𝐴 = 𝐵 + 64 0,48 × 𝑇 = 0,4 × 𝑇 + 64 0,8 × 𝑇 = 64 𝑇 = 800 𝑚𝑖𝑙ℎõ𝑒𝑠
Logo, 𝐶 = 0,12 × 𝑇 𝐶 = 12 × 800 𝐶 = 96 𝑚𝑖𝑙ℎõ𝑒𝑠
Gabarito: B.
(CESPE/CBM-AL/2017) Na tabela a seguir, A, B, C, D e E são as quantidades de resmas de papel A4
consumidas, em quatro meses, pelas seções administrativas I, II, III, IV e V, respectivamente. Apesar de
não mostrar explicitamente essas quantidades, a tabela apresenta as frequências absolutas e (ou) relativas
de algumas dessas quantidades.
Considerando que cada uma dessas resmas, juntamente com a embalagem, tem forma de um
paralelepípedo retângulo reto que mede 5 cm × 21 cm × 30 cm, julgue o item seguinte.
O gráfico de barras verticais a seguir apresenta as frequências absolutas de resmas consumidas pelas cinco
seções.
Seção
Quantidades
de Resmas
Frequência
Absoluta
Frequência
Relativa
I A 38 19%
II B
III C 20%
IV D 36
V E 44
Total 100%
Comentários:
Podemos usar uma regra de três simples para completar a tabela. Primeiro, vamos encontrar o valor que
representa 100%: 38 − 0,19 𝑄 − 1,00 𝑄 = 38 × 1,000,19 = 200
Encontrando o valor de 20%: 200 − 1,00 𝐶 − 0,20 𝐶 = 200 × 0,21,00 = 40
Agora, basta sabermos a frequência absoluta na seção II. Como foram consumidas 200 resmas, então o
número de resmas consumidas pela seção II foi: 200 − 38 − 40 − 36 − 44 = 42
Dessa forma, nas seções I, II, III, IV e V foram consumidas, respectivamente 38, 42, 40, 36 e 44 resmas de
papel A4, conforme mostra o gráfico.
Gabarito: Certo.
RESUMO DA AULA
INTRODUÇÃO À ESTATÍSTICA
A Estatística pode ser dividida em três grandes ramos: Estatística Descritiva (ou dedutiva), Estatística
Probabilística e Estatística Inferencial (ou indutiva).
CONCEITOS INICIAIS
É responsável pela coleta,
organização, descrição e resumo dos
dados observados.
É responsável pela análise e
interpretação dos dados.
É responsável por estabelecer o
modelo matemático adotado para
explicar fenômenos aleatórios.
CONJUNTO de TODOS os elementos a
serem estudados, que apresentam umaou mais características em comum.
ESTUDO dos dados relativos a TODOS os
ELEMENTOS de uma população.
PROCESSO que consiste na seleção
criteriosa dos elementos a serem
submetidos à investigação.
SUBCONJUNTO extraído DA POPULAÇÃO
para análise, devendo ser representativo
daquele grupo
Medidas numéricas extraídas de
AMOSTRAS representativas extraídas da
população.
Descrições numéricas de características
da POPULAÇÃO, que normalmente
precisam ser estimadas.
MÉTODO EXPERIMENTAL X MÉTODO ESTATÍSTICO
DADOS ESTATÍSTICOS
Com relação ao número de observações coletadas, os dados são classificados em univariados, bivariados ou
multivariados:
Quanto à forma de apresentação, os dados podem ser classificados em dados brutos ou rol.
As CAUSAS são mantidas CONSTANTES,
COM EXCEÇÃO DE UMA, que é VARIADA
para que seus efeitos sejam descobertos.
Admite e REGISTRA TODAS AS POSSÍVEIS
VARIAÇÕES DAS CAUSAS PRESENTES,
procurando determinar a influência de
cada fator no resultado.
É quando uma única observação de
cada indivíduo é registrada.
É quando mais duas observações
acerca de cada indivíduo são
registradas
É quando duas observações de cada
indivíduo são registradas.
Dados
Rol
Brutos
Os valores não são organizados por ordem de grandeza
crescente ou decrescente.
Fornecem poucas informações úteis ao leitor (tabela
primitiva).
Os valores são organizados por ordem de grandeza em
crescente ou decrescente.
Facilitam a identificação dos valores máximo e
mínimo.
VARIÁVEIS ESTATÍSTICAS
As variáveis estatísticas podem ser classificadas, inicialmente, em duas categorias: qualitativas e
quantitativas.
Variáveis
Qualitativas
Quantitativas
Ordinais
Nominais
Discretas
Contínuas
Os resultados obtidos não podem ser
ordenados/hierarquizados.
Ex: cor dos olhos; esporte praticado.
Os resultados obtidos podem ser
ordenados/hierarquizados.
Ex: nível de escolaridade.
Os possíveis valores formam um conjunto finito ou
enumerável; resultam de contagem.
Ex: número de leitos por cidade; idade.
Os possíveis valores formam um intervalo de números
reais; resultam de mensuração.
Ex: peso; altura.
SÉRIES ESTATÍSTICAS
As séries estatísticas podem ser classificadas em: temporais, geográficas, específicas ou mistas:
Séries
Temporais
Específicas
Também chamadas de HISTÓRICAS ou EVOLUTIVAS.
Geográficas
Mistas
Também chamadas de ESPACIAIS ou de LOCALIZAÇÃO.
Também chamadas de CATEGÓRICAS.
Combinação de duas ou mais séries.
Tabelas de dupla entrada
Se for uma série mista de FATO e TEMPO,
denominaremos de série específico-temporal.
Se tivermos uma série mista de LOCAL e TEMPO,
denominaremos de série geográfica-temporal.
Enquanto o TEMPO varia, o fato investigado e o local
permanecem constantes.
Enquanto o LOCAL varia, o fato investigado e o tempo
permanecem constantes.
Enquanto o FATO investigado varia, a época e o local
permanecem constantes.
DISTRIBUIÇÃO DE FREQUÊNCIAS
As distribuições de frequências podem ser classificadas em dois tipos: distribuição de frequências pontual
(ou discreta) e distribuição de frequências intervalar (ou contínua).
Elementos de uma Distribuição de Frequências
Item Definição Símbolos e Fórmulas
Número de
Classes
As classes são os intervalos nos quais o
fenômeno é subdividido.
𝑘 = 1 + 3,3 × 𝑙𝑜𝑔 𝑛 𝑘 = √𝑛
Limites de Classe Correspondem aos valores extremos. 𝑙𝑖𝑛𝑓 e 𝑙𝑠𝑢𝑝
Amplitude de um
Intervalo de Classe
Distância entre os limites inferiores (ou
superiores) de classes consecutivas.
ℎ = 𝑙𝑠𝑢𝑝 − 𝑙𝑖𝑛𝑓
Amplitude total
Diferença entre o limite superior da última
classe (limite superior máximo) e o limite
inferior da primeira classe (limite inferior
mínimo).
𝐴𝑇 = 𝑙𝑚á𝑥 − 𝑙𝑚í𝑛 𝐴𝑇 = ℎ × 𝑘
Ponto Médio
Média aritmética simples dos valores
extremos de uma classe.
𝑃𝑀 = (𝑙𝑖𝑛𝑓 + 𝑙𝑠𝑢𝑝)2 𝑃𝑀 = 𝑙𝑖𝑛𝑓 + ℎ2 𝑃𝑀 = 𝑙𝑠𝑢𝑝 − ℎ2
Frequência
Absoluta Simples
Número de observações correspondentes a
uma determinada classe ou a um
determinado valor.
𝑓𝑖
Frequência
Absoluta
Acumulada
Total das frequências de todos os valores
inferiores ao limite superior do intervalo de
uma dada classe
𝑓𝑎𝑐𝑖 = 𝑓1 + 𝑓2 + 𝑓3 + ⋯ + 𝑓𝑖
São apresentados todos os dados
coletados juntamente com suas
respectivas frequências, não havendo
perda de valores.
É agrupamento os valores por intervalos
de classe.
Frequência
Relativa Simples
Proporção de dados existentes em uma
determinada classe.
𝐹𝑖 = 𝑓𝑖∑ 𝑓𝑖 = 𝑓𝑖𝑛
Frequência
Relativa
Acumulada
Proporção de valores inferiores ao limite
superior do intervalo de uma dada classe.
𝐹𝑎𝑐𝑖 = 𝐹1 + 𝐹2 + 𝐹3 + ⋯ + 𝐹𝑖
Densidade de
Frequência
Quociente entre a frequência da classe
(absoluta ou relativa) e sua amplitude 𝑑 = 𝑓ℎ
REPRESENTAÇÕES GRÁFICAS DAS DISTRIBUIÇÕES DE FREQUÊNCIA
Gráfico Definição
O gráfico de hastes ou bastões é muito utilizado para
representar dados não agrupados em classes, o que
normalmente ocorre com dados discretos.
O histograma é um gráfico destinado a representar dados
agrupados em classe, sendo composto por um conjunto de
retângulos contíguos (justapostos).
A poligonal característica é construída utilizando apenas os
contornos do histograma.
O polígono de frequências é um gráfico em linha obtido por
meio da ligação, por segmentos de reta, dos pontos médios das
bases superiores dos retângulos de um histograma.
A curva de frequências é obtida a partir do polimento de um
polígono de frequências
O gráfico de ogiva é empregado na representação de
distribuições de frequências acumuladas, sejam elas crescentes
ou decrescentes
Principais formas de representação de dados estatísticos:
Gráfico Definição
Os gráficos em linha normalmente são usados para representar a
variação dos valores de uma variável ao longo do tempo. Esse tipo de
gráfico permite-nos comparar duas variáveis: uma é traçada no eixo x
(horizontal) e a outra no eixo y (vertical).
Os gráficos em barra normalmente são usados para representar
distribuições de dados categóricos ou qualitativos. Uma série
estatística é representada por um conjunto de retângulos dispostos
horizontalmente, cada um indicando uma categoria particular.
Os gráficos em coluna também são usados para distribuições de
dados categóricos ou qualitativos. A diferença básica é que, agora,
uma série estatística é representada por um conjunto de retângulos
dispostos verticalmente, cada um indicando uma categoria
particular.
O gráfico em setores é usado para representar a frequência relativa
(porcentagem) de uma variável categórica, sendo formado por um
círculo dividido em setores circulares, cada um representando uma
categoria.
O gráfico polar consiste em uma sequência de eixos igualmente
espaçados (ângulos iguais), cada um representando uma das
variáveis. Uma linha é desenhada ligando os valores de cada eixo.
O cartograma é empregado com a finalidade de apresentar dados
estatísticos diretamente relacionados com áreas geográficas.
O pictograma substitui valores por ícones, tornando os dados mais
atraentes e facilitando o entendimento acerca de um determinado
fenômeno.
O gráfico de dispersão é uma representação de pares ordenados em
um plano cartesiano, composto por um eixo vertical (ordenada) e
um eixo horizontal (abcissa). Os dados são representados como uma
coleção de pontos.
O diagrama de ramos e folhas fornece uma maneira rápida de
representar graficamente a distribuição dos dados. Nele, cada
número é separado em duas partes. Em geral, de um lado ficam as
unidades do número e do outro lado fica o restante desse número.
QUESTÕES COMENTADAS
Introdução à Estatística
1. (VUNESP/Câmara Municipal de São Carlos/2013) Trata-se da estatísticaque tem as atribuições de
obtenção, organização, redução e representação de dados estatísticos, bem como a obtenção de algumas
informações que auxiliam na descrição de um fenômeno observado. Esta estatística é denominada
a) Coletora.
b) Celetista.
c) Populacional.
d) Amostral.
e) Descritiva.
Comentários:
A Estatística está dividida em três grandes ramos, a saber:
a) Estatística Descritiva (ou Dedutiva) - responsável pela coleta (ou obtenção), organização, redução
e representação de dados estatísticos;
b) Estatística Probabilística - responsável por estabelecer o modelo matemático probabilístico adotado
para explicar os fenômenos aleatórios investigados pela Estatística; e
c) Estatística Inferencial (ou Indutiva) - responsável pela análise e interpretação dos dados.
Portanto, a alternativa correta é a letra E.
Gabarito: E.
QUESTÕES COMENTADAS
Conceitos Iniciais
1. (CESGRANRIO/BB/2021) Responsável por entender o comportamento dos produtos oferecidos por
determinado banco onde trabalhava, e preocupado com a quantidade enorme de dados disponíveis para
a análise, um funcionário decidiu extrair um subconjunto desses dados.
Esse subconjunto é conhecido como
a) amostra
b) censo
c) parâmetro
d) população
e) variável
Comentários:
A questão traz o conceito de amostra. Uma amostra é um subconjunto extraído da população para análise,
que deve ser representativo. A partir das informações coletadas da amostra representativa, os resultados
obtidos podem ser utilizados para generalizar, inferir ou tirar conclusões acerca da população. Portanto, o
subconjunto coletado do banco de dados, que representa a população, é a amostra.
Vejamos as definições das demais alternativas:
Alternativa B: o censo, ou recenseamento, é um estudo dos dados referentes a todos os elementos de uma
população.
Alternativa C: os parâmetros são descrições numéricas de características populacionais que raramente são
conhecidas.
Alternativa D: uma população é um conjunto que contém todos os indivíduos, objetos ou elementos a serem
estudados, que apresentam uma ou mais características em comum.
Alternativa E: uma variável é uma característica de relevância que é medida em cada componente da amostra
ou população. As variáveis podem ter valores numéricos (variáveis quantitativas) ou não numéricos
(variáveis qualitativas).
Gabarito: A.
2. (CESPE/PGDF/2021) Certa empresa desejava conhecer as opiniões de seus 20.000 funcionários acerca
da confiança que eles têm no canal interno de denúncias. Para tanto, elaborou-se um questionário
eletrônico que foi remetido, por email, para todos os endereços eletrônicos cadastrados, tendo sido
desenvolvidos mecanismos para evitar que uma pessoa respondesse em lugar de outra, ou que uma
mesma pessoa respondesse mais de uma vez. O questionário foi respondido por 400 pessoas, das quais
68% disseram confiar no processo de apuração de denúncias e 32% disseram ter reservas quanto ao
processo. Verificou-se ainda que cerca de 500 mensagens retornaram por falha no cadastro dos endereços
eletrônicos (erros de digitação), e que algumas respostas foram atribuídas a pessoas que não são mais
funcionários; ainda, os endereços eletrônicos de alguns funcionários recém contratados não constavam
do cadastro.
Com relação a essa situação hipotética, julgue o item a seguir.
As informações apresentadas permitem afirmar que a população- alvo da pesquisa difere da população
referenciada.
Comentários:
Vamos analisar as informações contidas no enunciado da questão:
i) a empresa desejava conhecer a opinião dos seus 20.000 funcionários, logo, essa é a população-alvo da
pesquisa;
ii) o questionário foi enviado por e-mail aos funcionários cadastrados, portanto, essa é a população
referenciada da pesquisa;
iii) apenas 400 (quatrocentas) pessoas responderam ao questionário, tendo havido falha na entrega de 500
mensagens;
iv) da população referenciada, alguns funcionários não trabalhavam mais na empresa; e
v) da população-alvo, alguns funcionários novos não estavam cadastrados no e-mail.
Assim, podemos concluir que a população-alvo não foi alcançada, visto que era diferente da população
referenciada, isto é, das pessoas cadastradas no serviço de e-mail.
Gabarito: Certo.
3. (VUNESP/Pref. Valinhos/2019) O grupo completo de unidades elementares de pessoas, objetos ou
coisas é denominado, para a estatística, de
a) Amostra.
b) Unidades.
c) Censo.
d) População.
e) Variáveis.
Comentários:
Para resolvermos a questão vamos conceituar cada uma das alternativas:
• Letra A: amostra é um subconjunto de uma população. Os dados coletados e/ou selecionados de
uma população estatística por um procedimento definido, denotado de amostragem.
• Letra B: unidades são elementos da amostra (unidades amostrais) ou da população (unidade
populacional).
• Letra C: censo consiste na análise de todos os elementos da população.
• Letra D: população é o grupo completo de unidades elementares de pessoas, objetos ou coisas, ou
seja, constitui todo o universo de informações de que se necessita.
• Letra E: variável é a característica de relevância que é medida em cada componente da amostra ou
população. As variáveis podem ter valores numéricos (variáveis quantitativas) ou não numéricos
(variáveis qualitativas).
Gabarito: D.
4. (CESPE/DEPEN/2015) O diretor de um sistema penitenciário, com o propósito de estimar o percentual
de detentos que possuem filhos, entregou a um analista um cadastro com os nomes de 500 detentos da
instituição para que esse profissional realizasse entrevistas com os indivíduos selecionados.
A partir dessa situação hipotética e dos múltiplos aspectos a ela relacionados, julgue o item, referente a
técnicas de amostragem.
A diferença entre um censo e uma amostra consiste no fato de esta última exigir a realização de um número
maior de entrevistas.
Comentários:
Um censo é a análise de todos os elementos de determinada população. Trabalhamos com uma amostra
quando obtemos informações de apenas uma parte dessa população. Portanto, o censo requer a realização
de um número maior de entrevistas.
Gabarito: Errado.
5. (FCC/DPE-SP/2010) Sobre estatística aplicada, é correto o que se afirma em:
a) Parâmetros são medidas características de grupos, determinadas por meio de uma amostra aleatória.
b) A estatística descritiva é a técnica pela são coletados dados de uma amostra, a partir do que são tomadas
decisões sobre uma determinada população.
c) A caracterização de uma população se dá por meio da observação de todos os seus componentes que a
integram.
d) A estatística inferencial compreende um conjunto de técnicas destinadas à síntese de dados numéricos.
e) Censo é o processo utilizado para se medir as características de todos os membros de uma dada
população.
Comentários:
Vejamos cada uma das alternativas:
• Letra A: na aula de amostragem, veremos que os parâmetros são as medidas características da
população. Os valores obtidos da amostra são as estimativas da população. Logo, a alternativa A está
errada.
• Letra B: é a Estatística Inferencial que possui técnicas para tomada de decisões sobre a população a
partir de uma amostra. Portanto, a alternativa B está errada.
• Letra C: utilizamos justamente a Estatística Inferencial para caracterizar toda a população a partir da
observação de uma parte de seus elementos (amostra). Dessa forma, a alternativa C está errada.
• Letra D: é a Estatística Descritiva que possui técnicas para síntese de dados numéricos. Assim, a
alternativa D está errada.
• Letra E: o censo consiste na coleta de dados de todos os elementos de uma população. Portanto, a
alternativa E está correta.
Gabarito: E.
6. (CESPE/SEFAZ-AL/2002) Julgue os seguintes itens.
Um censo consiste no estudo de todos os indivíduos da população considerada.
Comentários:
O conceito apresentadoestá correto. O censo consiste na obtenção dos dados de todos os elementos da
população considerada.
Gabarito: Certo.
7. (CESPE/SEFAZ-AL/2002) Julgue os seguintes itens.
Como a realização de um censo tipicamente é muito onerosa e (ou) demorada, muitas vezes é conveniente
estudar um subconjunto próprio da população, denominado amostra.
Comentários:
O item está correto. Como normalmente é muito caro e demorado obter os dados de toda a população,
trabalhamos apenas com uma parte dela, que chamamos de amostra.
Gabarito: Certo.
QUESTÕES COMENTADAS
Variáveis Estatísticas
1. (CESPE/DPE-RO/2022)
Variável Valores
estado civil casado, solteiro, divorciado
quantidade de filhos 0, 1, 2, 3 ...
salário 6.510,25; 7.915,68
idade 22, 23, 27
Com relação às variáveis apresentadas na tabela anterior, julgue os itens a seguir.
I. A variável estado civil é qualitativa nominal.
II. A variável quantidade de filhos é quantitativa discreta.
III. As variáveis salário e estado civil são quantitativas discretas.
IV. As variáveis idade e quantidade de filhos são qualitativas nominais.
Estão certos apenas os itens
a) I e II.
b) II e III.
c) III e IV.
d) I, II e IV.
e) I, III e IV.
Comentários:
Vamos analisar cada variável da tabela:
A variável "estado civil" é qualitativa nominal. Dizemos que a variável "estado civil" é qualitativa pois ela não
possui um sentido numérico ou quantitativo. Também podemos afirmar que é nominal por não possuir
significado matemático, logo, as possíveis categorias não podem ser ordenadas.
A variável "quantidade de filhos" é quantitativa e discreta. É quantitativa porque possui valor quantitativo,
exprime uma quantidade. Também podemos afirmar que a variável é discreta porque ela possui uma
quantidade finita de valores. Os possíveis valores formam um conjunto finito ou enumerável de números e,
em geral, resultam de um processo de contagem.
A variável "salário" é quantitativa e discreta. É quantitativa pois possui valor quantitativo, exprimindo uma
quantidade. Também podemos afirmar que é discreta porque possui uma quantidade finita de valores.
A variável "idade" é quantitativa e discreta. É quantitativa pois possui valor quantitativo, exprime uma
quantidade. Também podemos afirmar que é discreta porque possui uma quantidade finita de valores.
Portanto, analisando os itens, podemos constatar que os únicos corretos são os itens I e II.
Gabarito: A.
2. (CESPE/DPE-RO/2022) O valor de um atributo de um dado objeto é uma medida da quantidade daquele
atributo, a qual pode ser numérica ou categórica.
Nesse caso, estado civil e sexo são classificados como atributo
a) binário.
b) nominal.
c) ordinal.
d) ausente.
e) razão.
Comentários:
As variáveis qualitativas representam as características que não podem ser descritas de forma numérica, mas
que podem ser definidas por meio de qualidades (atributos ou categorias) do indivíduo pesquisado. No caso,
as variáveis "estado civil" e "sexo" são qualitativas nominais (ou categóricas), pois as categorias não podem
ser ordenadas nem possuem significado matemático.
Gabarito: B.
3. (CESGRANRIO/BB/2021) Foi solicitado a um funcionário de um determinado banco que realizasse uma
pesquisa, exclusivamente com variáveis do tipo qualitativa, sobre a satisfação dos clientes com os serviços
oferecidos pela instituição.
Para atender a essa demanda utilizando os meios adequados, sua escolha de escalas de mensuração deve
estar limitada às escalas
a) intervalares e razão
b) nominais e intervalares
c) nominais e ordinais
d) ordinais e intervalares
e) ordinais e razão
Comentários:
As variáveis qualitativas representam as características que não podem ser descritas de forma numérica, mas
que podem ser definidas por meio de qualidades (atributos ou categorias) do indivíduo pesquisado. Elas
podem ser classificadas em nominais ou ordinais:
i) variável qualitativa nominal (ou categórica), quando as possíveis categorias não podem ser ordenadas. Por
exemplo, as cores dos olhos dos moradores de uma determinada cidade (pretos, castanhos, azuis e verdes);
ii) variável qualitativa ordinal, as possíveis categorias podem ser ordenadas de alguma forma. Por exemplo,
o grau de instrução dos funcionários de um determinado órgão (fundamental, médio e superior).
Gabarito: C.
4. (CESPE/IPHAN/2018). Julgue o item subsequente, referente à análise exploratória de dados.
O gráfico de barras é adequado para a análise de variáveis qualitativas ordinais ou quantitativas discretas,
pois permite investigar a presença de tendência nos dados.
Comentários:
O gráfico em barras normalmente é usado para representar distribuições de dados categóricos ou
qualitativos. Por meio desse gráfico, uma série estatística é representada por um conjunto de retângulos
dispostos horizontalmente, cada um indicando uma categoria em particular, os quais possuem a mesma
altura e comprimentos proporcionais aos respectivos dados.
Para ficar claro, apresentamos um gráfico de barras como exemplo:
População brasileira, por Grandes Regiões, em 2010 (x1000)
Fonte: Censo Demográfico 1970/2010 (IBGE)
Gabarito: Certo.
5. (FGV/COMPESA/2018) A COMPESA, em uma pesquisa de satisfação dos usuários, preparou um
formulário para traçar os perfis de seus clientes e o grau de satisfação com os serviços da empresa,
Em um formulário, ela solicitou os dados a seguir.
I. Idade.
II. Grau de escolaridade.
III. Faixa de renda familiar.
IV. Nota dada ao serviço.
Assinale a opção que contempla apenas variáveis categóricas.
a) I e II.
b) II e III.
c) III e IV.
d) I, II e III.
e) I, II e IV.
Comentários:
As variáveis podem ser classificadas em:
a) variáveis quantitativas: são as características que podem ser medidas em uma escala quantitativa, isto é,
numérica. Elas podem ser contínuas ou discretas:
i) variáveis discretas: características mensuráveis que podem assumir apenas um número finito ou
infinito contável de valores e, assim, somente fazem sentido valores inteiros. Geralmente são o
resultado de contagens. Exemplos: número de membros de uma família, número de carros
produzidos por dia.
ii) variáveis contínuas: características mensuráveis que assumem valores em uma escala contínua (na
reta real), nesse caso, valores fracionários fazem sentido. Geralmente são medidas por meio de algum
instrumento. Exemplos: peso e altura.
b) variáveis qualitativas (ou categóricas): são as características que não possuem valores quantitativos. Nesse
caso, são definidas por várias categorias, ou seja, representam uma classificação dos indivíduos. Elas podem
ser nominais ou ordinais:
i) variáveis nominais: não existe uma ordenação entre as categorias. Exemplos: sexo, estado civil, cor
dos olhos.
ii) variáveis ordinais: existe uma ordenação entre as categorias. Exemplos: grau de instrução
(fundamental, médio, superior), nível de aprendizado (básico, intermediário, avançado), nível de
queimadura (1°, 2°, 3° graus).
Com base nos conceitos apresentados concluímos que:
I. Idade. (Quantitativa)
II. Grau de escolaridade. (Categórica)
III. Faixa de renda familiar. (Categórica)
IV. Nota dada ao serviço. (Quantitativa)
Gabarito: B.
6. (VUNESP/CM São Joaquim Barra/2018) A Estatística descritiva faz uso de variáveis, que são classificadas
como quantitativas ou qualitativas. Assinale a alternativa correta em relação a essas variáveis.
a) Quantitativas referem-se às variáveis ordinal ou discreta; as qualitativas referem-se às variáveis nominal
ou contínua.
b) Quantitativas referem-se às variáveis ordinal ou contínua; as qualitativas referem-se às variáveis nominal
ou discreta.
c) Quantitativas referem-se às variáveis nominal ou contínua; as qualitativas referem-se às variáveis discreta
ou ordinal.
d) Quantitativas referem-se às variáveis contínua ou discreta; as qualitativasreferem-se às variáveis nominal
ou ordinal.
e) Quantitativas referem-se às variáveis nominal ou ordinal; as qualitativas referem-se às variáveis contínua
ou discreta.
Comentários:
As variáveis podem ser classificadas em:
a) variáveis quantitativas: são as características que podem ser medidas em uma escala quantitativa, isto é,
numérica. Elas podem ser contínuas ou discretas:
i) variáveis discretas: características mensuráveis que podem assumir apenas um número finito ou
infinito contável de valores e, assim, somente fazem sentido valores inteiros. Geralmente são o
resultado de contagens. Exemplos: número de membros de uma família, número de carros
produzidos por dia.
ii) variáveis contínuas: características mensuráveis que assumem valores em uma escala contínua (na
reta real), nesse caso, valores fracionários fazem sentido. Geralmente são medidas por meio de algum
instrumento. Exemplos: peso e altura.
b) variáveis qualitativas (ou categóricas): são as características que não possuem valores quantitativos. Nesse
caso, são definidas por várias categorias, ou seja, representam uma classificação dos indivíduos. Elas podem
ser nominais ou ordinais:
i) variáveis nominais: não existe uma ordenação entre as categorias. Exemplos: sexo, estado civil, cor
dos olhos.
ii) variáveis ordinais: existe uma ordenação entre as categorias. Exemplos: grau de instrução
(fundamental, médio, superior), nível de aprendizado (básico, intermediário, avançado), nível de
queimadura (1°, 2°, 3° graus).
Gabarito: D.
7. (VUNESP/IPSM-SJC/2018) A tabela apresenta o número de acertos de 100 candidatos a uma vaga de
emprego, em uma avaliação contendo 5 questões de múltipla escolha.
Número de Acertos Número de Candidatos
0 4
1 11
2 13
3 16
4 22
5 34
Com base nas informações apresentadas na tabela, é correto afirmar que
a) 22 candidatos acertaram a questão de número 4.
b) Menos da metade dos candidatos acertaram mais da metade das questões.
c) 28 candidatos acertaram, no máximo, duas questões.
d) Mais da metade dos candidatos acertaram menos da metade das questões.
e) 15 candidatos acertaram, pelo menos, uma questão.
Comentários:
Analisando as alternativas, temos:
• Letra A: observando a última linha da tabela, concluímos que 34 candidatos que gabaritaram a prova.
Logo, ao menos esses 34 acertaram a quarta questão da prova. Portanto, se há 34 que a acertaram,
é possível formar um subgrupo contendo 22 candidatos. Porém, o examinador deu a entender que
devemos considerar que a palavra “exatamente” está implícita no enunciado, tornando a alternativa
incorreta.
• Letra B: os candidatos das três últimas linhas da tabela acertaram mais da metade das questões. São
aqueles que acertaram 3, 4 ou 5 questões. Somando as quantias correspondentes (16 + 22 + 34),
concluímos que 72 candidatos acertaram mais de metade das questões. Isso corresponde a mais de
50% do total de alunos. Logo, alternativa incorreta.
• Letra C: De fato, 4 candidatos erraram todas; 11 candidatos acertaram (exatamente) uma questão e
13 candidatos acertaram (exatamente) duas questões, formando um total de 4 + 11 + 13 = 28.
Portanto, alternativa correta.
• Letra D: os candidatos das três primeiras linhas da tabela acertaram menos da metade das questões.
São aqueles que acertaram 0, 1 ou 2 questões. Somando as quantias correspondentes (4 + 11 + 13),
concluímos que 28 candidatos acertaram mais de metade das questões. Isso corresponde a menos
de 50% do total de alunos. Assim, a alternativa está incorreta.
• Letra E: aqui temos o mesmo caso da letra A. Precisamos supor implícita a palavra “exatamente”.
Exatamente 15 candidatos acertaram, pelo menos, uma questão. Dos 100 candidatos, só 4 erraram
todas as questões da prova. Os outros 100 − 4 = 96 acertaram pelo menos uma questão. Dessa
forma, a alternativa está incorreta.
Gabarito: C.
8. (VUNESP/IPSM-SJC/2018) Considere as informações a seguir para construir uma distribuição de
frequência sem intervalo de classe e responder a questão.
Um dado foi lançado 50 vezes e foram registrados os seguintes resultados:
5 4 6 1 2 5 3 1 3 3
4 4 1 5 5 6 1 2 5 1
3 4 5 1 1 6 6 2 1 1
4 4 4 3 4 3 2 2 2 3
6 6 3 2 4 2 6 6 2 1
A frequência simples relativa do primeiro elemento é
a) 10%.
b) 20%.
c) 50.
d) 7.
e) 20.
Comentários:
A frequência absoluta é o número de vezes em que uma determinada variável assume um valor, enquanto a
frequência relativa é o quociente entre a frequência absoluta da classe correspondente e a soma das
frequências (total observado).
Para os dados apresentados, temos que
Valor obtido no lançamento Frequência absoluta Frequência relativa
1 10 10/50 = 0,2 = 20%
2 9 9/50 = 0,18 = 18%
3 8 8/50 = 0,16 = 16%
4 9 9/50 = 0,18 = 18%
5 6 6/50 = 0,12 = 12%
6 8 8/50 = 0,16 = 16%
Total 50 100%
Portanto, a frequência absoluta simples do primeiro elemento é igual a 20%.
Gabarito: B.
9. (VUNESP/IPSM-SJC/2018) Considere as informações a seguir para construir uma distribuição de
frequência sem intervalo de classe e responder a questão. Um dado foi lançado 50 vezes e foram
registrados os seguintes resultados:
5 4 6 1 2 5 3 1 3 3
4 4 1 5 5 6 1 2 5 1
3 4 5 1 1 6 6 2 1 1
4 4 4 3 4 3 2 2 2 3
6 6 3 2 4 2 6 6 2 1
A frequência simples relativa do quinto elemento é
a) 12%.
b) 84%.
c) 5.
d) 6.
e) 42.
Comentários:
A frequência absoluta é o número de vezes em que uma determinada variável assume um valor, enquanto a
frequência relativa é o quociente entre a frequência absoluta da classe correspondente e a soma das
frequências (total observado).
Para os dados apresentados, temos que
Valor obtido no lançamento Frequência absoluta Frequência relativa
1 10 10/50 = 0,2 = 20%
2 9 9/50 = 0,18 = 18%
3 8 8/50 = 0,16 = 16%
4 9 9/50 = 0,18 = 18%
5 6 6/50 = 0,12 = 12%
6 8 8/50 = 0,16 = 16%
Total 50 100%
Portanto, a frequência relativa simples do quinto elemento é igual a 12%.
Gabarito: A.
10. (VUNESP/TJM-SP/2017) A tabela apresenta o número de acertos dos 600 candidatos que realizaram a
prova da segunda fase de um concurso, que continha 5 questões de múltipla escolha.
Número de
acertos
Número de
candidatos
5 204
4 132
3 96
2 78
1 66
0 24
Analisando-se as informações apresentadas na tabela, é correto afirmar que
a) Mais da metade dos candidatos acertou menos de 50% da prova.
b) Menos da metade dos candidatos acertou mais de 50% da prova.
c) Exatamente 168 candidatos acertaram, no mínimo, 2 questões.
d) 264 candidatos acertaram, no máximo, 3 questões.
e) 132 candidatos acertaram a questão de número 4.
Comentários:
Analisando as alternativas, temos:
• Letra A: A prova tinha 5 questões. Metade da prova corresponde a 2,5 questões. Portanto, acertaram
"menos da metade da prova" quem teve 0, 1 ou 2 acertos, o que perfaz um total de 78 + 66 + 24 =168. Portanto, temos que 168 pessoas acertaram menos da metade da prova. Logo, menos da
metade dos candidatos (300) acertaram menos da metade da prova. Dessa forma, alternativa
incorreta.
• Letra B: já temos a informação na letra A de que 168 pessoas acertaram menos da metade da prova.
Logo, a quantidade de pessoas que acertaram mais da metade da prova é: 600 − 168 = 432.
Portanto, temos que 432 pessoas acertaram mais da metade da prova. Logo, mais da metade das
pessoas (300) acertou mais de 50% da prova. Logo, alternativa incorreta.
• Letra C: já vimos na letra A que 168 candidatos acertaram 0, 1 ou 2 questões; portanto, acertaram no
máximo duas questões. Já a quantidade dos que acertaram no mínimo duas questões é dada por: 204 + 132 + 96 + 78 = 432 + 78 = 510. Assim, podemos afirmar que a alternativa está incorreta.
• Letra D: 168 candidatos que acertaram até duas questões (vide letra A). Somando com os 96 que
acertaram exatamente3 questões, temos 168 + 96 = 264. Portanto, alternativa correta.
• Letra E: sabemos que 132 candidatos acertaram exatamente quatro questões. Mas não temos como
saber quantos acertaram a quarta questão da prova. Além disso, nas demais linhas da tabela, ou seja,
nas linhas referentes às pessoas que acertaram 1 questão, 2 questões, 3 questões, ou 5 questões, é
perfeitamente possível termos mais gente acertando a questão 04. Assim, alternativa Incorreta.
Gabarito: D.
11. (CESPE/TCE-PA/2016)
Um indicador de desempenho X permite avaliar a qualidade dos processos de governança de instituições
públicas. A figura mostra, esquematicamente, a sua distribuição, obtida mediante estudo amostral feito
por determinada agência de pesquisa. A tabela apresenta estatísticas descritivas referentes a essa
distribuição.
Com base nessas informações, julgue o item a seguir.
X representa uma variável qualitativa ordinal.
Comentários:
As variáveis podem ser classificadas em:
a) variáveis quantitativas: são as características que podem ser medidas em uma escala quantitativa, isto é,
numérica, podendo ser contínuas ou discretas.
b) variáveis qualitativas (ou categóricas): são as características que não possuem valores quantitativos. Nesse
caso, são definidas por várias categorias, ou seja, representam uma classificação dos indivíduos. Podem ser
nominais ou ordinais.
Analisando as informações dadas na questão, percebemos que X pode adotar valores que vão de 0 (mínimo)
a 3,10 (máximo). Logo, como X assume valores numéricos, dizemos que ela é uma variável quantitativa.
Gabarito: Errado.
12. (CESPE/TELEBRAS/2015)
Uma empresa coletou e armazenou em um banco de dados diversas informações sobre seus clientes, entre
as quais estavam o valor da última fatura vencida e o pagamento ou não dessa fatura. Analisando essas
informações, a empresa concluiu que 15% de seus clientes estavam inadimplentes. A empresa recolheu
ainda dados como a unidade da Federação (UF) e o CEP da localidade em que estão os clientes. Do conjunto
de todos os clientes, uma amostra aleatória simples constituída por 2.175 indivíduos prestou também
informações sobre sua renda domiciliar mensal, o que gerou o histograma apresentado. Com base nessas
informações e no histograma, julgue o item a seguir.
O CEP da localidade dos clientes e o valor da última fatura vencida são variáveis quantitativas.
Comentários:
O CEP, embora possua uma representação numérica, não exprime quantidades e, portanto, não é uma
variável quantitativa. Esse código número apenas qualifica as ruas de um determinado endereço, podendo
ser classificada como uma variável qualitativa.
O valor da última fatura vencida, por sua vez, é sim uma variável quantitativa.
Gabarito: Errado.
13. (CESPE/TELEBRAS/2015) Roberto comprou, por R$ 2.800,00, rodas de liga leve para seu carro, e, ao
estacionar no shopping, ficou indeciso sobre onde deixar o carro, pois, caso o coloque no estacionamento
público, correrá o risco de lhe roubarem as rodas, ao passo que, caso o coloque no estacionamento
privado, terá de pagar R$ 70,00, com a garantia de que eventuais prejuízos serão ressarcidos pela empresa
administradora.
Considerando que p seja a probabilidade de as rodas serem roubadas no estacionamento público, que X
seja a variável aleatória que representa o prejuízo, em reais, ao deixar o carro no estacionamento público,
e que Y seja a variável aleatória que representa o valor, em reais, desembolsado por Roberto ao deixar o
carro no estacionamento pago, julgue o item subsequente.
A variável aleatória Y é contínua.
Comentários:
As variáveis quantitativas podem ser classificadas em:
a) variáveis contínuas: características mensuráveis que assumem valores em uma escala contínua, nesse
caso, valores fracionários fazem sentido;
b) variáveis discretas: características mensuráveis que podem assumir apenas um número finito ou infinito
contável de valores e, assim, somente fazem sentido valores inteiros.
No problema em questão, a variável aleatória Y pode assumir o valor R$ 70,00, se Roberto deixar o carro no
estacionamento pago; ou o valor R$ 0,00, se Roberto não deixar o carro no estacionamento pago. Portanto,
Y é uma variável aleatória discreta.
Gabarito: Errado.
14. (CESPE/TJ-SE/2014)
Quantidade
São Paulo
(j =1)
Rio de
Janeiro
(j =2)
Minas
Gerais
(j =3)
Rio Grande
do Sul
(j =4)
Total
Casos novos
(X, em milhões)
5 2 1 2 18
Casos pendentes
(Y, em milhões)
16 8 3 2 48
Processos baixados
(Z, em milhões)
5 2 2 2 18
Sentenças e Decisões
(W, em milhões)
4 3 1 1 16
O quadro acima mostra uma síntese da movimentação processual dos tribunais de justiça dos estados de
São Paulo, Rio de Janeiro, Minas Gerais, Rio Grande do Sul e do total da justiça estadual no Brasil em 2010.
Considere que o estoque de processos em andamento no estado j (𝑬𝒋), no final de 2010, seja um indicador
que se define como 𝑬𝒋 = 𝑿𝒋 + 𝒀𝒋 − 𝒁𝒋 − 𝑾𝒋, em que j = 1, 2, ..., 27; 𝑿𝒋 representa o número de casos
novos registrados em 2010 no estado j; Yj seja a quantidade de casos pendentes no estado j (i.e., casos
anteriores que não foram solucionados até o final de 2010); 𝒁𝒋 denota o total de processos baixados
(arquivados) no estado j durante 2010 e 𝑾𝒋 seja o número de sentenças e decisões proferidas no estado j
até o final de 2010. Considere, por fim, que, para todos os efeitos, o Distrito Federal seja um estado. Com
base nessas informações e no quadro acima, julgue o item que se segue.
O quadro apresentado é uma tabela de contingência que mostra o cruzamento entre uma variável qualitativa
nominal com 4 níveis de resposta (estados) e outra variável qualitativa com quatro níveis de resposta (casos
novos, pendentes, baixados e resolvidos).
Comentários:
As variáveis podem ser classificadas em:
a) variáveis quantitativas: são as características que podem ser medidas em uma escala quantitativa, isto é,
numérica. Elas podem ser contínuas ou discretas:
i) variáveis discretas: características mensuráveis que podem assumir apenas um número finito ou
infinito contável de valores e, assim, somente fazem sentido valores inteiros. Geralmente são o
resultado de contagens. Exemplos: número de membros de uma família, número de carros
produzidos por dia.
ii) variáveis contínuas: características mensuráveis que assumem valores em uma escala contínua (na
reta real), nesse caso, valores fracionários fazem sentido. Geralmente são medidas por meio de algum
instrumento. Exemplos: peso e altura.
b) variáveis qualitativas (ou categóricas): são as características que não possuem valores quantitativos. Nesse
caso, são definidas por várias categorias, ou seja, representam uma classificação dos indivíduos. Elas podem
ser nominais ou ordinais:
i) variáveis nominais: não existe uma ordenação entre as categorias. Exemplos: sexo, estado civil, cor
dos olhos.
ii) variáveis ordinais: existe uma ordenação entre as categorias. Exemplos: grau de instrução
(fundamental, médio, superior), nível de aprendizado (básico, intermediário, avançado), nível de
queimadura (1°, 2°, 3° graus).
No problema em questão, a tabela não representa uma variável qualitativa, mas sim quantitativa, vez que
podemos atribuir valores às variáveis X, Y, Z e W.
Gabarito: Errado.
15. (CESPE/STF/2013)
Com referência à figura acima, que mostra a distribuição da renda mensal — x, em quantidades de salários
mínimos (sm) — das pessoas que residem em determinada região, julgue o item subsequente.
A variável x, por possuir quatro níveis de respostas, é do tipo qualitativa ordinal.
Comentários:
O gráfico representa um histograma, em que as pessoas foram classificadas de acordo com as quantidades
de salários-mínimos recebidos. Reparem na existência de três intervalos de classe (5 a 10; 10 a 15; e 15 a
20). Portanto, a variável x exprimea quantidade de salários-mínimos, sendo classificada como uma variável
quantitativa.
Gabarito: Errado.
16. (CESPE/TRE-ES/2011)
Quantidade de eleitores Quantidade de municípios 0 ⊢ 2.000 364 2.000 ⊢ 4.000 1.000 4.000 ⊢ 6.000 3.000 6.000 ⊢ 8.000 1.000 8.000 ⊢ 10.000 200
Total 5.564
A tabela acima apresenta uma distribuição hipotética das quantidades de eleitores que não votaram no
segundo turno da eleição para presidente da República bem como os números de municípios em que essas
quantidades ocorreram. Com base nessa tabela, julgue o item seguinte, relativo à análise exploratória de
dados.
Na tabela de frequências, o uso de intervalos de classe permite concluir que a variável em questão é
contínua.
Comentários:
As variáveis quantitativas podem ser classificadas em:
a) variáveis contínuas: características mensuráveis que assumem valores em uma escala contínua, nesse
caso, valores fracionários fazem sentido;
b) variáveis discretas: características mensuráveis que podem assumir apenas um número finito ou infinito
contável de valores e, assim, somente fazem sentido valores inteiros.
A questão apenas agrupou a quantidade de eleitores em classes, mas continua sendo uma variável discreta.
Gabarito: Errado.
17. (CESPE/TRE-ES/2011)
Cargo Candidatos Candidatos aptos Eleitos
Presidente da República 9 9 1
Governador de Estado 170 156 27
Senador 272 234 54
Deputado Federal 6.021 5.058 513
Deputado
Estadual/Distrital
15.268 13.076 1.059
Total 21.640 18.533 1.658
Internet: <www.tse.gov > (com adaptações).
Com base na tabela acima, referente às eleições de 2010, que apresenta a quantidade de candidatos para
os cargos de presidente da República, governador de estado, senador, deputado federal e deputado
estadual/distrital, bem como a quantidade de candidatos considerados aptos pela justiça eleitoral e o total
de eleitos para cada cargo pretendido, julgue o item a seguir.
A variável "cargo" classifica-se como uma variável qualitativa ordinal.
Comentários:
As variáveis podem ser classificadas em:
a) variáveis quantitativas: são as características que podem ser medidas em uma escala quantitativa, isto é,
numérica. Elas podem ser contínuas ou discretas:
i) variáveis discretas: características mensuráveis que podem assumir apenas um número finito ou
infinito contável de valores e, assim, somente fazem sentido valores inteiros. Geralmente são o
resultado de contagens. Exemplos: número de membros de uma família, número de carros
produzidos por dia;
ii) variáveis contínuas: características mensuráveis que assumem valores em uma escala contínua (na
reta real), nesse caso, valores fracionários fazem sentido. Geralmente são medidas por meio de algum
instrumento. Exemplos: peso e altura.
b) variáveis qualitativas (ou categóricas): são as características que não possuem valores quantitativos. Nesse
caso, são definidas por várias categorias, ou seja, representam uma classificação dos indivíduos. Elas podem
ser nominais ou ordinais:
i) variáveis nominais: não existe uma ordenação entre as categorias. Exemplos: sexo, estado civil, cor
dos olhos;
ii) variáveis ordinais: existe uma ordenação entre as categorias. Exemplos: grau de instrução
(fundamental, médio, superior), nível de aprendizado (básico, intermediário, avançado), nível de
queimadura (1°, 2°, 3° graus).
Com base nesses conceitos, podemos afirmar que o cargo é realmente uma variável qualitativa, pois
classifica os indivíduos, e ordinal, pois estabelece uma ordem para os cargos (a tabela está ordenada pela
coluna número de eleitos).
Gabarito: Certo.
18. (CESPE/TCU/2008) Uma agência de desenvolvimento urbano divulgou os dados apresentados na tabela
a seguir, acerca dos números de imóveis ofertados (X) e vendidos (Y) em determinado município, nos anos
de 2005 a 2007.
Ano
Número de imóveis
Ofertados (X) Vendidos (Y)
2005 1.500 100
2006 1.750 400
2007 2.000 700
Correios Braziliense, 29/4/2008, p.17 (com adaptações)
Com respeito ao texto, considere que cada imóvel ofertado em determinado ano seja classificado como
vendido ou não-vendido, e, a um imóvel e classificado como vendido seja atribuído um valor Z = 1, e, ao
imóvel classificado como não-vendido, seja atribuído um valor Z = 0. Supondo-se que as classificações dos
imóveis como vendido ou não-vendido em um dado ano possam ser consideradas como sendo realizações
de uma amostragem aleatória simples, julgue os itens a seguir.
A variável Z é classificada como variável qualitativa nominal, pois representa o atributo do imóvel como
vendido ou não-vendido.
Comentários:
Analisando os dados fornecidos no enunciado, observamos que a variável Z é uma variável qualitativa que
assume os valores nominais “vendido” ou “não vendido”. No entanto, a questão atribuiu valores numéricos
à variável, 1 para vendido e 0 para não vendido. Diante disso, a variável Z também passou a ser classificada
como variável quantitativa.
Gabarito: Errado.
QUESTÕES COMENTADAS
Séries Estatísticas
1. (CESPE/ANTAQ/2009)
Variável 2003 2004 2005 2006 2007
Exportação X 40 46 50 52 54
Importação Y 20 21 22 24 27
Total X+Y 60 67 72 76 81
Internet: <www.portodesantos.com> (com adaptações).
Considerando a tabela acima, que apresenta a movimentação anual de cargas no porto de Santos de 2003
a 2007, em milhões de toneladas/ ano e associa as quantidades de carga movimentadas para exportação
e importação às variáveis X e Y, respectivamente, julgue o item subsequente.
As séries estatísticas apresentadas na tabela formam três séries temporais.
Comentários:
Sabemos que uma série temporal é uma sequência de dados observados em um período de tempo. No caso
da tabela, temos três séries cronológicas correspondentes às variáveis X (exportação); Y (importação); e X+Y
(total).
Gabarito: Certo.
2. (CESPE/TCU/2008) Uma agência de desenvolvimento urbano divulgou os dados apresentados na tabela
a seguir, acerca dos números de imóveis ofertados (X) e vendidos (Y) em determinado município, nos anos
de 2005 a 2007.
Ano
Número de imóveis
Ofertados (X) Vendidos (Y)
2005 1.500 100
2006 1.750 400
2007 2.000 700
Correios Braziliense, 29/4/2008, p.17 (com adaptações)
Considerando as informações do texto, julgue os itens subsequentes.
A variável X forma uma série estatística denominada série temporal.
Comentários:
Vamos analisar os elementos da tabela. Temos uma série em que o fato (número de imóveis) e o local (um
determinado município) permanecem constantes, mas há variação do tempo (2005, 2006, 2007). Portanto,
temos todos os elementos para classificar a série em temporal ou cronológica.
Gabarito: Certo.
QUESTÕES COMENTADAS
Distribuições de Frequência
1. (IBFC/Pref. Cuiabá/2023) A tabela a seguir fornece a distribuição de frequências das notas de 45 alunos
de um curso de estatística básica:
Intervalo de classes Frequência simples Frequência relativa 0 ⊢ 3 4 9 3 ⊢ 5 A 22 5 ⊢ 7 25 C 7 ⊢ 10 B D
Os valores de A, B, C e D são, aproximadamente:
a) 10, 6, 40, 13
b) 6, 10, 50, 13
c) 10, 6, 13, 40
d) 10, 6, 40, 14
Comentários:
O enunciado da questão nos disse que a tabela fornece a distribuição de frequências das notas de 45 alunos.
Sendo assim, a soma de todas as frequências é igual ao número total de observações analisadas:
∑𝑓𝑖45𝑖=1 = 45
A frequência absoluta simples corresponde ao número de observações correspondentes a uma determinada
classe ou a um determinado valor.
A frequência relativa simples corresponde à proporção de dados existentes em uma determinada classe.
Para calcular a frequência relativa de uma classe, dividimos a frequência absoluta simples 𝑓𝑖 pela frequência
total (isto é, dividimos a parte pelo todo): 𝐹𝑖 = 𝑓𝑖∑𝑓𝑖 = 𝑓𝑖𝑛
A soma de todas as frequências relativas deve ser igual a 100%. Além disso, a frequência absoluta acumulada
crescente (𝑓𝑎𝑐) é a soma dasfrequências de todos os valores inferiores ao limite superior do intervalo de
uma determinada classe. Sabendo disso, podemos preencher a tabela e calcular os valores faltantes:
Intervalo de
classes
Frequência
simples
Frequência
acumulada
Frequência
relativa 0 ⊢ 3 4 4 9 3 ⊢ 5 A 4 + 𝐴 22 5 ⊢ 7 25 4 + 𝐴 + 25 = 29 + 𝐴 C 7 ⊢ 10 B 29 + 𝐴 + 𝐵 = 45 D
45 100
Calculando os valores de A e B, temos: 29 + 𝐴 + 𝐵 = 45 𝐴 + 𝐵 = 45 − 29 𝐴 + 𝐵 = 16
Vamos agora fazer o caminho inverso do cálculo da frequência relativa para A. Ora, se 𝐴45 = 22 ⇔ 22 × 45 = 990
Sabemos que a frequência relativa é dada em termos percentuais. Logo: 990100 = 9,9
Assim, o valor é aproximadamente 10. Substituindo na equação acima, temos: 𝐴 + 𝐵 = 16 10 + 𝐵 = 16 𝐵 = 16 − 10 = 6
Portanto, já sabemos que 𝐴 = 10 e 𝐵 = 6. Vamos calcular agora os valores de C e Dl:
Para C, temos que: 𝑓𝑖𝑛 = 2545 ≅ 0,56 × 100 ⟹ 56
Para D, temos que: 𝑓𝑖𝑛 = 645 ≅ 0,13 × 100 ⟹ 13
Completando a tabela, ficamos com:
Intervalo de classes Frequência simples Frequência relativa 0 ⊢ 3 4 9 3 ⊢ 5 10 22 5 ⊢ 7 25 56 7 ⊢ 10 6 13
A banca considerou o gabarito como sendo a alternativa A, porém, a questão deveria ter sido anulada por
não ter resposta correta.
Gabarito: A.
2. (CESPE/FUB/2022) A tabela de frequência a seguir mostra dados coletados em uma pesquisa para se
verificar o número de disciplinas que os estudantes de determinada universidade estão cursando por
semestre.
Disciplinas 2 3 4 5 6 7 8
Estudantes 10 15 40 35 28 10 4
Considerando essas informações, julgue o item seguinte.
A proporção de alunos que cursam mais de 6 disciplinas é maior que a proporção de alunos que cursam 3
disciplinas.
Comentários:
Calculando as proporções apresentadas, verificamos que 15 alunos cursam 3 disciplinas e que 14 alunos
cursam 7 e 8 disciplinas. Temos ainda um total de 142 alunos. Portanto, segue:
Para 3 disciplinas, a proporção de alunos é de: 15142 = 0,10 = 10,56%
Para mais de 6 disciplinas, a proporção de alunos é de: 10142 = 0,07 = 7% 4142 = 0,028 = 2,8%
E somando as proporções de 7 e 8 disciplinas, temos: 0,07 + 0,028 = 0,098 = 9,8%
Logo, a proporção de alunos que cursam mais de 6 disciplinas é menor que a proporção de alunos que cursam
3 disciplinas.
Gabarito: Errado.
3. (CESPE/FUB/2022) Uma universidade está fazendo um estudo para verificar a distribuição dos tempos
que os alunos do curso de mestrado levam até a defesa da dissertação. Os dados a seguir mostram a função
de probabilidade desses tempos, em meses.
Tempo de Defesa (meses) Probabilidade
12 0,01
15 0,02
18 0,04
20 0,10
22 0,22
24 0,31
25 0,18
26 0,04
28 0,03
30 0,05
Considerando essas informações, julgue o item subsequente.
Se o prazo máximo recomendado para a defesa da dissertação de mestrado é de 24 meses, então a
probabilidade de um aluno defender sua dissertação até 2 meses antes desse prazo é igual à probabilidade
de um aluno defendê-la até 2 meses depois.
Comentários:
Analisando os dados da tabela, observamos que a probabilidade de defesa em 24 meses é de 0,31, que
corresponde a 31% das chances totais. Percebam que a tabela não traz a informação de defesa em 23 meses,
porém, a probabilidade de defesa em 22 meses é de 0,22, que corresponde a 22% das chances totais.
Assim, para defesa em até 2 meses antes do prazo máximo, a probabilidade é de 22%.
Agora, vejam na tabela que as probabilidades de defesa nos meses 25 e 26 são respectivamente 0,18 e 0,04,
ou seja, 18% e 4%. Ao somarmos esses dois meses, também temos a probabilidade de 22%.
Logo, para a defesa em até dois meses após o prazo máximo, a probabilidade também é de 22%.
Portanto, a probabilidade de um aluno defender sua dissertação em até 2 meses antes do prazo máximo, 24
meses, é igual à probabilidade de um aluno defendê-la em até 2 meses depois.
Gabarito: Certo.
4. (CESPE/FUB/2022) Uma universidade está fazendo um estudo para verificar a distribuição dos tempos
que os alunos do curso de mestrado levam até a defesa da dissertação. Os dados a seguir mostram a função
de probabilidade desses tempos, em meses.
Tempo de Defesa (meses) Probabilidade
12 0,01
15 0,02
18 0,04
20 0,10
22 0,22
24 0,31
25 0,18
26 0,04
28 0,03
30 0,05
Considerando essas informações, julgue o item subsequente.
Os valores da probabilidade de um aluno defender a dissertação em 13, 14, 16, 19, 21, 23, 27 ou 29 meses,
somados, é igual à probabilidade de um aluno defender a dissertação em exatamente 31 meses.
Comentários:
A partir dos dados apresentados na tabela, podemos perceber que a probabilidade de um aluno defender a
dissertação em 13, 14, 16, 19, 21, 23, 27 ou 29 meses, somados, é igual a zero, posto que não foram
discriminadas as frequências relativas para os referidos meses. Igualmente, não foi informada a frequência
com que os alunos defendem a dissertação com 31 meses, sendo a probabilidade, portanto, igual a zero.
Gabarito: Certo.
5. (CESPE/FUB/2022) Uma universidade está fazendo um estudo para verificar a distribuição dos tempos
que os alunos do curso de mestrado levam até a defesa da dissertação. Os dados a seguir mostram a função
de probabilidade desses tempos, em meses.
Tempo de Defesa (meses) Probabilidade
12 0,01
15 0,02
18 0,04
20 0,10
22 0,22
24 0,31
25 0,18
26 0,04
28 0,03
30 0,05
Considerando essas informações, julgue o item subsequente.
Se o prazo máximo de defesa recomendado é de 24 meses, então a probabilidade de um aluno defender sua
dissertação no prazo é superior a 70%.
Comentários:
Com base nos dados da tabela, a probabilidade de um aluno defender a dissertação em um prazo superior a
24 meses é igual a: 0,18 + 0,04 + 0,03 + 0,05 = 0,30
Portanto, 30% dos alunos defendem sua dissertação em prazo superior a 24 meses. Assim, a probabilidade
de um aluno defender sua dissertação no prazo é de até 70%, não mais que isso.
Gabarito: Errado.
6. (CESPE/FUB/2022) A tabela de frequência a seguir mostra dados coletados em uma pesquisa para se
verificar o número de disciplinas que os estudantes de determinada universidade estão cursando por
semestre.
Disciplinas 2 3 4 5 6 7 8
Estudantes 10 15 40 35 28 10 4
Considerando essas informações, julgue o item seguinte.
Na pesquisa foram entrevistados 142 alunos.
Comentários:
Para identificarmos o número de entrevistados, basta somarmos as quantidades de estudantes inscritos em
cada disciplina: 10 + 15 + 40 + 35 + 28 + 10 + 4 = 142
Gabarito: Certo.
7. (FADESP/SEFA-PA/2022) Em uma determinada fazenda, a criação de pirarucu (Arapaima gigas) mostrou
que o tamanho desses animais segue uma distribuição como mostrada a seguir:
Tamanho (m) 1,20 ⊢ 2,30 2,30 ⊢2,40 2,40 ⊢2,50 2,50 ⊢2,60 2,60 ⊢ 2,70 2,70 ⊢ 2,80
Nº de animais 5 25 30 20 10 10
O proprietário quer dividir os animais em 4 (quatro) categorias de modo que
• os 10% menos pesados pertençam à classe D;
• os 40% seguintes pertençam à classe C;
• os 30% seguintes pertençam à classe B;
• os 20% restantes pertençam à classe A.
Diante das informações, pode-se afirmar que os tamanhos dos indivíduos pertencentes à classe C estão
situados no intervalo de
a) 2,32m a menos de 2,47m.
b) 2,12m a menos de 3,2 m.
c) 3,25m a menos de 3,72m.
d) 2,45m a menos de 3,86m.
e) 3,32m a menos de 3,65m.
Comentários:
Nessa questão, precisamos saber a quantidade total dos animais apresentados na tabela. Então: 5 + 25 + 30 + 20 + 10 + 10 = 100
O enunciado afirma que os 10% menos pesados, isto é, 10 animais, pertencem à classe D. Os 40% seguintes,
40 animais, pertençam à classe C.
De acordo com a tabela, na classe dos animais menos pesados, 1,20 ⊢ 2,30, estão apenas 5 animais. Como a
classe D possui 10 animais menos pesados, então, os outros 5 estão na classe 2,30 ⊢ 2,40. Nesse caso,
precisamos definir até que tamanho vão os 5 animais pertencentes à classe D no intervalo2,30 ⊢2,40.
Como temos 25 animais nesse intervalo e 5 pertencem à classe D, a proporção será de 1/5: 2,30 + 15 (2,40 − 2,30) = 2,32
Então, a classe D corresponde ao intervalo de 1,20 ⊢ 2,32.
Agora, precisamos calcular a classe C, que possui 40 animais. São 20 animais no intervalo de 2,30 ⊢2,40, pois
já utilizamos 5 no intervalo anterior. Os outros 20 estão no intervalo 2,40 ⊢2,50, que contém 30 animais.
Portanto, a proporção dos 20 animais pertencentes à classe C será de 2/3: 2,40 + 23 (2,50 − 2,40) = 2,47
Então, a classe C corresponde ao intervalo de 2,32 ⊢ 2,47.
Gabarito: A.
8. (FADESP/SEFA-PA/2022) Foi aplicada uma avaliação, ao mesmo tempo, para duas turmas de estatística.
Na avaliação, constavam 15 questões objetivas com 5 alternativas, sendo apenas uma correta. Dos 80
alunos que realizaram a avaliação, 50 estudavam no turno matutino e 30, no vespertino. A tabela a seguir
apresenta o número de acertos das duas turmas.
Nº de acertos Matutino Vespertino Total
0⊢3 2 1 3
3⊢6 3 3 6
6⊢9 6 4 10
9⊢12 25 15 40
12⊢15 11 5 16
15 3 2 5
Total 50 30 80
Selecionando-se aleatoriamente uma avaliação, a probabilidade de ter menos de 6 acertos ou, no mínimo,
12 acertos é igual a
a) 0,1150.
b) 0,3750.
c) 0,3900.
d) 0,5000.
e) 0,6250.
Comentários:
Analisando a tabela, podemos verificar que as avaliações com menos de 6 acertos correspondem às duas
primeiras classes, 0⊢3 e 3⊢6. Assim, somando os turnos matutino e vespertino, temos um total de 9
avaliações.
As avaliações com no mínimo 12 acertos compreendem as duas últimas classes, 12⊢15 e 15. Agrupando os
turnos matutino e vespertino, temos um total de 21 avaliações.
Somando o total de avaliações para as duas condições, temos: 9 + 21 = 30
Para sabermos a probabilidade pedida na questão, basta calcularmos a razão entre o total de avaliações para
as duas condições e o total de avaliações aplicadas: 𝑝 = 3080 = 38 = 0,375
Gabarito: B.
9. (FGV/TRT-PB/2022) Considere o lançamento aleatório de dois dados honestos. Se X é a variável aleatória
que calcula o módulo da diferença entre os dois números obtidos, então o valor mais provável de X é igual
a
a) 0.
b) 1.
c) 2.
d) 3.
e) 4.
Comentários:
Para responder essa questão, basta montarmos a tabela contendo todas as diferenças possíveis entre os dois
dados:
|Di - Dj|
Dj
1 2 3 4 5 6
Di
1 0 1 2 3 4 5
2 1 0 1 2 3 4
3 2 1 0 1 2 3
4 3 2 1 0 1 2
5 4 3 2 1 0 1
6 5 4 3 2 1 0
Feito isso, verificamos a frequência de cada valor de diferença:
Diferença Frequência
0 6
1 10
2 8
3 6
4 4
5 2
Logo, o valor mais provável de X é 1.
Gabarito: B.
10. (VUNESP/EsFCEx/2021) A tabela apresenta parte da distribuição de frequências das notas de 200
candidatos na primeira fase de um concurso:
Notas Frequência absoluta Frequência relativa
0,0 ⊢ 6,0 6,0 ⊢ 7,0 40 7,0 ⊢ 8,0 8,0 ⊢ 9,0 0,05 9,0 ⊢ 10,0
Total 200 1,00
Sabendo-se que 48% dos candidatos tiraram notas maiores ou iguais a 7,0, sendo que a quarta parte deles
tiraram notas abaixo de 8,0, é possível afirmar corretamente que, em relação aos 200 candidatos, tiraram
notas abaixo de 6,0 ou notas maiores ou iguais a 9,0:
a) 65%
b) 61%
c) 63%
d) 59%
e) 57%
Comentários:
Vamos preencher a tabela com as informações dadas:
Temos um total de 200 candidatos, sendo que 48% dos candidatos tiraram notas maiores ou iguais a 7,0: 0,48 × 200 = 96
Assim, 96 candidatos estão distribuídos nas três últimas classes.
Agora, a quarta parte dos candidatos tiraram notas abaixo de 8,0: 964 = 24
Então, 24 candidatos estão na classe 7,0 ⊢ 8,0.
Já podemos completar a tabela calculando as frequências relativas dadas para a classe 8,0 ⊢ 9,0: 200 × 0,05 = 10
Para a classe 9,0 ⊢ 10,0, basta subtrairmos: 96 − 24 − 10 = 62
Logo, teremos 62 candidatos na última classe.
E para a classe 0,0 ⊢ 6,0, basta subtrairmos as demais classes: 200 − 40 − 96 = 64
Calculando a frequência relativa dividindo a quantidade de candidatos de cada classe pelo total de
candidatos, temos que:
Notas Frequência absoluta Frequência relativa
0,0 ⊢ 6,0 64 0,32 6,0 ⊢ 7,0 40 0,2 7,0 ⊢ 8,0 24 0,12 8,0 ⊢ 9,0 10 0,05 9,0 ⊢ 10,0 62 0,31
Total 200 1,00
Agora, podemos calcular o percentual dos candidatos que tiraram notas abaixo de 6,0 ou notas maiores ou
iguais a 9,0, somando a frequência relativa dessas classes: 0,32 + 0,31 = 0,63 → 63%
Gabarito: C.
11. (VUNESP/CM Serrana/2019) A tabela apresenta o número de acertos dos 200 candidatos a um cargo,
em um concurso interno, composto por uma prova contendo 5 questões de múltipla escolha.
Número de
acertos
Número de
candidatos
0 8
1 22
2 26
3 32
4 44
5 68
Com base nas informações apresentadas na tabela, é correto afirmar que
a) 68 candidatos acertaram a questão de número 5.
b) 144 candidatos acertaram, no mínimo, 3 questões.
c) 26 candidatos acertaram, no máximo, duas questões.
d) Mais da metade do número total dos candidatos acertaram menos da metade do número total das
questões.
e) Menos da metade do número total dos candidatos acertaram mais da metade do número total das
questões.
Comentários:
Analisando as alternativas temos:
Letra A: Errado. 68 candidatos acertaram as 5 questões da prova, essa é a informação dada pela tabela, e
não somente a questão número 5.
Letra B: Correto. Acertar no mínimo 3 questões significa acertar 3 ou 4 ou 5 questões. Somando o número
de candidatos correspondentes a esses acertos, de acordo com a tabela, teremos 32 + 44 + 68 = 144.
Letra C: Errado. A tabela informa que 26 candidatos acertaram exatamente duas questões. Para considerar
quantas pessoas acertaram no máximo duas questões, precisamos incluir as pessoas que acertaram
exatamente 2, exatamente 1 e exatamente nenhuma questão, ou seja, 56 candidatos acertaram no máximo
2 questões, (8 + 22 + 26 = 56).
Letra D: Errado. Como visto no item acima, 56 candidatos acertaram 2 questões ou menos, o que
corresponde a menos da metade da prova. Esse valor não corresponde a mais da metade do número total
de candidatos (200).
Letra E: Errado. De acordo com a letra C, 56 pessoas acertaram menos da metade da prova. Se o total de
candidatos corresponde a 200, então 200 − 56 = 144 candidatos acertaram mais da metade da prova,
número superior a metade do número total de candidatos, que é igual a 100. Também podemos recorrer à
letra B para confirmarmos o resultado, 32 + 44 + 68 = 144 candidatos que acertaram mais da metade da
prova.
Gabarito: B.
12. (CESPE/Polícia Federal/2018)
DIA
1 2 3 4 5
X (quantidade diária
de drogas
apreendidas, em kg)
10 22 18 22 28
Tendo em vista que, diariamente, a Polícia Federal apreende uma quantidade X, em kg, de drogas em
determinado aeroporto do Brasil, e considerando os dados hipotéticos da tabela precedente, que
apresenta os valores observados da variável X em uma amostra aleatória de 5 dias de apreensões no citado
aeroporto, julgue o item.
A tabela em questão descreve a distribuição de frequências da quantidade de drogas apreendidas nos cinco
dias que constituem a amostra.
Comentários:
A tabela apenas registra as quantidades de drogas apreendidas por dia. Para que ela configurasse uma
distribuição de frequências da quantidade de drogas apreendidas nos cinco dias, era necessário que cada
valor estivesse associado a uma frequência, o que não ocorreu. Uma distribuição de frequência dos dados
acima seria assim:
Gabarito: Errado.
13. (CESPE/IPHAN/2018). A tabela a seguir mostra as quantidades de bibliotecas públicas presentes em 20
microrregiões brasileiras.
90 66 78 82
77 60 64 90
87 85 67 91
Valor Frequência
10 1
18 1
22 2
28 1
82 70 81 80
69 78 90 67
A partir desses dados, pretende-se construir um gráfico de distribuição de frequências com quatro classes
de igual amplitude. Os valores mínimo e máximo de cada classe devem ser números inteiros.Considerando essas informações, julgue o item subsequente, relativo ao gráfico de distribuição a ser
apresentado.
A amplitude de cada classe deverá ser superior a 6.
Comentários:
A questão forneceu um conjunto de dados e disse que se pretende construir um gráfico de distribuição de
frequências com quatro classes de igual amplitude. Para encontrar a amplitude de cada classe, podemos
utilizar a fórmula da amplitude total: 𝐴𝑇 = ℎ × 𝑘 ⟹ ℎ = 𝐴𝑇𝑘
Analisando a tabela, identificamos os limites mínimo e máximo: 𝑙𝑚á𝑥 = 91 𝑙𝑚í𝑛 = 60
Calculando a amplitude total, temos: 𝐴𝑇 = 𝑙𝑚á𝑥 − 𝑙𝑚í𝑛 𝐴𝑇 = 91 − 60 𝐴𝑇 = 31
Aplicando a fórmula anterior, temos: ℎ = 𝐴𝑇𝑘 = 314 = 7,75
O número inteiro mais próximo deste resultado é 8 (superior a 6).
Logo, o item está correto.
Gabarito: Certo.
14. (CESPE/IPHAN/2018) A tabela a seguir mostra as quantidades de bibliotecas públicas presentes em 20
microrregiões brasileiras.
90 66 78 82
77 60 64 90
87 85 67 91
82 70 81 80
69 78 90 67
A partir desses dados, pretende-se construir um gráfico de distribuição de frequências com quatro classes
de igual amplitude. Os valores mínimo e máximo de cada classe devem ser números inteiros. Considerando
essas informações, julgue o item subsequente, relativo ao gráfico de distribuição a ser apresentado.
A última classe deverá variar de 84 a 91.
Comentários:
A questão não informou qual o limite inferior do primeiro intervalo, portanto, poderíamos ter adotado
qualquer valor. Isso alteraria totalmente o resultado esperado pelo avaliador. Dessa forma, considero que a
questão deveria ter sido anulada. De todo modo, vamos fazer a questão como a banca esperava que ela
fosse resolvida.
Para encontrar a amplitude de cada classe, podemos utilizar a fórmula da amplitude total: 𝐴𝑇 = ℎ × 𝑘 ⟹ ℎ = 𝐴𝑇𝑘
Analisando a tabela, identificamos os limites mínimo e máximo: 𝑙𝑚á𝑥 = 91 𝑙𝑚í𝑛 = 60
Calculando a amplitude total, temos: 𝐴𝑇 = 𝑙𝑚á𝑥 − 𝑙𝑚í𝑛 𝐴𝑇 = 91 − 60 𝐴𝑇 = 31
Aplicando a fórmula anterior, temos: ℎ = 𝐴𝑇𝑘 = 314 = 7,75
Para o número inteiro mais próximo deste resultado pode ser 8 ou 7. Vamos iniciar calculando para o menor
valor, 7: 60 ⊢⊣ 67 68 ⊢⊣ 75 76 ⊢⊣ 83
84 ⊢⊣ 91
Assim, concluímos que o examinador optou por esse valor para o cálculo. Novamente, a questão não
explicitou que o valor mínimo deveria ser 60, logo, poderíamos ter adotado qualquer valor, o que alteraria
esse resultado.
Gabarito: Certo.
15. (CESPE/IPHAN/2018). Julgue o item subsequente, referente à análise exploratória de dados.
O histograma é um diagrama de retângulos contíguos com base na curtose das faixas de valores da variável
e com área igual à diferença da frequência absoluta da respectiva faixa.
Comentários:
Um histograma é uma representação gráfica (um gráfico de barras verticais ou barras horizontais) da
distribuição de frequências de um conjunto de dados quantitativos contínuos. Ele pode ser construído com
base em valores absolutos ou frequência relativa ou densidade.
Em se tratando de densidade, a frequência relativa do intervalo i, (𝑓𝑟𝑖), é representada pela área de um
retângulo, colocado acima do ponto médio da classe i. Consequentemente, a área total do histograma (igual
a soma das áreas de todos os retângulos) será igual a 1.
Assim, ao construir o histograma, cada retângulo deverá ter área proporcional à frequência relativa (ou à
frequência absoluta) correspondente. No caso em que os intervalos são de tamanhos iguais, as alturas dos
retângulos serão iguais às frequências relativas (ou iguais às frequências absolutas) dos intervalos
correspondentes.
Desse modo, a área não tem relação com a diferença de frequência absoluta de um certo intervalo. A área
de cada retângulo é proporcional à frequência da classe, sem qualquer operação de diferença envolvida.
Outro ponto relevante é que o histograma não tem relação com a curtose dos intervalos. A curtose é uma
medida que indica o grau de achatamento de uma distribuição de frequências.
Gabarito: Errado.
16. (FCC/TRT 14ª Região/2018) De um histograma e uma tabela de frequências absolutas, elaborados para
analisar a distribuição dos salários dos empregados em uma empresa, obtém-se a informação que 24
empregados ganham salários com valores pertencentes ao intervalo (2.000; 4.000], em reais, que
apresenta uma densidade de frequência de 𝟎, 𝟕𝟓 × 𝟏𝟎−𝟒(𝑹$)−𝟏
Densidade de frequência de um intervalo é o resultado da divisão da respectiva frequência relativa pela
amplitude deste intervalo. Em um intervalo do histograma que está sendo analisado, com uma amplitude
de R$ 3.000,00 e uma densidade de frequência de 𝟏 × 𝟏𝟎−𝟒(𝑹$)−𝟏, tem-se que o correspondente número
de empregados é igual a
a) 40.
b) 36.
c) 30.
d) 48.
e) 42.
Comentários:
Vamos destacar os dados da questão:
- densidade de frequência: 0,75 × 10−4(𝑅$)−1;
- amplitude da classe: 4000 − 2000 = 2000;
- número de funcionários na classe: 24; e
- total de funcionários na classe: T.
A frequência relativa é calculada pela fórmula a seguir: 𝐹𝑟𝑒𝑞𝑢ê𝑛𝑐𝑖𝑎 𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑎 = 𝑁º 𝑑𝑒 𝑓𝑢𝑛𝑐𝑖𝑜𝑛á𝑟𝑖𝑜𝑠 𝑛𝑎 𝑐𝑙𝑎𝑠𝑠𝑒𝑇𝑜𝑡𝑎𝑙 𝑑𝑒 𝑓𝑢𝑛𝑐𝑖𝑜𝑛á𝑟𝑖𝑜𝑠 = 24𝑇
Então, pela fórmula da densidade de frequência, teremos: 𝐷𝑒𝑛𝑠𝑖𝑑𝑎𝑑𝑒 𝑑𝑒 𝑓𝑟𝑒𝑞𝑢ê𝑛𝑐𝑖𝑎 = 𝐹𝑟𝑒𝑞𝑢ê𝑛𝑐𝑖𝑎 𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑎𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑𝑒
0,75 × 10−4 = 24𝑇2000 0,15 = 24𝑇 𝑇 = 160
Agora, vamos aplicar a mesma metodologia para a classe do histograma com amplitude de 3000 e densidade
de frequência de 1 × 10−4. Considerando o número de funcionários na classe igual a 𝑁, teremos a seguinte
frequência relativa: 𝐹𝑟𝑒𝑞𝑢ê𝑛𝑐𝑖𝑎 𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑎 = 𝑁º 𝑑𝑒 𝑓𝑢𝑛𝑐𝑖𝑜𝑛á𝑟𝑖𝑜𝑠 𝑛𝑎 𝑐𝑙𝑎𝑠𝑠𝑒𝑇𝑜𝑡𝑎𝑙 𝑑𝑒 𝑓𝑢𝑛𝑐𝑖𝑜𝑛á𝑟𝑖𝑜𝑠 = 𝑁160
Então, pela fórmula da densidade de frequência, teremos:
𝐷𝑒𝑛𝑠𝑖𝑑𝑎𝑑𝑒 𝑑𝑒 𝑓𝑟𝑒𝑞𝑢ê𝑛𝑐𝑖𝑎 = 𝐹𝑟𝑒𝑞𝑢ê𝑛𝑐𝑖𝑎 𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑎𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑𝑒
10−4 = 𝑁1603000 0,3 = 𝑁160 𝑁 = 48
Gabarito: D.
17. (CESPE/CBM-AL/2017). Na tabela a seguir, A, B, C, D e E são as quantidades de resmas de papel A4
consumidas, em quatro meses, pelas seções administrativas I, II, III, IV e V, respectivamente. Apesar de
não mostrar explicitamente essas quantidades, a tabela apresenta as frequências absolutas e (ou) relativas
de algumas dessas quantidades.
Seção
Quantidades
de Resmas
Frequência
Absoluta
Frequência
Relativa
I A 38 19%
II B
III C 20%
IV D 36
V E 44
Total 100%
Considerando que cada uma dessas resmas, juntamente com a embalagem, tem forma de um
paralelepípedo retângulo reto que mede 5 cm × 21 cm × 30 cm, julgue o item seguinte.
O gráfico de barras verticais a seguir apresenta as frequências absolutas de resmas consumidas pelas cinco
seções.
Comentários:
Podemos usar uma regra de três simples para completar a tabela. Primeiro, vamos encontrar o valor que
representa 100%: 38 − 0,19 𝑄 − 1,00 𝑄 = 38 × 1,000,19 = 200
Encontrando o valor de 20%: 200 − 1,00 𝐶 − 0,20 𝐶 = 200 × 0,21,00 = 40
Agora, basta sabermos a frequência absoluta na seção II. Como foram consumidas 200 resmas, então o
número de resmas consumidas pela seção II foi: 200 − 38 − 40 − 36 − 44 = 42
Dessa forma, nas seções I, II, III, IV e V foram consumidas, respectivamente 38, 42, 40, 36 e 44 resmas de
papel A4, conforme mostra o gráfico.
Gabarito: Certo.
18. (FCC/ARTESP/2017) Foi solicitado para uma empresa de transportes que fizesse um levantamento da
idade da frota dos seus caminhões que operavam em um trecho de rodovia com tráfego intenso. O gerente
da empresa entregou a seguinte tabela:
Caminhão A B C D E F G H I J K L M
Idade (anos) 15 20 5 2 3 3 17 23 16 8 6 9 14
Caminhão N O P Q R S T U V W X Y
Idade (anos) 10 10 6 8 2 4 18 5 9 11 26 14
De posse deste levantamento, a analista de operações da autarquia solicitante organizou uma distribuiçãode frequência para organizar melhor os dados para serem analisados. Sendo assim, em um primeiro
momento, fez-se necessário encontrar o número de intervalos (K) e a classe (C), que são expressos,
respectivamente, por
a) 5 e 4,80.
b) 5 e 5,20.
c) 6 e 4,80.
d) 6 e 5,20.
e) 4 e 5.
Comentários:
Iniciaremos a resolução calculando a amplitude total. Sabemos que o menor valor é 2 e o maior valor é 26.
Assim, a amplitude total fica: 𝐴𝑇 = 26 − 2 = 24.
Temos 25 caminhões, logo, o valor correspondente de intervalos será: 𝐾 = √25 = 5.
Portanto, com 𝐾 intervalos de amplitude 𝐶, conseguiremos cobrir as 24 unidades: 𝐴𝑇 = 𝐶 × 𝐾
Podemos montar a equação da seguinte forma: 𝐶 = 𝐴𝑇𝐾 = 245 𝐶 = 4,8
Portanto, a alternativa correta contém as combinações 𝐾 = 5 e 𝐶 = 4,8.
Gabarito: A.
19. (FUNDATEC/BRDE/2017) Um grupo de pessoas foi consultada sobre a marca de veículos de sua
preferência. Nessa pesquisa, 100 pessoas escolheram a marca Hyundai de um total de 500 participantes.
As que escolheram a marca Ford correspondem a 30%. As pessoas restantes escolheram entre as marcas
Chevrolet e Volkswagen. A frequência absoluta das pessoas que escolheram a marca Volkswagen é igual
a diferença entre o número de pessoas que escolheram as marcas Ford e Hyundai. A frequência relativa
entre as pessoas que escolheram a marca Chevrolet corresponde a:
a) 10%.
b) 20%.
c) 30%.
d) 40%.
e) 50%.
Comentários:
Segundo o enunciado, do total de 500 participantes, 100 escolheram Hyundai.
Além disso, 30% dos 500 participantes escolheram Ford. Logo, 0,3 × 500 = 150.
Os 150 que escolheram Ford subtraídos dos 100 que escolheram Hyundai é igual ao número de pessoas que
escolheram Volkswagen: 150 − 50 = 100
Portanto, o número de pessoas que escolheram a Chevrolet foi: 500 − 100 − 150 − 50 = 200
A frequência relativa é obtida dividindo a frequência absoluta (200 pessoas que escolheram Chevrolet) pelo
número total de observações (total de 500 pessoas consultadas). Calculando a frequência relativa das
pessoas que escolheram Chevrolet, temos: 200500 = 40100 = 40%
Logo, a frequência relativa de pessoas que escolheram Chevrolet é de 40%.
Gabarito: D.
20. (CESPE/TCE-PA/2016)
Número diário de
denúncias registradas (X)
Frequência
Relativa
0 0,3
1 0,1
2 0,2
3 0,1
4 0,3
Total 1,0
A tabela precedente apresenta a distribuição de frequências relativas da variável X, que representa o
número diário de denúncias registradas na ouvidoria de determinada instituição pública. A partir das
informações dessa tabela, julgue o item seguinte.
A variável X é do tipo qualitativo nominal.
Comentários:
De acordo com a tabela X corresponde à quantidade diária de denúncias. Logo, X é uma variável quantitativa
discreta, pois assume valores inteiros.
Gabarito: Errado.
21. (FCC/TRT 20ª Região/2016) Um gráfico corresponde a um histograma apresentando a distribuição dos
salários dos funcionários lotados em um determinado órgão público. No eixo das abscissas constam os
intervalos de classe (fechados à esquerda e abertos à direita) dos salários em R$ e no eixo das ordenadas
as respectivas densidades de frequências em (R$) −1. Densidade de frequência de um intervalo é definida
como sendo o resultado da divisão da respectiva frequência relativa pela correspondente amplitude do
intervalo. Se 135 funcionários ganham salários com valores pertencentes ao intervalo [3.000, 6.000) com
uma densidade de frequência de 1 × 10 −4 (R$) −1, então o número de funcionários que ganham salários
com valores pertencentes ao intervalo [6.000, 8.000) com uma densidade de frequência de 2 × 10 −4 (R$)
−1 é igual a:
a) 300
b) 180
c) 270
d) 150
e) 90
Comentários:
O enunciado da questão traz informações importantes para a resolução do problema.
Sabemos que a densidade de frequência (𝑑), é a relação entre a frequência relativa (𝑓𝑟) e a amplitude de
classe (ℎ). Assim: 𝑑 = 𝑓𝑟ℎ
Temos a informação de que 135 funcionários pertencem à classe [3.000, 6.000). Logo, a amplitude dessa
classe será: ℎ = 6.000 − 3.000 = 3.000
Se 135 funcionários ganham salários com valores entre o intervalo [3.000, 6.000) com uma densidade de
frequência de 10−4, então precisamos encontrar a frequência relativa (𝑓𝑟). Para isso, podemos fazer: 𝑑 = 𝑓𝑟ℎ 10−4 = 𝑓𝑟3000 𝑓𝑟 = 3.000 × 10−4 𝑓𝑟= 0,3
Então, temos 30% das observações nesta classe.
Além disso, foi afirmado que a classe [6.000, 8.000) tem densidade de frequência 2 × 10−4. Esta classe tem
amplitude: ℎ = 8.000 − 6.000 = 2.000
Aplicando a fórmula da densidade, temos: 𝑑 = 𝑓𝑟ℎ 2 × 10−4 = 𝑓𝑟2000 𝑓𝑟 = 2.000 × 2 × 10−4 = 0,4
Portanto, já sabemos que esta classe apresenta 40% das observações. Então, montando uma regra de três,
temos: 30% − 135 𝑓𝑢𝑛𝑐𝑖𝑜𝑛á𝑟𝑖𝑜𝑠 40% − 𝑥 0,3𝑥 = 0,4 × 135 𝑥 = 540,3 = 180
Gabarito: B.
22. (CESPE/DEPEN/2015)
Região
Quantidade de detentos no
sistema penitenciário
brasileiro (mil pessoas)
Déficit de vagas no sistema
penitenciário (mil vagas)
População brasileira
(milhões de
habitantes)
Norte 37 13 17
Centro-Oeste 51 24 15
Nordeste 94 42 55
Sudeste 306 120 85
Sul 67 16 28
Total 555 215 200
Ministério da Justiça — Departamento Penitenciário Nacional — Sistema Integrado de Informações Penitenciárias – InfoPen, Relatório Estatístico Sintético do
Sistema Prisional Brasileiro, dez./2013
Internet: <www.justica.gov.br> (com adaptações).
A tabela mostrada apresenta a quantidade de detentos no sistema penitenciário brasileiro por região em
2013. Nesse ano, o déficit relativo de vagas — que se define pela razão entre o déficit de vagas no sistema
penitenciário e a quantidade de detentos no sistema penitenciário — registrado em todo o Brasil foi
superior a 38,7%, e, na média nacional, havia 277,5 detentos por 100 mil habitantes.
Com base nessas informações e na tabela apresentada, julgue o item a seguir.
Em 2013, mais de 55% da população carcerária no Brasil se encontrava na região Sudeste.
Comentários:
Vamos analisar os dados da região sudeste. Sabemos que o total da população carcerária é 555 mil. Se a
região sudeste contém 306 mil, basta calcularmos o percentual desse valor com relação ao total. Assim: 𝑋 = 306555 × 100% = 55,13%
Gabarito: Certo.
23. (CESPE/DEPEN/2015)
Região
Quantidade de detentos no
sistema penitenciário
brasileiro (mil pessoas)
Déficit de vagas no sistema
penitenciário (mil vagas)
População brasileira
(milhões de
habitantes)
Norte 37 13 17
Centro-Oeste 51 24 15
Nordeste 94 42 55
Sudeste 306 120 85
Sul 67 16 28
Total 555 215 200
Ministério da Justiça — Departamento Penitenciário Nacional — Sistema Integrado de Informações Penitenciárias – InfoPen, Relatório Estatístico Sintético do
Sistema Prisional Brasileiro, dez./2013
Internet: <www.justica.gov.br> (com adaptações).
A tabela mostrada apresenta a quantidade de detentos no sistema penitenciário brasileiro por região em
2013. Nesse ano, o déficit relativo de vagas — que se define pela razão entre o déficit de vagas no sistema
penitenciário e a quantidade de detentos no sistema penitenciário — registrado em todo o Brasil foi
superior a 38,7%, e, na média nacional, havia 277,5 detentos por 100 mil habitantes.
Com base nessas informações e na tabela apresentada, julgue o item a seguir.
A quantidade total de vagas existentes no sistema penitenciário brasileiro em 2013 era de 340 mil vagas.
Comentários:
Analisando a tabela, temos a informação do total de 555 mil detentos, e a informação do déficit de vagas no
sistema penitenciário 215 mil.
Ora, para sabermos a quantidade real de vagas, basta subtrairmos o déficit do total. 555 − 215 = 340
Gabarito: Certo.
24. (CESPE/DEPEN/2015)
Região
Quantidade de detentos no
sistema penitenciário
brasileiro (mil pessoas)
Déficit de vagas no sistema
penitenciário (mil vagas)
População brasileira
(milhõesde
habitantes)
Norte 37 13 17
Centro-Oeste 51 24 15
Nordeste 94 42 55
Sudeste 306 120 85
Sul 67 16 28
Total 555 215 200
Ministério da Justiça — Departamento Penitenciário Nacional — Sistema Integrado de Informações Penitenciárias – InfoPen, Relatório Estatístico Sintético do
Sistema Prisional Brasileiro, dez./2013
Internet: <www.justica.gov.br> (com adaptações).
A tabela mostrada apresenta a quantidade de detentos no sistema penitenciário brasileiro por região em
2013. Nesse ano, o déficit relativo de vagas — que se define pela razão entre o déficit de vagas no sistema
penitenciário e a quantidade de detentos no sistema penitenciário — registrado em todo o Brasil foi
superior a 38,7%, e, na média nacional, havia 277,5 detentos por 100 mil habitantes.
Com base nessas informações e na tabela apresentada, julgue o item a seguir.
O déficit relativo de vagas observado na região Sudeste, em 2013, foi superior ao déficit relativo de vagas
registrado na região Centro-oeste no mesmo período.
Comentários:
Precisamos calcular o percentual do déficit das regiões sudeste e centro-oeste. Para isso, basta dividirmos o
déficit de vagas da região pela respectiva quantidade de detentos dessa região. Assim: 𝑆𝑢𝑑𝑒𝑠𝑡𝑒 = 120306 = 39,21% 𝐶𝑒𝑛𝑡𝑟𝑜 − 𝑂𝑒𝑠𝑡𝑒 = 2451 = 47,05%
Portanto, o déficit é maior na região Centro-Oeste.
Gabarito: Errado.
25. (CESPE/DEPEN/2015)
Região
Quantidade de detentos no
sistema penitenciário
brasileiro (mil pessoas)
Déficit de vagas no sistema
penitenciário (mil vagas)
População brasileira
(milhões de
habitantes)
Norte 37 13 17
Centro-Oeste 51 24 15
Nordeste 94 42 55
Sudeste 306 120 85
Sul 67 16 28
Total 555 215 200
Ministério da Justiça — Departamento Penitenciário Nacional — Sistema Integrado de Informações Penitenciárias – InfoPen, Relatório Estatístico Sintético do
Sistema Prisional Brasileiro, dez./2013
Internet: <www.justica.gov.br> (com adaptações).
A tabela mostrada apresenta a quantidade de detentos no sistema penitenciário brasileiro por região em
2013. Nesse ano, o déficit relativo de vagas — que se define pela razão entre o déficit de vagas no sistema
penitenciário e a quantidade de detentos no sistema penitenciário — registrado em todo o Brasil foi
superior a 38,7%, e, na média nacional, havia 277,5 detentos por 100 mil habitantes.
Com base nessas informações e na tabela apresentada, julgue o item a seguir.
No ano considerado, a quantidade média de detentos por 100 mil habitantes na região Nordeste foi superior
ao número médio de detentos por 100 mil habitantes na região Centro-oeste.
Comentários:
Precisamos calcular a razão entre a quantidade de detentos e a população das respectivas regiões. Assim,
para as regiões Nordeste e Centro-Oeste, temos que: 𝑁𝑜𝑟𝑑𝑒𝑠𝑡𝑒 = 94 × 10³55 × 106 = 1,7 × 10−3 𝐶𝑒𝑛𝑡𝑟𝑜 − 𝑂𝑒𝑠𝑡𝑒 = 51 × 10³15 × 106 = 3,4 × 10−3
Portanto, a quantidade é maior na região Centro-Oeste.
Gabarito: Errado.
26. (FCC/TRT 3ª Região/2015) Em um histograma representando os preços unitários de
microcomputadores em estoque, observa-se que no eixo das abscissas constam os intervalos de classe em
R$ e no eixo das ordenadas as respectivas densidades de frequências em (R$)−1. Densidade de frequência
de um intervalo de classe é o resultado da divisão da respectiva frequência relativa pela correspondente
amplitude do intervalo. Um determinado intervalo de classe com amplitude igual a R$ 2.500,00 apresenta
uma densidade de frequência, em (R$)−1, igual a 12,8 × 10−5. Se o número de microcomputadores deste
intervalo é igual a 48, então o número total de microcomputadores em estoque é igual a
a) 150.
b) 120.
c) 240.
d) 160.
e) 96.
Comentários:
Sabemos que a densidade de frequência (𝑑), é a relação entre a frequência relativa (𝑓𝑟) e a amplitude de
classe (ℎ). Assim: 𝑑 = 𝑓𝑟ℎ
Temos que, para determinada classe, a amplitude vale 2.500 e a densidade de frequência vale 12,8 × 10−5.
Aplicando na fórmula, temos: 12,8 × 10−5 = 𝑓𝑟2500 𝑓𝑟 = 12,8 × 10−5 × 2.500 = 0,32
Sabemos também que a frequência relativa vale 0,32. Isso significa que 32% das observações estão nesta
classe. O enunciado informa que 32% correspondem a 48 microcomputadores. Para determinar o número
total de computadores, fazemos uma regra de três: 32% − 48 100% − 𝑥 0,32𝑥 = 48 𝑥 = 480,32 𝑥 = 150
Gabarito: A.
27. (FCC/TRT 16ª Região/2014) A distribuição das medidas dos comprimentos, em cm, de uma
determinada peça em estoque de uma fábrica está representada em um histograma com todos os
intervalos de classe fechados à esquerda e abertos à direita. No eixo horizontal constam os intervalos de
classe e no eixo vertical as respectivas densidades de frequências, em cm−1. Define-se densidade de
frequência de um intervalo de classe como sendo o resultado da divisão da respectiva frequência relativa
pela correspondente amplitude deste intervalo. Verifica-se com relação ao histograma, que o intervalo de
classe [2 , 6), em cm, apresenta uma densidade de frequência igual a 0,028 cm−1. Dado que o número de
peças em estoque com medidas iguais ou superiores a 2 cm e inferiores a 6 cm é igual a 84, obtém-se que
o número total destas peças em estoque é
a) 750.
b) 400.
c) 500.
d) 250.
e) 1.000.
Comentários:
Vamos calcular a densidade de frequência: 𝑑 = 𝑓𝑟ℎ
Em que 𝑑 é a densidade de frequências; 𝑓𝑟 é a frequência relativa; e ℎ é a amplitude.
Aplicando os valores do enunciado, temos: 0,28 = 𝑓𝑟6 − 2 𝑓𝑟 = 0,28 × 4 𝑓𝑟 = 0,112
O número de peças em estoque com medidas iguais ou superiores a 2 cm e inferiores a 6 cm é igual a 84,
logo: 𝑓𝑟 = 84𝑇 𝑇 × 𝑓𝑟 = 84 𝑇 = 840,112 𝑇 = 750
Gabarito: A.
28. (FCC/TRT 13ª Região/2014) O histograma, abaixo, refere-se à distribuição dos salários dos funcionários
lotados em um setor de um órgão público. No eixo das abscissas constam os intervalos de classe em R$
(todos fechados à esquerda e abertos à direita) e no eixo das ordenadas as respectivas densidades de
frequências em (R$)−1. Define-se densidade de frequência de um intervalo como sendo o resultado da
divisão da respectiva frequência relativa pela correspondente amplitude do intervalo.
Se o número de funcionários que tem um salário inferior a R$ 5.000,00 é igual a 56, então verifica-se que
o número de funcionários que tem um salário igual ou superior a R$ 2.000,00 e inferior a R$ 8.000,00 é
igual a
a) 104.
b) 152.
c) 136.
d) 144.
e) 120.
Comentários:
Vamos iniciar a resolução montando uma tabela com os dados fornecidos pelo histograma. Assim:
Classes 𝒇𝒓 𝒇𝒂𝒄
1 [0,1000) 0 0
2 [1000,2000) 0,05 0,05
3 [2000,5000) 0,30 0,35
4 [5000,6000) 0,15 0,50
5 [6000,8000) 0,40 0,90
6 [8000,10000) 0,10 1,00
1,00
Na tabela, 𝑓𝑟 é a frequência relativa e 𝑓𝑎𝑐 é frequência acumulada.
Analisando a tabela percebemos que o número de empregados com salários inferiores a 5000 corresponde
às três primeiras classes. O número de funcionários com salário igual ou superior a 2000 e inferior a 8000
corresponde às 3ª, 4ª e 5ª classes.
Vamos calcular a densidade de frequência: 𝑑𝑓 = 𝑓𝑟ℎ
A amplitude da terceira classe é 3000, temos: 1,0 × 10−4 = 𝑓𝑟3000 𝑓𝑟 = 0,3 𝑓𝑟 = 0,3
Para encontrarmos o número de funcionários com salário igual ou superior a 2000 e inferior a 8000, deve-se
calcular a 𝑓𝑎𝑐. Já sabemos que a frequência acumulada é obtida pela soma das frequências relativas de todos
os valores da variável (salário), menores ou iguais ao valor considerado, como apresentado na quarta coluna
da nossa tabela.
Assim, os 56 empregados com salários inferiores a 5000 correspondem à 𝑓𝑎𝑐 de 0,35. Para achar a frequência
acumulada correspondente ao número de funcionários com salário igual ou superior a 2000 e inferior a 8000,
deve-se somar as 𝑓𝑟 da 3ª, 4ª e 5ª (0,35 + 0,15 + 0,40 = 0,85).
Utilizando a regra de três, temos: 0,35 → 560,85 → 𝑥 0,35𝑥 = 47,60 𝑥 = 136
Gabarito: C.
29. (FGV/AL-BA/2014) Observe a tabela de frequências a seguir, que se refere aos saldos em conta, num
determinado dia, de duzentas contas‐correntes:
Saldos em conta (R$) Frequência
Até 100,00 8
De mais de 100,00 a 300,00 28
De mais de 300,00 a 500,00 46
De mais de 500,00 a 700,00 54
De mais de 700,00 a 900,00 44
De mais de 900,00 a 1.100,00 13
De mais de 1.100,00 a 1.300,00 6
Acima de 1.300,00 1
A frequência relativa acumulada de saldos em R$ 900,00 é igual a
a) 22%.
b) 36%.
c) 54%.
d) 90%.
e) 97%.
Comentários:
Para resolvermos a questão, precisamos saber a frequência acumulada, da seguinte forma:
Saldos em conta (R$) Frequência Frequência acumulada
Até 100,00 8 =8
De mais de 100,00 a 300,00 28 = 8 + 28 = 36
De mais de 300,00 a 500,00 46 = 36 + 46 = 82
De mais de 500,00 a 700,00 54 = 82 + 54 = 136
De mais de 700,00 a 900,00 44 = 136 + 44 =180
De mais de 900,00 a 1.100,00 13
De mais de 1.100,00 a 1.300,00 6
Acima de 1.300,00 1
Total 200
Não é necessário preencher toda a tabela, tendo em vista que a questão pede o saldo em 900,00.
Portanto, verificamos que a frequência absoluta acumulada até 900 é 180. Para determinar a frequência
relativa acumulada, basta dividir este valor (180) por 200, pois são 200 observações (soma das frequências): 180200 = 0,9 = 90%
Gabarito: D.
30. (CESPE/BACEN/2013)
2 4 8 4 8 1 2 32 12 1 5 7 5 5 3 4 24 19 4 14
Os dados mostrados acima representam uma amostra, em minutos, do tempo utilizado na armazenagem
de formulários no almoxarifado central de certa instituição por diversos funcionários.
Com base nesses dados, julgue o próximo item.
A distribuição de frequência acumulada para tempo de armazenagem observado na amostra inferior a 8
minutos é igual a 13, o que corresponde a uma frequência relativa superior a 0,60.
Comentários:
Não precisamos construir a distribuição de frequências para responder à questão. Sabemos que o total de
observações é 20, pois é esse o número de termos.
Vamos destacar as observações que são inferiores a 8:
2 4 8 4 8 1 2 32 12 1 5 7 5 5 3 4 24 19 4 14
São 13 números inferiores a 8. Portanto, a frequência acumulada para um tempo menor do que 8 é 13.
Para calcular a frequência relativa, basta dividir a frequência absoluta pelo total de observações: 1320 = 0,65
Logo, a frequência relativa acumulada é maior do que 0,60.
Gabarito: Certo.
31. (FCC/TRT 6ª Região/2012) A distribuição dos 500 preços unitários de um equipamento é representada
por um histograma em que no eixo das abscissas constam os intervalos de classe e no eixo das ordenadas
estão assinaladas as respectivas densidades de frequências, em (R$)−1. Define-se densidade de frequência
de um intervalo de classe como sendo o resultado da divisão da respectiva frequência relativa pela
correspondente amplitude do intervalo. Um intervalo de classe no histograma apresenta uma amplitude
de R$ 2,50 com uma densidade de frequência igual a 0,096. A quantidade de preços unitários referente a
este intervalo é
a) 96.
b) 120.
c) 144.
d) 150.
e) 192.
Comentários:
Sabemos que a densidade de frequência (𝑑), é a relação entre a frequência relativa (𝑓𝑟) e a amplitude de
classe (ℎ). Assim: 𝑑 = 𝑓𝑟ℎ
Dados do enunciado:
• Amplitude de classe = 2,50 (ℎ = 2,50);
• Densidade de frequência = 0,096 (𝑑𝑓 = 0,096).
Substituindo esses valore na equação, temos: 𝑑𝑓 = 𝑓𝑟ℎ 𝑓𝑟 = 0,096 × 2,50 = 0,24 = 24%
Então, 24% dos preços estão localizados neste intervalo.
Calculando a quantidade para 500 preços, temos: 24% × 500 = 120
Gabarito: B.
32. (FCC/TRT 6ª Região/2012) A função de distribuição empírica abaixo, F200(x), refere-se a uma pesquisa
realizada em 200 residências, escolhidas aleatoriamente, em que x é o número verificado de pessoas que
trabalham em cada residência.
𝑭𝟐𝟎𝟎(𝒙) =
{
𝟎, 𝟎𝟎 𝒔𝒆 𝒙 < 𝟎𝟎, 𝟏𝟎 𝒔𝒆 𝟎 ≤ 𝒙 < 𝟏𝟎, 𝟒𝟎 𝒔𝒆 𝟏 ≤ 𝒙 < 𝟐𝟎, 𝟔𝟓 𝒔𝒆 𝟐 ≤ 𝒙 < 𝟑𝟎, 𝟖𝟓 𝒔𝒆 𝟑 ≤ 𝒙 < 𝟒𝟎, 𝟗𝟓 𝒔𝒆 𝟒 ≤ 𝒙 < 𝟓𝟏, 𝟎𝟎 𝒔𝒆 𝒙 ≥ 𝟓
O número de residências desta pesquisa em que se verificou possuir pelo menos uma pessoa que trabalha
e menos que 4 é
a) 150.
b) 160.
c) 170.
d) 180.
e) 190.
Comentários:
Inicialmente, vamos montar uma tabela com as frequências acumuladas para melhor visualizarmos a
questão:
Classe Frequência Acumulada 0 ≤ 𝑥 < 1 0,1 1 ≤ 𝑥 < 2 0,4 2 ≤ 𝑥 < 3 0,65 3 ≤ 𝑥 < 4 0,85 4 ≤ 𝑥 < 5 0,95 𝑥 ≥ 5 1
A primeira linha nos diz que 10% das residências não apresentam ninguém que trabalhe.
A quarta linha nos diz que em 85% das residências há menos de 4 pessoas trabalhando.
Se o total de residências é 200 e temos a informação de que em 85% há menos de 4 pessoas trabalhando,
logo, há 170 residências nesta classe. Queremos eliminar as residências em que não trabalha ninguém, os
10% = 20 residências. Então: 170 − 20 = 150
Gabarito: A.
33. (CESPE/ALECE/2011)
X 0 1 2 3 4 5
Frequência Absoluta 80 47 30 20 6 1
Um levantamento foi realizado para se avaliar, por município, a quantidade X de obras que estão sob
suspeita de irregularidade. Com base em uma amostra de municípios, foi obtida a distribuição de
frequências mostrada na tabela acima. Com base nessas informações, julgue o item a seguir.
Os extremos mínimo e máximo da variável X foram, respectivamente, iguais a 1 e 80.
Comentários:
Na tabela temos que a variável X assume valores que vão de 0 a 5. As frequências absolutas correspondem
a quantas vezes esses valores se repetem. Portanto, concluímos que os valores mínimo e máximo de X são,
respectivamente, 0 e 5.
Gabarito: Errado
34. (CESPE/ALECE/2011)
X 0 1 2 3 4 5
Frequência Absoluta 80 47 30 20 6 1
Um levantamento foi realizado para se avaliar, por município, a quantidade X de obras que estão sob
suspeita de irregularidade. Com base em uma amostra de municípios, foi obtida a distribuição de
frequências mostrada na tabela acima. Com base nessas informações, julgue o item a seguir.
O número de municípios que têm obras sob suspeita de irregularidades é superior a 120.
Comentários:
Para respondermos a questão, basta entendermos que precisamos fazer um somatório de todas as obras
que estão sob suspeita de irregularidades. Se 𝑋 = 0 se refere ao fato de nenhuma obra estar sob suspeita
de irregularidade, então partiremos da soma 𝑋 = 1 a 𝑋 = 5. Assim, somaremos todas as frequências
absolutas: 47 + 30 + 20 + 6 + 1 = 104
Gabarito: Errado.
35. (CESPE/ALECE/2011)
X 0 1 2 3 4 5
Frequência Absoluta 80 47 30 20 6 1
Um levantamento foi realizado para se avaliar, por município, a quantidade X de obras que estão sob
suspeita de irregularidade. Com base em uma amostra de municípios, foi obtida a distribuição de
frequências mostrada na tabela acima. Com base nessas informações, julgue o item a seguir.
O total de municípios considerado no levantamento foi superior a 180.
Comentários:
Para sabermos o total de municípios, basta somarmos todas as frequências absolutas: 80 + 47 + 30 + 20 + 6 + 1 = 184
Gabarito: Certo.
36. (FCC/TRT 1ª Região/2011) Um histograma representa a distribuição dos preços unitários de venda de
um determinado equipamento no mercado. No eixo das ordenadas estão assinaladas as respectivas
densidades de frequência para cada intervalo em (R$)−1. Define-se densidade de frequência de um
intervalo de classe como sendo o quociente da divisão da respectiva frequência relativa pela
correspondente amplitude do intervalo. Um intervalo de classe do histograma corresponde aos preços
unitários maiores ou iguais a R$ 32,00 e inferiores a R$ 44,50 com uma densidade de frequência igual a 1,6
× 10−2 (R$)−1. Se todos os intervalos de classe do histograma têm a mesma frequência relativa, então um
intervalo de classe com densidade de frequência igual a 5,0 × 10−3 (R$)−1 apresenta uma amplitudede
a) R$ 64,00.
b) R$ 48,00.
c) R$ 40,00.
d) R$ 32,00.
e) R$ 24,00.
Comentários:
Calculando a amplitude do intervalo: 44,50 − 32 = 12,50
Sabemos que a densidade de frequência (𝑑), é a relação entre a frequência relativa (𝑓𝑟) e a amplitude de
classe (ℎ). Assim:
𝑑 = 𝑓𝑟ℎ
Em que 𝑑 é a densidade de frequência; 𝑓𝑟 é a frequência relativa e ℎ é a amplitude.
Aplicando os valores do enunciado na fórmula, temos: 𝑑 = 𝑓𝑟ℎ 1,6 × 10−2= 𝑓𝑟12,50 𝑓𝑟 = (1,6 × 10−2) × 12,50 = 20 × 10−2 = 0,2
A questão informou que todos os intervalos têm a mesma frequência. Assim, podemos concluir que todos
eles têm frequência de 20%.
Considerando o intervalo com densidade de 5,0 × 10−3 (R$)−1: 5 × 10−3 = 0,2ℎ ℎ = 0,25 × 10−3 ℎ = 40
Gabarito: C.
37. (CESPE/SEFAZ-MT/2004) Considere a seguinte situação hipotética.
Um órgão do governo recebeu pela Internet denúncias de sonegação de impostos estaduais contra 600
pequenas empresas. Denúncias contra outras 200 pequenas empresas foram encaminhadas pessoalmente
para esse órgão. Para a apuração das denúncias, foram realizadas auditorias nas 800 empresas
denunciadas. Como resultado dessas auditorias, foi elaborada a tabela abaixo, que apresenta um quadro
das empresas denunciadas e os correspondentes débitos fiscais ao governo. Das empresas denunciadas,
observou-se que apenas 430 tinham débitos fiscais.
Valor do débito fiscal (VDF), em R$ mil, apurado após auditoria na
empresa denunciada
Forma de recebimento da
denúncia
0 < 𝑉𝐷𝐹 < 1 1 ≤ 𝑉𝐷𝐹 < 2 2 ≤ 𝑉𝐷𝐹 < 3 3 ≤ 𝑉𝐷𝐹 ≤ 4 Total
Pela internet 60 100 50 30 240
Pessoalmente 20 120 40 10 190
Total 80 220 90 40 430*
Nota: *Para as demais empresas, VDF=0
Com base na situação hipotética acima e de acordo com as informações apresentadas, julgue o item que
se segue.
O valor total dos débitos fiscais apurados após as auditorias feitas nas empresas denunciadas é inferior a R$
500 mil.
Comentários:
Para responder essa questão, trabalharemos com os limites inferiores das classes, buscando minimizar os
valores dos débitos, para ver se é possível que o total seja menor de R$ 500 mil.
Débito Mínimo Frequência Produto
0 80 0
1 220 220
2 90 180
3 40 120
Total 520
Portanto, o débito total é de, no mínimo, R$ 520 mil. Logo, é impossível que o valor total dos débitos fiscais
seja inferior a R$ 500 mil.
Gabarito: Errado.
38. (CESPE/SEFAZ-AL/2002) Julgue o seguinte item.
Em uma distribuição de frequências para um conjunto de n indivíduos, pode-se calcular as frequências
relativas, dividindo-se cada frequência absoluta pela amplitude da correspondente classe ou do intervalo.
Comentários:
A frequência relativa é calculada pela divisão entre a frequência absoluta simples e a frequência total. Na
realidade, a questão fez referência ao cálculo da densidade de frequência.
Gabarito: Errado.
QUESTÕES COMENTADAS
Representação Gráfica das Distribuições de Frequências
1. (CESPE/TELEBRAS/2022)
Considerando que o histograma apresentado descreve a distribuição de uma variável quantitativa X por
meio de frequências absolutas, julgue o item que se segue.
O número de observações que constituem a variável X é igual a 1.000.
Comentários:
O número de observações consiste na soma de todas as frequências representadas no histograma. Assim,
com base no histograma, temos que a soma das frequências é igual a: 400 + 300 + 200 + 150 + 50 = 1100
Gabarito: Errado.
2. (FGV/TCU/2022) O histograma a seguir mostra a quantidade de refeições para cada faixa de preço, em
uma determinada área do Rio de Janeiro.
O conjunto de dados consistente com o histograma é:
a) 25, 27, 27, 28, 29, 34, 34, 34, 35, 35, 35, 35, 36, 36, 37;
b) 26, 27, 27, 28, 29, 34, 34, 34, 35, 35, 36, 36, 37;
c) 26, 27, 27, 28, 29, 34, 34, 34, 35, 35, 35, 35, 36, 36, 39;
d) 26, 27, 27, 28, 29, 34, 34, 34, 35, 35, 35, 35, 36, 36, 37;
e) 26, 27, 27, 28, 29, 31, 34, 34, 34, 35, 35, 35, 36, 36, 37.
Comentários:
Calculando a amplitude de cada classe: 37 − 264 = 2,75
De posse dessa informação, podemos formar as classes do histograma:
26 ⊢ 28,75
28,75 ⊢ 31,5
31,5 ⊢ 34,25
34,25 ⊢ 37
Agora, podemos acrescentar as frequências de cada classe:
Classes Frequências
26 ⊢ 28,75 4
28,75 ⊢ 31,5 1
31,5 ⊢ 34,25 3
34,25 ⊢ 37 7
Analisando as alternativas, concluímos que a letra D está correta.
Gabarito: D.
3. (VUNESP/CMSJC/2022) Os tempos de espera, em minutos, para o atendimento de 80 consumidores em
um centro de atendimento ao consumidor estão registrados no gráfico a seguir.
De acordo com o gráfico, é correto afirmar que o tempo de espera de
a) mais da metade dos consumidores foi superior a 1 hora.
b) 12,5% dos consumidores foi entre 1 h e 35 min e 2 h e 20 min.
c) 65% dos consumidores foi inferior a 1 hora.
d) 24 consumidores foi entre 50 min e 80 min.
e) no mínimo 2 pessoas, foi superior a 2 h e 30 min.
Comentários:
Primeiro, podemos montar a tabela de frequências acumuladas para simplificar a análise das alternativas:
Classes
Frequência
Absoluta
Frequência
Absoluta
Acumulada
Frequência
Relativa
Frequência
Relativa
Acumulada
20 ⊢ 35 24 24 30,00% 30,00%
35 ⊢ 50 20 44 25,00% 55,00%
50 ⊢ 65 8 52 10,00% 65,00%
65 ⊢ 80 10 62 12,50% 77,50%
80 ⊢ 95 6 68 7,50% 85,00%
95 ⊢ 110 3 71 3,75% 88,75%
110 ⊢ 125 3 74 3,75% 92,50%
125 ⊢ 140 4 78 5,00% 97,50%
140 ⊢ 155 2 80 2,50% 100,00%
Total 80 80 100% 100%
Agora, analisando as alternativas, podemos afirmar que:
Alternativa A: Incorreta. O tempo de espera foi inferior a 50 minutos para mais da metade (55%) das pessoas.
Alternativa B: Correta. Para 12,5% dos consumidores, o tempo de espera foi entre 1h e 35 min e 2h e 20min.
Somando as frequências relativas referentes às classes 95 ⊢ 110, 110 ⊢ 125 e 125 ⊢ 140, temos: 3,75% + 3,75% + 5,00% = 12,5%
Alternativa C: Incorreta. Não podemos afirmar isso, pois a terceira classe termina em 65 min. O que podemos
afirmar é que para 65% das pessoas o tempo de espera foi inferior a 1h e 5 minutos.
Alternativa D: Incorreta. O tempo de espera foi entre 50 min e 80 min para 18 pessoas.
Alternativa E: Incorreta. O que se pode afirmar é que, para no mínimo duas pessoas, o tempo de espera foi
superior a 2h e 20 min.
Gabarito: B.
4. (CESGRANRIO/BB/2021) Após a coleta de dados em um determinado contexto (variáveis A, B, C, … X),
uma das formas mais simples e iniciais de análise é a geração e a avaliação de um histograma para uma
variável selecionada (ex: X), como por exemplo, em um estudo climático, em que os dados coletados
poderiam incluir a temperatura máxima observada em toda a Terra ao longo de dez anos.
Nesse caso, o histograma adequado é um gráfico em que são apresentadas as
a) últimas dez médias móveis da variável X
b) somas das médias dos quadrados de cada valor de uma variável X
c) variações de uma variável X ao longo do tempo
d) médias históricas da variável X nos últimos sete dias
e) frequências de uma variável X em intervalos de valores.
Comentários:
O histograma é um gráfico destinado a representar dados agrupados em classe, sendo composto por um
conjunto de retângulos contíguos (justapostos) cujas bases ficam localizadas sobre o eixo horizontal (eixo x),
de forma que os seus pontos médios devem coincidir com os pontos médios dos intervalos de classe e seus
limites devem coincidir com os limites de cada classe. A quantidade de retângulos em um histograma é
equivalente ao número de classes. A largura de cada retângulo é equivalente à amplitude do intervalo de
classe, enquanto a altura deve ser proporcional à frequência da classe.
Logo, podemos estabelecer que o histograma é um gráfico em que são apresentadas as frequências de uma
variável X em intervalos de valores.
Gabarito: E.
5. (CESPE/SEDUC AL/2021) Com base em estatística, julgue o item a seguir.
Suponha que o histograma a seguir represente afrequência relativa de alunos, distribuída por faixa etária,
que ingressaram no ensino superior no estado de Alagoas em 2020. Com base nas informações desse
gráfico, é correto afirmar que mais de 50% dos novos alunos têm idade superior a 22 anos.
Comentários:
Observando o histograma, percebemos que as duas primeiras classes correspondem a mais de 50% dos
dados, pois possuem frequências superiores a 30% e 20%, respectivamente. Como as idades nesse intervalo
variam de 18 a 22 anos, menos de 50% terão idades superiores a 22 anos.
Gabarito: Errado.
6. (CESPE/FUNPRESP/2016)
O gráfico ilustra cinco possibilidades de fundos de investimento com suas respectivas rentabilidades.
Considerando que as probabilidades de investimento para os fundos A, B, C e D sejam, respectivamente,
P(A) = 0,182; P(B) = 0,454; P(C)= 0,091; e P(D)= 0,182, julgue o item subsequente.
O gráfico apresentado é um histograma.
Comentários:
O gráfico não é um histograma por dois motivos: primeiro porque há uma separação entre as colunas, o que
não ocorre em um histograma, e sim em um gráfico de colunas; segundo porque um histograma representa
dados que estão agrupados em intervalos de classe, e não em categorias, como é o caso.
Gabarito: Errado.
7. (CESPE/DEPEN/2015)
Região
Quantidade de detentos no
sistema penitenciário
brasileiro (mil pessoas)
Déficit de vagas no sistema
penitenciário (mil vagas)
População brasileira
(milhões de
habitantes)
Norte 37 13 17
Centro-Oeste 51 24 15
Nordeste 94 42 55
Sudeste 306 120 85
Sul 67 16 28
Total 555 215 200
Ministério da Justiça — Departamento Penitenciário Nacional — Sistema Integrado de Informações Penitenciárias – InfoPen, Relatório Estatístico Sintético do
Sistema Prisional Brasileiro, dez./2013
Internet: <www.justica.gov.br> (com adaptações).
A tabela mostrada apresenta a quantidade de detentos no sistema penitenciário brasileiro por região em
2013. Nesse ano, o déficit relativo de vagas — que se define pela razão entre o déficit de vagas no sistema
penitenciário e a quantidade de detentos no sistema penitenciário — registrado em todo o Brasil foi
superior a 38,7%, e, na média nacional, havia 277,5 detentos por 100 mil habitantes.
Com base nessas informações e na tabela apresentada, julgue o item a seguir.
Na análise exploratória, o histograma é um gráfico adequado para descrever a distribuição da quantidade de
detentos por região em 2013.
Comentários:
O histograma é destinado a representar dados agrupados em classes, mas o enunciado apresenta dados com
valores individualizados. Como a informação não está agrupada em classes, o histograma não representaria
adequadamente os dados da tabela.
Gabarito: Errado.
8. (CESPE/BACEN/2013)
2 4 8 4 8 1 2 32 12 1 5 7 5 5 3 4 24 19 4 14
Os dados mostrados acima representam uma amostra, em minutos, do tempo utilizado na armazenagem
de formulários no almoxarifado central de certa instituição por diversos funcionários.
Com base nesses dados, julgue o próximo item.
É inviável a elaboração de um histograma em decorrência do fato de ser este um conjunto de dados
quantitativos discretos; dessa forma, apenas por meio de um gráfico de barras pode ser realizada a
representação gráfica.
Comentários:
O item está errado. É sim possível elaborar um histograma para os dados apresentados, bastaria, para tanto,
organizá-los em intervalos de classe.
Gabarito: Errado.
QUESTÕES COMENTADAS
Outros Gráficos e Representações
1. (IBFC/Pref. Cuiabá/2023) O diagrama de ramo e folhas abaixo corresponde às observações das idades
de 50 pacientes escolhidos em um determinado bairro de uma cidade:
1 6 7 7 8 8 9 9
2 0 0 1 1 2 3 3 4 4 4 8 9
3 0 1 2 2 1 7 8 8
4 2 3 6 6 6 6 8 9
5 2 3 3 4 4 8
6 0 2 5 6
7 1 4
Assinale a alternativa que apresenta o valor do módulo da diferença entre a mediana e a moda destas
idades observadas.
a) 0
b) 3
c) 10
d) 14
Comentários:
O diagrama de ramos e folhas fornece uma maneira rápida de representar graficamente a distribuição dos
dados. Nesse tipo de diagrama, cada número é separado em duas partes. De um lado ficam as unidades do
número e do outro lado fica o restante desse número.
Como sabemos, a mediana caracteriza a posição central de uma série de valores. Ela separa uma série de
valores em duas partes de tamanhos iguais, cada uma contendo o mesmo número de elementos.
O enunciado diz que o conjunto é formado por 50 pacientes, entretanto, há apenas 47 observações no
diagrama, assim, consideraremos que o número de paciente é igual a 47. Quando uma série possui um
número ímpar de elementos, a mediana SEMPRE coincide com o elemento central do conjunto de dados. O
termo central ocupa a posição 𝑛+12 : 47 + 12 = 24
Para o cálculo da mediana, os dados devem estar ordenados. No diagrama as idades estão ordenadas de
forma crescente, porém, na casa dos 30, há uma pequena desordem. A quinta idade deve ser considerada
na contagem de posição como a terceira idade da casa dos 30. Observe:
3 0 1 2 2 1 7 8 8
A sequência correta é: 30 31 31 32 32 37 38 38
1 6 7 7 8 8 9 9
2 0 0 1 1 2 3 3 4 4 4 8 9
3 0 1 1 2 2⏟24º 𝑡𝑒𝑟𝑚𝑜 7 8 8
4 2 3 6 6 6 6 8 9
5 2 3 3 4 4 8
6 0 2 5 6
7 1 4
Feita esta observação, podemos encontrar a idade na posição 24: 𝑀𝑑 = 32
A moda é uma medida de posição e de tendência central que descreve o valor mais frequente de um conjunto
de observações, ou seja, o valor de maior ocorrência dentre os valores observados. A idade com maior
ocorrência dentre as observadas é 46, que se repete 4 vezes. 𝑀𝑜 = 46
Logo, o módulo da diferença entre a mediana e a moda é: |32 − 46| = 14
Gabarito: D.
2. (CESPE/FUB/2022) Uma universidade está fazendo um estudo para verificar a distribuição dos tempos
que os alunos do curso de mestrado levam até a defesa da dissertação. Os dados a seguir mostram a função
de probabilidade desses tempos, em meses.
Tempo de Defesa (meses) Probabilidade
12 0,01
15 0,02
18 0,04
20 0,10
22 0,22
24 0,31
25 0,18
26 0,04
28 0,03
30 0,05
Considerando essas informações, julgue o item subsequente.
O gráfico de setores é adequado para representar a distribuição em questão.
Comentários:
O gráfico em setores (também conhecido como gráfico de pizza) é usado para representar a frequência
relativa (porcentagem) de uma variável categórica. Ele é formado por um círculo dividido em setores
circulares, cada um representando uma categoria, cujos ângulos centrais são proporcionais às frequências
relativas de cada categoria. Na tabela em questão, o tempo de defesa é representado de forma numérica, o
que não é condizente com uma variável categórica. Portanto, o gráfico em setores não é adequado para
representar a distribuição apresentada na tabela.
Gabarito: Errado.
3. (CESPE/FUB/2022) A tabela de frequência a seguir mostra dados coletados em uma pesquisa para se
verificar o número de disciplinas que os estudantes de determinada universidade estão cursando por
semestre.
Disciplinas 2 3 4 5 6 7 8
Estudantes 10 15 40 35 28 10 4
Considerando essas informações, julgue o item seguinte.
O gráfico do tipo pizza é o mais apropriado para representar os dados apresentados na tabela, visto que a
variável analisada é qualitativa ordinal.
Comentários:
O gráfico em setores (também conhecido como gráfico de pizza) é usado para representar a frequência
relativa (porcentagem) de uma variável categórica. Ele é formado por um círculo dividido em setores
circulares, cada um representando uma categoria, cujos ângulos centrais são proporcionais às frequências
relativas da categoria.
As variáveis qualitativas são as características que não podem ser descritas de forma numérica, mas que
podem ser definidas por meio de qualidades (atributos ou categorias) do indivíduopesquisado. Elas podem
ser classificadas em nominais ou ordinais:
a) variável qualitativa nominal (ou categórica), as possíveis categorias não podem ser ordenadas. Por
exemplo, a cor dos olhos dos moradores de uma determinada cidade (pretos, castanhos, azuis e
verdes);
b) variável qualitativa ordinal, as possíveis categorias podem ser ordenadas de alguma forma. Por
exemplo, o grau de instrução dos funcionários de um determinado órgão (fundamental, médio,
superior).
Portanto, analisando os dados apresentados na tabela, verificamos tratar-se de uma variável quantitativa, a
qual podemos atribuir valores numéricos, e não uma variável qualitativa. Assim, a afirmativa da questão está
incorreta.
Gabarito: Errado.
4. (FADESP/Pref. De Igarapé-Açu/2022)
CONSIDERE OS DADOS A SEGUIR PARA RESPONDER À QUESTÃO.
No dia 25 de agosto de 2021, a Prefeitura Municipal de Igarapé-Açu
divulgou o Boletim Covid-19, conforme imagem abaixo.
Fonte: https://prefeituradeigarapeacu.pa.gov.br/boletim-epidemiologico-em-25-08-2021/ Acesso em 28/08/2021.
O número de casos confirmados em relação ao de casos notificados corresponde, aproximadamente, a
a) 33%.
b) 35%.
c) 37%.
d) 39%.
Comentários:
O boletim informa que o número de casos confirmados foi de 3.586 e que o número de casos notificados foi
de 9.182. Para sabermos o percentual de casos confirmados em relação ao número de casos notificados,
basta dividirmos: 35869182 = 0,39 → 39%
Gabarito: E.
5. (FADESP/Pref. De Igarapé-Açu/2022)
CONSIDERE OS DADOS A SEGUIR PARA RESPONDER À QUESTÃO.
No dia 25 de agosto de 2021, a Prefeitura Municipal de Igarapé-Açu
divulgou o Boletim Covid-19, conforme imagem abaixo.
Fonte: https://prefeituradeigarapeacu.pa.gov.br/boletim-epidemiologico-em-25-08-2021/ Acesso em 28/08/2021.
Suponhamos que, dias depois, o número de casos recuperados tenha sido igual a 3.492, o número de
óbitos tenha sido igual a 2% da quantidade de casos confirmados e o número de pessoas em tratamento
domiciliar tenha sido igual a 50% do número de óbitos. Nessas condições, nesse dia, o número de casos
confirmados (que se constitui na soma do número de casos recuperados com o de casos em tratamento
domiciliar mais o número de óbitos) foi igual a
a) 3.580.
b) 3.600.
c) 3.620.
d) 3.640.
Comentários:
Vamos analisar o que diz o comando da questão:
i) casos recuperados: 3.492;
ii) número de óbitos: 2% de 3.586: 3586 × 0,02 = 72
iii) número de pessoas em tratamento domiciliar: 50% de 72: 72 × 0,5 = 36
Assim, o número de casos confirmados foi igual a:
casos confirmados = casos recuperados + casos em tratamento domiciliar + número de óbitos 𝐶𝑎𝑠𝑜𝑠 𝑐𝑜𝑛𝑓𝑖𝑟𝑚𝑎𝑑𝑜𝑠 = 3.492 + 36 + 72 = 3.600
Gabarito: B.
6. (FADESP/Pref. De Igarapé-Açu/2022)
CONSIDERE OS DADOS DOS QUADROS A SEGUIR
PARA RESPONDER À QUESTÃO.
É correto afirmar que, nesse período de quatorze anos, em Igarapé-Açu,
a) morreram menos de 130 crianças com idade inferior a 1 ano.
b) morreram mais de 150 crianças com idade inferior a 1 ano.
c) nasceram vivas menos de 7.000 crianças.
d) nasceram vivas mais de 9.800 crianças.
Comentários:
Essa questão é bem direta, para sabermos o número crianças que morreram com idade inferior a 1 ano,
devemos somar todas as observações apresentadas no gráfico da mortalidade infantil: 15 + 9 + 12 + 12 + 1 + 8 + 12 + 10 + 12 + 2 + 9 + 4 + 6 + 7 = 119
Do mesmo modo, podemos estabelecer que o número de nascidos vivos foi: 620 + 650 + 590 + 580 + 600 + 580 + 590 + 610 + 600 + 570 + 550 + 560 + 590 + 550 = 8.240
Gabarito: A.
7. (FADESP/Pref. De Igarapé-Açu/2022)
CONSIDERE OS DADOS DOS QUADROS A SEGUIR
PARA RESPONDER À QUESTÃO.
A taxa de mortalidade infantil, calculada pelo IBGE, é obtida considerando-se a quantidade de crianças
mortas com menos de um ano por mil crianças que nasceram vivas. Assim, é possível afirmar que, em
Igarapé-Açu, no ano de 2010, a taxa de mortalidade infantil foi, aproximadamente, igual a
a) 1,67.
b) 1,87.
c) 2,07.
d) 2,27.
Comentários:
Conforme o enunciado, a taxa de mortalidade infantil é obtida considerando-se a quantidade de crianças
mortas com menos de um ano por mil crianças que nasceram vivas.
Observando o gráfico de nascidos vivos, temos o valor de 600 para o ano de 2010. Logo, Assim, a taxa de
nascidos vivos por mil crianças foi de: 6001000 = 0,6
Voltando ao gráfico de mortalidade infantil, temos o valor de 1 para o ano de 2010. Assim, considerando a
quantidade de crianças mortas com menos de um ano por mil crianças que nasceram vivas, temos: 10,6 = 1,67
Gabarito: A.
8. (VUNESP/EsFCEx/2021) O gráfico abaixo apresenta os resultados de uma pesquisa de opinião com os
clientes de operadoras de telefonia móvel no estado Açaí.
É correto afirmar sobre o gráfico que
a) a operadora ATCHIM é a mais bem avaliada entre as três operadoras, pois a soma dos percentuais de
“Ótima” e “Boa” é a maior entre as três operadoras.
b) as opiniões dos clientes sobre as operadoras são semelhantes no estado Açaí, porque os percentuais são
aproximadamente iguais.
c) as opiniões dos clientes sobre as operadoras são positivas no estado Açaí, porque a soma dos percentuais
de “Ótima” e “Boa” é superior a 50% para todas.
d) a opinião dos clientes da operadora SINFÔNICA no estado Açaí é bastante negativa, porque a soma dos
percentuais de “Ruim” e “Péssima” é cerca de 60%.
e) o maior percentual de respostas dos clientes está concentrado na categoria “Boa” para todas as
operadoras.
Comentários:
Analisando as alternativas, podemos afirmar que:
Alternativa A: Correta. De fato, a operadora ATCHIM é a mais bem avaliada dentre as três operadoras, pois
a soma dos percentuais de “Ótima” e “Boa” alcança, aproximadamente, 42%, enquanto os percentuais das
demais operadoras atingem 34% e 25%.
Alternativa B: Incorreta. Há uma variação considerável entre as opiniões dos clientes. A operadora "MORTO",
por exemplo, foi avaliada como péssima em 25% das opiniões coletadas, enquanto as demais foram avaliadas
como péssima por cerca de 15% dos usuários.
Alternativa C: Incorreta. Como foi dito na alternativa A. Os índices são de, aproximadamente, 42% para a
operadora ATCHIN, 34% para a operadora SINFÔNICA e 25% para a operadora MORTO.
Alternativa D: Incorreta. Para a operadora SINFÔNICA, a soma dos percentuais de "Ruim" e "Péssima" é cerca
de 45%.
Alternativa E: Incorreta. Para a operadora "MORTO", o maior percentual se concentra na categoria
"Regular". Para as outras duas operadoras, o maior percentual se concentra na categoria "Boa".
Gabarito: A.
9. (VUNESP/Pref. Araçariguama/2021) O gráfico a seguir apresenta como votaram os vereadores de uma
determinada cidade na votação de um projeto na Câmara Municipal.
Número de votos
Sobre o modo como esses vereadores votaram, é correto afirmar que
a) 2/3 dos vereadores votaram a favor do projeto.
b) os votos a favor foram mais do que o dobro dos votos contrários.
c) a maioria dos votos foi contrária a emenda.
d) para cada voto contrário tiveram dois votos a favor.
e) mais de 1/3 dos vereadores votaram contra o projeto.
Comentários:
Pelo gráfico, podemos perceber que houve pouco mais de 30 votos. Vamos supor que tenham sido 33 votos.
Se 20 vereadores votaram a favor, então 13 foram os que votaram de forma contrária. Assim, temos uma
proporção de vereadores que votaram contra um pouco maior que 1/3, isto é, 13/33. Logo, a alternativa
correta é a letra E.
Gabarito: E.
10. (VUNESP/UNICAMP/2019) Assinale dentre os exemplos a seguir, o gráfico de dispersão.
a)
b)
c)
d)
e)
Comentários:
Analisando cada gráfico, temos:
• Letra A: o gráfico de setores é formado por um círculo dividido em setores circulares, cada um
representando uma categoria, cujos ângulos centrais são proporcionais às frequências relativas da
categoria. Logo, aalternativa está errada.
• Letra B: o gráfico de dispersão é uma representação gráfica que analisa a relação entre duas variáveis
quantitativas — uma de causa e outra de efeito, chamadas de variáveis independente e dependente,
respectivamente. Esse tipo de diagrama traz números simultâneos das duas variáveis, deixando
visível se o que acontece em uma variável interfere na outra.
• Letra C: o gráfico em linhas é o gráfico em que os pontos são geralmente usados para controlar
alterações ao longo do tempo e para facilitar a identificação de tendências ou de anomalias.
Alternativa Errada.
• Letra D: os gráficos em colunas assim como os gráficos de barras são usados para distribuições de
dados categóricos ou qualitativos. A diferença básica é que, no primeiro, uma série estatística é
representada por um conjunto de retângulos dispostos verticalmente, cada um indicando uma
categoria particular, todos com a mesma largura e alturas proporcionais aos respectivos. Alternativa
Errada.
• Letra E: os gráficos em barras normalmente são usados para representar distribuições de dados
categóricos ou qualitativos. Uma série estatística é representada por um conjunto de retângulos
dispostos horizontalmente, cada um indicando uma categoria particular, os quais possuem a mesma
altura e comprimentos proporcionais aos respectivos dados. Alternativa Errada.
Gabarito: B.
11. (VUNESP/Pref. Campinas/2019) Uma empresa atua em três segmentos de mercado, A, B e C. O gráfico
de setores mostra a distribuição percentual, por segmento, da receita total obtida por essa empresa em
2018.
Sabendo-se que a receita obtida no segmento A superou a receita obtida no segmento B em R$ 64 milhões,
é correto afirmar que a receita obtida no segmento C foi igual a
a) R$ 98 milhões.
b) R$ 96 milhões.
c) R$ 94 milhões.
d) R$ 88 milhões.
e) R$ 86 milhões.
Comentários:
Consideremos T o total de receitas obtidas pela empresa em 2018. Pelas informações apresentadas no
gráfico de pizza, temos: 𝐴 = 0,48 × 𝑇 𝐵 = 0,4 × 𝑇 𝐶 = 0,12 × 𝑇
Sabendo que a receita obtida no segmento A superou a receita obtida no segmento B em R$ 64 milhões,
então: 𝐴 = 𝐵 + 64 0,48 × 𝑇 = 0,4 × 𝑇 + 64 0,8 × 𝑇 = 64 𝑇 = 800 𝑚𝑖𝑙ℎõ𝑒𝑠
Logo, 𝐶 = 0,12 × 𝑇 𝐶 = 12 × 800 𝐶 = 96 𝑚𝑖𝑙ℎõ𝑒𝑠
Gabarito: B.
12. (VUNESP/Pref. Campinas/2019) Considere o gráfico a seguir.
Atendimento ao público: número de pessoas por dia
Se, ao invés da situação exposta no gráfico, o número de pessoas atendidas por dia tivesse sido sempre
igual e mantido o número total de atendimentos, o número de pessoas que teriam sido atendidas na 5ª
feira teria sido inferior ao que consta no gráfico em
a) 6 unidades.
b) 8 unidades.
c) 7 unidades.
d) 10 unidades.
e) 9 unidades.
Comentários:
Para saber qual seria o número de pessoas atendidas por dia se fossem atendidas a mesma quantidade todos
os dias, basta calcularmos a média dos atendimentos da semana. Assim, temos: 23 + 19 + 27 + 32 + 14 = 115 1155 = 23
Desse modo, como anteriormente haviam sido atendidas 32 pessoas, então o número de pessoas atendidas
na 5ª feira foi inferior ao que consta no gráfico em: 32 − 23 = 9 𝑝𝑒𝑠𝑠𝑜𝑎𝑠.
Gabarito: E.
13. (CESPE/IPHAN/2018) Julgue o item subsequente, referente à análise exploratória de dados.
A representação de diagramas de barras, de linha e de pizza possui escala de medida nominal e tem a moda
como medida de tendência central.
Comentários:
Os diagramas de barras, de linha e de pizza são geralmente usados para representar dados nominais ou
categóricos. Como veremos na aula de medidas de posição, a única medida de tendência central que
podemos utilizar no caso de dados categóricos é a moda, pois ela apenas registra a categoria que mais se
repete em uma amostra, sem envolver outras operações matemáticas.
Gabarito: Certo.
14. (FCC/Pref. Macapá/2018) Para fazer um gráfico de setores que representasse o número de alunos
canhotos, destros e ambidestros na sala de aula, Renato coletou os dados indicados na tabela abaixo.
Nº DE ALUNOS
DA SALA DE AULA
Destros (D) 35
Canhotos (C) 3
Ambidestros (AD) 2
Sabendo-se que um círculo pode ser dividido em 360°, quantos graus tem o setor circular correspondente
aos canhotos no gráfico correto feito por Renato?
a) 18°.
b) 25°.
c) 7,5°.
d) 24°.
e) 27°.
Comentários:
O gráfico em setores é usado para representar a frequência relativa (porcentagem) de uma variável
categórica. Para a construção do gráfico de setores, utilizaremos uma regra de três simples, em que as
frequências relativas de cada categoria correspondem ao ângulo central que desejamos representar em
relação à frequência total, que corresponde ao ângulo de 360°.
Podemos considerar que 360° corresponde a 100% dos alunos. Temos um total de 40 alunos.
Queremos saber o percentual de canhotos. Então, montamos uma regra de três: 360° − 40 𝑋 − 3
Calculando, temos que: 360𝑥 = 403 40𝑥 = 1080 𝑥 = 108040 𝑥 = 27°
Gabarito: E.
15. (FCC/SEDU-ES/2018) Depois da aplicação de uma prova para todos os alunos do 7º A, a professora
Marli fez um histograma com a distribuição das notas, conforme indicado abaixo.
Se a média de notas da sala foi igual a seis, a porcentagem dos alunos que tiraram nota maior ou igual a
média da sala nessa prova foi de
a) 54%.
b) 50%.
c) 56%.
d) 60%.
e) 52%.
Comentários:
Vamos, incialmente, calcular o total de alunos: 2 + 6 + 14 + 16 + 6 = 44
Agora com base nas informações do gráfico percebemos que existem 22 pessoas com média maior ou igual
a 6 (representado pelas duas últimas colunas do gráfico). Assim: 16 + 6 = 22
Logo, a porcentagem será de: 2244 = 0,5 = 50%
Gabarito: B.
16. (CESPE/CBM-AL/2017) O gráfico de setores a seguir mostra a distribuição das quantidades de incêndios
em determinada região, nos meses de abril a setembro de determinado ano.
Sabendo-se que nesses meses ocorreram 1.548 incêndios nessa região, julgue o item que se segue.
A frequência relativa à classe “incêndios no mês de setembro” é superior a 30%.
Comentários:
Para resolvermos essa questão, basta aplicarmos uma regra de três simples. Se uma circunferência total tem
360° e corresponde a 100%, então o ângulo de 120° corresponderá a: 𝑆𝑒𝑡. = 120360 = 13 ≈ 33,33%
Gabarito: Certo.
17. (CESPE/CBM-AL/2017) O gráfico de setores a seguir mostra a distribuição das quantidades de incêndios
em determinada região, nos meses de abril a setembro de determinado ano.
Sabendo-se que nesses meses ocorreram 1.548 incêndios nessa região, julgue o item que se segue.
Nos meses de maio e junho ocorreram mais de 400 incêndios nessa região.
Comentários:
Para resolver a questão, devemos aplicar uma regra de três simples. Isto é, se a circunferência total possui
360° e corresponde a 100%, então 360° também equivale ao número total de incêndios, 1548.
Podemos verificar também que os meses de maio e junho somam um total de 90°. Calculando 90°, temos: 360 − 1548
90 − 𝑋 𝑋 = 139.320360 = 387
Logo, a quantidade de incêndios durante os meses de maio e junho não foi superior a 400, como afirma o
item.
Gabarito: Errado.
18. (FGV/IBGE/2017) Uma vez concluída a etapa de críticas de dados, relativa a um conjunto de registros
obtido através de uma pesquisa de campo, inicia-se o trabalho de tabulação e elaboração de gráficos.
Durante as análises, algumas variáveis surgem com destaque.
I. Número de indivíduos por faixa etária;
II. Percentuais do nível de escolaridade; e
III. Pares de valores de consumo e renda.
Portanto, os tipos de gráficos considerados adequados a serem empregados em cada caso são,
respectivamente:
a) Colunas, linha e setores;
b) Setores, cartograma e barras;
c) Barras, setores e linha;
d) Linha, colunas e cartograma;
e) Colunas, setores e linha.
Comentários:
O gráfico de barras é um gráfico com barras retangulares queapresenta dados categorizados em que o
comprimento das barras é proporcional aos valores representados. Este gráfico é construído no plano
cartesiano. Há duas formas de representar as barras, verticalmente ou horizontalmente. O gráfico de barras
verticais também é chamado de gráfico de colunas. Nesse gráfico, um eixo do gráfico mostra especificamente
o que está sendo comparado enquanto o outro eixo representa valores associados. Vejamos um exemplo:
População brasileira, por Grandes Regiões, em 2010 (x1000)
Fonte: Censo Demográfico 1970/2010 (IBGE)
O gráfico de setores consiste em representar informações na forma de setor circular. Também chamado de
gráfico de pizza, os valores podem ser expressos por números ou em percentuais. Para tanto, basta
considerar que 100% dos dados equivalem a um setor circular de 360. Cada ângulo do setor circular
corresponde a uma porcentagem dos dados. Vejamos um exemplo:
População Urbana e Rural do Brasil em 2010
Fonte: Sinopse do Censo Demográfico de 2010 (IBGE)
O gráfico de linha é um tipo de gráfico que nos permite comparar duas variáveis: uma é traçada no eixo x
(horizontal) e a outra no eixo y (vertical). O eixo y geralmente indica uma quantidade, enquanto o eixo x
representa uma unidade de tempo. Tipicamente, o eixo y representa a variável dependente e o eixo x
representa a variável independente. Um gráfico de linhas é normalmente desenhado para representar dados
de séries temporais. A finalidade é mostrar a variação dos valores de uma variável ao longo do tempo. Por
exemplo,
População brasileira, por Grandes Regiões, de 1970 a 2010 (x1000)
Fonte: Censo Demográfico 1970/2010 (IBGE)
Gabarito: E.
19. (CESPE/DEPEN/2015)
Dado que a participação dos presidiários em cursos de qualificação profissional é um aspecto importante
para a reintegração do egresso do sistema prisional à sociedade, foram realizados levantamentos
estatísticos, nos anos de 2001 a 2009, a respeito do valor da educação e do trabalho em ambientes
prisionais. Cada um desses levantamentos, cujos resultados são apresentados no gráfico, produziu uma
estimativa anual do percentual P de indivíduos que participaram de um curso de qualificação profissional
de curta duração, mas que não receberam o diploma por motivos diversos. Em 2001, 69,4% dos
presidiários que participaram de um curso de qualificação profissional não receberam o diploma. No ano
seguinte, 2002, esse percentual foi reduzido para 61,5%, caindo, em 2009, para 30,9%.
A partir das informações e do gráfico apresentados, julgue o item que se segue.
Se os percentuais forem representados por barras verticais, conforme o gráfico a seguir, então o resultado
será denominado histograma.
Comentários:
O histograma é destinado a representar dados contínuos agrupados em classes (em intervalos), como o
mostrado na figura a seguir.
Em realidade, a assertiva apresentou um gráfico de colunas (barras verticais) que representa dados
agrupados por valores.
Gabarito: Errado.
20. (CESPE/DEPEN/2015)
Dado que a participação dos presidiários em cursos de qualificação profissional é um aspecto importante
para a reintegração do egresso do sistema prisional à sociedade, foram realizados levantamentos
estatísticos, nos anos de 2001 a 2009, a respeito do valor da educação e do trabalho em ambientes
prisionais. Cada um desses levantamentos, cujos resultados são apresentados no gráfico, produziu uma
estimativa anual do percentual P de indivíduos que participaram de um curso de qualificação profissional
de curta duração, mas que não receberam o diploma por motivos diversos. Em 2001, 69,4% dos
presidiários que participaram de um curso de qualificação profissional não receberam o diploma. No ano
seguinte, 2002, esse percentual foi reduzido para 61,5%, caindo, em 2009, para 30,9%.
A partir das informações e do gráfico apresentados, julgue o item que se segue.
Os dados apresentados são suficientes para que se possa afirmar que o total de presidiários que participaram
de um curso de qualificação profissional de curta duração e que não receberam o diploma em 2008 foi
superior ao total referente ao ano de 2007.
Comentários:
As informações presentes no gráfico foram dispostas em termos percentuais e não por meio de valores
absolutos, portanto, não podemos afirmar que o número de presidiários que participaram do curso e não
receberam diploma foi maior em um ano do que em outro. Apenas podemos afirmar que o percentual de
presidiários que participaram dos cursos e não receberam o diploma foi maior em 2008 que o percentual em
2007.
Gabarito: Errado.
21. (FUNDATEC/BRDE/2015) Assinale a alternativa que representa a nomenclatura dos três gráficos
abaixo, respectivamente.
a) Gráfico de Setores – Gráfico de Barras – Gráfico de Linha.
b) Gráfico de Pareto – Gráfico de Pizza – Gráfico de Tendência.
c) Gráfico de Barras – Gráfico de Setores – Gráfico de Linha.
d) Gráfico de Linhas – Gráfico de Pizza – Gráfico de Barras.
e) Gráfico de Tendência – Gráfico de Setores – Gráfico de Linha.
Comentários:
Os gráficos de barras verticais (ou gráfico de colunas) normalmente são usados para representar
distribuições de dados categóricos ou qualitativos. Uma série estatística é representada por um conjunto de
retângulos dispostos horizontalmente, cada um indicando uma categoria particular, os quais possuem a
mesma altura e comprimentos proporcionais aos respectivos dados.
O gráfico em setores é usado para representar a frequência relativa (porcentagem) de uma variável
categórica. Ele é formado por um círculo dividido em setores circulares, cada um representando uma
categoria, cujos ângulos centrais são proporcionais às frequências relativas da categoria.
Os gráficos em linha, normalmente, são usados para representar dados de séries temporais, com a finalidade
de mostrar a variação dos valores de uma variável ao longo do tempo. Esse tipo de gráfico permite-nos
comparar duas variáveis: uma é traçada no eixo x (horizontal) e a outra no eixo y (vertical). O eixo y
geralmente indica uma quantidade, enquanto o eixo x representa uma unidade de tempo.
O gráfico de hastes ou bastões é frequentemente usado para representar dados não agrupados em classes
(normalmente dados discretos), em que não há perda de informação. Em relação a sua construção, basta
utilizar as frequências absolutas ou relativas simples de cada elemento.
Apenas com estes conceitos, já somos capazes de julgar a alternativa correta. No caso, respectivamente,
gráficos de barras, setores e linhas.
Gabarito: C.
22. (FCC/ALE-PE/2014) Analise o gráfico e as afirmativas abaixo.
(http://blogs.estadao.com.br/vox-publica/tag/psdb/. Acessado em: 20/02/2013)
I. O crescimento da faixa de renda de “até 1 salário mínimo” pode ser reflexo dos programas de
transferência de renda governamentais, os quais garantem um rendimento mínimo às pessoas carentes.
II. O crescimento da faixa de renda de “até 1 salário mínimo” é fruto do emprego formal gerado no país
dentro do período da pesquisa, pois, os beneficiários dos programas de transferência de renda
governamentais entram na categoria sem rendimento.
III. No gráfico, percebe-se uma diminuição da concentração de renda no país. Isso fica evidente quando
analisamos, por exemplo, a faixa de renda “mais de 5 a 10 salários mínimos”.
IV. No gráfico, a faixa “mais de 1 a 2 salários mínimos” é a que apresenta a maior diferença em pontos
percentuais entre os dados de 2001 e 2011.
Está correto o que se afirma APENAS em
a) I e II.
b) II e III.
c) III e IV.
d) I e III.
e) II e IV.
Comentários:
Analisando as afirmações, temos o seguinte:
Item I: no gráfico percebemos que de fato houve um aumento na faixa de renda de “até 1 salário-
mínimo”, porém, não temos nenhuma informação que justifique esse aumento. O que torna a
alternativa correta é o empregoda possibilidade, não a afirmação categórica.
Item II: como dito no item anterior não temos nenhuma informação sobre o motivo do aumento da
renda da respectiva faixa, portanto, o item está errado.
Item III: o gráfico mostra o aumento nas faixas abaixo de "mais de 5 a 10 salários-mínimos" e reduções
nas faixas acima de "mais de 3 a 5 salários-mínimos". Assim, podemos sugerir que houve diminuição
da concentração de renda no país. Logo, o item está correto.
Item IV: não temos informações suficientes no gráfico para esta afirmativa. Portanto, o item está
incorreto.
Gabarito: D.
23. (FGV/CGE-MA/2014) No setor A de uma empresa foi feita uma auditoria para descobrir quantas vezes
cada pessoa fazia ligações pessoais do seu celular no período de trabalho de 14 às 17 horas de um único
dia. O resultado está no gráfico a seguir.
O número de pessoas que trabalham no setor A dessa empresa é
a) 15.
b) 22.
c) 27.
d) 29.
e) 42.
Comentários:
Ao analisarmos o gráfico, percebemos a existência de um eixo horizontal, que nos mostra o número de
ligações feitas no período; e um eixo vertical, que nos apresenta o número de pessoas. Assim, podemos
montar uma tabela atribuindo os valores do gráfico:
Nº de ligações Nº de pessoas
0 2
1 5
2 10
3 7
4 3
5 2
Logo, somando todos os valores que representam o número de pessoas, temos: 2 + 5 + 10 + 7 + 3 + 2 = 29 𝑝𝑒𝑠𝑠𝑜𝑎𝑠
Gabarito: D.
24. (CESPE/TRE-ES/2011)
Cargo Candidatos Candidatos aptos Eleitos
Presidente da República 9 9 1
Governador de Estado 170 156 27
Senador 272 234 54
Deputado Federal 6.021 5.058 513
Deputado
Estadual/Distrital
15.268 13.076 1.059
Total 21.640 18.533 1.658
Internet: <www.tse.gov > (com adaptações).
Com base na tabela acima, referente às eleições de 2010, que apresenta a quantidade de candidatos para
os cargos de presidente da República, governador de estado, senador, deputado federal e deputado
estadual/distrital, bem como a quantidade de candidatos considerados aptos pela justiça eleitoral e o total
de eleitos para cada cargo pretendido, julgue o item a seguir.
Considerando-se a representação das quantidades de eleitos para cada cargo em um gráfico de pizza, a fatia
desse gráfico correspondente ao cargo de deputado federal terá ângulo superior a 120°.
Comentários:
Inicialmente, precisamos descobrir o quanto o ângulo de 120° corresponde do valor total. Sabemos que 360°
é o ângulo total, logo, 120° corresponde a 1/3 de 360°. Portanto, para afirmarmos que o cargo de deputado
federal corresponde ao ângulo de 120°, ele deve necessariamente corresponder a 1/3 do total de candidatos
eleitos. Vejamos: 16583 ≅ 552,66
Logo, para que o cargo de deputado federal tivesse um ângulo superior a 120°, deveríamos ter 553
candidatos eleitos. Não é o caso, pois, de acordo com a tabela, foram eleitos 513 candidatos.
Gabarito: Errado.
25. (FGV/CODEBA/2010) O gráfico de pizza apresentado abaixo fornece os resultados de uma pesquisa
feita com 20 mulheres acerca da quantidade de filhos que cada uma possui.
Assinale o gráfico de colunas que melhor representa os dados apresentados acima.
a)
b)
c)
d)
e)
Comentários:
Segundo o enunciado, a pesquisa foi realizada com um total de 20 mulheres.
Agora, interpretando as informações do gráfico, temos:
• nenhum filho = 35%. Logo, 35% de 20 mulheres corresponde a: 0,35 × 20 = 7 𝑚𝑢𝑙ℎ𝑒𝑟𝑒𝑠;
• um filho = 25%. Logo, 25% de 20 mulheres corresponde a: 0,25 × 20 = 5 𝑚𝑢𝑙ℎ𝑒𝑟𝑒𝑠.
Olhando para as alternativas, percebemos que não se faz necessário calcular todas as informações do gráfico.
Portanto, ficamos entre as alternativas a) ou c), cujas primeiras colunas demonstram que 7 mulheres não
tiveram nenhum filho.
Passamos para a segunda informação calculada, em que 5 mulheres tiveram apenas 1 filho. Com isso
eliminamos a letra a) e temos nosso gabarito, letra c).
Gabarito: C.
26. (FGV/Senado/2008) Entre os tipos de representações gráficas a seguir, o único que não é definido para
uma variável quantitativa contínua é:
a) histograma.
b) diagrama ramo-e-folhas.
c) diagrama de setores.
d) diagrama "Box-Plot".
e) Polígono de frequências.
Comentários:
Uma variável quantitativa contínua é aquela que tem características mensuráveis, que assume valores em
uma escala contínua (na reta real). Analisando as alternativas temos:
Letra A: em um histograma associamos a cada intervalo de classe uma determinada densidade de
frequência. No caso de variáveis quantitativas, é sempre possível estabelecer intervalos de classe, portanto,
é sempre factível traçar um histograma. Exemplo de histograma:
Tempo médio (𝑿𝒊) Frequência (𝒇𝒊) 𝟖𝟓 ≤ 𝒙 < 𝟏𝟎𝟎 5 𝟏𝟎𝟎 ≤ 𝒙 < 𝟏𝟏𝟓 5 𝟏𝟏𝟓 ≤ 𝒙 < 𝟏𝟑𝟎 12 𝟏𝟑𝟎 ≤ 𝒙 < 𝟏𝟒𝟓 10 𝟏𝟒𝟓 ≤ 𝒙 < 𝟏𝟔𝟎 7 𝟏𝟔𝟎 ≤ 𝒙 < 𝟏𝟕𝟓 9 𝟏𝟕𝟓 ≤ 𝒙 < 𝟏𝟗𝟎 2
Na leitura do histograma tem-se que a classe 85 - 100 tem frequência 5. A classe 100 - 115 tem frequência
5. A classe 115 - 130 tem frequência 12. E assim por diante.
Observamos que é possível abranger todos os valores reais do intervalo entre 85 a 190. E, por esse motivo,
o histograma pode representar uma variável contínua.
Letra B: o diagrama de ramos e folhas impõe que listemos todas as realizações da variável. Desta forma,
como a variável assume infinitos valores reais, é impossível listar todos eles, portanto, não seria viável a
construção do diagrama de ramos e folhas. No entanto, para representar uma amostra da população, tal
diagrama poderá ser utilizado. Exemplo de diagrama de ramos e folhas:
Dados utilizados:
85, 89, 96, 98, 99, 103, 104, 105, 113, 114, 115, 115, 123, 123, 124, 126, 126, 126, 127, 128, 129,
129, 134, 135, 135, 135, 137, 137, 137, 142, 143, 143, 148, 153, 154, 155, 157, 158, 159, 161,
161, 165, 168, 170, 171, 171, 171, 173, 175, 175
Repare que, no lado esquerdo, temos as centenas e as dezenas representando os ramos. Por sua vez, no lado
direito, temos as unidades representando as folhas. As folhas, portanto, estão vinculadas aos ramos. Dessa
maneira, a chave “9 | 6 8 9” significa que, no rol original, havia os números 96, 98 e 99. Podemos perceber
que a amostra da variável contínua pôde ser representada. Porém, não conseguiríamos representar todos
os possíveis de dada população num intervalo real.
Letra C: o diagrama de setores é usualmente utilizado para representar variáveis qualitativas, motivo pelo
qual a banca considerou esta alternativa como o gabarito da questão. Exemplo de diagrama de setores:
População Urbana e Rural do Brasil em 2010
Fonte: Sinopse do Censo Demográfico de 2010 (IBGE)
Letra D: o box-plot impõe a determinação do primeiro quartil, da mediana, do terceiro quartil, e dos valores
extremos. Tudo isso pode ser calculado para uma variável quantitativa contínua. Exemplo de box-plot:
Letra E: o polígono de frequência é o gráfico em linhas obtido através da união dos pontos médios das bases
superiores dos retângulos de um histograma (que utiliza colunas verticais para mostrar as frequências).
Portanto, se o histograma pode ser elaborado para variáveis quantitativas contínuas, então o polígono de
frequência também pode. Exemplo de polígono de frequência:
Gabarito: C.
27. (FUNDATEC/SEFAZ-RS/2009) Na revista Seleções de setembro de 2009 foram publicados os resultados
da 8ª edição da Pesquisa Marcas de Confiança, também apresentados através de alguns tipos de gráficos,
dentre eles, os dois primeiros que estão abaixo, sendo os outros dois fictícios. A sequência correta dos
gráficos abaixo é, respectivamente,
a) Polígono, Colunas, histograma, barras.
b) Histograma, colunas, barras, polígono.
c) Colunas, barras, histograma, polígono
d) Histograma, polígono, barras, colunas.
e) Barras, colunas, histograma, polígono
Comentários:
Na primeira figura, temos um gráfico de colunas. Osgráficos de colunas são usados para distribuições de
dados categóricos ou qualitativos, uma série estatística é representada por um conjunto de retângulos
dispostos verticalmente, cada um indicando uma categoria particular, todos com a mesma largura e alturas
proporcionais aos respectivos dados.
Na segunda figura, temos um gráfico de barras, que também são usados para distribuições de dados
categóricos ou qualitativos. A diferença é que as barras são colocadas ao longo do eixo vertical.
A terceira figura corresponde a um histograma. Nesse caso, este gráfico é destinado a representar dados
agrupados em classe, de modo que haverá uma perda de informação, pois o trabalho realizado nas
distribuições de frequências é com classes de elementos, e não com elementos dispostos individualmente.
A quarta figura é o polígono de frequência que é o gráfico em linhas obtido através da união dos pontos
médios das bases superiores dos retângulos de um Histograma (que utiliza colunas verticais para mostrar as
frequências).
Gabarito: C.
LISTA DE QUESTÕES
Introdução à Estatística
1. (VUNESP/Câmara Municipal de São Carlos/2013) Trata-se da estatística que tem as atribuições de
obtenção, organização, redução e representação de dados estatísticos, bem como a obtenção de algumas
informações que auxiliam na descrição de um fenômeno observado. Esta estatística é denominada
a) Coletora.
b) Celetista.
c) Populacional.
d) Amostral.
e) Descritiva.
GABARITO
Introdução à Estatística
1. LETRA E
LISTA DE QUESTÕES
Conceitos Iniciais
1. (CESGRANRIO/BB/2021) Responsável por entender o comportamento dos produtos oferecidos por
determinado banco onde trabalhava, e preocupado com a quantidade enorme de dados disponíveis para
a análise, um funcionário decidiu extrair um subconjunto desses dados.
Esse subconjunto é conhecido como
a) amostra
b) censo
c) parâmetro
d) população
e) variável
2. (CESPE/PGDF/2021) Certa empresa desejava conhecer as opiniões de seus 20.000 funcionários acerca
da confiança que eles têm no canal interno de denúncias. Para tanto, elaborou-se um questionário
eletrônico que foi remetido, por email, para todos os endereços eletrônicos cadastrados, tendo sido
desenvolvidos mecanismos para evitar que uma pessoa respondesse em lugar de outra, ou que uma
mesma pessoa respondesse mais de uma vez. O questionário foi respondido por 400 pessoas, das quais
68% disseram confiar no processo de apuração de denúncias e 32% disseram ter reservas quanto ao
processo. Verificou-se ainda que cerca de 500 mensagens retornaram por falha no cadastro dos endereços
eletrônicos (erros de digitação), e que algumas respostas foram atribuídas a pessoas que não são mais
funcionários; ainda, os endereços eletrônicos de alguns funcionários recém contratados não constavam
do cadastro.
Com relação a essa situação hipotética, julgue o item a seguir.
As informações apresentadas permitem afirmar que a população- alvo da pesquisa difere da população
referenciada.
3. (VUNESP/Pref. Valinhos/2019) O grupo completo de unidades elementares de pessoas, objetos ou
coisas é denominado, para a estatística, de
a) Amostra.
b) Unidades.
c) Censo.
d) População.
e) Variáveis.
4. (CESPE/DEPEN/2015) O diretor de um sistema penitenciário, com o propósito de estimar o percentual
de detentos que possuem filhos, entregou a um analista um cadastro com os nomes de 500 detentos da
instituição para que esse profissional realizasse entrevistas com os indivíduos selecionados.
A partir dessa situação hipotética e dos múltiplos aspectos a ela relacionados, julgue o item, referente a
técnicas de amostragem.
A diferença entre um censo e uma amostra consiste no fato de esta última exigir a realização de um número
maior de entrevistas.
5. (FCC/DPE-SP/2010) Sobre estatística aplicada, é correto o que se afirma em:
a) Parâmetros são medidas características de grupos, determinadas por meio de uma amostra aleatória.
b) A estatística descritiva é a técnica pela são coletados dados de uma amostra, a partir do que são tomadas
decisões sobre uma determinada população.
c) A caracterização de uma população se dá por meio da observação de todos os seus componentes que a
integram.
d) A estatística inferencial compreende um conjunto de técnicas destinadas à síntese de dados numéricos.
e) Censo é o processo utilizado para se medir as características de todos os membros de uma dada
população.
6. (CESPE/SEFAZ-AL/2002) Julgue os seguintes itens.
Um censo consiste no estudo de todos os indivíduos da população considerada.
7. (CESPE/SEFAZ-AL/2002) Julgue os seguintes itens.
Como a realização de um censo tipicamente é muito onerosa e (ou) demorada, muitas vezes é conveniente
estudar um subconjunto próprio da população, denominado amostra.
GABARITO
Conceitos Iniciais
1. LETRA A
2. CERTO
3. LETRA D
4. ERRADO
5. LETRA E
6. CERTO
7. CERTO
LISTA DE QUESTÕES
Variáveis Estatísticas
1. (CESPE/DPE-RO/2022)
Variável Valores
estado civil casado, solteiro, divorciado
quantidade de filhos 0, 1, 2, 3 ...
salário 6.510,25; 7.915,68
idade 22, 23, 27
Com relação às variáveis apresentadas na tabela anterior, julgue os itens a seguir.
I. A variável estado civil é qualitativa nominal.
II. A variável quantidade de filhos é quantitativa discreta.
III. As variáveis salário e estado civil são quantitativas discretas.
IV. As variáveis idade e quantidade de filhos são qualitativas nominais.
Estão certos apenas os itens
a) I e II.
b) II e III.
c) III e IV.
d) I, II e IV.
e) I, III e IV.
2. (CESPE/DPE-RO/2022) O valor de um atributo de um dado objeto é uma medida da quantidade daquele
atributo, a qual pode ser numérica ou categórica.
Nesse caso, estado civil e sexo são classificados como atributo
a) binário.
b) nominal.
c) ordinal.
d) ausente.
e) razão.
3. (CESGRANRIO/BB/2021) Foi solicitado a um funcionário de um determinado banco que realizasse uma
pesquisa, exclusivamente com variáveis do tipo qualitativa, sobre a satisfação dos clientes com os serviços
oferecidos pela instituição.
Para atender a essa demanda utilizando os meios adequados, sua escolha de escalas de mensuração deve
estar limitada às escalas
a) intervalares e razão
b) nominais e intervalares
c) nominais e ordinais
d) ordinais e intervalares
e) ordinais e razão
4. (CESPE/IPHAN/2018). Julgue o item subsequente, referente à análise exploratória de dados.
O gráfico de barras é adequado para a análise de variáveis qualitativas ordinais ou quantitativas discretas,
pois permite investigar a presença de tendência nos dados.
5. (FGV/COMPESA/2018) A COMPESA, em uma pesquisa de satisfação dos usuários, preparou um
formulário para traçar os perfis de seus clientes e o grau de satisfação com os serviços da empresa,
Em um formulário, ela solicitou os dados a seguir.
I. Idade.
II. Grau de escolaridade.
III. Faixa de renda familiar.
IV. Nota dada ao serviço.
Assinale a opção que contempla apenas variáveis categóricas.
a) I e II.
b) II e III.
c) III e IV.
d) I, II e III.
e) I, II e IV.
6. (VUNESP/CM São Joaquim Barra/2018) A Estatística descritiva faz uso de variáveis, que são classificadas
como quantitativas ou qualitativas. Assinale a alternativa correta em relação a essas variáveis.
a) Quantitativas referem-se às variáveis ordinal ou discreta; as qualitativas referem-se às variáveis nominal
ou contínua.
b) Quantitativas referem-se às variáveis ordinal ou contínua; as qualitativas referem-se às variáveis nominal
ou discreta.
c) Quantitativas referem-se às variáveis nominal ou contínua; as qualitativas referem-se às variáveis discreta
ou ordinal.
d) Quantitativas referem-se às variáveis contínua ou discreta; as qualitativas referem-se às variáveis nominal
ou ordinal.
e) Quantitativasreferem-se às variáveis nominal ou ordinal; as qualitativas referem-se às variáveis contínua
ou discreta.
7. (VUNESP/IPSM-SJC/2018) A tabela apresenta o número de acertos de 100 candidatos a uma vaga de
emprego, em uma avaliação contendo 5 questões de múltipla escolha.
Número de Acertos Número de Candidatos
0 4
1 11
2 13
3 16
4 22
5 34
Com base nas informações apresentadas na tabela, é correto afirmar que
a) 22 candidatos acertaram a questão de número 4.
b) Menos da metade dos candidatos acertaram mais da metade das questões.
c) 28 candidatos acertaram, no máximo, duas questões.
d) Mais da metade dos candidatos acertaram menos da metade das questões.
e) 15 candidatos acertaram, pelo menos, uma questão.
8. (VUNESP/IPSM-SJC/2018) Considere as informações a seguir para construir uma distribuição de
frequência sem intervalo de classe e responder a questão.
Um dado foi lançado 50 vezes e foram registrados os seguintes resultados:
5 4 6 1 2 5 3 1 3 3
4 4 1 5 5 6 1 2 5 1
3 4 5 1 1 6 6 2 1 1
4 4 4 3 4 3 2 2 2 3
6 6 3 2 4 2 6 6 2 1
A frequência simples relativa do primeiro elemento é
a) 10%.
b) 20%.
c) 50.
d) 7.
e) 20.
9. (VUNESP/IPSM-SJC/2018) Considere as informações a seguir para construir uma distribuição de
frequência sem intervalo de classe e responder a questão. Um dado foi lançado 50 vezes e foram
registrados os seguintes resultados:
5 4 6 1 2 5 3 1 3 3
4 4 1 5 5 6 1 2 5 1
3 4 5 1 1 6 6 2 1 1
4 4 4 3 4 3 2 2 2 3
6 6 3 2 4 2 6 6 2 1
A frequência simples relativa do quinto elemento é
a) 12%.
b) 84%.
c) 5.
d) 6.
e) 42.
10. (VUNESP/TJM-SP/2017) A tabela apresenta o número de acertos dos 600 candidatos que realizaram a
prova da segunda fase de um concurso, que continha 5 questões de múltipla escolha.
Número de
acertos
Número de
candidatos
5 204
4 132
3 96
2 78
1 66
0 24
Analisando-se as informações apresentadas na tabela, é correto afirmar que
a) Mais da metade dos candidatos acertou menos de 50% da prova.
b) Menos da metade dos candidatos acertou mais de 50% da prova.
c) Exatamente 168 candidatos acertaram, no mínimo, 2 questões.
d) 264 candidatos acertaram, no máximo, 3 questões.
e) 132 candidatos acertaram a questão de número 4.
11. (CESPE/TCE-PA/2016)
Um indicador de desempenho X permite avaliar a qualidade dos processos de governança de instituições
públicas. A figura mostra, esquematicamente, a sua distribuição, obtida mediante estudo amostral feito
por determinada agência de pesquisa. A tabela apresenta estatísticas descritivas referentes a essa
distribuição.
Com base nessas informações, julgue o item a seguir.
X representa uma variável qualitativa ordinal.
12. (CESPE/TELEBRAS/2015)
Uma empresa coletou e armazenou em um banco de dados diversas informações sobre seus clientes, entre
as quais estavam o valor da última fatura vencida e o pagamento ou não dessa fatura. Analisando essas
informações, a empresa concluiu que 15% de seus clientes estavam inadimplentes. A empresa recolheu
ainda dados como a unidade da Federação (UF) e o CEP da localidade em que estão os clientes. Do conjunto
de todos os clientes, uma amostra aleatória simples constituída por 2.175 indivíduos prestou também
informações sobre sua renda domiciliar mensal, o que gerou o histograma apresentado. Com base nessas
informações e no histograma, julgue o item a seguir.
O CEP da localidade dos clientes e o valor da última fatura vencida são variáveis quantitativas.
13. (CESPE/TELEBRAS/2015) Roberto comprou, por R$ 2.800,00, rodas de liga leve para seu carro, e, ao
estacionar no shopping, ficou indeciso sobre onde deixar o carro, pois, caso o coloque no estacionamento
público, correrá o risco de lhe roubarem as rodas, ao passo que, caso o coloque no estacionamento
privado, terá de pagar R$ 70,00, com a garantia de que eventuais prejuízos serão ressarcidos pela empresa
administradora.
Considerando que p seja a probabilidade de as rodas serem roubadas no estacionamento público, que X
seja a variável aleatória que representa o prejuízo, em reais, ao deixar o carro no estacionamento público,
e que Y seja a variável aleatória que representa o valor, em reais, desembolsado por Roberto ao deixar o
carro no estacionamento pago, julgue o item subsequente.
A variável aleatória Y é contínua.
14. (CESPE/TJ-SE/2014)
Quantidade
São Paulo
(j =1)
Rio de
Janeiro
(j =2)
Minas
Gerais
(j =3)
Rio Grande
do Sul
(j =4)
Total
Casos novos
(X, em milhões)
5 2 1 2 18
Casos pendentes
(Y, em milhões)
16 8 3 2 48
Processos baixados
(Z, em milhões)
5 2 2 2 18
Sentenças e Decisões
(W, em milhões)
4 3 1 1 16
O quadro acima mostra uma síntese da movimentação processual dos tribunais de justiça dos estados de
São Paulo, Rio de Janeiro, Minas Gerais, Rio Grande do Sul e do total da justiça estadual no Brasil em 2010.
Considere que o estoque de processos em andamento no estado j (𝑬𝒋), no final de 2010, seja um indicador
que se define como 𝑬𝒋 = 𝑿𝒋 + 𝒀𝒋 − 𝒁𝒋 − 𝑾𝒋, em que j = 1, 2, ..., 27; 𝑿𝒋 representa o número de casos
novos registrados em 2010 no estado j; Yj seja a quantidade de casos pendentes no estado j (i.e., casos
anteriores que não foram solucionados até o final de 2010); 𝒁𝒋 denota o total de processos baixados
(arquivados) no estado j durante 2010 e 𝑾𝒋 seja o número de sentenças e decisões proferidas no estado j
até o final de 2010. Considere, por fim, que, para todos os efeitos, o Distrito Federal seja um estado. Com
base nessas informações e no quadro acima, julgue o item que se segue.
O quadro apresentado é uma tabela de contingência que mostra o cruzamento entre uma variável qualitativa
nominal com 4 níveis de resposta (estados) e outra variável qualitativa com quatro níveis de resposta (casos
novos, pendentes, baixados e resolvidos).
15. (CESPE/STF/2013)
Com referência à figura acima, que mostra a distribuição da renda mensal — x, em quantidades de salários
mínimos (sm) — das pessoas que residem em determinada região, julgue o item subsequente.
A variável x, por possuir quatro níveis de respostas, é do tipo qualitativa ordinal.
16. (CESPE/TRE-ES/2011)
Quantidade de eleitores Quantidade de municípios 0 ⊢ 2.000 364 2.000 ⊢ 4.000 1.000 4.000 ⊢ 6.000 3.000 6.000 ⊢ 8.000 1.000 8.000 ⊢ 10.000 200
Total 5.564
A tabela acima apresenta uma distribuição hipotética das quantidades de eleitores que não votaram no
segundo turno da eleição para presidente da República bem como os números de municípios em que essas
quantidades ocorreram. Com base nessa tabela, julgue o item seguinte, relativo à análise exploratória de
dados.
Na tabela de frequências, o uso de intervalos de classe permite concluir que a variável em questão é
contínua.
17. (CESPE/TRE-ES/2011)
Cargo Candidatos Candidatos aptos Eleitos
Presidente da República 9 9 1
Governador de Estado 170 156 27
Senador 272 234 54
Deputado Federal 6.021 5.058 513
Deputado
Estadual/Distrital
15.268 13.076 1.059
Total 21.640 18.533 1.658
Internet: <www.tse.gov > (com adaptações).
Com base na tabela acima, referente às eleições de 2010, que apresenta a quantidade de candidatos para
os cargos de presidente da República, governador de estado, senador, deputado federal e deputado
estadual/distrital, bem como a quantidade de candidatos considerados aptos pela justiça eleitoral e o total
de eleitos para cada cargo pretendido, julgue o item a seguir.
A variável "cargo" classifica-se como uma variável qualitativa ordinal.
18. (CESPE/TCU/2008) Uma agência de desenvolvimento urbano divulgou os dados apresentados na tabela
a seguir, acerca dos números de imóveis ofertados (X) e vendidos (Y) em determinado município, nos anosde 2005 a 2007.
Ano
Número de imóveis
Ofertados (X) Vendidos (Y)
2005 1.500 100
2006 1.750 400
2007 2.000 700
Correios Braziliense, 29/4/2008, p.17 (com adaptações)
Com respeito ao texto, considere que cada imóvel ofertado em determinado ano seja classificado como
vendido ou não-vendido, e, a um imóvel e classificado como vendido seja atribuído um valor Z = 1, e, ao
imóvel classificado como não-vendido, seja atribuído um valor Z = 0. Supondo-se que as classificações dos
imóveis como vendido ou não-vendido em um dado ano possam ser consideradas como sendo realizações
de uma amostragem aleatória simples, julgue os itens a seguir.
A variável Z é classificada como variável qualitativa nominal, pois representa o atributo do imóvel como
vendido ou não-vendido.
GABARITO
Variáveis Estatísticas
1. LETRA A
2. LETRA B
3. LETRA C
4. CERTO
5. LETRA B
6. LETRA D
7. LETRA C
8. LETRA B
9. LETRA A
10. LETRA D
11. ERRADO
12. ERRADO
13. ERRADO
14. ERRADO
15. ERRADO
16. ERRADO
17. CERTO
18. ERRADO
LISTA DE QUESTÕES
Séries Estatísticas
1. (CESPE/ANTAQ/2009)
Variável 2003 2004 2005 2006 2007
Exportação X 40 46 50 52 54
Importação Y 20 21 22 24 27
Total X+Y 60 67 72 76 81
Internet: <www.portodesantos.com> (com adaptações).
Considerando a tabela acima, que apresenta a movimentação anual de cargas no porto de Santos de 2003
a 2007, em milhões de toneladas/ ano e associa as quantidades de carga movimentadas para exportação
e importação às variáveis X e Y, respectivamente, julgue o item subsequente.
As séries estatísticas apresentadas na tabela formam três séries temporais.
2. (CESPE/TCU/2008) Uma agência de desenvolvimento urbano divulgou os dados apresentados na tabela
a seguir, acerca dos números de imóveis ofertados (X) e vendidos (Y) em determinado município, nos anos
de 2005 a 2007.
Ano
Número de imóveis
Ofertados (X) Vendidos (Y)
2005 1.500 100
2006 1.750 400
2007 2.000 700
Correios Braziliense, 29/4/2008, p.17 (com adaptações)
Considerando as informações do texto, julgue os itens subsequentes.
A variável X forma uma série estatística denominada série temporal.
GABARITO
Séries Estatísticas
1. CERTO 2. CERTO
LISTA DE QUESTÕES
Distribuições de Frequência
1. (IBFC/Pref. Cuiabá/2023) A tabela a seguir fornece a distribuição de frequências das notas de 45 alunos
de um curso de estatística básica:
Intervalo de classes Frequência simples Frequência relativa 0 ⊢ 3 4 9 3 ⊢ 5 A 22 5 ⊢ 7 25 C 7 ⊢ 10 B D
Os valores de A, B, C e D são, aproximadamente:
a) 10, 6, 40, 13
b) 6, 10, 50, 13
c) 10, 6, 13, 40
d) 10, 6, 40, 14
2. (CESPE/FUB/2022) A tabela de frequência a seguir mostra dados coletados em uma pesquisa para se
verificar o número de disciplinas que os estudantes de determinada universidade estão cursando por
semestre.
Disciplinas 2 3 4 5 6 7 8
Estudantes 10 15 40 35 28 10 4
Considerando essas informações, julgue o item seguinte.
A proporção de alunos que cursam mais de 6 disciplinas é maior que a proporção de alunos que cursam 3
disciplinas.
3. (CESPE/FUB/2022) Uma universidade está fazendo um estudo para verificar a distribuição dos tempos
que os alunos do curso de mestrado levam até a defesa da dissertação. Os dados a seguir mostram a função
de probabilidade desses tempos, em meses.
Tempo de Defesa (meses) Probabilidade
12 0,01
15 0,02
18 0,04
20 0,10
22 0,22
24 0,31
25 0,18
26 0,04
28 0,03
30 0,05
Considerando essas informações, julgue o item subsequente.
Se o prazo máximo recomendado para a defesa da dissertação de mestrado é de 24 meses, então a
probabilidade de um aluno defender sua dissertação até 2 meses antes desse prazo é igual à probabilidade
de um aluno defendê-la até 2 meses depois.
4. (CESPE/FUB/2022) Uma universidade está fazendo um estudo para verificar a distribuição dos tempos
que os alunos do curso de mestrado levam até a defesa da dissertação. Os dados a seguir mostram a função
de probabilidade desses tempos, em meses.
Tempo de Defesa (meses) Probabilidade
12 0,01
15 0,02
18 0,04
20 0,10
22 0,22
24 0,31
25 0,18
26 0,04
28 0,03
30 0,05
Considerando essas informações, julgue o item subsequente.
Os valores da probabilidade de um aluno defender a dissertação em 13, 14, 16, 19, 21, 23, 27 ou 29 meses,
somados, é igual à probabilidade de um aluno defender a dissertação em exatamente 31 meses.
5. (CESPE/FUB/2022) Uma universidade está fazendo um estudo para verificar a distribuição dos tempos
que os alunos do curso de mestrado levam até a defesa da dissertação. Os dados a seguir mostram a função
de probabilidade desses tempos, em meses.
Tempo de Defesa (meses) Probabilidade
12 0,01
15 0,02
18 0,04
20 0,10
22 0,22
24 0,31
25 0,18
26 0,04
28 0,03
30 0,05
Considerando essas informações, julgue o item subsequente.
Se o prazo máximo de defesa recomendado é de 24 meses, então a probabilidade de um aluno defender sua
dissertação no prazo é superior a 70%.
6. (CESPE/FUB/2022) A tabela de frequência a seguir mostra dados coletados em uma pesquisa para se
verificar o número de disciplinas que os estudantes de determinada universidade estão cursando por
semestre.
Disciplinas 2 3 4 5 6 7 8
Estudantes 10 15 40 35 28 10 4
Considerando essas informações, julgue o item seguinte.
Na pesquisa foram entrevistados 142 alunos.
7. (FADESP/SEFA-PA/2022) Em uma determinada fazenda, a criação de pirarucu (Arapaima gigas) mostrou
que o tamanho desses animais segue uma distribuição como mostrada a seguir:
Tamanho (m) 1,20 ⊢ 2,30 2,30 ⊢2,40 2,40 ⊢2,50 2,50 ⊢2,60 2,60 ⊢ 2,70 2,70 ⊢ 2,80
Nº de animais 5 25 30 20 10 10
O proprietário quer dividir os animais em 4 (quatro) categorias de modo que
• os 10% menos pesados pertençam à classe D;
• os 40% seguintes pertençam à classe C;
• os 30% seguintes pertençam à classe B;
• os 20% restantes pertençam à classe A.
Diante das informações, pode-se afirmar que os tamanhos dos indivíduos pertencentes à classe C estão
situados no intervalo de
a) 2,32m a menos de 2,47m.
b) 2,12m a menos de 3,2 m.
c) 3,25m a menos de 3,72m.
d) 2,45m a menos de 3,86m.
e) 3,32m a menos de 3,65m.
8. (FADESP/SEFA-PA/2022) Foi aplicada uma avaliação, ao mesmo tempo, para duas turmas de estatística.
Na avaliação, constavam 15 questões objetivas com 5 alternativas, sendo apenas uma correta. Dos 80
alunos que realizaram a avaliação, 50 estudavam no turno matutino e 30, no vespertino. A tabela a seguir
apresenta o número de acertos das duas turmas.
Nº de acertos Matutino Vespertino Total
0⊢3 2 1 3
3⊢6 3 3 6
6⊢9 6 4 10
9⊢12 25 15 40
12⊢15 11 5 16
15 3 2 5
Total 50 30 80
Selecionando-se aleatoriamente uma avaliação, a probabilidade de ter menos de 6 acertos ou, no mínimo,
12 acertos é igual a
a) 0,1150.
b) 0,3750.
c) 0,3900.
d) 0,5000.
e) 0,6250.
9. (FGV/TRT-PB/2022) Considere o lançamento aleatório de dois dados honestos. Se X é a variável aleatória
que calcula o módulo da diferença entre os dois números obtidos, então o valor mais provável de X é igual
a
a) 0.
b) 1.
c) 2.
d) 3.
e) 4.
10. (VUNESP/EsFCEx/2021) A tabela apresenta parte da distribuição de frequências das notas de 200
candidatos na primeira fase de um concurso:
Notas Frequência absoluta Frequência relativa
0,0 ⊢ 6,0 6,0 ⊢ 7,0 40 7,0 ⊢ 8,0 8,0 ⊢ 9,0 0,05 9,0 ⊢ 10,0
Total 200 1,00
Sabendo-se que 48% dos candidatos tiraram notas maiores ou iguais a 7,0, sendo que a quarta parte deles
tiraram notas abaixo de 8,0, é possível afirmar corretamente que, em relação aos 200 candidatos, tiraram
notas abaixo de 6,0 ou notas maiores ou iguais a 9,0:
a) 65%
b) 61%
c) 63%
d) 59%
e) 57%
11. (VUNESP/CM Serrana/2019) A tabela apresenta o número de acertos dos 200 candidatos a umcargo,
em um concurso interno, composto por uma prova contendo 5 questões de múltipla escolha.
Número de
acertos
Número de
candidatos
0 8
1 22
2 26
3 32
4 44
5 68
Com base nas informações apresentadas na tabela, é correto afirmar que
a) 68 candidatos acertaram a questão de número 5.
b) 144 candidatos acertaram, no mínimo, 3 questões.
c) 26 candidatos acertaram, no máximo, duas questões.
d) Mais da metade do número total dos candidatos acertaram menos da metade do número total das
questões.
e) Menos da metade do número total dos candidatos acertaram mais da metade do número total das
questões.
12. (CESPE/Polícia Federal/2018)
DIA
1 2 3 4 5
X (quantidade diária
de drogas
apreendidas, em kg)
10 22 18 22 28
Tendo em vista que, diariamente, a Polícia Federal apreende uma quantidade X, em kg, de drogas em
determinado aeroporto do Brasil, e considerando os dados hipotéticos da tabela precedente, que
apresenta os valores observados da variável X em uma amostra aleatória de 5 dias de apreensões no citado
aeroporto, julgue o item.
A tabela em questão descreve a distribuição de frequências da quantidade de drogas apreendidas nos cinco
dias que constituem a amostra.
13. (CESPE/IPHAN/2018). A tabela a seguir mostra as quantidades de bibliotecas públicas presentes em 20
microrregiões brasileiras.
90 66 78 82
77 60 64 90
87 85 67 91
82 70 81 80
69 78 90 67
A partir desses dados, pretende-se construir um gráfico de distribuição de frequências com quatro classes
de igual amplitude. Os valores mínimo e máximo de cada classe devem ser números inteiros.
Considerando essas informações, julgue o item subsequente, relativo ao gráfico de distribuição a ser
apresentado.
A amplitude de cada classe deverá ser superior a 6.
14. (CESPE/IPHAN/2018) A tabela a seguir mostra as quantidades de bibliotecas públicas presentes em 20
microrregiões brasileiras.
90 66 78 82
77 60 64 90
87 85 67 91
82 70 81 80
69 78 90 67
A partir desses dados, pretende-se construir um gráfico de distribuição de frequências com quatro classes
de igual amplitude. Os valores mínimo e máximo de cada classe devem ser números inteiros. Considerando
essas informações, julgue o item subsequente, relativo ao gráfico de distribuição a ser apresentado.
A última classe deverá variar de 84 a 91.
15. (CESPE/IPHAN/2018). Julgue o item subsequente, referente à análise exploratória de dados.
O histograma é um diagrama de retângulos contíguos com base na curtose das faixas de valores da variável
e com área igual à diferença da frequência absoluta da respectiva faixa.
16. (FCC/TRT 14ª Região/2018) De um histograma e uma tabela de frequências absolutas, elaborados para
analisar a distribuição dos salários dos empregados em uma empresa, obtém-se a informação que 24
empregados ganham salários com valores pertencentes ao intervalo (2.000; 4.000], em reais, que
apresenta uma densidade de frequência de 𝟎, 𝟕𝟓 × 𝟏𝟎−𝟒(𝑹$)−𝟏
Densidade de frequência de um intervalo é o resultado da divisão da respectiva frequência relativa pela
amplitude deste intervalo. Em um intervalo do histograma que está sendo analisado, com uma amplitude
de R$ 3.000,00 e uma densidade de frequência de 𝟏 × 𝟏𝟎−𝟒(𝑹$)−𝟏, tem-se que o correspondente número
de empregados é igual a
a) 40.
b) 36.
c) 30.
d) 48.
e) 42.
17. (CESPE/CBM-AL/2017). Na tabela a seguir, A, B, C, D e E são as quantidades de resmas de papel A4
consumidas, em quatro meses, pelas seções administrativas I, II, III, IV e V, respectivamente. Apesar de
não mostrar explicitamente essas quantidades, a tabela apresenta as frequências absolutas e (ou) relativas
de algumas dessas quantidades.
Seção
Quantidades
de Resmas
Frequência
Absoluta
Frequência
Relativa
I A 38 19%
II B
III C 20%
IV D 36
V E 44
Total 100%
Considerando que cada uma dessas resmas, juntamente com a embalagem, tem forma de um
paralelepípedo retângulo reto que mede 5 cm × 21 cm × 30 cm, julgue o item seguinte.
O gráfico de barras verticais a seguir apresenta as frequências absolutas de resmas consumidas pelas cinco
seções.
18. (FCC/ARTESP/2017) Foi solicitado para uma empresa de transportes que fizesse um levantamento da
idade da frota dos seus caminhões que operavam em um trecho de rodovia com tráfego intenso. O gerente
da empresa entregou a seguinte tabela:
Caminhão A B C D E F G H I J K L M
Idade (anos) 15 20 5 2 3 3 17 23 16 8 6 9 14
Caminhão N O P Q R S T U V W X Y
Idade (anos) 10 10 6 8 2 4 18 5 9 11 26 14
De posse deste levantamento, a analista de operações da autarquia solicitante organizou uma distribuição
de frequência para organizar melhor os dados para serem analisados. Sendo assim, em um primeiro
momento, fez-se necessário encontrar o número de intervalos (K) e a classe (C), que são expressos,
respectivamente, por
a) 5 e 4,80.
b) 5 e 5,20.
c) 6 e 4,80.
d) 6 e 5,20.
e) 4 e 5.
19. (FUNDATEC/BRDE/2017) Um grupo de pessoas foi consultada sobre a marca de veículos de sua
preferência. Nessa pesquisa, 100 pessoas escolheram a marca Hyundai de um total de 500 participantes.
As que escolheram a marca Ford correspondem a 30%. As pessoas restantes escolheram entre as marcas
Chevrolet e Volkswagen. A frequência absoluta das pessoas que escolheram a marca Volkswagen é igual
a diferença entre o número de pessoas que escolheram as marcas Ford e Hyundai. A frequência relativa
entre as pessoas que escolheram a marca Chevrolet corresponde a:
a) 10%.
b) 20%.
c) 30%.
d) 40%.
e) 50%.
20. (CESPE/TCE-PA/2016)
Número diário de
denúncias registradas (X)
Frequência
Relativa
0 0,3
1 0,1
2 0,2
3 0,1
4 0,3
Total 1,0
A tabela precedente apresenta a distribuição de frequências relativas da variável X, que representa o
número diário de denúncias registradas na ouvidoria de determinada instituição pública. A partir das
informações dessa tabela, julgue o item seguinte.
A variável X é do tipo qualitativo nominal.
21. (FCC/TRT 20ª Região/2016) Um gráfico corresponde a um histograma apresentando a distribuição dos
salários dos funcionários lotados em um determinado órgão público. No eixo das abscissas constam os
intervalos de classe (fechados à esquerda e abertos à direita) dos salários em R$ e no eixo das ordenadas
as respectivas densidades de frequências em (R$) −1. Densidade de frequência de um intervalo é definida
como sendo o resultado da divisão da respectiva frequência relativa pela correspondente amplitude do
intervalo. Se 135 funcionários ganham salários com valores pertencentes ao intervalo [3.000, 6.000) com
uma densidade de frequência de 1 × 10 −4 (R$) −1, então o número de funcionários que ganham salários
com valores pertencentes ao intervalo [6.000, 8.000) com uma densidade de frequência de 2 × 10 −4 (R$)
−1 é igual a:
a) 300
b) 180
c) 270
d) 150
e) 90
22. (CESPE/DEPEN/2015)
Região
Quantidade de detentos no
sistema penitenciário
brasileiro (mil pessoas)
Déficit de vagas no sistema
penitenciário (mil vagas)
População brasileira
(milhões de
habitantes)
Norte 37 13 17
Centro-Oeste 51 24 15
Nordeste 94 42 55
Sudeste 306 120 85
Sul 67 16 28
Total 555 215 200
Ministério da Justiça — Departamento Penitenciário Nacional — Sistema Integrado de Informações Penitenciárias – InfoPen, Relatório Estatístico Sintético do
Sistema Prisional Brasileiro, dez./2013
Internet: <www.justica.gov.br> (com adaptações).
A tabela mostrada apresenta a quantidade de detentos no sistema penitenciário brasileiro por região em
2013. Nesse ano, o déficit relativo de vagas — que se define pela razão entre o déficit de vagas no sistema
penitenciário e a quantidade de detentos no sistema penitenciário — registrado em todo o Brasil foi
superior a 38,7%, e, na média nacional,havia 277,5 detentos por 100 mil habitantes.
Com base nessas informações e na tabela apresentada, julgue o item a seguir.
Em 2013, mais de 55% da população carcerária no Brasil se encontrava na região Sudeste.
23. (CESPE/DEPEN/2015)
Região
Quantidade de detentos no
sistema penitenciário
brasileiro (mil pessoas)
Déficit de vagas no sistema
penitenciário (mil vagas)
População brasileira
(milhões de
habitantes)
Norte 37 13 17
Centro-Oeste 51 24 15
Nordeste 94 42 55
Sudeste 306 120 85
Sul 67 16 28
Total 555 215 200
Ministério da Justiça — Departamento Penitenciário Nacional — Sistema Integrado de Informações Penitenciárias – InfoPen, Relatório Estatístico Sintético do
Sistema Prisional Brasileiro, dez./2013
Internet: <www.justica.gov.br> (com adaptações).
A tabela mostrada apresenta a quantidade de detentos no sistema penitenciário brasileiro por região em
2013. Nesse ano, o déficit relativo de vagas — que se define pela razão entre o déficit de vagas no sistema
penitenciário e a quantidade de detentos no sistema penitenciário — registrado em todo o Brasil foi
superior a 38,7%, e, na média nacional, havia 277,5 detentos por 100 mil habitantes.
Com base nessas informações e na tabela apresentada, julgue o item a seguir.
A quantidade total de vagas existentes no sistema penitenciário brasileiro em 2013 era de 340 mil vagas.
24. (CESPE/DEPEN/2015)
Região
Quantidade de detentos no
sistema penitenciário
brasileiro (mil pessoas)
Déficit de vagas no sistema
penitenciário (mil vagas)
População brasileira
(milhões de
habitantes)
Norte 37 13 17
Centro-Oeste 51 24 15
Nordeste 94 42 55
Sudeste 306 120 85
Sul 67 16 28
Total 555 215 200
Ministério da Justiça — Departamento Penitenciário Nacional — Sistema Integrado de Informações Penitenciárias – InfoPen, Relatório Estatístico Sintético do
Sistema Prisional Brasileiro, dez./2013
Internet: <www.justica.gov.br> (com adaptações).
A tabela mostrada apresenta a quantidade de detentos no sistema penitenciário brasileiro por região em
2013. Nesse ano, o déficit relativo de vagas — que se define pela razão entre o déficit de vagas no sistema
penitenciário e a quantidade de detentos no sistema penitenciário — registrado em todo o Brasil foi
superior a 38,7%, e, na média nacional, havia 277,5 detentos por 100 mil habitantes.
Com base nessas informações e na tabela apresentada, julgue o item a seguir.
O déficit relativo de vagas observado na região Sudeste, em 2013, foi superior ao déficit relativo de vagas
registrado na região Centro-oeste no mesmo período.
25. (CESPE/DEPEN/2015)
Região
Quantidade de detentos no
sistema penitenciário
brasileiro (mil pessoas)
Déficit de vagas no sistema
penitenciário (mil vagas)
População brasileira
(milhões de
habitantes)
Norte 37 13 17
Centro-Oeste 51 24 15
Nordeste 94 42 55
Sudeste 306 120 85
Sul 67 16 28
Total 555 215 200
Ministério da Justiça — Departamento Penitenciário Nacional — Sistema Integrado de Informações Penitenciárias – InfoPen, Relatório Estatístico Sintético do
Sistema Prisional Brasileiro, dez./2013
Internet: <www.justica.gov.br> (com adaptações).
A tabela mostrada apresenta a quantidade de detentos no sistema penitenciário brasileiro por região em
2013. Nesse ano, o déficit relativo de vagas — que se define pela razão entre o déficit de vagas no sistema
penitenciário e a quantidade de detentos no sistema penitenciário — registrado em todo o Brasil foi
superior a 38,7%, e, na média nacional, havia 277,5 detentos por 100 mil habitantes.
Com base nessas informações e na tabela apresentada, julgue o item a seguir.
No ano considerado, a quantidade média de detentos por 100 mil habitantes na região Nordeste foi superior
ao número médio de detentos por 100 mil habitantes na região Centro-oeste.
26. (FCC/TRT 3ª Região/2015) Em um histograma representando os preços unitários de
microcomputadores em estoque, observa-se que no eixo das abscissas constam os intervalos de classe em
R$ e no eixo das ordenadas as respectivas densidades de frequências em (R$)−1. Densidade de frequência
de um intervalo de classe é o resultado da divisão da respectiva frequência relativa pela correspondente
amplitude do intervalo. Um determinado intervalo de classe com amplitude igual a R$ 2.500,00 apresenta
uma densidade de frequência, em (R$)−1, igual a 12,8 × 10−5. Se o número de microcomputadores deste
intervalo é igual a 48, então o número total de microcomputadores em estoque é igual a
a) 150.
b) 120.
c) 240.
d) 160.
e) 96.
27. (FCC/TRT 16ª Região/2014) A distribuição das medidas dos comprimentos, em cm, de uma
determinada peça em estoque de uma fábrica está representada em um histograma com todos os
intervalos de classe fechados à esquerda e abertos à direita. No eixo horizontal constam os intervalos de
classe e no eixo vertical as respectivas densidades de frequências, em cm−1. Define-se densidade de
frequência de um intervalo de classe como sendo o resultado da divisão da respectiva frequência relativa
pela correspondente amplitude deste intervalo. Verifica-se com relação ao histograma, que o intervalo de
classe [2 , 6), em cm, apresenta uma densidade de frequência igual a 0,028 cm−1. Dado que o número de
peças em estoque com medidas iguais ou superiores a 2 cm e inferiores a 6 cm é igual a 84, obtém-se que
o número total destas peças em estoque é
a) 750.
b) 400.
c) 500.
d) 250.
e) 1.000.
28. (FCC/TRT 13ª Região/2014) O histograma, abaixo, refere-se à distribuição dos salários dos funcionários
lotados em um setor de um órgão público. No eixo das abscissas constam os intervalos de classe em R$
(todos fechados à esquerda e abertos à direita) e no eixo das ordenadas as respectivas densidades de
frequências em (R$)−1. Define-se densidade de frequência de um intervalo como sendo o resultado da
divisão da respectiva frequência relativa pela correspondente amplitude do intervalo.
Se o número de funcionários que tem um salário inferior a R$ 5.000,00 é igual a 56, então verifica-se que
o número de funcionários que tem um salário igual ou superior a R$ 2.000,00 e inferior a R$ 8.000,00 é
igual a
a) 104.
b) 152.
c) 136.
d) 144.
e) 120.
29. (FGV/AL-BA/2014) Observe a tabela de frequências a seguir, que se refere aos saldos em conta, num
determinado dia, de duzentas contas‐correntes:
Saldos em conta (R$) Frequência
Até 100,00 8
De mais de 100,00 a 300,00 28
De mais de 300,00 a 500,00 46
De mais de 500,00 a 700,00 54
De mais de 700,00 a 900,00 44
De mais de 900,00 a 1.100,00 13
De mais de 1.100,00 a 1.300,00 6
Acima de 1.300,00 1
A frequência relativa acumulada de saldos em R$ 900,00 é igual a
a) 22%.
b) 36%.
c) 54%.
d) 90%.
e) 97%.
30. (CESPE/BACEN/2013)
2 4 8 4 8 1 2 32 12 1 5 7 5 5 3 4 24 19 4 14
Os dados mostrados acima representam uma amostra, em minutos, do tempo utilizado na armazenagem
de formulários no almoxarifado central de certa instituição por diversos funcionários.
Com base nesses dados, julgue o próximo item.
A distribuição de frequência acumulada para tempo de armazenagem observado na amostra inferior a 8
minutos é igual a 13, o que corresponde a uma frequência relativa superior a 0,60.
31. (FCC/TRT 6ª Região/2012) A distribuição dos 500 preços unitários de um equipamento é representada
por um histograma em que no eixo das abscissas constam os intervalos de classe e no eixo das ordenadas
estão assinaladas as respectivas densidades de frequências, em (R$)−1. Define-se densidade de frequência
de um intervalo de classe como sendo o resultado da divisão da respectiva frequência relativa pela
correspondente amplitude do intervalo. Um intervalo de classe no histograma apresenta uma amplitude
de R$ 2,50 com uma densidade de frequência igual a 0,096. A quantidade de preçosunitários referente a
este intervalo é
a) 96.
b) 120.
c) 144.
d) 150.
e) 192.
32. (FCC/TRT 6ª Região/2012) A função de distribuição empírica abaixo, F200(x), refere-se a uma pesquisa
realizada em 200 residências, escolhidas aleatoriamente, em que x é o número verificado de pessoas que
trabalham em cada residência.
𝑭𝟐𝟎𝟎(𝒙) =
{
𝟎, 𝟎𝟎 𝒔𝒆 𝒙 < 𝟎𝟎, 𝟏𝟎 𝒔𝒆 𝟎 ≤ 𝒙 < 𝟏𝟎, 𝟒𝟎 𝒔𝒆 𝟏 ≤ 𝒙 < 𝟐𝟎, 𝟔𝟓 𝒔𝒆 𝟐 ≤ 𝒙 < 𝟑𝟎, 𝟖𝟓 𝒔𝒆 𝟑 ≤ 𝒙 < 𝟒𝟎, 𝟗𝟓 𝒔𝒆 𝟒 ≤ 𝒙 < 𝟓𝟏, 𝟎𝟎 𝒔𝒆 𝒙 ≥ 𝟓
O número de residências desta pesquisa em que se verificou possuir pelo menos uma pessoa que trabalha
e menos que 4 é
a) 150.
b) 160.
c) 170.
d) 180.
e) 190.
33. (CESPE/ALECE/2011)
X 0 1 2 3 4 5
Frequência Absoluta 80 47 30 20 6 1
Um levantamento foi realizado para se avaliar, por município, a quantidade X de obras que estão sob
suspeita de irregularidade. Com base em uma amostra de municípios, foi obtida a distribuição de
frequências mostrada na tabela acima. Com base nessas informações, julgue o item a seguir.
Os extremos mínimo e máximo da variável X foram, respectivamente, iguais a 1 e 80.
34. (CESPE/ALECE/2011)
X 0 1 2 3 4 5
Frequência Absoluta 80 47 30 20 6 1
Um levantamento foi realizado para se avaliar, por município, a quantidade X de obras que estão sob
suspeita de irregularidade. Com base em uma amostra de municípios, foi obtida a distribuição de
frequências mostrada na tabela acima. Com base nessas informações, julgue o item a seguir.
O número de municípios que têm obras sob suspeita de irregularidades é superior a 120.
35. (CESPE/ALECE/2011)
X 0 1 2 3 4 5
Frequência Absoluta 80 47 30 20 6 1
Um levantamento foi realizado para se avaliar, por município, a quantidade X de obras que estão sob
suspeita de irregularidade. Com base em uma amostra de municípios, foi obtida a distribuição de
frequências mostrada na tabela acima. Com base nessas informações, julgue o item a seguir.
O total de municípios considerado no levantamento foi superior a 180.
36. (FCC/TRT 1ª Região/2011) Um histograma representa a distribuição dos preços unitários de venda de
um determinado equipamento no mercado. No eixo das ordenadas estão assinaladas as respectivas
densidades de frequência para cada intervalo em (R$)−1. Define-se densidade de frequência de um
intervalo de classe como sendo o quociente da divisão da respectiva frequência relativa pela
correspondente amplitude do intervalo. Um intervalo de classe do histograma corresponde aos preços
unitários maiores ou iguais a R$ 32,00 e inferiores a R$ 44,50 com uma densidade de frequência igual a 1,6
× 10−2 (R$)−1. Se todos os intervalos de classe do histograma têm a mesma frequência relativa, então um
intervalo de classe com densidade de frequência igual a 5,0 × 10−3 (R$)−1 apresenta uma amplitude de
a) R$ 64,00.
b) R$ 48,00.
c) R$ 40,00.
d) R$ 32,00.
e) R$ 24,00.
37. (CESPE/SEFAZ-MT/2004) Considere a seguinte situação hipotética.
Um órgão do governo recebeu pela Internet denúncias de sonegação de impostos estaduais contra 600
pequenas empresas. Denúncias contra outras 200 pequenas empresas foram encaminhadas pessoalmente
para esse órgão. Para a apuração das denúncias, foram realizadas auditorias nas 800 empresas
denunciadas. Como resultado dessas auditorias, foi elaborada a tabela abaixo, que apresenta um quadro
das empresas denunciadas e os correspondentes débitos fiscais ao governo. Das empresas denunciadas,
observou-se que apenas 430 tinham débitos fiscais.
Valor do débito fiscal (VDF), em R$ mil, apurado após auditoria na
empresa denunciada
Forma de recebimento da
denúncia
0 < 𝑉𝐷𝐹 < 1 1 ≤ 𝑉𝐷𝐹 < 2 2 ≤ 𝑉𝐷𝐹 < 3 3 ≤ 𝑉𝐷𝐹 ≤ 4 Total
Pela internet 60 100 50 30 240
Pessoalmente 20 120 40 10 190
Total 80 220 90 40 430*
Nota: *Para as demais empresas, VDF=0
Com base na situação hipotética acima e de acordo com as informações apresentadas, julgue o item que
se segue.
O valor total dos débitos fiscais apurados após as auditorias feitas nas empresas denunciadas é inferior a R$
500 mil.
38. (CESPE/SEFAZ-AL/2002) Julgue o seguinte item.
Em uma distribuição de frequências para um conjunto de n indivíduos, pode-se calcular as frequências
relativas, dividindo-se cada frequência absoluta pela amplitude da correspondente classe ou do intervalo.
GABARITO
Distribuições de Frequência
1. LETRA A
2. ERRADO
3. CERTO
4. CERTO
5. ERRADO
6. CERTO
7. LETRA A
8. LETRA B
9. LETRA B
10. LETRA C
11. LETRA B
12. ERRADO
13. CERTO
14. CERTO
15. ERRADO
16. LETRA D
17. CERTO
18. LETRA A
19. LETRA D
20. ERRADO
21. LETRA B
22. CERTO
23. CERTO
24. ERRADO
25. ERRADO
26. LETRA A
27. LETRA A
28. LETRA C
29. LETRA D
30. CERTO
31. LETRA B
32. LETRA A
33. ERRADO
34. ERRADO
35. CERTO
36. LETRA C
37. ERRADO
38. ERRADO
LISTA DE QUESTÕES
Representação Gráfica das Distribuições de Frequências
1. (CESPE/TELEBRAS/2022)
Considerando que o histograma apresentado descreve a distribuição de uma variável quantitativa X por
meio de frequências absolutas, julgue o item que se segue.
O número de observações que constituem a variável X é igual a 1.000.
2. (FGV/TCU/2022) O histograma a seguir mostra a quantidade de refeições para cada faixa de preço, em
uma determinada área do Rio de Janeiro.
O conjunto de dados consistente com o histograma é:
a) 25, 27, 27, 28, 29, 34, 34, 34, 35, 35, 35, 35, 36, 36, 37;
b) 26, 27, 27, 28, 29, 34, 34, 34, 35, 35, 36, 36, 37;
c) 26, 27, 27, 28, 29, 34, 34, 34, 35, 35, 35, 35, 36, 36, 39;
d) 26, 27, 27, 28, 29, 34, 34, 34, 35, 35, 35, 35, 36, 36, 37;
e) 26, 27, 27, 28, 29, 31, 34, 34, 34, 35, 35, 35, 36, 36, 37.
3. (VUNESP/CMSJC/2022) Os tempos de espera, em minutos, para o atendimento de 80 consumidores em
um centro de atendimento ao consumidor estão registrados no gráfico a seguir.
De acordo com o gráfico, é correto afirmar que o tempo de espera de
a) mais da metade dos consumidores foi superior a 1 hora.
b) 12,5% dos consumidores foi entre 1 h e 35 min e 2 h e 20 min.
c) 65% dos consumidores foi inferior a 1 hora.
d) 24 consumidores foi entre 50 min e 80 min.
e) no mínimo 2 pessoas, foi superior a 2 h e 30 min.
4. (CESGRANRIO/BB/2021) Após a coleta de dados em um determinado contexto (variáveis A, B, C, … X),
uma das formas mais simples e iniciais de análise é a geração e a avaliação de um histograma para uma
variável selecionada (ex: X), como por exemplo, em um estudo climático, em que os dados coletados
poderiam incluir a temperatura máxima observada em toda a Terra ao longo de dez anos.
Nesse caso, o histograma adequado é um gráfico em que são apresentadas as
a) últimas dez médias móveis da variável X
b) somas das médias dos quadrados de cada valor de uma variável X
c) variações de uma variável X ao longo do tempo
d) médias históricas da variável X nos últimos sete dias
e) frequências de uma variável X em intervalos de valores.
5. (CESPE/SEDUC AL/2021) Com base em estatística, julgue o item a seguir.
Suponha que o histograma a seguir represente a frequência relativa de alunos, distribuída por faixa etária,
que ingressaram no ensino superior no estado de Alagoas em 2020. Com base nas informações desse
gráfico, é correto afirmar que mais de 50% dos novos alunos têm idade superior a 22 anos.
6. (CESPE/FUNPRESP/2016)
O gráfico ilustra cinco possibilidades de fundos de investimento com suas respectivas rentabilidades.
Considerando que as probabilidades de investimento para os fundos A, B, C e D sejam, respectivamente,
P(A) = 0,182; P(B) = 0,454; P(C)= 0,091; e P(D)= 0,182, julgue o item subsequente.
O gráfico apresentado é um histograma.
7. (CESPE/DEPEN/2015)
Região
Quantidade de detentos no
sistema penitenciário
brasileiro(mil pessoas)
Déficit de vagas no sistema
penitenciário (mil vagas)
População brasileira
(milhões de
habitantes)
Norte 37 13 17
Centro-Oeste 51 24 15
Nordeste 94 42 55
Sudeste 306 120 85
Sul 67 16 28
Total 555 215 200
Ministério da Justiça — Departamento Penitenciário Nacional — Sistema Integrado de Informações Penitenciárias – InfoPen, Relatório Estatístico Sintético do
Sistema Prisional Brasileiro, dez./2013
Internet: <www.justica.gov.br> (com adaptações).
A tabela mostrada apresenta a quantidade de detentos no sistema penitenciário brasileiro por região em
2013. Nesse ano, o déficit relativo de vagas — que se define pela razão entre o déficit de vagas no sistema
penitenciário e a quantidade de detentos no sistema penitenciário — registrado em todo o Brasil foi
superior a 38,7%, e, na média nacional, havia 277,5 detentos por 100 mil habitantes.
Com base nessas informações e na tabela apresentada, julgue o item a seguir.
Na análise exploratória, o histograma é um gráfico adequado para descrever a distribuição da quantidade de
detentos por região em 2013.
8. (CESPE/BACEN/2013)
2 4 8 4 8 1 2 32 12 1 5 7 5 5 3 4 24 19 4 14
Os dados mostrados acima representam uma amostra, em minutos, do tempo utilizado na armazenagem
de formulários no almoxarifado central de certa instituição por diversos funcionários.
Com base nesses dados, julgue o próximo item.
É inviável a elaboração de um histograma em decorrência do fato de ser este um conjunto de dados
quantitativos discretos; dessa forma, apenas por meio de um gráfico de barras pode ser realizada a
representação gráfica.
GABARITO
Representação Gráfica das Distribuições de Frequências
1. ERRADO
2. LETRA D
3. LETRA B
4. LETRA E
5. ERRADO
6. ERRADO
7. ERRADO
8. ERRADO
LISTA DE QUESTÕES
Outros Gráficos e Representações
1. (IBFC/Pref. Cuiabá/2023) O diagrama de ramo e folhas abaixo corresponde às observações das idades
de 50 pacientes escolhidos em um determinado bairro de uma cidade:
1 6 7 7 8 8 9 9
2 0 0 1 1 2 3 3 4 4 4 8 9
3 0 1 2 2 1 7 8 8
4 2 3 6 6 6 6 8 9
5 2 3 3 4 4 8
6 0 2 5 6
7 1 4
Assinale a alternativa que apresenta o valor do módulo da diferença entre a mediana e a moda destas
idades observadas.
a) 0
b) 3
c) 10
d) 14
2. (CESPE/FUB/2022) Uma universidade está fazendo um estudo para verificar a distribuição dos tempos
que os alunos do curso de mestrado levam até a defesa da dissertação. Os dados a seguir mostram a função
de probabilidade desses tempos, em meses.
Tempo de Defesa (meses) Probabilidade
12 0,01
15 0,02
18 0,04
20 0,10
22 0,22
24 0,31
25 0,18
26 0,04
28 0,03
30 0,05
Considerando essas informações, julgue o item subsequente.
O gráfico de setores é adequado para representar a distribuição em questão.
3. (CESPE/FUB/2022) A tabela de frequência a seguir mostra dados coletados em uma pesquisa para se
verificar o número de disciplinas que os estudantes de determinada universidade estão cursando por
semestre.
Disciplinas 2 3 4 5 6 7 8
Estudantes 10 15 40 35 28 10 4
Considerando essas informações, julgue o item seguinte.
O gráfico do tipo pizza é o mais apropriado para representar os dados apresentados na tabela, visto que a
variável analisada é qualitativa ordinal.
4. (FADESP/Pref. De Igarapé-Açu/2022)
CONSIDERE OS DADOS A SEGUIR PARA RESPONDER À QUESTÃO.
No dia 25 de agosto de 2021, a Prefeitura Municipal de Igarapé-Açu
divulgou o Boletim Covid-19, conforme imagem abaixo.
Fonte: https://prefeituradeigarapeacu.pa.gov.br/boletim-epidemiologico-em-25-08-2021/ Acesso em 28/08/2021.
O número de casos confirmados em relação ao de casos notificados corresponde, aproximadamente, a
a) 33%.
b) 35%.
c) 37%.
d) 39%.
5. (FADESP/Pref. De Igarapé-Açu/2022)
CONSIDERE OS DADOS A SEGUIR PARA RESPONDER À QUESTÃO.
No dia 25 de agosto de 2021, a Prefeitura Municipal de Igarapé-Açu
divulgou o Boletim Covid-19, conforme imagem abaixo.
Fonte: https://prefeituradeigarapeacu.pa.gov.br/boletim-epidemiologico-em-25-08-2021/ Acesso em 28/08/2021.
Suponhamos que, dias depois, o número de casos recuperados tenha sido igual a 3.492, o número de
óbitos tenha sido igual a 2% da quantidade de casos confirmados e o número de pessoas em tratamento
domiciliar tenha sido igual a 50% do número de óbitos. Nessas condições, nesse dia, o número de casos
confirmados (que se constitui na soma do número de casos recuperados com o de casos em tratamento
domiciliar mais o número de óbitos) foi igual a
a) 3.580.
b) 3.600.
c) 3.620.
d) 3.640.
6. (FADESP/Pref. De Igarapé-Açu/2022)
CONSIDERE OS DADOS DOS QUADROS A SEGUIR
PARA RESPONDER À QUESTÃO.
É correto afirmar que, nesse período de quatorze anos, em Igarapé-Açu,
a) morreram menos de 130 crianças com idade inferior a 1 ano.
b) morreram mais de 150 crianças com idade inferior a 1 ano.
c) nasceram vivas menos de 7.000 crianças.
d) nasceram vivas mais de 9.800 crianças.
7. (FADESP/Pref. De Igarapé-Açu/2022)
CONSIDERE OS DADOS DOS QUADROS A SEGUIR
PARA RESPONDER À QUESTÃO.
A taxa de mortalidade infantil, calculada pelo IBGE, é obtida considerando-se a quantidade de crianças
mortas com menos de um ano por mil crianças que nasceram vivas. Assim, é possível afirmar que, em
Igarapé-Açu, no ano de 2010, a taxa de mortalidade infantil foi, aproximadamente, igual a
a) 1,67.
b) 1,87.
c) 2,07.
d) 2,27.
8. (VUNESP/EsFCEx/2021) O gráfico abaixo apresenta os resultados de uma pesquisa de opinião com os
clientes de operadoras de telefonia móvel no estado Açaí.
É correto afirmar sobre o gráfico que
a) a operadora ATCHIM é a mais bem avaliada entre as três operadoras, pois a soma dos percentuais de
“Ótima” e “Boa” é a maior entre as três operadoras.
b) as opiniões dos clientes sobre as operadoras são semelhantes no estado Açaí, porque os percentuais são
aproximadamente iguais.
c) as opiniões dos clientes sobre as operadoras são positivas no estado Açaí, porque a soma dos percentuais
de “Ótima” e “Boa” é superior a 50% para todas.
d) a opinião dos clientes da operadora SINFÔNICA no estado Açaí é bastante negativa, porque a soma dos
percentuais de “Ruim” e “Péssima” é cerca de 60%.
e) o maior percentual de respostas dos clientes está concentrado na categoria “Boa” para todas as
operadoras.
9. (VUNESP/Pref. Araçariguama/2021) O gráfico a seguir apresenta como votaram os vereadores de uma
determinada cidade na votação de um projeto na Câmara Municipal.
Número de votos
Sobre o modo como esses vereadores votaram, é correto afirmar que
a) 2/3 dos vereadores votaram a favor do projeto.
b) os votos a favor foram mais do que o dobro dos votos contrários.
c) a maioria dos votos foi contrária a emenda.
d) para cada voto contrário tiveram dois votos a favor.
e) mais de 1/3 dos vereadores votaram contra o projeto.
10. (VUNESP/UNICAMP/2019) Assinale dentre os exemplos a seguir, o gráfico de dispersão.
a)
b)
c)
d)
e)
11. (VUNESP/Pref. Campinas/2019) Uma empresa atua em três segmentos de mercado, A, B e C. O gráfico
de setores mostra a distribuição percentual, por segmento, da receita total obtida por essa empresa em
2018.
Sabendo-se que a receita obtida no segmento A superou a receita obtida no segmento B em R$ 64 milhões,
é correto afirmar que a receita obtida no segmento C foi igual a
a) R$ 98 milhões.
b) R$ 96 milhões.
c) R$ 94 milhões.
d) R$ 88 milhões.
e) R$ 86 milhões.
12. (VUNESP/Pref. Campinas/2019) Considere o gráfico a seguir.
Atendimento ao público: número de pessoas por dia
Se, ao invés da situação exposta no gráfico, o número de pessoas atendidas por dia tivesse sido sempre
igual e mantido o número total de atendimentos,o número de pessoas que teriam sido atendidas na 5ª
feira teria sido inferior ao que consta no gráfico em
a) 6 unidades.
b) 8 unidades.
c) 7 unidades.
d) 10 unidades.
e) 9 unidades.
13. (CESPE/IPHAN/2018) Julgue o item subsequente, referente à análise exploratória de dados.
A representação de diagramas de barras, de linha e de pizza possui escala de medida nominal e tem a moda
como medida de tendência central.
14. (FCC/Pref. Macapá/2018) Para fazer um gráfico de setores que representasse o número de alunos
canhotos, destros e ambidestros na sala de aula, Renato coletou os dados indicados na tabela abaixo.
Nº DE ALUNOS
DA SALA DE AULA
Destros (D) 35
Canhotos (C) 3
Ambidestros (AD) 2
Sabendo-se que um círculo pode ser dividido em 360°, quantos graus tem o setor circular correspondente
aos canhotos no gráfico correto feito por Renato?
a) 18°.
b) 25°.
c) 7,5°.
d) 24°.
e) 27°.
15. (FCC/SEDU-ES/2018) Depois da aplicação de uma prova para todos os alunos do 7º A, a professora
Marli fez um histograma com a distribuição das notas, conforme indicado abaixo.
Se a média de notas da sala foi igual a seis, a porcentagem dos alunos que tiraram nota maior ou igual a
média da sala nessa prova foi de
a) 54%.
b) 50%.
c) 56%.
d) 60%.
e) 52%.
16. (CESPE/CBM-AL/2017) O gráfico de setores a seguir mostra a distribuição das quantidades de incêndios
em determinada região, nos meses de abril a setembro de determinado ano.
Sabendo-se que nesses meses ocorreram 1.548 incêndios nessa região, julgue o item que se segue.
A frequência relativa à classe “incêndios no mês de setembro” é superior a 30%.
17. (CESPE/CBM-AL/2017) O gráfico de setores a seguir mostra a distribuição das quantidades de incêndios
em determinada região, nos meses de abril a setembro de determinado ano.
Sabendo-se que nesses meses ocorreram 1.548 incêndios nessa região, julgue o item que se segue.
Nos meses de maio e junho ocorreram mais de 400 incêndios nessa região.
18. (FGV/IBGE/2017) Uma vez concluída a etapa de críticas de dados, relativa a um conjunto de registros
obtido através de uma pesquisa de campo, inicia-se o trabalho de tabulação e elaboração de gráficos.
Durante as análises, algumas variáveis surgem com destaque.
I. Número de indivíduos por faixa etária;
II. Percentuais do nível de escolaridade; e
III. Pares de valores de consumo e renda.
Portanto, os tipos de gráficos considerados adequados a serem empregados em cada caso são,
respectivamente:
a) Colunas, linha e setores;
b) Setores, cartograma e barras;
c) Barras, setores e linha;
d) Linha, colunas e cartograma;
e) Colunas, setores e linha.
19. (CESPE/DEPEN/2015)
Dado que a participação dos presidiários em cursos de qualificação profissional é um aspecto importante
para a reintegração do egresso do sistema prisional à sociedade, foram realizados levantamentos
estatísticos, nos anos de 2001 a 2009, a respeito do valor da educação e do trabalho em ambientes
prisionais. Cada um desses levantamentos, cujos resultados são apresentados no gráfico, produziu uma
estimativa anual do percentual P de indivíduos que participaram de um curso de qualificação profissional
de curta duração, mas que não receberam o diploma por motivos diversos. Em 2001, 69,4% dos
presidiários que participaram de um curso de qualificação profissional não receberam o diploma. No ano
seguinte, 2002, esse percentual foi reduzido para 61,5%, caindo, em 2009, para 30,9%.
A partir das informações e do gráfico apresentados, julgue o item que se segue.
Se os percentuais forem representados por barras verticais, conforme o gráfico a seguir, então o resultado
será denominado histograma.
20. (CESPE/DEPEN/2015)
Dado que a participação dos presidiários em cursos de qualificação profissional é um aspecto importante
para a reintegração do egresso do sistema prisional à sociedade, foram realizados levantamentos
estatísticos, nos anos de 2001 a 2009, a respeito do valor da educação e do trabalho em ambientes
prisionais. Cada um desses levantamentos, cujos resultados são apresentados no gráfico, produziu uma
estimativa anual do percentual P de indivíduos que participaram de um curso de qualificação profissional
de curta duração, mas que não receberam o diploma por motivos diversos. Em 2001, 69,4% dos
presidiários que participaram de um curso de qualificação profissional não receberam o diploma. No ano
seguinte, 2002, esse percentual foi reduzido para 61,5%, caindo, em 2009, para 30,9%.
A partir das informações e do gráfico apresentados, julgue o item que se segue.
Os dados apresentados são suficientes para que se possa afirmar que o total de presidiários que participaram
de um curso de qualificação profissional de curta duração e que não receberam o diploma em 2008 foi
superior ao total referente ao ano de 2007.
21. (FUNDATEC/BRDE/2015) Assinale a alternativa que representa a nomenclatura dos três gráficos
abaixo, respectivamente.
a) Gráfico de Setores – Gráfico de Barras – Gráfico de Linha.
b) Gráfico de Pareto – Gráfico de Pizza – Gráfico de Tendência.
c) Gráfico de Barras – Gráfico de Setores – Gráfico de Linha.
d) Gráfico de Linhas – Gráfico de Pizza – Gráfico de Barras.
e) Gráfico de Tendência – Gráfico de Setores – Gráfico de Linha.
22. (FCC/ALE-PE/2014) Analise o gráfico e as afirmativas abaixo.
(http://blogs.estadao.com.br/vox-publica/tag/psdb/. Acessado em: 20/02/2013)
I. O crescimento da faixa de renda de “até 1 salário mínimo” pode ser reflexo dos programas de
transferência de renda governamentais, os quais garantem um rendimento mínimo às pessoas carentes.
II. O crescimento da faixa de renda de “até 1 salário mínimo” é fruto do emprego formal gerado no país
dentro do período da pesquisa, pois, os beneficiários dos programas de transferência de renda
governamentais entram na categoria sem rendimento.
III. No gráfico, percebe-se uma diminuição da concentração de renda no país. Isso fica evidente quando
analisamos, por exemplo, a faixa de renda “mais de 5 a 10 salários mínimos”.
IV. No gráfico, a faixa “mais de 1 a 2 salários mínimos” é a que apresenta a maior diferença em pontos
percentuais entre os dados de 2001 e 2011.
Está correto o que se afirma APENAS em
a) I e II.
b) II e III.
c) III e IV.
d) I e III.
e) II e IV.
23. (FGV/CGE-MA/2014) No setor A de uma empresa foi feita uma auditoria para descobrir quantas vezes
cada pessoa fazia ligações pessoais do seu celular no período de trabalho de 14 às 17 horas de um único
dia. O resultado está no gráfico a seguir.
O número de pessoas que trabalham no setor A dessa empresa é
a) 15.
b) 22.
c) 27.
d) 29.
e) 42.
24. (CESPE/TRE-ES/2011)
Cargo Candidatos Candidatos aptos Eleitos
Presidente da República 9 9 1
Governador de Estado 170 156 27
Senador 272 234 54
Deputado Federal 6.021 5.058 513
Deputado
Estadual/Distrital
15.268 13.076 1.059
Total 21.640 18.533 1.658
Internet: <www.tse.gov > (com adaptações).
Com base na tabela acima, referente às eleições de 2010, que apresenta a quantidade de candidatos para
os cargos de presidente da República, governador de estado, senador, deputado federal e deputado
estadual/distrital, bem como a quantidade de candidatos considerados aptos pela justiça eleitoral e o total
de eleitos para cada cargo pretendido, julgue o item a seguir.
Considerando-se a representação das quantidades de eleitos para cada cargo em um gráfico de pizza, a fatia
desse gráfico correspondente ao cargo de deputado federal terá ângulo superior a 120°.
25. (FGV/CODEBA/2010) O gráfico de pizza apresentado abaixo fornece os resultados de uma pesquisa
feita com 20 mulheres acerca da quantidade de filhos que cada uma possui.
Assinale o gráfico de colunas que melhor representaos dados apresentados acima.
a)
b)
c)
d)
e)
26. (FGV/Senado/2008) Entre os tipos de representações gráficas a seguir, o único que não é definido para
uma variável quantitativa contínua é:
a) histograma.
b) diagrama ramo-e-folhas.
c) diagrama de setores.
d) diagrama "Box-Plot".
e) Polígono de frequências.
27. (FUNDATEC/SEFAZ-RS/2009) Na revista Seleções de setembro de 2009 foram publicados os resultados
da 8ª edição da Pesquisa Marcas de Confiança, também apresentados através de alguns tipos de gráficos,
dentre eles, os dois primeiros que estão abaixo, sendo os outros dois fictícios. A sequência correta dos
gráficos abaixo é, respectivamente,
a) Polígono, Colunas, histograma, barras.
b) Histograma, colunas, barras, polígono.
c) Colunas, barras, histograma, polígono
d) Histograma, polígono, barras, colunas.
e) Barras, colunas, histograma, polígono
GABARITO
Outros Gráficos e Representações
1. LETRA D
2. ERRADO
3. ERRADO
4. LETRA E
5. LETRA B
6. LETRA A
7. LETRA A
8. LETRA A
9. LETRA E
10. LETRA B
11. LETRA B
12. LETRA E
13. CERTO
14. LETRA E
15. LETRA B
16. CERTO
17. ERRADO
18. LETRA E
19. ERRADO
20. ERRADO
21. LETRA C
22. LETRA D
23. LETRA D
24. ERRADO
25. LETRA C
26. LETRA C
27. LETRA C
Índice
..............................................................................................................................................................................................1) Noções Iniciais sobre Médias 3
..............................................................................................................................................................................................2) Medidas de Posição 4
..............................................................................................................................................................................................3) Notação de Somatório 6
..............................................................................................................................................................................................4) Média Aritmética Simples 16
..............................................................................................................................................................................................5) Média Ponderada 33
..............................................................................................................................................................................................6) Média para Dados Agrupados 39
..............................................................................................................................................................................................7) Média Geométrica 53
..............................................................................................................................................................................................8) Média Harmônica 59
..............................................................................................................................................................................................9) Desigualdade das Médias 66
..............................................................................................................................................................................................10) Questões Comentadas - Média Aritmética Simples - Multibancas 75
..............................................................................................................................................................................................11) Questões Comentadas - Média Ponderada - Multibancas 183
..............................................................................................................................................................................................12) Questões Comentadas - Média para Dados Agrupados - Multibancas 210
..............................................................................................................................................................................................13) Questões Comentadas - Média Geométrica - Multibancas 248
..............................................................................................................................................................................................14) Questões Comentadas - Média Harmônica - Multibancas 250
..............................................................................................................................................................................................15) Questões Comentadas - Desigualdade das Médias - Multibancas 253
..............................................................................................................................................................................................16) Lista de Questões - Média Aritmética Simples - Multibancas 256
..............................................................................................................................................................................................17) Lista de Questões - Média Ponderada - Multibancas 305
..............................................................................................................................................................................................18) Lista de Questões - Média para Dados Agrupados - Multibancas 318
..............................................................................................................................................................................................19) Lista de Questões - Média Geométrica - Multibancas 336
..............................................................................................................................................................................................20) Lista de Questões - Média Harmônica - Multibancas 338
..............................................................................................................................................................................................21) Lista de Questões - Desigualdade das Médias - Multibancas 340
INTRODUÇÃO
A média é um número que, de algum modo, resume as características de um grupo. Nosso contato
com a média surge ainda na escola, quando os professores calculam a média das nossas avaliações.
Suponha que um aluno tenha obtido as seguintes notas em determinada disciplina: 4; 10; 8; 10; 7; 9.
Com base nesses dados, podemos concluir que a média aritmética desse aluno nessa disciplina será 8.
Assim, a média é capaz de representar o conjunto dos valores observados.
A média está presente em nosso cotidiano. Com certa frequência, as notícias abordam conceitos que
estão relacionados com a média: expectativa de vida dos brasileiros; idade média de uma população;
renda domiciliar per capita brasileira; consumo médio de combustível; tempo médio de deslocamento
em um trajeto.
Vamos analisar o primeiro exemplo. Quando o noticiário diz que expectativa de vida no Japão teve um
aumento recorde na última década, chegando a 84,2 anos. O que você entende diante dessa informação?
Essa informação reflete a qualidade de vida da população japonesa. Ela nos mostra que a população
japonesa está envelhecendo de forma saudável e que o sistema de saúde está sendo eficaz.
Se o noticiário também disser que a expectativa de vida em Angola gira em torno de 60 anos, você será
capaz comparar essas duas populações, certo? A resposta é sim. Quando comparados, os números
mostram que a qualidade de vida em Angola não é tão boa quanto a do Japão. Também nos dizem que
os angolanos tendem a viver, em média, 24 anos a menos que os japoneses.
Ao longo dessa aula, aprenderemos a calcular a média em diversas situações. Vamosver que, a depender
de como os dados nos forem apresentados, o cálculo será feito de uma forma diferente. Além disso,
conheceremos algumas propriedades da média que facilitam a resolução de questões.
8
4
10
8
10
7
9
MEDIDAS DE POSIÇÃO
Muitas vezes, queremos resumir um conjunto de dados apresentando um ou alguns valores que sejam
representativos de uma série toda. As medidas de posição são estatísticas que caracterizam o
comportamento dos elementos de uma série de dados, orientando quanto à posição da
distribuição em relação ao eixo horizontal do gráfico da curva de frequência.
Em outras palavras, podemos dizer que as medidas de posição indicam a tendência de concentração dos
elementos de uma série, apontando o valor que melhor representa o conjunto de dados. Por exemplo,
podemos ter uma medida para representar a posição de maior frequência de uma distribuição:
As medidas de posição podem ser divididas em:
a) medidas de tendência central: representam o ponto central ou o valor típico de um conjunto
de dados, indicando onde está localizada a maioria dos valores de uma distribuição. As medidas mais
utilizadas são:
• média aritmética: é a medida de posição mais utilizada, sendo o valor resultante da divisão
entre a soma de todos os valores de uma série de observações e o número de observações;
• mediana: valor que ocupa a posição central de uma série de observações, quando
organizadas em ordem crescente ou decrescente; e
• moda: valor mais frequente em uma série de observações, ou seja, o que aparece o maior
número de vezes dentro de um conjunto de valores observados.
Apenas a título de exemplo, vejamos como as medidas de tendência central se posicionam em relação a
uma distribuição de frequências. Notem que essas medidas tendem a ocupar as posições centrais da
distribuição, por isso são denominadas de medidas de tendência central.
jeffs
Destacar
jeffs
Destacar
b) medidas separatrizes: dividem (ou separam) uma série em duas ou mais partes, cada uma
contendo a mesma quantidade de elementos. As medidas mais utilizadas são:
• mediana: divide uma série em duas partes iguais. Reparem que, além de ser uma medida
separatriz, a mediana também é uma medida de tendência central;
• quartis: dividem uma série em quatro partes iguais;
• decis: dividem uma série em dez partes iguais; e
• percentis: dividem uma série em cem partes iguais.
A seguir, podemos ver como os quartis se relacionam com uma determinada distribuição de frequências.
Reparem que os quartis dividem a distribuição em quatro partes com iguais quantidades de elementos.
Medidas de
Posição
Medidas de
Tendência
Central
Medidas
Separatrizes
Quartis
Decis
Percentis
Média
Moda
Mediana
Média Aritmética
Média Geométrica
Média Harmônica
Mediana
jeffs
Destacar
jeffs
Destacar
NOTAÇÃO DE SOMATÓRIO
Com frequência, as fórmulas matemáticas exigem a adição de muitas variáveis, como é o caso da média
aritmética. O somatório ou notação sigma é uma forma simples e conveniente de abreviação, usada
para fornecer uma expressão concisa para a soma dos valores de uma variável. Por exemplo, se
quisermos representar a soma de um número de termos tais como 1 + 2 + 3 + 4 + 5
ou 12 + 22 + 32 + 42 + 52
em que há um padrão evidente para os números envolvidos.
De modo geral, se tomarmos uma sequência de números 𝑥1, 𝑥2, 𝑥3, ⋯ , 𝑥𝑛 , então podemos escrever a
soma desses números como 𝑥1 + 𝑥2 + 𝑥3 +⋯+ 𝑥𝑛. Nesse conjunto, 𝑥1 representa o primeiro termo; 𝑥2
representa o segundo; 𝑥3, o terceiro; e 𝑥𝑖 o i-ésimo termo da soma.
Essa soma pode ser representada de uma forma mais simples e concisa, deixando que 𝑥𝑖 represente o
termo geral da sequência. Para isso, empregamos a seguinte notação:
∑𝑥𝑖𝑛𝑖=1
Então, em vez de usarmos vários elementos para determinarmos o somatório, utilizamos apenas o
símbolo do somatório:
Essa notação envolve um símbolo de somatório, 𝛴, que é a letra grega maiúscula Sigma (S). Basicamente,
esse símbolo está nos instruindo a somar determinados elementos de uma sequência. Os elementos
típicos da sequência que está sendo somada aparecem à direita do símbolo de somatório:
𝑿𝟏 + 𝑿𝟐 + 𝑿𝟑 +⋯+ 𝑿𝒏 ∑𝒊=𝟏𝒏 𝒙𝒊
jeffs
Destacar
jeffs
Destacar
jeffs
Destacar
jeffs
Destacar
Observe que essa notação também requer a definição de um índice, que fica localizado abaixo do
símbolo de somatório. Esse índice é frequentemente representado por 𝒊, embora também seja
comum encontrarmos questões adotando 𝑗 ou 𝑛.
Esse índice normalmente aparece como uma expressão, por exemplo, 𝑖 = 𝑎, em que o índice assume
um valor inicial atribuído no lado direito da equação, conhecido como limite inferior (𝑎). Se
considerarmos que 𝑖 = 1, estamos dizendo que o primeiro elemento da sequência a ser considerado é o
de índice igual a 1, isto é, o primeiro elemento da sequência. A condição de parada ou limite superior
do somatório é o valor localizado acima do símbolo, no caso (𝑏). A condição de parada indica o último
elemento da sequência a ser considerado no somatório.
∑𝑥𝑖𝑏𝑖=𝑎
Então, se tivermos uma sequência de 10 valores, devemos interpretar a notação a seguir como a soma
dos valores da sequência 𝑥𝑖 , com 𝑖 variando de 1 a 10:
∑𝑥𝑖10𝑖=1
Vejamos alguns exemplos típicos de operações envolvendo somatórios. Para isso, tomaremos como
exemplo a sequência {𝑥𝑖} = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10}:
∑𝑥𝑖𝑛𝑖=1
Representa a soma dos valores de 𝑥, começando em 𝑥1 e terminando em 𝑥𝑛.
∑𝑥𝑖𝑛𝑖=1 = 𝑥1 + 𝑥2 + 𝑥3 +⋯+ 𝑥𝑛
∑𝑥𝑖𝑛𝑖=1 = 1 + 2 + 3 +⋯+ 10 = 55
∑𝑥𝑖10𝑖=1
Representa a soma dos valores de 𝑥, começando em 𝑥1 e terminando em 𝑥10.
∑𝑥𝑖10𝑖=1 = 𝑥1 + 𝑥2 + 𝑥3 + 𝑥4 + 𝑥5 + 𝑥6 + 𝑥7 + 𝑥8 + 𝑥9 + 𝑥10
∑𝑥𝑖𝑛𝑖=1 = 1 + 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9 + 10 = 55
jeffs
Destacar
jeffs
Destacar
jeffs
Destacar
∑𝑥𝑖10𝑖=3
Representa a soma dos valores de 𝑥, começando em 𝑥3 e terminando em 𝑥10.
∑𝑥𝑖10𝑖=3 = 𝑥3 + 𝑥4 + 𝑥5 + 𝑥6 + 𝑥7 + 𝑥8 + 𝑥9 + 𝑥10
∑𝑥𝑖10𝑖=3 = 3 + 4 + 5 + 6 + 7 + 8 + 9 + 10 = 55
∑𝑥
Os limites do somatório são frequentemente entendidos como sendo 𝑖 =1 e 𝑛. Assim, a notação abaixo e acima do símbolo de somatório pode ser
omitida. Portanto, essa expressão representa a soma dos valores de 𝑥,
começando em 𝑥1 e terminando em 𝑥𝑛. ∑𝑥 = 𝑥1 + 𝑥2 + 𝑥3 +⋯+ 𝑥𝑛
∑𝑥 = 1+ 2 + 3 +⋯+ 10 = 55
∑𝑥𝑖2𝑛𝑖=1
Representa a soma dos quadrados dos valores de 𝑥, começando em 𝑥1 e
terminando em 𝑥𝑛.
∑𝑥𝑖2𝑛𝑖=1 = 𝑥12 + 𝑥22 + 𝑥32 +⋯+ 𝑥𝑛2
∑𝑥𝑖2𝑛𝑖=1 = 12 + 22 + 32 +⋯+ 102 = 385
∑(2𝑥𝑘 + 1)4𝑘=1
Representa a soma dos termos da sequência {2𝑛 + 1}, com 𝑘 começando
em 1 e terminando em 4.
∑(2𝑥𝑘 + 1)4𝑘=1 = (2 × 1 + 1) + (2 × 2 + 1) + (2 × 3 + 1) + (2 × 4 + 1)
∑(2𝑥𝑘 + 1)4𝑘=1 = 3 + 5 + 7 + 9 = 24 ∑( 𝑥𝑖𝑥𝑖 + 1)5𝑖=3 Representa a soma dos termos da sequência {
𝑥𝑖𝑥𝑖+1}, com 𝑖 começando em
3 e terminando em 5.
jeffs
Destacar
∑( 𝑥𝑖𝑥𝑖 + 1)5𝑖=3 = 33 + 1 + 44 + 1 + 55 + 1
∑( 𝑥𝑖𝑥𝑖 + 1)5𝑖=3 = 34 + 45 + 56 = 45 + 48 + 5060 = 14360
Agora que já entendemos o funcionamento básico dessa notação, precisamos analisar outras operações
aritméticas que também podem ser realizadas com as variáveis dentro de um somatório. Para tanto,
vamos tomar como base as sequências {𝑥𝑖} = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10} e {𝑦𝑖} ={3, 6, 9, 12, 15, 18, 21, 24, 27, 30}.
Por exemplo, na SOMA DOS PRODUTOS, multiplicamos 𝑥1 por 𝑦1; 𝑥2 por 𝑦2; e assim por diante, até 𝑥𝑛
por 𝑦𝑛. Em seguida, somamos os resultados de cada multiplicação. A SOMA DOS PRODUTOS da variável 𝑥 pela variável 𝑦, com 𝑖 variando de 1 a 10, pode ser representada por meio da seguinte expressão:
∑𝒙𝒊 × 𝒚𝒊𝒏𝒊=𝟏 = 𝒙𝟏 × 𝒚𝟏 + 𝒙𝟐 × 𝒚𝟐 + 𝒙𝟑 × 𝒚𝟑 +⋯+ 𝒙𝒏 × 𝒚𝒏
∑𝒙𝒊 × 𝒚𝒊𝟏𝟎𝒊=𝟏 = 𝟏 × 𝟑 + 𝟐 × 𝟔 + 𝟑 × 𝟗 +⋯+ 𝟏𝟎 × 𝟑𝟎 = 𝟏𝟏𝟓𝟓
Observe que essa expressão é diferente de ∑ 𝑥𝑖𝑛𝑖=1 × ∑𝑦𝑖𝑛𝑖=1 , que representa o PRODUTO DAS SOMAS
dessas duas variáveis. No PRODUTO DAS SOMAS, primeiro somamos toda a sequência 𝑥, depois toda
a sequência 𝑦 e, em seguida, multiplicamos o resultado das somas:
∑𝒙𝒊𝟏𝟎𝒊=𝟏 ×∑𝒚𝒊𝟏𝟎𝒊=𝟏 = (𝟏 + 𝟐 + 𝟑 +⋯+ 𝟏𝟎) × (𝟑 + 𝟔 + 𝟗 +⋯+ 𝟑𝟎)
∑𝒙𝒊𝟏𝟎𝒊=𝟏 ×∑𝒚𝒊𝟏𝟎𝒊=𝟏 = 𝟓𝟓 × 𝟏𝟔𝟓 = 𝟗𝟎𝟕𝟓
Dessa forma, temos que a SOMA DOS PRODUTOS é diferente do PRODUTO DAS SOMAS:
jeffs
Destacar
jeffs
Destacar
jeffs
Destacar
∑𝒙𝒊 × 𝒚𝒊𝟏𝟎𝒊=𝟏 ≠∑𝒙𝒊𝟏𝟎𝒊=𝟏 ×∑𝒚𝒊𝟏𝟎𝒊=𝟏 𝒙𝟏 × 𝒚𝟏 + 𝒙𝟐 × 𝒚𝟐 + 𝒙𝟑 × 𝒚𝟑 +⋯+ 𝒙𝒏 × 𝒚𝒏 ≠ (𝒙𝟏 + 𝒙𝟐 + 𝒙𝟑 +⋯+ 𝒙𝒏) × (𝒚𝟏 + 𝒚𝟐 + 𝒚𝟑 +⋯+ 𝒚𝒏) 𝟏 × 𝟑 + 𝟐 × 𝟔 + 𝟑 × 𝟗 +⋯+ 𝟏𝟎 × 𝟑𝟎 ≠ (𝟏 + 𝟐 + 𝟑 +⋯+ 𝟏𝟎) × (𝟑 + 𝟔 + 𝟗 +⋯+ 𝟑𝟎) 𝟏𝟏𝟓𝟓 ≠ 𝟗𝟎𝟕𝟓
Também podemos utilizar a notação para representar o QUADRADO DA SOMA dos valores de 𝑥, com 𝑖
iniciando em 1 e terminando em 10. No QUADRADO DA SOMA, somamos toda a sequência e elevamos
o resultado ao quadrado:
(∑𝒙𝒊𝒏𝒊=𝟏 )
𝟐 = (𝒙𝟏 + 𝒙𝟐 + 𝒙𝟑 +⋯+ 𝒙𝒏)𝟐
(∑𝒙𝒊𝒏𝒊=𝟏 )
𝟐 = (𝟏 + 𝟐 + 𝟑 +⋯+ 𝟏𝟎)𝟐
(∑𝒙𝒊𝒏𝒊=𝟏 )
𝟐 = (𝟓𝟓)𝟐 = 𝟑𝟎𝟐𝟓
Veja que essa expressão é diferente de ∑ 𝑥𝑖2𝑛𝑖=1 , que representa a SOMA DOS QUADRADOS. Na SOMA
DOS QUADRADOS, cada elemento da sequência é elevado ao quadrado e depois os resultados são
somados:
∑𝒙𝒊𝟐𝒏𝒊=𝟏 = 𝟏𝟐 + 𝟐𝟐 + 𝟑𝟐 +⋯+ 𝟏𝟎𝟐 = 𝟑𝟖𝟓
Logo, podemos afirmar que o QUADRADO DA SOMA é diferente da SOMA DOS QUADRADOS:
(∑𝒙𝒊𝒏𝒊=𝟏 )
𝟐 ≠∑𝒙𝒊𝟐𝒏𝒊=𝟏 (𝒙𝟏 + 𝒙𝟐 + 𝒙𝟑 +⋯+ 𝒙𝒏)𝟐 ≠ 𝒙𝟏𝟐 + 𝒙𝟐𝟐 + 𝒙𝟑𝟐 +⋯+ 𝒙𝒏𝟐
jeffs
Destacar
jeffs
Destacar
jeffs
Destacar
Por fim, ainda podemos representar o somatório de uma constante 𝑘. Digamos que essa constante tenha
valor igual a 3:
∑𝑘𝑛𝑖=1 = 𝑘 + 𝑘 +⋯+ 𝑘 = 𝑘 × 𝑛
∑3𝑛𝑖=1 = 3 + 3 +⋯+ 3 = 3 × 𝑛
Propriedades do Somatório
As propriedades apresentadas nesta seção facilitam o desenvolvimento de expressões algébricas com a
notação de somatório.
1ª. Propriedade: O somatório de uma constante 𝒌 é igual ao produto do número de termos pela
constante.
∑𝒌𝒏𝒊=𝟏 = 𝒌 + 𝒌 +⋯+ 𝒌 = 𝒌 × 𝒏
Para demonstrar essa propriedade, consideraremos que cada constante está multiplicada pelo valor
um, isto é:
∑𝑘𝑛𝑖=1 = 𝑘 × 1 + 𝑘 × 1 +⋯+ 𝑘 × 1
Agora, colocaremos os novos valores em evidência:
∑𝑘𝑛𝑖=1 = 𝑘 × (1 + 1 +⋯+ 1⏟ 𝑛 𝑡𝑒𝑟𝑚𝑜𝑠 ) = 𝑘 × 𝑛
jeffs
Destacar
Considere uma lista composta por noventa e nove elementos repetidos e iguais a 9: {9, 9, 9, 9, 9,⋯ , 9⏟ }99 𝑡𝑒𝑟𝑚𝑜𝑠 𝑟𝑒𝑝𝑒𝑡𝑖𝑑𝑜𝑠 .
O somatório dos elementos dessa lista será:
∑999𝑖=1 = 9 + 9 + 9 + 9 + 9 + ⋯+ 9⏟ 99 𝑡𝑒𝑟𝑚𝑜𝑠 𝑟𝑒𝑝𝑒𝑡𝑖𝑑𝑜𝑠 = 9 × (1 + 1 + 1 + 1 + 1 +⋯+ 1⏟ 99 𝑡𝑒𝑟𝑚𝑜𝑠 ) = 9 × 99 = 891
2ª. Propriedade: O somatório do produto de uma constante por uma variável é igual ao
produto da constante pelo somatório da variável.
∑𝒌× 𝒙𝒊𝒏𝒊=𝟏 = 𝒌 × 𝒙𝟏 + 𝒌 × 𝒙𝟐 +⋯+ 𝒌 × 𝒙𝒏 = 𝒌 ×∑𝒙𝒊𝒏𝒊=𝟏
Para demonstrarmos essa propriedade, colocaremos em evidência cada constante 𝑘:
∑𝑘 × 𝑥𝑖𝑛𝑖=1 = 𝑘 × 𝑥1 + 𝑘 × 𝑥2 +⋯+ 𝑘 × 𝑥𝑛 = 𝑘 × (𝑥1 + 𝑥2 +⋯+ 𝑥𝑛)
Já sabemos que ∑ 𝑥𝑖𝑛𝑖=1 = 𝑥1 + 𝑥2 +⋯+ 𝑥𝑛. Logo:
∑𝑘 × 𝑥𝑖𝑛𝑖=1 = 𝑘 ×∑𝑥𝑖𝑛𝑖=1
Portanto, a constante pode sair de dentro do somatório, passando a multiplicá-lo.
jeffs
Destacar
Cinco funcionários de um escritório de contabilidade recebem os seguintes salários: 𝑅$ 1.000, 𝑅$ 1.250, 𝑅$ 1.500, 𝑅$ 1.750 e 𝑅$ 2.000. O patrão propõe dobrar seus salários quando
o faturamento do escritório aumentar em 50%. Quando a meta for alcançada, quanto o patrão
passará a desembolsar por essa equipe?
Os salários atuais podem ser representados pela sequência: {𝑥𝑛} = {1.000, 1.250, 1.500, 1.750, 2.000}
A soma dos termos dessa sequência é dada por:
∑𝑥𝑖5𝑖=1 = 1.000 + 1.250 + 1.500 + 1.750 + 2.000 = 7.500
Agora, vamos multiplicar cada um dos termos por 2, tendo em vista que os salários serão dobrados. {2 × 𝑥𝑛} = {2.000, 2.500, 3.000, 3.500, 4.000}
A soma dos termos da nova sequência será:
∑2× 𝑥𝑖5𝑖=1 = 2.000 + 2.500 + 3.000 + 3.500 + 4.000 = 15.000
Como base na propriedade ora analisada, também poderíamos simplesmente ter feito:
∑2× 𝑥𝑖5𝑖=1 = 2 ×∑𝑥𝑖5𝑖=1 = 2 × 7.500 = 15.000
3ª. Propriedade: O somatório de uma soma ou subtração é igual à soma ou à subtração dos
somatórios dessas variáveis.
∑(𝒙𝒊 ± 𝒚𝒊)𝒏𝒊=𝟏 =∑𝒙𝒊𝒏𝒊=𝟏 ±∑𝒚𝒊𝒏𝒊=𝟏
Podemos demonstrar essa propriedade da seguinte forma:
∑(𝑥𝑖 ± 𝑦𝑖)𝑛𝑖=1 = (𝑥1 ± 𝑦1) + (𝑥2 ± 𝑦2) + ⋯+ (𝑥𝑛 ± 𝑦𝑛)
∑(𝑥𝑖 ± 𝑦𝑖)𝑛𝑖=1 = (𝑥1 + 𝑥2 +⋯+ 𝑥𝑛) ± (𝑦1 + 𝑦2 +⋯+ 𝑦𝑛)
∑(𝑥𝑖 ± 𝑦𝑖)𝑛𝑖=1 =∑𝑥𝑖𝑛𝑖=1 ±∑𝑦𝑖𝑛𝑖=1
Cinco funcionários de uma fábrica de bolas de futebol recebem os seguintes salários: 𝑅$ 1.500, 𝑅$ 2.000, 𝑅$ 2.500, 𝑅$ 3.000 e 𝑅$ 3.500. O patrão propõe um bônus de R$ 1.000, para
cada funcionário, nos meses em que houver um aumento de produção acima de 10%. Nos meses
em que a meta for alcançada, quanto o patrão pagará a essa equipe?
Os salários atuais podem ser representados pela seguinte sequência: {𝑥𝑛} = {1.500, 2.000, 2.500, 3.000, 3.500}
O bônus de cada funcionário pode ser representado pela sequência: {𝑦𝑛} = {1.000, 1.000, 1.000, 1.000, 1.000}
jeffs
Destacar
Assim, a sequência {𝑥𝑛 + 𝑦𝑛} é dada por: {𝑥𝑛 + 𝑦𝑛} = {2.500, 3.000, 3.500, 4.000, 4.500}
Dessa forma, temos que:
∑𝑥𝑖5𝑖=1 = 1.500 + 2.000 + 2.500 + 3.000 + 3.500 = 12.500
∑𝑦𝑖5𝑖=1 = 1.000 + 1.000 + 1.000 + 1.000 + 1.000 = 5.000
∑𝑥𝑖5𝑖=1 +∑𝑦𝑖5𝑖=1 = 12.500 + 5.000 = 17.500
Além disso, sabemos que ∑ (𝑥𝑖 + 𝑦𝑖)5𝑖=1 representa o somatório dos termos da sequência {𝑥𝑛 + 𝑦𝑛}.
Logo,
∑(𝑥𝑖 + 𝑦𝑖)5𝑖=1 = 2.500 + 3.000 + 3.500 + 4.000 + 4.500 = 17.500
Portanto, em conformidade com a propriedade ora em análise, temos que:
∑(𝑥𝑖 + 𝑦𝑖)5𝑖=1 =∑𝑥𝑖5𝑖=1 +∑𝑦𝑖5𝑖=1
MÉDIA ARITMÉTICA SIMPLES
A média aritmética simples está muito presente em nosso cotidiano, seja no consumo médio de
combustível, na temperatura média ou na renda per capita. Essa medida é definida como o
QUOCIENTE entre a SOMA DE TODOS OS ELEMENTOS e o NÚMERO DELES. A propriedade
principal da média é preservar a soma dos elementos de um conjunto de dados.
Podemos adotar o seguinte raciocínio para encontrarmos a fórmula da média aritmética. Dada uma lista
de 𝑛 números, {𝑥1, 𝑥2, ⋯ , 𝑥𝑛}, a soma de seus termos é igual a:
𝑥1 + 𝑥2 +⋯+ 𝑥𝑛.⏟ 𝑛 𝑓𝑎𝑡𝑜𝑟𝑒𝑠
A média aritmética dessa lista é um número �̅�, tal que, se todos os elementos forem substituídos por �̅�,
a soma da lista permanecerá preservada. Assim, substituindo todos os elementos por �̅�, teremos uma
nova lista, {�̅�, �̅�, ⋯ , �̅�}, cuja soma é:
�̅� + �̅� +⋯+ �̅�⏟ 𝑛 𝑓𝑎𝑡𝑜𝑟𝑒𝑠 = 𝑛 × �̅�
Como as somas das duas listas são iguais, temos:
𝑛 × �̅� = 𝑥1 + 𝑥2 +⋯+ 𝑥𝑛
Portanto, a média aritmética é:
�̅� = 𝒙𝟏 + 𝒙𝟐 +⋯+ 𝒙𝒏𝒏
Reparem que no numerador somamos todos os elementos, ao passo que no denominador temos a
quantidade de elementos somados (𝑛).
jeffs
Destacar
jeffs
Destacar
jeffs
Destacar
Calcule a média aritmética dos números 8, 16, 26 e 30.
Para responder a essa questão, somaremos os quatro números e, em seguida, dividiremos o
resultado por quatro:
�̅� = 8 + 16 + 26 + 304 = 804 = 20
Portanto, 20 é o valor da média aritmética dos números 8, 16, 26 e 30.
Repare que a soma dos números da lista é 8 + 16 + 26 + 30 = 80. Se os quatro números forem
substituídos por 20, a soma também será 20 + 20 + 20 + 20 = 80. Por isso, dizemos que a média
aritmética preserva a soma dos números.
Sempre que a questão não especificar qual o tipo de média, faremos o cálculo da média aritmética.
Sobre a média aritmética, podemos afirmar que:
I – ela preserva a soma dos elementos da lista de números;
II – ela é obtida pelo quociente entre a soma de todos os elementos de um conjunto e quantidadede elementos nele existentes (�̅� = ∑ 𝑥𝑖𝑛𝑖=1𝑛 = 𝑥1+𝑥2+⋯+𝑥𝑛𝑛 ).
jeffs
Destacar
A soma total de um conjunto de dados é dada pela multiplicação entre a média do conjunto e a
quantidade de termos. Isso decorre da própria definição de média aritmética:
Trata-se da mesma fórmula apresentada anteriormente, tendo apenas o termo “n” passado para o
outro lado da igualdade, multiplicando a média.
(VUNESP/FITO/2020) O gráfico apresenta as notas de um aluno, nas disciplinas de matemática
e química, nos três quadrimestres de 2019.
A média das notas de matemática desse aluno corresponde, da média das notas de química, a
a) 120%
b) 125%
c) 130%
d) 135%
e) 140%
Comentários:
jeffs
Destacar
A média aritmética é definida pelo quociente entre a soma dos valores de um determinado conjunto e a
quantidade de valores nele existentes. Pelos valores dados no enunciado, a média das notas de
matemática é: �̅�𝑚𝑎𝑡 = 5 + 6 + 43 �̅�𝑚𝑎𝑡 = 153 �̅�𝑚𝑎𝑡 = 5
Já a média das notas de química é: �̅�𝑞𝑢í𝑚 = 4,5 + 3,5 + 43 �̅�𝑞𝑢í𝑚 = 123 �̅�𝑞𝑢í𝑚 = 4
Com isso, em termos percentuais, a média das notas de matemática desse aluno corresponde, da média
das notas de química, a: 54 = 1,25 = 125%
Gabarito: B.
(CESPE/UNCISAL/2019) A crise mundial tem contribuído para o aumento da entrada de
estrangeiros no Brasil. A maior parte vem de países vizinhos, a exemplo do Paraguai. A tabela a
seguir apresenta, de acordo com dados do Ministério da Justiça, a quantidade de paraguaios que
vieram para o Brasil nos anos de 2009, 2011 e 2012.
Disponível em: http://reporterbrasil.org.br. Acesso em: 9 nov. 2018 (adaptado).
Se a média anual de imigrantes paraguaios para o Brasil, no período de 2009 a 2012, foi de 17
600, então, quantos paraguaios imigraram para o Brasil em 2010?
a) 13 100
b) 14 325
c) 15 000
d) 15 840
e) 17 600
Ano Paraguaios
2009 11000
2010 ?
2011 19000
2012 27300
Comentários:
A questão informa que a média anual de imigrantes paraguaios no Brasil, no período de 2009 a 2012,
foi de 17.600. Como sabemos, a média é dada pela soma dos dados dividida pelo número de observações.
Então, se considerarmos que o número de imigrantes em 2010 foi 𝑥, teremos: �̅� = 11000 + 𝑥 + 19000 + 273004 17600 = 57300 + 𝑥4 4 × 17600 = 57300 + 𝑥 70400 = 57300 + 𝑥 𝑥 = 70400 − 57300 𝑥 = 13.100
Gabarito: A.
(CESPE/PM AL/2018) Acerca de análise de dados, julgue o próximo item.
O gráfico a seguir mostra a distribuição de frequência de delitos ocorridos em determinado
bairro nos seis primeiros meses de 2018.
Nesse caso, a média dos delitos ocorridos no semestre considerado foi superior à média dos delitos
ocorridos no segundo trimestre.
Comentários:
Precisamos calcular duas médias: do segundo trimestre e do semestre inteiro.
Conforme o gráfico, para o segundo trimestre, temos:
{ 𝑎𝑏𝑟𝑖𝑙 = 30 𝑑𝑒𝑙𝑖𝑡𝑜𝑠𝑚𝑎𝑖𝑜 = 24 𝑑𝑒𝑙𝑖𝑡𝑜𝑠𝑗𝑢𝑛ℎ𝑜 = 18 𝑑𝑒𝑙𝑖𝑡𝑜𝑠
A média é dada pela soma de todos os valores dividida pelo número de meses. Logo: �̅� = 30 + 24 + 183 �̅� = 723 = 24
https://www.tecconcursos.com.br/concursos/soldado-policial-militar-pm-al-combatente-2018
Para o semestre, temos:
{ 𝑗𝑎𝑛𝑒𝑖𝑟𝑜 = 27 𝑑𝑒𝑙𝑖𝑡𝑜𝑠𝑓𝑒𝑣𝑒𝑟𝑒𝑖𝑟𝑜 = 30 𝑑𝑒𝑙𝑖𝑡𝑜𝑠𝑚𝑎𝑟ç𝑜 = 21 𝑑𝑒𝑙𝑖𝑡𝑜𝑠𝑠𝑒𝑔𝑢𝑛𝑑𝑜 𝑡𝑟𝑖𝑚𝑒𝑠𝑡𝑟𝑒 = 72 𝑑𝑒𝑙𝑖𝑡𝑜𝑠
Logo: �̅� = 27 + 30 + 21 + 726 0 �̅� = 1506 = 25
Então, podemos concluir que o número de delitos no semestre foi maior que no segundo trimestre.
Gabarito: Certo.
Propriedades da Média Aritmética
Nessa seção, vamos estudar algumas propriedades importantes sobre a média aritmética.
1ª Propriedade: Dado um conjunto com 𝒏 ≥ 𝟏 elementos, a média aritmética sempre existirá
e será única.
Desde que o conjunto tenha pelo menos um elemento, podemos afirmar que a média aritmética sempre
existe, pois sempre conseguiremos calcular o quociente entre a soma dos elementos e o número deles.
Além disso, como o somatório dos elementos resulta em um único número, o valor da média também
sempre será único.
jeffs
Destacar
2ª Propriedade: A média aritmética �̅� de um conjunto de dados satisfaz a expressão 𝒎 ≤ 𝒙 ≤𝑴, em que 𝒎 e 𝑴 são, respectivamente, os elementos que representam o valor mínimo e o
valor máximo desse conjunto. 𝒎í𝒏𝒊𝒎𝒐 ≤ �̅� ≤ 𝑴á𝒙𝒊𝒎𝒐
Essa propriedade diz respeito ao fato de a média aritmética sempre se encontrar entre os números
mínimo e máximo de um conjunto.
Para exemplificar essa propriedade, vamos tomar como base a sequência {𝑥𝑛} = {1, 2, 3, 4, 5}, com
média �̅� = 3.
Reparem que o valor mínimo desse conjunto é 1 e o máximo é 5. Portanto, a média encontrada
satisfaz a 2ª propriedade: 1 ≤ �̅� ≤ 5
Se a sequência fosse {𝑦𝑛} = {1, 2, 3, 4, 5, 6, 7, 8, 9}, teríamos como média:
�̅� = 1 + 2 + 3 + 4 + 5 + 6 + 7 + 8 + 99 = 459 = 5
Assim, o valor mínimo seria 1 e o máximo 9. Novamente a propriedade continuaria válida, pois: 1 ≤ �̅� ≤ 9
Essa propriedade sempre será válida, seja qual for a sequência escolhida.
jeffs
Destacar
Alguns alunos costumam me pedir para demonstrar as propriedades apresentadas na aula, pois
sentem mais facilidade de assimilar o conteúdo dessa maneira. Entendo, porém, que essa
informação não é relevante para a maioria. Por isso, sempre que a demonstração for um pouco mais
complexa, colocarei a dedução em uma seção “indo mais fundo!”. Vamos lá!
Se 𝑚 e 𝑀 são os valores mínimo e máximo de um conjunto, então, necessariamente, todos os
elementos desse conjunto serão maiores ou iguais a 𝑚 e menores ou iguais a 𝑀, ou seja, 𝑚 ≤ 𝑥𝑖 ≤𝑀, para 𝑖 = 1, 2, 3,⋯ , 𝑛. Assim, podemos fazer: 𝑚 ≤ 𝑥1 ≤ 𝑀 𝑚 ≤ 𝑥2 ≤ 𝑀 ⋮ 𝑚 ≤ 𝑥𝑛 ≤ 𝑀
Somando as 𝑛 inequações, obtemos: 𝑛 ×𝑚 ≤ 𝑥1 + 𝑥2 +⋯+ 𝑥𝑛 ≤ 𝑛 ×𝑀
Agora, dividindo tudo por n, temos:
𝑚 ≤ 𝑥1 + 𝑥2 +⋯+ 𝑥𝑛𝑛 ≤ 𝑀
Portanto, concluímos que a média está sempre entre os valores mínimo e máximo de um conjunto: 𝒎 ≤ �̅� ≤ 𝑴
jeffs
Destacar
3ª Propriedade: Somando-se (ou subtraindo-se) uma constante 𝒄 de todos os valores de uma
variável, a média do conjunto fica aumentada (ou diminuída) dessa constante. �̅� = �̅� + 𝒄 ou �̅� = �̅� − 𝒄
Para exemplificar essa propriedade, vamos tomar como base a sequência {𝑥𝑛} = {1, 2, 3, 4, 5}, com
média �̅� = 3.
Se adicionarmos uma constante 5 a cada um de seus números, vamos obter uma nova lista {𝑥𝑛 + 5} = {6, 7, 8, 9, 10}, cuja média é:
𝑥 + 5̅̅ ̅̅ ̅̅ ̅ = 6 + 7 + 8 + 9 + 105 = 405 = 8
Veja que, como acrescentamos 5 a cada um dos números da lista, a média também aumentou 5
unidades, de 3 foi para 8.
Vejamos como demonstrar a propriedade para a adição de uma constante. Esse mesmo raciocínio
pode ser seguido para a subtração de uma constante.
Seja {𝑥𝑛} uma sequência de números:
jeffs
Destacar
{𝑥𝑛} = {𝑥1, 𝑥2, ⋯ , 𝑥𝑛},
e �̅� a média aritmética dos termos dessa sequência:
�̅� = 𝑥1 + 𝑥2 +⋯+ 𝑥𝑛𝑛
Seja {𝑦𝑛} uma sequência de números formada pela adição de uma constante 𝑐 a cada um dos termos
de {𝑥𝑛}: {𝑦𝑛} = {𝑥𝑛 + 𝑐} = {𝑥1 + 𝑐, 𝑥2 + 𝑐,⋯ , 𝑥𝑛 + 𝑐},
e �̅� a média aritmética dos termos dessa nova sequência:
�̅� = (𝑥1 + 𝑐) + (𝑥2 + 𝑐) + ⋯+ (𝑥𝑛 + 𝑐)𝑛
�̅� = (𝑥1 + 𝑥2 +⋯+ 𝑥𝑛) + (𝑐 + 𝑐 + ⋯+ 𝑐)⏞ 𝑛 𝑡𝑒𝑟𝑚𝑜𝑠𝑛
�̅� = (𝑥1 + 𝑥2 +⋯+ 𝑥𝑛) + 𝑛 × 𝑐𝑛
�̅� = (𝑥1 + 𝑥2 +⋯+ 𝑥𝑛)𝑛 + 𝑛 × 𝑐𝑛
�̅� = (𝑥1 + 𝑥2 +⋯+ 𝑥𝑛)𝑛 + 𝑐
Portanto, ao adicionarmos uma constante 𝑐 aos elementos de um conjunto, a média do novo
conjunto foi aumentada em 𝑐: �̅� = �̅� + 𝑐
4ª Propriedade: Multiplicando-se (ou dividindo-se) uma constante c de todos os valores de
uma variável, a média do conjunto fica multiplicada (ou dividida) por esta constante. �̅� = �̅� × 𝒄 ou �̅� = �̅� ÷ 𝒄
Para exemplificar essa propriedade, vamos tomar como base a sequência {𝑥𝑛} = {1, 2, 3, 4, 5}, com
média �̅� = 3.
Se multiplicarmos cada um de seus elementos por umaconstante 5, vamos obter uma nova lista {𝑥𝑛 × 5} = {5, 10, 15, 20, 25}, cuja média é:
𝑥 × 5̅̅ ̅̅ ̅̅ ̅ = 5 + 10 + 15 + 20 + 255 = 755 = 15
Veja que, como multiplicamos cada um dos números da lista por 5, a média também foi multiplicada
por 5, aumentando de 3 para 15.
Vejamos como demonstrar a propriedade para a multiplicação por uma constante. Esse mesmo
raciocínio pode ser seguido para a divisão por uma constante.
Seja {𝑥𝑛} uma sequência de números:
jeffs
Destacar
{𝑥𝑛} = {𝑥1, 𝑥2, ⋯ , 𝑥𝑛},
e �̅� a média aritmética dos termos dessa sequência:
�̅� = 𝑥1 + 𝑥2 +⋯+ 𝑥𝑛𝑛
Seja {𝑦𝑛} uma sequência de números formada pela multiplicação de cada um dos termos de {𝑥𝑛}
por uma constante 𝑐: {𝑦𝑛} = {𝑥𝑛 × 𝑐} = {𝑥1 × 𝑐, 𝑥2 × 𝑐,⋯ , 𝑥𝑛 × 𝑐},
e �̅� a média aritmética dos termos dessa nova sequência:
�̅� = (𝑥1 × 𝑐) + (𝑥2 × 𝑐) + ⋯+ (𝑥𝑛 × 𝑐)𝑛
�̅� = (𝑥1 + 𝑥2 +⋯+ 𝑥𝑛) × 𝑐𝑛 �̅� = (𝑥1 + 𝑥2 +⋯+ 𝑥𝑛𝑛 ) × 𝑐
Portanto, ao multiplicarmos os elementos de um conjunto por uma constante 𝑐, a média do novo
conjunto também foi multiplicada por 𝑐: �̅� = �̅� × 𝑐
5ª Propriedade: A soma algébrica dos desvios em relação à média é nula. ∑(𝒙𝒊 − �̅�)𝒏𝒊=𝟏 = 𝟎
Para exemplificar essa propriedade, vamos tomar como base a sequência {𝑥𝑛} = {1, 2, 3, 4, 5, 6, 7},
com média �̅� = 4.
O desvio em relação à média é a diferença entre cada elemento da sequência e a média aritmética.
Como a sequência possui 7 elementos, teremos o mesmo número de desvios para calcular. Logo,
basta encontrarmos a diferença entre cada elemento e a média: 𝑑1 = 𝑥1 − �̅� = 1 − 4 = −3 𝑑2 = 𝑥2 − �̅� = 2 − 4 = −2 𝑑3 = 𝑥3 − �̅� = 3 − 4 = −1 𝑑4 = 𝑥4 − �̅� = 4 − 4 = 0 𝑑5 = 𝑥5 − �̅� = 5 − 4 = 1 𝑑6 = 𝑥6 − �̅� = 6 − 4 = 2 𝑑7 = 𝑥7 − �̅� = 7 − 4 = 3
Agora, somaremos todos esses desvios:
∑𝑑𝑖7𝑖=1 = 𝑑1 + 𝑑2 + 𝑑3 + 𝑑4 + 𝑑5 + 𝑑6 + 𝑑7 ∑𝑑𝑖7𝑖=1 = (−3) + (−2) + (−1) + 0 + 1 + 2 + 3 ∑𝑑𝑖7𝑖=1 = 0
jeffs
Destacar
Portanto, não importa qual a sequência de números, a soma dos desvios em relação à média é
sempre igual a zero.
Vejamos como demonstrar essa propriedade.
Seja {𝑥𝑛} uma sequência de números: {𝑥𝑛} = {𝑥1, 𝑥2, ⋯ , 𝑥𝑛},
e �̅� a média aritmética dos termos dessa sequência: �̅� = 𝑥1 + 𝑥2 +⋯+ 𝑥𝑛𝑛 ⇒ 𝑥1 + 𝑥2 +⋯+ 𝑥𝑛 = �̅� × 𝑛
A soma dos desvios em relação à média é dada por: ∑(𝑥𝑖 − �̅�)𝑛𝑖=1 =∑𝑥𝑖𝑛𝑖=1 −∑�̅�𝑛𝑖=1
A média é um valor constante para essa sequência de números, portanto, podemos tirá-la do
somatório: ∑(𝑥𝑖 − �̅�)𝑛𝑖=1 =∑𝑥𝑖𝑛𝑖=1 − �̅� ×∑1𝑛𝑖=1 ∑(𝑥𝑖 − �̅�)𝑛𝑖=1 =∑𝑥𝑖𝑛𝑖=1 − �̅� × 𝑛 ∑(𝑥𝑖 − �̅�)𝑛𝑖=1 = (𝑥1 + 𝑥2 +⋯+ 𝑥𝑛) − �̅� × 𝑛 ∑(𝑥𝑖 − �̅�)𝑛𝑖=1 = �̅� × 𝑛 − �̅� × 𝑛 ∑(𝑥𝑖 − �̅�)𝑛𝑖=1 = 0
jeffs
Destacar
6ª Propriedade: A soma dos quadrados dos desvios da sequência de números {𝒙𝒊}, em relação
a um número 𝒂, é mínima se 𝒂 for a média aritmética dos números. ∑(𝒙𝒊 − 𝒂)𝟐𝒏𝒊=𝟏 ≥∑(𝒙𝒊 − �̅�)𝟐𝒏𝒊=𝟏
Essa propriedade afirma que, caso os desvios sejam calculados com relação a um número diferente da
média, e os resultados de tais desvios sejam elevados ao quadrado e somados, teremos um número
necessariamente maior do que obteríamos caso a mesma operação fosse realizada utilizando-se a
média.
Para exemplificar essa propriedade, vamos tomar como exemplo a sequência {𝑥𝑛} ={1, 2, 3, 4, 5, 6, 7}, com média �̅� = 4. Já calculamos os desvios desses números em relação à média,
vamos relembrar: 𝑑1 = 𝑥1 − �̅� = 1 − 4 = −3 𝑑2 = 𝑥2 − �̅� = 2 − 4 = −2 𝑑3 = 𝑥3 − �̅� = 3 − 4 = −1 𝑑4 = 𝑥4 − �̅� = 4 − 4 = 0 𝑑5 = 𝑥5 − �̅� = 5 − 4 = 1 𝑑6 = 𝑥6 − �̅� = 6 − 4 = 2 𝑑7 = 𝑥7 − �̅� = 7 − 4 = 3
Na propriedade anterior, vimos que a soma dos desvios é sempre igual a zero. Agora, calcularemos
a soma dos quadrados desses desvios. Em outras palavras, vamos elevar cada um deles ao quadrado
e somar todos os resultados:
∑𝑑𝑖27𝑖=1 = 𝑑12 + 𝑑22 + 𝑑32 + 𝑑42 + 𝑑52 + 𝑑62 + 𝑑72
jeffs
Destacar
∑𝑑𝑖27𝑖=1 = (−3)2 + (−2)2 + (−1)2 + 02 + 12 + 22 + 32 ∑𝑑𝑖27𝑖=1 = 9 + 4 + 1 + 0 + 1 + 4 + 9 ∑𝑑𝑖27𝑖=1 = 28
A propriedade nos garante que, para essa sequência numérica, o valor 28 é o menor valor possível.
Isto é, se encontrarmos os desvios em relação a outro número (diferente da média) e, em seguida,
calcularmos a soma dos quadrados dos desvios, o valor obtido será maior que 28.
Vamos ver o que acontece ao calcularmos o desvio em relação ao número 6: 𝑑1 = 𝑥1 − �̅� = 1 − 6 = −5 𝑑2 = 𝑥2 − �̅� = 2 − 6 = −4 𝑑3 = 𝑥3 − �̅� = 3 − 6 = −3 𝑑4 = 𝑥4 − �̅� = 4 − 6 = −2 𝑑5 = 𝑥5 − �̅� = 5 − 6 = −1 𝑑6 = 𝑥6 − �̅� = 6 − 6 = 0 𝑑7 = 𝑥7 − �̅� = 7 − 6 = 1
Agora, calcularemos a soma dos quadrados desses números:
∑𝑑𝑖27𝑖=1 = (−5)2 + (−4)2 + (−3)2 + (−2)2 + (−1)2 + 02 + 12 ∑𝑑𝑖27𝑖=1 = 25 + 16 + 9 + 4 + 1 + 0 + 1 = 56
Como esperávamos, o resultado foi maior do que 28.
Vejamos como demonstrar essa propriedade.
Seja {𝑥𝑛} uma sequência de números: {𝑥𝑛} = {𝑥1, 𝑥2, ⋯ , 𝑥𝑛},
e �̅� a média aritmética dos termos dessa sequência: �̅� = 𝑥1 + 𝑥2 +⋯+ 𝑥𝑛𝑛 ⇒ 𝑥1 + 𝑥2 +⋯+ 𝑥𝑛 = �̅� × 𝑛
A soma dos quadrados dos desvios em relação a um número 𝒂 é dada por:
∑(𝑥𝑖 − 𝑎)2𝑛𝑖=1 =∑[(𝑥𝑖 − �̅�) + (�̅� − 𝑎)]2𝑛𝑖=1 ∑(𝑥𝑖 − 𝑎)2𝑛𝑖=1 =∑(𝑥𝑖 − �̅�)2𝑛𝑖=1 +∑[2 × (𝑥𝑖 − �̅�) × (�̅� − 𝑎)]𝑛𝑖=1 +∑(�̅� − 𝑎)2𝑛𝑖=1
O valor de (�̅� − 𝒂) é uma constante, portanto, podemos simplificar essa expressão:
∑(𝑥𝑖 − 𝑎)2𝑛𝑖=1 =∑(𝑥𝑖 − �̅�)2𝑛𝑖=1 + 2 × (�̅� − 𝑎) ×∑(𝑥𝑖 − �̅�)𝑛𝑖=1 + (�̅� − 𝑎)2∑1𝑛𝑖=1
Pela propriedade anterior, sabemos que o somatório dos desvios em relação à média é zero, logo:
∑(𝑥𝑖 − 𝑎)2𝑛𝑖=1 =∑(𝑥𝑖 − �̅�)2𝑛𝑖=1 + 2 × (�̅� − 𝑎) × 0 + (�̅� − 𝑎)2∑1𝑛𝑖=1 ∑(𝑥𝑖 − 𝑎)2𝑛𝑖=1 =∑(𝑥𝑖 − �̅�)2𝑛𝑖=1 + 𝑛 × (�̅� − 𝑎)2
Para que o valor da soma seja mínimo, é necessário que (�̅� − 𝒂)𝟐 = 𝟎. Para qualquer valor diferente
disso, teremos um valor maior que o mínimo. Logo, para que a soma dos quadrados tenha valor
mínimo, obrigatoriamente, teremos 𝑎 = �̅�.
MÉDIA PONDERADA
Muitas vezes, certos elementos de um conjunto de dados possuem relevância maior que os demais.
Nessa situação, para calcular a média de tais conjuntos, devemos encontrar uma média ponderada. Uma
média ponderada é a média de um conjunto de dados cujos valores possuem pesos variados.
Ela é calculada pela igualdade a seguir, em que 𝑝 é o peso de cada valor de 𝑥:
�̅� = ∑ (𝒙𝒊 × 𝒑𝒊)𝒏𝒊=𝟏∑ 𝒑𝒊𝒏𝒊=𝟏
Observe que no numerador cada valor será multiplicado pelo seu respectivo peso, enquanto no
denominador teremos a soma de todos os pesos.
Suponha que um candidato tenha prestado um concurso público para o cargo de Auditor Fiscal,
alcançando as seguintes notas:
Disciplina Nota (𝒙𝒊)
Língua Portuguesa 4,0
Direito
Administrativo
4,0
Direito
Constitucional
4,0
Direito Tributário 7,0
Legislação Tributária 7,0
Contabilidade 8,0
Auditoria 8,0
PORTUGUÊS MATEMÁTICA
jeffs
Destacar
jeffs
Destacar
jeffs
Destacar
jeffs
Destacar
Considere, também, que o edital desse concurso previa que algumas disciplinas teriam importância
maior do que outras, por isso foram atribuídos pesos diferentes às várias disciplinas. Digamos que os
pesos tenham sido distribuídos da seguinte forma:
Disciplina Peso (𝒑𝒊)
Língua Portuguesa 1
Direito
Administrativo
2
Direito
Constitucional
2
Direito Tributário 3
Legislação Tributária 3
Contabilidade 3
Auditoria 3
Agora, admita que o candidato deveria alcançar uma nota 7,0 ou superior na prova objetiva para que
fosse convocado para a etapa discursiva. Se você fosse um dos avaliadores desse concurso, você
consideraria o candidato aprovado na prova objetiva?
Para responder a esse questionamento, devemos calcular a média aritmética ponderada desse
candidato, levando em consideração os pesos de cada disciplina. Dessa forma, devemos multiplicar cada
nota pelo seu respectivo peso, somar esses produtos e dividir pela soma dos pesos.
DisciplinaNota (𝒙𝒊) Peso (𝒑𝒊) 𝒙𝒊 × 𝒑𝒊
Língua Portuguesa 4,0 1 4,0 x 1 = 4,0
Direito
Administrativo
4,0 2 4,0 x 2 = 8,0
Direito
Constitucional
4,0 2 4,0 x 2 = 8,0
Direito Tributário 6,0 3 6,0 x 3 = 18,0
Legislação Tributária 6,0 3 6,0 x 3 = 18,0
Contabilidade 7,0 3 7,0 x 3 = 21,0
Auditoria 7,0 3 7,0 x 3 = 21,0
Nesse ponto, temos uma lista contendo todos os produtos de notas e pesos. Então, a média aritmética
ponderada é dada por:
�̅� = 𝑥1 × 𝑝1 + 𝑥2 × 𝑝2 + ⋯ + 𝑥𝑛 × 𝑝𝑛𝑝1 + 𝑝2 + ⋯ + 𝑝𝑛
�̅� = 4,0 + 8,0 + 8,0 + 18,0 + 18,0 + 21,0 + 21,01 + 2 + 2 + 3 + 3 + 3 + 3 = 9815 ≅ 6,53
Veja que, com essas notas, o candidato não seria convocado para a etapa discursiva.
(VUNESP/AVAREPREV/2020) Uma loja trabalha com produtos que são classificados em apenas
três tipos. Na tabela, constam os preços de venda de cada tipo do produto:
A média ponderada pode ser calculada por
meio das seguintes etapas:
Multiplicamos os valores por seus respectivos
pesos.
Somamos as operações de multiplicação da
etapa anterior e guardamos o resultado.
Dividimos o resultado pela soma dos pesos.
Tipo do
produto
Preço unitário de
venda
A R$ 10,00
B R$ 12,00
C R$ 15,00
jeffs
Destacar
No último dia útil de funcionamento, foram vendidos produtos dos três tipos, sendo que, do total
de unidades vendidas,
𝟏𝟒 foi de produtos do tipo A, 𝟐𝟓 foi de produtos do tipo B, e o restante, de
produtos do tipo C. Naquele dia, o preço médio unitário de venda dos produtos vendidos foi de
a) R$ 11,95.
b) R$ 12,30.
c) R$ 12,55.
d) R$ 13,50.
e) R$ 13,95.
Comentários:
Segundo o enunciado, temos que:
• total de produtos do tipo A vendidos: 14 = 25%;
• total de produtos do tipo B vendidos: 25 = 40%;
• total de produtos do tipo C vendidos: 100% − 25% − 40% = 35%.
Portanto, o preço médio unitário de venda será definido como uma média ponderada, em que os pesos
serão as porcentagens acima. Nesse sentido, devemos lembrar que a média ponderada é o somatório
dos produtos de cada valor por seu respectivo peso, dividido pela soma dos pesos.
Logo, �̅� = 10 × 25% + 12 × 40% + 15 × 35%25% + 40% + 35% �̅� = 10 × 25% + 12 × 40% + 15 × 35%100% �̅� = 10 × 0,25 + 12 × 0,40 + 15 × 0,35 �̅� = 2,5 + 4,8 + 5,25 �̅� = 𝑅$ 12,55
Gabarito: C.
(CESPE/Pref. São Cristóvão/2019) A tabela seguinte mostra a distribuição das idades dos 30
alunos da turma A do quinto ano de uma escola de ensino fundamental.
A partir dessa tabela, julgue o item.
Se, em outra turma B, as frequências das idades fossem respectivamente iguais ao dobro das frequências
da turma A, então a média aritmética das idades da turma B seria igual ao dobro da média da turma A.
Idade (em anos) 9 10 11 12 13 14
Quantidade de
estudantes
6 22 0 1 0 1
Comentários:
A média das idades da turma A é uma média ponderada, em que os pesos são representados pelas
quantidades de alunos. Assim, a média resulta da divisão entre o somatório dos produtos de idades e
quantidades de estudantes e o total de estudantes: �̅� = 9 × 6 + 10 × 22 + 11 × 0 + 12 × 1 + 13 × 0 + 14 × 16 + 22 + 0 + 1 + 0 + 1 �̅� = 30030 �̅� = 10
Na turma B, teremos que duplicar as frequências. Dessa forma, a média da turma B será dada por: �̅� = 9 × 12 + 10 × 44 + 11 × 0 + 12 × 1 + 13 × 0 + 14 × 212 + 44 + 0 + 2 + 0 + 2 �̅� = 60060 �̅� = 10
Com isso, percebemos que a média não mudará o seu valor.
Gabarito: Errado.
(CESPE/IFF/2018) No registro das quantidades de filhos de 200 casais, verificaram-se os valores
mostrados na tabela seguinte.
Nesse caso, a quantidade média de filhos para esse grupo de casais é igual a
a) 0.
b) 1.
c) 2.
d) 2,5.
e) 3.
Comentários:
A quantidade média de filhos é uma média ponderada, em que os pesos são representados pelas
quantidades de casais. Portanto, a média é resultado da divisão entre o somatório dos produtos de
quantidades de filhos e quantidades de casais, dividido pelo total de casais:
Quantidade de filhos 1 2 0 3 4 5 6
Quantidade de casais 50 40 40 30 25 10 5
�̅� = 1 × 50 + 2 × 40 + 0 × 40 + 3 × 30 + 4 × 25 + 5 × 10 + 6 × 5200 �̅� = 50 + 80 + 90 + 100 + 50 + 30200 �̅� = 400200 �̅� = 2
Gabarito: C.
MÉDIA PARA DADOS AGRUPADOS
Em estatística, os dados podem ser definidos como informações que representam os atributos
qualitativos ou quantitativos de uma variável ou de um conjunto de variáveis. Esses dados podem ser
classificados em agrupados e não-agrupados. Normalmente, logo após a etapa de coleta, temos dados
não-agrupados ou dados brutos.
Por exemplo, suponha que o Estratégia Concursos esteja realizando um experimento com um grupo de
dez alunos, para mensurar o tempo médio de resposta a uma questão de estatística. Logo após a coleta,
os dados ainda estão brutos, pois não passaram por nenhuma análise nem foram agrupados de alguma
forma. Então, teríamos uma tabela similar a seguinte:
Aluno 1 2 3 4 5 6 7 8 9 10
Tempo médio
(em min)
1 3 5 7 9 6 6 5 3 9
Por sua vez, os dados agrupados são aqueles que passaram por algum nível de análise, o que significa
que já não são brutos. Os dados agrupados podem ser organizados por frequência de um
determinado valor ou por intervalos de classes. Quando por frequência de valor, os dados são
organizados de forma ascendente e suas ocorrências são contabilizadas:
Tempo médio (𝑿𝒊) Frequência (𝒇𝒊)
1 1
3 2
5 2
6 2
7 1
9 2
Quando por intervalos de classes, os dados também são organizados de forma ascendente, porém, em
classes preestabelecidas, e as ocorrências de cada classe são contabilizadas:
Tempo médio (𝑿𝒊) Frequência (𝒇𝒊) 𝟎 ≤ 𝒙 < 𝟐 1 𝟐 ≤ 𝒙 < 𝟒 2
jeffs
Destacar
jeffs
Destacar
𝟒 ≤ 𝒙 < 𝟔 2 𝟔 ≤ 𝒙 < 𝟖 3 𝟖 ≤ 𝒙 < 𝟏𝟎 2
Para dados agrupados e apresentados como diagramas ou tabelas, a definição da média permanece
inalterada, então, tudo o que estudamos até o momento permanece válido, mas teremos métodos
específicos para obtenção da média. A seguir, veremos como proceder em cada caso.
Média para Dados Agrupados por Valor
Dando continuidade ao nosso exemplo, vamos a calcular a média aritmética de dados que estão
agrupados por valor. Os dados foram organizados na tabela a seguir:
Tempo médio (𝑿𝒊) Frequência (𝒇𝒊)
1 1
3 2
5 2
6 2
7 1
9 2
Como podemos interpretar essa tabela? Basta você saber que as frequências refletem o número de
repetições de cada valor da nossa variável tempo médio. Isto é, um aluno conseguiu responder à questão
em 1 minuto, dois alunos conseguiram em 3 minutos, dois alunos conseguiram em 5 minutos, e assim
sucessivamente.
Para calcularmos a média a partir de uma tabela de frequências como esta, devemos utilizar a seguinte
fórmula:
�̅� = ∑ (𝑿𝒊 × 𝒇𝒊)𝒏𝒊=𝟏∑ 𝒇𝒊𝒏𝒊=𝟏
A aplicação dessa fórmula é bem simples. O raciocínio é exatamente o mesmo adotado para a média
ponderada, sendo que, agora, o peso é representado pela frequência. Desse modo, vamos multiplicar
cada valor por sua respectiva frequência, somar tudo e dividir pela soma das frequências:
jeffs
Destacar
Tempo médio (𝑿𝒊) Frequência (𝒇𝒊) 𝑿𝒊 × 𝒇𝒊
1 1 1 x 1 = 1
3 2 3 x 2 = 6
5 2 5 x 2 = 10
6 2 6 x 2 = 12
7 1 7 x 1 = 7
9 2 9 x 2 = 18
Após isso, somaremos todos os valores da coluna 𝑋𝑖 × 𝑓𝑖, obtendo o termo ∑ (𝑋𝑖 × 𝑓𝑖)𝑛𝑖=1 , e também
somaremos os termos da coluna 𝑓𝑖 , obtendo o termo ∑ 𝑓𝑖𝑛𝑖=1 . Veja a última linha da tabela:
Tempo médio (𝑿𝒊) Frequência (𝒇𝒊) 𝑿𝒊 × 𝒇𝒊
1 1 1 x 1 = 1
3 2 3 x 2 = 6
5 2 5 x 2 = 10
6 2 6 x 2 = 12
7 1 7 x 1 = 7
9 2 9 x 2 = 18
Total 10 54
Agora, basta dividirmos um valor pelo outro, obtendo:
�̅� = ∑ (𝑋𝑖 × 𝑓𝑖)𝑛𝑖=1∑ 𝑓𝑖𝑛𝑖=1 = 5410 = 5,4
Portanto, a média dos dados apresentados na tabela é 5,4.
(VUNESP/Pref. Cananéia/2020) Na tabela, identificam-se informações sobre as notas tiradas por
30 alunos, em uma prova cujas notas variaram de 0,0 a 5,0.
Sabendo que o número de alunosque tirou nota 4,0 foi o dobro do número de alunos que tirou
nota 5,0, a média aritmética simples das notas dessa prova foi maior que
a) 3,0 e menor ou igual a 3,1.
b) 3,1 e menor ou igual a 3,2.
c) 3,2 e menor ou igual a 3,3.
d) 3,3 e menor ou igual a 3,4.
e) 3,4 e menor ou igual a 3,5.
Comentários:
Seja 𝑥 a quantidade de alunos que tirou nota 5,0 e 2𝑥 a quantidade de alunos tirou nota igual a 4,0.
Sabemos que o total de alunos é igual a 30. Portanto, temos: 1 + 3 + 4 + 7 + 2𝑥 + 𝑥 = 30 15 + 3𝑥 = 30 3𝑥 = 15 𝑥 = 5 𝑎𝑙𝑢𝑛𝑜𝑠.
Agora, com base nos valores apresentados na tabela, temos que a média das notas é dado por �̅� =0 × 1 + 1 × 3 + 2 × 4 + 3 × 7 + 4 × 2𝑥 + 5 × 𝑥1 + 3 + 4 + 7 + 2𝑥 + 𝑥
Nota
Quantidade
de Alunos
0,0 1
1,0 3
2,0 4
3,0 7
4,0 ?
5,0 ?
�̅� =0 × 1 + 1 × 3 + 2 × 4 + 3 × 7 + 4 × 10 + 5 × 51 + 3 + 4 + 7 + 10 + 5 �̅� =3 + 8 + 21 + 40 + 2530 �̅� =9730 �̅� ≅ 3,23
Gabarito: C.
(VUNESP/IPSM-SJC/2018) A tabela mostra grupos de funcionários de uma empresa e os
respectivos salários individuais dos componentes de cada grupo.
A diferença de salário de cada funcionário do grupo A e a média aritmética ponderada de todos
os salários é de aproximadamente
a) 15%
b) 18%
c) 22%
d) 25%
e) 27%
Comentários:
Primeiro, vamos calcular a média aritmética de todos os salários:
DISTRIBUIÇÃO SALARIAL POR GRUPO
GRUPO
NÚMERO DE
FUNCIONÁRIOS
SALÁRIO (R$)
A 8 800,00
B 10 1.100,00
C 12 1.200,00
https://www.tecconcursos.com.br/concursos/analista-de-gestao-municipal-ipsm-sjc-contabilidade-2018
A média é dada pela divisão entre os dois totais: �̅� = 31.80030 = 3.1803 = 1.060
No grupo A, cada funcionário tem salário de R$ 800,00. Portanto, a diferença para a média é: 1.060 − 800 = 260
Para determinar a diferença percentual, basta dividirmos esse valor pela média: 2601.060 ≅ 24,52%
Gabarito: D.
(CESPE/FUB/2016) Em um almoxarifado há, em estoque, 100 caixas na forma de
paralelepípedos retângulos. Na tabela a seguir são mostrados alguns valores da frequência
absoluta, da frequência relativa e da porcentagem da variável, volume interno da caixa, em litros
(L).
Considerando essas informações, julgue o seguinte item.
A média aritmética dos volumes dessas caixas é igual a 40 L.
Comentários:
Nessa questão, teremos que calcular a frequência relativa e completar a tabela apresentada. Assim,
temos que a frequência relativa é dada pela divisão entre a frequência absoluta e o total de elementos.
Iniciaremos completando a tabela pelas linhas que já possuem informações de frequência e
porcentagem.
Volume da
caixa (L)
Frequência absoluta Frequência relativa Porcentagem (%)
10 10 * *
20 * * *
45 * 0,2 *
60 * * 40
Total 100 1 100
https://www.tecconcursos.com.br/concursos/assistente-fub-administracao-2016
Na primeira linha (Vol. = 10 litros), temos que a frequência absoluta é igual a 10. Como a frequência
absoluta total é 100, podemos usar regra de três simples para encontrar a porcentagem (%) e a
frequência relativa: 𝑓𝑎𝑏𝑠 – % 10 – 𝑥 100 − 100
Assim, temos que: 𝑥 = 100 × 10100 = 10%
Logo, a porcentagem é 10% e a frequência relativa é 0,1.
Na terceira linha (Vol = 45 litros), temos que a frequência relativa é igual a 0,2. Como a frequência
relativa total é 1, podemos usar regra de três simples para encontrar a frequência absoluta: 𝑓𝑎𝑏𝑠 – 𝑓𝑟𝑒𝑙 𝑦 – 0,2 100 − 1,0
Dessa forma, descobrimos que: 𝑦 = 100 × 0,21,0 = 20
Portanto, a frequência absoluta é 20.
O mesmo raciocínio deve ser seguido para a quarta linha da tabela, restando, portanto, apenas a segunda
linha. Essa linha será descoberta pelo confronto com a linha totalizadora. Assim, após descobrirmos os
valores de todas as células, teremos a seguinte tabela:
Calculando a média:
Volume da
caixa (L)
Frequência absoluta Frequência relativa Porcentagem (%)
10 10 0,1 10
20 30 0,3 30
45 20 0,2 20
60 40 0,4 40
Total 100 1 100
�̅� = 10 × 10 + 20 × 30 + 45 × 20 + 60 × 40100 �̅� = 100 + 600 + 900 + 2.400100 �̅� = 4.000100 �̅� = 40
Gabarito: Certo.
(CESPE/PRF/2012)
A tabela acima mostra a distribuição da quantidade Q de pessoas transportadas, incluindo o
condutor, por veículo de passeio circulando em determinado município, obtida como resultado
de uma pesquisa feita nesse município para se avaliar o sistema de transporte local. Nessa
tabela, P representa a porcentagem dos veículos de passeio circulando no município que
transportam Q pessoas, para Q = 1, ..., 5. Com base nessas informações, julgue o seguinte item.
Em média, cada veículo de passeio que circula no referido município transporta duas pessoas. Portanto,
se, em determinado momento, houver 10 mil veículos circulando nesse município, a quantidade
esperada de pessoas que estão sendo transportadas por todos esses veículos, incluindo-se os
condutores, será igual a 20 mil.
Comentários:
Inicialmente, precisamos verificar se a média realmente vale 2. Para isso, basta multiplicarmos a
quantidade de pessoas por suas respectivas frequências. Assim, temos: 1 × 0,5 = 0,5 2 × 0,2 = 0,4 3 × 0,15 = 0,45 4 × 0,1 = 0,4 5 × 0,05 = 0,25
Q P (%)
1 50
2 20
3 15
4 10
5 5
Somando todos os resultados: 0,5 + 0,4 + 0,45 + 0,4 + 0,250,5 + 0,2 + 0,15 + 0,1 + 0,05 = 2
Portanto, a média realmente vale 2.
Assim, basta multiplicarmos a média por 10.000: 2 × 10.000 = 20.000 𝑝𝑒𝑠𝑠𝑜𝑎𝑠
Gabarito: Certo.
Média para Dados Agrupados por Classe
Retomando nosso exemplo, vamos calcular a média aritmética de dados que estão agrupados por classe.
Os dados foram organizados na tabela a seguir:
Tempo médio (𝑿𝒊) Frequência (𝒇𝒊) 𝟎 ≤ 𝒙 < 𝟐 1 𝟐 ≤ 𝒙 < 𝟒 2 𝟒 ≤ 𝒙 < 𝟔 2 𝟔 ≤ 𝒙 < 𝟖 3 𝟖 ≤ 𝒙 < 𝟏𝟎 2
Como podemos interpretar essa tabela? Basta sabermos que as frequências refletem o número de
ocorrências em cada um dos intervalos definidos para a variável tempo médio. Isto é, um aluno
respondeu à questão com tempo médio abaixo de 2 minutos, dois responderam com tempo médio entre
2 e 4 minutos, dois com tempo médio entre 4 e 6 minutos, e assim sucessivamente.
Ao agruparmos os dados em classes, precisaremos fazer uma modificação em relação ao cálculo
anterior: substituir os intervalos pelos seus respectivos pontos médios. Como assim? Ao invés de
considerarmos o intervalo de 0 a 2 minutos, por exemplo, substituiremos pelo valor de 1 minuto.
Em nosso exemplo, a identificação dos pontos médios é relativamente fácil. Mas é possível que você
encontre situações em que isso não seja tão trivial. Como fazer nesses casos? Devemos calcular a média
dos dois extremos do intervalo. Assim, o ponto médio (𝑷𝑴) é calculado pela seguinte expressão:
𝑷𝑴 = 𝒍𝒊𝒏𝒇 + 𝒍𝒔𝒖𝒑𝟐
jeffs
Destacar
jeffs
Destacar
em que 𝑙𝑖𝑛𝑓 e 𝑙𝑠𝑢𝑝 são, respectivamente, os limites inferior e superior do intervalo considerado.
Na tabela abaixo, repare que foi incluída uma nova coluna para o cálculo dos pontos médios:
Tempo médio (𝑿𝒊) Ponto Médio (𝑷𝑴𝒊) Frequência (𝒇𝒊) 𝟎 ≤ 𝒙 < 𝟐 (0 + 2) 2⁄ = 1 1 𝟐 ≤ 𝒙 < 𝟒 (2 + 4) 2⁄ = 3 2 𝟒 ≤ 𝒙 < 𝟔 (4 + 6) 2⁄ = 5 2 𝟔 ≤ 𝒙 < 𝟖 (6 + 8) 2⁄ = 7 3 𝟖 ≤ 𝒙 < 𝟏𝟎 (8 + 10) 2⁄ = 9 2
O próximo passo consiste em calcular os valores das multiplicações 𝑃𝑀𝑖 × 𝑓𝑖 , multiplicando essas duas
colunas. Vamos ver:
Tempo médio (𝑿𝒊) Ponto Médio (𝑷𝑴𝒊) Frequência (𝒇𝒊) 𝑷𝑴𝒊 × 𝒇𝒊 𝟎 ≤ 𝒙 < 𝟐 1 1 1 x 1 = 1 𝟐 ≤ 𝒙 < 𝟒 3 2 3 x 2 = 6 𝟒 ≤ 𝒙 < 𝟔 5 2 5 x 2 = 10 𝟔 ≤ 𝒙 < 𝟖 7 3 7 x 3 = 21 𝟖 ≤ 𝒙 < 𝟏𝟎 9 2 9 x 2 = 18
Após isso, somaremos todos os valores da coluna 𝑃𝑀𝑖 × 𝑓𝑖, obtendo o termo ∑ (𝑃𝑀𝑖 × 𝑓𝑖)𝑛𝑖=1 , e também
somaremos os termos da coluna 𝑓𝑖 , obtendo o termo ∑ 𝑓𝑖𝑛𝑖=1 . Veja a última linha da tabela:
Tempo médio (𝑿𝒊) Ponto Médio (𝑷𝑴𝒊) Frequência (𝒇𝒊) 𝑷𝑴𝒊 × 𝒇𝒊 𝟎 ≤ 𝒙 < 𝟐 1 1 1 x 1 = 1 𝟐 ≤ 𝒙 < 𝟒 3 2 3 x 2 = 6 𝟒 ≤ 𝒙 < 𝟔 5 2 5 x 2 = 10 𝟔 ≤ 𝒙 < 𝟖 7 3 7 x 3 = 21 𝟖 ≤ 𝒙 < 𝟏𝟎 9 29 x 2 = 18
Total 10 56
jeffs
Destacar
jeffs
Destacar
jeffs
Destacar
Agora, basta dividirmos um valor pelo outro, obtendo:
�̅� = ∑ (𝑃𝑀𝑖 × 𝑓𝑖)𝑛𝑖=1∑ 𝑓𝑖𝑛𝑖=1 = 5610 = 5,6
Finalmente, repare que a média de dados agrupados por classe (5,6) foi diferente da média de dados
agrupados por valor (5,4). Por que isso ocorreu? Isso ocorreu porque, ao agruparmos os valores da
variável em classes, perdemos detalhes que eram relevantes para o cálculo exato da média, embora a
forma de apresentação tenha sido simplificada.
(CSEP/IFPI/2019) Na tabela abaixo, estão relacionadas as durações das chamadas telefônicas
feitas em um dia, em uma empresa.
Assim, a duração média das chamadas telefônicas é mais próxima de
a) 6 min e 14 seg.
b) 7 min e 14 seg.
c) 7 min e 23 seg.
d) 7 min e 32 seg.
e) 8 min e 23 seg.
Duração (em minutos) Frequência (𝒇𝒊)
0 ⊢ 2 90
2 ⊢ 6 55
6 ⊢ 10 35
10 ⊢ 15 20
15 ⊢ 20 12
20 ⊢ 30 17
30 ⊢ 40 5
40 ⊢ 60 1
Total 235
Comentários:
Para dados agrupados em classes, a média aritmética é calculada a partir da média dos pontos centrais
de cada classe. Vejamos:
A média é dada pela divisão entre os dois totais: �̅� = 1700235 ≅ 7,23 𝑚𝑖𝑛
Transformando 0,23 minutos em segundos: 0,23 × 60𝑠𝑒𝑔 = 13,8𝑠𝑒𝑔
Portanto, a média em segundos é: �̅� = 7𝑚𝑖𝑛14𝑠𝑒𝑔
Gabarito: D.
Duração (em minutos) Ponto Médio (𝑷𝑴𝒊) Frequência (𝒇𝒊) 𝑷𝑴𝒊 × 𝒇𝒊
0 ⊢ 2 0 + 2
2
= 1 90 1 × 90 = 90
2 ⊢ 6 2 + 6
2
= 4 55 4 × 55 = 220
6 ⊢ 10 6 + 10
2
= 8 35 8 × 35 = 280
10 ⊢ 15 10 + 15
2
= 12,5 20 12,5 × 20 = 250
15 ⊢ 20 15 + 20
2
= 17,5 12 17,5 × 12 = 210
20 ⊢ 30 20 + 30
2
= 25 17 25 × 17 = 425
30 ⊢ 40 30 + 40
2
= 35 5 35 × 5 = 175
40 ⊢ 60 40 + 60
2
= 50 1 50 × 1 = 50
Total 235 1700
(CESPE/DEPEN/2015)
Felipe M. Monteiro, Gabriela R. Cardoso e Rafael da Silva. A seletividade do sistema prisional brasileiro e as políticas de segurança pública.
In: XV Congresso Brasileiro de Sociologia, 26 a 29 de julho de 2011. Curitiba (PR). Grupo de Trabalhos - Violência e Sociedade (com
adaptações).
A tabela precedente apresenta a distribuição percentual de presos no Brasil por faixa etária em
2010, segundo levantamento feito por Monteiro et al. (2011), indicando que a população
prisional brasileira nesse ano era predominantemente jovem. Com base nos dados dessa tabela,
julgue os itens a seguir.
A maior parte da população prisional brasileira em 2010 era formada por pessoas com idades inferiores
a 30 anos. Porém, a média da distribuição das idades dos presos no Brasil nesse ano foi superior a 30
anos.
Comentários:
A tabela nos permite concluir que a primeira parte do item está correta, pois há 30% + 25% = 55% de
pessoas com idades inferiores a 30 anos. Agora, para terminarmos de analisar o item, teremos que
calcular a média.
Como os dados estão agrupados em classe, devemos calcular o ponto médio de cada uma das classes:
Portanto, a média é:
Idade (𝒙) Percentual
18 ≤ 𝑥 < 25 30%
25 ≤ 𝑥 < 30 25%
30 ≤ 𝑥 < 35 20%
35 ≤ 𝑥 < 45 15%
45 ≤ 𝑥 < 60 10%
Total 100%
Idade (x) Percentual (𝒇𝒊) Ponto Médio (𝑷𝑴𝒊) 𝑷𝑴𝒊 × 𝒇𝒊 𝟏𝟖 ≤ 𝒙 < 𝟐𝟓 30% = 0,30 21,5 6,450 𝟐𝟓 ≤ 𝒙 < 𝟑𝟎 25% = 0,25 27,5 6,875 𝟑𝟎 ≤ 𝒙 < 𝟑𝟓 20% = 0,20 32,5 6,500 𝟑𝟓 ≤ 𝒙 < 𝟒𝟓 15% = 0,15 40,0 6,000 𝟒𝟓 ≤ 𝒙 < 𝟔𝟎 10% = 0,10 52,5 5,250
100% = 1,00 31,075
�̅� = ∑(𝑃𝑀𝑖 × 𝑓𝑖)∑ 𝑓𝑖 = 31,0751 = 31,075
Gabarito: Certo.
(CESPE/STF/2013)
Com referência à figura acima, que mostra a distribuição da renda mensal — x, em quantidades
de salários mínimos (sm) — das pessoas que residem em determinada região, julgue o item
subsequente.
Considerando a forma de cálculo para dados agrupados, a distribuição da renda mensal x possui média
igual a 9,75 sm.
Comentários:
A questão requer o cálculo da média de dados agrupados. Para achar a média precisamos, inicialmente,
determinar o ponto médio de cada classe. Teremos:
• de 5 a 10 ponto médio = 7,5;
• de 10 a 15 ponto médio = 12,5;
• de 15 a 20 ponto médio = 17,5.
Agora, a média da amostra é dada pela média ponderada dos pontos médios multiplicados por suas
respectivas frequências. �̅� = 7,5 × 65% + 12,5 × 25% + 17,5 × 10%65% + 25% + 10% �̅� = 4,875 + 3,125 + 1,751,00 �̅� = 9,75
Gabarito: Certo.
https://www.tecconcursos.com.br/concursos/analista-judiciario-stf-apoio-especializado-estatistica-2013
MÉDIA GEOMÉTRICA
A média geométrica é uma medida estatística muito utilizada em situações de acumulação de
percentuais, fato muito comum em problemas financeiros. Também é encontrada na geometria plana,
quando, por exemplo, devemos fazer com que a área de um quadrado seja igual à área de um retângulo.
Essa medida é definida, para o conjunto de números positivos, como a raiz 𝒏-ésima do produto
de 𝒏 elementos de um conjunto de dados. A propriedade principal dessa média é preservar o
produto dos elementos de um conjunto de dados.
O raciocínio para encontrarmos a fórmula da média geométrica é análogo ao adotado para a média
aritmética. Dada uma lista de 𝑛 números, {𝑥1, 𝑥2, ⋯ , 𝑥𝑛}, o produto de seus termos é igual a: 𝑥1 × 𝑥2 ×⋯× 𝑥𝑛.⏟ 𝑛 𝑓𝑎𝑡𝑜𝑟𝑒𝑠
A média geométrica dessa lista é um número 𝐺, tal que, se todos os elementos forem substituídos por 𝐺, o produto da lista permanecerá preservado. Assim, substituindo todos os elementos por 𝐺, teremos
uma nova lista, {𝐺, 𝐺,⋯ , 𝐺}, cujo produto é: 𝐺 × 𝐺 ×⋯× 𝐺⏟ 𝑛 𝑓𝑎𝑡𝑜𝑟𝑒𝑠 = 𝐺𝑛
Como os produtos das duas listas são iguais, temos: 𝐺𝑛 = 𝑥1 × 𝑥2 ×⋯× 𝑥𝑛
Portanto, temos que: 𝑮 = √𝒙𝟏 × 𝒙𝟐 ×⋯× 𝒙𝒏𝒏
Repare que a raiz varia de acordo com a quantidade de elementos da lista de números, isto é, se a lista
contém dois números, teremos uma raiz quadrada; se a lista contém três números, teremos uma raiz
cúbica.
jeffs
Destacar
jeffs
Destacar
jeffs
Destacar
jeffs
Destacar
jeffs
Destacar
Vejamos um exemplo numérico: qual a média geométrica dos números 4, 20 e 100?
Para responder a essa questão, primeiro, calcularemos o produto dos três números e, em seguida,
a raiz cúbica dele: 𝐺 = √4 × 20 × 1003 = √80003 = 20
Extrair a raiz cúbica de um número, contudo, nem sempre é tão trivial. Na hora da prova, é mais fácil
adotarmos o processo de fatoração:
421 | 22
201051 |
225
100502551 ||
2255
Vocês lembram como fazemos para fatorar um número? Primeiro, dividimos esse número pelo seu
menor divisor primo (2, 3, 5, 7, 11, 13,⋯ ). Em seguida, dividimos o quociente obtido pelo seu
menor divisor primo. Depois, fazemos isso de forma sucessiva até obtermos o valor 1.
Por meio da fatoração, concluímos que: 4 = 2 × 2 = 22 20 = 2 × 2 × 5 = 22 × 51 100 = 2 × 2 × 5 × 5 = 22 × 52
Levando essa informação para a fórmula da média geométrica, temos que: 𝐺 = √4 × 20 × 1003 𝐺 = √(22) × (22 × 51) × (22 × 52)3
E agora? Vocês lembram como fazemos multiplicação de potências de mesma base? Sim, é isso
mesmo, repetiremos as bases e somaremos os expoentes. Assim, 22 × 22 × 22 = 26 e 51 × 52 =53. Portanto, ficaremos com:
𝐺 = √26 × 533
Agora, por ser uma raiz cúbica, devemos dividir cada um dos expoentes por 3: 𝐺 = 26 3⁄ × 53 3⁄ 𝐺 = 22 × 51 = 4 × 5 = 20
Portanto, 20 é o valor da média geométrica dos números 4, 20 e 100.
Reparem que o produto dos números da lista é 4 × 20 × 100 = 8000. Se os três números forem
substituídos por 20, o produto também será 20 × 20 × 20 = 8000. Por isso, dizemos que a média
geométrica preserva o produto dos números.
Vejamos algumas situações em que empregamos a média geométrica:
1) no setor financeiro: o preço de um produto, nos últimos 3 meses, sofreu aumentos de,
respectivamente, 3%, 8%, 9%. Qual foi o aumento médio percentual nesse período? 𝑗 = √3 × 8 × 93 𝑗 = √3 × 23 × 323 𝑗 = √23 × 333 = 6%
2) na geometria espacial: um prisma de base retangular possui o mesmo volume que um cubo. Se
asdimensões do prisma são 4 cm x 10 cm x 25 cm, qual é o valor do lado do cubo em centímetros? 𝑙3 = 4 × 10 × 25 𝑙 = √4 × 10 × 253 𝑙 = √22 × 2 × 5 × 523 𝑙 = √23 × 533 = 10𝑐𝑚
Sobre a média geométrica, podemos afirmar que:
I – ela preserva o produto dos elementos de uma lista de números;
II – ela é obtida por meio da raiz n-ésima do produto de n elementos de um conjunto, 𝑮 =√𝒙𝟏 × 𝒙𝟐 ×⋯× 𝒙𝒏𝒏 .
Somente definimos a média geométrica para números não-negativos. Assim, evitamos situações
em que a média geométrica não existe. Por exemplo, não conseguiríamos calcular a média
geométrica de 1 e -1, pois a raiz quadrada de -1 não existe no campo dos números reais.
(VUNESP/Pref. de Sertãozinho/2018) O gráfico a seguir mostra as notas das duas provas obtidas
por um aluno em matemática e as duas notas obtidas em língua portuguesa, nesse bimestre.
Seus professores afirmaram que, nesse bimestre, a média de matemática e de língua portuguesa
será a raiz quadrada do produto de Mat1 x Mat2e a raiz quadrada do produto de LP1 e LP2. Dessa
forma, a média de matemática desse aluno será maior que sua média de língua portuguesa em
a) 0,5 ponto.
b) 1,0 ponto.
jeffs
Destacar
jeffs
Destacar
c) 1,5 ponto.
d) 2,0 pontos.
e) 2,5 pontos.
Comentários:
Do gráfico, extraímos que: {𝑀𝑎𝑡1 = 4,5𝑀𝑎𝑡2 = 8,0 𝑒 {𝐿𝑃1 = 2,0𝐿𝑃2 = 8,0.
Como a média de matemática será calculada pela raiz quadrada do produto de 𝑀𝑎𝑡1 ×𝑀𝑎𝑡2, então a
média desse aluno em matemática será de: √𝑀𝑎𝑡1 ×𝑀𝑎𝑡2 = √4,5 × 8 = √36 = 6,0 𝑝𝑜𝑛𝑡𝑜𝑠
A média de língua portuguesa, por sua vez, será dada pela raiz quadrada de 𝐿𝑃1 × 𝐿𝑃2. Assim, a média
desse aluno em português será de: √𝐿𝑃1 × 𝐿𝑃2 = √2 × 8 = √16 = 4,0 𝑝𝑜𝑛𝑡𝑜𝑠
Portanto, a média de matemática desse aluno será maior que sua média de língua portuguesa em: 6,0 − 4,0 = 2,0 𝑝𝑜𝑛𝑡𝑜𝑠
Gabarito: D.
(AOCP/Pref. de Pinhais/2017) Sejam a, b, e c três números reais e positivos tais que:
• A média aritmética entre a e b é igual a 15;
• A média aritmética entre b e c é igual a 11;
• A média aritmética entre a e c é igual a 5.
Dessa forma, a média geométrica entre a, b, e c será igual a
a) 3√73
b) √72
c) 7√33
d) √32
e) √1892
Comentários:
Por definição, a média aritmética é a soma total dos termos dividida pelo número total dos termos.
Pelos dados apresentados, sabemos que:
https://www.tecconcursos.com.br/concursos/analista-fiscal-de-tributos-municipais-pref-pinhais-2017
{
𝑎 + 𝑏2 = 15𝑏 + 𝑐2 = 11𝑎 + 𝑐2 = 5
De forma equivalente, temos que: {𝑎 + 𝑏 = 30𝑏 + 𝑐 = 22𝑎 + 𝑐 = 10
Temos um sistema de equações lineares formado por três equações e três incógnitas. Para resolvê-lo,
podemos utilizar a técnica de substituição de incógnitas. Pela primeira equação, temos que: 𝑎 = 30 − 𝑏
Isolando a incógnita c na segunda equação, teremos: 𝑐 = 22 − 𝑏
Agora, vamos substituir o valor na terceira equação: 𝑎 + 𝑐 = 10 (30 − 𝑏) + (22 − 𝑏) = 10 52 − 2𝑏 = 10 52 − 10 = 2𝑏 42 = 2𝑏 𝑏 = 21
Dessa forma, teremos: 𝑎 = 30 − 𝑏 = 30 − 21 = 9 𝑐 = 22 − 𝑏 = 22 − 21 = 1
Logo, ao resolver o sistema, descobrimos que 𝑎 = 9, 𝑏 = 21 e 𝑐 = 1. Assim, sendo a média geométrica
a raiz cúbica do produto desses números, então: 𝐺 = √𝑎 × 𝑏 × 𝑐3 𝐺 = √9 × 21 × 13 𝐺 = √32 × (3 × 7) × 13 𝐺 = √33 × 73 𝐺 = 3 × √73
Gabarito: A.
MÉDIA HARMÔNICA
A média harmônica é muito utilizada quando precisamos trabalhar com grandezas inversamente
proporcionais. É o caso de problemas clássicos, como o cálculo da velocidade média de um
automóvel ou da vazão de torneiras (quanto tempo duas ou mais torneiras levam para encher um
tanque).
Essa medida é definida, para o conjunto de números positivos, como o inverso da média
aritmética dos inversos. A propriedade principal dessa média é preservar a soma dos inversos
dos elementos de um conjunto de números.
O raciocínio para encontrarmos a fórmula da média harmônica é similar ao adotado para as médias
aritmética e geométrica. Dada uma lista de 𝑛 números, {𝑥1, 𝑥2, ⋯ , 𝑥𝑛}, a soma dos inversos de seus
termos é igual a: 1𝑥1 + 1𝑥2 +⋯+ 1𝑥𝑛⏟ 𝑛 𝑓𝑎𝑡𝑜𝑟𝑒𝑠
A média harmônica dessa lista é um número 𝐻, tal que, se todos os elementos forem substituídos por 𝐻,
a soma dos inversos permanecerá preservada. Assim, substituindo todos os elementos por H, teremos
uma lista, {𝐻,𝐻,⋯ ,𝐻}, cuja soma dos inversos é: 1𝐻 + 1𝐻 +⋯+ 1𝐻⏟ 𝑛 𝑓𝑎𝑡𝑜𝑟𝑒𝑠 = 𝑛𝐻
Como as somas dos inversos das duas listas são iguais, temos: 𝑛𝐻 = 1𝑥1 + 1𝑥2 +⋯+ 1𝑥𝑛 𝑛 = 𝐻 × ( 1𝑥1 + 1𝑥2 +⋯+ 1𝑥𝑛) 𝑯 = 𝒏𝟏𝒙𝟏 + 𝟏𝒙𝟐 +⋯+ 𝟏𝒙𝒏
em que 𝑛 corresponde à quantidade de termos que integram o conjunto.
Como vimos no início, muitas vezes, a média harmônica é descrita como o inverso da média
aritmética dos inversos. Isso porque a fórmula acima também pode ser escrita na forma mostrada a
seguir, em que ( 1𝑥1 + 1𝑥2 +⋯+ 1𝑥𝑛) 𝑛⁄ corresponde à média aritmética dos inversos. 𝑯 = 𝟏( 𝟏𝒙𝟏 + 𝟏𝒙𝟐 +⋯+ 𝟏𝒙𝒏)𝒏
jeffs
Destacar
jeffs
Destacar
jeffs
Destacar
jeffs
Destacar
jeffs
Destacar
jeffs
Destacar
Vejamos um exemplo numérico. Qual a média harmônica dos números 15 e 60?
Para responder a essa questão, iniciaremos calculando o valor da soma dos inversos desses
números: 115 + 160
Calculando o M.M.C de 15 e 60, temos: 15, 6015, 3015, 155, 51, 1 ||
2235 22 × 3 × 5 = 60
Então, temos que: 115 + 160 = 4 + 160 = 560 = 112
Agora, por serem somente dois números, devemos dividir a soma dos inversos por 2. Dessa forma
encontraremos a média dos inversos: ( 112)2 = 112 × 12 = 124
Desse modo, temos que: 𝐻 = 1( 124) = 1 × 24 = 24
Portanto, 24 é o valor da média harmônica dos números 15 e 60.
Repare que a soma dos inversos dos números da lista é 1 15⁄ + 1 60⁄ = 1 12⁄ . Se os dois números
forem substituídos por 24, a soma dos inversos também será 1 24⁄ + 1 24⁄ = 1 12⁄ . Por isso,
dizemos que a média harmônica preserva a soma dos inversos dos números.
Vejamos algumas situações em que empregamos a média harmônica:
1) no cálculo da velocidade média: durante a metade de um percurso um veículo manteve a
velocidade de 80 km/h e durante a metade restante sua velocidade foi de 120 km/h. Qual a
velocidade média do veículo durante o percurso?
Primeiro, precisa ficar claro o motivo de adotarmos a média harmônica. Note que as distâncias
percorridas são iguais, o que muda é a velocidade e, consequentemente, o tempo. Se aumentarmos
a velocidade, o tempo que levaremos para percorrer uma mesma distância diminuirá, logo, essas
grandezas são inversamente proporcionais. 𝑣𝑚é𝑑 = 𝑛1𝑣1 + 1𝑣2 = 2180 + 1120
Calculando o M.M.C de (80, 120): 80, 12040, 6020, 3010, 155, 155, 51 1 |
| 222235 24 × 5 × 3 = 240
Então, temos que: 𝑣𝑚é𝑑 = 23 + 2240 = 25240 𝑣𝑚é𝑑 = 2 × (2405 ) 𝑣𝑚é𝑑 = 4805 = 96 𝑘𝑚/ℎ
2) no cálculo da vazão de duas torneiras: para encher um tanque, uma torneira leva 12 horas. Para
encher esse mesmo tanque, outra torneira leva 6 horas. Caso as duas torneiras fossem abertas ao
mesmo tempo, quanto tempo elas levariam para encher o tanque?
Repare que vazão e tempo são grandezas inversamente proporcionais, pois, quanto maior a vazão
da torneira, menor será o tempo que ela levará para encher o tanque. Desse modo, utilizaremos a
média harmônica para encontrarmos o tempo médio das duas torneiras. 𝑡𝑚é𝑑 = 216 + 112 𝑡𝑚é𝑑 = 22 + 112 𝑡𝑚é𝑑 = 2312 𝑡𝑚é𝑑 = 2 × (123 ) 𝑡𝑚é𝑑 = 243 = 8 ℎ𝑜𝑟𝑎𝑠
Como as torneiras serão ligadas simultaneamente em um único tanque, precisamos dividir esse
tempo por 2, pois cada torneira leva, em média, 8 horas. Então, concluímos que o tempo de espera
com as duas torneiras ligadas seria de 4 horas. 8 ÷ 2 = 4 ℎ𝑜𝑟𝑎𝑠
Sobre a média harmônica, podemos afirmar que:
I – ela preserva a soma dos inversos de uma lista de números;
II – ela é definida como o inverso da média aritméticados inversos, 𝑯 = 𝒏( 𝟏𝒙𝟏+ 𝟏𝒙𝟐+⋯+ 𝟏𝒙𝒏).
jeffs
Destacar
Somente definimos a média harmônica para números não-negativos. Assim, evitamos situações
em que a média harmônica não existe. Por exemplo, não conseguiríamos calcular a média
geométrica de 1 e -1, pois a soma dos inversos resultaria em zero e, como sabemos, a divisão por
zero é impossível de ser calculada.
(FCC/SEFAZ-GO/2018) Os matemáticos definem diferentes tipos de médias entre dois números
positivos e, para cada aplicação, escolhem qual o tipo mais adequado a ser utilizado. A média
harmônica H entre os números positivos a e b, por exemplo, é definida como o inverso da média
aritmética dos inversos desses números, ou seja, 𝑯 = 𝟏𝟏𝒂 + 𝟏𝒃𝟐
A média aritmética dos números 5 e 20 supera a média harmônica desses mesmos números em
a) 4,75 unidades.
b) 5 unidades.
c) 4 unidades.
d) 4,25 unidades.
e) 4,5 unidades.
Comentários:
A média aritmética é dada por: 5 + 202 = 12,5
A média harmônica é o inverso da média aritmética dos inversos. O primeiro passo é calcularmos a soma
dos inversos: 15 + 120 = 4 + 120 = 520 = 14
Assim, podemos calcular a média aritmética dos inversos. Para isso, basta dividirmos a soma dos termos
por 2:
jeffs
Destacar
142 = 14 × 12 = 18
Portanto, a média aritmética supera a média harmônica em 12,5 − 8 = 4,5 unidades.
Também, podemos calcular a média harmônica de dois números de forma mais rápida. Para tanto, basta
desenvolvermos a própria fórmula que foi dada na questão: 𝐻 = 11𝑎 + 1𝑏2 𝐻 = 21𝑎 + 1𝑏 𝐻 = 2𝑎 + 𝑏𝑎 × 𝑏 𝐻 = 2 × 𝑎 × 𝑏𝑎 + 𝑏
Assim, a média harmônica de dois números é o quociente do dobro do produto dos números pela soma
dos números. Voltando ao enunciado, queremos calcular a média harmônica dos números 5 e 20, logo: 𝐻 = 2 × 5 × 205 + 20 = 20025 = 8
Gabarito: E.
(FCC/ARTESP/2017) Considere as seguintes informações
I. (A) = média harmônica dos números 4, 6 e 12.
II. (B) = média geométrica dos números 4, 6 e 12.
A média aritmética entre (A) e (B) é igual a
a) 6,81.
b) 5,68.
c) 6,30.
d) 5,41.
e) 6,93.
Comentários:
A média geométrica é: 𝐺 = √4 × 6 × 123 𝐺 = √22 × 2 × 3 × 22 × 33
𝐺 = 2 × √363
Agora, a nossa dificuldade será encontrar a raiz cúbica de 36. Sabemos que 33 = 27 e que 43 = 64.
Portanto, o número que procuramos está entre 3 e 4. E deve ser ligeiramente maior que 3. Vamos
aproximar uma só casa, testando valores: 3,13 = 29,791 3,23 = 32,768 3,33 = 35,937
Portanto, já chegamos bem próximo do valor que queríamos (36). Assim, vamos considerar a raiz cúbica
de 36 aproximadamente igual a 3,3. 𝐺 = 2 × √363 𝐺 = 2 × 3,3 𝐺 = 6,6
A média harmônica é 𝐻 = 114 + 16 + 1123
Vamos calcular, em primeiro lugar, a soma dos inversos: 14 + 16 + 112 = 3 + 2 + 112 = 612 = 12
Agora, vamos calcular o valor médio da soma dos inversos: 14 + 16 + 1123 = 123 = 12 × 13 = 16
Finalmente, vamos encontrar o inverso da média da média aritmética dos inversos: 𝐻 = 114 + 16 + 1123 =
116 = 1 × 6 = 6 𝐻 = 6
Agora, vamos descobrir o valor da média aritmética entre 𝐺 e 𝐻: 6,6 + 62 = 6,3
Gabarito: C.
DESIGUALDADE DAS MÉDIAS
Dada uma lista de 𝑛 números positivos, {𝑥1, 𝑥2, ⋯ , 𝑥𝑛}, podemos afirmar que: �̅� ≥ 𝑮 ≥ 𝑯
em que �̅� é a média aritmética; 𝐺 é a média geométrica e 𝐻 é a média harmônica.
Significa dizer que a média aritmética será sempre maior ou igual à média geométrica que, por sua
vez, será sempre maior ou igual à média harmônica. A igualdade ocorrerá quando os números da
lista forem todos iguais.
Tomemos como exemplo os números 4, 12 e 20. Como sabemos, a média aritmética será: �̅� = 4 + 12 + 203 = 12
A média geométrica será: 𝐺 = √4 × 12 × 203 ≅ 9,86
E a média harmônica será: 𝐻 = 314 + 112 + 120 ≅ 2,61
Obtivemos, portanto, uma média aritmética (�̅� = 12) maior que a média geométrica (𝐺 = 9,86) que, por
sua vez, é maior que a média harmônica (𝐻 = 2,61).
Agora, analisaremos um caso em que as três médias são iguais: considere uma lista composta pelos
números 5, 5 e 5. Nesse caso, temos que �̅�, 𝐺 e 𝐻 são, respectivamente: �̅� = 5 + 5 + 53 = 5 𝐺 = √5 × 5 × 53 = 5 𝐻 = 315 + 15 + 15 = 5
Portanto, quando todos os números da lista são iguais, as médias aritmética (�̅�), geométrica (𝐺) e
harmônica (𝐻) também são iguais.
jeffs
Destacar
(CESPE/SEFAZ-RS/2018) Para a, b e c, números reais, positivos e distintos, são verdadeiras as
seguintes propriedades:
• 𝒂 < 𝒄
• 𝒃 < 𝒂+𝒄𝟐 < √𝒃𝒄
A partir dessas propriedades, é correto concluir que
a)
𝑎+𝑐2 < 𝑎+𝑏+𝑐3
b) 𝑎 > 𝑏
c) 𝑐 < 𝑎+𝑏2
d) 𝑎 < 𝑏 < 𝑐
e) 𝑏 > 𝑐
Comentários:
Essa questão pode ser respondida de duas formas numericamente, por meio da atribuição de valores às
variáveis, ou algebricamente, por meio da manipulação das variáveis.
Primeiro, vamos resolver de forma numérica. Para isso, devemos considerar que, para a, b e c, números
reais positivos e distintos, são verdadeiras as seguintes propriedades: 𝑎 < 𝑐 𝑏 < 𝑎 + 𝑐2 < √𝑏𝑐
Como temos √𝑏𝑐, podemos atribuir valores às variáveis b e c, tais como 𝑏 = 9 e 𝑐 = 16, de forma que a
raiz resulte em um número inteiro. Dessa forma, √𝑏𝑐 = √9 × 16 = √144 = 12. Assim, temos que: 𝑎 < 𝑐 𝑎 < 16
Temos ainda que: 𝑏 < 𝑎 + 𝑐2 < √𝑏𝑐 9 < 𝑎 + 162 < 12
Vamos multiplicar todos os termos por 2. 18 < 𝑎 + 16 < 24
Nesse ponto, devemos subtrair 16 de todos os termos. 18 − 16 < 𝑎 < 24 − 16 2 < 𝑎 < 8
Portanto, 𝑎 pode ser qualquer valor nesse intervalo. Vamos supor que 𝑎 = 4. Assim, vamos assumir que 𝑎 = 4, 𝑏 = 9 e 𝑐 = 16. Agora, podemos partir para a análise das alternativas:
a)
𝒂+𝒄𝟐 < 𝒂+𝒃+𝒄𝟑 4 + 162 < 4 + 9 + 163 10 < 9,666 (𝑓𝑎𝑙𝑠𝑜)
b) 𝑎 > 𝑏 4 > 9 (𝑓𝑎𝑙𝑠𝑜)
c) 𝑐 < 𝑎+𝑏2 16 < 4 + 92 16 < 6,5 (𝑓𝑎𝑙𝑠𝑜)
d) 𝑎 < 𝑏 < 𝑐 4 < 9 < 16 (𝑣𝑒𝑟𝑑𝑎𝑑𝑒𝑖𝑟𝑜)
e) 𝑏 > 𝑐 9 > 16 (𝑓𝑎𝑙𝑠𝑜)
Agora, vamos usar o método algébrico para responder à questão. Retomando o que diz o enunciado,
temos que, para a, b e c, números reais positivos e distintos, são verdadeiras as seguintes propriedades: 𝑎 < 𝑐 𝑏 < 𝑎 + 𝑐2 < √𝑏𝑐
Assim, já sabemos que 𝑎 < 𝑐.
A segunda desigualdade nos diz que 𝑏 < √𝑏𝑐. Em outras palavras, b é menor que a média geométrica
entre b e c. Como a média geométrica sempre fica entre os números, podemos concluir que 𝑏 < 𝑐.
Podemos verificar isso da seguinte forma: 𝑏2 < 𝑏𝑐 𝑏 < 𝑐
Precisamos, agora, saber a relação entre a e b.
A segunda desigualdade informou que
𝑎+𝑐2 < √𝑏𝑐. O lado esquerdo representa a média aritmética entre
os números a e c. Sabemos que a média aritmética é sempre maior que a média geométrica. Portanto, √𝑎𝑐 < 𝑎 + 𝑐2
Logo, √𝑎𝑐 < 𝑎 + 𝑐2 < √𝑏𝑐
Agora, sabemos que: √𝑎𝑐 < √𝑏𝑐 𝑎𝑐 < 𝑏𝑐 𝑎 < 𝑏
Assim, temos que 𝑎 < 𝑏 e 𝑏 < 𝑐. Portanto, 𝑎 < 𝑏 < 𝑐. A resposta está na alternativa D, mas analisaremos
as demais alternativas.
a)
𝒂+𝒄𝟐 < 𝒂+𝒃+𝒄𝟑
Sabemos que 𝑏 < 𝑎 + 𝑐, isto é, 𝑏 é menor que a média entre 𝑎 e 𝑐. Assim, se formos incluir no cálculo da
média, o resultado dessa média diminuirá. Logo, a alternativa A está errada.
b) 𝑎 > 𝑏
Falso, pois concluímos que 𝑎 < 𝑏.
c) 𝑐 < 𝑎+𝑏2
Falso, pois 𝑐 é o maior valor. Logo, também será maior que a média dos dois menores.
d) 𝑎 < 𝑏 < 𝑐
Alternativa correta
e) 𝑏 > 𝑐
Falso, pois 𝑏 < 𝑐.
Assim, comprovamos que a resposta correta é a alternativa D.
Gabarito: D.
RESUMO DA AULA
MEDIDAS DE POSIÇÃO
NOTAÇÃO DE SOMATÓRIO
Nessa notação, temos:
1) um símbolo de somatório, 𝛴, que é a letra grega maiúscula Sigma (S);
2) um índice que vai variar do limite inferior 𝑎 até o limite superior 𝑏;
3) um limite inferior;
4) um limite superior ou condição de parada;
5) o termo geral de uma sequência.
Propriedades do Somatório
1ª. Propriedade: O somatório de uma constante 𝒌 é igual ao produto do número de termos pela
constante.
∑ 𝒌𝒏𝒊=𝟏 = 𝒌 + 𝒌+ ⋯ + 𝒌 = 𝒌 × 𝒏
Medidas de
Posição
Medidas de
Tendência
Central
Medidas
Separatrizes
Quartis
Decis
Percentis
Média
Moda
Mediana
Média Aritmética
Média Geométrica
Média Harmônica
Mediana
2ª. Propriedade: O somatório do produto de uma constante por uma variável é igual ao
produto da constante pelo somatório da variável.
∑ 𝒌 × 𝒙𝒊𝒏𝒊=𝟏 = 𝒌 × 𝒙𝟏 + 𝒌 × 𝒙𝟐 + ⋯ + 𝒌 × 𝒙𝒏 = 𝒌 × ∑ 𝒙𝒊𝒏𝒊=𝟏
3ª. Propriedade: O somatório de uma soma ou subtração é igual à soma ou à subtração dos
somatórios dessas variáveis.
∑(𝒙𝒊 ± 𝒚𝒊)𝒏𝒊=𝟏 = ∑ 𝒙𝒊𝒏𝒊=𝟏 ± ∑ 𝒚𝒊𝒏𝒊=𝟏
MÉDIA ARITMÉTICA SIMPLES
A média aritmética de um conjunto de dados é definida como o quociente entre a soma de todos os
elementos e o número deles.
�̅� = 𝒙𝟏 + 𝒙𝟐 + ⋯ + 𝒙𝒏𝒏
A propriedade principal da média é preservar a soma dos elementos de um conjunto de dados.
A soma total de um conjunto de dados é calculada pela multiplicação entre a média do conjunto e a
quantidade de elementos nele existentes. Trata-se da mesma fórmula apresentada anteriormente, tendo apenas o termo “n” passado para o outro lado da igualdade, multiplicando a média.
�̅� = 𝒔𝒐𝒎𝒂𝒏 ⟹ 𝒔𝒐𝒎𝒂 = 𝒏 × �̅�
Propriedades da Média Aritmética
1ª Propriedade: Dado um conjunto com 𝒏 ≥ 𝟏 elementos, a média aritmética sempre existirá
e será única.
2ª Propriedade: A média aritmética �̅� de um conjunto de dados satisfaz a expressão 𝒎 ≤ 𝒙 ≤𝑴, em que 𝒎 e 𝑴 são, respectivamente, os elementos que representam o valor mínimo e o
valor máximo desse conjunto. 𝒎í𝒏𝒊𝒎𝒐 ≤ �̅� ≤ 𝑴á𝒙𝒊𝒎𝒐
3ª Propriedade: Somando-se (ou subtraindo-se) uma constante 𝒄 de todos os valores de uma
variável, a média do conjunto fica aumentada (ou diminuída) dessa constante. �̅� = �̅� + 𝒄 ou �̅� = �̅� − 𝒄
4ª Propriedade: Multiplicando-se (ou dividindo-se) uma constante c de todos os valores de
uma variável, a média do conjunto fica multiplicada (ou dividida) por esta constante. �̅� = �̅� × 𝒄 ou �̅� = �̅� ÷ 𝒄
5ª Propriedade: A soma algébrica dos desvios em relação à média é nula. ∑(𝒙𝒊 − �̅�)𝒏𝒊=𝟏 = 𝟎
6ª Propriedade: A soma dos quadrados dos desvios da sequência de números {𝒙𝒊}, em relação
a um número 𝒂, é mínima se 𝒂 for a média aritmética dos números.
∑(𝒙𝒊 − 𝒂)𝟐𝒏𝒊=𝟏 ≥ ∑(𝒙𝒊 − �̅�)𝟐𝒏𝒊=𝟏
MÉDIA PONDERADA
A média ponderada é a média de um conjunto cujos valores possuem pesos variados. Ela é
calculada pela igualdade a seguir, em que 𝑝 é o peso de cada valor de 𝑥:
�̅� = ∑ (𝒙𝒊 × 𝒑𝒊)𝒏𝒊=𝟏∑ 𝒑𝒊𝒏𝒊=𝟏
Observe que no numerador cada valor será multiplicado pelo seu respectivo peso, enquanto no
denominador teremos a soma de todos os pesos.
MÉDIA PARA DADOS AGRUPADOS
Média para Dados Agrupados por Valor
A média para dados agrupados por valor é calculada pela seguinte fórmula:
�̅� = ∑ (𝑿𝒊 × 𝒇𝒊)𝒏𝒊=𝟏∑ 𝒇𝒊𝒏𝒊=𝟏
O raciocínio é exatamente o mesmo adotado para a média ponderada, sendo que, agora, o peso é
representado pela frequência. Desse modo, multiplicamos cada valor por sua respectiva frequência,
somamos tudo e dividimos pela soma das frequências.
Média para Dados Agrupados por Classe
A diferença em relação ao cálculo anterior consiste na substituição dos intervalos pelos seus respectivos
pontos médios. O ponto médio (𝑷𝑴) é calculado pela média dos dois extremos do intervalo, pela
seguinte expressão:
𝑷𝑴 = 𝒍𝒊𝒏𝒇 + 𝒍𝒔𝒖𝒑𝟐
A média para dados agrupados por classe é calculada pela seguinte fórmula:
�̅� = ∑ (𝑷𝑴𝒊 × 𝒇𝒊)𝒏𝒊=𝟏∑ 𝒇𝒊𝒏𝒊=𝟏
MÉDIA GEOMÉTRICA
A média geométrica é definida como a raiz 𝒏-ésima do produto de 𝒏 elementos de um conjunto
de dados: 𝑮 = √𝒙𝟏 × 𝒙𝟐 × ⋯ × 𝒙𝒏𝒏
A propriedade principal dessa média é preservar o produto dos elementos de um conjunto de
dados.
Somente definimos a média geométrica para números não-negativos.
MÉDIA HARMÔNICA
A média harmônica é definida como o inverso da média aritmética dos inversos:
𝑯 = 𝒏𝟏𝒙𝟏 + 𝟏𝒙𝟐 + ⋯ + 𝟏𝒙𝒏
A propriedade principal dessa média é preservar a soma dos inversos dos elementos de um
conjunto de números.
Somente definimos a média geométrica para números não-negativos.
DESIGUALDADE DAS MÉDIAS
A média aritmética (�̅�) é sempre maior ou igual a média geométrica (𝐺) que, por seu turno, é sempre
maior ou igual a harmônica (𝐻). �̅� ≥ 𝑮 ≥ 𝑯
A igualdade ocorre quando os números da lista são todos iguais.
QUESTÕES COMENTADAS
Média Aritmética Simples
1. (FCC/TRT 18ª Região/2023) Em uma turma de 60 alunos, 10 foram reprovados. Sabendo-se que a média
dos alunos aprovados foi 8,5 e a média dos alunos reprovados foi de 3,4, a média da turma foi
a) 8,35
b) 7,65
c) 7,95
d) 6,95
e) 7,05
Comentários:
A média é dada pelo quociente entre a soma de todos os elementos e a quantidade de elementos. Para
sabermos a média da turma, precisamos incialmente saber a soma das notas dos alunos aprovados e dos
alunos reprovamos, então temos: �̅� = 𝑠𝑜𝑚𝑎𝑛 ⟹ 𝑠𝑜𝑚𝑎 = �̅� × 𝑛
Temos um total de 60 alunos na turma, se 10 foram reprovados, então 50 foram aprovados. Assim, para os
alunos aprovados, temos: 𝑠𝑜𝑚𝑎𝐴𝑝𝑣 = �̅� × 𝑛 𝑠𝑜𝑚𝑎𝐴𝑝𝑣 = 8,5 × 50 𝑠𝑜𝑚𝑎𝐴𝑝𝑣 = 425
Agora, calculando a soma das notas para os alunos reprovados, temos: 𝑠𝑜𝑚𝑎𝑅𝑝𝑣 = �̅� × 𝑛 𝑠𝑜𝑚𝑎𝑅𝑝𝑣 = 3,4 × 10 𝑠𝑜𝑚𝑎𝑅𝑝𝑣 = 34
Sabendo a soma das notas, podemos calcular a média da turma: �̅� = 425 + 3460 = 45960 �̅� = 7,65
Gabarito: B.
2. (FUNDATEC/CIGA-SC/2023) Luciana está contabilizando quanto tempo utiliza as redes sociais e anotou
a quantidade de minutos diários em que utilizou as redes em uma semana conforme a tabela a seguir:
Dia da semana Tempo em minutos
Segunda-feira 75
Terça-feira 63
Quarta-feira 124
Quinta-feira 25
Sexta-feira 133
Sábado 92
Domingo 118
A média, em horas, que Luciana utilizou as redes sociais durante esses sete dias foi de:
a) 1,3 horas.
b) 1,9 horas.
c) 1,5 horas.
d) 1 hora.
e) 1,4 horas.
Comentários:
A média aritmética é definida como a divisão entre a soma dos valores de um determinado conjunto e a
quantidade de valores nele existentes: �̅� = 𝑠𝑜𝑚𝑎𝑛 �̅� = 75 + 63 + 124 + 25 + 133 + 92 + 1187 �̅� = 6307 �̅� = 90
Logo, Luciana usou as redes sociais, em média, 90 minutos por dia. Como 60 minutos correspondem a 1 hora,
a média de Luciana equivale a 1,5 horas.
Gabarito: C.
3. (IBADE/Fundação Faceli/2023) Uma sala de aula possui 30 alunos. A média das notas dos alunos da
turma em matemática é igual à 8. Um aluno novo chega à turma e decide que irá ajudar a elevar a média
geral. Dessa forma, qual deve ser a nota do aluno para que a média suba para 8,05?
a) 10
b) 9,55
c) 9,25
d) 8,45
e) 8,25
Comentários:
A média é definida como o quociente entre a soma dos valores de um determinado conjunto e a quantidade
de valores nele existentes: �̅� = 𝑠𝑜𝑚𝑎𝑛
Então, vamos calcular a soma das notas dos alunos: 8 = 𝑠𝑜𝑚𝑎30 𝑠𝑜𝑚𝑎 = 8 × 30 𝑠𝑜𝑚𝑎 = 240
Agora, com a entrada de um aluno novo, queremos que a média passe a ser de 8,05: 8,05 = 𝑠𝑜𝑚𝑎31 𝑠𝑜𝑚𝑎 = 8,05 × 31 𝑠𝑜𝑚𝑎 = 249,55
Para identificarmos a nota do novo aluno, basta subtrairmos as somas das notas antes e após a entrada dele: 249,55 − 240 = 9,55
Portanto, para que a média suba para 8,05, com a entrada do novo aluno, a nota dele deverá ser igual a 9,55.
Gabarito: B.
4. (VUNESP/Pref. Jaguariúna/2023) A média aritmética simples de três orçamentos para o mesmo serviço
é de R$ 860,00. Tomando-se apenas os orçamentos de valores mais alto e mais baixo, a média aritmética
simples é de R$ 880,00. Logo, o valor do terceiro orçamento está compreendido entre
a) R$ 795,00 e R$ 805,00.
b) R$ 805,00 e R$ 815,00.
c) R$ 815,00 e R$ 825,00.
d) R$ 825,00 e R$ 835,00.
e) R$ 835,00 e R$ 845,00.
Comentários:
Para resolvermos a questão, vamos precisar calculara soma dos três orçamentos. Sabemos que a média é
igual à soma dos valores dividida pela quantidade. Assim, temos que: �̅� = 𝑠𝑜𝑚𝑎𝑛 ⟹ 𝑠𝑜𝑚𝑎 = �̅� × 𝑛 𝑠𝑜𝑚𝑎 = 860 × 3 𝑠𝑜𝑚𝑎 = 2.580
O enunciado também nos disse que, se tomarmos apenas os orçamentos de valores mais alto e mais baixo,
a média aritmética simples é de R$ 880,00. Logo, podemos calcular a soma desses dois valores: 𝑠𝑜𝑚𝑎 = 880 × 2 𝑠𝑜𝑚𝑎 = 1.760
Agora, basta subtrairmos a segunda soma da primeira e encontraremos o terceiro valor: 2.580 − 1.760 = 820
Portanto, o terceiro orçamento é igual a 820.
Gabarito: C.
5. (VUNESP/Pref. Marília/2023) Um álbum possui 9 músicas, e o tempo médio de duração de cada música
é 3 minutos e 20 segundos. As três primeiras músicas têm duração 2 minutos e 40 segundos cada, e as três
músicas seguintes têm duração de 4 minutos e 10 segundos cada. A média aritmética da duração das três
últimas músicas desse álbum é 3 minutos e
a) 5 segundos.
b) 10 segundos.
c) 15 segundos.
d) 20 segundos.
e) 25 segundos.
Comentários:
Primeiramente, vamos transformar o tempo médio das 9 músicas em segundos para facilitar os cálculos. A
questão diz que o tempo médio é de 3 minutos e 20 segundos. Ora, se 1 minuto corresponde a 60 segundos,
podemos transformar tudo em segundos: �̅� = 3 × 60 + 20 �̅� = 180 + 20 �̅� = 200
Portanto, o tempo médio das 9 músicas do álbum é de 200 segundos.
Vamos fazer a mesma transformação para as demais informações do enunciado. As três primeiras músicas
têm duração 2 minutos e 40 segundos cada, então: 𝑀1,2,3 = 2 × 60 + 40 𝑀1,2,3 = 160
Assim, as músicas 1,2 e 3 têm 160 segundos cada. Logo, a soma das três primeiras músicas é de 480 segundos: 𝑆1,2,3 = 3 × 160 = 480
As três músicas seguintes têm duração de 4 minutos e 10 segundos cada. Então: 𝑀4,5,6 = 4 × 60 + 10 𝑀4,5,6 = 250
Assim, as músicas 4,5 e 6 têm 250 segundos cada. Logo, a soma das três próximas músicas é de 750 segundos: 𝑆4,5,6 = 3 × 250 = 750
Como temos a média de tempo de todas as músicas e a quantidade de músicas do álbum, podemos calcular
o somatório de tempo de todas as músicas: �̅� = 𝑠𝑜𝑚𝑎𝑛 ⟹ 𝑠𝑜𝑚𝑎 = �̅� × 𝑛 𝑠𝑜𝑚𝑎 = 200 × 9 𝑠𝑜𝑚𝑎 = 1800
Ora, se a soma do tempo de todas as músicas é de 1800 segundos, e já temos a soma de tempo das 6
primeiras, podemos calcular a soma de tempo das três últimas músicas. Dessa forma, temos que: 𝑠𝑜𝑚𝑎 = 𝑆1,2,3 + 𝑆4,5,6 + 𝑆7,8,9 1800 = 480 + 750 + 𝑆7,8,9 1800 = 1230 + 𝑆7,8,9 𝑆7,8,9 = 1800 − 1230 𝑆7,8,9 = 570
Portanto, a soma do tempo das três últimas músicas é de 570 segundos. Agora, basta calcularmos o tempo
médio de cada uma:
𝑀7,8,9 = 5703 𝑀7,8,9 = 190
Assim, as músicas 7,8 e 9 têm 190 segundos cada. Transformando de volta para minutos, temos: 190 ÷ 60 = 3 e sobra 10
Portanto, tempo médio das últimas 3 músicas é de 3 minutos e 10 segundos.
Gabarito: B.
6. (VUNESP/DPE SP/2023) Considere a tabela de preços de quatro produtos obtidos na Loja Me na Loja P.
Loja M Loja P
Produto A R$ 12,50 Produto A R$ 13,00
Produto B R$ 17,00 Produto B R$ 16,20
Produto C R$ 21,50 Produto C R$ 19,80
Produto D R$ 28,00 Produto D R$ 31,00
Calculando a média aritmética simples dos preços desses quatro produtos em cada loja, é correto afirmar
que a média dos preços da Loja M é menor do que a média dos preços da Loja P em uma porcentagem
igual a
a) 0,25.
b) 0,50.
c) 0,75.
d) 1,00.
e) 1,25.
Comentários:
Vamos inicialmente calcular as médias para as duas lojas. Para a loja M, temos a seguinte média: �̅�𝑀 = 12,50 + 17,00 + 21,50 + 28,004 �̅�𝑀 = 794 �̅�𝑀 = 19,75
Para a loja P, temos: �̅�𝑃 = 13,00 + 16,20 + 19,80 + 31,004 �̅�𝑃 = 804 �̅�𝑃 = 20
Portanto, a loja M tem a média de preços R$ 0,25 menor que a média dos preços da loja P. Logo, a
porcentagem menor de M em relação a P é de: 0,2520 = 0,0125 ⟹ 1,25%
Gabarito: E.
7. (VUNESP/CAMPREV/2023) A tabela mostra o número de unidades (representados por x e múltiplos de
x) de veículos eletrificados vendidos mensalmente por uma concessionária no último quadrimestre de
2022.
Mês Nº de unidades
Setembro x
Outubro 1,2 x
Novembro 1,4 x
Dezembro 2 x
Sabendo-se que, em outubro, foram vendidas 4 unidades a mais que o número de unidades vendidas em
setembro, é correto afirmar que a média aritmética do número de unidades vendidas mensalmente nesse
período é igual a
a) 20.
b) 22.
c) 24.
d) 26.
e) 28.
Comentários:
Podemos determinar o valor de x com base nos dados do enunciado e nos valores da tabela. O enunciado
diz que em outubro foram vendidas 4 unidades a mais que em setembro. Ora, se em setembro foram
vendidas x unidades e em outubro 4 a mais, podemos relacionar as quantidades usando os dados tabelados: 𝑜𝑢𝑡𝑢𝑏𝑟𝑜 = 𝑠𝑒𝑡𝑒𝑚𝑏𝑟𝑜 + 4 1,2𝑥 = 𝑥 + 4 1,2𝑥 − 𝑥 = 4 0,2𝑥 = 4 𝑥 = 40,2 𝑥 = 20
Agora que sabemos o valor de x, podemos completar a tabela para todos os meses:
Mês Nº de unidades
Setembro 20
Outubro 1,2 × 20 = 24
Novembro 1,4 × 20 = 28
Dezembro 2 × 20 = 40
Basta calcularmos a média para os quatro meses: �̅� = 𝑠𝑜𝑚𝑎𝑛 �̅� = 20 + 24 + 28 + 404 �̅� = 1124 �̅� = 28
Portanto, a média de unidades vendidas no último quadrimestre é de 28.
Gabarito: E.
8. (VUNESP/CAMPREV/2023) Em uma ação judicial, um advogado precisa informar o valor da média
aritmética simples das 5 últimas contribuições previdenciárias de seu cliente, que foram de R$ 350,00, R$
375,00, R$ 360,00, R$ 345,00 e R$ 355,00. Feito corretamente o cálculo solicitado, o advogado informará
o valor de
a) R$ 358,00.
b) R$ 357,00.
c) R$ 356,00.
d) R$ 355,00.
e) R$ 354,00.
Comentários:
A média aritmética é definida pelo quociente entre a soma dos valores de um determinado conjunto e a
quantidade de valores nele existentes. Portanto: �̅� = 𝑠𝑜𝑚𝑎𝑛 �̅� = 350 + 375 + 360 + 345 + 3555 �̅� = 17855 �̅� = 357
Portanto, a média das últimas 5 contribuições previdenciárias é igual a 357.
Gabarito: B.
9. (CESPE/FUB/2022) No item a seguir apresenta uma situação hipotética seguida de uma assertiva a ser
julgada com relação a análise combinatória, probabilidade e estatística.
A média aritmética simples das idades dos seis servidores lotados em um instituto da UnB é de 35 anos. Um
novo servidor chega e integra a equipe desse instituto, então a média aritmética simples das idades passa a
ser de 38 anos. Nesse caso, a idade do novo servidor é de 41 anos.
Comentários:
A média aritmética é determinada pelo quociente entre a soma de todos os elementos e a quantidade de
elementos existentes. Para determinarmos a idade do novo servidor, temos que conhecer a soma das idades.
Inicialmente, temos seis servidores e a média das idades é 35 anos. Assim, temos que: �̅� = 𝑠𝑜𝑚𝑎𝑛 ⟹ 𝑠𝑜𝑚𝑎 = 𝑛 × �̅� 35 = 𝑠𝑜𝑚𝑎6 𝑠𝑜𝑚𝑎 = 35 × 6 𝑠𝑜𝑚𝑎 = 210
Logo, a soma das idades dos seis servidores é de 210.
Agora, adicionaremos o novo servidor e chamaremos de 𝑖 a nova idade. Logo, temos que: �̅� = 𝑠𝑜𝑚𝑎𝑛 38 = 210 + 𝑖7 210 + 𝑖 = 38 × 7 210 + 𝑖 = 266 𝑖 = 266 − 210 𝑖 = 56
Portanto, a idade do novo servidor é 56 anos.
Gabarito: Errado.
10. (CESPE/PETROBRAS/2022) No que diz respeito aos conceitos e cálculos utilizados em probabilidade e
estatística, julgue o item a seguir.
Se, de 2016 a 2020, o total de petróleo produzido pela PETROBRAS, em milhões de barris, foi
respectivamente 2,51; 2,62; 2,59; 2,78 e 2,94, então, nesse período, a PETROBRAS produziu, em média, mais
de 2,72 milhões de barris de petróleo.
Comentários:
A média é definida pelo quociente entre a soma de todos os elementos e o número deles. Assim, a média
dos valores informados no enunciado será: �̅� = 2,51 + 2,62 + 2,59 + 2,78 + 2,945 = 2,688
Então, a média foi de 2,688 milhões de barris de petróleo, ou seja, inferior a 2,72 milhões. Logo, a alternativa
está errada.
Gabarito: Errado.
11. (CESPE/TELEBRAS/2022) Com respeito ao conjunto de dados {5a, 2a, 2a}, emque a representa uma
constante não nula, julgue o próximo item.
A média amostral desse conjunto de dados é igual a 2a.
Comentários:
A média é definida pelo quociente entre a soma de todos os elementos e o número deles. Calculando a média
para os dados apresentados, temos: �̅� = 5𝑎 + 2𝑎 + 2𝑎3 = 9𝑎3 = 3𝑎
Gabarito: Errado.
12. (FCC/TRT 5ª Região/2022) Numa prova com dez questões, a pontuação na correção de cada questão
pode variar entre 0 e 10 pontos. A média dos pontos obtidos por um estudante nas 6 primeiras questões
é 6,5. A pontuação média nas quatro últimas questões para que ele atinja um total de 71 pontos na prova
deverá ser:
a) 7
b) 7,5
c) 8
d) 8,5
e) 9
Comentários:
Se a média dos pontos obtidos por um estudante nas 6 primeiras questões é 6,5, então, apenas nessas seis
primeiras questões, o estudante alcançou um total de 66 × 6,5 = 39 pontos. Logo, ele ainda precisa
conquistar um total de 71 − 39 = 32 pontos nas últimas quatro questões.
Para que consiga alcançar 32 pontos nas últimas 4 questões, a pontuação média deve ser: �̅� = 324 = 8
Gabarito: C.
13. (FCC/TRT 5ª Região/2022) Na tabela, temos o registro do número semanal de livros novos recebidos
pela biblioteca.
Sem 1 Sem 2 Sem 3 Sem 4 Sem 5 Sem 6 Sem 7 Sem 8
15 8 12 ? ? 30 26 35
Sabe-se que a média semanal de recebimento de livros é de 21 livros; no entanto, os números
correspondentes às semanas 4 e 5 foram perdidos. A informação que foi recuperada é que o número de
livros recebidos na semana 5 é 10% superior ao número da semana 4. Na semana 5 foram recebidos:
a) 12 livros.
b) 15 livros.
c) 19 livros.
d) 22 livros.
e) 25 livros.
Comentários:
Vamos considerar que na semana 4 tenham sido recebidos 𝑥 livros. De acordo com o enunciado, o número
de livros recebidos na semana 5 foi 10% superior ao da semana 4. Logo, na semana 5, o total de livros
recebidos foi igual a: 𝑥 + 10% × 𝑥 = 1,1 × 𝑥
Agora, sabendo que a média semanal de recebimento de livros é de 21 livros, podemos descobrir o valor de 𝑥. Para isso, somamos os valores correspondentes a todas as semanas e dividimos pelo número de semanas,
encontrando a média. Vejamos: �̅� = 15 + 8 + 12 + 𝑥 + 1,1𝑥 + 30 + 26 + 358 21 = 126 + 2,1𝑥8 168 = 126 + 2,1𝑥 42 = 2,1𝑥 𝑥 = 20
Portanto, o número de livros na semana 5 foi: 1,1 × 20 = 22 𝑙𝑖𝑣𝑟𝑜𝑠
Gabarito: D.
14. (FCC/TRT 23ª Região/2022) Uma escola de ensino médio possui 30 alunos e 5 professores. A idade
média dos alunos é de 16 anos e a dos professores é de 34 anos. Um professor acaba de ser contratado e
a idade média dessas 36 pessoas passou a ser de 19 anos.
A idade do novo professor é:
a) 56 anos.
b) 26 anos.
c) 35 anos.
d) 40 anos.
e) 34 anos.
Comentários:
A idade média dos alunos é de 16 anos e são 30 alunos, logo, a soma das idades dos alunos é: �̅�𝑎𝑙𝑢𝑛𝑜𝑠 = 𝑠𝑜𝑚𝑎𝑎𝑙𝑢𝑛𝑜𝑠𝑛𝑎𝑙𝑢𝑛𝑜𝑠 ⇒ 𝑠𝑜𝑚𝑎𝑎𝑙𝑢𝑛𝑜𝑠 = �̅�𝑎𝑙𝑢𝑛𝑜𝑠 × 𝑛𝑎𝑙𝑢𝑛𝑜𝑠 = 16 × 30 = 480
A idade média dos professores é de 34 anos e são 5 professores, logo, a soma das idades dos professores é: �̅�𝑝𝑟𝑜𝑓𝑠 = 𝑠𝑜𝑚𝑎𝑝𝑟𝑜𝑓𝑠𝑛𝑝𝑟𝑜𝑓𝑠 ⇒ 𝑠𝑜𝑚𝑎𝑝𝑟𝑜𝑓𝑠 = �̅�𝑝𝑟𝑜𝑓𝑠 × 𝑛𝑝𝑟𝑜𝑓𝑠 = 34 × 5 = 170
Após a contratação do novo professor, com X anos de idade, a idade média das 36 pessoas passou a ser de
19 anos: �̅�𝑝𝑒𝑠𝑠𝑜𝑎𝑠 = 𝑠𝑜𝑚𝑎𝑝𝑒𝑠𝑠𝑜𝑎𝑠𝑛𝑝𝑒𝑠𝑠𝑜𝑎𝑠 ⇒ 19 = 480 + 170 + 𝑋36 684 = 480 + 170 + 𝑋 684 = 650 + 𝑋 𝑋 = 34
Portanto, o novo professor tem 34 anos de idade.
Gabarito: E.
15. (FCC/PGE AM/2022) Uma ginasta executa três vezes uma determinada prova. Suas notas, na primeira
e segunda tentativas foram, respectivamente, metade e dois terços da nota da terceira tentativa. A média
aritmética das notas das três tentativas foi de 32,5 pontos. A nota da primeira prova foi
a) 20,5 pontos.
b) 30,0 pontos.
c) 22,5 pontos.
d) 45,0 pontos.
e) 20,0 pontos.
Comentários:
Conforme o enunciado, o ginasta executou três vezes uma determinada prova, obtendo as notas 𝑁1, 𝑁2 e 𝑁3. Ainda de acordo com o enunciado, 𝑁1 = 12𝑁3 e 𝑁2 = 23𝑁3. Portanto, a média aritmética das três
tentativas foi de: �̅� = 𝑁1 + 𝑁2 + 𝑁33
�̅� = 12𝑁3 + 23𝑁3 +𝑁33
Como o enunciado disse que a média aritmética foi igual a 32,5, podemos estabelecer que:
32,5 = 12𝑁3 + 23𝑁3 + 𝑁33 97,5 = 12𝑁3 + 23𝑁3 + 𝑁3 97,5 = (12 + 23 + 1)𝑁3 97,5 = (3 + 4 + 66 )𝑁3 97,5 = (136 )𝑁3 𝑁3 = 97,5 × ( 613) = 45
Como 𝑁1 = 12𝑁3, temos que 𝑁1 = 22,5.
Gabarito: C.
16. (VUNESP/CMSJC/2022) A média das idades dos funcionários de uma empresa é igual a 44 anos. No
próximo mês, 5 funcionários irão se aposentar, sendo que um tem 64 anos, dois têm 65 anos e dois têm
69 anos. Para substituí-los, serão contratados 8 pessoas, cujas idades têm média igual a 28 anos. Sabendo
que os atuais funcionários e os futuros contratados já fizeram aniversário esse ano, e que, após a
substituição de todos os envolvidos, a nova média das idades dos funcionários dessa empresa será igual a
42 anos, o número atual de funcionários da empresa é
a) 105.
b) 109.
c) 113.
d) 117.
e) 121.
Comentários:
A média aritmética é determinada pelo quociente entre a soma de todos os elementos e o número de
elementos do conjunto. Conforme o enunciado, a média das idades dos funcionários na situação inicial é
igual a 44: �̅�𝑖𝑛𝑖𝑐𝑖𝑎𝑙 = 𝑆𝑜𝑚𝑎𝑖𝑛𝑖𝑐𝑖𝑎𝑙𝑁 𝑆𝑜𝑚𝑎𝑖𝑛𝑖𝑐𝑖𝑎𝑙 = 44 × 𝑁
Na situação final, após a contratação de um grupo de 8 funcionários com média de 28 anos; e a
aposentadoria de 5 funcionários, a média passa a ser 42 anos. Assim, temos que: �̅�𝑓𝑖𝑛𝑎𝑙 = 𝑆𝑜𝑚𝑎𝑖𝑛𝑖𝑐𝑖𝑎𝑙 − 1 × 64 − 2 × 65 − 2 × 69 + 8 × 28𝑁 − 8 + 5 42 = 𝑆𝑜𝑚𝑎𝑖𝑛𝑖𝑐𝑖𝑎𝑙 − 108𝑁 − 3 42 × (𝑁 − 3) = 𝑆𝑜𝑚𝑎𝑖𝑛𝑖𝑐𝑖𝑎𝑙 − 108
Agora, vamos substituir o valor de 𝑆𝑜𝑚𝑎𝑖𝑛𝑖𝑐𝑖𝑎𝑙: 42 × (𝑁 − 3) = 44 × 𝑁 − 108 42 × 𝑁 − 126 = 44 × 𝑁 − 108 234 = 2 × 𝑁 𝑁 = 117
Portanto, o número total de funcionários da empresa é 117.
Gabarito: D.
17. (VUNESP/DOCAS PB/2022) A média aritmética simples das idades de 4 pessoas é de 24 anos. Sabendo-
se que, com base na idade da pessoa mais nova do grupo, as demais têm 2, 9 e 13 anos a mais, a pessoa
com a maior idade, do grupo, tem
a) 28 anos.
b) 29 anos.
c) 30 anos.
d) 31 anos.
e) 32 anos.
Comentários:
A média aritmética é definida pelo quociente entre a soma dos valores de um determinado conjunto e a
quantidade de valores nele existentes. Então, a média é dada por:
�̅� = 𝑠𝑜𝑚𝑎𝑛
Vamos denominar a idade da pessoa mais nova do grupo de Y. Então, de acordo com o enunciado, as idades
das outras três pessoas do grupo são: Y+2; Y+9; e Y+13.
Já sabemos que a média é 24, então, vamos colocar a soma das idades na nossa equação: 24 = 𝑌 + 𝑌 + 2 + 𝑌 + 9 + 𝑌 + 134 24 = 4𝑌 + 244 4𝑌 + 24 = 96 4𝑌 = 96 − 24 4𝑌 = 72 𝑌 = 18
Portanto, a pessoa mais nova do grupo tem 18 anos.
Sendo assim, a pessoa mais velha do grupo tem: 18 + 13 = 31
Logo, a pessoa mais velha tem 31 anos.
Gabarito: D.
18. (VUNESP/DOCAS PB/2022) O gráfico a seguir refere-se ao primeiro semestre de 2021 em um
determinado porto.
Já se sabe que, nesse mesmo porto, a quantidade de navios atracados em Julho, Agosto, Setembro,
Outubro e Novembro de 2021 foi um total de 163. Para que a média mensal de navios atracados no
segundo semestre ultrapasse em 7 navios a média mensal do primeiro semestre, é preciso que o número
de navios que tenham atracado em Dezembro seja igual a
a) 54.
b) 51.
c) 47.
d) 45.
e) 40.
Comentários:
A média aritmética é definida pelo quociente entre a soma dos valores de um determinado conjunto e a
quantidade de valores nele existentes. Assim, a média é expressa por: �̅� = 𝑠𝑜𝑚𝑎𝑛
Vamos identificar a média para o primeiro semestre com base nos dados apresentados no gráfico: �̅�1 = 15 + 21 + 19 + 33 + 41 + 396 = 1686 = 28
Para que a média do segundo semestre ultrapassa em 7 a do primeiro, a nova média