Logo Passei Direto
Buscar
Material
páginas com resultados encontrados.
páginas com resultados encontrados.

Prévia do material em texto

Programação em Python Para Análise de Dados
Marcio Quirino - 1 
Exercícios 
1. Considere dados sobre o peso de navios. Essa variável é classificada em:
Quantitativa contínua
Observe que o peso é uma variável não contável, assumindo valores que pertencem ao conjunto dos 
números reais. Portanto, é uma variável quantitativa contínua.
2. Analisando as alternativas a seguir, qual das alternativas é falsa?
Distribuição de frequência é o arranjo dos dados em ordem decrescente.
A distribuição de frequência é o arranjo dos dados em classes com suas respectivas frequências 
absolutas.
3. Dados sobre atendimentos médicos por faixa etária foram coletados e organizados na seguinte 
distribuição de frequência:
Classes 0 ⊢ 10 10 ⊢ 20 20 ⊢ 40 40 ⊢ 80 Soma
Fi 280 320 180 220 1000
Dito isso, determine o ponto médio da terceira classe.
30
Veja que a terceira classe tem limite inferior e limite superior de classe, respectivamente igual a 20 e 30. 
Portanto, como o ponto médio da classe é a média aritmética entre os limites inferior e superior, temos 
que Xi é igual a 30.
4. Julgue as alternativas a seguir e assinale a alternativa verdadeira.
O histograma é o gráfico típico das distribuições de frequências.
O histograma é um gráfico de colunas ou barras, que tem por objetivo ilustrar como determinada 
amostra ou população de dados está distribuída.
5. De acordo com o diagrama de caixa a seguir, julgue a alternativa verdadeira.
Lucro Anual de Cia RH - 2010 a 2019
O primeiro quartil é aproximadamente 16.
6. Dados sobre evasão escolar em determinado município estão exibidos na distribuição de 
frequência a seguir. Veja:
 Classes 0 ⊢ 6 6 ⊢ 10 10 ⊢ 14 14 ⊢ 17 Soma
Fi 20 44 64 72 200
Programação em Python Para Análise de Dados
Marcio Quirino - 2 
7. Agora, determine a amplitude entre as frequências relativas.
26
Classes 0 ⊢ 6 6 ⊢ 10 10 ⊢ 14 14 ⊢ 17 Soma
Fi 20 44 64 72 200
f1% 10 22 32 36 100
 Como desejamos a amplitude entre as frequências relativas, basta calcular a diferença entre a maior e 
a menor frequência relativa. Assim, a amplitude entre as frequências relativas é igual a 36-10=26.
8. Considerando novamente a distribuição de frequência da questão anterior:
Classes 0 ⊢ 6 6 ⊢ 10 10 ⊢ 14 14 ⊢ 17 Soma
Fi 20 44 64 72 200
Qual o gráfico mais apropriado para representar esse conjunto de dados?
Histograma
Vimos que o gráfico que representa os dados em distribuição de frequência é o histograma, que nada 
mais é do que um gráfico de barras justapostas, cujas classes se encontram ao longo do seu eixo 
horizontal (abcissa) e as frequências absolutas ou relativas são apresentadas no eixo vertical 
(ordenada).
9. O rol a seguir representa os valores de itens vendidos (em reais) em uma loja de produtos 
alimentícios durante um dia de trabalho. 
5, 8, 10, 10, 12, 15, 18, 20, 20, 24, 25, 25, 25, 30, 38, 45, 52, 52, 60, 65, 70, 70, 79, 84, 90 
Determine a média, a mediana e a moda de vendas nesse dia de trabalho.
38, 25 e 25
Programação em Python Para Análise de Dados
Marcio Quirino - 3 
10. A Secretaria de Educação de certo município coletou dados sobre o número de evasão escolar 
no ensino fundamental durante os últimos cinco anos. Os dados estavam salvos em uma planilha 
eletrônica, mas, por um descuido do digitador, os dados foram multiplicados por 2. Sobre esse 
deslize, é correto afirmar:
A média, mediana e moda ficam multiplicadas por 2.
Observe que, se multiplicarmos os dados por 2, todos os valores serão multiplicados por 2. Por exemplo, 
se considerarmos os valores 1, 2, 2, 4 e 6, é fácil ver que a média é igual a 3 e a mediana e moda são 
iguais a 2. Se multiplicarmos os dados por 2, os seus novos valores serão 2, 4, 4, 8 e 12 e agora a sua 
média é 6 e a mediana e moda são iguais a 4. Portanto, as novas medidas de posição (média, mediana 
e moda) ficam multiplicadas por 2.
11. Um plano de saúde fez um levantamento da quantidade de famílias associadas levando em conta 
o número de dependentes. Os dados foram resumidos na distribuição de frequência a seguir.
N° de dependentes Quantidade de Famílias
0 800
1 1200
2 350
3 150
Soma 2500
A média e a mediana do número aproximado de dependentes dessas famílias são:
1 e 1
Observe que os dados são apresentados em uma distribuição de frequência. Portanto, utilizaremos as 
fórmulas para dados agrupados para o cálculo das medidas pedidas. Tendo a média:
N° de dependentes Fi Xi,Fi
0 800 0
1 1200 1200
2 350 700
3 150 450
Soma 2500 2350
Paulo Henrique Coelho Maranhão.
Daí,
Para o cálculo da mediana, considere os seguintes passos:
1) Determinar o elemento mediano.
Programação em Python Para Análise de Dados
Marcio Quirino - 4 
A classe que contém o elemento mediano é a segunda, visto que essa classe contém o elemento de 
ordem 1250, que é o elemento mediano.
3) Aplicar a fórmula:
Veja que a amplitude das classes é zero. Então, a fórmula para o cálculo da mediana se reduz a:
12. A distribuição de frequência a seguir representa a faixa etária dos funcionários de certa empresa.
Classe Xi Fi Xi,Fi
20 ⊢ 30 25 30 750
30 ⊢ 40 35 40 1400
40 ⊢ 50 45 25 1125
50 ⊢ 60 55 17 935
60 ⊢ 70 65 13 845
Soma - 125 5055
Modauma indenização de R$ 500.000 
em caso de morte acidental. Com base em dados estatísticos, a probabilidade de uma pessoa 
falecer em um determinado período é de 0,02%. Qual é o valor esperado dessa cobertura de 
seguro?
R$ 100
188. Uma aplicação prática de probabilidades está seleção de pessoas dentro de um universo de 
possibilidades. Uma sala possui 15 alunos, dos quais 8 são mulheres e 7 são homens. Se um 
aluno é selecionado aleatoriamente, qual é a probabilidade de ser um homem?
7/15
189. As probabilidades são usadas para calcular a chance de selecionar uma bola específica ou 
uma combinação específica de bolas de uma urna com bolas coloridas. Uma caixa contém 5 
bolas vermelhas, 3 bolas verdes e 2 bolas azuis. Duas bolas são retiradas sucessivamente, sem 
reposição. Qual é a probabilidade de ambas as bolas serem vermelhas?
2/9
190. Uma urna contém 10 bolas numeradas de 1 a 10. Foram sacadas, sucessivamente com 
reposição, 2 dessas bolas. A probabilidade de a primeira bola ter um número par e a segunda ter 
um número múltiplo de 5 é igual a:
1/10
191. Considere um conjunto de divisores positivos de 60. Escolhemos ao acaso um elemento 
desse conjunto. Qual a probabilidade desse elemento ser primo?
1/4
192. (FUNDATEC/2022) Um cliente chega em uma padaria onde tem 20 pães, sendo 6 deles do dia 
anterior e 10 sucos, sendo 2 deles vencidos. A probabilidade desse cliente comprar um pão do 
dia e um suco dentro da validade é de:
14/25
Programação em Python Para Análise de Dados
Marcio Quirino - 61 
193. (FGV/2021) Dois eventos A e B são tais que PIA] = 0,8, P[BI = 0,5 e 0,4. Assim, a probabilidade 
condicional P[BIA] é igual a
25%
194. Considere dois eventos A e B, os quais são mutuamente excludentes, sendo P(A) a 
probabilidade de ocorrência de A e P(B) a probabilidade de ocorrência de B. Assinale a 
alternativa correta.
P(A|B)=0
195. (CESGRANRlO/2021) Os alunos de uma determinada escola formaram um grupo de ajuda 
humanitária e resolveram arrecadar fundos para comprar alimentos não perecíveis. Decidiram, 
então, fazer uma rifa e venderam 200 tíquetes, numerados de 1 a 200. Uma funcionária da escola 
resolveu ajudar e comprou 5 tíquetes. Seus números eram 75, 76, 77, 78 e 79. No dia do sorteio da 
rifa, antes de revelarem o ganhador do prêmio, anunciaram que o número do tíquete sorteado era 
par. Considerando essa informação, a funcionária concluiu acertadamente que a probabilidade 
de ela ser a ganhadora do prêmio era de:
2,0%
196. (FGV/2022) Em uma disputa de pênaltis, quando um time acerta uma cobrança de pênalti, a 
probabilidade de que esse time acerte a cobrança seguinte é de 70% e, quando um time perde 
uma cobrança de pênalti, a probabilidade de que esse time também perca a próxima cobrança é 
de 80%. Se o time A acertou a primeira cobrança, a probabilidade de que esse time perca a sua 
terceira cobrança é:
45%
197. (FGV/2015) Na teoria das probabilidades, os conceitos de eventos independentes e eventos 
mutuamente exclusivos, apesar de distintos, guardam entre si uma estreita relação. Quando dois 
eventos são independentes:
Não podem ser mutuamente exclusivos.
198. (FGV/2015) Em uma urna há quatro bolas brancas e duas bolas pretas. Retiram-se, 
sucessivamente e sem reposição, duas bolas da urna. A probabilidade de as duas bolas retiradas 
serem da mesma cor é:
7/15
199. Carlos tem probabilidade 2/3 de resolver um problema de probabilidade. Joana, sua colega de 
classe, tem probabilidade 3/4 de resolver o mesmo problema. Se os dois tentarem resolvê-lo de 
forma independente, qual é a probabilidade do problema ser solucionado?
11/12
200. Um estudante marca, ao acaso, as respostas de um teste de 10 questões de múltipla escolha, 
com 4 alternativas por questão. O número mais provável de acertos é:
2
201. Em uma urna contendo 30 bolas, sendo 10 vermelhas e 20 azuis, deseja-se retirar uma amostra 
de 5 bolas sem reposição. Considerando a distribuição hipergeométrica, qual das alternativas 
abaixo melhor representa a natureza da variável aleatória X nesse contexto?
Média aritmética do número de bolas vermelhas na amostra.
Programação em Python Para Análise de Dados
Marcio Quirino - 62 
202. O retorno mensal de certo investimento de risco pode ser modelado pela variável aleatória W, 
com função de probabilidade dada a seguir.
O retorno esperado é:
1,5%
203. Um empresário, investindo em um determinado empreendimento, espera ter os seguintes 
lucros em função dos cenários "Bom", "Médio" e "Ruim":
A expectância e a variância do respectivo lucro são, em Re(R)2 , respectivamente:
5.300,00 e 3.510.000
204. Um fabricante de brinquedos realiza testes de qualidade em seus produtos. Durante o 
processo de produção, há uma probabilidade de 0,2 de um brinquedo ser considerado 
defeituoso. Considerando a importância da distribuição binomial, qual das alternativas abaixo 
melhor representa a natureza dessa distribuição nesse contexto?
Média aritmética da quantidade de brinquedos defeituosos encontrados nos testes.
205. Em um experimento de qualidade de produtos eletrônicos, uma empresa selecionou 
aleatoriamente 10 aparelhos de uma linha de produção que contém 20% de itens defeituosos. A 
variável aleatória X representa o número de produtos defeituosos encontrados na amostra de 10 
aparelhos. Qual é a média aritmética esperada do número de aparelhos defeituosos nessa 
amostra?
2
206. A entrada de clientes em uma loja segue um processo de Poisson homogêneo com 
intensidade por hora. Considerando que, em um determinado dia, chegaram 8 clientes em um 
período de 8 horas, qual é a probabilidade de que tenham chegado exatamente 5 clientes nas 
primeiras 4 horas?
3003 x (1/2)15
207. Em uma pesquisa de opinião, foi questionado a um grupo de pessoas qual a sua preferência 
de sorvete: chocolate, baunilha, morango ou pistache. Os resultados foram registrados e 
analisados utilizando a função de massa de probabilidade. Considerando essa situação, qual das 
alternativas abaixo melhor representa a natureza da função de massa de probabilidade nesse 
contexto?
Probabilidade de uma pessoa preferir um sabor específico de sorvete.
Programação em Python Para Análise de Dados
Marcio Quirino - 63 
208. Uma empresa de delivery de pizzas recebe uma média de 4 pedidos por hora durante a noite. A 
empresa está interessada em analisar a ocorrência de um determinado evento: o número de 
pedidos recebidos em um intervalo contínuo de 2 horas. Qual das seguintes afirmações sobre a 
distribuição de Poisson é correta para esse contexto?
A distribuição de Poisson é adequada para modelar o número de pedidos recebidos em um 
intervalo contínuo de tempo.
209. Um jogador de basquete está prestes a realizar um lance livre. Em cada lance, ele pode acertar 
a cesta ou errar. Considerando a distribuição de Bernoulli, qual das alternativas abaixo melhor 
representa a natureza da variável aleatória X nesse contexto?
Probabilidade de o jogador acertar um lance livre especifico.
210. O símbolo E( ) indica o operador esperança ou expectativa matemática. Sendo X e Y variáveis 
aleatórias, a expressão abaixo nem sempre válida é:
E(XY) = E(X) E(Y)
211. Marque a alternativa correta em relação ao modelo probabilístico que mais se adequa ao 
seguinte caso: lançamento de uma moeda honesta, contando o número de casos até a realização 
da primeira coroa.
Geométrica
212. Em uma população finita de tamanho N, onde existem k indivíduos com uma característica de 
interesse, ao se selecionar uma amostra aleatória de tamanho n sem reposição, o número de 
indivíduos com a característica na amostra (R) é uma variável aleatória com distribuição 
hipergeométrica. A probabilidade de se ter exatamente r indivíduos na amostra com a 
característica de interesse é dada por:
II e IV
Programação em Python Para Análise de Dados
Marcio Quirino - 64 
213. Considere duas variáveis aleatóriasdiscretas X e Y, ambas com distribuição binomial. Sabe-se 
que: X: b (2, p) e Y: b (4, p). Se P (X≥ 1) = 5/9 então P (Y = 1) é:
32/81
214. Um restaurante popular em uma cidade recebe diariamente um grande número de clientes 
para suas refeições. A administração está interessada em estudar a ocorrência de um evento 
específico: o número de vezes que um cliente derruba um utensílio durante o horário do almoço. 
O processo de Poisson é utilizado para modelar esse evento, considerando que ele ocorre em 
intervalos contínuos de tempo. Qual dos seguintes exemplos se encaixa como um processo de 
Poisson?
I. Número de acidentes de trânsito por mês em uma cidade.
II. Número de encomendas online recebidas por hora em uma loja virtual.
III. Número de pacotes de correspondência extraviados por dia em um centro de distribuição.
IV. Número de gols marcados por partida em um campeonato de futebol.
V. Número de erros ortográficos por página em um livro.
É correto o que se afiram afirma apenas em:
l, II, III e V
215. Um fabricante de smartphones deseja analisar a vida útil de suas baterias em horas de uso. 
Para isso, coletou dados sobre o tempo de duração das baterias de uma amostra de smartphones. 
Qual das alternativas abaixo melhor representa a natureza da esperança matemática nesse 
contexto?
Média aritmética dos tempos de duração das baterias da amostra.
216. Em um grupo de pessoas, suas massas foram medidas e normalmente distribuídas. A média 
da massa de grupo é de 70kg, e a variância é de 5kg2. A probabilidade de haver uma pessoa com 
massa de 355kg neste grupo é igual a:
18%
217. Uma empresa de delivery de comida oferece um serviço de entrega rápida, em que o tempo de 
entrega varia de forma uniforme entre 20 e 40 minutos. Considerando os conceitos de distribuição 
uniforme, qual das alternativas abaixo melhor representa a natureza da variância nesse contexto?
Tempo exato de entrega de um pedido selecionado aleatoriamente.
218. Seja X uma variável aleatória que representa o preço, em reais, do litro da gasolina, com 
função de distribuição acumulada dada por:
A probabilidade de que X seja maior do que R$ 2,50 é:
0,69
Programação em Python Para Análise de Dados
Marcio Quirino - 65 
219. Um estudo foi realizado para analisar a altura de estudantes do último ano do ensino médio de 
uma determinada escola. Considerando a importância da distribuição normal e do Teorema 
Central do Limite, qual das alternativas abaixo melhor representa a natureza da distribuição 
normal nesse contexto?
Probabilidade de um estudante ter uma altura específica.
220. Um site de e-commerce oferece um cupom de desconto para os clientes, em que o valor do 
desconto varia de forma uniforme entre R 10e R 50. Considerando os conceitos de distribuição 
uniforme, qual das alternativas abaixo melhor representa a natureza da função de distribuição 
acumulada nesse contexto?
Probabilidade de um cliente obter um desconto específico.
221. Um sistema de sorteio de prêmios em um evento distribui tickets numerados de forma 
uniforme no intervalo de 1 a 100. Considerando os conceitos de distribuição uniforme, qual das 
alternativas abaixo melhor representa a natureza da esperança matemática nesse contexto?
Média aritmética dos números dos tickets distribuídos.
222. Uma variável aleatória X é uniformemente distribuída no intervalo [1, 5]. A média e a variância 
correspondentes são, respectivamente:
3 e 4/3
223. Um vendedor de sorvetes realiza uma pesquisa para determinar a quantidade de sabores de 
sorvete que cada cliente escolhe. Suponha que a distribuição dessa quantidade seja uniforme no 
intervalo de 1 a 5 sabores. Considerando os conceitos de distribuição uniforme, qual das 
alternativas abaixo melhor representa a natureza da função densidade nesse contexto?
Quantidade exata de sabores de sorvete escolhidos por um cliente selecionado aleatoriamente.
224. A variável aleatória contínua X tem a seguinte função de densidade de probabilidade:
Sendo k uma constante, seu valor é igual a:
5/24
225. Os tempos de vida de um certo tipo de componente eletrônico são exponencialmente 
distribuídos com média de 2000 horas. A probabilidade de que um componente dure mais de 2000 
horas é igual a:
e-1
226. Um estudo foi realizado para analisar o tempo que os passageiros levam para completar uma 
caminhada do terminal de embarque até o portão de partida em um aeroporto movimentado. 
Considerando que o tempo de caminhada pode variar de forma contínua, qual das alternativas 
abaixo melhor representa a natureza da variável aleatória nesse estudo?
Distância em metros percorrida pelos passageiros.
Programação em Python Para Análise de Dados
Marcio Quirino - 66 
227. Em um experimento sobre a altura de uma população de árvores em uma floresta, um 
pesquisador mediu as alturas das árvores selecionadas aleatoriamente. Ele registrou os valores 
em metros. Considerando que a altura das árvores pode variar de forma contínua, qual das 
alternativas abaixo melhor representa a natureza da variável aleatória nesse experimento?
Altura exata de uma árvore selecionada ao acaso.
228. Suponha que um dado justo de seis faces seja lançado. Qual é a probabilidade de que o 
resultado seja um número entre 2 e 4 (inclusive)?
0,50
229. Um dos grandes problemas das grandes cidades é o grande congestionamento. Se 20 carros 
atravessam a Ponte Rio-Niterói, em média, a cada minuto, qual é a probabilidade de 15 ou mais 
carros atravessarem a ponte em um minuto particular?
Aproximadamente 45%.
230. As filas para cadastros dos clientes nos hospitais estão cada dia pior, os clientes chegam nos 
hospitais e precisam fazer um cadastro, muitas vezes demorado e cansativo. Suponha que o 
tempo médio de espera para realizar o cadastro seja de dez minutos. Qual a probabilidade de um 
cliente ser atendido no caixa em menos de 5 minutos?
Aproximadamente 39%.
231. Suponha que, em uma indústria de transformação, determinado produto é produzido e tem 
probabilidade de ser defeituoso com probabilidade de sucesso de 0,9%. Seja uma variável 
aleatória do número de produtos com defeitos em 30 verificações, sendo assim, a distribuição 
será uma binomial com n=30 e p=0,9%. Qual a probabilidade de selecionarmos no máximo uma 
peça defeituosa?
A probabilidade é de aproximadamente 0.97
232. Em uma base dados de preços de um certo produto, existem vários erros de digitação. Para 
auxiliar a encontrá-los seria ideal fazer um gráfico. Qual a função em Python que é utilizada para 
fazer a identificação de distribuição e outliers em dados?
plt.boxplot()
233. O Python possui uma quantidade enorme de base de dados já pré-carregados em sua 
memória. Para esse exercício, você vai precisar carregar uma base de dados chamada Iris. Ela 
apresenta dados sobre algumas espécies de plantas. Assinale a alternativa que apresenta a 
programação necessária para fazer um histograma da variável "tamanho da pétala" (Petal.length) 
apenas para a espécie (Species) do tipo Setosa. Além disso, a cor do histograma deve ser verde, o 
eixo X deve estar no intervalo de (1,2), o rótulo do eixo y deve estar escrito "Frequência", o do eixo 
x escrito "Tamanho da pétala", a fonte ser o "Python" e o título "Histograma do tamanho da Pétala 
para a espécie Setosa
iris = sns.load_dataset("iris")
setosa_petal_length = "setosa", "petal_length"]
sns.histplot(data=setosa_petal_length, color="green")
sns.set(font="Python")
sns.xlabel("Tamanho da pétala")
sns.ylabel("Frequência")
sns.title("Histograma do tamanho da Pétala para a espécie Setosa")
sns.xlim(1, 2)
Programação em Python Para Análise de Dados
Marcio Quirino - 67 
234. Suponha que um dado justo de seis faces seja lançado 10 vezes. Qual é a probabilidade de que 
o número de vezes em que o número 3 aparece seja igual a 2?
0,2907
235. Seja X uma variável dos retornos de uma ação e ela tem uma distribuição normal. Qual é a 
função em Python que é utilizada para calcular a probabilidadede X assumir um valor exato x?
norm.pdf
236. Um analista de dados está trabalhando em um projeto que envolve a análise de dados de 
vendas. Ele precisa criar um gráfico que mostre a distribuição de vendas por categoria de 
produto. Qual a função em Python que ele deve utilizar para plotar esse tipo de gráfico?
plt.bar()
237. A PMC- Pesquisa mensal do comércio, divulga todos os meses o valor comercializado por 
atividade. Suponha que temos os seguintes dados sobre as vendas no comércio por atividade 
para um determinado mês:
Eletrônico: R$ 20.000,00
Roupas: R$ 12.000,00
Alimentos: R$ 8.000,00
Outros: R$ 5.000,00
Qual é o código do Python para gerar um gráfico de setores (ou pizza) mostrando a proporção de 
vendas de cada atividade?
238. Em uma empresa, o departamento de recursos humanos deseja organizar as informações que 
passam em seu setor. O departamento tem um conjunto de dados que representa o salário dos 
funcionários, e deseja criar um gráfico para visualizar a distribuição dos salários. Qual gráfico em 
Python é mais adequado para essa situação?
Boxplot.
239. O Censo Brasileiro começou no ano de 2022, ele abrange toda população brasileira, diversas 
variáveis estão sendo investigadas, dentre elas está a altura da população. Imagine que a altura 
de um grupo de pessoas analisadas segue uma distribuição normal com média 170 cm e desvio 
padrão 10 cm. Qual é a probabilidade de que uma pessoa selecionada ao acaso desse grupo tenha 
altura superior a 185 cm?
0,0668
240. Em um laboratório, os testes para COVID têm uma taxa de precisão de 95%. Qual é a 
probabilidade de uma pessoa testar positivo no teste de COVID?
0,95
241. O Prêmio de seguro é calculado a partir de todo gasto da seguradora. Uma seguradora deseja 
saber o número de acidentes de carro em um bairro, sabendo que o número médio de acidentes 
por dia seja 3. Qual é a probabilidade de ocorrerem 5 acidentes em um dia?
0.1008
Programação em Python Para Análise de Dados
Marcio Quirino - 68 
242. A criação de gráficos em Python é uma ferramenta poderosa para a análise e visualização de 
dados. Utilizando bibliotecas como Matplotlib e Seaborn, é possível apresentar informações de 
maneira visualmente clara e impactante. A escolha do tipo de gráfico deve considerar as 
características dos dados e os insights que se deseja transmitir. Qual gráfico é mais adequado 
para comparar a distribuição de valores entre duas variáveis contínuas em um conjunto de 
dados?
Um scatter plot, pois exibe correlações entre duas variáveis contínuas com clareza.
243. Uma empresa de streaming de música realiza uma pesquisa para analisar a preferência 
musical dos usuários. Considerando a definição de variável aleatória discreta, qual das 
alternativas abaixo melhor representa a natureza da variável aleatória nesse contexto?
Probabilidade de um usuário preferir um determinado gênero musical.
244. A tabela a seguir apresenta a distribuição de frequências associada à duração de chamadas 
telefônicas, em minutos, em uma determinada região.
10,5 e 12,95
245. Em um estudo de biologia marinha, pesquisadores estão interessados em analisar a relação 
entre o tamanho de diferentes espécies de tubarões e sua capacidade de migração. Para isso, 
coletam dados sobre o comprimento (em metros) dos tubarões e categorizam as espécies 
segundo sua distância de migração (curta, média e longa), Com base nessas informações, como 
podemos classificar a variável comprimento dos tubarões e a variável distância de migração das 
espécies?
Comprimento: Quantitativa continua: Distância de migração: Qualitativa ordinal.
246. Um estatístico coleta dados sobre a quantidade de horas que os alunos de uma escola passam 
fazendo lição de casa por semana. Ele deseja sintetizar essas informações para representar um 
valor central que descreva a experiência típica dos alunos. Qual das seguintes medidas ele 
deveria calcular para atingir esse objetivo, considerando que os dados não estão organizados em 
uma distribuição de frequência?
Media, que calcula o valor central somando tocas as horas e dividindo pelo número total de 
alunos.
Programação em Python Para Análise de Dados
Marcio Quirino - 69 
247.
[4,17]
248. Assinale a principal e mais comum preocupação de model os de forma reduzida:
249. (IDECAN/2022) Observe o gráfico do tipo boxplot ou diagrama de caixas abaixo e assinale a 
opção correta a partir do que é mostrado:
Não temos outliers abaixo do limite inferior
250. Companhias de seguros usam cálculos de probabilidade para estimar o risco de sinistros e 
determinar os prêmios de seguro adequados para os clientes. Uma seguradora oferece um 
seguro residencial contra roubo. Dados históricos mostram que, em média, a cada 100 
residências seguradas, 5 são roubadas em um determinado período. Qual é a probabilidade de 
uma residência segurada ser roubada?
5%
251. O tempo necessário para um medicamento contra dor fazer efeito segue um modelo com 
densidade Uniforme no intervalo de 5 a 15 (em minutos). Um paciente é selecionado ao acaso 
entre os que tomaram o remédio. A probabilidade do medicamento fazer efeito em até 10 minutos, 
neste paciente, é:
0,5
252. Um estudante está se preparando para um exame de múltipla escolha. Em cada questão, ele 
pode marcar a resposta correta ou errada. Considerando a distribuição de Bernoulli, qual das 
alternativas abaixo melhor representa a natureza da variável aleatória X nesse contexto?
Probabilidade de o estudante acertar uma questão específica.
Programação em Python Para Análise de Dados
Marcio Quirino - 70 
253. Se queremos fazer um teste de hipóteses para
,onde a distribuição de nossa amostra não 
é conhecida, utilizamos a estatística "A" e a região de aceitação "B" em nosso teste. Sabendo que 
nossa amostra é grande, assinale a alternativa que corresponde ao par correto para "A" e "B".
254. O segundo passo para um desenho de pesquisa utilizando a abordagem estrutural é:
Determinação da variável de interesse dentro do modelo econômico que irá guiar a análise.
255. Em uma pesquisa sobre salários de funcionários de uma empresa, foram coletados os 
seguintes valores mensais: R$ 3.000, R$ 3.500, R$ 4.200, R$ 4.800 e R$ 25.000. Após a análise 
inicial, o professor identificou um valor que pode ser considerado um outlier. Qual dos seguintes 
é o valor que mais provavelmente representa um outlier?
R$ 25.000
256. Verifique quais afirmações são verdadeiras e assinale a alternativa correta:
I - Em um teste de hipóteses, comete-se um Erro Tipo 1 quando se rejeita uma hipótese nula 
verdadeira.
II - O poder de um teste de hipóteses é medido pela probabilidade de se cometer o Erro Tipo 2.
III - A soma das probabilidades dos Erros Tipo 1 e Erro Tipo 2 é igual a 1.
IV - Quanto maior for o nível de significância de um teste de hipóteses, maior será o p-valor a ele 
associado.
Apenas a alternativa I é correta.
257. Assinale a principal e mais comum preocupação de modelos de forma reduzida:
Medir o impacto causal de uma variável em outra.
	Exercícios500 400 10 4000 18
500 ⊢ 1000 750 12 9000 30
1000 ⊢ 2000 150
0
15 22500 45
2000 ⊢ 5000 350
0
5 17500 50
Soma - 50 54600 -
 Calculando a média:
Calculando a mediana:
Calculando a moda:
Veja que a quarta classe é a classe modal, visto que tem a maior frequência absoluta.
Calculando o primeiro quartil:
Programação em Python Para Análise de Dados
Marcio Quirino - 9 
Calculando o terceiro quartil:
18. O rol a seguir representa os valores dos itens vendidos (em reais) em uma loja de produtos 
alimentícios durante um dia de trabalho. 
5, 8, 10, 10, 12, 15, 18, 20, 20, 24, 25, 25, 25, 30, 38, 45, 52, 52, 60, 65, 70, 70, 79, 84, 90 
Qual o desvio-padrão de vendas nesse dia de trabalho?
26,44
Veja que, para determinar o desvio-padrão para dados não agrupados, temos que inicialmente calcular 
a média, que nesse caso é dado por: 
Assim:
19. Considerando o resultado do desvio-padrão obtido na questão anterior, podemos afirmar que:
A dispersão dos itens vendidos em torno da média é de aproximadamente R$ 26,00 reais.
Como vimos, o desvio-padrão é dado por:
Logo, podemos dizer que a dispersão em torno da média para o valor dos itens vendidos é de 
aproximadamente R$26,00 reais.
20. Ainda considerando o enunciado da primeira questão, determine o valor do coeficiente de 
variação.
69,43%
Vimos que, para determinar o Coeficiente de Variação, podemos usar a seguinte expressão:
Programação em Python Para Análise de Dados
Marcio Quirino - 10 
Assim, podemos dizer que esses dados têm uma dispersão relativa em torno da média de 69,43%.
21. A distribuição de frequência a seguir representa a faixa etária de funcionários de certa empresa. 
O desvio-padrão da idade desses funcionários é de aproximadamente:
 Classe Fi
20 ⊢ 30 25
30 ⊢ 40 35
40 ⊢ 50 20
50 ⊢ 60 12
60 ⊢ 70 8
Soma 100
12
Resolução no vídeo 08
22. Considerando o enunciado da questão anterior, qual seria o valor do coeficiente de variação?
31%
Observe que, para o cálculo do coeficiente de variação, precisamos determinar a média. Logo:
Assim,
23. Considerando o resultado obtido do coeficiente de variação da questão anterior, é possível 
afirmar que:
Os dados têm alta dispersão.
24. Considere que os dados informados a seguir se referem à idade dos alunos de duas turmas de 
inglês.
Turma 1: 8, 8, 8, 9, 9, 10, 10, 12
Turma 2: 17, 17, 19, 19, 20, 20, 21, 23
Em qual das duas turmas as idades dos alunos é mais espalhada?
Resolução no vídeo 09
Programação em Python Para Análise de Dados
Marcio Quirino - 11 
25. Foram coletados dados sobre o número de passageiros, em determinada companhia aérea nos 
aeroportos do Brasil, de janeiro a outubro, conforme o quadro a seguir.
 Jan Fev Mar Abr Mai Jun Jul Ago Set Out
8522 12630 7453 6005 5874 6612 8439 7531 6430 4986
O desvio-padrão de passageiros, ao longo desses 10 meses nessa companhia aérea, é de 
aproximadamente:
2144
Note que as informações estão em forma de dados brutos, visto que não seguem uma ordem aparente. 
Desse modo, o cálculo do desvio-padrão é dado por:
26. A distribuição de frequência a seguir representa o lucro líquido de 50 empresas do setor 
petroquímico (em milhares de reais).
 Lucro Líquido (R$) Fi
100 ⊢ 300 8
300 ⊢ 500 10
500 ⊢ 1000 12
1000 ⊢ 2000 15
2000 ⊢ 5000 5
Soma 50
 Com base nesses dados, podemos afirmar que:
O coeficiente de variação é de aproximadamente 87%.
Veja que, para responder a essa questão precisamos determinar a média, o desvio-padrão e o 
coeficiente de variação:
Classe Fi Xi Xi,Fi X2i,Fi
100 (dash) 300 200 8 1600 320000
300 (dash) 500 400 10 4000 1600000
500 (dash) 1000 750 12 9000 6750000
1000 (dash) 2000 1500 15 22500 33750000
2000 (dash) 5000 3500 5 17500 61250000
Soma - 50 54600 103670000
 
Calculando a média:
Calculando a variância
Calculando o desvio-padrão:
Programação em Python Para Análise de Dados
Marcio Quirino - 12 
Calculando o coeficiente de variação:
27. O Python é um poderoso software para cálculo de medidas de tendência Central. Observe os 
dados abaixo com as vendas mensais em milhões, em 2022, dos comércios de uma cidade do 
estado do Rio de Janeiro. Qual a média e a mediana das vendas mensais em milhões, no ano de 
2022, dos comércios dessa cidade? Faça os cálculos no Python.
A média é 61 e mediana 60 das vendas mensais em milhões, no ano de 2022, dos comércios 
dessa cidade.
Primeiro, precisamos entrar com os dados dentro do Python. Para isso, faremos:
import statistics as stats
vendas = [58, 64, 58, 56, 68, 55, 68, 62, 68, 50, 54, 70]
Após a leitura dos dados, podemos calcular as medidas descritivas pedidas, como:
media = stats.mean(vendas)
mediana = stats.median(vendas)
print(media)
print(mediana)
60.91
60 
O resultado encontrado foi que a média é 61 e mediana 60 das vendas mensais em milhões, no ano de 
2022, dos comércios dessa cidade.
Programação em Python Para Análise de Dados
Marcio Quirino - 13 
28. O Python pode ser muito útil para análise exploratória de dados, principalmente na hora de 
resumi-los. Observe os dados abaixo com as vendas mensais em milhões, em 2022, dos 
comércios de uma cidade do estado do Rio de Janeiro. Qual é a frequência relativa de meses com 
as vendas de 68 milhões? Faça os cálculos no Python.
A frequência relativa de meses com as vendas de 68 milhões é 25%.
Primeiro, precisamos entrar com os dados dentro do Python. Para isso, faremos:
import statistics as stats
vendas = [58, 64, 58, 56, 68, 55, 68, 62, 68, 50, 54, 70]
Após a leitura dos dados, podemos calcular as frequências relativas, como:
freq = vendas[0].value_counts()
total = len(vendas)
freq_rel = freq / total
print(freq_rel.round(4))
Gerando, o seguinte resultado:
68 0.2500
58 0.1667
55 0.0833
62 0.0833
56 0.0833
70 0.0833
50 0.0833
54 0.0833
A frequência relativa de meses com as vendas de 68 milhões é 25%.
29. Suponha P(A) = 1/3 e P(B) = 1/2. Se A e B são mutuamente excludentes, determine P(A∪B):
5/16
Resolução no vídeo 0302
Programação em Python Para Análise de Dados
Marcio Quirino - 14 
30. Sabemos que genótipos de certa característica humana são formados pelos elementos AA, Aa, 
aA e aa, sendo “AA” o gene dominante e “aa” o gene recessivo. Qual é a probabilidade de um 
casal, cujo homem é dominante, e a mulher tem gene Aa, ter um filho com gene dominante?
1/2
Observe que o espaço amostral, que é o conjunto de todos os possíveis resultados, é formado pelos 
seguintes elementos quando fazemos as combinações dos pares AA e Aa: S = {(AA), (Aa), (AA), (Aa)}
Assim, considere o evento A: “Ter um filho com gene dominante”. Dessa maneira, segundo o conceito 
de probabilidade frequentista:
31. Suponha que um casal quer ter 3 filhos: 1 menino e 2 meninas. Qual é a probabilidade de que isso 
ocorra?
3/8
Resolução no vídeo 0303
32. Um número é escolhido aleatoriamente entre os números 1, 2, 3, ..., 100. Qual é a probabilidade de 
que esse número seja divisível por 7?
7/50
Já sabemos que nosso espaço amostral é composto por esses 100 números. Portanto, n(S) = 100. 
Agora, vejamos o evento de interesse.
Seja A: “O número escolhido é divisível por 7”, então:
Logo:
Assim, para cada 50 números escolhidos, 7 são divisíveis por 7.
33. Considerando o enunciado da questão anterior, qual é a probabilidade de esse número ser 
primo?
1/4
Seja P: “O número escolhido é primo”, logo:
n(A) = {2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47, 53, 59, 61, 67, 71, 73, 79, 83, 89 e 97}
 Então:
Programação em Python Para Análise de Dados
Marcio Quirino - 15 
Assim, para cada 4 números escolhidos, 1 é número primo.
34. O estudo antropométrico em uma amostra de 100 funcionários de determinada empresa resultou 
na seguinte tabela, que relaciona os pesos com as alturas:
 Abaixo de 1,70m Acima de 1,70m
Abaixo de 80kg 30 15
Acima de 80kg 10 45
Tabela: Estudo antropométrico. Paulo H. C. Maranhão
Considerando que um funcionário foi escolhido aleatoriamente, qual é a probabilidade de que ele 
tenha peso abaixo de 80kg e altura abaixode 1,70m?
3/10
Seja o evento A: “Ter peso abaixo de 80kg”, portanto:
Portanto, a cada 10 funcionários, 3 têm peso abaixo de 80kg.
35. Um professor usa dois dados não viciados para um experimento. Um dos dados tem o formato de 
um octaedro, com faces numeradas de 2 a 9; o outro, um dado comum, cúbico, possui as faces 
numeradas de 5 a 10. 
Modele um espaço amostral para determinar a probabilidade de, em uma jogada simultânea dos 
dois dados, se obter: 
1) O mesmo número nos dois dados.
2) A soma das faces igual a 7.
Resolução no vídeo 0304
36. Uma fábrica têxtil produz lotes de 100 camisas. Sabemos que, em geral, cada lote apresenta 5 
camisas com defeitos no tamanho, e 7 delas têm defeito no fio. Uma camisa é escolhida ao acaso. 
Qual é a probabilidade de que ela tenha defeitos?
3/25
Sejam os eventos A: “camisas com defeitos no tamanho” e B: “camisas com defeitos no fio”. Observe 
que não temos camisas com os dois tipos de defeito. Assim, podemos afirmar que os eventos são 
disjuntos:
Programação em Python Para Análise de Dados
Marcio Quirino - 16 
37. Vamos retomar o enunciado de um exercício feito ao longo do conteúdo.
O estudo antropométrico em uma amostra de 100 funcionários de determinada empresa resultou 
na seguinte tabela, que relaciona os pesos com as alturas:
 Abaixo de 1,70m Acima de 1,70m
Abaixo de 80kg 30 15
Acima de 80kg 10 45
Tabela: Estudo antropométrico. Paulo H. C. Maranhão
Considerando que um funcionário foi escolhido aleatoriamente, qual é a probabilidade de que ele 
tenha altura acima de 1,70m?
0.60
Seja o evento B: “Ter altura acima de 1,70m”, então:
38. Qual é a probabilidade de formarmos um código que contenha 2 números e 3 letras, de modo que 
não tenha nem números nem letras repetidas?
135/169
Apesar de a ideia de probabilidade frequentista estar sempre presente nas soluções de problemas que 
envolvem probabilidade, para encontrarmos o número de eventos no qual estamos interessados, 
poderemos recorrer a técnicas de contagem, como no caso desta questão.
 Assim, definimos o evento A como “Formar um código que contenha 2 números e 3 letras, de modo que 
não tenha nem números nem letras repetidas”.
 Dessa forma, considerando que podemos atribuir 10 números e 26 letras para o código, temos:
39. Suponha que, em um congresso, tenhamos 20 engenheiros e 10 matemáticos. Desejamos formar 
uma comissão com 5 congressistas para compor a organização do próximo congresso. Qual é a 
probabilidade de que essa comissão seja formada por 3 engenheiros e 2 matemáticos?
0,36
Para resolver este problema, podemos utilizar os conceitos de combinação – tópico inerente à análise 
combinatória.
 Primeiro, vamos fazer o cálculo do total de comissões satisfatórias.
Seja o evento A: “Formar comissão com 3 engenheiros e 2 matemáticos”. Veja que, para escolher 3 
engenheiros, escolheremos dos 20 existentes. Portanto, combinação de 20 escolhe 3.
 O mesmo raciocínio vale para a escolha dos 2 matemáticos: combinação de 10 escolhe 2, portanto:
Programação em Python Para Análise de Dados
Marcio Quirino - 17 
Por isso: n(A) = 51300.
Agora, vamos fazer o cálculo do total de comissões possíveis:
Logo: n(S) = 142506.
Por fim, vamos fazer o cálculo da probabilidade:
Assim sendo, a chance de termos uma comissão formada por 3 engenheiros e 2 matemáticos é de, 
aproximadamente, 36%.
40. Em uma classe, existem 3 alunos com média geral acima de 9, 7 alunos com média geral entre 7 e 
9, e mais 5 alunos com média geral abaixo de 7. Qual é a probabilidade de que, se selecionarmos 
5 alunos, 2 tenham média geral entre 7 e 9, 2 tenham média geral abaixo de 7, e 1 tenha média 
geral acima de 9?
0,210
Este problema segue a mesma ideia do exercício anterior. Dessa forma, seja o evento A: “Selecionar 5 
alunos, sendo que 2 têm média geral entre 7 e 9, 2 têm média geral abaixo de 7, e 1 tem média geral 
acima de 9”, então:
Por isso, a chance de esse evento ocorrer é de, aproximadamente, 21%.
41. Uma urna contém 6 bolas gravadas com as letras D, L, N, N, O, O. Extraindo as bolas uma por 
uma, sem reposição, a probabilidade de obtermos a palavra LONDON é:
1/180
Resolução no vídeo 0305
Programação em Python Para Análise de Dados
Marcio Quirino - 18 
42. Um jogo consiste em lançar uma moeda honesta até obter 3 caras consecutivas. Na primeira 
situação, quando obtemos 3 caras consecutivas, ganhamos o jogo. Qual é a probabilidade de 
que o jogo termine no terceiro lance?
1/8
Este é o típico caso em que podemos utilizar o diagrama de árvore para resolver a questão:
Observe que a sequência em vermelho é aquela em que o jogo termina no terceiro lance. Como em 
cada lançamento as probabilidades são as mesmas, ou seja, 1/2, temos que, para terminar no terceiro 
lançamento, a probabilidade será (1/2)3, que é igual a 1/8.
43. Observamos que uma academia recebe, por hora, cerca de 200 clientes. Destes:
• 90 se dirigem ao setor de musculação.
• 80, ao setor de piscinas.
• 75, ao setor de atividades aeróbicas.
• 30, aos setores de musculação e de piscinas.
• 30, aos setores de musculação e de atividades aeróbicas.
• 25, aos setores de piscinas e atividades aeróbicas.
Sabemos, ainda, que 20 clientes se dirigem a outros setores que não musculação, piscinas ou 
atividades aeróbicas, e que 10 clientes se dirigem aos três setores. Qual é a probabilidade de que 
um cliente da academia se dirija exclusivamente à musculação?
1/5
Resolução no vídeo 0306
44. Estatísticas apontam que 5 entre 6 brasileiros sonham em ganhar na Mega-Sena. Usando 
probabilidade, mostre por que a Mega-Sena é considerada um jogo de azar.
Resolução no vídeo 0307
Programação em Python Para Análise de Dados
Marcio Quirino - 19 
45. Dos 10 professores de uma universidade que se candidataram a uma promoção, 7 têm pós-
doutorado e os demais não. Selecionando aleatoriamente 3 desses candidatos para determinada 
avaliação, a probabilidade de que exatamente 2 tenham pós-doutorado é:
0,525
Seja o evento A: “Selecionar 3 candidatos dos quais exatamente dois tenham pós-doutorado”, assim:
46. Os estágios foram classificados em 3 grupos, dependendo do tempo de duração. São eles:
• Estágios de curta duração – Tempo de duração inferior a 80 horas.
• Estágios de média duração – Tempo de duração com mais de 80 horas e menos de 300 horas.
• Estágios de longa duração – Demais estágios.
Experiências anteriores estimam que as probabilidades de se conseguir um estágio de curta, 
média e longa duração são, respectivamente, 0,5, 0,3 e 0,2.
 
Selecionando k estagiários, a probabilidade de haver x estagiários de curta duração, y 
estagiários de média duração e z estagiários de longa duração, sendo x+y+z=n e x>0,y>0 e z>0, é:
Para resolver esta questão, lembre-se da permutação com repetição, a fim de determinar o número de 
maneiras para escolher n elementos, dos quais x são iguais, y são iguais e z são iguais, que é dada por:
Agora, multiplique por suas respectivas probabilidades elevadas ao número de elementos de cada 
estágio ou repetição. Assim, essa probabilidade é:
Programação em Python Para Análise de Dados
Marcio Quirino - 20 
47. A probabilidade de um físico resolver uma questão de cálculo é de 3/4, e a de um engenheiro 
resolver a mesma questão é de 5/7. Qual é a probabilidade de a questão ser resolvida?
13/14
Sejam os eventos A: “O físico resolve a questão” e B: “O engenheiro resolve a questão”.
 Veja que os eventos A e B são independentes, pois o fato de o físico resolver a questão não interfere no 
fato de o engenheiro resolver a questão. Logo:
48. Considere as informações da tabela a seguir, que trata da preferência de duas marcas de um 
produto de beleza por sexo:
Preferência Sexo
Homens Mulheres
Marca A 7 3
Marca B 8 12
Tabela: Preferências. Paulo H. C. Maranhão
Houve a seleção de uma pessoa ao acaso. Qual é a probabilidade de essa pessoa ser mulher ou 
preferir a marca A?
11/15
Resolução no vídeo 0308
49. Considerando os dados da questão anterior, oseventos “preferir a marca A” e “ser mulher” são 
independentes?
Não
Considere novamente os eventos A: “Preferir a marca A” e M: “Ser mulher”. Para que os eventos sejam 
independentes, devemos saber que:
Mas vimos que
Logo:
Portanto, A e B não são independentes.
Programação em Python Para Análise de Dados
Marcio Quirino - 21 
50. Considerando novamente os dados da questão 2, qual é a probabilidade de a pessoa selecionada 
preferir a marca B e ser homem?
4/15
Sejam os eventos B: “Preferir a marca B” e H: “Ser homem”, assim:
51. Uma gaveta contém 3 moedas de 1 real e 2 moedas de cinquenta centavos. Retiramos de uma 
caixa duas moedas de forma sucessiva e com reposição. Qual é a probabilidade de a primeira 
moeda ser de 1 real, e a segunda ser de cinquenta centavos?
6/25
Considere os eventos Ai: “A moeda na i-ésima retirada é de 1 real” e Bi: “A moeda na i-ésima retirada é 
de cinquenta centavos”.
Observe que, como a retirada é sem reposição, a retirada da primeira moeda não afeta a probabilidade 
da segunda. Por isso:
52. As probabilidades de dois times cariocas, A e B, jogando contra times paulistas, vencerem suas 
partidas, é de 1/3 e 2/5, respectivamente. Sabemos, ainda, que a probabilidade de os dois times 
empatarem seus jogos com times paulistas é igual a 1/3.
Se A e B jogam uma partida no mesmo dia contra adversários paulistas diferentes, qual a 
probabilidade de que ambos vençam suas respectivas partidas?
2/15
Resolução no vídeo 0309
53. Uma pesquisa eleitoral apresenta o resultado da preferência para presidente segundo a classe 
social. Os dados estão apresentados na tabela a seguir:
Houve a seleção de um eleitor ao acaso. Qual é a probabilidade de esse eleitor ser da classe C ou 
preferir o candidato X?
Resolução no vídeo 0310
Programação em Python Para Análise de Dados
Marcio Quirino - 22 
54. Se P(A)=1/2 e P(B)=1/4, e A e B são independentes, determine P[(A∪B)c], em que (A∪B)c é o 
complemento do evento A∪B
3/8
Vamos ao raciocínio:
Mas como A e B são independentes, temos que: P(A∩B)=P(A)⋅P(B). Logo:
Portanto:
55. Considerando a questão anterior, qual é a P(A∩B).
1/8
Como A e B são independentes, temos que: P(A∩B)=P(A)⋅P(B), então:
56. 50 amostras de um material foram analisadas quanto à resistência ao choque e resistência ao 
arranhão. Os resultados obtidos estão dispostos na tabela a seguir:
Resistência ao 
arranhão
Resistência ao choque
Baixa Total 
Alta 40 5 45
Baixa 2 3 5
Total 42 8 50
Tabela: Resultados obtidos. Paulo H. C. Maranhão
Determine a probabilidade de termos uma resistência ao arranhão alta, dado que a resistência ao 
choque é baixa:
5/8
Resolução no vídeo 0311
Programação em Python Para Análise de Dados
Marcio Quirino - 23 
57. Considerando os dados da questão anterior, calcule a probabilidade de termos uma resistência 
ao choque alta, dado que a resistência ao arranhão é baixa:
2/5
Considerando os eventos da questão anterior, temos que Ac: “Ter resistência ao arranhão baixa” e Bc: 
“Ter resistência ao choque alta”. Assim, a probabilidade pedida é:
58. Em um lote com 50 parafusos, 5 são considerados defeituosos. Se retirarmos 2 parafusos, um 
após o outro, sem reposição, qual será a probabilidade de que ambos sejam defeituosos?
2/245
Seja o evento D: "O parafuso é defeituoso". Desse modo, o que queremos determinar é P(D1∩D2). 
Então, usando o teorema do produto, temos:
59. Uma caixa contém bolas, das quais 4 são azuis e 3 são verdes. Retiramos 2 bolas, sem reposição. 
Qual é a probabilidade da segunda bola retirada ser azul?
4/7
Resolução no vídeo 0312
60. A fábrica A produziu 500 componentes eletrônicos, e a fábrica B produziu 1000 desses 
componentes. Sabemos que, de um lote de 100 componentes retirados da fábrica A, 5 estavam 
com defeito, e que de um lote de 100 componentes retirados da fábrica B, 8 estavam defeituosos.
Escolhemos ao acaso um componente dos 1500 produzidos pelas fábricas A e B. Qual a 
probabilidade de o componente ter sido fabricado por A sabendo-se que o componente é 
defeituoso?
5/21
Sejam os eventos A: “O componente foi produzido pela fábrica A”, B: “O componente foi produzido pela 
fábrica B” e D: “O componente é defeituoso”.
Programação em Python Para Análise de Dados
Marcio Quirino - 24 
61. A probabilidade de um indivíduo da classe A comprar um notebook é 3/4, da classe B, é 1/5, e da 
classe C, é 1/20. As probabilidades de os indivíduos de cada classe comprarem um notebook da 
marca Y são 1/10, 3/5 e 3/10, respectivamente.
Certa loja vendeu um notebook da marca Y. Qual é a probabilidade de que o indivíduo que 
comprou o notebook seja da classe B?
4/7
Sejam os eventos Y: “Comprar um notebook da marca Y”, A: “Classe A”, B: “Classe B” e C: “Classe C”. 
Usando o teorema de Bayes, temos:
62. Sabemos que 60% da população de certa cidade do interior do Brasil é formada por mulheres. 
Sabemos, ainda, que a taxa de desemprego, se o indivíduo for homem, é de 25%, e, se for mulher, 
é de 20%. Sabendo que o indivíduo está desempregado, qual é a probabilidade de ele ser 
homem?
Resolução no vídeo 0313
63. Em certa empresa, 10% dos homens e 5% das mulheres ganham mais de 10 salários mínimos. 
Além disso, 60% dos empregados são homens. Se estivéssemos interessados em determinar a 
probabilidade de que o empregado seja mulher, dado que ganha mais de 10 salários mínimos, 
que teorema de probabilidade seria usado para resolver a questão?
Teorema de Bayes.
Observe que queremos determinar a probabilidade de que o empregado seja mulher, dado que ganha 
mais de 10 salários mínimos. Como conhecemos as probabilidades individuais do sexo dos empregados 
e as probabilidades condicionais dos empregados que ganham mais de 10 salários mínimos dado o 
sexo, o teorema mais apropriado para resolver a questão seria o teorema de Bayes.
64. Um grupo de 100 clientes de uma empresa de telefonia está dividido por sexo e pelo plano (pré-
pago e pós-pago), de acordo com a tabela a seguir:
 Pré-pago Pós-pago
Homens 15 33
Mulheres 17 35
Tabela: Divisão de clientes. Paulo H. C. Maranhão
Um cliente foi sorteado ao acaso. Qual é a probabilidade de esse cliente ser homem, dado que 
pertence ao plano pré-pago?
15/32
Considere os eventos H: “O cliente é homem” e P: “O cliente pertence ao plano pré-pago”, logo:
Programação em Python Para Análise de Dados
Marcio Quirino - 25 
65. (Adaptado de ANPEC) Considere as alternativas abaixo e assinale a incorreta:
Como vimos neste módulo, toda probabilidade condicional também é uma probabilidade; portanto, os 
três axiomas da probabilidade também valem para ela. A letra "a" nada mais é do que o segundo axioma 
da probabilidade.
Pela lei da probabilidade condicional, sabemos que:
Desse modo, a letra "b" também está correta. Graças a essa lei, também estamos cientes de que:
Portanto, a letra "c" está incorreta.
Sabendo que P(A∣B)=0,2 e P(B)=0,8, podemos fazer substituições na equação da probabilidade 
condicional para obtermos isto: P(A∩B)=0,16.
Desse modo:
A alternativa "d" é verdadeira. Por fim, pela Lei de De Morgan, AC∪BC=(A∩B)C. Já pela lei da 
probabilidade condicional, verificamos que P(A∩B)=0,2⋅0,6=0,12.
 Sabemos, assim, que:
E, por fim, vemos que:
66. (ANPEC − 2015) Em determinada cidade, 60% dos moradores são mulheres e 40%, homens. Entre 
elas, 80% estão empregadas e 20%, desempregadas. Já entre eles, 90% estão empregados e 10%, 
desempregados. Obtenha a probabilidade de uma pessoa escolhida aleatoriamente nessa cidade 
ser mulher e estar desempregada.
0,75
 Empregado
s
Desempregado
s
Tota
l
Homens 0,36 0,04 0,4
Mulheres 0,48 0,12 0,6
População 0,84 0,16 1
Programação em Python Para Análise de Dados
Marcio Quirino - 26 
total
Queremos a probabilidade de ser mulher dado que está desempregada:
Essa probabilidade é igual a 0,12. Já a de ser desempregada é igual a 0,16.
Desse modo, a probabilidade de ser mulher dado que está desempregada é igual a 0,12/0,16 = 0,75.
67.(ANPEC − 2006) Em uma região, 25% da população é pobre. As mulheres constituem 75% dos 
pobres e 50% da população. Calcule a proporção de pobres entre elas.
0,375
Pobre
s
Não 
pobres
Tota
l
Homens 1/16 7/16 1/2
Mulheres 3/16 5/16 1/2
População 
total
1/4 3/4 1
Eis a probabilidade de ser mulher:
Vejamos agora a probabilidade de ser mulher e pobre:
Queremos calcular P(P | M). Sabemos que:
Veremos, portanto, que:
68. Um lote contém 10 peças, sendo 7 boas (B) e 3 com defeito (D). Ao acaso, duas peças são 
retiradas, sem reposição, para uma inspeção. Qual é a probabilidade de se obter duas peças 
defeituosas?
1/15
A probabilidade de sair uma peça defeituosa na primeira retirada é igual a: P(D1)=3/10.
Além disso, dado que, na primeira retirada, já saiu uma peça defeituosa, a probabilidade de que saia 
outra com defeito na segunda retirada é igual a P(D2∣D1)=2/9.
Desse modo:
Programação em Python Para Análise de Dados
Marcio Quirino - 27 
69. Júlia pertence a um grupo de 50 mulheres classificado de acordo com a cor dos cabelos e dos 
olhos de cada uma delas. A tabela a seguir mostra a relação delas segundo suas características:
 Olhos
Cabel
o
Azui
s
Castanho
s
Loira 17 9
Moren
a
4 14
Ruiva 3 3
 Quando João encontrou Júlia, seus cabelos estavam completamente molhados da chuva, mas 
ele notou que ela tinha olhos castanhos. Qual é a probabilidade de Júlia ser morena?
7/13
O primeiro evento de interesse é ter olhos castanhos: C. A probabilidade de ocorrer C é dada pela soma 
daquelas com olhos dessa cor dividido pelo número de mulheres:
O segundo evento, por sua vez, é ser morena: M. A probabilidade de ser morena é dada pelo número 
daquelas que o são dividido pelo total de mulheres:
Já a probabilidade de ser morena e ter olhos castanhos é dada por:
Com isso, utilizando nossos conhecimentos de probabilidade condicional, verificamos que:
70. Um grupo de três pessoas é formado pela escolha aleatória de cinco indivíduos: Júlio, Pedro, 
Rafael, Joana e Fernanda. Se Joana não pertence ao grupo, qual é a probabilidade de Rafael 
pertencer?
3/4
No todo, temos:
Há 10 possíveis grupos formados por três pessoas sabendo que há cinco delas.
Nosso primeiro evento é o número de grupos em que Joana não participa:
Assim:
Programação em Python Para Análise de Dados
Marcio Quirino - 28 
Já o segundo evento de interesse é o número de grupos em que Rafael é membro:
Desse modo:
Sendo JC∩R igual aos grupos que não têm Joana, mas têm Rafael, vemos que:
Sabemos, assim, que:
71. Considere uma empresa que possua 230 funcionários homens e 80 mulheres. Dos que são 
homens, 46 foram promovidos, de forma que os 184 restantes não o foram. Dentre as mulheres, 8 
foram promovidas, enquanto as demais permaneceram em seus cargos.
Buscando estudar desigualdade de gênero no mercado de trabalho, uma aluna de economia quer 
calcular a probabilidade de um funcionário do sexo masculino ser promovido. A aluna montou a 
seguinte tabela para ajudá-la. Qual seria a resposta encontrada por ela?
 Promovido
s
Não 
promovidos
Tota
l
Homens 46 184 230
Mulhere
s
8 72 80
Total 54 256 310
Para saber a probabilidade de um homem ser promovido, é preciso que ela obtenha a probabilidade 
condicional de um funcionário sê-lo dado que ele é homem.
 A ideia por trás da probabilidade condicional é que apenas os casos favoráveis ao evento condicionante 
(B = ser homem) passam a ser os casos possíveis. Portanto, a probabilidade de A dado B é igual ao 
número de homens promovidos (46) dividido pelo número total deles (230): 46/230 = 0,2.
 Para vermos como a condicional é distinta da probabilidade de interseção, suponhamos que a aluna 
queira calcular a probabilidade de um funcionário ser homem e ser promovido. Diretamente da tabela, 
vemos que 46 indivíduos satisfazem a ambas as condições, isto é, A = “ter sido promovido e B = “ser 
homem”.
 Dessa forma, verificamos que:
72. Considere o lançamento de dois dados no qual o evento A signifique uma soma das faces deles 
igual a 6 e o evento B, um resultado par apresentado por ambos. Qual é a probabilidade de a 
soma das faces ser igual a 6 dado que os números são pares?
Programação em Python Para Análise de Dados
Marcio Quirino - 29 
2/9
Para cada dado, existem seis possibilidades de resultado. Como temos dois dados, elas são 36, uma 
vez que, para cada possibilidade do primeiro, há seis possibilidades do segundo.
 Para encontrarmos P(A), precisaremos obter as combinações que somam seis:
(5,1); (4,2); (3,3); (2,4); (1;5)
Ou seja, P(A)=5/36.
 As possíveis combinações nas quais os dois dados dão um resultado par estão expressas a seguir:
(6,6); (6,4); (6,2); (4,6); (4,4); (4,2); (2,6); (2,4); (2,2)
Ou seja, são nove eventos. Assim, P(B) = 9/36.
Temos apenas duas opções que atendem simultaneamente aos dois requisitos: (2,4) e (4,2). Assim, 
P(A∩B) = 2/36.
Desse modo:
73. (UFRJ − Probest − P1/2013) Para ser campeão de um torneio de tênis, um jogador precisa vencer 
quatro partidas sucessivas (todas elas eliminatórias). José é um dos participantes. Suas 
probabilidades de vitória em cada partida (caso ele não tenha sido eliminado até então) foram 
estimadas: 80% na 1ª partida, 70% na 2ª, 60% na 3ª (semifinal) e 50% na 4ª (final). Observe que 
elas independem de quem seja o seu adversário em cada partida.
Calcule a probabilidade de José conseguir chegar a uma semifinal dado que ele não será o 
campeão.
0,471
Consideremos o evento de José perder na primeira partida denotado por P1. A probabilidade de derrota 
nessa partida é o evento complementar a ele ganhar.
Assim:
De forma análoga, podemos calcular a probabilidade de ele perder na segunda partida:
Na terceira partida, a probabilidade de derrota é a de ele ganhar na 1ª partida vezes a de ele ganhar na 
2ª multiplicada pela probabilidade de perder na terceira.
Com isso, vemos que:
De forma análoga, a probabilidade de ele perder na final é calculada por:
Programação em Python Para Análise de Dados
Marcio Quirino - 30 
Desse modo, a probabilidade de José ser campeão, P(C), é 0,168. Com isso, a de ele chegar à 
semifinal, dado que ele não é campeão, é dada por esta fórmula:
Sabemos que:
Também sabemos que:
Fazendo a substituição, chegamos a:
74. Suponha dois eventos A e B tais que P(A)=0,3 e P(A∪B)=0,5. Determine o valor de P(B) 
considerando que A e B são mutuamente exclusivos:
0,2
75. Há dois eventos A e B tais que P(A)=0,3 e P(A∪B)=0,5. Determine o valor de P(B) considerando 
que A e B sâo independentes:
2/7
Programação em Python Para Análise de Dados
Marcio Quirino - 31 
76. Suponha que A e B sejam eventos independentes. Observe as afirmativas abaixo e assinale a 
alternativa incorreta:
77. Imagine dois eventos A1 e A2 independentes cujas probabilidades sejam respectivamente 0,1 e 
0,2. Qual é a probabilidade de que nenhum deles ocorra?
0,98
Programação em Python Para Análise de Dados
Marcio Quirino - 32 
78. (ANPEC - 2015) Dois números X e Y são selecionados de forma aleatória entre 0 e 1. A partir daí, 
dois eventos independentes são definidos da seguinte forma: A=Pr[X≥0,5] e B≡Pr[Y≥0,5]. Tendo 
isso em vista, indique a probabilidade Pr[A∣B].
0,5
79. (ANPEC − 2017) Considere dois eventos A e B mutuamente excludentes, sendo P(A) a 
probabilidade de ocorrência de A e P(B) a de ocorrência de B. Assinale a alternativa correta.
Por definição, eventos mutuamente exclusivos são aqueles em que a ocorrência de um impede a de 
outro. Portanto, eventos mutuamente exclusivos não podem ser independentes, o que já torna as 
alternativas "c", "d" e "e" incorretas.
Programação em Python Para Análise de Dados
Marcio Quirino - 33 
 Como a ocorrência de um evento impossibilita a de outro, é impossível que o evento certo ocorra. 
Dessa maneira, a alternativa "b" também está incorreta. Por exclusão, concluímos que a probabilidade 
condicional é zero.
80. Uma fábrica de automóveis possui um lote que contém10 peças, sendo 7 boas (B) e 3 
defeituosas (D). Funcionária da fábrica, Fernanda retira duas peças (ao acaso e com reposição) 
para realizar a inspeção de rotina. Qual é a probabilidade de ela obter duas peças defeituosas?
Como Fernanda retira duas peças com reposição ao acaso, ou seja, após retirar a primeira peça, ela a 
coloca de volta no lote para que possa efetuar a segunda retirada, temos de: 
P(D1)=P(D2)=3/10 e P(B1)=P(B2)=7/10
Como queremos a probabilidade de Fernanda tirar duas peças defeituosas, precisamos encontrar a 
probabilidade de ela retirar uma peça defeituosa na primeira e na segunda retirada. 
Como a primeira e a segunda retiradas são realizadas de maneira independente, verificamos que:
Portanto, a probabilidade de ela retirar uma peça defeituosa nas duas retiradas é igual a 9%.
81. (ANPEC − 2016) Cinco parafusos defeituosos foram misturados com sete outros bons numa 
caixa e vendidos para a instalação de um armário que precisa de quatro deles. Qual é a 
probabilidade de que quatro parafusos defeituosos sejam escolhidos em sequência?
1/99
Programação em Python Para Análise de Dados
Marcio Quirino - 34 
82. O gerente de um posto de gasolina sabe, por experiência, que 80% dos clientes usam cartão de 
crédito quando compram gasolina. Admitindo independência entre as decisões deles sobre a 
forma de pagamento no momento da compra, qual é a probabilidade de os dois próximos clientes 
pagarem pela gasolina com cartão de crédito?
0,64
83. Considere a árvore de probabilidades a seguir. Qual é a probabilidade de ocorrer B dado que 
ocorreu A?
0,3
Programação em Python Para Análise de Dados
Marcio Quirino - 35 
84. (ANPEC − 2013) Uma firma de consultoria econômica possui um modelo para prever recessões. 
O modelo as prevê com probabilidade de 80% quando elas realmente estão a caminho e com uma 
de 10% quando não estão. A probabilidade não condicional de a economia passar por uma 
recessão é de 20%. Se o modelo prevê uma recessão, qual é a probabilidade de que ela realmente 
esteja a caminho? Assinale a alternativa correta:
2/3
Programação em Python Para Análise de Dados
Marcio Quirino - 36 
85. Um aluno de economia da turma de 2024.2 que teve um bom desempenho em probabilidade tem 
90% de chance de ser aprovado no exame da ANPEC para ingresso no mestrado. Caso contrário, 
ele tem apenas 30% de chance. No entanto, apenas 2% dos alunos de 2024.2 tiveram um bom 
desempenho. Qual é a probabilidade de um aluno selecionado ao acaso ter passado na ANPEC?
0,312
86. Um aluno de economia da turma de 2024.2 que teve bom desempenho em probabilidade tem 90% 
de chance de ser aprovado no exame da ANPEC. Caso contrário, ele tem apenas 30% de chance. 
Apenas 2% dos alunos de 2024.2 tiveram um bom desempenho. Se ele passou na ANPEC, qual é 
a probabilidade de esse aluno ter tido um bom desempenho em probabilidade?
0,0577
Programação em Python Para Análise de Dados
Marcio Quirino - 37 
87. As funcionárias de uma companhia dividem-se em três grupos: economistas, engenheiras e 
analistas de sistemas. Essas funcionárias podem ocupar cargos técnicos ou gerenciais. 
Sabemos que 20% das funcionárias são analistas de sistemas; 30%, engenheiras; e 50%, 
economistas. A direção da empresa, por sua vez, é composta por 1% das analistas de sistemas, 
2% das engenheiras e 3% das economistas. Uma funcionária é selecionada aleatoriamente. Qual 
é a probabilidade de que ela seja uma das diretoras da empresa?
0,023
88. As funcionárias de uma companhia dividem-se em três grupos: economistas, engenheiras e 
analistas de sistemas. Essas funcionárias podem ocupar cargos técnicos ou gerenciais. 
Sabemos que 20% das funcionárias são analistas de sistemas; 30%, engenheiras; e 50%, 
economistas. A direção da empresa, por sua vez, é composta por 1% das analistas de sistemas, 
2% das engenheiras e 3% das economistas. Uma funcionária é selecionada aleatoriamente. Dado 
que ela é uma das diretoras, qual é a probabilidade de ela ser engenheira?
0,2609
Programação em Python Para Análise de Dados
Marcio Quirino - 38 
89. Determinada pesquisa eleitoral realizada na eleição presidencial de 2014 propiciou as seguintes 
conclusões:
 37% dos eleitores moram numa região metropolitana (RM);
 Dos que moram numa RM, 10% votariam em Marina Silva;
 Dos que não moram numa RM, 5% pretendiam votar nela.
Escolhido um eleitor ao acaso, podemos calcular a probabilidade:
1. De esse eleitor morar na RM e votar na Marina Silva.
2. De o indivíduo ser eleitor dela.
3. De ele, sabendo que um eleitor vota nela, morar em uma RM.
Resolução 1
Para respondermos a essa pergunta, o que nos interessa é P(M∩R). Podemos então reescrever as 
probabilidades no formato da árvore de probabilidade:
Vemos então que:
Desse modo, a probabilidade de um eleitor escolhido ao acaso morar na RM e votar na Marina Silva é 
3,7%.
Resolução 2
Para calcularmos a probabilidade de o eleitor escolhido ao acaso votar na Marina Silva, temos de achar 
P(M).
Pela lei da probabilidade total, podemos escrever o seguinte:
Pela nossa árvore de probabilidades, sabemos que:
Programação em Python Para Análise de Dados
Marcio Quirino - 39 
Desse modo, vemos que:
Portanto, a probabilidade de um eleitor escolhido ao acaso votar nela é 6,85%.
Resolução 3
Para calcularmos a probabilidade de um eleitor morar em uma RM dado que ele vota na Marina Silva, 
devemos obter P(R∣M).
Pela regra de Bayes, podemos escrever isto:
Substituindo os valores na fórmula, obtemos:
Portanto, a probabilidade de um eleitor morar em uma RM, dado que ele vota na Marina Silva, é de 54%.
Programação em Python Para Análise de Dados
Marcio Quirino - 40 
90. Um teste de laboratório detecta uma doença quando ela está presente em 95% dos casos. 
Contudo, ele também fornece um resultado "falso positivo" para 1% das pessoas saudáveis 
testadas (isto é, se uma pessoa saudável faz o teste, há a probabilidade 0,01 de que o resultado 
dele diga que ela possui a doença, mesmo não a tendo.) Se 0,5% da população tem a doença, qual 
é a probabilidade de uma pessoa, dado que o resultado do teste é positivo, ter a doença?
0,323
91. Durante o mês de julho, a probabilidade de chuva é de 0,3. O Bangu, simpático time do subúrbio 
do Rio de Janeiro, ganha um jogo em um dia de chuva com a probabilidade 0,4 e em um dia sem 
ela com a probabilidade 0,6. Se ele ganhou um jogo em julho, qual é a probabilidade de que tenha 
chovido nesse dia?
2/9
Programação em Python Para Análise de Dados
Marcio Quirino - 41 
92. Um banco oferece seguro residencial que cobre acidentes como incêndio e catástrofe no valor de 
R$100.000,00. Ele cobra do segurado uma taxa anual de R$1.000,00. Sabendo que a probabilidade 
de ocorrer incêndio ou qualquer tipo de catástrofe em um ano é de 0,001, qual será o lucro 
esperado por cliente do banco?
Resolução Vídeo XXX
93. Considere uma moeda honesta. Ela é jogada quatro vezes. Seja X a variável aleatória que 
representa o número de caras. Quais os possíveis valores dessa variável aleatória?
Veja que, ao lançar uma moeda quatro vezes, podem ocorrer de 0 a 4 faces cara!
94. Considerando o enunciado anterior, qual seria o valor esperado do número de caras?
2
Veja o feedback completo no Solucionário, disponibilizado no campo preparação.
95. Um jogador participa de um jogo de aposta que consiste em lançar um dado. Se o dado resultar 
em face 6, ele ganha R$10,00, caso contrário, ele perde R$5,00. Depois de duas rodadas, ou seja, 
de lançarmos o dado duas vezes, qual a probabilidade desse jogador ter ganho positivo?
11/36
96. Considerando o enunciado anterior, qual seria o ganho esperado do jogador?
-5
97. Suponha que uma variável aleatória tenha a seguinte distribuição de probabilidade:
X 0 1 2 3
P(X=x
)
0,
1
0,
3
0,
4
0,
2
Tabela: Dados do exercício. Paulo H. C. Maranhão
Determine a função de distribuição acumulada para X=2.
0,8
98. Considerando o enunciado anterior,qual seria a variância da variável aleatória X?
0,81
99. Uma família pretende ter 3 filhos. Supondo que a chance de ter um menino é a mesma de ter uma 
menina e sendo X a variável aleatória que representa o número de meninas, determine a chance 
de X ser no mínimo igual a 2.
1/2
100. Um estudante pode escolher no mínimo uma disciplina e no máximo 4 disciplinas para fazer 
no semestre. A probabilidade de que o estudante escolha 1, 2, 3 ou 4 disciplinas no semestre é 
de, respectivamente, 1/20, 1/4, 2/5 e 3/10. Sabendo que para cada disciplina escolhida ele paga 
R$300,00, qual a despesa esperada desse estudante?
885
101. Um dado é lançado uma única vez. Seja a variável aleatória X que representa a retirada de um 
número par nesse único lançamento. Qual o valor esperado de X?
Programação em Python Para Análise de Dados
Marcio Quirino - 42 
1/3
102. Uma moeda não viciada é lançada 10 vezes. Determine a probabilidade de se obter exatamente 
2 caras.
0,04
103. Considerando o enunciando da questão anterior, a probabilidade de obtermos no mínimo 2 
caras é aproximadamente:
0,99
104. Um casal quer ter 5 filhos. Qual a probabilidade que, desses 5 filhos, no máximo um seja 
menino? Admita que a probabilidade de nascer menino seja igual a de nascer menina.
0,188
105. Em uma fábrica de dispositivos eletrônicos, 2% da produção é formada por itens defeituosos. 
Um lote é aceito pelo comprador se tiver no máximo 3% dos dispositivos defeituosos. Admita que 
um lote tenha 100 dispositivos. Qual a probabilidade de o comprador rejeitar o lote?
0,14
106. Considerando o enunciado da questão anterior, determine o número médio de dispositivos 
eletrônicos defeituosos em 10 lotes.
20
107. Uma fábrica de motores de ventiladores monta 120 motores por mês e separa 20 itens para 
inspeção. Sabe-se que, dos motores montados mensalmente, 6 não funcionam. Qual a 
probabilidade de todos os motores inspecionados funcionarem bem?
0,36
108. Uma companhia realiza inspeção em carregamentos de fornecedores, de modo a determinar 
produtos não conformes. Considere que um lote contenha 1000 itens, sendo 1% dos produtos 
não conformes. Qual é o tamanho necessário da amostra, de modo que a probabilidade de 
escolher, no mínimo, um item não conforme na amostra, seja no mínimo 0,90?
229
109. No lançamento de um dado, qual a probabilidade de ter que lançá-lo quatro vezes para se obter 
face dois pela primeira vez?
0,1
110. A probabilidade de encontrar um determinado produto na prateleira de um supermercado é de 
1/3. Qual é a probabilidade de ter que ir ao supermercado, no máximo, duas vezes para encontrar 
o produto pela primeira vez?
5/9
111. Considerando os dados da questão anterior, qual seria a média e a variância, respectivamente, 
de idas ao supermercado?
3 e 6
112. Uma urna contém 10 bolas brancas e 20 bolas pretas. Retira-se uma amostra de 5 bolas sem 
reposição. Qual a probabilidade de que essa amostra tenha 2 bolas brancas?
0,25
Programação em Python Para Análise de Dados
Marcio Quirino - 43 
113. Sabe-se que 10% das peças produzidas por determinada máquina são defeituosas. Retira-se 
uma amostra de tamanho 30 de uma população de 150 peças produzidas em um dia. Qual a 
probabilidade de que 5 peças sejam defeituosas?
0,10
114. Considerando o enunciado da questão anterior, determine a média de peças defeituosas na 
amostra.
3
115. Nos aeroportos de certo país, a probabilidade de um metal pequeno não ser detectado no raio-
X é de 0,2. Um passageiro que está viajando pelo modal aéreo, nesse país, vai fazer várias 
conexões. Sabe-se que ele esqueceu uma moeda no bolso. Qual a probabilidade de que o 
passageiro só tenha a moeda detectada no terceiro raio-X?
0,03
116. Um estacionamento de um centro comercial tem capacidade para 180 carros, sendo 30 vagas 
para idosos. Sabendo que 20 vagas estão ociosas nesse estacionamento, qual a probabilidade 
de que 3 dessas vagas sejam de idosos?
0,25
117. Um posto policial recebe em média 2 chamadas por dia. Qual a probabilidade de receber 
exatamente 3 chamadas em um dia?
0,18
118. Considerando o enunciado da questão anterior, qual seria a probabilidade desse posto 
receber 7 chamadas em uma semana?
0,02
119. Um jornal registra em média 3 erros ortográficos a cada 5 páginas impressas. Qual a 
probabilidade de que um jornal com 30 páginas contenha exatamente 8 erros?
0,004
120. Considerando o enunciado da questão anterior, qual seria a probabilidade desse jornal 
registrar menos de 2 erros em uma página?
0,88
121. Uma ouvidoria recebe 5 reclamações por hora. Qual a probabilidade de que receba apenas 
uma reclamação em 10 minutos?
0,36
122. Uma firma visita os clientes que compraram o seu produto. Se a probabilidade de defeito do 
produto for de 0,01, qual a probabilidade de que em 1000 visitas ocorram no mínimo 3 defeitos?
0,997
123. Suponha que a incidência de determinada doença na população seja de 1 caso a cada 100.000 
habitantes. Em uma cidade de 500.000 habitantes, determine a probabilidade de se encontrar 
exatamente 2 casos dessa doença na referida cidade.
0,08
Programação em Python Para Análise de Dados
Marcio Quirino - 44 
124. Sabe-se que em média 5 lâmpadas se queimam a cada 1000 lâmpadas testadas. Qual a 
probabilidade de que em um teste de 10.000 lâmpadas, exatamente 40 lâmpadas se queimem?
0,02
125. Seja
Determine o valor de k para que essa função seja, de fato, uma função densidade de 
probabilidade (fdp).
3
126. Considerando os dados da questão anterior, determine a esperança de X.
3/4
127. Seja f(x) a função de distribuição de probabilidade de uma variável aleatória X:
Programação em Python Para Análise de Dados
Marcio Quirino - 45 
2/3
128. Para determinar a função densidade de probabilidade f(x)f(x)f(x) no intervalo (0,1)(0,1)(0,1), 
precisamos derivar a função de distribuição acumulada F(x)F(x)F(x) fornecida.
A função de distribuição acumulada (FDA) é dada por:
Determine a função densidade f(x) no intervalo de (0,1):
129. Considere a seguinte função densidade de probabilidade:
Determine P(0 3).
1/2
134. Considerando o enunciado da questão anterior, qual seria o valor da média de X?
3
135. Os comprimentos dos eixos dos carros (em metros) de uma indústria automobilística são 
uniformemente distribuídos no intervalo [1,4; 2,6]. Qual a proporção de carros com eixos abaixo 
de 2 metros?
Programação em Python Para Análise de Dados
Marcio Quirino - 48 
50%
136. Considerando o enunciado da questão anterior, determine a função de distribuição acumulada 
de X.
137. O volume de refrigerante de uma latinha está uniformemente distribuído entre 320 e 330 ml. 
Qual o volume mínimo que está em 90% das latas?
321
138. Considerando o enunciado do mão na massa 5, qual a média e o desvio padrão desse 
refrigerante?
320 e 10
Programação em Python Para Análise de Dados
Marcio Quirino - 49 
139. Suponha que a variável aleatória X tenha uma distribuição uniforme no intervalo de –2 a 2. 
Qual a probabilidade de X ser maior do que 1?
0,25
140. Considerando a questão anterior, indique o valor esperado de X.
0
141. Suponha que X tenha uma distribuição exponencial com parâmetro λ = 1. Qual a probabilidade 
de X ser maior que 2?
0,14
142. Ainda com relação à questão anterior, determine a função de distribuição acumulada quando x 
for igual a 3.
0,95
Programação em PythonPara Análise de Dados
Marcio Quirino - 50 
143. Suponha que X tenha uma distribuição exponencial com média igual a 2. Qual é o parâmetro 
dessa distribuição?
0,5
144. O tempo entre as chamadas para um restaurante é distribuído exponencialmente com um 
intervalo médio de 5 minutos. Qual a probabilidade de não haver chamadas dentro de um 
intervalo de 10 minutos.
0,10
145. Considerando o enunciado da questão anterior, determine a probabilidade de que a primeira 
chamada chegue entre 5 e 15 minutos, depois que o restaurante estiver aberto.
0,32
146. Ainda com relação à questão 4, determine o comprimento de um intervalo de tempo, tal que 
exista a probabilidade de 95% de haver, no mínimo, uma chamada no intervalo.
15
Programação em Python Para Análise de Dados
Marcio Quirino - 51 
147. O tempo entre chegadas de mensagens de um e-mail qualquer é distribuído exponencialmente 
com média de 30 minutos. Qual a probabilidade de não chegar mensagem alguma no período de 
2 horas?
0,02
148. Considerando a questão anterior, determine a probabilidade de não chegar nenhuma 
mensagem nas últimas 3 horas, dado que não chegou mensagem nas últimas 2 horas.
0,002
149. Considere X uma variável aleatória com distribuição normal com média 100 e variância 25, 
ou seja, X∼N(100,25).
Nesse caso, determine a probabilidade de X ser maior do que 110.
0,02
150. A quantidade de leite em uma caixa, produzida por uma indústria de laticínios, segue uma 
distribuição normal com média de 995 ml e variância de 100 ml. Sabe-se que a caixa estoura se 
contiver mais de 1005 ml. Qual é a chance aproximada de uma caixa estourar?
16%
Programação em Python Para Análise de Dados
Marcio Quirino - 52 
151. Considerando a questão anterior, sabe-se que, se a caixa tiver menos de 990 ml, ela é rejeitada 
por certo comprador. Qual o percentual aproximado de caixas que o comprador deve rejeitar?
31%
152. Os funcionários de um departamento executam certas tarefas de acordo com uma distribuição 
normal com média de 2 horas e com desvio padrão de 30 minutos. A probabilidade de que um 
funcionário qualquer execute uma tarefa entre 1h40min e 2h20min é de, aproximadamente:
0,50
153. Uma indústria produz pacotes de biscoito cujo peso, de cada biscoito, segue uma distribuição 
normal, com média de 20 g e desvio padrão de 2 g. Sabe-se que cada embalagem contém 10 
biscoitos e que o peso da embalagem de biscoito sem o biscoito também segue uma distribuição 
Programação em Python Para Análise de Dados
Marcio Quirino - 53 
normal, com média de 10 g e desvio padrão de 1 g. Qual a probabilidade de que um pacote cheio 
pese menos de 200 g?
0,40
154. Sejam X1, X2, X3 e X4 quatro variáveis aleatórias, todas seguindo com distribuição normal 
padrão. Se definirmos uma distribuição t de Student a partir dessas 4 variáveis aleatórias, quais 
serão a média e a variância da distribuição t?
0 e 2
155. Os salários dos funcionários de uma empresa seguem uma distribuição normal com média de 
R$ 3000,00 e desvio padrão de R$ 1.000,00. Qual a probabilidade de que um funcionário sorteado 
ao acaso ganhe mais de R$ 5.500,00?
0,06
156. Sacos de cimento são transportados por caminhões que passam por pesagem na polícia 
rodoviária. Sabe-se que o peso do saco de cimento é normalmente distribuído com média de 20 
kg e desvio-padrão de 1 kg, e que o peso do caminhão também segue uma distribuição normal 
com média de 1 tonelada e desvio-padrão de 100 kg. Sabendo-se que o peso máximo admitido 
para um caminhão trafegar é de 2100 kg e que a polícia aplica uma multa caso o peso ultrapasse 
esse valor, qual a probabilidade de que um caminhão seja multado carregando 50 sacos de 
cimento?
0,025
Programação em Python Para Análise de Dados
Marcio Quirino - 54 
157. O Python é uma linguagem de programação poderosa para análise de dados e possui várias 
bibliotecas especializadas em análise de dados e visualização de informações. Com poucas 
linhas de código, é possível carregar, limpar e manipular dados, realizar análises estatísticas e 
criar visualizações gráficas para apresentar as informações de forma clara e intuitiva. Marque a 
biblioteca que não serve para fazer gráficos.
NumPy
As quatro bibliotecas populares para fazer gráficos em Python são Matplotlib, Seaborn, Plotly e Bokeh. 
A biblioteca NumPy não é utilizada para criação de gráficos, esta é voltada para manipulação de arrays 
numéricos e computação científica em Python.
158. Um analista financeiro deseja criar um histograma em Python utilizando a biblioteca Matplotlib 
para visualizar a distribuição de frequências das vendas mensais de um conjunto de dados. 
Assinale a opção que apresenta a forma correta de criar e exibir o histograma com base em 
conjunto de dados chamados “vendas_mensais”.
plt.hist(vendas_mensais); plt.show()
Para criar um histograma, utilizamos a função plt.hist(), passando como argumento o array de dados 
que queremos analisar. Em seguida, utilizamos a função plt.show() para exibir o gráfico gerado. 
Portanto, a opção correta para criar e exibir o histograma é plt.hist(vendas_mensais); plt.show().
159. A ouvidoria de um dos maiores bancos do Brasil recebe em média 50 denúncias por hora. Qual 
é a probabilidade de que a ouvidoria receba 70 chamadas em uma hora, se a distribuição do 
número de chamadas segue uma variável aleatória discreta Poisson?
0,001
Podemos modelar a situação como uma variável aleatória discreta Poisson, em que a média de 
reclamações por hora é λ = 50 e estamos interessados em saber a probabilidade de receber exatamente 
70 reclamações em uma hora. No Python, temos:
 
Programação em Python Para Análise de Dados
Marcio Quirino - 55 
from scipy.stats import Poisson
lambda_ = 50
prob_70_chamadas = poisson.pmf(70, lambda_)
round(prob_70_chamadas, 3))
 A probabilidade de receber exatamente 70 reclamações em uma hora é de: 0,001.
160. A distribuição binomial é uma distribuição de probabilidade discreta que modela o número de 
sucessos em determinado número de tentativas independentes, cada uma com uma 
probabilidade de sucesso fixa. Qual é a função de probabilidade da variável aleatória discreta 
binomial no Python?
binom.pmf
A função binom.pmf() do pacote SciPy em Python é usada para calcular a função de probabilidade de 
uma variável aleatória discreta binomial. Essa função é usada para calcular a probabilidade de obter
161. O tempo de vida dos aparelhos eletrônicos está ficando cada vez menor. Suponha que o 
tempo de vida de um celular moderno segue uma distribuição exponencial com média de 2 anos. 
Qual é a probabilidade de que um celular selecionado ao acaso tenha tempo de vida inferior a 1 
ano?
0,3935
Podemos modelar a situação como uma variável aleatória contínua exponencial, em que a média é λ = 
1/2, já que a média é o inverso do parâmetro λ da distribuição. No Python temos:
 from scipy.stats import expon
lambda_ = ½
prob_tempo_vida_1_ano = expon.cdf(1, scale=1/lambda_)
round(prob_tempo_vida_1_ano, 4))
A probabilidade de o celular ter tempo de vida inferior a 1 ano é de: 0,3935.
162. A distribuição normal é uma das distribuições mais utilizadas e mais comuns em estatística e 
probabilidade. Ela pode ser modelada no Python usando a biblioteca SciPy. Qual é a função de 
densidade de probabilidade da distribuição normal no Python?
norm.pdf
A função norm.pdf() do pacote SciPy em Python é usada para calcular a função de densidade de 
probabilidade de uma variável aleatória contínua normal. A norm.cdf (cumulative distribution function) é 
usada para calcular a probabilidade a partir da função de distribuição acumulada, por isso está errada. 
As outras alternativas não se referem a uma função.
163. (UFU-MG/2019 - Adaptada) Considere as seguintes variáveis.
l. Tamanho de um objeto (pequeno, médio ou grande)
II. Volume de água em um rio
III. Número de clientes numa fila
IV. Grau de instrução
V. Comprimento de um inseto
VI. Classe Social
Com relação à classificação dos dados requeridoscomo variáveis de pesquisa, é correto afirmar 
que:
as variáveis l, IV e VI são qualitativas
Programação em Python Para Análise de Dados
Marcio Quirino - 56 
164. Considere a amostra de uma variável aleatória, cujos valores estão todos expressos em uma 
mesma unidade. 
Amostra: 36 38 26 40 40 28 46 40 38 28
Sobre essa amostra, temos que:
A mediana é maior do que a média.
165. Observe os dados de produção diária dos 10 primeiros dias do mês de janeiro de uma fábrica 
de peças:
A produção mediana foi de 85 mil unidades; o desvio padrão, aproximadamente 22 mil unidades; 
o total da produção, 1.700.000 unidades. Que códigos no Python estão corretos para esses 
resultados? Os dados foram carregados dessa forma:
dados = [80, 90, 100, 60, 40, 70, 90, 100, 80, 110, 120, 130, 90, 60, 80, 70, 90, 60, 80, 110]
median (dados), std (dados), sum (dados)
166. Um estudo sobre o impacto de diferentes níveis de instrução no acesso a tecnologias digitais 
categoriza os entrevistados em três níveis de instrução e registra o número de dispositivos 
tecnológicos que possuem. Considerando o texto, analise as afirmativas abaixo:
l. Níveis de instrução podem ser classificados como uma variável qualitativa ordinal.
II. A quantidade de dispositivos tecnológicos possuídos é uma variável quantitativa contínua.
III. Variáveis qualitativas como o tipo de dispositivo tecnológico possuído têm ordem natural.
Apenas I está correta.
167. Uma empresa quer promover melhores benefícios a partir da idade dos seus funcionários. Ela 
deseja obter informações estatísticas sobre a idade utilizando a linguagem Python. Qual função e 
biblioteca que pode ser usada para realizar este cálculo?
A função describe() da biblioteca Pandas
Programação em Python Para Análise de Dados
Marcio Quirino - 57 
168. Determine a mediana das seguintes observações: 17, 12, 9, 23, 14, 6, 3, 18, 42, 25, 18, 12, 34, 5, 
17, 20, 7, 8, 21,13, 31, 24, 9.
17
169. Uma grande empresa alimentícia, gostaria de saber a dispersão dos salários de seus 
funcionários, para isso deseja calcular a variância dos salários utilizando a linguagem Python. 
Qual função e biblioteca que pode ser usada para realizar este cálculo?
A função var() da biblioteca NumPy
170. Dadas as informações a seguir:
Assinale a alternativa CORRETA.
O desvio-padrão de X é menor do que o desvio-padrão de Y.
171. A loja de departamento Brasileiras.SA tem uma lista das vendas realizadas por departamento 
da loja, essa empresa deseja as medidas de tendência central para as vendas. Qual biblioteca em 
Python pode ser usada para calcular a média e mediana?
Pandas
172. (EBSERH/2015 - Adaptada) Correlação é uma medida estatística que avalia o grau de 
associação entre duas variáveis. Ela indica a direção e a força dessa relação entre as variáveis, 
permitindo entender se elas estão relacionadas positivamente, negativamente ou se não há 
relação aparente entre elas. Quando dizemos que duas variáveis estão positivamente 
correlacionadas?
Quando valores pequenos de X tendem a estar relacionados com valores pequenos de Y, 
enquanto valores grandes de X tendem a estar relacionados a valores grandes de Y
Programação em Python Para Análise de Dados
Marcio Quirino - 58 
173. Uma empresa de pesquisa de mercado está interessada em analisar a satisfação dos 
consumidores em relação a um novo produto lançado no mercado. Para isso, eles decidem 
coletar dados de uma amostra representativa dos consumidores. A amostra será selecionada de 
forma aleatória, garantindo que todos os possíveis consumidores tenham a mesma chance de 
serem incluídos. Qual é o objetivo de selecionar uma amostra representativa da população nessa 
pesquisa de satisfação dos consumidores?
Assegurar que a amostra reflita as características e opiniões da população como um todo
174. (IBFC/2012) As idades dos funcionários de uma empresa são apresentadas abaixo:
23 - 32 - 47 - 35 -28 -19 -33 - 35 - 21 -27 -26 - 33
A amplitude total dos dados apresentados é de:
28
175. As medidas citadas adiante descrevem uma amostra obtida em um experimento aleatório. A 
única que mede a dispersão da amostra é:
Desvio-padrão
176. A empresa Corp e Co deseja obter os quartis (Q1, Q2, Q3), sobre o tempo de serviço de seus 
funcionários utilizando a linguagem Python. Qual função e biblioteca podem ser usadas para 
realizar este cálculo?
A função quantile() da biblioteca NumPy.
177. Os operadores lógicos variam de software para software e precisamos conhecer esses 
operadores durante a manipulação dos dados. Por exemplo, a igualdade no Python é 
representado pela expressão “x==y”, como é o operador lógico de diferença em Python?
!=
178. Um levantamento realizado em um clube com relação a quantidade de filhos de seus 
associados forneceu a seguinte distribuição de frequências:
A média aritmética (quantidade de filhos por socio), a mediana e a moda correspondentes a essa 
distribuição são, respectivamente:
1,03; 1,00 e 0,00
Programação em Python Para Análise de Dados
Marcio Quirino - 59 
179. Empresas frequentemente usam pesquisas de mercado para estimar a probabilidade de 
sucesso de um novo produto ou serviço, com base nas respostas dos consumidores em 
amostras representativas. Considere uma urna contém 4 bolas vermelhas, 3 bolas azuis e 5 bolas 
verdes. Qual é a probabilidade de selecionar uma bola azul?
1/4
180. Uma prova consta de 35 questões do tipo múltipla escolha, com 5 opções cada uma, onde 
apenas uma opção é verdadeira.
Um candidato que não sabe resolver nenhuma das questões vai respondê-las aleatoriamente. Ele 
sabe que as respostas certas das 35 questões estão distribuídas igualmente entre as opções A, 
B, C, D e E. Então, resolve marcar suas respostas seguindo este critério: escolherá 
aleatoriamente 7 questões para marcar a opção A, outras 7 para a opção B, e assim 
sucessivamente.
A probabilidade de ele acertar todas as questões é:
(7!)5 / 35!
181. Ao jogar um jogo de cartas como o pôquer, as probabilidades são usadas para calcular a 
chance de obter uma determinada mão, como um flush ou uma sequência. Um dado justo é 
lançado. Qual é a probabilidade de obter um número primo?
1/2
182. Um torneio será disputado por 4 tenistas (entre os quais A e B) de mesma habilidade, isto é, em 
qualquer jogo entre 2 dos 4 jogadores, ambos têm a mesma chance de ganhar. Na primeira 
rodada, eles se enfrentarão em 2 jogos, com adversários definidos por sorteio. Os vencedores 
disputarão a final. A probabilidade de que o torneio termine com A derrotando B na final é:
1/12
183. O gráfico a seguir mostra, em percentuais, a distribuição do número de mulheres de 15 anos 
ou mais de idade, segundo o número de filhos, no Brasil:
Selecionando aleatoriamente 1 filho dessa população, a probabilidade de que ele seja filho único 
é, aproximadamente:
17/100
Programação em Python Para Análise de Dados
Marcio Quirino - 60 
184. Em um grupo de 200 adultos, 130 são do sexo masculino. Das mulheres desse grupo, 40% são 
casadas. Entre essas 200 pessoas, 94 delas não são casadas. Ao escolher aleatoriamente 1 
desses adultos, qual é a probabilidade de que ele seja um homem, sabendo que o adulto sorteado 
é casado?
39/53
185. Um assistente virtual baseado em inteligência artificial foi projetado para responder perguntas 
de forma precisa. Durante um teste, o assistente respondeu corretamente a 80% das perguntas. 
Qual é a probabilidade de o assistente responder corretamente a próxima pergunta?
80%
186. Um dado não viciado, com a forma de um cubo e com as faces numeradas de 1 até 6, foi 
lançado 3 vezes. Sabendo que a soma dos resultados obtidos foi igual a 5, qual é a probabilidade 
de o resultado do segundo lançamento do dado ter sido igual a 2?
1/3
187. A taxação de determinados valores de coberturas irá depender da probabilidade de estes 
ocorrerem. Uma seguradora oferece um seguro de vida que paga

Mais conteúdos dessa disciplina