ModProbab Aplic EngProd - TEORIA 1ªAvD

•
UNIFOA

Renan Marques Teixeira
04.03.2015
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 46 páginas
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 46 páginas
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 46 páginas
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
E aí, curtiu este material?
Ajude a incentivar outros estudantes a melhorar o conteúdo
Gostou desse material? Compartilhe! 🧡
Estatística I

56.792 Materiais compartilhados
Baixe o app para aproveitar ainda mais
Leia os materiais offline, sem usar a internet. Além de vários outros recursos!
Prévia do material em texto
1 
 
 
 
 
 
 
Curso de Engenharia de Produção 
 
 
 
MODELOS PROBABILÍSTICOS APLICADOS À ENGENHARIA DE PRODUÇÃO 
 
 
 
1ª AvD 
 
 
 
 
 
 
 
 
 
 
PROF. SÉRGIO RICARDO BASTOS DE MELLO, MSC. 
 
 
 
 
 
2015.1 
 
 
 
 2 
Disciplina: Modelos Probabilísticos Aplicados à Engenharia de Produção 
Ementa: 
Introdução. Conceitos básicos de probabilidades. Probabilidade condicional e independência. 
Variáveis aleatórias. Funções de variáveis aleatórias. Valor esperado e variância. 
Distribuições de variáveis aleatórias discretas e contínuas. Teorema central do limite. 
Distribuições por amostragem. Aplicações de modelos probabilísticos em engenharia de 
produção. 
Bibliografia Básica: 
CALADO, Mônica; MONTGOMERY, Douglas C; RUNGER, George C. Estatística aplicada e 
probabilidade para engenheiros. 5. ed. Rio de Janeiro: LTC. 2012. 
QUEIROZ, Luiz Claudio; RYAN, Thomas P.. Estatística moderna para engenharia. Rio de 
Janeiro: Elsevier, 2009. 
WALPOLE, Ronald E., MYERS, et. al. Probabilidade e estatística para engenharia e 
ciências. 8. ed. São Paulo: Pearson Prentice Hall, 2009. 
Bibliografia Complementar: 
VIEIRA, Sonia. Estatística básica. São Paulo. 2012. 
MOORE, David S. Estatística básica e sua prática. 5. ed. Rio de Janeiro. 2011. 
BARBETTA, Pedro Alberto; BORNIA, Antônio Cezar; REIS, Marcelo Menezes. Estatística: 
para cursos de engenharia e informática. 2. ed. São Paulo: Atlas, 2008. 
CRESPO, Antônio Arnot. Estatística. São Paulo. 2008. 
ANDERSON, David R.; SWEENEY, Dennis; WILLIANS, Thomas A. Estatística aplicada à 
Administração e Economia. 2. ed. São Paulo: Pioneira Thomson Learning, 2008. 
 
Plano de aula: 
1. Apresentação do plano de ensino e plano de aula. Importância da disciplina. Revisão de 
conceitos básicos. Teoria dos conjuntos. (4h_a) 
2. Conceitos básicos de probabilidades. (1 h_a) 
3. Princípios de probabilidade. (1h_a) 
4. Probabilidade condicional e independência estatística. (2h_a) 
5. Teoremas de Bayes e da Probabilidade total. (2 h_a) 
6. Exercícios. (2 h_a) 
7. Variável aleatória. (2 h_a) 
 3 
8. Função de distribuição de probabilidade. (2 h_a) 
9. Valor esperado e variância de variável aleatória. (2 h_a) 
10. Exercícios. (2 h_a) 
11. Distribuição uniforme discreta. (1 h_a) 
12. Distribuição multinomial. (1 h_a) 
13. Distribuição binomial. (2 h_a) 
14. Distribuição geométrica (1 h_a) 
15. Distribuição binomial negativa. (2 h_a) 
16. Exercícios. (1 h_a) 
17. Distribuição hipergeométrica multivariada. (1 h_a) 
18. Distribuição hipergeométrica. (1 h_a) 
19. Distribuição de Poisson. (2 h_a) 
20. Exercícios. (2 h_a) 
21. 1ª AvD. (4 h_a) 
22. Vista da 1ª AvD. (2 h_a) 
23. Modelos de distribuição contínua. (2 h_a) 
24. Função de distribuição de probabilidade. (2 h_a) 
25. Valor esperado e variância de variáveis aleatórias contínuas. (2h_a) 
26. Exercícios. (2h_a) 
27. Distribuição uniforme contínua. (1h_a) 
28. Distribuição normal. (2h_a) 
29. Exercícios. (1 h_a) 
30. Distribuição Gama. (1 h_a) 
31. Distribuição exponencial. (2 h_a) 
32. Exercícios. (1 h_a) 
33. Distribuição qui-quadrado. (2 h_a) 
34. Distribuição t. (2 h_a) 
35. Outras distribuições contínuas. (4 h_a). 
36. 2ª AvD. (4h_a) 
37. Vista 2ª AvD. (2 h_a) 
38. Exercícios de revisão. (2 h_a) 
39. 2ª Chamada. (4h_a) 
40. Exame final. (4 h_a) 
 
 4 
Capítulo 0: Revisão de Estatística Descritiva 
 
0. Análise Exploratória de Dados 
 
0.1 Introdução 
A essência da ciência é a observação e seu objetivo é a inferência, que pode ser 
dedutiva (das premissas às conclusões) ou indutiva (do específico ao geral). 
A inferência estatística tem por objetivo a coleta, redução, análise e modelagem de 
dados para inferir para uma população, da qual os dados (a amostra) foram obtidos. 
A análise exploratória de dados inclui a redução, análise e interpretação dos dados, 
para identificar uma regularidade, padrão ou modelo presente nas observações, ou seja, 
busca estabelecer a relação: 
DADOS = MODELO + RESÍDUOS 
ou 
D = M + R 
 
0.2 Tipos de variáveis 
 
 
 
 
 
 
 
 
0.3 Distribuição de frequências 
O interesse no estuda de uma variável é conhecer sua distribuição através de seus 
possíveis valores. 
 
Variável qualitativa: 
Variável Contagem 
Frequência 
(absoluta) 
Frequência 
absoluta 
acumulada 
Proporção 
(frequência 
relativa) 
Proporção 
acumulada 
Gráfico: pontos 
Notação: 
 
absoluta) frequência(ou frequência - in
 
 
relativa) frequência(ou proporção - 
n
n
f ii 
 
 
 inn
 
 
10  if
 
 
1 if
 
Variável 
Qualitativa 
Quantitativa 
Nominal (não existe ordem – estado civil) 
Ordinal (existe ordem – grau de instrução) 
Discreta (contagem – nº de filhos) 
Contínua (mensuração - salário) 
 5 
Variável quantitativa: 
Classes da 
Variável 
Ponto médio 
da classe 
Frequência 
(absoluta) 
Frequência 
absoluta 
acumulada 
Proporção 
(frequência 
relativa) 
Proporção 
acumulada 
Gráfico: histograma. 
 
Procedimento para construção do histograma: 
 Nº de classes (K) 
o Se n ≤ 25  K = 5; 
o Se n > 25  
)log(32,31ou nKnK 
 
 Amplitude das classes (h): 
K
dadosdosMenordadosdosMaior
h
 

 
 Construir o agrupamento em classes de frequência: partir do menor valor e somar 
gradualmente o intervalo obtido para cada uma das classes até incluir o último 
valor; adotar uma notação de limites de classes. 
 
Histograma é um gráfico de barras contíguas, com altura proporcional a f i. A área total 
da figura é igual a 1, correspondendo à soma total das proporções. A área correspondente 
ao intervalo [a,b), qualquer, representa proporção deste intervalo. 
 
0.4 Medidas de posição 
Média, mediana e moda. 



n
i
ii xfx
1
.
 
Md
ant
f
fn
hIMd


)2/(
 
mediana da classe da frequência
mediana da classe àanterior classe da acumulada frequência
sobservaçõe denº
classes das amplitude
mediana da classe dainferior limite 
:





Md
ant
f
f
n
h
I
Onde
 
Fórmula de Pearson: 
xMdMo .2.3 
 
 
0.5 Medidas de dispersão 
Amplitude, desvio médio absoluto, variância e desvio padrão. 
R = xmaior − xmenor 
||.
1
xxfDMA
n
i
ii 

 
V(X) = ∑ fi(xi − x̅)
2
n
i=1
= ∑ fi(xi
2 − 2xix̅ + x̅
2) =
n
i=1
∑ fixi
2 − x̅2
n
i=1
 
)()( XVXDP 
 
 6 
Exemplo 1: Um pesquisador está interessado em fazer um levantamento sobre alguns 
aspectos socioeconômicos dos empregados da seção de orçamentos da Companhia Milsa. 
Usando informações obtias na seção de pessoal, ele elaborou a tabela a seguir. 
Nº 
Estado 
Civil 
Grau de 
instrução 
Nº de 
Filhos 
Salário 
(X sal 
min) 
Idade 
Região de 
procedência anos meses 
1 solteiro Fundamental - 4,00 26 03 Interior 
2 casado Fundamental 1 4,56 32 10 Capital 
3 casado Fundamental 2 5,25 36 05 Capital 
4 solteiro Médio - 5,73 20 10 Outro 
5 solteiro Fundamental - 6,26 40 07 Outro 
6 casado Fundamental 0 6,66 28 00 Interior 
7 solteiro Fundamental - 6,86 41 00 Interior 
8 solteiro Fundamental - 7,39 43 04 Capital 
9 casado Médio 1 7,59 34 10 Capital 
10 solteiro Médio - 7,44 23 06 Outro 
11 casado Médio 2 8,12 33 06 Interior 
12 solteiro Fundamental - 8,46 27 11 Capital 
13 solteiro Médio - 8,74 37 05 Outro 
14 casado Fundamental 3 8,95 44 02 Outro 
15 casado Médio 0 9,13 30 05 Interior 
16 solteiro Médio - 9,35 38 08 Outro 
17 casado Médio 1 9,77 31 07 Capital18 casado Fundamental 2 9,80 39 07 Outro 
19 solteiro Superior - 10,53 25 08 Interior 
20 solteiro Médio - 10,76 37 04 Interior 
21 casado Médio 1 11,06 30 09 Outro 
22 solteiro Médio - 11,59 34 02 Capital 
23 solteiro Fundamental - 12,00 41 00 Outro 
24 casado Superior 0 12,79 26 01 Outro 
25 casado Médio 2 13,23 32 05 Interior 
26 casado Médio 2 13,60 35 00 Outro 
27 solteiro Fundamental - 13,85 46 07 Outro 
28 casado Médio 0 14,69 29 08 Interior 
29 casado Médio 5 14,71 40 06 Interior 
30 casado Médio 2 15,99 35 10 Capital 
31 solteiro Superior - 16,22 31 05 Outro 
32 casado Médio 1 16,61 36 04 Interior 
33 casado Superior 3 17,26 43 07 Capital 
34 solteiro Superior - 18,75 33 07 Capital 
35 casado Médio 2 19,40 48 11 Capital 
36 casado Superior 3 23,30 42 02 Interior 
 
 
 7 
 
Questões: 
1 Classifique as variáveis da tabela anterior. 
2 
Elabore a distribuição de frequências da variável número de filhos dos 
empregados casados e construa o seu gráfico para a frequência relativa. 
3 
Elabore a distribuição de frequências da variável salário dos empregados e 
construa o seu gráfico para a frequência relativa. 
4 
Determine a média e a variância da distribuição de frequências da variável 
número de filhos dos empregados casados. 
5 
Determine a média e a variância da distribuição de frequências da variável 
salário dos empregados. 
 
0.6 Outras medidas 
Restrições à média e ao desvio padrão para representar um conjunto de valores: 
 São afetados, de forma significativa, por valores extremos; 
 As duas estatísticas juntas não são suficientes para indicar a assimetria da 
distribuição das observações. 
Proposta de Tukey, 1977: 
 Mediana: Md 
 Os extremos, E: maior e menor valores do conjunto de observações 
 Os quartis ou juntas, J: J1 (1/4 e 3/4), J2 (1/2 e 1/2) e J3 (3/4 e 1/4) – medidas de 
posição 
 Intervalo quartil, dJ = J3 – J1: medida de dispersão 
 Outliers ou observações discrepantes (muito aquém de J1 ou muito além de J3), x: 
dados menores que J1 – (3/2) dJ e dados maiores que J3 + (3/2) dJ 
 
0.7 Gráfico boxplot 
 
 
 
 
 
 
 
 
0.8 Análise bidimensional 
Análise conjunta de duas (ou mais) variáveis. Objetivo: verificar a associabilidade entre 
as variáveis, ou seja, o grau de dependência entre elas. 
 
Segue tabela da distribuição conjunta de X e Y. 
 
 
J2 
x 
x 
J3 
J1 
Jd
2
3
 
 
Jd
2
3
 
Jd
 
 8 
Y X X1 X2 X3 Total 
Y1 
Y2 
Y3 
Total 
 
A linha dos totais fornece a distribuição da variável X e a coluna dos totais fornece a 
distribuição da variável Y. As distribuições assim obtidas são chamadas de distribuições 
marginais. Cada casela pode conter as frequências absolutas ou relativas. No caso da 
frequência relativa ela pode ser expressa em relação: ao total geral, ao total de cada linha e 
ao total de cada coluna, de acordo com o objetivo da pesquisa. 
 
INDEPENDÊNCIA DE VARIÁVEIS 
1º passo: substituir as frequências absolutas pelas relativas (eliminando as diferenças 
marginais – todas as variáveis estarão referenciadas a 100). 
2º passo: fixar os totais pelas linhas ou colunas, que definirão os valores esperados para 
cada variável. 
A quantificação do grau de dependência entre duas variáveis é feita pelos coeficientes de 
correlação. Usaremos o coeficiente de contingência de Pearson, que varia de 0 a 1 (zero 
indica total independência). 
3º passo: construir as tabelas dos valores observados; dos valores esperados; e dos 
resíduos. 
4º passo: calcular a medida 
i
ii
e
eo 2)( 
 
esperado valor - 
observado valor - 
i
i
e
o
 
5º passo: calcular o χ2 – como uma medida do afastamento global 



i
ii
e
eo 22 )(
 
Para maiores valores de χ2, maior a dependência entre as variáveis. 
6º passo: calcular o coeficiente de contingência C, de Pearson: 
1C0 e sobservaçõe de nº n onde 
2
2



n
C 

 
 
 
 
 
 9 
COEFICIENTE DE CORRELAÇÃO LINEAR 
Agente X Y 𝑥 − �̅� 𝑦 − �̅� 
𝑥 − �̅�
𝐷𝑃(𝑋)
= 𝑧𝑥 
𝑦 − �̅�
𝐷𝑃(𝑌)
= 𝑧𝑦 
𝑧𝑥 . 𝑧𝑦 
A 
B 
Total 
Definição: Dados n pares de valores (x1,y1), (x2,y2) ... (xn,yn), o coeficiente de correlação 
linear entre as variáveis X e Y é 
 𝐶𝑜𝑟𝑟(𝑋, 𝑌) =
1
𝑛
∑ (
𝑥𝑖−�̅�
𝐷𝑃(𝑋)
) (
𝑦𝑖−�̅�
𝐷𝑃(𝑌)
)𝑛𝑖=1 − 1 ≤ 𝐶𝑜𝑟𝑟(𝑋, 𝑌) ≤ 1 
ou 
𝐶𝑜𝑟𝑟(𝑋, 𝑌) =
1
𝑛
∑(𝑥𝑖 − �̅�)(𝑦𝑖 − �̅�)
𝐷𝑃(𝑋). 𝐷𝑃(𝑌)
=
∑ 𝑥𝑖𝑦𝑖 − 𝑛�̅��̅�
√(∑ 𝑥𝑖
2 − 𝑛�̅�2). (∑ 𝑦𝑖
2 − 𝑛�̅�2)
 
 
0.9 Teoria dos Conjuntos 
0.9.1 Elementos da Teoria dos Conjuntos 
O interesse ao estudar os fenômenos aleatórios está em afirmar quais eventos podem 
ocorrer. Eventos e combinações de eventos desempenham papel central na teoria das 
probabilidades, também chamada álgebra dos eventos, que tem íntima relação com a teoria 
dos conjuntos. 
Conjunto é uma coleção de objetos (elementos) que possuem alguma(s) propriedade(s) 
em comum. Por exemplo: 
 A={1,2,3,4,5,6}  conjunto A tem como elementos os números inteiros de 
1 a 6. 
Usa-se letras maiúsculas A, B, C, , , ... para representar os conjuntos e letras minúsculas 
a, b, c, , , ... para representar seus elementos. 
Relação entre elemento e conjunto:  (pertence) e  (não pertence). Por exemplo, para o 
conjunto A anterior: 
 1  A e 7  A 
Conjunto finito: pode-se contar seu número de elementos. Por exemplo, conjunto das 
vogais  {a, e, i, o,u} 
Conjunto infinito: não se pode contar seu número de elementos. Por exemplo, conjunto 
dos números reais maiores que 6  {x  R | x > 6}. Pode ser numerável ou não numerável. 
Um conjunto infinito é numerável se pode ser estabelecida uma correspondência biunívoca 
de seus elementos com o conjunto dos números inteiros positivos. Caso contrário o conjunto 
infinito é não numerável, como o exemplo anterior. 
Subconjunto: dados 2 conjuntos A e B, B é subconjunto de A se, e somente se, todos 
os elementos que pertencem a B também pertencem a A. Símbolos utilizados para definir a 
 10 
relação entre conjuntos:  (está contido),  (contém) e  (não está contido). Por exemplo, 
para o conjunto A anterior e o conjunto 
 B={1,2,3} podemos dizer que: B  A, A  B e A  B 
 
 
 Diagrama de Venn para B  A 
 
Conjunto vazio: é o conjunto que não tem elementos. É representado por { } ou . É 
subconjunto de todo e qualquer conjunto. Exemplo: Lançamento de um dado e obter a face 
7. 
Conjunto unitário: é aquele que possui somente um elemento. Por exemplo: conjunto 
dos satélites da terra  {lua} 
Conjunto universo ou espaço: é um conjunto “máximo”, que contém todos os conjuntos 
em estudo. É representado por S; 
Conjunto complementar de A: conjunto de todos elementos de S que não são 
elementos de A. É representado por 
A
. 
AA
S
S




,
 
 
0.9.2 Operações com Conjuntos 
Dados A, B, C, ... subconjuntos de S. 
A união ou soma de A e B, A U B: conjunto de todos elementos que pertencem a A, ou 
a B ou a ambos. 
A interseção ou produto de A e B, A ∩ B ou AB: conjunto de todos elementos comuns a 
A e a B. 
 
 
 
 
 
Conjuntos disjuntos: quando A ∩ B = . 
Sempre um conjunto (A) e seu complementar (
A
) são disjuntos. 
A diferença de A e B, A – B: conjunto de todos elementos que pertencem a A e não a B. 
Então: 
BABAAAS  e eA -A  
 
A 
 
B 
S 
A 
A
 
A U B A ∩ B 
A 
B 
A 
B 
 11 
Exemplo 2: Seja S o espaço que consiste do segmento da reta real de0 a 10 e os 
segmentos reais A de 1 a 7 e B de 3 a 9. Marque os segmentos representativos de A U B, A 
∩ B, 
A
 e 
B
. 
Generalização das definições de união e interseção para vários conjuntos: 
j
n
j
nj
n
j
n AAAAAAAA 
1
21
1
21 ... e ...


 
Se os conjuntos Aj, j=1,2,...,n são disjuntos 
, ji AA
para todos i, j (i  j). 
 
Exemplo 3: Utilizando diagramas de Venn verifique as relações abaixo, bem como, que as 
operações de união e interseção são associativas, comutativas e distributivas, ou seja: 
   
   
ABBA
CBACBACBA
ABBA
CBACBACBA








 
     
     
 
BABABA
BAABA
CABACBA
CABACBA








BA e 
 
 
0.10 Técnicas de Contagem 
São técnicas para determinar o número de resultados em um espaço amostral ou 
evento. 
Em muitos exemplos a contagem é muito simples. Por exemplo, quantos resultados 
podem ser obtidos ao lançar um dado? 
Outros exemplos podem ser mais complexos. Nestes casos são utilizadas diferentes 
técnicas de contagem. 
Por exemplo: Um fabricante de automóveis fornece veículos equipados com opcionais 
selecionados. Cada veículo é encomendado: 
 Com ou sem transmissão automática 
 Com ou sem ar condicionado 
 Com uma das três escolhas de um sistema estéreo 
 Com uma das quatro cores exteriores: vermelho, branco, azul ou marrom 
 Com uma das quatro cores interiores: vermelha, preta, azul ou marrom, de 
acordo com os seguintes critérios: 
o Com exterior vermelho: interior preto ou vermelho 
o Com exterior branco: interior em qualquer cor 
o Com exterior azul: interior preto, vermelho ou azul 
o Com exterior marrom: somente interior marrom. 
Se o espaço amostral consistir no conjunto de todos os tipos possíveis de veículos, qual 
será o número de resultados no espaço amostral? 
 
 12 
Regra da Multiplicação (para técnicas de contagem) 
Considere uma operação que possa ser descrita como uma sequência de k etapas se 
 O número de maneiras de completar a etapa 1 for n1, 
 O número de maneiras de completar a etapa 2 for n2 para cada maneira de 
completar a etapa 1, 
 O número de maneiras de completar a etapa 3 for n3 para cada maneira de 
completar a etapa 2 e 
 Assim por diante. 
O número total de maneiras de completar a operação será 
 n1 x n2 x n3 x ... x nk 
 
Permutações 
É uma sequência ordenada dos elementos (ab ≠ ba). 
 número de permutações de n elementos diferentes: 
n! = n x (n-1) x (n-2) x ... x 2 x 1 
 número de permutações circulares: 
(n-1)! 
 número de permutações com repetição com n = n1 + n2 + ... + nr objetos dos 
quais n1 são de um tipo, n2 são de um segundo tipo, ..., e nr são de um r-ésimo 
tipo, é 
𝑛!
𝑛1! 𝑛2! 𝑛3! … 𝑛𝑟!
 
 número de permutações de subconjuntos de r elementos selecionados de um 
conjunto de n elementos diferentes é 
𝑃𝑟
𝑛 = 𝑛 𝑥 (𝑛 − 1)𝑥 (𝑛 − 2)𝑥 … 𝑥 (𝑛 − 𝑟 + 1) =
𝑛!
(𝑛 − 𝑟)!
 
 número de permutações de subconjuntos de r elementos selecionados de um 
conjunto de n elementos diferentes com repetição é 
𝑃𝑟
𝑛 = 𝑛𝑟 
 
Combinação 
É uma sequência de elementos em que a ordem não é importante (ab = ba). 
 número de combinações de subconjuntos de r elementos selecionados de um 
conjunto de n elementos diferentes é 
𝐶𝑟
𝑛 = (
𝑛
𝑟
) =
𝑛!
𝑟! (𝑛 − 𝑟)!
=
𝑃𝑟
𝑛
𝑟!
 
 13 
 número de combinações de subconjuntos de r elementos selecionados de um 
conjunto de n elementos diferentes é 
𝐶𝑟
𝑛 = 𝐶𝑟
𝑛+𝑟−1 
Exemplo 4: Dadas as palavras: ESTADO e ESTATISTICAMENTE, determine: 
 número total de anagramas com todas as letras das palavras; 
 número total de anagramas com 5 letras para cada palavra fornecida sem 
importar a ordem das letras; 
 número total de anagramas com 5 letras para cada palavra fornecida 
diferenciados pela ordem das letras; 
 número total de anagramas com 5 letras para cada palavra fornecida sem 
importar a ordem das letras e podendo conter repetição das letras; 
 número total de anagramas com 5 letras para cada palavra fornecida 
diferenciados pela ordem das letras e podendo conter repetição das letras; 
 
0.11 Exercícios 
1) Represente os diagramas de Venn e verifique se as relações abaixo são verdadeiras ou 
falsas. 
a) 
)()()()( CBCBABCBA 
 
b) 
BABA 
 
 
2) Suponha que uma família esteja saindo para as férias de verão em seu trailer e que M 
seja o evento no qual irão passar problemas mecânicos, T seja o evento no qual 
receberão uma multa de trânsito e V seja o evento no qual chegarão a um camping sem 
vagas. Com base no diagrama de Venn abaixo e usando a notação de operações entre 
eventos (∩ interseção e U união), liste os números das regiões que representam os 
seguintes eventos: 
a) (0,2) A família não passará por problemas mecânicos, não será multada nem chegará 
a um camping sem vagas (férias dos sonhos!!!) 
b) (0,2) A família não passará por problemas mecânicos nem cometerá violações de 
trânsito, mas chegará a um camping sem vagas 
c) (0,2) A família terá problemas mecânicos e para localizar um camping que tenha 
vagas, mas não receberá multa de trânsito 
d) (0,2) A família terá problemas mecânicos ou chegará a um camping sem vagas, mas 
não receberá multa de trânsito 
e) (0,2) Dado que a família será multada, ela terá problema mecânico ou chegará a um 
camping sem vagas 
f) (0,2) A família não chegara a um camping sem vagas 
 
 
 
 14 
 
 
 
 
 
 
 
 
 
Exemplo: A família terá problema mecânico, será multada e chegará a um camping sem 
vagas. M ∩ T ∩ V = 1; A família terá problema mecânico, será multada ou chegará a um 
camping sem vagas. M U T U V = 1 + 2 +3 + 4 + 5 + 6 + 7 
 
 
 
 
 
 
 
 
8 
M T 
 
 
 
1 
2 3 
4 5 
6 
7 
V 
 15 
Capítulo 1: CONCEITOS BÁSICOS DE PROBABILIDADE 
1.1 Introdução 
O sucesso industrial japonês iniciado na segunda metade do século XX é atribuído a 
implantação dos métodos estatísticos no gerenciamento de seus processos de manufatura. 
No início dos anos 80 as montadoras instaladas no Brasil, sob orientação de suas matrizes 
americanas e europeias e em resposta ao avanço da indústria nipônica, assumiram a 
responsabilidade pela disseminação dos métodos estatísticos junto à cadeia de suprimentos 
do segmento automotivo. 
É fato que o avanço da indústria japonesa atestou a importância da estatística no 
controle da qualidade dos processos de manufatura. É importante entender a estatística 
como uma ciência exata, suportada por princípios que garantem sua eficácia na solução de 
problemas. 
A Estatística Descritiva (análise exploratória de dados) é a parte da Estatística que 
organiza e descreve os dados científicos, através de: 
 Coleta de dados: planos de amostragem aleatória; 
 Representação dos dados: tabelas e gráficos; e 
 Síntese dos dados experimentais através de estatísticas: medidas de posição, 
medidas de dispersão absolutas e relativas e medidas de forma. 
A Inferência Estatística é um processo de raciocínio indutivo, em que se procuram tirar 
conclusões indo do particular para o geral, ou seja, a partir das propriedades verificadas na 
amostra (estatísticas), inferir propriedades para a população (parâmetros). 
O raciocínio com base em dados da amostra para inferir sobre a população pode 
resultar em erros (chamados erros de amostragem). No entanto, se a amostra for 
selecionada adequadamente, esses riscos poderão ser quantificados e um tamanho 
apropriadode amostra pode ser determinado. 
Os modelos probabilísticos são essenciais na transição entre a Estatística Descritiva e a 
Inferência Estatística. 
Os modelos de probabilidade ajudam a quantificar os riscos envolvidos em inferência 
estatística, isto é, os riscos envolvidos em decisões feitas todo dia. 
A probabilidade é ramo da ciência que estuda os fenômenos aleatórios – o resultado 
não pode ser previsto. Os fenômenos aleatórios estão associados a duas classes de 
situações e/ou problemas: o grau de incerteza associado aos fenômenos físicos ou naturais 
e a variabilidade inerente aos processos de manufatura. A incerteza de um problema é 
devida a sua complexidade, desconhecimento de suas causas e efeitos ou por informação 
insuficiente. Por exemplo, qual a previsão do tempo para daqui a um mês? A variabilidade 
dos processos é devida a pequenas variações de diferentes fontes. Por exemplo, por que 
duas peças produzidas numa mesma máquina e pelo mesmo operador não são exatamente 
iguais? 
A utilização de modelos é corrente no nosso dia a dia. Para que servem os modelos? 
Permitem a simplificação de uma realidade complexa pela eliminação dos seus aspectos 
irrelevantes para o problema analisado. 
 16 
O modelo probabilístico estipula que as condições da experimentação determinam 
somente o comportamento probabilístico (mais especificamente, a lei probabilística) do 
resultado observável. Para explicar os fenômenos aleatórios, o modelo utilizado será o 
cálculo das probabilidades. 
 
1.2 Experimentos Aleatórios 
Experimento é qualquer processo que gere um conjunto de dados. O interesse maior está 
nas observações obtidas ao se repetir o experimento estatístico diversas vezes. 
Ao descrever um experimento aleatório devemos especificar: 
 O procedimento que deve ser realizado e 
 O que deve ser observado. 
 
Exemplos de experimentos aleatórios: 
E1: Jogue uma moeda 4 vezes e observe a sequência obtida de caras e coroas. 
E2: Jogue uma moeda 4 vezes e observe o número de caras obtido. 
E3: Peças são fabricadas até que 10 peças perfeitas sejam produzidas; o número total 
de peças fabricadas é contado. 
E4: Uma lâmpada é fabricada; em seguida é ensaiada quanto à duração da vida, pela 
colocação em um soquete e anotação do tempo decorrido (em horas) até queimar. 
 
Características de um experimento aleatório: 
a) Cada experimento pode ser repetido indefinidamente sob condições essencialmente 
inalteradas; 
b) Embora não seja possível afirmar que resultado particular ocorrerá, seremos capazes 
de descrever o conjunto de todos os possíveis resultados do experimento; e 
c) Quando o experimento é executado repetidamente, os resultados individuais parecem 
acidentais, entretanto, para um grande número de vezes uma regularidade surgirá. 
 
1.3 Espaço Amostral 
Para cada experimento aleatório (E), define-se o ESPAÇO AMOSTRAL “S” como o 
conjunto de todos os possíveis resultados desse experimento. Cada resultado possível é um 
ponto amostral. 
 
Exemplos de espaços amostrais (com referência aos experimentos anteriores): 
S1: {cccc, ccck, cckc, ckcc, kccc, ..., kkkk} 
S2: {0,1,2,3,4} 
S3: {10, 11,12, ...} 
S4: {t ϵ R| t ≥ 0} 
 17 
Espaços amostrais discretos e contínuos: 
 Discreto: consiste em um conjunto finito (S1 e S2) ou infinito (S3) contável de 
resultados; 
 Continuo: contém um intervalo de números reais (S4). 
 
1.4 Evento 
Evento é um subconjunto do espaço amostral de um experimento aleatório. 
A ocorrência de um evento significa que o resultado observado no experimento é 
um ponto amostral daquele evento. Portanto, o espaço amostral é o evento certo e  é um 
evento impossível. 
Eventos podem ser descritos a partir de combinações de eventos existentes, através de 
operações básicas de conjuntos aplicáveis aos mesmos, tais como: 
 União de eventos (A U B): é o evento que consiste em todos os resultados 
(pontos amostrais) contidos em cada evento (A e B). 
 Interseção de eventos (A ∩ B): é o evento que consiste em todos os resultados 
(pontos amostrais) contidos nos eventos (A e B), simultaneamente. 
 Complemento de um evento em um espaço amostral (�̅�, 𝐴′, 𝐴𝑐): é o evento que 
consiste em todos os resultados (pontos amostrais) no espaço amostral que não 
estão no evento. 
Eventos mutuamente excludentes: quando os eventos não têm pontos amostrais em 
comum, ou seja, A ∩ B = . 
Exemplos de eventos relativos aos espaços amostrais anteriores: 
A1: {cccc, ccck, cckc, ckcc, kccc}, isto é, no máximo uma coroa ocorre 
A2: {2}, isto é, 2 caras ocorrem 
A3: {10, 11, 12, 13, 14,15, 16, 17, 18, 19, 20}, isto é, 10 peças perfeitas ocorrem na 
produção de 10 a 20 peças consecutivas 
A4: {t ϵ R | t < 100}, isto é, a lâmpada queima em menos de 100 h 
A descrição do espaço amostral, ponto amostral e evento se encaixam na teoria dos 
conjuntos, permitindo uma análise dos resultados de um experimento aleatório. Todas as 
relações entre resultados ou eventos na teoria das probabilidades podem ser descritas por 
meio de conjuntos ou operações com conjuntos. A tabela a seguir dá a correspondência 
entre alguns conceitos relativos a conjuntos e probabilidade. 
Teoria dos 
conjuntos 
Probabilidade 
Espaço S Espaço amostral, evento certo 
Conjunto vazio  
Evento impossível (nenhum resultado possível pode ser 
elemento do conjunto vazio) 
Elementos a, b, ... Pontos amostrais 
Conjuntos A, B,... Eventos 
 18 
A Ocorrência do evento A 
A
 Não ocorrência do evento A 
A U B Ocorrência de ao menos um dos eventos A ou B 
A ∩ B Ocorrência de ambos os eventos A e B 
A – B Ocorrência apenas do evento A 
A  B 
A ocorrência do evento A necessariamente implica a ocorrência 
do evento B 
A ∩ B =  
Eventos A e B são mutuamente excludentes (i.é., A e B não 
podem ocorrer simultaneamente) 
 Todo espaço amostral S (n pontos amostrais) finito ou infinito numerável tem 2n 
eventos (subconjuntos possíveis). 
A relação entre eventos e espaço amostral correspondente pode ser representada 
graficamente pelo diagrama de Venn, como ilustra a figura a seguir. 
 
Exemplo 1: Considere um experimento que consiste na contagem de conversões de 
automóveis à esquerda num cruzamento, em um grupo de 100 automóveis. Dados os 
eventos: A – evento que consiste em, no máximo, 50 carros fazerem conversão à esquerda; 
B – evento que consiste em entre 40 e 60 (inclusive) conversões à esquerda; e C – evento 
que consiste em 80 ou mais conversões à esquerda. 
 Qual é o espaço amostral do experimento? 
 Determine A U B e A ∩ B. 
 Qual a relação entre os eventos A e C? 
 
Exemplo 2: Um dispositivo eletrônico é ensaiado e o tempo total do serviço t é registrado. 
Admitiremos que o espaço amostral seja {t ϵ R | t ≥ 0}. Sejam A, B e C três eventos definidos 
como segue: 
A = {t ϵ R | t < 100}; B = {t ϵ R | 50 ≤ t ≤ 200}; C = {t ϵ R | t>150} 
Determine: 
;;;;;;;;;;; CACACBCBBABACBBABCBBA 
 
 
 
 
 
 
 19 
1.5 Medida de Probabilidade 
 
1.5.1 Frequência Relativa 
 
Exemplo 3: Vamos supor que uma determinada indústria produz lâmpadas em linha e são 
coletadas durante um dia 10 amostras de 25 lâmpadas, no outro dia 10 amostras de 250 
lâmpadas e no terceiro dia 10 amostras de 2500 lâmpadas e para cada amostra obtiveram-
se as porcentagens de lâmpadas defeituosas como mostrado na tabela a seguir. 
Amostras 
Quantidade de lâmpadas analisadas 
25 250 2500 
% defeitos % defeitos % defeitos 
1 4 4,8 6,28 
2 16 5,6 6,08 
3 0 6,8 6,28 
4 0 4,4 5,44 
5 4 8,8 6,08 
6 4 3,6 5,40 
7 8 6,0 5,72 
8 0 5,6 6,40 
9 4 8,4 5,96 
10 4 3,2 6,12 
Média 4,400 5,720 5,976 
Desvio padrão 4,7891,867 0,348 
Coeficiente de variação 109% 33% 6% 
 
Suponha que o experimento (E) seja repetido n vezes. Sejam A e B dois eventos 
associados ao experimento E. 
Considere que os eventos A e B ocorrem nA e nB vezes, respectivamente. 
Por definição 
n
n
f AA 
 é a frequência relativa do evento A nas n repetições do 
experimento E. 
A frequência relativa tem as seguintes propriedades: 
1) 0 ≤ fA ≤ 1 
2) fA = 1 se, e somente se, o evento A ocorrer nas n repetições do experimento E 
3) fA = 0 se, e somente se, o evento A não ocorrer nas n repetições do experimento E 
4) se A e B são eventos mutuamente excludentes, então fAUB = fA + fB 
 
1.5.2 Interpretações de Probabilidade 
Quando um experimento é repetido n vezes, e n se torna grande surgirá uma 
regularidade de ocorrência de um evento A, e sua frequência relativa será naturalmente a 
probabilidade do evento A, representada por P(A). O método da frequência relativa para 
atribuição de probabilidades é o processo adotado na ciência e engenharia. 
 20 
𝑃(𝐴) = lim
𝑛→∞
𝑓𝐴 
Probabilidade é usada para quantificar a possibilidade ou a chance de ocorrência de um 
resultado de um experimento aleatório. 
Maior a certeza de ocorrer um ponto amostral quando o experimento é realizado, a 
probabilidade atribuída a ele se aproxima de 1. Maior a certeza de não ocorrer um ponto 
amostral quando o experimento é realizado, a probabilidade atribuída a ele se aproxima de 0. 
Um zero indica que um resultado não ocorrerá. Uma probabilidade de 1 indica que um 
resultado ocorrerá com certeza. 
 
1.5.3 Princípios de Probabilidade 
Para determinar a probabilidade de um evento A, P(A), somamos todas as 
probabilidades atribuídas aos pontos amostrais de A. 
Dado um espaço amostral S, a probabilidade de um evento A, P(A), é uma função 
definida em S, que associa ao evento um número real, satisfazendo os seguintes princípios: 
I. 0 ≤ P(A) ≤ 1 
II. P(S) = 1  para todo ponto amostral em S, atribuímos uma probabilidade de modo 
que a soma de todas as probabilidades seja 1. 
III. Se A e B são eventos mutuamente excludentes (A ∩ B = ): P(A U B) = P(A) + 
P(B), ou seja, a probabilidade de que pelo menos um evento ocorra é a soma das 
probabilidades da ocorrência dos eventos individuais. 
 
Exemplo 4: Os princípios anteriores são suficientes para deduzir todas as propriedades de 
uma função de probabilidade. Verifique as propriedades: 
I. P() = 0 – Para pontos fora do espaço amostral, a probabilidade atribuída a eles é 0. 
II. P(
A
) = 1 – P(A) 
III. Se A  B então P(A) ≤ P(B) 
IV. Se A e B são dois eventos quaisquer, então P(A U B) = P(A) + P(B) – P(A ∩ B) 
 
1.6 Probabilidades Finitas dos Espaços Amostrais Finitos 
Consideremos o seguinte exemplo: três cavalos, A, B e C estão em uma corrida; A tem 
duas vezes mais probabilidade de ganhar que B, e B tem duas vezes mais probabilidade de 
ganhar que C. Quais são as probabilidades de vitória de cada um, isto é, P(A), P(B) e P(C)? 
Fazendo P(C) = p, então P(B) = 2 P(C) = 2p e P(A) = 2 P(B) = 4p; como a soma das 
probabilidade é igual a 1, temos: p + 2p + 4p = 1 então p = 1/7. 
Logo, P(A) = 4 p = 4/7; P(B) = 2 p = 2/7; e P(C) = p = 1/7 
 
1.7 Espaços Amostrais Finitos Equiprováveis 
Em muitos experimentos os pontos amostrais têm iguais probabilidades (jogar moeda 
ou dados, por exemplo). 
 21 
Um espaço amostral é chamado equiprovável quando associamos a cada ponto 
amostral a mesma probabilidade, ou seja, se S contém “n” pontos amostrais, a probabilidade 
de cada ponto amostral será 
n
1
. 
Por outro lado, se um evento A associado a S contém “r” pontos amostrais, então 
n
r
n
rAP 






1
)(
. 
Exemplo, ao jogar um dado equilibrado a probabilidade da face superior ser 6 é 
6
1
 e ao 
escolher aleatoriamente uma carta de um baralho com 52 cartas a probabilidade da carta ser 
de ouros é 
52
13
52
1
13 





x
. 
A expressão “aleatória” nos indicará que o espaço é equiprovável. Ou seja, 
selecionar aleatoriamente implica que, em cada etapa da amostragem, os itens são 
igualmente prováveis de serem selecionados. 
 
Para listar os pontos amostrais de um espaço amostral finito que fornece o maior 
número de informações construímos o diagrama de árvore. 
 
Exemplo 5: Jogue uma moeda. Se der cara jogue a moeda novamente e se der coroa jogue 
um dado. Construa o diagrama de árvore para representar o espaço amostral desse 
experimento estatístico. 
 
1.8 Probabilidade Condicional 
 
Exemplo 6: Em um total de 400 itens fabricados 10% dos itens contêm falhas visíveis na 
superfície (evento F) e 25% dos itens com falhas na superfície são itens funcionalmente 
defeituosos. Entretanto, somente 5% dos itens sem falhas na superfície são defeituosos. 
 
 
Falha na superfície 
Sim (evento F) Não (evento F’) Total 
Defeituoso 
Sim (evento D) 
Não (evento D’) 
Total 400 
 
Calcule, a partir da tabela acima, probabilidade P(D/F) e P(D/F’). 
 
Solução: A probabilidade de um item defeituoso (evento D) depende do nosso conhecimento 
da presença ou ausência de uma falha na superfície. Portanto, representando por P(D/F) a 
 22 
probabilidade de D ocorrer dado que (ou considerando que) F ocorreu, temos P(D/F) = 0,25 
e P(D/F’) = 0,05. 
 
Probabilidade condicional 
Dados dois eventos A e B associados a um experimento aleatório, define-se a 
probabilidade condicional de A, sabendo-se que B ocorreu, por P(A/B), como sendo 
   
 
,
/
/
/
BP
BAP
nn
nn
n
n
BAP
B
AB
B
AB 
 P(B)  0, pois B já ocorreu. 
Assim, P(A  B) = P(A/B).P(B) 
Onde, n é o número de experimentos, nAB é o número de resultados que ambos A e B 
ocorreram, nB é o número de resultados que B ocorreu. Dado que B ocorreu, a frequência 
relativa de A é nAB / nB. 
O diagrama em forma de árvore pode ser empregado para dispor as probabilidades 
condicionais. Segue diagrama em árvore para a tabela anterior. 
 
1.9 Independência Estatística 
Dois eventos A e B são independentes se, e somente se, P(A/B) = P(A), ou seja, 
P(A∩B) = P(A).P(B), 
então, a probabilidade de ocorrência simultânea de A e B depende somente das 
probabilidades associadas aos eventos individuais. Portanto, a ocorrência ou não ocorrência 
de um evento não afeta a ocorrência ou não ocorrência do outro. 
Dados n eventos A1, A2, .. , An; eles são independentes se eles são independentes 2 a 
2, 3 a 3, ..., n a n. 
 
Exemplo 7: Sendo S = {1, 2, 3, 4} um espaço amostral equiprovável e A = {1, 2}, B = {1. 3} e 
C = {1, 4} três eventos de S. Verificar se os eventos A, B e C são independentes. 
 
 23 
Exemplo 8: Dois dados são lançados. Consideremos os eventos: A = {(x1, x2)/x1+x2 = 10} e B 
= {(x1, x2)/x1 > x2}. Calcular P(A), P(B), P(A/B) e P(B/A). 
 
Exemplo 9: Em lote de 12 peças das quais 4 são defeituosas, 2 peças são retiradas uma 
após a outra sem reposição. Qual a probabilidade de que ambas sejam boas? 
 
Exemplo 10: Em lote de 10 peças das quais 4 são defeituosas, 2 peças são retiradas uma 
após a outra com reposição. Qual a probabilidade de que ambas sejam boas? 
 
1.10 Regras Aditivas 
Se A e B são dois eventos, então: P(A U B) = P(A) + P(B) – P(A ∩ B). 
Se A e B são eventos mutuamente excludentes, então: P(A U B) = P(A) + P(B). 
Para 3 eventos A, B e C: 
P(A U B U C) = P(A) + P(B) + P(C) – P(A ∩ B) – P(A ∩ C) – P(B ∩ C) + P(A ∩ B ∩ C) 
Para n eventos: 
𝑃 (⋃ 𝐴𝑗
𝑛
𝑗=1
) = ∑ 𝑃(𝐴𝑗
𝑛
𝑗=1
) − ∑ ∑ 𝑃(𝐴𝑖 ∩ 𝐴𝑗) + ⋯ − (−1)
𝑛−1𝑃(𝐴1 ∩ 𝐴2 ∩ … ∩ 𝐴𝑛
𝑛
𝑗=2
𝑛
𝑖=1
) 
Para n eventos mutuamente excludentes:P(A1 U A2 U ... U An) = P(A1) + P(A2) + ... + P(An) 
 
Exemplo 11: [Walpole, et al] A probabilidade de que uma indústria norte-americana será 
localizada em Xangai, na China, é de 0,7; a probabilidade de que será localizada em Pequim, 
China, é de 0,4; e a probabilidade de que será localizada em Xangai ou em Pequim, ou em 
ambos os lugares, é de 0,8. Qual é a probabilidade de que a empresa seja localizada em (a) 
ambas as cidades? (R. 0,3) (b) em nenhuma das cidades? (R. 0,2) 
 
1.11 Regras Multiplicativas 
Se A e B são dois eventos, então: P(A ∩ B) = P(A).P(B|A), desde que P(A) > 0. 
Se A e B são dois eventos independentes, então: P(A ∩ B) = P(A).P(B). 
Para n eventos: 
P(A1∩A2∩...∩An) = P(A1).P(A2|A1). P(A3|A1∩A2). ... .P(An|A1∩A2∩A3∩...∩An-1). 
Para n eventos independentes: P(A1∩A2∩...∩An) = P(A1).P(A2). P(A3). ... .P(An). 
 
Exemplo 12: [Walpole, et al] Um sistema elétrico consiste em quatro componentes, como 
ilustrado na figura a seguir. O sistema funciona se ambos os componentes A e B 
funcionarem e se ou o componente C, ou D, ou ambos funcionarem. A confiabilidade 
(probabilidade de funcionamento) de cada componente é mostrada na figura. Determine a 
probabilidade de que o sistema funcione por completo. (R. 0,7776) 
 24 
 
 
1.12 Teorema de Bayes 
Sejam A e B dois eventos arbitrários com P(A)  0 e P(B) 0. Então 
 
 
 
)(
)(/
/
AP
BPBAP
ABP 
 
 
1.13 Teorema da probabilidade total 
Dizemos que os eventos B1, B2, ..., Bn representam uma partição do espaço amostral S, 
quando 
a) B1, B2, ..., Bn são eventos mutuamente excludentes, ou seja, 



n
i
iB
1
 
b) B1, B2, ..., Bn são eventos exaustivos, ou seja, 
SB
n
i
i 


1
 
c) P(Bi) > 0 para todo i. 
d) P(B1 U B2 U ... U Bn) = P(B1) + P(B2) + ... + P(Bn) = 1 
Ou seja, quando um experimento E é realizado um, e somente um, dos eventos B 
ocorre. 
 
 
 
 
 
Então, para um evento arbitrário A referente a S, podemos escrever: 
)(...)()()(
...
21
21
n
n
BAPBAPBAPAP
BABABAA

 
Substituindo as probabilidades de interseção pela probabilidade condicional, obtemos 
a expressão que traduz o teorema da probabilidade total: 
 P(A) = P(A/B1)P(B1) + P(A/B2)P(B2) + ... + P(A/Bn)P(Bn) 
B7 
B2 B1 
B3 
B4 
B5 
B6 
B8 
B9 
 
A 
 25 
Exemplo 13: Consideremos um lote de 20 peças defeituosas e 80 não defeituosas, do qual 
extrairemos duas peças sem reposição. Sendo A o evento que representa a 1ª peça 
defeituosa e B o evento que representa a 2ª peça defeituosa, calcular: 
 P(A); 
 P(B); 
 P(A|B). 
 
Exemplo 14: [Walpole, et al] Um saco contém 4 bolas brancas e 3 pretas, e um segundo 
saco contém 3 bolas brancas e 5 pretas. Uma bola é retirada do 1º saco e colocada no 2º 
sem ser vista. Qual é a probabilidade de que uma bola, selecionada depois do 2º saco, seja 
preta? (R. 38/63) 
 
Exemplo 15: Um canal de comunicação binária simples transmite mensagens utilizando 
apenas dois sinais, digamos 0 e 1. Supondo que: 
a) o sinal 1 seja transmitido 40% das vezes; 
b) a probabilidade de um 0 transmitido ser recebido corretamente é 0,90; 
c) a probabilidade de um 1 transmitido ser recebido corretamente é 0,95. 
Determine: 
 A probabilidade de um 1 ser recebido 
 Dado que um 1 é recebido, a probabilidade de 1 ter sido transmitido. 
 
Exemplo 16: Falhas em semicondutores. Suponha as seguintes probabilidades para falha no 
produto sujeito a níveis de contaminação na fabricação: 
Probabilidade de falha Nível de contaminação 
0,10 Alto 
0,01 Médio 
0,001 Baixo 
Em uma batelada particular de produção, 20% dos chips estão sujeitos a níveis altos de 
contaminação, 30% a níveis médios de contaminação e 50% a níveis baixos de 
contaminação. Qual é a probabilidade de um produto falhar ao usar um desses ships? 
 
1.14 Exercícios 
1) A teoria da confiabilidade estuda sistemas e seus componentes. O sistema funciona se 
seus componentes ligados em série funcionam simultaneamente e o sistema em paralelo 
funciona se pelo menos um de seus componentes funciona. Para o sistema da figura a 
seguir seus componentes funcionam independentemente. Calcule a confiabilidade do 
sistema. 
 
 
 
 
 0,90 
0,92 0,84 
0,85 
a b 
 26 
2) Um lote é formado por 10 peças boas, 5 peças com defeitos e 1 peça com defeito grave. 
Retiram-se 2 peças ao acaso. Qual a probabilidade de que: 
a) ambas sejam perfeitas; b) pelo menos uma seja perfeita; 
 c) nenhuma tenha defeito grave; d) nenhuma seja perfeita. 
 
3) Amostras de plástico policarbonato são analisadas com relação à resistência a arranhões 
e choque. Os resultados de 100 discos estão resumidos a seguir. 
 
Resistência a choque 
Alta Baixa 
Resistência a 
arranhão 
Alta 80 9 
Baixa 6 5 
Faça “A” denotar o evento em que um disco tem alta resistência a choque e faça “B” denotar 
o evento em que um disco tem alta resistência a arranhões. Determine a probabilidade dos 
eventos: 
𝐴 ∩ 𝐵; 𝐴 ∪ 𝐵; �̅�; 𝐴 ∩ �̅� 
4) A tabela a seguir resume a análise de amostras de aço galvanizado, para peso de 
recobrimento e rugosidade da superfície. 
 
Peso do recobrimento 
Alto Baixo 
Rugosidade 
da superfície 
Alta 12 16 
Baixa 88 34 
a) Se o peso de recobrimento de uma amostra for elevado, qual será a probabilidade da 
rugosidade da superfície ser elevada? 
b) Se rugosidade da superfície de uma amostra for elevada, qual será a probabilidade do 
peso de revestimento ser elevado? 
c) Se a rugosidade da superfície de uma amostra for baixa, qual será a probabilidade do 
peso de recobrimento ser elevado? 
 
5) O Distúrbio de hiperatividade com déficit de atenção, DHDA, é uma desordem que afeta 
entre 3 a 10% das crianças em idade escolar. Assumindo que essa probabilidade seja 
6,6%, estimar: 
a) A probabilidade de que, entre duas crianças em idade escolar escolhidas ao acaso, as 
duas apresentem DHDA. 
b) Uma criança escolhida ao acaso não apresente DHDA. 
c) Duas crianças escolhidas ao acaso não apresentem DHDA. 
d) Em duas crianças escolhidas ao acaso, uma apresente DHDA. 
e) No caso anterior, pelo menos uma apresente DHDA. 
 
6) Dados divulgados sobre os 30 maiores fundos de ações e de investimentos 
diversificados apresentaram a rentabilidade percentual para aplicações de um ano e de 
cinco anos, respectivamente, correspondentes ao período com vencimento em 31 de 
março de 2000 (The Wall Street Journal, 10 de abril de 2000). Suponha que 
 27 
consideremos elevada uma rentabilidade superior a 50%, para aplicações de um ano e 
que consideremos também elevada uma rentabilidade acima de 300%, para aplicações 
de 5 anos. Nove dos fundos tiveram rentabilidade acima de 50% para aplicações de um 
ano, sete dos fundos tiveram rentabilidade acima de 300%, para aplicações de cinco 
anos, e cinco dos fundos tanto tiveram rentabilidade acima de 50% para aplicações de 
um ano, como rentabilidade acima de 300% para aplicações de cinco anos. 
a) Qual é a probabilidade de haver uma rentabilidade elevada para aplicações de um 
ano, e qual é a probabilidade de rentabilidade elevada para aplicações de cinco anos? 
b) Qual é a probabilidade de rentabilidade elevada tanto para aplicações de um ano 
como para aplicações de cinco anos? 
c) Qual é a probabilidade de não haver rentabilidade elevada para aplicações de um ano 
nem para aplicações de cinco anos? 
 
7) Descreva o espaço amostral para cada um dos seguintes experimentos: 
a) Sabe-se que um lote de 120 tampas de baterias para marca-passos contém um certo 
número de tampas defeituosas por causa deum problema com o material de 
isolamento aplicado.Três tampas são aleatoriamente selecionadas (sem reposição) e 
são cuidadosamente inspecionadas. 
b) Sabe-se que uma forma com 10 peças contém uma unidade defeituosa e nove 
unidades boas. Quatro peças são aleatoriamente selecionadas (sem reposição) e 
inspecionadas. 
 
8) Suponha que, em um levantamento de dados, uma determinada população foi 
classificada de acordo com uma das características abaixo: 
P1 Heterossexuais 63% 
P2 Homossexuais 18% 
P3 Hemofílicos 5% 
P4 Usuários de drogas injetáveis 14% 
Imagine ainda que levantamentos estatísticos anteriores permitiram presumir que o risco de 
transmissão do HIV entre os heterossexuais é da ordem de 2,3%; entre a população 
homossexual 9,3%; entre os hemofílicos 12%; e entre os usuários de drogas 17,1%. Com 
estas informações, determine a probabilidade de: 
a) transmissão do HIV; 
b) a chance de um HIV+ ser proveniente do grupo de heterossexuais. 
 
9) Sejam P(A  B) = 0,75 e P(AB) = 0,25. Determine P(A) e P(B), se A e B são 
independentes. 
 
10) Apenas uma em cada dez pessoas de uma população tem tuberculose. Das pessoas 
que têm tuberculose 80% reagem positivamente ao teste Y, enquanto apenas 30% dos 
que não têm tuberculose reagem positivamente. Uma pessoa da população é 
 28 
selecionada ao acaso e o teste Y é aplicado. Qual a probabilidade de que essa pessoa 
tenha tuberculose, se reagiu positivamente ao teste? 
 
11) Três máquinas, A, B e C produzem respectivamente 40%, 50% e 10% do total de peças 
de uma fábrica. As porcentagens de peças defeituosas nas respectivas máquinas são 
3%, 5% e 2%. Uma peça é sorteada ao acaso e verifica-se que é defeituosa. Qual a 
probabilidade de que a peça tenha vindo da máquina B? 
 
12) Uma aula de estatística avançada tem dez estudantes do primeiro ano, 30 do último ano 
e dez formados. O resultado final mostra que três dos alunos do primeiro ano, dez do 
último ano e cinco dos formados receberam um A pelo curso. Se um estudante for 
escolhido aleatoriamente nessa aula e for sabido que ele recebeu um A, qual é a 
probabilidade de que seja um aluno do último ano? 
 
13) Consumidores são usados para avaliar projetos iniciais de produtos. No passado, 95% 
dos produtos altamente aprovados recebiam bons conceitos, 60% dos produtos 
moderadamente aprovados recebiam bons conceitos e 10% dos produtos ruins recebiam 
bons conceitos. Além disso, 40% dos produtos tinham sido altamente aprovados, 35% 
moderadamente aprovados e 25% tinham sido produtos ruins. 
a) Qual é a probabilidade de um produto atingir um bom conceito? 
b) Se um novo projeto atingir um bom conceito, qual será a probabilidade de que ele será 
um produto altamente aprovado? 
 
14) Uma nave espacial tem 1.000 componentes em série. Se a confiabilidade da nave deve 
ser de 0,9, e se todos os componentes têm o mesmo grau de confiabilidade, qual deve 
ser a confiabilidade de cada componente? (R: 0,999895) 
 
15) Uma indústria automobilística está preocupada com um possível recall de seu sedã 4 
portas mais vendido. Se houver um recall, há 0,25 de probabilidade de que o defeito seja 
no sistema de freios; 0,18 de que seja na transmissão; 0,17 de que seja no sistema de 
combustível e 0,40 de que seja em alguma outra parte. 
a) Qual é a probabilidade de que o defeito esteja nos freios ou no sistema de 
combustível, se a probabilidade de defeitos em ambos os sistemas, simultaneamente, 
é de 0,15? 
b) Qual é a probabilidade de que não haja defeitos nem no sistema de freios nem no 
sistema de combustível? 
 29 
Capítulo 2: VARIÁVEIS ALEATÓRIAS DISCRETAS 
 
2.1 Introdução 
O interesse no estudo de um fenômeno aleatório reside em afirmações sobre os 
eventos que podem ocorrer; essas afirmações são feitas com base em probabilidades 
atribuídas a resultados simples. Nosso interesse agora é estabelecer um processo aritmético 
para facilitar essas afirmações. Para isso o primeiro passo consiste em representar por um 
número real cada um dos resultados possíveis de um experimento aleatório e assim 
substituir sua descrição qualitativa por uma quantitativa, por exemplo: quando os resultados 
possíveis de um experimento são sucesso e fracasso, atribuímos arbitrariamente a esses 
eventos os números 1 e 0, respectivamente. Então o espaço amostral [0,1] tem 0 e 1 como 
pontos amostrais em lugar de fracasso e sucesso. 
Isso possibilitará a utilização de meios aritméticos para o cálculo de probabilidades e 
utilizar espaços amostrais associados a muitos experimentos aleatórios de interesse já 
constituídos de conjuntos de números reais não equiprováveis. 
 
2.2 Variáveis aleatórias 
Sejam E um experimento e S o espaço amostral associado ao experimento. Uma 
função X, que associe a cada elemento s  S um número real, X(s), é denominada 
VARIÁVEL ALEATÓRIA (V.A.). Ou seja, uma variável aleatória é uma função que atribui um 
número real a cada resultado no espaço amostral de um experimento aleatório. 
 
 
 
 
 
A variável aleatória X é uma função unívoca, ou seja, a cada s  S corresponderá 
exatamente um valor X(s). Diferentes valores de s podem levar ao mesmo valor de X. 
 
Notação: Uma variável aleatória é denotada por uma letra maiúscula, tal como X. 
Depois de um experimento ser conduzido, o valor medido da variável aleatória é denotado 
por uma letra minúscula x, tal como x = 70 mm. 
 
Exemplo 1: Dados: 
 E: lançamento de duas moedas e observação da face superior 
 Então, S = {(c,c), (c,k), (k,c), (k,k)} 
 Seja X: nº de caras (k) obtidas nas duas moedas 
 Portanto, x = 0, 1, 2 
 Seja A = {(c,k), (k,c)}, como A  S, então:𝑃(𝐴) =
𝑛𝐴
𝑛𝑆
=
2
4
=
1
2
 
s 
S Rx 
x=X(s) 
X 
 30 
 Similarmente, temos que a probabilidade de x=1 é: 
2
1
)1( XP
 
Definição: Sendo A um evento no domínio S e B um evento no contradomínio RX, 
definimos 
P(B) = P(A), onde A = {s  S | X(s)  B} 
Admitindo que probabilidades possam ser associadas a eventos em S, então, a 
definição torna possível atribuir probabilidades a eventos associados a RX em termos de 
probabilidades definidas sobre S. 
Assim, para o exemplo 1, lançamento de duas moedas tem: 
 P(X = 0) = P((c,c)) = ¼ 
 P(X = 1) = P((c,k),(k,c)) = ½ 
 P(X = 2) = P((k,k)) = ¼ 
Usando a aritmética podemos calcular essas probabilidades: 
2 1, 0, x para ,
4
1
)(
2









x
xp
 
Uma variável aleatória X será DISCRETA se o número de valores possíveis de X (seu 
contradomínio) for finito ou infinito numerável (contável). Isto é, os valores possíveis de X, 
podem ser postos em lista como x1, x2,...,xn. Caso contrário será CONTÍNUA, ou seja, seu 
contradomínio é um intervalo real a < x < b (onde a e b podem ser -∞ e +∞, 
respectivamente). 
 
2.3 Variáveis aleatórias discretas 
Seja X uma V.A. discreta. Portanto, RX, o contradomínio de X, será formado no máximo 
por um número infinito numerável de valores x1, x2,... A cada possível resultado xi 
associaremos um número p(xi) = P(X = xi), denominado probabilidade de xi. Os números 
p(xi), i = 1, 2, ... devem satisfazer às seguintes condições: 
a) p(xi) ≥ 0 para todo i, 
b) 




1
.1)()(
i
i SPxp
 
A função p(x) é denominada função de probabilidade (fp) da variável aleatória X. A 
coleção de pares [xi,p(xi)], i = 1, 2,..., é denominada distribuição de probabilidade da 
V.A. X. 
 p(x) pode ser expressa por uma tabela, gráfico ou fórmula. 
 
Exemplo 2: Para o exemplo 1 tem-se 
Tabela: Gráfico: 
 
 
x 0 1 2 
p(x) 1/4 1/2 1/4 
p(x) 
x 0 1 2 
1/2 
1/4 
 31 
Fórmula:
,
41
)(
2









x
xp
 para x = 0, 1, 2 
Qualquer função de uma variável aleatória é uma variável aleatória, isto é, se X é 
uma V.A.  Y = f(X) é também uma V. A. 
 
Exemplo 3: Suponha que uma válvula eletrônica seja posta num soquete e ensaiada. Admita 
que a probabilidade de que o ensaio seja positivo seja ¾ e que a condição de uma válvula 
não influencia a condição de outra. Admita também que seja ensaiada uma partida grande 
dessas válvulas. Os ensaios continuam até que a primeira válvula positiva apareça. 
Determine a distribuição de probabilidade da variável aleatória que representa o número de 
testes necessários para concluir o experimento. 
 
Exemplo 4: (Fonseca, p.29) Uma variável aleatória discreta X tem a distribuição de 
probabilidade dada por: 
7 5, 3, 1, xpara )( 
x
K
xp
. Determine o valor de K e P(X = 5). 
 
Exemplo 5: (Bussab e Morettin, p.128) O ponteiro dos segundos de um relógio mecânico 
pode parar a qualquer instante por defeito técnico, e vamos indicar por X o ângulo que este 
ponteiro forma com o eixo imaginário, passando pelo centro do relógio e pelo número XII, 
conforme mostra a figura a seguir. 
 
Medindo este ângulo X em graus, e lembrando que: 
a) O ponteiro deve dar 60 “saltos” (ele dá um salto em cada segundo) para 
completar uma volta; 
b) O ponteiro tem probabilidade igual de parar em qualquer ponto. 
Determine a função de probabilidade da variável aleatória discreta X. (Resposta: 
𝑝(𝑥) =
1
60
, 𝑝𝑎𝑟𝑎 𝑥 = 6, 12, 18, … , 60º) 
 
2.4 Função de distribuição de probabilidade (fd) 
Seja X uma variável aleatória discreta. Define-se a função F como a função de 
distribuição de probabilidade da variável aleatória X como sendo a probabilidade de que X 
assuma um valor menor ou igual a x, isto é, 
 F(x) = P(X  x). 
 Cálculos: 
 32 
a) 




xx
i
i
i
xpxF
1
)()(
, portanto, a fd pode ser interpretada como a probabilidade associada 
ao ponto x e a todos os pontos à esquerda de x; 
b) 
)()()()( 1 iiii xFxFxXPxp
 
 Propriedades da função de distribuição acumulada: 
a) F(-) = 0 
b) F(+) = 1 
c) P(a  X  b) = F(b) – F(a) 
d) P(a  X  b) = F(b) – F(a) + P(X = a) 
e) P(a < X < b) = F(b) – F(a) - P(X = b) 
 
Exemplo 6: Para o exemplo 1 e 2 tem-se 
 
 
 
 
4
1
)0()()0()0(
0
1
 


pxpXPF
ix
i
i
 
4
3
2
1
4
1
)1()0()()1()1(
1
1
 


ppxpXPF
ix
i
i
 
1
4
1
2
1
4
1
)2()1()0()()2()2(
2
1
 


pppxpXPF
ix
i
i
 
Qual a probabilidade de ocorrem 1 cara ou 2 caras? 
4
3
2
1
4
3
1)1()1()2()21()21(  XPFFXPXXP
 
Exemplo 7: Considere que a variável aleatória X tome os valores 0, 1 e 2, com 
probabilidades 1/3, 1/6 e 1/2, respectivamente. Determine a F(x) e construa os gráficos de 
p(x) e F(x). 
 
Exemplo 8: Considere o exemplo 5. Determine a função de distribuição acumulada da 
variável aleatória discreta X e calcule F(10º). 
 
2.5 Valor esperado de uma VAD (variável aleatória discreta) 
Genericamente, o valor esperado de uma VAD X é dado por: 
 




1
)()(
i
ii xpxXE
 
x 0 1 2 
p(x) 1/4 1/2 1/4 
F(x) 
x 0 1 2 
1/2 
1/4 
3/4 
1 
Prop. a) 
 fd Prop. b) 
 33 
Obs.: 
a) para um número finito de termos, E(X) corresponde à média dos possíveis valores de 
X, ponderada pelos pesos p(x); 
b) se todos os pesos forem iguais, E(X) é a própria média aritmética dos possíveis 
valores de X. 
 
Exemplo 9: (Ross, 1976, p.184) Um dado equilibrado é lançado várias vezes. Seja X uma 
VAD representando a face de cima em cada repetição (note que X = 1,2,...,6). Qual o valor 
esperado de X nessas repetições? 
 
Exemplo 10: (Meyer, 1976, p.140) Um grande lote de peças é produzido. Cada peça tem 
probabilidade 0,9 de ser perfeita e 0,1 de ser defeituosa. Lucra-se $ 5 por peça produzida 
perfeita e $ -1 se ela for defeituosa. Quanto espera-se lucrar por peça com esse lote? 
 
2.6 Valor esperado de uma função de VA Discreta 
Seja X uma VA com distribuição conhecida, e Y = H(x) uma função de X. Calcular o valor 
esperado de Y, E(Y): 




1
)()())(()(
i
ii xpxHXHEYE
 
Exemplo 11: Seja X o número de bits com erro transmitido nos próximos 4 bits transmitidos. 
As probabilidades para esses erros são P(X = 0) = 0,6561, P(X = 1) = 0,2916, P(X = 2) = 
0,0486, P(X = 3) = 0,0036 e P(X = 4) = 0,0001. A variável Y representa o quadrado do 
número de bits com erro. Determine o valor esperado de Y. 
Solução: (R. 0,52) 
x 0 1 2 3 4 
y 
p(x) 0,6561 0,2916 0,0486 0,0036 0,0001 
y.p(x) 
 
 
2.7 Propriedades do valor esperado 
I. Se C é uma constante, então E(C) = C 
II. Se Y=CX, em que C é uma constante e X é uma VA, então E(Y)=E(CX)=CE(X) 
III. Se Z=X+Y, em que X e Y são VA, então E(Z)=E(X)+E(Y) 
IV. Se Z=AX+B, em que A e B são constantes, então E(Z)=AE(X)+B 
 
Exemplo 12: Uma moeda é lançada n vezes. Em cada lançamento, a probabilidade de sair 
cara é constante e igual a p. Qual o número de caras esperado nos n lançamentos? 
 
 34 
2.8 Variância de VAD 
Para uma mesma VAD X, podemos obter um mesmo valor esperado E(X) para diferentes 
distribuições de X. Veja figura a seguir. 
Para distinguir essas diferentes situações, introduzimos o conceito de variância, que mede o 
grau de “compactação” ou grau de “dispersão” dos dados em torno do valor esperado E(X), 
definida por: 
 
222 )()(]))([()( XEXEXEXEXV 
 
 
2
11
222 ))(()()()()( 





i
ii
i
ii xpxxpxXEXEXV
 
 
 A variância V(X) é expressa em unidades quadradas de X. Assim, para os casos de 
medidas de componentes em mm, a variância V(X) é expressa em mm². 
 Para expressar a dispersão dos dados em unidades iguais as de X, define-se o desvio 
padrão como a raiz quadrada da variância: 
 
)()( XVX 
 
 
Exemplo 13: (Meyer, 1983, p.158) Uma estação metereológica me 11 graus de 
nebulosidades do céu, X = 0, 1, 2,..., 10, com as probabilidades 0,05, 0,15, 015, 0,06, 0,06, 
0,06, 0,06, 0,06, 0,15, 0,15, 0,05, respectivamente. Os graus extremos X=0 e X=10 
correspondem, respectivamente, a um céu completamente aberto e um completamente 
fechado. Determine E(X), V(X) e σ(X). 
 
2.9 Propriedades da variância 
I. Se C é uma constante, então V(C) = 0 
II. Se Y=CX, em que C é uma constante e X é uma VA, então V(Y)=V(CX)=C²V(X) 
III. Se Z=X+Y, em que X e Y são VA independentes, então V(Z)=V(X)+V(Y) 
IV. Se Z=AX+B, em que A e B são constantes, então V(Z)=A²V(X)+0 
 
Exemplo 14: Considere o exemplo 12. Qual a variância do número de caras X obtido em n 
lançamentos? 
 35 
2.10 Coeficiente de variação 
No exemplo 13 observamos que os desvios padrões são muito altos se comparados com 
E(X) e com o intervalo de variação de X. Em situações em que conhecemos E(X) e V(X) e 
não conhecemos a distribuição de X (isto é, p(x)), podemos ter uma ideia da dispersão dos 
dados em relação ao valor esperado. Dados muito dispersos são pouco precisos, ou seja, 
quanto maior é a variância dos dados menor é a precisão. 
Por definição, o coeficiente de variação é a razão entre o desvio-padrão e o valor 
esperado. Normalmente expresso em porcentagem. 
 
)(
)(
XE
x
CV


 
Como regra geral, experimentos feitos em laboratório não devem ter CV muito maior que 
10%. Experimentos “de campo” têm CV em torno de 30%. 
 
2.11 Exercícios 
1) Dada a função da variável aleatória X a seguir: 
𝑝(𝑥) = 𝑐(𝑥2 + 4), 𝑝𝑎𝑟𝑎𝑥 = 0, 1, 2, 3. 
Determine: 
a) c de modo que p(x) seja uma função de probabilidade. 
b) O valor esperado, a variância e a função de distribuição acumulada de X. 
 
2) Dada a função da variável aleatória X a seguir: 
𝑝(𝑥) = 𝑘 (
2
𝑥
) (
3
3 − 𝑥
) , 𝑝𝑎𝑟𝑎 𝑥 = 0, 1, 2. 
Determine: 
a) k de modo que p(x) seja uma função de probabilidade. 
b) O valor esperado e a variância de X. 
 
3) Uma aula de estatística avançada tem dez estudantes do primeiro ano, 30 do último ano 
e dez formados. O resultado final mostra que três dos alunos do primeiro ano, dez do 
último ano e cinco dos formados receberam um A pelo curso. Se um estudante for 
escolhido aleatoriamente nessa aula e for sabido que ele recebeu um A, qual é a 
probabilidade de que seja um aluno do último ano? 
 
4) A quantidade de chips de memória, M, necessária num computador pessoal depende do 
número de aplicativos, X, que o proprietário pretende executar simultaneamente. 
Suponha que a distribuição de probabilidade de X, P(X), de todos os proprietários seja 
determinada por, com a expectativa incluindo obviamente todos os proprietários: 
P(X) = k (7,5 – x), x = 1, 2, 3, 4 
Determine: 
a) O valor de k. 
 36 
b) A quantidade esperada e a variância de X. 
c) A função de distribuição acumulada de X. 
 
5) Examinaram-se 2.000 ninhadas de 5 porcos cada uma, segundo o número de machos. 
Os dados estão representados na tabela a seguir: 
Nº machos 0 1 2 3 4 5 
Nº ninhadas 20 360 700 680 200 40 
Determine a esperança e a variância da variável aleatória discreta que descreve a 
quantidade de machos. 
 
6) A variável aleatória X assume os valores 1, 2 e 3 com probabilidades (1+3k)/3, (1+2k)/3 e 
(0,5+5k)/3, respectivamente. 
a) Encontre o valor apropriado de k; 
b) Encontre o valor esperado e a variância de X; 
c) Encontre a função de distribuição acumulada (FDP); 
d) Calcule P(X ≥ 2). 
 
7) Um modelo teórico para a distribuição da variável aleatória X, que um empresário poderá 
usar para julgar a viabilidade econômica de um projeto que ele pretende realizar é dado 
pela tabela a seguir. 
a) Construa o gráfico da função de probabilidade de X (p(x)); 
b) Determine a função de distribuição acumulada de X (F(x)); 
c) Construa o gráfico da função de distribuição acumulada de X; 
d) Qual a probabilidade P(0 ≤ X ≤ 12)? 
e) Qual a probabilidade P(5 ≤ X ≤ 10)? 
x p(x) 
15 0,56 
10 0,23 
5 0,02 
-5 0,19 
Total 1,00 
 
8) Determine o valor esperado, a variância, o desvio padrão e o coeficiente de variação da 
variável aleatória discreta X da questão anterior. 
 
9) Suponha que o número de carros X que passam por um lava-rápido entre 16 h e 17 h, 
numa sexta-feira ensolarada, tenha a seguinte distribuição de probabilidade: 
x 4 5 6 7 8 9 Soma 
P(X = x) 1/12 1/12 1/4 1/4 1/6 1/6 
Seja Y = 2X – 1 a quantia (em dólares) paga ao atendente pelo gerente. Determine os 
ganhos esperados do atendente para esse período em particular, e a variância e o 
coeficiente de variação. 
10) X é uma variável aleatória discreta, tal que a função distribuição de probabilidade é dada 
por: F(-2) = 0,3; F(0) = 0,5; F(1) = 0,6; F(2) = 0,8; F(5) = 1,0. 
a) Calcule a E(X) e V(X); 
 37 
b) P(-1 ≤ x ≤ 4)? 
 
11) Um empreiteiro vai entrar em uma concorrência, e o número de dias para completar o 
trabalho, X, segue a distribuição de probabilidade dada por 
p(x) = 0,1 x = 10, 
 = 0,3 x = 11, 
 = 0,4 x = 12, 
 = 0,1 x = 13, 
 = 0,1 x = 14, 
 = 0 caso contrário. 
 
Determine: 
a) E(X), V(X) e o coeficiente de variação; 
b) Distribuição de probabilidade acumulada. 
 
12) Suponha que X seja uma variável aleatória tal que E(X) = 3 e V(X) = 5. Se H(X) = 2 X – 
7, determine E(X) e V(X). 
 
13) A função de probabilidade para a soma dos valores obtidos no lançamento de dois dados 
pode ser escrita como 
𝑝(𝑥) = 
𝑥 − 1
36
 𝑝𝑎𝑟𝑎 𝑥 = 2, 3, … , 6, 
 
 =
13−𝑥
36
 𝑝𝑎𝑟𝑎 𝑥 = 7, 8, … , 12 
 
Determine a média e a variância da variável aleatória de X. 
 
14) Um processo que fabrica anéis de pistão produz anéis cujos diâmetros, em centímetros, 
variam de acordo com as funções densidades de probabilidade: 
a) Produtor A: 
𝑓(𝑥) = {3
[1 − 16(𝑥 − 10)2] 9,75 < 𝑥 < 10,25
0 𝑐𝑎𝑠𝑜 𝑐𝑜𝑛𝑡𝑟á𝑟𝑖𝑜
 
b) Produtor B: 
 
𝑓(𝑥) = {
15[1 − 25(𝑥 − 10,05)2]
4
 9,85 < 𝑥 < 10,25
0 𝑐𝑎𝑠𝑜 𝑐𝑜𝑛𝑡𝑟á𝑟𝑖𝑜
 
 
As especificações determinam que os diâmetros estejam entre 10,0 ± 0,1 cm. Qual processo 
é melhor? Justifique sua resposta indicando para cada processo, a porcentagem de anéis 
dentro da especificação. 
 
 38 
Capítulo 3: MODELOS DE DISTRIBUIÇÃO DISCRETA 
 
3. 1 Distribuição Uniforme Discreta 
Se a variável aleatória X assume os valores x1, x2, ..., xk com igual probabilidade, então 
a distribuição uniforme discreta é dada por: 
p(x) = 1/k, com x = x1, x2, ... , xk. 
A média e variância da distribuição uniforme discreta são: 
.))((
1
V(X) e 
1
)( 2
11
XEx
k
x
k
XE
k
i
i
k
i
i  
 
Exemplo 1: Um funcionário é escolhido de um grupo de 10 para supervisionar um projeto 
selecionando-se uma etiqueta aleatoriamente de uma caixa que contém 10 etiquetas 
numeradas de 1 a 10. Determine a fórmula para a distribuição de probabilidade de X, que 
representa o número na etiqueta selecionada. 
a) Qual é a probabilidade de que o número selecionado seja menor que 4? 
b) Determine a média e a variância da variável aleatória X. 
 
3. 2 Distribuição Multinomial 
Considerando a possibilidade de k alternativas, ou seja, repartimos o espaço amostral 
em k eventos (A1, A2, ..., Ak) mutuamente exclusivos e exaustivos com probabilidades p1, p2, 
..., pk, e, portanto, p1 + p2 + ... + pk=1. 
Considerando que n repetições do experimento inclui x1 ocorrências do evento A1, x2 
ocorrências do evento A2, ... e xk ocorrências do evento Ak, com x1+x2+...+ xk = n, então o 
número de permutações distintas em n experimentos é dada por (significado: número de 
possibilidades de ocorrer k eventos em n repetições sem observar a ordem): 
!!...xx!x
n!
=
k21,...,, 21





 n
xxx k
 
Assim, em n experimentos, a probabilidade de que A1 ocorra x1 vezes, A2 ocorra x2 
vezes, ..., Ak ocorra xk vezes é igual: 
kx
k
xx
ppp ....
!!...xx!x
n!
=) x,P(X 21 21
k21
ii
 
Em que 



k
i
i
k
i
i pnx
11
1 e 
 
Para cada classe i = 1,2,...,k, temos: 
 Valor esperado: E(Xi) = npi 
 Variância: V(Xi) = npi(1-pi) 
 39 
Exemplo 2: Um dado é lançado 10 vezes. Qual a probabilidade de terem aparecido duas 
vezes o número 2, duas vezes o número 5, três vezes o número 1 e uma vez os demais 
resultados? 
 
3. 3 Experimentos de Bernoulli 
Uma VAD X representa as saídas de um processo Bernoulli se apresenta as seguintes 
propriedades: 
a) Cada tentativa gera apenas dois resultados possíveis, sucesso e fracasso, 
mutuamente excludentes; 
b) Suas probabilidades permanecem constantes em todos os experimentos; 
c) O experimento envolve n repetições independentes e do mesmo tipo; 
 
Portanto, para um processo Bernoulli, podemos definir as seguintes variáveis aleatórias: 
 Y – representa o número de sucessos em n tentativas; 
 Z – representa o número de tentativas para r sucessos; e 
 W – representa o número de sucessos em um intervalo contínuo (tempo, linear, área, 
volume, e outros). 
Exemplo: 
 Y – representa o número depeças defeituosas em 25 peças produzidas; 
 Z – representa o número de peças produzidas para ocorrerem 3 peças defeituosas; 
 W – representa o número de peças produzidas com defeito em um turno de trabalho 
de 8 horas. 
 
3. 4 Distribuição Binomial 
Uma VAD X tem distribuição binomial quando representa o número de sucessos em uma 
sequência de eventos Bernoulli. 
kx
k
xx
ppp ....
!!...xx!x
n!
=) x,P(X 21 21
k21
ii
 
Para k = 2: 
21
21
21
ii .
!x!x
n!
=) x,P(X
xx
pp
 
Como x1 + x2 = n e fazendo x1 = x  x2 = n – x 
e p1 + p2 = 1 e fazendo p1 = p  p2 = 1 – p 
)1(
)(
x)!-(nx!
n!
= x)P(X, pp
xnx


 
 40 
Fazendo 1-p = q temos a explicação do nome binomial: é por que 
xnx
n
x
qp 





é o termo de 
grau x em p no desenvolvimento pelo Binômio de Newton (q + p)n. 
 Portanto, a função de probabilidade da distribuição binomial: 
 
xnx
n
x
ppxp 





 )1()(
 
0,10 e positivo e inteiro 
ãodistribuiç da parâmetros dois os são e 
,...,2,1,0


pn
pn
nx
 
 Como a distribuição binomial é a soma de n experimentos Bernoulli temos que: 
Valor esperado: E(X) = n.p 
 Variância: V(X) = n.p.(1-p) 
 Função de distribuição de probabilidade (fd) da distribuição binomial: 
 











xm
x
xnx
n
x
qpxF
0
)(
 
. asuperior não inteiromaior o é xm
 
Exemplo 3: Uma moeda não viciada é lançada 8 vezes. Encontre a probabilidade de: 
a) dar 5 caras; (R: 7/32) 
b) pelo menos 1 cara; (R: 255/256) 
c) no máximo 2 caras. (R: 37/256) 
 
Exemplo 4: Uma companhia aérea estima que 5% das pessoas que fazem reserva para 
determinado voo não comparecem. Consequentemente, sua política consiste em vender 84 
bilhetes para um voo que só pode acomodar 80 passageiros. 
a) Qual a probabilidade de não sobrar nenhum dos passageiros que comparecem? 
b) Qual o número médio de não-comparecimentos? 
 
3. 5 Distribuição geométrica 
Uma VAD X tem distribuição geométrica quando representa o número de provas em 
uma sequência de tentativas Bernoulli para a ocorrência do primeiro sucesso. 
Seja X a VAD número de repetições necessárias até obter um sucesso. Então, X pode 
tomar os valores 1, 2, ..., n. Representando o sucesso por 1 e o fracasso por 0, podemos 
escrever: 
X = 1  1 sucesso  P(1) = p 
X = 2  1 fracasso e 1 sucesso P(2) = q.p 
X = 3  2 fracassos e 1 sucesso P(3) = q.q.p = q2.p 
X = x  x-1 fracassos e 1 sucesso  P(x) = qx-1.p 
Função de probabilidade da distribuição geométrica: 
 
ppxp x .)1()( 1
 
0,10 e positivo e inteiro 
ãodistribuiç da parâmetros dois os são e 
,...,2,1


pn
pn
nx
 
 41 
Características da distribuição geométrica: 
Valor esperado: 
p
XE
1
)( 
 
Variância: 
2
)1(
)(
p
p
XV


 
 Função de distribuição de probabilidade (fd) da distribuição geométrica: 
 
 x.asuperior não inteiromaior o é m onde 1 )()( ,portanto
)...1(.)1(...).1(.)1()()(
1
1
121
1
1
1













m
xm
x
mm
xm
x
x
xm
x
qxpxF
qqqppppppppxpxF
 
Exemplo 5: (Soong, 1986, p. 151): Um motorista vê uma vaga para estacionamento em uma 
rua. Há 5 carros na frente dele, e cada um tem uma probabilidade de 0,2 de tomar a vaga. 
Qual a probabilidade de a vaga ser tomada pelo carro imediatamente adiante dele? 
 
Exemplo 6: (Soong, 1986, p. 152): A probabilidade de um elemento falhar durante certo 
experimento é 0,1. Qual a probabilidade de serem necessários mais de 3 elementos para 
que um sobreviva ao experimento? 
 
3. 6 Distribuição binomial negativa (Pascal) 
 A distribuição binomial negativa é uma generalização da distribuição geométrica, em 
que o experimento é repetido até que ocorram r sucessos. 
 A VAD X tem distribuição binomial negativa quando representa o número de provas de 
Bernoulli necessárias para a ocorrência do réssimo sucesso e tem sua distribuição de 
probabilidade dada por: 
 
,...2,1, )1()(
1
1






 


rrrxppxp rxr
x
r
 
Características da distribuição binomial negativa: 
Valor esperado: 
p
r
XE )(
 
Variância: 
2
)1(
)(
p
pr
XV


 
Exemplo 7: (Meyer, 1983, p. 205): A probabilidade de sucesso de certo experimento é p = 
0,8 em cada repetição. O experimento deve ser repetido até obter 4 sucessos. Qual a 
probabilidade de o experimento ser repetido 6 vezes? 
 
 
 
 42 
Diferenciação entre as distribuições binomial e binomial negativa: 
Distribuição Binomial Binomial negativa 
Nº de sucessos VAD Conhecido 
Nº de repetições Conhecido VAD 
 
3. 7 Distribuição hipergeométrica multivariada 
Dada uma população com N elementos com a possibilidade de k alternativas, ou seja, 
repartimos o espaço amostral em k eventos (A1, A2, ..., Ak), com a1, a2, ... , ak ocorrências, 
respectivamente. É extraída uma amostra desta população com n elementos, sem reposição. 
Se Xi é a VAD que representa o nº de elementos da classe i na amostra, então Xi tem 
distribuição hipergeométrica multivariada, cuja função de probabilidade é da dada por: 
 
...
),,(
2
2
1
1

































N
n
a
x
a
x
a
x
iii
k
k
axXP 
Exemplo 8: (Walpole, 2009, p. 100): Um grupo de 10 indivíduos é usado para um estudo 
biológico de casos. O grupo tem três pessoas com tipo sanguíneo O, quatro com tipo A e três 
com tipo B. Qual é a probabilidade de que uma amostra aleatória de cinco contenha uma 
pessoa com tipo sanguíneo O, duas com tipo A e duas com tipo B? 
 
3. 8 Distribuição hipergeométrica 
A distribuição hipergeométrica é um caso particular da distribuição hipergeométrica 
multivariada para k = 2. 
De uma população com N elementos é extraída uma amostra com n elementos, sem 
reposição. Para uma dada classe i, há r elementos na população (p = r / N). Se X é a VAD 
que representa o nº de elementos da classe i na amostra, então X tem distribuição 
hipergeométrica, cuja função de probabilidade é da dada por: 
),(,...,2,1,0 )( nrmínxxp
N
n
rN
xn
r
x 



























 
N
r
pnpXE  com )(
 
)1(
))(1(
)(



N
nNpnp
XV
 
Exemplo 9: (Meyer, 1983, p. 207): Em um lote de 50 motores, 3 são defeituosos. Uma 
amostra de 5 motores é retirada aleatoriamente desse lote, sem reposição. O lote será 
 43 
reprovado se 1 ou mais motores dessa amostra forem defeituosos. Qual a probabilidade de 
reprovação do lote? 
 
3. 9 Distribuição de Poisson 
A distribuição de Poisson é uma distribuição discreta empregada em situações 
probabilísticas onde o intervalo de oportunidade de ocorrência de um evento é grande, mas a 
oportunidade de ocorrência em um intervalo particular (ou em um ponto) é muito pequena. 
(Fernando Nogueira). O modelo de Poisson é relevante no estudo de fenômenos: 
 Biológicos – contagem de bactérias em uma lâmina de Petri 
 Físicos – desintegração radioativa 
 Sociais – bombardeio aéreo sobre Londres 
Para construir esse modelo, são assumidas as seguintes hipóteses: 
I. Os eventos relativos a intervalos não-sobrepostos constituem VA independentes, ou 
seja, as variáveis aleatórias