Buscar

apostilha de probabilidade

Prévia do material em texto

Apostila de Probabilidade – Prof GILBERT QUEIROZ DOS SANTOS – Unisuam/2016 3 
1 Teoria dos conjuntos 
 
1.1 Definição 
 
 O conceito de conjunto é fundamental não somente no estudo da probabilidade e 
da estatística, como para a matemática em geral. 
 
Um conjunto pode ser considerado como uma coleção de objetos, chamados 
membros ou elementos do conjunto. 
 
Em geral, denota-se um conjunto por uma letra maiúscula (A, B, C,...) e um 
elemento do conjunto por uma letra minúscula (a, b, c,...). 
 
A relação entre um conjunto e seus elementos é feita através da pertinência. 
 
Um conjunto pode ser definido relacionando-se todos os seus elementos, ou, 
quando isto não for possível, indicando uma propriedade que seja válida para todos os 
elementos do conjunto, e somente para eles. O primeiro método chama-se método da 
listagem, o segundo, método da propriedade. 
 
1.2 Subconjuntos 
 
Se todo elemento de um conjunto A é também elemento de um conjunto B, 
dizemos que A é subconjunto de B, e escrevemos BA ⊂ ou AB ⊃ e lemos “A está 
contido em B”, ou “B contém A”. Ou seja: ∀x, x ∈ A → x ∈ B 
 
1.3 Conjunto Universo - U 
 
Em muitos casos restringimos nosso estudo a subconjuntos de um determinado 
conjunto chamado conjunto universo. É também designado por espaço. Representamo-lo 
pela letra υ. Os elementos de um conjunto espaço costumam chamarem-se pontos do 
espaço. 
 
1.4 Conjunto vazio (∅) 
 
É o conjunto desprovido de elementos, denotado por ∅. O conjunto vazio é 
subconjunto de qualquer conjunto. 
 
 
1.5 Operações com conjuntos 
 
a) União – o conjunto de todos os elementos que pertencem a A, ou a B, ou a ambos, é 
chamado união de A e B; denota-se por BA ∪ , onde A∪B = { x | x ∈ A ou x ∈ B} 
 
 
 
 
 
 
 
 
υ 
A B 
Apostila de Probabilidade – Prof GILBERT QUEIROZ DOS SANTOS – Unisuam/2016 4 
b) Interseção – o conjunto dos elementos que pertencem a A e a B é chamado de 
interseção de A e B. Denota-se por BA ∩ , onde A∩B = {x | x ∈ A e x ∈ B} 
 
 
 
 
 
 
 
 
 
Obs: dois conjuntos A e B tais que ∅=∩ BA , isto é, cuja interseção é vazia, chamam-se 
conjuntos disjuntos. 
 
 
 
 
 
 
 
 
 
 
c) Diferença – o conjunto formado pelo elementos de A que não pertencem a B é 
chamado diferença de A e B; denota-se por A – B = A ∩ Bc , onde A – B = {x | x ∈ A e x ∉ 
B} 
 
 
 
 
 
 
 
 
 
 
 
d) Complemento – se BA ⊂ então B – A é o complementar de B em relação a A; denota-
se por ABC . Se =B U, o conjunto universo, referimo-nos U - A como complementar de A; 
denotamo-lo por A’ ou A , onde AUA −= . Então: 
 
 B – A = {x | x ∈ B e x ∉ A} U - A = { x| x ∈ U e x ∉ A} 
 
 
 
 
 
 
 
 
 
 
υ 
A B A∩B 
υ 
A B 
υ 
A B 
υ υ 
B 
A 
A 
Apostila de Probabilidade – Prof GILBERT QUEIROZ DOS SANTOS – Unisuam/2016 5 
1.6 Leis da Álgebra dos Conjuntos 
 
Lei Idempotentes 
AAA =∪ AAA =∩ 
Lei Associativa 
( ) ( )CBACBA ∪∪=∪∪ ( ) ( )CBACBA ∩∩=∩∩ 
Lei Comutativa 
ABBA ∪=∪ ABBA ∩=∩ 
Lei Distributiva 
( ) ( ) ( )CABACBA ∪∩∪=∩∪ ( ) ( ) ( )CABACBA ∩∪∩=∪∩ 
Lei de Identidade 
AA =∅∪ 
∪A S = S 
∅=∅∩A 
∩A S = A 
Lei de Complementação 
=∪ 'AA S 
( ) AA ='' 
∅=∩ 'AA 
S’ = ∅ , ∅’ = S 
Leis de De Morgan 
( ) ''' BABA ∩=∪ ( ) ''' BABA ∪=∩ 
 
Obs: ( ) ( )cBABAA ∩∪∩= 
 
1.7 Número de elementos de um conjunto 
 
Dado um conjunto finito A, representa-se o seu número de elementos por n[A]. Por 
exemplo: seja A = { a, b, c, d, e }. Então, n[A] = 5. 
Sejam dois conjuntos A e B disjuntos, isto é A ∩ B = ∅, então o número de elementos da 
união A ∪ B é igual à soma dos números de elementos dos dois conjuntos, ou seja: 
 
n[A ∪ B] = n[A] + n[B] 
 
Por outro lado, se A e B não são disjuntos, isto é, se A ∩ B ≠ ∅, então o número de 
elementos da união A ∪ B é igual à soma dos números de elementos dos dois conjuntos, 
menos o número de elementos da interseção, ou seja: 
 
n[A ∪ B] = n[A] + n[B] – n[A ∩ B] 
 
Exemplo: seja A = {a, b, c, d, e} e B = {c, d, e, f, g, h, i}; vamos determinar n[ A ∪ B] e 
n[A ∩ B] e verificar a relação n[A ∪ B] = n[A] + n[B] – n[A ∩ B]. 
 
Então, de A temos n[A] = 5 e de B temos n[B] = 7. 
A ∪ B = {a, b, c, d, e, f, g, h, i}, logo n[A ∪ B] = 9 
A ∩ B ≠ ∅ e A ∩ B = {c, d, e}, logo n[A ∩ B] = 3 
Considerando que A ∪ B = (A – B) ∪ (A ∩ B) ∪ (B – A), temos: 
(A – B) = {a, b } 
(B – A) = { f, g, h, i} 
Então, 
n(A ∪ B) = n(A – B) + n(A ∩ B)+n(B – A) = 2 + 3 + 4 = 9. 
Usando n[A ∪ B] = n[A] + n[B] – n[A ∩ B], temos n[A ∪ B] = 5 + 7 – 3 = 9. 
 
 
Apostila de Probabilidade – Prof GILBERT QUEIROZ DOS SANTOS – Unisuam/2016 6 
1.8 Princípio da Multiplicação 
 
Dados dois conjuntos A e B, temos que n(A x B) = n(A) . n(B) 
 
Exemplo usando o R 
 
Seja U = {1, 2, 3, 4, 5, 6, 7, 8} 
Vamos criar os subconjuntos de U: 
 
U=c(1, 2, 3, 4, 5, 6, 7, 8) 
A=subset(U, U>=2 & U<=3) 
> A 
[1] 2 3 
B=subset(U, U>=3 & U<=5) 
> B 
[1] 3 4 5 
 
Vamos montar o Diagrama de Venn: 
 
install.packages("VennDiagram") # para instalar o pacote 
library(VennDiagram) # para chamar o pacote 
 
venn.diagram(list(A = A, B = B), filename = "teste1.tiff", main="Diagrama de Venn") # este 
comando cria o diagrama, que é colocado no diretório “Documentos” 
 
O diagrama fica assim: 
 
 
 
 
 
 
 
 
 
 
 
 
 
2 Análise Combinatória 
 
Análise Combinatória é um conjunto de procedimentos que possibilita a construção de 
grupos diferentes formados por um número finito de elementos de um conjunto sob certas 
circunstâncias. 
Na maior parte das vezes, tomaremos conjuntos C com m elementos e os grupos 
formados com elementos de C terão p elementos, isto é, p será o tamanho do 
agrupamento, com p<m. 
Arranjos, Permutações ou Combinações, são os três tipos principais de agrupamentos, 
sendo que eles podem ser simples, com repetição ou circulares. Apresentaremos alguns 
detalhes de tais agrupamentos. 
 
Apostila de Probabilidade – Prof GILBERT QUEIROZ DOS SANTOS – Unisuam/2016 7 
Observação: É comum encontrarmos na literatura termos como: arranjar, combinar ou 
permutar, mas todo o cuidado é pouco com os mesmos, que às vezes são utilizados em 
concursos em uma forma dúbia! 
Um dos princípios fundamentais da análise combinatória é o Princípio Fundamental da 
Contagem que se baseia no fato de que se tivermos k etapas de ocorrência de um 
determinado acontecimento, onde na 1ª etapa temos n1 possibilidade, na 2ª etapa temos 
n2 possibilidades, ..., e na k-ésima etapa temos nk possibilidades, então o acontecimento 
ocorrerá de n1 x n2 x ...x nk possibilidades. 
 
 
2.1 Fatorial 
 
Para todo número inteiro n, sendo n ≥ 2, definimos: 
 
n! = n(n-1)…1 
 
que se lê “fatorial de n” ou “n fatorial”. 
 
Exemplo: 
 
6! = 6 . 5 . 4. 3. 2. 1 = 720 
 
Para n = 1 e n = 0, temos: 
1! = 1 0! = 1 
Casos especiais: 
(n+1)! = (n+ 1) . n! 
 
 
2.2 Permutações 
 
Quando formamos agrupamentos com m elementos, de forma que os m elementos sejam 
distintos entre si pela ordem. As permutações podem ser simples, com repetição ou 
circulares. 
2.2.1 Permutação simples: São agrupamentos com todos os m elementos distintos. 
Fórmula: Ps(m) = m(m-1)(m-2)...3 . 2 . 1 = m!. 
Cálculo para o exemplo: Ps(3) = 3!=6. 
Exemplo: Seja C={a,b,c} e m=3. As permutações simples desses 3 elementos são 6 
agrupamentos que não podem ter a repetição de qualquer elemento em cada grupo mas 
podem aparecer na ordem trocada. Todos os agrupamentos estão no conjunto: 
Ps={abc, acb, bac, bca, cab, cba} 
Casos especiais: 
Quando m = 0 e m = 1, temos 
Ps(0) = 0! = 1 Ps(1) = 1! = 1 
Computacionalmente,usando o R, temos: 
Apostila de Probabilidade – Prof GILBERT QUEIROZ DOS SANTOS – Unisuam/2016 8 
x<-c("A", "B", "C"} # vetor com as letras A, B e C 
 res<-permutations(n=3,r=3,v=x) # comando no R 
 res 
res 
 [,1] [,2] [,3] 
[1,] "A" "B" "C" 
[2,] "A" "C" "B" 
[3,] "B" "A" "C" 
[4,] "B" "C" "A" 
[5,] "C" "A" "B" 
[6,] "C" "B" "A" 
 
2.2.2 Permutação com elementos repetidos: Dentre os m elementos do conjunto 
C={x1,x2,x3,...,xn}, faremos a suposição que existem m1 iguais a x1, m2 iguais a x2, m3 
iguais a x3, ... , mn iguais a xn, de modo que m1+m2+m3+...+mn=m. 
Fórmula: Se m=m1+m2+m3+...+mn, então 
!!...!
!)...(
......)(
21
1
2
1
1
)...( 211
21
nn
nmmmm
m
mm
m
m
mr
mmm
m
m
mmm
m
mm
m
m
CCCmP n
n
=




 ++−





 −






==
+++−−
 
 
Anagrama: Um anagrama é uma (outra) palavra construída com as mesmas letras da 
palavra original trocadas de posição. 
Cálculo para o exemplo: m1=4, m2=2, m3=1, m4=1 e m=6, logo: 
 Pr(6)=C(6,4).C(6-4,2).C(6-4-1,1)=C(6,4).C(2,2).C(1,1)= !42
!456
!1!1!2!4
!6
x
xx
= =15. 
Exemplo: Quantos anagramas podemos formar com as 6 letras da palavra ARARAT. A 
letra A ocorre 3 vezes, a letra R ocorre 2 vezes e a letra T ocorre 1 vez. As permutações 
com repetição desses 3 elementos do conjunto C={A,R,T} em agrupamentos de 6 
elementos são 60 grupos que contêm a repetição de todos os elementos de C 
aparecendo também na ordem trocada, uma vez que: 
60
!3.2
!3.4.5.6
!1!2!3
!6)6( ===rP 
 
2.2.3 Permutação circular: Situação que ocorre quando temos que colocar m elementos 
distintos em m lugares equiespaçados em torno de um círculo. 
Apostila de Probabilidade – Prof GILBERT QUEIROZ DOS SANTOS – Unisuam/2016 9 
Fórmula: )!1(!)( −== n
n
n
mPc 
Cálculo para o exemplo: P(4)=3!=6 
Exemplo: Seja um conjunto com 4 pessoas K={a,b,c,d}. De quantos modos distintos 
estas pessoas poderão sentar-se junto a uma mesa circular (pode ser retangular) para 
realizar o jantar sem que haja repetição das posições? 
Se considerássemos todas as permutações simples possíveis com estas 4 pessoas, 
teríamos 24 grupos, apresentados no conjunto: 
Pc={abcd,abdc,acbd,acdb,adbc,adcb,bacd,badc, 
bcad,bcda,bdac,bdca,cabd,cadb,cbad,cbda, 
cdab,cdba, dabc,dacb,dbac,dbca,dcab,dcba} 
Acontece que junto a uma mesa "circular" temos que: 
abcd=bcda=cdab=dabc 
abdc=bdca=dcab=cabd 
acbd=cbda=bdac=dacb 
acdb=cdba=dbac=bacd 
adbc=dbca=bcad=cadb 
adcb=dcba=cbad=badc 
Existem somente 6 grupos distintos, dados por: 
Pc={abcd,abdc,acbd,acdb,adbc,adcb} 
 
2.2.4 Permutações Caóticas 
 
Uma permutação de m elementos de um conjunto é dita caótica (ou desordenada) quando 
nenhum elemento de C está no seu lugar primitivo. 
Por exemplo, as permutações 2143 e 3142 são caóticas, mas 1342 não é, porque 1 está 
no seu lugar primitivo. 
 
O número de permutações caóticas é dado por: 
 






−
++−+−=
!
)1(
...
!3
1
!2
1
!1
11!)(
m
mmD
m
 
 
Por exemplo: 
914)3.4(1
!3
!4
!2
!4!4!4
!4
1
!3
1
!2
1
!1
11!4)4( =+−=



+−+−=



+−+−=D 
 
Sendo C={a, b, c, d} , as permutações caóticas são: 
{(b, a, d, c) (c, a, d, b) (d, a, b, c) (c, d, a, b) (b, d, a, c) (b, c, d, a) (d, c, a, b) (c, d, b, a) 
(d, c, b, a)} 
 
 
 
 
 
Apostila de Probabilidade – Prof GILBERT QUEIROZ DOS SANTOS – Unisuam/2016 10 
2.3 Arranjos (Permutações de subconjuntos) 
 
São agrupamentos formados com p elementos, extraídos de um conjunto com m 
elementos distintos, sendo p<m, de forma que os p elementos sejam distintos entre si 
pela ordem ou pela espécie. Os arranjos podem ser simples ou com repetição. 
2.3.1 Arranjo simples: Não ocorre a repetição de qualquer elemento em cada grupo de p 
elementos. 
Fórmula: )]1()...[1(),( −−−= pmmmpmAs ou )!(
!),(
pm
mpmAs
−
= 
Cálculo para o exemplo: As(4,2) = 4 x 3 = 12 ou 12!2
!4
)!24(
!4)2,4( ==
−
=sA 
Exemplo: Seja Z={a, b, c, d}, m=4 e p=2. Os arranjos simples desses 4 elementos 
tomados 2 a 2 são 12 grupos que não podem ter a repetição de qualquer elemento mas 
que podem aparecer na ordem trocada. Todos os agrupamentos estão no conjunto: 
As={ab, ac , ad, ba, bc, bd, ca, cb, cd, da, db, dc} 
Casos especiais: 
Quando p = 0, p = 1 e p = n, temos: 
1
!
!
)!0(
!
0, ==
−
=
n
n
n
nAn n
n
nn
n
nAn =
−
−
=
−
= )!1(
)!1(
)!1(
!
1, )(!!0
!
)!(
!
,
nPnn
nn
nA nn ===
−
= 
Computacionalmente, usando do software gratuito R, temos o seguinte: 
 x<-c("A", "B", "C", "D") # vetor com as letras A, B, C e D 
 res<-permutations(n=4,r=2,v=x) # comando no R (pacote “gtools”) 
res 
 [,1] [,2] 
 [1,] "A" "B" 
 [2,] "A" "C" 
 [3,] "A" "D" 
 [4,] "B" "A" 
 [5,] "B" "C" 
 [6,] "B" "D" 
 
2.3.2 Arranjo com repetição: Todos os elementos podem aparecer repetidos em cada 
grupo de p elementos. 
Fórmula: Ar(m,p) = mp. 
[,1] [,2] 
[7,] "C" "A" 
[8,] "C" "B" 
[9,] "C" "D" 
[10,] "D" "A" 
[11,] "D" "B" 
[12,] "D" "C" 
 
Apostila de Probabilidade – Prof GILBERT QUEIROZ DOS SANTOS – Unisuam/2016 11 
Cálculo para o exemplo: Ar(4,2) = 42=16. 
Exemplo: Seja C={a,b,c,d}, m=4 e p=2. Os arranjos com repetição desses 4 elementos 
tomados 2 a 2 são 16 grupos que onde aparecem elementos repetidos em cada grupo. 
Todos os agrupamentos estão no conjunto: 
Ar={aa,ab,ac,ad,ba,bb,bc,bd,ca,cb,cc,cd,da,db,dc,dd} 
Casos especiais: 
Quando p = 0, p = 1 e p = n, temos: 
100, == nArn nnArn ==
1
1, 
n
nn nA =, 
Computacionalmente, temos com o uso do R: 
 x<-c("A", "B", "C", "D") 
 res<-permutations(n=4,r=2,v=x, repeats.allowed=T) 
 res 
 [,1] [,2] 
 [1,] "A" "A" 
 [2,] "A" "B" 
 [3,] "A" "C" 
 [4,] "A" "D" 
 [5,] "B" "A" 
 [6,] "B" "B" 
 [7,] "B" "C" 
 [8,] "B" "D" 
 
 
2.3.3 Arranjo condicional: Todos os elementos aparecem em cada grupo de p 
elementos, mas existe uma condição que deve ser satisfeita acerca de alguns elementos. 
Fórmula: N=A(m1,p1).A(m-m1,p-p1) 
Cálculo para o exemplo: N=A(3,2).A(7-3,4-2)=A(3,2).A(4,2)=6×12=72. 
Exemplo: Quantos arranjos com 4 elementos do conjunto {a,b,c,d,e,f,g}, começam com 
duas letras escolhidas no subconjunto {a,b,c}? 
Aqui temos um total de m=7 letras, a taxa é p=4, o subconjunto escolhido tem m1=3 
elementos e a taxa que este subconjunto será formado é p1=2. Com as letras a, b e c, 
tomadas 2 a 2, temos 6 grupos que estão no conjunto: 
Então, 
 [,1] [,2] 
[9,] "C" "A" 
[10,] "C" "B" 
[11,] "C" "C" 
[12,] "C" "D" 
[13,] "D" "A" 
[14,] "D" "B" 
[15,] "D" "C" 
[16,] "D" "D" 
Apostila de Probabilidade – Prof GILBERT QUEIROZ DOS SANTOS – Unisuam/2016 12 
A(m1,p1) = A(3, 2) = 3 x 2 = 6 
Pabc = {ab,ba,ac,ca,bc,cb} 
Com as letras d,e,f e g tomadas 2 a 2, temos 12 grupos que estão no conjunto: 
Então, 
A(m-m1,p-p1) = A(7-3, 4 – 2) = A(4, 2) = 4 x 3 = 12 
Pdefg = {de,df,dg,ed,ef,eg,fd,fe,fg,gd,ge,gf} 
Usando a regra do produto, teremos 72 possibilidades obtidas pela junção de um 
elemento do conjunto Pabc com um elemento do conjunto Pdefg. 
Então, 
N= A(m1,p1).A(m-m1,p-p1) = A(3,2).A(7-3,4-2)=A(3,2).A(4,2)=6×12=72. 
Um típico arranjo para esta situação é cafg. 
 
 
2.4 Combinações 
 
Quando formamos agrupamentos com p elementos, (p<m) de forma que os p elementos 
sejam distintos entre sí apenas pela espécie. 
2.4.1 Combinação simples: Não ocorre a repetição de qualquer elemento em cada 
grupo de p elementos. 
Fórmula: )!(!
!),(
pmp
m
p
m
pmC
−
=





= 
Cálculo para o exemplo: C(4,2)= 6
2
3.4
!2!2!4
)!24(!2
!4
2
4
===
−
=





 
Exemplo: Seja C={a,b,c,d}, m=4 e p=2. As combinações simples desses 4 elementos 
tomados 2 a 2 são 6 grupos que não podem ter a repetição de qualquer elemento nem 
podem aparecer na ordem trocada. Todos os agrupamentos estão no conjunto: 
Cs={ab,ac,ad,bc,bd,cd} 
Casos especiais: 
n
n
=





1
 1
0
=




n
 1=





n
n
 
Se 





=





q
n
p
n
, então (p + q = n ou p = q) 






−
=





pn
n
p
n
 
Apostila de Probabilidade – Prof GILBERT QUEIROZ DOS SANTOS – Unisuam/2016 13 






−
−
+




 −
=





1
11
k
n
p
n
p
n
 
A relação 





+
+
=





+
+





1
1
1 p
n
p
n
p
n
 é denominada Relação de Stifel. 
Do conceito de combinação, temos a seguinte relação importante 
p
pm
pm P
A
C ,
,
= 
Computacionalmente, temos no R o seguinte: 
 x<-c("A", "B", "C", "D") # vetor com as letras A, B , C e D 
 res<-combinations(n=4,r=2,v=x) # comando no R 
 res 
 [,1] [,2] 
[1,] "A" "B" 
[2,] "A" "C" 
[3,] "A" "D" 
[4,] "B" "C" 
[5,] "B" "D" 
[6,] "C" "D" 
 
 
2.4.2 Combinação com repetição: Todos os elementos podem aparecer repetidos em 
cada grupo até p vezes. 
Fórmula: Cr(m,p)=C(m+p-1,p) 
Cálculo para o exemplo: Cr(4,2)=C(4+2-1,2)=C(5,2)=5!/[2!3!]=10 
Exemplo: Seja C={a,b,c,d}, m=4 e p=2. As combinações com repetição desses 4 
elementos tomados 2 a 2 são 10 grupos que têm todas as repetições possíveis de 
elementos em grupos de 2 elementos não podendo aparecer o mesmo grupo com a 
ordem trocada. De um modo geral neste caso, todos os agrupamentos com 2 elementos 
formam um conjunto com 16 elementos: 
Cr={aa,ab,ac,ad,ba,bb,bc,bd,ca,cb,cc,cd,da,db,dc,dd} 
mas para obter as combinações com repetição, deveremos excluir deste conjunto os 6 
grupos que já apareceram antes, pois AB=BA, AC=CA, AD=DA, BC=CB, BD=DB e 
CD=DC, assim as combinações com repetição dos elementos de C tomados 2 a 2, são: 
Cr={aa,ab,ac,ad,bb,bc,bd,cc,cd,dd} 
Computacionalmente, temos: 
Apostila de Probabilidade – Prof GILBERT QUEIROZ DOS SANTOS – Unisuam/2016 14 
 x<-c("A", "B", "C", "D") # vetor com as letras A, B, C e D 
 res<-combinations(n=4,r=2,v=x, repeats.allowed=T) # comando no R 
 res 
 [,1] [,2] 
 [1,] "A" "A" 
 [2,] "A" "B" 
 [3,] "A" "C" 
 [4,] "A" "D" 
 [5,] "B" "B" 
 [6,] "B" "C" 
 [7,] "B" "D" 
 [8,] "C" "C" 
 [9,] "C" "D" 
[10,] "D" "D" 
 
2.4.3 Combinação generalizada: considere-se um conjunto de n elementos (não 
necessariamente distintos) pertencentes a k grupos (cada um dos quais é constituído por 
objetos idênticos). Os primeiro n1 elementos idênticos podem ser colocados em n lugares 
(de tal forma que em nenhum lugar há mais que um objeto) de 






1n
n
 
modos distintos. Então, os n2 elementos do grupo seguinte podem ser colocados nos 
lugares restantes de 





 −
2
1
n
nn
 
modos diferentes. E assim sucessivamente, até esgotar todos os k grupos de elementos. 
Ao todo há então 





 ++−
××




 −
×





k
k
n
nnn
n
nn
n
n )...(
...
1
2
1
1
 
modos diferentes de colocar n elementos nos n lugares disponíveis. Cada um destes 
modos de arrumar n elementos é denominado de combinação generalizada de n 
elementos repartidos por k grupos de elementos idênticos e o seu número total é dado por 
Apostila de Probabilidade – Prof GILBERT QUEIROZ DOS SANTOS – Unisuam/2016 15 






≡
k
n
nnn
nnn
n
C
k
,...,, 21
,...,, 21
= 




 ++−
××




 −
×





k
k
n
nnn
n
nn
n
n )...(
...
1
2
1
1
= 
 
 
Observação: 
 
Para contar o número de maneiras de colocar objetos em caixas, precisamos estar muito 
claros em relação à nossa capacidade de distinguir entre os objetos e entre as caixas. Se 
dois objetos são indistinguíveis (não distintos), então o intercâmbio delas não resultará em 
uma nova maneira de colocar os objetos em caixas. Do mesmo modo, se duas caixas são 
indistinguíveis (não distintas), então se deslocam todos os objetos de uma caixa para 
outra caixa não resultará numa nova maneira de posicionar os objetos em caixas. Então, 
precisamos considerar todos os casos para saber se os objetos e se as caixas são 
distinguíveis (distintas). 
 
 Caixas distintas Caixas não distintas 
Objetos distintos 
!!...!
!
21 nmmm
m
 S(n,k) = S(n-1,k-1) + k S(n-1,k) 
Objetos não distintos C(n+k-1,k-1) Part(n,k) 
 
Onde: S(n, k) é o Número de Stirling de Segunda Espécie e Part(n, k) são as partições de 
um número. 
 
2.5 Regras Gerais sobre Análise Combinatória ou Regras de Contagem 
 
Problemas de Análise Combinatória normalmente são muito difíceis mas eles podem ser 
resolvidos através de duas regras básicas: a regra da soma e a regra do produto. 
Regra da soma: A regra da soma nos diz que se um elemento pode ser escolhido de m 
formas e um outro elemento pode ser escolhido de n formas, então a escolha de um ou 
outro elemento se realizará de m+n formas, desde que tais escolhas sejam 
independentes, isto é, nenhuma das escolhas de um elemento pode coincidir com uma 
escolha do outro. 
Exemplo: Considere um processo de manufatura dividido em máquinas 
. Cada peça é desenvolvida por uma das máquinas e classificada em: 
Máquinas M1 M2 M3 M4 
A1 B1 C1 D1 
A2 B2 C2 D2 Característica 
A3 D3 
Totais 3 2 2 3 
 
Apostila de Probabilidade – Prof GILBERT QUEIROZ DOS SANTOS – Unisuam/2016 16 
Com isso, concluímos que existe um total de maneiras de classificarmos a peça. 
Regra do Produto: A regra do produto diz que se um elemento H pode ser escolhido de 
m formas diferentes e se depois de cada uma dessas escolhas, um outro elemento M 
pode ser escolhido de n formas diferentes, a escolha do par (H,M) nesta ordem poderá 
ser realizada de m.n formas. 
Exemplo: Uma peça manufaturada deve passar por três passos e por três estações de 
controle. Em cada estação a peça é inspecionada com relação a uma determinada 
característica e marcada adequadamente. Na primeira estação, três classificações são 
possíveis (ok, excelente, retrabalho), enquanto que nas duas últimas, duas classificações 
são possíveis (ok, retrabalho). De quantas maneiras uma peça pode ser marcada? 
1ª estação - 3 maneiras 
2ª estação - 2 maneiras 
3ª estação - 2 maneiras 
Desta forma, a peça pode ser marcada de maneiras diferentes. 
Quadro-resumo: 
 
 
Apostila de Probabilidade – Prof GILBERT QUEIROZ DOS SANTOS – Unisuam/2016 17 
 
 
3 Probabilidade 
 
3.1 Conceitos iniciais: 
 
 Encontramos na natureza dois tipos de fenômenos: determinísticos e aleatórios. 
 Os fenômenos determinísticos são aqueles em que os resultados são sempre os 
mesmos, qualquer que seja o número de ocorrências verificadas. 
 Nos fenômenos aleatórios, os resultados não serão previsíveis, mesmo que haja 
um grande número de repetições do mesmo fenômeno. 
 
3.1.1 Experimento 
 
 É qualquer ação ou processo que implique a observação e coleta de dados 
referentes a um fenômeno. Com isto, temos os experimentos determinísticos e os 
experimentos aleatórios. 
 
3.1.1.1 Experimento Determinístico 
 
 São aqueles que ao serem repetidos nas mesmas condições conduzem ao mesmo 
resultado. 
 Exemplo: 
- ao deixar uma pedra cair de umacerta altura, podemos determinar sua posição e 
velocidade em qualquer instante de tempo posterior à queda; 
- se aquecermos a água a 100 graus centígrados, ela entrará em ebulição. 
 
3.1.1.2 Experimento Aleatório - ε 
 
São aqueles que ao serem repetidos nas mesmas condições não produzem o 
mesmo resultado, ou seja, os resultados estão sujeitos à incerteza. 
 
Exemplo: 
 
- lançamento de um dado; 
- lançamento de uma moeda; 
- retirada de cartas de um baralho; 
- retirada de bolas de uma urna; 
- Etc. 
 





 −+
=−+
p
pn
ppnCR
1
),1(
 
Apostila de Probabilidade – Prof GILBERT QUEIROZ DOS SANTOS – Unisuam/2016 18 
 Matematicamente, o conceito de experimento é considerado como uma noção 
primitiva e, conseqüentemente, não definido. 
 
 Contudo, deve-se observar que: 
 
a) cada experimento poderá ser repetido indefinidamente sob as condições 
essencialmente inalteradas; 
b) muito embora não sejamos capazes de afirmar que resultado particular ocorrerá (“a 
priori”), seremos capazes de descrever o conjunto de todos os possíveis resultados do 
experimento; 
c) quando o experimento for executado um grande número de vezes, surgirá uma 
regularidade, chama de regularidade estatística, 
 
 
3.1.2 Espaço amostral – S 
 
 É o conjunto de todos os resultados possíveis de um determinado experimento 
aleatório ε. 
 Dependendo da quantidade de resultados possíveis, o espaço amostral pode ser 
classificado como: 
 
a) espaço amostral finito: quando contem somente um número finito de resultados 
possíveis; 
b) espaço amostral infinito numerável: quando o conjunto de resultados possíveis podem 
ser postos em correspondência biunívoca com o conjunto de números naturais; 
c) espaço amostral não contável ou não-numerável quando o conjunto de resultados 
possíveis tem correspondência com um intervalo de números reais. 
 
Fala-se em espaço amostral discreto, quando se possui um espaço amostral finito 
ou um espaço amostral infinito numerável. Fala-se em espaço amostral contínuo quando 
se possui um espaço amostral não contável ou não-numerável. 
 
3.1.3 Evento 
 
 É um subconjunto de um espaço amostral que pode ser determinado tanto por uma 
listagem direta de seus elementos, como por uma relação ou fórmula que dê a condição 
que os elementos devem satisfazer a fim de pertencerem ao subconjunto. 
 
a) Evento simples: é aquele formado por apenas um único elemento do espaço amostral. 
 
b) Evento composto: é aquele formado por dois ou mais elementos do espaço amostral. 
 
c) Evento certo - υ: é aquele que ocorre sempre, isto é, em todas as realizações da 
experiência. Pela Teoria dos conjuntos, este evento é um subconjunto impróprio do 
espaço amostral. 
 
d) Evento impossível - ∅: é aquele que nunca ocorre, isto é, em nenhuma realização da 
experiência. 
 
e) Eventos mutuamente exclusivos ou disjuntos – são aqueles em que a ocorrência de 
um deles exclui a possibilidade de ocorrência do outro, isto é, não ocorrem 
simultaneamente, e ( ) ∅=∩ BA 
Apostila de Probabilidade – Prof GILBERT QUEIROZ DOS SANTOS – Unisuam/2016 19 
 
Sejam A1, A2,..., Aj, com j = 1,...,n, eventos de um espaço amostral S. Da teoria 
dos conjuntos, temos as seguintes operações entre eventos: 
 
a) União: é a operação que consiste na ocorrência de pelo menos um dos eventos A1, 
A2,..., Aj, onde temos U
n
j
jA
1=
. 
 
b) Interseção: que é a operação que consiste na ocorrência simultânea dos eventos A1, 
A2,..., Aj, onde temos ∩ Aj 
 
c) Complemento (Ac ou A ) – é a operação em que só ocorrem os elementos de espaço 
amostral que não pertence a um evento. 
Se A é um evento qualquer, seu complemento ou complementar é A , e ASA −= 
 
 
 
 
 
 
 
 
d) Diferença (A – B ou A ∩ Bc) – é a operação que consiste na diferença entre A e B, ou 
seja, na ocorrência somente dos elementos A, exceto os que também estejam em B. 
 
 
e) Diferença simétrica (A∆B ou (A∩Bc) ∪ (Ac ∩ B)) – é a operação em que ocorrem todos 
os elementos de A∪B exceto os que estejam na A∩B. 
 
 
 
 
 
 
 
 
 
Observação: 
 
Partição do Espaço Amostral – diz-se que A1, A2,..., Aj, com j = 1,...,n, formam uma 
partição de S se são disjuntos e se sua união é o próprio espaço amostral, ou seja 
SA
n
j
j =
=
U
1
, com Ai ∩ Aj = 0, ∀ i ≠ j 
Exemplo: 
Seja um baralho de 52 cartas. Seja o seguinte experimento: retirar uma carta do baralho. Observe 
que: 
a) o espaço amostral associado a este experimento é: 
 
require(prob) 
S <- cards(makespace=TRUE) 
A 
A 
S 
A B A∩B 
Apostila de Probabilidade – Prof GILBERT QUEIROZ DOS SANTOS – Unisuam/2016 20 
S 
 
 rank suit probs 
1 2 Club 0.01923077 
2 3 Club 0.01923077 
3 4 Club 0.01923077 
4 5 Club 0.01923077 
5 6 Club 0.01923077 
6 7 Club 0.01923077 
7 8 Club 0.01923077 
8 9 Club 0.01923077 
9 10 Club 0.01923077 
10 J Club 0.01923077 
11 Q Club 0.01923077 
12 K Club 0.01923077 
13 A Club 0.01923077 
 
b) Alguns eventos deste espaço amostral: 
 
A <- subset(S, suit == "Heart") 
> A 
 rank suit probs 
27 2 Heart 0.01923077 
28 3 Heart 0.01923077 
29 4 Heart 0.01923077 
30 5 Heart 0.01923077 
31 6 Heart 0.01923077 
32 7 Heart 0.01923077 
33 8 Heart 0.01923077 
34 9 Heart 0.01923077 
35 10 Heart 0.01923077 
36 J Heart 0.01923077 
37 Q Heart 0.01923077 
38 K Heart 0.01923077 
39 A Heart 0.01923077 
 
B <- subset(S, rank == "A" ) 
> B 
 rank suit probs 
13 A Club 0.01923077 
26 A Diamond 0.01923077 
39 A Heart 0.01923077 
52 A Spade 0.01923077 
 
C <- subset(S, suit == "Spade") 
 
> C 
 rank suit probs 
40 2 Spade 0.01923077 
41 3 Spade 0.01923077 
42 4 Spade 0.01923077 
43 5 Spade 0.01923077 
44 6 Spade 0.01923077 
45 7 Spade 0.01923077 
46 8 Spade 0.01923077 
47 9 Spade 0.01923077 
14 2 Diamond 0.01923077 
15 3 Diamond 0.01923077 
16 4 Diamond 0.01923077 
17 5 Diamond 0.01923077 
18 6 Diamond 0.01923077 
19 7 Diamond 0.01923077 
20 8 Diamond 0.01923077 
21 9 Diamond 0.01923077 
22 10 Diamond 0.01923077 
23 J Diamond 0.01923077 
24 Q Diamond 0.01923077 
25 K Diamond 0.01923077 
26 A Diamond 0.01923077 
27 2 Heart 0.01923077 
28 3 Heart 0.01923077 
29 4 Heart 0.01923077 
30 5 Heart 0.01923077 
31 6 Heart 0.01923077 
32 7 Heart 0.01923077 
33 8 Heart 0.01923077 
34 9 Heart 0.01923077 
35 10 Heart 0.01923077 
36 J Heart 0.01923077 
37 Q Heart 0.01923077 
38 K Heart 0.01923077 
39 A Heart 0.01923077 
40 2 Spade 0.01923077 
41 3 Spade 0.01923077 
42 4 Spade 0.01923077 
43 5 Spade 0.01923077 
44 6 Spade 0.01923077 
45 7 Spade 0.01923077 
46 8 Spade 0.01923077 
47 9 Spade 0.01923077 
48 10 Spade 0.01923077 
49 J Spade 0.01923077 
50 Q Spade 0.01923077 
51 K Spade 0.01923077 
52 A Spade 0.01923077 
Apostila de Probabilidade – Prof GILBERT QUEIROZ DOS SANTOS – Unisuam/2016 21 
48 10 Spade 0.01923077 
49 J Spade 0.01923077 
50 Q Spade 0.01923077 
51 K Spade 0.01923077 
52 A Spade 0.01923077 
 
 
 
3.2 Processos de amostragem 
 
Uma amostra de tamanho n de um conjunto C que tem N elementos é um 
subconjunto de n elementos retirados de C. 
As amostras podem ser retiradas de um conjunto de duas maneiras: com reposição 
ou sem reposição. 
Nas amostras retiradas com reposição cada elemento selecionado é reposto no 
conjunto antes da próxima retirada. No caso de amostras sem reposição, os elementos 
não são repostos após cadaretirada. 
Os elementos da amostra poderão ainda ser ordenados ou não. 
Uma amostra é dita ordenada se os seus elementos forem ordenados, isto é, se 
duas amostras com os mesmos elementos, porém, em ordens distintas, forem 
consideradas diferentes. 
As amostras não ordenadas sem reposição, de tamanho n de um conjunto com N 
elementos, são denominadas, na maioria dos textos elementares de probabilidade ou de 
combinatória, de combinações de N elementos tomadas n a n. Quando não for 
estabelecida nenhuma qualificação, estaremos admitindo que os elementos são todos 
distintos e que a amostra é não ordenada. As amostras ordenadas sem reposição são 
denominadas arranjos. 
 
3.2.1 Amostragem ordenada sem reposição 
 
O número de amostras ordenadas sem reposição de tamanho n, de um conjunto de 
N elementos é dado por: 
(n)k = n(n – 1)...(n – k + 1) = )!(
!
kn
n
−
– Arranjos simples 
 
Quando n = k, temos uma permutação, então 
 
(n)n = n(n – 1)...1= n! - Permutação 
 
3.2.2 Amostragem ordenada com reposição 
 
O número de amostras ordenadas com reposição de tamanho n, de um conjunto 
com N elementos é dados por: 
nk – Arranjo completo ou com repetição 
 
3.2.3 Amostragem não ordenada sem reposição 
 
O número de amostras não ordenadas sem reposição de tamanho n, de um 
conjunto com N elementos, é dados por 
 
!
)(
, N
N
k
nC nkn =





= - Combinação simples 
 
Apostila de Probabilidade – Prof GILBERT QUEIROZ DOS SANTOS – Unisuam/2016 22 
3.2.4 Amostragem não ordenada com reposição 
 
O número de amostras não ordenadas com reposição de tamanho n, de um 
conjunto com N elementos, é dados por 





 −+
==
−+ k
knCCR kknkn
1
,1, - Combinação com repetição 
 
 
Resumo: 
 
Tipo de amostragem Ordenada Não-ordenada 
Com reposição knknAR =),( 




 −+
=−+ k
knkknCR 1),1( 
Sem reposição )!(
!),(
kn
nknA
−
= 





= k
nknC ),( 
 
 
3.3 Freqüência relativa 
 
 Suponha-se que repetimos n vezes um experimento aleatório ε, e seja A um evento 
associado ao espaço amostral S do experimento aleatório ε. Admitamos que seja nA o 
número de vezes que o evento A ocorreu nas n repetições. 
 Temos então a fração 
n
nf AA = , que é denominada freqüência relativa. 
 Quando o experimento for repetido um grande número de vezes, surgirá uma 
regularidade desta fração. É esta regularidade que torna possível construir um modelo 
matemático preciso, com o qual se analisará o experimento. Esta regularidade é 
denominada “Regularidade Estatística”. 
 
 
Apostila de Probabilidade – Prof GILBERT QUEIROZ DOS SANTOS – Unisuam/2016 23 
Este gráfico pode ser obtido por meio do seguinte script para ser utilizado no programa R: 
 
n<-seq(5,1000,5) 
p<-0 
x<-c(0,1) 
for (i in 1:length(n)){ 
toss<-sample(x,n[i],replace=TRUE) 
p[i]<-sum(toss)/length(toss) 
} 
 
plot(n,p, type="l", ylim=c(0,1), lwd = 3, col = "blue", main="Probabilidades no Lançamento 
de Uma Moeda", ylab="Probabilidades", xlab="Número de Lançamentos") 
abline(h=0.5, lty=2, lwd=2, col="red") 
 
 
As propriedades da freqüência relativa são: 
 
a) 10 ≤≤ Af ; 
b) 1=Af se, e somente se, A correr nas n repetições; 
c) 0=Af se, e somente se, A nunca ocorrer nas n repetições; 
d) Se A e B forem eventos mutuamente excludentes, BABA fff +=∪ 
 
Com base na “regularidade estatística” de um experimento, temos que o valor hipotético 
fixo no qual tende a haver uma estabilização da freqüência relativa, denomina-se 
probabilidade. 
 
 Ou seja, se A é um evento associado ao espaço amostral S do experimento 
aleatório ε e nA o número de vezes que este evento ocorre em n repetições do 
experimento aleatório, então a probabilidade de A será dada por: 
 
n
nfAP A
n
A
n ∞→∞→
== limlim)( 
 
 
3.4 Definição Clássica de Probabilidade 
 
 Dada uma experiência aleatória ε uniforme definida num espaço de amostragem S, 
define-se probabilidade de ocorrer o evento A, contido em S, como sendo o quociente 
entre o número de elementos do evento A e o número de elementos do espaço amostral 
S, isto é, é o número de casos favoráveis ao evento, dividido pelo número total de casos 
possíveis, supondo todos casos igualmente possíveis. 
 
( )
S
A
n
nAP = 
 
Embora seja muito intuitiva também, esta definição tem algumas restrições sérias: 
 
a) existe dificuldade, muita vezes, de se identificar e enumerar os casos favoráveis e 
possíveis, por exemplo nas experiências que os resultados tenham caráter qualitativo 
e/ou não possamos efetuar contagens; 
Apostila de Probabilidade – Prof GILBERT QUEIROZ DOS SANTOS – Unisuam/2016 24 
b) esta definição não depende da experiência para que se concretize realmente o que 
idealizamos; 
c) no caso em que o espaço amostral tivesse infinitos elementos, não teria sentido falar 
em Sn ; 
d) não estabelece um critério para casos igualmente possíveis, pois, partindo da hipótese 
que a experiência é uniforme (todos os resultados são equiprováveis) estamos 
definindo probabilidade por aquilo exatamente que queríamos definir. 
 
 
3.5 Definição Axiomática de Probabilidade 
 
 No Ano de 1930, A. N. Kolmogorov apresentou um conjunto de axiomas 
matemáticos para definir probabilidade: 
 
 Seja ε um experimento aleatório e S seu espaço amostral associado. A cada 
evento A associaremos um número real representado por P(A) e denominado 
“Probabilidade de A”, que satisfaça aos seguintes axiomas: 
 
a) ( ) 10 ≤≤ AP ; 
b) 1)( =SP ; 
c) Se A1, A2, ..., Ak for um conjunto finito de eventos mutuamente exclusivos, então 
∑=∪∪∪=





==
k
i
ik
k
i
i APAAAPAP
1
21
1
)()...(U 
 Se A1, A2, ... for um conjunto infinito de eventos mutuamente exclusivos, então 
∑=∪∪=




 ∞
=
∞
= 1
21
1
)(...)(
i
i
i
i APAAPAP U 
 
3.6 Modelos matemáticos 
 
- Modelo determinístico: modelo que se refere a experimentos determinísticos, ou seja, 
aqueles que executados sob as mesmas condições produzem resultados idênticos. 
 
- Modelo não-determinístico ou probabilístico: modelo que se refere a experimentos 
aleatórios, ou seja, aqueles que executados sob as mesmas condições produzem 
resultado distintos, e que seguem um comportamento probabilístico. 
 
 
3.6.1 Modelo Probabilístico 
 
Um modelo probabilístico é constituído por: 
a) um conjunto não vazio S – espaço amostral; 
b) uma σ-Álgebra F de eventos aleatórios; 
c) Uma probabilidade P definida em F. 
 
Com isto, temos um espaço de probabilidade formado por (S, F, P) 
 
3.7 Propriedades da Teoria da Probabilidade 
 
a) Para todo evento A: 1)(0 ≤≤ AP ; 
b) Para S: 1)( =SP ; 
Apostila de Probabilidade – Prof GILBERT QUEIROZ DOS SANTOS – Unisuam/2016 25 
c) Para o evento ∅: 0)( =∅P ; 
d) ( )APAP −= 1)( 
e) Se A e B são eventos mutuamente exclusivos, então 
)()()( BPAPBAP +=∪ 
 
Observação 1: Para um número qualquer de eventos mutuamente excludentes A1, A2, ... 
 
( ) ( ) ( ) ...... 2121 ++=∪∪ APAPAAP ∑
==
=




 m
j
j
m
j
j APAP
11
)(U 
 
Observação2: Em particular, se SAAA n =∪∪∪ ...21 , então 
1)()(...)()( 21 ==+++ SPAPAPAP n 
 
f) Se A e B são dois eventos quaisquer 
 
( )BAPBPAPBAP ∩−+=∪ )()()( 
 
Dem.: Sendo A ∪ B = A ∪ (B ∩ A ) e B = (A ∩ B) ∪ (B ∩ A ), temos 
P(A∪ B) = P(A) + P(B ∩ A ), mas P(B) = P(A ∩ B) + P(B ∩ A )∴ P(B ∩ A ) = P(B) - 
P(A ∩ B), então 
P(A∪ B) = P(A) + P(B ∩ A ) = P(A) + P(B) - P(A ∩ B) 
 
Ou ainda, considerando que (A∪B) = (A – B) ∪ (A∩B) ∪ (B – A), 
A = (A-B) ∪ (A∩B) e B = (B – A) ∪ (A∩B) 
 
 
 
 
 
 
 
 
 
g) Para quaisquer eventos A e B 
( ) ( )BAPBAPAP ∩+∩=)(h) Se BA ⊂ , então )()( BPAP ≤ e P(B – A) = P(B) – P(A) 
 
 
 
S 
A B A∩B B
 
S 
A - B B - A A∩B 
Apostila de Probabilidade – Prof GILBERT QUEIROZ DOS SANTOS – Unisuam/2016 26 
Exemplo: 
 
Seja um baralho de 52 cartas. Seja o seguinte experimento: retirar uma carta do baralho. Vimos que: 
 
a) o espaço amostral associado a este experimento é: 
 
require(prob) 
S <- cards(makespace=TRUE) 
S 
 
 rank suit probs 
1 2 Club 0.01923077 
2 3 Club 0.01923077 
3 4 Club 0.01923077 
4 5 Club 0.01923077 
5 6 Club 0.01923077 
6 7 Club 0.01923077 
7 8 Club 0.01923077 
8 9 Club 0.01923077 
9 10 Club 0.01923077 
10 J Club 0.01923077 
11 Q Club 0.01923077 
12 K Club 0.01923077 
13 A Club 0.01923077 
 
b) Alguns eventos deste espaço amostral: 
 
A <- subset(S, suit == "Heart") 
> A 
 rank suit probs 
27 2 Heart 0.01923077 
28 3 Heart 0.01923077 
29 4 Heart 0.01923077 
30 5 Heart 0.01923077 
31 6 Heart 0.01923077 
32 7 Heart 0.01923077 
33 8 Heart 0.01923077 
34 9 Heart 0.01923077 
35 10 Heart 0.01923077 
36 J Heart 0.01923077 
37 Q Heart 0.01923077 
38 K Heart 0.01923077 
39 A Heart 0.01923077 
 
B <- subset(S, rank == "A" ) 
> B 
 rank suit probs 
13 A Club 0.01923077 
26 A Diamond 0.01923077 
39 A Heart 0.01923077 
52 A Spade 0.01923077 
 
C <- subset(S, suit == "Spade") 
 
 
14 2 Diamond 0.01923077 
15 3 Diamond 0.01923077 
16 4 Diamond 0.01923077 
17 5 Diamond 0.01923077 
18 6 Diamond 0.01923077 
19 7 Diamond 0.01923077 
20 8 Diamond 0.01923077 
21 9 Diamond 0.01923077 
22 10 Diamond 0.01923077 
23 J Diamond 0.01923077 
24 Q Diamond 0.01923077 
25 K Diamond 0.01923077 
26 A Diamond 0.01923077 
27 2 Heart 0.01923077 
28 3 Heart 0.01923077 
29 4 Heart 0.01923077 
30 5 Heart 0.01923077 
31 6 Heart 0.01923077 
32 7 Heart 0.01923077 
33 8 Heart 0.01923077 
34 9 Heart 0.01923077 
35 10 Heart 0.01923077 
36 J Heart 0.01923077 
37 Q Heart 0.01923077 
38 K Heart 0.01923077 
39 A Heart 0.01923077 
40 2 Spade 0.01923077 
41 3 Spade 0.01923077 
42 4 Spade 0.01923077 
43 5 Spade 0.01923077 
44 6 Spade 0.01923077 
45 7 Spade 0.01923077 
46 8 Spade 0.01923077 
47 9 Spade 0.01923077 
48 10 Spade 0.01923077 
49 J Spade 0.01923077 
50 Q Spade 0.01923077 
51 K Spade 0.01923077 
52 A Spade 0.01923077 
Apostila de Probabilidade – Prof GILBERT QUEIROZ DOS SANTOS – Unisuam/2016 27 
> C 
 rank suit probs 
40 2 Spade 0.01923077 
41 3 Spade 0.01923077 
42 4 Spade 0.01923077 
43 5 Spade 0.01923077 
44 6 Spade 0.01923077 
45 7 Spade 0.01923077 
46 8 Spade 0.01923077 
47 9 Spade 0.01923077 
48 10 Spade 0.01923077 
49 J Spade 0.01923077 
50 Q Spade 0.01923077 
51 K Spade 0.01923077 
52 A Spade 0.01923077 
 
Em termos de probabilidade, com ajuda do R, temos: 
 
 > Prob(A) 
[1] 0.25 
 
> Prob(B) 
[1] 0.07692308 
 
> Prob(C) 
[1] 0.25 
 
> Prob(union(A,B)) 
[1] 0.3076923 
 
> Prob(union(A,C)) 
[1] 0.5 
 
> Prob(setdiff(S, A)) 
[1] 0.75 
 
> Prob(S) 
[1] 1 
 
 
3.8 Eventos Equiprováveis 
 
Se um experimento ε tem como espaço amostral S = {e1, e2, ..., en}, com um número finito 
de elementos, dizemos que os eventos elementares {ei} são equiprováveis, se todos 
possuem a mesma probabilidade de ocorrer, isto é: 
 
n
eP i
1)( = 
 
 
 
 
Pois, 25,0
4
1
52
13)( ====
s
A
n
nAP 
 
Pois, 0769,0
13
1
52
4)( ====
s
B
n
n
BP 
 
Pois, 25,0
4
1
52
13)( ====
s
c
n
nCP 
 
Pois, 30769,0
52
1
13
1
4
1)()()()( =−+=∩−+=∪ BAPBPAPBAP 
 
Pois, 5,0
4
1
4
1)()()( =+=+=∪ BPAPBAP 
 
Pois, 75,0
4
11)(1)( =−=−= APAP 
 
Pois, 1)( =SP 
 
Apostila de Probabilidade – Prof GILBERT QUEIROZ DOS SANTOS – Unisuam/2016 28 
 
3.9 Probabilidade Condicionada 
 
 Considere o evento condicionado (B|A), ou seja, o evento que consiste na 
realização do evento B sob a condição de ter-se realizado o evento A, isto é, com a 
informação adicional de que o evento A já ocorreu. 
 
 Denotaremos por ( )ABP | , a probabilidade condicionada do evento B, quando A 
tiver ocorrido. 
 
Sempre que calcularmos ( )ABP | , estaremos essencialmente calculando P(B) em 
relação ao espaço amostral reduzido A, em lugar de fazê-lo em relação ao espaço 
amostral S. 
 
)(
)()|(
AP
BAPABP ∩= 
 
Onde: 
 
a) 1)|(0 ≤≤ ABP 
b) 1)|( =ASP 
c) )|()|()|( 2121 ABPABPABBP +=∪ , se ∅=∩ )( 21 BB 
 
Se os eventos B1, B2, ..., Bk representam partições do espaço amostral S e 
 
a) ∅=∩ ji BB , para todo ji ≠ 
b) SBi
k
i
=∪
=1
 
c) 0)( >iBP , para todo i 
 
Como conseqüência da probabilidade condicionada, temos 
 
)|().()( ABPAPBAP =∩ 
Ou equivalente 
)|().()( BAPBPBAP =∩ 
 
O exemplo mais simples para a probabilidade condicionada é dado abaixo: 
 
"Suponha que em uma empresa trabalhem 500 pessoas. Algumas delas são profissionais 
de engenharia (A), enquanto outras são economistas (B); algumas pessoas são do sexo 
feminino (C), enquanto outras são do sexo masculino (D). A tabela abaixo fornece o 
número de pessoas de cada classificação. Um cliente entra na empresa e escolhe uma 
pessoa ao acaso para conversar. A pessoa escolhida é do sexo feminino. Qual será a 
probabilidade de que ela seja engenheira?" 
 
 A B Totais 
C 120 50 170 
D 250 80 330 
Totais 370 130 500 
 
Apostila de Probabilidade – Prof GILBERT QUEIROZ DOS SANTOS – Unisuam/2016 29 
O que se deseja é calcular P(A | C) = 
17
12
170
120
500
170
500
120
)(
)(
===
∩
CP
CAP
 
A maneira intuitiva de obter o valor desta probabilidade é pensar que, das 170 pessoas do 
sexo feminino, que compõem o espaço amostral reduzido, 120 são também engenheiras. 
Logo, a probabilidade em questão é dada por: 
 
17
12
170
120)|( ==CAP 
Usando o exemplo anterior no R, temos: 
 
> Prob(intersect(A, B)) 
[1] 0.01923077 
 
> Prob(B) 
[1] 0.07692308 
 
> Prob(intersect(A, B)) / Prob(B) 
[1] 0.25 
 
> Prob(A, given = B) 
[1] 0.25 
 
 
3.9.1 Teorema da Probabilidade Total 
 
Consideramos em evento B qualquer referente a S, e A1, A2, ..., Ak uma partição de 
S. 
Se ( ) ( )kABABABB ∩∪∪∩∪∩= ...)( 21 , temos 
( ) ( ) ∑ ∩=∩++∩+∩=∩++∩+∩=
=
k
i
ikk BAPBAPBAPBAPABPABPABPBP
1
2121 )()(...)()(...)()(
 
 
Pelo regra da multiplicação sabemos que )|().()( ABPAPBAP =∩ , e ainda que 
)(
)/().(
)(
)()/(
BP
ABPAP
BP
BAPBAP =∩= 
Com relação a B, temos: 
 
)|().(...)/().()|().()( 2211 kk ABPAPABPAPABPAPBP +++= 
 
Logo, 
∑=
=
k
i
ii ABPAPBP
1
)|().()( - Teorema da Probabilidade Total 
 
 
 
 
 
 
Apostila de Probabilidade – Prof GILBERT QUEIROZ DOS SANTOS – Unisuam/2016 30 
A1 
 
 
 
 
 
A2 A3 A4 A5 A6 A7 A8 ... Ak 
 
 
 
3.10 Teorema de Bayes 
 
 Sejam A1, A2, ..., Ak, k eventos mutuamente exclusivos, onde: 
 
A) ∅=∩ ji AA , para todo ji ≠ 
b) SAi
k
i
=∪
=1
 
 
c) 0)( >iAP , para todo i 
d) ∑=
=
k
i
ii ABPAPBP
1
)|()()( 
 
Então, a probabilidade condicional )|( BAP i , de que um destes eventos iA ocorra, 
dado que B ocorre é 
 
∑
=
∩
=
=
K
i
ii
iii
i
ABPAP
ABPAP
BP
BAPBAP
1
)|()(
)|()(
)(
)()|( 
 
Esta fórmula relaciona probabilidade “a priori” )( iAP com a probabilidade “a 
posteriori” )|( BAP i , probabilidade de Ai depois que ocorrerB. 
 
Um exemplo para o Teorema de Bayes seria: 
 
"A caixa I contém 2 fichas vermelhas e 3 fichas azuis, a caixa II contém 3 fichas 
vermelhas e 7 fichas azuis. Joga-se uma moeda. Se a moeda der cara, extrai-se ao uma 
ficha da caixa I; se der coroa, extrai-se ao acaso uma ficha da caixa II. Suponha-se que 
não se conheça o resultado da jogada da moeda (e, conseqüentemente, não se saiba de 
qual caixa a ficha é extraída). Sabe-se somente que foi extraída uma ficha vermelha. 
Determinar a probabilidade de a ficha vermelha ter sido extraída da caixa I." 
 
Neste caso, temos: 
 
C1 = caixa I P(C1) = 
2
1
 
C2 = caixa II P(C2) = 
2
1
 
A = ficha vermelha 
 
B 
B ∩ A1 
B ∩ A2 B ∩ A3 B ∩ A4 B ∩ A5 B ∩ A6 B ∩ A7 B ∩ A8 
... 
B ∩ Ak 
Apostila de Probabilidade – Prof GILBERT QUEIROZ DOS SANTOS – Unisuam/2016 31 
P(A) = P(C1) * P(A|C1) + P(C2) * P(A|C2) = 
20
7
20
34
20
3
5
1
10
3
.
2
1
5
2
.
2
1
=
+
=+=+ 
 
Queremos P(C1|A), então 
7
4
10
3
.
2
1
5
2
.
2
1
5
2
.
2
1
)2|(*)2()1|(*)1(
)1|(*)1(
)(
)1|(*)1(
)(
)1()|1( =
+
=
+
==
∩
=
CAPCPCAPCP
CAPCP
AP
CAPCP
AP
ACPACP
 
3.11 Eventos independentes 
 
 Dois eventos, associado a um experimento, são ditos independentes quando a 
ocorrência de um deles não depende à ocorrência do outro, isto é, a informação adicional 
de que um dos eventos já ocorreu em nada altera a possibilidade de ocorrência do outro. 
 
 Assim , ( ) BAB =| 
 A probabilidade de (B|A) é denotada por )()|( BPABP = 
 E, )()()|()()( BPAPABPAPBAP ==∩ 
 
 
 
Então, dados dois eventos mutuamente exclusivos A e B, sendo P(A) e P(B) diferentes de 
zero, se A ocorrer, B não poderá ocorrer e vice-versa. Então, P(B|A) = 0. Mas P(B) é, 
sabidamente, maior que zero, de modo que P(B|A) é diferente de P(B); assim, por 
definição, os eventos são dependentes. 
 
Se A e B são eventos independentes, então, são também independentes os eventos A e 
B , os eventos A e B e os eventos A e B . 
 
Se uma seqüência de eventos A1, A2, ..., Ak independentes então ∏=





∩
=
=
k
i
ii
k
i
APAP
11
)( 
3.12 Regra da adição 
 
É utilizada quando desejamos determinar a probabilidade de ocorrer um evento ou outro 
(pelo menos um), isto é, quando desejamos determinar a probabilidade do evento união 
(A ∪ B), ou seja P(A ∪ B). 
Apostila de Probabilidade – Prof GILBERT QUEIROZ DOS SANTOS – Unisuam/2016 32 
 
Se os eventos A e B são eventos quaisquer: P(A ∪ B) = P(A) + P(B) – P(A∩B). 
Se os eventos A e B são mutuamente excludentes: P(A ∪ B) = P(A) + P(B) 
 
 
3.13 Regra da Multiplicação 
 
É utilizada quando desejamos determinar a probabilidade de ocorrer dois ou mais eventos 
simultaneamente, isto é, quando desejamos determinar a probabilidade do evento 
intersecção (A ∩ B), ou seja P(A ∩ B). 
 
Se os eventos A e B são condicionados, então: 
 
)|().()( ABPAPBAP =∩ 
Ou equivalente a 
)|().()( BAPBPBAP =∩ 
 
Se os eventos A e B são independentes, então: 
 
)().()( BPAPBAP =∩ 
Esta regra pode ser estendida a mais de dois eventos. 
 
3.14 Variável aleatória 
 
 Seja ε um experimento e S seu espaço amostral associado. Uma função X, em um 
espaço de probabilidade (S, F, P), que associa a cada ponto “s” do espaço amostral S, 
um número (geralmente um número real) X(s) é chamada variável aleatória (ou variável 
estocástica), ou, mais precisamente, função aleatória (ou função estocástica). 
 
 Denota-se em geral por uma letra maiúscula X, Y, ... . Em geral, uma variável 
aleatória tem algum significado físico, geométrico, ou outro qualquer. 
 
 O espaço amostral S é denominado o domínio da variável aleatória ou da função, e 
o conjunto de todos os valores de X(s) é denominado contradomínio da variável aleatória. 
 
 
 
 
Resumindo: variável aleatória é aquela cujos valores são obtidos por um experimento 
aleatório aos quais podemos associar probabilidades. Ou ainda, uma variável aleatória é 
uma função definida em um espaço amostral, que assume valores reais. 
 
Por exemplo: ao jogar uma moeda duas vezes, podemos ter os seguintes resultados: 
 
S 
s 
R 
X(s) X 
Apostila de Probabilidade – Prof GILBERT QUEIROZ DOS SANTOS – Unisuam/2016 33 
Eventos de S Probabilidade 
CaCa P(Ca)P(Ca)= ½ * ½ = ¼ 
CaCr P(Ca)P(Cr)= ½ * ½ = ¼ 
CrCa P(Cr)P(Ca)= ½ * ½ = ¼ 
CrCr P(Ca)P(Ca)= ½ * ½ = ¼ 
 
Onde: 
Ca – representa a face “cara” da moeda 
Cr – representa a face “coroa” da moeda 
 
Façamos a seguinte correspondência: a cada evento de S associaremos um número real. 
Para isso vamos definir X = números de caras 
Logo, X pode assumir os seguintes valores: 
 
Eventos de S X 
CaCa 2 
CaCr 1 
CrCa 1 
CrCr 0 
 
 
Então, em termos de probabilidade temos: 
 
Eventos de S Valores de X P(X) 
CrCr 0 ¼ 
CaCr ou CrCa 1 ½ 
CaCa 2 ¼ 
 
 
3.14.1 Variável aleatória discreta 
 
É aquela que pode assumir um número limitado de valores, pois apresenta espaço 
amostral discreto, ou seja quando se possui um espaço amostral finito ou um espaço 
amostral infinito numerável. 
Exemplo: Um número de empregados na produção de uma empresa pode ser apenas um 
número inteiro; não pode ser fracionado. 
 
3.14.2 Variável aleatória contínua 
 
Teoricamente, é aquela que pode assumir qualquer valor em um intervalo real, pois 
apresenta um espaço amostral contínuo, ou seja quando se possui um espaço amostral 
não contável ou não-numerável. 
Exemplo: medidas de comprimento, peso e tempo. 
 
 
3.15 Representações da Distribuição da Variável Aleatória X 
 
A coleção de pares , i = 1, 2,....é denominada distribuição de probabilidade 
de X, que caracteriza o comportamento de uma variável aleatória, isto é, a maneira como 
as probabilidades se distribuem pelos valores que a variável toma. 
 
A distribuição de X é determinada por qualquer das seguintes funções: 
 
)}(;{ ii xpx
Apostila de Probabilidade – Prof GILBERT QUEIROZ DOS SANTOS – Unisuam/2016 34 
a) Função de probabilidade p(x), no caso discreto; 
b) Função densidade de probabilidade f(x),se X é absolutamente contínua; 
c) Função de distribuição F(x); 
 
 
3.15.1 Funções de probabilidade (f.p.) e Função densidade de probabilidade (f.d.p) 
 
Uma vez que uma v.a. (variável aleatória) assume valor do seu contradomínio com certa 
probabilidade tem-se que as probabilidades são associadas a valores da v. a. discreta 
(VAD) por uma função de probabilidade (f.p.) e as probabilidades são associadas a 
intervalos de valores de uma v. a. contínua (VAC) por uma função densidade de 
probabilidade (f.d.p). 
 
Se X é uma variável aleatória discreta, então Rx, o contradomínio de X, será formado no 
máximo por um número infinito numerável de valores x1, x2,...A cada possível resultado xi 
associaremos um número 
 
 
denominado probabilidade de xi. Os números devem satisfazer às seguintes condições: 
 
a) , para todo i; 
 
b) 
 
A função p(x), definida acima, é denominada função de probabilidade (ou função de 
probabilidade no ponto) da variável X discreta. 
Por exemplo, seja a seguinte distribuição de probabilidade: 
 
X 2 3 4 5 6 7 
P(X) 0,1 0,1 0,3 0,2 0,2 0,1 
 
O gráfico desta distribuição é dado por: 
 
 
Se X é uma variável aleatória contínua, a função de densidade de probabilidade f, 
indicada por fdp, é uma função que satisfaz as seguintes condições: 
 
)()( ii xXPxp ==
1)(0 ≤≤ ixp
∑
∞
=
=
1
1)(
i
ixp
Apostila de Probabilidade – Prof GILBERT QUEIROZ DOS SANTOS – Unisuam/2016 35 
a) , para todo 
 
b)Além disso, definimos para qualquer c < d (em Rx), 
 
 
 
Por exemplo, seja a seguinte função de densidade de probabilidade: 
 








+−=
0
1
3
3
2
)( x
x
xf 
 
O gráfico desta função densidade de probabilidade é dado por: 
 
 
Computacionalmente, obtemos este gráfico da seguinte forma no R: 
 
#Inicialmente, digitamos a função 
 
f <- function(x){ 
 fx <- numeric(length(x)) 
 fx[x < 0] <- 0 
 fx[x >= 0 & x < 1] <- 2*x[x >= 0 & x < 1]/3 
1)( ≥xf xRx ∈
∫ =
xR
dxxf 1)(
∫=<<
d
c
dxxfdXcP )()(
, se 0 ≤ x < 1 
, se 1 ≤ x < 3 
, se x < 0 ou x > 3 
Apostila de Probabilidade – Prof GILBERT QUEIROZ DOS SANTOS – Unisuam/2016 36 
 fx[x >= 1 & x <= 3] <- (-x[x >= 1 & x <= 3]/3) + 1 
 fx[x > 3] <- 0 
 return(fx) 
 } 
 
Em seguida, plotamos o gráfico usando: 
curve(f2, -1, 4, main="Função Densidade de Probabilidade", ylab="f(x)") 
abline(v=0, lty=2) 
abline(v=1, lty=2) 
abline(v=3, lty=3) 
 
3.15.2 Função de distribuição de probabilidade 
 
A função de distribuição da variável aleatória X representada por F(x) ou simplesmente Fx 
é definida por 
)()( xXPxF ≤= 
 
Na literatura, a função de distribuição de X é freqüentemente chamada de função de 
distribuição acumulada de X. 
 
Obedece às seguintes propriedades: 
 
a) 0 ≤ F(x) ≤ 1 para -∞ ≤ x ≤ +∞ 
b) F é não-decrescente, isto é F(x) ≤ F(y) sempre que x ≤ y, ∀x, y ∈ ℜ 
c) 0)(lim =
−∞→
xF
x
 e 1)(lim =
∞→
xF
x
 
d) F é contínua à direita, pois )()(lim 0
0
xFxF
xx
=
+→
 
 
Se X é uma variável aleatória discreta, define-se F como a função de distribuição 
acumulada dada por 
 
 
 
onde o somatório é estendido a todos os índices j que satisfaçam xj ≤ x. 
 
Dada a função de distribuição acumulada, podemos obter a probabilidade no ponto xi 
fazendo: 
)()()( 1−−== iii xFxFxXP 
 
Por exemplo, utilizando a seguinte distribuição de probabilidade, temos: 
 
X 2 3 4 5 6 7 
P(X) 0,1 0,1 0,3 0,2 0,2 0,1 
F(X) 0,1 0,2 0,5 0,7 0,9 1,0 
 
 
 
 
 
 
 
∑
≤
=≤=
xx
j
j
j
xpxXPxF )()()(
Apostila de Probabilidade – Prof GILBERT QUEIROZ DOS SANTOS – Unisuam/2016 37 
A função de distribuição acumulada, fica: 









=
1
9,0
7,0
5,0
2,0
1,0
0
)(xF 
 
O gráfico da função de distribuição acumulada, fica: 
 
Se X é uma variável aleatória contínua, define-se F como a função de distribuição 
acumulada dada por 
 
 
 
Dada a função de distribuição acumulada, podemos calcular a probabilidade entre dois 
pontos a e b fazendo: 
 
)()()( aFbFbXaP −=≤< 
 
 
 
Por exemplo, utilizando a função de densidade de probabilidade anterior, dada por: 








+−=
0
1
3
3
2
)( x
x
xf 
 
Temos a seguinte função de distribuição acumulada: 
 
∫
∞−
=
x
dxxfxF )()(
se, x < 2 
se, 2≤ x < 3 
se, 3≤ x < 4 
se, 4≤ x < 5 
se, 5≤ x < 6 
se, 6≤ x < 7 
se, x ≥ 7 
, se 0 ≤ x < 1 
, se 1 ≤ x < 3 
, se x < 0 ou x > 3 
, se x < 0 
, se 0 ≤ x < 1 
 
, se 1 ≤ x < 3 
 
, se x ≥ 3 
Apostila de Probabilidade – Prof GILBERT QUEIROZ DOS SANTOS – Unisuam/2016 38 








−+−=
1
6
36
3
0
)( 2
2
xx
x
xF 
 
O gráfico da função de distribuição acumulada fica: 
 
Computacionalmente, temos: 
 
F <- function(x){ 
 Fx<- numeric(length(x)) 
 Fx[x < 0]<- 0 
 Fx[x >= 0 & x < 1] <- x[x >= 0 & x < 1]^2/3 
 Fx[x >= 1 & x < 3] <- (-x[x >= 1 & x < 3]^2 + 6*x[x >= 1 & x < 3] - 3)/6 
 Fx[x >= 3] <- 1 
 return(Fx) 
 } 
 
O gráfico é obtido por: 
 
curve(F, -1, 4, main="Função de Distribuição Acumulada", ylab="F(x)") 
Apostila de Probabilidade – Prof GILBERT QUEIROZ DOS SANTOS – Unisuam/2016 39 
abline(v=0, lty=2) 
abline(v=1, lty=2) 
abline(v=3, lty=2) 
 
Existe uma relação entre a função distribuição e a função densidade de probabilidade 
dada por: 
x
xF
xf
∂
∂
=
)()( 
 
 
3.16 Expectância ou valor esperado 
 
O número mais importante e útil para a localização do “centro” da distribuição de X é a 
expectância ou valor esperado, geralmente indicado por E(X). 
Se X é uma variável aleatória, então E(X) é definida por: 
 
a) no caso discreto: 
 
b) no caso contínuo: 
 
Propriedades da expectância 
 
a) Se X = C, onde C é uma constante, então E(X)=C; 
b) E(CX)=CE(X), onde C é uma constante e X uma v.a.; 
c) Sejam X e Y duas v.a. quaisquer, então E(X ± Y)=E(X) ± E(Y); 
d) Sejam n v.a. X1, X2,...,Xn, então E(X1+...+Xn)=E(X1)+...+E(Xn), ou seja 






∑=∑
==
n
i
i
n
i
i XEXE
11
)( 
e) Sejam X e Y duas v.a. quaisquer E[XY] = E[X] . E[Y] + Cov [E, Y] 
Se X e Y são independentes E[XY] = E[X].E[Y] 
f) Se Y = aX + b, E(Y) = aE(X) + b 
g) )()...()()( 21
1
n
n
i
i XEXEXEXE =∏
=
 
 
Duas outras quantidades de uso comum, que também dão uma medida do centro de uma 
distribuição de probabilidade, são a mediana e a moda. 
A mediana é qualquer ponto que divida a distribuição em duas partes iguais. Então, xj é a 
mediana da distribuição se, e somente se: 
 
 
 
 
Em comparação com a média E(x), prefere-se às vezes a mediana como medida de 
tendência central no caso de distribuições assimétricas, especialmente quando há um 
pequeno número de valores extremos da distribuição. A mediana é, nesses casos, 
superior à média porque não é sensível a um pequeno número de valores extremamente 
altos ou extremamente baixos. 
 
A moda é um ponto xi tal que 
 
 e no caso discreto; 
∑= )()( ii xpxXE
∫
+∞
∞−
= dxxxfXE )()(
2
1)()()( ==≤= ∑
j
jxpxXPxF
)()( 1+> ii xPxP )()( 1−> ii xPxP
Apostila de Probabilidade – Prof GILBERT QUEIROZ DOS SANTOS – Unisuam/2016 40 
 
 e no caso contínuo. 
 
Sendo ε uma quantidade positiva arbitrária pequena. 
 
A moda é, pois, um valor de x que corresponde a um pico em sua função de distribuição 
ou de densidade. O termo unimodal se refere a uma distribuição de probabilidade que 
apresenta uma única moda. 
 
Para efeito de comparação dessas três medidas de tendência central, a figura abaixo 
ilustra suas posições relativas em três situações diferentes. É claro que a média, a 
mediana e a moda coincidem no caso de uma distribuição unimodal simétrica. 
 
 
 
3.17 Variância 
 
A variância de uma variável aleatória é um número não negativo definido como: 
 
 
Ou seja, a variância é o valor esperado dos desvios em relação à média, elevados ao 
quadrado. 
Esta expressão pode ser reescrita da seguinte forma: 
 
 
Onde: 
 
 no caso discreto; e 
 
)()( ε+> ii xfxf )()( ε−> ii xfxf
[ ]2)()( XEXEXV −=
22 ))(()()( XEXEXV −=
∑= )()( 22 ii xpxXE
∫
+∞
∞−
= dxxfxXE )()( 22
Apostila de Probabilidade – Prof GILBERT QUEIROZ DOS SANTOS – Unisuam/2016 41 
 no caso contínuo. 
 
E(X) é dado: 
 
a) No caso discreto: 
 
b) No caso contínuo: 
 
 
Propriedades da Variância 
 
a) Se C for uma constante: 
V(C)=0 
V(X+C)=V(X) 
V(CX)=C²V(X) 
b) Se X e Y forem v.a. independentes: V(X+Y)=V(X)+V(Y) 
c) Se X é uma v.a com variância finita, então, para qualquer número real α: 
 
 
d) se X e Y forem v.a. quaisquer V(X + Y) = V(X) + V(Y) + 2Cov(X,Y) 
 V(aX ± bY) = a2V(X) + b2V(X) ± 2abCov(X, Y) 
f) se Y = aX + b, Var(Y)=a2Var(X) 
 
 
3.18 Desvio-padrão 
 
A raiz quadrada da variância é chamada de desvio padrão de X. Uma vantagem da 
utilização do desvio padrão em lugar da variânciacomo medida de dispersão é que o 
segundo tem a mesma unidade que a média. 
 
 
 
3.19 Coeficiente de variação (CV) 
 
Um número adimensional, que caracteriza a dispersão em relação à média e também 
facilita comparações entre variáveis aleatórias de unidades diferentes, é o coeficiente de 
variação CV(x) definido por 
 
 
 
3.20 Desigualdade de Chebyshev 
 
Como interpretar a variância (ou o desvio-padrão) de uma variável aleatória? 
Intuitivamente, quanto menor a variância, mais perto de E(X) estão os valores prováveis 
de X. A formalização desta intuição pode ser feito pelo teorema a seguir: 
 
Teorema (Desigualdade de Chebyshev): Seja X uma variável aleatória com valor 
esperado E(X) = µ e desvio-padrão DP(X) = σ. Seja P = {x ∈ ℜ | | x - µ | < kσ}, isto é P é 
um intervalo aberto (x - kσ, x + kσ), ou seja, um conjunto de valores de X que estão 
"perto da média", pelo menos k desvios-padrão. Então, para qualquer k > 0, tem-se: 
2
1)Pr(
k
PX ≤∉ 
∑= )()( ii xpxXE
∫
+∞
∞−
= dxxxfXE )()(
[ ] [ ]22 )()()( αα −−−= XEXEXV
)()( xVxDP =
)(
)()(
xE
xDP
xCV =
Apostila de Probabilidade – Prof GILBERT QUEIROZ DOS SANTOS – Unisuam/2016 42 
Ou seja, 2
1)|Pr(|
k
kX ≤≥− σµ 
Que ainda pode ser escrito, 2
11)|Pr(|
k
kX −≥<− σµ 
A Desigualdade de Chebyshev significa o seguinte: em qualquer distribuição de 
probabilidade: 
 
- Há no máximo %25
4
1
= de chances de X estar a 2 ou mais desvios-padrão da média; 
assim, há pelo menos 75% de chances de X estar a menos de 2 desvios-padrão da 
média; 
- Há no máximo 
9
1
 de chances de X estar a 3 ou mais desvios-padrão da média; 
- Há no máximo 
16
1
 de chances de X estar a 4 ou mais desvios-padrão da média; e 
- Em geral, há no máximo 2
1
k
 de chances de X estar a k ou mais desvios-padrão da 
média (k não precisa ser inteiro) ou no mínimo 211 k− de chances de X estar a menos de k 
desvios-padrão da média. 
 
 
 
3.21 Quantis 
 
Se X é uma v.a. discreta com função de distribuição F(X), então o número real Q(p) é o 
quantil de ordem p, p ∈ [0, 1], da distribuição de probabilidade de X, se 
 



−≥≥
≥≤
ppQXP
ppQXP
1)]([
)]([
 
 
Se X é uma v.a. contínua com função de distribuição F(x), então o numero real Q(p) é o 
quantil de ordem p, p ∈ [0, 1], da distribuição de probabilidade de X, se 
 
ppQF =))(( 
Denominações especiais: 
 
- Quartil: Q(0,25), Q(0,50) e Q(0,75) 
- Decil: Q(0,10) a Q(0,90) 
- Centil: Q(0,01) a Q(0,99) 
 
 
3.22 Momentos 
 
São formas generalizadas capazes de caracterizar os principais aspectos da distribuição 
de probabilidade de uma v.a. 
 
Uma função, cuja a expectância possui grande interesse, é a função potência, dada por 
φ(x) = xk, para k = 1, 2, 3,....A expectância dessa função é denominada k-ésimo momento 
da variável aleatória X, e é indicada por 
Apostila de Probabilidade – Prof GILBERT QUEIROZ DOS SANTOS – Unisuam/2016 43 
 
 Caso discreto 
 
 Caso contínuo 
Obs: 
 
 
 
 
 
A fim de eliminar o efeito da posição da origem na escala da medida, é mais útil trabalhar 
com potências de X – μ, o desvio da média, do que potências de X. O k-ésimo momento 
em torno da média da variável X é dado por 
 
 
Obs: 
 
 
 
 e 
 
3.23 Assimetria 
 
A partir do conhecimento dos momentos, podemos determinar o grau de assimetria de 
uma distribuição dado por 
 
 
 
 
 
3.24 Curtose 
 
A curtose está relacionada com o grau de afastamento dos valores de X em relação à sua 
média. Quanto maior for o valor da variância, maior será a dispersão e mais achatada 
será a distribuição. 
 
O grau da curtose pode ser obtido por 






==
∫
∑
∞+
∞−
dxxfx
xpx
xE
k
i
i
k
i
k
k )(
)(
)('µ
µµ === )()( 1'1 xExE
)( 2'2 xE=µ
( )[ ]kk xE µµ −=
( )[ ] ( ) 011 =−=−=−= µµµµµ xExE
( )[ ] )(22 xVxE =−= µµ 2'2)( µµ −=XV
( )32
3
3
µ
µ
=a
Apostila de Probabilidade – Prof GILBERT QUEIROZ DOS SANTOS – Unisuam/2016 44 
 
 
 
 
 
 
 
4. Principais distribuições discretas 
 
4.1 Uniforme 
 
Uma v.a X diz-se ter distribuição uniforme discreta se para todos os valores de x1, x2, ..., 
xk tem-se: 
 
k
xXP i
1)( == , com i = 1, ..., k 
 
O valor esperado e a variância da distribuição Uniforme são: 
 
k
x
XE
k
i
i∑
=
=
1)( 
( )
k
XEx
XV
k
i
i∑
=
−
=
1
2)(
)( 
 
Supondo que a distribuição uniforme discreta seja: 
 
X 1 2 3 4 5 6 
P(X) 1/6 1/6 1/6 1/6 1/6 1/6 
( ) 342
4
4 −=
µ
µ
a
Apostila de Probabilidade – Prof GILBERT QUEIROZ DOS SANTOS – Unisuam/2016 45 
F(X) 1/6 2/6 3/6 4/6 5/6 1,0 
 
Os gráficos ficam: 
 
 
4.2 Distribuição de Bernoulli 
 
Seja um experimento onde só pode ocorrer “sucesso” ou “fracasso”, e associamos uma 
variável aleatória X aos possíveis resultados, de forma que 
X = 1, se o resultado for um sucesso 
X = 0, se o resultado um fracasso. 
A função de distribuição de Bernoulli será: 
 
 
 
 
 
 
Que pode ser expressa por: 
 
xx ppxXP −−== 1)1()( , com x = 0, 1 
 
O valor esperado e variância da distribuição de Bernoulli são: 
 
 
4.3 Distribuição Binomial 
 
Seja um experimento dentro das seguintes condições: 
a) são realizadas n provas independentes; 
b) cada prova é uma prova de Bernoulli, ou seja, só pode levar ao sucesso ou fracasso; 
c) a probabilidade p de sucesso em cada prova é constante. 
Associando uma variável aleatória X igual ao número de sucessos nessas n provas, X 
poderá assumir os valores 0, 1, 2,...,n. 





=
=−=
=
1.ou 0 de diferentefor x se ,0
1; xse ,
0; xse ,1
)( p
pq
XP
pXE =)(
pqXV =)(
Apostila de Probabilidade – Prof GILBERT QUEIROZ DOS SANTOS – Unisuam/2016 46 
Vamos determinar a distribuição de probabilidades dessa variável X, dada através da 
probabilidade de um número genérico k de sucessos. 
 
Suponhamos que ocorram apenas sucessos nas k primeiras provas e apenas fracassos 
nas n-k provas restantes. Indicando sucesso em cada prova por 1 e fracasso por 0, 
temos: 
1, 1, 1, 1,...,1, 0, 0, 0,...,0 
k n – k 
Como as provas são independentes, a probabilidade de ocorrência desse evento é 
 
 
Porém, o evento “k sucessos em n provas” pode acontecer em outras ordens distintas, 
todas com as mesmas probabilidades. 
Como o número de ordens é o número de combinações de n elementos k a k, a 
probabilidade de ocorrerem k sucessos em n provas será: 
 
 
 
A expressão obtida para P(X=k) é o (k+1)º termo do desenvolvimento de segundo 
o Binômio de Newton, daí o nome “distribuição binomial” dado a essa distribuição. 
 
O Valor esperado e a variância da distribuição Binomial são: 
 
 
 
 
Os gráficos da distribuição binomial são: 
 
 
 
4.4 Distribuição de Poisson 
 
Na Distribuição Binomial, a variável definida era o número de sucessos em certo intervalo 
discreto (repetição do experimento). Entretanto, em muitas situações, poderemos estar 
interessados no número de sucesso em um certo intervalo contínuo, intervalo este que 
pode ser: comprimento, tempo, superfície etc. 
Como exemplo, podemos citar: 
a) número de defeitos por metro em determinado tecido; 
knk qp −
knk qp
k
n
kXP −





== )(
npq )( +
npXE =)(
npqXV =)(
Apostila de Probabilidade – Prof GILBERT QUEIROZ DOS SANTOS – Unisuam/2016 47b) número de defeitos na impressão de certo livro; 
c) número de partículas emitidas por fonte radioativa em certo intervalo de tempo; 
d) número de pessoas que chegam ao caixa de um supermercado no intervalo de tempo 
de 3 minutos; 
e) número de carros que passam por um pedágio no intervalo de tempo de 30 minutos. 
 
Diz-se que uma v.a X tem distribuição de Poisson, com parâmetro λ>0, e representa-se 
X ~Poi(λ), se sua função de probabilidade for expressa por: 
!
)(
k
ekXP
k λλ −
== 
 
 
O Valor esperado e a variância: 
 
 
 
 
Propriedade: se X1, X2, ..., Xn são variáveis aleatórias independentes com Xi ~Poi(λi), com 
i=1, 2, ..., n, então: 
)...(~ 21
1
n
n
i
i PoiXY λλλ +++∑=
=
 
 
Aproximação da Binomial à Poisson 
 
Quando n →∞ e p →0, mantendo-se constante o produto Np, tem-se: 
)(~),(~ npPoiXpnBX ⇒ 
Em geral, a distribuição de Poisson fornece uma boa aproximação da distribuição 
binomial quando n > 20 e p ≤ 0,05. 
 
Demonstração: 
 
A partir da função de densidade de probabilidade Binômia, podemos mostrar como obter 
a distribuição de Poisson. 
Primeiramente, vamos reescrever a distribuição Binomial da seguinte forma: 
 
 
 
Quando n aumenta e p diminui , temos que λ = np, então 
 
 
 
 
Sabendo que q = 1 – p 
 
 
 
 
 
Desenvolvendo nK 
 
 
λ=)(XE
λ=)(XV
knkknk qp
k
knnnnqp
k
n
kXP −− +−−−=





==
!
)1)...(2)(1()(
knk
knk
nnk
knnnnqp
k
knnnn −
−






−




+−−−
=
+−−− λλ 1
!
)1)...(2)(1(
!
)1)...(2)(1(
kn
k
kknk
nnnk
knnnn
nnk
knnnn −−






−





−
+−−−
=





−




+−−− λλλλλ 11
!
)1)...(2)(1(1
!
)1)...(2)(1(
knk
nnknnnn
knnnn −






−





−
+−−− λλλ 11
!.....
)1)...(2)(1(
Apostila de Probabilidade – Prof GILBERT QUEIROZ DOS SANTOS – Unisuam/2016 48 
 
 
Fazendo a divisão por n 
 
 
 
 
Quando n cresce, ou seja, n →∞, 
 
 
 
 
 
 
 
 
Então, temos 
 
 
 
 
 
Logo, 
 
 
 
Os gráficos da distribuição de Poisson são: 
 
 
4.5 Distribuição Hipergeométrica 
 
Suponha-se um conjunto de N elementos, R dos quais apresentam certa característica e 
R ≤ N. Serão extraídos n elementos de N, sendo n ≤ N sem reposição. Nestes n 
elementos existem k elementos de R. Se isto ocorrer, temos o caso de uma distribuição 
hipergeométrica, a qual é definida por: 
kkknk
nknn
k
nnnnkn
kn
n
n
n
n
−−






−











−




 −
−





−





−=





−





−
+−− λλλλλλ 1
!
111...211111
!
)1(
...
)1(
1111...2111 →











−




 −
−





−





−
nn
k
nn
λ
λλ −− →





− e
n
k
1
λλλλλ −−
=





−











−




 −
−





−





− e
knknn
k
nn
kkk
!
1
!
111...2111
( ) λλ −== e
k
kXP
k
!
Apostila de Probabilidade – Prof GILBERT QUEIROZ DOS SANTOS – Unisuam/2016 49 
 
 
 
 
 
Ou seja, 
 
 
 
 
 
 
 
 
 
 
 
 
O valor esperado e a variância da distribuição hipergeométrica são: 
 
 
 
 
 
Sendo: e 
 
 
Os gráficos da distribuição hipergeométrica são: 
 
 
 
 
 
 
 












−
−






==
n
N
kn
RN
k
R
kXP )(
S 
N 
n 
 
 
R 
k 
npXE =)(






−
−
=
1
)(
N
nN
npqXV
N
Rp = p
N
R
N
RNq −=−=−= 11
N - R 
n - k 
Apostila de Probabilidade – Prof GILBERT QUEIROZ DOS SANTOS – Unisuam/2016 50 
Exercícios 
 
1. Um atirador acerta na mosca do alvo 20% dos tiros. Se ele dá 10 tiros, qual a 
probabilidade dele acertar na mosca no máximo 1 vez? 
 
Este é um exemplo referente à Distribuição Binomial, então: 
 
knk pp
k
n
kXP −−





== )1()( 
 
O valor de p é 0,20, dado no problema. Mas a probabilidade pedida é de no máximo 1, 
logo P(X ≤ 1). Então: P(X ≤ 1) = P(X = 0) + P(X = 1). Calculando, temos: 
 
1074,080,0)20,01(20,0
0
10)0( 100100 ==−





==
−XP 
 
2684,0)80,0(20,0)20,01(20,0
1
10)1( 91101 ==−





==
−XP 
 
Então, P(X ≤ 1) = P(X = 0) + P(X = 1) = 0,1074 + 0,2684 = 0,3758 
 
Usando o R, temos: 
dbinom(0, 10, 0.20) 
dbinom(1, 10, 0.20) 
 
Que resulta: 
[1] 0.1073742 
[1] 0.2684355 
 
No R, poderia ser dado o seguinte comando: 
pbinom(1, 10, 0.20) 
 
Que resulta: 
[1] 0.3758096 
 
2. Em um certo tipo de fabricação de fita magnética, ocorrem cortes a uma taxa de 1 corte 
por 2000 pés. Qual a probabilidade de que um rolo com comprimento de 4000 pés 
apresente: 
a) no máximo 2 cortes? 
b) Pelo menos 2 cortes? 
 
 Este é um exemplo referente à Distribuição de Poisson, então: 
 
!
)(
k
ekXP
k λλ −
== 
 
O valor de λ é de 1/2000, dado no problema. Mas a probabilidade pedida refere-se a um 
rodo de 4000 pés, logo devemos determina um novo λ, ou seja λ', da seguinte forma: 
 
λ' = λ * medida do rolo = 1/2000 * 4000 = 2, este valor será usado na expressão acima. 
Apostila de Probabilidade – Prof GILBERT QUEIROZ DOS SANTOS – Unisuam/2016 51 
 
A letra a) pede no máximo 2 cortes, logo P(X ≤ 2). Então: P(X ≤ 2) = P(X = 0) + P(X = 1) + 
P(X = 2). Calculando, temos: 
 
2
20
!0
2)0( −
−
=== e
eXP 
 
2
21
2
!1
2)1( −
−
=== e
eXP 
 
2
22
2
!2
2)2( −
−
=== e
eXP 
Então, P(X ≤ 2) = P(X = 0) + P(X = 1) + P(X = 2) = e-2 + 2e-2 + 2e-2 = 5e-2 = 0,6767 
 
No R, seria: 
dpois(0, 2) 
dpois(1, 2) 
dpois(2, 2) 
 
Que resulta: 
[1] 0.1353353 
[1] 0.2706706 
[1] 0.2706706 
 
Somando tudo: dpois(0, 2) + dpois(1, 2) + dpois(2, 2) 
[1] 0.6766764 
 
Ou usando: ppois(2, 2), que resulta: [1] 0.6766764 
 
A letra b) pede pelo menos 2 cortes, logo P(X ≥ 2). Mas: P(X ≥ 2) = 1 - P( X < 2). Mas, 
P(X < 2) = P(X = 0) + P(X = 1) . Calculando, temos: 
 
2
20
!0
2)0( −
−
=== e
eXP 
 
2
21
2
!1
2)1( −
−
=== e
eXP 
 
Então, P(X < 2) = P(X = 0) + P(X = 1) = e-2 + 2e-2 = 3e-2 = 0,4060 
E, P(X ≥ 2) = 1 - P( X < 2) = 1 - 0,4060 = 0,5940 
 
No R, podemos usar direto o seguinte comando: 
 
1 - ppois(1, 2), que resulta [1] 0.5939942 
 
3. Entre os 16 programadores de uma empresa, 12 são do sexo masculino. A empresa 
decide sortear 5 programadores para fazer um curso avançado de programação. Qual a 
probabilidade dos 5 sorteados serem do sexo masculino? 
 
Este é um exemplo referente à Distribuição Hipergeométrica, então: 
Apostila de Probabilidade – Prof GILBERT QUEIROZ DOS SANTOS – Unisuam/2016 52 
 












−
−






==
n
N
kn
RN
k
R
kXP )( 
 
N é igual a 16. R se refere ao sexo masculino, logo R = 12. k é igual a 5, neste caso, n é 
igual a 5. Logo 
 
1813,0
4368
792
5
16
0
4
5
12
5
16
55
1216
5
12
)5( ==


















=












−
−






==XP 
 
No R, temos o seguinte comando: 
 
dhyper(5, 12, 4, 5), que resulta: [1] 0.1813187

Continue navegando