Buscar

Probabilidade e Variáveis Aleatórias - Marcos Nascimento Magalhães

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 210 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 210 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 210 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

( l . Probabilidade e Variáveis Aleatórias 
Marcps Nasçimento Magalhaes 
2!! edição 
111104 1 
UNIVERSIDADE DE SÃO PAULO 
Rei tora Suely Vilela 
EDITORA DA UNIVERSIDADE DE SÃO PAULO 
Diretor-presidente Plinio Martins Filho 
COMISSÃO EDITORIAL 
Presidellte José Mindlin 
Vice-pre.<idente Laura de Mello e Souza 
Brasflio João Sallum Júnior 
Carlos Alberto Barbosa Dantas 
Carlos Augusto Monteiro 
Franco Maria Lajolo 
Guilherme Leite da Silva Dias 
Plinio Martins Filho 
Diretora Editorial Silvana Biral 
Diretora Comercial )vete Silva 
Editores-as.'iistentes Marilena Vizentin 
Carla Fernanda Fontana 
Marcos Bernardini 
Probabilidade e Variáveis Aleatórias 
Marcos Nascimento Magalhães 
I 
I 
Copyright © 2004 by Marcos Nascimento Magalhães 
I' edição 2004 (IME-USP) 
2' edição 2006 (Edusp) 
Ficha catalográfica elaborada pelo Departamento 
Técnico do Sistema Integrado de Bibliotecas da USP 
Magalhães, Marcos Nascimento. 
Probabilidade e Variáveis Aleatórias I Marcos Nascimento 
Magalhães . - 2. ed. - São Paulo: Editora da Universidade de 
São Paulo, 2006. 
428 p.; 16 lt 23 em. 
Inclui bibliografia. 
Inclui índice remissivo. 
Apêndice: A. Tabela normal, Resumo de distribuições, Sumário 
de eltpressões matemáticas - B. Respostas de ellercícios. 
ISBN 85-314-0945-4 
I. Matemática. 2. Probabilidade. L Título. 
Direitos reservados à 
Edusp- Editora da Universidade de São Paulo 
Av. Prof. Luciano Gualberto, Travessa J, 374 
CDD-519.2 
6" andar- Ed. da Antiga Reitoria- Cidade Universitária 
05508-900- São Paulo - SP- Brasil 
Divisão Comercial: Te I. (Ou I I) 3091-4008 I 3091-4 I 50 
SAC (Oxx 11 ) 3091-291 I -Fax (Oxx I I) 3091-415 I 
www.usp.br/edusp- e-mail: edusp@edu.usp.br 
Printed in Brazil 2006 
Foi feito o depósito legal 
Conteúdo 
Prefácio .................................................................................................................. ;
;; 
1. Conceitos Básicos em Probabilidade ................................................................
 1 
1.1 Introdução............................................................................................. 1 
1.2 Conjuntos e Combinatória .................................................................... I 
1.3 Probabilidade ...................................................................................... 1 O 
1.4 Exercícios ............................................................................................ 46 
2. Variáveis Aleatórias ......................................................................................... 6
3 
2.1 Introdução ........................................................................................... 63 
2.2 Variáveis Aleatórias ............................................................................ 63 
2.3 Principais Modelos Discretos ............................................................. 8 1 
2.4 Principais Modelos Contínuos ............................................................ 94 
2.5 Exercícios ....................... ~ .................................................................. lO? 
3. Vetores Aleatórios .......................................................................................... 11
5 
3 . I Introdução......................................................................................... I 15 
3.2 Vetores Aleatórios ............................................................................ 115 
3.3 Funções de Variáveis Aleatórias ...................................................... . l41 
3.4 Exercícios .......................................................................................... 169 
4. Valor Esperado ............................................................................................... l7
9 
4.1 Introdução ......................................................................................... 179 
4.2 Valor Esperado .................................................................................. ISO 
4.3 Valor Esperado- Integral de Lebesgue-Stieltjes ................................ l99 
4.4 Propriedades do Valor Esperado ....................................................... 213 
4.5 Exercícios .......................................................................................... 234 
5. Momentos, Esperança Condicional e Funções Auxiliares .......................... 24
1 
5.1 Introdução ......................................................................................... 241 
5.2 Momentos .......................................................................................... 24 1 
5.3 Esperança Condicional. ..................................................................... 260 
5.4 Função Geradora de Momentos ........................................................ 266 
5.5 Função Característica ........................................................................ 276 
5.6 Exercícios .......................................................................................... 290 
-· ( 
i i Conteúdo 
6. Convergência de Variáveis Aleatórias ......................................................... 299 
6. 1 Introdução ......................................................................................... 299 
6.2 Modos de Convergência ................................................................ , ... 300 
6.3 Leis dos Grandes Números ............................................................... 323 
6.4 Teorema Central do Limite ............................................................... 337 
6.3 Exercícios .......................................................................................... 350 
Apêndice A ........................................................................................................ 359 
Tabela Normal .......................................................................... : ............ 36l 
Resumo de Distribuições ...................................................................... 362 
Sumário de Expressões Matemáticas .................................................. 365 
Apêndice B -Respostas de Exercícios ............................................................... 371 
Bibliografia ......................................................................................................... 403 
Índice Remissivo ................................................................................................. 407 
Prefácio 
Este livro busca contribuir para a formação de estudantes que tenham 
interesse em aprofundar os conceitos de probabilidade e de variáveis aleatórias. 
Em especial, poderia ser útil para estudantes de pós-graduação em ínicio de 
Mestrado nas áreas de exatas, em particular, de Matemática e Estatística. O nível 
dos pré-requisitos necessários à leitura e a formalização envolvida no texto, 
podem ser considerados similares ao livro excelente (e, de certa forma, já clássico 
em nosso país) de autoria de Barry James. 
A seqüência do conteúdo e a escolha dos tópicos refletem minha 
experiência, adquirida nos vários anos em que fui responsável por disciplinas 
correlatas, no curso de Pós-Graduação do Departamento de Estatística do Instituto 
de Matemática e Estatística da Universidade de São Paulo (IME-USP). 
Este livro traz inúmeros exemplos ilustrativos e uma quantidade 
expressiva de exercícios. Isto busca realçar, para os leitores, a necessidade de 
praticarem os conceitos através da resolução de exercícios. Muitas vezes, a 
aparente frustração de ficar horas tentando resolver um exercício pode esconder 
os grandes benefícios que essa persistência tem em nossa formação, pois, como na 
vida, nem todos os problemas são resolvidos no tempo em que gostaríamos que o 
fossem. Como é comum em textos desse tipo, muitos desses exercícios foram 
adaptados de o"utros livros e/ou sugeridos por colegas. Vários foram criados e 
outros tantos coletados de provas e exames que organizei, ao longo da carreira 
acadêmica. Os exercíciossão apresentados ao fim de cada seção e em uma seção 
específica ao final de cada capítulo. 
Quero expressar minha gratidão aos colegas e estudantes que deram sua 
colaboração na feitura deste livro. A professora Elisabeti Kira leu praticamente 
todos os capítulos e fez inúmeras sugestões e comentários. Também auxiliou na 
discussão de vários exercícios. Os professores Francisco Miraglia e Luis Gustavo 
Esteves leram alguns capítulos e, também, deram várias sugestões importantes. A 
professora Zara I. Abud forneceu algumas referências de Análise Matemática e a 
professora Maria Izabel R. Martins auxilou na solução de vários exercícios que 
envolviam integração. Os estudantes Thomas L. Ritchie, Geraldine G. Bosco e 
Juvêncio S. Neto deram sugestões em capítulos específicos. Para preparar as 
respostas dos exercícios, foram muito úteis as soluções que os estudantes 
Fernando C. Cordeiro, Grazielle Y. Soldá, Juvêncio S. Neto e Mariana M. Ribeiro 
iii 
i v Pref
ácio 
gentilmente disponibilizaram. Gostaria de agradecer, em especial, ao estudante 
Nelio P. Machado pela organização de exercícios, ajuda na digitação, bem como 
na edição dos apêndices. O professor Antonio Carlos P. de Lima auxiliou-me, em 
vários momentos, na escolha das diversas opções que a redação de um texto como 
este sempre traz. A professora Maria Cecilia Camargo Magalhães, com a 
tradicional competência e rapidez, auxiliou na correção do texto. Luis Ricardo 
Camara, da ADUSP- Associação dos Docentes da USP, preparou a capa e a 
formatação da Tabela da Normal. As professoras Elisabeti Kira e Mônica 
Carneiro Sandoval utilizaram a 1 a. edição em seus cursos e deram várias 
sugestões incorporadas nessa nova edição. A todos eles meu profundo 
agradecimento. 
Para a segunda edição foram corrigidos, na medida que foram 
encontrados, os erros ortográficos e os erros em respostas de exercícios. Alguns 
enunciados de exemplos, definições, proposições e exercícios foram alterados 
para sanar pequenos erros e/ou tornar mais clara a redação. Eventualmente, 
pequenas modificações de redação também foram feitas para ajustar a 
diagramação. Em resumo, não há grandes alterações nessa segunda edição. A 
grande motivação para esta nova edição foi o fato da la. edição ter se esgotado. 
Desse modo, os estudantes e colegas podem continuar usando a edição anterior 
após consulta à www.ime.usp.br/-marcos que contém uma descrição das 
atualizações. 
Por maior esforço que se possa ter feito, alguns erros vão aparecer e são 
de minha responsabilidade. Agradeceria receber críticas e sugestões que possam 
contribuir para a melhoria do texto em novas edições. 
São Paulo, fevereiro de 2006 
Marcos N. Magalhães 
marcos@ime.usp.br 
Capítulo 1 
Conceitos Básicos em Probabilidade 
1.1 Introdução 
Neste capítulo, são apresentadas as idéias básicas de probabilidade. 
Incluímos, também, vários exemplos para ilustrar técnicas importantes que devem 
ser exercitadas pelos leitores. Muitos dos problemas apresentados são clássicos, 
estão presentes em vários textos da área, e fazem parte da história do estudo de 
probabilidade. Apresentamos, na Seção 1.2, um sumário dos principais 
resultados em Teoria dos Conjuntos e Combinatória. Em seguida, na Seção 1.3, o 
conceito formal de probabilidade é. apresentado usando o suporte axiomático 
rigoroso introduzido pelo matemático russo A. N. Kolmogorov. A notação 
utilizada procurou ser a mais usual dentre as várias alternativas possíveis e irá 
sendo introduzida conforme necessário. 
1.2 Conjuntos e Combinatória 
Encontramos, na natureza, muitas situaç.ões que envolvem incertezas. 
Elas são denominadas de fenômenos ou experimentos aleatórios. A busca por 
avaliar as diversas probabilidades de ocorrência é um dos objetivos no estudo 
desses fenômenos. 
O espaço amostrai é o conjunto de todos os resultados possíveis de um 
experimento aleatório e é representado por n. Ele pode ser enumerável, finito ou 
infinito, se pode ser colocado em correspondência bi-unívoca com os números 
naturais. Caso contrário, será não enumerável, como a reta real. Cada resultado 
pOSSSÍVel é denominado ponto OU elemento de f! e denotado genericamente por UI. 
Assim, escrevemos UI E n para indicar que o elemento UI está em n. o conjunto 
sem elementos é o conjunto vazio, denotado por 0. Os subconjuntos de n, serão 
denotados por letras latinas maiúsculas do ínicio do alfabeto, tais como A, B, etc. 
Além disso, escrevemos A C n para indicar que A é subconjunto do espaço 
amostrai n. 
Exemplo 1.1: Uma rede de computadores está em operação contínua, mas pode 
sofrer avaria a qualquer momentó. Na ocorrência de falha, o tempo de colocar a 
rede novamente em operação depende de vários fatores envolvendo a extensão e a 
1 
Anailson S. S.
Anailson S. S.
( 
( 
( J 
( 
( 
( 
( I 
( 
( 
( 
2 Capítulo 1: Conceitos Básicos em Probabilidadt• 
causa da falha, entre outras. Se estivermos interessados no número de falhas 
diárias temos como espaço amostrai: 
n = {0, 1, 2,. ··,m}. 
Nesse caso, n é um conjunto enumerável finito, sendo m o limite máximo de 
falhas estabelecido pelo administrador da rede. É claro que se esse limite não é 
fixado, poderíamos considerar n como sendo enumerável infinito. Em uma 
análise estatística do funcionamento da rede, poderia haver interesse em avaliar o 
valor de m para estabelecer políticas de manutenção preventiva. 
Supondo, agora, que o interesse é observar a hora do dia em que ocorre 
falha, o espaço amostrai seria 
f2 = { w E IR : O :::; w :::; 24}. 
Temos, assim, um conjunto não enumerável. Se a unidade de tempo for minutos 
ou segundos, o intervalo de valores se modifica adequadamente. 
Observe que, para um mesmo fenômeno aleatório, pudemos associar 
yários espaços amostrais. A escolha de qual é adequado depende do interesse do 
estudo e, muitas vezes, é possível trabalhar com mais de um espaço amostrai. O 
A notação utilizada para as operações básicas entre subconjuntos é 
apresentada a seguir: 
(i) A c ou A é o complementar de A, isto é, todos os elementos de n exceto os 
de A; 
n 
(ii) A1 U A2 ... U A,. ou U AJ é a união de A1, A2, ... , A,. e representa os 
j= l 
pontos de n que pertencem a pelo menos um desses subconjuntos; 
n 
(iii) A1 n A2 ... nA" ou n Ai ou, ainda, simplesmente A1A2 ... A,. é a 
j=l 
intersecção de A 1, A 2, .•• , A 11 e representa a ocorrência simultânea 
desses subconjuntos; 
(iv) A- B ou A n B" = ABc é a diferença entre A e B, isto é, todos os 
elementos de A, exceto os que também estejam em B ; 
(v) A!::::.B ou ABc U Ar B é a diferença simétrica entre A e B, isto é, todos os 
elementos de A U B exceto os que estejam em A n B. 
1.2 Conjuntos e Combinatória 3 
Diremos que dois subconjuntos são disjuntos ou mutuamente exclusivos 
se sua intersecção é o vazio. Assim, 
A e B disjuntos {::} A n B = 0. 
Diremos que A 1 , A2, ... , A, formam uma partição de n se são disjuntos 
e se sua união é n, ou seja: 
n 
UA; = n, com A; nAj = 0, Vi =I= j. 
i=l 
o conjunto das partes de n é formado por todos os subconjuntos de n. 
Denotaremos esse conjunto por nP, mas são comuns outras notações tais como 
P{n} (que foi evitada aqui para não confundir com probabilidade, definida 
adiante). 
Se um número infinito de subconjuntos estiver envolvido nas operações 
acima mencionadas, elas são definidas de maneira análoga. 
Exemplo 1.2: Leis de Morgan 
Um conjunto de relações entre umao e intersecção de conjuntos, 
conhecido como Leis de Morgan, auxilia na demonstração de vários resultados. 
Elas são dadas por: 
Vamos verificar a relação (i) e deixamos ao leitor a demonstração da 
outra parte, que é análoga. 
O caminho usual, para demonstrar igualdades entre conjuntos, é provar 
que cada um deles está contido no outro. Dessa forma, temos duas partes a serem 
verificadas: 
n )c n ( UA; c nA~ (parte I) e 
i"=l i=l 
n . c n 
( U A;) :J nA;· (parte 2). 
i=l i=l 
Prova da Parte 1: 
Suponha que w E (9
1 
A;) c .Então w ~;ºA; e, ainda, w ~A; para todo 
11 
i. Dessa forma w E Aj para todo i e, consequentemente, w E n Aj. 
i=l 
Anailson S. S.
Anailson S. S.
Anailson S. S.
Anailson S. S.
Anailson S. S.
Anailson S. S.
Anailson S. S.
Anailson S. S.
Anailson S. S.
Anailson S. S.
Anailson S. S.
Anailson S. S.
Anailson S. S.
Anailson S. S.
Anailson S. S.
4 Capítulo 1: Conceitos Básicos em Probabilidade 
Prova da Parte 2: 
n 
Suponha que w E n Af. Então w E Af para todo i e, ainda, w rf- A; para 
i=l 
todo i. Dessa forma w rf- iº l A; e, consequentemente, w E (Q A;) c. 
Portanto, a verificação da relação (i) está completa. Vale ressaltar que as 
Leis de Morgan também são válidas para o caso em que n = oo. D 
Diremos que os subconjuntos A~, A2, •• • formam uma seqüência 
monótona não-decrescente se An C An+l para todo n 2:: 1 (em notação 
simplificada An l ). A seqüência será monótona não-crescente (An l ) se a 
inclusão for no sentido contrário, isto é, se para n 2:: 1 tivermos An :::> An+l· 
O limite superior da seqüência de subconjuntos { An; n 2:: 1} é definido 
por: 
00 00 
limsup An = lim An = n U Ak· 
n=lk=n 
Em palavras, o lim supAn é o conjunto dos elementos de O que pertencem a um 
número infinito dos A ... Por essa razão, é freqüente denominar lim sup An pelo 
conjunto {An infinitas vezes}. 
De modo similar, definimos limite inferior por 
00 00 
liminf A11 = lim A,.= U n Ab 
n=l k=n 
sendo interpretado como o conjunto dos w E O que estão em todos os An, a partir 
de um certo n (que pode ser função de w). Outra interpretação, bastante utilizada, 
considera o lim in f An como sendo o conjunto {ocorre An, para todo n 
suficientemente grande} . 
Se uma seqüência {A.,; n 2:: 1} tem limite, então os limites inferior e 
superior coincidem, isto é, 
lim An = lim An = lim An, 
n-->oo 
justificando a nomenclatura utilizada para essas operações de conjuntos. 
Vamos estabelecer uma classe de subconjuntos com algumas 
propriedades convenientes. Ela será usada para a definição axiomática de 
probabilidade, apresentada na próxima seção. 
1.2 Conjuntos e Combinatória 5 
Definição 1.1: o--álgebra 
Uma classe de subconjuntos de O, representada por :F, é denominada uma 
u-álgebra se satisfaz as seguintes propriedades: 
(Al) O E :F; 
(A2) Se A E :F, então Ac E :F; 
00 
(A3) Se A; E :F, i 2:: 1, então U A; E :F. 
i=l 
Se apenas a união finita está em :F temos uma classe menos restrita, denominada 
álgebra. D 
É fácil verificar que uma u-álgebra é também uma álgebra. Fica como 
exercício ao leitor verificar que intersecções infinitas de elementos de uma u -
álgebra, também pertencem à u-álgebra. 
Exemplo 1.3: Considere O = {1, 2, 3} e as seguintes coleções de subconjuntos: 
• 
:Fl = {0,0,{1} , {2,3}}; 
:F2 = {0,0,{1}, {2} , {1 , 3} , {2, 3}} . 
Seriam ambas u-álgebra? 
Para responder a essa questão vamos verificar se as propriedades (Al)-
(A3) estão satisfeitas. As duas coleções contém o espaço amostrai e, assim, (A1) 
está satisfeita para ambas. 
Vamos verificar (A2). Observe que os complementares dos elementos de 
:F1 estão todos também em :F1 pois: 
0c =o, oc = 0, {1}" = {2,3} e {2,3Y = {1} . 
Logo :F1 satisfaz a propriedade (A2). De modo análogo, verificamos que o mesmo 
ocorre com a coleção :F2. 
Para verificar (A3) observamos que, como o número de elementos em 
cada coleção é finito, basta verificar se todas as uniões possíveis com seus 
elementos também pertencem à coleção. A união com o vazio é inócua e a com O 
dá o próprio O, logo vamos nos ocupar das demais uniões que poderiam não 
pertencer à coleção. 
Para :F1 temos 
{1} u {2, 3} =o E :F1 , 
e, portanto, a propriedade (A3) está satisfeita e a coleção :F1 é uma u-álgebra. 
Anailson S. S.
Anailson S. S.
Anailson S. S.
6 Capítulo 1: Conceitos Básicos em Probabilidade 
Se tomarmos as uniões relevantes e não triviais em :F2, notamos 
imediatamente que 
{1} u {2} = {1, 2} tt :F2; 
logo (A3) não vale e a coleção de conjuntos :F2 não forma uma o--álgebra. O 
Exemplo 1.4: Seja :F uma o--álgebra de conjuntos de n e considere que 
A1, A2 , ···sejam elementos de :F. Para k = 1, 2, ··· ,definimos: 
B~.: = { w : w pertence a no mínimo k dos conjuntos An, n = 1, 2, · · · }. 
Vamos verificar que os conjuntos Bk, k = 1, 2, ···também estão na o--álgebra :F. 
Fixando um k arbitrário, precisamos caracterizar os elementos de B~ .. Observe 
que se w E Bh então ele pertence a j dos An 's, para algum j 2: k. Assim, 
podemos considerar os w's E B~.: como a união daqueles que pertencem a 
exatamente j dos An 's, com j = k, k + 1, ···. Mas pertencer a exatamente j dos 
j 
An 's, é pertencer à n An1 , para alguma escolha de índices nh n2 , ... , nk. 
i=l 
oc j 
Portanto segue que B~.: = U n An;· 
j=ki=l 
Note que, pelas Leis de Morgan, temos ió An1 = (~1 A~1 ) c. Aplicando 
sucessivamente as propriedades de o--álgebra vem: 
A~1 E :F pois A711 E :F (propriedade A2); 
j 
::::} U A~1 E :F (propriedade A3); 
i=l 
::::} (U A~i ) r E :F (propriedade A2); 
t=l 
00 ( j c ::::} U U A~~ ) E :F (propriedade A3); 
j=k i=l 
logo Bk E :F e a verificação está completa. 
Exemplo 1.5: A "menor" u-álgebra gerada por um subconjunto 
o 
Em várias situações, nosso interesse é construir uma o--álgebra que tenha. 
entre seus elementos, um particular subconjunto A c f!. Não é díficil verificar 
1.2 Conjuntos e Combinatória 7 
que :F= {0, A, A c, f!} é uma o--álgebra, sendo A um dos seus elementos. 
Qualquer outra o--álgebra que também contiver A será "maior", isto é, terá os 
elementos de :F e, eventualmente, mais alguns. Por isso, :F é definida como a o--
álgebra gerada por A ou, ainda, como a intersecção de todas as o--álgebras que 
contém o subconjunto A. Numa denonúnação mais informal diremos que :F é a 
menor o--álgebra que contém o subconjunto A. 
A o--álgebra de Borel em IR, denotada por B(IR), é a menor o--álgebra que 
contém todos os intervalos abertos dos reilis. É possível verificar que ela pode ser 
gerada pelos intervalos ( -oo, x) com x E IR. Existem outras escolhas para o 
intervalo gerador, mas o que é importante é que, qualquer tipo de intervalo dos 
reais, pode ser obtido através de um número enumerável, finito ou infinito, de 
operações de uniões e intersecções com o intervalo acima. 
Para ilustrar essas idéias, vamos verificar que o intervalo [a, bJ, com 
a < b, a, b E JR, está na o--álgebra gerada por intervalos do tipo ( -oo, x) com 
X E JR. 
Observe que, para qualquer b E JR, existe uma seqüência b, ! b de modo 
•oo 
que ( -oo, bJ pode ser escrito como n ( -oo, bn)· Logo ( -oo, b] está em B(JR), 
n=l 
pois ele é obtido da intersecção infinita de intervalos do tipo ( -oo, x), todos em 
B(JR). Note que, sendo (-oo,aY = [a,oo) este intervalo também está em B(JR). 
Finalmente, [a, bj está na o--álgebra de Borel, pois é intersecção ·de dois de seus 
elementos, isto é, [a, b] = [a, oo) n ( -oo, b]. 
Se o resultado de um experimento é um número real, isto é n = JR, então 
todas as perguntas práticas de interesse se referem a um conjunto pertencente à o--
álgebra de Borel. É preciso muito esforço e artificialidade para construir um 
subconjunto que não seja boreliano. O 
Uma função bastante útil na operação entre conjuntos é a função 
indicadora do conjunto A, definida da seguinte forma: 
se w E A; 
se w <tA. 
Não é difícil verificar que J,1c:(w) = 1- IA(w). A notação de função indicadora 
pode variar entre autores, sendo também comum a utilização de 1A(w) ou 6A(w). 
Exemplo 1.6: Indicadores da União e Intersecção 
Muitas vezes a operação com indicadores facilita a notação e clarifica as 
idéias envolvidas. Vamos verificar duas expressões com indicadores referentes a 
8 Capítulo 1: Conceitos Básicos em Probabilidade 
união e a intersecção de conjuntos. Sejam A1o A2, ... An subconjuntos de n e 
n n 
defina A= U Ai e B = n Ai então: 
i=l i=l 
Prova de (i) : 
n 
(i) lA(w) = 1 - IT IA:;(w); 
i=l 
n 
(ii) IB(w) = II IAi(w). 
j=l 
Se w E A, temos IA(w) = 1. Nesse caso, w E Ai para algumj e, assim, 
para esse j temos w ~ Aj e portanto IAj(w) = 0: Logo, o lado direito da 
igualdade (i) é igual a 1. Se w ~A, temos IA(w) =O. Logo w ~Ai para todo j, 
n 
isto é, w E Aj para todo j. Dessa maneira, IA~(w) = 1 para todo j e TI 
) j=l 
IA~(w) = 1. Assim o lado direito de (i) também é igual a O. 
) 
Prova de (ii) : 
Se w E B, temos IB(w) = 1. Nesse caso, w E Ai para todo j e, assim, 
n 
IA/w) = 1 para todo j . Então TI IAi(w) = 1 e o lado direito de (ii) é igual a 1. 
j=l 
Se w ~ B, temos IB(w) = O e portanto w ~ Ai para pelo menos um j. Seja j* um 
desses índices, temos IA.(w) =O. Logo, o lado direito de (ii) é igual a O. O 
) 
As idéias de contagem se relacionam com probabilidade, conforme 
veremos na próxima seção. Sem pretender ser exaustivo, apenas mencionamos 
aqui as definições e resultados básicos de análise combinatória. 
Considere que desejamos escolher k dentre n objetos. Se a ordem de 
escolha é importante, temos um arranjo de n objetos tomados k a k. Caso a 
ordem não importe, o agrupamento formado é a combinação de n objetos 
tomados k a k. O número de diferentes agrupamentos que podem ser formados 
são apresentados a seguir 
arranjo: (n)k = n(n- 1)(n- 2)· · ·(n- k + 1) = (n(:!~)!; 
b. _ (n) n! com maçao: k = k! (n _ k)! · 
1.2 Conjuntos e Combinatória 9 
Um arranjo de n objetos, tomados n a n, é uma permutação de n objetos. 
Assim, a expressão do número de diferentes permutações é dada por: 
permutação: (n)n = n! 
Outro resultado útil é o Príncipio Fundamental da Contagem enunciado a 
seguir: 
Se uma tarefa tem k etapas e cada etapa i tem n; maneiras 
diferentes de ser realizada, então o número total de alternativas para 
realizar a tarefa é o produto n1n2 ... nk . 
Exercícios da Seção 1.2: 
1. Sendo A, B e C subconjuntos quaisquer, expresse em notação matemática os 
conjuntos cujos elementos: 
a. Estão em A e B, mas não em C. 
b. Não estão em nenhum deles. 
c. Estão, no máximo, em dois deles: 
d. Estão em A, mas no máximo em um dos outros. 
e. Estão na intersecção dos três conjuntos e no complementar de A. 
2. Verifique fofi!ialmente que: 
a. A6B = B6A. 
b. (A6B) u AB = A U B. 
c. (ABcc u N BC) n ABCc = 0. 
3. Sejam A1. A2, • • • subconjuntos de n e defina Bn da seguinte forma: 
B1 = A1 e Bn = AnA~-1 A~-2" ·Aí, n 2:: 2. 
00 
Mostre que a seqüência { Bn; n 2:: 1} forma uma partição de U An. n=l 
4. Considere a seqüência infinita A1, A2, ···de subconjuntos de n e defina 
00 00 
Bn = nAj e Cn = UAj. 
j=n j=n 
a. Estude a monotonícidade das seqüências { Bn; n 2:: 1} e { Cn; n 2:: 1}. 
00 
b. Prove que w E U Bn se, e somente se, w pertence a todos os subconjuntos 
n=l 
A1, A2 , ···exceto, possivelmente, a um número finito deles. 
10 Capítulo 1: Conceitos Básicos em Probabilidade 
. oc 
c. Mostre que w E n Cn se, e somente se, w pertence a um número infinito 
n=l 
dos subconjuntos A1, A2, · · ·. 
5. Sendo S1 = {a, b, c}, liste todas as a-álgebras de subconjuntos de n. 
6. Sendo S1 = {1 , 2, 3}, mostre que SlP é a-álgebra. 
11 
7. Mostre que, se A1 , A2 , .. ·,A, são elementos de uma a-álgebra :F então nA; i=l 
também pertence a :F. 
8. Sendo n = JR., seja B(JR.) a a-álgebra gerada pelos intervalos ( -oo, x) com 
x E R Mostre que com o intervalo [x,y), x ~ y, x.,y E JR., também 
poderíamos gerar os mesmos borelianos de B(JR.). 
9. Seja C uma coleção não vazia de subconjuntos de n. Mostre que existe a menor 
a-álgebr;1 de subconjuntos de S1 que contém C, e que ela é unica. 
10. Considere S1 = [O, I) e os seguintes subconjuntos: 
'A= {x E S1: x ~ 1/2} e B = {x E S1: x 2: 1/3}. 
Expresse, em fúnção dos indicadores de A e B, os indicadores dos seguintes 
conjuntos: 
a. {:r E Sl: X> 1/2}. 
b. {x E Sl: X< 1/3}. 
C. {x E f2: 1/3 ~X ~ 1/2}. 
d. {x E f2: X< 1/3 ou X> 1/2}. 
e. n. 
1.3 Probabilidade 
A definição clássica de probabilidade se refere a subconjuntos unitários 
eqüipmváveis. No caso enumerável finito temos: 
P(A) = Número de elementos em A 
Número total de elementos em S1 
Utilizando essa definição, muitos problemas são resolvidos através de técnicas de 
análise combinatória e de contagem. Se o número de elementos de n for infinito, 
precisamos tratar a definição acima com o uso de limites. 
Se n não for enumerável, o conceito se aplicará ao comprimento de 
intervalos, medida de áreas ou similares, dando origem ao que é chamado de 
1.3 Probabilidade 11 
probabi!idáde geométrica. Por exemplo, para n sendo um intervalo dos reais 
temos, 
P(A) = Comprimento de A 
Comprimento total de S1 
Uma outra definição, denominadafreqüentista ou estatística, considera o 
limite de frequências relativas como o valor da probabilidade. Para tal, seja nA o 
número de ocorrências de A em n repetições independentes do experimento em 
questão. Assim, 
P(A) = lim nA· 
n ..... oo n 
As definições apresentadas acima têm o apelo da intuição e permanecem 
sendo usadas para resolver inúmeros problemas. Entretanto, elas não são 
suficientes para uma formulação matemática mais rigorosa da probabilidade. Ao 
redor de 1930, A. N. Kolmogorov apresentou um conjunto de axiomas 
matemáticos para definir probabilidade, permitindo incluir as definições 
anteriores como casos particulares. 
Definição 1.2: Probabilidade 
Uma função P, definida na a-álgebra :F de subconjuntos de n e com 
valores em [0, 1), é uma probabilidade se satisfaz os Axiomas de Kolmogorov: 
(Axl) P(Sl) = I; 
(Ax2) Para todo subconjunto A E :F, P(A) ;::: O; 
(Ax3) Para toda seqüência A1, A2, ... E :F, mutuamente exclusivos, 
temos 
o 
A trinca (S1, :F, P) é denominada espaço de probabilidade. Os 
subconjuntos que estão_ em :F são denominados eventos e é somente a eles que se 
atribui probabilidade. E possível demonstrar, através do Teorema da Extensão de 
Caratheodory, que uma função de probabilidade definida em uma álgebra pode 
ser estendida para uma a-álgebra conveniente. 
12 Capítulo 1: Conceitos Básicos
 em Probabilidade 
Exemplo 1.7: Problema dos Aniversários (Feller [68]) 
Num grupo de r pessoas, qual é a probabilidade de pelo menos duas delas 
fazerem aniversário no mesmo dia? 
Esse problema tem surpreendido estudantes pois, dependendo do valor de 
r, a_probabilidade procurada é bastante alta. Vamos considerar o ano com
 365 
dias e, assim, assumimos r < 365 pois para r ~ 365 a probabilidade desejada 
seria 1. 
O espaço amostrai n será o conjunto de todas as seqüências formadas 
com as datas dos aniversários (associamos cada data a um dos 365 dias do a
no). 
Pode ser verificado que o conjunto das partes de um espaço amostrai enumer
ável 
é uma a-álgebra. Dessa forma, podemos tomar a a-álgebra :F como send
o o 
conjunto das partes de f! e, para qualquer A E :F, P(A) é o quociente entre
 o 
número de elementos de A por 365r, que é o número total de seqüências 
de 
tamanho r. Assim, assumimos que todos os dias são eqüiprováveis. 
Seja E o evento de interesse, isto é, E = {pelo menos duas pessoas 
aniversariam no mesmo dia} . Para o complementar de E, temos Ec ={ninguém 
faz aniversário no mesmo dia}. Iremos calcular a probabilidade de Ec com o 
auxílio do Principio Fundamental da Contagem. 
Considerando a escolha das idades como sendo r etapas sucessivas 
precisamos, para as datas serem todas distintas, eliminar as que forem escolh
idas 
em etapas anteriores. O agrupamento formado é um arranjo e, dessa forma, pa
ra o 
total de maneiras de escolhermos r datas diferentes de aniversário, teremos 
(365) r = 365 X 364 X ... X (365- r+ 1). 
Em outras palavras, o produto acima é o número de seqüências que satisfaze
m a 
condição de datas distintas de aniversário. Então, 
c (365)r ( 1 ) ( 2 ) ( r- 1) 
P(E ) = 365r = 1 1 - 365 1 - 365 ... 
1 - 365 . 
Portanto, a probabilidade desejada, de pelo menos dois aniversários no 
mesmo dia, será P(E) = 1 - P(ec). 
O curioso é que para r = 23, um número relativamente baixo de pessoas, 
a probabilidade de pelo menos dois aniversários coincidentes já é maior que 
1/2. 
A tabela a seguir (ver Neuts [73]) apresentaalguns valores dessa probabilid
ade 
em função de r. 
1.3 Probabilidade 13 
r P (E) 
10 0,1169 
20 0,4114 
30 0,7063 
40 0,8912 
50 0,9704 
60 0,9941 
A nossa intuição de considerar "evento raro" duas pessoas terem a mesma 
data de aniversário contradiz os cálculos da tabela. Não é preciso um grupo m
uito 
grande para que tenhamos, com quase certeza, aniversários coincidentes. 
O 
Exemplo 1.8: Paradoxo de Bertrand (Neuts [73]) 
. Ne~te exemplo, vamos apresentar um problema que é passível 
de 
diferentes Interpretações. Apesar de se tomar conhecido como um parado
xo, 
~ata-se apenas de diferentes escolhas do espaço de probabilidade e, se
ndo 
ngoroso, não existe paradoxo algum. Em todas as interpretações os elementos
 são 
~üiprováveis mas, como os espaços de probabilidade são diferentes, produz
em 
diferentes respostas. O problema é formulado da seguinte forma: 
Num círculo unitário, representado a seguir, o triângulo eqüilátero 
inscrito tem lado igual a y'3 . Qual é a probabilidade de uma corda desse círculo 
escolhida ao acaso, ter comprimento maior que o lado desse triângulo? 
' 
c 
Figura 1.1: Paradoxo de Bertrand. 
14 Capítulo 1
: Conceitos Básicos em Probabilidade 
I a. Intemretacão: 
A corda é escolhida ao acaso da seguinte form
a: escolhemos 
aleatoriamente um ponto P dentro do círculo e o ligamos 
ao centro através de um 
segmento de reta. A corda é traçada nesse ponto de forma 
a ser perpendicular ao 
segmento conforme figura a seguir. 
D 
c 
Figura 1.2: Paradoxo de Bertrand-la.lnterpretação. 
Para essa interpretação consideramos O como o círculo un
itário e :F uma 
a-álgebra constituída de modo a incluir todos os subco
njuntos de O cuja área 
esteja definida. Para todo A E :F, definimos P(A) como sendo
 o quociente entre 
a área de A e a área do círculo unitário. 
É um exercício de geometria, verificar que a região que 
produzirá as 
cordas desejadas é o círculo inscrito no triângulo, de mes
mo centro e raio 1/2. 
Logo, a probabilidade de interesse será: 
P(c d 
. r;;3
) Área Círculo (0, 1/2) = !1r = ~. 
or as maiOres que v J = , 4 Area Círculo (0, 1) 1r 
2a. Intemretação: 
A corda une dois pontos na circunferência. Admitimos, ain
da, que a corda 
é invariante por qualquer rotação da circunferência. Dess
a forma, fixamos uma 
extremidade e escolhemos, ao acaso, o outro extremo na c
ircunferência. O espaço 
amostrai O consiste dos arcos no intervalo [0, 211'] e a a-á
lgebra :F é formada de 
modo a incluir todos os arcos de O cuja medida possa 
ser avaliada. Para todo 
A E :F, definimos P(A) como a medida do arco dividido por 21
1'. 
1.3 Probabilidade 
15 
As cordas com comprimento superior a J3 são aquelas em que o outro 
extremo da corda está no arco com extremidades entre 
~ e ~ (ver figura a 
seguir). 
4Jtl3 
D 
Figura 1.3: Paradoxo de Bertrand- la. Interpretação. 
Segue que 
r;; Medida do Arco ( ~, !...3,.) 
2 1 
P(Cordas maiores que v J) = · 
3 = 311' = _. 
211' 211' 3 
3a. Intemretação: 
Para a obtenção da corda, escolha um ponto ao acaso em u
m dos raios, e 
por esse ponto, trace uma perpendicular. O particular raio u
tilizado é irrelevante e 
o procedimento aleatório é equivalente a sortear um p
onto ao acaso num 
segmento [0, 1] . 
Para essa interpretação, seja O o intervalo [0, 1] e :F uma 
a-álgebra 
constituída de modo a incluir todos os intervalos de O cu
jo comprimento esteja 
definido. Para todo A E :F, definimos P(A) como sendo o comp
rimento de A. 
Para produzir os tamanhos desejados de corda, o ponto esc
olhido precisa 
estar no intervalo [O, 1/2], conforme figura a seguir. 
Então, 
P(Cordas maiores que VJ) = Comprimento do Intervalo [0, 1/2] = ~ · 
16 Capítulo 1: Conceitos Básicos em Probabilidade 
c 
1/2 
D 
Figura 1.4: Paradoxo de Bertrand- 3a. Interpretação. 
Essas três respostas, aparentemente paradoxais, refletem as diferentes 
interpretações dadas à frase "escolhida ao acaso". Para estabelecer qual delas é a 
resposta correta, é necessário tornar mais precisa a pergunta para evitar 
ambiguidades na interpretação. Aliás, em muitos problemas de probabilidade, 
essa pode ser a parte mais difícil! D 
Nos próximos dois exemplos, o espaço de probabilidade não foi 
formalizado e deixamos ao leitor essa tarefa. 
Exemplo 1.9: Amostragem com e sem Reposição (Mood, Graybill e Boes [74]) 
Num lote de n peças existem m defeituosas. Uma amostra sem reposição 
de r dessas peças, r < n, é sorteada ao acaso e deseja-se obter a probabilidade de 
obtermos k peças defeituosas, k $ min(r, m ). 
Cada amostra é denotada por ( z1 , z2 , .•• , Zr) em que zi representa a peça 
escolhida na i-ésima retirada. Dessa forma, o total de amostras possíveis é 
(n )r. ou seja, o número de arranjos de n tomados r a r. Para estabelecer o número 
de casos favoráveis, consideramos três etapas. Inicialmente escolhemos em que 
posição as defeituosas foram retiradas. As k peças defeituosas formam um 
subconjunto de tamanho k, dentre as r posições da amostra. Assim, temos G) 
possibilidades. Note que as r - k peças boas formam um outro subconjunto 
complementar ao das defeituosas. Tendo fixada a posição das defeituosas, as boas 
têm posição definida. A segunda etapa será escolher quais k dentre as m peças 
defeituosas existentes ocuparão as posições fixadas na primeira etapa. Isto pode 
ser feito de (m)k maneiras diferentes. Uma terceira etapa, análoga à anterior, será 
escolher as peças boas para participarem da amostra. Obtemos ( n - m )r-k 
diferentes formas dessa escolha. Aplicando o Príncipio Fundamental da 
1.3 Probabilidade 17 
Contagem, o número de amostras, sem reposição, com k peças defeituosas é dado 
pelo produto ( n ( m )k ( n - m )r-k· A correspondente probabilidade será 
G)(m)k (n- m)r-k 
P (k defeituosas na amostra sem reposição)= ....:..:::..'---------
(n)r 
Essa expressão pode ser reescrita na seguinte forma: 
(:') (~=~) 
P ( k defeituosas na amostra sem reposição) = (;) ' 
cuja interpretação corresponde a um outro espaço amostrai descrito a seguir. O 
espaço amostrai seria agora constituído de subconjuntos das n peças com 
tamanho r e, assim, temos ( ; )escolhas possíveis. Para contar os casos favoráveis, 
observe que, dentre as m peças defeituosas existentes, há ( :' )escolhas para as k 
participantes da amostra. De modo análogo, para as peças boas existem . ( r;=~') 
possibilidades. Pelo Principio Fundamçntal da Contagem o número total de casos 
favoráveis é o produto. Daí segue a probabilidade desejada, conforme a expressão 
acima indicada. Como será visto no próximo capítulo, essa situação origina o 
modelo Hipergeométrico para variáveis. 
Na situação em questão parece ser mais natural uma amostragem sem 
reposição. Entretanto, para efeito didático, vamos considerar uma amostragem 
com reposição. 
Para cada elemento da amostra temos n escolhas possíveis e então nr 
fornece o número total de amostras possíveis. De forma similar ao caso sem 
reposição, temos para o número de casos favoráveis, o produto ( ~ ) mk(n- my-k 
e podemos escrever 
(r)mk(n- my-k 
P( k defeituosas na amostra com reposição) = ~k:.....___:_ __ ...:........_ nr 
= G)(:f(l- :r-~ 
Essa expressão corresponde à função de probabilidade do modelo Binomial, a ser 
definido no Capítulo 2, sendo ~ a proporção de peças defeituosas no lote. O 
18 Capítulo 1: Conceitos Básicos em Probabilidade 
Exemplo 1.10: Problema da Eleição e Principio da Reflexão (Brémaud [88]) 
Suponha que dois candidatos I e 11 disputem uma eleição recebendo, 
respectivamente, a e b votos. Admita que a > b e o interesse é calcular a 
probabilidade do candidato I estar sempre à frente na contagem. 
Considere um plano cartesiano com os votos de I no eixo x e os do 
candidato 11 em y. A marcha da contagem pode ser pensada como um caminho 
que liga o ponto (O, O) até (a, b). Na figura abaixo uma possível trajetória é 
apresentada. Trajetórias favoráveis são aquelas que ficam abaixo da diagonal. 
y 
y=x 
b (a, b) 
(0,0) a X 
Figura1.5: Principio da Reflexão. 
Assumimos que todas as trajetórias de (0, O) até (a, b) são equiprováveis, 
isto é, os votos vão sendo contados ao acaso. Dessa forma, a probabilidade 
desejada será o quociente entre o número de trajetórias favoráveis (candidato I 
sempre à frente) e o número total de trajetórias. 
Vamos representar por n o número total de trajetórias. O total de votos a 
serem contados é a + b , dos quais a serão do candidato I. Logo, n nada mais é do 
que o número total de posições para os a votos do candidato I. Uma vez que, para 
esse cálculo, a localização dos votos do candidato I não é importante, temos 
Seja n1 o número de trajetórias com o candidado I liderando a apuração. 
O número de trajetórias desfavoráveis é repartido em duas, dependendo de quem 
recebe o primeiro voto. Assim 
1.3 Probabilidade 19 
n = n1 + mpf + mplJ, 
em que mp1 e mpii representam, respectivamente, o número de trajetórias 
desfavoráveis com primeiro voto em I e 11. 
Observe que a probabilidade de interesse é dada por 
n1 = 1 _ mpJ + mpn , 
n n 
restando calcular mn e mplJ, o que será feito a seguir. 
Se o primeiro voto é em 11, já estamos numa trajetória desfavorável e, 
assim, todas as trajetórias a partir desse ponto devem ser contadas. Dessa forma, 
basta contar o número total de trajetórias do ponto (0, 1) até (a, b). Isto 
comesponde ao número de posições para os a votos do candidato I dentre o total 
de votos de a + b - 1. Assim, 
mpii = (a +! -.1) = (a;~~ 1} 
Vamos agora verificar que mpf = mpJI, observando que cada trajetória 
em um dos casos desfavoráveis tem uma correspondente no outro caso. 
Uma trajetória, que se inicia com o voto no candidato I, precisa encontrar 
a diagonal em algum momento para ser desfavorável. Seja ( x, x) a primeira vez 
que isso ocorre. Se os movimentos de (0,0) até (x,x) são refletidos em relação à 
diagonal, temos um trajetória também desfavorável que se inicia com o primeiro 
voto no candidato 11. De (x, x) até o fim, as duas trajetórias podem prosseguir 
pelo mesmo caminho. Então, cada trajetória desfavorável, iniciada com voto em I, 
tem uma correspondente iniciada com voto em 11. 
De forma recíproca, considere agora que iniciamos com uma trajetória 
desfavorável com primeiro voto em 11. Como o candidato I venceu as eleições, 
essa trajetória deve atingir a diagonal em algum momento. Aplicando o mesmo 
raciocínio anterior, concluiríamos que para cada uma dessas trajetórias existirá 
uma correspondente, que se iniciou com o voto em I. 
Se os dois conjuntos de trajetórias se relacionam biunivocamente, então 
têm o mesmo número de elementos e portanto mpJ = mpJI. Assim, 
, ) n1 2(at~~ 1 ) a-b 
P(Cand. I sempre a frente = -:; = 1- (a~b) = a+ b · 
o 
20 Capítulo 1: Conceitos Básicos em Probabilidade 
Com os Axiomas de Kolmogorov, apresentados na definição dt: 
probabilidade, pode-se demonstrar com rigor matemático, diversas propriedades. 
Proposição 1.1: Propriedades da Probabilidade 
Dado (n, F, P), considere que os conjuntos mencionados abaixo são 
eventos nesse espaço de probabilidade. Temos: 
(Pl) P(A) = 1 - P(N); 
(P2) Sendo A e B dois eventos quaisquer, vale 
P(B) = P(B nA)+ P(B nA c); 
(P3) Se A c B então P(A) ::::; P(B); 
(P4) Regra da Adição de Probabilidades (generalizável para qualquer n): 
P(A U B) = P(A) + P(B) - P(A n B) ; 
(PS) Para eventos quaisquer A 1 , A2, ... 
(P6) Se AnTA então P(An) T P(A). De forma similar, se An ! A então 
P(An)! P(A) . 
Demonstração: 
(Pl) Os eventos A e Ac formam uma partição de n e, portanto, por (Ax3) 
temos 
P(O) = P(A u N) = P(A) + P(Ac); 
que, com auxílio de (Axl), vem 
1 = P(A) + P(Ac) '* P(A) = 1 - P(Ac). 
(P2) Para dois eventos A e B quaisquer, é sempre possível escrever o 
evento B da seguinte forma: B = (B nA) U (B n N). Note que essa é uma 
união disjunta e, portanto, por (Ax3) o resultado segue imediatamente. 
1.3 Probabilidade 21 
(P3) Se A c B então o evento B pode ser particionado nos moldes 
usados em (P2). Assim, 
Então, como a união é disjunta, vem 
P(B) = P(A) + P(B nA c) ;::: P(A), 
uma vez que, por (Ax2), P(B nA c) ;::: O. 
(P4) Vamos escrever A U B como a seguinte união disjunta: 
dessa forma, segue por (Ax3) 
P(A U B) = P(A nBc) + P(B n Ac) + P(A n B). 
Aplicando (P2) nos eventos A e B, eles podem ser escritos da seguinte • 
forma: 
P(A) = P(A n B) + P(A n Bc) e P(B) = P(B nA)+ P(B n Ac); 
de modo que obtemos 
P(A U B) = P(A)- P(An B) + P(B)- P(B nA)+ P(A nB), 
e o resultado segue, uma vez que a intersecção é comutativa. 
A expressão para a probabilidade da união de n eventos é dada pelo 
Teorema de Poincaré e envolve alternar entre a subtração e a soma de 
probabilidades de intersecção de um número crescente de eventos. A 
demonstração é solicitada em exercício ao final do capítulo e pode ser feita por 
indução. 
00 
(PS) Vamos escrever U A; como união de uma seqüência disjunta de 
i=l 
eventos. Temos 
00 
UA; = A1 u (A~ n Az) u (A! n A2 n A3 ) u .... 
i=l 
22 
Capítulo 1: Conceitos Básicos em Probabili
dade 
Portanto, pelo Axioma 3, podemos escrever 
oc 
P(UA;) = P(AI) + P(A} n A2) + P(A} n A2 n A3) + ... ; 
t=l 
como, para qualquer j, A~ n A~ n · · · n Aj_1 n Ai c Ai se
gue de (P3) que 
oc 
P(UA;) :5 P(AI) + P(A2) + P (A3) + .... 
t=l 
(P6) Lembremos que a notação An j A indica 
que temos uma seqüência 
00 
monótona não decrescente de eventos A 1, A2,
 ·· ·, tais que limA;= A = .U A;. 
~--+oo t=l 
Uma vez que A1 C A2 c A3 C .. ·, segue que P (A; ) é não 
decrescente em i pela 
propriedade (P3). Como também é limitada ent
ão lim P(An) existe. 
n--+C>O 
Escrevendo A nos mesmos moldes do que foi f
eito nà demonstração de 
(P5) vem 
00 
P(A) = P(UA;) = P(AI) + P (Aí n A2) + P (Aí nA~ n A3) +
 ... ; 
i= l 
nesse caso, vale P (A} n A2 n · · · n Aj_ 1 n Ai) = P(
Ai) - P(Ai-I) para 
qualquer j . Assim, pela definição de convergên
cia de séries infinitas, 
P(A) = J~~(P(AI) + [P(A2)- P(AI)J + ... [P(An) - P (An-d
J ) , 
e, então o resultado segue após simplificação. 
Considere agora o caso em que An ! A. Temos agora u
ma seqüência 
monótona não crescente com A1 :) A
2:) A3:) .. ·, de modo que 
00 
_limA; = A= .n A; e também P(A;) é não cre
scente em i por (P3). Tomando os 
...... 00 t=l 
complementares dos A ;' s, recaímos no caso a
nterior de seqüências monótonas 
não decrescentes e o resultado segue sem dificu
ldade. Os detalhes são deixados ao 
leitor. 
O 
Exemplo 1.11: Um dado equilibrado é lançad
o duas vezes e as faces resultantes 
observadas. Um espaço amostrai natural seria 
n = {1, 2, .. ·, 6} x {1 , 2, .. ·, 6} . A 
a-álgebra pode ser o conjunto das partes e Pé
 a probabilidade uniforme em todos 
os pontos de n, isto é, P( { w}) = 1/36. Note que fica mai
s simples considerar 
---- ---- ---- ----
1.3 Probabilidade 
23 
que w = (w1, w2). Dessa forma, o espaço amost
rai é constituído de pares de 
valores, representando os resultados do prim
eiro e do segundo lançamento, 
respectivamente. 
Considere os eventos: 
A : a soma dos resultados é ímpar; 
B : o resultado do primeiro lançamento é ímpar. 
C : o produto dos resultados é ímpar 
Não é díficil obter suas probabilidades, bastand
o contar quantos são os pontos de 
interesse. Para o evento A temos o conjunto de 
pontos {(1, 2) , (1, 4),(1,6),· .. , 
{6, 5)}, totalizando 18 pares e, portanto, temo
s P(A) = 1/2. De modo análogo, 
vem P(B) = 1/2. 
Para a união de A e B, temos 
P(A u B) = 1/2 + 1/2- 1/4 = 3/4, 
uma vez que A n B = { (1, 2), (1, 4), · · ·, (5, 6)} e contém 
9 pares. 
O cálculo da probabilidade da união de A, B e 
C pode ser feito com 
aplicações sucessivas da regra de adição de pr
obabilidades, que é a propriedade 
(P4) apresentada acima. Assim, 
.P(A U B U C)= P[(A UB) U C)] 
= P(A u B ) + P(C)- P[(A U B) n C] 
= P(A) + P(B)- P(A n B ) + P(C)- P[(A n C) U (B n C)] 
= P(A) + P(B)- P(A n B) + P(C)- [P(A nC) + P(BnC
)- P(A n B nC)J 
= P(A) + P(B) + P(C)- P(A n B)- P (A n C)- P(B nC) 
+ P(A n B n C); 
logo, pode-se verificarque P(A U B U C)= 3/4. 
Os cálculos de probabilidade com os even
tos acima poderiam ser 
facilitados se um outro espaço amostrai foss
e utilizado. Considere a seguinte 
alternativa para espaço amostrai 
n1 = {(p, p), (p, i), (i, p), (i, i)}, 
sendo p e i a ocorrência de face par e ímp
ar, respectivamente. A a-álgebra 
poderia continuar sendo o conjunto das partes 
de 0 1 e a probabilidade uniforme
 
continuaria valendo, ou seja, P( { w}) = 1/4 com w
 sendo um dos pares acima. 
O evento A corresponderia ao conjunto {(p,
i),(i,p)} e, de forma 
imediata, teríamos P(A) = 1/2. Deixamos ao leitor a t
arefa de completar os 
cálculos das probabilidades obtidas acima e c
onstatar que podem ser feitos de 
forma bem mais rápida com o novo espaço de
 probabilidade. Entretanto, vale a 
--- --- ---- ---- ---- ---- ----
24 Capitulo 1: Conceitos 
Básicos em Probabilidade 
pena enfatizar que, o espaço amostrai 0 1 não permitiria cal
cular algumas 
probabilidades tais como a de um duplo 6! 
O 
Exemplo 1.12: O Posto de Saúde de um certo bairro coleta informa
ções de seus 
pacientes quanto à ocorrência de várias doenças. Os dados, referentes
 ao último 
ano, indicam 650 atendimentos de crianças com até 2 anos. A
 tabela abaixo 
apresenta, para algumas das doenças atendidas, o número de consu
ltas até a cura, 
ou encaminhamento para outro orgão de saúde. 
Doença\ No. Consultas 1 2 3 4 
Bronquite 35 53 52 46 
Diarréia 84 72 42 20 
Otite 120 85 32 9 
Essa tabela corresponde a uma realização anual do fenômeno al
eatório 
representando o atendimento nesse Posto de Saúde. Se assumirm
os que o que 
ocorreu nesse ano é típico e representa aproximadamente bem a
 realidade em 
bairros similares, podemos usar esses dados para estabeler u
m modelo de 
probabilidade formal para estudar essas características. 
Consideramos como espaço amostrai o conjunto de todas as alter
nativas 
de doença e número de consultas. Denotando cada doença por s
ua letra inicial 
temos I= {b , d , o} como o conjunto das doenças. De modo 
similar seja 
J = { 1, 2, 3, 4} o conjunto possível para o número de consultas. Assim, 
0 = {(x, y): x E I, y E J}. 
O espaço amostra] é finito e consiste de 12 pontos, sendo que cada p
onto é um par 
conforme mencionado acima. Para a-álgebra consideramos o conj
unto das partes 
de n. Para a função de probabilidade P podemos adotar a freqüência relativa das 
ocorrências. Isto é, 
P (( )) = N(x, y), 
x, y 650 
em que N (x, y) é a freqüência do par (x, y). 
Dessa forma, baseado nas suposições feitas, o espaço de probab
ilidade 
(O, F , P ) representa um modelo probabilístico para o fenômeno aleatór
io do 
atendimento de crianças por postos de saúde em certos bairros. 
O atendimento 
modelado ficou restrito às doenças mencionadas e ao máximo de 4
 consultas por 
ocorrência de doença e se refere a uma criança, escolhida ao acas
o, que procura 
esse tipo de Posto de Saúde. 
1.3 Probabilidade 
Considere os seguintes eventos: 
A : a criança só recebe uma consulta; 
B : a criança é atendida por bronquite; 
25 
C : a criança é atendida por alguma doença, exceto diarréia, em 
até 3 consultas; 
D : a criança é atendida com dor de ouvido em 2 ou mais 
consultas. 
Seguindo nosso modelo temos 
35 + 84 + 120 
P(A) = P( {(b, 1), (d, 1), (o, 1)}) = 650 
= O, 37; 
P(B) = P( {(b, 1), (b, 2), (b, 3), (b, 4)}) = 35 + 536;052 + 46 =O, 29; 
( ) ({ 
35 + ... + 32 
P C = P (b , 1), (b, 2), (b, 3), (o, 1), (o, 2), (o, 3)} ) = 650 
= O, 58; 
P(D) = P( {(o, 2), (o, 3), (o, 4)}) = 
85 +6~~ + 
9 = O, 19. 
Com o auxílio das propnedades obtemos, sem dificulda
de, a 
probabilidade de alguns outros eventos: 
P(A U B ) =O, 37 + O, 29- O, 05 = O, 61; 
P( CU D) = O, 58 + O, 19- O, 18 = O, 59; 
P(Ac u C) = O, 63 + O, 58 - O, 34 = O, 87. 
Exemplo 1.13: Limite superior de probabilidades 
o 
Seja {A";n ~ O} uma seqüência de eventos em (n,.r, P), vamos 
verificar que P(limAn ) ~ lim P(A71 ) . 
O limite superior de uma seqüência numérica { x, : n ~ O} é dado por: 
lim sup X 11 = inf sup XA· = lim sup xk. 
71 ~1 k~n n ... :>o k~n 
"" Seja B n = U Ak e observe que a seqüência {B71 : n ~O} é não-
A·= u 
crescente, uma vez que a união tem cada vez um evento a menos. As
sim, 
oc oc 00 
limATI = n U Ak = nBII = limB/1 . 
u = O 1.: = 11 n = O n-+x 
( 
( 
( 
( 
( 
( 
( 
( 
( 
( 
( 
( 
( 
( 
( 
( 
( 
( 
( 
( 
( 
( 
( 
26 Capítulo 1: Conceitos Básicos em Probabilidade 
Temos, então, P(limAn ) = lim P(B .. ) pela continuidade da probabilidade 
n-+:x> 
expressa na propriedade (P6). 
:x; 
Por outro lado, P(Bn) = P( U Ak ) 2: P(Ak), 'r:/k 2: n. Desse modo, 
temos P(B1,) 2: supP(Ak ). 
k~n 
Então, 
k=1l 
P(limA 11 ) = limP(B,. ) 2: limsupP(Ak) = limP(An )· 
n-.oo n-+x k~n 
o 
Em muitas situações, informações preliminares podem alterar as 
probabilidades de eventos. Assim, a probabilidade de chover no final da tarde 
poderia ser diferente se tivermos informações adicionais, tais como a situação 
climática do dia anterior. Vamos, agora, descrever como é possível incorporar 
essas informações de um modo formal. 
Suponha que um experimento é descrito originalmente em termos do 
espaço de probabilidade (0, :F, P). Desejamos discutir como a atribuição original 
de probabilidade aos eventos de :F é afetada pela informação sobre uma 
realização do experimento. 
De fo~a mais precisa, suponha que tenha ocorrido um ponto w 
pertencente a um certo evento B. Seria possível identificar uma classe de eventos, 
subconjuntos de B, e uma função de probabilidade nessa classe, de modo a 
incorporar o efeito da informação de que w E B? 
Seja A E :F um evento qualquer. A única forma dele ocorrer, sabendo-se 
que ocorreu w E B, seria se tivéssemos w E B nA. Assim, é natural considerar 
um novo espaço amostrai B (ver Figura 1.6) com uma nova a-álgebra :F8 com 
todos os conjuntos do tipo B nA para A E :F. A a-álgebra :FB é denominada a 
restrição de :F ao espaço amostrai B. 
A probabilidade original P(A) é a soma de P(A n B) com P(An Bc). 
A informação adicional disponível nos diz que A n nc não pode mais ocorrer. 
Gostaríamos que a nova probabilidade P1(A) fosse proporcional à P(A n B). 
Assim, é intuitivo redistribuir a massa unitária de probabilidade nos conjuntos de 
:FB de modo proporcional às probabilidades que esses conjuntos tinham na antiga 
função de probabilidade P. 
Vamos considerar 
Pt(A) = kP(AnB), 
para todos os eventos A. Observe que P1 ( B) = 1 e, substituindo A por B nessa 
1.3 Probabilidade 
27 
equação, resulta em: 
l =kP(B); 
Se P(B) > O, então k = 1/ P(B). Se P(B) =O, não existe k que possa 
satisfazer as condições que discutimos até agora e nossa argumentação intuitiva 
não valeria. Nesses casos, alguns autores indicam que P1 (A) é indeterminada e 
outros lhe atribuem um valor arbitrário. 
É possível verificar que, para P(B) > O, a função P1 aplicada em 
conjuntos de :F 8 e definida por 
p (A)= P(AnB) 
1 P(B) 
satisfaz os Axiomas de Kolmogorov, sendo assim uma probabilidade. 
A 
B 
Figura 1.6: Restrição ao evento B. 
Desse modo, construímos um novo espaço de probabilidade (B,:FB, Pt ) 
partindo do original (0, :F, P). 
A construção do novo espaço de probabilidade não é essencial e poderia 
ser contornada. Para tal, vamos estender a definição de P1 para todos conjuntos 
A E :F. Isto é feito atribuindo sempre P1(A n Bc) =O, \:IA E :F. Dessa forma, 
( 
28 Capítulo
 1: Conceitos Básicos em Probabilidade 
usando a aditividade de P1. podemos escrever 
c P(AnB) 
P1(A) = P1(A n B) + P1(A n B ) = P(B) · 
Para enfatizar a estreita relação de H com o evento B, é c
onveniente 
alterar a notação de P1(A) para P(AI B) . Toda 
essa argumentação conduz à 
próxima definição. 
Definição 1.3: Probabilidade Condicional 
Considere os eventos A e B em (0, F, P). 
Sendo P(B) > O, a 
probabilidade condicional de A dado que ocorr
eu B, é dada por: 
P(AnB) 
P(AI B) = P(B) ; 
caso P(B) =O, definimos P(AI B) = P(A). 
o 
Convém observar que, nocaso de P(B) =O, alg
uns autores preferem 
igualar a probabilidade condicional a zero ou me
smo considerá-la indefinida. 
Além de servirem como modelagem pa
ra situações práticas, 
probabilidades condicionais podem auxiliar n
o cálculo de probabilidades em 
geral. Existem situações em que desejamos a p
robabilidade de um certo evento 
cuja caracterização não é simples de estabelecer.
 Eventualmente, nesses casos, um 
condicionamento em eventos mais simples po
de ser conveniente e tornar os 
cálculos menos complicados. 
As próximas proposições apresentam expr
essões importantes nas 
operações com probabilidade condicional. 
Proposição 1.2: Regra do Produto de Probabili
dades 
11 
Para os eventos A1, A2, ... , An em (0, F, P), com 
P(n A;) >O, a regra 
i=l 
do produto de probabilidades é dada por: 
P(A1 n A2 ... n A11 ) = P(AI)P(A2I A1) ... P(An)AI n 
A2 ... n An-1)· 
Demonstração: 
Observe que, por hipótese, todos os condicionam
entos do lado direito são 
11 
feitos em eventos com probabilidade positiva, po
is todos eles contém nA;. 
i=l 
------- -- - -- -- --
1.3 Probabilidade 29 
Procedemos por indução. Para n = 2, pela def
inição de probabilidade 
condicional, temos 
P(A1 n A2) 
P(A2I At) = P(A1
) =? P(A1 n A2) = P(A1)P(A2I A1), 
pois P(AI) > O. 
Assim, 
Supomos o resultado válido para n = k e vamos
 prová-lo para k + 1. 
P(A1 n A2 ... n Ak n Ak+l) = P[(A1 n A2 ... n Ak) n Ak+d
 
= P(A1 n A2 ... n Ak) P(Ak+li A1 n A2 ... n Ak) 
= P(At)P(A2I A1) ... P(AkiA1 n A2 ... n Ak-d 
P(Ak+1IA1n ... nAk)· 
E, portanto, a proposição está demonstrada. 
Teorema 1.3: Lei da Probabilidade 'Fotal 
o 
Suponha que os eventos C1 , C2, .•. , Cn em ( n, F , P) forma
m uma 
partição de n e todos têm probabilidade positiva. Então, para qualquer e
vento A 
1l 
P(A) = LP(C;)P(AI Ci). 
i=l 
Demonstração: 
Observe que temos P(C;)P(AI C;)= P(A n C;), pela regra 
do produto 
de probabilidades. Também, para i= 1, 2, · · ·n, os e
ventos A n C; são disjuntos. 
Então, 
n n 
n 
LP(C;)P(AIC;) = LP(AnC;) = P[U(AnC;)]
 = 
i=l i=l 
i=l 
. n 
= P [A n (Uc;) J = P(A) ; 
•=1 
uma vez que a união dos C; 'sé n. o 
---- -------------- -- -- -- --
LI. 
30 
Capítulo I: Conceitos Básicos em Proba
bilidade 
Teorema 1.4: Teorema de Bayes 
Suponha que os eventos Ct, C2, ... , Cn e
stão em (0, F, 'P), formam uma 
partição de O e todos têm probabilidade p
ositiva. Seja A um evento qualquer com 
P(A) >O. Então, para todo j = 1, 2, . .. , n, tem
os 
P( Gil A)= !(AI Ci)P(CJ) . 
I:P(AI C;)P(C;) 
i=l 
Demonstração: 
Na expressão do lado direito, o numera
dor é P(A n CJ) pela regra do 
produto de probabilidades. O denomina
dor é P(A) pela Lei de Probabilidade 
Total. Portanto, pela definição de proba
bilidade condicional, a proposição está 
demonstrada. 
O 
Em geral, na aplicação do Teorema de 
Bayes, conhecemos ou fazemos 
suposições sobre as probabilidades P(A
I C;) e P(C;) para todo i= 1, 2, ... n. 
Uma interpretação dessa fórmula é supo
r que C; (i= 1, · · ·, n) represente uma 
possível causa no resultado de um 
experimento aleatório. Realizado o 
experimento e obtido um resultado A, 
o Teorema de Bayes indica como 
recalcular as probabilidades à priori 
P(C;), i= 1, · · ·, n . As probabilidades 
resultantes, representadas por P(C
d A), i= 1, .. ·, n, são denominadas 
probabilidades à posteriori e podem ser 
usadas para avaliar o quanto cada causa 
C; é responsável pela ocorrência do even
to A. 
Exemplo 1.14: Problema dos Encontro
s (Dudewicz e Mishra [88]) 
Diversas variações desse problema s
ão encontradas em livros de 
probabilidade. Usamos bolas e caixas, 
mas são comuns também versões com 
chapéus, casais e cartas. O problema bási
co pode ser formulado como segue: 
Suponha que bolas numeradas de 1 a 
n são colocadas ao acaso em 
caixas, também numeradas de 1 a n. A b
ola "encontrou" seu lugar correto se fo
i 
çolocada na caixa de mesmo número. O
btenha a probabilidade de todas as bol
as 
irem para caixas erradas. 
O espaço (0, F , 'P) é definido a seguir. O es
paço amostrai O é o conjunto 
de todas as seqüências (i 1, i 2 , ... , Í 11 ), re
presentando os números das bolas que 
foram colocadas nas caixas ordenadas de
 1 a n. A a-álgebra :F é o conjunto das 
partes de O. Para definir 'P assumimos todas 
as seqüências eqüiprováveis. 
------ ----- ------
1.3 Probabilidade 
31 
Seja Ak a ocorrência de bola k na caixa k
, k = 1, 2, ... , n. Esse evento 
corresponde a um encontro em k. A p
robabilidade de interesse é não haver 
nenhum encontro: 
P(todas as bolas em caixas erradas) = 1- P(pelo men
os 1 bola na caixa correta) 
n 
= 1- P( u Ak)· 
k=l 
Pelo Teorema de Poincaré, a probabilida
de da união pode ser calculada 
como 
em que, para cada k = 1, 2, .. ·, n, 8k é def
inido por 
8k = L P(A;IA;2, .. ·, A;k), it? 1 e ik s n. 
it<h<···<ik 
Uma pequena reflexão sobre o número de
 seqüências favoráveis, em cada 
caso, permite escrever 
P(Ak) = (n - ,
1)! => 81 = t P(Ak) = n (n -, 1)! = 1; 
n. k=l n. 
P(A;Aj) = (n -, 2)! => 82 = L P(A;Aj) = (n) (n-
2)! = 1/2; 
n. i<J 2 n! 
P(AiAjAk} = (n -,3)! => 83 =L P(A;AjAk) = (n) (n -,
3)! = 1/3!. 
n. i<j<k 3 
n. 
Não é díficil perceber que, para k = 1, 2, ... , n, temos 
(n- k)' (n) (n- k)l 
P(A;tAiz• .. ·, A;k) = I . e ainda 8k = 
. = 1/k!. 
n. k n! 
Portanto, concluímos 
n 1 1 (-l)n-1 
P( k~IAk)=1-2!+3!- ... + n!. 
N t -x 1 
x2 x3 • 
d -
o e que e = - x + 2f - 3f · · · e, asstm, po emos usar es
sa expressao com 
x = 1 para aproximar a probabilidade acim
a. Desse modo para n grande, vem: 
-- -- - -
32 Capítulo 1: Conceitos Básicos em Probabilidade 
P( Ü Ak) = 1- (1- 1 + ..!._- ..!._ + ... + ( - 1)n ) ~ 1- e-1. 
k=I 2! 3! n! 
Portanto, para a probabilidade de interesse temos: 
P(todas as bolas em caixas erradas) = 1 - P( Ü Ak) ~ e-1 =O, 368. 
k=1 
Vamos apresentar uma outra solução (ver Ross [98]), que calcula a 
probabilidade de não haver encontros através de uma expressão recursiva com o 
condicionamento na primeira ocorrência. 
Introduzimos nova notação que auxiliará o estabelecimento da recursão. 
Seja U o evento de não haver encontros e Pn a sua probabilidade. A primeira bola 
a "escolher" uma caixa pode produzir um encontro, evento que representamos por 
E. Nesse caso, restarão n- 1 bolas e suas n- 1 caixas. Caso ocorra um 
desencontro, isto é, a primeira bola escolheu a caixa de uma outra bola, teremos a 
ocorrência de Ec. Nesse caso, dentre as n - 1 bolas restantes, uma delas não vai 
achar a sua caixa pois ela já foi escolhida! Assim, U pode ser escrito como: 
U =(UnE) u (Un EJC), 
mas U n E = 0, uma vez que U é o evento de todos os desencontros. Então 
Observe que P(Ec) = (n- 1)/n, pois é a probabilidade de desencontro na 
primeira bola. Para o cálculo de P(UI Ec) vamos desenvolver um novo 
argumento. 
Como houve desencontro na primeira ocorrência, temos agora n - 1 
bolas e n - 1 caixas, das quais uma bola e uma caixa não farão encontro pois seus 
respectivos pares já sairam na primeira ocorrência. Denominemos a bola, e 
também a caixa, como extra. A probabilidade que desejamos calcular, dada por 
P(U] Ec), representa a ocorrência de não haver nenhum encontro entre n- 1 
bolas e n - 1 caixas, sendo que existe uma caixa e também uma bola do tipo 
extra. Seu cálculo vai levar em conta as situações excludentes da bola extra ir ou 
não para a caixa extra. 
Sendo F o evento em que a bola extra foi para a caixa extra, temos 
P(U] EJC) = P(U FI Ec) + P(U Fc I EJC). 
Observe que P(F) = P(Fl Ec) = 1/(n- 1). Dado que F ocorre, restam n- 2 
1.3 Probabilidade 33 
bolas e suas respectivas n - 2 caixas e, para o evento U ocorrer, precisamos que 
na atribuição dessas bolas não haja nenhum encontro. Logo, estamos no problema 
inicial de obter desencontros com n- 2 bolas, o qual tem probabilidade Pn-2· Ou 
seja, 
Vamos admitir que a bola extra possa fazer par com a caixa extra. Logo a 
probabilidade condicional de ocorrência simultânea de U e Fc dado Ec, é igual à 
probabilidade de n-1 desencontros, o que é igual a Pn-1· Assim, 
P(UPIEJC) =Pn-1· 
Dessa forma, temos 
P(UI Ec) = Pn-2 ~1 + Pn-1· n-
Então, a probabilidade do evento U pode ser escrita como 
ou, ainda, 
( 
1 )n-1 
P(U) = Pn = Pn-2 n _ 1 + Pn-1 -n- ; 
1 
Pn- Pn-1 = --(Pn-1- Pn-2)· 
n 
Valores iniciais de p11 podem ser calculados pela definição, resultando em P1 = O 
e P2 = 1/2. A partir desses valores e da expressão acima, podemos obter 
recursivamente os outros termos. Não é difícil verificar que, em geral, 
1 1 (-1)11 -1 
Pu = 21 - 31 + ... + --1- ~ e = O, 368; 
. . n. 
conforme obtido anteriormente. o 
Exemplo 1.15: O doente sadio e o sadio doente (DeGroot e Schervich [02]) 
Uma das formas de avaliar a eficiência de um teste para detectar uma 
doença é quantificar a probabilidade de erro. Em geral, testes sofisticados 
envolvem vários procedimentos laboratoriais e diversos equipamentos. 
Denominamos falso-positivo ao erro em que o teste indica positivo para um 
paciente que não tem a doença. Por outro lado, teremos um erro falso-negativo se 
34 Capítulo 1: Conceitos Básicos em Probabilidade 
o teste não acusar a doença num paciente doente. Não é díficil imaginar os 
inconvenientes dessas ocorrências. Os erros originam doentes sadios e sadios 
doentes, isto é, pessoas sadias indicadas como doentes pelo teste e pessoas 
doentes apontadas como sadias. As probabilidades dos erros são calculadas 
condicionalmente à situação do paciente. Seus complementares fornecem as 
probabilidades de acerto do teste, ou seja, a probabilidade de indicar doença para 
os doentes e não doença para os sadios. 
Para fixar as idéias, considere que um determinado teste resulta positivo 
para não doentes, com probabilidade 0,1. Também com probabilidade 0,1, o teste 
será negativo para um paciente doente. As informações fornecidas se referem aos 
erros que podem ser cometidos ao realizar o teste. Se a incidência da doença na 
população é de I para cada I O mil habitantes, qual é a probabilidade de uma 
pessoa estar realmente doente se o teste deu positivo? Observe que, estando ou 
não doente, existe uma probabilidade não nula do teste indicar a presença da 
doença. 
A situação acima ocorre de forma similar em várias áreas e é típica para a 
aplicação do Teorema de Bayes. Definimos os eventos: 
D : a pessoa está doente; 
A : o teste é positivo. 
Assim, as informações disponíveis são as seguintes: 
P(D) = 0,0001; P(Aj De)= 0,1 e P(Acl D) = 0,1. 
Note que, pela propriedade do complementar, temos P(Dc) = 0,9999 e também 
P(AI D) = 0,9. Com a notação utilizada, a probabilidade desejada é P(Dj A) e 
será calculada através do Teorema de Bayes. 
P(AI D)P(D) · 
P(DI A) = P(AI D)P(D) + P(AI Dc)P(Dc) 
0,9 X 0,0001 
0,9 X 0,0001 + 0,1 X 0,9999 
= 0,0009. 
Essa probabilidade é de aproximadamente 1 em 1000. Ela é bastante 
pequena apesar de ser dez vezes maior que a probabilidade da doença na 
população. É interessante notar que a probabilidade calculada depende fortemente 
da eficiência do aparelho. Deixamos ao leitor, a tarefa de refazer os cálculos, 
considerando uma eficiência de 99%, isto é, cada um dos erros é igual a 0,01. O 
1.3 Probabilidade 35 
Em certas farm1ias de eventos do espaço de probabilidade (0, :F, P), a 
função de probabilidade tem uma propriedade particular de grande importância, 
tanto prática quanto teórica. Ela se refere à indiferença no cálculo da 
probabilidade de um evento A frente à informação da ocorrência de um outro 
evento B. É como se não aprendêssemos nada da ocorrência de B, que fosse 
capaz de modificar a probabilidade atribuída ao evento A anteriormente. A 
propriedade, denominada independência de eventos, é definida a seguir. Ela 
permite, muitas vezes, separar o experimento em partes mais simples de serem 
estudadas e, assim, possibilitar uma enorme simplificação nos cálculos 
probabilísticos de interesse. 
Definição 1.4: Independência de Dois Eventos 
Os eventos A e B em (0, :F, P) são independentes se a informação da 
ocorrência de B não altera a probabilidade atribuída ao evento A. Isto é: 
P(Aj B) = P(A); 
a condição de independência pode também ser expressa na seguinte forma 
alternativa e equivalente: 
P(A n B) = P(A)P(B). 
o 
A expressão equivalente, apresentada na definição de independência, é 
muito conveniente para efetuar cálculos e definir outros tipos de independência. 
Por exemplo, diremos que os eventos A e C são condicionalmente independentes 
dado B se P(A n Cl B) = P(AI B) P(CI B). A expressão alternativa também 
será usada para definir independência entre mais de dois eventos. Nesse caso, 
ressaltamos que precisamos considerar a intersecção entre todas as combinações 
dos eventos. 
Definição 1.5: Independência de Vários Eventos 
Os eventos A1, A 2 , ••• , An em (0, :F, P) são independentes se, para toda 
coleção de índices 1 :::; í 1 < í2 < . . . < Ík :::; n e 2 :::; k :::; n, tivermos 
P(A;1 n A;2 n ... n Aik) = P(A;JP(A;2 ) ••• P(A;k). 
o 
36 
Capítulo 1: Conceitos Básicos em Pro
babilidade 
Exemplo 1.16: Problema dos pontos 
(Ross [98]) 
Este problema é histórico no estudo
 de probabilidades e pode ser 
enunciado da seguinte forma: 
Ensaios do tipo sucesso-fracasso são
 realizados de forma independente, 
sendo p a probabilidade de suces
so e 1 - p a de fracasso. Qual 
é a 
probabilidade de ocorrerem n sucesso
s antes de mfracassos? 
A solução apresentada a seguir, atribuíd
a ao matemático Fermat no século 
17, consiste em observar que o event
o { n sucessos antes de m fracassos}
 é 
equivalente a {ocorrem pelo menos
 n sucessos nos primeiros m + n - 1 
ensaios}. Deixamos ao leitor a verificaç
ão dessa eqüivalência. 
Para obter a probabilidade de k sucesso
s em m + n - 1 ensaios, note que 
a ordem da ocorrência dos k sucessos n
ão é importante. Logo pela independên
cia 
entre os ensaios, temos 
} (
m + n- 1) k(1 )m+n-1-k 
P{k sucessos em m + n- 1 ensaios = k 
P - P , 
e, então 
m n- k m+n-1-k m+n-1( + 1) 
P { n sucessos antes de m fracassos} = t; k P ( 1 - P) · 
Diversos outros problemas, mais ou me
nos famosos, envolvem cálculo de 
probabilidades em sequências indepen
dentes de sucesso-fracasso. O leitor p
ode 
consultar Feller [68] para a descrição
 de alguns deles, entre os quais temo
s o 
Problema das Caixas de Fósforos de 
Banach e o Problema de Vencer no Ten
is de 
Mesa. o 
Exemplo 1.17: O problema da namor
ada desconfuula 
João e José disputam um jogo com uma
 moeda equilibrada. Cada jogador 
lança a moeda duas vezes e vence o 
jogo aquele que obtiver dois resultad
os 
iguais. João começa jogando e, se n
ão vencer, passa a moeda para José
 e; 
continuam assim, alternando as jogadas
, até alguém vencer. A namorada de Jo
se 
desconfia da honestidade do jogo e rec
lama que João tem mais probabilidade
 de 
vitória por iniciar o jogo. Por outro l
ado, a namorada de João diz que iss
o é 
besteira pois, como o número de jogada
s pode ser infinito, tanto faz quem com
eça 
jogando. Quem será que tem razão? 
1.3 Probabilidade 
37 
Poderíamos iniciar, imediatamente, os
 cálculos das probabilidades de 
interesse para responder a questão 
proposta. Entretanto, vamos nos de
ter 
buscando formalizar a estrutura do espa
ço de probabilidade, sob a qual estarem
os 
trabalhando. 
Temos aqui um exemplo em que escrev
er o espaço de probabilidade pode 
ser uma tarefa complicada. Os lanç
amentos da moeda são implicitamen
te 
assumidos como independentes, o que
 faz com que a probabilidade de um 
par 
possa ser calculada pelo produto da
s probabilidades do resultado de se
us 
elementos. O mesmo vale se desejarmos
 calcular a probabilidade da ocorrência 
de 
vários pares. Note que, cada jogador fa
z um experimento que consiste em obt
er 
um par de resultados da moeda e o jogo
 prossegue até a vitória de um deles. Is
to 
significa a ocorrência de uma seqüên
cia de pares com elementos diferente
s, 
seguido por um par com elementos igua
is. 
Como nosso interesse é saber se ocorr
eram ou não elementos iguaisno 
par de lançamentos, definimos inicialme
nte um espaço amostrai básico com essa
s 
características. Seja no= {A, Ac}, em qu
e A é a ocorrência de elementos iguais, 
isto é duas caras ou duas coroas. Para o
--álgebra tomamos Fo = {no, 0, A , Ar} e 
atribuímos probabilidade, coerentement
e com o indicado no ínicio do exempl
o, 
através da função Po em que P0 (A) = 1/2
. Assim, para o experimento de cada 
jogador na sua jogada, é suficiente o esp
aço de probabilidade {no, Fo, Po}. 
Como os jogadores se sucedem, repetin
do esse experimento, o espaço de 
probabilidade conveniente será o espaç
o produto que, como o nome sugere, se
rá 
uma espécie de produto de outros espaç
os de probabilidade, idênticos ou não. N
o 
nosso caso, os espaços são todos idênti
cos e o espaço produto será denotado p
or 
{n, F, P}. É preciso cautela na sua const
rução. Descrevemos brevemente como 
isso pode ser feito e indicamos, para
 mais detalhes, textos de Probabilida
de 
Avançada tais como Billingsley [91]. 
O espaço amostrai n é o produt
o cartesiano dos no's, isto é 
n = no X no X . . · . Sendo c a classe de todos os con
juntos da forma 
A1 x A2 x · · ·, com A; E F0 , definim
os F= u(C). Assim, F é a o--álgebra 
gerada pela classe C. Finalmente, 
é possível construir uma função d
e 
probabilidade P sobre F com a propriedade
 de que 
P(AI. A2, · · ·) = lim Po(AI) Po(A2) · · · Po
(An), com (A1, A2 , ···)E :F. 
n-+ex:> 
----------------------------
--------------------------~
 
38 Capítulo 1: Conceitos Básicos em Probabilidade 
De volta ao nosso exemplo. Se João vence na la. jogada, temos o evento 
(A, n0 , no,··· ), cuja probabilidade é dada por 
1 1 
P(A no no ... ) = - X 1 X 1 X ••• = - . , , , 2 2 
Para José vencer na sua segunda tentativa, é preciso que João e José não vençam 
nas suas primeiras jogadas e João também não vença na sua segunda tentativa. 
Assim, 
P( {José vence na 2a. jogada}) = P( X, A c, A c, A, f!o, no,···) = 1
1
6 
· 
Vamos agora resolver a polêmica entre as namoradas. A probabilidade de 
João vencer é dada por 
1 (1)3 (1)5 2 P({Joãovencerojogo})= 2 + 2 + 2 +···='3' 
e, portanto, a namorada de José tem razão em dizer que João tem maior 
probabilidade de vitória. Após saber dessa resposta, ela virou para o seu 
namorado e, num tom desafiador, exclamou "E agora José?" Para ajudá-lo, você 
teria alguma sugestão? Uma moeda com outra probabilidade de cara ajudaria? O 
Exemplo 1.18: Aplicação em Confrabilidade (Feldman e Fox [91]) 
A confiabilidade de um sistema ou componente é a probabilidade que ele 
funcione. Muitos sistemas são construídos com redundâncias nos componentes, 
permitindo alternativas de funcionamento em caso de falha de algum componente. 
Considere um sistema com dois sub-sistemas em série 8 1 e 82 com, 
respectivamente, mt e m2 componentes idênticos em paralelo (ver figura a 
seguir). 
Figura 1.7: Dois Sistemas em Série. 
1.3 Probabilidade 
39 
o evento em que o componente j do sub-sistema si funciona é 
representado por Aii• i = 1, 2 e j = 1, 2, ... , mi. Seja P(Aii) = a; para todo j, 
isto é, a probabilidade de funcionamento de cada componente dentro de um 
mesmo sub-sistema é igual. Desejamos estabelecer valores para o número de 
componentes, de modo a obter uma confiabilidade no sistema de pelo menos "f 
(0 < 'Y < 1). 
Assumimos independência entre os sub-sistemas e entre os componentes 
dentro de cada sub-sistema. Para o sistema funcionar basta que um dos 
componentes de cada sub-sistema funcione. Assim, 
m1 m2 m, m2 
P(Sistema funcione)= P((UAtj) n (UA2j)) = P(UAtj) P(UA2j) ~ 'Y· 
j=l j=l j=l j=l 
Observe que 
m1 m1 m, 
P( UAtj) = 1- P( ( UArjr) = 1- P( nA~j) = 
j=l J="l J=l 
ffii 
= 1- I1P(A1j) = 1- (1- at)m1 ; 
j=l 
e, de modo análogo, 
ffl2 
P( UA2j) = 1- (1- a2)m2. 
j=l 
Então, escolhemos os menores inteiros mr e mz que satisfazem à 
desigualdade 
Se os componentes em cada sub-sistema têm custos diferentes, então isto deve ser 
levado em conta, escolhendo m 1 e m 2 de forma a minimizar também a função 
custo. 
Para ilustrar nossos cálculos, considere componentes com custos iguais 
nos dois sub-sistemas, confiabilidade 'Y = 0,99, a1 = 0,7 e a2 = 0,8. Nesse caso, 
( 
( 
( 
( 
( 
( 
( 
40 Capítulo 1: Conceitos Básicos em Probabilidade 
a condição requerida é 
que pode ser obtida fixando um valor possível de m 1 e variando m 2• O menor 
valor possível para m 1 é 4 que implica na condição 
0,2m2 ~ 0,00192; 
a qual, com auxílio de logaritmos naturais é equivalente a m 2 ~ 3,89. Dessa 
forma, a confiabilidade de 99% está garantida com 4 componentes em cada sub-
sistema. o 
Exemplo 1.19: Probabilidade à priori e à posteriori (DeGroot e Schervich [02]) 
Suponha que uma máquina produza itens defeituosos com probabilidade p 
(O < p < 1) e não defeituosos com probabilidade q = 1 - p . Considere que 
foram selecionados 6 itens escolhidos aleatoriamente da produção e que os 
resultados são independentes. Vamos obter, inicialmente, a probabilidade de dois 
dos 6 itens serem defeituosos. 
. O espaço amostrai é constituído de todas sequências de 6 itens, em que 
cada 1tem pode ser defeituoso ou não. Representamos por Di e N; se o item i é 
defeituoso ou não, respectivamente. Por exemplo, (N1D 2N 3 N 4 D5 N 6 ) representa 
a sequência com itens defeituosos na 2a. e 5a. seleção e não defeituosos nas 
demais. Tendo em vista a independência, sua probabilidade é dada por 
P(N1D2NaN4 D5N 6 ) = p2q4 • 
Essa também será a probabilidade de qualquer sequência que tenha dois 
defeituosos em alguma outra posição. Logo, considerando o número dessas 
sequências, concluímos 
P(Dois defeituosos)= (~)p2q4. 
Suponha agora que a probabilidade p, de item defeituoso, é desconhecida 
mas toma um dos dois valores p = 0,01 (operação normal) ou p = 0,4 (operação 
fora do padrão). Denominamos B 1 e B 2 os eventos correspondentes aos 
funcionamentos normal e fora do padrão, respectivamente. Logo para qualquer i, 
P(D;I Bt) = 0,01 e P(Dd B2) = 0,4. 
1.3 Probabilidade 
41 
A independência entre os resultados se toma agora independência 
condicional. Isto é, para a particular sequência acima mencionada, dada a 
ocorrência de B 1, temos 
Dessa forma, 
P(Dois defeituosos! Bt) = ( ~) 0,012 0,994 = 1,44 x 10-3; 
P(Dois defeituosos! B 2) = ( ~) 0,42 0,64 = 0,311. 
Considere agora que atribuímos probabilidades às escolhas de p. 
Estabelecemos, assim, o que é conhecido como probabilidade à priori para p. 
Essas probabilidades expressam nosso conhecimento quanto ao comportamento 
da máquina e, em geral, são baseadas na experiência anterior. Não é difícil 
imaginar que poderíamos ter mais de- dois valores para p. Em várias situações, a 
atribuição de probabilidades à priori pode envolver uma parcela de subjetividade. 
Assumimos que P(Bt) = 0,9 e P(B2 ) = 0,1. Esses valores indicam a 
probabilidade de funcionamento normal e fora do padrão, respectivamente. 
Se na amostra de 6 itens dois foram defeituosos, qual seria a 
probabilidade posterior para p = 0,01? Em outras palavras, estamos interessados 
em saber qual a probabilidade da máquina estar funcionando normalmente se 
observamos 2 itens defeituosos. 
Pelo Teorema de Bayes segue que 
P(B I D 
. d ç . ) P(Dois defeituosos I B1)P(Bt) 
l OIS e1e1tUOSOS = 2 
2:P(Dois defeituosos I B;)P( Bi) 
í=l 
= 1,44 X 10-
3 
X 0,9 = Ü 04. 
1,44 X 10-3 X 0,9 + 0,311 X 0,1 ' 
Observe o efeito da informação da amostra. A probabilidade à priori de 
B1 era de 0,9. Entretanto, a probabilidade à posteriori sofreu u
ma considerável 
redução e foi calculada em 0,04. Isto reflete o fato da ocorrência de dois itens 
defeituosos ser muito mais provável quando B 2 acontece, do que quando ocorre o 
evento B1. 
O 
42 Capítulo 1: Conceitos Básicos em Probabilidade 
Exemplo 1.20: Independência entre vários eventos 
Considere um alfabeto que tem um total de n letras. Dentre todas as 
palavras formadas com 3 letras escolhemos uma delas, ao acaso. Seja s uma 
particular

Outros materiais