Buscar

Base Teórica de Probabilidade

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 3, do total de 28 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 6, do total de 28 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 9, do total de 28 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Prévia do material em texto

Aula 5
Base Teórica de Probabilidade
Objetivo: Compreender os fundamentos teóricos da Teoria das Probabilidades
para uma justa matematização do acaso e caracterização dos modelos probabilísticos
para os dados coletados.
Nesta aula exporemos os conceitos e os resultados centrais da Teoria das Pro-
babilidades, para que possamos ajustar os dados coletados a um modelo adequado e
assim poder tomar decisões sob incerteza. Nessa medida, não pretendemos esgotar
todas as potencialidades de tratamento deste assunto, que vale por si só como um
curso independente, num módulo à parte. Nossa intenção é apresentar para aqueles
que não tiveram uma exposição à teoria das probabilidades os fundamentos que
nortearão o conceito de distribuições amostrais, conceito este crucial para a parte
inferencial, e os principais equívocos difundidos em sala de aula na disciplina de
probabilidade.
1 Álgebra de Conjuntos
Nessa seção, relembraremos as principais operações envolvendo conjuntos, já que
na linguagem da probabilidade, eventos serão frequentemente descritos através de
uniões, interseções e complementares de conjuntos.
Letras maiúsculas, como por exemplo A, B, ..., Y , Z, representarão conjuntos.
A letra grega 
 representará o conjunto universal em uma situação determinada.
Letras minúsculas a, b, ..., y, z, indicarão elementos desses conjuntos.
A relação de pertencimento será grafada pelo símbolo 2 e escrevemos, por
exemplo a 2 A para indicar que a é membro de A (ou a pertence a A).
O conjunto vazio é representado pelo símbolo ?.
Um conjunto também pode ser descrito por uma propriedade p, comum a todos
os seus elementos, e escrevemos
A = fx j x tem a propriedade pg .
Exemplo 1 A = fx j x = 2k, k = 1; 2; :::g descreve o conjunto dos números in-
teiros pares positivos.
Usaremos o símbolo nA para indicar o número de elementos de um determinado
conjunto A (ou cardinalidade de A).
Diremos que A � B (A está contido em B) se todo elemento de A é também um
elemento de B, e diremos também que A é subconjunto de B. Diremos que A = B,
se A � B e B � A.
1
Se A � B mas existe um elemento b 2 B tal que b =2 A, (b não pertence a A),
diremos que A é um subconjunto próprio de B.
Para mostrar que A não está contido em B, basta exibir um elemento a 2 A tal
que a =2 B.
Proposição 1 ? � A, para qualquer conjunto A.
Prova. Suponha que ? não seja subconjunto de A. Então devemos exibir um
elemento a 2 ? tal que a =2 A. Mas isso é impossível! Então devemos ter ? � A,
pois se uma proposição é falsa, a proposição complementar é verdadeira.
De…nição 1 Dados dois conjuntos A e B indicaremos por A [ B o conjunto dos
elementos que pertencem a A ou a B, isto é, o conjunto dos elementos que pertencem
a pelo menos um dos conjuntos A e B. Este conjunto é chamado união de A com
B.
A [B = f! 2 
 j ! 2 A ou ! 2 Bg.
Extensão: Seja a coleção de conjuntos A1, A2, ..., An. Então
n[
i=1
Ai = f! 2 
 j ! 2 A1 ou ! 2 A2 ... ou ! 2 Ang.
De…nição 2 Dados dois conjuntos A e B, de…nimos o conjunto interseção de A
e B como o conjunto dos elementos que pertencem simultaneamente a A e B, isto é,
A \B = f! 2 
 j ! 2 A e ! 2 Bg.
Extensão: Seja a coleção de conjuntos A1, A2, ..., An. Então
n\
i=1
Ai = f! 2 
 j ! 2 A1 e ! 2 A2 ... e ! 2 Ang.
De…nição 3 Dados dois conjuntos A e B, diz-se que eles são disjuntos, se não
têm elementos comuns, isto é, se A \ B = ?. Por extensão, dada uma coleção de
conjuntos A1, ..., An, dizemos que eles são (mutuamente) disjuntos, ou disjuntos
dois a dois, se Ai \ Aj = ?, para todo i 6= j.
De…nição 4 Dado um conjunto A, de…nimos o conjunto complementar de A o
conjunto dos elementos de 
 que não pertencem a A. Simbolicamente
Ac = f! 2 
 j ! =2 Ag.
De…nição 5 Dados dois conjuntos A e B, de…ne-se o conjunto diferença de A e
B como o conjunto dos elementos de A que não pertencem a B, isto é
A�B = f! 2 
 j ! 2 A e ! =2 Bg
Observe que A�B = A \Bc.
2
A seguir listamos as propriedades mais importantes que relacionam os conceitos
de…nidos anteriormente. Você poderá veri…car cada uma delas tanto por meio da
lógica proposicional, quanto pelo diagrama de Venn.
Dado um conjunto universal 
 e conjuntos A, B e C, os seguintes resultados se
veri…cam:
(i) Para todo conjunto A � 
, A [? = A, A \? = ?.
(ii) A � B se e somente se A [B = B.
(iii) A � B se e somente se A \B = A.
(iv) A [ (B [ C) = (A [B) [ C. (Propriedade Associativa da União)
(v) A \ (B \ C) = (A \B) \ C. (Propriedade Associativa da Interseção)
(vi) A\ (B [C) = (A\B)[ (A\C). (Propriedade Distributiva da Interseção)
(vii) A [ (B \ C) = (A [B) \ (A [ C). (Propriedade Distributiva da União)
(viii) A [ Ac = 
, A \ Ac = ?, ?c = 
, 
c = ?.
(ix) (Ac)c = A.
(x) A � B se e somente se Bc � Ac.
(xi) (A [B)c = Ac \Bc. (Lei de Morgan)
(xii) (A \B)c = Ac [Bc. (Lei de Morgan)
2 De…nições e Resultados Básicos da Teoria das
Probabilidades
Suponha que vamos realizar um experimento cujo resultado não pode ser predito
de antemão, mas cujos possíveis resultados conhecemos. Este conjunto de todos
os resultados possíveis, que denotaremos por 
, é chamado, no contexto da Teoria
das Probabilidades, de espaço amostral do experimento. Assim, temos a seguinte
de…nição:
O conjunto 
 contendo todos os resultados possíveis de um determinado
experimento é chamado de espaço amostral.
Exemplo 2 Se o experimento consiste em lançar uma moeda, então 
 = fCa;Cog,
onde Ca é ”cara”e Co é ”coroa”.
Exemplo 3 Se o experimento consiste em lançar um dado e observar a face supe-
rior, então 
 = f1; 2; 3; 4; 5; 6g.
Exemplo 4 Se o experimento consiste em lançar duas moedas, então
 = f(Ca;Ca); (Ca;Co); (Co;Ca); (Co;Co)g, onde o resultado (a; b) ocorre se a
face da primeira moeda é a e a face da segunda moeda é b.
Exemplo 5 Se o experimento consiste em lançar dois dados e observar as faces
superiores, então
 =
8>>>>>><>>>>>>:
(1; 1) (1; 2) (1; 3) (1; 4) (1; 5) (1; 6)
(2; 1) (2; 2) (2; 3) (2; 4) (2; 5) (2; 6)
(3; 1) (3; 2) (3; 3) (3; 4) (3; 5) (3; 6)
(4; 1) (4; 2) (4; 3) (4; 4) (4; 5) (4; 6)
(5; 1) (5; 2) (5; 3) (5; 4) (5; 5) (5; 6)
(6; 1) (6; 2) (6; 3) (6; 4) (6; 5) (6; 6)
9>>>>>>=>>>>>>;
3
onde o resultado (i; j) ocorre se a face i aparece no primeiro dado e a face j no
segundo dado.
Exemplo 6 Se o experimento consiste em medir a vida útil de um carro, então um
possível espaço amostral consiste de todos os números reais não-negativos, isto é,
 = [0;1).
Qualquer subconjunto A do espaço amostral 
, isto é A � 
,
ao qual atribuímos uma probabilidade, é dito um evento aleatório.
Obviamente, como ? � 
 e 
 � 
, os conjuntos ? e 
 são eventos aleatórios. O
conjunto vazio ? é denominado evento impossível e o conjunto 
 é denominado
evento certo. Se ! 2 
 o evento f!g é dito elementar (ou simples).
Dois eventos A e B são ditos mutuamente exclusivos
ou incompatíveis se A \B = ?.
Observação 1 É importante saber traduzir a notação de conjuntos para a lin-
guagem de eventos: A [ B é o evento ”A ou B”; A \ B é o evento ”A e B” e
Ac é o evento ”não A”.
Observação 2 (Concepção Errônea) Um dos equívocos comumente propagado
pelos livros didáticos e pelos professores é o estabelecimento de uma relação um a
um do experimento com o espaço amostral associado. É preciso ter em mente que
para todo experimento é possível estabelecer uma in…nidade de espaços amostrais,
todos legítimos, pois o espaço amostral deve ser o conjunto que contém todos os
resultados possíveis, mas não há necessidade de que este seja minimal. Assim, se o
experimento consiste em lançar um dado e se observar a sua face superior, podemos
ter 
1 = f1; 2; 3; 4; 5; 6g, 
2 = N e 
3 = (0;1) como espaços amostrais legítimos
para esse experimento. Em todos eles basta atribuir a probabilidade de 1
6
para os
pontos 1; 2; 3; 4; 5 e 6 e probabilidade nula para os demais pontos se houver. Claro
que não há necessidadede se pecar por excesso, se podemos reconhecer o espaço
amostral mínimo, mas isso nem sempre é possível, como o exemplo 6, que se presta
a vários possíveis espaços amostrais e nesse caso pecaremos por excesso e deixaremos
a medida de probabilidade fazer o trabalho de de…nir pontos (ou regiões) de maior e
menor probabilidade.
É preciso lembrar também que toda escolha do espaço amostral induz uma medida
de probabilidade diferente. Por exemplo, se temos uma urna com três bolas brancas
e 2 bolas vermelhas e o experimento consiste em se retirar uma bola e registrar a sua
cor, então poderíamos ter os seguintes espaços amostrais, dentre outros possíveis:
1 = fb; vg e 
2 = fb1; b2; b3; v1; v2g. No primeiro espaço amostral, estaríamos con-
siderando as bolas pretas e vermelhas indistinguíveis entre si e assim o ponto b teria
3
5
de chance e o ponto v teria 2
5
de chance, ou seja, um espaço amostral de elemen-
tos não equiprováveis. No segundo espaço amostral, estaríamos considerando todas
as bolas como distinguíveis e, nesse caso, cada ponto tem a mesma probabilidade
1
5
, construindo assim um espaço amostral de elementos equiprováveis. Portanto, se
o evento for "retirar uma bola branca", então esse evento será dado por fbg pelo
espaço amostral 
1, e fb1; b2; b3g pelo espaço amostral 
2. No entanto, ambos terão
a mesma chance de 3
5
.
4
2.1 De…nição e Propriedades das Probabilidades
Há várias interpretações da probabilidade. Discutiremos as três mais importantes
que todo professor deveria trabalhar em sala de aula, já que há uma tendência nos
livros didáticos de apenas trabalhar o conceito clássico de probabilidade, induzindo
os alunos a sempre tomarem espaços amostrais de elementos equiprováveis e re-
duzindo assim suas possibilidades de tradução de fenômenos aleatórios de outras
naturezas.
(Clássica) Baseia-se no conceito de equiprobabilidade, ou seja, de resultados equiprováveis
(todos os elementos do espaço amostral têm a mesma chance de ocorrer). Seja
A um evento e 
 o espaço amostral …nito, então
P (A) =
nA
n
onde nA é a cardinalidade de A (o número de elementos de A) e n
 a cardi-
nalidade de 
.
Infelizmente nem todos os espaços amostrais para fenômenos aleatórios são …nitos
ou de elementos equiprováveis... Assim, o conceito clássico não dá conta de todas as
estruturas probabilísticas necessárias para a descrição de fenômenos aleatórios. O
conceito a seguir vem suprir um pouco mais essa de…ciência.
(Frequentista) Baseia-se na frequência relativa de um ”número grande” de realizações do
experimento. Seja A um evento, então a probabilidade do evento A é vista
como o limite da taxa de ocorrência do evento A em realizações sucessivas e
independentes do experimento, isto é,
P (A) = lim
n!1
nA
n
onde nA é o número de ocorrências do evento A em n realizações.
O problema agora que surge é a suposição de que possamos reproduzir um ex-
perimento in…nitas vezes para se avaliar a convergência da taxa de ocorrência de um
dado evento, e isso infelizmente não é possível, embora, para certos eventos com-
plexos, possamos lançar mão do computador para simular um número grande de
realizações experimentais e chegar ao resultado aproximado dessa probabilidade...
Assim devemos entender esse conceito num sentido abstrato. Além disso, o lim-
ite acima caracterizado, não pode ser entendido como o conceito clássico de limite
de convergência de uma sequência matemática, já que não podemos garantir com
certeza que a partir de um determinado número de realizações a taxa de ocorrência
do evento entrará numa bola aberta centrada em P (A) e de raio � e jamais sairá
dela...
O conceito seguinte tem grandes implicações numa área de grandes estudos hoje
na Estatística, chamada Inferência Bayesiana, e apenas o citaremos como ilustração
para uma nova interpretação de probabilidade, embora ela não seja útil para esse
curso introdutório, pois trataremos da inferência clássica nesse curso.
5
(Subjetiva) Baseia-se em crenças e/ou informações do observador a respeito do fenômeno
em estudo. Ou seja, o observador/cientista atribui subjetivamente umamedida
de crença para o evento estudado e combina sua crença com as informações
vindas de dados coletados.
Para efeito de discussão em sala de aula, podemos revelar aos nossos alunos o uso
intuitivo que todos nós fazemos da probabilidade à luz de informações obtidas sobre
fenômenos quaisquer. Por exemplo: um médico é capaz de inferir com uma certa
probabilidade a chance de seu paciente ter uma dada patologia à luz dos sintomas
descritos pelo seu paciente e a partir dessa chance indicar esse ou aquele exame
(que também estará sujeito a erro do tipo "falso positivo" ou "falso negativo") para
decidir sobre a operação ou não de seu paciente. (Pense você em outros exemplos
do dia a dia, em que intuitivamente você atribui medidas de crença sobre algo para
em seguida tomar suas decisões pessoais.)
Mais importante agora é construir uma teoria matemática em que nela caibam
todos os conceitos acima descritos. Assim vamos estabelecer os seguintes axiomas
(as regras iniciais da teoria).
Seja 
 um espaço amostral e A um subconjunto de 
. Uma medida de proba-
bilidade P é uma aplicação de argumento A tendo os seguintes propriedades:
A1) P (A) � 0.
A2) P (
) = 1.
A3) (Aditividade …nita) Se A1; A2; :::; An � 
 são disjuntos dois a dois, isto é,
Ai \ Aj = ? para todo i 6= j, então P
�
n[
i=1
Ai
�
=
nX
i=1
P (Ai).
Uma função P satisfazendo os Axiomas 1, 2 e 3 é chamada probabilidade
…nitamente aditiva.
Infelizmente, restringir a probabilidade às uniões …nitas de conjuntos não nos
ajudará a resolver os problemas de interesse na Estatística. Assim devemos esta-
belecer também que se A1; A2; ::: � 
 são disjuntos dois a dois, então P
� 1[
i=1
Ai
�
=
1X
i=1
P (Ai). Essa propriedade é chamada de �-aditividade.
Observação 3 O Axioma 3 é dado em geral nos livros didático como a seguir:
Se A e B � 
 são disjuntos, isto é, A\B = ?, então P (A [B) = P (A)+P (B).
De fato não consideramos pertinente o tratamento da �-aditividade no ensino
médio, pois o aluno ainda não sabe manipular uniões e interseções enumeráveis de
conjuntos. Apenas de…nimos dessa forma, pois todo professor deve estar ciente dos
axiomas fundamentais da Teoria das Probabilidades, concebidos pelo matemático
russo Andrey Nikolaevich Kolmogorov.
Observação 4 O Axioma 3 oferece pedagogicamente uma boa oportunidade para o
professor revelar a relação entre uniões de conjuntos disjuntos e a aritmética da
6
soma de chances. Como união de conjuntos está associada ao conector "ou", e a
chance de A ou B ocorrerem deve ser maior que as chances de A e B isoladas, essa
probabilidade da união se dá pela soma das chances individuais dos eventos.
Com base nos axiomas de probabilidade, podemos demonstrar os seguintes re-
sultados fundamentais da probabilidade.
Teorema 1 P (?) = 0.
Prova. Como 
 = 
 [? e 
 \? = ?, temos pelo Axioma 3, que
P (
) = P (
 [?)
P (
) = P (
) + P (?)
P (;) = 0.
O que o teorema acima a…rma é que o evento impossível tem probabilidade nula.
Observação 5 (Concepção Errônea) Sabemos agora que se A = ; então P (A) =
0. No entanto, a recíproca não é verdadeira, isto é, P (A) = 0 não implica neces-
sariamente que A = ;! Um evento pode ter probabilidade nula e não ser impossível.
Da mesma forma, sabemos pelo Axioma 2 que se A = 
 então P (A) = 1. No
entanto um evento pode ter probabilidade 1 e não ser o evento certo 
. É o que
chamamos em probabilidade de um evento quase-certo.
Vejamos o exemplo a seguir para ilustrar esses fatos.
Exemplo 7 Um experimento consiste em se selecionar um ponto aleatoriamente do
círculo de raio unitário centrado na origem. Então
 =
�
! = (x; y) : x2 + y2 � 1	
Como todo ponto é aleatoriamente escolhido, a probabilidade de um ponto cair numa
regiãodo círculo deveria ser a razão entre a área dessa região e a área do círculo
unitário. Assim, se A � 
, temos
P (A) =
SA
�
,
com SA a área da região de…nida pelos pontos de A. Mas então, todo evento ele-
mentar desse espaço amostral tem probabilidade nula, pois se A = f(a; b)g, então
SA = 0, e consequentemente
P (A) =
0
�
= 0.
No entanto A 6= ?. Além disso, observe que todo experimento terá como um resul-
tado um ponto do círculo unitário, que tinha probabilidade nula antes de ele ocorrer.
Portanto eventos de probabilidade 0 não são necessariamente eventos impossíveis!
Seja agora o evento B como sendo o conjunto de pontos do círculo unitário tais
que a abscissa é diferente da ordenada, isto é, B = f! = (x; y) : x2 + y2 � 1 e x 6= yg.
Naturalmente B é subconjunto próprio de 
. Mas
P (B) =
SB
�
=
�
�
= 1,
7
pois SB (a área da região de…nida pelos pontos de B) equivale à área de 
. Assim
B é um evento quase-certo, pois embora possamos obter um ponto do tipo (a; a) que
não satisfaz ao evento B, a chance de isso ocorrer é nula.
Teorema 2 Para todo A � 
, temos P (Ac) = 1� P (A).
Prova. Como 
 = A [ Ac e A \ Ac = ?, temos pelo Axiomas 2 e 3, que
P (
) = P (A [ Ac)
1 = P (A) + P (Ac)
P (Ac) = 1� P (A).
O que o teorema acima nos informa é que a probabilidade de A não ocorrer é
100% = 1 descontado da chance de A ocorrer.
Teorema 3 Para todo A � 
, temos 0 � P (A) � 1.
Prova. 0 � P (A) vem do Axioma 1. Agora pelo resultado anterior, temos
P (Ac) = 1� P (A) � 0
1� P (A) � 0 =) P (A) � 1.
Teorema 4 Sejam A e B � 
. Se A � B, então
(a) P (B � A) = P (B)� P (A);
(b) P (A) � P (B).
Prova. (a) Como A � B, então podemos escrever
B = A [ (B � A) com A \ (B � A) = ?
P (B) = P [A [ (B � A)]
P (B) = P (A) + P (B � A)
P (B)� P (A) = P (B � A)
(b) Como 0 � P (B � A) = P (B)� P (A), temos
P (B)� P (A) � 0
P (B) � P (A)
Teorema 5 Sejam A e B � 
. Então P (A [B) = P (A) + P (B)� P (A \B).
8
Prova. Primeiramente temos
A [B = A [ (B \ Ac) com A \ (B \ Ac) = ?
Assim
P (A [B) = P [A [ (B \ Ac)]
P (A [B) = P (A) + P (B \ Ac) (1)
Agora, temos
B = (A \B) [ (B \ Ac) com (A \B) \ (B \ Ac) = ?
Assim
P (B) = P [(A \B) [ (B \ Ac)]
P (B) = P (A \B) + P (B \ Ac)
P (B \ Ac) = P (B)� P (A \B) (2)
Substituindo (2) em (1), temos o resultado
P (A [B) = P (A) + P (B)� P (A \B):
Teorema 6 Sejam A, B e C eventos aleatórios. Então P (A [ B [ C) = P (A) +
P (B) + P (C)� P (A \B)� P (A \ C)� P (B \ C) + P (A \B \ C).
Prova. Primeiramente temos
A [B [ C = (A [B) [ C pela associatividade da união.
Assim, pelo teorema anterior, temos
P (A [B [ C) = P [(A [B) [ C]
P (A [B [ C) = P (A [B) + P (C)� P [(A [B) \ C]
P (A [B [ C) = P (A) + P (B)� P (A \B) + P (C)� P [(A [B) \ C] (3)
Mas pela propriedade distributiva, temos
(A [B) \ C = (A \ C) [ (B \ C)
E assim, novamente usando o teorema anterior, temos
P [(A [B) \ C] = P [(A \ C) [ (B \ C)]
P [(A [B) \ C] = P (A \ C) + P (B \ C)� P (A \B \ C) (4)
Agora, substituindo (4) em (3), temos o resultado:
P (A [B [ C) = P (A)+P (B)+P (C)�P (A\B)�P (A\C)�P (B\C)+P (A\B\C).
9
O que o teorema acima nos informa é que a probabilidade da união de três even-
tos é dado pela soma das probabilidades da ocorrência individual deles, retirada da
soma das probabilidades de ocorrerem dois a dois e somada com a chance de eles
ocorrerem concomitantemente. O resultado acima, conhecido como o Princípio da
Inclusão e Exclusão da Probabilidade, pode ser generalizado para n eventos. As-
sim, a probabilidade da união de n eventos será dada pela soma das probabilidades
individuais, menos a soma das probabilidades dois a dois, mais a soma das probabili-
dades dos eventos tomados três a três, menos a soma das probabilidades dos eventos
tomados quatro a quatro, e assim por diante. Assim, quando temos um número par
de eventos a fórmula termina com uma diferença; se o número de eventos é ímpar,
a fórmula termina com uma soma.
Vejamos os seguintes exemplos para ilustrar os resultados obtidos.
Exemplo 8 Uma bola é extraída de uma urna contendo 10 bolas numeradas de 1 a
10. Calcule a probabilidade de que o número da bola extraída seja 3, 4 ou 5.
Solução: O espaço amostral para o experimento de extração de uma única bola
da urna pode ser dado por
 = f1; 2; 3; :::; 10g .
Como a extração é ao acaso, temos
P (f!g) = 1
10
, para todo ! 2 
.
Desejamos a probabilidade do evento A = f3; 4; 5g. Assim, temos
P (A) = P (f3g) + P (f4g) + P (f5g)
=
1
10
+
1
10
+
1
10
=
3
10
,
ou equivalentemente
P (A) =
nA
n
=
3
10
.
Exemplo 9 Suponha que dois dados honestos sejam lançados. Qual a probabilidade
de que a soma dos números seja par?
Solução: O espaço amostral para o experimento de lançamento de dois dados
pode ser dado por
 =
8>>>>>><>>>>>>:
(1; 1) (1; 2) (1; 3) (1; 4) (1; 5) (1; 6)
(2; 1) (2; 2) (2; 3) (2; 4) (2; 5) (2; 6)
(3; 1) (3; 2) (3; 3) (3; 4) (3; 5) (3; 6)
(4; 1) (4; 2) (4; 3) (4; 4) (4; 5) (4; 6)
(5; 1) (5; 2) (5; 3) (5; 4) (5; 5) (5; 6)
(6; 1) (6; 2) (6; 3) (6; 4) (6; 5) (6; 6)
9>>>>>>=>>>>>>;
ou na forma sintética
 = f! = (!1; !2) : !i 2 f1; 2; :::; 6g ; i = 1; 2g .
10
Como os dados são honestos, temos
P (f!g) = 1
36
, para todo ! 2 
.
Desejamos avaliar a probabilidade do evento A: "soma par das faces é obtida". As-
sim
A = f! = (!1; !2) 2 
 : !1 + !2 2 f2; 4; :::; 12gg
Para que a soma seja par, devemos ter as duas faces pares ou as duas faces ímpares.
Como há 3 escolhas de face par para o primeiro dado e 3 escolhas para a face par do
segundo dado. Assim há 3� 3 = 9 resultados com soma das faces par com as duas
faces pares. Pelo mesmo raciocínio, temos 3 escolhas de face ímpar para o primeiro
dado e 3 escolhas para a face ímpar do segundo dado. Assim há 3�3 = 9 resultados
com soma das faces par com as duas faces ímpares. Assim, temos
nA = 3� 3 + 3� 3 = 9 + 9 = 18:
Portanto
P (A) =
nA
n
=
18
36
=
1
2
.
Exemplo 10 Sete pessoas entram juntas num elevador no andar térreo de um
edifício de 10 andares. Suponha que os passageiros saiam independentemente e de
maneira aleatória com cada andar (1; 2; :::; 10) tendo a mesma probabilidade de ser
selecionado. Qual a probabilidade de que todos saiam em andares diferentes?
Solução: O espaço amostral para o experimento de saídas aleatórias das sete
pessoas é dado pelas diversas escolhas dos andares pelas sete pessoas envolvidas.
Assim
 = f! = (!1; !2; :::; !7) : !i 2 f1; 2; :::; 10g ; i = 1; 2; :::7g ,
com !i representando o andar que a pessoa i escolhe para sair. Assim, havendo 10
escolhas possíveis para cada pessoa, o número de con…gurações de saídas será dado
por
n
 = 10� 10� :::� 10| {z }
7 parcelas
= 107
Como as escolhas são aleatórias, temos
P (f!g) = 1
107
, para todo ! 2 
.
Seja o evento A: "todos saem em andares diferentes". Assim
A = f! = (!1; !2; :::; !7) 2 
 : !i 6= !j;8i 6= jg
Assim, para que todos saiam em andares diferentes, há 10 escolhas possíveis para
primeira pessoa, 9 escolhas possíveis para segunda pessoa, 8 escolhas possíveis para
terceira pessoa, ..., 4 escolhas possíveis para sétima pessoa. O número de con…gu-
rações de saídas diferentes será dado por
nA = 10� 9� 8� 7� 6� 5� 4
11
Assim
P (A) =
nA
n
=
10� 9� 8� 7� 6� 5� 4
107
=
60:480
1:000:000
P (A) = 0; 06048
P (A) = 6; 048%
Exemplo 11 De uma dada população, 35% têm olhos azuis, 42% são ruivos e 20%
são ruivos de olhos azuis. Escolhido ao acaso uma pessoa dessa população, qual a
probabilidade de:
(a) ser ruivo ou ter olhos azuis?
(b) não ser ruivo e nem ter olhos azuis?
(c) ser ruivo mas não ter olhos azuis?
Solução: O espaço amostral para o experimento deveria conter os possíveis
registros duplos de cor dos olhos e cor dos cabelos. Assim, de…nindo a paraolhos
azuis, �a para olhos não azuis, r para ruivo e �r para não ruivo, temos os seguintes
resultados do experimento:
 = f(a; r) ; (a; �r) ; (�a; r) ; (�a; �r)g
Sejam os eventos A "a pessoa escolhida tem olhos azuis" e R "a pessoa escolhida é
ruiva". Assim temos
A = f(a; r) ; (a; �r)g , R = f(a; r) ; (�a; r)g e A \R = f(a; r)g
Temos, pelos dados fornecidos,
P (A) = 0; 35, P (R) = 0; 42 e P (A \R) = 0; 2.
Observe que os quatro elementos do espaço amostral não são equiprováveis, já que so-
mente o par (a; r) tem 20% de chance e não 25%, caso os elementos fossem equipro-
váveis.
(a) Desejamos a probabilidade do evento A [R, ser ruivo ou ter olhos azuis.
P (A [R) = P (A) + P (R)� P (A \R)
= 0; 35 + 0; 42� 0; 2
= 0; 57
P (A [R) = 57%.
(b) Desejamos a probabilidade do evento Ac\Rc, não ser ruivo nem ter olhos azuis.
P (Ac \Rc) = 1� P [(Ac \Rc)c]
= 1� P (A [R)
= 1� 0; 57
P (Ac \Rc) = 43%.
12
(c) Desejamos a probabilidade do evento Ac \R, ser ruivo mas não ter olhos azuis.
Mas
Ac \R = R� (A \R) , com A \R � R.
Assim temos
P (Ac \R) = P [R� (A \R)]
= P (R)� P (A \R)
= 0; 42� 0; 2
P (Ac \R) = 22%.
2.2 Probabilidade Condicional
Em Ciência, informação é o material mais precioso que existe. Quanto mais infor-
mação dispomos de determinados fenômenos, mais acurados serão nossos modelos
e nossos cálculos de probabilidade. É nesse sentido que surge o conceito de pro-
babilidade condicional: como reavaliar a chance de um evento A ocorrer dado que
sabemos que um outro evento B ocorreu? Por exemplo, suponha o lançamento de
um dado honesto, isto é 
 = f1; 2; 3; 4; 5; 6g. Seja o evento A = f2; 4; 6g, "cair
número par". Então, se nada soubermos sobre o experimento, temos que
P (A) =
nA
n
=
3
6
=
1
2
= 50%.
Suponha agora que tendo realizado o experimento, alguém nos diga que um
número primo foi obtido. Assim sabemos que o evento B = f2; 3; 5g ocorreu. Qual
é a chance agora de A ter ocorrido? Temos agora apenas 1 chance em 3. Ou seja
P (A dado que B ocorreu) =
nA\B
nB
=
# f2g
# f2; 3; 5g =
1
3
�= 33; 33%.
Assim a chance de A se reduz de 50% para 33,33% quando sabemos que um
número primo ocorreu.
Utilizaremos a notação P (A j B) para signi…car a probabilidade da ocorrência do
evento A à luz da informação de que o evento B ocorreu. Assim, temos a seguinte
de…nição: Seja 
 um espaço amostral e seja B � 
 com P (B) > 0.
A probabilidade condicional de A dado B é de…nida por
P (A j B) = P (A \B)
P (B)
, para A � 
.
Para que a probabilidade acima esteja bem de…nida, devemos ter P (B) > 0, daí
a exigência dessa condição.
Cabe aqui justi…car a fórmula acima aos nossos alunos, fazendo um apelo ao con-
ceito clássico de probabilidade. Suponha um espaço amostral …nito 
 de elementos
equiprováveis com cardinalidade n
. Sejam A e B dois eventos de cardinalidades
nA e nB, respectivamente. Então dado que B ocorreu, B se torna agora um novo es-
paço amostral, pois apenas elementos de B podem ter ocorrido. Assim, deveríamos
13
saber quantos elementos de B favorecem à ocorrência do evento A, mas isso equiv-
ale a contar quantos elementos há em A \B. Assim, como vimos anteriormente no
exemplo do dado, temos
P (A j B) = nA\B
nB
=
nA\B
n
nB
n
=
P (A \B)
P (B)
,
pois P (A \B) = nA\B
n
e P (B) =
nB
n
.
É preciso observar que todos os resultados vistos concernentes à probabilidade
não-condicional valem também para a probabilidade condicional, em outras palavras,
a probabilidade condicional é também uma medida de probabilidade. Assim, dado
que B ocorreu, temos também, por exemplo, que
P (Ac j B) = 1� P (A j B).
Exemplo 12 Certo experimento consiste em lançar um dado equilibrado duas vezes,
independentemente.
(a) Qual a probabilidade de que a soma das faces seja 6?
(b) Dado que os dois números extraídos sejam diferentes, qual é a probabilidade
agora de a soma dos números ser 6?
Solução: O espaço amostral para o experimento é dado por
 = f! = (!1; !2) : !i 2 f1; 2; :::; 6g ; i = 1; 2g .
Como o dado é honesto, temos
P (f!g) = 1
36
, para todo ! 2 
.
(a) Desejamos avaliar a probabilidade do evento A: "soma das faces é 6". Assim
A = f! = (!1; !2) 2 
 : !1 + !2 = 6g
A = f(1; 5) ; (5; 1) ; (2; 4) ; (4; 2) ; (3; 3)g
nA = 5.
Portanto
P (A) =
nA
n
=
5
36
.
(b) Seja B o evento "os números extraídos são diferentes". Então
B = f! = (!1; !2) 2 
 : !1 6= !2g
Como há 6 escolhas possíveis para o primeiro lançamento e 5 escolhas possíveis para
o segundo lançamento, já que a segunda face deve ser diferente da primeira face,
temos
nB = 6� 5 = 30.
Portanto,
P (B) =
nB
n
=
30
36
=
5
6
.
14
Seja agora o evento A \B "a soma dos números é 6 e os números são diferentes".
Então
A \B = f(1; 5) ; (5; 1) ; (2; 4) ; (4; 2)g
nA\B = 4,
e assim
P (A \B) = nA\B
n
=
4
36
=
1
9
.
Finalmente, temos
P (A j B) = P (A \B)
P (B)
=
1
9
5
6
=
1
9
� 6
5
P (A j B) = 2
15
.
Observe que de fato, dado que B ocorreu, então temos apenas 4 casos favoráveis a
A dentre os 30 possíveis agora com o conhecimento de que B se deu, daí 4
30
= 2
15
.
Vemos também que, quando nada sabemos sobre o experimento, a probabilidade de
soma 6 é de 5
36
; no entanto em face à informação de que B ocorreu essa probabilidade
passa a 2
15
, que embora próxima não é a mesma.
Teorema 7 Sejam A;B � 
 com P (A) > 0 e P (B) > 0. Então
P (A \B) = P (B):P (A j B)
= P (A):P (B j A)
Prova. Pela de…nição de probabilidade condicional temos
P (A j B) = P (A \B)
P (B)
=) P (A \B) = P (B):P (A j B) e
P (B j A) = P (A \B)
P (A)
=) P (A \B) = P (A):P (B j A).
Observação 6 O teorema acima é extremante útil pedagogicamente para justi…car
perante os alunos, por que a aritmética associada à interseção de eventos é dada pela
operação de multiplicação. Como a chance de dois eventos A e B ocorrerem simul-
taneamente deve ser potencialmente menor que a chance individual desses eventos e
como o produto de dois números entre 0 e 1 é sempre inferior aos fatores envolvidos
(a menos que algum deles seja 0 ou 1), a probabilidade de dois eventos ocorrerem
simultaneamente será calculada como um produto de duas probabilidades, conforme
o teorema anterior. Portanto, é necessário deixar claro aos alunos que o conector
"e" associado a eventos será traduzido aritmeticamente como produtos de chances,
enquanto que o conector "ou" se associa à aritmética da soma.
Teorema 8 Para quaisquer A, B e C, eventos aleatórios, temos: P (A \ B \ C) =
P (A):P (B j A):P (C j A\B), se as probabilidades condicionais estão bem de…nidas.
15
Prova. Pela propriedade associativa da interseção, temos
A \B \ C = (A \B) \ C.
Assim, valendo-se do teorema anterior para dois conjuntos, temos
P (A \B \ C) = P [(A \B) \ C]
= P (A \B):P (C j A \B)
= P (A):P (B j A):P (C j A \B).
Observação 7 Podemos estender o resultado anterior para qualquer quantidade
de eventos. Assim, para todo A1; A2; :::; An � 
, temos P (A1 \ A2 \ ::: \ An) =
P (A1):P (A2 j A1):P (A3 j A1 \A2):::P (An j A1 \A2 \ :::An�1), se as probabilidades
condicionais estão bem de…nidas.
Exemplo 13 Selecionar três cartas sem reposição ao acaso. Qual a probabilidade
de se retirar 3 reis.
Solução: Sejam os eventos K1, K2 e K3 rei é obtido na primeira, segunda e
terceira extrações, respectivamente. Desejamos
P (K1 \K2 \K3) = P (K1):P (K2 j K1):P (K3 j K1 \K2)
Mas como há 4 reis num baralho de 52 cartas, temos:
P (K1) =
4
52
, P (K2 j K1) = 3
51
e P (K3 j K1 \K2) = 2
50
.
P (K1 \K2 \K3) = 4
52
:
3
51
:
2
50
P (K1 \K2 \K3) = 1
5:525
.
2.3 Independência
Independência é um conceito fundamental em Probabilidade e Estatística, já que
muitos dos modelos utilizados na Estatística supõem observações de variáveis aleatóriasindependentes. Diremos que dois eventos A e B são independentes, se a informação
a respeito de que um deles ocorreu não altera a chance de o outro ocorrer, ou seja, a
informação dada não contribui para a reavaliação do outro evento dado. Em notação
matemática, dizemos então que A e B são independentes se
P (A j B) = P (A)
ou, equivalentemente,
P (B j A) = P (B) .
16
Como consequência, temos
P (A j B) = P (A \B)
P (B)
= P (A) =) P (A \B) = P (A):P (B)
P (B j A) = P (A \B)
P (A)
= P (B) =) P (A \B) = P (A):P (B)
Ou seja:
Dois eventos A e B são ditos (estocasticamente) independentes
se P (A \B) = P (A):P (B).
Observação 8 É preciso ressaltar aos alunos que a fórmula P (A\B) = P (A):P (B)
só poderá ser utilizada se houver garantia de independência entre A e B, do contrário,
a fórmula geral a ser utilizada é dada por P (A \B) = P (A):P (B j A).
Observação 9 (Concepção Errônea) Um erro muito comum entre os alunos é
associar independência com disjunção de eventos, interpretando erroneamente que
se A e B são independentes, então A \ B = ?. É justamente o contrário que se
dá, ou seja, se A \ B = ?, então A e B não são independentes (a menos que um
deles tenha probabilidade zero). Isso …ca claro se pensarmos que P (A) = p > 0 e
P (B) = q > 0 com A \B = ?. Assim, neste caso, teremos
P (A j B) = P (A \B)
P (B)
=
P (?)
P (B)
=
0
q
= 0 6= p = P (A) .
Assim P (A j B) 6= P (A), o que prova que A e B não são independentes!
Outra maneira de justi…car esse fato é pensar que se A e B não têm nada em
comum, então se um deles ocorre a probabilidade de o outro ocorrer é inevitavelmente
nula, o que reduz uma chance inicial desse outro evento ocorrer a zero. Ou seja,
para que dois conjuntos sejam independentes eles necessitam potencialmente ter algo
em comum, do contrário serão dependentes.
Outro problema de má interpretação do conceito de independência de eventos
com a disjunção decorre de uma má caracterização do espaço amostral como no
exemplo a seguir.
Exemplo 14 Um dado e uma moeda honestos são lançados sucessivamente e seus
resultados são registrados. Qual a probabilidade de se obter um número primo e uma
face cara?
Solução: O espaço amostral para o experimento pode ser
 = f! = (!1; !2) : !1 2 f1; 2:::; 6g e !2 2 fca; cogg
Como há 12 elementos equiprováveis (pois tanto o dado quanto a moeda são hon-
estos), temos que
P (f!g) = 1
12
.
17
Sejam os eventos A: "número primo é retirado no dado" e B: "a face cara é
obtida na moeda". Desejamos
P (A \B) = P (f2; 3; 5g � fcag)
= P (f(2; ca); (3; ca); (5; ca)g)
=
3
12
=
1
4
= P (A)P (B)
=
3
6
� 1
2
O aluno então diz: "Viu, porfessor, eles são independentes e disjuntos, pois
A = f2; 3; 5g e B = fcag e A\B = ?!" Onde o aluno se equivoca? Na caracterização
dos eventos A e B, pois o experimento consiste no lançamento de dado e moeda,
assim estabelecido o espaço amostral corretamente acima, temos que
A = f(2; ca); (2; co); (3; ca); (3; co); (5; ca); (5; co)g
e
B = f(1; ca); (2; ca); (3; ca); (4; ca); (5; ca); (6; ca)g
e de fato
P (A) =
6
12
=
1
2
, P (B) =
6
12
=
1
2
e P (A \B) = P (A)P (B) = 1
4
.
Ou seja, A e B são independentes, mas não são disjuntos, pois
A \B = f(2; ca); (3; ca); (5; ca)g 6= ?.
Teorema 9 Se A e B são independentes, então A e Bc também são independentes
(e também Ac e B, e ainda Ac e Bc).
Prova. Por hipótese, temos P (A \B) = P (A):P (B). Mas
P (A \Bc) = P (A)� P (A \B)
= P (A)� P (A):P (B) (pela hipótese de independência)
= P (A) [1� P (B)]
P (A \Bc) = P (A) :P (Bc) (A e Bc são independentes)
Para Ac e B, o raciocínio é o mesmo. Agora sejam Ac e Bc.
P (Ac \Bc) = 1� P [(Ac \Bc)c]
= 1� P (A [B)
= 1� P (A)� P (B) + P (A \B)
= 1� P (A)� P (B) + P (A):P (B)
= [1� P (A)]� P (B) [1� P (A)]
= [1� P (A)] [1� P (B)]
P (Ac \Bc) = P (Ac) :P (Bc) (Ac e Bc são independentes)
18
O que o teorema acima nos informa é que se A e B são dois eventos indepen-
dentes, então a propriedade de independência se estende para os complementares
dos conjuntos.
É preciso, no entanto, diferenciar o conceito de independência dois a dois de
eventos, com o conceito de dependência coletiva. Vejamos os dois conceitos:
Os eventos aleatórios Ai, i 2 I (I um conjunto de índices), são independentes
dois a dois (ou a pares) se P (Ai \ Aj) = P (Ai):P (Aj) para todo i; j 2 I, i 6= j.
Os eventos aleatórios A1; :::; An (n � 2), são (coletiva ou estocasticamente)
independentes se P (Ai1 \ Ai2 \ ::: \ Aim) = P (Ai1):P (Ai2):::P (Aim),
1 � i1 < i2 < ::: < im � n, e para todo m = 2; 3; :::; n.
Assim, pela de…nição acima, só podemos a…rmar, por exemplo, que A, B e C
são independentes, se eles são independentes 2 a 2 e 3 a 3, isto é, vale a regra do
produto
P (A \B) = P (A):P (B),
P (A \ C) = P (A):P (C),
P (B \ C) = P (B):P (C) e
P (A \B \ C) = P (A):P (B):P (C).
Para quatro eventos, a regra do produto deve valer para o nível 2 a 2, 3 a 3 e 4
a 4; e assim sucessivamente para maior número de eventos.
Observação 10 (Concepção Errônea) Um erro muito comum é achar que in-
dependência a pares implica independência coletiva. Isso não vale necessariamente!
Tampouco vale dizer que se a regra do produto vale no maior nível então ela vale
para os níveis mais baixos.
O exercício a seguir ilustra isso.
Exemplo 15 Suponha um tetraedro regular com faces marcadas 1, 2, 3 e 4. Seja
o experimento de jogar o tetraedro e observar a face justaposta à mesa. Sejam
os eventos A = f1; 4g, B = f2; 4g e C = f3; 4g. Veri…que que A, B e C são
independentes dois a dois, mas não são coletivamente independentes.
Solução: O espaço amostral para o experimento é dado por 
 = f1; 2; 3; 4g e
P (fwg) = 1=4 para todo w 2 
, pois o tetraedro é regular. Assim temos
P (A) = P (B) = P (C) =
1
2
.
P (A \B) = P (f4g) = 1
4
=
1
2
� 1
2
= P (A) :P (B)
P (A \ C) = P (f4g) = 1
4
=
1
2
� 1
2
= P (A) :P (C)
P (B \ C) = P (f4g) = 1
4
=
1
2
� 1
2
= P (B) :P (C)
19
Assim A, B e C são independentes dois a dois. No entanto,
P (A \B \ C) = P (f4g) = 1
4
e
P (A):P (B):P (C) =
1
2
� 1
2
� 1
2
=
1
8
.
E assim
P (A \B \ C) = 1
4
6= 1
8
= P (A):P (B):P (C).
Logo A, B e C não são independentes.
Exemplo 16 Perguntou-se através de uma amostra de 600 adultos em três cidades
do sudeste brasileiro (Rio de Janeiro - RJ, São Paulo - SP e Minas Gerais - MG),
se eles eram favoráveis ou não à volta da CPMF e os seguintes resultados foram
obtidos, no domínio da frequência.
RJ SP MG Total
Favor 90 54 36 180
Contra 210 126 84 420
Total 300 180 120 600
Denotando por R, S e M os eventos "a pessoa selecionada é do Rio, São Paulo
e Minas, respectivamente"; e por F e C, "a pessoa selecionada é a favor e contra a
volta da CPMF, respectivamente", veri…que se as categorias ser ou não a favor são
independentes dos estados do sudeste no estudo.
Solução: Precisamos montar uma tabela com a frequência relativa observada.
Assim, temos o seguinte resultado:
RJ SP MG Total
Favor 90
600
= 0; 15 54
600
= 0; 09 36
600
= 0; 06 180
600
= 0; 3
Contra 210
600
= 0; 35 126
600
= 0; 21 84
600
= 0; 14 420
600
= 0; 7
Total 300
600
= 0; 5 180
600
= 0; 3 120
600
= 0; 2 600
600
= 1
Assim, temos por exemplo: P (F ) = 0; 3, P (M) = 0; 2, P (R \ C) = 0; 35, e
assim por diante. Para que as categorias ser ou não a favor sejam independentes
dos estados do sudeste no estudo devemos ter a regra do produto das probabilidades
validada.
P (R \ F ) = 0; 15 = 0; 5� 0; 3 = P (R) :P (F )
P (R \ C) = 0; 35 = 0; 5� 0; 7 = P (R) :P (C)
P (S \ F ) = 0; 09 = 0; 3� 0; 3 = P (S) :P (F )
P (S \ C) = 0; 21 = 0; 3� 0; 7 = P (S) :P (C)
P (M \ F ) = 0; 06 = 0; 2� 0; 3 = P (M) :P (F )
P (M \ C) = 0; 14 = 0; 2� 0; 7 = P (M) :P (C)
Vemos que a regrado produto vale para todo cruzamento das categorias Fa-
vor/Contra com Estados, o que prova haver independência entre a opinião e estado.
20
Cabe aqui ressaltar que poderíamos averiguar no domínio da frequência observando,
se por exemplo no caso R e F, temos
nR\F =
nR � nF
n
o que se comprova, já que nR\F = 90, nR = 300 e nF = 180, e
nR\F = 90 =
300� 180
600
=
nR � nF
n
e assim por diante nos outros casos. Guarde bem essa maneira de averiguar in-
dependência, pois nos servirá mais tarde para justi…car um teste estatístico muito
importante para se averiguar relação de dependência entre variáveis categóricas.
Terminaremos nossa aula com dois resultados básicos importantes da Teoria das
Probabilidades: o Teorema da Probabilidade Total e o Teorema de Bayes. Para isso,
necessitaremos da seguinte de…nição:
Uma partição de 
 é uma família de conjuntos A1, A2, ..., An tais que
n[
i=1
Ai = 
 e Ai \ Aj = ?, para todo i 6= j.
Ou seja, os conjuntos A1, A2, ..., An são disjuntos dois a dois e a sua união
recompõe o conjunto 
. Dizemos também que 
 foi particionado pelos conjuntos
A1, A2, ..., An.
Partição do Espaço Amostral
Com isso, vemos, pelo diagrama abaixo, que para todo evento B � 
 temos
B =
n[
i=1
(Ai \B) = (A1 \B) [ ::: [ (An \B) .
com (Ai \B)\ (Aj \B) = ?, para todo i 6= j, pois como os Ai são disjuntos, então
os Ci = Ai \B são também disjuntos.
21
Teorema da Probabilidade Total
Com isto podemos demonstrar os seguintes teoremas:
Teorema 10 (Teorema da Probabilidade Total) Se a sequência de eventos
aleatórios A1, A2, ..., An formar uma partição de 
, então
P (B) =
nX
i=1
P (Ai):P (B j Ai)
para todo B � 
.
Prova. Pelo exposto, acima, vimos que B =
n[
i=1
(Ai \B) com (Ai \B) \
(Aj \B) = ? para todo i 6= j. Assim, temos
P (B) = P [(A1 \B) [ ::: [ (An \B)]
= P (A1 \B) + :::+ P (An \B)
P (B) = P (A1):P (B j A1) + :::+ P (An):P (B j An),
Teorema 11 (Fórmula de Bayes) Se a sequência de eventos aleatórios A1, A2,
..., An formar uma partição de 
, então
P (Ai j B) = P (Ai)P (B j Ai)nX
j=1
P (Aj):P (B j Aj)
.
Prova. Pela de…nição de probabilidade condicional, temos
P (Ai j B) = P (Ai \B)
P (B)
=
P (Ai)P (B j Ai)
P (B)
22
Mas, pelo Teorema da Probabilidade Total, temos P (B) = P (A1):P (B j A1) + :::+
P (An):P (B j An), e assim
P (Ai j B) = P (Ai)P (B j Ai)
P (A1):P (B j A1) + :::+ P (An):P (B j An)
P (Ai j B) = P (Ai)P (B j Ai)nX
j=1
P (Aj):P (B j Aj)
.
Há uma forma melhor de entender os Teoremas da Probabilidade Total e de
Bayes, a partir da construção de um diagrama de árvores, respeitando-se a cronologia
dos eventos, sem passar pelas fórmulas acima. Vejamos os exemplos a seguir para
ilustrar esses resultados.
Exemplo 17 Depois de ser assaltada, uma loja decide instalar um alarme. Se hou-
ver assalto numa noite, o alarme dispara com probabilidade 0; 99, mas pode acontecer
um alarme falso (um rato passa pelo alarme!) com probabilidade 0; 005. Se a pro-
babilidade de ocorrer um assalto numa noite é 0; 002, pede-se:
(a) Qual a probabilidade de o alarme não disparar numa dada noite?
(b) Qual a probabilidade de ter havido um assalto, se o alarme não tocou?
Solução: Precisamos inicialmente de…nir os eventos relacionados com o pro-
blema dado. De…namos os eventos A "há um assalto na loja" e D "o alarme dis-
para". Assim temos:
P (A) = 0; 002 e P (Ac) = 0; 998;
P (D j A) = 0; 99 e P (Dc j A) = 0; 01;
P (D j Ac) = 0; 005 e P (Dc j Ac) = 0; 995.
O diagrama em árvore é dado a seguir, levando-se em conta que o evento A é
cronologicamente anterior ao evento D.
23
(a) Desejamos P (Dc). Mas o alarme não dispara em duas situações: ou há um
assalto e ele não dispara; ou não há um assalto e ele não dispara. Assim, temos
P (Dc) = P [(A \Dc) [ (Ac \Dc)]
= P (A \Dc) + P (Ac \Dc)
P (Dc) = P (A)P (Dc j A) + P (Ac)P (Dc j Ac)
o que equivale o Teorema da Probabilidade Total com B = Dc e A1 = A e A2 = Ac.
Assim
P (Dc) = 0; 002� 0; 01 + 0; 998� 0; 995
= 0; 00002 + 0; 99301
P (Dc) = 0; 99303.
Vemos que o Teorema da Probabilidade Total é utilizado quando desejamos avaliar
a probabilidade de um evento que se situa numa segunda fase de uma estrutura
cronológica, quando não sabemos o que aconteceu na primeira fase do experimento
(houve ou não assalto?). Vemos também que a probabilidade do evento Dc é dado
pela soma das probabilidades situadas nos ramos �D.
(b) Desejamos agora calcular P (A j Dc), ou seja, conhecemos o evento da se-
gunda fase e desejamos calcular a probabilidade de um evento da primeira fase (como
um olhar ‡asback no tempo). Pela de…nição de probabilidade condicional, temos:
P (A j Dc) = P (A \D
c)
P (Dc)
=
P (A)P (Dc j A)
P (A)P (Dc j A) + P (Ac)P (Dc j Ac)
que é a fórmula do Teorema de Bayes para B = Dc e A1 = A e A2 = Ac. Assim
P (A j Dc) = 0; 002� 0; 01
0; 002� 0; 01 + 0; 998� 0; 995 =
P (A j Dc) �= 0; 00002014.
Vemos assim que o Teorema de Bayes é usado quando desejamos calcular a prob-
abilidade de um evento que poderia ser uma possível fonte causal para um evento
observado no presente ou futuro. Vemos também que a probabilidade condicional
P (A j Dc) = P (A \D
c)
P (Dc)
, poderia ser calculada tomando no numerador a probabili-
dade dos ramos A �D e a do denominador como a soma das probabilidades dos ramos
envolvendo �D. Assim, pelo diagrama de árvore temos
P (A j Dc) = P (A \D
c)
P (Dc)
=
0; 00002
0; 00002 + 0; 99301
= 0; 00002014.
Observe também que a soma de todas as probabilidades nas extremidades dos
ramos é sempre igual a 1.
Exemplo 18 Num mercado, três corretoras A, B e C são responsáveis por 20%,
50% e 30% do volume total de contratos negociados, respectivamente. Do volume de
cada corretora, 20%, 5% e 2%, respectivamente, são contratos futuros em dólares.
Pergunta-se:
24
(a) Um contrato é selecionado ao acaso. Qual a probabilidade de que este contrato
seja em dólares?
(b) Um contrato é selecionado ao acaso e este é futuro em dólares. Qual a
probabilidade de ter sido negociado pela corretora A?
Solução: Precisamos inicialmente de…nir os eventos relacionados com o pro-
blema dado. De…namos os eventos A, B e C "o contrato é negociado pelas corretoras
A, B e C", respectivamente, e D "o contrato é em dólares". Assim temos:
P (A) = 0; 2, P (B) = 0; 5 e P (C) = 0; 3;
P (D j A) = 0; 2, P (D j B) = 0; 05 e P (D j C) = 0; 02.
(a) Desejamos P (D). Mas
P (D) = P [(A \D) [ (B \D) [ (C \D)]
= P (A \D) + P (B \D) + P (C \D)
P (D) = P (A)P (D j A) + P (B)P (D j B) + P (C)P (D j C)
ou seja, o Teorema da Probabilidade Total nos auxilia novamente aqui a calcular a
probabilidade do contrato ser em dólares, sem o conhecimento de qual corretora o
operou. Assim temos
P (D) = 0; 2� 0; 2 + 0; 5� 0; 05 + 0; 3� 0; 02
= 0; 04 + 0; 025 + 0; 006
P (D) = 0; 071.
25
(b) Desejamos P (AjD). Assim temos
P (AjD) = P (A \D)
P (D)
=
P (A)P (DjA)
P (A)P (DjA) + P (B)P (DjB) + P (C)P (DjC)
=
0; 2� 0; 2
0; 2� 0; 2 + 0; 5� 0; 05 + 0; 3� 0; 02
=
0; 04
0; 071
=
40
71
.
P (AjD) �= 0; 56338.
Ou seja, o Teorema de Bayes nos auxilia calcular a probabilidade de que a fonte
causal para o contrato em dólares tenha sido a corretora A (‡ashback no tempo).
Mostre você mesmo que:
P (BjD) �= 0; 35211 e P (CjD) �= 0; 08451
e que, portanto,
P (AjD) + P (BjD) + P (CjD) = 1.
Exercício 1 Sabe-se que P (A) = 0; 35, P (B) = 0; 25, e P (A [B) = 0; 5. Cal-
cule P (A \B), P (Ac \B) e P (Ac \Bc), e veri…que se A e B são independentes.
Resp.: P (A \B) = 0; 1, P (Ac \B) = 0; 15, P (Ac \Bc) = 0; 5; A e B não são
independentes.
Exercício 2 Sabe-se que P (Ac [B) = 0; 76, P (Ac [Bc) = 0; 92, P (Ac \Bc) =
0; 31. Calcule P (A [B), P (A \B), P (B) e P (A), e veri…que se A e B são in-
dependentes. Resp: P (A [B) = 0; 69, P (A \B) = 0; 08, P (B) = 0; 45, P (A) =0; 32; A e B não são independentes.
Exercício 3 Suponha que A, B e C sejam eventos tais que A e B sejam indepen-
dentes e que P (A \B \ C) = 0; 04, P (C j A \B) = 0; 25, P (B) = 4P (A). Calcule
P (A [B). Resp.: P (A [B) = 0; 84.
Exercício 4 Um médico a partir da observação de sintomas supõe com 55% de
probabilidade que seu paciente esteja com o vírus HIV. Para con…rmar, pede-lhe
que faça um exame que dá positivo em 70% das vezes que o paciente de fato tem a
doença e dá negativo em 65% das vezes que o paciente não tem de fato a doença.
Pergunta-se: Dado que o teste foi positivo, qual a probabilidade de que o paciente
tenha o vírus HIV? Resp.: 70; 9677419%
Exercício 5 Dois dados são lançados. Seja A1 = fface ímpar no primeiro dadog,
A2 = fface ímpar no segundo dadog e A3 = fa soma da faces é ímparg. Esses even-
tos são independentes dois a dois? Eles são conjuntamente independentes? Resp.:
Sim; Não.
26
Exercício 6 Mostre que se A e B são eventos tais que P (A) > 0, P (B) > 0 e
P (AjB) > P (A), então P (BjA) > P (B).
Exercício 7 Se A e B são eventos independentes tais que P (A) = 1=3 e P (B) =
1=2, calcule P (A [B), P (Ac [Bc) e P (Ac \B). Resp.: 2=3, 5=6 e 1=3.
Exercício 8 A probabilidade de um homem ser canhoto é 1/10. Qual é a pro-
babilidade de, em um grupo de 10 homens, haver pelo menos um canhoto? Resp.:
aproximadamente 0; 65.
Exercício 9 Sacam-se, sucessivamente e sem reposição, duas cartas de um baralho
comum (52 cartas). Calcule a probabilidade de a primeira carta ser uma dama e a
segunda ser de copas. Resp.: 1=52.
Exercício 10 Seja uma caixa contendo 3 moedas: duas honestas e uma de duas
caras. Retirar uma moeda ao acaso e jogá-la. Pergunta: qual a probabilidade condi-
cional da moeda ter sido a de duas caras, dado que o resultado …nal foi cara? Resp.:
1=2.
Exercício 11 Uma moeda é lançada. Se ocorre cara, um dado é lançado e o seu
resultado é registrado. Se ocorre coroa, dois dados são lançados e a soma dos pontos
é registrada. Qual a probabilidade de ser registrado o número 2? Resp.: 7=72.
Exercício 12 Num certo certo país, todos os membros de comitê legislativo ou são
comunistas ou são republicanos. Há três comitês. O comitê 1 tem 5 comunistas, o
comitê 2 tem 2 comunistas e 4 republicanos, e o comitê 3 consiste de 3 comunistas e
4 republicanos. Um comitê é selecionado aleatoriamente e uma pessoa é selecionada
aleatoriamente deste comitê.
(a) Ache a probabilidade de que a pessoa selecionada seja comunista. Resp.:
37=63.
(b) Dado que a pessoa selecionada é comunista, qual a probabilidade de ela ter
vindo do comitê 1? Resp.: 21=37.
Exercício 13 São dadas duas urnas A e B. A urna A contém 1 bola azul e 1
vermelha. A urna B contém 2 bolas vermelhas e 3 azuis. Uma bola é extraída ao
acaso de A e colocada em B. Uma bola então é extraída ao acaso de B. Pergunta-se:
(a) Qual a probabilidade de se retirar uma bola vermelha de B? Resp.: 5=12.
(b) Qual a probabilidade de ambas as bolas retiradas serem da mesma cor? Resp.:
7=12.
Exercício 14 Um estudante se submete a um exame de múltipla escolha no qual
cada questão tem cinco respostas possíveis, das quais exatamente uma é correta. O
estudante seleciona a resposta correta se ele sabe a resposta. Caso contrário, ele
seleciona ao acaso uma resposta dentre as 5 possíveis. Suponha que o estudante
saiba 70% das questões. Pergunta-se:
(a) Qual a probabilidade de que o estudante escolha a resposta correta para uma
dada questão? Resp.: 0; 76.
(b) Se o estudante escolhe a resposta correta para uma dada questão, qual a
probabilidade de que ele sabia a resposta? Resp.: 35=38.
27
Exercício 15 A …m de se investigar o efeito de uma vacina para uma dada pa-
tologia em animais, foram selecionados 100 unidades experimentais para a amostra,
obtendo-se o seguinte resultado no domínio da frequência:
Contraíram Doença Não Contraíram Doença
Vacinados 18 42
Não Vacinados 12 28
Veri…que se contrair ou não a doença é independente de ser ou não vacinado.
Resp.: As categorias são independentes, pois vale a regra do produto.
Exercício 16 (Fórum de Discussões) Suponha que você esteja propondo a seguin-
te discussão em sala de aula: "Um aluno está participando de um programa televisivo
chamado "Porta da Felicidade", da seguinte forma: O apresentador do programa
mostra ao aluno três portas, uma das quais esconde um carro como prêmio e as
outras duas não oferecem nada e o colocam fora do jogo. O que acontece? O aluno
escolhe uma porta e o apresentador abre uma outra porta vazia não escolhida por
ele. Assim, ainda há a chance de o aluno ganhar o carro. Mas agora é oferecida a
ele a oportunidade de mudar de porta! O que ele deve fazer para maximizar a chance
de acerto? Ficar com a mesma porta escolhida ou mudar para a outra porta?"
Questões para a discussão:
(a) Qual a decisão correta a ser tomada à luz da incerteza, segundo a Teoria das
Probabilidades?
(b) Proponha uma forma empírica (simulação de vários eventos) em sala de
aula com os alunos, para a obtenção de uma taxa empírica de acertos quando a
estratégia adotada é mudar de escolha da porta inicial, de forma a comparar os
resultados empíricos com a tomada de decisão teórica correta à luz da Teoria das
Probabilidades.
(c) Discuta os possíveis equívocos na análise dessa tomada de decisão sob in-
certeza.
28

Outros materiais

Outros materiais