Buscar

Aula 5 - Bioestatística


Continue navegando


Prévia do material em texto

Aula 5
Base Teórica de Probabilidade
Objetivo: Compreender os fundamentos teóricos da Teoria das Probabilidades
para uma justa matematização do acaso e caracterização dos modelos probabilísticos
para os dados coletados.
Nesta aula exporemos os conceitos e os resultados centrais da Teoria das Pro-
babilidades, para que possamos ajustar os dados coletados a um modelo adequado e
assim poder tomar decisões sob incerteza. Nessa medida, não pretendemos esgotar
todas as potencialidades de tratamento deste assunto, que vale por si só um módulo
à parte, como um curso independente. Nossa intenção é apresentar para aqueles
que não tiveram uma exposição à teoria das probabilidades os fundamentos que
nortearão o conceito de distribuições amostrais, conceito este crucial para a parte
inferencial.
1 Álgebra de Conjuntos
Nessa seção, relembraremos um pouco as operações envolvendo conjuntos, já que na
linguagem da probabilidade, eventos serão descritos através de uniões, interseções e
complementares de conjuntos.
Letras maiúsculas, como por exemplo A, B, ..., Y , Z, representarão conjuntos.
A letra grega 
 representará o conjunto universal em uma situação determinada.
Letras minúsculas a, b, ..., y, z, indicarão elementos desses conjuntos.
A relação de pertencimento será grafada pelo símbolo 2 e escrevemos, por
exemplo a 2 A para indicar que a é membro de A (ou a pertence a A).
O conjunto vazio é representado pelo símbolo ?.
Um conjunto também pode ser descrito por uma propriedade p, comum a todos
os seus elementos, e escrevemos
A = fx j x tem a propriedade pg .
Exemplo 1 A = fx j x = 2k, k = 1; 2; :::g descreve o conjunto dos números in-
teiros pares positivos.
Usaremos o símbolo nA para indicar o número de elementos de um determinado
conjunto A (ou cardinalidade de A).
Diremos que A � B (A está contido em B) se todo elemento de A é também um
elemento de B, e diremos também que A é subconjunto de B.
Se A � B mas existe um elemento b 2 B tal que b =2 A, (b não pertence a A),
diremos que A é um subconjunto próprio de B.
Para mostrar que A não está contido em B, basta exibir um elemento a 2 A tal
que a =2 B.
1
Proposição 1 ? � A, para qualquer conjunto A.
Prova. Suponha que ? não seja subconjunto de A. Então devemos exibir um
elemento a 2 ? tal que a =2 A. Mas isso é impossível! Então devemos ? � A, pois
se uma proposição é falsa, então a proposição complementar é verdadeira.
De…nição 1 Dados dois conjuntos A e B indicaremos por A [ B o conjunto dos
elementos que pertencem a A ou a B, isto é o conjunto dos elementos que pertencem
a pelo menos um dos conjuntos A e B. Este conjunto é chamado união de A com
B.
A [B = f! 2 
 j ! 2 A ou ! 2 Bg.
Extensão: Seja a coleção de conjuntos A1, A2, ..., An. Então
n[
i=1
Ai = f! 2 
 j ! 2 A1 ou ! 2 A2 ... ou ! 2 Ang.
De…nição 2 Dados dois conjuntos A e B, de…nimos o conjunto interseção de A
e B como o conjunto dos elementos que pertencem simultaneamente a A e B, isto é
A \B = f! 2 
 j ! 2 A e ! 2 Bg.
Extensão: Seja a coleção de conjuntos A1, A2, ..., An. Então
n\
i=1
Ai = f! 2 
 j ! 2 A1 e ! 2 A2 ... e ! 2 Ang.
De…nição 3 Dados dois conjuntos A e B, diz-se que eles são disjuntos, se não
têm elementos comuns, isto é, se A \ B = ?. Por extensão, dada uma coleção de
conjuntos A1, ..., An, dizemos que eles são (mutuamente) disjuntos, ou disjuntos
dois a dois, se Ai \ Aj = ?, para todo i 6= j.
De…nição 4 Dado um conjunto A, de…nimos o conjunto complementar de A o
conjunto dos elementos de 
 que não pertencem a A. Simbolicamente
Ac = f! 2 
 j ! =2 Ag.
De…nição 5 Dados dois conjuntos A e B, de…ne-se o conjunto diferença de A e
B como o conjunto dos elementos de A que não pertencem a B, isto é
A�B = f! 2 
 j ! 2 A e ! =2 Bg
Observe que A�B = A \Bc.
A seguir listamos as propriedades mais importantes que relacionam os conceitos
de…nidos anteriormente. O aluno poderá veri…car cada uma delas tanto pela lógica
proposicional, quanto pelo diagrama de Venn, se assim o desejar:
Dado um conjunto universal 
 e conjuntos A, B e C, os seguintes resultados se
veri…cam:
(i) Para todo conjunto A � 
, A [? = A, A \? = ?.
(ii) A � B se e somente se A [B = B.
(iii) A � B se e somente se A \B = A.
2
(iv) A [ (B [ C) = (A [B) [ C. (Propriedade Associativa da União)
(v) A \ (B \ C) = (A \B) \ C. (Propriedade Associativa da Interseção)
(vi) A\ (B [C) = (A\B)[ (A\C). (Propriedade Distributiva da Interseção)
(vii) A [ (B \ C) = (A [B) \ (A [ C). (Propriedade Distributiva da União)
(viii) A [ Ac = 
, A \ Ac = ?, ?c = 
, 
c = ?.
(ix) (Ac)c = A.
(x) A � B se e somente se Bc � Ac.
(xi) (A [B)c = Ac \Bc. (Lei de Morgan)
(xii) (A \B)c = Ac [Bc. (Lei de Morgan)
2 De…nições e Resultados Básicos da Teoria das
Probabilidades
Suponha que vamos realizar um experimento cujo resultado não pode ser predito
de antemão, mas cujos possíveis resultados conhecemos. Este conjunto de todos
os resultados possíveis, que denotaremos por 
, é chamado de espaço amostral do
experimento. Assim, temos a seguinte de…nição:
O conjunto 
 contendo todos os resultados possíveis de um determinado
experimento é chamado de espaço amostral.
Exemplo 2 Se o experimento consiste em lançar uma moeda, então 
 = fCa;Cog,
onde Ca é ”cara”e Co é ”coroa”.
Exemplo 3 Se o experimento consiste em lançar um dado e observar a face supe-
rior, então 
 = f1; 2; 3; 4; 5; 6g.
Exemplo 4 Se o experimento consiste em lançar duas moedas, então
 = f(Ca;Ca); (Ca;Co); (Co;Ca); (Co;Co)g, onde o resultado (a; b) ocorre se a
face da primeira moeda é a e a face da segunda moeda é b.
Exemplo 5 Se o experimento consiste em lançar dois dados e observar as faces
superiores, então
 =
8>>>>>><>>>>>>:
(1; 1) (1; 2) (1; 3) (1; 4) (1; 5) (1; 6)
(2; 1) (2; 2) (2; 3) (2; 4) (2; 5) (2; 6)
(3; 1) (3; 2) (3; 3) (3; 4) (3; 5) (3; 6)
(4; 1) (4; 2) (4; 3) (4; 4) (4; 5) (4; 6)
(5; 1) (5; 2) (5; 3) (5; 4) (5; 5) (5; 6)
(6; 1) (6; 2) (6; 3) (6; 4) (6; 5) (6; 6)
9>>>>>>=>>>>>>;
onde o resultado (i; j) ocorre se a face i aparece no primeiro dado e a face j no
segundo dado.
Exemplo 6 Se o experimento consiste em medir a vida útil de um carro, então um
possível espaço amostral consiste de todos os números reais não-negativos, isto é,
 = [0;1).
3
Qualquer subconjunto A do espaço amostral 
, isto é A � 
,
ao qual atribuímos uma probabilidade, é dito um evento aleatório.
Obviamente, como ? � 
 e 
 � 
, os conjuntos ? e 
 são eventos aleatórios. O
conjunto vazio ? é denominado evento impossível e o conjunto 
 é denominado
evento certo. Se ! 2 
 o evento f!g é dito elementar (ou simples).
Dois eventos A e B são ditos mutuamente exclusivos
ou incompatíveis se A \B = ?.
Observação 1 É importante saber traduzir a notação de conjuntos para a lin-
guagem de eventos: A [ B é o evento ”A ou B”; A \ B é o evento ”A e B” e
Ac é o evento ”não A”.
2.1 De…nição e Propriedades das Probabilidades
Há várias interpretações da probabilidade. Discutiremos as três mais importantes:
(Clássica) Baseia-se no conceito de equiprobabilidade, ou seja, de resultados equiprováveis
(todos os elementos do espaço amostral têm a mesma chance de ocorrer). Seja
A um evento e 
 o espaço amostral …nito, então
P (A) =
nA
n
onde nA é a cardinalidade de A (o número de elementos de A) e n
 a cardi-
nalidade de 
.
Infelizmente nem todos os espaços amostrais em Estatística são …nitos e de
elementos equiprováveis... Assim, o conceito clássico não dá conta de todas as
estruturas probabilísticas necessárias para a descrição de fenômenos aleatórios. O
conceito a seguir vem suprir um pouco essa de…ciência.
(Frequentista) Baseia-se na frequência relativa de um ”número grande” de realizações do
experimento. Seja A um evento, então a probabilidade do evento A é vista
como o limite da taxa de ocorrência do evento A em realizações sucessivas do
experimento,isto é,
P (A) = lim
n!1
nA
n
onde nA é o número de ocorrências do evento A em n realizações.
O problema agora aqui é que se supõe que possamos reproduzir um experimento
in…nitas vezes para que possamos avaliar a convergência da taxa de ocorrência de
um dado evento, e isso não é possível... Assim devemos entender esse conceito num
sentido abstrato.
O conceito seguinte tem grandes implicações numa área de grandes estudos hoje
na Estatística, chamada Inferência Bayesiana, e apenas o citaremos como ilustração
para uma nova interpretação de probabilidade, embora ela não seja útil para esse
curso introdutório, pois trataremos da inferência clássica nesse curso.
4
(Subjetiva) Baseia-se em crenças e/ou informações do observador a respeito do fenômeno
em estudo. Ou seja, o observador/cientista atribui subjetivamente umamedida
de crença para o evento estudado e combina sua crença com as informações
vindas de dados coletados.
Como dissemos, não nos preocuparemos com o problema de como de…nir proba-
bilidade para cada experimento, pois mais importante é como construir uma teoria
matemática em que nela caibam todos os conceitos. Assim vamos estabelecer os
seguintes axiomas (as regras iniciais da teoria).
Seja 
 um espaço amostral e A um subconjunto de 
. Uma medida de proba-
bilidade P é uma aplicação de argumento A tendo os seguintes propriedades:
A1) P (A) � 0.
A2) P (
) = 1.
A3) (Aditividade …nita) Se A1; A2; :::; An � 
 são disjuntos dois a dois, isto é,
Ai \ Aj = ? para todo i 6= j, então P
�
n[
i=1
Ai
�
=
nX
i=1
P (Ai).
Uma função P satisfazendo os Axiomas 1, 2 e 3 é chamada probabilidade
…nitamente aditiva.
Infelizmente, restringir a probabilidade às uniões …nitas de conjuntos não nos
ajudará a resolver os problemas de interesse na Estatística. Assim devemos esta-
belecer também que se A1; A2; ::: � 
 são disjuntos dois a dois, então P
� 1[
i=1
Ai
�
=
1X
i=1
P (Ai). Essa propriedade é chamada de �-aditividade.
Com base nos axiomas de probabilidade, podemos demonstrar os seguintes re-
sultados fundamentais da probabilidade.
Teorema 1 P (?) = 0.
Prova. Como 
 = 
 [? e 
 \? = ?, temos pelo Axioma 3, que
P (
) = P (
 [?)
P (
) = P (
) + P (?)
P (;) = 0.
O que o teorema acima a…rma é que o evento impossível tem probabilidade nula.
Entretanto, a recíproca não é verdadeira! Um evento pode ter probabilidade nula
e não ser impossível... Vejamos um exemplo da chamada probabilidade geométrica
para ilustrar esse fato.
5
Exemplo 7 Um experimento consiste em se selecionar um ponto aleatoriamente do
círculo de raio unitário centrado na origem. Então
 =
�
! = (x; y) : x2 + y2 � 1	
Como todo ponto é aleatoriamente escolhido, a probabilidade de um ponto cair numa
região do círculo deveria ser a razão entre a área dessa região e a área do círculo
unitário. Assim, se A � 
, temos
P (A) =
SA
�
,
com SA a área da região de…nida pelos pontos de A. Mas então, todo evento ele-
mentar desse espaço amostral tem probabilidade nula, pois se A = f(a; b)g, então
SA = 0, e consequentemente
P (A) =
0
�
= 0.
No entanto A 6= ?. Além disso, observe que todo experimento terá como um resul-
tado um ponto do círculo unitário, que tinha probabilidade nula antes de ele ocorrer.
Portanto eventos de probabilidade 0 não são necessariamente eventos impossíveis!
Teorema 2 Para todo A � 
, temos P (Ac) = 1� P (A).
Prova. Como 
 = A [ Ac e A \ Ac = ?, temos pelo Axiomas 2 e 3, que
P (
) = P (A [ Ac)
1 = P (A) + P (Ac)
P (Ac) = 1� P (A).
O que o teorema acima nos informa é que a probabilidade de A não ocorrer é
100% = 1 descontado da chance de A ocorrer.
Teorema 3 Para todo A � 
, temos 0 � P (A) � 1.
Prova. 0 � P (A) vem do Axioma 1. Agora pelo resultado anterior, temos
P (Ac) = 1� P (A) � 0
1� P (A) � 0 =) P (A) � 1.
Teorema 4 Sejam A e B � 
. Se A � B, então
(a) P (B � A) = P (B)� P (A);
(b) P (A) � P (B).
6
Prova. (a) Como A � B, então podemos escrever
B = A [ (B � A) com A \ (B � A) = ?
P (B) = P [A [ (B � A)]
P (B) = P (A) + P (B � A)
P (B)� P (A) = P (B � A)
(b) Como 0 � P (B � A) = P (B)� P (A), temos
P (B)� P (A) � 0
P (B) � P (A)
Teorema 5 Sejam A e B � 
. Então P (A [B) = P (A) + P (B)� P (A \B).
Prova. Primeiramente temos
A [B = A [ (B \ Ac) com A \ (B \ Ac) = ?
Assim
P (A [B) = P [A [ (B \ Ac)]
P (A [B) = P (A) + P (B \ Ac) (1)
Agora, temos
B = (A \B) [ (B \ Ac) com (A \B) \ (B \ Ac) = ?
Assim
P (B) = P [(A \B) [ (B \ Ac)]
P (B) = P (A \B) + P (B \ Ac)
P (B \ Ac) = P (B)� P (A \B) (2)
Substituindo (2) em (1), temos o resultado
P (A [B) = P (A) + P (B)� P (A \B):
Teorema 6 Sejam A, B e C eventos aleatórios. Então P (A [ B [ C) = P (A) +
P (B) + P (C)� P (A \B)� P (A \ C)� P (B \ C) + P (A \B \ C).
Prova. Primeiramente temos
A [B [ C = (A [B) [ C pela associatividade da união.
7
Assim, pelo teorema anterior, temos
P (A [B [ C) = P [(A [B) [ C]
P (A [B [ C) = P (A [B) + P (C)� P [(A [B) \ C]
P (A [B [ C) = P (A) + P (B)� P (A \B) + P (C)� P [(A [B) \ C] (3)
Mas pela propriedade distributiva, temos
(A [B) \ C = (A \ C) [ (B \ C)
E assim, novamente usando o teorema anterior, temos
P [(A [B) \ C] = P [(A \ C) [ (B \ C)]
P [(A [B) \ C] = P (A \ C) + P (B \ C)� P (A \B \ C) (4)
Agora, substituindo (4) em (3), temos o resultado:
P (A [B [ C) = P (A)+P (B)+P (C)�P (A\B)�P (A\C)�P (B\C)+P (A\B\C).
O que o teorema acima nos informa é que a probabilidade da união de três even-
tos é dado pela soma das probabilidades da ocorrência individual deles, retirada da
soma das probabilidades de ocorrerem dois a dois e somada com a chance de eles
ocorrerem concomitantemente. O resultado acima, conhecido como o princípio da
inclusão e exclusão da probabilidade, pode ser generalizado para n eventos. As-
sim, a probabilidade da união de n eventos será dada pela soma das probabilidades
individuais, menos a soma das probabilidades dois a dois, mais a soma das probabili-
dades dos eventos tomados três a três, menos a soma das probabilidades dos eventos
tomados quatro a quatro, e assim por diante. Assim, quando temos um número par
de eventos a fórmula termina com uma diferença; se o número de eventos é ímpar,
a fórmula termina com uma soma.
Vejamos os seguintes exemplos para ilustrar os resultados obtidos.
Exemplo 8 Uma bola é extraída de uma urna contendo 10 bolas numeradas de 1 a
10. Calcule a probabilidade de que o número da bola extraída seja 3, 4 ou 5.
Solução: O espaço amostral para o experimento de extração de uma única bola
da urna é dado por
 = f1; 2; 3; :::; 10g .
Como a extração é ao acaso, temos
P (f!g) = 1
10
, para todo ! 2 
.
Desejamos a probabilidade do evento A = f3; 4; 5g. Assim, temos
P (A) = P (f3g) + P (f4g) + P (f5g)
=
1
10
+
1
10
+
1
10
=
3
10
,
ou equivalentemente
P (A) =
nA
n
=
3
10
.
8
Exemplo 9 Suponha que dois dados honestos sejam lançados. Qual a probabilidade
de que a soma dos números seja par?
Solução: O espaço amostral para o experimento de lançamento de dois dados é
dado por
 =
8>>>>>><>>>>>>:
(1; 1) (1; 2) (1; 3) (1; 4) (1; 5) (1; 6)
(2; 1) (2; 2) (2; 3) (2; 4) (2; 5) (2; 6)
(3; 1) (3; 2) (3; 3) (3; 4) (3; 5) (3; 6)
(4; 1) (4; 2) (4; 3) (4; 4) (4; 5) (4; 6)
(5; 1) (5; 2) (5; 3) (5; 4) (5; 5) (5; 6)
(6; 1) (6; 2) (6; 3) (6; 4) (6; 5) (6; 6)
9>>>>>>=>>>>>>;
ou na forma sintética
 = f! = (!1; !2) : !i 2 f1; 2; :::; 6g ; i = 1; 2g .
Como os dados são honestos, temos
P (f!g) = 1
36
, para todo ! 2 
.
Desejamos avaliar a probabilidade do evento A: "soma par das faces é obtida". As-
sim
A = f! = (!1; !2) 2 
 : !1 + !2 2 f2; 4; :::; 12gg
Para que a soma seja par, devemos ter as duas faces pares ou as duas faces ímpares.
Pela análise combinatória, há 3 escolhas de face par para o primeirodado e 3 escolhas
para a face par do segundo dado. Assim há 3� 3 = 9 resultados com soma das faces
par com as duas faces pares. Pelo mesmo raciocício, temos 3 escolhas de face ímpar
para o primeiro dado e 3 escolhas para a face ímpar do segundo dado. Assim há
3 � 3 = 9 resultados com soma das faces par com as duas faces ímpares. Assim,
temos
nA = 3� 3 + 3� 3 = 9 + 9 = 18:
Portanto
P (A) =
nA
n
=
18
36
=
1
2
.
Exemplo 10 Sete pessoas entram juntas num elevador no andar térreo de um
edifício de 10 andares. Suponha que os passageiros saiam independentemente e de
maneira aleatória com cada andar (1; 2; :::; 10) tendo a mesma probabilidade de ser
selecionado. Qual a probabilidade de que todos saiam em andares diferentes?
Solução: O espaço amostral para o experimento de saídas aleatórias das sete
pessoas é dado pelas diversas escolhas dos andares pelas sete pessoas envolvidas.
Assim
 = f! = (!1; !2; :::; !7) : !i 2 f1; 2; :::; 10g ; i = 1; 2; :::7g ,
com !i representando o andar que a pessoa i escolhe para sair. Assim, pela análise
combinatória, tendo 10 escolhas possíveis para cada pessoa, o número de con…gu-
rações de saídas será dado por
n
 = 10� 10� :::� 10| {z }
7 parcelas
= 107
9
Como as escolhas são aleatórias, temos
P (f!g) = 1
107
, para todo ! 2 
.
Seja o evento A: "todos saem em andares diferentes". Assim
A = f! = (!1; !2; :::; !7) 2 
 : !i 6= !j;8i 6= jg
Assim, pela análise combinatória, tendo 10 escolhas possíveis para primeira pessoa,
9 escolhas possíveis para segunda pessoa, 8 escolhas possíveis para terceira pessoa,
..., 4 escolhas possíveis para sétima pessoa. O número de con…gurações de saídas
diferentes será dado por
nA = 10� 9� 8� 7� 6� 5� 4
Assim
P (A) =
nA
n
=
10� 9� 8� 7� 6� 5� 4
107
=
60:480
1:000:000
P (A) = 0; 06048
P (A) = 6; 048%
Exemplo 11 De uma dada população, 35% têm olhos azuis, 42% são ruivos e 20%
são ruivos de olhos azuis. Escolhido ao acaso uma pessoa dessa população, qual a
probabilidade de:
(a) ser ruivo ou ter olhos azuis?
(b) não ser ruivo e nem ter olhos azuis?
(c) ser ruivo mas não ter olhos azuis?
Solução: O espaço amostral para o experimento deveria representar os possíveis
registros duplos de cor dos olhos e cor dos cabelos. Assim, de…nindo a para olhos
azuis, �a para olhos não azuis, r para ruivo e �r para não ruivo, temos os seguintes
resultados do experimento:
 = f(a; r) ; (a; �r) ; (�a; r) ; (�a; �r)g
Sejam os eventos A "a pessoa escolhida tem olhos azuis" e R "a pessoa escolhida é
ruiva". Assim temos
A = f(a; r) ; (a; �r)g , R = f(a; r) ; (�a; r)g e A \R = f(a; r)g
Temos, pelos dados fornecidos,
P (A) = 0; 35, P (R) = 0; 42 e P (A \R) = 0; 2.
Observe que os quatro elementos do espaço amostral não são equiprováveis, já que
apenas o par (a; r) tem 20% de chance e não 25%, caso os elementos fossem equipro-
váveis.
10
(a) Desejamos a probabilidade do evento A [R, ser ruivo ou ter olhos azuis.
P (A [R) = P (A) + P (R)� P (A \R)
= 0; 35 + 0; 42� 0; 2
= 0; 57
P (A [R) = 57%.
(b) Desejamos a probabilidade do evento Ac\Rc, não ser ruivo nem ter olhos azuis.
P (Ac \Rc) = 1� P [(Ac \Rc)c]
= 1� P (A [R)
= 1� 0; 57
P (Ac \Rc) = 43%.
(c) Desejamos a probabilidade do evento Ac \R, ser ruivo mas não ter olhos azuis.
Mas
Ac \R = R� (A \R) , com A \R � R.
Assim temos
P (Ac \R) = P [R� (A \R)]
= P (R)� P (A \R)
= 0; 42� 0; 2
P (Ac \R) = 22%.
2.2 Probabilidade Condicional
Em Ciência, informação é o material mais precioso que existe. Quanto mais infor-
mação dispomos de determinados fenômenos, mais acurados serão nossos modelos
e nossos cálculos de probabilidade. É nesse sentido que surge o conceito de pro-
babilidade condicional: como reavaliar a chance de um evento A ocorrer dado que
sabemos que um outro evento B ocorreu? Por exemplo, suponha o lançamento de
um dado honesto, isto é 
 = f1; 2; 3; 4; 5; 6g. Seja o evento A = f2; 4; 6g, "cair
número par". Então, se nada soubermos sobre o experimento, temos que
P (A) =
nA
n
=
3
6
=
1
2
= 50%.
Suponha agora que tendo realizado o experimento, alguém nos diga que um
número primo foi obtido. Assim sabemos que o evento B = f2; 3; 5g ocorreu. Qual
é a chance agora de A ter ocorrido? Temos agora apenas 1 chance em 3... Ou seja
P (A dado que B ocorreu) =
nA\B
nB
=
# f2g
# f2; 3; 5g =
1
3
�= 33; 33%.
Assim a chance de A cai de 50% para 33,33% quando sabemos que um número
primo ocorreu.
Utilizaremos a notação P (A j B) para signi…car a probabilidade da ocorrência do
evento A à luz da informação de que o evento B ocorreu. Assim, temos a seguinte
de…nição: Seja 
 um espaço amostral e seja B � 
 com P (B) > 0.
11
A probabilidade condicional de A dado B é de…nida por
P (A j B) = P (A \B)
P (B)
, para A � 
.
Para que a probabilidade acima esteja bem de…nida, devemos ter P (B) > 0, daí
a exigência dessa condição.
Cabe aqui justi…car a fórmula acima, fazendo um apelo ao conceito clássico de
probabilidade. Suponha um espaço amostral …nito 
 de elementos equiprováveis
com cardinalidade n
. Sejam A e B dois eventos de cardinalidades nA e nB, respec-
tivamente. Então dado que B ocorreu, B se torna agora um novo espaço amostral,
pois apenas elementos de B podem ter ocorrido. Assim, deveríamos saber quantos
elementos de B favorecem à ocorrência do evento A, mas isso equivale a contar
quantos elementos há em A \ B. Assim, como vimos anteriormente no exemplo do
dado, temos
P (A j B) = nA\B
nB
=
nA\B
n
nB
n
=
P (A \B)
P (B)
,
pois P (A \B) = nA\B
n
e P (B) =
nB
n
.
É preciso observar que todos os resultados vistos concernentes à probabilidade
não-condicional valem também para a probabilidade condicional. Assim, dado que
B ocorreu, temos também, por exemplo, que
P (Ac j B) = 1� P (A j B).
Exemplo 12 Certo experimento consiste em lançar um dado equilibrado duas vezes,
independentemente.
(a) Qual a probabilidade de que a soma das faces seja 6?
(b) Dado que os dois números extraídos sejam diferentes, qual é a probabilidade
agora de a soma dos números ser 6?
Solução: O espaço amostral para o experimento é dado por
 = f! = (!1; !2) : !i 2 f1; 2; :::; 6g ; i = 1; 2g .
Como o dado é honesto, temos
P (f!g) = 1
36
, para todo ! 2 
.
(a) Desejamos avaliar a probabilidade do evento A: "soma das faces é 6". Assim
A = f! = (!1; !2) 2 
 : !1 + !2 = 6g
A = f(1; 5) ; (5; 1) ; (2; 4) ; (4; 2) ; (3; 3)g
nA = 5.
Portanto
P (A) =
nA
n
=
5
36
.
12
(b) Seja B o evento "os números extraídos são diferentes". Então
B = f! = (!1; !2) 2 
 : !1 6= !2g
Pela análise combinatória, há 6 escolhas possíveis para o primeiro lançamento e
5 escolhas possíveis para o segundo lançamento, já que a segunda face deve ser
diferente da primeira face. Assim, temos
nB = 6� 5 = 30.
Portanto
P (B) =
nB
n
=
30
36
=
5
6
.
Seja agora o evento A \B "a soma dos números é 6 e os números são diferentes".
Então
A \B = f(1; 5) ; (5; 1) ; (2; 4) ; (4; 2)g
nA\B = 4,
e assim
P (A \B) = nA\B
n
=
4
36
=
1
9
.
Finalmente, temos
P (A j B) = P (A \B)
P (B)
=
1
9
5
6
=
1
9
� 6
5
P (A j B) = 2
15
.
Observe que de fato, dado que B ocorreu, então temos apenas 4 casos favoráveis a
A dentre os 30 possíveis agora com o conhecimento de que B se deu, daí 4
30
= 2
15
.
Vemos também que, quando nada sabemos sobre o experimento, a probabilidade de
soma 6 é de 5
36
; no entanto em face à informação de que B ocorreu essa probabilidade
passa a 2
15
, que embora próxima não é a mesma...
Teorema 7 Sejam A;B � 
 com P (A) > 0 e P (B) > 0. Então
P (A \B) = P (B):P (A j B)
= P (A):P (B j A)
Prova. Pela de…nição de probabilidade condicional temos
P (A j B) = P (A \B)
P (B)
=) P (A \B) =P (B):P (A j B) e
P (B j A) = P (A \B)
P (A)
=) P (A \B) = P (A):P (B j A).
Teorema 8 Para quaisquer A, B e C, eventos aleatórios, temos: P (A \ B \ C) =
P (A):P (B j A):P (C j A\B), se as probabilidades condicionais estão bem de…nidas.
13
Prova. Pela propriedade associativa da interseção, temos
A \B \ C = (A \B) \ C.
Assim, valendo-se do teorema anterior para dois conjuntos, temos
P (A \B \ C) = P [(A \B) \ C]
= P (A \B):P (C j A \B)
= P (A):P (B j A):P (C j A \B).
Observação 2 Podemos estender o resultado anterior para qualquer quantidade
de eventos. Assim, para todo A1; A2; :::; An � 
, temos P (A1 \ A2 \ ::: \ An) =
P (A1):P (A2 j A1):P (A3 j A1 \A2):::P (An j A1 \A2 \ :::An�1), se as probabilidades
condicionais estão bem de…nidas.
Exemplo 13 Selecionar três cartas sem reposição ao acaso. Qual a probabilidade
de se retirar 3 reis.
Solução: Sejam os eventos K1, K2 e K3 rei é obtido na primeira, segunda e
terceira extrações, respectivamente. Desejamos
P (K1 \K2 \K3) = P (K1):P (K2 j K1):P (K3 j K1 \K2)
Mas como há 4 reis num baralho de 52 cartas, temos:
P (K1) =
4
52
, P (K2 j K1) = 3
51
e P (K3 j K1 \K2) = 2
50
.
P (K1 \K2 \K3) = 4
52
:
3
51
:
2
50
P (K1 \K2 \K3) = 1
5:525
.
2.3 Independência
Independência é um conceito fundamental em Estatística, já que muitos dos modelos
utilizados na Estatística supõem observações de variáveis aleatórias independentes.
Diremos que dois eventos A e B são independentes, se a informação a respeito de que
um deles ocorreu não altera a chance de o outro ocorrer, ou seja, a informação dada
não contribui para a reavaliação do outro evento dado. Em notação matemática,
dizemos então que A e B são independentes se
P (A j B) = P (A)
ou, equivalentemente,
P (B j A) = P (B) .
14
Como consequência, temos
P (A j B) = P (A \B)
P (B)
= P (A) =) P (A \B) = P (A):P (B)
P (B j A) = P (A \B)
P (A)
= P (B) =) P (A \B) = P (A):P (B)
Ou seja:
Dois eventos A e B são ditos (estocasticamente) independentes
se P (A \B) = P (A):P (B).
Teorema 9 Se A e B são independentes, então A e Bc também são independentes
(e também Ac e B, e ainda Ac e Bc).
Prova. Por hipótese, temos P (A \B) = P (A):P (B). Mas
P (A \Bc) = P (A)� P (A \B)
= P (A)� P (A):P (B) (pela hipótese de independência)
= P (A) [1� P (B)]
P (A \Bc) = P (A) :P (Bc) (A e Bc são independentes)
Para Ac e B, o raciocínio é o mesmo. Agora sejam Ac e Bc.
P (Ac \Bc) = 1� P [(Ac \Bc)c]
= 1� P (A [B)
= 1� P (A)� P (B) + P (A \B)
= 1� P (A)� P (B) + P (A):P (B)
= [1� P (A)]� P (B) [1� P (A)]
= [1� P (A)] [1� P (B)]
P (Ac \Bc) = P (Ac) :P (Bc) (Ac e Bc são independentes)
O que o teorema acima nos informa é que se A e B são dois eventos indepen-
dentes, então a propriedade de independência se estende para os complementares
dos conjuntos.
Entretanto um erro muito comum entre os alunos (e até mesmo entre os pro-
fessores) é associar independência com disjunção, interpretando erroneamente que
se A e B são independentes, então A \ B = ?. É justamente o contrário que se
dá, ou seja, se A \ B = ?, então A e B não são independentes (a menos que um
deles tenha probabilidade zero). Isso …ca claro se pensarmos que P (A) = p > 0 e
P (B) = q > 0 com A \B = ?. Assim, neste caso, teremos
P (A j B) = P (A \B)
P (B)
=
P (?)
P (B)
=
0
q
= 0 6= p = P (A) .
Assim P (A j B) 6= P (A), o que prova que A e B não são independentes!
É preciso, no entanto, diferenciar o conceito de independência dois a dois de
eventos, com o conceito de dependência coletiva. Vejamos os dois conceitos:
15
Os eventos aleatórios Ai, i 2 I (I um conjunto de índices), são independentes
dois a dois (ou a pares) se P (Ai \ Aj) = P (Ai):P (Aj) para todo i; j 2 I, i 6= j.
Os eventos aleatórios A1; :::; An (n � 2), são (coletiva ou estocasticamente)
independentes se P (Ai1 \ Ai2 \ ::: \ Aim) = P (Ai1):P (Ai2):::P (Aim),
1 � i1 < i2 < ::: < im � n, e para todo m = 2; 3; :::; n.
Assim, vemos que só podemos a…rmar, por exemplo, que A, B e C são indepen-
dentes, se eles são independentes 2 a 2 e 3 a 3, isto é, vale a regra do produto
P (A \B) = P (A):P (B),
P (A \ C) = P (A):P (C),
P (B \ C) = P (B):P (C) e
P (A \B \ C) = P (A):P (B):P (C).
É importante ressaltar que independência a pares não implica independência
coletiva! Conforme o exercício a seguir.
Exemplo 14 Suponha um tetraedro regular com faces marcadas 1, 2, 3 e 4. Seja
o experimento de jogar o tetraedro e observar a face justaposta à mesa. Sejam
os eventos A = f1; 4g, B = f2; 4g e C = f3; 4g. Veri…que que A, B e C são
independentes dois a dois, mas não são coletivamente independentes.
Solução: O espaço amostral para o experimento é dado por 
 = f1; 2; 3; 4g e
P (fwg) = 1=4 para todo w 2 
, pois o tetraedro é regular. Assim temos
P (A) = P (B) = P (C) =
1
2
.
P (A \B) = P (f4g) = 1
4
=
1
2
� 1
2
= P (A) :P (B)
P (A \ C) = P (f4g) = 1
4
=
1
2
� 1
2
= P (A) :P (C)
P (B \ C) = P (f4g) = 1
4
=
1
2
� 1
2
= P (B) :P (C)
Assim A, B e C são independentes dois a dois. No entanto,
P (A \B \ C) = P (f4g) = 1
4
P (A):P (B):P (C) =
1
2
� 1
2
� 1
2
E assim
P (A \B \ C) 6= P (A):P (B):P (C).
Logo A, B e C não são independentes.
16
Exemplo 15 Perguntou-se através de uma amostra de 600 adultos em três cidades
do sudeste brasileiro (Rio de Janeiro - RJ, São Paulo - SP e Minas Gerais - MG),
se eles eram favoráveis ou não à volta da CPMF e os seguintes resultados foram
obtidos, no domínio da frequência.
RJ SP MG Total
Favor 90 54 36 180
Contra 210 126 84 420
Total 300 180 120 600
Denotando por R, S e M os eventos "a pessoa selecionada é do Rio, São Paulo
e Minas, respectivamente"; e por F e C, "a pessoa selecionada é a favor e contra a
volta da CPMF, respectivamente", veri…que se as categorias ser ou não a favor são
independentes dos estados do sudeste no estudo.
Solução: Precisamos montar uma tabela com a frequência relativa observada.
Assim, temos o seguinte resultado:
RJ SP MG Total
Favor 90
600
= 0; 15 54
600
= 0; 09 36
600
= 0; 06 180
600
= 0; 3
Contra 210
600
= 0; 35 126
600
= 0; 21 84
600
= 0; 14 420
600
= 0; 7
Total 300
600
= 0; 5 180
600
= 0; 3 120
600
= 0; 2 600
600
= 1
Assim, temos por exemplo: P (F ) = 0; 3, P (M) = 0; 2, P (R \ C) = 0; 35, e
assim por diante. Para que as categorias ser ou não a favor sejam independentes
dos estados do sudeste no estudo devemos ter a regra do produto das probabilidades
validada.
P (R \ F ) = 0; 15 = 0; 5� 0; 3 = P (R) :P (F )
P (R \ C) = 0; 35 = 0; 5� 0; 7 = P (R) :P (C)
P (S \ F ) = 0; 09 = 0; 3� 0; 3 = P (S) :P (F )
P (S \ C) = 0; 21 = 0; 3� 0; 7 = P (S) :P (C)
P (M \ F ) = 0; 06 = 0; 2� 0; 3 = P (M) :P (F )
P (M \ C) = 0; 14 = 0; 2� 0; 7 = P (M) :P (C)
Vemos que a regra do produto vale para todo cruzamento das categorias Fa-
vor/Contra com Estados, o que prova haver independência entre a opinião e estado.
Cabe aqui ressaltar que poderíamos averiguar no domínio da frequência observando,
se por exemplo no caso R e F, temos
nR\F =
nR � nF
n
o que se comprova, já que nR\F = 90, nR = 300 e nF = 180, e
nR\F = 90 =
300� 180
600
=
nR � nF
n
e assim por diante nos outros casos. Guarde bem essa maneira de averiguar in-
dependência, pois nos servirá mais tarde para justi…car um teste estatístico muito
importante para se averiguar relação de dependência entre variáveis categóricas.
17
Exercício 1 Sabe-se que P (A) = 0; 35, P (B) = 0; 25, e P (A [B) = 0; 5. Cal-
cule P (A \B), P (Ac \B) e P (Ac \Bc), e veri…que se A e B são independentes.
Resp.: P (A \B) = 0; 1, P (Ac \B) = 0; 15, P (Ac \Bc) = 0; 5; A e B não são
independentes.
Exercício 2 Sabe-se que P (Ac [B) = 0; 76, P (Ac [Bc) = 0; 92, P (Ac \Bc) =
0; 31. Calcule P (A [B), P (A \B), P (B)e P (A), e veri…que se A e B são in-
dependentes. Resp: P (A [B) = 0; 69, P (A \B) = 0; 08, P (B) = 0; 41, P (A) =
0; 32; A e B não são independentes.
Exercício 3 Suponha que A, B e C sejam eventos tais que A e B sejam indepen-
dentes e que P (A \B \ C) = 0; 04, P (C j A \B) = 0; 25, P (B) = 4P (A). Calcule
P (A [B). Resp.: P (A [B) = 0; 84.
Exercício 4 Dois dados são lançados. Seja A1 = fface ímpar no primeiro dadog,
A2 = fface ímpar no segundo dadog e A3 = fa soma da faces é ímparg. Esses even-
tos são independentes dois a dois? Eles são conjuntamente independentes? Resp.:
Sim; Não.
Exercício 5 Mostre que se A e B são eventos tais que P (A) > 0, P (B) > 0 e
P (AjB) > P (A), então P (BjA) > P (B).
Exercício 6 Se A e B são eventos independentes tais que P (A) = 1=3 e P (B) =
1=2, calcule P (A [B), P (Ac [Bc) e P (Ac \B). Resp.: 2=3, 5=6 e 1=3.
Exercício 7 A probabilidade de um homem ser canhoto é 1=10. Qual é a pro-
babilidade de, em um grupo de 10 homens, haver pelo menos um canhoto? Resp.:
aproximadamente 0; 65.
Exercício 8 Sacam-se, sucessivamente e sem reposição, duas cartas de um baralho
comum (52 cartas). Calcule a probabilidade de a primeira carta ser uma dama e a
segunda ser de copas. Resp.: 1=52.
Exercício 9 Uma moeda é lançada. Se ocorre cara, um dado é lançado e o seu
resultado é registrado. Se ocorre coroa, dois dados são lançados e a soma dos pontos
é registrada. Qual a probabilidade de ser registrado o número 2? Resp.: 1=12.
Exercício 10 A …m de se investigar o efeito de uma vacina para uma dada pa-
tologia em animais, foram selecionados 100 unidades experimentais para a amostra,
obtendo-se o seguinte resultado no domínio da frequência:
Contraíram Doença Não Contraíram Doença
Vacinados 18 42
Não Vacinados 12 28
Veri…que se contrair ou não a doença é independente de ser ou não vacinado.
Resp.: As categorias são independentes, pois vale a regra do produto.
18
Exercício 11 A …m de se investigar a relação entre criminoso e vítima, uma
pesquisa foi realizada obtendo-se os seguintes resultados na tabela abaixo:
Homicídio Furto Assalto
Estranho 12 379 727
Conhecido/Parente 39 106 642
Ignorado 18 20 57
(a) Se uma pessoa é selecionada aleatoriamente, qual é a probabilidade de ela ter
sido vítima de um estranho, dado que foi escolhida uma vítima de furto?
(b) Escolhida uma vítima de assalto, qual a probabilidade de o criminoso ser um
estranho?
Resp.: (a) 75%, (b) 51%
Exercício 12 Um determinado paciente tem uma consulta marcada com seu médico.
Sabe-se que a probabilidade de que ele compareça no dia e hora marcados é de 90%.
Por outro lado, a probabilidade de que o médico receba um chamado urgente que o
obrigue a desmarcar a consulta é de 5%. Admitindo-se que há independência entre
esses dois eventos e que esses são os dois únicos motivos que poderão fazer com que
a consulta não ocorra no dia e hora marcados, determine a probabilidade de que a
consulta não seja realizada. Resp.: 14,5%
Exercício 13 Uma relação de candidatos a um emprego consiste em cinco homens
e três mulheres. Entre essas oito pessoas, apenas duas serão escolhidas ao acaso
para serem entrevistadas. Qual a probabilidade de que os entrevistados sejam um
homem e uma mulher? Resp.: 53,57%
Exercício 14 Considere uma urna com 100 bolas numeradas de 1 a 100. Uma bola
é extraída aleatoriamente da urna e seu número é registrado. Qual a probabilidade
de o número obtido ser divisível por 2 ou por 3 ou por 5?
Exercício 15 Dois jogadores A e B jogam 120 partidas de xadrez, das quais A ganha
60, B ganha 40 e 20 terminam empatadas. A e B concordam em jogar novamente
três partidas. Determinar a probabilidade de:
(a) A ganhar todas as três;
(b) duas partidas terminarem empatadas;
(c) A e B ganharem alternadamente.
Resp.: (a) 1/8; (b) 5/72; (c) 5/36.
19