Estatistica Aplicada Vol.1

Probabilidade I

•
UFRJ

João José
16/09/2018
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
E aí, curtiu este material?
Ajude a incentivar outros estudantes a melhorar o conteúdo
Gostou desse material? Compartilhe! 🧡
Probabilidade I

4.481 Materiais compartilhados
Baixe o app para aproveitar ainda mais
Leia os materiais offline, sem usar a internet. Além de vários outros recursos!
Prévia do material em texto
Paulo 
Melo 
Rosa 
Andrade 
- , FDIt JES sI~A BO 
Visite a Sílabo na rede: 
www.silabo.pt 
Probabilidades, Variáveis Aleatórias 
Distribuições Teóricas 
Elizabeth Reis 
Paulo Me10 
Rosa Andrade 
Teresa Calapez 
~TDIÇÃO - REVISTA 
E expressamente proibido reproduzir, no todo ou em parte, sob qualquer meio 
ou forma, NOMEADAMENTE FOTOCÓPIA, esta obra. As transgressões serão 
passíveis das penalidades previstas na legislação em vigor. 
Editor: Manuel Robalo 
Título: Estatística Aplicada - Volume 1 
Autores: Elizabeth Reis, Paulo Melo, Rosa Andrade, Teresa Calapez 
O Edições Sílabo, Lda. 
4Wdição - 2Weimpressão 
Capa: Paul Klee (1 879-1 940), Clair de /une à St. Germain, 191 5. 
Lisboa, 2003 
Impressão e acabamentos: Gráfica Manuel A. Pacheco, Lda. 
Depósito Legal: 160052f01 
ISBN: 972-61 8-245-X 
EDIÇÕES S~LABO, LDA. 
R. Cidade de Manchester, 2 
11 70-1 00 LISBOA 
Telf.: 2181 30345 
Fax: 218166719 
e-mail: silaboQsilabo.pt 
www.silabo.pt 
Capítulo I . Introdução 
1 . DUAS RAZÕES PARA SE ESTUDAR ESTAT~STICA . . . . . . . . 17 
2 . A NECESSIDADE DA ESTAT~STICA NAS CIÊNCIAS 
ECONÓMICAS E DE GESTÃO . . . . . . . . . . . . . . . . . . . 17 
3 . MÉTODO ESTAT~STICO DE RESOLUÇÃO DE UM PROBLEMA . . 19 
4 . ESTAT~STICA DESCRITIVA E INFERÊNCIA ESTAT~STICA . . . . . 20 
. 5 ESCALAS DE MEDIDA DOS DADOS ESTAT~STICOS . . . . . . . 22 
5.1. Escala nominal . . . . . . . . . . . . . . . . . . . . . . . . . . 23 
5.2. Escala ordinal . . . . . . . . . . . . . . . . . . . . . . . . . . 24 
5.3. Escala por intervalos . . . . . . . . . . . . . . . . . . . . . . . 24 
5.4. Escala de rácios . . . . . . . . . . . . . . . . . . . . . . . . . 25 
. 6 ALGUMAS CONSIDERAÇÕES FINAIS . . . . . . . . . . . . . . . 25 
. 7 UTILIZAÇÃO DO COMPUTADOR . . . . . . . . . . . . . . . . . . 26 
Capítulo I1 . Teoria das probabilidades 
. 1 RESUMO HIST~RICO . . . . . . . . . . . . . . . . . . . . . . . . 29 
2 . CONCEITOS DA TEORIA DAS PROBABILIDADES . . . . . . . . . 32 
2.1. Experiência aleatória . . . . . . . . . . . . . . . . . . . . . . . 32 
2.2. Espaço de resultados . . . . . . . . . . . . . . . . . . . . . . 33 
2.3. Acontecimentos . . . . . . . . . . . . . . . . . . . . . . . . . 35 
3 . ÁLGEBRA DOS ACONTECIMENTOS . . . . . . . . . . . . . . . . 39 
3.1. União de acontecimentos . . . . . . . . . . . . . . . . . . . . 39 
3.2. Intersecção de acontecimentos . . . . . . . . . . . . . . . . . 40 
. . . . . . . . . . . . . . . . . . 3.3. Diferença de acontecimentos 
. . . . . . . . . . . . . . . . . . 3.4. Propriedades das operações 
. . . . . . . . . . . . . . . . . 4 . CONCEITOS DE PROBABILIDADE 
. . . . . . . . . . 4.1. Conceito clássico de probabilidade (a priori) 
. . . . . 4.2. Conceito frequencista de probabilidade (a posteriori) 
. . . . . 4.3. Conceito subjectivo ou personalista de probabilidade 
. . . . . . . . . 5 . AXIOMAS DA TEORIA DAS PROBABILIDADES 
. . . . . . . . . . . . . . . 6 . PROBABILIDADES CONDICIONADAS 
6.1. Axiomática e teoremas da teoria das probabilidades 
. . . . . . . . . . . . . . . . . na probabilidade condicionada 
7 . PROBABILIDADE DE INTERSECÇÃO DE ACONTECIMENTOS . 
. . . . . . . . . . . . . . ACONTECIMENTOS INDEPENDENTES 
. . . . . . . . 7.1. Probabilidade de intersecção de acontecimentos 
. . . . . . . . . . . . . . . . . 7.2. Acontecimentos independentes 
7.3. Acontecimentos independentes versus acontecimentos 
. . . . . . . . . . . . incompatíveis ou mutuamente exclusivos 
8 . TEOREMA DA PROBABILIDADE TOTAL E FÓRMULA DE BAYES 
. . . . . . . . . . . . . . . . . 8.1. Teorema da probabilidade total 
. . . . . . . . . . . . . . . . . . . . . . . . 8.2. Fórmula de Bayes 
. . . . . . . . . . . . . . . . . . . . . . EXERC~CIOS PROPOSTOS 
Capítulo 111 . Variáveis aleatórias 
. . . . . . . . . . . . . . . . . . . 1 . 1. Enquadramento e exemplos 
. . . 1.2. Cálculo de probabilidades através de variáveis aleatórias 
. . . . . 1.3. Variáveis aleatórias unidimensionais e bidimensionais 
2 . FUNÇOES DE PROBABILIDADE E DE DISTRIBUIÇÃO 
. . . . . . . . . DE VARIÁVEIS ALEATÓRIAS UNIDIMENSIONAIS 
. . . . . . . . . . . . . . . . . . 2.1. Variáveis aleatórias discretas 
. . . . . . . . . . . . . . . . . . 2.1 . 1. Função de probabilidade 
. . . . . . . . . . . . . . . . . . . . 2.1.2. Função de distribuição 
. . . . . . . . . . . . . . . . . . 2.2. Variáveis aleatórias contínuas 
3 . FUNÇOES DE PROBABILIDADE E DE DISTRIBUIÇAO 
DE VARIÁVEIS ALEAT~RIAS BIDIMENSIONAIS . . . . . . . . . . 115 
3.1. Variáveis aleatórias discretas . . . . . . . . . . . . . . . . . . 115 
3.1 . 1. Função de probabilidade conjunta . . . . . . . . . . . . . 115 
3.1.2. Função de distribuição conjunta . . . . . . . . . . . . . . . 117 
3.1.3. Função de probabilidade marginal . . . . . . . . . . . . . 119 
3.1.4. Independência de variáveis aleatórias . . . . . . . . . . . 120 
3.2. Variáveis aleatórias contínuas . . . . . . . . . . . . . . . . . . 121 
3.2.1. Definição . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 
3.2.2. Cálculo de probabilidades . . . . . . . . . . . . . . . . . . 123 
. . . . 3.2.3. Funções de densidade de probabilidade marginais 125 
3.2.4. Independência . . . . . . . . . . . . . . . . . . . . . . . . 126 
4 . PARÂMETROS DE VARIÁVEIS ALEATÓRIAS: VALOR ESPERADO 
E VARIÂNCIA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 
4.1. Média ou valor esperado . . . . . . . . . . . . . . . . . . . . 127 
4.1.1. Definição . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 
4.1.2. Propriedades do valor esperado . . . . . . . . . . . . . . 129 
. . . . . . . 4.1.3. Valor esperado de função de variável aleatória 131 
4.1.4. Valor esperado monetário (V.E.M.) . . . . . . . . . . . . . 133 
. . . . . . . . . . . . . . . . . . . . 4.2. Variância e desvio-padrão 137 
. . . . . . . . . . . . . . . . . . 4.2.1. Propriedades da variância 139 
. . . . . . . . . 4.3. Covariância e coeficiente de correlação linear 140 
5 . MOMENTOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145 
. . . . . . . . . . . . . . . . . 5.1. Função geradora de momentos 147 
6 . DESIGUALDADES DE MARKOV E CHEBISHEV . . . . . . . . . . 148 
EXERC~CIOS PROPOSTOS . . . . . . . . . . . . . . . . . . . . . . 154 
Capitulo /V . Distribuipões teóricas mais importantes 
1 . DISTRIBUIÇÓES DISCRETAS . . . . . . . . . . . . . . . . . . . . 161 
. . . . . . . . . . . . . . . . . . . . . . 1 . 1. A distribuição uniforme 161 
. . . . . . . . . . . . . . . . . . . . . . . . 1.2. Prova de Bernoulli 166 
. . . . . . . . . . . . . . . . . . . . 1.3. A distribuição de Bernoulli 169 
. . . . . . . . . . . . . . . . . . . . . . 1.4. A distribuição binomial 171 
. . . . . . . . . . . 1.4.1. A função de probabilidade da binomial 172 
1.4.2. Aspecto gráfico da função de probabilidade da binomial . . 177 
. . . . . . . . . . . . . 1.4.3. Parâmetros da distribuição binomial 181 
. . . . . . . . . . 1.4.4. A aditividade nas distribuições binomiais 
. . . . . . . . . 1.4.5. Outras aplicações da distribuição binomial 
. . . . . . . . . . . . . . . . . . . . 1.5. A distribuição multinomial 
. . . . . . . . 1.5.1. Parâmetros mais importantes da multinomial 
. . . . . . . . . . . . . . . . . 1.6. A distribuição binomial negativa 
. . . . . . 1.6.1. Relação entre a binorr.ial e a binomial negativa 
1.6.2. Parâmetros mais importantes da binomial negativa . . . . 
. . . . . . . . . . . . . 1.7. A distribuição geométrica ou de Pascal 
1.7.1. Parâmetros mais importantes da distribuição geométrica . 
. . . . . . . . . . . . . . . . . . 1.8. A distribuição hipergeométrica 200 
1.8.1. Parâmetros mais importantes da distribuição 
. . . . . . . . . . . . . . . . . . . . . . . hipergeométrica 203 
. . . . . .. 1.8.2. Generalização da distribuição hipergeométrica 204 
. . . . . . . . . . . . . . . . . . . . 1.9. A distribuição de Poisson 206 
. . . . . . . . . . . . . . . . . . . 1.9.1. O processo de Poisson 206 
1.9.2. Parâmetros mais importantes da distribuição de Poisson . 209 
. . . . . . . . . 1.9.3. A aditividade nas distribuições de Poisson 212 
. . . . . . 1.9.4. Aproximação da distribuição binomial a Poisson 214 
. . . . . . . . . . . . . . . . . . . 2 . DISTRIBUIÇ~ES CONT~NUAS 219 
. . . . . . . . . . . . . . . . . . . . . . 2.1. A distribuição uniforme 219 
. . . . . . . . . . . . . . . . . . . . . . 2.2. A distribuição normal 222 
. . . . . . . . . . . 2.2.1. Características da distribuição normal 223 
. . . . . 2.2.2. Cálculo de probabilidades na distribuição normal 225 
. . . . . . . . . . . . . 2.2.3. A aditividadada distribuição normal 232 
2.2.4. A distribuição normal como uma aproximação 
. . . . . . . . . . . . . . . . . . . da distribuição binomial 234 
2.2.5. A distribuição normal como aproximação 
. . . . . . . . . . . . . . . . . . da distribuição de Poisson 235 
. . . . . . . . . . . . . . . . . . . . 2.3. A distribuição exponencial 237 
. . . . . . . . . . . . . . . . . . . . . . . 2.4. A distribuição Gama 240 
. . . . . . . . . . . . . . . . . . . . . . EXERC~CIOS PROPOSTOS 244 
Apêndice . Tabelas de distribuição 
. . . . . . . . . . . . . . . . . . . . . . . . . Distribuição binomial 251 
. . . . . . . . . . . . . . . . . . . . . . . . Distribuição de Poisson 256 
. . . . . . . . . . . . . . . . . . . . . . Distribuição normal padrão 263 
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . BIBLIOGRAFIA 265 
Nota a segunda edição 
Esta nova ediçao de tstatistica Aplicada, para além de constituir uma nova 
versão revista e actualizada, apresenta-se agora dividida em dois volumes, 
para, tanto quanto possível, responder as solicitações de muitos dos nossos 
leitores, docentes e alunos, cujos programas de Estatística assim se encontram 
estruturados. 
O primeiro volume, para além do capítulo introdutório, inclui um segundo 
capítulo sobre Teoria das Probabilidades, um terceiro sobre Variáveis Aleató- 
rias, sendo o quarto e último sobre as Distribuições Teóricas mais Importantes. 
Os restantes cinco capítulos da primeira edição fazem agora parte do 
segundo volume. Embora maioritariamente dedicado aos métodos de Inferên- 
cia Estatística (capítulos Vil, VI11 e IX, Estimação de Parâmetros, Ensaios de 
Hipóteses e Testes não-Paramétricos), depois de uma breve introdução aos 
Processos de Amostragem (quinto capítulo), é também feita a apresentação 
das Distribuições Amostrais (capítulo VI). 
Acreditamos que esta solução dará também resposta as preferências de 
muitos outros leitores que, pelo carinho e interesse com que acompanharam 
a primeira edição, pelas sugestões e indicações de gralhas e erros, decidida- 
mente contribuíram para a produção desta nova edição. A todos, os nossos 
agradecimentos. 
Conscientes de que é possível fazer melhor, esperamos que esta nova 
edição vos desperte tanta atenção como a anterior, deixando aqui a promessa 
de nos mantermos empenhados no seu aperfeiçoamento. 
0 s autores 
Lisboa, Setembro de 1997 
Prefácio 
Este livro de Estatística Aplicada destina-se a profissionais licenciados ou 
não e a estudantes universitários que, na vida prática ou no processo de 
aprendizagem, têm necessidade de saber Estatística e de a aplicar aos pro- 
blemas mais variados do dia-a-dia. Como objectivos finais, este livro pretende 
tornar compreensíveis a linguagem e notação estatísticas, bem como exempli- 
ficar as suas potenciais utilizações, sem descurar os pressupostos subjacentes 
e o rigor teórico necessário. 
Deverá referir-se que a escolha do título não foi pacífica. De entre os vários 
alternativos - Probabilidades e Estatística, Inferência Estatística, etc. - a 
preferência por Estatística Aplicada justifica-se pela abordagem diferenciada 
de outras obras já publicadas sobre Inferência Estatística, e que resumidamen- 
te pode ser assim descrita: mais do que <<ensinar,,, pretende-se com este livro, 
a) despertar e estimular o interesse dos leitores pelo método estatístico de 
resolução dos problemas; b) utilizando uma linguagem simples e acessível, 
apresentar os conceitos e métodos de análise estatística de modo mais intuitivo 
e informal; c) acompanhar a apetência teórica com exemplos apropriados a 
cada situação. 
O livro encontra-se dividido em nove capítulos. No capítulo I (Introdução) 
são explicitadas várias razões para que um profissional, técnico, estudante ou 
mero cidadão adquira um nível mínimo de conhecimentos em Estatística. 
A Teoria das Probabilidades é objecto de estudo do capítulo II. Nele são 
apresentados os diferentes conceitos de probabilidade e a sua axiomática, 
dando especial relevo aos teoremas da probabilidade total e de Bayes. 
0 s terceiro e quarto capítulos, tal como o segundo, são essenciais para a 
compreensão dos seguintes, relativos a Inferência Estatística. O capítulo III 
respeita as Variáveis Aleatórias, sua definição, características e propriedades. 
No quarto capítulo estudam-se em pormenor as distribuições de algumas 
variáveis aleatórias de importância maior nas áreas de aplicação das ciências 
sócio-económicas como sejam as distribuições de Bernoulli, binomial, Poisson, 
binomial negativa, hipergeométrica, multinomial, uniforme e normal. 
O capítulo V é dedicado ao estudo dos processos de amostragem, incluindo 
os diferentes métodos de recolha de uma amostra, enquanto que no capítulo 
VI se apresentam as distribuições amostrais mais importantes. 
Os três últimos capítulos são dedicados a Inferência Estatística propriamen- 
te dita. No capítulo VI1 apresentam-se métodos de estimação de parâmetros, 
com ênfase especial para o método de máxima verosimilhança. Inclui-se ainda 
a estimação por intervalos. Os capítulos VIII e IX destinam-se a apresentação, 
respectivamente, dos ensaios de hipóteses paramétricos e não-paramétricos. 
Com excepção do primeiro, todos os restantes capítulos são finalizados com 
um conjunto de exercícios não resolvidos, acompanhados geralmente das 
respectivas soluções. 
No Apêndice estão incluídas as Tabelas (das distribuições) necessárias a 
compreensão do texto e a resolução dos exemplos e dos exercícios propostos. 
Este livro é o resultado de alguns anos de experiência docente dos seus 
autores na equipa de Estatística do ISCTE e da tentativa de responder as 
necessidades sentidas por muitos - alunos e docentes de variadas licencia- 
turas, docentes do ensino secundário, profissionais e técnicos de diferentes 
áreas científicas (gestão, economia, sociologia, psicologia, medicina, enferma- 
gem, engenharia, informática, etc.) - que, no decorrer destes anos, e na falta 
de uma obra que os ajudasse a encontrar as soluções estatísticas apropriadas 
aos seus problemas, procuraram ajuda junto dos autores. 
Sem dúvida que a responsabilidade desta obra é assumida pelos seus 
autores, mas a sua concretização só se tornou possível com a ajuda, apoio e 
disponibilidade de muitos. Por isso, não deixando de agradecer a todos os que, 
directa ou indirectamente, contribuíram para a sua realização, gostaríamos de, 
nominalmente, dar uma palavra especial de agradecimento aos seguintes 
docentes de Estatística do ISCTE: Ana Cristina Ferreira, Ana Paula Marques, 
António Robalo, Fátima Ferrão, Fátima Salgueiro, Graça Trindade, Helena 
Carvalho, Helena Pestana, João Figueira, J.C. Castro Pinto, J.J. Dias Curto, 
Margarida Perestrelo e Paula Vicente. 
Finalmente, uma palavra de apreço a todos os alunos, quer das licenciatu- 
ras do ISCTE, quer dos mestrados do INDEGIISCTE, cujas sugestões, dúvidas 
e problemas certamente contribuíram para enriquecer este livro. 
Os autores 
I. Duasrazões para se estudar estatística 
Existem duas boas razões para se saber Estatística. Primeiro, qualquer 
cidadão está diariamente exposto a um enorme conjunto de informações 
resultantes de estudos sociológicos e de mercado ou económicos, de sonda- 
gens políticas ou mesmo de pesquisa científica. Muitos destes resultados 
baseiam-se em inquéritos por amostragem. Alguns deles utilizam, para o efeito, 
uma amostra representativa de dimensão adequada e recolhida por um pro- 
cesso aleatório. Outros não. Para estes, a validade dos resultados não 
ultrapassa a amostra que os originou. A afirmação de que é fácil mentir com 
Estatística é quase um lugar comum. Qualquer manual que se preze apresenta 
nas primeiras páginas a famosa citação atribuída a Benjamin Disraeli: <<There 
is three kinds of lies: lies, damned lies and statistics),. E o pior é que, de certa 
forma, esta citação é verdadeira: é fácil distorcer e manipular resultados e 
conclusões e enganar alguém não-(in)formado. Mas saber Estatística permite 
que se avaliem os métodos de recolha, os próprios resultados, se detectem e 
rejeitem falsas conclusões. 
Se, para muitos, a necessidade de saber Estatística advém do facto de 
serem cidadãos do mundo, para alguns essa necessidade é acrescida por uma 
actividade profissional que requer a utilização de métodos estatísticos de 
recolha, análise e interpretação de dados. E esta é a segunda razão para se 
estudar Estatística. A utilização da Estatística nas ciências sociais, políticas, 
económicas, biológicas, físicas, médicas, de engenharia, etc, é por demais 
conhecida: os métodos de amostragem e de inferência estatística tornaram-se 
um dos principais instrumentos do método científico. Para todos os que traba- 
lham nestas áreas, é vital um conhecimento básico dos conceitos, 
possibilidades e limitações desses métodos. 
2. A necessidade da estatística nas ciências 
económicas e de gestão 
Nas áreas económicas e de gestão de empresas, a Estatística pode ser 
utilizada com três objectivos: (1) descrever e compreender relações entre 
diferentes características de uma população, (2) tomar decisões mais correctas 
e (3) fazer face a mudança. 
ESTA J/.SJICA APLICADA 
A quantidade de informação recolhida, processada e finalmente apresenta- 
da a um comum mortal cresce tão rapidamente que um processo de selecção 
e identificação das relações mais importantes se torna imprescindível. É aqui 
que a Estatística poderá dar o seu primeiro contributo, quer através de métodos 
meramente descritivos, quer utilizando métodos mais sofisticados de genera- 
lização dos resultados de uma amostra a toda a população. 
Uma vez identificadas as relações, estas poderão constituir uma ajuda 
preciosa a tomada de decisões correctas em situações de incerteza. Veja-se 
o seguinte exemplo. 
Através de métodos estatísticos adequados, determinada instituição bancá- 
ria identificou as características sócio-económicas daqueles que considera 
serem bons clientes. Esta identificação permite-lhe, no futuro, rejeitar pedidos 
de crédito por parte de potenciais clientes, cujas características mais se afas- 
tam das anteriores. 
Planear significa determinar antecipadamente as acções a empreender no 
futuro. Para fazer face a mudança, é necessário que as decisões e o planea- 
mento se apoiem numa análise cuidada da situação presente e numa previsão 
realista do que acontecerá no futuro. 
Os métodos estatísticos de previsão não permitem adivinhar com uma 
precisão absoluta os acontecimentos futuros, mas permitem medir as variações 
actuais e estabelecer os cenários futuros mais prováveis, diminuindo, de algum 
modo, a incerteza inerente a esses acontecimentos futuros. 
Na gestão das empresas, a tomada de decisão é crucial e faz parte do 
dia-a-dia de qualquer gestor. As consequências dessas decisões são dema- 
siado importantes para que possam basear-se apenas na intuição ou feeling 
momentâneos. 
Os gestores são responsáveis pelas decisões mesmo quando estas se 
baseiam em informações incompletas ou incertas. É precisamente porque a 
informação disponível está associado um elevado grau de incerteza que a 
Estatística se tornou tão importante no processo de tomada de decisões: a 
Estatística permite a extracção de conclusões válidas a partir de informação 
incompleta. 
O ambiente de formação de uma decisão varia de um extremo em que 
muita, pouca, ou nenhuma informação está disponível, ao extremo oposto em 
que o decisor detém toda ou quase toda a informação sobre a situação. Este 
último extremo significa que o decisor conhece a situação de todos os elemen- 
tos da população. A informação disponível a partir dos recenseamentos do INE, 
realizados de 10 em 10 anos, é um exemplo. Mas a situação mais comum 
para os gestores é aquela em que quase nenhuma informação se encontra 
disponível. Veja-se o exemplo do lançamento de um novo produto utilizando 
tecnologia de ponta praticamente desconhecida dos consumidores. Como irão 
estes reagir ao lançamento do novo produto? A partida, pouca ou nenhuma 
informação existe para que o gestor possa responder a esta pergunta. 
A Estatística fornece aos gestores instrumentos para que possam responder 
a estas questões e tomar decisões com alguma confiança, mesmo quando a 
quantidade de informação disponível é pequena e as situações futuras são de 
elevada incerteza. 
3. Método estatístico de resoluçáo 
de um problema 
Para que se obtenham resultados válidos, o investigador deve seguir todos 
os passos que definem o método estatístico de resolução de problemas: 
1. Identificar correctamente o problema em análise. Mesmo em estudos 
exploratórios cujo objectivo é identificar possíveis relações entre as caracterís- 
ticas dos indivíduos sem que, a partida, se defina um modelo regulador dessas 
relações, é necessário identificar o problema para o qual se pretendem encon- 
trar respostas. 
2. Recolher a informação necessária, relevante para o problema em estudo, 
em tempo útil e tão completa quanto possível. Esta informação poderá consistir 
em dados primários, recolhidos através de um questionário, ou dados secun- 
dários, recolhidos e publicados através de outra fonte de informação. 
3. Classificar e organizar os dados, por exemplo, através da codificação e 
criação de uma base de dados em suporte informático. Uma vez ultrapassada 
esta fase, é já possível reduzir a quantidade de informação, fazendo desapa- 
recer os pormenores menos importantes através de medidas de estatística 
descritiva (medidas de tendência central, dispersão, concentração, etc ), qua- 
dros e gráficos. 
4. Análise dos dados e apresentação dos resultados: identificar relações, 
testar hipóteses, definir modelos com a ajuda de métodos estatísticos apro- 
priados. 
ESTAT~STICA APLICADA 
5. Tomar a decisão mais adequada, ponderando as possíveis opções face 
aos objectivos inicialmente propostos. A qualidade da informação recolhida e 
as capacidades do investigador determinam, em grande parte, a adequabilida- 
de das opções propostas. 
Esta tis tica descritiva e in ferêncía estatística 
Embora a classificação e organização dos dados a que se faz referência 
no terceiro passo seja ainda um capítulo importante da Estatística - a Esta- 
tística Descritiva - um segundo capítulo torna-se muito mais importante, 
quando os dados recolhidos respeitam apenas a um subconjunto da população 
em estudo e não a toda a população - a Inferência Estatística. Só quando o 
grupo sobre o qual se pretende obter informação é de dimensão reduzida, se 
torna viável recolher essa informação para todos os elementos desse grupo. 
O recenseamento de uma população envolve custos e tempos demasiado 
elevados para serem suportados por organizações não vocacionadas para o 
efeito. Por essa razão, se tornaram populares e se generalizaram a todos os 
domínios científicos as técnicas de amostragem.Contrariamente a um recenseamento, onde se recolhe informação sobre as 
características de toda uma população, uma amostra fornece informação sobre 
um subconjunto dessa população. 
Os métodos de Inferência Estatística permitem (1) estimar as características 
desconhecidas de uma população (por exemplo, a proporção de consumidores 
que preferem uma dada marca de detergentes) e (2) testar se determinadas 
hipóteses sobre essas características desconhecidas são plausíveis (por 
exemplo, se a afirmação de um vendedor de que os resultados de lavagem 
da marca que vende são superiores aos de outras marcas concorrentes). 
Nos exemplos anteriores, as características das populações (proporção de 
consumidores e resultados médios da aplicação do produto) são os parâme- 
tros. Quando respeitam a uma amostra, estes indicadores estatísticos passam 
a chamar-se estatísticas. 
0 s métodos de Inferência Estatística envolvem o cálculo de estatísticas, a 
partir das quais se infere sobre os parâmetros da população, isto é, permitem, 
com determinado grau de probabilidade, generalizar a população certas con- 
clusões, por comparação com os resultados amostrais. 
Exemplos de parâmetros são a média de uma população (p), a variância 
(o2) ou o desvio-padrão (o). Como exemplos de estatísticas: a média (X), a 
variância (s2) OU O desvio-padrão ( s ) amostrais. 
A distinção entre parâmetro e estatística torna-se extremamente importante 
na Inferência Estatística. Muitas vezes pretende-se estimar o valor de um 
parâmetro ou fazer um teste de hipóteses sobre o seu valor. No entanto, o 
cálculo dos parâmetros é, geralmente, impossível ou impraticável, devido aos 
requisitos de tempo e dinheiro a que obriga. Nestes casos, a escolha de uma 
amostra aleatória permite que se obtenha uma estimativa para o parâmetro. A 
base da Inferência Estatística consiste, assim, na possibilidade de se tomarem 
decisões sobre os parâmetros de uma população, sem que seja necessário 
proceder a um recenseamento de toda a população. 
%+-?+%.o. **.. 
Exemplo 
Um industrial de máquinas de lavar quer determinar qual o número médio de 
lavagens de determinado tipo de máquina (lavar e secar), até que necessitem de 
reparação. O parâmetro que pretende conhecer é o número médio de lavagens 
das máquinas até serem reparadas. O técnico da sua fábrica selecciona aleato- 
riamente algumas máquinas da sua produção mensal, e verifica as lavagens 
efectuadas até ocorrer uma avaria, calculando, em seguida, para as máquinas da 
amostra, o número médio de lavagens, isto é, a média amostral. 
A figura seguinte demonstra o processo seguido. 
Amostra aleatória 
Amostra 
Estatísticas (conhecidas) 
Parâmetros (desconhecidos) / 
Inferência Estatística 
ESTAT~STICA APLICADA 
O processo de generalizar a população os resultados recolhidos na amostra 
é feito num ambiente de incerteza. A não ser que o valor dos parâmetros seja 
calculado a partir de todos os elementos da população, nunca se saberá com 
certeza se as estimativas ou inferências feitas são verdadeiras ou não. Num 
esforço para medir o grau de confiança ou de certeza associado aos resultados 
do processo de inferência, a Estatística utiliza a teoria das probabilidades. Por 
essa razão se dedica um capítulo deste livro ao estudo das probabilidades. 
5. Escalas de medida dos dados estatístícos 
Os exemplos de dados que diariamente se podem recolher são dos mais 
variados. Vejamos alguns: a temperatura máxima na cidade de Lisboa; a cota- 
ção do escudo e das restantes moedas do Sistema Monetário Europeu; as 
taxas de inflação dos países da União Europeia; as exportações de material 
electrónico dos países da Ásia Oriental; a distribuição etária da população do 
concelho de Lisboa; a distribuição por sexos dessa mesma população; as 
profissões da população da Marinha Grande; a distribuição dos emigrantes 
portugueses por países de acolhimento; as preferências da população portu- 
guesa no que respeita as suas viagens de férias; as preferências dos portu- 
gueses em relação aos quatro canais de televisão nacional; as quotas de 
mercado das diferentes marcas de automóveis utilitários. 
Estes exemplos de dados estatísticos diferenciam-se, não só por se referi- 
rem a características de diferentes populações, mas também por estarem 
definidos em diferentes escalas de medida e, portanto, por necessitarem de 
diferentes métodos estatísticos para os descreverem e analisarem. São quatro 
os tipos de escalas de medida: nominal, ordinal, por intervalos e por rácios. 
Nem sempre é evidente a distinção entre estas escalas, sobretudo entre as 
duas últimas. A classificaqão que se descreverá em seguida é a adoptada pelos 
autores deste livro, embora se reconheça não existir unanimidade neste domí- 
nio. 
Resumo histórico 
Não é possível fazer a história da Estatística sem falar em probabilidades. 
Estas tiveram a sua origem no estudo dos jogos de azar, já conhecidos dos 
Egípcios 3500 anos A.C. Mas só no século xvi se assiste a primeira tentativa 
de desenvolver uma teoria das probabilidades. 
Cardano foi um dos primeiros a tentar descrever um método de cálculo 
das probabilidades bem como as suas leis básicas. Cardano pode ser consi- 
derado como um verdadeiro cientista da Época Renascentista: escreveu sobre 
todas as áreas de estudo da época incluindo a matemática, a teologia, a 
cosmologia e a medicina. Com o seu livro intitulado The book on games of 
chance, Cardano não só explica as leis da probabilidade como analisa os jogos 
de azar e ensina a jogar e a detectar os abatoteiros)). A sua experiência como 
jogador inveterado ajuda-o a analisar correctamente os jogos de dados e a 
compreender, também de modo correcto, o cálculo de probabilidades para os 
casos simétricos ou igualmente prováveis. Nestes casos, a probabilidade de 
um acontecimento é o quociente entre o número de resultados que permitem 
a realização desse acontecimento e o número total de resultados possíveis. 
Por exemplo, a probabilidade de que saia uma face par no lançamento de um 
dado é 3/í, uma vez que há seis resultados possíveis (1, 2, 3, 4, 5, 6) e três 
deles são números pares (2,4,6). Uma importante lei probabilística descoberta 
por Cardano foi a lei do produto de acontecimentos independentes. A proba- 
bilidade de sair «Face,> quando se lança uma moeda é 1/2. A probabilidade de 
sair <(Face 2,) quando se lança um dado é 1/6. A probabilidade de estes dois 
acontecimentos ocorrerem quando se lança uma moeda e um dado é o produto 
das duas: ( 1 4 . ('/E) = 1/12. 
Cinco décadas mais tarde, Galileu respondeu aos jogadores sobre uma 
questão que, aparentemente, os preocupava: quando se lançam três dados, o 
total de 10 pontos ocorre mais vezes que um total de 9, o que Ihes parecia 
contraditório uma vez que é igual o número de combinações (6) que somam 
9 (621, 531, 522, 441, 432, 333) e 10 pontos (631, 622, 541, 532, 442, 433). 
Mas Galileu mostrou que só é possível que os resultados tenham diferente 
probabilidade se a ordem for também tomada em consideração e, nesse caso, 
ESTAT~STICA APLICADA 
o número de resultados com soma igual a 9 é de 25, e com soma igual a 10, 
de 27, resultando em probabilidades de 25/21s e 27/216, respectivamente. O 
que muitos autores se admiram é que os jogadores se tenham apercebido 
desta diferença tão diminuta! 
O estudo sistemático das leis das probabilidades teve um contributo impor- 
tante com Pascal e Fermat e a correspondência trocada entre ambos. Tudo 
começou quando Chevalier de Méré, conhecido escritor e ardente jogador da 
corte de Luís xiv, consultou Fermat sobre problemas de divisão de apostas e 
interrupções antes de se completar um jogo. 
Blaise Pascal (1 623 - 1662) era uma criança prodígio que aos dezasseis 
anos já tinha escrito um livro e aos dezoito inventado uma máquina calcula- 
dora. Pierre de Fermat (1601- 1665) era um jurista de Toulouse que nos 
tempos livres se dedicava ao estudo da matemática, tendo já sido considerado 
como o maior matemático puro de todos os tempos. 
Se de Cardano se pode afirmar que marcou o fim da pré-história da Teoria 
das Probabilidades, Fermat e Pascal deram o passo decisivo no desenvolvi- 
mento desta teoria e na fundamentação teórica da Inferência Estatística. No 
final do século xvii, Leibniz publicou duas obras, uma sobre problemas com- 
binatórios, e outra sobre a aplicação das probabilidades as questões 
financeiras. Foi sob o seu conselho que Jacques Bernoulli estudou o assunto 
de tal modo que o cálculo das probabilidades adquire finalmente o estatuto de 
ciência. O teorema de Bernoulli apresenta pela primeira vez a correspondência 
entre frequências e probabilidades, dando origem a um novo conceito de 
probabilidade. O conceito de probabilidade inversa é definido por Thomas 
Bayes ainda no século xviii. A importância dos resultados de Bayes só vem a 
ser reconhecida quase dois séculos depois, quando se forma, dentro da Esta- 
tística, uma nova corrente: a escola Bayesiana. 
Durante o século xix o desenvolvimento do cálculo das probabilidades 
deveu-se ao contributo de três astrónomos: Laplace, Gauss e Quetelet. 
Muitos dos desenvolvimentos posteriores, nomeadamente da escola russa 
(Chebyshev, Markov e Lyapunov), baseiam-se na análise e desenvolvimento 
da obra de Laplace. Gauss explanou uma teoria sobre a análise de observação 
aplicável a qualquer ramo da ciência, contribuindo, assim, para alargar o 
campo de aplicação do cálculo das probabilidades. Quetelet iniciou a sua 
aplicação aos fenómenos sociais. A ele se deve a introdução do conceito de 
<<homem médio. e a chamada de atenção para a consistência dos fenómenos 
sociais. 
TEORIA DAS PROBABILIDADES 
A distinção entre Estatística e Probabilidades parece já ser impossível. 
Desde o final do século xix que muitos contribuíram para o desenvolvimento 
da Estatística com valiosas antecipações que só mais tarde puderam ser 
plenamente compreendidas. De entre estes talvez se possam destacar Karl 
Pearson, William Gosset que escreveu sob o pseudónimo de ((Studentn e 
Ronald Fisher, pelo vigoroso impulso dado a Estatística. Pearson, que se 
dedicou ao estudo da correlação, cuja descoberta é atribuída a Galton, foi um 
entusiasta do evolucionismo de Darwin, desenvolveu extraordinariamente os 
métodos de tratamento de dados, para além de se interessar pelo cálculo das 
probabilidades. Em 1894, depois de analisar um elevado número de resultados 
das roletas num casino, chegou a conclusão de que estas estavam viciadas e 
que não serviam como laboratório para análise das probabilidades; em suma, 
a razão de ser dos casinos não era, de modo nenhum, científica. Mas estas 
experiências no início da sua carreira não deixaram de ser úteis na aplicação 
que fez da teoria das probabilidades a evolução biológica e a importantes 
descobertas estatísticas como o teste do qui-quadrado, utilizado para testar se 
uma dada distribuição de frequência segue determinada distribuição probabi- 
Iística. Gosset, ou seja, «Student>), trabalhava para uma empresa produtora de 
cervejas - a Guiness - e começou uma nova fase nos estudos estatísticos 
com os métodos de tratamento de pequenas amostras. Fisher deu, talvez, a 
mais importante contribuição a Estatística Matemática e a sua divulgação. O 
livro que publicou em 1925, Statiscal Methods for Research Workers, permitiu 
aos investigadores a familiarização necessária com os métodos estatísticos e 
a sua aplicação a problemas práticos. 
Muitos outros nomes poderiam ser referidos neste percurso de quase quatro 
séculos. Todos contribuíram para que, quando Fisher publicou o seu livro, há 
muito se tivesse deixado de definir Estatística como (<o estudo dos assuntos 
de Estado,,, associando-a a teoria das probabilidades. Com o século xx, a 
Estatística tornou-se um instrumento de análise poderoso aplicado em todas 
as áreas do saber e a que o desenvolvimento informático veio dar novo fôlego. 
Conceitos da teoria 
de probabilidades 
Se lhe perguntassem o significado da seguinte frase - (<Se lançar uma 
moeda ao ar, a probabilidade de sair (<Face>> é )> - a sua resposta talvez 
fosse: <<Só há dois resultados possíveis com iguais hipóteses de ocorrerem>>. 
Mas suponha que lhe perguntavam também: (<Qual a probabilidade de um carro 
avariar ao atravessar a ponte 25 de Abril?),. Também aqui existem apenas dois 
resultados possíveis: ao atravessar a ponte ou o carro avaria ou não avaria. 
Mas já será impossível responder que essa probabilidade é l/2. A simetria ou 
equiprobabilidade existente na primeira experiência (lançamento de uma moe- 
da ao ar) já não se verifica na segunda. Esta é a situação mais comum, a de 
experiências cujos resultados são influenciados pelo acaso e aos quais estão 
associadas diferentes probabilidades. 
2.1. Experiência aleatória 
São objecto de estudo na teoria das probabilidades os fenómenos aleató- 
rios, ou seja, acontecimentos influenciados pelo acaso. Na base desta teoria 
está o conceito de experiência aleatória, isto é, o processo de observação ou 
de acção cujos resultados, embora podendo ser descritos no seu conjunto, não 
são determináveis a priori, antes de realizada a experiência. 
Uma experiência aleatória tem como características (Murteira, 1979: 16): 
- A possibilidade de repetição da experiência em condições similares; 
- Não se poder dizer a partida qual o resultado (fenómeno aleatório) da 
experiência a realizar, mas poder descrever-se o conjunto de todos os 
resultados possíveis; 
- A existência de regularidade quando a experiência é repetida muitas 
vezes. 
TEORIA DAS PROBABILIDADES 
É com base nesta última característica que se desenvolve toda uma teoria 
e um conjunto de modelos probabilísticos tendentes a explicar os fenómenos 
aleatórios e a dar uma indicação da maior ou menor probabilidade da sua 
ocorrência. A experiência aleatória contrapõe-se a experiência não aleatória ou 
determinística, aquela cujo resultado pode ser conhecido antes da sua reali- 
zação. Por exemplo, o valor da velocidade de propagação do som (340 mls) 
é conhecido mesmo antes de realizada a experiência, o mesmo acontecendo 
com a medição da temperatura de entrada em ebulição da água, cujo resultado 
(lOoO C) é conhecido a priori. Já o mesmo não sucede quando lançamos ao 
ar um dado ou extraímos uma carta dum baralho, quando medimos a duração 
de vida de uma Iâmpada ou observamos o resultado do exame de um estu- 
dante escolhido ao acaso. Embora se possa dizer, no caso do exame, que o 
estudante irá obter uma classificação entre O e 20 valores, não podemos 
afirmar qual a classificação exacta que o estudante obterá, se por exemplo 10, 
14 ou 18 valores. Essa classificação só será conhecida depois de realizado o 
exame. O mesmo acontece com a duração de vida de uma Iâmpada; talvez 
se possa afirmar que ela durará entre O e 100 horas, mas o valor exacto da 
sua duração não é conhecido senão depois de a Iâmpada se ter fundido. 
Quando lançamos ao ar um dado e observamos o número inscrito na face 
voltada para cima, podemos descrever o conjunto de todos os resultados que 
poderão ocorrer (1, 2, 3, 4, 5 e 6), mas já é impossível, antes de efectuarmos 
o lançamento, afirmar qual a face que irá sair. Depois de efectuado o lança- 
mento, certamente que alguma face terá ocorrido, por exemplo a face 3. 
Dizemos então que <<3), é o resultado desta experiência aleatória. 
2.2. Espaço de resultados 
Numa determinada experiência aleatória, o conjunto de todos os resultados 
possíveis designa-se por espaço de resultados, e representa-se pela letra 
grega C&. 
No exemplo do lançamento do dado, L2 = { 1, 2, 3, 4, 5, 6 } . 
A maior parte das vezes não se descrevem em detalhe as condições e as 
circunstâncias que caracterizam umaexperiência aleatória. É esta de resto a 
dificuldade de fundo do cálculo das probabilidades: descrição das condições 
uniformes em que um acontecimento aleatório se verifica ou não. 
ESTAT~STICA APLICADA 
Se o número de elementos do espaço de resultados for finito ou infinito 
numerável trata-se de um espaço de resultados discreto; havendo um número 
infinito não numerável de elementos dispõe-se de um espaço de resultados 
contínuo. Um espaço de resultados pode ser ainda quantitativo ou qualitativo, 
conforme a natureza dos elementos que o compõem. A indicação dos elemen- 
tos do espaço de resultados pode fazer-se, quer pela enumeração de todos 
os elementos que o compõem (quando são em número finito, evidentemente) 
- definição por extensão - quer pela descrição abreviada desses elementos 
- definição por compreensão. 
Uma loja abre as 9 horas e encerra as 19. Um cliente, tomado ao acaso, entra 
na loja no momento X e sai no momento Y (tanto X como Y são expressos em 
horas com origem nas 9). Pretende observar-se os momentos de entrada e saída 
do cliente. 
Como a chegada e saída de um cliente se processa ao acaso, logicamente 
que poderá ocorrer em qualquer momento no tempo, entre as 9 e as 19 horas, 
pelo que X e Y são variáveis contínuas com X < Y. Portanto, o espaço de 
resultados R é infinito não numerável, podendo descrever-se da forma seguinte: 
(definição de R por compreensão). 
- * - .-> -. -. . - . 
Exemplo 2 
Considere-se a experiência aleatória que consiste no lançamento de um dado 
e observação do número inscrito na face voltada para cima. 
O espaço de resultados é 
R = {1,2,3,4,5,6) 
(definição de R por extensão). 
TEORIA DAS PROBABILIDADES 
2.3. A con tecimentos 
Retome-se o exemplo da experiência aleatória que consiste no lançamento 
de um dado e cujo espaço de resultados é L2 = {1,2,3,4,5,6 ) . 
Sendo o espaço de resultados um conjunto, é possível formar subconjuntos 
dos seus elementos, como, por exemplo: 
cujo significado é, respectivamente: 
A: saída de face 2 
B: saída de face ímpar 
C: saída de face divisível por 3. 
A, B e C, sendo subconjuntos de Q, são simultaneamente conjuntos de 
resultados possíveis da experiência aleatória. Designam-se por acontecimentos. 
Um acontecimento é, pois, um conjunto de resultados possíveis de uma 
experiência aleatória ou, de modo equivalente, qualquer subconjunto do espa- 
ço de resultados é um acontecimento definido em i2 (eventualmente o próprio 
Q ou o conjunto vazio 0). 
Um acontecimento A relativo a um determinado espaço de resultados Q e 
associado a uma experiência aleatória é simplesmente um conjunto de resul- 
tados possíveis. Diz-se que A se realizou, se o resultado da experiência 
aleatória, w, é um elemento de A, isto é, se o, E A. 
Não se deverá confundir acontecimento com resultado. Enquanto que o 
primeiro significa algo que a experiência aleatória pode produzir, mas não se 
realiza necessariamente, um resultado indica algo que a experiência aleatória 
produziu. Ou seja, o conceito de resultado só tem sentido depois de realizada 
a experiência, enquanto que o conceito de acontecimento tem pleno sentido 
mesmo antes da experiência aleatória se realizar. 
Um acontecimento, A, diz-se acontecimento elementar se a sua realização 
depender da ocorrência de somente um resultado específico da experiência 
aleatória. 
ESTAT~STICA APLICADA 
Por oposição poder-se-á definir um acontecimento complexo ou composto 
aquele cuja realização implica a ocorrência de um resultado da experiência 
aleatória, qualquer um de entre os vários possíveis para aquele acontecimento. 
",-." , , _*.. . . _. .l . ' * , , '"- ." ..-. < < . I.",..IIV *.^ - . < >. ..,..- "- 1 - - 
Exemplo 3 
Admita-se a seguinte experiência aleatória: contagem do número de peças 
produzidas por uma máquina até ao aparecimento de uma peça defeituosa. 
A experiência consiste, portanto, em contar as peças produzidas pela máqui- 
na, interrompendo-se essa contagem no momento em que surgir uma defeituosa. 
Como se poderá verificar, qualquer número inteiro pode ser um resultado da 
experiência: 
- pode ser 0, se a primeira peça retirada for defeituosa; 
- pode ser 1, se a primeira peça for boa e a segunda defeituosa; 
- pode ser 2, se as duas primeiras forem boas e a terceira defeituosa; 
- e assim por diante. Em geral, poderá ser n se as primeiras n peças forem 
boas e a n + 1 defeituosa. 
O espaço de resultados associado a esta esperiência aleatória é o conjunto 
dos números inteiros 
Serão acontecimentos, por exemplo, os seguintes subconjuntos de Q: 
ou 
A: contam-se seis peças até sair uma defeituosa. 
B: conta-se um número par de peças até sair uma defeituosa. 
Para que A se realize terá que ocorrer um, e sómente um, dos possíveis 
resultados da experiência aleatória (6); diz-se então que A é um acontecimento 
elementar. Pelo contrário, para que B se realize, basta que ocorra um, mas 
qualquer um, de entre os vários resultados possíveis, e que são todos os que 
correspondem a contagens pares (2, 4, 6, 8 ...). Trata-se, portanto, de um acon- 
tecimento complexo. 
Torna-se ainda mais nítida a diferença entre acontecimento e resultado 
quando se trata de acontecimentos complexos: enquanto que o primeiro prevê 
a possibilidade de ocorrência de vários resultados, depois de realizada a 
experiência aleatória apenas ocorrerá um desses resultados possíveis. 
Na Teoria das Probabilidades, um acontecimento não é, nem um conceito 
referente ao passado, nem um conceito com ocorrência assegurada no futuro. 
É apenas uma eventualidade (acontecimento elementar) ou um conjunto de 
eventualidades (acontecimento complexo) cuja ocorrência depende do acaso. 
Os acontecimentos podem ainda ser classificados em certos, possíveis e 
impossíveis. 
Considere-se a experiência aleatória que consiste em medir o tempo neces- 
sário para que um aluno com o 12Qno obtenha uma licenciatura em gestão de 
empresas. Admitindo-se que nenhum destes alunos poderá levar mais de 20 anos 
para tal e considerando que em algumas instituições universitárias a duração 
mínima da licenciatura é de quatro anos, o espaço de resultados desta experiên- 
cia aleatória será: 
Sejam os seguintes acontecimentos 
A: o tempo necessário para obtenção da licenciatura é de 5 anos 
6: o tempo necessário é igual ou superior a 4 anos mas não superior a 20 
anos. 
C o tempo necessário é de 2 anos. 
Poder-se-á dizer que A é um acontecimento possível, B é um acontecimento 
certo e C é um acontecimento impossível. 
6 é um acontecimento certo porque ocorre sempre, sendo o conjunto que o 
define 
6 = [4,20] 
exactamente coincidente com o próprio espaço de resultados. Já o acontecimento 
C não ocorre, qualquer que seja o resultado da experiência aleatória e, como não 
existe qualquer resultado que torne viável a sua realização, o conjunto que define 
C é o vazio: 
c = 0 
ESTAT~STICA APLICADA 
O acontecimento A situa-se, relativamente a B e C, numa situação intenédia 
quanto ao grau de possibilidade de se realizar. A é apenas possível, podendo 
ocorrer ou não depois de realizada a experiência aleatória. 
Considere-se um novo acontecimento 
D: o tempo necessário para obtenção da licenciatura é superior a 4 e inferior 
a 6 anos 
OU 
D = ]4,6[. 
Verifica-se que quando A se realizar, D também se realiza, uma vez que A é 
um subconjunto de D. 
Então, A é um sub-acontecimento de D, A c D, pois a realização de A implica 
a realização de D. 
d~gebra dos acontecimentos Q 
Definiu-se acontecimento como um conjunto de resultados possíveis de 
uma experiência aleatória. Esta definição sugere'que se poderá utilizar todos 
os instrumentos da teoria dos conjuntos para representar os acontecimentos 
e as operações que se definem sobre estes. Por exemplo, o diagrama de Venn 
revela-se de extrema utilidadena representação de acontecimentos: o conjunto 
universal é identificado como o espaço de resultados L2 da experiência alea- 
tória e cada acontecimento A por uma região interior a Q. 
De modo idêntico, o diagrama de Venn pode ser utilizado para representar, 
de forma simplificada e sugestiva, as operações que se definem sobre acon- 
tecimentos: união ou soma lógica, intersecção ou produto lógico e diferença. 
3.1. União de acontecimentos 
ESTAT~TICA APLICADA 
A união de acontecimentos implica, pois, a ideia de disjunção, de alternativa, 
traduzida por ou; para que se realize o acontecimento união basta que ocorra 
pelo menos um dos acontecimentos: ou A, ou B ou ambos. 
Diagramaticamente, a união de A com B pode representar-se da seguinte 
forma: 
A operação união de acontecimentos pode ser generalizada a mais de dois 
acontecimentos. 
Dada uma sucessão infinita de acontecimentos Al, A2, ..., A,, ... , define- 
m 
se a sua união Ai como sendo o acontecimento que ocorrerá se e 
i= 1 
somente se ocorrer pelo menos um dos acontecimentos Ai. 
3.2. Intersecção de acontecimentos 
Contrariamente a união, a intersecção implica a ideia de conjunção, simul- 
taneidade ou sequência, a ideia de e: o acontecimento A B só se realiza 
TEORIA DAS PROBABILIDADES 
quando se realizarem os acontecimentos A e 9. Diagramaticamente, a inter- 
secção de A e B pode ser representada da seguinte forma: 
Também esta operação pode ser generalizada a um conjunto, finito ou 
infinito, de acontecimentos. 
Há certos acontecimentos que não podem ocorrer simultaneamente, logo 
a sua intersecção é o acontecimento impossível, isto é, corresponde a um 
conjunto vazio. Acontecimentos nestas condições, em que a ocorrência de um 
exclui a ocorrência dos restantes, dizem-se mutuamente exclusivos ou incom- 
pa tíveis. 
No diagrama de Venn anterior representam-se três acontecimentos mutua- 
mente exclusivos. 
. - . 
Exemplo 5 
Seja a experiência aleatória que consiste no lançamento de um dado e os 
dois acontecimentos a ela associados: 
A : saída de face par; A = { 2 , 4 , 6 ) 
B : saída de face ímpar; B = { 1,3,5 ) 
A e B são mutuamente exclusivos ou incompatíveis, uma vez que não podem 
ocorrer simultaneamente: se ocorre A, isto é, sai face par, não pode ocorrer B e 
vice-versa. 
3.3. Diferença de acontecimentos 
Diagramaticamente 
TEORIA DAS PROBABILIDADES 
Seja a experiência aleatória que consiste em medir o consumo médio per 
capita de cerveja em Portugal (em litros) e A e B os seguintes acontecimentos: 
A: o consumo médio per capita é superior ou igual a 30 litros mas inferior a 
50 litros. 
B: o consumo médio per capita é igual ou superior a 40 litros mas inferior a 
75 litros. 
A - B é o acontecimento «o consumo médio per capita é igual ou superior a 
30 litros mas inferior a 40 litros» dado que 
ESTAT~STICA APLICADA 
3.4. Propriedades das operações 
Em seguida apresentam-se as propriedades mais importantes das opera- 
ções de união e intersecção de acontecimentos. 
PROPRIEDADES 
1 . Comutativa 
/ 3. Distributiva I A u ( B n C ) = / A n < B u C ) = I 
UNIÁO 
2. Associativa 
INTERSECÇÁO 
A U B = B U A A n B = B n A 
A u ( B u C ) = ( A u B ) u C 
4. Idempotência 
A n < B n c > = < A n B ) n c 
5. Lei do complemento 
6. Leis de De Morgan 
A u A = A 
7. Elemento neutro 
A n A = A 
A 2 = Q 
- 
A = 2 ij 
8. Elemento absorvente 
A ~ Ã = D 
A ~ B = Ã u B 
A u 0 = A A n Q = A 
A = Q A n 0 = 0 
Conceitos de probabilidade a 
Quais as hipóteses de que o rio Douro venha a ter um caudal abaixo do 
normal no próximo Verão? Qual a probabilidade de que a procura de automó- 
veis movidos a energia eléctrica venha a aumentar no próximo ano? Qual a 
probabilidade de que os trabalhadores do Metropolitano de Lisboa entrem em 
greve na próxima sexta-feira? As respostas a estas perguntas são dadas em 
termos da probabilidade ou verosimilhança de que cada um destes aconteci- 
mentos ocorra, sendo esta identificada como uma medida da certeza da 
ocorrência de cada acontecimento. 
Nas áreas económica e de gestão, os diferentes conceitos de probabilidade 
são largamente utilizados. Por exemplo, quando o primeiro-ministro afirma que 
a inflação no corrente ano não ultrapassará 4% ou quando um industrial prevê 
que as matérias-primas importadas para a sua produção não sofrerão um 
aumento de preços no curto prazo. As probabilidades fornecem aos gestores 
e economistas as bases para a tomada de decisão, quando existe incerteza 
sobre a evolução futura e sobre os efeitos práticos das suas decisões, isto é, 
quando a partir do passado não é possível prever deterministicamente o futuro, 
devido a influência do acaso, sendo no entanto possível prever as linhas de 
evolução futura e as possibilidades de estas se concretizarem. 
De acordo com a definição e o método de cálculo, podem definir-se três 
conceitos de probabilidade: clássica, empírica ou frequencista e subjectiva. As 
probabilidades que se baseiam nas características intrínsecas dos aconteci- 
mentos são definidas segundo o conceito clássico. Aquelas que se baseiam 
numa quantidade razoável de evidência objectiva são empíricas ou frequen- 
cistas, enquanto que as probabilidades definidas com base em crenças ou 
opiniões individuais se denominam subjectivas. 
ESTAT~STICA APLICADA 
4 I Conceito clássico de probabilidade (a priori) 
Se a uma experiência aleatória se podem associar N resultados possíveis, 
mutuamente exclusivos e igualmente prováveis, e se nA desses resultados 
nA tiverem o atributo A, então a probabilidade de A é a fracção -, N 
onde: 
nA - número de resultados favoráveis a A 
N - número de resultados possíveis 
Repare-se que, para o conceito clássico de probabilidade, os resultados 
possíveis são todos igualmente prováveis, isto é, têm todos igual probabilidade 
de se realizarem. É este o conceito subjacente aos chamados jogos de azar, 
cuja prévia apresentação sistemática foi feita por Cardano. Este define como 
probabilidade de um acontecimento o rácio entre o número de resultados que 
fazem com que o acontecimento se realize e o número total de resultados. Por 
exemplo, a probabilidade de sair um número par quando se lança um dado é 
de 3/6 porque existem seis resultados possíveis e três deles são números 
pares. 
Galileu, meio século mais tarde, utilizou o mesmo conceito de probabilidade 
para responder a uma dúvida dos jogadores que notaram, no lançamento de 
três dados, saírem mais vezes faces que somam um total de 10 pontos do 
que 9 pontos. Tal como Cardano, Galileu sabia que era necessário ter em 
consideração a ordem dos resultados para que se possam associar probabi- 
lidades diferentes aos resultados. Assim, de 6 x 6 x 6 = 21 6 resultados 
possíveis, 25 somam 9 pontos e 27 somam um total de 10 pontos, de onde 
resultam, respectivamente, probabilidades de 25/216 e 27/216 . Este último 
exemplo ilustra bem a necessidade de recorrer a análise combinatória como 
método auxiliar para a contagem do número de casos favoráveis e do número 
de casos possíveis. 
TEORIA DAS PROBABILIDADES 
Na experiência aleatória que consiste no lançamento de um dado e observa- 
ção do número inscrito na face voltada para cima, seja A o acontecimento: saída 
da face 3. O espaço de resultados é definido pelos seguintes elementos 
R = { 1, 2, 3, 4, 5, 6 }. A probabilidade de se realizar o acontecimento A é: 
com: 
n~ - número de resultados favoráveis ao acontecimento A 
N - número de resultados possíveis. 
Consideremos a experiência aleatória que consiste no lançamento de uma 
moeda equilibrada ao ar. Seja A o acontecimento: saída de face. O espaço de 
resultados será constituído por R = { Face, Coroa ). A probabilidade de A será: 
Um investigador mostra a um indivíduo 12 corese pede-lhe que escreva 4 
que sejam suas favoritas. 
a) Quantos resultados possíveis existem? 
b) Se uma das cores do lote das 12 for azul, quantos resultados possíveis irão 
conter essa cor? 
pois o azul é sempre escolhido e portanto só 3 cores das restantes 11 
podem ser escolhidas. 
ESTAT~STICA APLICADA 
c) Qual a probabilidade de escolher a cor azul como uma das suas preferidas? 
4.2. Conceito frequencista 
de probabilidade (a posteriori) 
Se em N realizações de uma experiência, o acontecimento A se verificou 
n vezes, diz-se que a frequência relativa de A nas N realizações é 
sendo fA a frequência relativa do acontecimento A. 
Noutras N realizações da mesma experiência, desde que N seja suficien- 
temente elevado, a frequência relativa com que se realiza o acontecimento A 
é em geral diferente mas próxima da anterior. A medida que o número de 
provas aumenta, verifica-se uma regularidade das frequências relativas, de tal 
modo que a irregularidade dos resultados individuais se opõe uma certa regu- 
laridade estatística ao fim de uma longa série de provas, isto é, f A = VN tende 
a estabilizar. É esta característica das experiências aleatórias que permite 
definir o conceito frequencista de probabilidade. 
Ao número para que tende a frequência relativa f A , quando se aumenta o 
número de provas, chama-se probabilidade do acontecimento A: 
P I A ] = lim fA 
N-s m 
Isto equivale a aceitar que numa sucessão numerosa de experiências é 
praticamente certo que a frequência relativa de A seja aproximadamente igual 
a P [A I. Esta regra está na base da definição frequencista de probabilidade. 
TEORIA DAS PROBABILIDADES 
O valor da frequência relativa é uma indicação do valor da probabilidade na 
experiência aleatória considerada, quando se repete essa experiência um 
número suficientemente grande de vezes. 
---- . "?*- w8".,,~% *-- ",, .- , . .- . . , , - .- ,~ -- . . . %.. . 
Exemplo 10 
A experiência aleatória que consiste na observação do sexo de um recém- 
-nascido pode considerar-se o exemplo típico para aplicação do conceito frequen- 
cista de probabilidade. Porque esta experiência já se realizou inúmeras vezes e 
existem registos do seu resultado, sabe-se que a probabilidade do sexo do 
recém-nascido ser masculino é de aproximadamente 0,52 e de ser feminino é de 
cerca de 0,48. 
A utilização do conceito clássico de probabilidade teria conduzido ao valor de 
0,5 para cada uma das referidas probabilidades, o que constituiria um erro. Este 
seria proveniente do facto de se considerarem equiprováveis os elementos do 
espaço de resultados S2 = { Masculino, Feminino }, quando estes o não são. 
4.3. Conceito subjectivo ou personalista 
de probabilidade 
Utilizando este conceito, a probabilidade de um acontecimento é dada pelo 
grau de credibilidade ou de confiança que cada pessoa dá a realização de um 
acontecimento. Baseia-se na informação quantitativa (ex: frequência de ocor- 
rência de um acontecimento) eiou qualitativa (ex: informação sobre experiência 
passada em situações semelhantes) que o decisor possui sobre o aconteci- 
mento em causa. Diferentes decisores podem atribuir diferentes probabilidades 
ao mesmo acontecimento decorrentes da experiência, atitudes, valores, etc, 
que possuem. 
Esta noção de probabilidade pode ser aplicada a experiências que, embora 
de resultado sujeito ao acaso, não se podem efectuar várias vezes nas mes- 
mas condições, casos em que os conceitos frequencista e clássico não se 
podem aplicar. 
ESTATíSTICA APLICADA 
* e?+ w,",*-- 2 - ".-- . W" . . . , . , . - 
Exemplo I 1 
Se o Primeiro Ministro afirmasse aa inflação para o próximo ano será de 3% 
com uma probabilidade de 0,9>> estaria a aplicar o conceito subjectivo ou perso- 
nalista de probabilidade. Uma outra figura política, da Oposição, diria certamente 
que tal meta seria difícil de atingir, e sendo instada a quantificar o que para ela 
era <<difícil» poderia mesmo afirmar: «Tal nível de inflação só será atingido com 
uma probabilidade de 0,25>>. Também esta figura política estará, deste modo, a 
aplicar o conceito personalista de probabilidade. 
II 
ESTAT~STICA APLICADA 
ou seja, 
P [ 0 ] = P [ Q ] - P [ a ] 
O acontecimento impossível tem probabilidade nula mas a recíproca não é 
verdadeira. A raridade dum acontecimento pode levar a que a sua probabili- 
dade seja zero sem que, no entanto, este seja impossível. É o caso em que, 
no lançamento duma moeda ao ar, esta fica em pé sem cair para nenhum dos 
lados. 
Sejam dois acontecimentos A e B quaisquer. Atendendo as propriedades 
das operações sobre acontecimentos, facilmente se demonstra o seguinte 
B = B ~ ( A ~ A ) 
B = ( B n A ) u í ~ n Ã > 
Os acontecimentos ( B r\ A ) e ( B n Ã ) são mutuamente exclusivos e 
( B n Ã ) é o acontecimento que se realiza quando se realiza B mas não se 
realiza A, logo 
B n Ã = { w : w E B A w E A } = B - A 
TEORIA DAS PROBABILIDADES 
Pelo axioma 3, teremos então 
P [ B ] = P [ B n A ] + P [ B n Ã ] 
ou 
logo 
Na produção de uma empresa de artigos de vestuário, 10% dos artigos 
produzidos têm defeitos de material (tecido), 5% têm defeitos de acabamento e 
2% defeitos de ambos os tipos. Qual a probabilidade de uma peça de vestuário 
retirada ao acaso ter apenas defeitos de tecido? 
Considerando os acontecimentos 
A: o artigo tem defeito de matéria prima (tecido) 
B: o artigo tem defeito de acabamento 
e o acontecimento 
A - B : o artigo tem apenas defeito de matéria prima 
a sua probabilidade será 
P [ A - B ] = P [ A ] - P [ A n B ] . 
De acordo com os dados disponíveis 
então 
P [ A - 51 = 0,10 - 0,02 = 0,08 
isto é, a probabilidade de uma peça de vestuário ter apenas defeitos de tecido é 
de 0,08. 
ESTAT~STICA APLICADA 
Considerem-se dois acontecimentos A e B quaisquer, mutuamente exclusi- 
vos ou não. Então, pelo teorema anterior e pelas propriedades das operações, 
A y B = ( A y B ) n s z = 
Aplicando probabilidades 
P[A y B ] = P [ A y ( 6 - A ) ] 
Mas, porque A e ( B - A ) são mutuamente exclusivos, 
P [ A y B ] = P [ A ] + P[B - A ] 
e utilizando o teorema anterior sobre a probabilidade da diferença de dois 
acontecimentos 
. " - , . " - . ~ P - ~ , - ~ r r ,><...i.I,T r-:-. ..r..?,.murw-,.w W v p . ~ " ' ..- r.*-.- -. . . ., -*.-. .--, "-*rq 
Exemplo 14 
Seja a experiência aleatória que consiste em retirar uma carta de um baralho 
de 52 cartas e considerem-se os acontecimentos: 
A: sai rei 
B: sai paus 
cujas probabilidades são, respectivamente, 4/52 e 13/52. 
A probabilidade do acontecimento união 
A y B : sai rei ou paus 
16 é P[A y B ] = -, uma vez que existem 16 resultados favoráveis (13 de 52 
saírem paus mais 3 de saírem reis que não são de paus) em 52 resultados 
possíveis. Esta probabilidade é diferente de 
pois ao somamos P[A] com P[B], conta-se duas vezes a probabilidade do 
acontecimento asai rei de paus» (acontecimento A n B ) comum aos aconteci- 
mentos A e B. É necessário, portanto, deduzir a probabilidade deste último 
acontecimento: 
P[A y B ] = P [A ] + P[B] - P[A n 51 = 
..- r-r r- olwl -rr, I-", %C<- rB r .r* 1 r - r * rr" -- ... ", *. -. r.r<. ,, .' - 
Exemplo 15 
Em determinada cidade, 30% da população de leitores de jomais diários 
compra o jornal aDiário>>, 40% o jornal «Público» e 10% compra os dois jomais. 
Se desta população escolhermos um leitor ao acaso, qual a probabilidade de ele 
comprar pelo menos um destes jomais, isto é, de ler o <<Diário>>, ou o <<Público» ou 
ambos? 
Considerando os acontecimentos: 
A: o leitor compra o diário» 
B: o leitor compra o <<Público» 
ESTAT~STICA APLICADA 
e sabendo que 
P [ A ] = 0,30 
P [ B ] = 0,40 
P [ A n B ] = 0,lO 
o que se pretende conhecer é P [ A y B ] . 
P [A y B ] = P [ A ] + P [ B ] - P [ A n B ] = 
= 0,30 + 0,40 - 0,lO = 
= 0,60 
isto é, 60% dos leitores compra pelo menos um destes jornais. 
TEORIA DAS PROBABILIDADES 
Para n = 3 
Para n = 4 
Exemplo 16 
A mesma população de leitores do exemplo anterior foi inquirida sobre as suas 
preferências relativamente a três revistas mensais A, B e C. Os resultados obtidos 
foram os seguintes: 
Qual a probabilidade de, um leitor escolhido ao acaso, ser leitor de 
a) Somente A e C? 
b) Pelo menos uma revista? 
Revista 
A 
B 
C 
A e B 
A e C 
B e C 
A e B e C 
As respostas a estas duas questões são imediatas se se atender ao teorema 
3 e a generalização do teorema 4: 
a) A probabilidade pedida é 
Leitores (Oh) 
9 8 
22,9 
12,l 
51 
3,7 
6,O 
2,4 
b) A probabilidade pedida é 
WoRIA DAS PROBABILIDADES 
Este problema poderia também ser resolvido com o auxilio de um diagrama 
de Venn. 
Probabilidades 
condicionadas 
A partir do momento em que se conhece a probabilidade de o acontecimen- 
to B (do espaço de resultados Q) ocorrer, é possível calcular a probabilidade de 
qualquer outro acontecimento A se realizar condicionado pelo acontecimento B. 
Um jogador da loteria compra três bilhetes para a extracção do Natal com os 
números 01011, 15555 e 22444, realizando-se o sorteio entre um total de 40000 
números, de 00000 a 39999. O acontecimento: 
A: o jogador obtém o primeiro prémio 
comporta três resultados favoráveis 
A = {01011, 15555, 22444) 
num total de 40000 resultados possíveis 
TEORIA DAS PROBABILIDADES 
Aplicando o conceito clássico de probabilidade facilmente se obtém a proba- 
bilidade de o jogador obter o primeiro prémio: 
Admita-se agora que, no dia da extracção, o jogador soube acidentalmente 
que o número premiado em primeiro lugar era um número par, embora não tivesse 
ainda conhecimento do número premiado. Qual será agora a probabilidade do 
jogador obter o primeiro prémio considerando a informação adicional de que, 
entretanto, tomou conhecimento? Isto é, qual a probabilidade de o jogador obter 
o primeiro prémio dado que o número premiado é par? 
O número de resultados favoráveis é agora apenas de 1, uma vez que o 
jogador apenas possui um bilhete com número par, enquanto que os resultados 
possíveis passaram a ser de 20000 (o total de números pares nos 40000): 
sendo 
B: o primeiro prémio saiu a um número par. 
A probabilidade anterior não representa a probabilidade absoluta ou total de 
A se realizar (igual a 3/40 000 como se viu anteriormente),. mas a probabilidade 
de A condicionada pela ocorrência de B, ou probabilidade de A dado B. 
O facto de ser dado B opera uma redução no espaço de resultados, que passa 
de R, constituído por 40 000 resultados possíveis, para o próprio B, formado por 
apenas 20 000 resultados. A probabilidade de A será então 
Dividindo ambos os termos da fracção por 40000 obtém-se 
1 
ficando 
i ) no denominador o número de resultados favoráveis a 5 sobre o número total 
de resultados possíveis, isto é, a probabilidade de B; 
ii) no numerador o quociente entre o número de resultados favoráveis a ocor- 
rência de A e B em simultâneo (A n B) e o número total de resultados 
possíveis, ou seja, P [A n B 1. 
ESTAT~STICA APLICADA 
Concluindo, a probabilidade de A dado B é igual a 
Suponha-se agora a situação inversa. No dia da extracção o jogador é infor- 
mado de que lhe saíu o primeiro prémio. Qual a probabilidade de que o número 
premiado seja par? 
O que se pretende conhecer é P [E I A 1. Aplicando a definição de probabili- 
dade condicionada: 
ou, porque a intersecção de acontecimentos é comutativa, 
Considere-se que a partir duma amostra efectuada sobre vários recém-nasci- 
dos se obteve o seguinte quadro de probabilidade conjunta: 
onde: 
Al - um recém-nascido escolhido ao acaso é do sexo masculino; 
AP - um recém-nascido escolhido ao acaso é do sexo feminino; 
Bl - um recém-nascido escolhido ao acaso tem olhos castanhos; 
B2 - um recém-nascido escolhido ao acaso não tem olhos castanhos. 
TEORIA DAS PROBABILIDADES 
A partir deste quadro podem-se definir: 
- probabilidades conjuntas como, por exemplo, a probabilidade do recém- 
-nascido ser do sexo masculino e não ter olhos castanhos: 
- probabilidades marginais (referentes a um único acontecimento) como, por 
exemplo, a probabilidade de um recém-nascido ser do sexo masculino 
independentemente da cor dos olhos: 
- probabilidades condicionadas, por exemplo, de um recém-nascido não ter 
olhos castanhos dado que é do sexo masculino: 
P [B2 I AI ] é a probabilidade de B tendo em conta que o acontecimento 
AI se realiza, ou seja, AI passa a ser o acontecimento certo, com proba- 
bilidade 1 (PIA1 I AI ] = 1 ) e B2 só pode ocorrer quando ocorre simulta- 
neamente AI. Logo a probabilidade de B2 n AI passa a ser redimensio- 
nada tendo em conta a probabilidade unitária do acontecimento AI no novo 
espaço de resultados R ' = AI. 
u 
6.1. Axiomática e teoremas da teoria 
das probabilidades 
na probabilidade condicionada 
O conceito de probabilidade condicionada satisfaz todos os axiomas da 
teoria das probabilidades introduzidos anteriormente. Assim, sendo B um acon- 
tecimento tal que P [B ] > 0 : 
ESTAT~TICA APLICADA 
I ) P [ A I B ] 2 O 
Demonstração: 
mas P [ A ri B ] 2 O 
e P [ B ] > O 
logo P [ A I B ] 2 O 
por definição 
pelo Axioma 1 
por hipótese 
c.q.d. 
Demonstração: 
corque Q é o elemento neutro da intersecção de acontecimentos. 
3) Se Al e A2 são mutuamente exclusivos (isto é, Al n A2 = 0 ), então: 
P[(Ai A*) I B ] = P[A1 I B ] + P[A2 I B ] 
TEORIA DAS PROBABILIDADES 
Demonstração: 
pela propriedade distributiva 
porque (Al n B ) e (A2 n B) são mutuamente exclusivos, por A, e A2 O 
serem, donde 
= P[A1 I B ] + PIA2 I B ] . 
Ao obedecer a axiomática da Teoria das Probabilidades, o conceito de 
probabilidade condicionada satisfaz também todos os seus teoremas. 
Probabilidade da intersec~ão 
de acontecimentos. 
Acontecimentos independentes 
7.1. Probabilidade da intersecção de acontecimentos 
A probabilidade de intersecção de dois acontecimentos, A e 9, decorre da 
probabilidade condicionada. De acordo com o ponto anterior, da definição de 
probabilidade condicionada resulta que 
Assim, das duas igualdades anteriores retira-se que 
TEORIA DAS PROBABILIDADES 
Exemplo 17 (continuaqáo) 
Retomando o exemplo do jogador que compra três bilhetes de loteria a sortear 
na extracção do Natal, a probabilidade da intersecção de 6 com A, ou de o 
jogador receber o primeiro prémio e de este ser um número par (1/40000), tanto 
pode obter-se tomando 6 como condicionante 
como inversamente, tomando A como condicionante 
A probabilidade de intersecção de dois acontecimentos pode ser facilmente 
generalizada a mais de dois acontecimentos se atendermos a associatividade 
da intersecção. 
Generalização a três acontecimentos: 
P[A n B n C ] = P[(A n B ) n C ] = 
= P [ C J ( A n B ) ] . P[A n B ] = 
= p [ C l ( A n 811 . P [ B I A l . P [ A l , 
para A, B e Ctais que P [ A ] + O e P [ A n B ] # O 
Generalização a quatro acontecimentos: 
P [ A n B n C n D ] = P [ ( A n B r, C ) n D ] = 
= P [ D ( ( A n B n C ) ] . P [ A ,q B C ] = 
= P [ D I ( A n B n C ) ] . P [ C I ( A n B ) ] . P [ B I A ] . P [ A ] . 
pa raA ,B ,CeDta i squeP [A ] ,P [A n B ] , P [ A n B n C ] nãonulas. 
7.2. Acontecimentos independentes 
Relacionado com o conceito de probabilidade condicionada está o conceito 
de acontecimentos independentes. 
TEORIA DAS PROBABILIDADES 
Estas relações, de per si intuitivas, derivam da definição formal de aconte- 
cimentos independentes: 
Para dois acontecimentos independentes,podem enunciar-se os seguintes 
teoremas: 
Demonstre-se o primeiro: 
A = A ~ Q = [ A ~ ( B ~ E ) ~ = ( A ~ B ) y ( A ~ E ) 
logo 
P [ A ] = P[(A n B ) (A n i)] = P [ A n a] + P [ A n ã ] 
porque (A ri B ) e (A n 8) são mutuamente exciusivos 
P [A ] = P [A ] . P [B ] + P [A n E ] porque A e B são independentes 
ESTAT~STICA APLICADA 
logo 
P [ A n E ] = P [ A ] - P [ A ] . P [ B ] = 
= P [ A ] . (1 - P [ B ] ) = 
= P [ A ] . P $ ] porque P [ E I = 1 - P [ B ] 
Então, dado que se demonstrou que 
conclui-se que, nestas condições, A e são acontecimentos independentes, 
c.q.d. 
De modo idêntico se poderiam demonstrar os dois últimos teoremas. 
Os acontecimentos Ai, A2, ..., An dir-se-ão independentes dois a dois se 
verificarem apenas a primeira condição. Convém também referir que a última 
condição é necessária mas não suficiente para que AI, A2, ..., An sejam 
independentes. 
TEORIA DAS PROBABILIDADES 
Suponha-se R formado por 4 acontecimentos elementares de igual probabili- 
dade: 
Q = {OI, w2, w3, w4 1 com P[ ai] = V4, i = 1, 2, 3, 4. 
Considerem-se os acontecimentos 
A = { a i , a 2 1 B = {WI, 0 3 1 C = {WI, w4} 
Pretende-se verificar se os acontecimentos A, B e C são independentes. 
1 P [ A n B] = P[wl ] = - 4 
As condições anteriores garantem que os acontecimentos são independentes 
dois a dois. Contudo, 
Assim, os acontecimentos não são independentes entre si, embora o sejam 
dois a dois. 
M 
ESTAT~STICA APLICADA 
Seja a experiência aleatória que consiste no lançamento de dois dados regu- 
lares e distinguíveis, cujo espaço de resultados é o conjunto 
e os acontecimentos 
A - a soma dos pontos dos 2 dados é par 
B - a soma dos pontos dos 2 dados é múltipla de 3 
C - a soma dos pontos dos 2 dados é maior que 9 
Com probabilidades 
Como se pode verificar P [A n B n C] = P [ A ] . P [ B ] . P [C]. No en- 
tanto, apenas os acontecimentos A e B são independentes, sendo A e C, e B e 
C dependentes entre si, pois 
TEORIA DAS PROBABILIDADES 
Em experiências aleatórias ligadas a jogos de azar é, em geral, fácil verificar 
a existência ou não de independência dos acontecimentos. Noutros casos, 
porém, só depois do exame rigoroso de todas as condições se poderá concluir 
acerca da independência dos acontecimentos. 
Uma caixa contém 100 peças sendo 10 defeituosas. Considere-se a expe- 
riência aleatória que consiste em extrair sucessivamente duas peças da caixa. 
Pretende saber-se a probabilidade do acontecimento: 
A: a primeira peça é não-defeituosa e a segunda é defeituosa. 
Para calcular esta probabilidade é necessário atender as duas situações 
possíveis: aquela em que a extracção da segunda se efectua sem que a primeira 
seja reposta na caixa (extracção sem reposição) e quando a extracção da segun- 
da peça só se efectua depois da primeira ter sido reposta na caixa (extracção 
com reposição). 
- Extracção sem reposição. 
Sejam os acontecimentos: Dl: a primeira peça é defeituosa 
D2: a segunda peça é defeituosa 
então 
A = Dl n D2. 
Por se tratar de uma extracção sem reposição, os dois acontecimentos são 
dependentes, logo 
P [A ] = f [ D 1 n D2] = 
- Extracção com reposição. 
Agora os acontecimentos elementares D1 e D2 são independentes, pois a 
primeira peça extraída é reposta e a probabilidade de 4 não se altera pelo facto 
de D1 ter ocorrido. Após a primeira extracção, a caixa volta a ter 100 peças, das 
ESTAT~STICA APLICADA 
quais 10 são defeituosas, isto é 
Então 
P I A ] = p[D1 n D2] = 
7.3. Acontecimentos independentes versus 
acontecimentos incompatíveis 
ou mutuamente exclusivos 
Sejam A e B dois acontecimentos tais que 
- no caso dos acontecimentos serem incompatíveis (mutuamente exclusi- 
vos) tem-se, por definição, (A n B ) = 0 e, consequentemente, 
P [ A n B ] = O. Os acontecimentos não podem ser independentes 
pois, para tal, e por definição de independência, seria 
P [A n B ] = P [A ] . P [ B ] > 0, pois ambos os acontecimentos têm 
probabilidades não nulas. 
- no caso dos acontecimentos serem independentes não podem ser mu- 
tuamente exclusivos, pois se são independentes então, 
P [A ri B ] = P [A ] . P [ B ] é maior que zero; para serem simultanea- 
TEORIA DAS PROBABILIDADES 
mente mutuamente exclusivos esta probabilidade teria de ser nula, facto 
impossível a não ser que algum dos acontecimentos tivesse proba- 
bilidade nula, o que não é o caso. 
Assim, em geral, dois acontecimentos não podem ser simultaneamente 
independentes e mutuamente exclusivos. Existe, no entanto, um caso particular 
em que tal pode ocorrer: é o caso em que um dos acontecimentos é impossível, 
porque este é sempre independente e mutuamente exclusivo de todo e qual- 
quer outro acontecimento possível. 
Teorema da probabilidade 
total e fórmula de Bayes 
O conceito de probabilidade condicionada revela-se muito importante e de 
larga utilização quando se conhecem probabilidades condicionadas nas quais 
os acontecimentos condicionantes definem uma partição em R. 
8.1. Teorema da probabilidade total 
Demonstração 
n 
= V (B n Ai). 
i = 1 
Dado que os Ai são mutuamente exclusivos, então os acontecimentos 
(B n Ai), i = 1, 4 ..., n, também O são; logo 
ESTAT~STICA APLICADA 
Diagramaticamente com n = 5 
I 
P [ B ] vem igual a soma das probabilidades dos acontecimentos sombrea- 
dos no diagrama, isto é, dos acontecimentos (Ai n B), com i = 1, 2, 3 ,4 , 5. 
8.2. Fórmula de Bayes 
Demonstração 
TEORIA DAS PROBABILIDADES 
por definição de probabilidade de intersecção de dois acontecimentos (no 
numerador) e pelo teorema da probabilidade total (no denominador). 
c.q.d. 
Uma fábrica de cachimbos utiliza 3 máquinas de acabamento com volume 
diário de produção, respectivamente, de 500, 1000 e 2000 unidades. De acordo 
com a experiência anterior sabe-se que a percentagem de cachimbos defeituosos 
originados por cada máquina é, respectivamente, de 0,005, 0,008 e 0,Ol. 
Sabendo que um cachimbo foi encontrado defeituoso pretende apurar-se qual 
a máquina que, com maior probabilidade, lhe terá dado origem e qual a que tem 
menor probabilidade de o ter gerado. 
Para resolver o problema devemos em primeiro lugar definir todos os aconte- 
cimentos. 
Ai - Um cachimbo escolhido ao acaso da produção diária foi produzido pela 
mgquina 1 
A2 - Um cachimbo escolhido ao acaso da produção diária foi produzido pela 
máquina 2 
AS - Um cachimbo escolhido ao acaso da produção diária foi produzido pela 
máquina 3 
B - Um cachimbo escolhido ao acaso da produção diária é defeituoso 
Pretendemos calcular as P [Ai I B ] ( i = 1, 2, 3) e ordená-las por ordem de- 
crescente. 
Ai, A2, A3 definem uma partição em i2 visto que 
3 
i ) Apenas as máquinas 1, 2 e 3 produzem cachimbos, isto é, y Ai = R. 
i= 1 
ii) Um cachimbo que é produzido numa máquina não é produzido noutra, 
A i r , A i = 0, i # j i, j = 1,2,3. 
iii) Qualquer uma das máquinas produz cachimbos, P [Ai ] > O, i = 1,2,3. 
As informações fornecidas no enunciado vão permitir utilizar a fórmula de 
Bayes, para o cálculo das probabilidades pretendidas. 
ESTAT~STICA APLICADA 
Sabe-se pelo enunciado que a probabilidade de cada cachimbo ter sido 
produzido por cada uma das máquinas é: 
Conhecem-se também as probabilidades de um cachimbo ser defeituoso, 
dado que foi produzido numa determinada máquina: 
P [B I AI ] = 0,005 
Construindo um quadro: 
0,008 0,0023 
0,Ol O 0,0057 0,66 
P [ B ] = 0,0087 1 
Note-se que P [B] foi calculada recorrendo ao teorema da probabilidade total. 
Do quadro anterior retira-se que a probabilidade de um cachimbo ter sido 
produzido pela máquina 3, sabendo que é defeituoso, é de 0,66; a mesma 
probabilidade para a máquina 2 é