Baixe o app para aproveitar ainda mais
Prévia do material em texto
Paulo Melo Rosa Andrade - , FDIt JES sI~A BO Visite a Sílabo na rede: www.silabo.pt Probabilidades, Variáveis Aleatórias Distribuições Teóricas Elizabeth Reis Paulo Me10 Rosa Andrade Teresa Calapez ~TDIÇÃO - REVISTA E expressamente proibido reproduzir, no todo ou em parte, sob qualquer meio ou forma, NOMEADAMENTE FOTOCÓPIA, esta obra. As transgressões serão passíveis das penalidades previstas na legislação em vigor. Editor: Manuel Robalo Título: Estatística Aplicada - Volume 1 Autores: Elizabeth Reis, Paulo Melo, Rosa Andrade, Teresa Calapez O Edições Sílabo, Lda. 4Wdição - 2Weimpressão Capa: Paul Klee (1 879-1 940), Clair de /une à St. Germain, 191 5. Lisboa, 2003 Impressão e acabamentos: Gráfica Manuel A. Pacheco, Lda. Depósito Legal: 160052f01 ISBN: 972-61 8-245-X EDIÇÕES S~LABO, LDA. R. Cidade de Manchester, 2 11 70-1 00 LISBOA Telf.: 2181 30345 Fax: 218166719 e-mail: silaboQsilabo.pt www.silabo.pt Capítulo I . Introdução 1 . DUAS RAZÕES PARA SE ESTUDAR ESTAT~STICA . . . . . . . . 17 2 . A NECESSIDADE DA ESTAT~STICA NAS CIÊNCIAS ECONÓMICAS E DE GESTÃO . . . . . . . . . . . . . . . . . . . 17 3 . MÉTODO ESTAT~STICO DE RESOLUÇÃO DE UM PROBLEMA . . 19 4 . ESTAT~STICA DESCRITIVA E INFERÊNCIA ESTAT~STICA . . . . . 20 . 5 ESCALAS DE MEDIDA DOS DADOS ESTAT~STICOS . . . . . . . 22 5.1. Escala nominal . . . . . . . . . . . . . . . . . . . . . . . . . . 23 5.2. Escala ordinal . . . . . . . . . . . . . . . . . . . . . . . . . . 24 5.3. Escala por intervalos . . . . . . . . . . . . . . . . . . . . . . . 24 5.4. Escala de rácios . . . . . . . . . . . . . . . . . . . . . . . . . 25 . 6 ALGUMAS CONSIDERAÇÕES FINAIS . . . . . . . . . . . . . . . 25 . 7 UTILIZAÇÃO DO COMPUTADOR . . . . . . . . . . . . . . . . . . 26 Capítulo I1 . Teoria das probabilidades . 1 RESUMO HIST~RICO . . . . . . . . . . . . . . . . . . . . . . . . 29 2 . CONCEITOS DA TEORIA DAS PROBABILIDADES . . . . . . . . . 32 2.1. Experiência aleatória . . . . . . . . . . . . . . . . . . . . . . . 32 2.2. Espaço de resultados . . . . . . . . . . . . . . . . . . . . . . 33 2.3. Acontecimentos . . . . . . . . . . . . . . . . . . . . . . . . . 35 3 . ÁLGEBRA DOS ACONTECIMENTOS . . . . . . . . . . . . . . . . 39 3.1. União de acontecimentos . . . . . . . . . . . . . . . . . . . . 39 3.2. Intersecção de acontecimentos . . . . . . . . . . . . . . . . . 40 . . . . . . . . . . . . . . . . . . 3.3. Diferença de acontecimentos . . . . . . . . . . . . . . . . . . 3.4. Propriedades das operações . . . . . . . . . . . . . . . . . 4 . CONCEITOS DE PROBABILIDADE . . . . . . . . . . 4.1. Conceito clássico de probabilidade (a priori) . . . . . 4.2. Conceito frequencista de probabilidade (a posteriori) . . . . . 4.3. Conceito subjectivo ou personalista de probabilidade . . . . . . . . . 5 . AXIOMAS DA TEORIA DAS PROBABILIDADES . . . . . . . . . . . . . . . 6 . PROBABILIDADES CONDICIONADAS 6.1. Axiomática e teoremas da teoria das probabilidades . . . . . . . . . . . . . . . . . na probabilidade condicionada 7 . PROBABILIDADE DE INTERSECÇÃO DE ACONTECIMENTOS . . . . . . . . . . . . . . . ACONTECIMENTOS INDEPENDENTES . . . . . . . . 7.1. Probabilidade de intersecção de acontecimentos . . . . . . . . . . . . . . . . . 7.2. Acontecimentos independentes 7.3. Acontecimentos independentes versus acontecimentos . . . . . . . . . . . . incompatíveis ou mutuamente exclusivos 8 . TEOREMA DA PROBABILIDADE TOTAL E FÓRMULA DE BAYES . . . . . . . . . . . . . . . . . 8.1. Teorema da probabilidade total . . . . . . . . . . . . . . . . . . . . . . . . 8.2. Fórmula de Bayes . . . . . . . . . . . . . . . . . . . . . . EXERC~CIOS PROPOSTOS Capítulo 111 . Variáveis aleatórias . . . . . . . . . . . . . . . . . . . 1 . 1. Enquadramento e exemplos . . . 1.2. Cálculo de probabilidades através de variáveis aleatórias . . . . . 1.3. Variáveis aleatórias unidimensionais e bidimensionais 2 . FUNÇOES DE PROBABILIDADE E DE DISTRIBUIÇÃO . . . . . . . . . DE VARIÁVEIS ALEATÓRIAS UNIDIMENSIONAIS . . . . . . . . . . . . . . . . . . 2.1. Variáveis aleatórias discretas . . . . . . . . . . . . . . . . . . 2.1 . 1. Função de probabilidade . . . . . . . . . . . . . . . . . . . . 2.1.2. Função de distribuição . . . . . . . . . . . . . . . . . . 2.2. Variáveis aleatórias contínuas 3 . FUNÇOES DE PROBABILIDADE E DE DISTRIBUIÇAO DE VARIÁVEIS ALEAT~RIAS BIDIMENSIONAIS . . . . . . . . . . 115 3.1. Variáveis aleatórias discretas . . . . . . . . . . . . . . . . . . 115 3.1 . 1. Função de probabilidade conjunta . . . . . . . . . . . . . 115 3.1.2. Função de distribuição conjunta . . . . . . . . . . . . . . . 117 3.1.3. Função de probabilidade marginal . . . . . . . . . . . . . 119 3.1.4. Independência de variáveis aleatórias . . . . . . . . . . . 120 3.2. Variáveis aleatórias contínuas . . . . . . . . . . . . . . . . . . 121 3.2.1. Definição . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 3.2.2. Cálculo de probabilidades . . . . . . . . . . . . . . . . . . 123 . . . . 3.2.3. Funções de densidade de probabilidade marginais 125 3.2.4. Independência . . . . . . . . . . . . . . . . . . . . . . . . 126 4 . PARÂMETROS DE VARIÁVEIS ALEATÓRIAS: VALOR ESPERADO E VARIÂNCIA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 4.1. Média ou valor esperado . . . . . . . . . . . . . . . . . . . . 127 4.1.1. Definição . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 4.1.2. Propriedades do valor esperado . . . . . . . . . . . . . . 129 . . . . . . . 4.1.3. Valor esperado de função de variável aleatória 131 4.1.4. Valor esperado monetário (V.E.M.) . . . . . . . . . . . . . 133 . . . . . . . . . . . . . . . . . . . . 4.2. Variância e desvio-padrão 137 . . . . . . . . . . . . . . . . . . 4.2.1. Propriedades da variância 139 . . . . . . . . . 4.3. Covariância e coeficiente de correlação linear 140 5 . MOMENTOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145 . . . . . . . . . . . . . . . . . 5.1. Função geradora de momentos 147 6 . DESIGUALDADES DE MARKOV E CHEBISHEV . . . . . . . . . . 148 EXERC~CIOS PROPOSTOS . . . . . . . . . . . . . . . . . . . . . . 154 Capitulo /V . Distribuipões teóricas mais importantes 1 . DISTRIBUIÇÓES DISCRETAS . . . . . . . . . . . . . . . . . . . . 161 . . . . . . . . . . . . . . . . . . . . . . 1 . 1. A distribuição uniforme 161 . . . . . . . . . . . . . . . . . . . . . . . . 1.2. Prova de Bernoulli 166 . . . . . . . . . . . . . . . . . . . . 1.3. A distribuição de Bernoulli 169 . . . . . . . . . . . . . . . . . . . . . . 1.4. A distribuição binomial 171 . . . . . . . . . . . 1.4.1. A função de probabilidade da binomial 172 1.4.2. Aspecto gráfico da função de probabilidade da binomial . . 177 . . . . . . . . . . . . . 1.4.3. Parâmetros da distribuição binomial 181 . . . . . . . . . . 1.4.4. A aditividade nas distribuições binomiais . . . . . . . . . 1.4.5. Outras aplicações da distribuição binomial . . . . . . . . . . . . . . . . . . . . 1.5. A distribuição multinomial . . . . . . . . 1.5.1. Parâmetros mais importantes da multinomial . . . . . . . . . . . . . . . . . 1.6. A distribuição binomial negativa . . . . . . 1.6.1. Relação entre a binorr.ial e a binomial negativa 1.6.2. Parâmetros mais importantes da binomial negativa . . . . . . . . . . . . . . . . . 1.7. A distribuição geométrica ou de Pascal 1.7.1. Parâmetros mais importantes da distribuição geométrica . . . . . . . . . . . . . . . . . . . 1.8. A distribuição hipergeométrica 200 1.8.1. Parâmetros mais importantes da distribuição . . . . . . . . . . . . . . . . . . . . . . . hipergeométrica 203 . . . . . .. 1.8.2. Generalização da distribuição hipergeométrica 204 . . . . . . . . . . . . . . . . . . . . 1.9. A distribuição de Poisson 206 . . . . . . . . . . . . . . . . . . . 1.9.1. O processo de Poisson 206 1.9.2. Parâmetros mais importantes da distribuição de Poisson . 209 . . . . . . . . . 1.9.3. A aditividade nas distribuições de Poisson 212 . . . . . . 1.9.4. Aproximação da distribuição binomial a Poisson 214 . . . . . . . . . . . . . . . . . . . 2 . DISTRIBUIÇ~ES CONT~NUAS 219 . . . . . . . . . . . . . . . . . . . . . . 2.1. A distribuição uniforme 219 . . . . . . . . . . . . . . . . . . . . . . 2.2. A distribuição normal 222 . . . . . . . . . . . 2.2.1. Características da distribuição normal 223 . . . . . 2.2.2. Cálculo de probabilidades na distribuição normal 225 . . . . . . . . . . . . . 2.2.3. A aditividadada distribuição normal 232 2.2.4. A distribuição normal como uma aproximação . . . . . . . . . . . . . . . . . . . da distribuição binomial 234 2.2.5. A distribuição normal como aproximação . . . . . . . . . . . . . . . . . . da distribuição de Poisson 235 . . . . . . . . . . . . . . . . . . . . 2.3. A distribuição exponencial 237 . . . . . . . . . . . . . . . . . . . . . . . 2.4. A distribuição Gama 240 . . . . . . . . . . . . . . . . . . . . . . EXERC~CIOS PROPOSTOS 244 Apêndice . Tabelas de distribuição . . . . . . . . . . . . . . . . . . . . . . . . . Distribuição binomial 251 . . . . . . . . . . . . . . . . . . . . . . . . Distribuição de Poisson 256 . . . . . . . . . . . . . . . . . . . . . . Distribuição normal padrão 263 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . BIBLIOGRAFIA 265 Nota a segunda edição Esta nova ediçao de tstatistica Aplicada, para além de constituir uma nova versão revista e actualizada, apresenta-se agora dividida em dois volumes, para, tanto quanto possível, responder as solicitações de muitos dos nossos leitores, docentes e alunos, cujos programas de Estatística assim se encontram estruturados. O primeiro volume, para além do capítulo introdutório, inclui um segundo capítulo sobre Teoria das Probabilidades, um terceiro sobre Variáveis Aleató- rias, sendo o quarto e último sobre as Distribuições Teóricas mais Importantes. Os restantes cinco capítulos da primeira edição fazem agora parte do segundo volume. Embora maioritariamente dedicado aos métodos de Inferên- cia Estatística (capítulos Vil, VI11 e IX, Estimação de Parâmetros, Ensaios de Hipóteses e Testes não-Paramétricos), depois de uma breve introdução aos Processos de Amostragem (quinto capítulo), é também feita a apresentação das Distribuições Amostrais (capítulo VI). Acreditamos que esta solução dará também resposta as preferências de muitos outros leitores que, pelo carinho e interesse com que acompanharam a primeira edição, pelas sugestões e indicações de gralhas e erros, decidida- mente contribuíram para a produção desta nova edição. A todos, os nossos agradecimentos. Conscientes de que é possível fazer melhor, esperamos que esta nova edição vos desperte tanta atenção como a anterior, deixando aqui a promessa de nos mantermos empenhados no seu aperfeiçoamento. 0 s autores Lisboa, Setembro de 1997 Prefácio Este livro de Estatística Aplicada destina-se a profissionais licenciados ou não e a estudantes universitários que, na vida prática ou no processo de aprendizagem, têm necessidade de saber Estatística e de a aplicar aos pro- blemas mais variados do dia-a-dia. Como objectivos finais, este livro pretende tornar compreensíveis a linguagem e notação estatísticas, bem como exempli- ficar as suas potenciais utilizações, sem descurar os pressupostos subjacentes e o rigor teórico necessário. Deverá referir-se que a escolha do título não foi pacífica. De entre os vários alternativos - Probabilidades e Estatística, Inferência Estatística, etc. - a preferência por Estatística Aplicada justifica-se pela abordagem diferenciada de outras obras já publicadas sobre Inferência Estatística, e que resumidamen- te pode ser assim descrita: mais do que <<ensinar,,, pretende-se com este livro, a) despertar e estimular o interesse dos leitores pelo método estatístico de resolução dos problemas; b) utilizando uma linguagem simples e acessível, apresentar os conceitos e métodos de análise estatística de modo mais intuitivo e informal; c) acompanhar a apetência teórica com exemplos apropriados a cada situação. O livro encontra-se dividido em nove capítulos. No capítulo I (Introdução) são explicitadas várias razões para que um profissional, técnico, estudante ou mero cidadão adquira um nível mínimo de conhecimentos em Estatística. A Teoria das Probabilidades é objecto de estudo do capítulo II. Nele são apresentados os diferentes conceitos de probabilidade e a sua axiomática, dando especial relevo aos teoremas da probabilidade total e de Bayes. 0 s terceiro e quarto capítulos, tal como o segundo, são essenciais para a compreensão dos seguintes, relativos a Inferência Estatística. O capítulo III respeita as Variáveis Aleatórias, sua definição, características e propriedades. No quarto capítulo estudam-se em pormenor as distribuições de algumas variáveis aleatórias de importância maior nas áreas de aplicação das ciências sócio-económicas como sejam as distribuições de Bernoulli, binomial, Poisson, binomial negativa, hipergeométrica, multinomial, uniforme e normal. O capítulo V é dedicado ao estudo dos processos de amostragem, incluindo os diferentes métodos de recolha de uma amostra, enquanto que no capítulo VI se apresentam as distribuições amostrais mais importantes. Os três últimos capítulos são dedicados a Inferência Estatística propriamen- te dita. No capítulo VI1 apresentam-se métodos de estimação de parâmetros, com ênfase especial para o método de máxima verosimilhança. Inclui-se ainda a estimação por intervalos. Os capítulos VIII e IX destinam-se a apresentação, respectivamente, dos ensaios de hipóteses paramétricos e não-paramétricos. Com excepção do primeiro, todos os restantes capítulos são finalizados com um conjunto de exercícios não resolvidos, acompanhados geralmente das respectivas soluções. No Apêndice estão incluídas as Tabelas (das distribuições) necessárias a compreensão do texto e a resolução dos exemplos e dos exercícios propostos. Este livro é o resultado de alguns anos de experiência docente dos seus autores na equipa de Estatística do ISCTE e da tentativa de responder as necessidades sentidas por muitos - alunos e docentes de variadas licencia- turas, docentes do ensino secundário, profissionais e técnicos de diferentes áreas científicas (gestão, economia, sociologia, psicologia, medicina, enferma- gem, engenharia, informática, etc.) - que, no decorrer destes anos, e na falta de uma obra que os ajudasse a encontrar as soluções estatísticas apropriadas aos seus problemas, procuraram ajuda junto dos autores. Sem dúvida que a responsabilidade desta obra é assumida pelos seus autores, mas a sua concretização só se tornou possível com a ajuda, apoio e disponibilidade de muitos. Por isso, não deixando de agradecer a todos os que, directa ou indirectamente, contribuíram para a sua realização, gostaríamos de, nominalmente, dar uma palavra especial de agradecimento aos seguintes docentes de Estatística do ISCTE: Ana Cristina Ferreira, Ana Paula Marques, António Robalo, Fátima Ferrão, Fátima Salgueiro, Graça Trindade, Helena Carvalho, Helena Pestana, João Figueira, J.C. Castro Pinto, J.J. Dias Curto, Margarida Perestrelo e Paula Vicente. Finalmente, uma palavra de apreço a todos os alunos, quer das licenciatu- ras do ISCTE, quer dos mestrados do INDEGIISCTE, cujas sugestões, dúvidas e problemas certamente contribuíram para enriquecer este livro. Os autores I. Duasrazões para se estudar estatística Existem duas boas razões para se saber Estatística. Primeiro, qualquer cidadão está diariamente exposto a um enorme conjunto de informações resultantes de estudos sociológicos e de mercado ou económicos, de sonda- gens políticas ou mesmo de pesquisa científica. Muitos destes resultados baseiam-se em inquéritos por amostragem. Alguns deles utilizam, para o efeito, uma amostra representativa de dimensão adequada e recolhida por um pro- cesso aleatório. Outros não. Para estes, a validade dos resultados não ultrapassa a amostra que os originou. A afirmação de que é fácil mentir com Estatística é quase um lugar comum. Qualquer manual que se preze apresenta nas primeiras páginas a famosa citação atribuída a Benjamin Disraeli: <<There is three kinds of lies: lies, damned lies and statistics),. E o pior é que, de certa forma, esta citação é verdadeira: é fácil distorcer e manipular resultados e conclusões e enganar alguém não-(in)formado. Mas saber Estatística permite que se avaliem os métodos de recolha, os próprios resultados, se detectem e rejeitem falsas conclusões. Se, para muitos, a necessidade de saber Estatística advém do facto de serem cidadãos do mundo, para alguns essa necessidade é acrescida por uma actividade profissional que requer a utilização de métodos estatísticos de recolha, análise e interpretação de dados. E esta é a segunda razão para se estudar Estatística. A utilização da Estatística nas ciências sociais, políticas, económicas, biológicas, físicas, médicas, de engenharia, etc, é por demais conhecida: os métodos de amostragem e de inferência estatística tornaram-se um dos principais instrumentos do método científico. Para todos os que traba- lham nestas áreas, é vital um conhecimento básico dos conceitos, possibilidades e limitações desses métodos. 2. A necessidade da estatística nas ciências económicas e de gestão Nas áreas económicas e de gestão de empresas, a Estatística pode ser utilizada com três objectivos: (1) descrever e compreender relações entre diferentes características de uma população, (2) tomar decisões mais correctas e (3) fazer face a mudança. ESTA J/.SJICA APLICADA A quantidade de informação recolhida, processada e finalmente apresenta- da a um comum mortal cresce tão rapidamente que um processo de selecção e identificação das relações mais importantes se torna imprescindível. É aqui que a Estatística poderá dar o seu primeiro contributo, quer através de métodos meramente descritivos, quer utilizando métodos mais sofisticados de genera- lização dos resultados de uma amostra a toda a população. Uma vez identificadas as relações, estas poderão constituir uma ajuda preciosa a tomada de decisões correctas em situações de incerteza. Veja-se o seguinte exemplo. Através de métodos estatísticos adequados, determinada instituição bancá- ria identificou as características sócio-económicas daqueles que considera serem bons clientes. Esta identificação permite-lhe, no futuro, rejeitar pedidos de crédito por parte de potenciais clientes, cujas características mais se afas- tam das anteriores. Planear significa determinar antecipadamente as acções a empreender no futuro. Para fazer face a mudança, é necessário que as decisões e o planea- mento se apoiem numa análise cuidada da situação presente e numa previsão realista do que acontecerá no futuro. Os métodos estatísticos de previsão não permitem adivinhar com uma precisão absoluta os acontecimentos futuros, mas permitem medir as variações actuais e estabelecer os cenários futuros mais prováveis, diminuindo, de algum modo, a incerteza inerente a esses acontecimentos futuros. Na gestão das empresas, a tomada de decisão é crucial e faz parte do dia-a-dia de qualquer gestor. As consequências dessas decisões são dema- siado importantes para que possam basear-se apenas na intuição ou feeling momentâneos. Os gestores são responsáveis pelas decisões mesmo quando estas se baseiam em informações incompletas ou incertas. É precisamente porque a informação disponível está associado um elevado grau de incerteza que a Estatística se tornou tão importante no processo de tomada de decisões: a Estatística permite a extracção de conclusões válidas a partir de informação incompleta. O ambiente de formação de uma decisão varia de um extremo em que muita, pouca, ou nenhuma informação está disponível, ao extremo oposto em que o decisor detém toda ou quase toda a informação sobre a situação. Este último extremo significa que o decisor conhece a situação de todos os elemen- tos da população. A informação disponível a partir dos recenseamentos do INE, realizados de 10 em 10 anos, é um exemplo. Mas a situação mais comum para os gestores é aquela em que quase nenhuma informação se encontra disponível. Veja-se o exemplo do lançamento de um novo produto utilizando tecnologia de ponta praticamente desconhecida dos consumidores. Como irão estes reagir ao lançamento do novo produto? A partida, pouca ou nenhuma informação existe para que o gestor possa responder a esta pergunta. A Estatística fornece aos gestores instrumentos para que possam responder a estas questões e tomar decisões com alguma confiança, mesmo quando a quantidade de informação disponível é pequena e as situações futuras são de elevada incerteza. 3. Método estatístico de resoluçáo de um problema Para que se obtenham resultados válidos, o investigador deve seguir todos os passos que definem o método estatístico de resolução de problemas: 1. Identificar correctamente o problema em análise. Mesmo em estudos exploratórios cujo objectivo é identificar possíveis relações entre as caracterís- ticas dos indivíduos sem que, a partida, se defina um modelo regulador dessas relações, é necessário identificar o problema para o qual se pretendem encon- trar respostas. 2. Recolher a informação necessária, relevante para o problema em estudo, em tempo útil e tão completa quanto possível. Esta informação poderá consistir em dados primários, recolhidos através de um questionário, ou dados secun- dários, recolhidos e publicados através de outra fonte de informação. 3. Classificar e organizar os dados, por exemplo, através da codificação e criação de uma base de dados em suporte informático. Uma vez ultrapassada esta fase, é já possível reduzir a quantidade de informação, fazendo desapa- recer os pormenores menos importantes através de medidas de estatística descritiva (medidas de tendência central, dispersão, concentração, etc ), qua- dros e gráficos. 4. Análise dos dados e apresentação dos resultados: identificar relações, testar hipóteses, definir modelos com a ajuda de métodos estatísticos apro- priados. ESTAT~STICA APLICADA 5. Tomar a decisão mais adequada, ponderando as possíveis opções face aos objectivos inicialmente propostos. A qualidade da informação recolhida e as capacidades do investigador determinam, em grande parte, a adequabilida- de das opções propostas. Esta tis tica descritiva e in ferêncía estatística Embora a classificação e organização dos dados a que se faz referência no terceiro passo seja ainda um capítulo importante da Estatística - a Esta- tística Descritiva - um segundo capítulo torna-se muito mais importante, quando os dados recolhidos respeitam apenas a um subconjunto da população em estudo e não a toda a população - a Inferência Estatística. Só quando o grupo sobre o qual se pretende obter informação é de dimensão reduzida, se torna viável recolher essa informação para todos os elementos desse grupo. O recenseamento de uma população envolve custos e tempos demasiado elevados para serem suportados por organizações não vocacionadas para o efeito. Por essa razão, se tornaram populares e se generalizaram a todos os domínios científicos as técnicas de amostragem.Contrariamente a um recenseamento, onde se recolhe informação sobre as características de toda uma população, uma amostra fornece informação sobre um subconjunto dessa população. Os métodos de Inferência Estatística permitem (1) estimar as características desconhecidas de uma população (por exemplo, a proporção de consumidores que preferem uma dada marca de detergentes) e (2) testar se determinadas hipóteses sobre essas características desconhecidas são plausíveis (por exemplo, se a afirmação de um vendedor de que os resultados de lavagem da marca que vende são superiores aos de outras marcas concorrentes). Nos exemplos anteriores, as características das populações (proporção de consumidores e resultados médios da aplicação do produto) são os parâme- tros. Quando respeitam a uma amostra, estes indicadores estatísticos passam a chamar-se estatísticas. 0 s métodos de Inferência Estatística envolvem o cálculo de estatísticas, a partir das quais se infere sobre os parâmetros da população, isto é, permitem, com determinado grau de probabilidade, generalizar a população certas con- clusões, por comparação com os resultados amostrais. Exemplos de parâmetros são a média de uma população (p), a variância (o2) ou o desvio-padrão (o). Como exemplos de estatísticas: a média (X), a variância (s2) OU O desvio-padrão ( s ) amostrais. A distinção entre parâmetro e estatística torna-se extremamente importante na Inferência Estatística. Muitas vezes pretende-se estimar o valor de um parâmetro ou fazer um teste de hipóteses sobre o seu valor. No entanto, o cálculo dos parâmetros é, geralmente, impossível ou impraticável, devido aos requisitos de tempo e dinheiro a que obriga. Nestes casos, a escolha de uma amostra aleatória permite que se obtenha uma estimativa para o parâmetro. A base da Inferência Estatística consiste, assim, na possibilidade de se tomarem decisões sobre os parâmetros de uma população, sem que seja necessário proceder a um recenseamento de toda a população. %+-?+%.o. **.. Exemplo Um industrial de máquinas de lavar quer determinar qual o número médio de lavagens de determinado tipo de máquina (lavar e secar), até que necessitem de reparação. O parâmetro que pretende conhecer é o número médio de lavagens das máquinas até serem reparadas. O técnico da sua fábrica selecciona aleato- riamente algumas máquinas da sua produção mensal, e verifica as lavagens efectuadas até ocorrer uma avaria, calculando, em seguida, para as máquinas da amostra, o número médio de lavagens, isto é, a média amostral. A figura seguinte demonstra o processo seguido. Amostra aleatória Amostra Estatísticas (conhecidas) Parâmetros (desconhecidos) / Inferência Estatística ESTAT~STICA APLICADA O processo de generalizar a população os resultados recolhidos na amostra é feito num ambiente de incerteza. A não ser que o valor dos parâmetros seja calculado a partir de todos os elementos da população, nunca se saberá com certeza se as estimativas ou inferências feitas são verdadeiras ou não. Num esforço para medir o grau de confiança ou de certeza associado aos resultados do processo de inferência, a Estatística utiliza a teoria das probabilidades. Por essa razão se dedica um capítulo deste livro ao estudo das probabilidades. 5. Escalas de medida dos dados estatístícos Os exemplos de dados que diariamente se podem recolher são dos mais variados. Vejamos alguns: a temperatura máxima na cidade de Lisboa; a cota- ção do escudo e das restantes moedas do Sistema Monetário Europeu; as taxas de inflação dos países da União Europeia; as exportações de material electrónico dos países da Ásia Oriental; a distribuição etária da população do concelho de Lisboa; a distribuição por sexos dessa mesma população; as profissões da população da Marinha Grande; a distribuição dos emigrantes portugueses por países de acolhimento; as preferências da população portu- guesa no que respeita as suas viagens de férias; as preferências dos portu- gueses em relação aos quatro canais de televisão nacional; as quotas de mercado das diferentes marcas de automóveis utilitários. Estes exemplos de dados estatísticos diferenciam-se, não só por se referi- rem a características de diferentes populações, mas também por estarem definidos em diferentes escalas de medida e, portanto, por necessitarem de diferentes métodos estatísticos para os descreverem e analisarem. São quatro os tipos de escalas de medida: nominal, ordinal, por intervalos e por rácios. Nem sempre é evidente a distinção entre estas escalas, sobretudo entre as duas últimas. A classificaqão que se descreverá em seguida é a adoptada pelos autores deste livro, embora se reconheça não existir unanimidade neste domí- nio. Resumo histórico Não é possível fazer a história da Estatística sem falar em probabilidades. Estas tiveram a sua origem no estudo dos jogos de azar, já conhecidos dos Egípcios 3500 anos A.C. Mas só no século xvi se assiste a primeira tentativa de desenvolver uma teoria das probabilidades. Cardano foi um dos primeiros a tentar descrever um método de cálculo das probabilidades bem como as suas leis básicas. Cardano pode ser consi- derado como um verdadeiro cientista da Época Renascentista: escreveu sobre todas as áreas de estudo da época incluindo a matemática, a teologia, a cosmologia e a medicina. Com o seu livro intitulado The book on games of chance, Cardano não só explica as leis da probabilidade como analisa os jogos de azar e ensina a jogar e a detectar os abatoteiros)). A sua experiência como jogador inveterado ajuda-o a analisar correctamente os jogos de dados e a compreender, também de modo correcto, o cálculo de probabilidades para os casos simétricos ou igualmente prováveis. Nestes casos, a probabilidade de um acontecimento é o quociente entre o número de resultados que permitem a realização desse acontecimento e o número total de resultados possíveis. Por exemplo, a probabilidade de que saia uma face par no lançamento de um dado é 3/í, uma vez que há seis resultados possíveis (1, 2, 3, 4, 5, 6) e três deles são números pares (2,4,6). Uma importante lei probabilística descoberta por Cardano foi a lei do produto de acontecimentos independentes. A proba- bilidade de sair «Face,> quando se lança uma moeda é 1/2. A probabilidade de sair <(Face 2,) quando se lança um dado é 1/6. A probabilidade de estes dois acontecimentos ocorrerem quando se lança uma moeda e um dado é o produto das duas: ( 1 4 . ('/E) = 1/12. Cinco décadas mais tarde, Galileu respondeu aos jogadores sobre uma questão que, aparentemente, os preocupava: quando se lançam três dados, o total de 10 pontos ocorre mais vezes que um total de 9, o que Ihes parecia contraditório uma vez que é igual o número de combinações (6) que somam 9 (621, 531, 522, 441, 432, 333) e 10 pontos (631, 622, 541, 532, 442, 433). Mas Galileu mostrou que só é possível que os resultados tenham diferente probabilidade se a ordem for também tomada em consideração e, nesse caso, ESTAT~STICA APLICADA o número de resultados com soma igual a 9 é de 25, e com soma igual a 10, de 27, resultando em probabilidades de 25/21s e 27/216, respectivamente. O que muitos autores se admiram é que os jogadores se tenham apercebido desta diferença tão diminuta! O estudo sistemático das leis das probabilidades teve um contributo impor- tante com Pascal e Fermat e a correspondência trocada entre ambos. Tudo começou quando Chevalier de Méré, conhecido escritor e ardente jogador da corte de Luís xiv, consultou Fermat sobre problemas de divisão de apostas e interrupções antes de se completar um jogo. Blaise Pascal (1 623 - 1662) era uma criança prodígio que aos dezasseis anos já tinha escrito um livro e aos dezoito inventado uma máquina calcula- dora. Pierre de Fermat (1601- 1665) era um jurista de Toulouse que nos tempos livres se dedicava ao estudo da matemática, tendo já sido considerado como o maior matemático puro de todos os tempos. Se de Cardano se pode afirmar que marcou o fim da pré-história da Teoria das Probabilidades, Fermat e Pascal deram o passo decisivo no desenvolvi- mento desta teoria e na fundamentação teórica da Inferência Estatística. No final do século xvii, Leibniz publicou duas obras, uma sobre problemas com- binatórios, e outra sobre a aplicação das probabilidades as questões financeiras. Foi sob o seu conselho que Jacques Bernoulli estudou o assunto de tal modo que o cálculo das probabilidades adquire finalmente o estatuto de ciência. O teorema de Bernoulli apresenta pela primeira vez a correspondência entre frequências e probabilidades, dando origem a um novo conceito de probabilidade. O conceito de probabilidade inversa é definido por Thomas Bayes ainda no século xviii. A importância dos resultados de Bayes só vem a ser reconhecida quase dois séculos depois, quando se forma, dentro da Esta- tística, uma nova corrente: a escola Bayesiana. Durante o século xix o desenvolvimento do cálculo das probabilidades deveu-se ao contributo de três astrónomos: Laplace, Gauss e Quetelet. Muitos dos desenvolvimentos posteriores, nomeadamente da escola russa (Chebyshev, Markov e Lyapunov), baseiam-se na análise e desenvolvimento da obra de Laplace. Gauss explanou uma teoria sobre a análise de observação aplicável a qualquer ramo da ciência, contribuindo, assim, para alargar o campo de aplicação do cálculo das probabilidades. Quetelet iniciou a sua aplicação aos fenómenos sociais. A ele se deve a introdução do conceito de <<homem médio. e a chamada de atenção para a consistência dos fenómenos sociais. TEORIA DAS PROBABILIDADES A distinção entre Estatística e Probabilidades parece já ser impossível. Desde o final do século xix que muitos contribuíram para o desenvolvimento da Estatística com valiosas antecipações que só mais tarde puderam ser plenamente compreendidas. De entre estes talvez se possam destacar Karl Pearson, William Gosset que escreveu sob o pseudónimo de ((Studentn e Ronald Fisher, pelo vigoroso impulso dado a Estatística. Pearson, que se dedicou ao estudo da correlação, cuja descoberta é atribuída a Galton, foi um entusiasta do evolucionismo de Darwin, desenvolveu extraordinariamente os métodos de tratamento de dados, para além de se interessar pelo cálculo das probabilidades. Em 1894, depois de analisar um elevado número de resultados das roletas num casino, chegou a conclusão de que estas estavam viciadas e que não serviam como laboratório para análise das probabilidades; em suma, a razão de ser dos casinos não era, de modo nenhum, científica. Mas estas experiências no início da sua carreira não deixaram de ser úteis na aplicação que fez da teoria das probabilidades a evolução biológica e a importantes descobertas estatísticas como o teste do qui-quadrado, utilizado para testar se uma dada distribuição de frequência segue determinada distribuição probabi- Iística. Gosset, ou seja, «Student>), trabalhava para uma empresa produtora de cervejas - a Guiness - e começou uma nova fase nos estudos estatísticos com os métodos de tratamento de pequenas amostras. Fisher deu, talvez, a mais importante contribuição a Estatística Matemática e a sua divulgação. O livro que publicou em 1925, Statiscal Methods for Research Workers, permitiu aos investigadores a familiarização necessária com os métodos estatísticos e a sua aplicação a problemas práticos. Muitos outros nomes poderiam ser referidos neste percurso de quase quatro séculos. Todos contribuíram para que, quando Fisher publicou o seu livro, há muito se tivesse deixado de definir Estatística como (<o estudo dos assuntos de Estado,,, associando-a a teoria das probabilidades. Com o século xx, a Estatística tornou-se um instrumento de análise poderoso aplicado em todas as áreas do saber e a que o desenvolvimento informático veio dar novo fôlego. Conceitos da teoria de probabilidades Se lhe perguntassem o significado da seguinte frase - (<Se lançar uma moeda ao ar, a probabilidade de sair (<Face>> é )> - a sua resposta talvez fosse: <<Só há dois resultados possíveis com iguais hipóteses de ocorrerem>>. Mas suponha que lhe perguntavam também: (<Qual a probabilidade de um carro avariar ao atravessar a ponte 25 de Abril?),. Também aqui existem apenas dois resultados possíveis: ao atravessar a ponte ou o carro avaria ou não avaria. Mas já será impossível responder que essa probabilidade é l/2. A simetria ou equiprobabilidade existente na primeira experiência (lançamento de uma moe- da ao ar) já não se verifica na segunda. Esta é a situação mais comum, a de experiências cujos resultados são influenciados pelo acaso e aos quais estão associadas diferentes probabilidades. 2.1. Experiência aleatória São objecto de estudo na teoria das probabilidades os fenómenos aleató- rios, ou seja, acontecimentos influenciados pelo acaso. Na base desta teoria está o conceito de experiência aleatória, isto é, o processo de observação ou de acção cujos resultados, embora podendo ser descritos no seu conjunto, não são determináveis a priori, antes de realizada a experiência. Uma experiência aleatória tem como características (Murteira, 1979: 16): - A possibilidade de repetição da experiência em condições similares; - Não se poder dizer a partida qual o resultado (fenómeno aleatório) da experiência a realizar, mas poder descrever-se o conjunto de todos os resultados possíveis; - A existência de regularidade quando a experiência é repetida muitas vezes. TEORIA DAS PROBABILIDADES É com base nesta última característica que se desenvolve toda uma teoria e um conjunto de modelos probabilísticos tendentes a explicar os fenómenos aleatórios e a dar uma indicação da maior ou menor probabilidade da sua ocorrência. A experiência aleatória contrapõe-se a experiência não aleatória ou determinística, aquela cujo resultado pode ser conhecido antes da sua reali- zação. Por exemplo, o valor da velocidade de propagação do som (340 mls) é conhecido mesmo antes de realizada a experiência, o mesmo acontecendo com a medição da temperatura de entrada em ebulição da água, cujo resultado (lOoO C) é conhecido a priori. Já o mesmo não sucede quando lançamos ao ar um dado ou extraímos uma carta dum baralho, quando medimos a duração de vida de uma Iâmpada ou observamos o resultado do exame de um estu- dante escolhido ao acaso. Embora se possa dizer, no caso do exame, que o estudante irá obter uma classificação entre O e 20 valores, não podemos afirmar qual a classificação exacta que o estudante obterá, se por exemplo 10, 14 ou 18 valores. Essa classificação só será conhecida depois de realizado o exame. O mesmo acontece com a duração de vida de uma Iâmpada; talvez se possa afirmar que ela durará entre O e 100 horas, mas o valor exacto da sua duração não é conhecido senão depois de a Iâmpada se ter fundido. Quando lançamos ao ar um dado e observamos o número inscrito na face voltada para cima, podemos descrever o conjunto de todos os resultados que poderão ocorrer (1, 2, 3, 4, 5 e 6), mas já é impossível, antes de efectuarmos o lançamento, afirmar qual a face que irá sair. Depois de efectuado o lança- mento, certamente que alguma face terá ocorrido, por exemplo a face 3. Dizemos então que <<3), é o resultado desta experiência aleatória. 2.2. Espaço de resultados Numa determinada experiência aleatória, o conjunto de todos os resultados possíveis designa-se por espaço de resultados, e representa-se pela letra grega C&. No exemplo do lançamento do dado, L2 = { 1, 2, 3, 4, 5, 6 } . A maior parte das vezes não se descrevem em detalhe as condições e as circunstâncias que caracterizam umaexperiência aleatória. É esta de resto a dificuldade de fundo do cálculo das probabilidades: descrição das condições uniformes em que um acontecimento aleatório se verifica ou não. ESTAT~STICA APLICADA Se o número de elementos do espaço de resultados for finito ou infinito numerável trata-se de um espaço de resultados discreto; havendo um número infinito não numerável de elementos dispõe-se de um espaço de resultados contínuo. Um espaço de resultados pode ser ainda quantitativo ou qualitativo, conforme a natureza dos elementos que o compõem. A indicação dos elemen- tos do espaço de resultados pode fazer-se, quer pela enumeração de todos os elementos que o compõem (quando são em número finito, evidentemente) - definição por extensão - quer pela descrição abreviada desses elementos - definição por compreensão. Uma loja abre as 9 horas e encerra as 19. Um cliente, tomado ao acaso, entra na loja no momento X e sai no momento Y (tanto X como Y são expressos em horas com origem nas 9). Pretende observar-se os momentos de entrada e saída do cliente. Como a chegada e saída de um cliente se processa ao acaso, logicamente que poderá ocorrer em qualquer momento no tempo, entre as 9 e as 19 horas, pelo que X e Y são variáveis contínuas com X < Y. Portanto, o espaço de resultados R é infinito não numerável, podendo descrever-se da forma seguinte: (definição de R por compreensão). - * - .-> -. -. . - . Exemplo 2 Considere-se a experiência aleatória que consiste no lançamento de um dado e observação do número inscrito na face voltada para cima. O espaço de resultados é R = {1,2,3,4,5,6) (definição de R por extensão). TEORIA DAS PROBABILIDADES 2.3. A con tecimentos Retome-se o exemplo da experiência aleatória que consiste no lançamento de um dado e cujo espaço de resultados é L2 = {1,2,3,4,5,6 ) . Sendo o espaço de resultados um conjunto, é possível formar subconjuntos dos seus elementos, como, por exemplo: cujo significado é, respectivamente: A: saída de face 2 B: saída de face ímpar C: saída de face divisível por 3. A, B e C, sendo subconjuntos de Q, são simultaneamente conjuntos de resultados possíveis da experiência aleatória. Designam-se por acontecimentos. Um acontecimento é, pois, um conjunto de resultados possíveis de uma experiência aleatória ou, de modo equivalente, qualquer subconjunto do espa- ço de resultados é um acontecimento definido em i2 (eventualmente o próprio Q ou o conjunto vazio 0). Um acontecimento A relativo a um determinado espaço de resultados Q e associado a uma experiência aleatória é simplesmente um conjunto de resul- tados possíveis. Diz-se que A se realizou, se o resultado da experiência aleatória, w, é um elemento de A, isto é, se o, E A. Não se deverá confundir acontecimento com resultado. Enquanto que o primeiro significa algo que a experiência aleatória pode produzir, mas não se realiza necessariamente, um resultado indica algo que a experiência aleatória produziu. Ou seja, o conceito de resultado só tem sentido depois de realizada a experiência, enquanto que o conceito de acontecimento tem pleno sentido mesmo antes da experiência aleatória se realizar. Um acontecimento, A, diz-se acontecimento elementar se a sua realização depender da ocorrência de somente um resultado específico da experiência aleatória. ESTAT~STICA APLICADA Por oposição poder-se-á definir um acontecimento complexo ou composto aquele cuja realização implica a ocorrência de um resultado da experiência aleatória, qualquer um de entre os vários possíveis para aquele acontecimento. ",-." , , _*.. . . _. .l . ' * , , '"- ." ..-. < < . I.",..IIV *.^ - . < >. ..,..- "- 1 - - Exemplo 3 Admita-se a seguinte experiência aleatória: contagem do número de peças produzidas por uma máquina até ao aparecimento de uma peça defeituosa. A experiência consiste, portanto, em contar as peças produzidas pela máqui- na, interrompendo-se essa contagem no momento em que surgir uma defeituosa. Como se poderá verificar, qualquer número inteiro pode ser um resultado da experiência: - pode ser 0, se a primeira peça retirada for defeituosa; - pode ser 1, se a primeira peça for boa e a segunda defeituosa; - pode ser 2, se as duas primeiras forem boas e a terceira defeituosa; - e assim por diante. Em geral, poderá ser n se as primeiras n peças forem boas e a n + 1 defeituosa. O espaço de resultados associado a esta esperiência aleatória é o conjunto dos números inteiros Serão acontecimentos, por exemplo, os seguintes subconjuntos de Q: ou A: contam-se seis peças até sair uma defeituosa. B: conta-se um número par de peças até sair uma defeituosa. Para que A se realize terá que ocorrer um, e sómente um, dos possíveis resultados da experiência aleatória (6); diz-se então que A é um acontecimento elementar. Pelo contrário, para que B se realize, basta que ocorra um, mas qualquer um, de entre os vários resultados possíveis, e que são todos os que correspondem a contagens pares (2, 4, 6, 8 ...). Trata-se, portanto, de um acon- tecimento complexo. Torna-se ainda mais nítida a diferença entre acontecimento e resultado quando se trata de acontecimentos complexos: enquanto que o primeiro prevê a possibilidade de ocorrência de vários resultados, depois de realizada a experiência aleatória apenas ocorrerá um desses resultados possíveis. Na Teoria das Probabilidades, um acontecimento não é, nem um conceito referente ao passado, nem um conceito com ocorrência assegurada no futuro. É apenas uma eventualidade (acontecimento elementar) ou um conjunto de eventualidades (acontecimento complexo) cuja ocorrência depende do acaso. Os acontecimentos podem ainda ser classificados em certos, possíveis e impossíveis. Considere-se a experiência aleatória que consiste em medir o tempo neces- sário para que um aluno com o 12Qno obtenha uma licenciatura em gestão de empresas. Admitindo-se que nenhum destes alunos poderá levar mais de 20 anos para tal e considerando que em algumas instituições universitárias a duração mínima da licenciatura é de quatro anos, o espaço de resultados desta experiên- cia aleatória será: Sejam os seguintes acontecimentos A: o tempo necessário para obtenção da licenciatura é de 5 anos 6: o tempo necessário é igual ou superior a 4 anos mas não superior a 20 anos. C o tempo necessário é de 2 anos. Poder-se-á dizer que A é um acontecimento possível, B é um acontecimento certo e C é um acontecimento impossível. 6 é um acontecimento certo porque ocorre sempre, sendo o conjunto que o define 6 = [4,20] exactamente coincidente com o próprio espaço de resultados. Já o acontecimento C não ocorre, qualquer que seja o resultado da experiência aleatória e, como não existe qualquer resultado que torne viável a sua realização, o conjunto que define C é o vazio: c = 0 ESTAT~STICA APLICADA O acontecimento A situa-se, relativamente a B e C, numa situação intenédia quanto ao grau de possibilidade de se realizar. A é apenas possível, podendo ocorrer ou não depois de realizada a experiência aleatória. Considere-se um novo acontecimento D: o tempo necessário para obtenção da licenciatura é superior a 4 e inferior a 6 anos OU D = ]4,6[. Verifica-se que quando A se realizar, D também se realiza, uma vez que A é um subconjunto de D. Então, A é um sub-acontecimento de D, A c D, pois a realização de A implica a realização de D. d~gebra dos acontecimentos Q Definiu-se acontecimento como um conjunto de resultados possíveis de uma experiência aleatória. Esta definição sugere'que se poderá utilizar todos os instrumentos da teoria dos conjuntos para representar os acontecimentos e as operações que se definem sobre estes. Por exemplo, o diagrama de Venn revela-se de extrema utilidadena representação de acontecimentos: o conjunto universal é identificado como o espaço de resultados L2 da experiência alea- tória e cada acontecimento A por uma região interior a Q. De modo idêntico, o diagrama de Venn pode ser utilizado para representar, de forma simplificada e sugestiva, as operações que se definem sobre acon- tecimentos: união ou soma lógica, intersecção ou produto lógico e diferença. 3.1. União de acontecimentos ESTAT~TICA APLICADA A união de acontecimentos implica, pois, a ideia de disjunção, de alternativa, traduzida por ou; para que se realize o acontecimento união basta que ocorra pelo menos um dos acontecimentos: ou A, ou B ou ambos. Diagramaticamente, a união de A com B pode representar-se da seguinte forma: A operação união de acontecimentos pode ser generalizada a mais de dois acontecimentos. Dada uma sucessão infinita de acontecimentos Al, A2, ..., A,, ... , define- m se a sua união Ai como sendo o acontecimento que ocorrerá se e i= 1 somente se ocorrer pelo menos um dos acontecimentos Ai. 3.2. Intersecção de acontecimentos Contrariamente a união, a intersecção implica a ideia de conjunção, simul- taneidade ou sequência, a ideia de e: o acontecimento A B só se realiza TEORIA DAS PROBABILIDADES quando se realizarem os acontecimentos A e 9. Diagramaticamente, a inter- secção de A e B pode ser representada da seguinte forma: Também esta operação pode ser generalizada a um conjunto, finito ou infinito, de acontecimentos. Há certos acontecimentos que não podem ocorrer simultaneamente, logo a sua intersecção é o acontecimento impossível, isto é, corresponde a um conjunto vazio. Acontecimentos nestas condições, em que a ocorrência de um exclui a ocorrência dos restantes, dizem-se mutuamente exclusivos ou incom- pa tíveis. No diagrama de Venn anterior representam-se três acontecimentos mutua- mente exclusivos. . - . Exemplo 5 Seja a experiência aleatória que consiste no lançamento de um dado e os dois acontecimentos a ela associados: A : saída de face par; A = { 2 , 4 , 6 ) B : saída de face ímpar; B = { 1,3,5 ) A e B são mutuamente exclusivos ou incompatíveis, uma vez que não podem ocorrer simultaneamente: se ocorre A, isto é, sai face par, não pode ocorrer B e vice-versa. 3.3. Diferença de acontecimentos Diagramaticamente TEORIA DAS PROBABILIDADES Seja a experiência aleatória que consiste em medir o consumo médio per capita de cerveja em Portugal (em litros) e A e B os seguintes acontecimentos: A: o consumo médio per capita é superior ou igual a 30 litros mas inferior a 50 litros. B: o consumo médio per capita é igual ou superior a 40 litros mas inferior a 75 litros. A - B é o acontecimento «o consumo médio per capita é igual ou superior a 30 litros mas inferior a 40 litros» dado que ESTAT~STICA APLICADA 3.4. Propriedades das operações Em seguida apresentam-se as propriedades mais importantes das opera- ções de união e intersecção de acontecimentos. PROPRIEDADES 1 . Comutativa / 3. Distributiva I A u ( B n C ) = / A n < B u C ) = I UNIÁO 2. Associativa INTERSECÇÁO A U B = B U A A n B = B n A A u ( B u C ) = ( A u B ) u C 4. Idempotência A n < B n c > = < A n B ) n c 5. Lei do complemento 6. Leis de De Morgan A u A = A 7. Elemento neutro A n A = A A 2 = Q - A = 2 ij 8. Elemento absorvente A ~ à = D A ~ B = à u B A u 0 = A A n Q = A A = Q A n 0 = 0 Conceitos de probabilidade a Quais as hipóteses de que o rio Douro venha a ter um caudal abaixo do normal no próximo Verão? Qual a probabilidade de que a procura de automó- veis movidos a energia eléctrica venha a aumentar no próximo ano? Qual a probabilidade de que os trabalhadores do Metropolitano de Lisboa entrem em greve na próxima sexta-feira? As respostas a estas perguntas são dadas em termos da probabilidade ou verosimilhança de que cada um destes aconteci- mentos ocorra, sendo esta identificada como uma medida da certeza da ocorrência de cada acontecimento. Nas áreas económica e de gestão, os diferentes conceitos de probabilidade são largamente utilizados. Por exemplo, quando o primeiro-ministro afirma que a inflação no corrente ano não ultrapassará 4% ou quando um industrial prevê que as matérias-primas importadas para a sua produção não sofrerão um aumento de preços no curto prazo. As probabilidades fornecem aos gestores e economistas as bases para a tomada de decisão, quando existe incerteza sobre a evolução futura e sobre os efeitos práticos das suas decisões, isto é, quando a partir do passado não é possível prever deterministicamente o futuro, devido a influência do acaso, sendo no entanto possível prever as linhas de evolução futura e as possibilidades de estas se concretizarem. De acordo com a definição e o método de cálculo, podem definir-se três conceitos de probabilidade: clássica, empírica ou frequencista e subjectiva. As probabilidades que se baseiam nas características intrínsecas dos aconteci- mentos são definidas segundo o conceito clássico. Aquelas que se baseiam numa quantidade razoável de evidência objectiva são empíricas ou frequen- cistas, enquanto que as probabilidades definidas com base em crenças ou opiniões individuais se denominam subjectivas. ESTAT~STICA APLICADA 4 I Conceito clássico de probabilidade (a priori) Se a uma experiência aleatória se podem associar N resultados possíveis, mutuamente exclusivos e igualmente prováveis, e se nA desses resultados nA tiverem o atributo A, então a probabilidade de A é a fracção -, N onde: nA - número de resultados favoráveis a A N - número de resultados possíveis Repare-se que, para o conceito clássico de probabilidade, os resultados possíveis são todos igualmente prováveis, isto é, têm todos igual probabilidade de se realizarem. É este o conceito subjacente aos chamados jogos de azar, cuja prévia apresentação sistemática foi feita por Cardano. Este define como probabilidade de um acontecimento o rácio entre o número de resultados que fazem com que o acontecimento se realize e o número total de resultados. Por exemplo, a probabilidade de sair um número par quando se lança um dado é de 3/6 porque existem seis resultados possíveis e três deles são números pares. Galileu, meio século mais tarde, utilizou o mesmo conceito de probabilidade para responder a uma dúvida dos jogadores que notaram, no lançamento de três dados, saírem mais vezes faces que somam um total de 10 pontos do que 9 pontos. Tal como Cardano, Galileu sabia que era necessário ter em consideração a ordem dos resultados para que se possam associar probabi- lidades diferentes aos resultados. Assim, de 6 x 6 x 6 = 21 6 resultados possíveis, 25 somam 9 pontos e 27 somam um total de 10 pontos, de onde resultam, respectivamente, probabilidades de 25/216 e 27/216 . Este último exemplo ilustra bem a necessidade de recorrer a análise combinatória como método auxiliar para a contagem do número de casos favoráveis e do número de casos possíveis. TEORIA DAS PROBABILIDADES Na experiência aleatória que consiste no lançamento de um dado e observa- ção do número inscrito na face voltada para cima, seja A o acontecimento: saída da face 3. O espaço de resultados é definido pelos seguintes elementos R = { 1, 2, 3, 4, 5, 6 }. A probabilidade de se realizar o acontecimento A é: com: n~ - número de resultados favoráveis ao acontecimento A N - número de resultados possíveis. Consideremos a experiência aleatória que consiste no lançamento de uma moeda equilibrada ao ar. Seja A o acontecimento: saída de face. O espaço de resultados será constituído por R = { Face, Coroa ). A probabilidade de A será: Um investigador mostra a um indivíduo 12 corese pede-lhe que escreva 4 que sejam suas favoritas. a) Quantos resultados possíveis existem? b) Se uma das cores do lote das 12 for azul, quantos resultados possíveis irão conter essa cor? pois o azul é sempre escolhido e portanto só 3 cores das restantes 11 podem ser escolhidas. ESTAT~STICA APLICADA c) Qual a probabilidade de escolher a cor azul como uma das suas preferidas? 4.2. Conceito frequencista de probabilidade (a posteriori) Se em N realizações de uma experiência, o acontecimento A se verificou n vezes, diz-se que a frequência relativa de A nas N realizações é sendo fA a frequência relativa do acontecimento A. Noutras N realizações da mesma experiência, desde que N seja suficien- temente elevado, a frequência relativa com que se realiza o acontecimento A é em geral diferente mas próxima da anterior. A medida que o número de provas aumenta, verifica-se uma regularidade das frequências relativas, de tal modo que a irregularidade dos resultados individuais se opõe uma certa regu- laridade estatística ao fim de uma longa série de provas, isto é, f A = VN tende a estabilizar. É esta característica das experiências aleatórias que permite definir o conceito frequencista de probabilidade. Ao número para que tende a frequência relativa f A , quando se aumenta o número de provas, chama-se probabilidade do acontecimento A: P I A ] = lim fA N-s m Isto equivale a aceitar que numa sucessão numerosa de experiências é praticamente certo que a frequência relativa de A seja aproximadamente igual a P [A I. Esta regra está na base da definição frequencista de probabilidade. TEORIA DAS PROBABILIDADES O valor da frequência relativa é uma indicação do valor da probabilidade na experiência aleatória considerada, quando se repete essa experiência um número suficientemente grande de vezes. ---- . "?*- w8".,,~% *-- ",, .- , . .- . . , , - .- ,~ -- . . . %.. . Exemplo 10 A experiência aleatória que consiste na observação do sexo de um recém- -nascido pode considerar-se o exemplo típico para aplicação do conceito frequen- cista de probabilidade. Porque esta experiência já se realizou inúmeras vezes e existem registos do seu resultado, sabe-se que a probabilidade do sexo do recém-nascido ser masculino é de aproximadamente 0,52 e de ser feminino é de cerca de 0,48. A utilização do conceito clássico de probabilidade teria conduzido ao valor de 0,5 para cada uma das referidas probabilidades, o que constituiria um erro. Este seria proveniente do facto de se considerarem equiprováveis os elementos do espaço de resultados S2 = { Masculino, Feminino }, quando estes o não são. 4.3. Conceito subjectivo ou personalista de probabilidade Utilizando este conceito, a probabilidade de um acontecimento é dada pelo grau de credibilidade ou de confiança que cada pessoa dá a realização de um acontecimento. Baseia-se na informação quantitativa (ex: frequência de ocor- rência de um acontecimento) eiou qualitativa (ex: informação sobre experiência passada em situações semelhantes) que o decisor possui sobre o aconteci- mento em causa. Diferentes decisores podem atribuir diferentes probabilidades ao mesmo acontecimento decorrentes da experiência, atitudes, valores, etc, que possuem. Esta noção de probabilidade pode ser aplicada a experiências que, embora de resultado sujeito ao acaso, não se podem efectuar várias vezes nas mes- mas condições, casos em que os conceitos frequencista e clássico não se podem aplicar. ESTATíSTICA APLICADA * e?+ w,",*-- 2 - ".-- . W" . . . , . , . - Exemplo I 1 Se o Primeiro Ministro afirmasse aa inflação para o próximo ano será de 3% com uma probabilidade de 0,9>> estaria a aplicar o conceito subjectivo ou perso- nalista de probabilidade. Uma outra figura política, da Oposição, diria certamente que tal meta seria difícil de atingir, e sendo instada a quantificar o que para ela era <<difícil» poderia mesmo afirmar: «Tal nível de inflação só será atingido com uma probabilidade de 0,25>>. Também esta figura política estará, deste modo, a aplicar o conceito personalista de probabilidade. II ESTAT~STICA APLICADA ou seja, P [ 0 ] = P [ Q ] - P [ a ] O acontecimento impossível tem probabilidade nula mas a recíproca não é verdadeira. A raridade dum acontecimento pode levar a que a sua probabili- dade seja zero sem que, no entanto, este seja impossível. É o caso em que, no lançamento duma moeda ao ar, esta fica em pé sem cair para nenhum dos lados. Sejam dois acontecimentos A e B quaisquer. Atendendo as propriedades das operações sobre acontecimentos, facilmente se demonstra o seguinte B = B ~ ( A ~ A ) B = ( B n A ) u í ~ n à > Os acontecimentos ( B r\ A ) e ( B n à ) são mutuamente exclusivos e ( B n à ) é o acontecimento que se realiza quando se realiza B mas não se realiza A, logo B n à = { w : w E B A w E A } = B - A TEORIA DAS PROBABILIDADES Pelo axioma 3, teremos então P [ B ] = P [ B n A ] + P [ B n à ] ou logo Na produção de uma empresa de artigos de vestuário, 10% dos artigos produzidos têm defeitos de material (tecido), 5% têm defeitos de acabamento e 2% defeitos de ambos os tipos. Qual a probabilidade de uma peça de vestuário retirada ao acaso ter apenas defeitos de tecido? Considerando os acontecimentos A: o artigo tem defeito de matéria prima (tecido) B: o artigo tem defeito de acabamento e o acontecimento A - B : o artigo tem apenas defeito de matéria prima a sua probabilidade será P [ A - B ] = P [ A ] - P [ A n B ] . De acordo com os dados disponíveis então P [ A - 51 = 0,10 - 0,02 = 0,08 isto é, a probabilidade de uma peça de vestuário ter apenas defeitos de tecido é de 0,08. ESTAT~STICA APLICADA Considerem-se dois acontecimentos A e B quaisquer, mutuamente exclusi- vos ou não. Então, pelo teorema anterior e pelas propriedades das operações, A y B = ( A y B ) n s z = Aplicando probabilidades P[A y B ] = P [ A y ( 6 - A ) ] Mas, porque A e ( B - A ) são mutuamente exclusivos, P [ A y B ] = P [ A ] + P[B - A ] e utilizando o teorema anterior sobre a probabilidade da diferença de dois acontecimentos . " - , . " - . ~ P - ~ , - ~ r r ,><...i.I,T r-:-. ..r..?,.murw-,.w W v p . ~ " ' ..- r.*-.- -. . . ., -*.-. .--, "-*rq Exemplo 14 Seja a experiência aleatória que consiste em retirar uma carta de um baralho de 52 cartas e considerem-se os acontecimentos: A: sai rei B: sai paus cujas probabilidades são, respectivamente, 4/52 e 13/52. A probabilidade do acontecimento união A y B : sai rei ou paus 16 é P[A y B ] = -, uma vez que existem 16 resultados favoráveis (13 de 52 saírem paus mais 3 de saírem reis que não são de paus) em 52 resultados possíveis. Esta probabilidade é diferente de pois ao somamos P[A] com P[B], conta-se duas vezes a probabilidade do acontecimento asai rei de paus» (acontecimento A n B ) comum aos aconteci- mentos A e B. É necessário, portanto, deduzir a probabilidade deste último acontecimento: P[A y B ] = P [A ] + P[B] - P[A n 51 = ..- r-r r- olwl -rr, I-", %C<- rB r .r* 1 r - r * rr" -- ... ", *. -. r.r<. ,, .' - Exemplo 15 Em determinada cidade, 30% da população de leitores de jomais diários compra o jornal aDiário>>, 40% o jornal «Público» e 10% compra os dois jomais. Se desta população escolhermos um leitor ao acaso, qual a probabilidade de ele comprar pelo menos um destes jomais, isto é, de ler o <<Diário>>, ou o <<Público» ou ambos? Considerando os acontecimentos: A: o leitor compra o diário» B: o leitor compra o <<Público» ESTAT~STICA APLICADA e sabendo que P [ A ] = 0,30 P [ B ] = 0,40 P [ A n B ] = 0,lO o que se pretende conhecer é P [ A y B ] . P [A y B ] = P [ A ] + P [ B ] - P [ A n B ] = = 0,30 + 0,40 - 0,lO = = 0,60 isto é, 60% dos leitores compra pelo menos um destes jornais. TEORIA DAS PROBABILIDADES Para n = 3 Para n = 4 Exemplo 16 A mesma população de leitores do exemplo anterior foi inquirida sobre as suas preferências relativamente a três revistas mensais A, B e C. Os resultados obtidos foram os seguintes: Qual a probabilidade de, um leitor escolhido ao acaso, ser leitor de a) Somente A e C? b) Pelo menos uma revista? Revista A B C A e B A e C B e C A e B e C As respostas a estas duas questões são imediatas se se atender ao teorema 3 e a generalização do teorema 4: a) A probabilidade pedida é Leitores (Oh) 9 8 22,9 12,l 51 3,7 6,O 2,4 b) A probabilidade pedida é WoRIA DAS PROBABILIDADES Este problema poderia também ser resolvido com o auxilio de um diagrama de Venn. Probabilidades condicionadas A partir do momento em que se conhece a probabilidade de o acontecimen- to B (do espaço de resultados Q) ocorrer, é possível calcular a probabilidade de qualquer outro acontecimento A se realizar condicionado pelo acontecimento B. Um jogador da loteria compra três bilhetes para a extracção do Natal com os números 01011, 15555 e 22444, realizando-se o sorteio entre um total de 40000 números, de 00000 a 39999. O acontecimento: A: o jogador obtém o primeiro prémio comporta três resultados favoráveis A = {01011, 15555, 22444) num total de 40000 resultados possíveis TEORIA DAS PROBABILIDADES Aplicando o conceito clássico de probabilidade facilmente se obtém a proba- bilidade de o jogador obter o primeiro prémio: Admita-se agora que, no dia da extracção, o jogador soube acidentalmente que o número premiado em primeiro lugar era um número par, embora não tivesse ainda conhecimento do número premiado. Qual será agora a probabilidade do jogador obter o primeiro prémio considerando a informação adicional de que, entretanto, tomou conhecimento? Isto é, qual a probabilidade de o jogador obter o primeiro prémio dado que o número premiado é par? O número de resultados favoráveis é agora apenas de 1, uma vez que o jogador apenas possui um bilhete com número par, enquanto que os resultados possíveis passaram a ser de 20000 (o total de números pares nos 40000): sendo B: o primeiro prémio saiu a um número par. A probabilidade anterior não representa a probabilidade absoluta ou total de A se realizar (igual a 3/40 000 como se viu anteriormente),. mas a probabilidade de A condicionada pela ocorrência de B, ou probabilidade de A dado B. O facto de ser dado B opera uma redução no espaço de resultados, que passa de R, constituído por 40 000 resultados possíveis, para o próprio B, formado por apenas 20 000 resultados. A probabilidade de A será então Dividindo ambos os termos da fracção por 40000 obtém-se 1 ficando i ) no denominador o número de resultados favoráveis a 5 sobre o número total de resultados possíveis, isto é, a probabilidade de B; ii) no numerador o quociente entre o número de resultados favoráveis a ocor- rência de A e B em simultâneo (A n B) e o número total de resultados possíveis, ou seja, P [A n B 1. ESTAT~STICA APLICADA Concluindo, a probabilidade de A dado B é igual a Suponha-se agora a situação inversa. No dia da extracção o jogador é infor- mado de que lhe saíu o primeiro prémio. Qual a probabilidade de que o número premiado seja par? O que se pretende conhecer é P [E I A 1. Aplicando a definição de probabili- dade condicionada: ou, porque a intersecção de acontecimentos é comutativa, Considere-se que a partir duma amostra efectuada sobre vários recém-nasci- dos se obteve o seguinte quadro de probabilidade conjunta: onde: Al - um recém-nascido escolhido ao acaso é do sexo masculino; AP - um recém-nascido escolhido ao acaso é do sexo feminino; Bl - um recém-nascido escolhido ao acaso tem olhos castanhos; B2 - um recém-nascido escolhido ao acaso não tem olhos castanhos. TEORIA DAS PROBABILIDADES A partir deste quadro podem-se definir: - probabilidades conjuntas como, por exemplo, a probabilidade do recém- -nascido ser do sexo masculino e não ter olhos castanhos: - probabilidades marginais (referentes a um único acontecimento) como, por exemplo, a probabilidade de um recém-nascido ser do sexo masculino independentemente da cor dos olhos: - probabilidades condicionadas, por exemplo, de um recém-nascido não ter olhos castanhos dado que é do sexo masculino: P [B2 I AI ] é a probabilidade de B tendo em conta que o acontecimento AI se realiza, ou seja, AI passa a ser o acontecimento certo, com proba- bilidade 1 (PIA1 I AI ] = 1 ) e B2 só pode ocorrer quando ocorre simulta- neamente AI. Logo a probabilidade de B2 n AI passa a ser redimensio- nada tendo em conta a probabilidade unitária do acontecimento AI no novo espaço de resultados R ' = AI. u 6.1. Axiomática e teoremas da teoria das probabilidades na probabilidade condicionada O conceito de probabilidade condicionada satisfaz todos os axiomas da teoria das probabilidades introduzidos anteriormente. Assim, sendo B um acon- tecimento tal que P [B ] > 0 : ESTAT~TICA APLICADA I ) P [ A I B ] 2 O Demonstração: mas P [ A ri B ] 2 O e P [ B ] > O logo P [ A I B ] 2 O por definição pelo Axioma 1 por hipótese c.q.d. Demonstração: corque Q é o elemento neutro da intersecção de acontecimentos. 3) Se Al e A2 são mutuamente exclusivos (isto é, Al n A2 = 0 ), então: P[(Ai A*) I B ] = P[A1 I B ] + P[A2 I B ] TEORIA DAS PROBABILIDADES Demonstração: pela propriedade distributiva porque (Al n B ) e (A2 n B) são mutuamente exclusivos, por A, e A2 O serem, donde = P[A1 I B ] + PIA2 I B ] . Ao obedecer a axiomática da Teoria das Probabilidades, o conceito de probabilidade condicionada satisfaz também todos os seus teoremas. Probabilidade da intersec~ão de acontecimentos. Acontecimentos independentes 7.1. Probabilidade da intersecção de acontecimentos A probabilidade de intersecção de dois acontecimentos, A e 9, decorre da probabilidade condicionada. De acordo com o ponto anterior, da definição de probabilidade condicionada resulta que Assim, das duas igualdades anteriores retira-se que TEORIA DAS PROBABILIDADES Exemplo 17 (continuaqáo) Retomando o exemplo do jogador que compra três bilhetes de loteria a sortear na extracção do Natal, a probabilidade da intersecção de 6 com A, ou de o jogador receber o primeiro prémio e de este ser um número par (1/40000), tanto pode obter-se tomando 6 como condicionante como inversamente, tomando A como condicionante A probabilidade de intersecção de dois acontecimentos pode ser facilmente generalizada a mais de dois acontecimentos se atendermos a associatividade da intersecção. Generalização a três acontecimentos: P[A n B n C ] = P[(A n B ) n C ] = = P [ C J ( A n B ) ] . P[A n B ] = = p [ C l ( A n 811 . P [ B I A l . P [ A l , para A, B e Ctais que P [ A ] + O e P [ A n B ] # O Generalização a quatro acontecimentos: P [ A n B n C n D ] = P [ ( A n B r, C ) n D ] = = P [ D ( ( A n B n C ) ] . P [ A ,q B C ] = = P [ D I ( A n B n C ) ] . P [ C I ( A n B ) ] . P [ B I A ] . P [ A ] . pa raA ,B ,CeDta i squeP [A ] ,P [A n B ] , P [ A n B n C ] nãonulas. 7.2. Acontecimentos independentes Relacionado com o conceito de probabilidade condicionada está o conceito de acontecimentos independentes. TEORIA DAS PROBABILIDADES Estas relações, de per si intuitivas, derivam da definição formal de aconte- cimentos independentes: Para dois acontecimentos independentes,podem enunciar-se os seguintes teoremas: Demonstre-se o primeiro: A = A ~ Q = [ A ~ ( B ~ E ) ~ = ( A ~ B ) y ( A ~ E ) logo P [ A ] = P[(A n B ) (A n i)] = P [ A n a] + P [ A n ã ] porque (A ri B ) e (A n 8) são mutuamente exciusivos P [A ] = P [A ] . P [B ] + P [A n E ] porque A e B são independentes ESTAT~STICA APLICADA logo P [ A n E ] = P [ A ] - P [ A ] . P [ B ] = = P [ A ] . (1 - P [ B ] ) = = P [ A ] . P $ ] porque P [ E I = 1 - P [ B ] Então, dado que se demonstrou que conclui-se que, nestas condições, A e são acontecimentos independentes, c.q.d. De modo idêntico se poderiam demonstrar os dois últimos teoremas. Os acontecimentos Ai, A2, ..., An dir-se-ão independentes dois a dois se verificarem apenas a primeira condição. Convém também referir que a última condição é necessária mas não suficiente para que AI, A2, ..., An sejam independentes. TEORIA DAS PROBABILIDADES Suponha-se R formado por 4 acontecimentos elementares de igual probabili- dade: Q = {OI, w2, w3, w4 1 com P[ ai] = V4, i = 1, 2, 3, 4. Considerem-se os acontecimentos A = { a i , a 2 1 B = {WI, 0 3 1 C = {WI, w4} Pretende-se verificar se os acontecimentos A, B e C são independentes. 1 P [ A n B] = P[wl ] = - 4 As condições anteriores garantem que os acontecimentos são independentes dois a dois. Contudo, Assim, os acontecimentos não são independentes entre si, embora o sejam dois a dois. M ESTAT~STICA APLICADA Seja a experiência aleatória que consiste no lançamento de dois dados regu- lares e distinguíveis, cujo espaço de resultados é o conjunto e os acontecimentos A - a soma dos pontos dos 2 dados é par B - a soma dos pontos dos 2 dados é múltipla de 3 C - a soma dos pontos dos 2 dados é maior que 9 Com probabilidades Como se pode verificar P [A n B n C] = P [ A ] . P [ B ] . P [C]. No en- tanto, apenas os acontecimentos A e B são independentes, sendo A e C, e B e C dependentes entre si, pois TEORIA DAS PROBABILIDADES Em experiências aleatórias ligadas a jogos de azar é, em geral, fácil verificar a existência ou não de independência dos acontecimentos. Noutros casos, porém, só depois do exame rigoroso de todas as condições se poderá concluir acerca da independência dos acontecimentos. Uma caixa contém 100 peças sendo 10 defeituosas. Considere-se a expe- riência aleatória que consiste em extrair sucessivamente duas peças da caixa. Pretende saber-se a probabilidade do acontecimento: A: a primeira peça é não-defeituosa e a segunda é defeituosa. Para calcular esta probabilidade é necessário atender as duas situações possíveis: aquela em que a extracção da segunda se efectua sem que a primeira seja reposta na caixa (extracção sem reposição) e quando a extracção da segun- da peça só se efectua depois da primeira ter sido reposta na caixa (extracção com reposição). - Extracção sem reposição. Sejam os acontecimentos: Dl: a primeira peça é defeituosa D2: a segunda peça é defeituosa então A = Dl n D2. Por se tratar de uma extracção sem reposição, os dois acontecimentos são dependentes, logo P [A ] = f [ D 1 n D2] = - Extracção com reposição. Agora os acontecimentos elementares D1 e D2 são independentes, pois a primeira peça extraída é reposta e a probabilidade de 4 não se altera pelo facto de D1 ter ocorrido. Após a primeira extracção, a caixa volta a ter 100 peças, das ESTAT~STICA APLICADA quais 10 são defeituosas, isto é Então P I A ] = p[D1 n D2] = 7.3. Acontecimentos independentes versus acontecimentos incompatíveis ou mutuamente exclusivos Sejam A e B dois acontecimentos tais que - no caso dos acontecimentos serem incompatíveis (mutuamente exclusi- vos) tem-se, por definição, (A n B ) = 0 e, consequentemente, P [ A n B ] = O. Os acontecimentos não podem ser independentes pois, para tal, e por definição de independência, seria P [A n B ] = P [A ] . P [ B ] > 0, pois ambos os acontecimentos têm probabilidades não nulas. - no caso dos acontecimentos serem independentes não podem ser mu- tuamente exclusivos, pois se são independentes então, P [A ri B ] = P [A ] . P [ B ] é maior que zero; para serem simultanea- TEORIA DAS PROBABILIDADES mente mutuamente exclusivos esta probabilidade teria de ser nula, facto impossível a não ser que algum dos acontecimentos tivesse proba- bilidade nula, o que não é o caso. Assim, em geral, dois acontecimentos não podem ser simultaneamente independentes e mutuamente exclusivos. Existe, no entanto, um caso particular em que tal pode ocorrer: é o caso em que um dos acontecimentos é impossível, porque este é sempre independente e mutuamente exclusivo de todo e qual- quer outro acontecimento possível. Teorema da probabilidade total e fórmula de Bayes O conceito de probabilidade condicionada revela-se muito importante e de larga utilização quando se conhecem probabilidades condicionadas nas quais os acontecimentos condicionantes definem uma partição em R. 8.1. Teorema da probabilidade total Demonstração n = V (B n Ai). i = 1 Dado que os Ai são mutuamente exclusivos, então os acontecimentos (B n Ai), i = 1, 4 ..., n, também O são; logo ESTAT~STICA APLICADA Diagramaticamente com n = 5 I P [ B ] vem igual a soma das probabilidades dos acontecimentos sombrea- dos no diagrama, isto é, dos acontecimentos (Ai n B), com i = 1, 2, 3 ,4 , 5. 8.2. Fórmula de Bayes Demonstração TEORIA DAS PROBABILIDADES por definição de probabilidade de intersecção de dois acontecimentos (no numerador) e pelo teorema da probabilidade total (no denominador). c.q.d. Uma fábrica de cachimbos utiliza 3 máquinas de acabamento com volume diário de produção, respectivamente, de 500, 1000 e 2000 unidades. De acordo com a experiência anterior sabe-se que a percentagem de cachimbos defeituosos originados por cada máquina é, respectivamente, de 0,005, 0,008 e 0,Ol. Sabendo que um cachimbo foi encontrado defeituoso pretende apurar-se qual a máquina que, com maior probabilidade, lhe terá dado origem e qual a que tem menor probabilidade de o ter gerado. Para resolver o problema devemos em primeiro lugar definir todos os aconte- cimentos. Ai - Um cachimbo escolhido ao acaso da produção diária foi produzido pela mgquina 1 A2 - Um cachimbo escolhido ao acaso da produção diária foi produzido pela máquina 2 AS - Um cachimbo escolhido ao acaso da produção diária foi produzido pela máquina 3 B - Um cachimbo escolhido ao acaso da produção diária é defeituoso Pretendemos calcular as P [Ai I B ] ( i = 1, 2, 3) e ordená-las por ordem de- crescente. Ai, A2, A3 definem uma partição em i2 visto que 3 i ) Apenas as máquinas 1, 2 e 3 produzem cachimbos, isto é, y Ai = R. i= 1 ii) Um cachimbo que é produzido numa máquina não é produzido noutra, A i r , A i = 0, i # j i, j = 1,2,3. iii) Qualquer uma das máquinas produz cachimbos, P [Ai ] > O, i = 1,2,3. As informações fornecidas no enunciado vão permitir utilizar a fórmula de Bayes, para o cálculo das probabilidades pretendidas. ESTAT~STICA APLICADA Sabe-se pelo enunciado que a probabilidade de cada cachimbo ter sido produzido por cada uma das máquinas é: Conhecem-se também as probabilidades de um cachimbo ser defeituoso, dado que foi produzido numa determinada máquina: P [B I AI ] = 0,005 Construindo um quadro: 0,008 0,0023 0,Ol O 0,0057 0,66 P [ B ] = 0,0087 1 Note-se que P [B] foi calculada recorrendo ao teorema da probabilidade total. Do quadro anterior retira-se que a probabilidade de um cachimbo ter sido produzido pela máquina 3, sabendo que é defeituoso, é de 0,66; a mesma probabilidade para a máquina 2 é
Compartilhar