Baixe o app para aproveitar ainda mais
Prévia do material em texto
INTRODUC¸A˜O A` ESTATI´STICA RICARDO S. EHLERS Departamento de Estat´ıstica Universidade Federal do Parana´ Primeira publicac¸a˜o 2002 Segunda edic¸a˜o publicada em 2005 Terceira edic¸a˜o publicada em 2006 c© RICARDO SANDES EHLERS 2002-2006 Prefa´cio O objetivo principal deste texto e´ oferecer um material dida´tico ba´sico em por- tugueˆs para um curso de Introduc¸a˜o a` Estat´ıstica a n´ıvel de graduac¸a˜o. Sa˜o apresentados os mais importantes conceitos e me´todos de ana´lise estat´ıstica de dados. O texto se originou de notas de aulas de disciplinas de introduc¸a˜o a` Es- tat´ıstica ministradas para diferentes cursos na Universidade Federal do Parana´. O manuscrito foi preparado usando o LATEX e todas as ilustrac¸o˜es e tabelas estat´ısticas foram produzidas no pacote estat´ıstico R (R Development Core Team 2006), gratuito e de co´digo aberto, que pode ser obtido em http://www.r-project.org/ Este texto certamente na˜o esta´ livre de erros, e comenta´rios e sugesto˜es dos leitores sa˜o bem vindos. Citar este texto como: Ehlers, R.S. (2005) Introduc¸a˜o a` Estat´ıstica. Departamento de Estat´ıstica, UFPR. Dispon´ıvel em http://www.est.ufpr.br/˜ ehlers/notas/. Acesso em: 21 nov. 2005. Ricardo S. Ehlers Curitiba, novembro de 2005. i Suma´rio 1 Estat´ıstica Descritiva 1 1.1 Introduc¸a˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.2 Tipos de Varia´veis . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.3 Varia´veis qualitativas . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.4 Varia´veis quantitativas . . . . . . . . . . . . . . . . . . . . . . . . 4 1.5 Resumos nume´ricos . . . . . . . . . . . . . . . . . . . . . . . . . . 8 1.5.1 Me´dia, variaˆncia e desvio padra˜o . . . . . . . . . . . . . . 9 1.5.2 A mediana e a amplitude inter-quartis . . . . . . . . . . . 11 1.5.3 A moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 1.6 Dados mu´ltiplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 1.6.1 Diagramas de dispersa˜o . . . . . . . . . . . . . . . . . . . 15 1.6.2 Dados Pareados . . . . . . . . . . . . . . . . . . . . . . . . 17 1.7 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 2 Probabilidades 24 2.1 Experimento aleato´rio . . . . . . . . . . . . . . . . . . . . . . . . 24 2.2 Definic¸a˜o de probabilidade . . . . . . . . . . . . . . . . . . . . . . 25 2.3 Probabilidade Condicional e Independeˆncia . . . . . . . . . . . . . 26 2.4 Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 2.5 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 2.6 Algumas distribuic¸o˜es de probabilidade . . . . . . . . . . . . . . . 33 2.6.1 A distribuic¸a˜o Uniforme Discreta . . . . . . . . . . . . . . 34 2.6.2 A distribuic¸a˜o Binomial . . . . . . . . . . . . . . . . . . . 34 2.6.3 A distribuic¸a˜o de Poisson . . . . . . . . . . . . . . . . . . 36 2.6.4 Distribuic¸a˜o Geome´trica . . . . . . . . . . . . . . . . . . . 38 2.6.5 Varia´veis Aleato´rias Discretas . . . . . . . . . . . . . . . . 38 2.6.6 A Distribuic¸a˜o Uniforme Cont´ınua . . . . . . . . . . . . . 40 2.6.7 A Distribuic¸a˜o Normal . . . . . . . . . . . . . . . . . . . . 40 2.6.8 Distribuic¸a˜o Exponencial . . . . . . . . . . . . . . . . . . . 43 ii SUMA´RIO iii 2.6.9 Varia´veis Aleato´rias Cont´ınuas . . . . . . . . . . . . . . . . 43 2.6.10 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 2.7 Ajuste de Modelos Teo´ricos . . . . . . . . . . . . . . . . . . . . . 45 2.8 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 3 Estimac¸a˜o 56 3.1 Infereˆncia Estat´ıstica . . . . . . . . . . . . . . . . . . . . . . . . . 56 3.2 Princ´ıpios de estimac¸a˜o . . . . . . . . . . . . . . . . . . . . . . . . 57 3.3 Obtendo uma amostra . . . . . . . . . . . . . . . . . . . . . . . . 58 3.4 Teorema Central do Limite . . . . . . . . . . . . . . . . . . . . . . 59 3.5 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 3.6 Intervalos de Confianc¸a . . . . . . . . . . . . . . . . . . . . . . . . 63 3.6.1 Intervalos de confianc¸a para a me´dia . . . . . . . . . . . . 63 3.6.2 Intervalos de confianc¸a para uma proporc¸a˜o . . . . . . . . 66 3.6.3 Comparac¸a˜o de intervalos de confianc¸a . . . . . . . . . . . 67 3.6.4 Intervalo de Confianc¸a para Variaˆncia . . . . . . . . . . . . 68 3.7 Comenta´rio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 3.8 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 4 Testes de Hipo´teses 72 4.1 Introduc¸a˜o e notac¸a˜o . . . . . . . . . . . . . . . . . . . . . . . . . 72 4.1.1 Deciso˜es e poder . . . . . . . . . . . . . . . . . . . . . . . 74 4.2 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 4.3 Probabilidade de significaˆncia (P -valor) . . . . . . . . . . . . . . . 76 4.4 Procedimento geral de teste . . . . . . . . . . . . . . . . . . . . . 77 4.5 Teste para a me´dia . . . . . . . . . . . . . . . . . . . . . . . . . . 78 4.6 Teste para a proporc¸a˜o . . . . . . . . . . . . . . . . . . . . . . . . 79 4.7 Testes para a variaˆncia da distribuic¸a˜o normal . . . . . . . . . . . 79 4.8 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 4.9 Dimensionamento de amostras . . . . . . . . . . . . . . . . . . . . 82 4.10 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 4.11 Testes de Adereˆncia (Testes χ2) . . . . . . . . . . . . . . . . . . . 85 4.12 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 4.13 Comenta´rios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 5 Comparando Grupos 89 5.1 Diferenc¸a entre me´dias de dois grupos . . . . . . . . . . . . . . . . 89 5.1.1 Desvios padra˜o iguais . . . . . . . . . . . . . . . . . . . . . 90 5.1.2 Desvios padra˜o diferentes . . . . . . . . . . . . . . . . . . 91 iv SUMA´RIO 5.2 Comparac¸a˜o de variaˆncias . . . . . . . . . . . . . . . . . . . . . . 92 5.3 Amostras pareadas . . . . . . . . . . . . . . . . . . . . . . . . . . 93 5.4 Comparando proporc¸o˜es . . . . . . . . . . . . . . . . . . . . . . . 94 5.5 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 6 Correlac¸a˜o e Regressa˜o 99 6.1 Definic¸o˜es . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 6.2 Interpretac¸a˜o do coeficiente de correlac¸a˜o . . . . . . . . . . . . . . 101 6.3 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 6.4 Regressa˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 6.4.1 Modelo de regressa˜o linear simples . . . . . . . . . . . . . 111 6.4.2 Estimando os paraˆmetros do modelo . . . . . . . . . . . . 112 6.4.3 Construindo intervalos e testando hipo´teses . . . . . . . . 114 6.4.4 Transformac¸o˜es de dados . . . . . . . . . . . . . . . . . . . 115 6.4.5 Representac¸a˜o Matricial . . . . . . . . . . . . . . . . . . . 116 6.4.6 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . 116 6.5 Regressa˜o Linear Mu´ltipla . . . . . . . . . . . . . . . . . . . . . . 118 6.6 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124 References 126 A Tabelas Estat´ısticas 127 B Soluc¸o˜es de Exerc´ıcios Selecionados 136 Cap´ıtulo 1 Estat´ıstica Descritiva 1.1 Introduc¸a˜o A Estat´ıstica esta´ presente em todas as a´reas da cieˆncia que envolvam a coleta e ana´lise de dados e sua consequente transformac¸a˜o em informac¸a˜o, para postular, refutar ou validar hipo´teses cient´ıficas sobre um fenoˆmeno observa´vel. Sendo assim, a Estat´ıstica pode ser pensada como a cieˆncia de aprendizagem a partir de dados. Em linhasgerais, o papel da Estat´ıstica consiste em desenvolver me´todos de ana´lise de dados que auxiliam o processo de tomada de decisa˜o nos mais variados problemas onde existe incerteza. Em func¸a˜o disto, fica evidente que os me´todos estat´ısticos podem ser empregados em praticamente todas as a´reas do conhecimento, sempre que estiver envolvida a coleta ou ana´lise de dados. Em cieˆncia, sa˜o realizados estudos experimentais ou observacionais que daˆo origem a um conjunto de dados nume´ricos. O propo´sito da investigac¸a˜o e´ responder uma questa˜o cient´ıfica, mas o padra˜o de variac¸a˜o nos dados faz com que a resposta na˜o seja o´bvia. Em geral, a disciplina de Estat´ıstica refere-se a me´todos para coleta e descric¸a˜o de dados, e para quantificac¸a˜o da evideˆncia nos dados pro´ ou contra uma questa˜o cient´ıfica. A presenc¸a de uma variac¸a˜o na˜o previs´ıvel (aleato´ria) nos dados faz disso uma tarefa pouco trivial. Neste cap´ıtulo sera˜o apresentadas te´cnicas para organizac¸a˜o e descric¸a˜o dos dados. No Cap´ıtulo 2 sera˜o estudados conceitos asso- ciados a` teoria das probabilidades, necessa´rios para desenvolver os me´todos dos cap´ıtulos seguintes. A partir do Cap´ıtulo 3 sera˜o estudados me´todos estat´ısticos que auxiliam na tomada de deciso˜es com base nos dados. 1 2 CAPI´TULO 1. ESTATI´STICA DESCRITIVA 1.2 Tipos de Varia´veis Ao inve´s de tentar interpretar listas de nu´meros e´ mais informativo produzir um resumo nume´rico e usar me´todos gra´ficos para descrever as caracter´ısticas principais dos dados. O me´todo mais apropriado dependera´ da natureza dos dados, e podemos distinguir dois tipos principais apresentados abaixo. • Varia´veis qualitativas ou catego´ricas que podem ser: – nominais, por exemplo sexo (masculino, feminino), classificac¸a˜o de defeitos em uma ma´quina. – ordinais, com categorias ordenadas, por exemplo salinidade (baixa, me´dia, alta). • Varia´veis quantitativas que podem ser: – discretos, i.e. contagens ou nu´mero inteiros, por exemplo nu´mero de ataques de asma no ano passado. – cont´ınuos, i.e. medidas numa escala cont´ınua, tais como volume, a´rea ou peso. As distinc¸o˜es podem ser menos r´ıgidas na pra´tica. Por exemplo, em geral tratar´ıamos a “idade” como uma varia´vel cont´ınua, mas se a idade for registrada pelo ano mais pro´ximo, podemos trata´-la como discreta, e se agruparmos os dados em “crianc¸as”, “adultos jovens”, “adultos” e “idosos”, enta˜o temos “faixa eta´ria” como uma varia´vel ordenada catego´rica. No entanto, em geral e´ recomendado manter os dados em sua forma original e criar categorias somente para propo´sitos de apresentac¸a˜o. 1.3 Varia´veis qualitativas Para resumir dados qualitativos numericamente, utiliza-se contagens, proporc¸o˜es, porcentagens, taxas por 1000, taxas por 1.000.000, etc, dependendo da escala apropriada. Por exemplo, se encontrarmos que 7 de uma amostra de 5000 pes- soas sa˜o portadoras de uma doenc¸a rara poder´ıamos expressar isto como uma proporc¸a˜o observada (0,0014) ou percentual (0,14%), mas melhor seria 1,4 casos por mil. Frequentemente o primeiro passo da descric¸a˜o de dados e´ criar uma tabela de frequeˆncias. Por exemplo, na Tabela 1.1 abaixo temos as frequeˆncias observadas 1.3. VARIA´VEIS QUALITATIVAS 3 Tabela 1.1: Frequeˆncias observadas para os dados de itens defeituosos. Estado ni ni/n pi Porcentagem Defeituoso 6 6/25 0,24 24,0% Perfeito 12 12/25 0,48 48,0% Recupera´vel 5 5/25 0,20 20,0% Outros 2 2/25 0,08 8,0% Totais n = 25 Σpi = 1 de itens produzidos e classificados segundo seu estado (defeituoso, perfeito, recu- pera´vel, outros). Note que foi definida tambe´m a categoria “outros”. Em geral, se muitos dados forem classificados em poucas categorias, enta˜o e´ conveniente unir as categorias com somente uma ou duas observac¸o˜es em outra categoria chamada “outros”. Tabelas simples como esta sa˜o na maioria das vezes suficientes para descrever dados qualitativos especialmente quando existem apenas duas ou treˆs categorias. Dados qualitativos sa˜o usualmente bem ilustrados num simples gra´fico de bar- ras onde a altura da barra e´ igual a` frequeˆncia. O gra´fico na Figura 1.1 apresenta as frequeˆncias observadas na Tabela 1.1. Note que a ordem das categorias poderia Figura 1.1: Gra´fico de barras das frequeˆncias observadas na Tabela 1.1 defeituoso perfeito recuperavel outros f r e q u e n c i a s 0 2 4 6 8 1 0 1 2 ser alterada no eixo horizontal ja´ que na˜o existe ordenac¸a˜o natural. Ale´m disso a distaˆncia horizontal entre as barras na˜o tem nenhuma interpretac¸a˜o. 4 CAPI´TULO 1. ESTATI´STICA DESCRITIVA Gra´ficos de setores tambe´m costumam ser utilizados para apresentac¸a˜o de dados catego´ricos. Os setores do gra´fico sa˜o desenhados de tal forma que eles tenham a´rea proporcional a` frequeˆncia. A Figura 1.2 abaixo ilustra as frequeˆncias observadas na Tabela 1.1. Figura 1.2: Gra´fico de setores com as frequeˆncias observadas na Tabela 1.1 defeituoso perfeito recuperavel outros No entanto, gra´ficos de setores constituem uma forma muito ruim de apre- sentar informac¸a˜o ja´ que em geral temos dificuldade em comparar a´reas. Um gra´fico de barras ou de pontos e´ prefer´ıvel para representar este tipo de dados. Duas o´timas refereˆncias para este assunto sa˜o Cleveland (1993, 1994) e Good and Hardin (2003). 1.4 Varia´veis quantitativas Analogamente, para resumir dados quantitativos discretos, podemos utilizar uma tabela de frequeˆncias como no exemplo a seguir. Exemplo 1.1 : Foram inspecionados 35 lotes de componentes eletroˆnicos e ob- tidos os nu´meros de itens defeituosos em cada lote. Os dados esta˜o resumidos na 1.4. VARIA´VEIS QUANTITATIVAS 5 Tabela 1.2. Note que foram incluidas as frequeˆncias acumuladas Ni e Fi, assim Tabela 1.2: Frequeˆncias observadas do nu´mero de itens defeituosos em 35 lotes. defeituosos 0 1 2 3 4 5 6 8 ni 1 3 5 4 9 5 6 2 pi 0,03 0,09 0,14 0,11 0,26 0,14 0,17 0,06 Ni 1 4 9 13 22 27 33 35 Fi 0,03 0,11 0,26 0,37 0,63 0,77 0,94 1,00 por exemplo podemos dizer que aproximadamente 77% dos lotes inspecionados tem 5 itens defeituosos ou menos. Neste caso, frequeˆncias absolutas e frequeˆncias acumuladas podem ser representadas graficamente como na Figura 1.3 abaixo. 0 2 4 6 8 0 . 0 0 . 2 0 . 4 0 . 6 0 . 8 1 . 0 defeituosos F r e q . a c u m u l a d a s (a) 0 2 4 6 8 defeituosos f r e q u ê n c i a s 0 1 2 3 4 5 6 8 (b) Figura 1.3: Gra´fico de frequeˆncias do nu´mero de itens defeituosos em 35 lotes. (a) Frequeˆncias acumuladas. (b) Frequeˆncias absolutas. A construc¸a˜o de tabelas de frequeˆncias para varia´veis quantitativas cont´ınuas requer certo cuidado uma vez que na˜o existira˜o observac¸o˜es repetidas. A soluc¸a˜o enta˜o e´ agrupar os dados em classes e obter as frequeˆncias observadas em cada classe. E´ importante notar que ao resumir dados referentes a uma varia´vel cont´ınua sempre se perde alguma informac¸a˜o ja´ que na˜o temos ide´ia de como se distribuem as observac¸o˜es dentro de cada classe. O me´todo mais comum de representac¸a˜o gra´fica de dados cont´ınuos e´ atrave´s de um histograma. Neste caso, a frequeˆncia de cada classe e´ representada por 6 CAPI´TULO 1. ESTATI´STICA DESCRITIVA um retaˆngulo cuja base e´ igual a amplitude da classe e a altura e´ proporcional a` frequeˆncia. Exemplo 1.2 : Em um rio foram encontrados mortos 150 peixes v´ıtimas de contaminac¸a˜o e seus comprimentos foram medidos em mil´ımetros. As medidas observadas foram agrupadas em classes e as frequeˆnciasde cada classe aparecem na Tabela 1.3. O histograma constru´ıdo com base nestes dados e´ apresentado na Figura 1.4. Tabela 1.3: Frequeˆncias dos comprimentos de peixes encontrados mortos em um rio. Comprimento (mm) ni pi Ni Fi 100 ⊢ 110 7 0,05 7 0,05 110 ⊢ 120 16 0,11 23 0,15 120 ⊢ 130 19 0,13 42 0,28 130 ⊢ 140 31 0,21 73 0,49 140 ⊢ 150 41 0,27 114 0,76 150 ⊢ 160 23 0,15 137 0,91 160 ⊢ 170 10 0,07 147 0,98 170 ⊢ 180 3 0,02 150 1,00 Figura 1.4: Histograma das frequeˆncias de comprimentos de peixes mortos dadas na Tabela 1.3 comprimentos f r e q u e n c i a s 100 120 140 160 180 0 1 0 2 0 3 0 4 0 1.4. VARIA´VEIS QUANTITATIVAS 7 Algumas vezes e´ conveniente agregar classes de frequeˆncia nos extremos da distribuic¸a˜o de forma que os intervalos passam a ter larguras diferentes. Neste caso deve-se ter certo cuidado ao interpretar o histograma. A ide´ia e´ que a a´rea de cada retaˆngulo deve ser preservada, assim por exemplo se a amplitude de um intervalo for duplicada ele deve ter altura igual a` metada de sua frequeˆncia. Neste texto na˜o discutiremos em detalhes a especificac¸a˜o do nu´mero e da am- plitude das classes ja´ que os pacotes estat´ısticos utilizam algoritmos para escolha o´tima destes valores. A ide´ia e´ que um nu´mero muito grande de classes na˜o re- sume satisfatoriamente os dados e com um nu´mero muito pequeno perde-se muita informac¸a˜o. Outro me´todo gra´fico que vale a` pena ser utilizado quando o nu´mero de ob- servac¸o˜es na˜o for muito grande e´ o gra´fico de ramo-e-folhas que sera´ ilustrado nos exemplos a seguir. Cada observac¸a˜o e´ separada em um ramo (geralmente a parte inteira) e uma folha (geralmente a parte decimal). O gra´fico tera´ a forma de um histograma pore´m retendo a informac¸a˜o dos valores observados. A te´cnica e´ ilustrada nos exemplo 1.3 abaixo. Exemplo 1.3 : Um estudo geoqu´ımico foi realizado utilizando-se amostras de sedimentos provenientes de riachos e obteve-se as concentrac¸o˜es de Cromo (em ppm) abaixo. Podemos facilmente escrever os dados no gra´fico de ramo-e-folhas como na Figura 1.5. 10,6 14,1 13,7 15,2 15,4 12,5 12,9 14,3 13,0 12,6 12,0 14,0 10,0 18,2 11,5 9,4 16,5 13,7 14,7 16,6 11,4 18,4 17,4 11,1 15,8 17,0 13,6 16,6 11,8 15,8 13,5 Note que os ramos sa˜o nu´meros inteiros e as folhas sa˜o os valores depois da v´ırgula decimal. E´ importante escrever as folhas em colunas igualmente espac¸adas, caso contra´rio a figura ficara´ distorcida. Ale´m de ser um resumo visual dos dados o gra´fico de ramo-e-folhas fornece mais informac¸a˜o do que o histograma ja´ que os dados podem ser lidos no gra´fico. Exemplo 1.4 : Os valores abaixo correspondem ao tempo (em minutos) que os alunos matriculados em uma disciplina do curso de Estat´ıstica utilizaram para resoluc¸a˜o da prova no segundo semestre de 2002. 23 31 42 45 51 52 57 61 61 64 68 69 73 75 75 82 89 94 118 120 8 CAPI´TULO 1. ESTATI´STICA DESCRITIVA Figura 1.5: Gra´fico de ramo-e-folhas dos dados geoqu´ımicos do Exemplo 1.3. 9|4 10|0 6 11|1 4 5 8 12|0 5 6 9 13|0 5 6 7 7 14|0 1 3 7 15|2 4 8 8 16|5 6 6 17|0 4 18|2 4 A representac¸a˜o no gra´fico de ramo-e-folhas e´ feita de forma que os ramos contenham dezenas de minutos e as folhas contenham unidades de minutos. 2|3 2|F 3|1 3|F 4|2 5 4|M F 5|1 2 7 5|F F M 6|1 1 4 8 9 6|F F F F M 7|3 5 5 7|M M M 8|2 9 8|M F 9|4 9|F 10| 10| 11|8 11|M 12|0 12|M Pode-se notar que os valores esta˜o simetricamente dispersos em torno de um valor central e na˜o ha´ a indicac¸a˜o de valores at´ıpicos ou discrepantes (outliers). No diagrama da direita a informac¸a˜o sobre o sexo dos alunos foi adicionada e ha´ indicac¸a˜o de que os homens (M) gastaram um tempo maior do que as mulheres (F). 1.5 Resumos nume´ricos Para resumir numericamente dados de uma varia´vel quantitativa o objetivo e´ escolher medidas apropriadas de locac¸a˜o e de dispersa˜o. Existem treˆs escolhas mais frequentemente utilizadas para medidas de locac¸a˜o que esta˜o ligadas a certas medidas de dispersa˜o como sera´ visto adiante. 1.5. RESUMOS NUME´RICOS 9 1.5.1 Me´dia, variaˆncia e desvio padra˜o Para resumir dados quantitativos aproximadamente sime´tricos, e´ usual calcular a me´dia aritme´tica como uma medida de locac¸a˜o. Se x1, x2, . . . , xn sa˜o os valores dos dados, enta˜o podemos escrever a me´dia como x = x1 + x2 + · · ·+ xn n = ∑n i=1 xi n . A variaˆncia e´ definida como o desvio quadra´tico me´dio em torno da me´dia e e´ calculada a partir de uma amostra de dados como s2 = ∑n i=1(xi − x)2 n− 1 . Note que, sendo definida a partir de uma soma de quadrados a variaˆncia sempre assume valores positivos. Ale´m disso, a divisa˜o por n−1 retira o efeito do tamanho do conjunto de dados, assim as disperso˜es de dois conjuntos ficam compara´veis mesmo que um deles tenha muito mais observac¸o˜es do que o outro. Na˜o e´ dif´ıcil mostrar que a expressa˜o da variaˆncia pode ser reescrita como s2 = ∑n i=1 x 2 i − nx2 n− 1 que e´ uma versa˜o mais fa´cil de ser calculada quando na˜o se dispo˜e de recursos computacionais. Mas cuidado porque os erros de arrendondamento podem gerar um valor negativo se a variaˆncia for muito pequena. A raiz quadrada positiva da variaˆncia, chamada de desvio padra˜o, e´ uma medida de dispersa˜o que esta´ na mesma escala dos dados. A notac¸a˜o usual e´ s = √ s2. Algumas propriedades destas mediadas sa˜o, 1. a soma de desvios em torno da me´dia e´ sempre igual a zero, ∑n i=1(xi−x) = 0. 2. a soma de desvios quadra´ticos em torno de um valor a, ∑n i=1(xi − a)2, e´ mı´nima se somente se a = x. 3. somando-se uma constante k aos dados a me´dia sera´ somada da mesma constante enquanto a variaˆncia fica inalterada. 4. multiplicando-se os dados por uma constante k a me´dia sera´ multiplicada pela mesma constante enquanto a variaˆncia sera´ multiplicada pelo quadrado da constante. 10 CAPI´TULO 1. ESTATI´STICA DESCRITIVA 5. a me´dia aritme´tica sempre pertence ao intervalo de variac¸a˜o dos dados, i.e. min(xi) ≤ x¯ ≤ max(xi) Das propriedades 3 e 4 e´ fa´cil verificar que se yi = a+ bxi, i = 1, . . . , n enta˜o a me´dia aritme´tica e a variaˆncia de y sa˜o y = a+ bx e s2y = b 2s2. Exemplo 1.5 : Sete homens foram pesados, e os resultados em Kg foram: 57,0; 62,9; 63,5; 64,1; 66,1; 67,1; 73,6. Utilizando uma calculadora na˜o e´ dif´ıcil verificar que a me´dia e´ 64,9 kg, a variaˆncia e´ 25,16 kg2 e o desvio padra˜o e´ 5,02 kg. Exemplo 1.6 : Foram inspecionados 30 aparelhos fabricados por uma indu´stria e obteve-se a distribuic¸a˜o de frequeˆncias do nu´mero de defeitos por aparelho dada na Tabela 1.4. Tabela 1.4: Frequeˆncias dos nu´meros de defeitos por aparelho inspecionado. Nu´mero de defeitos 0 1 2 3 4 ni 12 8 7 1 2 Neste caso o nu´mero me´dio de defeitos por aparelho sera´ x = 12× 0 + 8× 1 + 7× 2 + 1× 3 + 2× 4 30 = 33 30 = 1, 1 e sua variaˆncia sera´ s2 = 12× 02 + 8× 12 + 7× 22 + 1× 32 + 2× 42 − 30× 1, 12 29 = 40, 7 29 ≈ 1, 4. Vale notar que estas medidas sa˜o extremamente sens´ıveis a observac¸o˜es dis- crepantes. No Exemplo 1.6, se um u´nico aparelho apresentasse 15 defeitos ao inve´s de 4 a me´dia passaria a ser aproximadamente 1,5 e a variaˆncia passaria a ser aproximadamente 7,6. Uma medida de dispersa˜o relativa particularmente u´til quando se deseja com- parar disperso˜es em dois conjuntos de dados com me´dias bem diferentes e´ o 1.5. RESUMOS NUME´RICOS 11 coeficiente de variac¸a˜o definido como s/|x|. Assim a escala das observac¸o˜es esta´ sendo levada em conta. Exemplo 1.7 : Suponha por exemplo que 2 conjuntos de dados apresentam desvios-padro˜ess1 = 3 e s2 = 4 com me´dias x1 = 30 e x2 = 80. Embora em termos absolutos a dispersa˜o seja maior no segundo conjunto as disperso˜es relativas sa˜o 10% e 5% respectivamente. Exemplo 1.8 : Sejam agora as varia´veis X e Y cujos valores observados sa˜o 0,0, 0,05 e 0,10 e 1000, 110 e 1200 respectivamente. E´ fa´cil verificar que x = 0, 05 s2x = 0, 05 2 sx = 0, 05 y = 1100 s2y = 100 2 sx = 100 e a variabilidade de X e´ bem menor em termos absolutos. Pore´m, em termos relativos, CV (X) = 100% e CV (Y ) = 100 1100 ≈ 6%. 1.5.2 A mediana e a amplitude inter-quartis Aqui vamos apresentar medidas de locac¸a˜o e dispersa˜o baseadas em dados orde- nados (ou estat´ısticas de ordem) que sa˜o particularmente u´teis para distribuic¸o˜es assime´tricas e sa˜o pouco sens´ıveis a observac¸o˜es muito discrepantes. A mediana e´ definida como o valor que divide os dados ordenados em duas partes de mesmo tamanho. Quando ha´ um nu´mero ı´mpar de observac¸o˜es a me- diana e´ o valor central (de ordem (n+ 1)/2) enquanto que para um nu´mero par de observac¸o˜es a mediada e´ calculada como a me´dia dos dois valores centrais (de ordem n/2 e n/2 + 1). Por exemplo, as medianas dos conjuntos ordenados 5, 7, 9, 13, 17, 19, 20 e 3, 7, 8, 10, 12, 15 sa˜o 13 e (8+10)/2=9 respectivamente. A definic¸a˜o pode ser estendida para valores que dividem a distribuic¸a˜o em 4 partes de mesmo tamanho (quartis) ou 100 partes de mesmo tamanho (percentis). Os quartis inferior e superior, usualmente denotados por Q1 e Q3, sa˜o definidos como os valores abaixo dos quais esta˜o 1/4 e 3/4, respectivamente, dos dados. Estes valores sa˜o frequentemente usados para resumir os dados juntamente com o mı´nimo, o ma´ximo e a mediana. Para um nu´mero par de observac¸o˜es, os quartis tambe´m sera˜o uma me´dia de valores. 12 CAPI´TULO 1. ESTATI´STICA DESCRITIVA Podemos agora definir uma medida de dispersa˜o aproprida, a amplitude inter- quartis, que e´ a diferenc¸a entre o quartil superior e o inferior, Q3 − Q1. Note tambe´m que 50% dos dados estara˜o entre os quartis inferior e superior. Exemplo 1.9 : O nu´mero de crianc¸as em 19 famı´lias foi contado e obteve-se os seguintes valores (ja´ ordenados), 0, 1, 1, 2, 2, 2, 2, 2, 3, 3, 3, 4, 4, 5, 6, 6, 7, 8, 10. Assim, o nu´mero mediano de crianc¸as e´ o valor de ordem (19+1)/2=10, i.e. 3 crianc¸as. Analogamente, os quartis inferior e superior sa˜o os valores de ordem 5 e 15 respectivamente, i.e. 2 e 6 crianc¸as. Portanto a amplitude inter-quartis e´ de 4 crianc¸as. Vale notar tambe´m que no Exemplo 1.6 se um u´nico aparelho apresentasse 15 defeitos ao inve´s de 4 a mediana e os quartis ficariam inalterados. Um importante me´todo gra´fico para apresentar caracter´ısticas de um con- junto de dados chama-se “Box-and-Whisker plot” ou simplesmente “Box-plot” e e´ baseado nas medidas vistas acima, i.e. o mı´nimo, o ma´ximo, os quartis e a mediana. Um box-plot para os dados do Exemplo 1.3 e´ mostrado na Figura 1.6. A altura do retaˆngulo representa a distaˆncia inter-quartis e as linhas se estendem Figura 1.6: Box-plot dos dados geoqu´ımicos do Exemplo 1.3. 1 0 1 2 1 4 1 6 1 8 c o n c e n t r a ç õ e s d e C r ate´ as observac¸o˜es extremas, exceto aquelas consideradas discrepantes (outliers). 1.5. RESUMOS NUME´RICOS 13 Para efeito de construc¸a˜o do Box-plot, uma observac¸a˜o x sera´ considerada um outlier se, x < Q1 − 1, 5(Q3 −Q1) ou x > Q3 + 1, 5(Q3 −Q1). Exemplo 1.10 : Um box-plot para os dados do Exemplo 1.4 e´ mostrado na Figura 1.7. Os dados originais foram adicionados ao eixo vertical e pode-se notar que o valor 120 minutos foi considerado um outlier segundo o crite´rio acima. Figura 1.7: Box-plot dos dados do Exemplo 1.4. 2 0 4 0 6 0 8 0 1 0 0 1 2 0 t e m p o s e m m i n u t o s A presenc¸a de outliers em um conjunto de dados pode ser perfeitamente nor- mal, embora eles possam viesar ca´lculos baseados em somas. Eles tambe´m podem ser devido a erros (que podem ser corrigidos), ou ainda revelar que a distribuic¸a˜o dos dados tem “caudas pesadas” (e.g. dados intra-dia´rios do mercado financeiro). Vale notar que este tipo de gra´fico e´ particularmente u´til para comparar ca- racter´ısticas de diferentes conjuntos de dados (como sera´ visto na Sec¸a˜o 1.6.5). 1.5.3 A moda Algumas vezes, especialmente para dados de contagem, um u´nico valor domina a amostra. Neste caso, a medida de locac¸a˜o apropriada e´ a moda, definida como o valor que ocorre com maior frequeˆncia. A proporc¸a˜o da amostra que assume este valor modal pode ser utilizada no lugar de uma medida formal de dispersa˜o. 14 CAPI´TULO 1. ESTATI´STICA DESCRITIVA Na pra´tica pode haver situac¸o˜es aonde se pode distinguir claramente dois ou mais ‘picos’ na frequeˆncia dos valores observados. Neste caso dizemos que os dados apresentam multimodalidade e devemos reportar todas os valores modais. Dados deste tipo sa˜o particularmente dif´ıceis de resumir e analisar. Exemplo 1.11 : O conjunto de dados discretos 3, 5, 7, 7, 7, 8, 10, 10, 10, 15, 20 apresenta duas modas 7 e 10 sendo assim chamado de bimodal. 1.6 Dados mu´ltiplos Os resultados de um estudo tipicamente envolvera˜o mais do que um u´nico con- junto de dados. Neste caso, representac¸o˜es gra´ficas sa˜o u´teis para comparar grupos de dados ou para verificar se exitem relac¸o˜es entre eles. Existem mui- tas possibilidades, mas a mais adequada dependera´ das peculiaridades de cada conjunto de dados. Podemos criar combinac¸o˜es dos me´todos ja´ discutidos. Por exemplo, se me- dirmos as alturas e pesos de um conjunto de pessoas, podemos produzir box-plots de alturas lado a lado para homens e mulheres, ou gra´ficos ramo-e-folhas lado a lado (com as alturas dos homens a` esquerda do ramo, e as alturas das mulheres a` direita), ou um histograma acima do outro com a mesma escala no eixo horizontal de forma que eles possam ser facilmente comparados. Para um nu´mero diferente de grupos, uma se´rie de box-plots verticais funciona bem como um simples resumo dos dados. Exemplo 1.12 : Na Figura 1.8 sa˜o apresentados os box-plots da renda familiar mediana (em sala´rios mı´nimos) nos 75 bairros de Curitiba no ano de 2000, agru- pados por nu´mero de homic´ıdios (menor ou igual a 4 ou maior do que 41). Os valores originais dos dados aparecem nos eixos verticais. Que informac¸o˜es podem ser tiradas deste gra´fico? Para combinac¸o˜es de dados catego´ricos, uma se´rie de gra´ficos de setores ou de barras podem ser produzidos. No caso de dois ou treˆs grupos de uma mesma varia´vel catego´rica pode ser mais interessante colocar toda a informac¸a˜o em um mesmo gra´fico de barras. Exemplo 1.13 : Em um estudo foram medidos os comprimentos de um dos dentes em cada um de 10 porquinhos da India submetidos a 3 doses de Vitamina 1O valor 4 foi fixado somente para fins de ilustrac¸a˜o 1.6. DADOS MU´LTIPLOS 15 Figura 1.8: Box-plots dos dados de renda mediana em Curitiba no ano de 2000 agru- pados de acordo com o nu´mero de homicidios. Num. homic. > 4 Num. homic. <= 4 5 1 0 1 5 2 0 C (0,5, 1 e 2 mg) em 2 formas de ingesta˜o (A´cido asco´rbico e suco de laranja). Na Figura 1.9 sa˜o apresentados os box-plots das medidas separados por dosagem e forma de ingesta˜o. 1.6.1 Diagramas de dispersa˜o Para avaliar se existe uma relac¸a˜o entre duas varia´veis cont´ınuas podemos pro- duzir um gra´fico de pontos, em geral chamado de diagrama de dispersa˜o. Neste caso faz pouco sentido unir os pontos, exceto quando o eixo horizontal representa per´ıodos de tempo. S´ımbolos diferentes podem ser usados paradiferentes grupos adicionando assim uma nova dimensa˜o ao gra´fico. Exemplo 1.14 : O gra´fico na Figura 1.10 mostra as taxas de mortalidade por homicidio (por 100 mil habitantes) em Sa˜o Paulo (capital mais regia˜o metropoli- tana e interior do estado) entre janeiro de 1979 e agosto de 1995. Os histogramas das duas varia´veis aparecem nas margens e uma reta de regressa˜o foi estimada. Que informac¸o˜es podem ser tiradas deste gra´fico? Para mais do que duas varia´veis, deve-se produzir diagramas de dispersa˜o 16 CAPI´TULO 1. ESTATI´STICA DESCRITIVA Figura 1.9: Box-plots dos dados de comprimento de dente separados por dosagem e forma de ingesta˜o. 0.5 1 2 0 5 1 0 1 5 2 0 2 5 3 0 3 5 Dose de Vitamina C em mg C o m p r i m e n t o d o d e n t e 0.5 1 2 0 5 1 0 1 5 2 0 2 5 3 0 3 5 Acido Ascorbico suco de laranja para todos os pares poss´ıveis produzindo assim uma matriz de gra´ficos de pontos (Ver Cap´ıtulo 6). Gra´fico temporal Um caso especial de um gra´fico de pontos e´ um gra´fico temporal onde a varia´vel “tempo” esta´ no eixo horizontal. Ou seja, as medidas dos dados sa˜o feitas ao longo do tempo. Nestes casos e´ usual unir pontos sucessivos por segmentos de reta, e e´ em geral uma boa pra´tica deixar o eixo horizontal mais longo do que o vertical. Como exemplo deste tipo de dados, na Figura 1.11 sa˜o apresentados os gra´ficos temporais com medidas dia´rias de quatro indicadores de qualidade do ar em Nova Iorque entre maio e setembro de 1973. Uma refereˆncia para ana´lise deste tipo de dados e´ Morettin e Toloi (2004). 1.6. DADOS MU´LTIPLOS 17 Figura 1.10: Diagrama de dispersa˜o das taxas de mortalidade por homicidio em Sa˜o Paulo. 1 23 2 4 6 8 10 12 14 16 1 . 0 1 . 5 2 . 0 2 . 5 3 . 0 Metropolitana I n t e r i o r 1.6.2 Dados Pareados O exemplo abaixo ilustra um tipo de representac¸a˜o gra´fica que pode ser u´til para visualizar dados pareados. Exemplo 1.15 : Uma alterac¸a˜o foi introduzida na linha de montagem de um aparelho com o objetivo de reduzir o tempo gasto pelos opera´rios para execuc¸a˜o de certas tarefas. Uma amostra de 10 opera´rios foi observada antes e depois da alterac¸a˜o e a Tabela 1.5 abaixo mostra os tempos de execuc¸a˜o medidos. Uma representac¸a˜o gra´fica destes dados e´ dada na Figura 1.12. E´ muito mais fa´cil ver do gra´fico do que da tabela que os opera´rios tenderam a reduzir seus tempos de execuc¸a˜o, e que aqueles que na˜o reduziram ja´ tendiam a ter os menores tempos e provavelmente na˜o necessitavam da alterac¸a˜o. 18 CAPI´TULO 1. ESTATI´STICA DESCRITIVA dias O z o n i o 0 50 100 150 0 5 0 1 0 0 1 5 0 (a) dias R a d i a ç ã o s o l a r 0 50 100 150 0 5 0 1 0 0 1 5 0 2 0 0 2 5 0 3 0 0 (b) dias V e n t o 0 50 100 150 5 1 0 1 5 2 0 (c) dias T e m p e r a t u r a 0 50 100 150 6 0 7 0 8 0 9 0 (d) Figura 1.11: Gra´ficos com as se´ries temporais de quatro indicadores de qualidade do ar em Nova Iorque, EUA. 1.6. DADOS MU´LTIPLOS 19 Tabela 1.5: Tempos de execuc¸a˜o de tarefas por opera´rio. Opera´rio Tempo antes Tempo depois 1 10,3 12,2 2 11,4 12,1 3 10,9 13,1 4 12,0 11,9 5 10,0 12,0 6 11,9 12,9 7 12,2 11,4 8 12,3 12,1 9 11,7 13,5 10 12,0 12,3 Figura 1.12: Gra´fico dos tempos de execuc¸a˜o de tarefas por opera´rios observados antes e depois de uma alterac¸a˜o. 1 0 1 1 1 2 1 3 1 4 t e m p o d e e x e c u ç ã o 20 CAPI´TULO 1. ESTATI´STICA DESCRITIVA 1.7 Problemas 1. Para um conjunto de n valores observados x1, . . . , xn mostre que: (a) a variaˆncia tambe´m pode ser escrita como ( ∑n i=1 x 2 i − nx2)/(n− 1); (b) somando-se uma constante k aos dados a variaˆncia na˜o se altera e a me´dia fica somada de k; (c) multiplicando-se os dados por uma constante k a me´dia fica multipli- cada por k e a variaˆncia fica multiplicada por k2. (d) Calcule a me´dia e a variaˆncia da transformac¸a˜o yi = axi+ b para duas constantes a e b quaisquer. 2. No Exemplo 1.6 verifique que se um u´nico aparelho apresentasse 15 defeitos ao inve´s de 4 a mediana e os quartis ficariam inalterados. 3. O sala´rio me´dio dos funciona´rios de uma empresa era de R$500,00 com variaˆncia 100 reais2 e o sala´rio mediano era de R$450,00. Se todos os sala´rios forem duplicados o que ocorre com a me´dia, variaˆncia, mediana e coeficiente de variac¸a˜o? 4. Descreva em palavras quais informac¸o˜es podem ser tiradas das Figuras 1.8, 1.9 e 1.10. 5. Fornec¸a dois exemplos de varia´veis qualitativas e dois de varia´veis quanti- tativas (diferentes da apostila). 6. Descreva de forma concisa os seguintes dados usando suas palavras e algu- mas estat´ısticas descritivas, apontando caracter´ısticas principais observa- das. (a) As notas (de um total de 100 e ordenadas por tamanho) de 20 estu- dantes de estat´ıstica no primeiro exame do semestre: 30 35 37 40 40 49 51 54 54 55 57 58 60 60 62 62 65 67 74 89 (b) O nu´mero de faltas de 20 trabalhadores num ano (ordenados por ta- manho): 0 0 0 0 0 0 0 1 1 1 2 2 3 3 4 5 5 5 8 45 (c) O nu´mero de exemplares de um jornal mensal em particular lidos por 20 pessoas num ano: 1.7. PROBLEMAS 21 0 1 11 0 0 0 2 12 0 0 12 1 0 0 0 0 12 0 11 0 7. Fac¸a um gra´fico ramo-e-folhas para apresentac¸a˜o dos dados de altura (em metros) de 20 mulheres sendo estudadas para uma certa condic¸a˜o me´dica. 1,52 1,60 1,57 1,52 1,60 1,75 1,73 1,63 1,55 1,63 1,65 1,55 1,65 1,60 1,68 2.50 1,52 1,65 1,60 1,65 8. Os dados a seguir fornecem a concentrac¸a˜o de um determinado poluente (em ppm) em 8 pontos de um afluente medidos antes e uma hora depois de um acidente ambiental: Antes Depois 4,67 5,44 4,97 6,11 5,11 6,49 5,17 6,61 5,33 6,67 6,22 6,67 6,50 6,78 7,00 7,89 Fac¸a um gra´fico destes dados, e use o gra´fico para ajudar a avaliar se o acidente provocou um aumento significativo nos n´ıveis do poluente no aflu- ente. 9. A tabela abaixo fornece o nu´mero de graˆnulos de arenito por cm3 em 20 amostras tomadas de uma certa localidade (A) e 20 amostras tomadas de uma outra localidade (B). 22 CAPI´TULO 1. ESTATI´STICA DESCRITIVA A B 171 397 116 375 431 795 375 440 288 257 151 192 1283 902 752 503 554 1621 979 1252 295 1004 208 688 568 1378 426 771 958 435 675 377 2415 1104 410 700 1212 396 736 315 (a) Calcule as me´dias e desvios-padra˜o nas duas localidades. (b) Fac¸a histogramas dos dois conjuntos de dados, e compare-os. (c) Obtenha o mı´nimo, ma´ximo, mediana, e os quartis de cada grupo? (d) Usando sua resposta ao item (c), construa boxplots para os dois con- juntos de dados e compare-os. (e) Voceˆ acha que existe uma diferenc¸a real entre os nu´meros de graˆnulos de arenito nas duas localidades, ou as diferenc¸as observadas poderiam ter simplesmente ocorrido como uma consequeˆncia dos grupos consis- tirem de somente 20 observac¸o˜es cada? (f) Descreva as principais caracter´ısticas dos dados em uma ou duas sen- tenc¸as. 10. O percentual de ac¸u´car e sal em 9 cereais matinais mais populares foram medidos, com os seguintes resultados: Cereal ac¸u´car sal 1 19 8 2 36 5 3 3 10 4 8 4 5 26 6 6 16 6 7 8 9 8 10 3 9 54 3 1.7. PROBLEMAS 23 (a) Fac¸a um gra´fico desses dados para investigar a relac¸a˜oentre o conteu´do de ac¸u´car e sal nos cereais matinais. (b) Comente brevemente qualquer padra˜o observado nos dados. Cap´ıtulo 2 Probabilidades Um conceito fundamental Os me´todos estat´ısticos para ana´lise de dados esta˜o associados ao conceito de incerteza. Uma forma de quantificar o grau de incerteza (ou aleatoriedade) e´ atrave´s do conceito de probabilidade. Neste cap´ıtulo sera˜o apresentadas definic¸o˜es e propriedades em termos de teoria dos conjuntos. 2.1 Experimento aleato´rio Qualquer experimento cujo resultado na˜o pode ser previsto com certeza absoluta e´ chamado de experimento aleato´rio. O espac¸o amostral e´ conjunto de todos os poss´ıveis resultados de um experimento aleato´rio, que aqui sera´ denotado por S. Qualquer subconjunto A de S (i.e. A ⊂ S) e´ chamado de evento. Alguns exemplos de experimentos aleato´rios com os respectivos espac¸os amos- trais e um evento associado sa˜o os seguintes, 1. Lanc¸amento de uma moeda e observac¸a˜o da face superior. S = {cara, coroa}, A = {cara}. 2. Lanc¸amento de um dado e observac¸a˜o da face superior. S = {1, 2, 3, 4, 5, 6}, A = {2, 4, 6} 3. Contagem do nu´mero de pec¸as defeituosas em um lote com 100 pec¸as. S = {0, 1, 2, . . . , 100}, A = {0, 1, . . . , 10} 4. Medic¸a˜o do tempo de vida de um equipamento eletroˆnico em horas. S = (0,∞), A = (0, 100]. Note que o u´ltimo espac¸o amostral e´ uma construc¸a˜o teo´rica ja´ que na pra´tica havera´ sempre um limite superior para o intervalo. 24 2.2. DEFINIC¸A˜O DE PROBABILIDADE 25 Algumas operac¸o˜es com eventos sera˜o muito u´teis e sa˜o definidas a seguir. Para dois eventos A e B quaisquer: 1. A unia˜o entre eles (A∪B) ocorre se somente se pelo menos um deles ocorre. Em outras palavras, se ocorre apenas o evento A, ou ocorre apenas o evento B, ou ambos ocorrem simultaneamente. Podemos dizer ainda que A ou B ocorrem. 2. A intersec¸a˜o entre eles (A∩B) ocorre se somente se ambos ocorrem simul- taneamente, isto e´, A e B ocorrem. Em particular, se A ∩ B = ∅ dizemos que A e B sa˜o mutuamente exclusivos. 3. Se A na˜o ocorre dizemos que ocorre o seu complementar, A. Vale notar que as operac¸o˜es de intersec¸a˜o e unia˜o sa˜o comutativas, i.e. A ∩ B = B ∩A e A ∪B = B ∪ A. Algumas propriedades das operac¸o˜es de unia˜o, intersec¸a˜o e complementac¸a˜o tambe´m sera˜o bastante u´teis na resoluc¸a˜o de problemas. A seguir listamos aquelas mais importantes, 1. A ∩ S = A, A ∪ S = S, A ∩ ∅ = ∅ e A ∪ ∅ = A. 2. A ∩ A = ∅, A ∪ A = S, A ∩A = A e A ∪ A = A. 3. A ∪ B = A ∩ B e A ∩ B = A ∪ B. 4. A = (A ∩ B) ∪ (A ∩ B). 2.2 Definic¸a˜o de probabilidade Seja um espac¸o amostral S associado a um dado experimento aleato´rio. A cada poss´ıvel evento A de S podemos associar um nu´mero real, representado por P (A) e denominado probabilidade do evento A, satisfazendo as seguintes propriedades, 1. 0 ≤ P (A) ≤ 1, 2. P (S) = 1, 3. P (A1 ∪A2) = P (A1) + P (A2) se A1 e A2 sa˜o mutuamente exclusivos. 26 CAPI´TULO 2. PROBABILIDADES Esta u´ltima propriedade pode ser generalizada para um nu´mero finito ou infinito de eventos mutuamente exclusivos, A1, A2, . . . , An, ou seja P (A1 ∪A2 ∪ · · · ∪An) = P (A1) + P (A2) + · · ·+ P (An), se Ai ∩Aj = ∅, para todo i 6= j. A partir destes axiomas outras propriedades bastante u´teis podem ser obtidas, por exemplo 1. P (A) = 1− P (A) onde A e´ o evento complementar de A. 2. P (A ∪ A) = 1 e P (∅) = 0. 3. Se A ⊂ B enta˜o P (A) ≤ P (B). 4. P (A ∪ B) = P (A) + P (B)− P (A ∩B). Uma definic¸a˜o mais simples de probabilidade e´ a chamada definic¸a˜o cla´ssica. Neste caso a regra pra´tica para obter P (A) consiste em simplesmente contar o nu´mero de resultados favora´veis ao evento A e dividir pelo nu´mero de resultados poss´ıveis do experimento. Assim, P (A) = nu´mero de resultados favora´veis a A nu´mero de resultados poss´ıveis . No entanto esta definic¸a˜o so´ faz sentido quando o espac¸o amostral e´ finito, de modo que possamos fazer as contagens requeridas, e tambe´m se todos os poss´ıveis resultados teˆm a mesma chance de ocorrer. 2.3 Probabilidade Condicional e Independeˆncia Para dois eventos A e B, sendo que P (B) > 0, definimos a probabilidade condi- cional de A dado que B ocorreu como P (A|B) = P (A ∩ B) P (B) . Vale notar que todas as propriedades vistas anteriormente continuam va´lidas para probabilidades condicionais. Por exemplo, P (A | B) = 1− P (A | B). 2.3. PROBABILIDADE CONDICIONAL E INDEPENDEˆNCIA 27 A partir desta definic¸a˜o obtemos a chamada regra do produto de probabilida- des, P (A ∩ B) = P (A|B)P (B). Esta e´ chamada probabilidade conjunta dos eventos A e B e tambe´m pode ser escrita como P (A,B). P (A) e P (B) sa˜o chamadas probabilidades marginais dos eventos A e B. Exemplo 2.1 : Duas bolas sa˜o retiradas ao acaso de uma urna contendo 2 bolas brancas (B) e 3 vermelhas (V ), sem reposic¸a˜o. Neste caso os poss´ıveis resultados do experimento sa˜o {BB,BV, V B, V V } e suas probabilidades sa˜o, P (B ∩ B) = P (B)P (B|B) = 2 5 × 1 4 = 2 20 P (B ∩ V ) = P (B)P (V |B) = 2 5 × 3 4 = 6 20 P (V ∩ B) = P (V )P (B|V ) = 3 5 × 2 4 = 6 20 P (V ∩ V ) = P (V )P (V |V ) = 3 5 × 2 4 = 6 20 . No exemplo acima imagine agora que as retiradas sa˜o feitas com reposic¸a˜o. Neste caso a informac¸a˜o sobre a cor da bola na primeira retirada na˜o altera em nada chances de obtermos uma bola branca na segunda retirada. Em outras pa- lavras, P (B|V ) = P (B|B) = P (B) e dizemos que as retiradas sa˜o independentes. Em geral dizemos que dois eventos A e B sa˜o independentes se e somente se P (A|B) = P (A) e P (B|A) = P (B) e isto tambe´m equivalente a dizer que P (A ∩ B) = P (A)P (B). O conceito de independeˆncia pode ser estendido a um nu´mero qualquer de eventos, i.e. P (A1 ∩ · · · ∩Ak) = P (A1) . . . P (Ak) se somente se os eventos A1, . . . , Ak forem independentes. 28 CAPI´TULO 2. PROBABILIDADES 2.4 Teorema de Bayes Suponha agora que os eventos A1, A2, . . . , Ak sa˜o dois a dois mutuamente ex- clusivos e a unia˜o deles e´ o pro´prio espac¸o amostral. Em outras palavras, um destes eventos necessariamente ira´ ocorrer pore´m dois deles na˜o podem ocorrer simultaneamente, A1 ∪ A2 ∪ · · · ∪ Ak = S e Ai ∩Aj = ∅, i 6= j. Enta˜o, qualquer outro evento B pode ser escrito como B = (B ∩ A1) ∪ (B ∩ A2) ∪ · · · ∪ (B ∩ Ak) sendo que estes k eventos do lado direito tambe´m sa˜o mutuamente exclusivos (verifique!). Ale´m disso, P (B ∩ Aj) = P (B|Aj)P (Aj), j = 1, . . . k e portanto podemos escrever que P (B) = P (B ∩A1) + P (B ∩A2) + · · ·+ P (B ∩ Ak) = P (B|A1)P (A1) + P (B|A2)P (A2) + · · ·+ P (B|Ak)P (Ak) = k∑ j=1 P (B|Aj)P (Aj). O fato e´ que em muitas aplicac¸o˜es conhecemos as probabilidades do lado direito desta igualdade e estaremos interessados em calcular a probabilidade de um dos eventos Ai ocorrer dado que B ocorreu, isto e´ P (Ai|B) = P (Ai ∩ B) P (B) = P (B|Ai)P (Ai)∑k j=1 P (B|Aj)P (Aj) . Chamamos esta u´ltima igualdade de teorema de Bayes ou regra de Bayes, que nos mostra como atualizar a nossa crenc¸a no evento Ai apo´s receber novas informac¸o˜es (i.e. que B ocorreu). • P (Ai) e´ a probabilidade a priori do evento Ai, porque antecede a informac¸a˜o sobre o evento B. • P (Ai|B) e´ a probabilidade a posteriori do evento Ai porque e´ calculada apo´s termos informac¸a˜o sobre B. • Para um valor espec´ıfico de B, P (B|Ai) e´ chamada func¸a˜o de verossimi- lhanc¸a de Ai. 2.4. TEOREMA DE BAYES 29 Veremos uma aplicac¸a˜o no exemplo a seguir. Exemplo 2.2 : Um me´dico, ao examinar uma pessoa, “desconfia” que ela possa ter uma certa doenc¸a. Baseado na sua experieˆncia, ele assume que a probabilidade do paciente ter a doenc¸a e´ 0,7. Paraaumentar sua quantidade de informac¸a˜o sobre a doenc¸a o me´dico aplica um teste que tem probabilidades 0,4 e 0,95 de dar resultado positivo em pessoas sadias e pessoas doentes respectivamente. Sabendo que o teste deu positivo como fica a probabilidade da pessoa ter a doenc¸a? Aqui o evento de interesse e´ A= “o paciente tem a doenc¸a” e definimos o evento B= “teste deu resultado positivo”. Assim, P (B|A¯) = 0, 40 e P (B|A) = 0, 95. E´ bem intuitivo que a probabilidade de doenc¸a deve ter aumentado apo´s este resultado e a questa˜o aqui e´ quantificar este aumento. Usando o teorema de Bayes segue que P (A|B) = P (B|A)P (A) P (B|A)P (A) + P (B|A)P (A) = (0, 95)(0, 7) (0, 95)(0, 7) + (0, 40)(0, 30) = 0, 847. Exemplo 2.3 : No Exemplo 2.1 suponha que foram retiradas 2 bolas brancas mas na˜o sabemos se as retiradas foram com ou sem reposic¸a˜o. Definindo o evento A=’retiradas com reposic¸a˜o’ gostariamos de calcular a probabilidade de A a` luz do resultado do experimento (B ∩ B). Suponha que antes do sorteio na˜o temos informac¸a˜o sobre o tipo de experimento (com ou sem reposic¸a˜o) e atribuimos a probabilidade a priori P (A) = 0, 5. Usando o Teorema de Bayes obtemos que P (A|BB) = P (BB|A)P (A) P (BB|A)P (A) + P (BB|A)P (A) = 0, 16× 0, 5 0, 16× 0, 5 + 0, 1× 0, 5 = 0, 615. Assim, e´ mais prova´vel agora (a posteriori) que o experimento tenha sido com reposic¸a˜o. Em muitas situac¸o˜es podemos estar interessados em comparar probabilidades a posteriori atrave´s da raza˜o P (Ai|B) P (Aj|B) , ou seja, quanto o evento Ai e´ mais prova´vel do que o evento Aj apo´s observar o 30 CAPI´TULO 2. PROBABILIDADES evento B? Aplicando o teorema de Bayes ao numerador e denominador e notando que P (B) se cancela obtemos que P (Ai|B) P (Aj|B)︸ ︷︷ ︸ raza˜o de chances a posteriori = P (B|Ai) P (B|Aj)︸ ︷︷ ︸ fator de Bayes P (Ai) P (Aj) .︸ ︷︷ ︸ raza˜o de chances a priori No Exemplo 2.2, ter a doenc¸a era 2,33 vezes mais prova´vel do que na˜o ter a doenc¸a antes de realizar o teste. Apo´s realizar o teste e obter resultado positivo, o fator de Bayes indicou que ter a doenc¸a era 2,375 vezes mais plaus´ıvel do que na˜o ter. Combinando estas duas informac¸o˜es conclui-se que ter a doenc¸a ficou 5,54 vezes mais prova´vel a posteriori. No exemplo 2.3 temos que P (A|BB) P (A|BB) = 0, 615 1− 0, 615 = 1, 597 ou seja, e´ 1,597 mais prova´vel que o experimento tenha sido com reposic¸a˜o. 2.5 Problemas 1. Sejam os eventos S = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10}, A = {1, 2, 3, 4, 5}, B = {2, 3, 5, 6} e {3, 4, 5, 6}. Obtenha A, A ∩ B, A ∩ C, A ∩ B, e A ∩B. 2. Sejam os eventos A1, . . . , Ak tais que A1 ∪ · · · ∪ Ak = S e Ai ∩ Aj = ∅, i 6= j. Para um evento B qualquer verifique que B ∩ Ai sa˜o mutuamente exclusivos. 3. Duas moedas sa˜o lanc¸adas. Escreva o espac¸o amostral para este experi- mento e liste os seguintes eventos, (a) pelo menos duas caras (b) exatamente duas caras (c) o complementar do item anterior Agora calcule as probabilidades dos eventos acima. 4. Suponha que 300 estudantes de uma universidade foram classificados o sexo e sua a´rea de estudo. Obteve-se a distribuic¸a˜o de frequeˆncias abaixo. Se um estudante for selecionado ao acaso calcule, 2.5. PROBLEMAS 31 Area Sexo Biologicas Exatas Sociais masculino 50 58 54 feminino 43 34 90 (a) a probabilidade de que seja do sexo feminino e das ciencias sociais. (b) a probabilidade de que seja do sexo masculino e na˜o seja das cieˆncias biolo´gicas. (c) a probabilidade de que seja do sexo masculino dado que e´ da a´rea de exatas. 5. Considere o lanc¸amento de dois dados e os seguintes eventos A: soma dos nu´meros obtidos igual a 6 e B: nu´mero obtido no primeiro dado maior ou igual a 3. (a) Enumere os elementos de A e B. (b) Obtenha A ∪B, A ∩ B e B. (c) Calcule as probabilidades dos eventos no item anterior. 6. Dois dados sa˜o lanc¸ados e observa-se S, a soma dos valores obtidos nas faces. (a) Calcule a probabilidade da soma ser menor do que 8 sabendo que e´ um nu´mero ı´mpar. (b) Os dados sa˜o lanc¸ados ate´ que se obtenha soma 7 ou 8. Calcule a probabilidade do evento A = {S = 7} sabendo que o experimento terminou. 7. Dois eventos independentes A e B ocorrem com probabilidades p e q, res- pectivamente. Qual a probabilidade de que (a) nenhum destes eventos ocorra? (b) pelo menos um destes eventos ocorra? 8. Dois eventos independentes A e B sa˜o tais que P (A) = 0, 4, P (B) = p e P (A ∪B) = 0, 7. Para que valores de p os eventos sera˜o: (a) mutuamente exclusivos, (b) independentes. 32 CAPI´TULO 2. PROBABILIDADES 9. Duas ma´quinas operam de forma independente em uma linha de produc¸a˜o. Em um per´ıodo de 8 horas as probabilidades de que cada uma delas apre- sente defeito sa˜o 1/3 e 1/4. Qual a probabilidade de que pelo menos uma das ma´quinas apresente defeito neste per´ıodo? 10. Um dado e´ viciado de tal forma que a probabilidade de sair uma face e´ proporcional ao seu valor, i.e. P (face x) ∝ x. Calcular: (a) A probabilidade de sair 5, sabendo-se que a face que saiu e´ ı´mpar. (b) A probabilidade de sair um nu´mero par, sabendo-se que saiu um nu´mero maior que 3. 11. Expresse as seguintes afirmac¸o˜es em termos de operac¸o˜es entre eventos. (a) A ocorre mas B na˜o ocorre. (b) Exatamente um dos eventos A e B ocorre. (c) Nenhum dos dois eventos ocorre. (d) No ma´ximo um deles ocorre. 12. Se A e B sa˜o eventos independentes mostre que tambe´m sa˜o independentes A e B, A e B, A e B. 13. Se A, B e C sa˜o eventos independentes verifique se (a) A e B ∪ C sa˜o independentes, (b) A ∩B e A ∩ C sa˜o independentes. 14. Um me´dico, ao examinar uma pessoa, “desconfia” que ela possa ter uma certa doenc¸a e assume que a probabilidade do paciente ter a doenc¸a e´ 0,7. Para aumentar sua quantidade de informac¸a˜o o me´dico aplica um teste, que da´ resultado positivo em 40% das pessoas sadias e em 95% das pessoas com esta doenc¸a. (a) Qual a probabilidade do teste dar resultado positivo? (b) Sabendo-se que o teste deu resultado positivo qual a probabilidade desta pessoa estar doente? (c) Foi aplicado um segundo teste que da´ resultado positivo com pro- babilidades 0,04 e 0,98 em pessoas sadias e doentes respectivamente. Calcule a probabilidade deste teste dar positivo e a probabilidade de doenc¸a sabendo que ele deu negativo. 2.6. ALGUMAS DISTRIBUIC¸O˜ES DE PROBABILIDADE 33 15. Um componente eletroˆnico esta´ sendo testado e sabe-se que ele pode ter sido produzido por ma´quinas do tipo I, II ou III com probabilidades 0,35, 0,25 e 0,40 respectivamente. Sabe-se tambe´m que as probabilidades deste componente ser defeituoso sa˜o 0,01, 0,02 e 0,03 respectivamente para cada tipo de ma´quina. Calcule a probabilidade deste componente eletroˆnico (a) Defina os eventos e enumere as probabilidades fornecidas no problema. (b) Qual a probabilidade deste componente eletroˆnico na˜o ter sido fabri- cada por uma ma´quina do tipo I? (c) Qual a probabilidade dele ser defeituoso? (d) Qual a probabilidade dele ter sido fabricado por uma ma´quina do tipo II sabendo-se que e´ defeituoso? 16. Uma empresa de cre´dito precisa saber como a inadimpleˆncia esta´ distribu´ıda entre seus clentes. Sabe-se que um cliente pode pertencer a` uma de 4 clas- ses distintas com probabilidades 0,50, 0,20, 0,20 e 0,10 respectivamente. Para cada uma destas classes as probabilidade de um cliente estar inadim- plente sa˜o 0,30, 0,10, 0,05 e 0,05 respectivamente. Um cliente e´ sorteado aleatoriamente. (a) Defina os eventos e enumere as probabilidades fornecidas no problema. (b) Calcule a probabilidade de pertencer a`s classes A ou B. (c) Calcule a probabilidade de estar inadimplente e pertencer a` classe A.(d) Qual a probabilidade dele estar inadimplente ? (e) Sabendo que ele esta´ inadimplente, qual a probabilidade dele pertencer a` classe B? 17. Sejam duas moedas, uma honesta e a outra com 2 caras. Uma destas moedas foi sorteada e lanc¸ada. (a) Se o resultado foi cara, qual a probabilidade de ter sido usada a moeda honesta? (b) A moeda selecionada foi lanc¸ada novamente e o resultado foi cara. Qual a probabilidade de ser a moeda honesta? 2.6 Algumas distribuic¸o˜es de probabilidade Nesta sec¸a˜o estudaremos alguns modelos teo´ricos que se adequam a uma se´rie de problemas pra´ticos. Veremos que estes modelos envolvem paraˆmetros cujo 34 CAPI´TULO 2. PROBABILIDADES conhecimento e´ necessa´rio para calcular probabilidades. Vale notar que na maio- ria dos problemas reais estes paraˆmetros sera˜o desconhecidos e sera´ preciso fazer algum tipo de infereˆncia sobre eles, e este assunto sera´ abordado no pro´ximo cap´ıtulo. Por enquanto vamos assumir que estes paraˆmetros sa˜o conhecidos e nos concentrar nas principais caracter´ısticas dos modelos apresentados. 2.6.1 A distribuic¸a˜o Uniforme Discreta Suponha um experimento com um nu´mero finito de poss´ıveis resultados e cada um deles com a mesma probabilidade de ocorrer. Definindo uma varia´vel aleato´ria (v.a) X cujos poss´ıveis valores {x1, . . . , xk} esta˜o associados aos resultados deste experimento, enta˜o P (X = xi) = 1 k , i = 1, . . . , k. O valor me´dio (ou valor esperado) e´ E(X) = (1/k) ∑k i=1 xi e sua variaˆncia e´ V ar(X) = 1 k k∑ i=1 [xi − E(X)]2 = 1 k [ k∑ i=1 x2i − kE(X)2] 2.6.2 A distribuic¸a˜o Binomial Em muitos experimentos os poss´ıveis resultados apresentam ou na˜o uma deter- minada caracter´ıstica. Esta caracter´ıstica sera´ muitas vezes determinada pelo pesquisador dependendo dos objetivos do experimento. Por exemplo, se uma pessoa for escolhida ao acaso dentre 1000 podemos estar interessados apenas se ela e´ do sexo masculino ou na˜o. Neste tipo de experimento estaremos interessados na ocorreˆncia de um sucesso ou falha e esta terminologia sera´ utilizada daqui em diante. E´ usual denotar a probabilidade de sucesso por p, isto e´ P (sucesso) = p e portanto P (fracasso) = 1− p. Podemos definir uma varia´vel aleato´ria (v.a) X como a varia´vel indicadora de sucesso em um experimento bina´rio, i.e. X = { 1, se ocorre sucesso 0, se ocorre fracasso e a probabilidade de X assumir cada um dos seus poss´ıveis valores e´ P (X = x) = { px(1− p)1−x se x = 0, 1 0 caso contra´rio. 2.6. ALGUMAS DISTRIBUIC¸O˜ES DE PROBABILIDADE 35 Dizemos que X tem distribuic¸a˜o de Bernoulli com paraˆmetro p ou equivalente- mente X ∼ Bernoulli(p), 0 < p < 1. Suponha agora que n experimentos (ou ensaios) independentes, sa˜o executa- dos, onde n e´ um nu´mero fixo, e que cada experimento resulta num sucesso com probabilidade p ou numa falha com probabilidade 1− p. Ou seja, o experimento consiste na observac¸a˜o das v.a. X1, . . . , Xn onde Xi ∼ Bernoulli(p), i = 1, . . . , n. Frequentemente estaremos interessados no nu´mero total de sucessos obtidos, independente da ordem em que eles ocorrem. Por exemplo, uma moeda e´ lanc¸ada 10 vezes e o nu´mero total de caras e´ contado (aqui “cara” e´ um sucesso). O nu´mero total de sucessos, Y = ∑n i=1Xi, cujos poss´ıveis valores sa˜o 0, 1, . . . , n e´ uma varia´vel aleato´ria com distribuic¸a˜o binomial com paraˆmetros n e p, ou Y ∼ Binomial(n, p). As probabilidades de cada um destes poss´ıveis valores sa˜o dadas por P (Y = k) = ( n k ) pk(1− p)n−k, k = 0, 1, . . . , n (2.1) sendo ( n k ) = n! k!(n− k)! em! = ∏m i=1 i e´ o fatorial dem (define-se 0! = 1). Ale´m disso, o nu´mero me´dio (ou esperado) de sucessos e´ E(Y ) = np e a variaˆncia e´ V ar(Y ) = np(1−p). Na Figura 2.1 esta˜o representadas graficamente distribuic¸o˜es Binomiais com probabilidades de sucesso p=0,2, 0,5, 0,7 e 0,9. Note como a distribuic¸a˜o e´ sime´trica em torno da me´dia quando p = 1/2 e e´ assime´trica para os outros valores de p. Exemplo 2.4 : Em uma linha de montagem estima-se que a proporc¸a˜o de itens defeituosos e´ aproximadamente 0,1. Se esta proporc¸a˜o e´ (aproximadamente) cons- tante ao longo do processo e 20 itens sa˜o selecionados de forma independente enta˜o o nu´mero me´dio ou esperado de defeituosos e´ 2 com variaˆncia 1,8 itens2. Definindo a v.a. Y : nu´mero de itens defeituosos podemos calcular por exemplo a probabilidade de no ma´ximo 2 itens defeituosos como P (Y ≤ 2) = P (Y = 0) + P (Y = 1) + P (Y = 2) = ( 20 0 ) 0, 10 0, 920 + ( 20 1 ) 0, 11 0, 919 + ( 20 2 ) 0, 12 0, 918 = 0, 1216 + 0, 2702 + 0, 2852 = 0, 677. 36 CAPI´TULO 2. PROBABILIDADES 2.6.3 A distribuic¸a˜o de Poisson Um outro modelo bastante utilizado em aplicac¸o˜es pra´ticas e´ a distribuic¸a˜o de Poisson. Ela e´ frequentemente usada para modelar dados de contagem, i.e. o nu´mero de ocorreˆncias de um certo fenoˆmeno, durante um intervalo fixo de tempo ou regia˜o fixa do espac¸o. Alguns exemplos sa˜o: o nu´mero de chamadas recebidas por uma central telefoˆnica durante uma hora, o nu´mero de defeitos por unidade de comprimento de uma fita magne´tica, o nu´mero de nmeto´ides encontrados por unidade de superf´ıcie de solo, o nu´mero dia´rio de novos casos de caˆncer de mama, etc. Neste caso, o nu´mero de ocorreˆnciasX por intervalo fixo (de tempo ou espac¸o) tem distribuic¸a˜o de Poisson e a probabilidade de exatamente k ocorreˆncias e´ dada por P (X = k) = λke−λ k! , λ > 0, k = 0, 1, . . . . (2.2) sendo e a base do logaritmo natural (e = 2, 71828 . . . ). A constante λ (que e´ sempre positiva) pode ser interpretada como o nu´mero esperado (ou nu´mero me´dio) de ocorreˆncias por unidade de tempo ou espac¸o. Assim, a me´dia de uma varia´vel aleato´ria com distribuic¸a˜o de Poisson e´ igual a λ e pode-se mostrar que a variaˆncia e´ igual a sua me´dia, E(X) = V ar(X) = λ. Na Figura 2.2 esta˜o representadas graficamente distribuic¸o˜es de Poisson com me´dia λ=1, 2, 5 e 15. Exemplo 2.5 : O nu´mero de part´ıculas radioativas emitidas em cada intervalo de 5 segundos tem distribuic¸a˜o de Poisson e sabe-se que em me´dia 2 part´ıculas sa˜o emitidas por intervalo. Se forem observados 10 intervalos de tempo qual a probabilidade de que em cada um deles menos de 3 part´ıculas sejam emitidas? Neste caso, podemos definir a v.a. X como o nu´mero de part´ıculas emitidas por intervalo sendo que o nu´mero me´dio de emisso˜es e´ λ=2. Portanto X tem distribuic¸a˜o de Poisson com paraˆmetro igual a 2 e queremos calcular P (X < 3). Mas, P (X < 3) = P (X = 0) + P (X = 1) + P (X = 2) = 20e−2 0! + 21e−2 1! + 22e−2 2! = 0, 1351 + 0, 2707 + 0, 2707 = 0, 6767. Esta e´ a probabilidade de emissa˜o de menos de 3 part´ıculas em um intervalo de 2.6. ALGUMAS DISTRIBUIC¸O˜ES DE PROBABILIDADE 37 tempo. Portanto, para 10 intervalos a probabilidade sera´ 0, 676710 = 0, 0201. A distribuic¸a˜o de Poisson tambe´m pode ser vista como uma aproximac¸a˜o para a distribuic¸a˜o binomial quando n e´ grande e p e´ pequeno. Assim, intuitivamente podemos dizer que a distribuic¸a˜o de Poisson pode ser usada no estudo de eventos raros, i.e. com pequena probabilidade de ocorreˆncia, quando o experimento e´ repetido um nu´mero grande de vezes. Neste caso o nu´mero me´dio de ocorreˆncias e´ λ = np. Na pra´tica esta aproximac¸a˜o e´ geralmente utilizada quando n ≥ 50 e np < 5. Exemplo 2.6 : Sabe-se que a proporc¸a˜o de pessoas com uma certa doenc¸a em uma populac¸a˜o e´ 0,01. Em uma amostra aleato´ria de 200 pessoas qual a proba- bilidade de que pelo menos 4 delas tenham esta doenc¸a? Podemos assumir que a distribuic¸a˜o exata do nu´mero X de pessoas com a doenc¸adentre estas 200 e´ binomial com paraˆmetros n = 200 e p = 0, 01. Como n > 50 e np = 2 < 5 podemos aproxima´-la pela distribuic¸a˜o de Poisson com paraˆmetro λ = np = 2. Neste caso a probabilidade pedida e´ P (X ≥ 4) = ∞∑ k=4 P (X = k) = 1− P (X < 4) = 1− [P (X = 0) + P (X = 1) + P (X = 2) + P (X = 3)] = 1− [ 20e−2 0! + 21e−2 1! + 22e−2 2! + 23e−2 3! ] = 1− (0, 1353 + 0, 2707 + 0, 2707 + 0, 1804) = 0, 1428. Note que P (X ≥ 4) e´ uma soma infinita e foi mais fa´cil calcular a probabilidade do complementar. Finalmente, uma propriedade importante e´ que se temos n v.a. X1, . . . , Xn independentes e cada uma delas com distribuic¸a˜o Poisson(λ) enta˜o X = X1 + · · ·+Xn ∼ Poisson(nλ) e X = X1 + · · ·+Xn n tem me´dia igual a λ e vriaˆncia igual a λ/n. 38 CAPI´TULO 2. PROBABILIDADES 2.6.4 Distribuic¸a˜o Geome´trica A distribuic¸a˜o geome´trica tambe´m esta´ relacionada a experimentos dicotoˆmicos realizados de forma independente e com a mesma probabilidade de sucesso. O evento de interesse neste caso e´ o nu´mero de experimentos X necessa´rios para a ocorreˆncia do primeiro sucesso. Por exemplo o nu´mero de inspec¸o˜es necessa´rias ate´ encontrar-se um item defeituoso em um lote. A probabilidade de que exatamente k experimentos sejam necessa´rios ate´ a ocorreˆncia do primeiro sucesso e´ dada por P (X = k) = (1− p)k−1p, k = 1, 2, . . . . Tambe´m pode-se mostrar que o nu´mero me´dio de repetic¸o˜es do experimento ate´ ocorrer o primeiro sucesso e´ E(X) = (1 − p)/p e a variaˆncia e´ V ar(X) = (1− p)/p2 = E(X)/p. Ou seja, quanto menor a probabilidade de sucesso menor sera´ o nu´mero esperado de repetic¸o˜es para que ele ocorra. Exemplo 2.7 : Um motorista veˆ uma vaga de estacionamento em uma rua. Ha´ cinco carros na frente dele, e cada um deles tem probabilidade 0,2 de tomar a vaga. Qual a probabilidade de a vaga ser tomada pelo carro que esta´ imediatamente a frente dele? Neste caso, podemos definir a v.a. X como o nu´mero de carros que pas- sam pela vaga ate´ que ela seja tomada (este e´ o evento definido como sucesso). Assume-se tambe´m que cada motorista toma a vaga ou na˜o de forma indepen- dente. Ou seja queremos calcular P (X = 5) = (0, 8)4 0, 2 = 0, 082. 2.6.5 Varia´veis Aleato´rias Discretas Os modelos vistos ate´ agora sa˜o chamados distribuic¸o˜es de probabilidade dis- cretas ja´ que a v.a. associada assume valores em um conjunto finito ou infinito enumera´vel. Neste caso, probabilidades sa˜o calculadas como somas, i.e. P (X ∈ A) = ∑ k∈A P (X = k), 2.6. ALGUMAS DISTRIBUIC¸O˜ES DE PROBABILIDADE 39 para um conjunto A qualquer. Para distribuic¸o˜es discretas de probabilidade tambe´m e´ sempre poss´ıvel mostrar que∑ k P (X = k) = 1. As definic¸o˜es de valor esperado (ou valor me´dio) e variaˆncia tambe´m podem ser generalizados para qualquer v.a. discreta X. Usaremos a seguinte notac¸a˜o, E(X) = µX = ∑ k kP (X = k) V ar(X) = σ2X = ∑ k P (X = k) (k − µX)2 para valor me´dio e variaˆncia respectivamente. O equivalente teo´rico ao conceito de frequeˆncias acumuladas vistas no Cap´ıtulo 1 e´ a func¸a˜o de distribuic¸a˜o acu- mulada ou simplesmente func¸a˜o de distribuic¸a˜o definida como, F (x) = P (X ≤ x) = ∑ k≤x P (X = k), ∀x ∈ R Exemplo 2.8 : Em um experimento 5 pec¸as foram inspecionadas e a v.a. X representa o nu´mero de pec¸as defeituosas com a seguinte distribuic¸a˜o de proba- bilidades x 0 1 2 3 4 5 P (X = x) 0,35 0,45 0,1 0,05 0,04 0,01 Neste caso podemos calcular o nu´mero me´dio de defeituosos e a variaˆncia como E(X) = 0× 0, 35+ 1× 0, 45+ 2× 0, 1+ 3× 0, 05+ 4× 0, 04+ 5× 0, 01 ≈ 1 pec¸a V ar(X) = (0− 1)20, 35 + (1− 1)20, 45 + (2− 1)20, 1 + (3− 1)20, 05 + (4− 1)20, 04 + (5− 1)20, 01 ≈ 0, 9 pec¸as2 Exemplo 2.9 : Um empresa´rio vai abrir uma nova filial de sua empresa. Com base na experieˆncia sobre outras filiais e outras empresas do ramo o lucro foi representado como uma v.a. discreta com a distribuic¸a˜o abaixo. 40 CAPI´TULO 2. PROBABILIDADES lucro -100 0 50 100 200 P (lucro = k) 0,05 0,05 0,30 0,50 0,10 E(Lucro) = −1000, 05 + 00, 05 + 500, 30 + 1000, 50 + 2000, 10 = 80. A seguir estudaremos distribuic¸o˜es de probabilidade chamadas cont´ınuas quando a v.a. associada assume valores no conjunto dos nu´meros reais. 2.6.6 A Distribuic¸a˜o Uniforme Cont´ınua A forma mais simples de modelar um fenoˆmeno aleato´rio cujos valores ocorrem no intervalo (a, b) da reta dos reais e´ atrave´s de uma v.a. X cuja probabilidade de pertencer a qualquer subintervalo de (a, b) seja proporcional ao comprimento do subintervalo. Matematicamente, se (c, d) ⊆ (a, b) enta˜o P (c ≤ X ≤ d) ∝ d− c. Isto significa que func¸a˜o de densidade de probabilidade de X deve ser escrita como f(x) = 1 b− a, a ≤ x ≤ b 0, caso contra´rio Deste modo, P (c ≤ X ≤ d) = (d− c)/(b− a). Pode-se mostrar tambe´m que E(X) = (a+ b)/2 e V ar(X) = (b− a)2/12. Exemplo 2.10 : Seja X uma v.a. com distribuic¸a˜o uniforme no intervalo (-1,4). Enta˜o a func¸a˜o de densidade de probabilidade de X e´ f(x) = { 1/5, −1 ≤ x ≤ 4 0, caso contra´rio e tambe´m P (0 ≤ X ≤ 2) = 2/5. 2.6.7 A Distribuic¸a˜o Normal A distribuic¸a˜o normal e´ a mais familiar das distribuic¸o˜es de probabilidade e tambe´m uma das mais importantes em Estat´ıstica. Esta distribuic¸a˜o e´ carac- terizada por uma func¸a˜o de densidade de probabilidade cujo gra´fico tem uma forma de sino como na Figura 2.3. 2.6. ALGUMAS DISTRIBUIC¸O˜ES DE PROBABILIDADE 41 Esta distribuic¸a˜o e´ apropriada para modelar varia´veis aleato´rias cont´ınuas, que assumem valores em algum subconjunto dos nu´meros reais. Neste caso, so´ faz sentido falar na probabilidade da varia´vel pertencer a um certo intervalo [a, b] que e´ dada pela a´rea sob a curva e dentro deste intervalo. A equac¸a˜o da curva normal e´ especificada usando dois paraˆmetros: a me´dia µ, e o desvio padra˜o σ, ou equivalentemente a variaˆncia σ2. Denotamos N(µ, σ2) a` curva normal com me´dia µ e variaˆncia σ2. A me´dia refere-se ao centro da distribuic¸a˜o e o desvio padra˜o ao grau de espalhamento de curva. A distribuic¸a˜o normal e´ sime´trica em torno da me´dia o que implica que a me´dia, a mediana e a moda sa˜o todas coincidentes. Para refereˆncia, a equac¸a˜o da curva e´ dada por f(x) = 1√ 2πσ2 exp { −(x− µ) 2 2σ2 } , µ ∈ R, σ2 > 0. (2.3) O importante e´ que se entenda como a curva e´ afetada pelos valores nume´ricos de µ e σ. A forma da curva e´ mostrada na Figura 2.4 para alguns valores da me´dia e desvio padra˜o. A a´rea sob a curva normal (na verdade abaixo de qualquer func¸a˜o de densidade de probabilidade) e´ 1. Enta˜o, para quaisquer dois valores espec´ıficos podemos determinar a proporc¸a˜o de a´rea sob a curva entre esses dois valores. Em particular para a distribuic¸a˜o normal, a proporc¸a˜o de valores localizados dentro de um, dois, ou treˆs desvios padra˜o em torno da me´dia sa˜o: Intervalo Proporc¸a˜o µ± 1σ 68,3% µ± 2σ 95,5% µ± 3σ 99,7% Um exemplo de como utilizar este resultado e´ o seguinte. Exemplo 2.11 : Suponha que os comprimentos de um particular tipo de peixe podem ser descritos por uma distribuic¸a˜o normal, com me´dia 140mm e desvio padra˜o 15mm. Neste caso, a proporc¸a˜o dos peixes que teˆm comprimentos entre 110mm e 170mm, por exemplo, e´ a proporc¸a˜o da a´rea sob a curva normal entre 110 e 170. Enta˜o neste exemplo, cerca de 95% dos peixes tem comprimentos entre 110mm e 170mm. Em termos probabil´ısticos, se a varia´vel aleato´ria X representa o comprimento dos peixes e se um peixe for selecionado ao acaso enta˜o P (µ− 2σ < X < µ+ 2σ) = P (110 < X < 170) = 0, 95. Em geral as probabilidades sa˜o obtidas calculando-se a integral definida da42 CAPI´TULO 2. PROBABILIDADES func¸a˜o f(x) em (2.3), i.e. P (a < X < b) = ∫ b a f(x)dx. Neste caso, P (X = x) = 0 e portanto segue que P (a < X < b) = P (a ≤ X < b) = P (a < X ≤ b) = P (a ≤ X ≤ b). Na pra´tica desejamos calcular probabilidades para diferentes valores de µ e σ. Para isso, a varia´vel X cuja distribuic¸a˜o e´ N(µ, σ2) e´ transformada numa forma padronizada Z com distribuic¸a˜o N(0, 1) (distribuic¸a˜o normal padra˜o) pois tal distribuic¸a˜o e´ tabelada. A quantidade Z e´ dada por Z = X − µ σ (2.4) Exemplo 2.12 : A concentrac¸a˜o de um poluente em a´gua liberada por uma fa´brica tem distribuic¸a˜o normal com me´dia 8 ppm e desvio padra˜o 1,5 ppm. Qual a probabilidade, de que num dado dia, a concentrac¸a˜o do poluente exceda o limite regulato´rio de 10 ppm? A soluc¸a˜o deste problema resume-se em determinar qual proporc¸a˜o da dis- tribuic¸a˜o esta´ acima de 10 ppm. Assim, definindo a v.a. X como sendo a con- centrac¸a˜o do poluente na a´gua segue que X ∼ N(9; 1, 52), e devemos calcular P (X > 10). Usando a estat´ıstica Z temos que P (X > 10) = P ( Z > 10− 8 1, 5 ) = P (Z > 1, 33) = 1− P (Z ≤ 1, 33) = 0, 5− P (0 < Z < 1, 33) Consultando a tabela da distribuic¸a˜o normal padronizada obtemos que P (0 < Z < 1, 33) = 0, 4082 e assim P (X > 10) = 0, 0918. Portanto, espera- se que a a´gua liberada pela fa´brica exceda os limites regulato´rios cerca de 9% do tempo. Vale notar que a propriedade de simetria da curva normal em torno da me´dia e´ bastante u´til no ca´lculo de probabilidades. Por exemplo, se X tem distribuic¸a˜o N(µ, σ2) enta˜o, para quaisquer valores de µ, σ2 e h > 0, 1. P (X > µ) = P (X < µ) = 0, 50 uma vez que a a´rea total abaixo da curva e´ igual a 1. 2.6. ALGUMAS DISTRIBUIC¸O˜ES DE PROBABILIDADE 43 2. P (X > µ+ h) = P (X < µ− h). 2.6.8 Distribuic¸a˜o Exponencial Frequentemente usada para modelar o tempo entre eventos que ocorrem a uma taxa me´dia constante. Se X e´ uma v.a. com distribuic¸a˜o exponencial sua func¸a˜o de densidade de probabilidade tem a forma f(x) = λe−λx, x > 0, λ > 0, (2.5) sendo λ o paraˆmetro da distribuic¸a˜o. Usamos a notac¸a˜o X ∼ Exponencial(λ). Pode-se mostrar que o valor me´dio de X e´ 1/λ e sua variaˆncia e´ 1/λ2. Probabi- lidades sa˜o facilmente calculadas como P (a < X < b) = ∫ b a λe−λxdx = e−λa − e−λb Na Figura 2.5 esta˜o representadas graficamente as func¸o˜es de densidade (2.5) com λ=1, 2, e 0,5. Exemplo 2.13 : Em uma empresa os acidentes de trabalho ocorrem a uma taxa me´dia de 0,1 por dia. Seja T o tempo (em dias) ate´ a ocorreˆncia do primeiro acidente, enta˜o T tem distribuic¸a˜o exponencial com paraˆmetro λ = 0, 1. Assim, o tempo me´dio ate´ ocorrer o primeiro acidente e´ igual a 10 dias (E(T )=10). A probabilidade de na˜o haver acidentes em uma semana de trabalho (de 5 dias) e´ dada por P (T > 5) = ∫ ∞ 5 0, 1e−0,1tdt = e−0,1×5 ≈ 0, 607. O modelo exponencial tem inu´meras aplicac¸o˜es pra´ticas, por exemplo em teoria das filas (tempo entre chegadas de clientes em um sistema), confiabilidade (tempo ate´ a falha de um equipamento), etc. 2.6.9 Varia´veis Aleato´rias Cont´ınuas Estes u´ltimos modelos sa˜o chamados distribuic¸o˜es de probabilidade cont´ınuas ja´ que a v.a. associada assume valores em um conjunto infinito. Neste caso, probabilidades sa˜o calculadas como integrais, i.e. P (X ∈ A) = ∫ A f(x)dx, 44 CAPI´TULO 2. PROBABILIDADES para um conjunto A ⊂ R qualquer. Tambe´m e´ sempre poss´ıvel mostrar que∫ ∞ −∞ f(x)dx = 1. As definic¸o˜es de valor esperado (ou valor me´dio) e variaˆncia tambe´m podem ser generalizados para qualquer v.a. cont´ınua X, E(X) = µX = ∫ ∞ −∞ xf(x)dx V ar(X) = σ2X = ∫ ∞ −∞ f(x) (x− µX)2. Neste caso a func¸a˜o de distribuic¸a˜o acumulada e´ definida como F (x) = P (X ≤ x) = ∫ x −∞ f(t)dt, ∀x ∈ R 2.6.10 Problemas 1. Mostre que as func¸o˜es abaixo sa˜o func¸o˜es de densidade de probabilidade e determine o valor da constante k. (a) f(x) = kx2 para 0 < x < 4. (b) f(x) = k(1 + 2x) para 0 < x < 2. (c) f(x) = k exp(−x) para x > 0. 2. Considerando a func¸a˜o de densidade no item (b) do problema 1. (a) Calcule P (X > 1, 5). (b) Calcule P (0, 7 < X < 1, 2). (c) Calcule o valor esperado de X. (d) Calcule a variaˆncia de X. (e) Calcule a mediana de X. (f) Calcule os quartis da distribuic¸a˜o de X. 3. A func¸a˜o de distribuic¸a˜o acumulada de uma certa varia´vel aleato´ria e´ F (x) = 0, x < −2 0, 25x+ 0, 5, −2 ≤ x < 2 x x ≥ 2 2.7. AJUSTE DE MODELOS TEO´RICOS 45 (a) Calcule P (X < 1, 8) (b) Calcule P (X > −1, 5) (c) Calcule P (X < −2) (d) Calcule P (−1 < X < 1) (e) Calcule a me´dia e mediana de X 2.7 Ajuste de Modelos Teo´ricos Um problema de grande importaˆncia pra´tica e´ o ajuste de distribuic¸o˜es teo´ricas a`s distribuic¸o˜es dos dados observados. Em outras palavras, queremos saber se a distribuic¸a˜o das frequeˆncias observadas nos dados segue o padra˜o de algum modelo teo´rico (normal, binomial, etc.). Nos exemplos a seguir veremos como fazer este ajuste. Exemplo 2.14 : Em uma amostra de 100 lotes com 5 itens cada um, verificou-se que o nu´mero de itens defeituosos tem a seguinte distribuic¸a˜o de frequeˆncias, Tabela 2.1: Frequeˆncias observadas para os dados de itens defeituosos. no de defeituosos 0 1 2 3 4 5 total no de lotes 75 21 3 1 0 0 100 Podemos ajustar uma distribuic¸a˜o binomial a estes dados com n = 5 e p a probabilidade de um item ser defeituoso. Neste caso a me´dia teo´rica e´ np = 5p e o nu´mero me´dio de itens defeituosos observados e´ x¯ = 0, 3. Igualando as duas me´dias obtemos que 5p = 0, 3, e portanto p = 0, 06. Assim, se X representa o nu´mero de itens defeituosos em cada lote, a distribuic¸a˜o binomial ajustada sera´, P (X = k) = ( 5 k ) (0, 06)k(0, 94)5−k, k = 0, 1, 2, 3, 4, 5. Agora podemos calcular as frequeˆncias teo´ricas (ou ajustadas) e comparar com aquelas observadas, como na Tabela 2.2 a seguir. Com base nesta tabela podemos afirmar que o modelo binomial parece ser adequado ja´ que as frequeˆncias observadas ficaram muitos pro´ximas das ajusta- das. Em outras palavras, aquilo que foi observado parece estar de acordo com o modelo teo´rico. 46 CAPI´TULO 2. PROBABILIDADES Tabela 2.2: Frequeˆncias ajustadas e observadas para os dados de itens defeituosos. frequeˆncias no de defeituosos (k) P (X = k) ajustada observada 0 0,7339 73 75 1 0,2342 23 21 2 0,0299 3 3 3 0,0019 0 1 4 0,0001 0 0 5 0,0000 0 0 Tabela 2.3: Frequeˆncias observadas de defeitos em 300 itens. no de defeitos 0 1 2 3 4 total no de itens 80 122 53 31 14 300 Exemplo 2.15 : Em uma amostra de 300 itens, o nu´mero de defeitos observados em cada um deles tem a distribuic¸a˜o de frequeˆncias dada na Tabela 2.3 abaixo. Podemos pensar em ajustar uma distribuic¸a˜o de Poisson com paraˆmetro (λ) dado pelo nu´mero me´dio de defeitos observados por item. Neste caso a me´dia amostral e´ x¯ = 1, 26, e portanto se X representa o nu´mero de defeitos por item enta˜o a distribuic¸a˜o ajustada sera´, P (X = k) = (1, 26)ke−1,26 k! , k = 0, 1, . . . A partir deste modelo podemos calcular as frequeˆncias ajustadas, e obtemos a Tabela 2.4 a seguir. Podemos dizer que o modelo ainda parece adequado embora as frequeˆncias observadas na˜o estejam mais ta˜o pro´ximas das ajustadas (como no exemplo an- terior). Nos pro´ximos cap´ıtulos veremos como testar esta adequac¸a˜o mais for- malmente. Exemplo 2.16 : Em um determinada sec¸a˜o de um rio foram efetuadas 1000 medic¸o˜es de sua vaza˜o (em m3/s), e obteve-se a distribuic¸a˜o apresentada na Tabela 2.5 abaixo. Podemos ajustar uma distribuic¸a˜o normal com paraˆmetros (me´dia e variaˆncia) dados pela me´dia amostral
Compartilhar