Baixe o app para aproveitar ainda mais
Prévia do material em texto
Cap´ıtulo 1 Estat´ıstica Descritiva 1.1 Introduc¸a˜o 1.1.1 Estat´ıstica A palavra estat´ıstica deriva do latim ”status”e tem dois significados dis- tintos. Frequentemente usado no plural, o termo estat´ıstica designa todo conjunto coerente de dados nume´ricos relativos a um grupo de indiv´ıduos. Assim, por ex- emplo, pode-se falar em estat´ısticas de produc¸a˜o industrial ou agr´ıcola (quantidades produzidas, custos de produc¸a˜o, prec¸os de venda, etc), de estat´ısticas demogra´ficas (natalidade, mortalidade), de estat´ısticas de desemprego, de acidentes de estrada, etc. Por outro lado, a palavra estat´ıstica designa tambe´m, o conjunto de me´todos que permitem reunir e analisar dados de observac¸a˜o. De acordo com Fisher -“A Estat´ıstica e´ a matema´tica aplicada a dados de observac¸a˜o”. Ela tem por objetivo o uso de me´todos cient´ıficos para coleta, organizac¸a˜o, resumo, apresentac¸a˜o e ana´lise de dados, bem como a obtenc¸a˜o de concluso˜es va´lidas a serem utilizadas nas tomadas de deciso˜es. Assim todo estudo estat´ıstico pode ser decomposto em pelo menos duas fases: - a reunia˜o ou coleta dos dados estat´ısticos - sua ana´lise e interpretac¸a˜o. A coleta de dados pode ser realizada de duas formas: 1 2 - por simples observac¸a˜o dos fenoˆmenos em que se tem interesse - estudo observacional e - por experimentac¸a˜o, ou seja, provocando-se voluntariamente a aparic¸a˜o de certos fenoˆmenos controlados. A ana´lise estat´ıstica pode ser decomposta em duas etapas, uma dedutiva ou descritiva e a outra indutiva. A Estat´ıstica Descritiva tem por objetivo resumir e apresentar os dados observados sob a forma de: tabelas (descric¸a˜o tabular), gra´ficos (descric¸a˜o gra´fica) e paraˆmetros e suas estimativas (descric¸a˜o parame´trica). A Infereˆncia Estat´ıstica permite estender ou generalizar dentro de certas condic¸o˜es as concluso˜es obtidas. Frequentemente, a observac¸a˜o ou a experimentac¸a˜o e´ relativa a apenas uma frac¸a˜o dos indiv´ıduos em que se tem interesse. As concluso˜es relativas a essa frac¸a˜o, chamada amostra, devem, enta˜o, ser estendidas tanto quanto poss´ıvel ao conjunto de indiv´ıduos que formam a “populac¸a˜o”. Essa fase indutiva comporta evidentemente certos riscos de erro, que podem ser medidos, usando-se a teoria das probabilidades. Quando em um estudo trabalha-se com amostras, tem-se uma pesquisa por amostragem. Quando se utiliza a populac¸a˜o toda tem-se o censo. As diferentes etapas de todo estudo estat´ıstico na˜o sa˜o, entretanto, independentes. 1.1.2 Varia´veis Varia´vel e´ uma medida ou classificac¸a˜o obtida de cada elemento da populac¸a˜o ou amostra. A representac¸a˜o de dados torna-se mais fa´cil por meio da utilizac¸a˜o de varia´veis. E´ importante notar que a varia´vel aleato´ria e´ representada por letra maiu´scula e o valor observado pela mesma letra, pore´m minu´scula. Assim, por exemplo, os dados apresentados na Tabela 1.1, a varia´vel X refere-se ao peso de 24 animais do Cerrado brasileiro, em kg. Tem-se ainda que xi, i = 1, ..., 24, representa o peso observado de um determinado animal i, por exemplo, x1 = 250, x2 = 20, x3 = 10, ..., x24 = 60. Outro exemplo pode ser 3 Tabela 1.1: Peso de 24 animais do Cerrado brasileiro, em kg. Animal X Animal X Animal X Anta 250 Gato-do-mato 3 Cateto 20 Ariranha 20 Gato-maracaja´ 6 Prea´ 1 Bugio-preto 10 Gato-mourisco 10 Quati 5 Cachorro-do-mato 8 Jaguatirica 15 Raposa-do-campo 8 Capivara 70 Lobo-guara´ 20 Suc¸uarana 60 Cervo 100 Lontra 10 Tamandua´-bandeira 30 Cotia 3 Onc¸a-pintada 100 Tatu-bola 3 Gamba´ 1 Paca 8 Veado-do-campo 60 Y : tipos de famı´lias de algumas espe´cies de plantas encontradas no Parque Nacional da Serra da Canastra yj: Asteraceae, Bignoniaceae, Melastomataceae, j = 1, 2, 3 (famı´lias). Os tipos de varia´veis mais comumente utilizadas na descric¸a˜o de dados sa˜o: Varia´veis Quantitativas discretascont´ınuas Qualitativas nominaisordinais a) Varia´veis quantitativas representam quantidades. Podem ser de natureza discreta ou cont´ınua. Sa˜o de natureza discreta as varia´veis que podem assumir apenas valores den- tro do conjunto dos nu´meros naturais. Exemplo: nu´mero de frutos por ramo, nu´mero de parasitas por hospedeiro, nu´mero de ovos por ninho, nu´mero de sementes germi- nadas, nu´mero de insetos coletados em armadilhas, nu´mero de brotos em estudos de cultura de tecidos, etc. 4 Sa˜o de natureza cont´ınua as varia´veis que podem assumir qualquer valor em um intervalo. Exemplo: alturas de plantas, pesos de animais, velocidade de animais, concentrac¸a˜o de uma soluc¸a˜o, biomassa de plantas ou animais, etc. b) Varia´veis qualitativas descrevem categorias, qualidades. Sa˜o relativas a dados categorizados. Exemplo: rac¸a, sexo, cor da pele, ta´xon, grau de infecc¸a˜o, etc. E´ poss´ıvel, a`s vezes, estabelecer uma correspondeˆncia dessas varia´veis com varia´veis quantitativas discretas. E´ o caso, por exemplo, de: sexo: masculino, feminino ⇒ xi = 0, 1, i = 1, 2 condic¸a˜o: morto, vivo ⇒ xi = 0, 1, i = 1, 2 graus de infecc¸a˜o: ⇒ xi = 0, 1, 2, 3, i = 1, 2, 3, 4. 1.1.3 Somato´rio E´ uma notac¸a˜o bastante utilizada dentro da estat´ıstica. Considere, por exemplo, a varia´vel aleato´ria X, que representa o nu´mero de espe´cimes de zarro- americano (Aythya affinis) coletados ao longo dos anos de 1965 a 1980, conforme a Tabela 1.2. Tabela 1.2: Nu´mero de espe´cimes de zarro-americano (Aythya affinis) coletados ao longo dos anos de 1965 a 1980. Ano 1965 1966 1967 1968 1969 1970 1971 1972 Nu´meros 19 28 4 13 28 36 17 30 Ano 1973 1974 1975 1976 1977 1978 1979 1980 Nu´meros 21 32 34 16 22 16 23 31 Tem-se, enta˜o, que x1 = 19, x2 = 28, ..., x16 = 31. Logo, o total de zarros- americanos coletados de 1965 a 1980 e´ dado por T = x1 + x2 + ...+ x16 = 16∑ i=1 xi = x. = 370 5 Figura 1.1: Zarro americano. Podem ser obtidas, ainda, a soma dos quadrados e o quadrado da soma 16∑ i=1 x2i = x 2 1 + x 2 2 + ...+ x 2 16 = 9706 e ( 16∑ i=1 xi )2 = (x1 + x2 + ...+ x16) 2 = 3702 = 136900. Outro exemplo, seria o da Tabela 1.3 que mostra o nu´mero me´dio de ca- maro˜es-espinho coletados na ba´ıa de Ubatuba de acordo com o local no qual o tran- secto foi feito e com o esta´gio reprodutivo do camara˜o. Tabela 1.3: Nu´meros me´dios de camaro˜es-espinho coletados na ba´ıa de Ubatuba de acordo com o local no qual o transecto foi feito e com o esta´gio reprodutivo do camara˜o. Transecto Esta´gio j = 1 j = 2 j = 3 j = 4 j = 5 j = 6 Totais Ov´ıgero y11 = 4,0 y12 = 7,0 y13 = 4,5 y14 = 1,0 y15 = 5,5 y16 = 3,5 y1. = 25,5 Na˜o-ov´ıgero y21 = 3,0 y22 = 6,5 y23 = 5,0 y24 = 2,0 y25 = 5,0 y26 = 3,5 y2. = 25,0 Totais y.1 = 7,0 y.2 = 13,5 y.3 = 9,5 y.4 = 3,0 y.5 = 10,5 y.6 = 7,0 y.. = 50,5 6 Pode-se representar cada valor observado por yij, isto e´, yij e´ o nu´mero de camaro˜es-espinho referente ao i-e´simo esta´gio reprodutivo e j-e´simo transecto. Assim, tem-se, por exemplo y.. = 2∑ i=1 6∑ j=1 yij = y11 + · · ·+ y16 + y21 + · · ·+ y26 = 50, 5 y1. = 6∑ j=1 y1j = y11 + · · ·+ y16 = 25, 5 y.2 = 2∑ i=1 yi2 = y12 + y22 = 13, 5 Propriedades do somato´rio: a) n∑ i=1 k = nk b) n∑ i=1 kxi = k n∑ i=1 xi c) n∑ i=1 (xi ± yi) = n∑ i=1 xi ± n∑ i=1 yi d) n∑ i=1 (xi ± k) = n∑ i=1 xi ± nk. 1.2 Estat´ıstica Descritiva Tem por objetivo resumir e apresentar dados de observac¸a˜o (populac¸a˜o ou amostra), de modo a simplificar sua interpretac¸a˜o por meio de descric¸a˜o tabular, gra´fica ou parame´trica. 1.2.1 Varia´vel Qualitativa – Descric¸a˜o Tabular e Gra´fica Primeiro caso: Uma so´ varia´vel Seja o exemplo que se segue. Os alunosda sexta turma de Cieˆncias Biolo´gicas da ESALQ/USP observaram durante dois dias o nu´mero de visitas de polinizadores a um espe´cime de Heliconia rostrata. Obtiveram os resultados: das 8h a`s 10h, 10h 7 a`s 12h, 12h a`s 14h e das 14h a`s 16h, respectivamente, 17, 28, 18 e 19 polinizadores visitaram a planta. Figura 1.2: Heliconia rostrata. A representac¸a˜o tabular e´ feita por meio de tabelas de mono-entrada ou de classificac¸a˜o simples ou tabelas de frequeˆncias. As frequeˆncias podem ser absolu- tas simples, absolutas acumuladas, relativas simples, relativas acumuladas, depen- dendo do interesse do pesquisador. Uma tabela e mesmo um gra´fico deve apresentar: cabec¸alho, corpo e rodape´. O cabec¸alho deve conter o suficiente para que sejam respondidas as questo˜es: o queˆ? (fato), onde? (lugar) e quando? (e´poca). O corpo e´ apresentado por colunas e sub-colunas dentro das quais sera˜o registrados os dados. O rodape´ e´ reservado para as observac¸o˜es pertinentes, bem como para a identificac¸a˜o da fonte dos dados. Assim, para o exemplo dado, tem-se a Tabela 1.4. A descric¸a˜o gra´fica, dentre outras, pode ser feita de treˆs formas: gra´fico de colunas (ou barras), de linhas e de setores circulares. Esses gra´ficos podem ser obtidos considerando-se frequeˆncia absoluta, frequeˆncia relativa, frequeˆncia absoluta acumulada e frequeˆncia relativa acumulada. a) Gra´fico de colunas e de linhas Os resultados da Tabela 1.4 podem ser representados graficamente como mostra a Figura 1.3. 8 Tabela 1.4: Nu´mero de visitas de polinizadores a um espe´cime de Heliconia rostrata observados por alunos da sexta turma de Cieˆncias Biolo´gicas da ESALQ-USP no ano de 2009, em dois dias de observac¸a˜o. Intervalo Frequeˆncia Frequeˆncia Freq. abs. Freq. rel. (xi) absoluta (fi) relativa (f ′ i) acumulada acumulada 08:00-10:00 17 0,207 17 0,207 10:00-12:00 28 0,341 45 0,548 12:00-14:00 18 0,220 63 0,768 14:00-16:00 19 0,232 82 1,000 82 1,000 - - 08:00−10:00 10:00−12:00 12:00−14:00 14:00−16:00 Horário N úm er o de v is ita s 0 5 10 15 20 25 30 0 5 10 15 20 25 30 Horário N úm er o de v is ita s 08:00−10:00 10:00−12:00 12:00−14:00 14:00−16:00 Figura 1.3: Gra´ficos de colunas e de linhas para o nu´mero de polinizadores observa- dos. b) Gra´fico de setores circulares E´ a representac¸a˜o gra´fica, em um c´ırculo, por meio de setores. E´ utilizado, principalmente, quando se pretende uma visualizac¸a˜o em relac¸a˜o ao total. Para cons- 9 tru´ı-lo, divide-se o c´ırculo em setores, cujas a´reas sera˜o proporcionais a`s frequeˆncias. Essa divisa˜o pode ser feita por regra de treˆs. Assim, no exemplo dado 82 visitas− 360o x1 = 74 o37′48′′ 17 visitas− x1 82 visitas− 360o x2 = 122 o58′48′′ 28 visitas− x2 x3 = 79 o01′12′′, x4 = 83o24′36′′. 08:00−10:00 10:00−12:00 12:00−14:00 14:00−16:00 34,1% 20,7% 22,0% 23,2% Figura 1.4: Gra´fico de setores circulares para o nu´mero de polinizadores observados. Segundo caso: duas varia´veis Se no exemplo de visitas de polinizadores a um espe´cime de Heliconia ros- trata, ale´m da varia´vel “n´ıvel”, tambe´m, for considerada a varia´vel “dia de coleta”, os resultados obtidos podem ser representados em uma tabela de dupla-entrada, como a Tabela 1.5. A descric¸a˜o gra´fica pode ser feita por meio dos gra´ficos de colunas e de linhas, dentre outras, agrupando-se as colunas por dia de coleta ou por intervalos de coletas, conforme e´ mostrado na Figura 1.5. 10 Tabela 1.5: Nu´mero de visitas de polinizadores a um espe´cime de Heliconia rostrata observados por alunos da sexta turma de Cieˆncias Biolo´gicas da ESALQ-USP no ano de 2009, em dois dias de observac¸a˜o. Hora Primeiro dia Segundo dia Total 08:00-10:00 9 8 17 10:00-12:00 13 15 28 12:00-14:00 9 9 18 14:00-16:00 10 9 19 Total 41 41 82 Primeiro dia Segundo dia 0 5 10 15 8−10 10−12 12−14 14−16 8−10 10−12 12−14 14−16 08:00−10:00 10:00−12:00 12:00−14:00 14:00−16:00 0 5 10 15 1 2 1 2 1 2 1 222 Figura 1.5: Gra´ficos de colunas para o nu´mero de polinizadores observados. 1.2.2 Varia´vel Quantitativa Discreta – Descric¸a˜o Tabular e Gra´fica Primeiro caso: Uma so´ varia´vel a) Tabela Primitiva ou Tabela de Dados Brutos – E´ a tabela inicial dos dados, geralmente, sem qualquer crite´rio que permita informac¸o˜es “estat´ısticas”. Assim, por exemplo, em uma pesquisa em sala de aula pode-se solicitar a quinze alunos que digam o nu´mero de pessoas que moram em suas casas, enfatizando que a 11 Tabela 1.6: Um exemplo de tabela de frequeˆncias. xi fi x1 n1 x2 n2 · · · · · · xV nV Total N = ∑ i fi “honestidade”moral cient´ıfica da coleta de dados pode ser mais importante do que o pro´prio me´todo estat´ıstico adotado na ana´lise desses dados. A` medida que os alunos va˜o dando a informac¸a˜o solicitada, os dados va˜o “entrando”, sem um crite´rio espec´ıfico. Outro exemplos seriam dados coletados no campo, como, por exemplo, nu´mero de sementes germinadas, nu´mero de plantas doentes, etc. b) Rol – E´ a tabela de dados dispostos em ordem, geralmente, crescente (ou decrescente) Apesar de pouco informativa apresenta algumas vantagens sobre a tabela primitiva, pois facilmente se obteˆm os valores de - limite inferior: l ou LI - limite superior: L ou LS - amplitude total: A = L− l ou A = LS − LI Apresenta desvantagens quando o conjunto de dados e´ grande. c) Tabela de Frequeˆncias – As duas tabelas anteriores sa˜o usadas, em geral, apenas para “controle”do pesquisador. Quando a pesquisa e´ publicada, a tabela de frequeˆncias e´ a que deve ser apresentada: espac¸o de publicac¸a˜o, quantidade de informac¸a˜o, etc. Esse tipo de tabela conte´m, no caso mais simples duas colunas, uma com os valores observados (xi) e a outra com as frequeˆncias absolutas (fi), como mostrado na Tabela 1.6. Podem tambe´m, ser inclu´ıdas colunas com frequeˆncias 12 Tabela 1.7: Nu´mero de pessoas que moram nas casas de 15 alunos amostrados. . xi fi ai a ′ i pi Fi 3 3 3 15 0,2 0,2 4 4 7 12 0,27 0,47 5 5 12 8 0,33 0,80 6 1 13 3 0,07 0,87 7 1 14 2 0,07 0,94 8 1 15 1 0,07 1,00 absolutas acumuladas, frequeˆncias relativas, frequeˆncias relativas acumuladas. Suponha que na pesquisa com os quinze alunos sobre o nu´mero de pes- soas que moram em suas casas, os resultados obtidos foram aqueles apresentados na Tabela 1.7 em que ai e´ a frequeˆncia acumulada direta do valor xi, a ′ i e´ a frequeˆncia acumulada inversa do valor xi, pi e´ a frequeˆncia relativa fi N do valor xi e Fi e´ a frequeˆncia relativa acumulada direta do valor xi. Sera´ visto, posteriormente, que a frequeˆncia relativa e´ um “bom”estimador de probabilidade e que Fi e´ um “bom”estimador da func¸a˜o acumulada de probabili- dade. Graficamente as varia´veis quantitativas discretas sa˜o descritas por meio de gra´ficos de linhas e de barras. Segundo caso: Duas ou mais varia´veis Exemplo: Na mesma pesquisa com os 15 alunos, pode-se solicitar para infor- marem dentre os moradores quantos sa˜o “assalariados”, obtendo-se os dados brutos, o rol das n-uplas, ordenando-se por uma das varia´veis e uma tabela de dupla-entrada, em que a varia´vel aleato´ria X representa o nu´mero de moradores por resideˆncia e a varia´vel aleato´ria Y representa o nu´mero de assalariados, conforme mostrado na Tabela 1.8. 13 Tabela 1.8: Tabela de frequeˆncias, classificada de acordo com o nu´mero de pessoas que moram nas casas de 15 alunos amostrados e nu´mero de assalariados. X Y 2 3 4 5 6 Totais (f.j) 1 1 1 1 1 0 4 2 0 1 3 2 1 7 3 01 2 1 0 4 Totais (fi.) 1 3 6 4 1 15 Note que as frequeˆncias marginais de X reproduzem a tabela ja´ constru´ıda quando se considerou apenas a varia´vel X. De modo ana´logo pode ser feito para a varia´vel Y . Ale´m disso, ∑ ij fij = ∑ i fi = ∑ j fj = N = nu´mero de dados A tabela de dupla entrada pode ser constru´ıda com frequeˆncias relativas. 1.2.3 Varia´vel Quantitativa Cont´ınua – Descric¸a˜o Tabular e Gra´fica Primeiro caso: Uma so´ varia´vel a) Tabela primitiva ou tabela de dados brutos Exemplo: Os dados da Tabela 1.9 referem-se a peso de 50 colmos de cana- de-ac¸u´car (em g). b) Rol – Ordenando-se os dados obteˆm-se os limites inferior e superior e a amplitude total. l = LI = 10, 20 L = LS = 22, 10 A = 22, 10− 10, 20 = 11, 90. 14 Tabela 1.9: Peso de 50 colmos de cana-de-ac¸u´car (em g). 14,11 16,12 17,78 13,54 17,59 17,09 17,26 20,35 13,34 20,08 14,77 13,61 14,85 17,76 17,46 16,08 14,14 15,06 20,67 17,60 15,26 14,17 16,39 12,00 15,55 14,78 20,48 20,04 16,78 13,59 19,70 19,56 19,18 19,21 15,94 19,12 20,90 17,11 14,06 19,38 19,36 16,07 22,10 14,62 18,05 10,20 16,51 20,39 15,63 14,30 c) Tabela de classes Note que ao contra´rio das varia´veis discretas, as varia´veis cont´ınuas apresen- tam muitos valores diferentes. Desse modo, uma tabela de frequeˆncias teria muitas linhas e seria, portanto, pouco explicativa. Para contornar esse problema, usam-se, para descrever as varia´veis cont´ınuas, tabelas de classes ou tabelas de intervalos. Faz-se, enta˜o, a partic¸a˜o do rol em intervalos de amplitude, geralmente, iguais de- nominadas classes. O nu´mero ideal de classes de uma tabela depende, muitas vezes, mais do bom senso do pesquisador do que de regras r´ıgidas pre´-estabelecidas. Na˜o ha´ uma fo´rmula exata. Boas aproximac¸o˜es podem ser obtidas por: (i) k = ≤ 5 se N ≤ 25' √N se N > 25 (ii) Sturges k ' 1 + 3, 22 log(N). A amplitude de cada classe e´ obtida por n = A k . No exemplo dado, tem-se k = √ 50 ≈ 7 e h = 22, 10− 10, 20 7 = 1, 7 Os gra´ficos mais comumente usados para descrever as varia´veis quantitativas cont´ınuas, sa˜o histograma e pol´ıgono de frequeˆncia, usando-se frequeˆncias absolutas, e ogivas de Galton crescente ou decrescente, usando-se frequeˆncias acumuladas. O histograma e´ constitu´ıdo de uma sequeˆncia de retaˆngulos justapostos em 15 Tabela 1.10: Tabela de frequeˆncias simples (fi), simples acumuladas crescentes (ai), simples acumuladas decrescentes (a′i), relativas simples (Pˆi), relativas acumuladas (Fi) para os dados da Tabela 1.9, mi representa o ponto me´dio do intervalo. Peso mi fi ai a ′ i Pˆi Fi 10,0 ` 12,0 11,0 1 1 50 0,02 0,02 12,0 ` 14,0 13,0 5 6 49 0,10 0,12 14,0 ` 16,0 15,0 14 20 44 0,28 0,40 16,0 ` 18,0 17,0 14 34 30 0,28 0,68 18,0 ` 20,0 19,0 8 42 16 0,16 0,84 20,0 ` 22,0 21,0 7 49 8 0,14 0,98 22,0 ` 24,0 23,0 1 50 1 0,02 1,00 que cada retaˆngulo tem como base a amplitude de classe e como altura a frequ¨eˆncia da classe que descreve. O pol´ıgono de frequeˆncias consiste de uma linha poligo- nal fechada que une os pontos Pi(mi, fi), i = 1 · · · , k. Para “fechar”o pol´ıgono de frequeˆncias, supo˜e-se uma classe imediatamente anterior e outra imediatamente posterior, ambas com frequeˆncias nulas e procede-se de modo ana´logo. Pesos de colmos de cana−de−açúcar Fre qu ên cia s 0 10 20 30 40 0 1 2 3 4 0 5 10 15 4 12 20 28 36 Figura 1.6: Histograma e ogivas de Galton para os dados de pesos de colmos de cana-de-ac¸u´car. 16 A ogiva de Galton crescente consiste de uma linha poligonal que une os pontos Pi(Li, ai), enquanto que a ogiva de Galton decrescente consiste de uma linha poligonal que une os pontos Pi(li, a ′ i). O histograma e as ogivas de Galton para os dados de pesos de colmos de cana-de-ac¸u´car, esta˜o representados na Figura 1.6. 1.3 Descric¸a˜o parame´trica 1.3.1 Introduc¸a˜o Os dados relativos a uma varia´vel quantitativa, apresentados em uma tabela, da˜o visa˜o geral do problema em estudo. Entretanto, e´ extremamente conveniente proceder a uma descric¸a˜o dos dados usando-se medidas que mostrem, de maneira bastante concisa, certas caracter´ısticas da amostra. As medidas de tendeˆncia central, tambe´m chamadas medidas de posic¸a˜o, estabelecem o valor em torno do qual os dados se distribuem. Esta˜o entre elas: me´dia aritme´tica, me´dia geome´trica, me´dia harmoˆnica, me´dia quadra´tica, mediana, quartis, decis, percentis e moda. As medidas de dispersa˜o permitem quantificar a variabilidade dos valores observados, ao redor de um paraˆmetro de posic¸a˜o. Esta˜o entre elas: amplitude total, variaˆncia, desvio-padra˜o, erro-padra˜o da me´dia, coeficiente de variac¸a˜o (medida de dispersa˜o relativa), desvio-quartil, desvio semi-quart´ılico e desvio quartil reduzido. As medidas de assimetria medem o grau de simetria de uma distribuic¸a˜o en- quanto que as medidas de curtose medem o grau de achatamento de uma distribuic¸a˜o. Esta˜o entre elas: coeficientes de Pearson e coeficientes de Fisher. Uma distribuic¸a˜o pode ser: sime´trica, assime´trica positiva ou assime´trica negativa e, ainda, leptocu´rtica, mesocu´rtica ou platicu´rtica. Existem, ainda, as medidas de associac¸a˜o que envolvem a dispersa˜o de pon- tos referentes a duas varia´veis, e podem ser citadas: covariaˆncia e coeficiente de correlac¸a˜o. 17 Resta lembrar que para a maioria dos paraˆmetros, deve-se considerar, sepa- radamente, o caso de se´ries estat´ısticas (uma simples enumerac¸a˜o das observac¸o˜es) e aquele das distribuic¸o˜es de frequeˆncias considerando-se tabelas de frequeˆncias e de classes de frequeˆncias. E´ prefer´ıvel, geralmente, proceder a` reduc¸a˜o parame´trica dos dados, dire- tamente, a partir dos valores observados, mesmo se as distribuic¸o˜es de frequeˆncias foram estabelecidas, por exemplo, em vista da representac¸a˜o gra´fica dos resultados. Em particular, e´ preciso evitar efetuar a reduc¸a˜o dos dados a partir de distribuic¸o˜es grupadas em classes. 1.3.2 Medidas de tendeˆncia central ou de posic¸a˜o Estabelecem o valor em torno do qual os dados se distribuem. 1.3.2.1 Me´dia aritme´tica Primeiro caso: Dados na˜o agrupados Dado um conjunto de N valores ΩX = {x1, x2, . . . , xN} define-se a me´dia aritme´tica como x¯ = x1 + x2 + . . .+ xN N . Os s´ımbolos x¯, mˆ ou µˆ representam estimativas da me´dia m ou µ da popu- lac¸a˜o. Os s´ımbolos m e µ representam os paraˆmetros da populac¸a˜o. Como exemplo, sejam os dados de produc¸a˜o de cana-de ac¸u´car da Tabela 1.9. Tem-se: 50∑ i=1 xi = 839, 69 N = 50 x¯ = 16, 8g. 18 Segundo caso: Dados colocados sob a forma de tabelas de frequeˆncias Seja a Tabela 1.11 de frequeˆncias. Tabela 1.11: Tabela de frequeˆncias xi fi xifi x1 f1 x1f1 · · · · · · · · · xk fk xkfk Totais N = k∑ i=1 fi k∑ i=1 xifi A me´dia aritme´tica e´ obtida por mˆ = x¯ = k∑ i=1 xifi k∑ i=1 fi . Tabela 1.12: Nu´mero de moradores por resideˆncia, de 15 alunos amostrados. xi fi xifi 3 3 9 4 4 16 5 5 25 6 1 6 7 1 7 8 1 8 Totais 15 71 Exemplo: Considerando-se o exemplo do nu´mero de moradores por resideˆncia, de 15 alunos amostrados, pode-se construir a Tabela 1.12, a partir da 19 qual se obte´m a me´dia aritme´tica x¯ = 71 15 = 4, 7 moradores por resideˆncia. Terceiro caso: Dados colocados sob a forma de tabelas de classes de frequeˆncias Seja a Tabela 1.13 de classes de frequeˆncias. A me´dia aritme´tica e´ obtida Tabela 1.13: Tabela de classes de frequeˆncias. Classes mi fi mifi c1 ` c2 m1 f1 m1f1 c2 ` c3 m2 f2 m2f2 · · · · · · · · · · · · ck ` ck+1 mk fk mkfk Totais N = k∑ i=1 fi k∑ i=1 mifi porx¯ = k∑ i=1 mifi N , em que mi e´ o ponto me´dio da classe e N = k∑ i=1 fi. Propriedades da me´dia aritme´tica: 1) N∑ i=1 (xi − x¯) = 0 As diferenc¸as di = xi−x¯ sa˜o chamadas desvios, discrepaˆncias ou afastamento de cada xi em relac¸a˜o a x¯. 2) ∑N i=1 (xi − x¯)2 = 0 e´ mı´nima, isto e´, a soma dos quadrados dos desvios de cada observac¸a˜o xi em relac¸a˜o a uma medida de posic¸a˜o k e´ a menor poss´ıvel quando k e´ a me´dia aritme´tica. 20 Exemplo: Considere os dados de peso de 50 colmos de cana-de-ac¸u´car da Tabela 1.9 com a Tabela 1.14 de classes de frequeˆncias. A me´dia aritme´tica e´ obtida Tabela 1.14: Tabela de classes de frequeˆncias para os dados da Tabela 1.9. Peso mi fi mifi 10,0 ` 12,0 11,0 1 11,0 12,0 ` 14,0 13,0 5 65,0 14,0 ` 16,0 15,0 14 210,0 16,0 ` 18,0 17,0 14 238.0 18,0 ` 20,0 19,0 8 152,0 20,0 ` 22,0 21,0 7 147,0 22,0 ` 24,0 23,0 1 23,00 Totais 50 846 por x¯ = 846 50 = 17g. 1.3.2.2 Mediana E´ um paraˆmetro de posic¸a˜o tal que a metade das observac¸o˜es lhe sa˜o infe- riores (ou iguais) e a outra metade superiores (ou iguais). Primeiro caso: dados na˜o-agrupados Feita a ordenac¸a˜o dos n dados a mediana e´ dada por md = xn+1 2 se n e´ ı´mpar, e md = xn 2 + xn 2 +1 2 se n e´ par. Exemplo: Um estudo foi conduzido com adolescentes mulheres que sofriam de bulimia e os resultados das medidas de entrada calo´rica dia´ria (kcal/kg) esta˜o na 21 Tabela 1.15. A mediana e´ dada por md = x12 + x13 2 = 21, 6 + 22, 9 2 = 22, 25 Tabela 1.15: Medidas de entrada calo´rica dia´ria (kcal/kg) de 24 adolescentes mulhe- res. 15,9 18,9 25,1 16,0 19,6 25,2 16,5 21,5 25,6 17,0 21,6 28,0 17,6 22,9 28,7 18,1 23,6 29,2 18,4 24,1 30,9 18,9 24,5 30,6 Outro exemplo: As alturas (cm) de nove alunos do terceiro ano do curso de Cieˆncias Biolo´gicas da ESALQ/USP, 2009 foram X: { 172; 180; 183; 183; 185; 187; 189; 189; 191}. A mediana e´ dada por md = x5 = 185. Segundo caso: dados colocados sob a forma de tabelas de frequeˆncias Distribuic¸a˜o do nu´mero de moradores por resideˆncia, de 15 alunos sorteados no terceiro ano de Cieˆncias Biolo´gicas, 2009 xi fi a ′ i 3 3 3 4 4 7 5 5 12 6 1 13 7 1 14 8 1 15 md = x 15+1 2 = x8 = 5 22 Terceiro caso: dados colocados em uma tabela de classes de frequeˆncias Um modo de se obter a mediana e´ por meio de um processo gra´fico, utilizando-se a Ogiva de Galton. No exemplo de dados de bulimia tem-se a Ogiva de Galton. Figura 1.7: Ogiva de Galton crescente para os dados de bulimia Tabela 1.16: Tabela de classes de frequeˆncias para os dados da Tabela 1.15. Peso mi fi 15,9 ` 18,9 17,4 7 18,9 ` 21,9 20,4 5 21,9 ` 24,9 23,4 4 24,9 ` 27,9 23,4 3 27,9 ` 30,9 26,4 4 30,9 ` 33,9 29,4 1 Totais 24 Outro modo de se obter a mediana e´ usando-se a fo´rmula md = lmd + (N 2 −∑ fi)h fmd 23 em que lmd e´ o limite inferior da classe mediana, ∑ fi e´ a soma das frequeˆncias anteriores a` classe mediana, h e´ a amplitude da classe mediana e fmd e´ frequeˆncia da classe mediana. Para os dados de bulimia da Tabela 1.15, com tabela de classes de frequeˆncias na Tabela 1.16, tem-se md = 20, 4 + 24 2 − 7 5 · 3 = 23, 4. 1.3.2.3 Moda E´ o elemento de uma se´rie de dados que ocorre com maior frequeˆncia. Primeiro caso: dados na˜o-agrupados No exemplo de dados na˜o agrupados de bulimia (Tabela 1.15), a moda e´ igual a 18,9, pois aparece duas vezes enquanto que as outras observac¸o˜es apare- cem apenas uma vez. Para o exemplo de alturas de alunos, as modas sa˜o 183 e 189cm. Segundo caso: dados agrupados em uma tabela de frequeˆncias Para o exemplo de nu´mero de moradores por resideˆncia, de 15 alunos do ter- ceiro ano de Cieˆncias Biolo´gicas, 2009, a moda e´Mo = 5 (e´ o valor xi correspondente a` maior frequeˆncia fi) xi 3 4 5 6 7 8 fi 3 4 5 1 1 1 Terceiro caso: dados agrupados em uma tabela de classes de frequeˆncias Uma maneira de se obter a moda e´ por meio de um processo gra´fico, utilizando-se o histograma de frequeˆncias simples. No exemplo de cana-de-ac¸u´car, tem-se Mo = 18, 23, conforme Figura 1.8. Outro modo de se obter a moda e´ usando-se a fo´rmula de Czuber Mo = l + ∆1 ∆1 +∆2 .h 24 Figura 1.8: Histograma dos pesos de colmo de ac¸u´car com ca´lculo da moda. em que l e´ o limite inferior da classe modal, ∆1 e´ a diferenc¸a entre a frequeˆncia da classe modal e a imediatamente anterior, ∆2 e´ a diferenc¸a entre a frequeˆncia da classe modal e a imediatamente posterior e h e´ a amplitude da classe. Para os dados da Tabela 1.15 com Tabela 1.16 de classes de frequeˆncias, tem-se Mo = 15, 9 + 7 7 + 2 .3 = 18, 23. 1.3.2.4 Me´dia geome´trica Dado o conjunto de N valores ΩX = {x1, x2, . . . , xN}, se os dados forem na˜o agrupa- dos, a me´dia geome´trica e´ obtida por x¯g = n √ x1.x2 . . . xN = n √√√√ N∏ i=1 xi. Se os dados estiverem em uma tabela de classes de frequeˆncias, enta˜o, x¯g = n √√√√ N∏ i=1 xfii sendo xi a me´dia da classe i com frequeˆncia fi. Exemplo: Durante o primeiro semestre do ano de 1970 a relac¸a˜o x = prec¸o de gasolina prec¸o do o´leo diesel 25 foi x1 = 2, 50 e no segundo semestre foi x2 = 2, 00. Enta˜o, mgx = √ 2× 2, 5 = √ 5 = 2, 236 Note que se y = 1 x ⇒ y1 = 12,5 e y2 = 12 . Logo, mgy = √ 1 2, 5 × 1 2 = √ 1 5 = 0, 447 = 1 mgx . Se fosse utilizada a me´dia aritme´tica, ter-se-ia x¯ 6= 1 y¯ . 1.3.2.5 Me´dia harmoˆnica E´ utilizada no ca´lculo de velocidades me´dias e custo me´dio de bens comprados com uma quantia fixa. Dado o conjunto de N valores ΩX = {x1, x2, . . . , xN}, para dados na˜o agrupados, a me´dia harmoˆnica e´ x¯h = N 1 x1 + 1 x2 + . . .+ 1 xN = N∑N i=1 1 xi isto e´, e´ o inverso da me´dia aritme´tica dos inversos dos valores. Para dados em tabelas de frequeˆncias x¯h = N∑k i=1 fi xi . Exemplo: As cidades A, B e C sa˜o equidistantes umas das outras. Um motorista viaja de A para B a 30km/h de B para C a 60 km/h e de C para A a 120 km/h. Qual a velocidade me´dia desenvolvida no percurso? x¯h = 3 1 30 + 1 60 + 1 120 = 51, 428km/h. 26 1.3.2.6 Me´dia quadra´tica E´ utilizada, principalmente, na determinac¸a˜o de diaˆmetro de a´rvores de secc¸a˜o ou a´rea me´dia. Dado o conjunto de valores ΩX = {x1, x2, . . . , xN}, para dados na˜o- agrupados, a me´dia quadra´tica e´ x¯q = √ x21 + x 2 2 + . . .+ x 2 N N = √∑ x2i N . Para dados em tabelas de frequeˆncias, x¯q = √ 1 N ∑ fix2i . 1.3.2.7 Separatrizes: Decis, Quartis e Percentis Quartis dividem um conjunto de dados ordenados em quatro partes iguais, enquanto que os decis em dez partes iguais e os percentis em cem partes iguais. Assim, teˆm-se treˆs quartis (Q1, Q2, Q3), nove decis (D1, D2, ...,D9) e noventa e nove percentis (P1, P2,...,P99). Tem-se, ainda, que Md = Q2 = D5 = P50. O processo gra´fico utilizado para a determinac¸a˜o dessas separatrizes e´ seme- lhante ao utilizado para a mediana, a partir da Ogiva de Galton. Quanto a`s fo´rmulas tem-se: Q1 = lQ1 + ( N 4 −∑ fi) fQ1 .h . 1.3.2.8 Relac¸a˜o entre me´dia, mediana e moda Em uma distribuic¸a˜o sime´trica observa-se que x¯ = md = mo. 27 Figura 1.9: Exemplo de uma distribuic¸a˜o sime´trica Em uma distribuic¸a˜o assime´trica positiva observa-se que x¯ > md > mo enquanto que na assime´trica negativa x¯ < md < mo. 1.3.3 Medidas de dispersa˜o 1.3.3.1 Introduc¸a˜o As medidas de tendeˆncia central, embora de extrema importaˆncia, na˜o sa˜o suficientes para o estudo completo das distribuic¸o˜es. Exemplo inicial: Em um ensaio de cana-de-ac¸u´car em que se testaramtreˆs variedades foram obtidas as produc¸o˜es: variedade A: 86,0 87,0 88,0 88,0 88,0 89,0 90,0 variedade B: 84,0 86,0 88,0 88,0 88,0 90,0 92,0 variedade C: 87,0 87,0 88,0 88,0 88,0 89,0 89,0. Verifica-se que: x¯A = x¯B = x¯C = 88, 0 ∑ x2 = 54218 s2 = 1, 67 mdA = mdB = mdC = 88, 0 ∑ x2 = 54248 s2 = 6, 67 moA = moB = moC = 88, 0 ∑ x2 = 54212 s2 = 0, 67. 28 Tornam-se necessa´rias, portanto, outras medidas para se fazer a escolha de uma determinada variedade. Um novo crite´rio, enta˜o, poderia ser: a variedade mais regular, isto e´, a variedade cujas produc¸o˜es apresentam menor dispersa˜o. 1.3.3.2 Amplitude total E´ a mais rudimentar das medidas de dispersa˜o. E´ a diferenc¸a entre o maior e o menor dos valores de uma se´rie de dados. A = xmax − xmin No exemplo dado: AA = 4, 0 AB = 8, 0 AC = 2, 0 Tem a desvantagem de levar em considerac¸a˜o apenas os valores extremos. 1.3.3.3 Desvio (di) em relac¸a˜o a` me´dia Primeiro caso: dados na˜o agrupados di = xi − x¯ na amostra e di = xi − µ na populac¸a˜o Segundo caso: dados em tabelas de classes de frequeˆncias di = mi − x¯ Fato: ∑ di = ∑ (xi − x¯) = ∑ xi − nx¯ = 0 1.3.3.4 Variaˆncia E´ a mais importante das medidas de variac¸a˜o e e´ definida como a me´dia dos quadrados dos desvios. 29 Primeiro caso: dados na˜o agrupados Populac¸a˜o: σ2 = ∑ (xi − µ)2 n = 1 n [∑ x2 − ( ∑ x)2 n ] Amostra: s2 = ∑ (xi − x¯)2 n− 1 = 1 n− 1 [∑ x2 − ( ∑ x)2 n ] Nota: Perde-se um grau de liberdade ao estimar-se σ2 com base na estimativa da me´dia. No exemplo de peso das treˆs variedades de cana-de-ac¸u´car: s2A = 1, 67 s 2 B = 6, 67 s 2 C = 0, 67 Poder-se-ia, portanto, nesse caso escolher a variedade C. No exemplo de dados de produc¸a˜o de cana-de-ac¸u´car (t/ha), da Tabela 1.9, tem-se ∑ x2 = 14445, 64 ∑ x = 839, 69 s2 = 1 50− 1 ( 14445, 64− 839, 69 2 50 ) = 7, 02g2 Segundo caso: dados em tabelas de frequeˆncias σ2 = 1 n ∑ fi(xi − µ)2 = 1 n [∑ fix 2 i − ( ∑ fixi) 2 n ] s2 = 1 n−1 ∑ fi(xi − x¯)2 = 1 n− 1 [∑ fix 2 i − ( ∑ fixi) 2 n ] Exemplo: Distribuic¸a˜o do nu´mero de moradores por resideˆncia 30 xi fi fixi fix 2 i 3 3 9 27 4 4 16 64 5 5 25 125 6 1 6 36 7 1 7 49 8 1 8 64 15 71 365 s2 = 1 14 [ 365− 71 2 15 ] = 2, 07 Terceiro caso: dados em tabelas de classes de frequeˆncias s2 = 1 n− 1 k∑ i=1 fi(mi − x¯)2 = 1 n− 1 [∑ fim 2 i − ( ∑ fimi) 2 n ] sendo mi e´ o ponto me´dio da classe i e n = ∑ fi Em outro exemplo de dados de produc¸a˜o de cana-de-ac¸u´car (t/ha) tem-se: mi fi mifi m 2 i fi 74,0 ` 79,2 76,6 4 306,4 23470,24 79,2 ` 84,4 81,8 5 409,0 33456,20 84,4 ` 89,6 87,05 14 1218,0 105966,00 89,6 ` 94,8 92,2 7 645,4 59505,88 94,8 ` 100,0 97,4 2 194,8 18973,52 100,0 ` 105,2 102,6 4 410,4 42107,04 3184,0 283478,88 s2 = 1 35 [ 283478, 88− 3184, 0 2 36 ] = 1871, 7689 35 = 53, 4791 ' 53, 48t/ha 31 1.3.3.5 Desvio-padra˜o Observando-se a fo´rmula para o ca´lculo da variaˆncia, veˆ-se que o numerador e´ uma soma de quadrados. Assim, se a unidade foi, por exemplo, metro (m), tem-se que a variaˆncia sera´ dada em m2. Para se voltar a` varia´vel original, necessita-se, enta˜o, extrair a raiz quadrada da variaˆncia que e´ o desvio-padra˜o. Assim, tem-se: Populac¸a˜o: σ = √ σ2 Amostra: s = √ s2 s = √ 53, 48 = 7, 32 dados de cana-de-ac¸u´car agrupados s = √ 2, 07 = 1, 44 dados de habitantes por resideˆncia 1.3.3.6 Coeficiente de variac¸a˜o Trata-se de uma medida relativa de dispersa˜o, u´til para a comparac¸a˜o em termos relativos do grau de concentrac¸a˜o em torno da me´dia de se´ries distintas. E´ dado por: Populac¸a˜o: CV = σ µ ou CV (%) = 100 · σ µ Amostra: CV = s x¯ ou CV (%) = 100 · s x¯ Para efeitos pra´ticos, costuma-se considerar que CV superior a 50% indica alto grau de dispersa˜o e, consequentemente, pequena representabilidade da me´dia. Enquanto que para valores inferiores a 50% a me´dia sera´ tanto mais representativa do fato quanto menor for o seu CV. O coeficiente de variac¸a˜o mede o desvio-padra˜o em unidades da me´dia. Assim se temos duas amostras de peso (em kg) de gado Canchim aos 8 meses Amostra A: 347, 380, 328, 410, 380, 348, 329, 320, 330, 305 Amostra B: 350, 343, 325, 348, 334, 327, 317, 342, 341, 330 x¯A = 347, 7 x¯B = 335, 7 s2A = 1067, 79 s 2 B = 116, 9 sA = 32, 68 sB = 10, 81 CVA = 0, 094 CVB = 0, 032 32 Portanto, veˆ-se que a dispersa˜o relativa da amostra B e´ menor do que a da amostra A. 1.3.3.7 Erro-padra˜o da me´dia Obtido por σ(x¯) = σ√ n para populac¸a˜o s(x¯) = s√ n para amostra Pode ser verificado que me´dias e desvios-padra˜o sa˜o por si mesmos sujeitos a` variac¸a˜o e formam populac¸o˜es de me´dias e de desvios-padra˜o. Espera-se que me´dias sejam menos varia´veis que observac¸o˜es individuais. Assim, o erro-padra˜o da me´dia e´ uma medida de dispersa˜o de um conjunto de me´dias, utilizando-se apenas uma me´dia. Nos exemplos dados, tem-se: s(x¯) = 7, 09√ 36 = 1, 182 para dados de cana-de-ac¸u´car na˜o-agrupados s(x¯) = 3, 31√ 36 = 0, 552 para dados de cana-de-ac¸u´car agrupados s(x¯) = 1, 44√ 15 = 0, 372 para dados de habitantes por resideˆncia Cap´ıtulo 2 PROBABILIDADES 2.1 Conceituac¸a˜o 2.1.1 Experimento Aleato´rio (E) E´ aquele que repetido sob as mesmas condic¸o˜es pode levar a resultados diferentes, isto e´, na˜o se pode prever seu resultado, em raza˜o do fato de que todos os fatores que determinam o resultado na˜o podem ser medidos ou controlados. Exemplos: E1: Lanc¸ar uma moeda e observar o resultado da face voltada para cima. E2: Lanc¸ar duas moedas e observar o resultado das faces voltadas para cima. E3: Lanc¸ar dez moedas e observar o nu´mero de caras. E4: Lanc¸ar um dado e observar o nu´mero mostrado na face de cima. E5: Lanc¸ar dois dados e observar o nu´mero mostrado na face de cima. E6: Lanc¸ar dois dados e observar a soma dos nu´meros mostrados na face de cima. E7: Plantar 10 sementes de feija˜o e observar o nu´mero de sementes germi- nadas. E8: Fazer o cruzamento de dois animais e observar o sexo do animal que nasceu. Analisando esses experimentos verifica-se: a) Cada experimento podera´ ser repetido sob as mesmas condic¸o˜es in- definidamente. 33 34 b) Na˜o se conhece um particular valor do experimento “a priori”, pore´m, podem-se descrever todos os poss´ıveis resultados - as possibilidades. c) Quando o experimento for repetido um grande nu´mero de vezes, surgira´ uma regularidade, isto e´, havera´ uma estabilidade da frac¸a˜o f = s n (frequeˆncia re- lativa), em que o nu´mero n e´ o nu´mero de repetic¸o˜es e s e´ o nu´mero de sucessos de um particular resultado estabelecido antes da realizac¸a˜o. Essa caracter´ıstica e´ fundamental para o ca´lculo da probabilidade de um certo evento. Assim, n f 2.1.2 Espac¸o Amostral E´ o conjunto de todos os resultados poss´ıveis associados a um experimento, representado por S. Sendo S um conjunto, ele podera´ ser finito ou infinito. Nos exemplos dados a) E1 : S1 = {k, c} em que c = cara, k = coroa b) E2 : S2 = {(c, c), (c, k), (k, c), (k, k)} c) E3 : S3 = {0, 1, 2, ..., 10} d) E4 : S4 = {1, 2, 3, 4, 5, 6} e) E5 : S5 = {(1, 1), (1, 2), (1, 3), ..., (6, 6)} f) E6 : S6 = {2, 3, 4, ..., 12} g) E7 : S7 = {0, 1, 2, ..., 10} h) E8 : S8 ={feˆmea, macho} 35 2.1.3 Evento E´ um subconjunto de S, ou seja, um conjunto de resultados de um experi- mento. Nos exemplos dados a) A1: sair cara ⇒ A1 = {c} b) B1: sair pelo menos uma cara ⇒ B1 = {(c, c), (k,c), (c, k)} c) C1: na˜o sair cara ⇒ C1 = {0} d) D1: sair o treˆs ⇒ D1 = {3} e) X1: sair o par (5, 6)⇒ X1 = {(5, 6)} f) F1: sair soma onze ⇒ F1 = {(5, 6), (6, 5)} g) G1: pelo menos 8 sementes germinaram ⇒ G1 = {1, 2, 3, ..., 8} h) H1: nascer macho ⇒ H1={macho}. Tipos de Eventos Evento Imposs´ıvel – aquele que nunca ocorre. Representado por ∅. Por exemplo, no jogo de dois dados sair soma 13. ∅ = {13} Evento Simples ou Elementar – e´ aquele que conte´m apenas um dos elementos do espac¸o amostral. Exemplos: A1, C1, D1, H1. Evento Certo – e´ o pro´prio espac¸o amostral S. A = S Evento Complementar – Dado um evento A de um espac¸o amostral S, define-se o evento complementar de A, como o subconjunto de todos os elementos de S que na˜o esta˜o em A, isto e´, A¯ = {x : x ∈ S e /∈ A} 36 Propriedades a) A ∪ A¯ = S b) A ∩ A¯ = ∅ Exemplo: Em E4 = {1, 2, 3, 4, 5, 6}, podem-se definir os eventos comple- mentares A: sair face par ⇒ A = {2, 4, 6} A¯: sair face ı´mpar ⇒ A¯ = {1, 3, 5}. Eventos Mutuamente Exclusivos Dois eventos A1 e A2 sa˜o mutuamente exclusivos, se eles na˜o podem ocorrer simultaneamente, isto e´, A1∩A2 = ∅. Exemplo: Em E4, podem-se definir os eventos mutuamente exclusivos A1: sair o nu´mero 2, A1 = {2} A2: sair nu´mero ı´mpar, A2 = {1, 3, 5} A1 ∩ A2 = ∅. Eventos Independentes Dois eventos A1 e A2 sa˜o dependentes, se a ocorreˆncia de um deles depende de que o outro tenha ocorrido, ou na˜o. Dois eventos A1 e A2 sa˜o independentes, se a ocorreˆncia de um deles independe de que o outro tenha ocorrido, ou na˜o. Exemplo: Seja 37 E: Retirar 2 bolas de uma urna com 2 bolas brancas e uma preta, sem reposic¸a˜o. Os eventos A1: A primeira bola e´ branca e A2: A segunda bola e´ branca sa˜o dependentes, pois a chance de ocorreˆncia da segunda bola branca muda, depen- dendo da cor da primeira bola. 2.2 Definic¸a˜o de Probabilidade Dado um espac¸o amostral S, a probabilidade de um evento A, representada por P (A), e´ uma func¸a˜o definida em S, que associa um valor nume´rico ao evento A, satisfazendo os axiomas: a) 0 ≤ P (A) ≤ 1 b) P (S) = 1 c) Se A e B sa˜o eventos mutuamente exclusivos (A ∩B = ∅), enta˜o: P (A ∪B) = P (A) + P (B). Nos problemas pra´ticos o valor P (A) pode ser obtido por P (A) = tamanho de A tamanho de S . Exemplos 1) Joga-se um dado. Qual a probabilidade de sair pelo menos 3? Soluc¸a˜o: Dado que S = {1, 2, 3, 4, 5, 6} e A = {3, 4, 5, 6}, enta˜o P (A) = 4 6 = 2 3 . 2) Uma urna conte´m 5 bolas brancas, 7 pretas e 3 vermelhas. Tiram-se 5 bolas de uma vez. Calcule as probabilidades dos eventos que se seguem. a) Sa´ırem 3 bolas brancas e 2 vermelhas. 38 p1 = C35C 2 3 C515 = 10 1001 . b) Na˜o sair nenhuma bola branca. p2 = C510 C515 = 12 143 . c) Sair pelo menos uma preta. p3 = 1− P (nenhuma bola preta) = 1− C 5 8 C515 = 421 429 . 2.3 Teoremas 1. Se ∅ e´ o conjunto vazio, enta˜o P (∅) = 0. Prova: A e ∅ sa˜o disjuntos, pois A ∩ ∅ = ∅ P (A ∪ ∅) = P (A) + P (∅) P (A) = P (A) + P (∅), pois A ∪ ∅ = A Logo, P (∅) = 0. 2. Se A¯ e´ o complemento de A, enta˜o P (A¯) = 1− P (A). Prova: Como A ∪ A¯ = S e A ∩ A¯ = ∅, enta˜o P (A ∪ A¯) = P (A) + P (A¯) por (c), P (S) = P (A) + P (A¯) e por (b) 1 = P (A) + P (A¯)⇒ P (A¯) = 1− P (A). 39 3. Se A ⊂ B,enta˜o P (A) ≤ P (B). Prova: Pelo Diagrama de Venn, B = A ∪ (B ∩ A¯) e, portanto, P (B) = P (A) + P (B ∩ A¯) por (c), mas P (B ∩ A¯) ≥ 0 por (a), enta˜o, P (B) ≥ P (A) ou P (A) ≤ P (B). 4. Se A e B sa˜o dois eventos quaisquer, enta˜o: P (A ∪B) = P (A) + P (B)− P (A ∩B) i) Se A e B sa˜o mutuamente exclusivos, P (A ∩ B) = 0 e decorre imediata- mente pelo axioma (c) P (A ∪B) = P (A) + P (B) ii) Se A ∩B 6= ∅ Pelo diagrama de Venn, A ∪B = A ∪ (A¯ ∩B). Logo, como A e A¯ ∩B sa˜o mutuamente exclusivos P (A ∪B) = P (A) + P (A¯ ∩B), mas 40 B = (B ∩ A) ∪ (B ∩ A¯). Logo, P (B) = P (B∩A)+P (B∩A¯), pois (B∩A) e (B∩A¯) sa˜o mutuamente exclusivos. Enta˜o, P (B ∩ A¯) = P (B)− P (B ∩ A) e, portanto, P (A ∪B) = P (A) + P (B)− P (B ∩ A). 5. Se A e B sa˜o dois eventos quaisquer, enta˜o: P (A ∩B) = P (A¯ ∪ B¯) e P (A ∪B) = P (A¯ ∩ B¯) 2.4 Espac¸os amostrais finitos equiprova´veis Quando a cada ponto amostral de um espac¸o amostral esta´ associada a mesma probabilidade, o espac¸o amostral chama-se equiprova´vel ou uniforme. Em particular, se S conte´m n pontos, a probabilidade de cada ponto sera´ igual a 1 n . Por outro lado, se um evento A conte´m r pontos, enta˜o, P (A) = r 1 n = r n . Esse me´todo de avaliar P (A) e´ frequentemente colocado da seguinte forma P (A) = nu´mero de elementos de A nu´mero de elementos do espac¸o amostral ou P (A) = nu´mero de casos favora´veis nu´mero total de casos = n(A) n(S) . 41 2.5 Probabilidade Condicional, Teorema do Pro- duto, Eventos Independentes Exemplo inicial: Uma urna conte´m duas bolas brancas e treˆs bolas verdes. Retiram-se duas bolas 1 a 1. Sejam os seguintes eventos: A: a primeira bola e´ branca B: a segunda bola e´ branca Considere o experimento: 1) Com reposic¸a˜o da primeira bola P (A) = 2 5 e P (B) = P (B|A) = 2 5 P (B|A¯) = 2 5 2) Sem reposic¸a˜o da primeira bola P (A) = 2 5 e P (B) = P (B|A) = 1 4 P (B|A¯) = 2 4 = 1 2 Observac¸o˜es: i) P (B|A) e´ a probabilidade de B dado que ocorreu A. ii) P (B|A¯) e´ a probabilidade de B dado que na˜o ocorreu A. iii) Note que no primeiro caso (com reposic¸a˜o) a ocorreˆncia do evento B na˜o depende de que A tenha, ou na˜o, ocorrido. P (B|A) = P (B|A¯) = 2 5 = P (B). iv) Note que no segundo caso (sem reposic¸a˜o) a ocorreˆncia do evento B depende de que A tenha, ou na˜o, ocorrido. P (B|A) = 1 4 6= P (B|A¯) = 1 2 . 42 Outro exemplo: Considere o experimento E e os eventos A e B E: lanc¸ar um dado honesto A: ocorrer face par B: ocorrer face 2 Enta˜o, sem du´vida P (A) = 1 2 e P (B) = 1 6 . Suponha que o dado tenha sido lanc¸ado e que ja´ tenha ocorrido face par. Nessas condic¸o˜es, qual a probabilidade de ocorrer face 2, isto e´, P (B|A) =? O espac¸o amostral S ′ agora esta´ reduzido de S para A. S ′ = {2, 4, 6} = A P (B|A) = n(B) n(S ′) = n(B) n(A) = 1 3 . Definic¸a˜o: Dados os eventos A e B de um espac¸o amostral S, define-se a probabilidade condicional de B dado que ocorreu A, por P (B|A) = P (A ∩B) P (A) com P (A) 6= 0, pois A ja´ ocorreu. P (B|A) = n(A ∩B) n(S) n(A) n(S) = n(A ∩B) n(A) . No exemplo, A = {2, 4, 6} e B = {2}, e, portanto, A ∩B = {2} ⇒ m(A ∩B) = 1 m(A) = 3⇒ P (B|A) = 1 3 . Dessa definic¸a˜o decorre o Teorema do Produto: “A probabilidade de ocorreˆncia de dois eventos A e B, do mesmo espac¸o amostral e´ igual ao produto da probabilidade de um deles pela probabilidade condicional do outro, dado o primeiro.” 43 P (B|A) = P (A ∩B) P (A) ⇒ P (A ∩B) = P (A)P (B|A) ou P (A|B) = P (A ∩B) P (B) ⇒ P (A ∩B) = P (B)P (A|B). No exemplo da urna, considere o evento C: ambas as bolas sa˜o brancas. Enta˜o, P (C) = P (A ∩B) = P (A) · P (B|A) Note que: 1) Com reposic¸a˜o da primeira bola P (A ∩B) = P (B)P (B|A), em que P (B|A) = P (B) P (A ∩B) = P (A) · P (B) = 2 5 · 2 5 = 4 25 2) Sem reposic¸a˜o da segunda bola P (B|A) 6= P (B) P (A ∩B) = P (A) · P (B|A) = 2 5 · 1 4 = 1 10 Definic¸a˜o: Um evento A e´ independente de um evento B se a probabilidade de A ocorrer na˜o e´ influenciada pelo fato de B ter ocorrido, ou na˜o, ou seja, se P (A) = P (A|B). E´ evidente que, se A e´ independente de B, B e´ independente de A. Assim P (B) = P (B|A). Considerando o teorema do produto, seA e B sa˜o independentes, enta˜o P (A ∩B) = P (A) · P (B). Observac¸a˜o: Dados k eventos A1, A2, ..., Ak diz-se que eles sa˜o indepen- dentes se eles forem independentes 2 a 2, 3 a 3,..., k a k. 44 Exemplos: 1) Em um lote de 12 pec¸as, 4 sa˜o defeituosas; 2 pec¸as sa˜o retiradas uma apo´s a outra, sem reposic¸a˜o. Qual a probabilidade de que ambas sejam boas? Soluc¸a˜o: A: a primeira pec¸a e´ boa B: a segunda pec¸a e´ boa P (A ∩B) = P (A) · P (B|A) = 8 12 7 11 = 14 33 2) Em um certo cole´gio, 25% dos estudantes foram reprovados em matema´tica, 15% em qu´ımica e 10% em matema´tica e qu´ımica ao mesmo tempo, isto e´, P (A) = 1 4 , P (B) = 15 100 = 3 20 e P (A ∩B) = 1 10 . Um estudante e´ aleatoriamente escolhido. a) Se ele foi reprovado em qu´ımica, qual e´ a probabilidade de ele ter sido reprovado em matema´tica? P (A|B) = 1 10 3 20 = 2 3 . b) Se ele foi reprovado em matema´tica qual e´ a probabilidade de ele ter sido reprovado em qu´ımica? P (B|A) = 1 10 1 4 = 4 10 = 2 5 . c) Qual a probabilidade de ele ter sido reprovado em qu´ımica ou matema´tica? P (A ∪B) = P (A) + P (B)− P (A ∩B) = 0, 25 + 0, 15− 0, 10 = 0, 30. 45 Um outro exemplo do Teorema da Soma Lanc¸a-se um dado honesto. Qual a probabilidade de ocorrer a) Face menor do que 5 ou face par? A = {1, 2, 3, 4} ⇒ P (A) = 4 6 B = {2, 4, 6} ⇒ P (B) = 3 6 A ∪B = {1, 2, 3, 4, 6} A ∩B = {2, 4} ⇒ P (A ∩B) = 2 6 P (A ∪B) = P (A) + P (B)− P (A ∩B) = 5 6 b) Face menor do que 5 ou face maior que 5? A = {1, 2, 3, 4} ⇒ P (A) = 4 6 C = {6} ⇒ P (C) = 1 6 A ∪ C = {1, 2, 3, 4, 6} A ∩ C = ∅ ⇒ P (A ∩ C) = 0 P (A ∪ C) = 4 6 + 1 6 = 5 6 c) Face par ou face ı´mpar? B = {2, 4, 6} ⇒ P (B) = 3 6 D = {1, 3, 5} ⇒ P (D) = 3 6 B ∪D = S ⇒ P (S) = 1 B ∩D = ∅ P (B ∪D) = 1 46 2.6 Teorema de Bayes ou das probabilidades co- nhecidas “a priori” Definic¸a˜o: Sejam A1, A2, ..., An, n eventos mutuamente exclusivos, tais que A1 ∪ A2 ∪ ... ∪ An = S Sejam P (Ai) as probabilidades conhecidas dos va´rios eventos e B um evento qualquer de S tal que conhecemos todas as probabilidades condicionais P (B|Ai). Enta˜o, para cada i, tem-se: P (Ai|B) = P (Ai ∩B) P (B) = P (Ai ∩B) P (A1 ∩B) + ...+ P (An ∩B) = P (Ai)P (B|Ai) P (A1)P (B|A1) + ...+ P (An)P (B|An) Exemplos 1) Em uma gaiola meta´lica 4% dos coelhos machos e 1% das feˆmeas pesam mais do que 1,8 kg. Por outro lado, 60% dos coelhos sa˜o feˆmeas. Se um coelho escolhido aleatoriamente pesa mais de 1,8 kg, qual a probabilidade de ser feˆmea? Soluc¸a˜o: Logo, podem-se considerar os eventos: A1 : coelho feˆmea A2 : coelho macho B : coelho pesa mais de 1,8 kg 47 e as probabilidades P (A1) = 0, 6, P (B|A1) = 0, 01 P (A2) = 0, 4, P (B|A2) = 0, 04 P (A1|B) = 0, 6 · 0, 01 0, 6 · 0, 01 + 0, 4 · 0, 04 = 0, 006 0, 022 = 3 11 . 2) Uma cl´ınica envia amostras de equinos para 3 laborato´rios de ana´lises A, B e C nas seguintes proporc¸o˜es 0,2; 0,3 e 0,5, respectivamente. A probabilidade de cada um dos laborato´rios elaborar uma ana´lise errada e´ de, respectivamente, 1 2 , 1 3 e 1 6 . Logo, podem-se considerar os eventos: A1 : ana´lise feita pelo laborato´rio A A2 : ana´lise feita pelo laborato´rio B A3 : ana´lise feita pelo laborato´rio C B : realizar uma ana´lise errada e as probabilidades P (A1) = 0, 2 P (B|A1) = 1 2 P (A2) = 0, 3 P (B|A2) = 1 3 P (A3) = 0, 5 P (B|A3) = 1 6 . a) Uma ana´lise resultou errada, qual a probabilidade de ter sido feita pelo laborato´rio A? Pelo B? Pelo C? P (A1|B) = 0, 2 · 1 2 0, 2 · 1 2 + 0, 3 · 1 3 + 0, 5 · 1 6 = 0, 1 1, 7 6 = 0, 3529 P (A2|B) = 0, 3529 P (A3|B) = 0, 2941 b) Qual a probabilidade de um exame executado resultar errado? 48 P (B) = P (A ∩B1) + P (A ∩B2) + P (A ∩B3) = P (A1) · P (B|A1) + P (A2) · P (B|A2) + P (A3) · P (B|A3) = 1, 7 6 = 0, 2833. 3) Uma urna A conte´m 1 bola preta e 1 vermelha. Uma urna B conte´m 2 bolas pretas e 3 vermelhas. Uma bola e´ escolhida ao acaso na urna A e colocada na urna B. Uma bola e´, enta˜o, extra´ıda, ao acaso, da urna B. Qual a probablidade de que a primeira bola seja vermelha, sabendo-se que a segunda foi preta? Soluc¸a˜o: Sejam os eventos e as respectivas probabilidades A1 : a bola de A para B foi preta ∴ P (A1) = 1 2 A2 : a bola de A para B foi vermelha ∴ P (A2) = 1 2 X: a bola tirada de B e´ preta ∴ P (X|A1) = 3 6 = 1 2 e P (X|A2) = 2 6 . Logo, P (A2|X) = 1 2 · 2 6 1 2 · 2 6 + 1 2 · 3 6 = 2 5 . 4) O cara´ter pescoc¸o pelado das galinhas e´ dado por um fator gene´tico dominante Na. Um animal de constituic¸a˜o gene´tica NaNa ou Nana, tem pescoc¸o pelado, mas tera´ pescoc¸o coberto se tiver a constituic¸a˜o nana. Tendo um galo de pescoc¸o pelado sido cruzado com galinhas de pescoc¸o coberto, foram obtidos 5 pintos, todos de pescoc¸o pelado. Qual a probabilidade de que o galo seja puro para o fator Na? 49 Soluc¸a˜o: Sejam os eventos: A1 : galo puro NaNa A2 : galo de constituic¸a˜o gene´tica Nana B : 5 pintos Nana e as probabilidades P (A1) = 1 2 , P (B|A1) = 1 P (A2) = 1 2 , P (B|A2) = ( 1 2 )5 . Logo, P (A1|B) = 1 2 · 1 1 2 · 1 + 1 2 · 1 32 = 32 33 = 0, 97. 2.7 Exerc´ıcios 1) Considere o experimento E: Lanc¸ar um dado e uma moeda. Pede-se: a) Construa o espac¸o amostral b) Enumere os seguintes eventos A = {coroa, marcado por nu´mero ı´mpar} B = {cara, marcado por nu´mero ı´mpar} C = {mu´ltiplos de 3} c) Expresse os eventos I) B II) A ou B ocorrerem III) B e C ocorrerem IV) A ⋃ B d) Quais dos eventos A, B e C sa˜o mutuamente exclusivos? 50 2) Determine a probabilidade de: a) Sair um nu´mero par no lanc¸amento de um dado na˜o-viciado. b) Sair um rei ao se extrair uma carta de um baralho. c) Sair soma 5 no lanc¸amento de dois dados. 3) Um grupo de 15 elementos apresenta a seguinte composic¸a˜o: Homens Mulheres Menores 5 3 Adultos 5 2 Um elemento e´ escolhido ao acaso. Pergunta-se: a) Qual a probabilidade de ser homem? b) Qual a probabilidade de ser adulto? c) Qual a probabilidade de ser menor e mulher? d) Sabendo-se que o elemento escolhido e´ adulto, qual a probabilidade de ser homem? e) Dado que a escolha e´ mulher, qual a probabilidade de ser menor? 4) Considere que existam numa populac¸a˜o animais de geno´tipos dos tipos BB, Bb e bb, sendo os indiv´ıduos BB e Bb pretos e os do tipo bb brancos. As probabilidades dos 6 tipos de acasalamento esta˜o resumidas na tabela a seguir: BB Bb bb BB 4 25 5 25 6 25 Bb - 3 25 4 25 bb - - 3 25 51 Dado que um descendente e´ branco, quais as probabilidades dos diversos cruzamentos? 5) Denomina-se “screening program” a avaliac¸a˜o total de uma populac¸a˜o sobre determinada doenc¸a. Para se ter essa avaliac¸a˜o, cada indiv´ıduo e´ submetido ao mesmo teste cl´ınico. Em um destes programas foram apurados os resultados que se seguem: Doenc¸a Positivo (A) Negativo (B) Total Presente (B) 950 50 1000 Ausente (B) 10 990 1000 Total 960 1040 2000 Calcular as probabilidades condicionais apropriadas e responder se este teste cl´ınico e´ apropriado e se o programa deve ou na˜o ser executado. Informa-se que: a) P (A|B): quanto maior, mais sens´ıvel sera´ o teste b) P (A|B): quanto menor, mais espec´ıfico sera´ o teste c) P (B|A): falsos positivos d) P (B|A): falsos negativos Observac¸a˜o: Por (a) e (b) ter-se-a´ a resposta a` primeira pergunta e por (c) e (d) a resposta a` segunda pergunta. Num laborato´rio, apo´s um experimentocom reac¸a˜o em cadeia de polimerase (PCR), foram obtidos dez tubos de ensaio, numerados de 1 a 10. Sabe-se que em treˆs deles a reac¸a˜o na˜o ocorreu como o esperado. 1) Considerando o experimento com reposic¸a˜o, e os evendos: A = o primeiro tubo conte´m reac¸a˜o que na˜o ocorreu como o esperado B = o segundo tubo conte´m reac¸a˜o que na˜o ocorreu como o esperado 52 1.1. A e B sa˜o independentes? 1.2. A e B sa˜o mutuamente exclusivos? 1.2. Determine P (A), P (B), P (A ⋂ B) e P (A ⋃ B) 2) Refac¸a o item (1) considerando o experimento com reposic¸a˜o. Cap´ıtulo 3 Varia´veis Aleato´rias 3.1 Definic¸a˜o Define-se uma varia´vel aleato´ria como uma func¸a˜o X, que associa a cada ele- mento s ∈ S um nu´mero real X(s), ou seja, associa valores nume´ricos aos resultados de um experimento. Exemplo 1: E: lanc¸amento de duas moedas X: nu´meros de caras obtidos nas duas moedas S = {(c, c); (c, k); (k, c); (k, k)} X = {0, 1, 2} 53 54 Assim, uma varia´vel aleato´ria tem domı´nio em S e contradomı´nio em <. Uma varia´vel aleato´ria pode ser: discreta ou cont´ınua. Sera´ discreta se o nu´mero poss´ıvel de valores de X (seu contradomı´nio) for finito ou infinito numera´vel. Sera´ cont´ınua se o seu contradomı´nio for um intervalo ou uma colec¸a˜o de intervalos. No exemplo, X e´ uma varia´vel discreta. 3.2 Varia´veis Aleato´rias Discretas 3.2.1 Func¸a˜o de Probabilidade A probabilidade de que a varia´vel aleato´ria X assuma o valor x, e´ a func¸a˜o de probabilidade de X representada por P (X = x) ou simplesmente P (x). A func¸a˜o P (X = x) determina a distribuic¸a˜o de probabilidades da varia´vel aleato´ria e deve satisfazer os axiomas: a) 0 6 P (xi) 6 1 b) ∑ i P (xi) = 1 No exemplo 1, tem-se a distribuic¸a˜o de probabilidade de X: X = x 0 1 2 P(X = x) 1 4 1 2 1 4 Graficamente x P(x) 0 1 2 1/4 1/2 Exemplo 2: E2 : lanc¸ar dois dados e observar a soma dos nu´meros obtidos. X = x 2 3 4 5 6 7 8 9 10 11 12 P(X = x) 1 36 2 36 3 36 4 36 5 36 6 36 5 36 4 36 3 36 2 36 1 36 55 Graficamente x P(x) 2 3 4 5 6 7 8 9 10 11 12 1/36 2/36 3/36 4/36 5/36 6/36 3.2.2 Func¸a˜o de Distribuic¸a˜o Acumulada Define-se Func¸a˜o de Distribuic¸a˜o Acumulada da varia´vel aleato´ria X, no ponto x, como sendo a probabilidade de que X assuma um valor menor do que ou igual a x, isto e´, F (x) = P (X 6 x) Propriedades: a) F (x) = ∑ xi6x P (xi) b) F (−∞) = 0 c) F (∞) = 1 d) P (a < X 6 b) = F (b)− F (a) e) P (a 6 X 6 b) = F (b)− F (a) + F (X = a) f) P (a < X < b) = F (b)− F (a)− F (X = b) No exemplo 1: X = x 0 1 2 P(X = x) 1 4 1 2 1 4 F(x) 1 4 3 4 1 Exemplo 3: E3: lanc¸ar um dado e observar o nu´mero da face superior X = x 1 2 3 4 5 6 P(X = x) 1 6 1 6 1 6 1 6 1 6 1 6 F(x) 1 6 2 6 3 6 4 6 5 6 6 6 56 x F(x) 1 2 1/4 3/4 1 x P(x ) 1 2 3 4 5 6 1/6 x F(x ) 1 2 3 4 5 6 1/6 2/6 3/6 4/6 5/6 1 3.3 Varia´vel Aleato´ria Cont´ınua Func¸a˜o Densidade de Probabilidade Seja X uma v.a. cont´ınua. A func¸a˜o densidade de probabilidade f(x) e´ uma func¸a˜o que satisfaz a`s seguintes condic¸o˜es: a) f(x) ≥ 0 b) ∫ R f(x)dx = 1 Ale´m disso, P (a < X < b) = ∫ b a f(x)dx Propriedades: a) P (X = x0) = ∫ x0 x0 f(x)dx = 0 b) P (a ≤ X ≤ b) = P (a ≤ X < b) = P (a < X ≤ b) = P (a < X < b) = ∫ b a f(x)dx 57 Verifica-se que f(x), densidade de probabilidade, na˜o e´ probabilidade. Somente quando a func¸a˜o for integrada entre dois limites, ela produzira´ uma probabilidade que sera´ a a´rea sob a curva da func¸a˜o entre x = a e x = b, para a < b. Exemplo 4 Seja X uma v.a.c. com func¸a˜o densidade de probabilidade (f.d.p) f(x) = 2x se 0 < x < 10 para outros valores f(x) e´ f.d.p., pois a) f(x) ≥ 0 b) ∫∞ −∞ f(x)dx = ∫ 1 0 2xdx = [x2]10 = 1 Exemplo 5 Uma v.a. tem a seguinte func¸a˜o densidade de probabilidade f(x) = 0 se x < 0 kx2 se 0 < x < 1 0 se x ≥ 1 Pede-se: a) Determinar k b) Fazer o gra´fico de f(x) c) Obter P (0 < X < 1 2 ) Soluc¸a˜o: a) k ∫ 1 0 x2dx = k [ x3 3 ]1 0 = k 3 = 1⇒ k = 3 ∴ f(x) = 3x2 para 0 < x < 1 58 b) c) P (0 < X < 1 2 ) = 3 ∫ 1 2 0 x2dx = 3 [ x3 3 ]1/2 0 = [ 1 2 ]3 = 1 8 3.4 Paraˆmetros De uma maneira geral, as distribuic¸o˜es teo´ricas podem ser caracterizadas por paraˆmetros ana´logos a`queles da estat´ıstica descritiva. 3.4.1 Esperanc¸a Matema´tica, Valor Esperado ou Me´dia de uma varia´vel aleato´ria Define-se esperanc¸a matema´tica de uma v.a.d. X, como µx = E(X) = ΣxiP (xi) e de uma v.a.c., como µx = E(X) = ∫ ∞ −∞ xf(x)dx. Exemplo 6: E1: lanc¸ar duas moedas X: nu´mero de caras xi 0 1 2 P (xi) 1 4 1 2 1 4 µx = 0 · 1 4 + 1 · 1 2 + 2 · 1 4 = 1 Espera-se que para um nu´mero grande de jogadas ocorra em me´dia uma cara. Exemplo 7: E1: lanc¸ar dois dados 59 X: soma dos nu´meros mostrados na face de cima xi 2 3 4 5 6 7 8 9 10 11 12 P (xi) 1 36 2 36 3 36 4 36 5 36 6 36 5 36 4 36 3 36 2 36 1 36 µx = 1 36 [2 + 6 + 12 + 20 + 30 + 42 + 40 + 36 + 30 + 22 + 12] = 252 36 = 7 Exemplo 8: f(x) = 2x, para 0 < x < 10, para outros valores µx = E(X) = ∫ 1 0 2x2dx = [ 2x3 3 ]1 0 = 2 3 Exemplo 9: f(x) = 3x2, para 0 < x < 10, para outros valores µx = E(X) = ∫ 1 0 3x3dx = [ 3x4 4 ]1 0 = 3 4 Propriedades da Me´dia (Esperanc¸a): 1. A me´dia de uma constante e´ a pro´pria constante. E(K) = ∑ i KP (xi) = K ∑ P (xi) = K E(K) = ∫ ∞ −∞ Kf(x)dx = K ∫ ∞ −∞ f(x)dx = K 2. Multiplicando-se uma v.a. X por uma constante, sua me´dia fica multipli- cada por essa constante. E(KX) = ∑ KxiP (xi) = K ∑ xiP (xi) = KE(X) E(KX) = ∫ ∞ −∞ Kxf(x)dx = K ∫ ∞ −∞ xf(x)dx = KE(X) 60 3. E(X ± Y ) = E(X)± E(Y ) 4. E(X ±K) = E(X)±K 5. E(X − µx) = E(X)− µx = 0 6. E(XY ) = E(X) · E(Y ) se X e Y forem independentes 3.4.2 Variaˆncia Define-se variaˆncia de uma v.a., como: σ2x = Var(X) = E[X − E(X)]2 logo σ2x = Var(X) = Σ(xi − µx)2P (xi) se X v.a.d. e σ2x = Var(X) = ∫ ∞ −∞ (x− µx)2f(x)dx se X v.a.c. Exemplo 10: E: Lanc¸ar duas moedas X: Nu´mero de caras E(X) = 1 Var(X) = (0− 1)2 · 1 4 + (1− 1)2 · 1 2 + (2− 1)2 · 1 4 = 1 2 Exemplo 11: f(x) = 2x, para 0 < x < 10, para outros valores 61 E(X) = 2 3 Var(X) = 2 ∫ 1 0 ( x− 2 3 )2 xdx = 2 ∫ 1 0 ( x2 − 4 3 x+ 4 9 ) xdx = 2 ∫ 1 0 ( x3 − 4 3 x2 + 4 9 x ) dx = 2 ( x4 4 − 4 3 · x 3 3 + 4 9 · x 2 2 )1 0 = 2 ( 1 4 − 4 9 + 4 18 ) = 2 ( 9− 16 + 8 36 ) = 1 18 Propriedades da Variaˆncia: 1) A variaˆncia de uma constante e´ zero. Var(K) = E{(K − E(K))2} = E[K −K] = 0 2) Multiplicando-se uma v.a por uma constante, sua variaˆncia fica multipli- cada pelo quadrado da constante. Var(KX) = E{[KX − E(KX)]2} = K2E{X − E(X)}2 = K2Var(X) 3) Somando-se ou subtraindo-se uma constante K a uma v.a., sua variaˆncia na˜o se altera. Var(X ±K) = E{[(X ±K)− E(X ±K)]2} = E{[X ±K − E(X)±K]2} = E{[X − E(X)]2} = Var(X) 4) Var(X) = E{[X − E(X)]2} = E{X2 − 2XE(X) + [E(X)]2} = E(X2)− 2[E(X)]2 + [E(X)]2 = E(X2)− [E(X)]2 Obs.: Em muitos casos essa propriedade facilita grandemente o ca´lculo da variaˆncia. Exerc´ıcios 62 1) Seja X uma v.a.c. com f.d.p f(x) = k(x+ 3),para 1 ≤ x ≤ 80, para outros valores de x Pede-se: a) Determinar k b) P (2 < X < 6) c) P (X ≤ 3) d) P (X ≥ 3) e) E(X) f) E(X2) g) σ2x 2) Considere a distribuic¸a˜o de probabilidade da v.a.d. X, em que X= nu´mero de pontos obtidos quando se lanc¸a um dado uma so´ vez. Pede-se: a) Gra´fico da func¸a˜o de probabilidade b) E(X) = µx c) E(X2) d) σ2x = E(X 2)− [E(X)]2 3) Sejam as varia´veis aleato´rias discretas: X = nu´mero de tubos cuja reac¸a˜o na˜o ocorreu como o esperado na amostra escolhida Y = nu´mero de tubos cuja reac¸a˜o ocorreu com sucesso na amostra escolhida 3.1. Determine as distribuic¸o˜es de probabilidade de X e Y, considerando o experi- mento com reposic¸a˜o e, em seguida, sem reposic¸a˜o. 3.2. Compare E[X] nos casos com e sem reposic¸a˜o. 3.3. Idem (3.2) para E[Y ], Var[X] e Var[Y ]. 63 3.4. Compare E[X] + E[Y ] com o tamanho da amostra retirada. (n = 2) 4) Sabendo-se que sob certas condic¸o˜es, o ciclo vital da praga A, que atua na cana-de-ac¸u´car, pode ser descrito por: f(x) = 6(x− x2), se x ∈ [0; 1]0, caso contra´rio 4.1. Verifique se f(x) pode ser estudada como uma func¸a˜o densidade de probabili- dades. 4.2. Esboce um gra´fico para f(x). 4.3. Determine E[X] e Var[X]. 4.4. Determine e identifique no gra´fico da func¸a˜o: a) P (0 < x < 1/4) b) P (1/4 < x < 3/4) c) P (x > 3/4). Cap´ıtulo 4 Distribuic¸o˜es de probabilidade 4.1 Definic¸a˜o Entre as varia´veis aleato´rias existem algumas que se destacam por sua im- portaˆncia quanto a` representatividade de grande parte de fenoˆmenos biolo´gicos. Assim, por exemplo, sabe-se que varia´veis como peso, altura, idade, etc teˆm distribuic¸a˜o normal de probabilidade enquanto que o nu´mero de sementes germi- nadas pode ter distribuic¸a˜o binomial; o nu´mero de insetos presos em uma armadilha luminosa e o nu´mero de reac¸o˜es nocivas motivadas pela injec¸a˜o de certo soro podem ter a distribuic¸a˜o de Poisson. Sa˜o estudadas, a seguir, algumas distribuic¸o˜es de v.a. mais utilizadas. Den- tre as v.a.d., sera˜o vistas: - Distribuic¸a˜o de Bernoulli - Distribuic¸a˜o Binomial - Distribuic¸a˜o Poisson Dentre as de v.a.c, podem ser consideradas: - Distribuic¸a˜o Normal - Distribuic¸a˜o de χ2-quadrado - Distribuic¸a˜o t de Student - Distribuic¸a˜o F de Snedecor 65 66 4.2 Distribuic¸a˜o de Bernoulli 4.2.1 Definic¸a˜o Um experimento de Bernoulli e´ aquele ao qual podem ser associados apenas dois resultados: sucesso (se acontecer o evento de interesse) ou fracasso (se na˜o acontecer o evento de interesse). Tem-se, enta˜o, uma v.a.d. X que assume valor 1 caso ocorra o evento A (sucesso) e o valor 0 caso na˜o ocorra (insucesso ou fracasso), com probabilidades, respectivamente, p = P (X = 1) e q = 1 − p = P (X = 0), isto e´, a distribuic¸a˜o de probabilidade de X e´ X = x x1 = 0 x2 = 1 P (X = x) q = 1− p p sendo que q + p = 1− p− p = 1. Exemplos: E1: Planta-se uma semente de feija˜o A: a semente germina com probabilidade p A¯: a semente na˜o germina com probabilidade 1− p E2: Lanc¸a-se um dado honesto e observa-se o valor da face voltada para cima A: virar face 3, x2 = 1 e P(X = x2) = 1 6 A¯: virar face diferente de 3, x1 = 0 e P(X = x1) = 5 6 . Observa-se que no experimento E1 a probabilidade “p” na˜o e´ conhecida “a priori”. Em alguns casos desse tipo, obteˆm-se informac¸o˜es sobre estimativas de “p” em reviso˜es de bibliografia ou estima-se “p” experimentalmente. 4.2.2 Me´dia, Variaˆncia e Desvio-Padra˜o Sa˜o obtidos por 67 µx = µ = E(X) = Σ 2 i=1xiP (xi) = 0 · q + 1 · p = p σ2 = Var(X) = E[X − E(X)]2 = E(X2)− [E(X)]2 E(X2) = Σ2i=1x 2 iP (xi) = 0 2 · q + 12 · p = p σ2 = p− p2 = p(1− p) = p · q σx = √ σ2x = √ pq. Em E2 tem-se µx = 0. 5 6 + 1. 1 6 = 1 6 σ2x = ( 0− 1 6 )2 . 5 6 + ( 1− 1 6 )2 . 1 6 = 1 6 ( 1− 1 6 )2 = 5 36 σx = √ 5 36 = √ 5 6 4.3 Distribuic¸a˜o Binomial 4.3.1 Definic¸a˜o Seja uma sequeˆncia de n ensaios independentes e repetidos de Bernoulli. Enta˜o se a v.a. X representa o nu´mero de sucessos nesses n ensaios, diz-se que X tem distribuic¸a˜o binomial de probabilidades com paraˆmetros n e p e com func¸a˜o de probabilidade dada por: P (X = x) = Cxnp xqn−x Veˆ-se que P (X = x) e´ f.d.p., pois a) P (X = x) ≥ 0,∀x b) ∑ P (X = x) = n∑ x=0 Cxnp xqn−x = C0np 0qn + C1np 1qn−1 + . . .+ Cnnp nq0 = (p+ q)n = 1 Exemplo: Um recipiente conte´m um grande nu´mero de sementes de feija˜o para as quais o fornecedor garante um poder de germinac¸a˜o de 0,8. Se 5 dessas sementes sa˜o plantadas, determine: 68 a) A distribuic¸a˜o de probabilidades para a varia´vel X: nu´meros de sementes germinadas. Distribuic¸a˜o de Probabilidade de X X = xi P (X = xi) P (X = xi) 0 0,00032 P (0) = C50 (0, 8) 0(0, 2)5 1 0,00640 P (1) = C51 (0, 8) 1(0, 2)4 2 0,05120 P (2) = C52 (0, 8) 2(0, 2)3 3 0,20480 P (3) = C53 (0, 8) 3(0, 2)2 4 0,40960 P (4) = C54 (0, 8) 4(0, 2)1 5 0,32768 P (5) = C55 (0, 8) 5(0, 2)0 b) A probabilidade de que germinem no ma´ximo 4 sementes. P [X ≤ 4] = P (0) + P (1) + P (2) + P (3) + P (4) = 0, 67232 ou P [X ≤ 4] = 1− P (X = 5) = 1− 0, 32768 = 0, 67232. 4.3.2 Me´dia, Variaˆncia e Desvio-Padra˜o Como X v.a.d. binomial nada mais e´ do que a soma de n varia´veis indepen- dentes do tipo Bernoulli, tem-se: µx = µ = E(X) = ΣxP (X = x) = np σ2 = E[X − E(X)]2 = E(X2)− [E(X)]2 = npq σx = √ σ2x = √ npq No exemplo dado µx = 5 · 0, 8 = 4 germinac¸o˜es σ2x = 5 · 0, 8 · 0, 2 = 0, 8 germinac¸o˜es ao quadrado σx = √ 0, 8 = 0, 894 germinac¸o˜es. 69 No mesmo exemplo, ainda suponha que o agricultor precisa obter 100 mudas. Qual o nu´mero mı´nimo de sementes que ele deve plantar? Qual a variabilidade do nu´mero de sementes germinadas? µ = np⇒ 100 = n · 0, 8⇒ n = 125 σ2x = npq = 125 · 0, 8 · 0, 2 = 20 σx = 4, 47 ' 5 Exerc´ıcios 1) Certo tratamento quando aplicado a bovinos com certa enfermidade cura 60% dos casos. Tendo dois bovinos sob esse tratamento, qual a probabilidade: a) de que os dois morram b) de que os dois sejam curados c) de que um seja curado e o outro na˜o. Qual o nu´mero me´dio de curas e qual sua variabilidade? Distribuic¸a˜o de Probabilidade de X X = xi 0 1 2 P (X = xi) 0,16 0,48 0,36 em que X: nu´mero de sobreviventes, p = 0, 6, q = 1− 0, 6 = 0, 4 e n = 2. Soluc¸a˜o: a) P (X = 0) = C02 (0, 6) 0(0, 4)2 = 0, 16 b) P (X = 2) = C22 (0, 6) 2(0, 4)1 = 0, 48 c) P (X = 1) = C12 (0, 6) 1(0, 4)1 = 0, 36 µ = np = 2 · 0, 6 = 1, 2 curas σ2 = npq = 2 · 0, 6 · 0, 4 = 0, 48 curas2 σ = √ 0, 48 = 0, 6928 curas. 70 2) Certa doenc¸a dada em pintos tem uma fatalidade de 30%. Em 6 casos dessa doenc¸a, estabelec¸a a distribuic¸a˜o de probabilidade da v.a X: nu´mero de sobreviventes Baseado nessa distribuic¸a˜o, calcule: a) a probabilidade de que todos sobrevivam b) a probabilidade de que nenhum sobreviva c) a probabilidade de que os dois sobrevivam d) a probabilidade de que pelo menos dois sobrevivam e) a probabilidade de que no mı´nimo quatro morram f) o nu´mero me´dio de sobreviventes g) a variaˆncia e o desvio-padra˜o do nu´mero de sobreviventes. h) Se um produtor de frangos quer obter no final de um determinado per´ıodo 150 frangos, baseado na incideˆncia dessa doenc¸a, qual o nu´mero mı´nimo de pintos que ele deve comprar? Qual a variabilidade desse nu´mero? Distribuic¸a˜o de Probabilidade de X X = xi 0 1 2 3 4 5 6 P (X = xi) 0,00073 0,01021 0,05954 0,18522 0,32414 0,30253 0,11764 p = 0, 7 q = 0, 3 n = 6 Soluc¸a˜o: a) P (X = 6) = 0, 11764 b) P (X = 0) = 0, 00073 c) P (X = 2) = 0, 05954 d) P(X ≥ 2) = 1− P (X = 0)− P (X = 1) = 0, 98906 e) P (X ≤ 2) = P (X = 0) + P (X = 1) + P (X = 2) = 0, 07048 f) µ = np = 6 · 0, 7 = 4, 2 g) σ2 = npq = 6 · 0, 7 · 0, 3 = 1, 26 σ = √1, 26 = 1, 12 h) 150 = n · 0, 7⇒ n = 214 frangos σ2 = npq = 214 · 0, 7 · 0, 3 = 45⇒ σ = 6, 7. 71 4.4 Distribuic¸a˜o de Poisson 4.4.1 Definic¸a˜o Existem experimentos, nos quais o nu´mero de sucessos e´ conhecido ou facil- mente determina´vel mas o nu´mero de insucessos na˜o pode ser determinado. E´ o que acontece quando se tem interesse no nu´mero de insetos presos em uma armadilha luminosa ou no nu´mero de a´caros que atacam determinada cultura ou no nu´mero de brotos por explante. SeX e´ a varia´vel aleato´ria discreta tal que sua distribuic¸a˜o de probabilidades e´ do tipo P (X = x) = λxe−λ x! , x = 0, 1, 2, . . . , λ > 0 enta˜o, X tem distribuic¸a˜o de Poisson com paraˆmetro λ (λ e´ o nu´mero me´dio de sucessos). Verifica-se que P (X = x) representa uma leg´ıtima distribuic¸a˜o de proba- bilidade, pois: a) P (X = x) ≥ 0, ∀x b) ∑∞ x=0 λxe−λ x! = e−λ ∞∑ x=0 λx x! = e−λ [ 1+ 1 1! λ+ 1 2! λ2+ 1 3! λ3+. . . ] = e−λeλ = 1. 4.4.2 Me´dia, Variaˆncia e Desvio-padra˜o Sa˜o obtidos por: µX = E(X) = ∞∑ x=0 x λxe−λ x! = e−λ ∞∑ x=1 x λx−1λ x(x− 1)! = e −λ ∞∑ x=1 λx−1 (x− 1)! .λ = e −λ.eλ.λ = λ σ2X = E(X 2)− [E(X)]2 E(X2) = ∞∑ x=0 x2 e−λλx x! = ∞∑ x=1 x2 e−λλx x! = ∞∑ x=1 x e−λλx (x− 1)! = ∞∑ x=1 (x− 1 + 1) e −λλx (x− 1)! = ∞∑ x=1 e−λλx (x− 1)! + ∞∑ x=1 (x− 1) e −λλx (x− 1)! = λ+ ∞∑ x=2 x e−λλx (x− 2)! = λ+ λ 2 σ2X = λ+ λ 2 − λ2 = λ σX = √ σ2X = √ λ. 72 Exemplo: Em um determinado hospital veterina´rio existem em me´dia 3 diagno´sticos de ca˜es raivosos. Qual a probabilidade de que ocorram 2 diagno´sticos no pro´ximo meˆs? P (X = 2) = 32.e−3 2! = 0, 2240. 4.4.3 Relac¸a˜o entre as distribuic¸o˜es Binomial e de Poisson Na distribuic¸a˜o Binomial se n e´ grande, mas a probabilidade p de ocorreˆncia de um evento e´ proxima de zero, de modo que q = 1− p, e´ pro´ximo de 1, o evento se diz um evento raro. Na pra´tica, considera-se como raro um evento em que o nu´mero de provas e´ no mı´nimo 50 e np e´ menor do que 5. Em tais casos, a distribuic¸a˜o binomial e´ muito bem aproximada pela distribuic¸a˜o de Poisson com λ = np. Tal resultado ja´ era de se esperar pois, fazendo λ = npn tem-se pn = λ n e se λ e´ pequeno e n tende para infinito, enta˜o, p→ 0 e q → 1. Considerando-se a func¸a˜o de distribuic¸a˜o de probabilidade da varia´vel aleato´ria discreta X binomial P (X = x) = Cxnp xqn−x = n! x!(n− x)!p x(1− p)n−x = n(n− 1)(n− 2) . . . (n− x+ 1) x! px(1− p)n−x e, fazendo-se p = λ n , tem-se: P (X = x) = n(n− 1)(n− 2) . . . (n− x+ 1) x! ( λ n )x( 1− λ n )n−x = n(n− 1)(n− 2) . . . (n− x+ 1) nx λx x! ( 1− λ n )n( 1− λ n )−x = 1 ( 1− 1 n )( 1− 2 n ) . . . ( 1− x− 1 n ) λx x! ( 1− λ n )n( 1− λ n )−x Quando n→∞, enquanto x e λ permanecem constantes, tem-se: limn→∞ 1 ( 1− 1 n )( 1− 2 n ) . . . ( 1− x− 1 n ) = 1, 73 limn→∞ ( 1− λ x )n = 1 e limn→∞ ( 1− λ n )n = e−λ. Portanto, sob as condic¸o˜es limites dadas, tem-se: B(X;n, p)⇒ e −λλx x! , para X = 0, 1, 2, . . ., isto e´, lim n→∞ P (x = x) = e−λλx x! que e´ a func¸a˜o densidade de probabilidade de uma varia´vel aleato´ria discreta com distribuic¸a˜o de Poisson. Exemplo: A probabilidade de um indiv´ıduo sofrer uma reac¸a˜o nociva resultante da aplicac¸a˜o de uma determinada vacina e´ 0,001. Determinar a probabilidade de entre 2000 indiv´ıduos: a)Nenhum sofrer reac¸a˜o b) Mais do que 2 sofrerem a reac¸a˜o Soluc¸a˜o a) Por Poisson λ = np = 2000.0, 001 = 2 P (X = 0) = e−2 20 0! = 1 e2 = 0, 1353 Pela Binomial P (X = 0) = C02000(0, 001) 0(0.999)2000 = 0, 1353 b) Por Poisson P (X > 2) = 1− e−22 0 0! − e−22 1 1! − e−22 2 2! = 1− 0, 1353− 0, 2706 = 0, 3235 Pela Binomial 74 P (X = 1) = C12000(0, 001) 1(0.999)1999 = 0, 2707 P (X = 2) = C22000(0, 001) 1(0.999)1998 = 0, 2708 P (X > 2) = 1− 0, 1352− 0, 2707− 0, 2708 = 0, 3233. 4.5 Distribuic¸a˜o Normal 4.5.1 Introduc¸a˜o A distribuic¸a˜o normal tem sido considerada como a mais importante das distribuic¸o˜es de varia´vel aleato´ria cont´ınua e, e´ ba´sica para o desenvolvimento de testes estat´ısticos tais como, o teste “t”, o teste “F” e o teste “χ2” e outros. Dentro do campo de Cieˆncias sa˜o consideradas varia´veis normalmente dis- tribu´ıdas as varia´veis: altura, peso, idade, produc¸a˜o, total de leite, quantidade de rac¸a˜o consumida, diaˆmetro a` altura do peito, biomassa, etc. A equac¸a˜o matema´tica da curva normal foi desenvolvida por De Moivre em 1773 e, posteriormente, Gauss (1775-1855) tambe´m obteve a equac¸a˜o de um estudo de erros em medidas repetidas da mesma varia´vel, e devido a ele, ela e´ chamada tambe´m distribuic¸a˜o de Gauss. 4.5.2 Definic¸a˜o Uma varia´vel aleato´ria cont´ınua X tem distribuic¸a˜o normal se sua func¸a˜o densidade de probabilidade for dada por: f(x) = 1 σ √ 2pi e − (x− µ)2 2σ2 ,−∞ < x <∞ em que µ e σ sa˜o paraˆmetros que devem satisfazer a`s condic¸o˜es −∞ < x < ∞ e σ > 0. Ale´m disso, sera´ provado que µ e σ correspondem, respectivamente, a` me´dia e ao desvio-padra˜o da distribuic¸a˜o, e enta˜o, representa-se X ∼ N(µ, σ2). Como f(x) e´ uma func¸a˜o densidade de probabilidade, enta˜o, a)f(x) ≥ 0, ∀x, pois 1 σ √ 2pi > 0 e e − (x− µ)2 2σ2 > 0 75 b) ∫∞ −∞ f(x)dx = 1 Prova: ∫ ∞ −∞ f(x)dx = 1 σ √ 2pi ∫ ∞ −∞ e − (x− µ)2 2σ2 dx, fazendo-se x− µ σ = z ⇒ dx = σdz, quando x → ∞ ⇒ z → ∞ e x → −∞ ⇒ z → −∞. Logo, ∫ ∞ −∞ f(x)dx = 1 σ √ 2pi ∫ ∞ −∞ e − z2 2 σdz = 1√ 2pi ∫ ∞ −∞ e − z2 2 dz e como g(z) = e − z2 2 e´ uma func¸a˜o par, pois g(z) = g(−z), tem-se: ∫ ∞ −∞ f(x)dx = 1√ 2pi 2 ∫ ∞ 0 e− z2 2 dz. Fazendo-se z2 2 = t ⇒ 2zdz 2 = dt ⇒ dz = t −1/2 √ 2 dt, quando z = 0 ⇒ t = 0 e z →∞⇒ t→∞. Logo,∫ ∞ −∞ f(x)dx = 1√ 2pi 2√ 2 ∫ ∞ 0 t−1/2e−tdt = 1√ pi ∫ ∞ 0 t−1/2e−tdt = 1√ pi Γ( 1 2 ) = 1√ pi √ pi = 1 pois Γ(α+ 1) = ∫∞ 0 xαe−xdx. Portanto,∫ ∞ −∞ f(x)dx = 1. 4.5.3 Paraˆmetros: me´dia, variaˆncia e desvio-padra˜o Se X e´ uma v.a.c. com distribuic¸a˜o normal de paraˆmetros µ e σ, isto e´, X ∼ N(µ, σ2), enta˜o, X tem como me´dia µ e como variaˆncia σ2. Demonstrac¸a˜o: a) E(X) = 1 σ √ 2pi ∫ ∞ −∞ xe − (x− µ)2 2σ2 dx 76 Fazendo-se x− µ σ = z ⇒ x = σz + µ ⇒ dx = σdz, quando x → ∞ ⇒ z →∞ e x→ −∞⇒ z → −∞. Enta˜o, E(X) = 1 σ √ 2pi ∫ ∞ −∞ (σz + µ)e − z2 2 σdz = σ 1√ 2pi ∫ ∞ −∞ ze − z2 2 dz + µ 1√ 2pi ∫ ∞ −∞ e − z2 2 dz. Mas, ∫∞ −∞ ze − z2 2 dz = 0, pois g(z) = ze − z2 2 e´ func¸a˜o ı´mpar, isto e´, g(z) = −g(−z) e 1√ 2pi ∫ ∞ −∞ e − z2 2 dz = 1. Logo, E(X) = µ. b) µ2 = E[(X − µ)2] = 1 σ √ 2pi ∫ ∞ −∞ (x− µ)2e− (x− µ)2 2σ2 dx Fazendo-se x− µ σ = z ⇒ x − µ = σz ⇒ dx = σdz, quando x → ∞ ⇒ z → ∞ e x→ −∞⇒ z → −∞. Logo, E[(X − µ)2] = 1 σ √ 2pi ∫ ∞ −∞ σ2z2e − z2 2 σdz = σ2√ 2pi ∫ ∞ −∞ z2e − z2 2 dz = 2σ2√ 2pi ∫ ∞ 0 z2e − z2 2 dz pois, g(z) = z2e − z2 2 e´ func¸a˜o par, isto e´, g(z) = g(−z). Fazendo-se z2 2 = t⇒ z = √ 2t1/2 ⇒ dz = √ 2 1 2 t−1/2dt = 1√ 2 t−1/2dt, quando z = 0⇒ t = 0 e z →∞⇒ t→∞. Logo, E[(X − µ)2] = 2σ 2 √ 2pi ∫ ∞ 0
Compartilhar