Prévia do material em texto
D D VOLUME ÚNICO © 2010 by Luiz Gonzaga Morettin Todos os direitos reservados. Nenhuma parte desta publicação poderá ser reproduzida ou transmitida de qualquer 111odo ou por qualquer outro m.eio, eletrônico ou mecânico, ii1cluindo fotocópia, gravação ou qualquer outro tipo de sistema de arn1azenatnento e transmissão de info11T1ação, se1n prévia autorização, por escrito, da Pearson Education do Brasil. .Diretor editorial: Roger Triroer Gerente editorial: Sabrina Cairo Supervisor de produção editorial: Marcelo Françozo Editora: Theln1a Babaoka Preparação: Arlete Sousa Zebber • Revisão: Erica Alvi1n Capa: Alexandre Mieda Projeto gráfico e diagrarnação: ERJ Composição Editorial Dados Internacionais de Catalogação na Publicação (CIP) (Câmara Brasileira do Livro, SP, Brasil) Morettin, Luiz Gonzaga Estatística básica : probabilidade e inferência, volume único I Luiz Gonzaga Morettin. -- São Paulo : Pearson Prentice Hall, 201 O. Bibliografia ISBN 978-85-7605-370-5 1. Estatística - Estudo e ensino 1. Título. 09-09445 CDD-519.507 Índ ice para catálogo sistemático: 1. Estatistica : Estudo e ensino 519 .507 I ª reimpressão - julho 20 1 O Direitos exclusivos para a língua po1tuguesa cedidos à Pearson Education do Brasil Ltda., wna e1npresa do grupo Pearson Education Rua Nelson Francisco, 26 CEP: 02712-100 - São Paulo - SP Tel. : (11) 2178-8686 Fax: ( 11) 2178-8688 e-mail: vendas@pearson.co1n Sumário Parte 1 - Probabilidade .............................................................. . 1 1. Espaço amostral ..................................................................................................... 3 1 . 1 1.2 1.3 1.4 1.5 l nt1·odt1ção .................. .......................................................................................................... ·3 Espaço an1os11·al .................... ......................................................................... .............. ........ 4 eve11tos aleat61·ios ............................................................................................... 6 co1n eventos aleat61·ios .. ............ ...................... ........ .... ..... ........ ............. ........ ..... 6 1.6 Partição de um espaço amostral .. .... .... .... ........ ..... ............. ........ .... ..................... ............. ... 1 O Exercícios propostos ............................... ..... .... .......................... ............ .... ...................... ........... 1 O 2. 2. l 2.2 2.3 2.4 2.5 Probabilidade ................................................................................................ ........ 12 Função de probabi 1 idade ............. ... ......... ........ ..... ........ ..... .... ........ ..... ... ..... ..... ... ..... ........... 12 Teore1n.as ....... .... ............. ... ..... ..... ................ ......... ........ ............. ......... ............. ........ ........ ... J 2 Eventos equiprováveis ................... ..... .... ................. ............ .............................................. 15 Probabilidade condicional. ................. ................................................................ ......... ....... 19 Eventos independentes ............................................................................................ ........... 22 Exe.rcíc.ic.) 1·esolvido .......................................................................................................... ........... 23 2.6 Teorerna de Bayes .............................................................................................................. 24 Exercícios 1·esol vi dos ......... ........ ...... .... ............ ........ ......... .... .... ..... ........ ..... ........ ..... ... ..... ..... ... ... 28 Exercícios propostos .. .. .. ......... ............. ................ ......... ........ ................. .. ... ............. ... ......... ....... 38 3. 3. l 3.2 3.3 3.4 3.5 ·variáveis aleatórias discretas ............................................................................... 45 Definições .................................. .......................... ..... ........................ ......... ..... .... ............ ... 45 Esperança 111aten1ática ................. ....................................................................................... 48 Vai·iânci<.1 ........ ... ..... ......... ............. ........ ........ ................. ..... ................. ... ......... .... ......... ....... 52 Distribuição conjunta de duas variáveis aleatórias ...... ... .. ........ .... ..... ........ ..... ... ..... ........ ... 57 Função de distribuição ........... .. ... ........ .. .. ........ .............. .. .. ... ..... ............ ..... .... .... .. ... .. .. .... ... 70 Exe1·cícios 1·esol vi dos ................. ................................... .............................................................. 73 Exercícios propostos .. ..................... ................. ........ .................. ............ .......................... ........ ... 86 4. 4. 1 4.2 4.3 Distribuições teóricas de probabilidades de variáveis aleatórias discretas ...... 92 Distribuição de Bernoulli .. .......... ....... .................. ........ .... .... ..... ............. ......... ........ .. ... ...... 92 Disr.r·i bL1ição geo1nétJ·ica ..................................................................................................... 93 Distribuição de Pascal ........................................................................................................ 96 v 111 Estatística Básica 4. 4 Distribuição h i pergeotnétrica ... ..... ... .. .... .... .... ..................... .. .................... .... .... ............. .... 97 4.5 Dist1·ibuição binomial ....... ..... ... ... .. ..... .... .. .. .. .. .......................... .... .. ... ......... ... .. .. .... .. ... .. .. .. .. 99 4.6 Distribuição polinon1ial ou multinomial .... .... .... ......... .. .. .... ..... ......... ........ .... ................. .. 103 4.7 Distribuição de Poisson ........................... .......................................................... ............... 105 Exercícios resolvidos .................................. ........................................................................... ... 109 Exercícios p.ro·postos ..... .... .... ......... ........ ... ...... ................ .............................. ..... .... ............. .. .... l20 5. Variáveis aleatórias contínuas ...................................... ..................................... 125 5 .1 Definições ........................................................................................................................ 125 5.2 Principais distribuições teóricas de probabilidades de variáveis aleatórias contínuas ..... 131 Exercícios resolvidos ................................ ....................................... .................................. ..... .. 146 Exercícios p1·opostos ......... ................................................................................................ ........ 157 6. Aplicações da d.istribuição normal ........................................................ ............ 161 6.1 Distribuições de funções de variáveis aleatórias nonnais ................................................ 161 6.2 Aproxitnação da distribuição bino1njal pela distribuição normal .................................. .. 166 Exercícios resolvidos ............................. ..... ......................... .. .. .... .............................. ......... .... .. 169 Exercícios propostos ......... .............................. .... .... ..... ... ..... .... .... ... .. .... ........ ..... .... ................. .. 177 Parte 2 - Inferência ................................................................. 181 7. Amostragem ........................................................................................................183 7.1 Co11ceitos .......................................................................................................................... l83 7 .2 Tipos de amostragetn .. .................. ................................................................................... 185 8. Análise exploratória dos dados de uma amostra ............................................. 189 8.1 Conceitos ....................................... ..... ............................. .... ........................... .. .......... ...... 189 Exercício resolvido ........................ .............................................. .... ........... .. ............................ 200 Exercícios p1·opostos .............................................................................................. ................... 204 9. Distribuição amostral dos estimadores ............................................................. 206 9 .1 Distribuição an1ostral da 1nédia ........................................................................................ 206 9 .2 Distribuição amostral das proporções ........................ ...................................................... 215 Exercícios resolvidos ........................................................................ ........................................ 217 Exercíci.os p1·opostos ......... .... .... .............................. ........ ..... .. ... ... ... .................................... ...... 218 1 O. E.stimação .. ........................................................................................................ 219 10.1 I11 l:erê11cja estatística ....................................................................................................... 219 10.2 Estin1ação de parâtnetros ......... ........ ............ .................. ........ ....... ................................. 219 10.3 Tipos de estimação ...................... ..... .. .. ............ ......... .. .. .... ... ..... .................. .... ... ...... .. .. .. 220 11. Intervalos de confiança para médias e proporções ........................................ 225 11. L Inlervalos de confiança (IC) para a médiaµ de u1na população nom1al com ''at·iância d conl1ecida ......... .. ...... ... .. .... .... ................. ........ ..... ......................... ..... ........ .. 225 11.2 Intervalos de confiança para grandes amostras ........... .. .... ..... ......................... ............. .. 229 Exercícios resoJ vi dos ........ ........ ..... ........ ................. ...................................... ...................... ...... 234 Exerc_íc.i<.)S prop<.)Stos ................................................................ .... ............................................. 237 12. Testes de hipóteses para médias e proporções ............................................... 240 12. l I nt1·odução ..... ................................................................................................................. 240 12.2 Testes de hipóteses para a n1édia de populações nonnais cotn variâncias (a2) conhecidas ... 241 12.3 Testes de hipóteses para proporções ............................. .... ......... ......................... ..... .. .. .. 245 Sumário 1x Exercícios r·esol vi dos .............. ........ .... ......... ........ ......... ............. ........ .... ............. ............. ..... ... . 247 Exe1·cícios propostos ............... ........ ..... ................ ... ... ... .. .... .. ... .. ........ ......... ........ ............. ..... ... . 253 13. Erros de decisão ................................................................................................ 25 5 13 .1 Probabilidade de con1eter os etTOS dos tipos 1 e n ........................................................................... 255 13.2 Função poder de u1n teste ou potência de u1n teste ................. ......................... .. ... ......... 257 Exercícios p1,opostos .. .... .... ..... ........ ..... ........ ..... ... ......... ..................... ................. ........ ............. . 265 14. Distribuição de t de student IC e TH para a média de população normal com variância desconhecida .................................................................................... 266 14. l Distribuição de t de Studenl. ..... ........ .... ............. ........ ........ ..... ............................. .......... 266 14.2 IC e TH para a médiaµ de uma população norn1al com cl desconhecida .... ............ ..... 268 Exe1·cícios p1·opc.)sto.s 1 ............ ... ..... .. ... ... ..... .... ... ..... ..... ..... ... ..... ... ..... .... ..... ... ..... ....... ...... .... .... . 273 14.3 Rest1mo: IC e TH pa.ra µ ................................................................................................ 214 Exer·cícios p1·oposLos 2 .............. ...... .... ......... ........ ................. ..... ................. ........ .... .... ..... ......... 275 15. Comparação de duas médias: TH para a diferença de duas médias ........... 277 15.1 Dados e1nparelhados ............ ..... .. ....................... ......................... ................. ......... ........ . 277 15.2 Dados não empa1·eJhados ..... ..... ................ ......... ........ ..... ........ ......... ........ ............. ..... ... . 279 Exe1·cícios pr·opostos .. ............. ........................................................... .... ..... ........ .................. ... . 2.87 16. Distribuição deX2 (qui-quadrado), IC e TH para a variância de populações ll()flllélÍ~ .......... .. ............................................................ . ..................................... ~5)() 16.l Distribuição deX2 (qui-quadrado) ......... .... .... ............................................... .... ..... ........ . 290 16.2 IC e TH para a variância cl de un1a população normal com rnédia µ conhecida ...... ... .. 297 16.3 IC e TH para a a2 de população no1mal comµ desconhecida .................. ..... ....... ......... . 300 Exe.rcíc.ios 1·esolvidos ......... ...................... .............................................................. ............ .. .... . 302 Exe1·cícios p1·op·ost.os .. ........ ..... ........ ..... ................ ......... ........ .... .................. .......................... .... 306 16.4 Resu·mo ............... ................. ..... ........ .... ................. .... .... ......... .... ..... ........ ........ ..... ..... ... . 307 17. Testes de aderência e tabelas de contingência ................................................ 308 17 .1 Testes de aderência ............... ........ ......... ...................................... ................................... 308 17 .2 Tabelas de contingência ....... .... ..... .................................. ........ ........ ...................... ........ . 311 Exercícios re,sol vi dos .............. ........ ..... ................ .............................. .... ..... ........ ........ ..... ..... ... . 313 Exercícios propostos .. ..................... .... ......... .... ............. .............................. ........ ......... .... ........ . 320 18. Distribuição de F de Fisher-Snedecor, IC e TH para quociente de variâncias ...... 323 L8.J Distribuição F de Fisher-Snedecor ... .... .......................... ........ ......... ............. ... ..... ........ . 323 1.8.2 Intervalos de confiança para um quociente de variâncias ........... ..................... ..... .... .... . 326 18.3 Testes de hipóteses para quociente de variâncias .. ...................... ................................... 330 Exercícios propostos ............... ... .......... ... ......... ............. ........ ..... ... ...................... .... .... ..... ........ . 332 18.4 Resum.o ................... ..... ..................... .............................. ....... ...................... .................. 333 Tabelas .................................................................................335 Tabelas de distribuiçõe.s .......................................................................... .................. 337 ~~SJJC>~télS . . ....... . ... . ........ .... . ... .... .... . ... . ... . .... .... .... . ... . .... ... .... . .... . .. .. ... . ..... .. . ... . .... ... . ... .. .. ~~'7 Referências bibliográ.ficas ......................................................................................... 374 Sobre o autor ,,,,, .... ,.,, ........ , ............ .. , .. , .................. , .. , ......................... , ...................... 376 Prefácio Este livro é resultado de experiências vividas a partir de 1967, priineiro no Colé- gio de Aplicação Fidelino de Figueiredo da Faculdade de Filosofia, Ciências e Letras (FFCL-USP), depois no Departamento de Estatística do instituto de Matemática e Esta- tística (CME-USP), na Faculdade de Econornia São Luís, na Escola de Admin istração de En1presas de São Paulo da Fundação Getulio Vargas (FGV), na Faculdade de Engenha- ria Industrial (FEI) e, por fim, na Pontificia Universidade Católica de São .Paulo (PUC- SP). Além disso, seu conteúdo foi testado em cursos de especialização para professores de 1natemática, sendo apresentado como un1 modo didático de ensinar estatística. Essa so1na de cursos e experiências mostrou que a rnelhor fonna de apresentar a n1atéria consiste em expor os assuntos para o caso discreto, em que os conceitos são mais facihnente assimiláveis pelos alunos, passando a seguir para o caso contínuo, en1 que esses mesmos conceitos ficam sedirnentados. Nesta edição, essa fór1nula pode ser vista e comprovada, ben1 con10 é reforçada pelo fato de o livro agora reunir os dois volun1es anteriores. De fato, con1 essa rnudança, a obra ganha não apenas em aspectos gráficos, mas principalrnente em didática. O sistema de ensino/aprendizagem En1 grande parte do livro, os conceitos são apresentados por nleio de problemas e so1nente depois são definidos. São apresentados também exemplos de aplicação, be1n co1no exercícios resolvidos e propostos para cada assunto abordado. No final do livro, pode1n ser encontradas as tabelas das distribuições normal, de Poisson, binon1ial, t de Student, X2 de qui-quadrado e .F de Fisher-Snedecor. xu Estatlstica Básica U1n ponto importante: por todo o livro, são usados os 1nais diversos recursos para apoiar o processo de ensino/aprendizagen1, ajudando o professor en1 sala de aula e o estudante e1n sua busca por conhecimento. Esses recursos podem ser vistos nas seções . a seguir. Destaques As principais definições CD da área da estatística e os exemplos-chave @ para ilustrar a teoria estão destacados ao longo do texto para aumentar o entenditnento do estudante e contribuir para a didática do livro. CD ~- @-- 2.5 Eventos independentes Sejam A C fieB C fi. Intuitivamente, se A e B são independentes, P(AIB) = P(A) e P( BIA) = P(B). OEFINIÇÁO A ê 13 s.~o eventos indêpêndentc.s se P(A f"l 8) = P(A)' P(8). L.1nça111-se 3 moedas. Yeri6c.1r se são independentes os evelllos: A: s.1ícL1 de cara na I" moe<L1; B: saí<L1 de coroa 11a 2 ~ e 3" n1oed1s. As fórmulas@ rnais irnportantes estão en1 destaque para auxi liar na aprendizagem do estudante. Distribuição de Poisson Consideremos a probabilidade de ocorrência de sucessos em um determinado intcn'31o. A probabilidade da ocon·ência de um sucesso no intervalo é proporcional ao inter- ''ª'º· J\ probabilidade de 111ais de unJ sucesso nesse inten.1alo é bastante pequena co1n relação à probabilidade de um sucesso. Seja X o 1r1ín1ero <fe s11cessos 110 i111en·alo. en1<1o: @-·1------ P(X=k)= e-' ·)! k! Prefácio xiii Exercícios resolvidos São apresentados diversos exercícios resolvidos dos 1nais variados níveis de dificuldade, co1n sua resolução passo a passo, para auxiliar no desenvolvimento lógico do estudante. Exercícios resolvidos 1. De wna população nonnal com o'= 16, levantou-se uma ainosu·a, obtend<>-se as obser- \raç.ões: 10, 5, JO, 7. Deten11inar ao nível de 13% u111 JC _para a tllédia cL1 popt1laçâo. Resolução: Dados: 11 = 4 o'= 16 a = 13% x = .!. (10 + 5 + 10 + 7)=> x = 8 4 -.Z. : ,, ;;;;; :1),S'(> ;;;;; I, 5 J 87% : . 1'(8 - 1,51 ·2 < 1< < 8 + 1,5 1 · 2) • 0.87 />(8 - 3,02 <1t < 8 + 3,02) = 0,87 P(4,98 <11 < 11 ,02) = 0,87 ou IC(/1, 87%) = (4,98; ll,02) Exercícios propostos .z. z Q = 2 , Vários exercícios propostos, ta1nbém de diferentes níveis de dificuldade, são apre- sentados para que o estuda11te aplique a teoria na prática, aprofundando seu conbeci- n1ento e desenvolvendo seu raciocínio. RC °"' P(x :s; 1.576,48 ou x 2: 1.623.52) = 0,05 Como x = 1.570, x e RC :. rejeita-se H,, Exercícios propostos { H,>:µ = 50 1. Tcstnr H . 50 ,.,, > Dados: o' = 4 a = 5% 11 = 100 e .\' = 52 { H. :µ =36 2. Testar H,:/t < 36 x1v Estatística Básica Material adicional No site de apoio do Jivro (\.V\.VW.prenhall.com/morettin _ br), professores e es- ~:S~~n tudantes pode1n acessar 1nateriais adicionais e1n qualquer dia, durante 24 horas. Para professores • Apresentações ern PowerPoint para utilização ein sala de aula • Manual de soluções com a resolução de todos os exercícios do livro Esse n1aterial é de uso exclusivo para professores e está protegido por senha. Para ter acesso a eles, os professores que adotam o livro deve1n entrar em conta/o co111 seu representante Pearson ou enviar e-rnail para universitarios@pearsoned.co1n.br. Para estudantes • Exercícios adicionais com respostas Todos esses recursos e ferramentas de aprendizage1n torna1n a nova edição de Es- tatística básica ainda 1nais co1npleto e eficaz, contribu indo direta1nente para o bo1n en- tenditnento do estudante nesta disciplina muito importante para as 1nais diversas áreas de ensino e pesquisa. L11iz Gonzllgt1 Morettin 1. Espaço amostral 2. Probabi 1 idade ~ 3. Variáveis aleatórias discretas 4. Distribuições teóricas de probabilidades de variáveis aleatórias discretas 5. Variáveis aleatórias contínuas 6. Aplicações da distribuição normal Espaço amostral 1.1 lntroducão I Encontra1nos na natureza dois tipos de fenô1nenos: determinísticos e aleatórios. Os fenômenos detenn inísticos são aqueles ern que os resultados são sempre os n1es.mos, qualquer que s~ja o número de ocorrências verificadas. Se to1narmos un1 detenninado sólido, sabe1nos que a uma certa ternperatura haverá a passagen1 para o estado líquido. Este exemplo caracteriza um fenômeno determinístico. Nos fenô1nenos aleatórios, os resultados nã.o serão previsíveis, mesmo que haja u1n grande número de repetições do 1nes1no fenôrneno. Por exemplo: se considerarmos um pornar com centenas de laranjeiras, as produ- ções de cada planta serão diferentes e não previsíveis, 1nesmo que as condições de ten1- peratura, pressão, umidade, solo etc. sejarn as 1nes1nas para todas as árvores. Pode1nos considerar os experirnentos aleatórios como fenômenos produzidos pelo homem. Nos experimentos aleatórios, mesmo que as condições iniciais sejam sempre as mesn1as, os resultados finais de cada tentativa do experi1nento serão diferentes e não previsíveis. Exemplos a) lançamento de uma moeda honesta; b) lançamento de u1n dado; c) lançamento de duas inoedas; d) retirada de un1a carta de u1n baralho completo de 52 ca1tas; e) determinação da vida útil de un1 con1ponente eletrônico. A cada experimento aleatório está associado o resultado obtido, que não é previsí- vel, cha1nado evento aleatório. No exe1nplo a os eventos associados são cara (e) e coroa (r); no exemplo b poderá ocorrer u1na das faces 1, 2, 3, 4, 5 ou 6. 4 Estatística básica 1.2 Espaço amostral Espaço amostral de um experimento aleatório é o conjunto dos resultados do experi- 1nento. Os elementos do espaço a1nostral serão cha1nados també1n de pontos aniostrais. Representaremos o espaço amostral por ü. Nos exe1nplos dados na seção anterior, os espaços a1nostraissão: a) n = {e, r} b) n={l ,2,3,4, 5, 6} c) Q ={(e, r), (e, e), (r, e), (r, r)} d) Q = {A0 •.. K0, A1,. •. KP, Ae .. KE, Ac ... Kc} e) n = {t E IR 1 t ;;:: O} O evento aleatório pode ser utn único ponto amostral ou uma reunião deles, como vere1nos no exemplo a seguir: Lança1n-se dois dados. Enumerar os seguintes eventos: A: saída de faces iguais; B: saída de faces cuja soma seja igual a 10; C: saída de faces cuja son1a seja menor que 2; D: saída de faces cuja son1a seja menor que 15; E: saída de faces onde u1na face é o dobro da outra. Detenninação do espaço an1ostral: pode1nos deter111iná-lo por un1a tabela de dupla entrada (produto ca1tesiano ). D2 1 2 3 Dl 1 ( 1, 1) ( 1, 2) ( 1, 3) 2 (2, 1) (2, 2) (2, 3) 3 (3, l) (3, 2) (3, 3) 4 (4, 1) (4, 2) (4, 3) 5 (5, 1) (5, 2) (5, 3) 6 (6, 1) (6, 2) (6, 3) Os eventos pedidos são: A= {(1, 1), (2, 2), (3, 3), (4, 4), (5, 5), (6, 6)} B = {(4, 6), (5, 5), (6, 4)} e=<!> (evento i1npossível) 4 5 6 (1 , 4) ( 1, 5) ( 1, 6) (2, 4) (2, 5) (2, 6) (3, 4) (3, 5) (3, 6) (4, 4) (4, 5) (4, 6) (5, 4) (5, 5) (5, 6) (6, 4) (6, 5) (6, 6) Capitulo 1 - Espaço amostral 5 D = D. (evento certo) E= {(l, 2), (2, 1), (2, 4), (3, 6), (4, 2), (6, 3)} U111a outra 1naneira de determinar o espaço amostral desse experimento é usar o diagrama ern árvore, que será útil para a resolução de problemas futura111ente. Eis o processo: 1 2 3 • 4 5 6 t 1° dado 1 ( l , 1) 2 (1, 2) "' .) ( 1, 3) 4 ( 1, 4) 5 (1, 5) 6 (1 , 6) 1 (2, 1) 2 (2, 2) 3 (2, 3) 4 (2, 4) 5 (2, 5) 6 (2, 6) 1 (3, 1) 2 (3, 2) 3 (3, 3) 4 (3, 4) 5 (3, 5) 6 (3, 6) 1 (4, 1) 2 (4, 2) 3 (4, 3) 4 (4, 4) 5 (4, 5) 6 (4, 6) 1------. (5, 1) 2 ------. (5, 2) 3 ------+ (5, 3) 4 (5,4) 5 (5, 5) 6 (5, 6) 1 (6, 1) 2 (6, 2) 3 (6, 3) 4 (6, 4) 5 (6, 5) 6 (6, 6) t t 2Q dado Pontos amostrais 6 Estatística básica 1.3 Classe dos eventos aleatórios DEFINIÇÃO , E o conjunto formado de todos os eventos (subconjuntos) do espaço amostral. Para efeito de exen1plo, consideren1os um espaço a1nostral finito: Q = {e"e2 ,e3 ,e4 } A classe dos eventos aleatórios é: <!> {e1},{e2},{e3},{e4 } F(Q)= {e1, e2}, {e., e3 } , {e., e4}, {e2, e3}, {e2, e4 }, {e3 , e4} {e., e2, e3}, {e., e2, e4} , {e1, e3, e4}, {e2, e3, e4} {e., e2, e3, e4} Para detenninannos o nún1ero de ele1nentos (eventos) de F(O), observa1nos que: <!> corresponde a ~) {e,}, ... , {e4 } con·esponde a ( ~) 4 {e., e2, e3, e4 } corresponde a 4 Portanto, n( F) = ( ~ + ~ ) + ( ~ + (; + (:) = 16 Generica1nente, se o nú1nero de pontos an1ostrais de um espaço an1ostral fin ito é n, então o número de eventos de Fé 2", pois n n n n n(F ) = + + + · · · + = 2" O 1 2 n 1.4 Operações com eventos aleatórios Consideremos urn espaço amostral finito Q = {e1, e2, e3, ... , e,,}. Sejam A e B dois eventos de F(ü). As seguintes operações são definidas: a) Reunião DEFINIÇAO Capítulo 1 - Espaço amoslral 7 A U B = {e; E .Q 1 e; E A ou e; E B} , i = 1, 2, ... , n. O evento reunião é formado pelos pontos an1ostrais que pertencen1 a pelo n1enos um dos eventos. A B Q b) lntersecção DEFINIÇÃO A n B ={e; E .Q 1 e; E A e e; E B}, i = l, .. . ,n. O evento intersecção é formado pelos pontos a1nostrais que pertencem si1nultanean1ente aos eventos A e B. Obs. Se A n B = <j>, A e B são eventos 1nutuc1mente exc/'usivos. A B e) Comple1nentação DEFINIÇAO A 8 Estatística básica EXEMPLO 1 Lançam-se duas n1oedas. Sejam A: saída de faces iguais; e B: saída de cara na prin1eira 111oeda. Determinar os eventos: -- - -- - - - A u B, A n B, A, B, (A u B), (A n B), A n B, A u B, B - A, A - B, A n B e B n A. Resolução: .Q ={(e, c),(c, r) ,(r, c),(r, r)} A= {(c, c),(r, r)} B={(c,c),(c, r)} AUB={(c, c) ,(c, r),(r, r)} An B ={(e, e)} A={(c,r),(r,c)} B = {(r, e ),(r, r )} (AuB)={(r,c)} (AnB)= {(c, r) ,(r,c),(r,r)} AnB={(r,c)} AUB={(c, r),(r, c),(r, r)} B-A={(c, r)} A-B={(r, r)} AnB={(c, r)} BnA={(r, r)} 1.5 Propriedades das operações • Seja1u A, B e C eventos associados a um espaço amostral O. As segui11tes proprie- dades são válidas: a) Ide1npotentes AnA=A AUA=A b) Comutativas AUB=BUA AnB=BnA e) Associativas An(BnC)=(AnB)nc A U(B UC)= (A UB) UC d) Distributivas A U(B nC)= (A UB) n(AU C) A n(B UC)= (A nB) U(An e) e) Absorções AU(AnB)=A An(AUB)=A f) Identidades Ann=A AUQ=Q AnQ> = <j> AUQ>=A g) Complementares - Q = <l> - <1> = Q - AnA = <I> - AUA=Q (A)=A h) "Leis das dualidades" ou "Leis de Morga11" (AnB)=AUB (AuB)=AnB Essas propriedades são facilinente verificadas. Capítulo 1 - Espaço amostral 9 1 O Estatíslica básica 1.6 Partição de um espaço amostral A1 A" DEFINIÇÃO Dize1nos que os eventos Ai, A2, ••• , A,, fonnan1 uma partição do espaço amostral n se: a) A;* <j>, i = 1, ... , n 11 c) UA.=Q • 1 1= 1 Exercícios propostos 1. Lança1n-se três moedas. Enun1erar o espaço a1nostral e os eventos: a) faces iguais; b) cara na 1 ª moeda; c) coroa na 2ª e 3ª moedas. 2. Considere a experiência que consiste en1 pesquisar frunílias com três crianças, en1 relação ao sexo delas, segundo a ordem do nascin1ento. Enumerar os eventos: a) ocorrência de dois filhos do sexo masculino; b) ocorrência de pelo menos um filho do sexo tnasculino; c) ocorrência de no n1áxi1no duas crianças do sexo feminino. 3. U1n lote contém peças de 5, 10, 15, ... , 30 mm de diâ1netro. Suponha que 2 peças seja1n selecionadas no lote. Se x e y indicam respectivamente os diâ.n1etros da 1 ª e 2ª peças selecionadas, o par (x, y) representa u1n ponto a111ostral. Usando o plano cartesiano, indicar os seguintes eventos: a) A= {x= y} b) B= {y<x} Respostas Capítulo 1 - Espaço amoslral 11 c) C={x=y - 10} 4. Sejam A, B e C três eventos de um espaço an1ostral. Exprin1ir os eventos abaixo usando as operações reunião, intersecção e complementação: a) somente A ocorre; b) A e C ocorrem, 1nas B não; c) A, B e C ocorre1n; d) pelo menos um ocorre; e) exatamente u1n ocorre; f) neo.bum ocorre; g) exatamente dois ocorre1n; h) pelo 1nenos dois ocorre1n; i) no 1náximo dois ocorre1n. Respostas R Probabilidade 2.1 Função de probabilidade DEFINIÇÃO ' E a função P que associa a cada evento de F un1 nún1ero real pe1tencente ao inter- valo [O, l ], satisfazendo os axiomas: l)P(0) =1 li) P(A U B) = P(A) + P(B ), se A e B forem 1nutuamente exclusivos. Ili) P( Q, A;)= ~ P (A;). se A 1, A2, ... , A,, fore111, dois a dois, eventos n1utuamente exclusivos. Observamos pela definição que O< P( A) < 1 para todo evento A,A e Q . 2.2 Teoremas Teorema 1 "Se os eventos A 1, A2, ... ,A,, forn1an1 uma partição do espaço amostral, então: 11 L P(A;) = 1." i = 1 Detnonstração: Pela definiçã.o de partição, os eventos A1, A2, ... , A,, sã.o 111utuamente exclusivos e li U A; =Q. i = 1 Capítulo 2- Probabilidade 13 ( // ) li Logo P };) 1 A; = P(Q.). Usando os axiomas I e III da definição, te1nos: t; P( A;) = 1. Teorema 2 "Se<!> é o evento iinpossível, então P(<j>) = O." De111onstração: Co1no <1> n Q. = <!>e<!> U Q. = Q., te1nos P(<j> U Q.) = P(Q.) P(<j>) + P(Q.) = P(Q.) P(<j>) =O Obs: A recíproca não é verdadeira, pois o fato de P(A) = O não i1nplica que A seja irn- possível. Teorema 3 Teorema do evento complementar: ''Para todo evento A e n , P(A)+P(Ã)=l." De111onstração: Con10 ten1os: A nA =<j>e A U A= n, P(A) + P(A) = P(Q.) P(A) + P(A ) = 1 Teorema 4 Teoremadasoma: "Seja1n Ac Q. eBcQ. Então, P(AUB)= P(A) + P(B)-P(A n B)." A B De111onstração: Escreveremos os eventos (A U B) e A como reuniões de eventos mutua- 1nente exclusivos, como segue: A UB = (A-B) UB A=(A-B) U (AnB) 14 Estatística básica e Usando o axioma, temos: P(A UB)= .P(A-B)+P(B) P(A)= P(A-B)+ P(AnB) De 2 tiratnos: P(A -B) = P(A) - P(A n B) . Substituindo-se esse resultado em 1, cbega1nosa: P(A U B) = P(A) + P(B)-P(A n B). Se A n B = <I>, então P(A n B) = O => vale o axion1a li. 1 2 Teorema 5 "Para A e .Q e .B e .Q, ternos: P(A UB) < P(A)+ P(B) ." (A detnonstração fica a cargo do leitor.) Te o rema 6 " Dado o espaço a1nostral .Q e os eventos A 1, A2, .. . ,A,,, então: p( Q, À;)= t.P(A;)- ~P( A; n Aj ) + i ~ k P(A; n Aj n Ak )- ... + +(-l)n-i · P(A, n ... n A,, )." Den1onstração: Por indução finita. ( // ) li Teorema 7 "Dados os eventos A1,A2 , ... ,A,, , então:P ;l.d,A; <BP(A;)-" Exemplos de aplicação 1. Sendo P(A) = x, P(B) = y e P(A n B) = z , calcular: a) P(AUB) ; c) P(AnB) ; Resolução: - - a) P(A UB) =P(A nB) =1 - P(A n B)= 1- z b) P( A n B) = P(.A U B) = 1- P( A U B) = b) P(AnB); - d) P(A UB ). 1 - {P(A)+P(B)-P(A . nB)}=l -.~ - J' +z Capitulo 2 - Probabilidade 15 - c) P(A n B) = P(B - A) = P( B) - P( A n B) = y - z - - - d) P(A U B) =P(A)+ P(B)- .P(A nB) =(1 - x) + y - (y - z) = 1-x+ z 2. De1nonstrar que P(A U B UC) = P(A)+ P(B)+ P( C) - P(A n B)- -P(A nc) -P(B n C)+ P(A nB nc). De111onstração: P(A UB U C)= P[(A UB) uc]= P(A UB)+P(C)- -P[(A u B) n e]= P(A)+ P(.B)-P(A n B)+ +P(C)-P[(A n c)u(B nc)]=P(A)+P(B)+ +P(C) -P(A nB)-{P(A nc)+P(B n c)-P[(A nc) n(B nc)J} :. P(A u B U C)= P(A)+P(B)+P(C)-P(A nB)-P(A nc)- -P(B n c )+P(A nB nc) 3. Sejam A, B e C eventos tais que 1 1 P(A)=P(B)=P(C)=-, AnB=<!>, AnC=<!> eP(BnC)=-. 5 7 Calcule a probabilidade de que pelo menos um dos eventos A, B ou C ocorra. A B e Resolução: Pelo diagrama vemos que A n B n C =<!>, logo P(A n B n C) = 0. Aplican- do o resultado do proble1na anterior, temos: P( A U B U C) =.!._+.!_+.!__O - O _ _!_+ O= _!i 5 5 5 7 35 2.3 Eventos equiprováveis Consideremos o espaço a1nostral .Q = {e1, e2 , e3 , •• ., en} associado a un:i experimento a leatório. 16 Estatística básica Chatnemosp(e.)=p. i·=l n t ,, , • •• , . n 11 Ternos I.P(e,) =I. P; = 1. 1 i= 1 I= 1 DEFINIÇÃO Os eventos e1 , i = 1, .. ., n são equiprováveis quando P( e1) = P( e2 ) = ... = P( e11 ) = p, isto é, quando todos tên1 a 1nesrna probabilidade de ocorrer. " 1 fica: I. P = 1:::} np = 1 :. i= 1 Logo, se os n pontos an1ostrais (eventos) são equiprováveis, a probabilidade de d d . . 1 ca a utn os pontos a1nostra1s e - . n Van1os calcular a probabilidade de urn evento A e n. Suponharnos que A tenha K pontos arnostrais: A={e1,€1, ... ,ek}, 1< k< n:. k k 1 :. P( A) = L P( e1 ) = L p = K · p = K · - :. l = I i = I 11 K :. P(A)= - n Exemplos de aplicação 1. Retira-se urna carta de u1n baralho completo de 52 cartas. Qual a probabilidade de sair u1n rei ou uma carta de e5padas? Seja A: saída de un1 rei; e B: saída de urna ca1ta de espada. Então: Observan1os que A n B = {Re} :. 1 :.P(AnB)= - 52 Logo: P(A UB)= P(A)+ P(B)-P(A n B) 4 13 1 P(AUB)= 52 +51-52:. :.P(AUB)=_!i 52 Capitulo 2 - Probabilidade 17 2. O seguinte grupo de pessoas está numa sala: 5 rapazes com mais de 21 anos, 4 rapazes co1n menos de 21 anos, 6 moças com mais de 21 anos e 3 moças co1n n1enos de 21 anos. Uma pessoa é escolhida ao acaso entre as 18. Os seguintes eventos são definidos: A: a pessoa ten1 1nais de 2 1 anos; B: a pessoa tem menos de 21 anos; C: a pessoa é um rapaz; D: a pessoa é uma moça. Calcular: a) P(B U D); - - b) P(A n C). Resolução: 1 Q = {5R, 4r, 6M, 3ni} :. p = - 18 11 A= {5R, 6M} ~ P(A) = - 18 7 B ={4r, 3m}~P(B)=ii 9 C = {5R, 4r} ~ P(C) = 18 9 D= {6M, 3m}~P(D)= I8 a) P(BUD)=P(B)+P(D)-P(BnD) 3 Como B nD ={3m}, te1nos que P(B nD)=-· 18 Logo: . 7 9 3 13 P(.BUD)=-+---=- 18 18 18 18 18 Estatística básica b) P(à n c)= P(A u e)= 1- P(A UC)= 1- {P(A)+ P(C)-P(A nc)} 5 Como A n C ={SR} e P(A nC) = 18' ten1os que: p (A n e)= 1 -{ H + fs-fs} = fs = ~ ou Co1no A= B e C = D, te1nos: AnC = BnD={31n} :. Ne1n se1npre é possível enumerar o espaço a1nostra1. Nesses casos, devere1nos usar a análise combinatória como processo de contagen1. Veremos isso nos próximos exemplos. 3. Em un1 congresso científico existe1n 15 maten1áticos e 12 estatísticos. Qual a proba- bilidade de se formar u1na comissão com 5 me1nbros, na qual figure111 3 1naten1áticos e 2 estatísticos? Resolução: A: comissão de 3 matemáticos e 2 estatísticos. n = ( 2 5 7 ): comissões k= 15 (12 3 · 2 : co1n is sões com 3 matemáticos e 2 estatísticos '1 5' . '12) 3 2 P( A) = -'---"''- 27 -;--~ --'- 5 4. Qual a probabilidade de, num baralho com 52 cartas, ao se retirarem 4 cartas, ao acaso, se1n reposição, se obter uma quadra? Resolução: A: saída de u1na quadra. 52 n= 4 ~ n(11nero de quádruplas K = 13 ~ nún1ero de quadras : . P(A)= 13 (5:) Capitulo 2- Probabilidade 19 5. Calcular a probabilidade de se obter exatamente 3 caras e 2 coroas en1 5 lances de u1na moeda. Resolução: A: saída de 3 caras e 2 coroas. n = 25 = 32 : número de quíntuplas 5 k = = 10 : nún1eros de quíntuplas co1n 3 caras e 2 coroas 3 P(A)=~=.2_ 32 16 6. U1na urna contén1 as letras A, A, A, R, R, S. Retira-se letra por letra. Qual a probabi- lidade de sair a palavra araras? Resolução: A: saída de palavra araras. 6 6! n =(PR), 2 1 = = 60 J , • 3 ! 2! 1 ! 1, = 1 . /\, . . 1 :. P(A)= - 60 Obs. : n l (p'R) ll • = , com + n, + ... + n = n 111·''? ·'13, .... 1111 ' ' 1 n, - '' n1 .n2 •••• n,,. 2.4 Probabilidade condicional Introduziremos a noção de probabilidade condicional através do seguinte exemplo: Considere1nos 250 alunos que cursam o pri1neiro ciclo de un1a facu ldade. Destes alunos, 100 são ho1nens (H) e 150 são 1nulheres (1\1); 11 O cursam fís ica (F) e 140 cursa1n quí1nica (Q). A distribuição dos alunos é a seguinte: Disciplina F Q Total Sexo H 40 60 100 M 70 80 150 Total 110 140 250 Um aluno é sorteado ao acaso. Qual a probabilidade de que esteja cursando qu ími- ca, dado que é n1ttlher? 20 Estatística básica Pelo quadro vemos que esta probabi lidade é de 80 e representan1os: 150 P(QIJ'vf) = 80 (probabilidade de que o aluno curse quírnica, condicionado ao fato 150 de ser 1nu lher). Observainos, porén1, que P(1\1 n Q) = 8º 250 150 e P(M) = . Para obterrnos o resul- 250 tado do problema, basta considerar que: Logo: 80 P(O llvf) = 25º = SO ~ 150 150 250 P(Q/M) = P(M nQ) P(lvf) Sejam A e Q e B e Q. Definimos a probabilidade condicional de A , dado que B ocorre (A/ B) como segue: Tatnbém: EXEMPLO P(A nB) P(AIB) = se P(B) =t O P(B) ' P(B/A) = P(B n A) e P(A) *o P(A) 's 1 3 11 Sendo P(A) = 3 , P(B) = 4 e P(A U B) =u, calcular P(AIB). Resolução: P(A nB) Co1110P(A!B) = P(B) , devemoscalcularP(AnB). Co1no P(A U B) = P(A)+ P(B) - P(A nB), te1nos: :~=~+! - P(AnB) :. P(AnB)=l~= ~ Capitulo 2 - Probabilidade 21 Lo o P(AIB) = 116 = 2 g ' 3/4 9 Tiramos da definição da probabilidade condicional o chamado TEORE'Jv!A DO PRODUTO: Seja1n A C n e B C fl .. Então, P(A n B) = P(B) · P(AIB) ou P(A n B) = I P(A) · P(BI A). m EXEMPLO Duas bolas vão ser retiradas de tnna un1a que contérn 2 bolas brancas, 3 pretas e 4 verdes. Qual a probabilidade de que arnbas a) sejam verdes? b) sejam da 1nesn1a cor? Resolução: 2B 3P 4V 4 3 1 a) P(V n V) = P(V). P(V IV)= 9 . 8 = 6 b) P(MC)=P(BnB)+P(PnP)+P(Vn V) 2 1 3 2 4 3 P(MC) = 9 . 8 + 9 . 8 + 9 . S P(MC)= 20 =~ 72 18 A generalização do teoren1a do produto é: li PCf], A; )= P(A,). P(A.i IA,). P(A3IA, n Ai) .. . P(A/1 IA, n Ai n ... n A11-I) Resolvendo o Proble111a 6 da Seção 2.3, usando essa generalização, temos: P(A n R ()A nR n A nS) = P(A)· P(RIA) ·P(AIA n R) . . P(RIAn RnA)· P(AIAn Rn AnR)· P(SIAn Rn An 3 2 2 1 1 l n R n A) = - . - . - . - . - . 1 = - 6 5 4 3 2 60 • 22 Estatística básica 2.5 Eventos independentes Sejam A C O e B C O. Intuitiva1nente, se A e 'B são independentes, P(A/B) = P(A) e P(B/A) = P(B). DEFINIÇÃO A e B são eventos independentes se P(A n B) = P(A). P(B). EXEMPLO Lançan1-se 3 1noedas.Verificar se são independentes os eventos: A: saída de cara na l ª n1oeda; B: saída de coroa na 2ª e 3ª moedas. e e r e r r n = {(ccc), (ccr), (crc), (crr), (rcc), (rcr), (rrc), (rrr)} 4 1 A ={(ccc), (ccr), (crc), (crr)} :. P(A) = - = - 2 l B ={(crr), (rrr)} :. P(B) = 8 = 4 Logo: l 1 1 P( A) · P( B) = - · - = - 2 4 8 Con10 1 A n B = { ( CYfJ} e P( A n B) = - ' 8 8 2 e r e ,. e ,. e ,. temos que A e B são eventos independentes, pois P(A n B) = P(A) · P(B) . Obs. 1: Para verificarn1os se 3 eventos A, B e C, são independentes, deven1os verificar se as 4 proposições são satisfeitas: Capitulo 2 - Probabilidade 23 1: P(A n B nc) = P(A). P(B). P(C) 2: P(A n B) = P(A) · P(B) 3: P(A n C) = P(A) · P(C) 4: P(B n C) = P(B) · P(C) Se apenas u1na não for satisfeita, os eventos 11ão são independentes. Obs. 2: Se A e B são n?utuanzente exclusivos, então A e B são de1Jendentes, pois se A ocorre, B não ocorre, isto é, a ocorrência de um evento condiciona a não ocorrência do outro. Resolveren1os um problen1a que mostrará bem a distinção entre eventos mutua- mente exclusivos e independentes. • Exercício resolvido Sejam A e B eventos tais que P(A) = 0,2, P(B) = P, P(A U B) = 0,6. Calcular P considerando A e B: a) mutua1nente exclusivos; b) independentes. Resolução: a) A e B mutuan1ente exclusivos => P(A n B) = O, como P(A U B) =P(A) + P(B)-P(A nB) ven1 0,6 = 0,2 + P- O :. b) A e B independentes => P( A n .B) = P( A)· P( B) = O, 2 · P, co1no P(A U B) = P(A) + P(B) - P(A n B) vem 0,6 = 0,2 + P - 0,2P :. : . 0,4 = 0,8P P=O 5 ' Obs. 3: Se os eventos A1, A2, .. . ,A,, são independentes, então: li onde 1t P(A;)=P(A1)·P(Àz) ... P(A,,). 1= 1 EXEMPLO P = 04 ' A probabi lidade de que um homen1 esteja vivo daqui a 30 anos é 2/5; a de sua rnulher é de 2/3. Deter1ninar a probabilidade de que daqui a 30 anos: 24 Estatística básica a) an1bos estejam vivos; b) somente o hon1en1 esteja vivo; e) somente a mulher esteja viva; d) nenhurn esteja vivo; e) pelo menos urn esteja vivo. Resolução: Chamaremos de H: o home1n estará vivo daqui a 30 anos; M· a mulher estará viva daqui a 30 anos. 2 - 3 P(H) = S :. P(J-T) = S 2 - 1 P(M)= 3:.P(M)= 3 2 2 4 a) P(J-I n 1\11) = P(H). P(M) = 5. 3 = i5 - - 2 l 2 b) P(H n J\1) =P(H)·P(M)=s· 3 =i5 - - 3 2 2 e) P(Hn1Vf)=P(H)·P(M)= 5·3=5 - - - - 31 l d) P(H n 1\1) =P(H)· P(M) = 5.?, = S . 2 2 4 12 4 e) P(H U 1\1) =P(H)+P(M)-P(H nM) =- +- - - =- =- . 5 3 15 15 5 ou X: pelo menos u1n vivo - 1 4 P( X) = 1 - P( X) = 1 - - = - 5 5 2.6 Teorema de Bayes Teorema da probabilidade total "Sejan1 A" A2, ••• ,A,, eventos que formatn un1a partição do espaço arnostral. Seja B u1n evento desse espaço. Então li .P(B)= °LP(A;)·P(BIA;)." i= 1 • Capitulo 2 - Probabilidade 25 A, A., Den1onstração: Os eventos (B n A1) e (B nA1), parai* j, i = 1, 2, ... , n ej = 1, 2, .. . , n, são mutuamente exclusivos, pois: O evento B ocorre con10 segue: :. P(B) = P(B n A,) +P(B n Ai) +P(B n A3) + ... + P(B n A,,) E usando o teorerna do produto, vem: P(B) = P(A,) · P(BIA,) + P(A2 ) · P(B/Ai) + ... + P(A,, ) · P(BIA11 ) ,, ou P(B) = LP(A1) • P(BIA1) . i = l EXEMPLO Uma urna contérn 3 bolas brancas e 2 amarelas. Uma segunda uma contém 4 bo- las brancas e 2 arnarelas. Escolhe-se, ao acaso, u1na urna e dela retira-se, tarnbém ao acaso, uma bola. Qual a probabilidade de que seja branca? Resolução: P(l) = _!_ 2 P(Il) = _!_ 2 3B 2A I P(BII) = ~ 5 P(B!Il) = ~ = 3_ 6 3 4B 2A II 26 Estatística básica Logo, a bola branca pode ocorrer: B = (B n I) u ( B n II) P(B) = P(B n I) + P(B n II) P(B) = P(I) · P(BII) + P(II) · P(Bfil) :. :. P(B) = _!. · ~ + _!. · 2 = .!2_ 2 5 2 3 30 O problema também pode ser resolvido usando-se o diagrama ern árvore: (1 nB) 3 B -10 1 1/2 (I nA) 1 3 l 19 A - 10 + 3= 30 5 (Il n B) 1 B -3 li l (IInA) - A 6 • Teorema de Bayes "Seja1n A,, A2, •• • ,A,, eventos que formarn uma partição do n. Seja B e n. Sejam conhecidas P(A1) e P(B/A;), i = l, 2, ... , n. Então: Den1onstração: P(A.)·P(BIA .) . ,, P(A ./B)= 1 .1 ,;=1, ... ,n. J li L P(A;) . P(BIA;) i = 1 P(A . n B) P(A ./B) = - -'-1-- 1 P(B) Usando-se o teorema do produto e o teoren1a da probabilidade total, ternos: . P(A1) ·P(BIA1) . . P(A1/B) = 11 ,; = 1, . . .,n. L P(A;) · P(BIA; ) i= 1 O teorema de Bayes é tarnbém charnado de teoren1a da probabilidade a posteriori. Ele relaciona u1na das parcelas da probabilidade total corn a própria probabilidade total. Capitulo 2 - Probabilidade 27 EXEMPLO A un1a A contén1 3 fichas vermelhas e 2 azuis, e a urna B contén1 2 vermelhas e 8 azuis. Joga-se uma moeda "honesta". Se a 1noeda der cara, extrai-se uma ficha da urna A; se der coroa, extrai-se uma ficha da un1a B. U1na ficha vern1elha é extraída. Qual a probabilidade de ter saído cara no lança1nento? Resolução: Quere1nos: P(C/ V) P(C) = _!_ 2 1 P(r)= 2 Co1no: ternos: 3 V 2A A P(VIC)= '}_ 5 P(V/r) = _3__ 10 2V 8A B P(V) = P(C n V)+ P(r n V) , P(V) = P( C) · P(V IC) + P(r) · .P(V Ir) 1 3 1 2 4 P(V) = 2 . S + 2 · w = W Calculamos agora P(C/V): 3 P(CI V) = P(V nC) = 1õ = ~ P(V) 4 4 10 O problema também pode ser resolvido pelo diagrama em árvore, como segue: e 1/2 ,. V (CnV) 3 - 10 A V (Vnr) 2 20 A P(C! V) = 3/ 10 = l 4/10 4 • 28 Estatística básica Exercícios resolvidos 1. U1na urna contérn 5 bolas brancas, 4 vermelhas e 3 azuis. Extraern-se simultanea- mente 3 bolas. Achar a probabilidade de que: a) nenhu1na seja vennelha; b) exatamente un1a seja vennelha; c) todas sejam da n1esrna cor. Resolução: 5B 4V 3A . - - - 8 7 6 14 a) P( N.S .V) = P(V n V n V) = 12 . 11. 1 o = 5 5 - - 3 4 8 7 28 b) P(E.U.S.V)=P(V nv nV) ·(PR) =-·-·-·3=- 2·1 12 11 1 o 55 e) P(T.S.lvf.C.) = P(B n B n B) + P(V n v n V)+ P(A n A n A)= 5 4 3 4 3 2 3 2 1 3 =-·-·-+-·-·-+-·-·-= - 12 11 10 12 11 10 12 11 10 44 2. As probabilidades de 3 jogadores, A, B e C, marcarem um gol quando cobram um pênalti são 2 4 e l_, respectiva1nente. Se cada utn cobrar uma única vez, qual a 3 ' 5 10 probabilidade de que pelo menos um marque un1 gol? Resolução: 2 4 7 P(A) = 3,P(B) = S e P(C) = lO - - - P(A UB UC)= 1- P(A UBU C)=l-P(A nB nC)= - ,... - l 1 3 . 1 49 = 1-P(A)· P(B)· P(C) = 1-3· s·lõ = 1-Sõ = 5õ 3. Em urna indústria há l O pessoas que ganham n1ais de 20 salários 1níni1nos (s.m.), 20 que ganham entre 10 e 20 s.m., e 70 que ganham .menos de 10 s.1u. Três pessoas desta indústria são selecionadas. Determinar a probabi lidade de que pelo menos u1na ganhe rnenos de 1 O s.n1. Resolução: A: a pessoa ganha 1nais de 20 s.m. ~ B: a pessoa ganJ1a entre 1 O e 20 s.m. ~ C: a pessoa ganha 1nenos de 1 O s.rn. ~ P(CUC UC)= 1-P(CUC UC)= - - - = 1-P(C)· P(C) · P(C) = = 1 - o 30. o 30. o 30 = ' ' ' = 1 - o 027 = o 973 ' ' Capitulo 2 - Probabilidade 29 P(A) = 0,10 P(B) = 0,20 P(C) = 0,70 4. A e B jogam 120 partidas de xadrez, das quais A ganha 60, B ganha 40 e 20 terminan1 en1patadas. A e B concordam e1n jogar 3 partidas. Deterrninar a probabilidade de: a) A ganhar todas as três; b) duas partidas terrninarem empatadas; c) A e B ganharen1 alternadamente. J~esolução: P(A) = 60 = _!_ 120 2 P(B) = 40 = .!_ 120 3 P(E) = 20 = _!_ 120 6 1 1 1 1 a) P( A n A n A) = 2 . 2 . 2 = 8 - • 1 1 5 5 b) P(2E)=P(EnEnE)·(PR) ~ .1 =6·6·6·3 = 72 c) P(A e B alte1nadamente) = P(A n B n A)+ P(B n A nB) = 1111111 1 5 = - ·- · - + - ·-·- = - + - = - 2 3 2 3 2 3 12 18 36 5. São retiradas un1a a uma, aleatoriamente, bolas de uma urna até obter-se a primeira bola branca. Mas a cada tentativa dobra-se a quantidade de bolas azuis colocadas na un1a. Sabendo que inicialn1ente a uma conté1n 4 bolas azuis e 6 brancas, calcular a probabilidade de obter-se a primeira bola branca no máximo na 3ª tentativa. 30 Estatística básica Resolução:4A 1 A tentativa 6B 2ª tentativa 3ª tentativa 8A 6B 16A 6B P(Priineira Branca no 1náxiino na 3ª tentativa)= = P(B1•) + P(A1• n B2•) + P(Â1• n  2• n B;•) = 6 4 6 4 8 6 - +- ·- + - ·- ·- =o 8338 1 o 1 o 14 1 o 14 22 ' 6. U1n lote de 120 peças é entregue ao controle de qualidade de uma fi1ma. O responsável pelo setor seleciona 5 peças. O lote será aceito se foren1 observadas O ou 1 defeituosas. Há 20 defeituosas no lote. a) Qual a probabilidade de o lote ser aceito? b) Admitindo- se que o lote seja aceito, qual a probabilidade de ter sido observado só urn defeito? Resolução: P(d) = 20 = .!_ 120 6 - - P(d)=~ 6 a) P(A) = P(Od ou ld) = P(5d) + P(ld e 4d) = =P(d d d d d)+P(d d d d d)·PR1 5 4 = • (5) 5 1 (5)4 = - + - . - . 5 = o 4019 + o 4019 6 6 6 ' ' P(A) = 0,8038 P(Id!A)= P(ldnA) = 0,4019 =O 5 b) P(A) 0,8038 ' 7. A caixa A te1n 9 cartas numeradas de 1 a 9. A caixa B tem 5 cartas numeradas de 1 a 5. U1na caixa é escolhida ao acaso e uma ca1ia é retirada. Se o nún1ero é par, qual a probabilidade de que a carta sorteada tenha vindo de A? Resolução: l 4 P(A) = l ~ P(PIA) = 9 1 2 P(B) = - ~ P(P/B) = - 2 5 Capítulo 2 - Probabilidade 31 P(P)= P(A nP)+P(B nP) P(P) = P(A) · P(PIA) + P(B) · P(P/B) 1 4 1 2 19 P(P) = 2. 9 + 2. S = 45 :. :. P(AIP) P(A n P) = 219 _ 10 P(P) 19/ 45 19 8. Nun1 certo colégio, 4% dos hon1ens e 1% das mulheres têm mais de 1,75 de altura. 60o/o dos estudantes são 111ulheres. Um estudante é escolhido ao acaso e tem rnais de 1,75 1n. Qual a probabilidade de que seja homem? l~esolução: A: o estudante tem mais de 1,75 m A P(HnA) 0,016 H 0,4 - A A P(MnA) 0,006 M - A Logo: P(HIA)= P(H nA) = 0,016 = 8 P(A) O, 022 11 P(A) = 0,016 + 0,006 P(A) = 0,022 9. Uma caixa tem 3 moedas: uma não viciada, outra com 2 caras e uma terceira vicia- da, de modo que a probabilidade de ocorrer cara nesta rnoeda é de 1/5. Uma rnoeda é selecionada ao acaso na caixa. Saiu cara. Qual a probabilidade de que a 3A moeda tenha sido a selecionada? Resolução: A: pri1neira moeda B: segunda moeda C: terceira moeda 32 Estatística básica e P(A n e) 1 - 6 A 1/3 r P(c) =1 +1+1 :. 6 3 15 1/3 B l e P(Bnc) 1 :. P(c) = j6 -P(Cn c) 3 1 113 e 15 e r Logo: P(Clc) = P(C n c) = 1/15 = 2 P(c) 17/30 17 1 O. Uma urna contém 4 bolas brancas e 6 bolas vermelhas; outra urna contém 3 bolas brancas e 6 vermelhas. Passa-se uma bola, escolhida ao acaso, da prin1eira para a segunda urna, e, ern seguida, retiram-se 5 bolas desta última, corn reposição. Qual a probabilidade de que ocorra111 2 vermelhas e 3 brancas nessa ordern? Resolução: (0,6)2 (0,4)3 P [B e (2 V e 38)] B (2Ve3B) 0,009216 0,4 P(2Ve3B) = 0,011862 0,6 V (O 7)' (O 3)' ' . ' . (2 V e 3B) p [ Ve (2 V e 3B)] 0,002646 11 . A probabilidade de u111 indivíduo da classe A comprar um carro é de 3/4, da B é de 1/5 e da C é de l /20. As probabilidades de os indivíduos cornprarem um carro da marca x são 1/1 O, 315 e 3/1 O, dado que seja111 de A, B e C, respectivamente. Certa loj a vendeu um carro da rnarca x. Qual a probabilidade de que o indivíduo que o co1nprou seja da classe B? Resolução: X P(A n x) 3 - 40 A 3/4 -X P(Bnx) X 3 42 21 - P(x) = 200 = 100 1/5 25 (+) B - X P(Cn x) ~ X .) - 1/20 200 e -X Capitulo 2 - Probabilidade 33 :. P(Blx) = P(B nx) = 3125 = 4 P(x) 21/100 7 12. U1n certo progra1na pode ser usado con1 u1na entre duas sub-rotinas A e B, depen- dendo do problema. A experiência ten1 n1ostrado que a sub-rotina A é usada 40% das vezes e B é usada 60% das vezes. Se A é usada, existe 75% de chance de que o progran1a chegue a un1 resultado dentro do limite de tempo. Se B é usada, a chance é de 50o/o. Se o progra1na foi realizado dentro do limite de tempo, qual a probabilidade de que a sub-rotina A tenha sido a escolhida? Resolução: P(A) = 0,4 ~ P(RIA) =O, 75 ~ P(A n R) = 0, 300 P(B) = 0,6 ~ P(RIB) = 0,50 ~P(B nR) =0,300 Logo: P(R) = 0,300 + 0,300 = 0,600 P(AIR) = P(A n R) = 0,3 = 0,5 ou 50% P(R) 0,6 13. A urna X contém 2 bolas azuis, 2 brancas e 1 cinza, e a urna Y contém 2 bolas azuis, 1 branca e l ci_nza. R.etira-se u.ma bola de cada urna. Calcule a probabilidade de saírem 2 bolas brancas sabendo que são bolas de mesma cor. Resolução: P(1nesma cor)= P(A n A)+ P(B n B) + P(C n C) 222111 7 = - ·- + - ·- + - ·- = - 5 4 5 4 5 4 20 7 P(mesma cor)= - 20 . P(B nB) P(B n .Bimesma cor)= P( ) = 2 P(B n B)/1nesn1a cor) = - 7 mesma cor 2/20 2 7/20 7 14. Nu1n período de u1n n1ês, 100 pacientes sofrendo de detern1inada doença fora1n internados em utn hospital. Infonnações sobre o método de trata1nento aplicado em cada paciente e o resultado final obtido estão no quadro a seguir. 34 Estatística básica Tratamento A B Soma Resultado Cura total 24 16 40 Cura parcial 24 16 40 Morte 12 8 20 Soma 60 40 100 a) So11eando aleatorian1ente u1n desses pacientes, deter1ninar a probabilidade de o paciente escolhido: a1) ter sido sub1netido ao tratamento A; a2) ter sido totaln1ente curado; a3) ter sido sub1netido ao tratamento A e ter sido parcialmente curado; ai) ter sido sub1uetido ao trata.mento A ou ter sido parcialmente curado. b) Os eventos "1norte" e "tratamento A" são independentes? Justificar. c) Sorteando dois dos pacientes, qual a probabilidade de que: c1) tenhan1 recebido trata1nentos diferentes? C2) pelo menos un1 deles tenha sido curado totalmente? Resolução: 60 a) a1) P(A)= 100 = 0,6 40 ai) P(TC) = lOO = 0,4 24 a3) P(A nPC) = = 0,24 100 a4) P(A UPC) =P(A)+ P(PC)-P(A n PC) =0,6+ 0,4-0, 24 = 0,76 b) P(M)- 2 0 -O 2 - 100 - ' P(M) · P(A) = 0,2 x 0,6 = 0,12 P(A) = 0,6 Co1no: te1nos: P(M n A)= 12 = 0,12, 100 P(M n A)= P(M) · P(A) . Logo, os eventos "1norte" e "tratamento A" são independentes. Capitulo 2 - Probabilidade 35 e) c,) x = tratan1entos diferentes P(.x) = P(A nB)+ P(B n A)= 2x0,6 X 0,4= 0,48 C2) z = curado totahnente = 1- O, 6 ·O, 6 = 1- O, 36 = 0,64 15. A probabilidade de que u1n atleta A ultrapasse 17,30 1n nLnn único salto triplo é de 0,7. O atleta dá 4 saltos. Qual a probabilidade de que em pelo menos nu1n dos saltos ultrapasse 17,30 1n? Resolução: P(u) = 0,7 e P(ü)= 0,3 = 1-0,3. 0,3. 0,3. 0,3=1-0,0081 = 0,9919 16. Um dado A tem 3 faces brancas e 3 pretas; un1 dado B possui 2 faces brancas, 2 pretas e 2 ver1nelhas; um dado C possui 2 faces brancas e 4 pretas, e u1n dado D, 3 brancas e 3 pretas. Lança111-se os quatro dados. Qual a probabilidade de que: a) pelo menos u1na face seja branca? b) três sejam pretas? e 2B 3B D 4P 3P Cuidado: as probabilidades das cores não sã.o as mes1nas nos quatro dados. - - - - a) P(B1 UB2 U B3 UB4 ) =I-P(B1)·P(B2 )·P(B3 )·P(B4)= =1-3·4·4 · ~=1-.!.= 8 6 6 6 6 9 9 36 Estatística básica - - b) P(3 Pretas) = P(f; nPi n ~ n P.i) + P(f; n Pi n ~ n P.i) + - - +P(J:; nPi n~ nP.i)+P(J:; nPi n~ n?.i)= 3 2 4 3 3 2 2 3 3 4 4 3 = -·-· - · -+ - · - . -· -+- · - · - · - + 6666 6666 6666 3243 l 1 1 1 9 1 +- ·-·-·-=-+-+-+-=-= 6 6 6 6 18 36 9 18 36 4 17. A urna I te1n 3 bolas brancas e 2 pretas, a urna II tem 4 bolas brancas e 5 pretas, a. urna III tem 3 bolas brancas e 4 pretas. Passa-se un1a bola, escolhida aleatorian1ente, de 1 para II. Feito isto, retira-se uma bola de II e retiram-se 2 bolas de 111. Qual a probabilidade de sairem 3 bolas da mesu1a cor? Resolução: Ill 315 3 2 P(B nB) = - ·- 7 6 4 3 P(PnP) =-·- 7 6 B p P(MC) = P(B e 2B) + P(P e 2P) 23 3 2 27 4 3 11 P(lvfC) = - ·- ·- + - ·-·- = - 50 7 6 50 7 6 50 P(BnB) 15 B -50 P(BnP) p 15 - 50 B P(PnB) 8 50 p P(PnP) 12 50 P(B) = ~ 50 P(P) = ']]_ 50 18. Un1a urna x tem 8 bolas pretas e 2 verdes. A urna J' tem 4 pretas e 5 verdes, e a urna z te1n 2 verdes e 7 pretas. Passa-se uma bola de x para y. Feito isto, passa-se u1na bola de y para z. A seguir, retira1n-se 2 bolas dez, co1n reposição. Qual a probabilidadede que ocorram duas bolas verdes? Capitulo 2 - Probabilidade 37 Resolução: p 0,2 . 0,2 vv 0,016 p V 0,3 . 0,3 vv 0,036 p 0,2 . 0,2 vv -----. 0,0032 V V 0,3 . 0,3 vv-----. 0,0108 P(V n V)= 0,016 + 0,036 + 0,0032 + 0,0108 = 0, 066 19. Um aluno responde a utn teste de múltipla escolha con1 4 alte1nativas com uma só correta. A probabilidade de que ele saiba a resposta certa de u1na questão é de 30%. Se ele não sabe a resposta, existe a possibilidade de acertar "no chute". Não existe a possibilidade de ele obter a resposta certa por "cola". Se ele acertou a questão, qual a probabilidade de ele realmente saber a resposta? Resolução: - 55,79 - 2,37 o z P(SIA)=P(Sn A) = 0,3 = 0,6316 P(A) 0,475 20. Um analista de uma empresa fotográfica estitna que a probabilidade de que uma fir- 1na concorrente planeje fabricar equipan1entos para fotografias instantâneas dentro dos próximos 3 anos é 0,30. Se a firma concorrente te1n tais planos, será certamente construída uma nova fábrica. Se não tem tais p lanos, há ainda u1na probabilidade de 0,60 de que, por outras razões, construa u1na nova fabrica. Se iniciou os traba- lhos de construção de uma nova fábrica, qual a probabilidade de que tenha decidido entrar para o campo da fotografia instantânea? 38 Estatística básica Resolução: FJ--1--NF P(FinJ.lF) 0,3 (+) P(NF) = 0,72 P(FlnNF) NF 0,42 FI 1VF P(Fl/NF) = P(FI n JVF) 0,3 = 2_ = 0,4167 P(NF) O, 72 12 21. U1na urna X tetn 6 bolas brancas e 4 azuis. A urna Y tem 3 bolas brancas e 5 azuis. Passam-se duas bolas de X para Y e a seguir retira1n-se duas bolas de Y, co1n repo- sição. Sabendo-se que ocorrera1n duas bolas azuis, qual a probabilidade que duas azuis tenha1n sido transferidas de X para Y? Resolução: 5 5 - · - P(2B e2A) 10 10 750 6 5 88 2A 9.000 - ·- 10 9 4 3 7 7 -·- -·- P(2A e 2A) 10 9 AA 10 10 2A 588 P(2A) = 3·º66 = 0 3407 9.000 (+). 9.000 ' 6 4 6 6 - · - . 2 - ·- P(CD e2A) BA 10 10 1728 10 9 2A AB 9.000 • P(2A/2A) = p (2Ae2A) = 588/9.000 = 588 _ O,l918 P(2A) 3.06619.000 3.066 Exercícios propostos l. A seguinte afirmação trata da probabilidade de que exatamente un1 dos eventos, A ou B, ocorra. Prove que: - - P{(A n B) U(A. nB)} = P(A) + P(B) - 2P(A n B) Respostas Capitulo 2 - Probabilidade 39 2. En1 un1a prova caíran1 dois problemas. Sabe-se que 132 alunos acertara1n o primei- ro, 86 erraram o segundo, 120 acertararn os dois e 54 ace1tara1n apenas tun proble- 1na. Qual a probabilidade de que um aluno, escolhido ao acaso: a) não tenha aceitado nenJ1um problema? b) tenha aceitado apenas o segundo problen1a? 3. E1n u111a cidade onde se publica1n três jon1ais, A, B e e·, constatou-se que, entre 1.000 fan1ílias, assinarn: A: 470; B: 420; C: 315; Ae B: 110; Ae C: 220; B e C: 140; e 75 assi- nan1 os três. Escolhendo-se ao acaso u1na fan1ília, qual a probabil idade de que ela: a) não assine nenhu1n dos três jornais? b) assine apenas urn dos três jornais? c) assine pelo 1nenos dois jornais? 4. A tabela abaixo dá a distribuição das probabilidades dos quatro tipos sanguíneos, nu1na certa comunidade. Tipo sanguíneo A B AB o Probabi 1 idade de ter 0,2 o tipo especificado Probabi 1 idade de não ter o tipo 0,9 0,95 especificado Calcular a probabilidade de que: a) u1n indivíduo, sorteado ao acaso nessa co1nunidade, tenha o tipo O; b) dois indivíduos, sorteados ao acaso nessa comunidade, tenha111 tipo A e tipo B, nessa ordem; c) un1 indivíduo, sorteado ao acaso nessa co111unidade, não tenha o tipo B ou não tenha o tipo AB. 5. Quinze pessoas en1 uma sala estão usando insígnias numeradas de 1 a 15. Três pessoas são escolhidas ao acaso e são retiradas da sala. Os números de suas insígnias são anotados. Qual a probabilidade de que: a) o 1nenor número seja 7? b) o maior núrnero seja 7? 6. Un1a urna contém bolas numeradas: 1, 2, 3, 4, ... , n. Duas bolas são escolhidas ao acaso . . Encontre a probabi lidade de que os nú1neros das bolas sejarn inteiros conse- cutivos se a extração é feita: a) sem reposição; b) co1n reposição. 7. Colocam-se 4 nú1neros positivos e 6 negativos em l O memórias de urna máquina de calcular (um em cada 1ne1nória). Efetua-se o produto dos conteúdos de 4 memórias selecionadas ao acaso. Qual a probabilidade de que seja positivo? Respostas 40 Estatística básica 8. Três cartas vão ser retiradas de utn baralho de 52 cartas. Calcular a probabilidade de que: a) todas as três sejan1 espadas; b) as três ca11as sejan1 do mesmo naipe; c) as três cartas sejan1 de naipes diferentes. 9. Un1a urna contém l O bolas verdes e 6 azuis. Tira111-se 2 bolas ao acaso. Qual a pro- babilidade de que as duas bolas: a) sejam verdes? b) sejam da mes111a cor? c) sejam de cores diferentes? 1 O. De uma caixa co1n 1 O lâ1npadas, das quais 6 estão boas, retiratn-se 3 lân1padas ao acaso e que são testadas a seguir. Qual a probabilidade de que: a) todas acendam? b) pelo menos uma lârnpada acenda? 11. Un1a urna contém 5 bolas pretas, 3 vern1elhas, 3 azuis e 2 a1narelas. Extraetn-se si1nultaneamente 5 bolas. Qual a probabilidade de que saiam 2 bolas pretas, 2 azuis e u1na a1narela? 12. Un1a urna contém 4 bolas brancas, 4 vermelhas e 2 pretas. Outra urna contém 5 bolas brancas, 3 vem1elhas e 3 pretas. Extrai-se u1na bola de cada urna. Qual a pro- babilidade de que sejan1da1nesn1a cor? 13. U1na caixa contém 6 lâ1npadas de 40 W, 3 de 60 W e 1 de l 00 W. Retiratn-se 5 lâm- padas cotn reposição. Qual a probabilidade de que: a) saiam 3 de 40 W, 1 de 60 W e 1 de 100 W? b) saiam 4 de 40 W e 1 de 60 W? c) não saia nenhu1ua de 60 W? 14. Numa sala há 4 casais. De cada casal un1 dos cotnponentes é escolhido. Qual a pro- babilidade de sere1n escolhidos 3 homens ou 4 nlulheres? 15. As probabilidades de u1n estudante do curso básico de uma tàculdade escolher entre matetnática, física e estatística são 0,5, 0,3 e 0,2, respectivan1ente. Selecionam-se ao acaso 3 estudantes do ciclo básico desta faculdade. Qual a probabilidade de que pelo 1nenos um escolha estatística? 16. Duas pessoas lançam, cada uma, 3 rnoedas. Qual a probabilidade de que tirem o n1esmo número de caras? .17. De u1n grupo de 12 homens e 8 mulheres, retiran1-se 4 pessoas para fonnar uma cotnissão. Qual a probabilidade de: a) pelo tnenos uma 1nulher fazer parte da co1nissão? b) uma 1nulher fazer patte da cotnissão? c) haver pessoas dos dois sexos na co1nissão? Respostas Resp Capitulo 2 - Probabilidade 41 18. A e B alternadamente e nessa ordem, lança1n independente1nente 3 1noedas. Ganha o pri1nejro que tirar faces iguais. O jogo tertn ina cotu a vitória de um deles. Qual a probabilidade de A ganhar? Qual a probabilidade de B ganhar? 19. ·urn tabuleiro quadrado contérn 9 orifícios dispostos e1n 3 linhas e 3 colunas. En1 cada buraco cabe un1a única bola. Jogam-se 3 bolas sobre o tabuleiro. Qual a proba- bilidade de que os orifícios ocupados não estejam alinhados? 20. Uma urna conté1n 1 bola azul e 9 brancas. Un1a segunda urna contém x bolas azuis e as restantes brancas, r1un1 total de l O bolas. Realizan1-se 2 experin1entos, separa- damente e independentes entre si: a) retirar ao acaso u1na bola de cada urna; b) reunir as bolas das 2 urnas e em seguida retirar 2 bolas ao acaso. Calcular o valor 1nínin10 de x, a fim de que a probabilidade de saíren1 2 bolas azuis seja maior no 22 que no l 2 experi1nento. 21. Duas lâtnpadas ruins são misturadas com 2 lâmpadas boas. As lâ1npadas são testa- das u1na a uma, até que as 2 ruins seja1n encontradas. Qual a probabilidade de que a última rui1n seja encontrada no: a) segundo teste; b) terceiro teste; c) quarto teste. 22. Da produção diária de peças de un1a determinada máquina, 10% são defeituosas. Retira1n-se 5 peças da produção dessa máquina num detenninado dia. Qual a proba- bilidade de que: a) no n1áximo duas seja1n boas? b) pelo menos quatro sejam boas? c) exatamente três sejatn boas? d) pelo 1nenosu1na seja defeituosa? 23. Quatro bolsas de estudo serão sorteadas entre 30 estudantes: 12 do pri1neiro ciclo e 18 do segundo ciclo. Qual a probabilidade de que haja entre os sorteados: a) u1n do prin1eiro ciclo; b) no máximo um do segundo ciclo; c) pelo menos u1n de cada ciclo. 24. A probabil idade de que a porta de uma casa esteja trancada à chave é de 3/5. Há 1 O chaves em un1 chaveiro. Qual a probabilidade de que u1n indivíduo entre na casa po- dendo utilizar, se necessário, apenas u1na das chaves, to1nada ao acaso do chaveiro? 25. E1n uma uma estão colocadas 5 bolas azuis e 1 O bolas brancas. a) Retirando-se 5 bolas, sem reposição, calcular a probabilidade; a,) de as três prin1eiras sere1n azuis e as duas últimas brancas; a2) de ocorrer 3 bolas azuis e duas brancas. Respostas R 42 Estatística básica b) Retirando-se 2 bolas, sen1 reposição, calcular a probabilidade: b1) de a segunda ser azul; b2) de ter sido retirada a primeira branca, sabendo-se que a segunda é azul. 26. Num super1nercado há 2000 lâ1npadas, provenientes de 3 fábricas distintas, X, Y e z. X produziu 500, das quais 400 são boas. Y produziu 700, das quais 600 são boas, e Z as restantes, das quais 500 são boas. Se sortearmos ao acaso uma das lâ1npadas nesse supermercado, qual a probabilidade de que: a) seja boa? b) sendo defeituosa, tenJ1a sido fabricada por X? 27. Un1a e1n cada dez n1oedas apresenta o defeito de ser viciada, isto é, a probabilidade de obtermos cara nessa 1noeda é 0,8. Sortea1nos ao acaso u1na 1noeda e a lançan1os 5 vezes, obtendo-se 3 caras e 2 coroas. Qual a probabilidade de tennos escolh ido a 1noeda viciada? 28. U1na urna contém 3 bolas brancas e 4 azuis. Uma outra conté1n 4 brancas e 5 azuis. Passa-se uma bola da pri1neira para a segunda urna e, em seguida, extrai-se uma bola da segunda urna. Qual a probabilidade de ser branca? 29. Un1a pessoa joga u1n dado. Se sair 6, ganha a partida. Se sair 3, 4 ou 5, perde. Se sair 1 ou 2, tem o direito de jogar novamente. Desta vez, se sair 4, ganha, e se sair outro número, perde. Qual a probabilidade de ganhar? 30. A urna A tem 3 bolas pretas e 4 brancas. A urna B tem 4 bolas brancas e 5 pretas. Un1a bola é retirada ao acaso da urna A e colocada na un1a B. Retiran1-se ao acaso 2 bolas da urna B. Qual a probabilidade de que: a) a111bas seja1n da 1nes1na cor? b) a1ubas sejam de cores diferentes? 31. A fábrica A produziu 4000 lâmpadas, e a fábrica B, 6000 lâmpadas. 80% das lârn- padas de A são boas, e 60% das de B são boas ta1nbé1n. Escolhe-se uma lâmpada ao acaso das 10000 lâtnpadas. Qual a probabilidade que: a) seja boa, sabendo-se que é da 1narca A? b) seja boa? e) seja defeituosa e da marca B? d) sendo defeituosa, tenha sido fabricada por B? 32. A porcentagem de can·os con1 defeito entregue no mercado por ce11a montadora é historicamente esti1nada e1n 6%. A produção da 1nontadora ven1 de três fábricas distintas, da 1natriz, A, e das filiais, B e C, nas seguintes proporções: 60%, 30% e l 0%, respectivamente. Sabe-se que a proporção de defeitos na 111atriz é o dobro da filial B e, a da filial B é o quádruplo da filial C. Detenninar a porcentagem de defeito de cada fábrica. Respostas Capitulo 2 - Probabilidade 43 33. Uma urna contém 4 bolas brancas e 5 pretas. Duas bolas são retiradas ao acaso dessa urJ1a e substituídas por 2 bolas verdes. Depois disto, retira1n-se 2 bolas. Qual a pro- babilidade de saírem bolas brancas? 34. A urna 1 tem 3 bolas brancas e 2 pretas. A urna II tern 4 bolas brancas e 5 pretas, e a urna III tem 3 bolas brancas e 4 pretas. Passa-se uma bola, escolhida aleatoriamente, de I para li. Depois disso, passa-se uma bola da urna li para a urna III e, e1n seguida, retiram-se 2 bolas de UI. Qual a probabilidade de saírem 2 bolas brancas? 35. Un1a urna tem 5 bolas verdes, 4 azuis e 5 brancas. Retira1n-se 3 bolas com reposi- ção. Qual a probabilidade de que no máxitno duas sejam brancas? 36. Nu1n congresso científico, a cornposição de 4 comissões, A, B, C e D, é a seguinte: 5 hotnens (h) e 5 rnulheres (11'1); 3 h e 7 11i; 4 h e 6 m; e 6 h e 4 1n, respectivamente. Uma pessoa é escolhida ao acaso de cada co111issão e é forn1ada uma nova comissão, E. Qual a probabi lidade de que E seja co1nposta por: a) 2 mulheres; b) pessoas do mes1no sexo; c) sarnente por ho1nens. 37. A experiência mostra que detenninado aluno, A, te1n probabilidade 0,9 de resolver e acertar um exercício novo que lhe é proposto. Se.is novos exercícios são apresen- tados ao aluno A para sere1n resolvidos. Qual a probabilidade de que ele resolva e acerte: a) no máximo 2 exercícios; b) pelo menos um exercício; c) os seis exercícios. 38. A urna l tem 3 bolas brancas e 4 pretas. A urna II tem 4 bolas bran.cas e 5 pretas. A un1a III tem 3 bolas brancas e 2 pretas, e a urna IV tem 4 bolas brancas e 3 pretas. Passa-se uma bola, escolhida ao acaso, de I para li, e també1n passa-se uma bola, escolhida ao acaso, de III para IV. Feito isto, retira-se uma bolada urna II e uma bola da urna IV. Qual a probabilidade de saíren1 bolas da mesma cor? 39. Uma urna tem 3 bolas brancas, 3 pretas e 4 azuis. Duas bolas são retiradas ao acaso dessa urna e substituídas por 5 ver1nelhas. Depois disso, retira-se 1 bola. Qual a probabilidade de sair bola azul? 40. Uma caixa, A, contén1 6 bolas azuis e 4 vermelhas, e outra, B, contém 4 bolas azuis e 6 vern1elhas. Uma pessoa extrai ao acaso u1na bola de uma das caixas. A probabilidade de que seja azul é 0,44. Qual a preferência (probabilidade) da pessoa pela caixa A? 41. São dadas as urnas A, B e C. Da urna A é retirada uma bola e colocada na urna B. Da urna B retira-se u1na bola, que é colocada na urna C. Retira-se então uma bola da urna C. A probabilidade de ocorrer bola de cor vermelha é de 0,537. Determinar o valor de x sabendo que as urnas têm as seguintes composições: Respostas R 44 Estatística básica A{7 vermelhas 3 brancas { 3 vermelhas B 6 brancas c{(9- x) vem1elhas x brancas 42. U1na e1npresa produz o produto X e1n 3 fábricas distintas, A, B e e, COITIO segue: a produção de A é 2 vezes a de B, e a de C é 2 vezes a de B. O produto X é armazenado em u1n depósito central. As proporções de produção defeituosa são: 5% de A, 3% de B e 4% de C. Retira-se uma unidade de X do depósito e verifica-se que é defeituoso. Qual a probabilidade de que tenha sido fabricado por B? 43. Três máquinas, A, B e C, produzem, respectivamente, 40%, 50% e 10% da produção da en1presa X Historican1ente as porcentagens de peças defeituosas produzidas em cada 1náquina são: 5%, 3% e 3%, respectiva1nente. A e1npresa X contratou u1n enge- nheiro para fazer u1na revisão nas 1náquinas e no processo de produção. Tal engenhei- ro conseguiu reduzir pela 1netade a probabilidade de peças defeituosas da empresa e, ainda, igualou as porcentagens de defeitos das 1náquinas A e B, e a porcentagem de defeitos em C ficou na metade da conseguida para B. Quais são as novas porcen- tagens de defeitos de cada máquina? Respostas Variáveis aleatórias discretas 3.1 Definicões I Na prática é, nluitas vezes, n1ais interessante associannos um nú1nero a un1 evento aleatório e calcularrnos a probabilidade da ocorrência desse nú1nero do que a probabi- lidade do evento. lntroduziremos o conceito de variáveis al.eatórias discretas con1 o seguinte problen1a: Lançam-se três rnoedas. Seja X o número de ocorrências da face cara. Determinar a distribuição de probabilidade de X. O espaço amostral do experin1ento é: a ={(e, e, e), (e, e, r), (e, r, e), (e, r , r), (r, e, e), (r, e, r), (r, r , e), (r, r, r)} Se X é o nú1nero de caras, X assume os valores O, l, 2 e 3. Podemos associar a esses nún1eros eventos que con·espondatn à ocorrência de nenhuma, un1a, duas ou três caras respectivamente, como segue: X Evento correspondente o A, ={(r, r, r)} 1 A2 ={(e, r, r), (r, e, r), (r, r, e)} 1 2 Â3 ={(e, e, r), (e, r, e), (r, e, e)} .., J A4 ={(e,e, e)} Poden1os tambétn associar, às probabilidades de X assu1nir un1 dos valores, as proba- bilidades dos eventos correspondentes: 1 P(X =O)= P(A1) = -8 3 P(X = 1) = P(A,) = - 2 - 8 46 Estatística básica Esque1naticamente: X P(X) o 1/8 l 3/8 2 3/8 3 1/ 8 1 3 P(X = 2) = P(A3) = S 1 P(X = 3) = P(A4 ) = 8 3 Grafica1nente: 3 8 l - 8 P(X) • o 1 • ' ' 1 1 ' ' 2 3 Observan1os que e1n 1 fizemos o seguinte tipo de associação: A. o 1 2 3 4 X Então pode1nos dar a seguinte definição: variável alec1tória é a função que associa a todo evento pertencente a un1a partição do espaço amostral um único nú1nero real. Notamos que a variável aleatória para ser discreta deve assumir valores em um con- junto finito ou e1n um conjunto infinito, porém enu1nerável. Jndicare1nos, no caso finito: X: X1, X".!, ... , x,, Por 2 podemos definirfanção de probabilidade. DEFINIÇÃO Função de probabilidade é a função que associa a cada valor assumido pela variá- vel aleatória a probabilidade do evento correspondente, isto é: P(X=x1) = P(A,), i = l , 2, ... , n Capitulo 3 - Variáveis aleatórias discretas 47 Ao conjunto { (x;, p(x;), i = 1, ... , n} damos o no1ne de distribuição de probabili- dades da variável a leatória X como no quadro 3 e gráfico 4 . ' E impor1ante verificar que, para que haja luna distribuição de probabilidades de u1na variável aleatóriaX, é necessário que: li L P(X;) =l í = I Exemplos de aplicação 1. Lança1n-se 2 dados. Seja X a son1a das faces, detenninar a distribuição de probabi- 1 idades de X. X P(X) P(X) 2 l /36 3 2/36 6 - • 36 5 4 3/36 - ' ' 36 5 4/36 6 5/36 7 6136 4 - • • 36 1 1 3 1 1 - • 1 • 36 1 1 1 1 1 1 1 8 5136 9 4/36 10 3/36 2 1 1 1 1 1 1 - ' 1 1 1 ' 36 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 - • 1 1 1 1 1 • 36 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2/36 1 1 1 1 1 1 1 1 1 1 1 1 1 1 12 1/36 2 3 4 5 6 7 8 9 10 1 1 12 1 2. Suponhamos que a variável aleatória X tenha função de probabilidade dada por: Calcular: a) P(X ser par); b) P(X > 3); P( X = j) = ~ , j = 1, 2, 3, .. ., n, ... 21 c) P(X ser múltiplo de 3). Resolução: X 1 2 3 4 5 P(X) 1/2 1/4 1/8 1/ 16 1/32 ... ... 1 X 48 Estatística básica ~ 1 1 l 1/2 1/2 LP(X =X;)=-+-+-+ ... = = = 1 i=I 2 4 8 1- 1/2 1/2 a) P(Xser par) = P(X= 2) + P(X= 4) + P(X= 6) + ... = 1 1 1 114 l / 4 1 = - + - + - + ... = - - - 4 16 64 1-1/ 4 3 / 4 3 b) P(X> 3) = P(X= 3) + P(X= 4) + P(X= 5) + ... = 1 1 1 l / 8 1/8 1 =-+-+-+ ... = - - ou - - 8 16 32 1-1/ 2 112 4 P(X> 3) = 1-P(X < 3) = 1- {P(X= I) + P(X= 2)} = =1-{~+ ~}=1-! = ~ c) P(Xser múltiplo de 3) = P(X= 3) + P(X = 6) + ... = 1 1 1/8 1/8 1 = - +- + = - - 8 64 . . . l - l / 8 7 / 8 7 3.2 Esperança matemática Existem características nu1néricas que são mu.ito i1nportantes em uma distribuição de probabilidades de uma variável aleatória discreta. Sã.o os parâmetros das distribuições. U1n pri1neiro parâ1netro é a esperança ntate111ática (ou si1nples1nente niédia) de tuna variável aleatória. Introduzimos o conceito com o seguinte problema: U1na seguradora paga R$ 30.000,00 em caso de acidente de ca1To e cobra u1na taxa de R$ 1.000,00. Sabe-se que a probabilidade de que u1n carro sofra acidente é de 3%. Quanto espera a seguradora ganhar por carro segurado? Resolução: Suponha1nos que entre 100 carros segurados, 97 dão lucro de R$ I .000,00 e 3 dão prejuízo de R$ 29 .000,00 (R$ 30.000,00 - R$ 1.000,00). Lucro total= 97 · R$ 1.000,00 - 3 · R$ 29.000,00 = R$ 10.000,00 Lucro 1nédio por carro= R$ 10.000,00 : 100 = R$ 100,00 Se cha1narmos de X o lucro por carro, e o lucro médio por carro de E(X), tere1nos: E(X)= 97 ·1.000,00-3·29.000,00 = 100 97 3 = · l.000,00 - . 29.000,00 = 100 100 = 0,97 · l.000,00-0,03. 29.000, 00 Capitulo 3 - Variáveis aleatórias discretas 49 Onde x, = 1.000,00 e p(x,) = 0,97 x2 = -29.000,00 e p(x2) = 0,03 Seja X: x,, .'72, ••. , x,, e P(X = x,) = p(x1), i = 1, ... , n. DEFINIÇÃO li E(X) = I x1 • p(x1) i=I ' A esperança matetnática é u1n número real. E também urna média aritmética pon- derada, con10 foi visto no exen1plo. Notação: E(X), µ(x), µ,, µ .. Exemplos de aplicação 1. Resolução do problema pela definição. X: " lucro" por carro. Fazendo uma tabela, temos: X P(X) X· P(X) 1.000 0,97 970,00 - 29.000 0,03 - 870,00 1 100,00 :. E(X) = R$ 100,00 Isto é, o lucro médio por carro é de R$ 100,00. 2. No problema da página 44, calcular E(X). Resolução: X P(X) X• P(X) o 1/8 o l 3/8 3/8 2 318 618 3 1/8 318 l 12/8 = 1,5 :. E(X) = 1,5 Ou o nú1nero médio de caras no lança1nento de 3 moedas é 1,5 cara. 50 Estatística básica 3. Suponha1nos que un1 número seja sorteado de l a 1 O, inteiros positivos. Seja X o núrnero de divisores do nú1nero sorteado. Calcular o número 111édio de divisores do número sorteado. Resolução: X: número de divisores, logo: Nll Nll de divisores 1 1 2 2 ... .) 2 X P(X) X •P(X) 4 3 1 Ili O 1/ 1 o 5 2 2 4/10 8/ 10 6 4 3 2/10 6/ 10 7 2 4 3/ 10 12/ 10 8 4 1 2,7 9 ,., .) 10 4 . • • E(X) = 2,7 Número médio de divisores do nún1ero sorteado . 4. Nu1n jogo de dados, A paga R$ 20,00 a B e lança 3 dados. Se sair face 1 en1 u1n dos da- dos apenas, A ganha R$ 20,00. Se sair face 1 e1n dois dados apenas, A ganha R$ 50,00, e se sair l nos três dados, A ganha R$ 80,00. Calcular o lucro líquido médio de A em u1ua jogada. Resolu,ção: A: apenas un1a face 1 B: apenas duas faces 1 C: três faces 1 D: nenhuma face 1 :. X: -20, O, 30, 60 Observa1nos que: 1 5 5 75 P( A) = -6 . -6 . -6 . 3 = -21-6 1 1 1 1 P( C) = 6 . 6 . 6 = 216 Recebe 20 50 80 o Paga L ucro líquido 20 o 20 30 20 60 20 - 20 1 l 5 15 P(B)= -6 ·-6 ·-6 ·J= -21-6 P(D)=~·~·~= 125 6 6 6 216 Capitulo 3 - Variáveis aleatórias discretas 51 Fazendo o dispositivo prático: X P(X) X • P(X) - 20 125/216 - 2.500/2 16 o 75/216 o 30 15/216 450/216 60 1/216 60/216 1 - 1.990/216 E(X) = -9,21 Propriedades da esperança matemática 1. E(k) = k, k: constante. Demonstração: li li E(k) = L'.. k· p(x;) = k· L P(X;) = k·l = k i = I i = I 2. E(k · X) = k · E(X) Denionstração: li li E(k · X) = L k ·X; · p(x;) = k · L X;· p(x;) = k· E(X) i = 1 i = 1 3. E(X + Y) = E(X) + E(Y) Essa propriedade será demonstrada posteriorn1ente (página 62). 11 l i 4. E I.. xi = I.. {E(X;)} i=I i =I 5. E(aX + b) = c1E(X) + b, a e b constantes. Denionstração: E(aX + b) = E(ciX) + E(b) = aE(X) + b 6. E(X- µ") = O Demonstração: E(X - µx) = E(X) -E(µx) = E(X) - µt = o 52 Estatística básica 3.3 Variância O fato de conhecermos a média de uma distribuição de probabilidades já nos ajuda bastante, porém não temos uma medida que nos dê o grau de dispersão de probabilidade em torno dessa média. Vin1os que o desvio 1nédio, E{X - µ,} é nulo, logo não serve con10 n1edida de dispersão. A n1edida que dá o grau de dispersão (ou de concentração) de probabilidade e1n torno da rnédia é a variância. Para efetuarmos o estudo da variância, considerare1nos as distribuições das variáveis aleatórias X e Y com as suas respectivas médias. X P(X) X • P(X) y P(I') y . P(I') o 1/8 o - 2 115 - 215 1 6/8 6/8 - 1 1/5 - 1/5 2 1/8 2/8 o 115 o 1 µ.. = 1 ,., ..) 115 3/5 5 115 515 1 µ)" = 1 Fare1nos os gráficos das duas distribuições para ter1nos uma ideia n1elhor da concen- tração ou dispersão de probabil idades em torno da 1nédia, que é 1. 6 - 8 1 - 8 o P(X) • 1 1 l µX ' ' 1 1 1 1 1 1 1 1 1 1 2 X - 2 P(Y) l ' - ' ' 1 5 1 1 1 1 1 1 1 1 1 1 1 1 1 1 - l o l 3 5 y µy Notan1os que há uma grande concentração de probabi lidades en1 X e un1a grande di5persão eni Y, com relaçã.o à média. Definire1nos, agora, variância. VAR(X) =E{[X-E(X)]2 } No caso discreto, seja X: x,, X2, ... , x" e P(X =X;)= p(x;), i = 1, 2, ... , 11. DEFINIÇÃO . . Notação VAR(X), Capitulo3 - Variáveis aleatórias discretas 53 11 V AR(X) = L (x; - µx)2 • p(x;) i =I V(X), cr2(X), cr;, cr2 Calcular e1nos a VAR(X) do exemplo com essa fórmula: X P(X) X· P(X) (X-µ_,) (X-µx) 2 (X - µ.,) 2 · P(X) o 1/8 o - 1 1 1/8 6/8 6/8 o o o 2 1/8 2/8 1 1 1/8 1 µ,.. = 1 VAR(X) = 0,25 Deduzire mos uma fónnula mais fácil operacionalmente de ser aplicada. VAR(X) = E{[X - µ,,)}2 = E{X2 + µ,; - 2µ" ·À] = = E(X2) + E(µ;) - E(2µ." · X) = = E(X2) + µ; - 2µ,. · E(X) = E(X2) + µ; - 2µ . ~ = = E(X2) - µ,; ou YAR(X) = E(X2)- {E(X)} 2 11 Onde E( X2) = L,x;2. p(x;). i=I Calcular emos a VAR(.Y) usando essa fórmula. VAR(Y) VAR(Y) y P(Y) -2 1/5 - 1 1/5 o 1/5 3 1/5 5 1/5 1 = E(Y2)-{E(Y)}2 = 39 -12 5 Y• P(Y) - 2/5 - 1/5 o 3/5 515 µy= 1 Y2 • P(Y) 415 1/5 o 915 2515 E(Y2) = 39/5 54 Estatística básica VAR(Y) = 34 = 6,8 5 VAR(Y) = 6,8 Observando novamente os gráficos e os valores de VAR(X) e VAR(Y), concluímos que: quanto menor a variância, nienor o grau de dispersão de probabilidades eni torno da 111édia e vice-versa; quanto maior a variância, 1naior o grau de dispersão da proba- bilidade eni tomo da 1nédia. A variância é u1n quadrado, e muitas vezes o resultado torna-se artificial. Por exe1n- plo: a altura média de u1n grupo de pessoas é 1, 70 111, e a variância, 25 cm2• Fica bastante esquisito cm2 e1n altura. Contornamos esse "problema" definindo desvio padrão. DEFINIÇÃO Desvio padrão da variável X é a raiz quadrada da variância de X, isto é: O"x = .Jv AR(X) . Nos exemplos Usando a tabela da distribuição normal (que será estudada posterionnente), ven1os que no i11tervalo de (µ - cr) a (µ + cr) o grau de concentração de probabilidades em torno da média é de 68%; no intervalo de (µ - 2cr) a (µ + 2cr), o grau de concentração de probabilidades em torno da 111édia é de 95%, e essa concentração é de 99,7% no intervalo de (µ - 3cr) a(µ + 3cr). µ - 30' µ - 20' µ - O' µ µ+cr µ + 20' µ + 30' - ' ' ' ' ' ' ' ~ 68% 4 95% . 99,7% -----------..! Exe1nplificando, se dissern1os que a altura 1nédia (µ)do home1n brasileiro adulto é de l , 70 111, e desvio padrão ( cr), 5 c1n, estaremos dizendo que entre: 1,65 me 1,75 m enco11tra1nos 68o/o da população 1nasctilina adulta brasileira 1,60 me 1,80 m encontra111os 95% da população 111asculina adulta brasileira 1,55 me 1,85 1n encontra1nos 99,7% da população masculina adulta brasileira Capitulo 3 - Variáveis aleatórias discretas 55 Exemplo de aplicação Os empregados A, B, C e D ganham 1, 2, 2 e 4 salários mínimos, respectivamente. Retiratn-se amostras con1 reposição de 2 indivíduos e 1nede-se o salário 1nédio da a1nos- tra retirada. Qual a média e desvio padrão do salário Lnédio amostral? Resolução: Amostras Salário médio Amostras 11, A 1,0 CA ' A,B l 5 ' C,B A, C 1,5 c, c A, D 2,5 C, D B,A 1,5 D, A B,B 2,0 DB ' B,C 2,0 D C' ' B,D 3,0 D,D Seja X: salário 1nédio amostral X P(X) X• P(X) X 2 • P(X) 1,0 1/16 1/16 1/ 16 1,5 4/16 6/ 16 9/16 2,0 4/16 8/ 16 16/ 16 2,5 2/16 5/ 16 12,5/16 3,0 4/16 12/16 36/16 4,0 l/16 4/ 16 16/16 1 µ=9/4 E(X2) = 90,5/ 16 Logo: E(X) = 9 = 2,25, n1édia do salário n1édio an1ostral. 4 VAR(X)= 9 ~~ 5 - (:) 2 =0,59375 ª·" = 0,77 Desvio padrão do salário médio a1nostral. Propriedades da variância 1. VAR (k) = O, k: constante Den1ons1ração: V AR(k) = E{[k-E(k)]2} = E{[k-k] 2 } =O Salário médio 1,5 2,0 2,0 3,0 2,5 3,0 3,0 4,0 56 Estatística básica 2. VAR(k·X)=k2 ·VAR(X) VAR(k ·X)= E{[kX -E(kX)]2 } = E{[kX -kE(X)2 } = =E{k2[X-E(X)]2 }=k2 ·E{[X -E(X)]2 }= K 2 ·VAR(X) 3. VAR(X+ Y)= VAR(X)+ VAR(Y)+ 2 cov(X,Y) VAR(X + Y) = E{[(X + Y)-E(X + Y)]2 } De1nonstração: DEFINIÇÃO = E{[(X - E(X)) + (Y-E(Y))]2 } = = E{[(X - E(X)]2 +[Y - E(Y)]2 + + 2[X - .E(X)] · [Y - E(Y)]} = = E{[X -E(X)]2} + E{[Y -E(Y)]2 } + + 2E{[X-E(X)]·[Y-E(Y)]}= =V AR(X) + VAR(Y) ± 2 cov(X,Y) Covariância entre X e Y. cov(X,Y) = E{[X -E(X)] · [Y -E(Y)]} A covariância n1ede o grau de dependência entre as duas variáveis X e Y. 5. V AR(aX + b) = a 2V AR(X), a e b constantes. De1nonstração: V AR(aX + b) =V AR(aX) +V AR(b) + 2cov(aX,b) Con10 cov(aX,b) = E{[aX -E(aX)][b -E(b)] } =O, te1nos: VAR(aX±b)=a2 VAR(X) Capitulo 3 - Variáveis aleatórias discretas 57 3.4 Distribuição conjunta de duas variáveis aleatórias Muitas vezes estaren1os i11teressados em estudar mais de urn resultado de um experi- mento aleatório. Faren1os, apenas, o estudo das variáveis aleatórias bidimensionais. Jntroduzire1nos esse assunto con1 o seguinte problema: Dado o quadro a seguir, referente ao salário e tempo de serviço de dez operários, deter111inar a distribuição conjunta de probabilidade da variável X: salário (reais); e da variável Y: te1npo de serviço e1n anos. Operário A B e D E F G H I J X 500 600 600 800 800 800 700 700 700 600 y 6 5 6 4 6 6 5 6 6 5 Fare1nos un1a tabela de dupla entrada, no corpo da qual colocaren1os a probabilidade conjunta das variáveis X e Y. Assi1n, por exemplo: P(X = 500, Y = 4) = O, pois não há nenhum operário que ganhe 500 e tenha 4 anos de serviço. P(X = 600, Y = 5) = -3._, pois te1nos dois operários que ganhan1 600 e tên1 5 anos 10 de serviço. De modo análogo, calcularemos as den1ais probabilidades conjuntas, que aparecem no quadro. ~ 4 5 6 Totais das linhas 500 o o 1 /1 o 1/1 o 600 o 2/10 1 /)o 3/10 1 700 o 1/ 10 2/10 3/10 800 1/10 o 2/10 3/1 o Totais das colunas 1/10 3/1 o 6/1 o 1 Função de probabilidade conjunta Seja X uma variável aleatória que assun1e os valores x,, X2, ... , Xm, e Y uma variável aleatória que assume os valores y., y2, ... , y,,. DEFINIÇÃO A função de probabilidade conjunta associa a cada par (x;, yj), i = l, ... , m e j = 1, ... , n, a probabilidade P(X =X;, Y = Y.;) = p(x;; yj)· Da1nos o non1e de distribuição conjunta de probabilitlades da variável bitfitnen- sional (X, Y) ao conjunto: {(x;,y) , p(x;, )]), i = 1, ... ,ni ej = l, ... ,n} 58 Estatística básica Observatnos que: 111 11 L,.L,.P(X =X;, Y= Jj) = 1 i=I .i=I A representação gráfica da variável bidimensional (X, .Y) é: 2 10 1 - 10 P(X, Y) • . • • . . : 4 . . . 5 • . • . • . . . . . . . · :.· : .•. . .. ~ ' . . . .. 500 . . . .· ' ' . . : . ' . . ... .... .. .. ... .... . , .. . .. . ·:· · fl· · ··:-·· ·· ··· ·J'··· . . " . . . . . ' . ... . . "' . . ~ : . .. . . . . . . . : ... 600 .·· : : : .·· : . .· .· : . : .. · : :.· ,,,,,,,,,,,,.,,,,,4,,,,",\'"''''''''''''''':,,,, . .·. : . . : ... . . / . . . . . : . . . . . . . . . . . . 00 . . ' . . . 7 ... ~ ... .....• : ...... ..... , ~ · .. .. ; ....... ~ .. :. . . . . . . .. . . . . . . . . . . . . . . . . " . . . . . 800 : .. ·· ... · : .. ·· - - · - -- -- . - . - . .f. -- - . - - ... -~· -- -- . - - .. - -- . .:. - X Distribuições marginais de probabilidades Distribuição marginal de X Da Tabela 1 tiramos a tabela: X P(X) 500 1 /1 o 600 3/1 o 700 3/10 800 3110 1 A probabi 1 idade marginal de X= 600 é: 6 y P(X= 600, Y= 4) + P(X= 600, Y= 5) + P(X= 600, Y= 6) = =O+~+_!_= 2_ 10 10 10 Logo, pode1nos definir probabilidade 1narginal de X= X;, i = fixo. DEFINIÇÃO e Capitulo 3 - Variáveis aleatórias discretas 59 n P(X = x1) = L P(X = x;,Y = y j), i = 1, 2, ... , m J= I n1 111 11 L P( X = X;) = L L p(x;, Ji) = 1 i=I i =l .i=I Distribuição marginal de Y Da Tabela 1 tiramos a tabela: y P(Y) 4 1/ 10 5 3/ 1 o 6 6/10 1 Observamos que a probabilidade marginal de Y = 6 é: P(X= 500, Y = 6) + P(X= 600, Y = 6) + P(X= 700, Y = 6) + 1 1 2 2 6 +P(X=800 Y=6)= - + - + - + - = - , 10 10 10 10 10 Logo, podemos definir a probc1bilidade 111arginal de Y = y1, j =fixo. DEFINIÇÃO //l P(Y=y;) =L.P(X=x; ,Y=Ji),j=l, 2, .. . , n i =I e li li "' L. P(Y = yj) = LLP(Xi,yj) .i=• .i= l i =I Podemos, dada a distribuição conjunta de probabilidade mostrada na Tabela 1, calcular E(X): salário 1nédio; e E(Y): tempo 111édio de serviço. 60 Estatística básica X P(X) X ·P(X) 500 1/10 500/10 600 3/10 1.800/1 o 700 3/10 2.100/ 10 800 3/10 2.400/ 10 1 680 :. E(X) = 680 O salárjo médio dos operários é de R$ 680,00 y P(Y) y. P(Y) 4 1/ 1 o 4/ 10 5 3/10 15/1 o 6 6/1 0 36/10 1 5,5 :. E(Y) = 5,5 O tempo 1nédio de serv iço dos operários é 5,5 anos. Distribuições condicionais Poderemos estar interessados e1n calcular o salário 1nédio dos operários co1n 5 anos de serviço, por exemplo. Queren1os E(XIY = 5). DEFINIÇÃO p(X = x.; Y = .Y.·) j =fixo P(X= x;IY=Yi)= ' .1, '. · .P(Y = Y;-) i = 1, 2, .. ., tn DEFINIÇÃO p(X = x .; Y = y) i =fixo P(Y= y ./X=x)= ' .1 1 ' P(X=x;) 'J=l, 2, ... , n e P(X= x;) :f:. O DEFINIÇÃO DEFINIÇÃO Assi1n: e Capitulo 3 - Variáveis aleatórias discretas 61 j = 1, ... , n j =fixo i= fixo i = 1, 2, ... , m p (X= 500/Y = 5) = P(X = 500, y = 5) = O = O P(Y = 5) 3/10 P (X= 600IY= 5) = P(X = 600,Y = 5) = 2/ 10 = 2 P(Y = 5) 3/ 10 3 P(X = ?OO / y = 5) = P(X = 700, Y = 5) = 1/ 1 O = _! P(Y = 5) 3 / 10 3 P(X=8001Y=5)= P(X=800, Y=5) = O =O P(Y = 5) 3 / 10 Calculando E(X/Y = 5), temos: X P(X/Y=S) X· P(X/Y= 5) 500 o o 600 213 1.200/3 700 I /"' . .) 700/3 800 o o 1 1.900/3 :. E(X!Y= 5) = 633,33 :. o salário médio dos operários com 5 anos de serviço é de R$ 633,33. Da mesma forn1a, pode1nos definir: 62 Estatística básica Ili VAR(X IY = ~) = L (x; - µ) 2 · p(x;I~) Oll i =I onde Ta1nbé1n fl V AR(Y/X = x;) = L (Yj -µ) 2 • p(yilx;) ou j =I , , V AR(YIX =X;)= E(Y- /X = X;)-{E(YIX =X;)}-, onde 2 ~ 2 i = l, 2, ... , n1 E'(Y I X= x;) = ~ y j · p(yjlx;)· j =I i =fixo Co1no aplicação dessas definições, podemos calcular o te1npo n1édio de serviço e o desvio padrão dos operários com salários de R$ 700,00. Queremos E(YIX = 700) e VAR(YIX = 700). y P(YIX=700) Y · P(YIX= 700) 4 o 5 1/3 6 2/3 1 17 :. E(YIX = 700) = - = 5,67 3 V AR(Y IX = 700) = '!!_ -(!2)2 = 3_ 3 3 9 :. (J" (YIX = 700) = H = 0,47 o 5/3 12/3 17/3 Y2 · P(YIX = 700) o 25/3 72/3 97/3 Capitulo 3 - Variáveis aleatórias discretas 63 Variáveis aleatórias independentes . X : ,'Ç" x2 , ••. , x111 e P(X = x;) = p(xi), i = 1, ... , m Sejam . Y: y ,, ; 12 , ••. , y,, e P(Y = y1 ) = p(y1 ),J=1, 2, .. ., n DEFINIÇAO As variáveis aleatórias X e Y são independentes se, e somente se, P(X =X;, Y = y1) = P(X = x;) · P(Y = y1),para todo par (x;, y1) , i = 1, 2, ... , rn ej = 1, 2, ... , n. As variáveis X e Y do probletna 1 não são independentes, pois, por exemplo, 1 l 1 P(X=500, Y= 4)=0 eP(X=500)·P(Y=4)=w·w= lOO :. P(X = 500,Y = 4) t: P(X = 500) · P(Y = 4). Funções de variáveis aleatórias Conhecidas X, Y e P(X, Y), podere1nos estar interessados em calcular F(X, Y), isto é, fun- ções de X e YcomoX+ Y,X-Y,X· Y, 2X + 3Y, 3X-2f etc. Vere1nos primeiro alguns resultados iJnportantes. X: x,, X2, .. ., Xm e P(X =X;) = p(x;), i = 1, ... , 1n Y: y,, y2, .. ., y,, e P(Y = J'.i) = pÚ'J), j = 1, .. ., n Logo (X, Y): (x., y ,), (x,, )'2), ... , (x,,,, y,,) e i = 1, .. . , m. P(X=xt, Y=y 1 )=P(x;,y 1 ) . . _ 1 J - , .. .,n 1. E(X + Y) = E(X) + E( Y) Den1onstração: 111 li Jtl li E(X + Y) = LL(x; + y1) · p(x;,y1) = LLX; · p(x;,;11 )+ i=j J= I i= I J= I 111 11 Ili 11 n Ili ±LL.Y; · p(xi>y1) = L X; L P(X;•JI;) ± L Y1 L P(XPY,;) = i= j J=I i=I J=I J=I i=I n1 11 = L X;· p(x;)+ L Y1 · p(y1) = E(X)+ E(Y) i =I .i= 1 (Demonstra1nos a propriedade 3 da Esperança.). 64 Estatística básica 2. Cov(X,Y) = E(X · Y)-E(X) · E(Y) De111onstração: cov(X, Y) = E{[X - µx ][Y- µy]} =E {XY-X · µ)' - µ,, · Y + + µ ,, · µ )' }=E(X·Y)-E(X· µ y)-E(µ ... ·Y)+ +E(µ,, · µ)' ) = E(X · Y)- µy · E(X)- - u . · E(Y) + µ · µ = E(X · Y) - µ · µ - J ,\ ;e y y .t -,u .. . µ,, +µ.X. µy =E(X. Y)- µX. µy 3. Se X e Y são independentes, então E(X · Y) = E(X) · E(Y). De111onstração: ,, , 11 E(X · Y) = LLX; · y1 · p(x;.y1) = i =I i=I Ili li = LLX;. Y1 . p(x;)· P()l;) = i =I J=I 111 11 =LX;· p(x;) · L YJ · p(y1 ) = E(X) · E(Y) i=I j = I 4. Se X e Y são independentes, então cov(X, Y) = O. A recíproca não é verdadeira. 5. Se X e Y são independentes, então VAR(X + Y) = VAR(X) + V AR( Y) 6. Se X1, X2, ... , X,, são independentes, então Ili 111 VAR 2:xi = 2: VAR(X;) i=I i =I Aplicação: ~ o 1 2 3 o 1/8 2/8 J/8 o l o 1/8 2/8 1/8 Dada a distribuição conjunta de probabil idades da variável (X, Y), representada pela tabela acin1a, calcu lar: a) E(2X-3Y) Capitulo 3 - Variáveis aleatórias discretas 65 b) cov(X, Y) e) VAR(2X-3Y) d) E(YIX= 1) Resolução: y o X o 1/8 l o P(Y) 1/8 y. P(Y) o yz. P(Y) o 1 2 2/8 1/8 1/8 2/8 3/8 3/8 3/8 6/8 3/8 12/8 3 P(X) X· P(X) X 2 • P(X) o 4/8 o o 1/8 4/8 4/8 4/8 1/8 1 E(x) = 0,5 E(i2) = 0,5 3/8 E(Y) = 1,5 9/8 E(Y2) = 3 1 4 1 ObservamosqueP(X=O,Y= O)= 8 , P(X= 0)=8 eP(Y=O)= 8 . P(X =O, Y =O)~ P(X =O) · P(Y =O) :. X e Y não são independentes. :. E(X) = 0,5 e VAR(X) = 0,5 - 0,52 = 0,25 : . :. VAR(X) = 0,25 e cr., = 0,5 :. :. E(Y) = 1,5 e VAR(Y) = 3 - l ,52 = 0,75 :. :. VA:R(Y) = 0,75 e O'y = 0,87 Calcularemos agora a cov(X, Y). Defin i reinos a variável Z =X· Y e faremos a distri- buição de Z. z o 1 2 3 :. E(Z) = E(X · Y) = 1 Como P(Z) 4/8 1/8 2/8 1/8 1 Z · P(Z) o 1/8 4/8 3/8 E(Z) = 1 cov(X, Y) = E(X · Y) - E(X) · E(Y), 66 Estatística básica te1nos cov(X, Y) = l -0,5 · 1,5 = 0,25. a) E(2X -3Y) = 2E(X)-3E(Y) = 2 · 0,5 -3 · 1,5 = -3,5 b) cov(X, Y) = 0,25 c) VAR(2X - 3 Y) = VAR(2X) + VAR(3 · Y) - 2cov(2X, 3 Y) = = 4VAR(X) + 9VA.R(.Y)- J.2cov(X, Y) = = 4 . o 25 + 9 . o 75 - 12. o 25 = 4 75 ' ' ' ' Obs.: cov(2X, 3Y) = E{[2X - E(2X)][3Y - E(3.Y)]} = = E{[2X- 2E(X)] · [3 Y - 3E(Y)]} = 6E{[X-E(X)]}[Y-E(Y)]} = 6 cov(X, Y) d) E(YIX= 1) y P(Y/X = 1) Y · P(YIX= 1) o o o l 1/4 1/4 2 2/4 4/4 3 l/4 3/4 1 2 :. E(YIX= 1) = 2 Coeficiente de correlação Se estiver1nos estudando a dependência entre as variáveis X: altura do pai em cm, e Y: altura do J !! filho e1n c1n, ao calcularn1os a covariância, teremos u1na 1ned ida ao quadrado (c1n2). Além disso, o ca1npo de variação da covariância é 1nuito an1plo, isto é, -oo < cov(X, Y) < +oo. Introduziremos o conceito de coeficiente ele correlação, que supera esses problemas. Coeficiente de correlação (p) entre X e Y DEFINIÇÃO cov(X,Y) p= a .. ·a >' Capitulo 3 - Variáveis aleatórias discretas 67 També1n: e JpJ:s;l => - 1 <p<+l. a X,)' p= a x· a )' -- a) Quando p >O, cov(X, Y) >O. O diagra1na de dispersão é: (p - +l) y • µy - - - - - - - b) Quando p <O, cov(X, Y) <O. Graficatnente: (p - - 1) y • X X e) Quando p = O, cov(X, Y) = O, o que graficamente é: y • • • • • • • • • µy • • • • • • • X 68 Estatística básica Observa1nos que quando p > O e p < O, as "nuvens" de pontos dos diagramas de dispersão (a) e (b) apresentan1 u1na "tendência" linear. Quanto n1ais próximo for p de + 1 e p de - 1, maior o grau de dependência entre as variáveis e maior a confiabilidade de se escrever tuna variável e1n função da outra por 1neio do processo dos mínimos quadrados, por exemplo. Exemplo de aplicação Dada a distribuição conjunta bidi1nensional (X, Y) representada pela tabela de dupla entrada, determinar: a) p; b) a representação espacial de P(X, Y); c) se possível, a reta de regressão de Y e1n função de X. ~ o o o l o 2 l/4 Resolução: ~ o 1 2 o o o 1/4 l o 2/4 o 2 1/4 o o P(Y) 1/4 2/4 1/4 y. P(Y) o 2/4 2/4 y 2 . P(Y) o 2/4 414 Verificando se X e Y são independentes. P(X=O,Y= O)=O 1 P(X=0)=- 4 1 P(Y=0)= - 4 1 1 1 P(X =O)· P(Y =O)= - ·-· - :. 4 4 16 1 2 o l/4 2/4 o o o P(X) X· P(X) 1/4 o 2/4 214 114 2/4 1 E()() = 1 E(Y) = 1 E(Y2) = l,5 X 2 • P(X) o 2/4 4/4 E(X2) = 1,5 Capitulo 3 - Variáveis aleatórias discretas 69 :. P(X= O, Y= O) -:t- P(X= O)· P(Y-:t- O) :. :. X e Y não são independentes. Seja Z =X · Y. Calculare1nos E(X · Y). z o 1 2 4 E(Z) = E(X · Y) = 0,5 cov(X, Y) = 0,5 - 1,1 =0,5 VAR(X) = 1,5-1 2 = 0,5 VAR(Y) = 1,5 - 12 = 0,5 P(Z) 214 214 o o 1 a x =J0,5 aY =J0,5 = -0,5 = -1 JO,S·J0,5 Z · P(Z) o 214 o o 0,5 Co1no p = - 1, existirá u1na reta de regressão de Y e1n função de X, Y = aX + b. Nesse exen1plo específico é fácil detenn inarn1os esta equação, sem o uso do processo dos n1í- nin1os quadrados, pois, grafican1ente: • • 1 P(X, Y) 2 - 4 ' 1 • • - 4 • • • 1 • • Y=aX+b O>-- ~.__~ ~l ~~~...:;;,,..:::::.... ~~~ -.y / , / , , , / , , , , . , / . / , / / _________ ... , / / / / / / , , _________ ..... _________ _ 70 Estatística básica No plano (X, O, Y), ten1os: y 2 1 ---- -- --- -- --- : o A equação da reta, nesse caso, é: 1 -- -• . . . • . . 2 Y =- X+2 3.5 Funcão de distribuicão I I X Suponha1nos que u1na variável. aleatória discreta X tenha a seguinte distribuição de probabilidades. X P(X) 1 O, 1 2 0,2 "' .) 0,4 4 0,2 5 0,1 Defini1nosfunção de distribuição de X: F(x) = P(X $, x) = L P(x1) .t 1 :S.r Ten1os, então: F( 1) = P(X < 1) = P(X = 1) = O, 1 F(2) = P(X< 2) = P(X= 1) + P(X= 2) = 0,3 F(3) = P(X~ 3) = P(X = 1) + P(X= 2) + P(X = 3) = = F(2) + P(X= 3) = 0,3 + 0,4 = 0,7 F(4) = P(X< 4) = P(X< 3) + P(X= 4) =F(3) + P(X= 4) = = 0,7 +0,2 = 0,9 F(5 ) =P(X< 4) + P(X= 5) = F(4) + P(X = 5) = 0,9 + 0,1 = 1 Capitulo 3 - Variáveis aleatórias discretas 71 Poden1os calcular ta1nbé1n: F(l,34) = P(X < 1,34) = P(X< 1) = F(I) = 0,1 F(3,98) = P(X < 3,98) = P(X < 3) = F(3) =O, 7 F(7) = P(X< 7) = P(X< 5) = F(5) = l F(- 3) = P(X ::S-3) =O Com esses resultados podemos escrever: O seX <1 0,1 se 1<X<2 0,3se2s;X<3 F(x) = O, 7 se 3 <X< 4 Fazendo o gráfico de F(x), te1nos: 1 0,9 0,7 0,3 0,1 F(x) o l 0,9 se 4s;X <5 1 se X> 5 --o 1--0 1--0 2 3 4 X O domínio de F(x) é IR e o contradon1ínio é o conjunto {O, 1; 0,3; O, 7; 0,9; I}. Propriedades de F(x) 1. O <F(x) < 1 Co1no F(x) = P(x < x) e O < P(X = x) < 1 ~ O < F(X) < 1. 2. F(- oo)=O F(-oo) = lim F(x) =O x -+-oo Co1no se pode ver no exercício. 72 Estatística básica 3. F(+oo) = 1 F(+oo)= limF(x)=l .Y ... +o:> corresponde ao evento certo. 4 . F(x) é descontínua nos pontos X = xo, onde P(X = xo) * O. 5. F(x) é contínua à direita dos pontos X= xo, onde P(X = xo) *O. 6. P(a <Xs b) = F(b) - F(a) a b Pode1nos escrever: (- oo, b] = (- oo, a] u (a, b] (mutuamente exclusivos). :. P(X< b) = P(X< a) + P(a <Xs b) P( a <X< b) = P(X < b) - P(X < a) : . :. P(a < Xs b) = F(b) - F(a) 7. P(a <X< b) = F(b) - F(a) + P(X= a) Como (as X< b) ~ [a, b] = (c1, b] u{a}, te1nos: P(a <X< b) = F(b)-F(a) + P(X= a). 8. P(a < X < b) = F(b) - F(a) - P(X= b) Con10 (a, b] = (a, b) u {b} , P(a <X< b) = F(b)-F(a)-P(X= b). 9. F(x) é un1a função nã.o decrescente. Co1110 P(a < Xs b) = F(b) - F(a) ~O~ F(b) ~ F(a), logo, F(x) é não decrescente. Exemplo de aplicação Seja X a variável aleatória discreta co1n F(x) dada pelo gráfico. Detern1inar E(X) e VAR(X). Capitulo 3 - Variáveis aleatórias discretas 73 l 0,9 0,8 F(x) 1-----<0 1-----<0 0,4 1---0 0,1-+---o o 1 2 3 4 X Co1no foi visto no exe1nplo, o "degrau" e1n X= a é igual a P(X =a). Logo podemos forn1ar a tabela da distribuição de probabilidades de X. X P(X) X· P(X) X2. P(X) o O, 1 o o 1 0,3 0,3 0,3 2 0,4 0,8 1,6 3 O, l 0,3 0,9 4 o, 1 0,4 1,6 l 1,8 4,4 E(X) = 1,8 VAR(X) = 4,4 - 1,82 :. VAR(X) = 1,16 Exercícios resolvidos 1. Uma urna contén1 4 bolas brancas e 6 pretas. Três bolas são retiradas cotn reposição. Seja X o núrnero de bolas brancas. Calcular E(X). P(X= O) = P(3P) = 0,6 · 0,6 · 0,6 = 0,216 P(X= 1) = P(lB e 2P) = 0,4 · 0,6 · 0,6 · 3 = 0,432 P(X = 2) = P(2B e lP) = 0,4 · 0,4 · 0,6 · 3 = 0,288 P(X = 3) = P(3B) = 0,4 · 0,4 · 0,4 = 0,064 7 4 Estatística básica X o l 2 ,., .) • • • P(X) X· P(X) 0,21 6 o 0,432 0,432 0,288 0,576 0,064 0,192 1 1,2 E(X) = 1,2 2. Un1 caça-níquel te1n dois discos que funcionam independenten1ente um do outro. Cada disco tem 1 O figuras: 4 maçãs, 3 bananas, 2 peras e 1 laranja. Un1a pessoa paga R$ 80,00 e aciona a 111áquina. Se aparecere1n 2 maçãs, ganha R$ 40,00; se aparecerem 2 bananas, ganha R$ 80,00; R$ 140,00 se aparecerern 2 peras; e gan_ha R$ 180,00 se apareceren1 2 laranjas. Qual a esperança de ganho nun1a única jogada? P(1\1) = 0,4; P(B) = 0,3; P(P) = 0,2 e P(L) = O, 1 P(Mn M) = 0,4 · 0,4 = 0,16 P(B n B) = 0,3 · 0,3 = 0,09 P(J> n P) = 0,2 · 0,2 = 0,04 P(L n L) = 0,1 ·0,1 =0,01 Logo, P(2 frutas diferentes) = 1 - {O, 16 + 0,09 + 0,04 + 0,01 } = O, 70 Paga 80 80 80 80 80 Recebe 40 80 140 180 o • • • X: lucro P(X) X· P(X) --40 0,] 6 -6,40 o 0,09 0,00 60 0,04 2,40 100 0,01 1,00 - 80 0,70 - 56,00 1 - 59,00 E(X) = - 59,00 A esperança de a pessoa "lucrar" numa única jogada é negativei. 3. Na produção de urna peça são e1npregadas duas n1áquinas. A pri1neira é utilizada para efetivamente produzir as peças, e o custo de produção é de R$ 50,00 por uni- dade. Das peças produzidas nessa rnáquina, 90% são perfeitas. As peças defeituosas (produzidas na primeira ináquina) são colocadas na segunda tnáquina para a tenta- tiva de recuperação (torná-las perfeitas). Nessa segunda máquina o custo por peça é de R$ 25,00, mas apenas 60% das peças são de fato recuperadas. Sabendo que Capitulo 3 - Variáveis aleatórias discretas 75 cada peça perfeita é vendida por R$ 90,00, e que cada peça defeituosa é vendida por R$ 20,00, calcule o lucro por peça esperado pelo fabricante. Custo Venda X(lucro) P(X) X · P(X) 50 90 40 0,9 36,00 peças perfeitas na lq máquina 50 + 25 90 15 0,06 0,90 peças perfeitas na 2° máquina 50 + 25 20 -25 0,04 -2,20 peças defeituosas l E(X) = 34,70 O lucro esperado, por peça, é R$ 34, 70 . 4. Um supermercado faz a seguinte pron1oção: o cliente, ao passar pelo caixa, lança u1n dado. Se sair face 6 tetn u1n desconto de 30% sobre o total de sua conta. Se sair 5 o desconto é de 20%. Se ocorrer face 4 é de 10%, e se ocon·erem faces 1, 2 ou 3 o desconto é de 5%. a) Calcu lar a probabilidade de que nutn grupo de 5 clientes, pelo 1nenos um consi- ga um desconto 1naior que l 0%. b) Calcular a probabilidade de que o 42 cliente seja o pri1neiro a conseguir 30%. c) Calcular o desconto n1édio concedido. J~esolução: 1 Face 6: 30% ~ P(6) = 6 1 Face 5: 20% ~ P(5) =- 6 1 Face4: 10%~P(4)= 6 3 Face (1, 2 ou 3): 5% ~ P(l ou 2 ou 3) = 6 a) P(Pelo menos 1 > lOo/o) = 1 - P(nenbu1n > 10%) = 1-(: ) 5 = 0,8683 1 b) A: conseguir desconto de 30% ~P( A) = 6 - - - ( 5 ) 3 ( 1 ) 125 P(A A A e A)= 6 · 6 = 216 =0,0965 e) X: Desconto 76 Estatística básica X 30 20 10 5 :E • • • P(X) 1/6 1/6 116 316 l E(X)= 12,5% Desconto médio X· P(X) 3016 20/6 10/6 15/6 7516 5. Un1 banco pretende au1nentar a eficiência de seus caixas. Oferece u1n prêmio de R$ 150,00 para cada cl iente atendido além de 42 clientes por dia. O banco tem um ganho operacional de R$ 100,00 para cada cliente atendido alé1n de 41. As probabi- lidades de atendimento são: N11 clientes Até 41 42 43 44 45 46 Probabilidade 0,88 0,06 0,04 o 0 1 , 0,006 0,004 Qual a esperança de ganho do banco se este novo s.istetna for implantado? X: ganho (lucro) N2 clientes Paga Ganha X P(X) X· P(X) Até 41 0,00 0,00 0,00 0,88 0,00 42 0,00 100,00 100,00 0,06 6,00 43 150,00 200,00 50,00 0,04 2,00 44 300,00 300,00 0,00 0,01 0,00 45 450,00 400,00 -50,00 0,006 --0,30 46 600,00 500,00 - 100,00 0,004 -0,40 1 7,30 E(X) = 7,30 Logo, o sistema é vantajoso para o banco. 6. Sabe-se que t11na 1noeda 1nostra a face cara quatro vezes 1nais do que a face coroa, quando lançada. Esta 1noeda é lançada 4 vezes. Seja X o número de caras que apa-rece, detennine: a) E(X) b) VAR(X) e) P(X> 2) d) P(l <X < 3) Capitulo 3 - Variáveis aleatórias discretas 77 Resolução: Seja P(r) = p eP(c) = 4p comp + 4p = 1 ~ p=..!., logo 5 4 P(c)=5=0,8 1 P(r) = 5= 0,2 P(X= O)= P(4r) = (0,2)4 = 0,0016 P(X = l) = P(I e e 3r) = (0,8) · (0,2)3 · 4 = 0,0256 P(X = 2) = P(2c e 2r) = (0,8)2 · (0,2)2 • 6 = O, 1536 P(X= 3) = P(3c e Ir) = (0,8)3 • (0,2) · 4 = 0,4096 P(X = 4) = P( 4c) = (0,8)4 = 0,4096. X P(X) X· P(X) o 0,0016 o 1 0,0256 0,0256 2 0,1536 0,3072 " .) 0,4096 1,2288 4 0,4096 1,6384 l 3,20 a) E(X) = 3,20 b) VAR(X) = l 0,88 - 3,202 = 0,64 c) P(X> 2) = P(X= 2) + P(X= 3) + P(X= 4) = X 2 • P(X) o 0,0256 0,6144 3,6864 6,5536 10,88 =o, 1536 + 0,4096 + 0,4096 = 0,9728 ou P(X> 2) = 1 - P(X<2) = 1 - {P(X= O)+ P(X= l)} = = 1 - {0,0016 + 0,0256} = 1 - 0,0272 = 0,9728 d) P(I <,\'. <3) = P(X= l)+P(X= 2) = 0,0256+0,1536 = 0, 1792 7. As probabilidades de que um aluno no período das provas tenha uma ou duas pro- vas, no mesruo <li.a, são 0,70 e 0,30 respectiva1nente. A probabilidade de que deixe de fazer uma prova, por razões diversas, é 0,20. O te1npo de duraçã.o de cada prova é de 90 minutos. Faça X o te1npo total gasto, por dia, que ele usa fazendo as provas. Achar e1n 1nédia quantas horas gasta, por dia, resolvendo as provas. 78 Estatística básica - P(lPeF) 0,14 F (+) P(F) = 0,1520 IP 0,7 ~Fl P(lP e Fl) 0,56 - (+) P(Fl) = 0,656 - P(2Pe F) 0,012 (0,2)2 F 0,3 P(2Pe .Fl) 2P Fl 0,096 0,2 . 0,8 . 2 (0,8) 2 F2 P(2PeF2) 0,192 P(F2) = O, 192 X P(X) X· P(X) o 0,152 o 90 0,656 59,04 180 o, 192 34,56 L 1 93,6 E(X) = 93,6 min:: lh 34 min. 8. U1n jogador A aposta co1n B R$ 100,00 e lança 2 dados, nos quais as probabilida- des de sair cada face são proporcionais aos valores da face. Se sair so1na 7, ganha R$ 50,00 de B. Se sair so1na 11 , ganha R$ 100,00 de B; e se sair so1na 2, ganha. R$ 200,00 de B. Nos den1ais casos A perde a aposta. Qual a esperança de lucro (ganho) do jogador A em uma única jogada? Sejam: P(l) = p , P(2) = 2p, P(3) = 3p, P(4) = 4p, P(5) = 5p e P(6) = 6p. Corno logo P(l) = _!_ 21 P(2)=~ 21 P(3)=1_ 21 6 LP(i) = 1 => 2lp = l, i = I l p=- 21 X: so1na 7 Y: so.1na 11 Z: soma 2 T: outra so1na Capitulo 3 - Variáveis aleatórias discretas 79 P(4)=_i_ 21 P(5)=2_ 21 P(6)= ;l Logo E, portanto, Paga 100 100 100 100 X={(l, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, l)} f ={(5, 6), (6, 5)} Z={(l, l)} P(X) = 56 P(Y) = 60 P(Z) = 1 . 441 ' 441' 441 P(T)=l- 56 _ 60 _ 1 _ 324 441 441 441 441 Recebe X: "lucro" P(X) 50 -50 56/441 100 o 60/441 200 100 l /441 o - 100 324/441 L E(x) 35.100 ogo = - ---7 441 E(X) = -R$ 79,59 X·P(X) - 2.800/441 o 100/441 - 32.400/441 - 35.100/44 1 Portanto, a esperança de ganho do jogador A em tuna única jogada é negativa. 9. Seja O paraX<O O, l para O~ X< 1 0,3 para 1 <X< 2 F(x) = 0,5 para 2 ~X< 3 0,8 para 3 <X< 4 0,9 para 4 <X< 5 1 para X> 5 80 Estatística básica a) Construir o gráfico de F(x). b) Determinar a distribuição de X, E(X) e V AR(X). c) Sendo Y= 3X- 2, calcular E(Y) e VAR(Y). Resolução: a) F(x) 1 0,9 o 0,8 o 0,5 1---0 0,3 t---0 0,1 -----O o 1 2 3 4 5 X b) X P(X) X· P(X) X2. P(X) o 0,1 o o 1 0,2 0,2 0,2 2 0,2 0,4 0,8 ,., .) 0,3 0,9 2,7 4 O, l 0,4 1,6 5 o, 1 0,5 2,5 1 2,4 7,8 E(X) = 2,4 VAR(X) = 7,8 - 2,42 = 2,04 c) Y = 3X-2 E(Y) = E(32(- 2) = 3E(X) - E(2) = 3 · 2,4 - 2 = 5,2 VAR(Y) = VAR(3X- 2) = 9 VAR(X) = 9 · 2,04 = 18,36 l O. Dadas as distribuições das variáveis X e Y, independentes, construir a distribuição conjunta de (X, Y). Sendo Z = 3X + Y, calcular a E(Z) e VAR(Z), usando a distribuição de Z. X P(X) y P(Y) l 0,2 o 0,2 2 0,2 1 0,4 3 0,6 2 0,4 1 1 Capitulo 3 - Variáveis aleatórias discretas 81 ~ o 1 2 P(X) Z = 3X+ Y 1 0,04 0,08 0,08 0,2 z o 1 2 2 0,04 0,08 0,08 0,2 3 .., .) 4 5 .... .) 0, 12 0,24 0,24 0,6 6 6 7 8 P(Y) 0,2 0,4 0,4 J 9 9 10 1 1 Observando-se os valores de Z e as probabilidades respectivas em ambas as tabelas, fazemos: z P(Z) Z · P(Z) 3 0,04 0,12 4 0,08 0,32 5 0,08 0,40 6 0,04 0,24 7 0,08 0,56 8 0,08 0,64 9 0, 12 1,08 10 0,24 2,40 11 0,24 2,64 1 8,4 E(Z) = 8,4 VAR(Z) = 76,88 - 8,42 11. St~jam X: renda fàrn iliar en1 R$ 1.000,00 Y: nR de aparelhos de TV em cores. Considere o quadro: X 1 2 .., .) 1 .... .) y 2 1 .., .) 1 3 2 .... .) Z 2 • P(Z) 0,36 1,28 2,00 1,44 3,92 5,12 9,72 24,00 29,04 76,88 .... .) 1 2 .... .) 2 1 2 .... .) a) Verificar, usando o coeficiente de correlação p , se há dependência entre as duas variáveis. b) Detern1inar a renda familiar média de quem possui 2 aparelhos de TV (usando distribuição de probabilidade .E(X/Y = 2)). 82 Estatística básica Resolução: y 1 2 3 X 1 0,2 o, 1 o 2 o, 1 o, 1 o, 1 3 o 0,1 0,3 P(Y) 0,3 0,3 0,4 y . P(Y) 0,3 0,6 l,2 y2 . P(Y) 0,3 1,2 3,6 a) VAR(X) = 5, 1 - (2, 1)2 = 0,69 a _. =.J0,69 =0,83 VAR(Y) = 5, 1 -(2,1)2 = 0,69 a y = .Jo,69 = 0,83 SejaZ=X· Y z 1 2 3 4 6 9 L E(Z) = E(X · Y) = 4,9 cov(X, Y) = 5,1 - 2, 1 · 2,1 cov(X, Y) = 0,49 0, 49 p= 0,83. 0,83 p:;:::0,7113 P(Z) 0,2 0,2 o O,l 0,2 0,3 1 Há dependência linear entre X e Y. P(X) X· P(X) X 2 · P(X) 0,3 0,3 0,3 0,3 0,6 1,2 0,4 1 2 ' 3,6 l 2, l ~ 5, l "' E(Y) = 2,1 E(Y2) = 5,8 E(X) E(X)2 Z · P(Z) 0,2 0,4 o 0,4 1 2 ' 2,7 4,9 Capitulo 3 - Variáveis aleatórias discretas 83 b) E(XIY=2)=? X P(X/Y= 2) X· P(XIY=2) 1 113 113 2 1/3 2/3 3 1/3 2/3 L 1 2 :. E(X/Y= 2) = 2 12. Dada a distribuição conjunta das variáveis X e Y, independentes, seja Z = 2X - 4Y. Calcular E(Z) e VAR(Z), usando a distribuição de Z. y o l 2 P(X) X 1 0,06 0,2 2 0,15 0,05 3 P(Y) 0,3 1 y o P(X) l 2 X Z = 2X- 4Y 1 0,06 0, 12 0,02 0,2 z o 4 8 2 0,15 0,30 0,05 0,5 2 2 - 2 - 6 3 0,09 0,18 0,03 0,3 4 4 o -4 P(Y) 0,3 0,6 O, 1 1 6 6 2 -2 Logo: z P(Z) Z · P(Z) Z 2 · P(Z) -6 0,02 -0,12 0,72 --4 0,05 -0,20 0,80 -? - 0,15 - 030 ' 0,60 o 0,30 o o 2 0,24 0,48 0,96 4 0,15 0,60 2,40 6 0,09 0,54 3,24 l 1,00 8,72 E(Z) = 1,0 VAR(Z) = 8,72- 12 VAR(Z) = 7,72 84 Estatística básica 13. Considere a distribuiçã.o conjunta das variáveis X e Y. Defina Z = IX - i1 e W = X + Y. Construa a distribuição conjunta de probabilidades de Z e W e calcule a cov(Z, W). ~ 1 2 3 P(X) 1 o o, 1 0,2 0,3 2 0,2 0,1 O, 1 0,4 3 0,2 o O, l 0,3 P(Y) 0,4 0,2 0,4 1 X e Y não são independentes. z 1 2 3 w 1 2 3 1 o 1 2 1 2 ... .) 4 ? - 1 o l 2 3 4 5 ... .) 2 1 o 3 4 5 6 w 6 P(Z) 2 3 4 5 Z · P(Z) z o o o 0,J o 0,1 0,2 o l o 0,3 o O, 1 o 0,4 0,4 2 o o 0,4 o o 0,4 0,8 P(W) o 0,3 0,5 O, 1 o, 1 1 E(Z) = 1,2 Jf'. P(W) o 0,9 2,0 0,5 0,6 E(W) = 4,0 Seja T = Z · W T P(1) T · P(T) o 0,2 o 2 o o 3 0,3 0,9 4 o o 5 o, 1 0,5 6 o o 8 0,4 3,2 10 o o 12 o o 1 4,6 E(T) = E(Z · W) = 4,6 Capitulo 3 - Variáveis aleatórias discretas 85 Logo: cov(Z, W) = 4,6 - 1,2 · 4,0 cov(Z, W) = - 0,2 14. As variáveis aleatórias X e Y são independentes e tê1n as segu intes distribu ições de probabilidades: Sejam X o 2 Z=X+2Y T=l2X-3Y I P(X) 0,3 0,7 1 e W = Z · T, calcular E(W). 3Y 6 """ 2Y 4 2X ~ 2 o o 4 6 O, 12 6 2 4 2 0,28 P(Y) 0,4 Obs.: Para cada célula vale: z 24 12 T P(X) · P(Y) Logo: w P(W') 12 0,28 24 O, 12 40 0,42 54 0, 18 1 Portanto, E(W) = 32,76 y P(Y) 2 0,4 .., .) 0,6 1 9 6 P(X) 3 6 9 54 0,3 0,18 8 5 40 0,7 0,42 0,6 1 w W· P(W') 3,36 2,88 16,80 9,72 32,76 86 Estatística básica Exercícios propostos 1. U1na urna tem 4 bolas brancas e 3 pretas. Retira1n-se 3 bolas sem reposição. Seja X: número de bolas brancas, determinar a distribuição de probabilidades de X. 2. Fazer o exercício anterior considerando extração co1n reposição.3. Dada a tabela: X o 1 2 3 4 5 P(X) o pi p i p p p i a) Ache p; b) Calcule P(X> 4) e P(X < 3); c) Calcule P(IX - 31<2). 4. As probabilidades de que haja l, 2, 3, 4 ou 5 pessoas em cada carro que vá ao litoral num sábado são, respectivan1ente: 0,05; 0,20; 0,40; 0,25eO,10. Qual o número mé- dio de pessoas por carro? Se chegam no litoral 4000 carros por hora, qual o número esperado de pessoas, e1n 1 O horas de contage111? 5. U1na urna contém 6 bolas nu1neradas de 1 a 6. Un1a pessoa paga R$ 600,00 e retira aleatoriamente urna bola. Se retirar a bola 6 recebe R$ 1.500,00; se retirar as bolas 2, 3, 4 ou 5 nada recebe; e se retirar a bola J irá escolher outra bola, sem repor a prin1eira, e se esta segunda for a bola 6, recebe R$ 3 .600,00; caso contrário, nada recebe. Calcular quanto a pessoa que está jogando espera lucrar. 6. U1n produtor de sementes vende pacotes co111 15 se1nentes cada u1n. Os pacotes que apresentan1 1nais de duas sementes sen1 ger1ninar são indenizados. A probabilidade de un1a semente ger1ninar é de 95%. a) Qual a probabilidade de u1n pacote não ser indenizado? b Se o produtor vende 2000 pacotes, qual o número esperado de pacotes que serão indenizados? c) Se um pacote é indenizado, o produtor tem un1 prejuízo de R$ 24,50, e se o pacote não é indenizado, tem un1 lucro de R$ 50,40. Qual o lucro esperado por pacote? 7. Dois jogadores fazem u1na aposta. A paga R$ 100,00 para B e lança duas moedas vicia- das não simultanean1ente. A probabilidade de sair cara da 1-ª moeda é 0,3, e da 2s; moeda é 0,2. Se sair cara na 1 ª moeda tetn o direito de lançar a 2ª; se sai.r cara na 2ª moeda ganha R$ 200,00; e se sair coroa, ganha R$ 100,00. Se sair coroa na 1 ª 1noeda, A nada ganha. Qual a esperança de lucro do jogador A ern uma única jogada? 8. Urnjogador A paga R$ 5,00 a B e lança um dado. Se sair face 3, ganha R$ 20,00. Se sair faces 4, 5 ou 6, perde. Se sair faces 1 ou 2, te1n o direito de jogar nova1nente. Desta vez lança dois dados. Se sair duas faces 6, ganha R$ 50,00. Se sair uma face 6, recebe o dinheiro pago de volta. Nos de1nais casos, perde. Seja X o lucro líquido do jogador A nesse jogo. Determinar: Respostas Capitulo 3 - Variáveis aleatórias discretas 87 a) Distribuição de probabilidade de X; b) E(X); c) VAR(X). 9. Calcular a média e a variância da variável X, onde X assume os valores 1, 2, 3, ... , n, equiprovavelmente. l O. A função de probabi lidade da variável aleatória X é: P(X) = _!_ , para X= l, 2, 3, 4, 5. Calcular E(X) e E(X2), e usando esses resultados, calcular: 5 a) E(X + 3)2 ; b) VA 1 ~(3X- 2). 11. Sendo P(X = x) = 0,5\ x = 1, 2, 3, ... , calcular E(X). 12. Um jogador lança u1u dado. Se aparecere1u os nfuneros 1, 2 ou 3, recebe R$ 10,00. Se, no entanto, aparecer 4 ou 5, recebe R$ 5,00. Se aparecer 6, ganha R$ 20,00. Qual o ganho médio do jogador? 13. Uma pessoa vende colhedeiras de milho. Visita se1nanaln1ente un1a, duas ou três propriedades rurais co1n probabilidades 0,2, 0,5 e 0,3, respectiva1nente. De cada contato pode conseguir a venda de l colhedeira por R$ 120.000,00 com probabilida- de 0,3, ou nenbu1na venda com probabilidade 0,7 . . Deter1ninar o valor total esperado (médio) das vendas se1nanais. 14. Seja X o nú1nero de caras, e Y o número de coroas quando são lançadas 2 moedas. Calcular média e variância de Z = 2X + Y. 15. Un1 sinal consiste de un1a série de vibrações de magnitude X. Un1 ruído consiste de uma série de vibrações de n1ag11itude Y, tendo os valores 2, O e - 2 com probabilida- des 1/6, 2/3 e 1/6, respectivamente. Se ruídos e sinais são con1binados de vibrações sincro11izadas, a soma consiste de vibrações de magnitude Z = X+ Y. Construir a função de probabilidade de Z, calcular E(Z) e VAR(Z), adn1itindo independência entre ruído e sinal. X assun1e os valores 1, O e - 1, cada um co1n probabi lidade 1/3. 16. Seja X a renda fa1niliar e1n R$ 1.000,00, e Y o nún1ero de carros da fa1nília. Consi- dere o quadro: X 2 ... .) y 1 2 Calcular: a) E(X), E(Y); b) VAR(X), VAR(Y); e) cov(X, Y); d) p. 4 2 2 ... .) ,., .) 4 2 2 ... .) 2 1 3 3 1 2 2 Respostas 88 Estatística básica 17. Num posto de vistoria de carros foram examinados 1 O ve ículos, sendo que o núme- ro de irregularidades nos itens de segurança (X) e o número de irregularidades nos docu1nentos (Y) são os dados no quadro a seguir. Calcule o coeficiente de correlação entre as variáveis entre X e Y. Veículos 1 2 3 4 5 6 7 8 9 10 X o 1 2 o l 2 o 2 1 2 y o 1 o 1 1 1 o 2 2 2 18. Dada a distribuição conjunta de probabilidades da variável (X, Y), deter1ninar p e tentar escrever Y etn função de X. y o 2 4 X o 0,5 o o ] o 0,2 0,05 2 o o 0,25 19. Sejan1 X os anos de experiência em vendas e Yas unidades diárias vendidas. y 1 2 3 X 2 O, 14 0,04 0,02 4 0,04 O, 18 0,08 6 0,02 0,26 O, 12 8 o 0,02 0,08 Dada a tabela da distribuição conjunta de X e Y, calcular: a) cov(X, Y); b) p 20. Dada a tabela da d istribuição conjunta, calcular: a) E(2X - 3Y); b) VAR(3X + 2Y); c) p; d) E(X/Y= 2). y 1 2 3 4 X o 1/24 1/ 12 1/12 1/24 l 1/12 l/6 1/6 l/ 12 2 1/24 1/ 12 1/ 12 1/24 Respostas Capitulo 3 - Variáveis aleatórias discretas 89 21. Uma urna contém 3 bolas vermelhas e 2 verdes. Dessa uma, retira1n-se 2 bolas se1n reposição. Seja1n: O se a primeira bola for verde; X= l se a primeira bola for vermelha. O se a segunda bola for verde; Y= 1 se a segunda bola for vennelha. a) Deterruinar a distribuição conjunta para X e Y; b) Calcular E(X), E(Y), VAR(X), VAR(Y); e) E(X + Y) e VAR(X + Y) ; d) p. 22. As variáveis aleatórias X e Y são independentes e têm a seguinte distribuição de probabilidades. X P(X) y P(Y) 1 0,4 3 0,2 2 0,6 4 0,8 Considerando a variável aleatória Z = X + Y, construir a tabela da distribuição de probabilidades de Z e co1n ela calcular E(Z) e VAR(Z). 23. A variável aleatória bidin1ensional (X, Y) te1n a seguinte tabela de distribuição de probabi 1 idades: ~ 1 2 3 2 0,10 0,30 0,20 3 0,06 O, 18 o, 16 Calcular: a) E(2X + Y); b) p; c) VAR(Y/X= 2). 24. As variáveis aleatórias X e Y são independentes e têm as seguintes distribuições: X P(X) 2 0,3 3 0,5 4 0,2 y 1 2 P(Y) 0,2 0,8 Considerando a variável Z =X· Y, construir a ta- bela da distribuição de Z e, usando a tabela, calcu- lar E(Z) e VAR(Z). Respostas 90 Estatística básica 25. Dada a distribuição conjunta de (X, Y), detern1inar a média e variância de: a) X+ Y b) X· Y ~ 1 2 3 1 5/27 1/27 3/27 2 4/27 3/27 4/27 3 2/27 3/27 2/27 26. As variáveis X e Y são independentes e suas distribuições são: X 2 3 4 y 1 2 3 p (X) 0,3 0,4 0,3 P(Y) 0,5 0,3 0,2 Seja Z = IX- 2YI, detennine E (Z) usando a distribuição de probabilidade de Z. 27. SuponJ1a que X e Y tenbatn a seguinte tabela de distribuição conjunta: ~ 1 2 3 1 O, 1 o, 1 o 2 O, l 0,2 0,3 3 o 1 ' O, 1 o a) Detenninar a função de probabilidade de X + Ye, a partir daí, E(X + Y). De outra 1naneira pode-se obter a 111es1na resposta? b) Detenninar a função de probabilidade de (X· Y) e, em seguida, calcular E(XY). c) Mostrar que, embora E(XY) = E(X) · E(Y) ocorra, X e Ynão são iJ1dependentes. 28. Suponha que (X, Y) tenha a seguinte distribuição de probabilidade: ~ 1 2 3 1 1/18 l/6 o 2 o l/9 J /5 "' J 1/12 1./4 2/15 a) Mostre que a tabela anterior é reahnente utna distribuição de probabilidade. b) Calcule E(XIY= 2). c) Calcule VAR(Y/X= l). 29. As variáveis aleatórias X e Y são independentes. a) Co1npletar o quadro detenninando os valores de a, b e e. b) Seja Z = 13X - 4 J1, calcular E(Z) usando a distribuição de probabilidade de Z. c) Calcular VAR(3X - 21'). Respostas R Capitulo 3 - Variáveis aleatórias discretas 91 ~ 1 2 3 P(X) 1 0,04 0,08 a 3 b -) e P(J') a b e 1 30. As variáveis X e Y são independentes e têin inédia e variância iguais a 5 e 6 para X, e 4 e 3 para Y. Calcular a média e variância de: a) X-Y; b) 2X+3Y.3 1. Sendo Z = 5X + 3Y - 4, onde X e Y são independentes, E(X) = 3, VAR(X) = 2, E (Y) = 4 e VAR(Y) = 3. Detern1inar E(Z) e VAR(Z). 32. Etn um pequeno grupo de casais empregados, a renda X do mari.do e Y da respectiva esposa tem sua distribuição conjunta de probabi lidades dada abaixo: ~ 10 15 20 5 p 2p 3p 10 2p 4p 2p 15 3p 2p p X e Yem milhares de reais. a) Seja W = 0,6X + 0,8Y a renda do casal após dedução de i1npostos, qual sua média e sua variância? b) X e Y são independentes? Qual é o coeficiente de correlação p ~y ? 33. A função de probabilidade conjunta de duas variáveis X e Y é dada por P(X = x; Y = y) = 1/32 · ( x2 + y2 ), para X= O, 1, 2, 3 e Y = 0,1 . Verificar que a função de pro- babilidade de tnarginal de X é P(X) = 1/32 (2x2 + 1 ), X= O, 1, 2, 3 e que a função de probabi lidade de 1narginal de Y é P(Y) = 1 / 16 (2y2 + 7), Y =O, 1. 34. a) Co1nplete o quadro abaixo, supondo que X e Y são independentes. b) Calcule a esperança de Y, dado que X= 2. c) Seja Z = 4X - 3 Y, calcule E(Z) e V(Z). d) Dê a distribuição de Z e obtenha através dela os valores de E(Z) e V(Z). (Note que esses são os rnesmos obtidos no iten1 e.) ~ 2 3 4 P(X) l 0,08 2 3 0,3 P(J') 0,2 0,5 1 Respostas Distribuições teóricas de probabilidades de variáveis aleatórias discretas 4.1 Distribuicão de Bernoulli I Consideremos uma única tentativa de un1 experi1nento aleatório. Podemos ter suces- so oufracasso nessa tentativa. Seja p a probabilidade de sucesso e q a probabilidade de fracasso, co1n p + q = 1. Seja X o número de sucessos em uma única tentativa do experünento. X assume o valor O que corresponde ao fi·acasso, com probabilidade q, ou o valor 1, que corresponde ao sucesso, co1n probabilidade p. O fracasso X= l sucesso COITI P(X=O)=q e P(X= 1) = p. Nessas condições, a variável aleatória X tem distribuição de Bernoulli, e sua função de probabilidade é dada por: P(X=x) = y · q1- x Esperança e variância Calcularemos a média e a variância da variável con1 distribuição de Ben1oulli. X P(X) o q 1 p 1 :. E(X) = p VAR(X) = p - p 2 = p(l - p) = pq E(X)=p Logo VAR(X)= pq. X · P(X) X2. P(X) o o p p p p Capílulo 4 - Distribuições teóricas de probabilidades de variáveis aleatórias discrelas 93 Exemplo de aplicação Uma urna tem 30 bolas brancas e 20 verdes. Retira-se uma bola dessa uma. Seja X o nú1nero de bolas verdes, calcular E(X) e VAR(X) e determinar P(X). Resolução: X= 30 3 o -7q=-= - 50 5 20 2 1 -7 p= -=- 50 5 . • • (?)"' (3)1-x :. P(X=;c)= i 5 2 eE(X)= p=- 5 2 3 6 VAR(X)= p·q= - ·-= - 5 5 25 Resumo: X tem distribuição de Bernoulli. X= O -7 q -7 P(X = x) = p" · q1- " 1 -7 p E( X)= p e V AR(X) = pq 4.2 Distribuição geométrica Consideremos tentativas sucessivas e independentes de um 1nes1no experirnento aleatório. Cada tentativa adn1ite sucesso com probabilidade p e fracasso com proba- bi lidade q; p + q = 1. Seja X o número de tentativas necessárias ao apareciff1enLo do prilneiro sucesso. Logo, X assume os valores: X= 1, que corresponde ao sucesso (S) e P(X = 1) = p; X= 2, que co1Tesponde ao fracasso (F) na 1 ª tentativa e ao sucesso na 2ª, (FS) e P(X = 2) = P(F n S) = q · p; X= 3, que corresponde a. (FFS) e P (X= 3) = P (F n F n S) = q · q · p = q1 • p; X = 4, que corresponde a (FFFS) e P(X = 4) = q3 . p; e assim sucessivamente, X= x, que corresponde a FF · · · FS cotn X 94 Estatística básica A variável X tem, então, distribuição geo1nétrica. Observamos que: 00 00 00 L P( X =X) = L p • qx-1 = p L qx-1 = p(l + q + q2 + .. . ) x=I x=I .t=I 1 1 =p· =p· - =l I-q . p Exemplos de aplicação 1. A probabilidade de se encontrar aberto o sinal de trânsito nurna esquina é 0,20. Qual a probabilidade de que seja necessário passar pelo local 5 vezes para encontrar o sinal aberto pela primeira vez? Resolução: X: número de vezes necessárias para encontrar o sinal aberto. j) = 0,20 q = 0,80 P(X = 5) = (0,80)4 • (0,20) = 0,08192 2. Qual a probabilidade de que um dado deva ser lançado 15 vezes para que na 15ª vez ocorra a face 6 pela prirneira vez? Resolução: 1 p= - 6 5 q= - 6 X: nú1nero de lança1nentos necessários ao aparecirnento da prin1eira face 6. P(X = 15) = ( ~) 14 • ( ~) = 0,01298 Esperança e variância Para detern1inarmos a 111édia e a variância da distribu ição geométrica, usarernos os recursos: d (x") = nx"-1 I. dx d li 2· dx ,LJ;(,\:) i=I li d . = ~ :h{f;(x)} , nos pontos onde a função é derivável. Média Variância Capítulo 4 - Distribuíções teóricas de probabilidades de variáveis aleatórias discretas 95 .. 00 .. E(X)= 2:x·P(X=x)= 2:x· p·qx- I = p 2: xqx-I = x=I d =p·- dq q 1- q x= I x=I 1 1 1 - p· - p·--- - (1 - q)2 - p2 - p .. 00 "' E(X2) = L X2 . P . qx-1 = P L X2. qx-1 = P L [x(x-1) + x]qx-1 = x= I x=I .r=I 00 00 = p L x(x - l)·qx-1 + p L xqx-1 = x=I x=I 1 d 2 +- = p·q· ' dq-p q 1- q 2 1 2 pq 1 2q + p . = p · q· '+ - = +- = .. (1 - q)º p p3 p p2 :. VAR(X)=E(X2)-{E(X)} 2 = 2 q~ p -(_!_ 2 p - p Logo: VAR(X)=~ p 1 +- = p 96 Estatística básica Resumo: X tem distribuição geométrica~ X= 1, 2, ... , n, ... e P(X = x) = q·' - 1 • p e 4.3 Distribuicão de Pascal I E(X) =_!_ p VAR(X)=_!j_ p2 Suponha1nos que un1 experin1ento aleatório seja repetido independenten1ente até que urn evento A. ocorra pela r-ési1na vez. Seja P(A) = p (sucesso) e P(A) = q (fracasso) en1 cada tentativa do experiinento Seja X: número de repetições necessárias para que A ocorra pela r-ésima vez. Ser= 1, X te1n distribuição geométrica. Se X = x, o evento A ocorre pela r-ésin1a vez na repetição de nú111ero x. Logo, A ocorre (r - 1) vezes nas (,\'. - 1) repetições anteriores. • • • (x-1) P(X=x)= p'qx-r, r - 1 x>r A variável X assim definida te1n distribuição de Pascal. Exemplo de aplicação A probabilidade de que un1 sinal de trânsito esteja aberto numa esquina é 0,20. Qual a probabilidade de que seja necessário passar pelo local 1 O vezes para encontrá-lo aber- to pela 4ª vez? Resolução: X: número de passagens pela esquina. r = 4 p = 0,20 q = 0,80 P(X=lO)=(~ ·(0, 20)4 ·(0,80)6 =0,035232 Esperança e variância Usando os resultados de E(X) e VAR(X) da distribuição geométrica, é fácil demons- trar que: Resumo: Capítulo 4 - Distribuições teóricas de probabilidades de variáveis aleatórias discretas 97 E(X)=!_ p VAR(X)= r~ p - X tem distribuição de Pascal P(X= x) = x-1) r-1 prqx-r' X> r r rq E(X)= - e VAR(X)=- p p2 4.4 Distribuição hipergeométrica Consideremos uma população com N ele1nentos, dos quais r tê1n un1a deter1ninada característica (a retirada de um desses elementos corresponde ao sucesso). Retiramos dessa população, sem reposição, u1na arnostra de ta1nanho n. Seja X: núrnero de sucessos na anzostra (saída do elemento con1 a característica). Qual a P(X = k)? Pode1nos tirar ( :) a1nostras sem reposiçã.o. Os sucessos na a1nostra podem ocorrer (r) (N-r) de k maneiras e fracassos de n _ k n1odos. Logo, ' O<k<nek<r. A variável X assi1n defin ida tem distribuição hipergeométrica. Exemplos de aplicação 1. Pequenos motores são guardados en1 caixas de 50 unidades. Um inspetor de qua- lidade exa1nina cada caixa, antes da posterior ren1essa, testando 5 motores. Se ne- nhun1 motor for defeituoso, a caixa é aceita. Se pelo menos un1 for defeituoso, todos os 50 1notores são testados. Há 6 1notores defeituosos numa caixa. 98 Estatística básica Qual a probabilidade de que seja necessário exa1ninar todos os motores dessa caixa? Resolução: X: número de motores defeituosos da amostra. N = 50 r = 6 n=5 P(X> 1) = 1 - P(X < 1) = 1 - P(X =O)= (~)(:4) =1 - ( ) =1 -05126 = 50 ' 0,4874 5 2. De un1 baralho con1 52 ca1tas, retiran1-se 8 cartas ao acaso, se1n reposição. Qual a probabilidade de que 4 seja111 figuras? Resolução: X: número de figuras ern 8 cartas. 0,0601 3. U1na firn1acompra lâ1npadas por centenas. Exan1ina sempre un1a an1ostra de 15 lâ1npadas para verificar se estão boas. Se urna centena inclui 12 lâtnpadas queitna- das, qual a probabil idade de se escolher u1na amostra com pelo menos u1na lâmpada queitnada? Resolução: X: número de lâmpadas queimadas na amostra. P(X'?:. l) = 1- P(X< l)= 1- P(X=O)= (~)(~!) =l- 100) = Esperança e variância Demonstra-se que: 15 0,8747 E(X) = np (N-n) e VAR(X)=np(l- p) , (1V-l) Capítulo 4 - Distribuições teóricas de probabílidades de variáveis aleatórias discretas 99 r onde p= - . N Demonstra-se que, assintoticamente (n ~ oo), E(X) = np e VA R(X) = npq. Resumo: X tem distribuição hipergeo1nétrica (retiradas sem reposição) P(X=k)= r) N-r) k n- k (~) E(X) =np e (N-n) r VAR(X) = np(l - p) , onde p = -. (N - 1) N 4.5 Distribuicão binomial I Consideremos n tentativas independentes de u1n mesmo experimento aleatório. Cada tentativa admite apenas dois resultados: fi·acasso co1n probabil idades q e sucesso co1n probabilidade p, p + q = l. As probabilidades de sucesso e fracasso são as 1nesmas para cada tentativa. Seja X número de sucessos em n tentativas. Detenninaremos a função de probabilidades da variável X, isto é, P(X = k). U1n resultado particular (RP): sss ... SFFF . .. F. k n - k Logo, P(RP) = P(SSS .. . SFFF ... F) = k 11-k = p·p ... p·q·q ... q = p q . k 11 - k Considerando todas as n-uplas com k sucessos, ten1os: 100 Estatística básica A variável X tem distribuição binon1ial, com parâ1netros n e p, e a indicaretnos pela notação X: B(n,p) Exemplos de aplicação 1. U111a 111oeda é lançada 20 vezes. Qual a probabilidade de saírem 8 caras? Resolução: X: nú111ero de sucessos (caras) X =O, 1, 2, 1 .. . , 20 => p = P( e) = - => 2 (2º)( 1 ) 8 ( 1 )' 2 P(X = 8) = 8 2 2 = 0,12013 (tabela da página 342) 2. Numa criação de coelhos, 40% são machos. Qual a probabilidade de que nasçam pelo 111enos 2 coelhos nlachos num dia en1 que nascera111 20 coelhos? Resolução: X: nún1ero de coelhos machos (c.111.). X = O, 1, .. . , 20 ~ P( c.1n.) = JJ = 0,40 ~X: B(20; 0, 40) P(X > 2) = 1 - P(X < 2) = l - { P(X = O) + P(X = J)} = = 1- ( 2 0 º)<0,40)º co,60)2º + ( 2 1 º)co,40)' co,60)19 = ]- (0,00003 + 0,00049) = 0,99948 3. U1na prova tipo teste ten1 50 questões independentes. Cada questão ten1 5 alternati- vas. Apenas uma das alternativas é a correta. Se um aluno resolve a prova respon- dendo a esmo as questões, qual a probabilidade de tirar nota 5? Resolução: X: nún1ero de ace1tos X: O, l, ... , 50 p=P(acerto)= ~=>X: B(5o, ~):. 50 ( 1 ) 2 5 4) 25 :. P(X = 25) = 25 5 5 = 0,000002 Capítulo 4 - Distribuições teórícas de probabilidades de variáveis aleatórias discretas 101 Esperança e variância Se X: B(n,p) -7 P(X = k) = (: )pkq11-k Esperança "' 11 (n) E(X)= ~ , \:p(x)= ~X X px ·q 11- x = li (11) L ),: 11- ).' = ,x; · ·pq = X •·= I li 1 "" /1, • X 11- .t = L.,, x· ·pq = x= I x!(n -x)! 11 (n - 1)! x-1 11- x =n·p ·p q = x=I (x-l)!(n-x)! Fazendo y = x - 1, temos: 11-1(11-]) E(X) = n. p. L . pY. q11-y-1 = n. p y=O y . • • E(X) =n ·p 1. Variância 11 11 (n) E(X2) = ~ ,\:2 . p (x) = ~X 2 X • px. qll-x = 11 (n) = ~[x( x -1) +X]· X · px · q11-" 11 (n) " (n) E(X2)= ~ x(x -1)· X ·px ·q11-x + ~ X X ·p" ·qn-x n · p 102 Estatística básica li ' E(X2) ="" n . . px. q11-x + np ~ (,r -2)! · (n-x)! E(X2) = n(n - 1)2. P2. L - . px-2 . q"-x + np 11 (n-2) x=2 X 2 Fazendo y = x - 2, ten1os: E(X2 ) = n(n-1) · p 2 • L · p Y • q"-y- i + np :. n-2(n-2) y=O y • • • E(X2) = n(n - 1) · p 2 + np 1 Logo: VAR(X) = n(n - 1) p 2 + np - n2 · p 2 = - np2 + np = = np(I -p) = npq :. • • • VAR(X) = npq Exemplo de aplicação Achar a média e a variância da variável aleatória Y = 3X + 2, sendo X: B (20; 0,3). Resolução: E(X) = np = 20 · 0,3 = 6 YAR(X) = npq = 20 · 0,3 · O, 7 = 4,2 Logo: E(Y) = E(3X + 2) = 3E(X) + 2 = 3 · 6 + 2 = 20 e VA'R(Y) = YAR(3.1\'.' + 2) = 9 YAR(X) = 9 · 4,2 = 37,8 Resumo: SeX:B(n,p)~P(X= k)=(~ pkqn-k E(X)=np e VAR(X) = npq Capítulo 4 - Distribuições teórícas de probabilidacles de variáveis aleatórias discretas 103 4.6 Distribuição polinomial ou multinomial Consideremos um experimento aleatório e k eventos, A,, A2, A,, ... , Ak, que formam un1a partição do espaço amostral do experi1nento. Sejan1 P(A;) = p;, i = 1, 2, ... , k (probabilidades de sucessos). Consideremos n tentativas independentes do n1es1no experin1ento, sendo que os p;, k i = l, 2, ... , k per1nanece111 constantes durante as repetições, con1 2: P; = 1. i =I Sejan1 X,, X , ... ,X os nún1eros de ocorrências de A,, A2, ... , Ak, respectivan1ente, con1 k _L x; =n. i=I Nestas condições, li Com _L n; =n. i=I Essa função de probabilidade caracteriza a distribitição polino1nial ou multinornial de x;, i = 1, 2, ... , k. Quando k = 2, ten1os a distribuição bino1nial, pois Exemplos de aplicação 1. Uma urna tem 6 bolas brancas, 4 pretas e 5 azuis. Retiram-se 8 bolas co1n reposição. Qual a probabilidade de sair 4 bolas brancas, 2 pretas e 2 azuis? Resolução: 6 2 p, =P(B)=15=5 4 P2 =P(P)= lS X,: saída de 4 bolas brancas X2: saída de 2 bolas pretas 104 Estatística básica X3: saída de 2 bolas azuis 8 ! ( 2 ) 4 ( 4 ) 2 ( l ) 2 = 4!2!2!. 5 15 3 2. Lança-se um dado 30 vezes. Qual a probabilidade de que cada face ocorra exata- n1ente 5 vezes? Resolução: X1: ocorrência de 5 faces 1. X2: ocorrência de 5 faces 2. X3: ocorrência de 5 faces 3. X4: ocorrência de 5 faces 4. Xs: ocorrência de 5 faces 5. X6: ocorrência de 5 faces 6. P(X1= 5, X2 = 5, X, = 5, X4 = 5, Xs = 5, X;= 5) = = c!~)!6 ·(i)s ·(i)s· .... (i)s =e!~)~ ·(~) 30 6 Esperança e variância Se X;, i = 1, 2, .. ., k ten1 distribuição 1nultino1nial, é fácil ver que: E(X;) = n; · p; VAR(X;) = n, · p, · q,, i = 1, 2, .. ., k Resumo: X; ten1 distribuição multinon1ial, i = 1, 2, .. ., k E(X) = n,p; e VAR(X) = n, p, q, Capítulo 4 - Distribuições teóricas de probabilidacles de variáveis aleatórias discretas 105 4.7 Distribuicão de Poisson I Aproximação da distribuição binomial pela distribuição de Poisson Muitas vezes, no uso da bino1nial, acontece que n é n1uito grande (n ---7 oo ) , e p é muito pequeno (p ---7 O). Nesses casos, não encontra1nos o valor en1 tabelas, ou então o cálculo torna-se muito difícil, sendo necessário o uso de 1náquinas de calcular sofistica- díssi1n.as ou o uso de co1nputador. Pode1nos então fazer un1a aproximação da binon1ial pela distribuição de Poisson. 1. n ---7 oo (maior que o 1naior valor tabelado, n > 30) Consideremos 2. p ---7 O (p <O, 1) 3.0<µ~10 Quando isso ocorre, a média µ = np será to1nada co1no np =À. . (11) Nessas condições, se X: B(n, p ), queren1os calcular P(X = k) = k pk q"-k. -,t À. k Mostraremos que P(X = k)::::: e k! Seja P(X = k)(n)pkq"-k = n! pk · q"-k = n(n - l)(n-2) · k k!(n-k)! k ( / 1) P 11-k .... · n-1(+ · - ·q k! À. p= - n À. e q = 1- - . Quando n ---7 oo. n ( À. )k 1 ( À )"-k P(X=k):::lim n(n-I)(n-2)· ... ·(n-k+l)· - · - · 1- - ,,~.. n k! n = 1m 1 · 1- - · 1-- " .. · 1- · 11. • - • 1--1. { ( 1) ( 2) ( k -1) 1 k 1 ( À )" 11-+» n n n k ! n = 1 · 1 · 1 · ... · 1 · Àk • 2_ · e-J. · 1 = /e! . . . ( À )-k 1-- n 106 Estatística básica que é a chamada distribuição de Poisson. Logo, a binomial te1n a distribuição de Poisson co1no li1n ite, quando n -4 oo e p -4 O. Exemplos de aplicação 1. Seja X: B(200; 0,01 ). Calcular P(X = 1 O) usando binomial e aproxin1ação pela Poisson. Resolução: Binon1ial: P(x = 10) = (~~º)co , 01)1º(0,99) 190 = 0,000033 ÁJJroxin1ação pela Poisson: Â. = np = 200 · 0,01 = 2 -2 2'º P(X = 10) =e . = 0,000038 1 O! (tabela da página 339) Logo, a aproximação é bastante boa, pois o erro é de 0,000005 apenas. 2. A probabilidade de un1a lâ1npada se queimar ao ser ligada é 1/100. Nun1a instala- ção coml 00 lâmpadas, qual a probabilidade de 2 lâ1npadas se quei1nare1n ao serem ligadas? Resolução: X: número de lâmpadas queimadas. X: B(100, 1 ~ 0 ). Logo, ( 100) P(X = 2) = 2 (0,01)2 (0,99)98 • Usando a aproxin1ação pela Poisson, Â. = np = l 00 · 0,0 l = 1 - 1 12 P(X = 2) = e . = 0,183940 :. 2! :. P(X = 2) = ( 1 ~º)co,OI) 2 (0,99) 98 ::: 0, 183940. Capítulo 4 - Distribuições teórícas de probabilidades de variáveis aleatórias discretas 107 Distribuição de Poisson Considere1nos a probabilidade de ocorrência de sucessos em um determinado inteivalo. A probabil idade da ocorrência de um sucesso no inteivalo é proporcional ao inter- valo. A probabilidade de 1nais de um sucesso nesse intervalo é bastante pequena cotn relação à probabilidade de utn sucesso. Seja X o número de sucessos no intervalo, então: e-;. ·À. k P(X=k)=-- k! onde íl é a 1néd ia. A variável X assün defin ida ten1 distribuição de Poisson. A distribuição ele Poisson é muito usada na distribuição do nún1ero de: 1. carros que passatu por um cruzamento por minuto, durante u1na certa hora do dia; 2. erros tipográficos por página, em um material impresso; 3. defeitos por unidade (1n2 , 1n3, m etc.) por peça fabricada; 4. colônias de bactérias nu1na dada cultura por 0,01 m1n2 , nun1a plaqueta de 1ni- ' . croscop10; ' 5. mortes por ataque de coração por ano, nu1na cidade. E aplicada tambétn em problemas de fi las de espera em geral, e outros. Esperança e variância Cálculo da média "" "° e-l · íl" "' e-J. ·À:" E(X) = 2: xp(x) = L-"1: · x! = L . ' - x=O .r =O x=I (x -1) · • co À. x . oo À. x- 1 _, ""' _, íl ""' =e · L.J = e ·· L.J . x= I (x -1) ! x= I (x - 1)! Sejay = x-1. E(X)= e-J. ·À 2:-=e-1· ·À· l+íl +-+- + ... = "' À. y • À.2 À. 3 ) y=O Y ! 2! 3! Cálculo da variância oo - ;! • À. x "' íl'' E(X 2 ) = 2:x2 · e = e-i. L [x(x- l) + x]- = x=O X ! x=I ,"\: ! 108 Estatística básica "' .íl X • 00 .íl" =e-J. ,Lcx-1)·x· - +e--< ,Lx-= x=I X! x=O X! "' .íl X "' .íl x-2 =e-J. ~ + =e-A ·.íl 2 ~ + ~ (x-2)! ~ (x-2)! Sejay =x-2, :. VAR(X) = .ri.2 +.íl - ).2 = .íl Exemplos de aplicação 1. Num livro de 800 páginas há 800 erros de itnpressão. Qual a probabilidade de que u1na página contenha pelo 111enos 3 erros? Resolução: X: número de erros por página Â. = 1 P(X> 3 = l -P(X < 3) = 1- {P(X= O)+ P(X= l) + P(X = 2)} =1- O! l ! 2! = l-{0,367879 + 0,367879 + 0,183940} = = 1- 0,919698 = 0,080302 2. Nwna central telefünica chegan1 300 telefone1nas por hora. Qual a probabilidade de que: a) nu1n minuto não haja nenhu1n chamado? b) e1n 2 ininutos haja 2 chamados? e) e1n t minutos não haja cha1nados? Resolução: a) X: nú1nero de chan1adas por minuto -7  = 5 - s sº P(X =O)= e O.! =O, 006738 b) 2 minutos -7 À. = 1 O - 10 102 P(X = 2) =e . = 0,002270 2! Capítulo 4 - Distribuições teóricas de probabilidades de variáveis aleatórias discretas 109 c) t minutos~ À= 5t - 51 (5 )º P(X =O)= e . t = e- s1 O! Exercícios resolvidos 1. Qual a probabilidade de que no 25º lançan1ento de u1n dado ocorra a face 4 pela 5ª vez? Resolução: X: nú1nero de lançan1entos necessários para ocorrer a 5ª face 4 (Pascal). P=.!_ 6 ( 24)( 1 )5 (5 )2º P(X = 25) = 4 6 6 = 0,0356438 2. Urna urna ten1 20 bolas pretas e 30 brancas. Retirarn-se 25 bolas corn reposição. Qual a probabilidade de que: a) 2 sejam pretas? b) pelo menos 3 seja1n pretas? Resolução: 20 X: nú111ero de bolas pretas~ P = 50 = 0, 4 Logo X: B(25; 0,4) a) P(X=2)= 2 ;)(0,4)2 (0,6)23 = 0,00038 b) P(X>3) = 1- P(X<3) = 1-{P(X= O)+P(X= !) + + P(x= 2)} = 1- ( 2 ;)co,4)º(0,6)25 + +(2 1 5 )co,4)1(0,6) 24 +(2;)co, 4)2 (0,6)23 - = 1 - {O + 0,00005 + 0,00038} = 1 -0,00043 = = 0,99957 3. Nurna estrada há 2 acidentes para cada 100 km. Qual a probabilidade de que em: a) 250 krn ocorrarn pelo rnenos 3 acidentes? 110 Estatística básica b) 300 km ocorram 5 acidentes? Resolução: X: número de acidentes por f3 kn1 (Poisson) a) f3 = 250 ~À = 5 P(X> 3) = 1- P(X <3) = 1 - {P(X= O)+ P(X= 1) + +P(X = 2)} = 1.- -5 sº -5 5' e · e · --+ + O! 1 ! 2! = 1- {0,006738 + 0,033690 + +-- + 0,084224} = 1-0, 124652 = 0,875348 b) {3=300~À=6 -6 65 e . P(X = 5) = 5 ! = 0,160623 4. A probabilidade de um arqueiro acertar um alvo com uma ún_ica flecha é de 0,20. Lança 30 flechas no alvo. Qual a probabilidade de que: a) exatamente 4 acertem o alvo? b) pelo n1enos 3 acertem o alvo? Resolução: X: n.úmero de ace1tos no alvo ~ p = 0,20 X: B(30; 0,20) a) P(X = 4) = ( 3 ;)(0, 2)4 (0,8)26 = O, 13252 b) P(X> 3) = 1 - P(X < 3) = 1- {P(X= O) + P(X= l) + +P(X=2)}=1- ( 3 ~ (0,2)º (0,8)30 + +(31º)co,2)'(0,8)29 +(32º)co,2)2 co,8)2s - = l - {0,00124 + 0,00929 + 0,03366} = = l - 0,04419 = 0,95581 Capítulo 4 - Distribuições teórícas de probabilidades de variáveis aleatórias discretas 111 5. Um lote de apare l11os de TV é recebido por un1afirma. Vinte aparelhos são inspecio- nados. O lote é rejeitado se pelo menos 4 forem defeituosos. Sabendo-se que l % dos aparelhos é defeituoso, determinar a probabilidade de a firma rejeitar todo o lote. l~ es olu çã o: X: nú1nero de aparelhos defeituosos X: B(20; 0,01) P(X 2: 4) = 1- P(X < 4) = 1- ( 1 oº)co,01)º (0,99)20 + ( 20 20 20 . + l (0,01)1(0,99)19 + 2 (0, 01)2 (0, 99)'8 + 3 (0,01),(0,99)17 - = l - {0,81791 + o, 16523 + 0,0 1586 + 0,00096} = = 1 - 0,99996 = 0,00004 6. Sabe-se que 20% dos anin1ais submetidos a u1n certo tratamento não sobrevi- ven1. Se esse trata1nento foi aplicado e1n 20 ani1nais e se X é o nú1nero de não- -sobreviventes: a) qual a distribuiçã.o de X? b) calcular E(X) e VAR(X). c) ca lc ularP(2<X~4). d) calcular P(X> 2). Resolução: a) X: B(20; 0,2). b) E(X) = np = 20 · 0,2 = 4. VAR(X) = npq = 20 · 0,2 · 0,8 = 3,2 e) P(2 < x < 4) = P(X = 3) + P(X = 4) = = 0,20536 + 0,21820 = 0,42356 d) P(X> 2) = l - P(X < 2) = l - {P(X= O)+ P(X= l)} = = 1 - {0,01153 + 0,05765 }= 1- 0,06918 = 0,93082 7. A experiência 1nostra que de cada 400 lân1padas, 2 se queima1n ao serem ligadas. Qual a probabil idade de que nu1na instalação de: a) 600 lâtnpadas, no 111ínimo 3 se queime1n? b) 900 lâmpadas, exataine11te 8 se quein1em? Resolução: X: nú1nero de lâmpadas que se quein1a1n nun1a instalação (Poisson) 112 Estatística básica a) À= 3 P(X> 3) = 1 - P(X < 3) = 1 - { P(X = O) + P(X = 1) + + P(X = 2)}= 1 - {0,049787 + 0,149361 + + 0,224042 }= 1 - 0,42319 = 0,57681 b) À = 4,5 P(X = 8) = e- 45 • ( 4,5) 8 = 0,046330 . 8! 8. Nu1na linha adutora de água, de 60 k1n de extensão, ocorrem 30 vaza1nentos no período de um mês. Qual a probabilidade de ocorrer, durante o n1ês, pelo 1nenos 3 vazamentos num certo setor de 3 km de extensão? Resolução: X: número de vazamentos por 3 km 60 kln ~ 30 vazamentos À= 1,5 3 kn1 ~À P(X> 3) = 1-P(X < 3) = 1 - {P(X= O)+ P(X= 1) + P(X= 2)} = = 1 _ e-1'5(1,5)0 + e- 1'5(1,5)1 + e- 1•5 (1,5)2 = O! l! 2! = 1{0,223130 + 0,334695 + 0,251021} = = 1- 0,808846 = 0,191154 9. Numa fita de som, há u1n defeito em cada 200 pés. Qual a probabilidade de que: a) e1n 500 pés não aconteça defeito? b) e1n 800 pés ocorram pelo 1nenos 3 defeitos? Resolução: X: nú1nero de defeitos por f3 pés (Poisson) a) f3 = 500 ~À = 2,5 P(X =O)= e-2,5 . (2,5)º = O! 0,082085 P(X>3)=1-P(X <3)=1- e - 4 • 4 ° e - 4 • 41 e - 4 4 2 --+ +-- O! 1 ! 2 ! J - {0,18316 + 0,073263 +O, 146525} = 1 - 0,238104 = 0,761896 Capílulo 4 - Dístribuições teórícas de probabilidades de variáveis aleatórias discretas 113 l O. O número de mortes por afogamento em fins de semana, numa cidade praiana, é de 2 para cada 50.000 habitantes. Qual a probabilidade de que em: a) 200.000 habitantes ocorram 5 afogamentos? b) 112.500 habitantes ocorram pelo 1nenos 3 afogan1entos? Resolução: X: nú1nero de afogan1entos por f3 habitantes (Poisson) a) f3 = 200.000 --7· À= 8 - 8 85 e . P(X = 5) = = 0,091603 5! b) {3 = ll2.500-7à = 4,5P(X> 3) = 1- P(X < 3) = 1- {0,01 1109 + +0,049990+0,112479} = 1-0,1 73578= = 0,826422 11 . Uma 'firma recebe 720 n1ensagens en1 seu fax e1n 8 horas de funcionan1ento. Qual a probabilidade de que: a) em 6 minutos receba pelo menos 4 nlensagens? b) e1n 4 minutos não receba nenhun1a nlensagen1? Resolução: X: nú1nero de mensagens por f3 minutos a) f3 = 6 1ninutos 720 mensagens --7 480 min} À =9 À --7 6 min -9 9º -9 9' -9 92 -9 93 P(X > 4) = 1- P(X < 4) = 1- e . +e . +e . +e . O! 1! 2! 3! = 1 - { 0,000123 + 0,00 l l l l + 0,004998 + 0,014994 }= 1 - 0,021226 = 0,978774 b) f3=4minutos-7Â.=6 -6 6º e . P(X =O)= = 0,002479 O! 12. Considere 1 O tentativas independentes de um experimento. Cada tentativa admite sucesso com probabilidade 0,05. Seja X o número de sucessos: a) Calcular P( 1 < x < 4). b) Considere 100 tentativas independentes. Calcular P(X < 2). 114 Estatística básica Resolução: a)X: B(IO; 0,05) (10) (10 P(l <X s 4) = 2 (0,05)2(0,95)8 + 3 (0,05)3 (0,95)7 + + ( 1 ~)co,o5) 4 co,95)6 = 0,01463 + + 0,01048 + 0,00096 = 0,08607 b) X: BCI 00; 0,05). Usaren1os a aproxin1ação da binomial pela Poisson. À= l00·0,05 = 5 -5 5º - 5 5' -5 52 e · e · e · P(X<2) = + + = O! l! 2! = 0,006738 + 0,033690 + 0,084224 = = 0,124652 13. Nun1a urna há 40 bolas brancas e 60 pretas. Retira1n-se 20 bolas. Qual a probabili- dade de que ocorram no mínimo 2 bolas brancas, considerando as extrações: a) sen1 reposição; b) con1 reposição. Resolução: X: nútnero de bolas brancas a) Hipergeométrica P(X > 2) = 1-P(X<2) = 1 - {P(X= O) + P(X= 1)} = b) X: B(20; 0,4) P= 4 0 =O 4 100 ' =1 - :º)(~~) (~º) ~~) ( 1 ~i) + ( 1 ~i) = = 1 - {0,000008 + 0,000153}= = 1- 0,000 161 = 0,999839 P(X> 2) = 1 - P(X> 2) = 1 - {0,00003 + 0,00049} = 1 - 0,00052 = 0,99948 Capítulo 4 - Distribuições teórícas de probabilidades de variáveis aleatórias discretas 115 14. Um técnico visita os clientes que compraram assinatura de um canal de TV para verificar o decodificador. Sabe-se, por experiência, que 90% desses apareU1os não apresentam defeitos. Resolução: a) Determinar a probabilidade de que em 20 aparelhos pelo nlenos 17 não apresen- te1n defeitos. b) Se a probabilidade de defeito for de 0,0035, qual a probabilidade de que ern 2.000 visitas ocorra no ináximo 1 defeito? a) X: número de decodificadores sem defeito X: B(20; 0,90) ( 20) 17 3 20) 20 o P(X>l7)= 17 (0,90) (0,10) + ... + 20 (0,90) (0,10) = = 0,19012 + 0,28518 + 0,27017 + 0,12158 = = 0,86705 b) Y: número de decod ificadores defeituosos Y: B(2.000; 0,0035) Fazendo a aproximação pela Poisson, ten1os: À.= 2.000 . 0,0035 ~À. = 7 - 7 7º - 7 71 e · e · P(Y < 1) = + =O, 000912 +O, 0063 83 = O, 007295 o! l ! 15. Uma fábrica de 1notores para máquinas de lavar roupas separa de sua linha de pro- dução diária de 350 peças uma an1ostra de 30 itens para inspeção. O número de peças defeituosas é de 14 por dia. Qual a probabilidade de que a an1ostra contenha pelo menos 3 motores defeituosos? Resolução: X: nú1nero de n1otores defeituosos na amostra X: Hipergeométrica N =350 r= I4 n = 30 P(X> 3) = 1 - P(X < 3) = 1 - {P(X= O)+ P(X= 1) + P(X= 2)} = =1- 14) 336) l 29 + (3:0º) + = 1 - {0,278142 + 0,380521+0,232884} = = 1 - 0,891547 = o,108453 116 Estatística básica 16. Seja X: B(200; 0,04). Usando aproximação, calcular: a) P(X= 6); b) P(X + 2a > ft). Resolução: Sendo Z = 4X - 5, calcular E(Z) e VAR(Z). µ = E(X) = 200 · 0,04 = 8 a2 = VAR(X) = 200 · O 04 · O 96 = 7 68 ~a= 2 77 ' ' ' ' Aproximando pela Poisson, temos: ). = 200 . 0,04 = 8. e-s . 86 a) P(X=6)= ::: 0,122138 6! b) P(X + 2a > ft) = P(X + 2 · 2,77 > 8) = P(X> 2,46) = = 1 - P(X < 2,46) = l - P(X < 2) = = 1 - {0,000336 + 0,002684+0,010735} = = 1 - 0,013755 = 0,986245 { E (Z)=4·8-5= 27 seZ =4X-5 VAR(Z) = 16·VAR(X)=16 · 7,68 = 122,88 17. Seja X: B( 400; 0,02). Calcu lar, usando a aproxitnação pela Poisson: a) P(X= 7) b) P(2 '5: X < 6) c) P(X > 3) Resolução: ). = np = 400 · 0,02 = 8 e-s . 81 a) P(X = 7) = = 0,139587 7! e-s. 82 e-s. 83 e-s. 84 b) P(2<X <6)= + + + 2! 3! 4! -8 8s e . + =O, O 10735 +O, 028626 +O, 057252 +O, 091603 = 5! = 0,1 88216 c) P(X> 3) = 1-P(X < 3) = 1- {P(X= O) + P(X= 1) + + P(X= 2)} = l - {0,000336 + 0,002684 + 0,010735}= = 1 - 0,013755 = 0,986245 Capítulo 4 - Distribuições teórícas de probabilidades de variáveis aleatórias discretas 117 18. Uma urna tem 1 O bolas brancas e 40 pretas. a) Qual a probabilidade de que a 6ª bola retirada con1 reposição seja a 1 ªbranca? b) Qual a probabiJjdade de que de 16 bolas retiradas sem reposição ocorrarn 3 brancas? c) Qual a probabilidade de que a 15ª bola extraída com reposição s~ja a 6ª branca? d) Qual a probabilidade de que em 30 bolas retiradas con1 reposição ocorram no 1náximo 2 brancas? e) Se o número de bolas na urna fosse 50 brancas e 950 pretas, qual a probabili- dade de que, retirando-se 200 bolas, com reposição, ocorressem pelo menos 3 brancas? Resolução: a) Geométrica: 10 P=-=0 2~q=0 8 50 ' ' P(X = 6) = (0,8)5 • 0,2 = 0,065536 b) Hipergeométrica: 0,293273 c) Pascal: P(X=l5)=( 1 ;)co,2) 6 (0,8) 9 = 008599 d) Binom.ial ~X: B(30; 0,2) P(X :S 2) = ( 3i) (O, 2)0 (0,8)30 + (31º)co,2)' (0,8)29 + 30) + 2 (O, 2)2 (O, 8)28 =O, 00124 +O, 00929 + + 0,03366 = 0,04419 e) X: (200; 0,05) ~ Usare1nos a aproximação pela Poisson ~ ~À = 200 . 0,05 = lo P(X"2:. 3) = 1 -P(X < 3) = 118 Estatística básica e- 10 • 10° e- 10 • 101 =l- + + o! 1 ! e - 10 . 102 + = 1- {0,000045 + 2! + 0,000454 + 0,002270} = 1 - 0,002769 = 0,997231 19. Vinte por cento dos refrigeradores produzidos por u1na empresa são defeituosos. Os aparelhos são vendidos e1n lotes com 50 unidades. Um comprador adotou o seguinte procedimento: de cada lote ele testa 20 aparelhos, e se houver pelo 1nenos 2 defei- tuosos o lote é rejeitado. Ad.mitindo-se que o co1nprador tenha aceitado o lote, qual a probabilidade de ter observado exatamente u1n aparelho defeituoso? Resolução: X: nú1nero de defeituosos no lote de 20 aparelhos X: B(20; 0,2) P(Aceitar) = P(X < 2) = P(X =O)+ P(X = 1) = = ( 200) (O, 2)º (O, 8)20 + ( 210) (O, 2)1(O,8)19 = = 0,0l153 + 0,05365 = 0,06918 P(X = 1 / Aceitou)= P(X = l) =O, 05765 = P(Aceitar) 0,06918 0,83333 , 20. U1n detenninado artigo é vendido em caixa a preço de R$ 20,00 cada. E caracte- rística de produção que 20% destes artigos sejam defeituosos. Um co1nprador fez a seguinte proposta: de cada caixa escolhe 25 artigos, ao acaso, e paga por caixa: R$ 25,00, se nenhurn artigo, dos selecionados, for defeituoso; R$ 17,00, se um ou dois artigos forem defeituosos; R$ 10,00, se três ou rnais forem defeituosos. O que é 1nelhor para o fabricante: man- ter o seu preço de R$ 20,00 por caixa ou aceitar a proposta do consumidor? Resolução: X: número de artigos defeituosos X: B(25; 0,2) P(X= O)= 0,00378 P(l <X<2) = P(X= 1) + P(X= 2) = = 0,02361 + 0,07084 = 0,09445 Capítulo 4 - Distribuições teórícas de probabilidades de variáveis aleatórias discretas 119 P(X> 3) = 1 - {0,00378 + 0,02361+0,07084}= = 1 - 0,09823 = 0,90177 Y: pagamento por caixa do consu.midor. y P(Y) y . P(l') 25,00 0,00378 0,0945 17,00 0,09445 1,60565 10,00 0,90177 9,0177 1 10,71785 E(Y) = 10,72, que é o preço médio por caixa da proposta do comprador. Logo, o fabricante deve 1nanter seu preço de R$ 20,00 por caixa. 21. Sejam X e Yvariáveis aleatórias independentes com distribuições de Poisson, X com 1nédia 0,2, X = O, 1, 2 e Y com média 1, Y = O, 1, 2, 3, 4. Seja Z = l2X- J1, detern1inar E(Z) usando a distribuição de probabilidade de Z. Resolução: Os valores de P(X) e P(Y) foram tirados da tabela da distribuição de Poisson, para À. = 0,2 e À. = 1, respectivamente, fazendo o arredondamento na 2ª decimal. X P(X) y P(Y) o 0,82 o 0,37 1 0,16 1 0,37 2 0,02 2 0,18 L 1 3 0,06 4 0,02 L 1 y o 1 2 3 4P(X) X o 0,30 0,30 o, 15 0,05 0,02 0,82 1 0,06 0,06 0,03 0,01 o o, 16 2 0,01 0,01 o o o 0,02 P(Y) 0,37 0,37 0,18 0,06 0,02 1 120 Estatística básica Z = l2X- 11 z P(Z) o o,..,,.., ,_,.) 1 0,37 2 0,21 3 0,06 4 0,03 L 1 Exercícios propostos l. SejaX:B(10, ~).calc u lar: a) P(X= 3); c) P(X> 4); e) P(IX- 21 < I ); g) P(IX- 31 > 1); i) z X-µ , E(Z) e VAR(Z), sendo = 0 · -' Z · P(Z) o 0,37 0,42 O, 18 O, 12 1,09 b) P(X< 2); d) P(X- 2<1); f) P(3 <X< 5); h) E(X) e VAR(X); : . E(Z) = 1,09 E(l2X - fl) = 1,09 2. Seja X: B(n, p). Sabendo-se que E(X) = 12 e VAR(X) = 4, detenninar n, p, E(Z) e X-6 VAR(Z), sendo Z = 3 . 3. Uma remessa de 800 estabilizadores de tensão é recebida pelo controle de qualidade de u1na e1npresa. São inspecionados 20 aparelhos da remessa, que será aceita se ocorrer no 1náximo un1 defeituoso. 1-Iá 80 defeituosos no lote. Qual a probabilidade de o lote ser aceito? 4. Numa cidade, é selecionada uma amostra de 60 adultos e a esses indivíduos é pedi- do para opinarem se são a favor ou contra detern1inado projeto. Co1no resultado ob- tido, observou-se 40 a favor. Se na realidade as opiniões pró e contra são igualn1ente divididas, qual é a probabilidade de ter obtido tal resultado? 5. U1n órgão governa1nental credencia a firma A para fazer vistorias en1 carros recupe- rados ou construídos particularmente e dar a aprovação ou não para que detennina- do carro possa ser lacrado no Detran. Resolve testar se a firrnaA está trabalhando de acordo cotn suas especificações. De um lote de 250 carros vistoriados e aprovados por A, escolhe 50 e faz novas vistorias. Se encontrar no mínimo 2 que não mereça1n a aprovação, descredencia A . Sabendo-se que no lote de 250 há 8 carros que fora1n aprovados irregularmente, qual a probabilidade do descredenciamento? Respostas Capítulo 4 - Distribuições teóricas de probabilidacles de variáveis aleatórias discretas 121 6. O número de partículas gama emitidas por segundo, por certa substâ.ncia radioativa, é uma variáve.l aleatória co1n distribuição de Poisson com À = 3,0. Se um instrurnen- to registrador toma-se inoperante quando há mais de 4 partículas por segundo, qual a probabilidade de isso acontecer em qualquer dado segundo? 7. U111a máquina produz deter111inado artigo; no fim de cada dia de trabalho ela é ins- pecionada com a finalidade de se verificar a necessidade, ou não, de ser sub1netida a ajuste ou reparo. Para tal fim, um inspetor to1na un1a amostra de 1 O itens produzidos pela 1náquina, decidindo por ajuste ao assinalar de u1n a cinco itens defeituosos, e por reparo, no caso de 1nais de cinco itens defeituosos. Se a máquina está produzindo, em 1nédia, l % de itens defeituosos, deten11inar a probabilidade, após u1na inspeção: a) de não ser necessário ajuste ou reparo; b) de ser necessário apenas ajuste; c) de ser necessário reparo. 8. Na fabricação de um tecido ocorrem 2 tipos de defeitos: falha na pigtne11tação e falha na trarna. O quadro abaixo representa a distribuição de probabilidades de ocor- rências destes defeitos em uma peça, sendo X a quantidade ele fa lhas de pigmentação e Y a quantidade de falhas de trama. a) Qual a probabilidade de se encontrar, nun1 lote de 20 peças, no 1náximo 18 peças se1n nenhurn defeito? b) Qual a probabilidade de se encontrar, nun1 lote de 25 peças, no máximo 3 peças com pelo rnenos 3 defeitos ern cada urna? y o 1 o X o 0,7 0,05 0,06 1 0,05 0,02 0,055 2 0,02 0,03 0,015 9. En1 urn pronto-socorro, o número de atend irnentos de emergência segue tuna distri- buição de Poisson com média de 60 atendin1entos por hora. Calcular: a) A probabilidade de o pronto-socorro não efetuar t1enhu1u atendimento em tun intervalo de 5 nlinutos. b) A probabilidade de o pronto-socorro efetuar pelo menos 2 atendin1entos em un1 intervalo de 1 O nlinutos. 1 O. U1na fábrica de auton1óveis verificou que, ao testar seus carros na pista de prova, há, e1n 1nédia, urn estouro de pneu em cada 300 km, e que o número de pneus estourados segue razoaveln1ente un1a distribuição de Poisson. Qual a probabilidade de que: a) um teste de 900 km haja no máxirno urn pneu estourado? b) u1n carro anele 450 k1n na pista se1n estourar nenhum pneu? Respostas 122 Estatística básica 11. Un1a fábrica produz isoladores de alta tensão que são classificados con10 bons e ruins de acordo co1n u1n teste padrão. Da produção de uLn dia retiraram-se 10 isoladores que no laboratório apresentan1-se con10 sendo 8 bons e 2 ruins. Pede-se para calcular a probabilidade deste resultado, ad1nitindo que a máqui11a produza e1n n1édia: a) 95% de bons e 5% de ruins. b) 0% de bons e 10% de ruins. 12. Oito dados são lançados simultaneamente. Seja X o nútnero de vezes que ocorre a face 3, calcule: a) P(I <X<4). b) P(X'C. 3). c) E(X). d) VAR(X). 13. Calcular em 9 lances de uma moeda não viciada a probabilidade de que se tenha: a) Menos de 3 caras. b) Pelo menos 4 caras. c) Exata1nente 2 caras. 14. Un1 caixa de banco atende 150 clientes por hora. Qual a probabilidade de que atenda: a) Nenhu1n cliente en1 4 minutos. b) No 1náximo dois cl ientes e1n 2 minutos. 15. Seja111 X1, X2, ... ,X,,, n variáveis aleatórias independentes, com distribuição de Ber- noulli, com parâ1netros p. Seja X = X1 + .x; + ... +X,,, prove que: a) E(X) = np. b) VAR(X) = npq. 16. Na fabricação de peças de deterrninado tecido aparecem defeitos ao acaso, um a cada 250 tn. Supondo-se a distribuição de Poisson para os defeitos, qual a probabi- lidade de que na produção de 1.000 m: a) não haja defeito? b) aconteça1n pelo 1nenos três defeitos? e) en1 un1 período de 80 dias de trabalho, a produção diária é de 625 m. E1n quantos dias haverá u.ma produção se1n defeito? 17. O CRH de uma firma entrevista 150 candidatos a en1prego por hora. Qual a proba- bilidade de entrevistar: a) no máximo 3 candidatos em 2 minutos? b) exatamente 8 candidatos em 4 1ninutos? Respostas Capítulo 4 - Distribuições teórícas de probabilidades de variáveis aleatórias discretas 123 18. Seja X: B(300; 0,01 ). Usando aproxi1naçã.o pela Poisson, calcular: a) P(X= 4). b) P(X2. 2). e) P(l <X<4). 19. U1n inspetor de qualidade recusa peças defeituosas numa proporção de 10% das peças examinadas. Calcular a probabilidade de que sejam recusadas: a) Pelo menos 3 peças de um lote co1n 20 peças exam.inadas. b) No máximo 2 peças de um lote de 25 peças examinadas. 20. Sendo X: B(200; 0,025) e usando aproxin1ação, calcular: a) P(X> 4). b) P(X= 5). e) P(X< 2). d) P(IX - 21<1). 21. A probabilidade de u1n atirador aceitar no alvo num único tiro é 1 /4. O atirador atira 20 vezes no alvo. Qual a probabilidade de acertar: a) Exatan1ente 5 vezes. b) Pelo rnenos 3 vezes. e) Nenhuma vez. d) No máxiino 4 vezes. 22. De acordo com a Divisão de Estatística Vital do Departamento de Saúde dos Esta- dos Unidos, a média anual de afogamentos acidentais neste país é de 3 por 100.000 indivíduos. Detern1inar a probabilidade de que e1n uma cidade com 300.000 habi- tantes se verifiquem: a) Nenhum afoga1nento. b) No máximo 2 afogamentos. c) Mais de 4 e menos de 8 afoga1nentos. 23. En1 teste com u.rn motor, há falhas em 2 co1nponentes, a cada 5 horas. Qual a proba- bilidade de que: a) Em 10 horas de testes nenhum componente falhe. b) Em 7 1 /2 horas de testes ocorram falhas no 1náxi1no em 3 con1ponentes. 24. Nurn lote de 40 peças, 20% são defeituosas. Retirarn-se 1 O peças do lote. Qual a probabilidade de se encontrar: a) 3 defeituosas. b) No máximo 2 defeituosas. 25. Uma uma contén1 8 bolas brancas e 12 pretas. Retiram-se 1 O bolas com reposição. Qual a probabi lidade de que: Respostas 124 Estatística básica a) no máximo 2 seja111 brancas? b) 3 seja1n brancas? 26. A probabilidade de uma 1náquina produzir u111a peça defeituosa, e111 un1 dia, é de O, 1. a) Qual a probabi lidade de que em 20 peças produzidas pela máquina,en1 um dia, ocorra1n 3 defeituosas? b) Qual a probabilidade de que a 18ª peça produzida no dia seja a 4ª defeituosa? c) Qual a probabilidade de que a 1 Oª peça produzida em um dia seja a Jª defeituosa? d) Separa-se um lote de 50 peças das 400 produzidas em u1n dia. Qual a probabilidade de que 5 seja1n defeituosas, sabendo-se que das 400, 20 são defeituosas? e) Se a probabil idade da n1áquina produzir u1na peça defeituosa, nu1n dia, fosse de 0,01, qual a probabilidade de se ter no 111áxi1110 4 defeituosas en1 un1 dia de 500 peças produzidas? 27. Sabe-se que o número de passageiros por veículos tipo van em determinada rodovia segue aproximadarnente uma distribuição binomial com parâmetros n = 10 ep = 0,3 (uti lize apenas 2 casas decitnais). a) Calcular o nún1ero n1édio de ocupantes por veículo. b) Qual a probabilidade de que, em um deten11inado dia, a quinta van que passar por esta rodovia seja a segunda a transportar n1ais do que 3 pessoas? c) A taxa de pedágio nesta rodovia é cobrada da seguinte maneira: se o veículo trans- po1ta uma pessoa apenas (só o motorista), é cobrado R$ 6,00; se o veículo tem 2 ou 3 ocupantes, R$ 4,00; e se tiver mais do que 3 ocupantes, R$ 2,00. Calcular a arrecadação média diária, sabendo-se que, en1 média, passa1n 300 veículos por dia neste pedágio. Respostas Variáveis aleatórias contínuas 5.1 Definicões I Consideremos a distribuição de probabilidades da variável aleatória discreta X: X P(X) l O, l 2 0,2 .... .) 0,4 4 0,2 5 O, 1 Faren1os o histograma da distribuição de probabilidades de X. O h:istograrna é u1n gráfico da distri buição de X. É construído co1n retângulos de bases unitárias e alturas iguais às probabi lidades de X = xo. ' P(X) 0,4 I • 0,3 - 0,2 - 0,1 . A,, A,., A.., A,, A,, - • • ' • ' o 1 2 3 4 5 X 126 Estatística básica As áreas dos retângulos são: A,.1 = b1 • h1 = 1 · 0,1 = 0,1 :. Ar1 = P(X= 1) A,2 = b2 · h1 = 1 · 0,2 = 0,2 : . Ari = P(X = 2) ArJ = b3 · h3 = 1 • 0,4 = 0,4 :. A,.3 = P(X = 3) A, .. 1 = b4 · h4 = 1 · 0,2 = 0,2 :. A,4 = P(X= 4) A,.s =bs·hs=L·0,1=0,1 : . A,s= P(X= 5) 5 Co1no _LP(X = i) = 1, te1nos que: i=I Para calcularmos, por exe1nplo, P(l <X< 3), basta calcular a so1na das áreas Ari, Ar2 e Ar3, isto é, 3 P(I <X<3) =LA" =0,1+0,2+0,4=0,7. i=I Se to1narmos os pontos médios das bases superiores dos retângulos e os ligarmos por un1a curva, teremos, se considerarmos X u1na variável aleatória contínua, u1na fun- ção contínuaj(X), representada no gráfico: /f(x) a b X Poden1os, então, definir variável aleatória contínua: unia variável aleatória X é contínua e1n ~ se existir un1a função f(x) , tal que: 1. j(x) 2: O (não negativa). 2. J ~ 00 f (x)clx = 1. A função/(x) é cha1nada.fanção densidade de JJrobabilidade (f. d. p.) Observa1nos que: P(a <X~ b) = J: f(x)d.'I: (corresponde à área deli111itada pela função f{x), eixo dos X,e pelas retas X= a e X= b ). Capitulo 5 - Variáveis aleatórias contínuas 127 Pode1nos estender todas as definições de variáveis aleatórias discretas para variá- . ' veis continuas. Se X é uma variável aleatória contínua, então: DEFINIÇAO E(X) = J ~,,, x · f(x)dx A esperança pode ser entendida co1no urn "centro de distribuição de probabilidades". DEFINIÇÃO f <» 2 V AR(X) = _.., { - ~-E(X) } · f(x)dx ou VAR(X)=E(X2)-{E(X)} 2 , onde E(X2 ) = J..: x 2 • f(x)dx. Ta1nbém pode1nos definir: F(x) = P(X S': x) = J_·: .f(s)ds, e o gráfico genericarnente é: F(x) .. ---- ------ - .. ---- --- -:--:.:--------- X Pode1nos encontrar a f. d. p., se existir, a pa1tir de F(x), pois: d -F(x) = .f(x) dx nos pontos onde F(x) é deriváve 1. 128 Estatística básica Exemplos de aplicação 2x + 3 se O < x < 2 l. Verificar se f (x) = 0 é u1na f. d. p. Resolução: a) f(x) >O para todo x. se x :::;; O ou x > 2 b) f 00 f(x)clx=f 1 (2x+3)dx=(x 2 +3x) 2 =4+6=10:. - oo o o :. não é tuna f. d. p. Se definirmos: f(x) = 1 10 (2x+3) seO<x<2 o se x <O ou x > 2, então j(x) é uma função densidade de probabilidade. 2. Seja f (x) = kx seO<x<l O se x :::;; O ou x > 1 Determinar: a) k a fim de quef(x) seja f. d. p. b) o gráfico def(x). c) P(o<X<~)· d) E(X). e) VAR(X). t) F(x). g) gráfico de F(x). Resolução: f oo J 1 X2 a) f(x)cl'C=l~ kxdx=I~k --oo o 2 = 1 :. k=2 o 2x se O<x:51 b) j"(x)= 0 sex<O oux> 1 f(x) 2 1 X Capitulo 5 - Variáveis aleatórias contínllaS 129 1 4 d) E(X) = J: >:;f'(x)dx = J ~x·2x d.'C = J ~2x 2 dx = x3 2 =2 - 3 3 o e) E(X2 ) = J +"° x 2f(x)dx = J 1x2 • 2x dx = J 12x3dx= -oo o o Logo: x 4 1 • - - .. 2 2 o se x<O se O<x<l se x>l d Obs.: - F(x) = 2x para O< x < 1. dx g) F(x) 1 l 1 18 X 3. Seja X uma variável aleatória contínua com f. d. p. dada por 2x j'(x) = O se O:::;x:::;I sex<O ou x>l 130 Estatística básica Calcular P X< - - <X < - . ( 1 1 2) 2 3 3 Resolução: Con10 [o .!.] n [! ~] = [! .!.] temos: ' 2 3 ' 3 3 ' 2 ' 1 1 - - - 23 3 p(.!.<X< -2) J . ~ 2xdx (x 2 )I ~ _4 _ _ 1 3 3 /":. / 3 9 9 5 3 9 5 12 4. Seja X o tempo durante o qual um equipa1nento elétrico é usado e1n carga máxima, num certo período de tempo, em minutos. A função densidade de probabilidade de Xé dada por: f(x)= 1 --? x, se O:::; ,\: < 1.500 1.500- 1 --, (3.000 - x), se l.500<x<3.000 1.500- Calcular E(X), ou seja, o te1npo n1édio e1n que o equipamento será utilizado em ' . carga max1ma. Resolução: J 1.500 1 J 3.000 1 E(X)= , x·xdx+ 2 (3.000 -x)xdx= º 1.500- 1.soo 1.500 Graficamente: 1 1.5002 1 1.500 o x3 1.500 3 o f(x) 3.000 ' X~ + 1.500x2 - - - 1.500 n1in 3 1.500 1.500 3.000 X Capitulo 5 - Variáveis aleatórias contínuas 131 5.2 Principais distribuições teóricas de probabilidades de variáveis aleatórias contínuas Algumas distribuições de variáveis aleatórias contínuas são iinportantes. Faremos o estudo de três delas, dando 1naior destaque à distribuição normal. Distribuição uniforme Uma variável aleatória contínua X tem distribuição unifonne de probabilidades no intervalo [a, b] se a sua f. d. p. é dada por: O valor de k é: f b kdx=I ( 1 • • • .f'(x) = 1 k= . Logo: b - a 1 -- sea<x<b b-a k sea$x$b f(x) = · O se .\'. < a ou x > b f(x) a b X O sex<a ou >b A função de distribuição de X é dada por: I X 1 1 X X- a F(x)= ds= (s) =-- ª b- a b-a b-a <1 132 Estatística básica Logo, E seu gráfico é: A esperança de X é: F(x)= F(x) o x-a b - a 1 sex~a se a <x <b se x?::. b 1 -------------------- .....----- a b X {J b 1 x 2 1 E(X)= f x· dx= - · - ª b - a 2 b - a 2 (b - a) a . . . : . E(X) = b; ª E(X) é o ponto 1néd io do intervalo [a, b ]. A variância de ,)( é dada por: ' b x' ? f b ? 1 E(X-)= x- · dx= ª b-a 3 (/ b3 3 -a b2 +ab+a2 1 ·-- b-a ---- ----:. 3 (b - a) 3 : . VAR(X)= b2 +ab+a2 - (a+b)2 :. 3 4 ? : . VAR(X)= (b-a)- 12 Capitulo 5 - Variáveis aleatórias contínuas 133 Exemplos de aplicação 1. Um ponto é escoll1ido ao acaso no intervalo [O, 2]. Qual a probabilidade de que esteja entre l e 1,5? Resolução: /(x)= 1 - para O~x~2 2 O se x < O ou x > 2 1.5 1 1 l.S 1 :.P(I<X<I,5)=f -dx=-( -~) = - 1 2 2 4 1 • • • 2. A dureza H de urna peça de aço pode ser pensada como urna variável aleatória corn distribuição uniforme no intervalo [50, 70] da escala de Rockwel. Calcular a proba- bilidade de que uma peça tenha dureza entre 55 e 60. Resolução: .f(h) = l - se50 ~h~70 20 O se h < 50 ou h > 70 601 1 60 1 :. P(55<h<60)=f -dh=-(h) = - 55 20 20 4 55 Distribuição exponencial • • • Uma variável aleatória contínua X tem distribuição exponencial de probabilidade se a sua f. d. p. é dada por: ).. e-i. x .f(x) = 0 O gráfico da f. d. p. de X é f(x) o sex>O sex <O X 134 Estatística básica A função de distribuição de X é: Logo: 1-e - i.x se x > O F(x) = O se x:::; O E o gráfico é: F(x)1 --------------------------- X A esperança da distribuição de X é dada por: = ( 0-0 )-( 0- ~) = ~ :. E(X) = ~ Obs.: lim xe-"" = lim ,\'. = lim _, .... oo .t ... 00 e). ,"( .t ... !'O De 1nodo análogo, chega1nos a V AR(X) = J. 1 2 Capitulo 5 - Variáveis aleatórias contínuas 135 Exemplo de aplicação Uma variável aleatória contínua X tem f. d. p. dada por: f(x) k ,. - e-· sex2!:0 2 O sex<O a) Calcular o valor de k. b) Determinar F(x). c) Determinar a 1nediana da distribuição. Resolução: ook k "' a) J 0 2e -xdx=I ~2(-e --' ) =I~k=2 o b) c) DEFINIÇÃO ou direta1nente k k  = l e À.= - :. - = 1~k=2 2 2 1-e-x sex >O F(x)= O sex<O ni é mediana da distribuição se P(X> 111) = P(X < m). f /11 ( )Ili P(X<m) = e-xdx = -e-x 1-e-m :. o o :.P(X>m)=P(X<ni)=>e-m = I- e-111 :. -m 1 l 2 :. e = - ~ m = n :. 2 m = 0,693147 Distribuição normal Uma variável aleatória co11tínua X tem distribuição normal de probabilidade se a sua f. d. p. é dada por: .f(x)= ~e - ~{":'')', para -oo< x<+oo. a 2n 136 Estatística básica O gráfico dej(x) é: µ - cr µ µ + cr X As principais características dessa função são: a) O ponto rnáxiino de/(x) é o ponto X=µ. b) Os pontos de intlexã.o da função são: X =µ +a e X=µ - a. c) A curva é sin1étrica co1n relação a ~l. d) E(X) = µ e VAR(X) = a2 • De1nonstra-se que f 00 ~e -4{x:'' r d;i: = l. -ooa 2n X a b Se quisennos calcular a probabilidade indicada na figura, devernos fazer: que apresenta um grau relativo de dificuldade. Usare1nos a seguinte notação: X: N(µ, a2) (Xte1n distribuição norrnal co1n n1édiaµ e variância a2.) Seja X: N( µ , a2) , definimos: X-µ Z = --- a Detnonstra-se que Z ta1nbé1n tem distribuição norn1al. Z é chamada de variável norn1al reduzida, nortnal padronizadct ou variável norn1alizada. Mostrare1nos que E(Z) = O e VAR(Z) = 1 Capítulo 5 - Variáveis aleatórias contínuas 137 E(Z)=E{(X- µ)} =J_E(X- µ)=J_{E(X)- µ}=O a a a V AR (Z) =V AR =--,-V AR (X - µ)=--,-V AR (X)= 1 { X-µ} 1 1 a a- a- Logo, se: X: 1V(µ, a2) ~ Z: N(O, l) . f( 1 _,2 , , a f. d. p. de Z e . z) = J2;; e - - para -oo < z < +oo. - 1 o 1 z Essa curva é també1n si1nétrica com relação aµ,. Verificare1nos agora a correspondência entre X e Z, por 1neio do exe1nplo: Seja X: N(20, 4 ). Achar os valores reduzidos correspondentes a X,= 14, X2= 16, X3= 18, X4= 20, Xs= 22, X6= 24 X1= 26. SeX: N(20, 4) µ = 20 X - µ X - 20 e Z= - a =2 a 2 14-20 z - --3 . z --3 1- 2 - .. 1- b) ,X;= 16 z, = 16-20 = -2 :. Z2 =-2 - 2 c) X3= 18 18-20 Z3 = = - 1 : . Z3 = - 1 2 d) Xi= 20 24 __ 20-20 --O z O 2 :. 4 = µ , = 138 Estatística básica e) Xs= 22 22-20 Z= =l:.Z.=1 5 2 ) 24-20 Z6 = = 2 :. Z6 = 2 2 g) x;= 26 26-20 Z7 = = 3 :. Z7 = 3 2 Graficamente: 14 16 18 20 22 24 26 X - 3 - 2 - 1 o l 2 3 z 14=µx-3a 16=µx-2a 18= µX -(J 20 = flx 22= µX +a 24= fl x +2a 26= ,ux +3a -3=µ , -30' -2=µ , -2a -l=fl z -(J O=µ, 1= µ , +a 2=µ , +2a 3=,u , +3a Conclui1nos que a variável Z indica quantos desvios padrões a variável X está afas- tada da 111édia. Como as curvas são simétricas e1n rela9ão às médias, Capítulo 5 - Variáveis aleatórias contínuas 139 µ - O" µ µ+O" X P(µ - a <X< Jl) = P(µ <X<µ +a) -1 o 1 z P(- 1<Z<O)=P(O<Z<1) Ta1nbérn concluí1nos que se X: 1V(µ , a2), então X. µ x; X z, z Pois e 140 Estatística básica onde e z,, = X2 -µ - a Uso da tabela: A vantage1n de se usar a variável Z = X - µ é que podemos tabelar os valores da a área, ou as probabilidades, pois para cada X dado, a área depende deµ e a2• Comoµ== O e a2 = l, u1na tabela de Zé suficiente. A tabela apresentada no final do livro (páginas 337 e 338) nos dá Exemplos de uso da tabela 1. Seja X: 1V( 100, 25). Calcular: a) P(l 00 <X< 106); b) P (89 <X< 107); e) P( 112 <X< 116); d) P(X > 108). Resolução: .. o z,. z P(O < Z < Z,,) =a. X-100 :. µ =100 e o= 5-7 Z =-- 5 - a) P(lOO<X<106)=P(O<Z<l,2)= 0,384930 100 106 X Capítulo 5 - Variáveis aleatórias contínuas 141 z = 100 - 100 = o 1 5 Z - 106 - 100 - 2 , - -1 z - 5 ' o 1,2 b) P(89 <X< 107) = P(- 2,2 < Z < 1,4) = = P(-2,2 S ZS O) + P(O S Z S 1,4) = = 0,486097 + 0,419243 = 0,90534 89 100 107 X - 2,2 o 1,4 z e) P(l 12 S X S 116) = P(2,4 S Z S 3,2) = = P(O < Z < 3,2) - P(O < Z < 2,4) = = 0,499313 - 0,49 1803 = 0,00751 o 100112 116 X o 2,4 3,2 z z = 89-100 = -2 2 1 5 ' Z, = 107 -100 =l 4 - 5 ' z = 112 -100 = 2 4 1 5 ' z = 116-100 = 3 2 2 5 ' 142 Estatística básica d) P(X > 108) = P(Z 2:: 1,6) = 0,5 - P(O :S Z < 1,6) = = 0,5 - 0,445201 = 0,054 799 100 108 X o 1,6 z 2. Sendo X: .1V(50, 16), deter1ninar X,,, tal que: a) P(X> X,,) = 0,05 b) P(X :S X,,) = 0,99 Resolução: u = 50 a = 4 1 ' a) P(X> Xa) = 0,05 50 o z = 108 - 100 = 1 6 1 5 ' 0,05 / x;, X 0,05 / z Procurando no corpo da tabela 0,45 (0,5 - 0,05), encontramos: Za= 1,64 X -µ X -50 :. COl110 Za = ª ~ 1,64= ª :. ~ = 56,56 :. a 4 :. P(X> 56,56) = 0,05 Capítulo 5 - Variáveis aleatórias contínuas 143 b) P(X<Xa) = 0,99 0,99 ....--r-- / 0,01 / 50 X 0,99 ....--r-- / 0,01 / o z .. z Procurando no corpo da tabela 0,49 (0,5 - 0,01), encontra1nos: Za = 2,32 2 32= Xª -50 ' 4 Xa = 59,28 :. P(X < 59,28) = 0,99 Exemplos de aplicação 1. Urn fabricante de baterias sabe, por experiência passada, que as baterias de sua fabricação têm vida média de 600 dias e desvio padrão de 100 dias, sendo que a duração tem aproxin1ada1nente distribuição nonnal. Oferece u1na garantia de 312 dias, isto é, troca as baterias que apresentaren1 falhas nesse período. Fabrica l 0.000 baterias mensahnente. Quantas deverá trocar pelo uso da garantia, 1nensahnente? Resolução: { µ = 600 dias X: duração da bateria 100 d" a= ias ~ Z= X-600 100 144 Estatística básica 312 600 X - 2,88 o z P(X < 312) = P(Z < - 2,88) = 0,5 - P(- 2,88 < Z <O)= = 05-0498012 = 0.001988 ' ' , z = 312-600 =-2 88 1 100 ' Deverá substituir mensalmente: 10.000x0,001988 = 19,88 = 20 baterias 2. Un1a fábrica de carros sabe que os motores de sua fabricação têm duração normal co1u 111édia de 150.000 krn e desvio padrão de 5.000 km .. Qual a probabilidade de que um carro, escolhido ao acaso, dos fabricados por essa firma, tenha um 1notor que dure: a) 1nenos de 170.000 kn1? b) entre 140.000 km e 165.000 km? c) Se a fábrica substitui o 1notor que apresenta duração inferior à garantia, qual deve ser esta garantia para que a porcentage1n de 1notores substituídos seja infe- rior a 0,2%? Resolução: µ = 150.000 km X: duração do 1notor e1n k1n ~ a =5.000 km z =X -150.000 5.000 Capítulo 5 - Variáveis aleatórias contínuas 145 a) P(X < 170.000) = P(Z < 4) = 0,5 + P(O <Z $4) = = 0,5 + 0,499968 = 0,999968 150.000 170.000 X z = 170.000-150.000 = 4 1 5.000 o 4 z b) P(l40.000 <X< 165.000) = P(- 2 < Z < 3) = = P(- 2 $ Z $ O) + P(O $ Z $ 3) = = 0,477250 + 0,498650 = 0,97590 z = 140.000-15.000 = -2 1 5.000 140.000 150.000 165.000 X z = 165.000 - 150.000 = 3 2 5.000 - 2 o 3 z 146 Es1a1istica básica c) P(X<X,.,) = 0,002 0,002 0,002 ""' ""' X" 150.000 X o z Procurando no corpo da tabela 0,498 (0,5 - 0,002), encontramos: Za = -2,87 :. :. -2 87 =Xª -150.000 X 135 650 ' 5.000 :. ª = . A garantia deve ser de 135.650 km. Exercícios resolvidos l. O diâ1netro X de um cabo elétrico é u1na variável aleatória contínua con1 f. d. p. dada por: /(x)= K(2x-X2 ) se 0:5 x:51 O se x < O ou x > 1 a) Determinar K. b) Calcular E(X) e VAR(X). c) Calcular P(O <X< 1/2). Resolução: ,.3 2 -~ X - - Logo: ~ K=~ 2 J =1 o /(x)= %(2x-x2 ) se0:5x<l O se x < O ou x > 1 Capítulo 5 - Variáveis aleatórias contínuas 147 Logo: 3 2x3 x4 --- 2 3 4 2 2 5 o 5 8 =~(~-~)=;o 9 (5)2 VAR(X)=- - - = 20 8 19 320 Yi ( 1 ) J Yi 3 ( , ) 3 , x3 e) P O:$ X :$ - = - 2x - x- dx= - x- - - 2 o 2 2 3 5 16 o 2. A variável aleatória X tern f. d. p. dada pelo gráfico abaixo. Detern1 inar: a) P(X> 2); f (x) 1 b) mtalque P(X>m)= 8 ; 1 -2 e) E(X); d) VAR(X); e) F(x) e seu gráfico. o X jº(x) o 4 1 2 o 1 1 1 =O~J(x)= 8 (4- x) 1 1 - (4-x) se O!Sx!S4 :.J(x)= 8 O se x < O ou x > 4 4 X 148 Estatística básica Resolução: a) P(X>2)=1 - P(X~2)=1 -J 0 2 ~(4 - x)dx= ? ? -1 x- 1 =1-- 4x-- =1--(8-2)= 8 2 o 8 3 1 =1- - = 2 111 1 X - 4x- - 8 2 o ' 1 111.- - 4m --- 8 2 Logo: 4 4 7 - 8 7 = - ~m 2 - 8m+14=0 8 m = 2,58 m=5,42 m=2,58 4 1 1 •3 e) E(X)= J4- (4x-x2 ) dx=- 2x2 -~ - o 8 8 3 o =!(4·64 -64)=~ 8 3 3 Portanto V AR (X)=~ - _!i = ~ ' 3 9 9 ' _,. e) F(x)= J x.!_(4-s)ds=_!_ 4s - ~ o 8 8 2 o X x 2 - ---- 2 16 Capitulo 5 - Variáveis aleatórias contínllaS 149 O sex<O :. F(x) 2 16 X X 2 se O<x$4 1 sex>4 F(x) 1 o 4 X 3. A f. d. p. da variável aleatória contínua X é dada pelo gráfico. Deter1ninar n1 tal que P(X<m)=~P(X>1n) 4 Resolução: Portanto: f(x) K O m 3 X X j(x) 3 o o 2 3 J(x)= 1 2 2 1= O~ .f (x)=3 - 9 x 1 2 2 - - - x para O< x <3 3 9 O se x < O ou x > 3 150 Estatística básica J 111 (3. -2 x) dx=l J 3 ( 2 - 2 x) dx 039 4 111 39 2 {5,27 7m -42m+27 =0~n z- O, 73 Logo: m = 0,73 4. U1na fábrica de tubos de TV determinou que a vida média dos tubos de sua fabri- cação é de 800 horas de uso contínuo e segue uma distribuição exponencial. Qual a probabilidade de que a fábrica tenha de substituir un1 tubo gratuitamente, se oferece un1a garantia de 300 horas de uso? X: vida útil dos tubos de TV. Resolução: Como logo, E(X) = 800 1 1 1 E(X) = -Â. ~ I = 800 ~ Â. = -80-0 .f(x)= 1 - .< -e~ 800 o sex 2! O sex< O 300 ( ) f 300 1 - -\... (. - ~ ) P X < 300 = e 800dx= -e ~ , ., = o 800 o = - e-3001soo + 1=1-e-31s = 0,3127 5. A variável aleatória continua X tem f. d. p. dada por: /(x) = 6(x-x 2 ) para O< x < 1 O para x < O ou x > 1 Capítulo 5 - Variáveis aleatórias contínuas 151 Calcular P(µ - 2a < x < µ + 2a). o Logo, V AR(X) = 0,3-0,52 = 0,05 ~ a= 0,22 o 3 LO P(µ-2a <x< µ +2a ) = P(0,5-2·0,22<x<0,5+ +2 · 0,22) = P(0,06 < x < 0,94) = J º·94 6(x - x2 )dx = 0.06 x2 x3 =6 --- 2 3 0,94 ( 2 = 6 0,94 2 0,06 o 943 ' 3 o 062 ' o 063 ' = 6. 0,1632107 = 0,979264 2 3 6. Um.a variável aleatória continua X tem sua f . d. p. dada pelo gráfico: f(x) K --- - ~ -----, 1 4 X a) Determinar k. b) Calcu lar P(O <X< 2). c) Calcu lar E(X). Resolução: a) Usaremos o fato de que a so1na das duas áreas deve ser 1. 1 · K 2 -+ 3 · K = 1 ~ K+6K = 2 ~ K = - 2 7 152 Estatística básica 2 se O <x<l -x 7 J(x)= 2 se 1<x<4 - 7 o se x <O ou x >4 1 2 b) P(O<X < 2)=J 12 xdx+ J22 cl:c = l:_x2 + 2 x = 3 = 0,4286 o 7 1 7 14 7 7 o 1 c) E(X)= J'x· 2 ,\'. dx+ f 4 x · 2 x dx= J' 2 x 2dx+ J4 3.x dx= o 7 1 7 07 1 7 2 1 1 4 47 = - x3 + - x 2 = - = 2 2381 21 o 7 21 ' 7. Sendo /(x) = sex>O se x < O, calcular: a) K b) P(8µ - 3a < x < 1 Oµ + 6a) Resolução: K+44 K+44 . a) Co1no À. = = 2k ~ = 2K ~ K = 4 ~ À. = 8 6 6 8e -sx se x <:: O .f(x) = O sex<O 1 1 1 À.2 64 ~a =- 8 J2 2 = 8e-8xdx=(- e- 8x) = - e- 16 + e- 5 = O 00674 518 518 ' Capitulo 5 - Variáveis aleatórias contínuas 153 . 2e -Zx Se X ;;::: 0 8. A f. d. p. f (:e)= O sex <O representa a distribuição do [ndice de acidez (X) de um detenninado produto ai imen- tício. O produto é consun1ível se este índice for n1enor que 2. O setor de fiscalização do l .A.L. apreendeu 30 unidades dele. Qual a probabilidade de que pelo menos 10% da amostra seja in1própria para consumo? Resolução: ? 2 P(X < 2) = J-2e-2xdx = (-e-2') = -e-4 + 1 = o o = 0,98168437 Logo: P(X < 2) = 0,98: probabilidade de o produto ser consutnível Logo: probabilidade de não ser consumível = p p = 0,02 e q = 0,98 X: oú1nero de unidades i1npróprias para o consumo X: B(30; 0,02) P(X;;::: 3) = 1-P(X < 3) = 1- ( 3 oº)co,02)º (0,98)30 + + ( 3 1 º )co,02)'(0,98)29 +(3 2 º)co,02)2 (0,98)28 = 1 - {0,54548 + 0,33397 + 0,09883} = = 1 - 0,97828 = 0,02172 9. O diâmetro X de u1n cabo para TV é uma variável aleatória contínua com f. d. p. dada por: .f(x) = 3 ' - (2,t - x·) se 0::5 x ::5 l 2 O sex<O ou A probabilidade de u1u cabo sair com diâ1uetro defeituoso é dada por p1= 0,5125 - P(X :S 0,5). Se 25 cabos são produzidos, qual a probabilidade de que: a) pelo 1nenos 2 seja1n defeituosos? b) exata1nente 6 sejan1 defeituosos? 154 Estatística básica Resolução: 1/ 2 J 112 3 2 3 ( 2 x 3 3 5 5 P(X~0,5)= -(2x-. ~ )dx=- x -- = -·-= -º 2 2 3 2 24 16 o :. P(X < 0,5) = 0,3 125 :. Pi = 0,5125 - 0,3125 ~ Pi = 0,2 X: B(25; 0,2) a) P(X>2)=1-P(X<2)=1- ( 2 ;)(0,2)º(0,8)25 +(2 1 5 )(0,2)1(0,8)24 = = 1 - {0,00378 + 0,02361} = 1 - 0,02739 = 0,97261 b) P(x = 6) = ( 2 ;)co,2)6(0,8) 19 = 0,16335 1 O. Os salários dos diretores das empresas de São Paulo distribuem-se nonnahnente co1n média de R$ 8.000,00 e desvio padrão de R$ 500,00. Qual a porcentagem de diretores que receben1: a) 1nenos de R$ 6.470,00? b) entre R$ 8.920,00 e R$ 9.380,00? Resolução: µ =8.000 X: salário a =500 ~Z=X-8.000 500 a) P(X < 6.470) = P(Z < 3,06) = 0,5 - 0,498893 = 0,001107 ou 11% 6.470 8.000 X - 3 06 ' z = 6.470-8.000 =-3 06 500 ' b) P(8.920 <X< 9.380) = P(l ,84 < Z < 2,76) = X = 0,49711 o - 0,467116 = = 0,029994 ou :: 3% 8.000 8.920 9.380 o o 1,84 2,76 z z Capítulo 5 - Variáveis aleatórias contínuas 155 z = 8.920-8.000=1 84 1 500 ' z = 9.380-8.000 =2 76 2 500 ' 11. A quantidade de óleo contida e1n cada lata fabricada por u1ua indústria ten1 peso distribuído normah11ente, co1n média de 990 g e desvio padrã.o de 1 O g. Uma lata é rejeitada no co1nércio se tiver peso tnenor que 976 g. a) Se observanuos uma sequência casual destas latas em uma linha de produção, qual a probabilidade de que a 1 Oª lata observada seja a 1 ª rejeitada? b) Nas condições do ite1n a, qual a probabilidade de que, em 20 latas observadas, 3 sejam rejeitadas? Resolução: . µ =990 X: N(990, 100) ~ O a =l ~ Z= X-990 10 P(X < 976) = P(Z::;; - 1,4) = 0,5 - 0,419243 = 0,080757 p = 0,080757 q = 0,919243 a) P(X = 1 O) = (0,919243)9 (0,080757) = 0,03785 b) X: B(20; 0,080757) P(X = 3) = ( 2 3 °)(0,080757)3(0,919243)17 = 0,14347 976 990 X - 14 ' o z 12. Um fabricante de produtos alimentícios vende u1n de seus produtos e1n latas de 900 g de conteúdo líquido. Para e1nbalar o produto, adquiriu uma máquina que permite obter o peso desejado, co1n distribuição norn1al e desvio padrão de 1 O g. O 1 PM (J nstituto de Pesos e Medidas) exige que no máxi1no 5% das latas contenJ1am 1nenos do que o peso líquido 1101nÍJlal. Se a máqui.na for regulada para 91 O g, poderá satisfazer esta exigência. Qual deverá ser a regulagem da máquina para que a exigência do IPM seja observada? Feita esta nova regulagem, as latas são re1netidas ao co1nércio. O IPM exan1ina, então, utna an1ostra de 20 latas en1 utn supermercado. Qual a probabilidade de encontrar pelo 1nenos 3 co1n o peso inferior ao especificado na en1balagem? 156 Estatística básica Resolução: X: peso líquido µ =? X: N( , 100) O a =l { µ = 910 a) X: N(9l0, 100) O a =1 900 910 Z=X-910 10 X P(X < 900) = P(Z <-1) = 0,5 - 0,341345 = 0,158655 :. • • • 15,87% Logo, co1n a regulage1n de 91 O g, 15,87% das latas terão peso inferior a 900 g, o que não satisfaz a exigência do IPM. b) 0,45 900 µ X o z z = - 1 64 = 900 - µ µ = 916, 4 ª ' 10 Portanto, para que a exigê11cia do IPM. seja observada, a máquina deve ser regulada para 916,4 g. Logo: X: N(916,4; 100) e) X: nlimero de latas co1n peso líquido 1nenor do que 900 g. p = 0,05. X: B(20; 0,05) P(X ~ 3) = i-P(X < 3) = 1- (~º)co,os)º(0,95) 2 º + Capitulo 5 - Variáveis aleatórias contínuas 157 +(2 1 º)co,05)1(0,95)19 +(22 º)co,05)2 (0,95)18 = =1 - {0,35849 + 0,37735+O,1 8868} = J - 0,92452= 0,07548 Exercícios propostos 1. Dadas as funções abaixo, verificar para que valores de K podern ser consideradas f. d. p. Cal cu lar E(X) e VAR(X). Kx2 se 0!5:x<2 a) /(x)= 0 sex<O oux>2 b) fº(x)= K (2 - x) se O$ x !5: l O se x < O ou ,~ > 1 Ke-2x parax;::: O c) .f(x) = 0 para x <O 2. Fazer o gráfico da função de distribuição F(x) das funções do exercício anterior. 3. Un1a variável aleatória contínua X tem a função de distribuição dada por: O sex<O F(x)= x5 seO<x<l 1 sex>l Calcular E(X) e VAR(x). 4. Uma variável aleatória contínua X tem f. d. p. dada por: K se0!5:x!5:2 F(x)= K(x-l) se 2<x<4 O se x < O ou x > 4 Determinar K e E(X). 5. A f. d. p. de uma variável aleatória contínua X é representada pelo gráfico abaixo. 1 2 f(x) o 4 X Respostas 158 Estatística básica Calcular: a) K tal que: P(X> K) = 1/4. b) A n1ediana da distribuição de X, isto é, 11·1 tal que: P(X> m) = P(X < 11i). 6. Determinar a Jnédia e a variância de X, cuja f . d. p. é dada por: f(x)= 2 ---:;- se 1:5 x :5 2 x- 0 se x < 1 ou x > 2 7. O gráfico da f. d. p. de un1a variável aleatória contínua X é dado a seguir: Calcular: a) P(X> l); b) P(X< 1); e) E(X). f(x) - 2 o 8. Dada a f. d. p. de un1a variável aleatória X: 4 X 6x(l - .'7) se O < x < 1 f(x)= O se x < O ou x > 1 calcular P(µ - <J <X<µ + o). 9. A duração de uma lâmpada é un1a variável aleatória T, cuja f. d. p. é: f(t)= 1 - l.OOO e 111000 , para t;;:: O (em horas) O set<O Calcular a probabilidade de tuna lârnpada: a) Se queitnar antes de 1.000 horas. b) Durar entre 800 e 1.200 horas. Respostas R Capítulo 5 - Variáveis aleatórias contínuas 159 10. Na leitura de uma escala, os erros varia1n de - 1/4 a 1/4, com distribuição unifor111e de probabilidade. Calcular a média e a variância da distribuição dos erros. 11. Dada a variável aleatória Z =X - µ x , determinar E(Z) e VAR(Z), sendo queXten1 f. d. p. dada por: ª x e-x sex>O j'(x) = O sex<O 12. A duração X de u1n tubo de televisão te1n f. d. p.: Ke-kx se x ;:::: O f(x)= O sex<O Sejap;. = P(À <X <l + 1). Então p;. é da forn1a (1 - a)a;-. Deter1ninar a. 13. A f. d. p. de uma variável aleatória contínua X é dada por: Seja p1 = P(x < 1,2): 1-x/2 .f(x) = 0 se O :::;; x :::;; 2 sex<O oux>2 a) Considere experimentos independentes, onde p = 1,24 - P• é a probabilidade de sucesso. Qual a probabilidade de que em 25 tentativas do mesmo experi1nento ocorrarn pelo n1enos 3 sucessos? b) Se a probabilidade de sucesso for p = ( 1,24 - p ,)1200, em 1.000 tentativas inde- pendentes do experin1ento, qual a probabilidade de que oco1Tru11 no 1náxin10 2 sucessos? 14. O diâmetro X de un1 tubo é uma variável aleatória contínua co1n f. d. p. dada por: f(x)= seO< x <l sex<O oux> 1 A probabilidade de u1n tubo sair cotn defeito (diâmetro fora das especificações) é p = 0,5125 - P(x < 0,5). Se 25 tubos são fabricados, qual a probabilidade de que seja1n defeituosos: a) pelo 1nenos 4 tubos? b) exatamente 6 tubos? Respostas 160 Estatística básica 15. Foi feito un1 estudo sobre a altura dos alunos de u1na faculdade, observando-se que ela se distribuía normalmente com média de 1,72 in e desvio padrão de 5 c1n. Qual a porcentagem dos alunos com altura: a) entre 1,57 m e 1,87 m? b) acin1a de l ,90 111? 16. U1na variável aleatória X é nonnalmente distribuída com média 60 e variância 64. Detern1inar: a) P(X> 74); b) P(IX- 601 < 8); c) P(IX- 601 > 5). 17. Un1 estudo das modificações percentuais dos preços, no atacado, de produtos indus- trializados 1nostrou que há distribuição norn1al com média de 50% e desvio padrão de 10%. Qual a porcentagen1 dos artigos que: a) sofreram aumentos superiores a 75%? b) sofreram aumentos entre 30% e 80%? 18. O volun1e de correspondência recebido por un1a firma quinzenahnente tem distri- buição norn1al co1n 1nédia de 4.000 cartas e desvio padrão de 200 cartas. Qual a porce11tagem de quü1zenas ein que a firma recebe: a) entre 3.600 e 4.250 cartas? b) n1enos de 3 .400 cartas? c) 1nais de 4.636 ca1tas? 19. Numa fábrica foran1 instaladas 1.000 lâmpadas novas. Sabe-se que a duração média das lârnpadas é de 800 horas e desv io padrão de 100 horas, coin distribuição normal. Determinar a quantidade de Jâ1npadas que durarão: a) n1enos de 500 horas; b) 1nais de 700 horas; c) entre 5 16 e 684 horas. 20. Un1 fabricante de rnáquinas de lavar sabe, por longa experiência, que a duração de suas máquinas tem distribuição normal co1n média de 1.000 dias e desvio padrão de 200 dias. Oferece uma garantia de l ano (365 dias). Produz rnensalmente 2.000 n1áquinas. Quantas espera trocar pelo uso da garantia dada, mensaln1ente? 21. O diâmetro X de un1 cabo de vídeo é un1a v. a. con1 distribuição nonnal, co1n média de 21 n11n e desvio padrão de 1,5 1nm. A probabilidade de um cabo sair com diârne- tro fora das especificações é p 1 = 0,691759 - P(X > 23). Considerando p = p ,/800 a probabilidade de um cabo produzido ser rejeitado, determinar a probabilidade de que, na produção de 8.000 cabos, no 1náxin10 3 sejatn rejeitados. Respostas Aplicações da distribuição normal 6.1 Distribuicões de funcões de variáveis aleatórias I I • normais 1. S~jam n variáveis aleatórias independentes, cada tuna corn distribuição normal , e seja1n E(){;) = µ ;, VAR(){;) = a2;, i = 1, 2, ... , n, isto é,){;: N( µ ; ,a~). Consideremos a li variável X = L X; . Então X ta1nbém é norn1almente distribuída, i = I ti ,, X : 1V Lµi• Lª/ . i=I i=I Den1onstração: Não faren1os a demonstração de que a variável X tetn distribuição normal. Sejarn 11 X,: N(µ1, a~) X2: N( µ 2, a ~ ) X,, : N( ,u,,, a7,) independentes e X= L X;, calcularetnos E(X) e VAR(X). i=l lt li li E(X) =E .Lxi = Í:E(xi )= Lµi i=I i=I i=I e 11 li 11 VAR(X) = VAR .Lxi = Í:VAR(X;)+22:cov(x;,x;)· i=I i =I j;t. j 162 Estatística básica Co1no as variáveis](;, i = 1, 2, ... , n são independentes, a cov(X;, Ã'.i) = O,j = 1, ... , n, i :/= }. Logo: Jl li VAR(X)= 2:vAR(X;)= 2:a;2• i=I i=I 2. Nas condições de 1, seµ;= µ2 = ... = ,u,, =µe <J ~ = <J ~ = ... = cl, então X: N(nµ, ncl). Denionstração: De 1 tiran1os n 11 E(X)= 2:.tt; = 2:µ =nµ i=I i=I e ll 11 VAR(X)= 2:a;2 = 2:a2 =na2• i =I i=I 3. Seja111 ](;: N( ,tt, cl ), i = I, ... , n, variáveis independentes. Seja Então, - 1 n X= -2:X; . - X:N n i=I ? a - µ ,- n Denionstração: e 1 li E(X)= E - 2: X; n i=I 1 =-·nµ = µ 11 l n 1 n VAR(X)=VAR - 2: xi = --r VAR 2: xi - n i=1 n i=I 1 li 1 2 = 2 l:vAR(X;)=-2 · na 2 =!!_ n . 1 n n 1= Capítulo 6 - Aplicações da distribuição normal 163 4. Seja1n Xi: N(Jt;, a7 ), i = 1, 2, .. . , n variáveis independentes e seja Y =a + b1 X1 + b2X 2 + ... + b,X,,. Então: ll 11 Y:N a+ _Lh;·µ;, _Lb;2 ·a;2 i = I i=I Demonstração: E(Y) = E(ct + b,X, + bzXz + ... + b,,X,,) = =a+ b1E(X1) + b2E(X2) + ... + b,,E(X,,) = li = a+ Í: b;µ; i =I VAR(Y) = VAR(a + b1X 1 + b2.Kz + ... + b11X,,) = li = b2 . ª 2 + b2 a 2 + .. + b2 ª 2 = 'Ç' bz . a 2 l 1 2 2 · 11 11 ,,L,,,,s ,. i=l Exemplos de aplicação 1 . O peso de um cigarro é a soma dos pesos do papel e do fumo, e vale em média 1,200 g co1n a = 0,060 g. O peso 111édio do papel é 0,040 g com a = 0,020 g. Esses pesos tê1n distribuição normal. Os cigarros são feitos en1 u1na máquina auto1nática que pesa o fun10 a ser usado, coloca o papel e enrola o cigarro. Determinar o peso 1nédio do fu1no em cada cigarro e o desvio padrão. Qual a probabilidade de que um cigarro tenha n1enos de 1, 13 O g de fumo? Resolução: Façamos: X: peso do cigarro Y: peso do papel F: peso do fu1no Logo, F =X - Y con1 X e Y independentes. { µ_, = 1,20 g e a.,.= 0,06 g Temos µy = 0,04 g e ay = 0,02 g Precisamos detern1inar µF e a;.. Calculando-se a esperança e a variância de F, te1nos: 164Estatística básica ,lt,.- = E(X- Y) = E(X)- E(Y) = J ,20- 0,04 = l , 16 g a;= VAR(X- Y) = VAR(X) + VAR(Y) = = 0,062 + 0,022 = 0,0036 + 0,0004 = 0,0040 Logo: F: N(I ,1 6; 0,004) e aF = 0,063 ~ Z = F- µ ,.. OF 1, 13 1,16 F Calculando-se a probabilidade, temos: P(F < 1,13) = P(Z < - 0,48) = 0,5 - O,J 84386 = 0,315614 2. Un1a 1náquina auto1nática enche latas baseada ern seus pesos brutos. O peso bruto te1n distribuição nom1al co1n µ = 1.000 g e a = 20 g. As latas tên1 peso distribuído norrualmente, co1n µ = 90 g e a= l O g. Qual a probabilidade de que uma lata ten.ba, de peso líquido, a) inenos de 830 g? b) 111ais de 870 g? c) entre 860 e 920 g? Resolução: Seja1n X,: peso bruto X2: peso de lata Seja X: peso líquido Logo, Temos: X,: N(l.000, 400) X 2: N(90, 100) Calcularemos E(X) e VAR(X). E(X) = E(X,-Xi) = E(X,)-E(X2) = 1.000- 90 = 910 VAR(X) = VAR(X. -X2) = VAR(X,) + VAR(X2)- 2 cov(X,, X2) - 2 cov(X., X2) = 400 + 100 - O= 500 :. Capítulo 6- Aplicações da distribuição normal 165 :. X: N(910, 500) ~ { µ =910 a= 22,36 a) P(X < 830) = P(Z < - 3,58) = 0,5 -P(-3,58 < Z <O) = = 0,5 - 0,499828 = 0,000172 830 910 X - 3 58 ' o z = 830-910 =-3 58 1 22 36 ' ' b) P(X> 870) = P(Z> - 1,79) = .P(- 1,79 < Z <O) + 0,5 = = 0,463273 + 0,5 = 0,963273 870 910 X - L,79 o z = 870-910 =-1 79 22,36 , e) P(860 <X< 920) = P(-2,24 < Z :::; 0,45) = P(-2,24 < Z:::; O) + + P(O < Z < 0,45) = 0,487455 + O,1 73645 = 0,6611 860 910 920 X - 224 ' o 0,45 z = 860-910 =-2 24 1 22 36 ' , z = 920 - 910 =o 45 2 22,36 ' z z z 166 Estatística básica 6.2 Aproximação da distribuição binomial pela distribuicão normal • Para efetua1mos a aproxiinação da distribuição binomial pela distribuição normal, usaremos um resultado bastante i1nportante, o teore111a do limite central, que será ape- nas enunciado. Teorema do limite central Consideremos n variáveis aleatórias, X1 , X2, ... ,X,,, independentes co1n E(X) =µ ;e VAR(X,) =aJ, i = 1, 2, .. ., n. Seja Considerando-se condições bastante gerais, a variável li ,La/ i=I tem distribuição aproxi1nadamente N(O, 1 ). Se E(X) = µ e VAR(X ) = a2, i = 1, .. ., n e para n bastante grande (n ---7 ao), Z=X-nµ .Jna 2 tem distribuição normal no limite (Z = N(O, 1)). Na prática, quando n é fixo, a aproxirnação será 1nelhor na medida e1n que as variá- veis X, i = 1, .. ., n foren1 nla.is próxi1nas da distribuição normal. Mostrare1nos agora con10 será feita a aproxin1ação da distribuição bino1nial pela distribuição normal. li Seja X: B(n, p). Pode1nos escrever X= LX;, onde as variáveis X, X2, ... , X,, são i=I independentes, cada urna con1 distribuição de Bernoulli. Vin1os que E(X;) = p VAR(X;)=pq, i=I,2, ... ,n JI Então, E (X) = L E (X;) = np i=I Capítulo 6 - Aplicações da distribuição normal 167 e n VAR(X)= LVAR(X, )=npq, i=l que são os 1nesmos resultados já anterionnente obtidos. Logo, para n suficienten1ente grande, a variável é: X-np Z = ..Jnpq ::: N(O,l). npq Essa aproxitnação é charnada de Moivre - Laplace. Moivre 1nostrou que para n grande (n --7 oo ), ten1os: P(X=x)= n pxq11-x = e z "',,, ( ) 1 - 1 (~) 2 X .J2;; · .J npq Para 1nelhorar ainda mais a aproxirnação, usaren1os o recurso da correção ele con- tinuidade (cc), con10 segue: e Exemplos de aplicação 1. Lança-se uma rnoeda 20 vezes. Qual a probabilidade de se obter de urna a cinco caras, usando: a) distribuição binon1iaJ; b) aproximação da bino1nial pela normal. Resolução: X:Núrnerodecaras --7X:B(20, k) a) P(l <X<5)=P(X= l)+P(X= 2)+P(X =3)+ +P(X = 4) + P(X = 5) = ( 2 1 º)( 0,5)1 ( 0,5)19 + (2 2 º)( 0,5)2 ( 0,5)18 + 168 Es1atística básica +( 2 3 °)(0,5)3 (0,5)11 +(~º)(o,5) 4 (o,5)16 + 25°)(o,5) 5 (0,5)15 = = 0,00002 + 0,00018 + 0,00109 + 0,00462+0,01479 = 0,0207 Grafica111ente: 20 . O, 176 0,160 l 8 . 0,120 13 . 0,073 93 - 96 - \_ /,;; P(X) • 1 1 • ' • • 1 1 ' • • ' ' • • ' • ' • ' 0,036 0,0 1479 0,00462 0,00109 0,00018 0,00002 o 1 2 3 4 5 6 7 8 9 1 o 11 12 13 14 15 16 17 18 19 20 b) Se X: B (20, ~) . en t ãoµ= np = 20 · ± = 10 1 1 a 2 = npq = 20 · - -- = 5 2 2 e <J =JS =2,24 :. l 5 10 Queremos ca lcular P(l <X< 5). Usando a correção de continuidade: X P(l < X ~ 5) ~ P(0,5 <X< 5,5) = P(-4,24 < Z <-2,0 l) = = 0,5 - 0,4 77784 = 0,022216 • X Capítulo 6 - Aplicações da distribuição normal 169 O erro é de 0,001516, tnas no caso, 11 = 20 (pequeno) e tambétn a probabi !idade está tabelada. Logo, para 11 grande a aproximação será reahnente boa. 2. Um siste1na é fonnado por 100 componentes, cada um dos quais com confiabilidade de 0,95 (probabilidade de func ionamento do co1nponente durante um certo período de tempo). Se esses con1ponentes funcionam independentes uns dos outros e se o sistema cornpleto funciona adequada1nente quando pelo menos 80 componentes funcionam, qual a confiabilidade do sisten1a? Resolução: Seja X: número de con1 ponentes que funcionam X: B (100; 0,95) Usando a aproxi1nação da binomial pela nor1nal, temos: µ = np = 100 · 0,95 = 95 a2 = 11pq = 100 · 0,95 · 0,05 = 4,75 e a = 2,18 80 95 100 P(80 ::; X::; 100) ~ P(79,5 $ X ::; 100,5) = = P(- 7, l I < Z < 2,52) = = 0,5 + 0,494132 = 0,994132 Logo, a confiabilidade do sistema é de 99,41 % . Exercícios resolvidos X 1. Sejam X1: N(150, 30), X2: N(200, 20) e X1: N(IOO, 14) independentes. Seja X= X, - X2 +X; ta1nbén1 com distribuição nonnal. Calcular: a) P(61 $X$70); b) P(47 <X< 58). Resolução: E(X) = E(X,) - E(X2) + E (JG) = = 150 - 200 + 100 = 50 X = X, - X2+ X -7 VAR(X) = VAR(X,) + VAR(X';) + + VAR(X3) = = 30+20+ 1.4 = 64 170 Estatística básica Logo, u =50 X: N(50, 64) ' ~ a =8 Z=-x~_5_o 8 a) P(61 :SX S 70) = P(l,38 S Z S 2,5) = 0,493790 - 0,416207 = = 0,077583 50 61 70 X b) P(47 <X< 58) = P(- 0,38 < Z < 1) = 0,148027 + 0,341345 = = 0,489372 47 50 58 X 2. Sejan1 X,: N( 180, 40) e X2: N( 160, 50) independentes. Seja X = 4X, - 3X2 também co111 distribuição norn1al. Calcular: a) P(X-3a> µ- 100); b) P(IX- 2001>42); e) P(IX-2101 s 16). Resolução: { E (X) = 4 · 180-3 · 160 = 240 X=4X -3X t 2 VAR(X)=16·40+9·50=1.090 Logo: X: N(240, 1.090) µ =240 a= 33,02 a) P(X- 3 · 33,02 > 240- 100) = P(X> 239,06) = = P(Z > - 0,03) = 0,011967 + 0,5 = = 0,511967 z = X-240 33,02 Capítulo 6 - Aplicações da distribuição normal 171 239,06 240 X b) P(JX-200J > 42) = P(X- 200 < - 42) + P(X-200 > 42) = = P(X < 158) + P(X> 242) = = P(Z < - 2,48) + P(Z > 0,06) = = (0,5 - 0,493431) + (0,5 - 0,023922) = = 0,006569 + 0,476078 = 0,482647 158 240 252 c) P(IX - 2101<16) = P(- 16 <X- 210 < 16) = = P(l94 <X< 226) = P(-1 ,39 ~ Z <-0,42) = = 0,417736 - O, 162757 = 0,254979 194 226 240 X X 3. O peso de uru saco de café é urna variável aleatória que tem distribuição normal co1n média de 65 kg e desvio padrão de 4 kg. Um caminhão é carregado com 120 sacos. Pergunta-se qual a probabilidade de a carga do caminhão pesar a.) entre 7.893 kg e 7.910 kg? b) mais de 7.722 kg? (Obs.: considerar o peso da carga co1n distribuição normal.) Resolução: X: peso de un1 saco de café~ X: N(65, 16) i= 1, 2, ... , 120 172 Estatística básica 20 X: peso da carga ~ X = ,2: X; ~ i=I 120 E(X) = _2: 65=120· 65 = 7.800 i=I 120 120 VAR(X)= _2:VAR(X;) = _2:16=120· 16 = 1.920 i=I i=I Logo: X: N(7.800, 1. 920) µ = 7.800 a = 43,82 ~ Z = X-7.800 43,82 a) P(7.893 <X< 7.910) = P(2, 12 S Z S 2,51) = = 0,493963 -0,482997 = 0,010966 7.800 7.893 7.910 X b) P(X > 7.722) = P(Z 2: - 1,78) = = P(- 1,78 < Z <O)+ 0,5 = 0,5 + 0,462462 = = 0,962462 7.722 7.800 X 20 4. Seja1n x;: N(40, 4), i = 1, 2, ... , 20 independentes. Seja X= _2:x;, Xta1nbém com distribuição nonnal. i =I a) DetermÍJ1ar x;,, tal que P(X> X,,)= 0,84. b) Calcular P(IX - 101 S 820). c) Calcular P(~ µ -20a <X<!µ+ 20a ). Capítulo 6 - Aplicações da distribuiçãonormal 173 Resolução: Como: 20 20 E(X)=E 2:xi L40=800 i=I i =I 20 20 VAR(X)=VAR LX; = L4=20·4=80 Logo: X: N(800, 80) ~ a) Za = 0,99 ,u = 800 ~ a =8,94 i =I i =I Z= X-800 8,94 - 0,99= Xª - 3 00 ~ Xª =791,15 8 94 ' x;, 1 1 1 1 800 0,84 0,34 X -Z " b) P(IX- 101 < 820) = P(- 820 <X- 1 O < 820) = = P(-810 < X $ 830) = P(-180,09 $ Z $ 3,36) = = 0,5 + 0,49961 o = 0,9996 1 o -8 10 800 830 X -180,09 o o = P(~ · 800-20·8,94 !5 X !5 % · 800 + 20· 8,94) = 0,5 z 3,36 z 17 4 Estatística básica = P(301,20 <X< 778,8) = P(-55, 79 < Z <-2,37) = = 0,5 - 0,491106 = 0,008894 - 55,79 - 2,37 o z 5. Un1 elevador ten1 seu funcionamento bloqueado se sua carga for superior a 450 kg. Sabendo que o peso de um adulto é uma variável aleatória co1n distribuição nor- mal, sendo a média igual a 70 kg e o desvio igual a 15 kg, calcule a probabi lidade de ocorrer o bloqueio nun1a tentativa de transportar 6 adultos. Resolução: X: Peso de um adulto X: N(70, 225) 6 E(Y)= L E(X;)=6·70=420 Y: Peso de 6 adultos ~ i = I 6 V AR(Y) =LV AR(X;) = 6. 225 = 1.350 µ =420 :. Y: N( 420, 1.350) .J (} = 1.350 = 36, 74 P(Bloqueio) = P(Y> 450) = P(Z > 0,82) = = 0,5 - P(O < Z ~ 0,82) = 0,5 - 0,293892 P(Bloqueio) = 0,206108 i= I Z= Y - 420 36,74 6. O peso de uma caixa de peças é uma variável a leatória co1n distribuição normal de probabilidade, com média de 60 kg e desvio padrão de 4 kg. Um carregatnento de 200 caixas de peças é feito. Seja X o peso do can·egamento e X tendo distribuição nor1nal, determinar: a) P(IX - 12. 100 1 > 32); b)X, tal que P(X> X ,) = 0,973. Resolução: X: N( 60, 16) Peso da Caixa i 200 X: Peso da carga X = L xi i=I Capítulo 6 - Aplicações da distribuição normal 175 E(X) = 60·200=12.000 } V AR(X) = 200·16 = 3.200 X: N(l2.000, 3.200) Z= X-12.000 56,57 µ = 12.000 (} = .J3.200 = 56,57 a) P(~ - 12.100 1::S 32) = P(- 32 :SX- 12.100 < 32) = P(12.068 <X ::S 12.132) = = P(l,20 < Z < 2,33) = P(O < Z < 2,33) -P(O < Z < 1,20) = = 0,490097 - 0,384930 = 0,105167 b) P(X> x;,) = 0,973 0,473 Xa 12.000 X Z = Zo 41· = -1 92 a , .) ' - 1 92 = _x'"'""" _- _12_. o_o_o ' 56,57 x;, = 11.891,39 7. O custo de tun produto A é determinado por custos fixos, 111ão de obra e maté- ria-prima. Sabemos que os custos fixos são de R$ 1.000,00 e o desvio padrão de R$ 80,00, com distribuição nor1nal, e que o custo da rnão de obra segue distribui- ção normal com 1nédia de R$ 5.000,00 e desvio padrão de R$ 100,00. O custo da 1natéria-prirna é o dobro do custo da mão de obra e tambén1 segue u1na distribuição normal. Admitindo-se que custo fixo, n1atéria-prima e 1não de obra sejam indepen- dentes e que o custo do produto A tenha u1n.a distribuição nonnal, determine: a) qual a média e o desvio do custo de A; b) qual a probabilidade de A custar ruais R$16.500,00; c) qual a probabilidade de que o custo de A esteja entre R$ 15 .800,00 e R$ 16.900,00. J~esolução: a) Seja1n: X,: custo fixo X2: custo da n1ão de obra X3: custo da matéria-prima X: custo de A 176 Estatística básica E(X3 ) = 2E(X2 ) VAR(X3 ) = 4VAR(X2 ) Logo: X1: N( 1.000, 6.400) X2: N(5.000, 10.000) X1: N(l0.000, 40.000) E como te1nos: E(X) = 1.000+5.000 + 10.000 E(X) = 16.000 VAR(X) = 6.400 + 10.000 + 40.000 VAR(X) = 56.400 X: N(16.000, 56.400) µ =16.000 a = 237,49 -? z = X - I 6.000 237,49 b) P(X> 16.500)=P(Z>2,11)=0,5 - P(O <Z< 2,11)= = 0,5 - 0,482571 = 0,017429 16.000 16.500 X e) P( l 5.800 <X< 16.900) = P(-0,84 ::; Z::; 3,79) = = 0,299546 + 0,499925 = 0,799471 15.800 16.000 16.900 X Capítulo 6 - Aplicações da distribuição normal 177 8. Um criador possui 5.000 cabeças de vaca leiteira. Sabendo-se que cada vaca produz em média 3 litros por dia, obedecendo a urna distribuição norinal, co1n desvi.o pa- drã.o de 0,5 litro, calcular a probabilidade de produzir, diarian1ente: a) 1nais de 15 .11 O litros; b) entre 14.910 e 14.960 litros. Resolução: Xi: Produção da vaca i Xi: N(3; 0,25) 5.000 X: Produção total :. X= LX; i=I E(X) = nµ = 5.000 · 3=15.000 VAR(X)=na 2 =5.000 ·0,25=1.250 X: N(l5.000, 1·250) µ = 15.000 X -15.000 :. ~ Z=---- a=.Jl.250=35,36 35,36 a) P(X> l5.IJO) = P(Z ?: 3, ll) = 0,5 - P(O < Z<3, ll) = = 0,5 - 0,499065 = , Oi.000935 b) P(l4.910<X< 14.960) = P(-2,55 <Z< - 1,13) = =P(- 2,55 <Z<O) - P(- 1,13 <Z<O)= = 0,494614 - 0,370762 = O, 123852 Exercícios propostos 1. Seja1n X, : N(200, 60) ex;: N( l 00, 20) variáveis independentes. Seja X nor1nahnente distribuída, tal que X= X, - x;, calcular: a) P(92 <X < 106); b) P(llO <X < 117); c) P(IX-1001$ 14). 2. Seja1n as variáveis norn1ahnente distribuídas e independentes, X,: N(lOO, 20) X2: N(I 00, 30) X3: N( 160, 40) X4: N(200, 40) SejaXtatnbém con1 distribuição normal, sendo que X = 2 X1 -Xz+ 3 X - X.. Calcular: a) P(X> 420); b) P(X < 436); Respostas 178 Estatística básica c) P(300 $ X< 480). 3. Nun1a indústria, a 111ontagen1 de um certo iten1 é feita em duas etapas. Os ten1pos ne- cessários para cada etapa são independentes e têm as seguintes distribuições: X,: }./(7 5 seg; 16 seg2) , X1: te1n po da 1 ª etapa X2: N(l 25 seg; 100 seg2) , X2: te1npo da 2n etapa Qual a probabilidade de que sejam necessários, para montar a peça: a) 111ais de 21 O segundos? b) .1nenos de 180 segundos? 4. X: B(IOO; ~)·Calcular P(X= LO) pela aproxi1nação da norn1al. 1 5. X: B (n;p), onde n = 100 e JJ = 2 . Calcular, usando a aproxi1uação pela normal: a) P(X> 25); b) P(X< 70); c) P(X> 57); d) P(X= 52); e) P(25 <X< 57). 6. Numa binon1ial em que n = 100 e p = 0,6, calcular a probabilidade de se obter de 70 a 80 sucessos, inclusive os extre1nos. 7. U1n dado é lançado J 20 vezes. Detern1inar a probabilidade de aparecer face 4: a) 18 vezes ou rnenos; b) 14 vezes ou menos, adn1 itindo-se que o dado não seja viciado. 8. Uma máquina produz parafusos, dos quais 10% são defeituosos. Usando a aproxima- ção da distribuição bino1nial pela non11al, determinar a probabilidade de uma a1nos- tra formada ao acaso de 400 parafusos produzidos pela 1náquina seren1 defeituosos: a) no máximo 30; b) entre 30 e 50 (inclusive os extremos); c) mais de 35 e rnenos de 45; d) 1nais de 55. 9. Determinar a probabil idade de que en1 200 lances de uma moeda, resultem: a) 80 <caras< 120; b) nlenos de 90 caras; c) menos de 85 ou mais de 115 caras; d) exatamente 100 caras. Respostas R Capítulo 6 - Aplicações da distribuição normal 179 1 O. Sejan1 X1: JV( 150, 30), X2: N(200 , 20) e X3: N( 120, 40) independentes. Seja X= 3X1 - X2 -X3 ta1nbém normal. Calcular: a) P(X ~Xª)= 0,83; b) P( µ - 1, 4a <X< ,u + 2,3a). 11. Sejam X1: N( 180, 25) e X2 : 1V(95, 36) variáveis independentes. Seja X = 4 Xi - 5 X2. Calcular: a) P(IX - 2001 < 180); b) P(IX-16012: 120). 12. Seja1n Xí: N(200, 40) variáveis normais con1 distribuições independentes, i = l, 2, ... , 100 J.00. Seja X= ,Lx; també1n normal. Calcular: i=I a) P(X> 20.247); b) P(X- 0,96 a2 2: µ - 4.000). 13. A 1nontage1n de un1a peça é feita e1n 3 etapas, independentes entre si. Os tempos de 1nontage1n de cada etapa são normahnente distribuídos, co1no segue: Etapa Média Desvio 1ª 3h 30 1ninutos 2ª 4h 20 minutos 3ª 6h 50 minutos O tempo total de montage1n ta1nbém é nonnaln1ente distribuído. Qual a probabilidade de que a montage1n da peça seja feita: a) em mais de 660 mü1utos? b) entre 896 111inutos e 915 minutos? 14. Sacos de feijão são con1pletados automaticamente por uma 1náquina, com peso mé- dio por saco de 60 kg, desvio padrão de 1,5 kg e distribuição non11al. No processo de armazenage1n e transporte, a perda 1nédia por saco é de 1,2 kg e desvio padrão de 0,4 kg, tarnbén1 con1 distribuição nonnal. Calcular a probabilidade de que, numa remessa de 140 sacos de feijão, o peso total não ultrapasse 8.230 kg. Respostas , PAGINA EM BRANCO A.. • n erenc1a 7. Amostragem 8. Análiseexploratória dos dados de uma amostra 9. Distribuição amostral dos estimadores 1 O. Estimação 11. Intervalos de confiança para médias e proporções 12. Testes de hipóteses para médias e proporções 13. Erros de decisão 14. Distribuição de t de student IC e TH para a média de população normal com variância desconhecida 15. Comparação de duas médias: TH para a diferença de duas médias 16. Distribuição de x2 (qui-quadrado), IC e TH para a variância de populações normais 17. Testes de aderência e tabelas de contingência 18. Distribuição de Fde Fisher-Snedecor, IC e TH para quociente de variâncias , PAGINA EM BRANCO Amostragem 7 .1 Conceitos Popu/{lção: é o conjunto formado por indivíduos ou objetos que tê1n pelo menos un1a variável comum e observável. Pode1nos falar e1n: • população dos alunos do primeiro período de uma faculdade; • população dos operários da indústria auto1nobilística; • população de alturas em cm das pessoas de determinado bairro; • população de peças fabricadas numa linha de produção, e assi1n por diante. Definiremos con10 ta1nanho de uma população finita o nún1ero de ele1nentos que a con1põem. Usare1nos A' para designar esse nún1ero. Aniostr{I: fixada u1na população, qualquer subconjunto formado exclusivamente por seus elementos é denominado an1ostra desta população. Usaremos n para indicar o nú- mero de elementos da a1nostra, o seu tamanho. Aniostragen1: é o processo de seleção de u1na amostra, que possibilita o estudo das características da população. Erro {lmosfr{I/: é o erro que ocorre justa1nente pelo uso da amostra. P{lrâmetro: é a 1nedida usada para descrever u1na característica nu1nérica populacio- nal. Genericamente representaremos por O. A 1nédia (µ),a variância (a2) e o coeficiente de correlação (p) são alguns exe1nplos de parâtnetros populacionais. Estim{ldor: tan1bé1n denominado estatística de um parâmetro populacional; é u1na característica numérica determinada na a1nostra, uina função de seus elen1entos. Gene- ~ rica1nente, representaren1os por O. A média an1ostral (X), a variância a1nostral (s2) e o coeficiente de correlação amostral (r) são exe.1npios de estimadores. Estimativt1: é o valor nu1nérico detenninado pelo estimador, que genericamente re- ~ presentaremos por Bo. 184 Estatística básica Logo, o erro amostral, que designaremos por s, é definido por: A s= ()-() A O valor de ()varia ern cada urna das N' arnostras de tamanho n, tiradas da população, corno segue: amostra 1 an1ostra 2 ........ an1ostrap A A A Logo, () é u1na variável aleatória e, como tal, podemos determinar a E(()), VAR(()), A isto é, a esperança maten1ática de () e sua variância. Podemos des1nembrar o erro amostral em duas partes: e = [ ê - E( Ô)] + [E( Ô) - ()] 1 2 1: parte casual 2: viés ou desvio O viés pode aparecer na seleção da amostra, na coleta dos dados ou na estimação dos parâmetros. Viés de seleção A a1nostrage1n pode ser probabilística e não probabilística. An1ostragen1 probabilísti- ca é o processo de seleção de un1a a1nostra no qual cada unidade a1nostral da população te1n probabilidade diferente de zero e conhecida de pertencer à amostra. Na a1nostragem não probabilística, a probabilidade de seleção é desconhecida para al- guns ou todos os elementos da população, podendo alguns destes elementos ter probabi lida- de nula de pertencer à a1nostra, co1no em a1nostras intencionais, a esrno ou de voluntários. O n1elhor modo de evitar o viés de seleção é o uso do sorteio, seja ele 1nanual ou por 1neio de uma tabela de números aleatórios, ou então pela geração de nún1eros aleatórios por co1nputador. A amostragem probabilística é isenta de viés de seleção. Viés na coleta de dados Esse tipo de vício pode ocorrer principahnente quando se substitui a unidade de an1ostragem ou quando há falta de respostas. Viés de estimação Esse tipo de vício pode ser controlado fazendo-se amostragens probabilísticas. Capítulo 7 - An1ostragem 185 7 .2 Tipos de amostragem Amostragem casual simples Considere1nos urna populaçãoX,,X2, .... , X,.,, co1n elemento genérico X;, co1n 1 <j < N e t · 1 to ,. I<'< a a1nos ra x,, Xl, ... , x,, co1n e emen o 0 ener1co X;, - 1 - n. DEFINIÇÃO 1 U1na amostra se diz casual simples quando P(X; = X;) = N , quaisquer que seja1n i = 1, 2, .. ., n e j = 1, 2, ... N. Jsso significa que em un1a amostra casual si1nples todos os ele1nentos da popula- ção têm a 1nesma probabi lidade de serem selecionados. a) Quando a amostrage1n é feita con1 reposição, para n = 2, te1nos: 1 l Ni l - 1 N e P(X2 = x.JX, = x,) = - N b) Quando a amostragem é sem reposiçã.o, para n = 2, temos: 1 P(X1 = x,, X2 = x1) = O e, sendo P(X1 = x1) = N e 1 P(X2 = x2IX, = x,) = N _ 1 , po11anto 1 Podemos formar o quadro a seguir. ~ X1 X2 • • • XN • 1 1 x. o N(1V - l) .. . 1V(N- l) 1 1 X2 o N(N -1) ... N(N- 1) . . . . . . . . . . . . . . . XN 1 N(N-1) 1 N(1V- l) ... o P(X) 1 1 1 - - - iV 1V . . . N P(X) 1 - 1V 1 - N . . . 1 - 1V 1 186 Estatística básica Logo, tanto para a1nostragen1 com reposição con10 para sem reposição, tetnos: 1 P(X=x) = - ; I N 1 e P(X; + 1 =X;) = -. N EXEMPLO Consideremos a população fon11ada por 1, 2, 3, 4, .... , 7, 8 e 9. A média da população éµ= (1+2 + 3 + ... + 7 + 8 + 9)/9, µ, = 5. Retiramos dessa população a1nostras de ta1nanho 3. a) Co1n reposição: a1) amostra con1os1nenores valores~ l, l, 1 ~ x = 1 ~ s = 1 - 5 = - 4 (letnbrando: s = x - µ ); a2) amostra com os n1aiores valores~ 9, 9, 9 ~ x = 9 ~ s = 9 - 5 = 4 portanto l s 1 = 1 x - µ 1 < 4. b) Sern reposição: b1) arnostra con1 os tnenores valores~ 1, 2, 3 ~ x = 2 ~e = 2 - 5 = - 3; bz) amostra com os rnaiores valores~ 7, 8, 9 ~ x = 8 ~ s = 8 - 5 = 3 portanto, l s I < 3. Concluhnos que o e1To amostral é menor quando se usa a1nostrage1n sem reposição. • Amostragem por estratificação Va1nos considerar o rnesmo exernplo abordado anteriormente. Deve1nos usar uma variável "critério" para separar a população en1 estTatos. No exe1nplo, o critério de estratificação será: E1: grupo fonnado pelos três n1enores valores; Ez: grupo forrnado pelos três valores centrais; E3: grupo for1nado pelos três maiores valores. Ei =l , 2, 3 Ez = 4, 5, 6 E3 = 7, 8, 9 Selecionemos um elen1ento de cada estrato para forman11os as amostras de tamanho 3: • amostras com menores elernentos ~ l, 4, 7 ~ x = 4 ~ s = -l; • an1ostras com maiores elementos ~ 3, 6, 9 ~ x = 6 ~ e = 1 portanto, 1 s 1 < 1 . Capítulo 7-Amostragem 187 EXEMPLO Dada a população de 50.000 operários da indústria automobilística, formar uma arnostra de 5% de operários para estirnar seu salário rnédio. Usando a variável critério "cargo" para estratificar essa população, e considerando arnostras de 5% de cada estrato obtido, chegarnos ao seguinte quadro. Cargos População Amostra Chefes de seção 5.000 250 Operários especial izados 15.000 750 Operários não especializados 30.000 1 .500 Total 50.000 2.500 A amostragem por estratificação tem as seguintes características: • dentro de cada estrato há uma grande hon1ogeneidade, ou então l11na pequena variabilidade; • entre os estratos bá urna grande heterogeneidade, ou então urna grande var.iabi- lidade. No primeiro exernplo, retirarnos o rnesmo nún1ero de elernentos de cada um dos estratos e, no segundo, fizemos u1na partilha proporcional. Amostragem por conglomerados Se estivermos interessados no salário n1édio dos operários da indústria automobi- lística, como no exernplo anterior, podemos selecionar uma montadora e, dentro dela, estudar os salários. l-Já uma rnudança fundan1ental na unidade de sorteio. Passarnos de elernento para grupo. Consideramos conglo111erados os grupos de elernentos com as seguintes características: • dentro de cada conglomerado há uma grande heterogeneidade, ou então uma grande variabilidade; • entre os conglorneradoshá un1a pequena variabilidade, ou então uma grande homogeneidade. Amostragem sistemática Consideramos urna população de tamanho A' e dela tiramos uma a111ostra de tamanho n. Definirnos s = [ fj,]: fator de siste1natização. 188 Estatística básica Sorteru11os um número e11tre 1 e s. Seja 1n esse nún1ero: • • • • • O pritneiro elemento da amostra é o de número 1n; O segundo elen1ento da a1nostra é o de nún1ero s + m; O terceiro elemento da an1ostra é o de nú1nero 2s + m; ... O n-ésimo elemento da a1nostra é o de nú1nero (n - l)s + ni . Para esse tipo de an1ostragem é necessário que a população esteja ordenada, por exemplo, em nomes de 11ma lista telefónica ou em n(1meros das casas de 11111a rua. EXEMPLO De uma população de N = 1.000 elementos ordenados, retirar un1a an1ostra siste- mát ica de tamanho 100. s = [1 .000] = 10 100 Seja 1 < n1 < 1 O. Suponhamos que m = 7. Logo, te1nos: 1 º elen1ento da an1ostra ..... ........ .... ... 7º 2ll ele1nento da amostra .......... .. ....... l 7ll Jll ele1nento da amostra ..... ...... .. ...... 27Q 100° elemento da amostra ............. 997° • Análise exploratória dos dados de uma amostra 8.1 Conceitos Suponhamos que não conheçamos a n1édia e a variância de un1a população X que de- sejan1os estudar. Retiramos u1na a1nostra de n elen1entos e estirnarnos este parâmetro. A 111édiaµ da população é esti1nada pelo estin1ador: 1 li x= -:L x; n i=I e E(x) = µ, con10 1nostraren1os futuramente. Isso demonstra que o estimador da média é não viciado ou não viesado. A variância cf da variável X é estimada por: que tan1bé1n é um estimador não viciado da variância, pois veren1os que E(s2) = a2• Se usarmos o estimador 1 11 2 ~ ( - )2 S = - ,L_; X; - X n. i = I veren1os que ele é urn estin1ador viciado, pois dernonstra-se que E(s2) :/= cf. EXEMPLO Detenninar a rnédia e a variância da a1nostra: 10, 20, 30, 40, 50. 190 Estatística básica n = 5 ~X = J 50 x= 15015 = 30 s2 = 1.000/4 = 250 X; 10 20 30 40 50 150 - (X;-X)2 X;-X -20 400 -10 100 o o 10 100 20 400 1.000 Logo, a 1nédia da an1ostra é 30 e sua variância é 250, sendo então o seu desvio padrão: s =mo= 1s,s1 No exemplo, estan1os trabalhando co1n dados aniostrais isolados, não agrupados. Para o cálculo do s2, pode1nos usar uma fórn1ula operacional mais sin1ples de ser aplicada, como demonstrare1nos a seguir: 1 li 1 li 2 "" ( _ )2 "" ( 2 2 - - 2 ) S = ,.t. X; - ,\: = ,.t. X; - ·,\:; ·X+ X = n - I i= I n - 1 i =I 1 [" li li ] 1 [" li ] = _ L X;2 - L 2 · X; • x + L x 2 = _ L x{ - 2 · x · LX; + n · x 2 = n 1 i=I i=I i=I n 1 i=l i=I 1 n-1 1 n-l Logo: ou então: ( 1 li +n n~X; li 2 ( " ) 2 1 ( li 2 L X;2 - - • L X; + - . LX; i =I 11. i=I n i =I 1 ? s-=-- n-1 11 ? l '' :Lx;-- LX; i = I /1 i=l 1 [ li 2 ? -2 s = LX;- -n·x n - 1 i=I 2 2 • Capítulo 8- Análise exploratória dos dados de uma amostra 191 e EXEMPLO Considere a an1ostra fonnada por 1 O, 11, 13, 15 e 18. Detern1inar a 1nédia e sua variância, usando para s2 a fónnula simplificada. X1 x? 10 100 11 121 13 169 15 225 18 324 67 939 n = 5 X =iZ.=13 4 5 ' 1 ( 67) 2 s=- 939- =10,3 4 5 s = .J10,3 = 3,21 Consideremos agora dados s71jeitos a repetições, isto é, dados afetados de frequência. Sejam: n, = frequência absoluta do elemento X1, i = l, 2, 3, .. ., n. k = número de classes de frequência ou número de agrupa1nentos. k :L,n1 =n i=I As fórmulas anteriores de 1nédia e variância a111ostrais passa1n a ser escritas como seguem: 1 k X= -""' X-· n. ~ , 1 n i=I l k s2 = :L,(x1 -x) 2 • n1 n -1 i=I ou 1 ' s-=-- n - 1 k 1 ( k ) 2 L x12 • n1 - - L x1 • n1 i=I n i = I • 192 Estatística básica e EXEMPLO Considere a seguinte tabela de dados: X; 10 20 30 40 50 60 70 n; L 5 22 24 22 5 J Determine x e s2 • X; n; X;· n; (X;-X) (X;-X)2 (x;- x)2 • n; 10 1 10 - 30 900 900 20 5 100 -20 400 2.000 30 22 660 -10 100 2.200 40 24 960 o o o 50 22 1.100 10 100 2.200 60 5 300 20 400 2.000 70 1 70 30 900 900 I 80 3.200 10.200 k=7 n=80 ~ x= 3·200 =40 ~ x=40 80 s 2 = 1º·200 =1 2911 ~ s2 =129,11 e s=ll,36 79 ' Usando a fórmula operacional ou abreviada para o cálculo de s2, ten1os: X1 n; X;• ll; xl · ni 10 1 10 100 20 5 100 2.000 30 22 660 19.800 40 24 960 38.400 50 22 1.100 55.000 60 5 300 18.000 70 1 70 4.900 I 80 3.200 138.200 X = 3 .200/80 = 40 Capítulo 8 - Análise exploratória cios dados de uma amostra 193 s2 = _l _ , 138.200- (3.200)2 80-1 80 s 2 = _!_ [ 138.200-128.000] 79 Portanto, X= 40 ' s 2 = _!_10.200 s2 =129,l l 79 S2 = 129 11 ' e s = 11 36 ' Considere1nos agora o uso de dados agrupados eni classes de frequências . Para exe1nplo, to1naren1os uma amostra do QI de 50 alunos de un1a determinada faculdade: 11 o 120 129 141 JOI 107 107 121 119 115 115 94 1o1 141 93 103 121 118 122 128 107 105 103 133 121 91 126 127 135 123 109 110 1 131 111 114 132 104 119 113 116 11 9 111 124 106 118 102 119 101 101 118 Fare1nos em pri1neiro lugar o Rol dos dados, isto é, a colocação dos dados iniciais ern u1na certa ordem, crescente ou decrescente. A tabulação poderá ser feita de vários modos, porém usaremos o processo desen- volvido por Tukey, chamado de Stem-and-leaf, Ra1no e folhas. 9 l , 3, 4 10 1, l , 1, l , 2, 3, 3, 4, 5,6, 7, 7, 7, 9 11 0, 0, l, J, 3, 4, 5,5,6,8,8,8, 9, 9, 9,9 12 o, 1, 1, 1, 2,3,4, 6, 7, 8, 9 13 1, 2, 3, 5 14 l, l À esquerda da barra, coloca1nos os algaris1nos da centena e da dezena e, à direita, as unidades. An1plitude total: A = Xm&x - Xm;• A= 141 - 91 = 50 Devemos agrupar os dados em classes e associar a cada classe i , i = l , 2, ... , k as frequências absolutas 11, dos valores observados das respectivas classes. Número ele classes = k Para determinar k, podeinos usar a fór1nula de Sturges, que é a seguinte: k = l + 3,22 · log n 194 Estatística básica Neste caso, ternos: k = l + 3,22 · log (50) k = l + 3,22 . 1,69897 = 6,47068 Poden1os optar por 6 ou 7 classes. Optarernos por 7 classes. Há un1a sugestão, por parte de estatísticos, que a seguinte tabela seja seguida: 11 5 10 25 50 100 k 2 4 6 8 10 Alguns pesquisadores estatísticos sugere1n k = Fn. No nosso exemplo, k = J5õ = 7,07 ~ k = 7 classes. 200 500 1.000 12 15 15 Obs.: Para n = 50, os resultados são próxi1nos nos três métodos de detenninação de k. Poré1n, quando usa1nos n = 250, temos: Sturges k = 8, 72 classes Raiz k = 15,81 classes Deve1nos levar en1 conta que não se trabalha co111 classes vazias. Usare1nos sempre a fórmula de Sturges para deter1ninar o nún1ero de classes, arre- dondando para mais ou para 111enos conforme o caso, quando k não for inteiro. O pri1neiro passo é deter1ninarmos a an1plitude de classe; h; = diferença entre os limites inferiores (ou superiores) de duas classes contíguas. i = 1, 2, ... ' k 50 Logo, h; = - = 7,1428; ton1aremos h; = 7. 7 Definiremos, no quadro a seguir, as classes e fare111os a tabulaçã.o dos dados para obtennos a frequência de cada classe definida: Classes Tabulação 11; 911-- 98 Ili ..., .) 98 1-- 105 //// //// 8 105 1-- 11 2 ////// // // 10 11 2 1-- 119 //// //// 8 1191--126 //ll//l/I // 11 1261--133 //// // 6 133 1-- 140 li 2 140 1-- 147 li 2 Capítulo 8 - Análise exploratória dos dados de uma amostra 195 Observamos que ten1os 8 c lasses, sendo k = 7. Esse fato ocorre porque aproxima- ções são feitas. St'._jarn: x; = ponto médio da classe i; fi = frequência relativa da classe i ; M = frequência absoluta acu1nu lada da c lasse i; F, = frequência relativa acumulada da c lasse i. Formamos então a tabela dos dados agrupados en1 classes de.frequências. Classes Limites aparentes Limites reais X; n; N1 .fi 91 1-- 98 90,5 1-- 97,5 94 ,., .) 3 0,06 98 1-- 105 97,5 1-- 104,5 101 8 11 o, 16 105 1-- 112 104,5 1-- 11 1,5 108 10 21 0,20 1121--119 11 1,5 1-- 118,51 15 8 29 o, 16 119 1-- 126 118,5 1-- 125,5 122 l 1 40 0,22 1261-- 133 125,5 1-- 132,5 129 6 46 0,12 133 1--140 132,5 1-- 139,5 136 2 48 0,04 140 1-- 147 139,5 1-- 146,5 143 2 50 0,04 L 50 1,00 F1 0,06 0,22 0,42 0,58 0,80 0,92 0,96 1,00 Faren1os agora a descrição gráfica desses dados, construindo o histogra1na, o po- lígono de frequências e o polígono de frequências acumuladas. Histogran1a é u1n gráfico representado por retângulos (batTas) contíguos no qual os extre1nos da base do retângulo i são definidos pelos limites da classe i, a altura é proporcional à frequência e a base é sen1pre un itária. A área total do histogra1na deve ser 1.% ou 100%. 10 8 6 4 2 o . . . • 1 1 80 87 94 101 108 115 122 129 136 143 1 1 ' • ' • x, Polígono de frequências. Considera1nos a poligonal que une os pontos médios das bases superiores dos retângu los do histogran1a (pontos 1nédios das classes). 196 Estatística básica 12 n; 10 ~ -------- ~...,- --- / 8 - 1 ~------ / 6 -1------/ 4 -1-----/ 2-l----;/ º ..l-- -f'- ---.-----,.---...----.---,...----,.---...-----.-- -"'i- --.---.-~ 1 80 87 94 101 108 115 122 129 136 143 150 X; Polígono das frequências acurnuladas (ogivas de Galton) . Para construí-lo, consi- deraren1os os segmentos que unem os pontos de abcissas iguais aos valores dos limites reais de classe e as ordenadas iguais aos valores das frequências acurnuladas. 60 50 40 30 20 10 o n1 ' • / ' ' ' / X; • ' • ' • ' ' 76,5 83,5 90,5 97 ,5 104,5 111 ,5 118,5 125,5 132,5 139,5 146,5 153,5 160,5 Cálculo da 1nédia e do desvio padrão: Classes X; 90,5 1- 97,5 94 97,5 1- 104,5 101 104,5 1- 111 ,5 108 11 1,5 1- 118,5 115 118,5 1- 125,5 122 125,5 1- 132,5 129 132,5 1- 139,5 136 139,5 1- 146,5 143 L Logo, x = 5 · 764 =115,28-7x=115,28 50 11; X;• n; 2 X; • ll; 3 282 26.508 8 808 81.608 10 1.080 116.640 8 920 105.800 I I 1.342 163.724 6 774 99.846 2 272 36.992 2 286 40.898 50 5.764 672.016 Capítulo 8 - Análise exploratória dos dados de uma amostra 197 1 (5 764) 2 s2 = - 672.016- · = 153,92~s 2 = 153,92 49 50 s = 12,4665 Alén1 da 1nédia e da variância, outras 1nedidas sã.o interessantes para a análise dos dados. A média é unia n1edida de posição. Estudaremos outras 1nedidas de posição: a mediana, moda, quartis, decis e percentis. Usaremos no cálculo dessas medidas a seguinte simbologia: I; = limite real inferior da classe da separatriz; M, = frequência acumulada da classe anterior à da separatriz; h, = amplitude da classe da 1nedida; n, =frequência absoluta da classe da 1nedida; j, = frequência relativa da classe anterior à da separatriz; e fi, = frequência posterior à classe da niedida. ' Moda é o valor 1nais frequente de urna distribuição de frequências. E o valor da variável que corresponde ao valor máxin10 na distribuição de frequência. Usaremos o método de King para detenninar a 1noda: h .. f. M = /. + ' . P o 1 fa+fp A classe de maior frequência, portanto a classe 111odal, é a 5ª. Ternos, pois: Is= 1l 8,5 .fi = 0,16 fc, = 0, 12 hs = 7 M =1185+ 7 ·0,l2 o ' (0,16+0,12) Mo= 121,5 Podería1nos també1n ter usado o 1nétodo de Czuber: Encontraríamos o valor Mo= 121,125 Mediana é o valor que ocupa a posição central de uma distribuição. Se tivermos u1na a1nostra simples, co1no 1, 4, 6, 9 e 11, a rnediana é o 6. 198 Estatística básica Se a an1ostra for do ta1nanho par, como l , 5, 7, 8, l O e 11, a mediana será a média dos dois termos cet1trais: (7 +8) Md= -7Md=7,5 2 A fór111ula para calcularmos a mediana será a seguinte: . 1 (n ) Md = e. + - - - N · h. 1 2 a 1 n; Para detenninarmos a classe da 1nediana, faze1nos n = 50 = 25. Procuramos na 2 2 tabela dada na página 195 na coluna M. Co1no 25 < 29, a classe da n1ediana é a 4ª classe, e daí tira111os: [4 = 111,5 N3 = 21 Md=lll,5+7· ( 25 - 2 l) 8 Md = 115 Quartis são separatrizes que dividem a área de u1na distribuição de frequências em regiões de áreas iguais e múltiplos de _!_ da área total. 4 Prüneiro quartil (Q1) é o valor (separatriz) que divide a distribuição e1n duas partes, tal que 25% dos valores seja1n menores que ele e ~ , ou 75%, dos valores sejam maiores que ele. 4 A fór1nula para o cálculo do pritneiro quartil é a 111es1na da 1nediana, com pequenas adaptações: Para determinarmos a classe do primeiro quartil, fazemos !!_ = 50 = 12, 5 e, usando 4 4 o 1nesn10 critério da mediana, notamos que 12,5 < 21. Logo, a classe do pri1neiro quartil, lB classe. Temos: /3 = l 04,5 n.3 = 1 o h; = 7 o =104 5+7- 12' 5 - 11 -I ' 10 Q. = 105,55 Capítulo 8 - Análise exploratória dos dados de uma amostra 199 Segundo q·uartil (Q2) coincide com a 1nediana da distribuição. Q2 = Md = 115 Terceiro quartil (QJ) é o valor que deixa 75% ( ~ ) dos valores à sua esquerda e 25% deles à sua direita. A fórn1u la de cálculo é se1nelhante à anterior: Q = /. + _!_ (31!.. - N ) · h. 3 r 4 a r n. l Faze1nos 31!..= 150 =37,5. Na tabela, usando a coluna do M, verificamos que 4 4 3 7 ,5 < 40, portanto a classe do 32 qua1til é a 5ª classe. l; = 118,5 ns = l l hs = 7 Q 8 (37,5-29)·7 3 = 11 , 5 + ~------'- l l O· = 123 91 _, , Centis ou percentis são valores que dividetn uma distribuição de frequência em áreas iguais a múltiplos inteiros de un1 centési1no dessa área. Para o cálculo dos percentis, usaren1os a fórn1u la: P, = l + _!_[(k · n - N ) · h.] k J n. 100 a J J Para calcu larmos o P9o, isto é, o valor que deixa 90o/o dos dados à sua esquerda e l 0% à sua direita, faze1nos: n 50 k · = 90 · = 45 ~ 45 < 46 ~ a classe do 902 percentil é a 6ª classe, 100 100 e portanto: 16= 125,5 Ns= 40 (45-40)·7 ~o= 125,5 +--~- 6 P9o = 131,33 Observamos que o P90 é o 9g decil. Logo, não é necessário usar uma fór1nula espe- cífica para calcular qua lquer decil, basta usar a fórrnu la acima. 200 Estatística básica Na verdade, o leitor deve ter percebido que é desnecessário gravar as fórmulas para 1nediana, quartis, decis e perce11tis, pois todas são casos pa11iculares da última fórmula dada nesta página, como se segue: P 2s = Q, Pso = l'vfd P1s = QJ P30 = D3 e assiJn por diante. Exercício resolvido São dadas as vendas de un1a firma, expressas e1n milhares de$, durante 100 se1na- nas, segundo o quadro abaixo: 26 39 26 29 34 27 28 30 29 32 34 30 29 32 21 24 23 29 30 36 31 37 34 30 27 28 "',., .).) 28 30 34 27 34 29 31 27 32 33 36 32 30 33 23 29 27 30 29 30 31 37 27 30 32 26 30 27 36 33 31 28 33 33 29 30 24 30 28 30 27 30 30 31 33 30 32 30 "',., .).) 27 27 31 33 27 "',., .).) 31 27 31 28 27 29 31 24 28 30 27 30 31 30 33 30 33 34 Deter1ni nar: a) rol; b) an1plitude máxi1na; c) nún1ero de classes; d) a1n pi itude de classes de frequências; e) distribuição em classes de frequência. Elaborar: f) histograma; g) polígono de frequências; h) polígono de frequências acu1nu ladas. Calcular: i) 1nédia, variância, desvio padrão e moda; j) Q,, Ds, P6s· Capítulo 8 - Análise exploratória dos dados de uma amostra 201 Resolução: a) 2 1 2 3,3 2 4,4,4 2 6,6,6 2 7,7,7,7,7,7,7,7,7,7,7,7,7,7 2 8,8,8,8,8,8,8 2 9,9,9,9,9,9,9,9,9 3 O,O,O,O,O,O,O,O,O,O,O,O,O,O,O,O,O,O,O,O,O ,., .) 1, 1, 1, 1,1, 1, 1, 1,1,1 3 2,2,2,2,2,2 3 3,3,3,3,3,3,3,3,3,3,3,3 ,., .) 4,4,4,4,4,4 3 6,6,6 ,., .) 7,7 3 9 b) Á = X m;., - Xmin = 39 - 2] = 18 e) k = 1 + 3,22 · log lOO = 7,44 d) h. = 18 = 2 41 ~ h. = 2 1 7 44 ' 1 ' e) Classes Limites apar. Limites reais X ; 21 f-23 20,5 f- 22,5 2 1,5 23 f-25 22,5 f-24,5 23,5 25 f-27 24,5 f-26,5 25,5 27 f- 29 26,5 f- 28,5 27,5 29 f- 31 28,5 f- 30,5 29,5 31 f-33 30,5 f- 32,5 31,5 33 f-35 32,5 f- 34,5 33,5 35 f- 37 34,5 f- 36,5 35,5 37 f- 39 36,5 f- 38,5 37,5 39 f- 41 38,5 f--- 40,5 39,5 L n1 1 5 3 21 30 16 18 3 2 1 11 = 100 N1 fi F1 1 0,01 0,01 6 0,05 0,06 9 0,030,09 30 0,21 0,30 60 0,30 0,60 76 o, 16 0,76 94 O,J 8 0,94 97 0,03 0,97 99 0,02 0,99 100 0,01 1,00 202 Estatística básica f) 35 30 25 20 )5 10 5 o - 1 1 1 1 1 1- 1 ' • ' ' 21,5 23,5 25,5 27,5 29,5 31 ,5 33,5 35,5 37 5 39 5 X; ' ' g) 35 30 25 20 15 10 5 - - n; / / / ' / / \ \. '\ \ \ '\. ' ' ' ' ' ' ' ' ' ' o ~ 19,5 21,5 23,5 25,5 27,5 29,5 31 ,5 33,5 35,5 37,5 39,5 41,5 h) 120 !1; 100 80 60 40 20 / / / 1 1 1 1 1 1 1 1 1 1 ' 0 X1 .18,5 20,5 22,5 24,5 26,5 28,5 30,5 32,5 34,5 36,5 38,5 40,5 42,5 Capítulo 8 - Análise exploratória dos dados de uma amostra 203 i) média, variância, desvio padrão e 1noda Classes X; ll; X;. ll; 2 X; • ll; 20,5 1-22,5 21,5 1 21,5 462,25 22,5 1-24,5 23,5 5 117 ,5 2. 761 ,25 24,5 1-26,5 25,5 3 76,5 1.950,75 26,5 1-28,5 27,5 21 577,5 15.881,25 28,5 1- 30,5 29,5 30 885,0 26.107,25 30,5 1- 32,5 31,5 16 504,0 15.876,00 32,6 1- 34,5 33,5 18 603,0 20.200,50 34,5 1- 36,5 35,5 3 106,5 3.780,75 36,5 1- 38,5 37,5 2 75,0 2.812,50 38,5 l-40,5 39,5 l 39,5 1.560,25 k 100 3.006,0 91.393,00 Logo x = 3·006 = 30,06 x = 30,06 100 1 (3.006) 2 s 2 = - 91.393- = 10 45 s 2 =10,43 99 100 ' s=..JI0,43=3,23 -7 s=3,23 Moda: a classe da 1noda é a 5ª, logo, Is= 28,5 fa = 0,21 M 0 =28,5+( )=29,36 0,21+0,16 2. 0,16 j, = o, 16 hs = 2 1\lfo = 29,36 j) Primeiro quartil: Q1 = P2s N; 1 6 9 30 60 76 94 97 99 100 n 100 k · lOO = 25 · IOO = 25, con10 25 < 30, a classe do Q, é a quarta classe. /4 = 26,5 Q =26 5+ ( 25 - 9)· 2 =28 02 1 ' 21 ' Q, = 28,02 F; 0,01 0,06 0,09 0,30 0,60 0,76 0,94 0,97 0,99 1,00 204 Estatística básica Oitctvo decil: Ds = Pso k. n = 80 · 1 OO = 80, como 80 < 94, a classe do Ds é a sétima classe: 100 100 Is = 32,5 D = 32 5 + (80-76) = 32 94 8 , 8 , ns = 18 h8 = 2 D8 = 32,94 ~s: kn = 65 · lOO = 65, co1no 65 < 76, a classe do percentil é a 6ª classe: 100 100 /6 = 30,5 Ns = 60 (65-60)· 2 ~ 5 =30,5+ =31,13 16 PGs = 31, 13 Obs.: 1. Md = 29,83 (quinta classe) 2. Se usarmos h, = 3 e limites aparentes, tere1n.os 7 classes e obteremos, por exem- plo: x = 30,56 e s2 = 10,43. Exercícios propostos 1. Dada a distribuição de salários de 135 operários de uma indústria, expressos em$: a) fazer o histograma dessa distribuição; b) fazer o polígono de frequências; c) fazer o polígono de frequências acumuladas; d) detenninar o salário n1édio desses operários; e) determinar o desvio padrão. Limites n; Limites n; 150 f- 250 10 750 f-850 14 250 f- 350 13 850 f-950 13 350 f- 450 14 950 f- 1.050 10 450 f- 550 17 1.050 f-1.150 8 550 f-650 16 1. 150 f- 1.250 5 650 f-750 15 ~ 135 Respostas Capítulo 8 - Análise exploratória dos dados de uma amostra 205 2. Dada a distribuição de frequência abai.xo, fazer o histogratna, o polígono de frequências, o polígono de frequências acumuladas e determinar: média, desvio padrão, moda, 1nediana, J!! quartil e P4s. Limites reais n1 36,95 f- 38,95 ] 38,95 f- 40,95 5 40,95 f- 42,95 10 42,95 f- 44,95 14 44,95 f- 46,95 16 46,95 f- 48,95 8 48,95 f- 50,95 4 50,95 f- 52,95 2 }'. 60 3. Dados brutos: vendas de uma firma em n1ilhões de$, durante 100 semanas. 25 40 25 30 28 23 30 31 28 33 20 25 33 38 33 31 26 28 26 35 28 42 26 .., .., .) .) 32 28 28 26 29 30 29 33 25 31 26 37 32 40 29 25 29 29 30 34 29 33 29 34 26 34 30 28 30 29 27 34 36 33 30 30 Detenninar: a) rol dos dados; b) amplitude total; c) n(nnero de classes; d) agruparnento ern classes de frequências; e) histograma; f) polígono das frequências; g) polígono das frequências acumuladas; h) média; 27 31 39 33 24 28 29 37 34 29 29 35 32 35 31 31 31 32 36 28 32 30 27 34 29 28 29 31 28 "? .)_ 30 34 26 30 30 25 34 29 32 30 i) variância e desvio padrão; j) moda; k) 1nediana; 1) terceiro quartil; m) sexto decil; n) septuagésimo quarto percentil. Respostas Distribuição amostral dos estimadores Estudaremos neste capítulo co1no se distribuem por a1nostrage1n dois estimadores: o esti1nador x da médiaµ e o estimador p da proporção populacional p. Lembrando o esquen1a geraJ: População Parâmetros: () ! A1nostras ~ Estimadores: () 9.1 Distribuicão amostral da média • De u1na população X, tira1nos uma a1nostra de ta1nanho n constituída pelos elemen- tos X1, Xz, ..• , x.,. O estin1ador da médiaµ populacional na amostTa é: 1 li X=- LX;. n i = I Para exe1nplificar, vamos considerar uma população fin ita X: 1, 2, 3, 4, 5, N = 5. N E(x)= µ.r = _L x;.p(x;) i=I N • • • • • • VAR(x)= a;= L ( -~; -µx) 2·p(x;) :. i= I E(x)= µ =.!.(1+2+3+4+5)= 15 =3 .r 5 5 µx=E(x)=3 Capitulo 9 - Distribuição amostral dos estimadores 207 X P(x) x-µ.,. (X-/lx)2 (x - µx)1 • P(x) 1 1/5 -2 4 4/5 2 l/5 -1 l 115 3 1/5 o o o 4 1/5 1 1 1/5 5 1/5 2 4 4/5 L 1 2 Logo: a 2 =VAR(x)=2 X Va.1nos retirar dessa população de ta1nanho N = 5 todas as an1ostras com reposição de tan1anho n = 2. Poden1os retirar 1V" = 52 = 25 a1nostras. Calcularen1os as 1nédias de cada. a.mostra. Amostras -X; Amostras -X; Amostras -X; 1 1, 1) 1,0 11 (3, 1) 2,0 21 (5, 1) 3,0 2 " 1 1,2 1 1,5 12 (3,2 2,5 22 '5,2) 3,5 3 ( 1,3 1 2,0 13 C' .... .) , .) 3,0 23 5,3) 4,0 4 1,4 2,5 14 (3,4 3,5 24 5,4) 4,5 5 (1.5) 3.0 15 (3.5) 4.0 25 (5.5) 5.0 6 (2,1) 1,5 16 (4, 1) 2,5 7 (2.2) 2,0 17 (4.2) 3.0 8 (2,3) 2.5 18 (4,3) 3,5 9 12,4) 3,0 19 (4,4) 4,0 10 1 2,5 3,5 20 (4,5) 4,5 Co1no x varia de a1nostra para amostra, .X é u1na variável aleatória, discreta no caso. Determinaremos a distribuição da variável .X e calcularemos E( x ) e VAR( .X). - P(x) x · P(x) x 2 • P(x) X 1,0 1/25 1,0/25 1/25 1.5 2/25 3.0/25 4.5/25 2.0 3/25 6.0/25 12/25 2,5 4/25 l 0,0/25 25/25 3.0 5/25 15,0/25 45/25 3,5 4/25 14/25 49/25 4,0 3/25 12/25 48/25 4,5 2/25 9/25 40,5/25 5,0 1/25 5,0/25 25/25 L l 3 10 li Logo, E(.r:) = µx = ,Lx; · P(x;) = 3 :. i=I U - =E(x)=3 ' X 208 Estatística básica 11 Como E(x2 ) = ,Lx/ · p(x; ), :. temos E(x 2 ) = 10. í= I Sendo VAR(x) = E(x 2)-{E(x)}2 , então V AR(:X) = 10 - 32 =1. Logo: ai =VAR(x)=l Concluí1nos, portanto: Proposição 1 A n1édia das médias amostrais, ou E(x), é igual à médiaµ populacional, ou E(x) = µ,. Vejrunos: lembrando que: X x, X1 XJ l 1 1 P(X; =x;) - - - N N N 1 li 1 li 1 Ten1os que E(x) = - _L E(x) = - · LP = ....:. . nµ = µ n í=J n i=J n • • • A A E(x) = µ - Xv 1 -... N Quando E(O) = O, o estimador O é não viciado, não viesado ou não tendencioso. Logo, x é u1n estimador não tendencioso deµ. Co1no VAR(X) = 2, n = 2 e VAR (:X)= 1, concluimos que VAR(:X)= VAR(X) , daí a n Capitulo 9 - Distribuição amostral dos estimadores 209 Proposição 2 A variância da média a1nostral é igual à variância populacional dividida pelo tamanho da a1nostra, ou De fato: (J 2 VAR(x) = a ~ = - x n 1 li 1 VAR(x) = VAR -_Lx; =-2 VAR(x, + ... +.'711 ) = n i=t n = - 1 VAR n2 Graficamente: P(x) 115 1 2 3 i=I 4 ª 2 ai = VAR(x)=- 5 X 5125 4125 3/25 2/25 1/25 n P(x) • • • • • • • . . . . . . ' ----~---- .-----r---- .---- • ---- ,----.. ~ ·--·• .. ·---~--· . ' ' . . ' ' . ' . ' ' . . ' ' . ' • •• • •• • •• ---- ~ ---- ~ ----- ~ ----~---- ~ - -- -'- ---- ~- - - - ~ -----~---. ' ' . . ' ' . ' . ' ' . . ' ' . ' , ,, , ,, , ,, . .. . . , . . , ----r----1----.. ---- {- ----~----t ---- • ----f-----r--- , ' • • 1 ' ' • ' •••••• • •• • ' • • 1 ' ' • ' -- -- ~- --- .. ·-- - ~ ---- ~ ----- ~ ---- ~ -----~---_._·---~---, ,, , ,, , , , • ' • • 1 ' ' 1 ' ,, , , ,, , , , • •• • •• • • • ---... ----1-----~---- 1 ----- r- --- {----- r---- 1--- - .. ---. ' . . . ' ' ' ' . ' ' . ' ' ' . ' 1 1,5 2 2,5 3 3,5 4 4,5 5 -X Portanto, se X: N(µ, a 2) e se dessa população retirarmos a1nostras de ta1nanho n, então x:N (]2 µ ,- n Isto é: a distribuição da variável x por amostragem casualsimples será sen1pre normal co1n a n1esma n1édia da população X e variância n vezes menor. Isso significa que, quanto maior o tamanho da a1nostra, menor será a variância de ,\:, ou o estimador será mais preciso à 1nedida que o tamanho da a1nostra au1nentar. 210 Estatística básica Observa1nos, pois, que: - 1 f(x)= .J2n a- 2n X _.!_(x-1•) 2 2 (J -e " Concluímos que f"(x) = ~ 2n ·a f( x ) µ COl110 a - ~ --=ª x -~-;;- ~ Não den1onstraren1os que, se X é normal, x ta1nbém é normal. Se a população não é nonnal, qual a distribuição amostral de ,, ? Se a população X não é normal, a variável x não será "exatamente" nor1nal, mas . . d 1 . , . , 1 Z X - µ ' ' d. "b . -s1n1 aproxnna amente nonna , isto e, a var1ave = · tera. co1no 1str1 u1çao ª -X li1nite a. distribuição N(O , 1), fato que resulta do teore111a do limite central. Concluindo, se X é t11na. população não norn1al co1n parâmetrosµ e a2, e se retirar- 111os dela uma amostra de tamanho n, suficientemente grande, então x = N( µ , : 2 . Há un1a observação i1nportante a ser feita: se a população for finita e de tamanho N conhecido, e se a amostra de ta1nanho n dela retirada for se1n reposição, então: EXEMPLO • . . N-n N-l Ten1os uma população de 5.000 alunos de un1a faculdade. Sabemos que a altura média dos alunos é de 175 c1n e o desvio padrão, 5 cm. Retiramos uma. amostra sem reposição, de tamanho n = 100. e Capitulo 9 - Distribuição amostral dos esti1nadores 211 X: N(l 75, 25 cm) { u = 175cm a= 5 cm Então, µx = E(x) = 175 a N - n ª -x = J;. N-1 5 5.000-100 = o 495024 10 5.000-1 ' 1 Logo, a média das 1nédias an1ostrais é 175 cm e o desvio padrão da n1édia amos- tral é 0,5 cm. Observação 1 O nú1nero de amostras sem reposição é(~) , no caso presente ( 1 ~~~º) Observação 2 Calculando sern o fator de correção, ten1os: (J 5 a x = J;. = 10 = 0,5, portanto: 2 Quando tiramos u1na amostra grande de uma população de tarnanbo muito maior que o da a1nostra (pelo n1enos o dobro), é indiferente usar o fator de correção para populações finitas, para se calcular a,, , porque o erro é rnu ito pequeno, como mos- I tran1 1 e 2 . • Exemplos de aplicação 1. Seja X: 1V(80, 26). Dessa população retiramos u1na arnostra de n = 25. Calcu lar: a) P(x > 83); b) P(x < 82); c) P( x - 2a, < µ s x + 2a,). Resolução: Co1no X: N(80, 26) µ - =80 X e µ =80 ~ (J = J26 = 5,10 z = x - µ X =X -80 ª .-r 1, 02 212 Estatística básica a) P(x >83) = P(Z >2,94) = 0,5-0,498359 = 0,001641 80 83 X z = 83 - 80 = 2 94 1 1 02 ' ' b) P( x < 82) = P(z < l ,96) = 0,5 + 0,4 75002 = 0,975002 80 82 c) P(x - 2a_, :::; ,u :::; x + 2ax) = P(µ - 2ax :::; x ::5 µ + 2ax) = P(80- 2·1, 02:::; X ::::; 80 + 2 · l, 02) = P(77' 96::::; X ::::; 82, 04) = P(-2::::; z::::; 2) = = 2. 0,477250 = 0,954500 77 ,96 80 82,84 X :. Temos 95,45% de confiança de que, se retirarmos dessa população nonnal uma a1nostra de 25 elementos, a 1nédia da amostra estará no intervalo (77,96; 82,04) ou, então, se selecionan11os 100 amostras de ta1nanho 25, em 95 delas o valor da 1nédia pertencerá ao intervalo e em 5 delas a nlédia não pertencerá ao intervalo. 2. Seja X N(IOO; 85). Retiramos un1a amostra de tan1anho n = 20. Detenninar: a) P(95 < x < 105); b) P(x -Za ·O-x <µ<x + Za ·a, ) = 0,95. Resolução: SeX: 1\T(JOO, 85) µ =100 ( 85) , ~X :N 100, - a- =85 20 . • • • • • µ x =100 e :x -100 Z=--- 2,06 Capitulo 9 - Distribuição amostral dos esti1nadores 213 a) P(95 < -~ < 105) = P(-2,43 < -~ < 2,43) = 2 X 0,492451 = 0,984902 - 95 100 105 X :. a probabilidade de x pertencer ao intervalo (95 , 105) é de 98,4%, e a de não pertencer a esse intervalo, que seria o risco de se retirar urn valor de x < 95 ou X > ) 05, é de J ,6%. b) A probabilidade, neste caso, já está dada. Precisamos deter1ninar o valor de Z,. tal que 0,95 seja a probabilidade de que a média µ esteja entre os dois limites x + Z,, = ai, e 0,05 seja a probabilidade de que a média esteja fora desses limites. P( X - z,. . ª -x < µ < X + z(Y. . a,) = 0,95 0,475 - Z,, O z Pela tabela, Za = Zo.•75 = 1,96. :. P( X - 1,96 . 2,06 < 100 < X + 1,96 . 2,06) = 0,95 Para ficar c laro: x - 1,96 · 2,06 < 100 -7 x < 104,04 100 < X + 1,96 . 2,06 :. 95,96 < X < 104,04 :. P(95,96 < X < 104,04) = 0,95 :. a probabilidade de que x E ao intervalo aci1na é de 95%, o que significa que te1nos uma confiança de 95% de que, retirada uma amostra de n = 20, a média dela estará entre 95,96 e l 04,04, ou então há um risco de 5% de que esta rnédia se ja < 95,96 ou > 104,04 . • 214 Estatística básica Dimensionamento de uma amostra Muitas vezes, é importante saben11os qual deverá ser o tamanho de uma amostra para que a probabilidade de que determinado parâ1netro ou estimador esteja dentro dos litnites seja u1n valor dado, ou então, queremos delin1itar o erro de an1ostrage1n dentro de u1n risco determinado. Veren1os um exemplo: seja X: N( 1.200, 840). Qual deverá ser o tamanho de uma amostra, de tal fonna que P(l.196 < x < 1.204) = 0,90? . f µ = 1.200 . - Se X~ N(l .200, 840) l , . . µ, -1.200 e a- =840 · . . . ' l.196 1.200 l.204 0,90 - X ª" = ra2 = {840 ~~ ~---;;-- 28, 98 O- = )";i ·' n • • • Z" = Zo.•s = 1,64 1 64 = 1.204 -1.200 , 28,98 Fn E indiferente escolher entre uma das duas: . • • Fn = 1,64 . 28,98 4 Fn =ll,88~n=l41,13 Concluímos que, se retirannos uma a1nostra de 141 elementos da população X, te- remos 95% de confiança de que x estará no intervalo ( 1.196, 1.216) e P( x < 1.196) = 0,025 ou P( x > 1.216) = 0,025, o que significa que o risco que corremos de que o valor da 111édia caia fora do intervalo anterior é de 5%. Capitulo 9 - Distribuição amostral dos estimadores 215 Gráficos de controle Os gráficos de controle são representações que permitem un1 controle estatístico sobre processos de produção. De modo be1n sitnples e resun1ido, apresentamos o grá- fico da 1nédia. E1n uma linha de produção, tomamos diarian1ente amostras de n itens e calcularnos x e a_,. Mes1no que as n1edidas desses itens não tenham distribuição nonnal, x, como já vitnos, terão distribuição aproximadarnente normal. O gráfico de controle da 1nédia x da a1nostra de tamanho n é feito n1arcando-se, nas ordenadas, os valores x e, nas abscissas, o número de ordem das amostras ou das datas que foram retiradas. Aos limites de confiança corresponderão retas horizontais, co1n os significados: µ + 3,0 a;: li1nite superior (LS) µ: linha média (LM) µ - 3,0 a,: lin1ite inferior (LI) X ' . Jl + 3ai 1------------------- LS µ - 3a- 1------------------- 1., LI -+--1-, -+;--1;--+--,--------------------i:.- Amostras Quando o processo está sob controle, 99,7% dos pontos deverão estar na zona gra- fada, havendo uma pequena probabilidade de aproxi1nada1nente 0,3% se encontraren1 fora da zona de controle. Logo, a existência de pontos na zona externa 1nostra Lnna ausência de controle, exigindo ação corretiva. 9.2 Distribuição amostral das proporções Veren1os a distribuição an1ostral ela proporção p de sucessos, característica que se estuda na população. 216 Estatística básica Seja p conhecida. A população pode ser definida co1no uma variável X tal que X= 1 se o elemento da população tem a característica X= O se o ele1nento da população não tem a característica eP(X= l)=p,P(X= O) = q, p + q = 1 ,tt = E(X)= p Sabe1nos que a 2 =VAR(X)= pq= p(l-q) Retira1nos u1na grande a1nostra, n ---7 oo, x,, x2, ... x,., dessa população, co1n reposi- ção, e definin1os x como o número de sucessos na amostra, isto é, o número de elen1en- tos da an1ostra co1n a característica que se quer estudar. X O esti1nador de p é definido por P = - : proporção de sucessos na a1nostra. n X: B(n,p) e E(X) = np VAR(X) = npq Calculando esperança e variância de p, temos: E(p) = E(x) = _!_ E(x) = _!_ · np = p :. E(p) = p n n n ou O que garante que, para grandesamostras, a proporção a1nostral se distribui com 1nédia igual à proporção populacional. Vejrunos agora: VAR(,ô)=VAR - = 1 ·VAR(X)= 2 npq (X) 1 1 n n n ou V AR(,ô) = !!!.!... n ou a. = [pq p \j --;; . • • Logo, a variância da proporção an1ostral é a variância da população dividida pelo nú1nero de ele1nentos da an1ostra. Quando n ---7 oo p = N(p, ~q ),pé aproxi1nadan1ente normal. Capitulo 9 - Distribuição amostral dos estimadores 217 Quando p é desconhecida e a atnostra co111 reposição é grande, determinamos X Po = - , estimativa de p. n a. :::: p Para alguns autores e estatísticos, ui.na anJostra é suficiente1nente grande quando np > 5 enq > 5. Exercícios resolvidos 1. En1 uma população, a proporção de pessoas favoráveis a uma deter111inada lei é de 40o/o. Retiramos u1na a1nostra de 300 pessoas dessa população. Deter1ninar: P(p - Zª · ai> :::; p:::; p + Zr,- ai>) = 0,95. Resolução: Como n = 300 e p = 0,4 q=l-p = 0,6 a. = ,, 0,4·0,6 --- => 300 :. Z" = Zi.41s = 1,96 a . =~ p ~--;;- ª;, = 0,0283 -Z " :. P(0,4 - 1,96 · 0,0283 < jJ < 0,4 + 1,91 · 0,0283) = 0,95 P(0,4 - 0,0555 < p < 0,4 + 0,0555) = 0,95 • • • P(0,3445 < jJ < 0,4555) = 0,95 P(34,45% < p < 45,55%) = 0,95 95% o z 2. Deseja-se saber qual a proporção de pessoas da população portadoras de deter1ninada doença. Retira-se uma a1nostra de 400 pessoas, obtendo-se 8 portadores da doença. Definir li111ites de confiabilidade de 99% para a proporção populacional. J~esolução: ~ X 8 002 Po = 7; = 400 = ' fto = 0,02 99% ê/o = 0,98 -z a o 218 Estatística básica Po ·q0 _ 0,02·0,98 n 400 (Jp = 0,007 Con10 Z" = Zo .. 19s = 2,5 7, ten1os: P(po - Za<J,) S P S Po + Za · CJ;>) = 0,99 P(0,02-2,57 · 0,007 < p < 0,02-2,57 · 0,007)= 0,99 P(0,02-0,018 < p < 0,02 + 0,018) = 0,99 P( 0,002 < p < 0,038) = 0,99 • • • P(0,2%<p<3,8%)= 0,99 Pode1nos garantir co1n un1a confiabilidade de 99% que a proporção de pessoas por- tadoras da doença na população varia de no mínimo 0,20% e no máxin10 3,8%. Algumas distribuições a1nostrais de estatísticas impo1tantes serão vistas nos pró- ximos capítulos, à medida que fore1n necessárias, como por exemplo a t de Student, a Qui-Quadrado e a .F de Fisher-Snedecor. Exercícios propostos 1. Seja X: 1V(900, 642). Retirrunos uma amostra de tamanho 30. Determinar: a) P(x < 894); b) P(896 s X< 903); c) P(x - 3a':i < µ < x + 3a ~ ). 2. Seja X: iV( l .200, 1.444). Retira1nos uma a.1nostra de tamanho 15. Detern1inar: a) P(l.194<x<1.206); b) P(x - Zª · ax <µ <x + Z"' · a.v) = 0,90. 3. Qual deverá ser o ta1nanho de uma amostra a ser retirada de uma população X: J\1(200, 350) para que P(lx -,ui < 5) = 0,95. 4. Des~ja-se saber qual o número de eleitores de determinada região que votarão no can- didato A, de fom1a que a probabilidade do en·o de esti1nação seja no 1náximo 3%, com 95% de confiança. Para estudar o problema, retira-se uma amostra de 500 eleitores dessa região, obtendo-se 120 eleitores que vota1n en1 A. Obs.: e = jJ - p 5. U1na fábrica de peças especifica en1 suas embalagens que a proporção de defeitos é de 4%. Um cli.ente dessa fábrica inspeciona uma an1ostra de 200 peças e constata que 12 são defeituosas. Baseado nesses dados, em quantas amostras o cliente encontraria tuna proporção de defeitos inaior que o especificado pelo fabricante? Respostas Estimação 10.1 Inferência estatística Usualmente, é in1praticável observar toda u1na população, seja pelo custo caríssi- n10, seja por dificuldades diversas. Exarnina-se, então, uma amostra. Se essa amostra for bastante representativa, os resultados obtidos poderão ser generalizados para toda a população. O pesquisador poderá levantar hipóteses das possibilidades das generalizações dos resultados aos experimentos semelhantes. Deverá testar essas hipóteses, que poderão ser rejeitadas. Um experimento pode ter por finalidade a determinação da esti1nativa de um parâ- n1etro de uma função. Toda conclusão tirada por un1a a1nostragen1, quando generalizada para a população, virá acompanhada de un1 grau de incerteza ou risco. Ao conjunto de técnicas e procedimentos que permite1n dar ao pesquisador tun grau de confiabilidade, de confiança, nas afirmações que faz para a população, baseadas nos resultados das amostras, da1nos o nome de inferência estatística. O problema fundamental da inferência estatística, portanto, é 111edir o grau de in- certeza ou risco dessas genera lizações. Os instrumentos da inferência estatística permi- te1n a viabilidade das conclusões por meio de afirmações estatísticas. 10.2 Estimação de parâmetros Um dos objetivos bás icos da experi1nentação é a estimação de parân1etros. Estuda- -se un1a população cuja distribuição é considerada conhecida por 1neio de sua função de densidade de probabilidade, j(X, e,, 82, ..... , 8")' onde X é uma variável aleatória e O;, i = l, 2, ... , p são os parâ1netros da distribuição. 220 Estatística básica EXEMPLO X: Jll(µ, a2), onde f(x;µ, <>2) = ~ e -~ ( X: I' r; portanto a distribuiçã.o de X, que é a 2n norn1al, depende de 2 parân1etros, µ e a2• Te1nos de avaliar u1n ou 1nais parâmetros da distribuição populacional, tomando por base uma an1ostra casual sin1ples x,, x2, ... , Xn. O principal proble1na é procurar funções de observações que forneçam estimativas dos parâmetros. A distribuição dessas funções devem estar o 1nais concentradas possível e1n torno dos verdadeiros valores dos parâ1netros de O. Estas funções, con10 já vimos, são es- ~ tbnadores: ()e o valor numérico deles, calculados usando as observações xi, x2, ... , X11 ~ são as estin1ativas dos parâ1netros: Oo. Logo: 1 li .X = -2: X; é urn estimador deµ e x = x0 é urna estimativa. n i=I 1 li s 2 = L ( X; - x ) 2 é u1n esti1nador de a2, e s2 = sõ é uma esti111ativa calculada n-li=I na amostra. Vitnos no capítulo anterior a distribuição por amostragem de dois esti1nadores: a rnédia amostral e a proporção runostral. Lembrando: Se X: N(µ, a2) então, x : N ? a- µ, - n 10.3 Tipos de estimação ' - ? ; e se p e a proporçao corn µ = p e a- = pq, Há dois tipos fundan1entais de estimação: por ponto e por intervalo. Estimação por ponto • Na estilnação por ponto, a pa11ir das observações, calcula-se un1a estimativa, usan- do o estunador ou "estatística" . A distTibuição por an1ostTage1n dos estimadores ton1a possível o estudo das qualidades de urn estin1ador. Capítulo 10- Estimação 221 Qualidades de um bom estimador Qua11to maior o grau de concentração da distribuição amostral do estimador em ton10 do verdadeiro valor do parâ1netro populacional, tanto 1nelhor será o esti1nador. As principais qualidades de um estimador são: a) consistência; b) ausência de vício; c) eficiência; d) suficiência. a) Consistência DEFINIÇÃO Um estimador ê é consistente para estimar(), se!}~ (P 1ê - e1 >e)= O. x é um estimador consistente paraµ. Usando o teorema de Chebychev: "Se X é uma variável aleatória co1n E(X) = µ e VAR(x) = a2 , então ª 2 P(lx - µ 1 >e)< - 2 , para todo e > O'', ternos: e P(I- I ) VAR(.X) a 2 x-µ >e :::; e2 = -n-e-2 Quando n ~ oo, ? a- lim 2 =O. ,, .. ,,, ne Logo, a distribuição de .X se concentra e1u torno de ,u quando a amostra é sufi- cienten1ente grande. b) Ausência de vício ou justeza DEFINIÇÃO A Um estimador () é não viciado, não tendencioso, não viesado ou justo se E(Ô) = (). Se ~;!E(ê) =fJ, dire1nos que o estin1ador é assintoticarnente não tendencioso. EXEMPLO X: N(u, a2). Já viinos que x é un1 estimador não viciado de ,u, pois E ( x ) = ,u. 1 " ? Vere1nos que s 2 = 2: (X; - x )- é un1 estimador não viciado de a2. n -1 ._ 1 ,_ 222 Estatística básica 1 E n-1 li 11 ""' 2 2-""' -2 L.J X; - X L.J X; + nx i=I 1 E n-1 11 11 LX; ""' ? 2 - i=t -2 L.J xj - · x · n · + nx i=l n 11 = 1 E n-1 ""' ? 2-' + _, L.J xi- x- ·n nx- = 1 E n-1 E 2:x12 -E(nx )2 l =I 11 L E(x;2 )-nE(x2 ) i=l liComo L E(x;2 ) = E(x;2 ) + E(x;2 )+ .... + E(x,~) = E(X2 ) , i =I como VAR(X)=E(X2 )-{E(X)} 2 ou a2 = E ( x2 )- µ 2 • • • ( ' ) ? ? E x- =a-+µ- Da mes1na forma, chegaríamos a ? E(- ' ) a - , x- =- + µ-. n Reescrevendo 1, temos: l=I 1 2 3 E(s2 ) = 1 {nE(x2 )- nE(x2 )}, substituindo 2 e 3 nessa fórmula, temos: n-1 ( ? ) 1 ( ? ? ) <1 2 2 E s- = n a- + µ- - n - + µ n- 1 n = 1 . {na2 -a2} n-1 • . . 1 { ? ? ? ' } = na- + n Jl- - a- - n µ- = n-1 .·. ~ =a2 O que de1nonstra que s2 é u1n estimador não viciado de a2. Capítulo 1 O - Estimação 223 Como exercício, deixamos para o leitor de1nonstrar que: s 2 = _!_ ~ ( x; - x )1 é um n i=I estin1ador viciado de a2, nlas assintotica1nente não viciado da variância populacional. c) Eficiência A A Dados dois estimadores, O, e 02, definiinos eficiência de um parâmetro com relação VAR(ê2 ) a outro, para u1n 1nesn10 tan1anho de runostra, como Ef = (A ) . VAR 81 Un1 estimador é 1nais eficiente que outro se sua variância for nlenor que a do outro. A ~ Se O, é 1nenos eficiente que 02, então E1 < 1. A A Caso O, seja rnais eficiente que 02, então Er> 1. Uma nledida absoluta da eficiência pode ser feita usando-se o estilnador ntais efi- ciente do parâmetro e111 estudo. Esse estilnador terá eficiência 1% ou 100%. Podernos denon1inar simplesn1ente eficiente. d) Suficiência DEFINIÇÃO A U1n esti1nador O de O é suficiente se contén1 o máximo possível de infor1nações co1n relação ao parâmetro por ele estimado, en1 forn1a bem simples de dizer. O esti- " I'\ A , mador fJ de fJ é suficiente se, para qualquer outro esti1nador fJk, a distribuição de f)k for independente de fJ. 1 Pode1nos dizer: quantidade de informaçã.o = V AR ( () ) Há critérios para a escolha de estimadores. Cita1nos, apenas para constar: o 1nétodo de 1náxi1na verossimilhança, dos 1nomentos e de Bayes. Esses métodos permitem a escolha de estimadores 1nais adequados. Estimação por intervalo A estimação por pontos de um parárnetro não possui urna 1nedida do possível erro con1etido na estimação. Urna 1naneira de expressar a precisão da estin1ação é estabelecer lilnites, que co1n ce1ia probabilidade inclua1n o verdadeiro valor do parâ1netro da população. Esses lirnites são cha1nados lirnites de co1?fiança: deterrninan1 un1 intervalo de con- fiança, no qual deverá estar o verdadeiro valor do parâ1netro. Logo, a estilnação por intervalo consiste na fixação de dois valores, tais que ( 1 - a) seja a probabilidade de que o intervalo, por eles detenninado, contenha o verdadeiro va lor do parâmetro. 224 Estatística básica a: nível de incerteza ou grau de desconfiança. 1 - a: coeficiente de confiança ou nível de confiabilidade. Portanto, a nos dá a 1nedida da incerteza desta inferência (nível de significância). Logo, a partir de infonnação de amostra, deven1os calcular os li111ites de um inter- valo, valores críticos, que e1n (J - a)% dos casos inclua o valor do parâ1netro a esti1nar e e1n ex.% dos casos não inclua o valor do parâmetro. Intervalos de confiança para médias e proporções 11.1 Intervalos de confiança (IC) para a médiaµ de uma população normal com variância a2 conhecida Consideramos tuna população norn1al con1 1nédia desconhecida que desejamos es- tin1ar e com a 2 conhecida, X: N(?, a 2) Procedi1nento para a construção do IC: 1. Retiramos urna amostra casual simples de n eletnentos. 2. Calcula1nos a n1édia da a1nostra x. 3. Calculamos o desvio padrão da n1édia amostral: ax = a --;: - ..rn· l (l 4. Fixamos o Dível de significância a, e com ele determinamos z", tal que P(lzl > z") =a, ou seja: P(z > z,,) = ª e P(z < - z") = ~. Logo devemos ter: 2 2 a/2 (1-a) : . P(lzl <za) = 1 - a . -Za Precisa1nos deter1ninar a partir dessa fórmula o IC. -x-µ Con10 z = x -x-µ p ª-X - ou z= x - µ =1 - a 226 Estatística básica P(lx-µI <za ·a-)= 1-a: X :. P(-z,, ·a-< x - µ <z ,, a ~)= 1-a :r ,t. P(-x - z · a- < -µ < - x + z a-) = 1 - a (.1 .\· a .\' • . . P(x - za·a-<µ<x +za·a-) = 1-a , X X que é a fórmula do IC para a média de populações normais com variâncias conhecidas. Os limites citados no capítulo anterior são:µ , = x - z,, · ax e µ1 = x + z,, · ax . Usando tuna notação si1npl ificada, teremos: Selecionamos 100 an1ostras de mesmo tan1anho n. Obtemos 100 estilnativas de x , co1n as quais construí1nos 100 IC para ,tt. Se a = 5%, poden1os esperar que 95 dos IC contenha1n o verdadeiro valor deµ e 5 não contenha1n o valor de ,u. X ,,, l----+--+--+--1------------l--- I -+--i---+--+--+--1------------+---------+ Amostras 1 2 3 4 5 ... 100 Logo. em uma amostra qualquer, a probabi lidade de que o IC determinado conte- nha o verdadeiro valor da 1nédia é de 95%, ou ternos u1na confiança de 95% de que o lC detenninado co.ntenha o verdadeiro valor de,tt. Po11anto. corrernos 5% de risco de que ele nã.o contenha esse valor. Capítulo 11 - Intervalos de confiança para médias e proporções 227 Exemplos 1. De un1a população nor1nal X, co1n a 2 = 9, tiran1os uma amostra de 25 observações, 25 obtendo 2: x; = 152. Determinar u1n IC de limites de 90% paraµ. i=I Resolução: a= 10% - 152 x = 25 X =6 08 ' Za = Z4;% = Zo.4> = 1,64 5% 90% 5% - Za Za Z :. P(6,08 - 1,64 · 0,6 < µ < 6,08 + 1,64 · 0,6) = 0,90 ?(6,08-0,984 <µ < 6,08 + 0,984) = 0,90 90% 5,096 7,064 . • • P(5,096 <µ < 7,064) = 0,90 - X ou lC (u, 90%) = (5,096; 7,064) Portanto, temos 90% de confiança de que o verdadeiro valorµ populacional se en- contra entre 5,096 e 7,064; ou então corren1os um risco de 10% de que o verdadeiro valor da médiaft populacional seja n1enor que 5,096 ou n1aior que 7,064. 228 Estatística básica 2. De un1a população de l .000 e le1nentos com distribuição aproximada1nente normal con1 d1=400, tira-se u1n.a amostra de 25 ele1uentos, obtendo-se x = 150. Fazer um IC paraµ, ao nível de 5%. Resolução: Con10 a popu lação é aproximadamente norn1a l, x tem distribuição nor1nal. Usare- 1V - n N _ 1 para populações finitas e a1nostragem sen1 mos para ª-x o fator de correção . ~ repos1çao. Dados: N = 1.000 a a - = r· X '\/ n N - n N-1 Za = Z 41,; % = J ,96 cr2 = 400 n = 25 20 1.000-25 5 1.000-1 . • • • • • X = 130 a- = 3 95 X ' P(150- l,96 · 3,95 <µ < 150 + 1,96 + 3,95) = 0,95 P(I42,25 <µ < 157,75) = 0,95 ou IC(µ, 95%) = (142,25; 157,75) a =5% 3. De utna população nonnal con1 a= 5, retiran1os u1na amostra de 50 elementos e obtetnos x = 42. a) Fazer u1n IC para a nlédia ao níve l de 5%. b) Qual o erro de estin1ação ao nível de 5%? c) Para que o erro seja< l , com probabi lidade de acerto de 95%, qual deverá ser o tamanho da amostra? Resolução: a) Dados: n = 50 a = 5 X = 42 a= 5% z = z,1 - ~ = 1 96 (t . ~ .... ) a 5 a = r = r;-;; =O 71 -~ '\/ n '\/ 50 ' • • • P(42 - l ,96 · 0,71 <µ < 42 + 1,96 · 0,71) = 0,95 P(42 - 1,39 < ,u < 42+ l ,39) = 0,95 P(40,6l < µ<43 ,39) = 0,95 b) Co1no e = x - µ e x -µ zã = , então Za · ax = e a- " e= 1,96 · 0,71 = 1,39 Capitulo 11 - Intervalos de confiança para médias e proporções 229 c) SeP(e<l) = 0 , 95~n = ? a Como desconhece1nos n, a x = Fn Z., = Z .17,So/. = J ,96 1,96. ~ :::; l • • • n > 96,04 • • • e <I Fn ;::: 1,96 . 5 n > 96 elementos Fn ;::: 9,8 Logo, se tomarmos un1a amostra de no 1níni1no 96 elementos, teremos 95% de confiança de que o erro será de, no 1náxin10, 1 . 11.2 Intervalos de confiança para grandes amostras Consideremos uma amostra grande quando n > 30. Precisamos construir IC para parâ1netros de populações não nonnais, co1n distribuições bino1niais, de Poisson, de frequências relativas, logo, de distribuições aprox in1adan1ente norrnais ou então de po- pulações normais com variâncias desconhecidas. Nessas condições podemos construir, aproxi1nadamente, o IC para o parârnetro, seguindo o 1nodelo de IC para 1nédia de po- pulações normais com variâncias conhecidas. Estimaçãode proporções ou intervalos de confiança para proporções Len1brando que quando p populacional é conhecida, p = x te111 distribuição n ft - fl (p, pq) ou p - p : N(O, 1) assintotica1nente. n afo Para construir1nos o IC para p desconhecida, detenninamos p0 na amostra e consi- A A deran1os a. ::::: p º · q º P n Logo, ao nível a de significância, P(lzl < z.) = l - a A • • • A Sendo z= Po - p ' ai, Po-P P 1-------1 < 7 - - a = 1-a e desenvolvendo con10 fo i feito para a n1édia, chega1nos facil- afo 1nente à fórmula do I.C para a proporção fJ populacional. 230 Estatística básica Exemplos 1. Retira1nos de uma população u1na amostra de 100 ele1nentos e encontramos 20 suces- sos. Ao nível de l %, construir um IC para a proporção real de sucessos na população. Dados: n = 100 x = 20, onde x = n2 de sucessos na amostra a = l % ~ X 20 ~ O P --- · p - 2 e º - n - l 00 · · º - ' a. - " 0,2·0,8 100 Resolução: Z a = Z49,5% = 2,57 - Za q,, = 0,8 99% P(0,2-2,57 · 0,04 < p < 0,2 + 2,57 · 0,04) = 0,99 P(0,2 - 0,1028 < p::; 0,2 + 0,1028) = 0,99 P(0,0972 < p < 0,3028 ) = 0,99 P(9,72% ::;p::; 30,28) = 0,99 ou IC(p, 99%) = [9,72%; 30,28%] Portanto, corremos un1 risco de 1% de que a verdadeira proporção populacional não pertença ao IC dado anterion11ente, ou então nossa confiança de que p pe11ença ao IC detern1inado é de 99%. 2. Para se esti.1nar a porcentage1n de alunos de un1 curso favoráveis à 1nodificação do cur- rículo escolar, tomou-se u1na runostra de 100 alunos, dos quais 80 forrun favoráveis. a) Fazer um JC para a proporção de todos os alunos do curso favoráveis à modifi- cação ao nível de 4%. b) Qual o valor do erro de estimação co1netido e1n a? Dados: n = 100 x = n2 de alunos favoráveis à n1odificação; x = 80 a = 4%. A X 80 A p0 = n = lOO =0,80 e q0 =0,20 0,8·0,2 =O 04 100 ' Capítulo 11 - lnteNalos de confiança para médias e proporções 231 Resolução: a) Za = Z48% = 2,05 96% - Za P(0,8 - 2,05 · 0,04 ;5; p ;5; 0,80 + 2,05 · 0,04) = 0,96 P(0,80 - 0,082 < p < 0,80 + 0,082) = 0,96 • • • ou P(O, 71 80 < JJ < 0,882) = 0,96 P(7 l ,80o/o < p < 88,2%) = 0,96 IC(p, 96%) = [71 ,8%; 88,2%] z Temos uma confiança de 96% que de 71,86% a 88,2% dos alunos do curso serão favoráveis à modificação curricular. :. e = z ·a. a P • • • e = 2 05 · O 04 = O 082 ' ' ' • • • e= 82% ' O erro de estin1ação cometido em "a" é de 8,2%, para 96% de confiança e uma amostra de l 00 alunos. Intervalos de confiança para a média de populações normais com variâncias desconhecidas Quando queremos estimar a 1nédia de uma população normal con1 variância desco- nhecida, con.siderarnos dois procedunentos: • se n < 30, então usa-se a distribuição t de Student, que veremos adiante; • se n > 30, então usa-se a distribuição normal com o estimador s2 de a2. No 1no1nento nos interessa o segundo procedimento. Calcula1nos na amostra suficientemente grande, x e s2 onde: 232 Estatística básica 11 2 li 2.: X; "" ? i=J ~ X; - - --'-----'-- í-1 n ou 1 s2 = -- n-l li L X;2 - nx2 i =I Con10 a amostra é grande, s 2 - a 2 P( x-z ·a- <µ< x+z ·a- )=1-a a.r J a :r é a fórmula já conhecida para o IC para a média. Exemplos • • • 1. De utna população non11al com parâmetros desconhecidos, tiramos utna amostra de ta1nanho 100, obtendo-se x = 112 e s = 11 . Fazer um IC paraµ ao nível de 10%. Dados: n = 100 X = 112 s = 11 a = lOo/o Resolução: Con10 a amostra é grande, usarnos: 99% -Za z Za = Z45% = 1,64 P( 112 - l, 64 · 1, l < µ < 112 + 1, 64 · l , 1 ) = O ,90 P(l 10,20 < f t < 113,80) = 0,90 ou IC(u, 90%) = (110,20; 113,80) Capítulo 11 - Intervalos de confiança para médias e proporções 233 De onde concluímos que, apesar de usar o desvio padrão da a1nostra, ten1os um grau de certeza de 90% de que o verdadei_ro valor da média populacioual está entre 110,20 e 113,80. 2. A altura dos ho1nens de u1na cidade apresenta distribuição normal. Para esti1nar a al- tura média dessa população, levantou-se u111a a111ostra de 150 indivíduos obtendo-se 150 150 ,Lx; = 25.800 cm ,Lx/ = 4.440.075cm2 • Ao nível de 2%, deter1ninar u1n IC para i = l i=I a altura 1nédia dos homens da cidade. 1 ? s-=-- n - 1 - l li 25.800 X =-_Lx. =--- n i=I 1 150 1 149 s2 = 16,61 • • • S = 4,07 CITI X= 172 CITI 4.440.075- (25·800 ) 2 150 :. Dados: n = 150 (an1ostra grande) x = 172 cm s = 4,07 a = 2%. Usaremos Za = Z49% = 2,32 P(l 72 - 2,32 · 0,332 < µ < 172 + 2,32 · 0,332) = 0,98 • • • ou P(l 71,22 <µ < 172,77) = 0,98 1% -Za IC(µ, 98o/o) = (1 ,71 m; 1,73 1n) Podemos afinnar com u1na certeza de 98% que, apesar de os parâmetros popula- cionais serem desconhecidos, a altura n1édia dos homens da cidade e1n questão é superior a 1, 71 m e inferior a 1, 73 m. 234 Estatística básica Exercícios resolvidos 1. De uma população nom1al com d2 = 16, levantou-se uma amostra, obtendo-se as obser- vações: 1 O, 5, l O, 7. Dete1minar ao nível de 13% u1n IC para a 1nédia da população. Resolução: Dados: n = 4 a = 13% x = .!_ (10+5+10+7)=> x =8 4 Za = Z43.5% = 1,51 87% :. P(8 - 1,51 · 2 < µ < 8 + 1,51 · 2) = 0,87 P(8 - 3,02 <µ < 8 + 3,02) = 0,87 P(4,98 <,u < 11,02) = 0,87 ou IC(µ, 87%) = (4,98; 11 ,02) • • • O'- = 2 X 2. Dada u1na população 1101mal co1n VAR(X) = 3, levantou-se u1na an1ostra de 4 ele- 4 mentas, tal que _L,\'.; = 0,8. Construir u1n IC para a verdadeira 1nédia populacionalµ ao nível de 1 %. Resolução: i=l 4 Dados: n = 4 0 2 = 3 _Lx;=0,8 a = 1% .". X= 0,8 = 0 2 4 ' Za = Z49,>% = 2,57 i=l (j fj cr- = J;, = =O 866 X 2 > n :. P(0,2 - 2,57 · 0,866 < µ < 0,2 + 2,57 · 0,866) = 0,99 :. P(-2,0256 < ,u < 2,4256) = 0,99 ou IC (µ , 99%) = (- 2,03; 2,43) Capitulo 11 - Intervalos de confiança para médias e proporções 235 3. A experiência con1 trabalhadores de u1na certa indústria indica que o te1npo neces- sário para que uiu trabalhador, aleatoriainente selecionado, realize uma tarefa é dis- tribuído de maneira aproximadamente normal, com desvio padrão de 12 minutos. Uma amostra de 25 trabalhadores forneceu :X = 140 1nin. Determinar os limites de confiança de 95% para a 1nédia,u da população de todos os trabalhadores que fazen1 aquele detenninado serviço. Resolução: Dados: n = 25 a= 12 :X = 140 a = 5% a 12 a - = r= - =2 4 .r '\/n 5 ' Z" = Z47,5% = l, 96 P(l40 - 1,96 · 2 ,4 < µ < 140 + 1,96 · 2,4) = 0,95 P(l35,296 <µ < 144,704) = 0,95 • • • IC(µ, 95%) = (135,3; 144,7) Concluhnos que a duração 1nédia da tarefa para os operários da e1npresa varia de 135,3 min. a 144, 7 1nin., isso com uma confiança de 95%. O erro de estin1ação é: e = 1,96 · 2,4 = 4,7 1nin. 4 . E1u u1n.a lin11a de produção de certa peça mecânica, colheu-se uma amostra de 100 itens, constatando-se que 4 peças eran1 defeituosas. Construir o IC para a proporçã.o "p" das peças defeituosas ao nível de 10%. J~ e solução: Dados: n = 100 x = nº de peças defeituosas na amostra x = 4 a = 10% :. A 4 A Po = lOO = 0,04 ; q0 = 0,96 Ztt = Z 4s% = 1,64 • • • a . :::. p o, 04. o, 96 =o o 196 100 ' P(0,04 - 1,64 · 0,0196 :s; p :s; 0,04 + 1,64 · 0,0196) = 0,90 P(0,00786 < p < 0,07214) = 0,90 P(0,790/o <p < 7,214%) = 0,90 ou IC(p, 90%) = [0,78%; 7,214%) 5. En1 u1na pesquisa de opinião, entre 600 pessoas pesquisadas, 240 responderam "sim" a deter1n i.nada pergunta. Estin1ar a porcentagern de pessoas co1n essa m.esma opinião na população, dando un1 intervalo de 95% de confiabilidade. Resolução: Dados: n = 600 x = nQ de pessoas que respondera1n sim x = 240 a = 5% 236 Estatística básica .. ~ = 240 =o 4 .. Po 600 ' e q0 =0,6 • • • a. -P 0,4·0,6 =o 02 600 ' Z a = Z47,5% = 1,96 • • • P(0,4 - 1 ,96 · 0,02 < p s 0,4 + 1,96 · 0,02) = 0,95 P(0,3608 s p < 0,4392) = 0,95 ou P(36,08% s p < 43,92%) = 0,95 ou ainda JC (p, 95%) = [36,08%, 43,92%] E1n relação à população pode1nos afirmar que a proporção de pessoasque res- ponderiam "siin" varia de 36,08% (111ínirno) a 43,92% (máxi1110), com 95o/o de confiabilidade. 6. U1na votação realizada entre 400 eleitores, escolhidos ao acaso entre todos aqueles de um determinado distrito, indicou que 55% deles são a favor do candidato A. De- tenninar os li1nites de confiança de 99% para a proporção de todos os eleitores do distrito favoráveis ao candidato A. Resolução: Dados: n = 400 p 0 = 0,55 :. q 0 = 0,45 a = 1 % (J . = 0,55. 0,45 =o 0249 p 400 , Z a = Z49.5% = 2,57 • • • • • • P(0,55 - 2,57 · 0,249 < p < 0,55 + 2,57 · 0,0249) = 0,99 P(0,55 - 0,064 < p < 0,55 + 0,064 ) = 0,99 P(48,6 o/o sp < 61 ,4%) = 0,99 ou IC (p, 99%) = [48,6%, 61 ,4%] Se o número de eleitores desse distrito fosse de 230.000 pessoas, qual seria a votação esperada pelo candidato A? 48,58% de 230.000 = 111 .734 votos 61 ,42% de 230.000 =141.266 votos O candidato A poderia esperar de um mínimo de 111 .734 votos a un1 1náximo de 141.266 votos, isso co1n 99% de confiabilidade. 7. Uina an1ostra aleatória de 80 notas de maten1ática de uma população com distribui- ção nor1nal de 5.000 notas apresenta média de 5,5 e desvio padrão de 1,25. a) Quais os limites de confiança de 95% para a média das 5.000 notas? b) Co1n que grau de confiança diría1nos que a 1nédia das notas é 1naior que 5,0 e 1nenor que 6,0? Dados: 1V = 5.000 n = 80 x = 5 5 s = 1 25 ' ' Capítulo 11 - Intervalos de confiança para médias e proporções 237 Co1no a população é nonnal, finita e a an1ostra é suficientemente grande, ten1os: s ª-::: .J,i X N - n 1,25 N-l - J8õ 5.000 -80 :::.a_ =O 1386 5.000-1 X ' n Resolução: a) Za = Z 47,S% = l,96 :. P(5,5-1 ,96 · 0,1386 <µ < 5,5 + 1,96 · 0,1386) = 0,95% :. P(5,2283 < µ < 5,7717) = 0,95 . • • P(5,23 <µ < 5,77) = 0,95 ou IC(µ, 95%) = (5,23; 5,77) Poden1os afirmar que a verdadeira média populacional estará entre 5,23 e 5,77 com 95% de confiança ou certeza: A média das 5.000 notas terá 1 entre 5,23 e 5,77, co1n 95% de confiança ou certeza. b) P(5,0 <µ < 6,0) = 1- a :. sendo x = 5,5 e ª -x = 0,1386, e sendo os li1nitesµ , = x - z,. · ax ten1os que 5,0 = 5,5 -Za · 0,1386 6,0 = 5,5 + Zu · 0, 1386 z,. =3,61 z., = 3,61 pela tabela da normal padronizada, P(O < z., < 3,6 J) = 0,499841. Logo, (1-a) = 2 · 0,499841 {l - a)%= 99,97%. • • • Logo, o grau de confiabilidade que 5,0 <µ < 6,0 é de 99,97o/o. Exercícios propostos 1. De uma população norinal X com variância 121, retiramos uma a1nostra de 25 ob- servações, obtendo x = 45. Ao nível de 2%, fazer um IC para a verdadeira 1nédia da população X. Respostas 238 Estatística básica 2. Levanta-se uma amostra de 1 O observações de u1na população normal com variância 10 160, obtendo-se L .Y:; = 2.300. Determinar os IC para a média fl aos níveis de 20% i=I e 10%. 3. U1na loja te1n os valores de suas vendas diárias distribuídos nonnaln1ente com des- vio padrão de R$ 530,00. O gerente da loja, quando inquerido pelo dono, afirmou vender e1n média R$ 34. 720,00. Posteriorn1ente levantou-se tuna an1ostra das vendas de determinado dia, obtendo-se os valores em reais (R$): 33.840,00; 32.960,00; 41.811,00; 35.080,00; 35.060,00; 32.947 ,00; 32.120,00; 32.740,00; 33 .580,00 e 33 .002,00. a) Construir u1n IC para a venda 1nédia diária ao nível de 5%. b) Construir um IC para a venda .m.éd ia diária ao nível de 1%. c) En1 qual dos dois níveis de significância pode1nos afinnar que o gerente se baseia para responder à indagação? 4. U1n fabricante sabe que a vida útil das lâmpadas que fabrica tem distribuição aproxi- 111adan1ente normal co111 desvio padrão de 200 horas. Para estirnar a vida 1nédia das lâ1npadas, tomou urna an1ostra de 400 delas, obtendo vida média de 1.000 horas. a) Construir um IC paraµ ao nível de 1 %. b) Qual o valor do erro de estimação cometido em "a"? c) Qual o tamanho da a1nostra necessária para se obter um en·o de 5 horas, com 99% de probabilidade de acerto? 5. Que ta1nanho de amostra seria necessário retirar de uma população nonnal X co1n a = 12, a fin1 de esti1nar a duração n1édia de urna tarefa em n1inutos, co1n u1n erro de, no 1náxin10, 2 min. e com probabilidade de 95% de estar correto? 6. A ÍJ1gestão de um medicainento adormece o paciente. O tempo decorrido entre a in- gestão do medicamento e o adonnecimento em nlinutos é distribuído norn1almente co1n a= 10 min. Urna a1nostra de 25 pacientes submetidos ao tratamento com o ,. _ ) ren1édio é formada. Observou-se que l: x; = l .375min. Construir em IC para fl , i - 1 con1 limitesµ, e /'-2 (µ , < µ 2), de fon11a que seja observada a seguinte especificação: à desconfiança que1t seja nle11or queµ,, atribuiren1os o nível de 5%, enquru1to à descon- fiança que ,u > µ 2, atribuire1nos o nível de 10%. Obs.: IC co1n limites assiinétricos. 7. Querendo estimar a proporção de defeitos de u1na certa produção, exan1inou-se uma a1nostra de 100 itens, encontrando-se 30 defeituosos. Detenninar o IC pru·a a propor- ção p da população ao nível de 5%. 8. U1na organização universitária deseja estitnar a porcentagem de estudantes que são favoráveis a uma nova constituição do corpo discente. Ela seleciona uma atnostra de 200 estudantes, aleatoria1nente, e constata que 120 são favoráveis a esta nova constituição. Respostas Capitulo 11 - Intervalos de confiança para médias e proporções 239 a) Fazer um IC para p, a verdadeira porcentage1n com estudantes favoráveis, na população ao nível de 2%. b) Qual o erro de estimação contido em "a"? c) Qual deverá ser o ta1nanho da a1nostra para se ter un1 erro de no máxi1no 5o/o, com probabilidade de 98% de estar certo? 9. Querendo estimar a proporção de defeitos de u1na linha de produção de uma peça, exa1nh1ou-se uma a1nostra de 100 peças, encontrando-se 30 defeituosas. Sabe-se que o estimador p0 para esse ta1nanho de amostra te1n desvio padrão de 3%. Encontrar os limites de confiança de 95% para p e o respectivo erro de estimação. 1 O.U1na a1nostra de 10.000 itens de uma produção foi inspecionada e o número de defeitos por peça fo i registrado na tabela abaixo: Número de defeitos o 1 2 3 4 Frequência absoluta 6.000 3.200 600 150 50 a) Chamando de p a proporção de itens defeituosos nessa produção, determinar os limites de confiança de 98% de p. b) Qual o etTO de estiJnação co1netido e1n a? 11. Querendo se estimar a tnédia de uma população X com distribuição nonnal, levan- tou-se uma amostra de 100 observações, obtendo-se x = 30 e s = 4. Ao nivel de 90%, determinar o limite de confiança para a verdadeira média da população. 12. U1n pesquisador deseja estabelecer o peso 1nédio dos jovens entre 14 e 20 anos. Ape- sar de desconhecer a média e o desvio padrão populacional, sabe por literatura da área que a distribuição dos pesos é aproxi1nadamente norn1al. Retira-se uma a1nostra casual simples de 60 jovens obtendo peso médio de 67 kg e desvio padrão de 9 kg. a) Ao nível de 5% de significância, estabelecer um IC para o peso médio populacional. b) Qual o tamanho da a1nostra que o pesquisador deveria to1nar para ter uma proba- bilidade de 95% de certeza de co1neter um erro de, no máximo, 1,5 kg? Respostas R 12.1 Testes de hipóteses para médias e proporções lntroducão I Suponhamos que un1a certa distribuição dependa de um parân1etro () e que não se conheça() ou, então, haja razões para acreditar que o() variou, seja pelo passar do tempo ou, então, pela introdução de novas técnicas na produção, por exen1plo. A inferêncja estatística fornece un1 processo de análise denon1inado teste de hipó- teses, que pennite se decidir por u1n valor do parâmetro() ou por sua modificação com urn grau de risco conhecido. Forn1ulan1os duas hipóteses básicas: Ho: hipótese nula ou da existência. H,: hipótese alternativa. Testamos hipóteses para to1narmos uma decisão entre duas alternativas. Por essa razão, o teste de hipótese é u1n processo de decisão estatística. Veja1nos algunsexen1plos de hipóteses: • os chips da n1arca A têm vida média /t =µ o; • o nível de inteligência de um.a população de universitários éµ = µ o; • o equipa1nento A produz peças corn variabilidade menor que a do equipamento B: a"2 < ae2; • o aço produzido pelo processo A é mais duro que o aço produzido pelo processo B: µ" > µ,1. Podernos, pois, apresentar as hipóteses genéricas que engloban1 a n1aioria dos casos: Ho: () =()o 1. H, : () > ()o Para testes bilaterais. Capitulo 12 - Testes de hipóteses para médias e proporções 241 ,., .) . Ho: () =Oo H1: () <Oo Para testes unilaterais à direita. Para testes unilaterais à esquerda. Para testes aplicados a valores do parân1etro obtidos após a deci- são tomada ern um dos três testes anteriores. O procedi1nento padrão para a realização de um teste de hipóteses é o que se segue: • definem-se as hipóteses do teste: nula e alternativa; • fixa-se urn nível de significância a; ~ • levanta-se un1a an1ostra de tamanho n e calcula-se uma estin1ativa Oo do parâ- metro O; • usa-se para cada tipo de teste uma variável cuja distribuição an1ostral do esti- mador do parâmetro seja a mais concentrada ern torno do verdadeiro valor do ~ parametro; • calcula-se co1n o valor do parârnetro Oo, dado por fio, o valor crítico, valor obser- vado na amostra ou valor calculado (V.a1.); • fixa1n-se duas regiões: u1na de não rejeição de Ho (RNR) e uma de rejeição de Ho ou critica (RC) para o valor calculado, ao nível de risco dado; • se o valor observado ( v.;,,,.) E região de não rejeição, a decisão é a de não rejeitar Ho; • se V..1c E região crítica, a decisão é a de rejeitar Ho. Devemos observar que quando se fixa a, determinamos para os testes bilaterais, por exen1plo, valores críticos (tabelados), V,,, tais que: P(IV..,,. I <V,, ) = 1-a ~ RNR P(I Vc",. I> V,,)= a ~ RC 12.2 Testes de hipóteses para a média de populações normais com variâncias (a2) conhecidas .Fare.mos a explicação do teste usando os passos definidos no procedimento, por meio de un1 exemplo. 242 Estatística básica Testes bilaterais De u1na população nonnal com variância 36, ton1a-se uma amostra casual de ta1na- nh.o 16, obtendo-se x = 43. Ao nível de 10%, testar as hipóteses: H 0 :µ =45 fl,: µ:;é 45 As hipóteses já estão definidas. O nível a de significância é de 10% :. a= 10%. A a1nostra é de tan1anho 16, n = 16, e a estin1ativa de média já fo i calculada, isto é, X= 43. Con10 o teste é para 111édia de populações normais co1n variâncias conhecidas, usa- rernos a variável Z: N (O, 1) co1no critério. a2 = 36 x = 43 n = 16 Z= x-µHo a x :. sendo µ110 = 45, ternos :. z .. ,.= 43-45 = -1,33 1,5 • • • a .< = 1,5 Z,.1c = - 1,33 Co1no o teste é bilateral e a = l 0%, a região de nã.o rejeição, RNR, é: P(IZl < Z,,)=l - a ~ P( I Z l < l ,64)=0,90 Z" = Zs% = 1,64. E a região de rejeição (RC) é dada por P( 1Z1:?: Za) = a~ P(I Z 1:?: 1,64) = 0, 10. Co1no Z co1c = - 1,33, temos que Z,,,,. E RNR RC • • • -164 ' RNR deH0 90% 1,64 5% z Logo, a decisão é não rejeitarmos Ho, isto é, a 111édia é 45, corn 10% de risco de não rejeitar1nos uma hipótese fa lsa. Poderíamos fazer o teste de hipóteses usando IC, co.mo se segue: RNR -+ p ( .u Ho - za . a X < X < µ Ho + za . a X) = 1 - a ou P(Xi <x<x2 )=1-a Capitulo 12 - Testes de hipóteses para médias e proporções 243 x, = 45 - 1 64 . l 5 = 42 54 ' ' ' :X2 = 45 + 1,64 · 1,5 = 47,46 RNR = (42,54; 47,46) RC = (-oo; 42,54] U [47,46; +oo) Como x = 43, x E RNR. Não se rejeita Ho ta1nbén1. Teste unilateral (monocaudal) à esquerda EXEMPLO Urna fábrica anuncia que o índice de nicotina dos cigarros da rnarca X apresenta- se abaixo de 26 n1g por cigarro. Um laboratório realiza 1 O análises do índ ice obtendo: 26, 24, 23,22, 28, 25, 27, 26, 28,24. Sabe-se que o índice de nicotina dos cigarros da marca X se distribui nonnalmente com variância 5,36 1JJg2 • Pode-se aceitar a afinnação do fabricante, ao nível de 5%? Resolução: H 0 :µ=26 H 1:,u < 26 n = l O a = 5% X=.!_ ~ X = 253 .".X= 25,3 n i=I t } o z = 25,3 - 26 =-0 959 cale O 73 ' ' Za = Zso/; = 1,64 Z.," = -0,959 RNR = (- 1,64; +oo) RC = (-oo; - 1,64] .". Z colc E RNR 244 Estatística básica RC 5% - 1,64 RNR 95% Zwe z Não se rejeita Ho, isto é, ao nível de 5%, poden1os concluir que a afi1mação do fabricante é falsa. Resolução por intervalos de confiança: RNR -7 P(x >µ,, - Z ·a- ) = l - a - ' O <1 Jt • • • P(x > 26 - 1,64 · 0,73) = 0,95 RNR -7 P(x > 24,803) = 0,95 RC -7 P(x < 24,803) = O, 1 O. Como :. x = 25,3, concluírnos que x E RNR :. Não se rejeita Ho. RC 5% Teste unilateral à direita EXEMPLO - 1,64 - X RNR 95% - X U1n fabricante de lajotas de cerâmica introduz un1 novo material en1 sua fabrica- ção e acredita que aurnentará a resistência n1édia, que é de 206 kg. A resistência das lajotas te1n distribuição nonnal com desvio padrão de 12 kg. Retira-se uma amostra de 30 lajotas, obtendo x = 210 kg. Ao nível de 10%, pode o fabricante aceitar que a resistência média de suas lajotas tenha aumentado? Resolução: H 0 :µ =206 Ht:µ > 206 a= 10% n = 30 ()' 12 ()'x = ~ = J3õ X= 210 • Capitulo 12 - Testes de hipóteses para médias e proporções 245 :. ª r = 2,19 Zª = Zior. = 1,28 z = 210-206 = 1827 cale 2,J 9 ' RNR 90% RC 10% 1,28 z ""' z Co1no Z"'Jç > Z", rejeita-se fio, isto é, ao nível de 10%, o fabricante pode concluir que a resistência média de suas lajotas aumentou. Outro inétodo: RNR ~ P ( x < µ 110 + Z,, · ar ) = 1 - a RC ~ P( x > µ 110 + Z,, · ª x- ) = l - a RNR ~ P( ,"\; < 206 - 1,28 · 2, 19) = 0,90 RNR ~ P( X < 208,8) = 0,90 RC ~ P(x ~ 208,8) = 0,1 0 RNR 90% RC - 208,8 X X Co1no x = 210,00 E RC, rejeita-se H0 a 10%. 12.3 Testes de hipóteses para proporções Procedimento Ho:p= Po 1. Fixa1n-se as hipóteses H 1: P ;é Po,P > Po, P < Po 2. Fixa-se o nível a. "' .. \': 3. Retira-se uma amostra de tamanho n e define-se x: nQ de sucesso, calculando p0 = - · n 246 Estatística básica . PH .qH 4. Determina-se com p dados por Ho, ai> = 0 · 0 n ~ p -p 5. Define-se co1no variável critério: Z = 0 110 ª;, 6. Definem-se as regiões RNR e RC da mesrna forn1a anterior e, co1n o 1nesmo proce- din1ento, rejeita-se ou não Ho. EXEMPLO Sabe-se por experiência que 5% da produção de um determinado artigo é defei- tuosa. U1n novo e111pregado é contratado. Ele produz 600 peças do artigo co1n 82 defeituosas. Ao nível de 15%, verificar se o novo eJnpregado produz peças com maior índice de defeitos que o existente. Resolução: H~:p =0,05 H 1:p > 0,05 (J. = I' 0,05. 0,95 =o 0089 600 , z = 0,137-0,05 cale O, 0089 Za = Z1s% = 1,03 • • • n= 600 x=82 ~ 82 P = =0137 o 600 ' Zcaic = 9,775 RNR RC 85% 15% 1,03 z Co1no z".k > Z,,, z •• k E 'RC, rejeita-se Ho, isto é, COITI 15% de risco, pode1nos levan- tar sérias dúvidas quanto à habi lidade do novo en1pregado na fabricaçã.o do artigo, sendo sua proporção de defeitos superior à dos den1ais. Outro processo: RNR ~P(p 0 <p 11 0 +Z a ·a ;, )=l-a Capitulo 12- Testes de hipóteses para médias e proporções 247 RNR ~ P(p 0 < 0,05 + 1,03 · 0,0089) = 0,85 P(p 0 < 0,0592) = 0,85 RC ~ P(p0 > 0,0592) = O, 15 fJ0 =0,137 :. p0 E [0,0592; +oo) :. p0 E RC Rejeita-se Ho. Exercícios resolvidos RNR 85% 0,0592 RC 15% ~ ~ p Po 1. Urna fábrica de autornóveis anuncia que seus carros consotnem, e1n média, 11 litros por l 00 k1n, con1 desvio padrão de 0,8 litro. Un1a revista decide testar essa afirma- ção e analisa 35 carros dessa 1narca, obtendo 11,4 litros por 100 kn1, con10 consumo 1nédio. Admitindo que o consumo tenha distribuição normal, ao nível de l 0%, o que a rev i.sta co.ncluirá sobre o anúncio da fábrica? Resolução: H0 :µ = 11 H I: ,u :;: 11 RC X =11 4 ' n=35 - 1 64 ' RNR 90% a 0,8 0 (Jx ;;;;; .fn;;;;; J35;;;;; ,133 z= 11, 4 - 11 = 3 008 cale O 133 ' ' Za = Zs% = 1,64 RC 1,64 z 248 Estatística básica Con10 Zc.dc e RC, rejeita-se Ho, isto é, ao nível de 10% a revista pode concluir que o anúncio não é verdadeiro. Outra solução: RNR ~ P(,u1-10 -zª · ax <x <µNo +Za · a-x )=l-a • • • P(l I - 1,64 . 0,133 < X < 11 + 1,64. 0,133) = 0,90 :. P(l0,782 <X < 11 ,218) = 0,90 :. RNR = (I0,782; ll ,218) RC~P(x::;; 10,782ou x;::; ll ,218)=0, l • • • RC = (-oo; 10,782] U [11 ,218; =) RC 10,782 RNR 90% 11 Como :X = 11,4 e RC, rejeita-se .Ho. RC 5% 2. A altura dos adultos de u1na certa cidade tem distribuição normal co1n 111édia de 164 c1n e desvio padrão de 5,82 cm. Deseja-se saber se as condições sociais desfavorá- veis vigentes na pat1e pobre dessa cidade causan1 um retardamento no crescimento dessa população. Para isso, levantou-se lnna amostra de 144 adultos dessa parte da cidade, obtendo-se a média de 162 cm. Pode esse resultado indicar que os adultos residentes na área são e1n 1nédia mais baixos que os demais habitantes da cidade ao nível de 5%? Resolução: H 0 :µ =164 H I:µ < 164 n = 144 X = 162 a = 5,82 a- = a = 5,82 = 5,82 =O 485 X .Jn Jl44 12 > z = 162-164 - -2 =-4124 ca1c O, 485 O, 485 ' Za= Zso;,= l,64 Capitulo 12 - Testes de hipóteses para médias e proporções 249 RC t - 1,64 z,.,, RNR 95% z Con10 Z,.1c < Za, rejeita-se Ho, isto é, poden1os ad1nitir que as condições sociais desfa- voráveis provocam u1n retardamento no crescimento da população da parte estudada ao nível de 5%. Outra solução: RNR -7 P( X >µ/lo - Za . ª x) - 1 - a • • • • • • P(x > 164 - 1,64 · 0,485) = 0,95 P(x > 163,205) = 0,95 -7 RNR = (163,205; +oo) RC = (-00; 163,205] Co1no x = 162, x E RC :. , rejeita-se Ho. 3. E1n u1na experiência sobre percepção extrassensorial (PES), um ind ivíduo A, ern uma sala isolada, é solicitado a declarar a cor vennelha ou preta (e1n n(nneros iguais) de ca11as tiradas ao acaso de um baralho de 50 cartas, por outro indivíduo B, posicio- nado e1n outra sala. Se A identifica correta1nente 32 cartas, esse resultado é significa- tivo ao nível de 5o/o para indicar que A tern PES? Resolução: H 0 : p = 0,5 A não te1n PES H,: p > 0,5 A te1n PES x: nún1ero de cartas declaradas na cor certa por A. x=32 n= 50 ~ = 32 =O 64 Po 50 ' a.= ,, ~ lt> • q Ho n 0 • 5 . 0 • 5 =o 0707 50 ' 250 Estatística básica z = 0,64-0,5 = p0 - p 110 cale o 0707 a. ' ,, z,.1c = 1,9802 Z" = Z s% = J ,64 RNR RC 95% 1,64 :. como Z c"1c E RC, rejeita-se Ho , isto é, podernos concluir que A tem PES. Outra solução: RNR -t P(p0 < Puo + Zª ·aµ)= 1- a RC -t P(p0 > p 110 + Zª . aí,) = a RNR P(f;0 < 0,5 + 1,64 · 0,0707) = 0,95 P(f;0 < 0,6159) = 0,95 RNR = (-oo; 6 1,59%) RC = [61,59%, +oo) RNR 95% RC 5% A 0,5 0,6159 A Po p Con10 p0 = 0,64, p0 E RC :. p0 E [61,59% , +oo) :. rejeita-se .Ho . 4. U1n candidato a deputado estadual afirma que terá 60% dos votos dos eleitores de u1na cidade. U1n instituto de pesquisa colhe u1na a1nostra de 300 eleitores dessa cidade, encontrando 160 que votarão no candidato. Esse resultado inostra que a afinnação do candidato é verdadeira, ao nível de 5o/o? Capitulo 12-Testes de hipóteses para médias e proporções 251 Resolução 1: H 0 : P =O, 60 O candidato tem 60% dos votos. H,: P ~ O, 60 O candidato não tem 60% dos votos. n = 300 x = 160 A = 160 =o 53 Po 300 ' a. = 0,60. 0,40 =O 0283 " 300 ' 2 = f;0 -p11(J = o,53-0,60 =-2 474 cale a. o, 0283 ' " a = 5% ~ Z = Z2-., = l 96 a: .~ ." ' RNR RC deH 0 RC 95% Zcalc - 1,96 1,96 z Co1no Zco1c e RC, rejeita-se Ho , isto é, podernos aceitar que a afirrnação do candi- dato é fa lsa, a 5% de risco. Resolução 2: RNR ~ p (PH. - za. a.< Po < P1-1 + Za . a.)= 1-a p o " P (0,6 - 1,96 · 0,0283 < Po < o,6 + 1,96 · 0,0283) = o,95 P (0,5445 < Po < o,6555) = o,95 RNR = (54,45%; 65,55%) • • • RC = (-oo; 54,45%] U [65,55%; +oo) RC RNR 90% RC 5% A A 0,5445 Po 0,6 0,6655 p Co1no p0 = 0,5333 e p0 e RC, rejeita-se Ho . 252 Estatística básica 5. A vida tnédia de un1a a1nostra de 100 lâmpadas produzidas por un1a firn1a foi cal- culada em 1.570 horas, co1n desvio padrão de 120 horas. Sabe-se que a duração das lâ1npadas dessa firma tem distribuição norn1aJ com média de 1.600 horas. Ao nível de 1%, testar se houve alteração na duração 1nédia das lâmpadas. Resolução: H 0 :µ =1.600 H 1 : µ # 1 . 600 n = 100 X = 1.570 s = 120 A variância populacional é desconhecida, porén1 a a1nostra é grande, o que permite usar a distribuição nonnal co1n s2, estimador não viciado de a2• s 120 :. a, = .[;;, = Jiõõ = 12 :. ª-x = 12 Z =x-µ Ho =l.570-1.600 cale ax 12 Zoa1o = -2,5 a = lo/o :. Zª = Zo.s% = 2,57 RC RNR 99% - 2,57 tz cale RC 2,57 z Con10 Zcalé E RNR, não se rejeita Ho, isto é, nã.o é significativa a alteração da vida 111édia das lâmpadas a 1 %. Este resultado levanta o seguinte proble1na: co1no proceder quando o Zc,.1. = Z,,: rejei- tar ou não rejeitar? Deve1nos refazer o teste, aun1enta11do o número de ele1nentos da a1nostra, ou diminuit1do o nível do teste. Quando não é possível fazer o procedimento acilna, é meU1or decidir pela rejeição de Ho, como veremos no próxi1no capítulo, sobre erros de decisão. No caso, se o nível fosse 5%, Z,, = Zz.s-"' = 1,96, H0 seria rejeitada, isto significando que haveria alteração na duração 1nédia das lâmpadas. Resolveremos o exercício pelo segundo modo, usando a = 5%. RNR ~ p (µ 110 -za. ª-x < X <µNo+ za. ª -x ) = 1-a .'. p (J .600 - 1,96 · 12 < X < J .600 + 1,96 · 12) = 0,95 RNR ~ P( 1.576,48 < X < 1.623,52) = 0,95 Capitulo 12 - Testes de hipóteses para médias e proporções 253 RC --7 P( X < 1.576,48 ou X > 1.623,52) = 0,05 Como x = 1.570, x E RC : . rejeita-se Ho . Exercícios propostos 1. Testar H 0 :µ=50 .H1:µ >50 Dados: a2 = 4 a = 5% n = 100 e X = 52 2 . Testar H 0 :µ =36 H 1:µ <36 Dados: a2 = 9 n = 64 a = 1% e X = 34,7 3. A duração em horas de trabalho de 5 tratores fo i 9.420, 8.200, 9.810, 9.290 e 7.030 horas. Sabe-se que a duração dos tratores dessa 1narca é nor1nal com desvio padrão de 55 horas. Ao nível de 3%, testar: H 0 :µ =8.700 b) H 1:µ>8.700 4. Os indivíduos de um país apresentan1 altura n1édia de 170 cn1 e desvio padrão de 5 c1n. A altura ten1 distribuição normal. Un1a amostra de 40 indivíduos apresentou 1uédia de J 67 cm. Podemos afirmar, ao nível de 5o/o, que essa arnostra é formada por indivíduos daquele país? 5. Lança-se utna moeda 100 vezes e observa-se que ocorre.1n 40 caras. Baseado nesse resu ltado, podemos afirmar, ao nível de 5%, que a 1noeda não é honesta? 6. O salário dos e1npregados das indústrias siderúrgicas tem distribuição nonnal, co1n n1édia de 4,5 salários 1níni1nos, com desvio padrão de 0,5 salário 1níni1no. U1na in- dústria e1nprega 49 e1npregados, corn urn salário tnédio de 4,3 s. 1n. Ao nível de 5%, pode1nos afirmar que essa indústria paga salários inferiores à média? 7. U.1n exame padrão de inteligência tem sido usado por vários anos com média de 80 pontos e desvio padrão de 7 pontos. U n1 grupo de 25 estudantes é ensinado, dando-se ênfase à resolução de testes. Se esse grupo obtem rnédia de 83 pontos no exa1ne, há razões para se acreditar que a ênfase dada mudou o resu ltado do teste ao nível de 10%? 8. Um fabricante de droga 1nedicinal afirma que ela é 90% eficaz na cura de uma aler- gia, e1n detern1inado período. En1 uma amostra de 200 pacientes, a droga curou 150 pessoas. Testar ao nível de 1 % se a pretensão do fabricante é legítima. Respostas 254 Estatística básica 9. U1n 1netalúrgico decide testar a pureza de un1 certo 1netal, que supõe ser constituí- do exclusivamente de 1nanganês. Adota para isso o critério da verificação do ponto de fusão. Experiências anteriores mostraram que esse ponto de fusão se distribuía nonnalmente com média de 1.260° e desvio padrão de 2º. O metalúrgico realizou4 experiências, obtendo 1.267°, 1.269°, 1.26.l 0 e l .263º. Poderá ele aceitar que o metal é puro ao nível de 5%? l O. U1n comprador de blocos de ci1nento acredita que a qualidade dos produtos da mar- ca A esteja se deteriorando. Sabe-se, por experiência passada, que a força média de es1nagamento desses blocos era de 400 libras, co1n desvio padrão de 20 libras. Uma amostra de 100 blocos da marca A forneceu um.a força média de esrnagamento de 390 libras (supor distribuição norn1al). Testar ao nível de 2,5%, supondo que a qua- lidade n1édia dos blocos tenha diminuído. 11.A tensão de ruptura de cabos fabricados por un1a en1presa apresenta distribuição nor- n1al, con1 média de 1.800 kg e desvio padrão de 100 kg. Mediante u1na nova técnica de produção, proclamou-se que a tensão de ruptura teria aumentado. Para testar essa declaração, ensaiou-se uma arnostra de 50 cabos, obtendo-se con10 tensão 1nédia de ruptura 1.850 kg. Pode-se aceitar a proclan1ação ao nível de 5%? 12. U111 fabricante de correntes sabe, por experiência própria, que a resistência à ruptura dessas correntes tem distribuição nor1nal com 1nédia de 15,9 libras e desvio padrão de 2,4 libras. Uma modificação no processo de produção é introduzida. Levanta-se então uma a1nostra de 16 correntes fabricadas com o novo processo, obtendo-se resistência 1nédia de ruptura de 15 libras. Pode esse resultado significar que a resis- tência 1nédia à ruptura di1ninuiu ao nível de 5o/o? Resolver o n1es1no problema para u1na a1nostra de 64 correntes e 1nes1na n1édia an1ostral. Respostas Erros de decisão Pode1nos cometer um en·o de decisão quando feito o teste de hipótese: 1. Rejeitamos urna hipótese aula verdadeira: é o denorninado erro de 1ª espécie ou do tipo I. 2. Não rejeitamos un1a fio falsa: é o cha1nado erro de 2.il espécie ou erro do tipo II. Resumindo: Ho Verdadeira Falsa Decisão Não rejeitar Não há erro Erro do tipo li Rejeitar Erro do tipo 1 Não há erro Só podemos con1eter o erro do tipo 1 quando rejeitamos Ho, e o erro do tipo II quan- do não rejeitamos Ho. 13.1 Probabilidade de cometer os erros dos tipos 1 e li Consideremos apenas testes bilaterais para o paJâmetro µ da população nor1nal com variância conhecida, isto é: Ho:µ =µo H 1:µ ;é µo e a2 conhecida. Probabilidade de se cometer o erro do tipo 1: P(I) Co1neteremos o erro de 1 ª espécie quando rejeitarmos Ho, ou seja, quando levantar- mos tuna amostra e o x cair na RC do teste, isto é: 256 Estatística básica Se µo é verdadeiro, concluín1os que P(I) = P( x E RC) = a :. RC P(I) = a RNR (1 -a)% RC a/2% - X Probabilidade de se cometer um erro do tipo li: P(ll) = {3 Feito o teste, não rejeita111os l-10 : ,u = µo con10 verdadeiro. Posterionnente, e por can1inhos independentes do teste, verifica-se que Ho é falsa. Cometemos, então, u1n erro de 2ª espécie. Só pode1nos 1uedir a probabilidade desse erro se especificar1nos como é H1: µ = µ 1 (hipótese sin1ples). Te1nos, ao nível a, as hipóteses: Ho:µ =µo H,:µ = µ t (falso) (verdadeiro) RNR (l - a) Não rejeita1nos H0 quando x E ( x1, x2 ) - X Co1no a verdadeira média éµ =,u i, a distribu ição co1n a médiaµo é fictícia. Ten1os então: -X Logo, a probabilidade de cometennos o en·o do tipo II é a probabilidade de x E ( x1, x2 ) , porém, com x se distribuindo co1n a médiaµ, , verdadeira. Capítulo 13 - Erros de decisão 257 13.2 Função poder de um teste ou potência de um teste Sob as condições já colocadas, definimos função poder de u1n teste ou junção po- tência de u1n teste: R----.. [a , 1) e tal que P(µ1) = l -/3 ou ainda A função poder de utn teste fornece a probabilidade de se rejeitar u1na hipótese nula falsa. Graficamente: • • • - X A função poder depende da variávelµ, definida e1n R e dos parân1etros ,uo, a e n (fixados e1n cada problen1a). Exemplos 1. De uma população norn1al, levantou-se uma an1ostra e calculou-se ao nível de 1 % que z(t · a_, = 5. Admitindo as hipóteses: H 0 : µ =100 H1 : µ 1 = 11 O Calcular a probabilidade de cometerrn.os u1n erro do tipo ll, isto é, de não rejeitarrnos Ho, sendo H, verdadeira. Resolução: Não rejeita1nos Ho quando x E (95, l 05). Co1nete1nos erro de 2ª espécie quando não rejeitamos Ho: µ = 100, sendo verdadeira H, : µ = 11 O. 258 Estatística básica 95 100 105 110 • • • f3 = P{95s; - ~s; 105 1,u = 110} Zª = Z0•5% = 2, 57 5 a ~ = = 1 945 ·' 2,57 , z = 95-110 = -7 71 95 1,945 , f3 =P(-7,71s:Zs: -2,57)= z = 105-110 = -2 57 105 l 945 , , = 0,5-P(-2,57 s; Z s; O)= 0,5-0,494915 f3 = O, 005085 f3 = 0,51% Con10 a função poder de u1n teste é P(µ,) = 1 - /3 -7 P(µ,) = 0,994915 ou P(µ1) = 99,49% . Logo, o teste é altame11te poderoso, pois a probabilidade de se rejeitar uma hipótese nula falsa é altíssima, 99,49%. 2. Calcular P(f) ou P(ff) confor1ne o caso, no seguinte proble1na. De un1a população nor- n1al, levantou-se uma a1nostra de tamanho 16, obtendo-se x = 18. Sabendo-se que a variância da população é 64, analisar ao nível de 10% as hipóteses (usar teste bilateral): H1:µ = 25 Resolução: Za ' (J x = 2 · }, 64 = 3, 28 RNR = (,tt HO + za ·a_,, ) :. RNR = (16,72; 23,28) x=18 • • • .X E RNR -7 não se rej eita H0 RC RNR 90% 16,72 20 - X Capítulo 13 - Erros de decisão 259 23,28 -X :. A probabilidade de con1etermos o en·o do tipo I é zero, pois não rejeitamos Ho (só acontece o erro quando rejeitamos H0). Por outro lado, a probabilidade de co1neten11os o erro de 2ª espécie, de não rejeitar- 1nos fio fa lsa, será considerar J-11: ~t = 25 verdadeira, isto é: f3 = P(l6,72 < X < 23,281µ = 25). 16,72 20 23,28 X /3 16,72 23,28 25 z =16,72-25 = -414 16,72 2 ' Z = 23,28 - 25 = -O 86 23.28 2 ' :. f3 = P(-4, 14 < z < - 0,86) = P(-4,14 < z < O)-P(-0,86 < z <O) = = 0,5 - 0,305106 f3 = o, 194894 - X A probabilidade de não rejeitarn1os u1na Ho falsa é pequena. 3. De uma população norrnal com a = 100, tira1nos uma amostra de n = 100 observa- ções, obtendo-se 1.016,4 para limite crítico (num teste monocaudal à direita). Ao nível de 5%, determinar a função poder de um teste, sendo: 260 Estatística básica Resolução: H0 :µ =1 .000 H 1:,u =1 .018 1.000 1.018 1.016,4 :. f3=P(x< 1.016,4/µ = 1.018) X z-i - 1.016,4-1.018 (J_ µHo + Za · (Jx = l.016,4 .< z = 1.016,4-1.018= -016 1 10 ' 1.000 + 1,64. ª"" = 1.016,4 1,64ax = 16,4 ª -x = 10 f3 = P(z ~ -0, 16) = 0,5 - 0,063595 = 0,436405 /3 = 0,436405 :. 43,64o/o P(µ i) = 1 - /3 = 1 - 0,436405 :. P(µ i) = 0,563595 O poder do teste é 56,36% :. o teste éji·aco, isto é, a probabilidade de rejeitar tuna hipótese falsa é pequena. Estudo do comportamento da função poder de um teste Faren1os o estudo da função poder de utn teste quandoµ ,, ,uo, a e n variatn indi- vidualn1ente, fixados os outros. µ1 varia, fixosµo, a e 11 H0 :µ =100 HI: µ :;it 100 n=36 a = 10% a 2 = 400 Capítulo 13 - Erros de decisão 261 Za = Zs% = 1,64 ª-= ~ =J4º0 =3 333 X \} --;; 36 ' Za · a x = 1,64 · 3,333 = 5,467 Consideraremos Ho fa lsa e calcularemos a função poder P(µ,) paraµ, , variando de 80 al50, de5em 5. a) H 0 :µ =100 H 1:µ 1 =80 f3 = P(94,533 < X < 105,467/µ = 80) z = 94,533-80 = 4 36 94.533 3 333 ' ' z = 105,467-80 = 7 64 105.467 3 333 ' • • • ' f3 = .P(4,36<Z<7,64) f3 = 0,000006123 80 94,533 100 105,467 P(µ ,) = 1 - /3 = 1 - 0,000006 123 P(u1) = 0,99993787:: 0,9999 - X Não apresentaremos os cálculos para os de1nais casos, son1ente os resultados finais: b) H ,: fti = 85 -7 P(µi) - 0,99788 d) f/,: ,ll1 = 95 -7 P(µ,) = 0,55485 f) H ,: µ,=105-7P(µ1) =0,55485 h) H ,: ,tt1 = 115 -7 P(µ,) = 0,99788 Fazendo o gráfico, temos: c) e) g) i) H1:,u1= 90 -7P(µ ,)-0,91466 H1:,u1= 100-7P(µ ,) = 0,1 (a) H ,:,u, = 11 0 -7 P(u,) = 0,9 1466 H,: µ, = 120 -7 P(µ,) = 0,9999 262 Estatística básica 1 0,9999 0,99788 0,91460 0,91466 - - -- - .! . - -- - - ! . - -- - . .! . - -- - .!. -- - - - -· - - -- - - - ·- - - -- - -'- - -- - - -·- - - -- - -·- - - - - - - · . . . . ' . ' . . +- ~- -.. --... -.. -. -. --... -. -.. -... -. -. --..... -. -.. ,. --. -.. ,,. -;;· ·--· --. -. -. . --... --- .... ---- .... --- ---·- ---- --.-- -- ······'·····-.1 .... . J •••••• J •••••• .J ••••••• • •••••••••• ...................... . ' . . . . . ' . . ---- -~------~--- - --~- ---- - -- ---- ~ ---- - -~------ · 0,55486 .... . .•........ .. --. .- . ... ---- -- -.- ----- ---- .. , .. -- -.. ,,. .. --- . ,.. --- . -· a 0,1 -··- -··-··· -· ·-· ·· -··· -······-··- - --- --_,_ . -----·-------· ---- --· ------· 80 85 90 95 100 105 110 115 120 µ, Conclusão: Quanto mais distante estiver ,u 1 de µ o, 111aior o poder do teste para rejeitctr Ho: ,u = ,uo e inversa111ente. Podemos e laborar o gráfico da função poder, e1n função deµ ., confor1ne figura a • seguir. 1 ------------------------------------------ -,------- -----------------------------------• a ······················------·····-··"'·· ...... ..;..... ~ - "°-········ ·· · ··· ···· --- ··· · ·············· µ o varia, fixos a e n Fazendo-se todos os cálcu los necessários para P(µ1), fa ren1os o gráfico consi- derando dois valores µó eµ~ de µo. Capítulo 13- Erros de decisão 263 ---------------------------r-- ------------------ . 1 --------------~-~"""-----------+----:::..- ~"""----------------! µ'~ Mantida a sua fon11a original, a curva desloca-se no mesn10 sentido do desloca- n1ento. Assim, para u1n certo valor µ1 , P' {µ 1) > P"(µ 1), se ~l i estiver mais distante deu' do queµ" ' o o. a varia, fixosµo, e 11. Tabela de P(µ1) para valores de a e µ 1: ~ 80 85 90 95 100 10% 0,99999 0,99788 0,91466 0,55485 0,1000 5% 0,99997 0,99446 0,85083 0,32303 0,05000 1% 0,99970 0,97320 0,66640 O, 14233 0,01000 Os valores para 105, 110, 115 e 120 são os de 95, 90, 85 e 80, respectivan1ente. De posse desses dados, pode111os obter o gráfico, que apresentru11os de fo1ma genérica. P(µ1) 1 ············-······-·········-·············-,··············································a = 10% • 1 · a2= 5% ª2 ................................ ...... . • • a 3 ------------------- ------------- - - --- ------ : - - - -- - - - -- - -- -------- - - ------ - - - ------ -- - - - - a 3= 1% 264 Estatística básica Conclusão: Quanto maior o nosso nível de descorifiança a, maior será a probabilidade de rejeitarmos Hofalsa, isto é, maior é a potência do teste. n varia, fixos µo, a Fazendo-se n variai; de /1 = 1, 4, 9, 16, 25, 36 e 64, e considerando-se os valores dados para ,u ,, fixo µ o = 100 e a = 1 Oo/o, terernos un1 gráfico como se segue: 1 --- ------ ------------------------------------ ,------ ----------------------- ----- ------- ----• • a ............................................. . ............................................ . n = 64 n = 36 n = 9 n=4 n=l Veremos que, para un1 detenninado valor deµ ,, P,, 1 (µ,) > P112(µ 1) se 111 > 112. Conclusão: Quanto maior for o ta111anho da atnostra, 1nais representativa será, e, portanto, maior será o JJoder do teste, isto é, niaior será a probabilidade de rejeitarmos Hof'also. ou Quanto rnaior o tan1anho da a1nostrc1, 1naior o poder do teste. O gráfico da função poder de utn teste, com as alternativas Ho e H, e o gráfico de f3 e1n função de ,u, para o exempo analisado, é: l ............................. . a i--- l r--··:.;.::································ Curva característica / de operação (e. c. o) Jl Capítulo 13 - Erros de decisão 265 Exercícios propostos 1. Detennine para a = l 0%, n = 3 5 e a = 1 O os valores de ,'t que levariatn a rejeitar Ho: µ = 50 (usar teste biJateral). Calcule /3 se H1: µ = 53. 2. Afinna-se que 50% das pessoas tên1 2 resfriados por ano. Decidi1nos rejeitar essa afirmação se, entre 400 pessoas, 216 ou mais tiverern 2 resfriados por ano. Qual a probabilidade de cometer un1 erro de tipo l? 3. U1n quhnico deseja testar a dureza de certo 111aterial, cotnposto de chumbo, usando o critério de ponto de fusão. Obté1n 322 ºC, 328 ºC, 326 ºC e 320 ºC. Entretanto, o químico não possui o ponto de fusão do chun1bo, 1nas, quando verifica esse índice, a distribuição é normal co1n variância 4. O quín1ico estabelece, ao nível de 10% de risco, o teste: Ho: µ = 325 (n1etal puro) H1:µ =f. 325 (1n etal não puro) a) Que resultado obté1n o quhnico no teste? b) O químico sabe que pode estar aceitando un1a fio tàlsa e por isso resolve e laborar os gráficos deP(µ1) ef3. Como serão eles? 4 . Posteriormente, o quín1ico verifica que o ponto de fusão do chumbo é 327,4 ºC. Se o quín1ico realizasse 100 testes, com 100 amostras do mesmo tan1anho, em quantos aceitaria que o metal é puro? 5. No problema do fabricante de correntes (problen1a 12 dos Exercícios propostos do Capítu lo 12), qual a probabilidade de que esteja co1netendo un1 erro do: a) Tipo I? b) Tipo II? Respostas Distribuição de t de student IC e TH para a média de população normal com variância desconhecida 14.1 Distribuicão de t de student • - A variável Z = x - µ tem distribuição normal. Quando não conhecen1os a variân- a, eia a2, devemos usar s2, estin1ador de a2• e A variável definida con10 t<P = x - µ é denominada variável co1n distribuição de Sr 't de Student' com <P graus de liberdade. Quando n é grande, s2 se aproxima bastante de a2, o que faz con1 que a variável t se aproxime da variável nor1nal Z. -x - µ Quando n é pequeno, isso não ocorre. não é normal, pois sfi é u1na variável Sr x-µ aleatória, o que não ocorre con1 , em que o deno1ninador é constante. Graus de liberdade x -µ Reto1nando: t<P = --'---. S-x ª-X O nú1nero de infor1nações independentes da amostra dá o número de graus de li- berdade <P da distribuição de t. Generica1nente, podemos dizer que o nún1ero de graus de liberdade é igual ao nú- 1nero de infonnações independentes da amostra (n) 1nenos o número (K) de parâmetros da população a serem estin1ados alé1n do parârnetro inerente ao estudo. Capftulo 14 - Distribuiç.ão de t de s1udent IC e TH para a média de população normal com variância desconhecida 267 <f>=n - K Co1no van1os esti1nar a 1nédia de tuna população nor1nal con1 a2 desconhecida, alén1 de x, estimador inerente ao estudo, estimaremos a2, um parâmetro a mais. Isso significa que usare1nos a t co1n n - l graus de liberdade. Para cada valor de</>, temos uma curva diferente de "t'', e quando n ~ oo, t ~ N (O, 1 ). Apresentamos urn gráfico comparativo entre a distribuição te a Z. µ Ve1nos que a distribuição t é 1nais alongada que a normal reduzida. Quanto 1naior o</>, 1nais elevada é a curva. A curva de t é si1nétrica co1n relação à n1édiaµ = O. Uso da tabela A tabela que se encontra na página 347 dá o valor de ta, tal que: Exemplos 1. </>= 15 a=5% t=O t P(t > t1,) =a P(t > ta) = 0,05 o l,7531 t la= ltfi,a% = ! 15,5% = 1, 7531 268 Estatística básica 2. </> = 20 a =2,5% P(t < - ta) = 0,025 - 2,086 o t(l = !20; 2,5% = 2, o 860 3. </> = 25 P(t > - t(l) = 0,99 0,99 -t a t ta = t 2s:1% = 2,4851 4. P(lt i>t(l ) = 0,10 <f> = l8 90% -t a o '" t la = l1s;S% = 1,7341 14.2 IC e TH para a médiaµ de uma população normal com a2 desconhecida O procedimento padrão tanto para IC (intervalos de confiança) con10 para TH (tes- tes de hipóteses) é o mesn10 usado anteriormente. 1. Retira1nos uma amostra de n elen1entos da população. • Se n > 30, usa-se a distribuição normal co111 s2• • Se n $; 30, usa-se a distribuição t de Student, com</> = n - l graus de liberdade. 1 Jl 2. Calculamos x = - LX; n i=I Capftulo 14 - Distribuiç.ão de t de s1udent IC e TH para a média de população normal com variância desconhecida 269 n 2 ,, "" X; 1 n 2 1 ~ 3. Calculamos s1 = 2: (-"I:; - :X) = 2: x;2 - _ ; -_i __ n -1 i=l n -1 ;=i n 1 ou s1 = -- n -1 11 2:x?-nx1 i=I 4. Deter1n inamos padrão eep ). 5. Ao nível a%, fazemos: 5 .1. P( x- la · sx < µ < x + ta · s_, ) = 1 - a 5.2. Ho:µ =µo H 1:,u :;é µ 0 ,µ > µ 0 ,,u < µ 0 (Jr (estin1ador do erro x-µ Com o la, deter1n ina1nos a RNR e RC. Calculamos !caie = H,, Sx • Se l ca1e E RNR -7 não se rejeita Ho. • Se l ca1c E RC -7 rejeita-se Ho. Obs.: Quando a população é normal co1n parâmetros descorthecidos, teoricamente a solução J\T(O, 1) só é aconselhável quando n > 120. Na prática, para n > 30 usa-se a N(O, 1 ). Exemplos de aplicação 1. De uma população norn1al co1n parân1etros desconhecidos, retirou-se u1na an1ostra de 25 elementos para se estimarµ, obtendo-se x = 15 e s2 = 3 6. Determinar un1 I C para a média ao nível de 5%. Resolução: </> = n - 1 = 25 - 1 = 24 /24; 2,s% = 2,0639 P(l 5 - 2,0639 · 1,2 <µ < 15 + 2,0639 · 1,2) = 0,95 270 Estatística básica 95% - t " '"' t P(15 - 2,477 <µ < 15 + 2,477) = 0,95 P(l2,523 <µ < 17,477) = 0,95 2. A vida nlédia das lâtnpadas elétricas produzidas por u1na en1presa era de l .120 ho- ras. U1na amostra de 8 lâmpadas extraída recenten1ente apresentou a vida média de 1.070 horas, co1n desvio padrão de 125h e distribuição norn1al para a vida útil. Testar a hipótese de que a vida média das lâmpadas não se alterou ao nível de 1 %. Resolução J: H0:µ =1120 H.,: µ ~ 1120 RC -3,4995 t (l = t1;0,5% = 3,4995 125 S-x = J8 =44,1945 <P = 7 t. =l .070-1.120=-1131 cale 44 194 ' RNR 99% o RC 3,4995 ' t Con10 lca1c E RNR, não se rejeita Ho, isto é, não é significativa a alteração na vida n1édia das lâtnpadas ao nível de lo/o. Resolução 2: RNR ~ P(l.120- 3,4995 . 44,194 < X < 1.120 + 3,4995 . 44,194) = 0,99 RNR ~ P(965,343 < X < 1.274,657) = 0,99 l~C = (-oo; 965,343) u [1.274,657 +oo) :. x = 1.070 :. x E RNR ~ i1ão se rejeita Ho . 3. Seja X uma variável aleatória normal com parân1etros desconhecidos. Dessa popula- ção foi retirada tuna an1ostrax;: 10, 12, 14, 15, 9, 12, 16, 11, 8, 13. Construir u1na IC paraµ ao nível de 5%. Capitulo 14 - Distribuição de t de student IC e TH para a média de população normal com variância desconhecida 271 Resolução: 10 10 n=lO 2:x, = 120 2: X;2 = 1.500 i=I i=I 2: x; 120 X= = =12 n 10 1 s2 =- 1.500- (120)2 10 9 s = 2 582 ' 95% - t ,, 60 =-= 6 667 9 , S- = w = X \j-;; cp =9 6,667 =O 817 10 ' ta = f9; 2.5% = 2,2622 P( x - ta · S-x < µ < x + fu · S-x ) = 1 - a P( 12 - 2,2622 · 0,817 < µ < 12 + 2,2622 · 0,817) = 0,95 P(l0,1 52 <µ < 13,848) = 0,95 4. Querendo detenn inar o peso méd io de nicotina dos cigarros de sua produção, um fabricante recolheu tuna an1ostra de 25 cigarros, obtendo 25 25 2: x; = 950 mg e 2:x? = 36.106 ing2 i=I i =I Resolução: Supondo a distribuição normal para o peso de nicotina, construir um IC paraµ ao nível de 5%. Ao mesmo nível, testar se o peso 1nédio de nicotina é inferior a 40 mg. n=25 l sz = - 24 36.106- (95º) 2 25 _ O, 5 _ O, 5 _ O l Sr: - .J25 - 5 - , . X= 950 =38 25 =0,25 • • • s = .Jo,25 = o,5 cp =24 la= /24; 2,5% = 2,0639 272 Estatística básica IC P(38-2,0639 · 0, l <µ < 38 + 2,0639 · 0, 1) = 0,95 p (37,793 < µ < 38,206) = 0,95 TH - Solução 1: H0 :µ =40 H1:µ <40 38-40 tcalc = 0,1 !cale =-20 RC 5% RNR 95% -1,7109 o !cale Cotno tca1c < la, rejeita-se H0, isto é, a 5% é significativo que o peso da nicotina apresente-se abaixo de 40 mg. TH-Solução 2: RNR --7 P( X > µHo - la · Sr-) P(x > 40-1 ,7109 · 0,1) = 0,95 P( X > 39,829) = 0,95 Co1no x = 38, x E RC. RNR = (39,829 + oo) RC = (-oo; 39,829] :. rejeita-se fio . 5. Un1a 1náquina é projetada para fazer esferas de aço de 1 cm de raio. U1na a1nostra de 10 esferas é produzida e ten1 o raio médio de 1,004 cm, com s = 0,003. l-Iá razões para suspeitar que a rnáquina esteja produzindo esferas corn raio 1naior que l cm, ao nível de 10%? Resolução l: X= 1,004 s =0,003 n=lO S- = S = O, 003 = 0 0009 " ~ Jlõ' t = 1, 004 - 1 = 4 44 cale O, 0009 ' </> = 9 'ª = / 9;10% = 1,383 Capitulo 14 - Distribuiçao de t de student IC e TH para a média de População normal com variância desconhecida 273 RNR 90% 1,383 RC t Como fcaic E RC, rejeita-se Ho. :. há razões para se suspeitar que a máquina esteja fazendo esferas con1 raio médio maior que 1 c1n, a 10% de risco. Resolução2:RNR~P(x < µH 0 + ta · s-x ) = 1-a P( :X < l + 1,383 · 0,0009) = 0,90 P(x < 1,01245) = 0,90 RNR = (-oo, 1,01245) RC = [l ,01241, +oo) .X = l ,004 :. e RC. :. rejeita-se Ho . Exercícios propostos 1 1. Dado que x = 20, s = 24 e n = 16, con1 X normaln1ente distribuída, determinar os limites de confiança de 95% para a média. 2. Construir um IC de 90% para a média de un1a população nor1nal con1 variância desconhecida, sabendo-se que uma an1ostra de 26 observações fornece x = 15,6 e s2 = 2,58. 3. Supondo que a média e o desvio padrão das notas de um teste de habilitação para uma a1nostra de 20 estudantes de uma classe de 100 fossem x = 150 e s = 20, calcu- lar os limites de confiança paraµ ao nível de 95%. Obs.: Usar fator de correção para populações finitas. 4. Uma a1nostra constituída de 12 medidas de tensão de ruptura de u1n fio de algodão apresentou média de 7,38 kg e desvio padrão de 1,24 kg. Determinar os limites de confiança de 95% e 99% para a n1édia da população. 5. Foi testada uma amostra de 15 cigarros de urna certa marca, com relação ao 11ível de nicotina, dando x = 22 n1g e s = 4 nig. Determinar os liin ites de confiança para a inédia, ao nível de 98%. 6. U1n certo tipo de hormônio, ao ser injetado en1 galinhas, autnenta o peso 1nédio do ovo em 0,3 g. Uma arnostra de 30 ovos ten1 média 0,4 g aci1na da média anterior à injeção e s = 0,30. Há razões suficientes para aceitar a afinnação de que o aumento da média é superior a 0,3 g ao nível de 5%? Respostas 27 4 Estatística básica 7. U1na nláquina de misturar fertilizantes é adaptada para fornecer 10 g de nitrato para cada 100 g de fe1tilizante. Dez porções de 100 g são exa1ninadas, cotn as seguintes porcentagens de nitrato: 9, 12, 11, 10, 11, 9, li, 12, 9, 10. Há razões para crer que a porcentagem de 11 itrato não é 10%, ao 11 ível de l Oo/o? 8. Registrara1n-se os valores 0,28; 0,30; 0,27; 0,33; e 0,31 segundos, obtidos em 5 me- dições do tempo de reação de u1n indivíduo a ce1to estí1nulo (distribuição normal). Determinar os limites de confiança de 99% para o tempo médio de reação da popu- lação ao estimulo. 9. De uma população normal de parâmetros desconhecidos, retiramos u1na an1ostra de 16 elen1e11tos, obtendo-se x = 12 e s = 4, ao nível de 2%. Testar as hipóteses: J-10 :µ =10 Ht:µ:;élO 1 O. Un1 certo tipo de rato apresenta, nos três prin1eiros 1neses de vida, u1n ganl10 médio de peso de 58 g. Uma an1ostra de 1 O ratos foi alitnentada desde o nascitnento até a idade de 3 1neses co1n uma ração especial, e o ganho de peso de cada rato foi: 55, 58, 60, 62, 65 , 67, 54, 64, 62 e 68. 1-Iá razões para crer, ao nível de 5%, que a ração especial au1nenta o peso nos 3 pri1neiros 1neses de vida? 14.3 Resumo: IC e TH paraµ 1 . X: 1\T(?' a2) · x· N ? . . . . ' n - - x-µ P(x-zª ·ax <µ < x +zª ·ax)=l-a; Z carc = a- 2. X: J.l(?, ?) - 1~ n~x =-L.Jxi n Para n < 30: 1 , s-=-- n-1 s s - =~ X ;ç -µ !cale = ' com </> = n -1. S_;; n x Respostas Capftulo 14 - Distribuiç.ão de t de s1udent IC e TH para a média de população normal com variância desconhecida 275 3. X: N(?, ?) n>30 • • • -x-µ zcalc = -- S_;; 1 11 X= - l:xi n ;=1 Exercícios propostos 2 1. Testar: Ho = lOO ao nível de 5% co1n n = 64 , x = 98,6 e s2 = 2,56. H, <100 2 . De un1a população normal, levantaram-se os seguintes dados: Classes 111 11- 3 1 3 l- 5 5 5 l-7 13 71-9 14 9 l-11 10 11 1- 13 5 13 l-15 2 a) Ao nível de 5%, deter1ninar um IC, para a 1nédia da população. b) Testar ao nível de 5% as hipóteses: Ho: µ = 7 H,: µ:;é 7 3. U1na 1náquina automática que e1npacota o alin1ento A é progran1ada para colocar100 g de peso. Para verificar a precisão da 111áquina, uma amostra de 60 pacotes do referido ali1nento fornece peso médio de 98 g e desvio padrão de 6 g. O que se pode concluir ao nível de l %? Respostas 276 Estatística básica 4. Para estimar o peso 1nédio de sacas de café, levantou-se uma amostra prévia de ta- n1anho 100, obtendo-se x = 60 kg e s = 0,5 kg. Detern1inar o tan1anho da amostra necessário para estimar o peso médio das sacas, con1 uma aproxin1ação que dê erro 1náxi1no de 100 g e probabilidade de 99,7% de ace11o. 5. De un1a população norn1al, retira1nos u1na an1ostra de 36 ele1nentos: 40, 1 45 39, 1 43,9 45,8 44,2 45,2 41,2 40,7 43,1 44,1 42,6 42,9 45,8 43,4 45,5 44,8 42,3 42, 1 44,4 43,7 43 9 ' 42,6 45,5 43,6 42,8 4" " .) ,.> 45,7 Deter1ninar um IC para a rnédia de 95% de co11fiabilidade. Ao nível de 5%, testar: H0 =42 H, >42 37,4 40,6 40,4 41 ,5 44,7 41,8 41 ,9 45,2 6. Utn conjunto de 50 animais é alimentado con1 certa espécie de ração por utn pe- ríodo de 2 semanas. O aumento de peso foi de 42 kg e desvio padrão de 5 kg. a) Enco11tre os limites de 95% de confiança paraµ. b) De que tamanho deveria ser tomada u1na amostra, se desejásse1nos que x dife- risse deµ por Vi kg com a probabilidade de 0,95 de estar certo? 7. De uma população norn1al cuja variância é desconhecida, extraiu-se u111a a1nostra casual obtendo-se os seguintes valores: 86 138 101 92 116 106 105 85 118 118 118 90 112 97 116 88 81 93 108 83 89 114 127 102 a) Construir um IC paraµ ao nível de 1 %. b) Ao nível de 5%, testar: H0:µ = 105 H I:µ <105 92 115 105 90 85 99 90 91 94 117 99 94 Respostas Comparação de duas médias: TH para a diferença de duas médias Analisaremos os vários casos de cornparações de médias de duas populações nor- mais. Em geral, faremos testes sobre a diferença entre duas médias populacionais: Ho: µ , - µ 2 = µ,,, sendo na rnaioria dos casosµ" = O, o que significa que estaremos testando a igualdade entre as n1édias: Ho:µ1 = µ2 Consideraremos dois casos na comparação das tnédias: dados emparelhados (popu- lações correlacionadas) e dados não ernparelhados (populações não correlacionadas). 15.1 Dados emparelhados Fazemos testes de co1nparação de rnédias para dados etnparelhados quando os re- sultados das duas a1nostras são relacionados dois a dois, de acordo con1 algu1n critério que fon1ece uma influência entre os vários pares e sobre os valores de cada par. Para cada par definido, o valor da prin1eira an1ostra está claran1ente associado ao respectivo valor da segunda arnostra. Para exemplificar, to1nare1nos um grupo de pessoas que fizeran1 detern1inada dieta por uma semana. Medi1uos o peso no início e no final da dieta. As pessoas estão clara- mente determinadas. A identidade de cada urna tem influência nos valores observados de seu peso, porém essa influência deve ser aproxi1nadarnente igual dentro de cada par de va lores do tipo "antes" e "depois". Ao tomarmos a diferença entre vários pares de valores e trabalhannos corn elas, a influên- cia individual de cada pessoa deverá desaparecer, ficando apenas a influência da dieta. Calculam.os as diferenças para cada par de valores, produzindo dados de uma amos- tra de n diferenças. Ho:µ, - µ 2 = µt1 =O H1: µ" > O ou µ" < O ou µt1 >é O 278 Estatística básica - d: 1nédia da an1ostra das diferenças µd: valor das diferenças entre médias das populações a ser testado s": desvio padrão da an1ostra das diferenças n: tamanho da arnostra das diferenças Usan1os: - d - µ / d s, t = ' , on e s J = [- . s- v n " EXEMPLO Un1 grupo de l O pessoas é submetido a urn tipo de dieta por l O dias, estando o peso antes do início (x;) e no final da dieta (y;) nlarcados na tabela abaixo. Ao nível de 5%, podemos concluir que houve diminuição do peso médio pela apl icação da dieta? Ho: ftc1 =O H,: ,u" >O Seja d; = x; - y;, i = 1, ... , 1 O. Pessoa X; y; A 120 116 B 104 102 e 93 90 D 87 83 E 85 86 F 98 97 G 102 98 H 106 108 1 88 82 J 90 85 - 1 li d =-Ldi n ,·- 1 - Pessoa (/; til A 4 16 B 2 4 e " .) 9 D 4 16 E - 1 1 F l l G 4 16 H -2 4 1 6 36 J 5 25 r 26 128 Capitulo 15 - Cornparação de duas médias: TH para a diferença de duas médias 279 • • • - 26 d = - =2 6 10 ' li 1 li Ldi 2 "" d ? i=I LI·; .. ---- n - 1 i = t n l 128- (26)2 9 10 s~ = 6,71-?sc1 = 2,59 2 59 s- = jw =O 82 ti 1 o ' 2,6-0 !cale = = 3,17 0,82 </> = 9 ta = 19.5% = 1,833 RNR 95% RC 5% l ,833 t t t .. -alc :. co1.no fcaic > t(l, rejeita-se H0, isto é, a 95% de confiabilidade, conclui1nos que é significativa a queda de peso pelo uso da dieta no grupo. • 15.2 Dados não emparelhados Se os dados não são e1nparelhados, não calcularemos diferenças entre os valores de duas amostras . O teste será baseado na diferença entre as duas 1nédias das runostras. Populações normais com variâncias conhecidas Apresentare1nos alguns resultados para aplicar os testes. Teorema Se X1 e X2 são populações com distribuições normais independentes com médiasµ , e ,u2 e desvios padrão 0'1 e <12, então a variável x" = x1 - x 2 possuirá també1n distribuição 11or1nal com 1nédiaµ, -µ2 e desvio padrão ~ª-x, + ª-x,. 280 Estatística básica • Se X1: N(µ,, ar) --7 a1nostra de tamanho: n1. • X2: N(µ 2, a ~ ) --7 an1ostra de tamanho: n1. Te1nos que ª-x" (J a = 2 ·'2 /;1" n, - Se as populações não são normais e n, e n2 são grandes (maiores que 30), então x, e x2 poden1 ser adrnitidos co1no normahnente distribuídos :. 0 2 0 2 1 2 µ -µ -+- ' 2 ' n, n2 Generica1nente, faren1os as hipóteses: Ho:µ , -µ 2 =µ o H,:µ , -µ 2 ;é µ 0 ou µ 1-µ 2 > µ 0 ouµ, -µ 2 < µ 0 Se µ o = O, testaremos A variável a ser usada é Z, co1110 se segue: Se há igualdade de variâncias, teremos aí= ai= a 2• O- =o· Xa l l (J - +- Quando as variâncias foretn desconhecidas e as a1nostras, grandes, usare1nos o.,. =o(_ - ) :::: .. ,, ·"1 - .{l Capitulo 15 - Comparação de duas médias: TH para a diferença de duas médias 281 onde sr e si são estin1ativas de aí e ai, feitas por ineio de arnostras de tarnanhos n1 e n2 e co1no variável critério Exemplos de aplicação 1. De duas populações nor1naisX, eX2 con1 variâncias 25, levantara1n-se duas amostras de ta1nanhos n1 = 9 e ni = 16, obtendo-se: Ao nível de 10%, testar as hipóteses: l ª população: X, : N(}t1 , 25)n1 = 9 - 27 - X = - ~X =3 t 9 1 Resolução: RC 32 x= - ~ 2 16 a - ~ I - ª -xd = 2,083 ª 2 ª 2 - + - =a· n1 112 Z - Xd - µf/O - 1-0 . Z 0 48 cale a- 2 083 . . cale = ' RNR 90% .\·ti ' RC 1 1 - +- 9 16 a = 10% ---'> Za = Zs% = 1,64 - 1 64 ' 1,64 z 282 Estatística básica Con10 Zcatc E RNR, não se rejeita Ho, isto é, ao nível de 10% não é significativa a diferença entre as médias das duas populações. Outra solução: P(O - l,64 · 2,083 < xd <O+ 1,64 · 2,083) = 1 - a RNR = (-3,4 16; 3,416) RC = (--oo;3,416] U [3,41 6;+oo) :. x" = 1 ~ x" E RNR ~não se rejeita H 0 • 2. Utn supennercado não sabe se deve comprar lâ1npadas da marca A ou B, de mesmo preço. Testa uma arnostra de 100 lâmpadas de cada uma das marcas, obtendo: XA = 1. J 60H e S;1 = 90h X11= 1.1401-I e sn = 80h Ao nível de 2,5%, testar a hipótese de que as nlarcas são iguahnente boas quanto contra a hipótese de que as da 1narca A são 1nelhores que as da 1narca B. Resolução: Ho:µ-1 - µB = O fft: µA - µB > 0 ou Ho: µA= ,uB Jii:µA > µB Con10 n, = n2 = l 00 lân1padas, podemos estiinar s,J e sl e usar 8.100 + 6.400 =12 0416 100 100 ' co111 a normal Z. Xd = X1 - X 2 = 1. 160 - 1.140 = 20h Z = Xd - µNO = 20- 0 cale S- 12 0416 ·"'(/ ' zcalc = l, 6609 RNR 97,5% o 1,96 zcak RC z Corno Zcatc < Za, não se rejeita Ho, isto é, não é significativa a diferença entre as vidas 1nédias das lâmpadas da 111arcaA ou marca B, ao nível de 2,5%. Capitulo 15 - Cornparação de duas médias: TH para a diferença deduas médias 283 Populações normais com variâncias desconhecidas e iguais (amostras pequenas) Se n1 + n2 < 30, então usaremos a distribuição t de Student. Co1no as variâncias são desconhecidas e consideradas iguais, cha1naremos de s o estimador: s2 s2 - +- =s. n, n2 Para determinannos s2, usaremos: , (n 1 -l ) s~+(n 2 -I)si , , . s· = , que e uma media n1 + n2 -2 arit1nética ponderada das variâncias an1ostrais si e s ~, sendo: ' 1 ., s·=-- 1 n 1 -1 1 s;=-- n2 -1 • • • e • ou S-,. = • d n1 + n2 -2 n1 +n2 -2 n -1 1 n - 1 2 1 1 - + - n, n2 284 Estatística básica Para teste bilateral, deter1nina1nos: RC l{NR RC (l - a)% <P = ni + n1 - 2 graus de liberdade. t Populações normais com variâncias desconhecidas e diferentes Caso as populações sejan1 nonnais e a ~ e ai seja1n desconhecidas e diferentes, então para n1 + ni < 30, tere1nos: S ,. = •'ó • • • co1n <P grau de liberdade, onde Exemplos de aplicação X µ e f = d HO cale 2 s2 s2 S- ·"(1 -'- + -1. n1 n2 <P = -'-----'--2 - 2 2 2 s2 s1 2 n1 n2 -'------'---- + -'----'-- n1 + l nz+l 1. Em u1na prova de estatística, 12 alunos de u1na classe conseguira1n média 7,8 e desvio padrão de 0,6, ao passo que 15 alunos de outra turm.a, do mesmo curso, con- seguira1n 1nédia 7,4 con1 desvio padrão de 0,8. Considerando distribuições normais para as notas, verificar se o prin1eiro grupo é superior ao segundo, ao nível de 5%. H'o:µ, -µ 2 =O-+µ,= µ 2 H,:µ, - ,ui >O~ µ1 > µ2 Con10 as populações são normais e com variâncias desconhecidas, pode1nos consi- derar que, apesar de desconhecidas, são iguais, já que são tunnas do n1es1no curso. Capitulo 15 - Cornparação de duas médias: TH para a diferença de duas médias 285 n1 = 12 x, = 7,8 S1 = 0,6 112 = 15 X1 = 7,4 S2 = 0,8 sí = 0,36 si= 0,64 X,1 = X1 - X2 = 7,8-7,4 x,, = 0,4 , (n 1 -l)s ~ +(n 2 -l) s ; (12-l)0,36+(15-1)0,64 ll·0,36+14·0,64 0 68 S - - - - - 51 - - - - , n1+n2 -2 12+15-2 25 s 2 =O 5168 ' Resolução 1: s_;,, = 0,0775..,,. s_, 4 = 0,278 xd -ft,, 0,4-0 t = o- --- cale s,d 0,278 tcalc = 1,439 la= l2s; 5% = l ,708 RNR 95% o 1,708 t.,.,. RC 5% t Como lcaic <l a ~ não se rejeita Ho. Concluúnos que a 5% não há 1notivos para consi- derar a primeira tur1na superior à segunda. Resolução 2: RNR..,,. P( x < µ 0 + taa xJ) = 0,95 P(x <O+ l, 708 · 0,278) = 0,95 RNR = (-oo; 0,478) RC = [0,478; +oo) Co1no x" = 0,4 ~ xtt E RNR, o que nos leva a não r~jeitar I-lo. 2. O QJ de 16 estudantes de u1na zona pobre de ce11a cidade apresenta a 1nédia de J 07 pontos com desvio padrão de 1 O pontos, enquanto os 14 estudantes de outra região rica da cidade apresenta1u média de 112 pontos com desvio padrão de 8 pontos. O QI em an1bas as regiões tem distribuição non11al. Há u1na diferença significativa entre os Qls 1nédios dos dois grupos a 5%? 286 Estatística básica H 0 :µ, - ,u 2 =O Ht:µ, -µ 2 ~O ou Ho:,u, = µ2 H,:µ,~µ2 Con10 esta1nos trabalhando com Ql de estudantes de duas regiões distintas da 1nesn1a cidade, podemos supor que sejam desconhecidas e diferentes. n,=16 x,=107 sr =lOO n2 = 14 x2 = 112 si = 64 . • • <P = 30 la = /30;2,5% = 2,042 Resolução 1: X-µ -5-0 f = d HO = --- 'cale S- 3, 2896 :r." RC -2,042 x,, = X1 - X2 = l 07 - 112 x = -5 d fcalc = -J ,52 RNR 95% o RC 2,042 t Con10 !caie E RNR, não se rejeita J-10, isto é, ao nível de So/o não é significativa a dife- rença entre os Qls das duas regiões da cidade. Resolução 2: P(O - 2,042 · 3,2896 < x" <O + 2,042 · 3,2896) = 0,95 Capitulo 15 - Cornparação de duas médias: TH para a diferença de duas médias 287 RNR=(- 6,7174; 6,7174) RC = (-oo;-6,7174) U [6,7174;+00) Con10 xd = -5 ~ x,1 E RNR ~ não se rejeita Ho. Exercícios propostos 1. Un1a turma de 1 O alunos é separada dos demais para ser testada. Aplica-se u1na prova de matemática e as notas são: 4,5; 5,0; 5,5; 6,0; 3,5; 4,0; 5,0; 6,5; 7,0; 8,0. U1n novo processo de aprendizagem de n1ate1nática é introduzido, e a tunna é en- sinada por esse novo 111étodo. No final, aplica-se uma prova de n1es1uo nível de dificuldades, e as notas obtidas pelos alunos, na ordem das primeiras, são, respecti- vamente: 5,0; 5,0; 6,0; 7,0; 3,0; 4,5; 4,0; 7,0; 7,5; 9,0. Há razões para crer que o novo processo au1nentou o nível de aprendizado da tunna en1 1natemática, a 5o/o? 2. Duas a1nostras de 1 O alunos de duas turn1as distintas de u1n n1esn10 curso apresentan1 os seguintes totais de pontos e1n provas de certa disciplina: Tum1ax,: 51 , 47, 75, 35, 72, 84, 45, 11, 52, 57. Tur1na x2: 27, 75, 49, 69, 73, 63, 79, 37, 84, 32. Ao nível de 10%, testar as hipóteses de que as tur1uas ten}1a1n aproveitainentos dife- rentes. Admitir populações norn1ais com 1nesn1a variância. 3. De duas populações normais, X, e X2, de 1nes1na variância, retira1n-se amostras e os dados são apresentados a seguir: População X,: n, = 6 2: -~, = 36,3 _L x,2 = 223,55 População .Xi: n2 = 9 Testar ao nível de 2,5% que a inédia da primeira população é inferior à média da segunda população. 4. Duas an1ostras de 1 O ele1nentos forneceran1 , respectivamente: x, = 29,5 sr = 5,24 X2 = 3 J,2 s? = 3 90 - ' Testar a hipótese de que a pri1neira a1nostra provenha de u1na população cuja 1nédia seja inferior à média da outra população, ao nível de 5%. Respostas 288 Estatística básica 5. As 111es1nas provas de estatística foram aplicadas para 2 turmas de adn1inistração de faculdades diferentes, pelo 1nesmo professor de atnbas. Na turma da faculdade A, os resultados foram: nA = 11 Na turma da faculdade B, os resultados foram: Testar ao nível de 1 Oo/o se os alunos da faculdade A são 1nelhores do que os alunos da faculdade B. 6. Un1a amostra de 150 lâmpadas da marca A apresentou vida média de 1.400 horas e o desvio padrão de 120 horas. Uma amostra de 200 lâmpadas da marca B apresen- tou vida 1nédia de 1.200 horas e desvio padrão de 80 horas. Ao nível de 10%, testar se as vidas médias das duas rnarcas são diferentes. 7. Urna pesquisa amostral entre 300 eleitores do distrito A e 200 eleitores do distrito B indicou que 56% e 48%, respectivamente, foram a favor de dete1minado candidato. Ao nível de 5%, testar a hipótese de haver diferença entre os distritos. Obs.: Testes de diferenças de duas proporções. 8. Dois conjuntos de 50 crianças de uma escola primária foram ensinados a ler por dois métodos diferentes. Após o ténnino do ano, u1n teste de leitura apresentou os seguin- tes resultados: X1 = 73,4 Xz = 70,J S1 = 8 Testar a hipótese de que µ1 "# µ 2, ao nível de 5%. 9. U1n teste de 200 adultos e 100 adolescentes n1ostrou que 60 adultos e 50 jovens eram 111otoristas descuidados. Usar estes dados para testar a afirn1ativa de que a porcenta- gen1 dos motoristas adolescentes descuidados seja 10% maior do que a dos adultos descuidados, ao nível de 10%. 1 O. Exa111inara1n-se 2 classes de 40 e 50 alunos de urn 1nesmo período de u111 curso. Na pri1neira, o grau médio foi de 7,4 com desvio padrão de 0,8. Na segunda, a média foi de 7,8, corn desvio padrão de 0,7. Há un1a diferença significativa entre os apro- veitrunentos das 2 classes ao nível de 5%? Respostas R Capitulo 15 - Cornparação de duas médias: TH para a diferença de duas médias 289 11. Dois tipos de co1nponentes elétricos são testados quanto à sua vida 1nédia. Os se- guintes dados foram observados: Tipo 1 Tipo II Ta1nanho da a1nostra 46 64 Média da a1nostra l .070h l.041h s1- 21,00 23,20 Há evidências de que a vida média dos dois tipos de componentes elétricos seja1n diferentes ao nível de 5%? l 2.E111 u1na amostra de 250 elementos, verifica111-se 24 sucessos, e e1n outra a1nostra de 100 verificam-se 15 sucessos. Podemos supor idênticas as probabilidades de sucesso nas duas populações ao nível de 5%? Respostas Distribuição de X 2 ( qui-quadrado), IC e TH para a variância de populações normais 16.1 Distribuição de X 2(qui-quadrado) Consideremos as variáveis aleatórias norn1ais Z;: N(O, 1 ), i = 1, 2, ... , n indepen- dentes. A função definida por: li x2 = _L zi2 í=I ? R" --2 ~R+ é cha1nada distribuição X- (qui-qi1a-X drado) co1n </> graus de liberdade. ? Con10 usa1nos n variáveis aleatórias independentes, x· está definido co1n </> = n graus de liberdade. Sejam x;: N(µ, a2) , i = l, 2, ... , n. X- tt Z = ' ' : 1V(O, 1) , a X~ =n = }: (~X ; -=_ µ )1 í= I O ? x2 D(Xº) = O < < +oo 1 1 • n , --x- , -- ) A função densidade do X 2 é: f ( x ·) = 211,2 r( n/2 ) e 2 (X" ) 2 Capítulo 16 - Dislribuição de x• (qui-quadrado), IC e TH para a variância de populações normais 291 Quando </> = 4 o Pode1nos resumir a distribuição X 2 no gráfico. 292 Estatística básica f Ci) 0=1 0=3 ---~ º= 10 0 =6 l!L::~ __ _..:::::::::==::::::;;::~~:.....::::::::.._ _x 2 o Observamos que o gráfico de X 2 depende de</>. De1nonstra-se que: x ~t\x = </> - 2. E(X 2 ) = </> VAR(X 2 ) = 2</> f(i) ll_ ___ _;_,!.._ _ _J_2_---=::=- x2 </>- 2 µ X,, Uso da tabela ? A tabela dá, fixado o nú1nero de graus de liberdade, o valor x;, no corpo da tabela, tal que: Exemplos l.<f> =4 2 2 P(X > Xa) = 0,25 Capítulo 16- Dislribuição de x• (qui-quadrado), IC e TH para a variância de populações normais 293 IL.._ _______ _L_ _ _::::::::.x2 x: x;, = X ~.aº/o = X!.2s% = 5,385 2. </> = 4 P(X 2 < X ~ ) = 0,75 X ~,= X!.25% = 5,385 , 3. </> = 20 Determinar P(X- < 11) P(X2 < l l) = 1 - P(X2 2 l l) = 2 = 1 - P(X > 10,851) = 1 - 0,95 P(X 2 < 11) = 0,05 2 .rr.x) 4 . Determinar x;,, tal que P(X 2 :::;; X~)= 0,025 IL.._ _ __L _______ __:::::::::.x2 x! A tabela não dá essa probabilidade :. P(X2 :::;; X ~ ) = 1 - P(X2 > x;,) 0,025 = 1 - P(X2 >X!) , , P(x- > x;,) = o,975 , , X ~= X 0 20;97,S% = 9,5908 294 Estatística básica Deterrninar P(X2 >X ~ )= 0,75 ll._~ _l._ 2 ~ __!_~ ~~~~ ---=:::=-x 2 Xa 10 6. P(X2 < X ~ ) = 0,1 O !<x2) 10% ll._~__J,l.._~~ ~~ ~~---=:::=-x2 x; 7. P(X 2 < X ~, )= 0,975 x! 8. P(X ~ < X2 <X ~ )= 0,80 ll..__L _____ L_____:::::::::_x2 X~ X ~ Interpolação para aºlo Detern1inar X ~, tal que P(X ~ . 10 > X ~ )= 0,40 ? x;, = x~ 2 :Js% = I J ,340 x;, = x ~ 290 % = 6,303 s • 2 2 xª = x,2:2.s% = 23,3367 2 2 X,= X,2,90% = 6,3038 x ~ = x ~ 2 . 1 ~~ = t 8,5493 Capítulo 16- Distribuição de;/ (qui-quadrado), IC e TH para a variância de populações normais 295 Por não termos esse valor tabelado, faremos interpolação, obtendo u111 resultado aproxiinado, satisfatório. Temos • • • P(X!= w;::: 9,342) = 0,50 P(X! . 10 > 12,549) = 0,25 50%-9,342 25% - 12,549 25%~3,207 1 5%~x ---7 X= J ,924 x;i = x. ~ 0 • 4 0 % = 9,342 + 1,924 ·x.2 = 11 266 (t , 50% IL._ ___ _;__,_--1-_;.__.......:::=.x2 9,342 12,549 8 11,266 Interpolação para </> Determinar P(X:=>• >X ~, )= 0,95 De1nonstra-seque (~2x ~ - .J2<1>-1):N(O, 1) • • • Za = Zso;, = 1,64 1 { }' 1 X 2 = - -1 64+.J2·31-l - = -· 37 283236 ª 2 ' 2 ' ? X-= 18 642 a ' 296 Estatística básica EXEMPLO </> = 50 Deter1ninar P(X: . 50 <X ~ ,)= 0,95 0,95 IL._ ~~~~~~~ J2 ~~....:::::==- x 2 Xa x; =_!._{ 1,64 +.J2 · so- 1}2 2 ? X-= 67 1629 a ' O resultado correto calculado diretamente é 67,5048. Aditividade do X2 ? Un1a in1portante propriedade da distribuição x· é sua aditividade. A son1a de duas variáveis independentes cotn distribuições X 2 con1 </>1 e </>2 graus de 1 iberdade é igual a uma . , variável tambétn com distribuição x· com </>1 + </>2 graus de liberdade. n Distribuição de L(X; -µ)2 i = 1 Consideremos n variáveis aleatórias norn1ais x;, independentes e todas co1n a mes- 1na médiaµ e a mes1na variância <J2• X;: N~ , <J2), i = 1, 2, .. ., n. li Veremos qual a distribuição de L (x; - µ )2 : i=l 11 L (X; - µ ) 2 = (x 1 - µ )2 + (x2 - µ )2 + ... +(x,, - µ )2 i= l Dividindo-se o segundo 1ne1nbro por cl e multiplicando-se por cl, ten1os: {-, ( _ ) 2 = ( ,\:1 - µ ) 2 ( X2 - µ ) 2 ( Xn - µ ) 2 • 2 L.J X; µ + + ... + <J ;=1 a <J a n ""' ( ) 2 - 2 { 2 2 2 } L.J xi - µ - <J z, + z2 + ... + Z11 i=I Capítulo 16- Distribuição de x• (qui-quadrado), IC e TH para a variância de populações normais 297 • • • ou li ""' ( )2 2 2 L.J ,r1 - µ =o . X.p=11 i=l _;-_1 ___ _ x2 02 - tp=11 16.2 IC e TH para a variância a2 de uma população normal com médiaµ conhecida Veja1nos inicialn1ente a esti1n.ação da variância a2 de u1na população nonna.1 con1 média conhecida. 1 li Retira-se uma amostra de ta1nanho n e calcula-se s 2 = - L ( x; - µ )2 • n i=I Sendo a média conhecida, esse resultado é mais preciso do que se usasse x . 0 2X2 =ns2 "'=11 Faremos agora o IC para a2 ao nível a%. P(x~ $x; $xi )=l-a com </> = n. Co111 P(x 2 $ xi)=~ 2 2 ? X1 = x;.(1-a12)% ? ? X 2 = X ;=11.(a12)% e P(x 2 ;:;:x~)=~. 2 P x,2 $ _._i=---'----$ x; = 1-a a2 1- a 298 Estatística básica li X ~ :;:; """';_-'--1 ____ -;. 0 2 • ª2 X~ :5 L (x; - µ ) 2 i=I ª2 < _i=-'1 ___ _ 2 X1 Tan1bém ...:..i=....:1--? --< xi a- -'-;-....:1 ____ :;:; a 2 xi • • • • • p ....ci ....:I ____ < 0 2 < -'-1-....:1 ___ _ x2 x2 2 1 li Co1no L (x; - µ )2 = ns2, temos: i = 1 S 2 ns2 n 2 P --<a < ? xJ X 1- Teste de hipóteses H 2 2 o: a = ªº H 1: ª 2 :;é ag ou =1-a (J2 > (J 2 o n ou ,L:(x; - ,u )2 Definimos 2 i=I X cale = --(-a -2) __ _ <I Fio ns2 =1-a (J 2 < (J2 o ou 1 2 Capítulo 16 - Dislribuição de x• (qui-quadrado), IC e TH para a variância de populações normais 299 Exemplos 1. Sabe-se que o tempo de vida de certa lâmpada te1n distribuição aproximadamente nor- 1nal, com média de 500 horas e variância desconhecida. Uma arnostra de 25 lâmpadas 25 forneceu L (x; - µ )2 = 62.500. Constru ir urn IC para a2 ao nível de 5%. i=I n = 25 </> = 25 X~ = X is;975% = 13,1 197 X i = X is;z.s% = 40, 6465 95% ll...__J_ _____ __l_ _ __:::::::::.. xi X~ X~ Usando a fórmula 1 do JC, temos: p ( 62.500 :5 (}2 :5 62.500) =o 95 40,6465 13,1197 ' P(l.537,65 < 0 2 < 4.763,82) = 0,95 2. De u1na população normal com 1nédia 300, levantou-se uma amostra de 26 ele1nentos, obtendo-se: 26 Í:(x; - µ )2 = 129.000 i= l Ao nível de 5%, testar as hipóteses: RC 15,3792 RNR 95% H0 : 0 2 =3.600 HI: a 2 < 3.600 2 = 129.000 = 35 833 X ca le 3.600 ' </> = 26 X~ =X i6;9s% = 15,3792 Co1no X ~ i c >X ~, não se rejeita Ho, isto é, ao nível de 5% não é sign ificativo que a variância seja diferente de 3 .600. 300 Estatística básica 16.3 IC e TH para a 0 2 de população normal comµ desconhecida n Distribuição de L. (x;- x )2 Í = 1 II Da mesma for1na co1no foi feito para a distribuição de L (-\'.; - µ )2, detnonstra-se i=I II que 2:(x;-x)2 ? tern distribuição relacionada à distribuição x- co1n (n - 1) graus de i= I liberdade, isto é: II "' ( _)2 2 ? ~ X ; -x -a X; =n - 1 í=I li 2:(x;- x)2 • 2 i=I . • X 1'= 11 - I = - - a2-- li 2:(x;-x)2 =(n-l)s2 :.a2 X ~= 11 _, =(n-l)s2 i =I 2 (n-l)s2 X tp=11-I = 2 a IC para a2 P (n-l)s2 2 (n-l)s 2 -- 2 -< a < 2 =1-a ou X2 X1 p -'-i=__,_1 ___ < a 2 < -'-i=....:...I __ _ ? ? X í X,- =l-a Capítulo 16- Distribuição de x• (qui-quadrado), IC e TH para a variância de populações normais 301 TH para a2 Exemplos H 0: a 2 = a ~ H,: a 2 :;i= ag li :L(x; - x)2 , , 2 , ou a- > a: e a < a.-o o 2 i=I X cale = -'--'..,-( a.~2 ),--- OU O fio 2 (n-l)s 2 X cale = ( a.2 ) o li (1 1. Sabe-se que o te1npo de vida de certo tipo de válvula tem distribuição aproximada- n1ente norn1al. Un1a amostra de 25 válvulas fon1eceu x = 500h e s = 50h. Construir um IC para a2, ao nível de 2%. n = 25 s2 = 2.500 1' = 24 X ~ = X i4;99% = 10,8563 X i = X i4: i% = 42, 9798 :. p(242.500 $ ª 2 $ 242.500)=0 98 42, 9798 1o,8563 ' P(l.396s a 2 s5.526,74)=0,98 98% 2. Avaliou-se en1 240 kg o desvio padrão das tensões de rupturade certos cabos produ- zidos por uma fábrica. Depois de ter sido introduzida uma mudança no processo de fabricação desses cabos, as tensões de ruptura de uma an1ostra de 8 cabos apresen- 302 Estatística básica tara1n o desvio padrão de 300 kg. Investigar a significância do aumento aparente da variância, ao nível de 5%. H0 : 0 2 = 57.600 H,: 0 2 > 57.600 RNR 95% RC ll...._ _~ ____ __j_ __ --=:::==-x2 14,0671 2 Xc.ic n=8 </> =7 s2 =(300) 2 =90.000 2 (n-l)s 2 7·90.000 X cale= ( 0"2) Ho = 57.600 X ~i c = 10,938 x; = xi.5% =14,0671 N ão se rejeita Ho. Ao nível de 5%, o aun1ento aparente da variância não é sig- nificativo. Exercícios resolvidos 1. De uma população nor1nal com médiaµ = 20, levantou-se uma amostra de 24 ele- 24 mentes, obtendo-se L (x; - µ )2 = 423, 42. Ao nível de l 0%, construir u1n IC para. i =I a variância populacional. Resolução: </> = 24 ? ? 8 X 1- = X 24;95% = 13,84 4 f<x~ xi = xi4;5% = 36,415 90% P(423, 42::::;; 0 2 ::::;; 423,42 )=o 90 36,415 13,8484 ' ll....___J[_ _____ 1__--=:::=- x2 X~ X~ p (11,628::::;; 0 2 ::::;; 30,5754) = 0,90 Capítulo 16 - Dislribuição de x• (qui-quadrado), IC e TH para a variância de populações normais 303 2. De uma população normal X com média 1.000, levanta-se uma amostra de 15 ele- 1nentos, obtendo-se L (X; - µ )2 = 200. Ao nível de 1 %, testar. ' H0 :a-=8 fl1:a 2 >8 f<i') 2 X cate RNR 99% </> = 15 2 200 X cale = 8 = 25 X i =X ~ ;i % = 30,5780 RC :. não se rejeita Ho • isto é, ao nível de 1 o/o é significativo que 0 2 = 8. 3. De uma população normal levantou-se uma a1nostra de 1 O observações, obtendo-se os seguintes valores: 10, 8, 15, 11, 13, 19, 21, 13, 15 e 14. Sabendo-se que a popula- ção tem 1nédia µ = 14, construir um IC para a 0 2 populacional ao nível de 5% e, ao 1nes1no nível, testar: 10 L(x; - µ )2 = (10-14)2 + (8-14)2 + ... + (14-14)2 =139 i=I Resolução: a) f(Xi) 95% 1!__.1_ _____ ..J._ _ __::::::::::... x2 2 2 X, X2 p{ 139 <02< 139 }=095 20,483 3,247 ' p ( 6, 786 :5 0 2 :512,809) = 0,95 </>=10 X~ =X 1 ~ ;?1. s % = 3,247 X . ~ = X 1 2 0:2.s% = 20, 483 304 Estatística básica b) RC 2,5% J-10 : a 2 = 3 H,: a 2 ~ 3 RNR 95% RC X 2 =3 247 1 ' ? X- =20 4832 2 ' ~ _ _L_ _____ _L_ _ _.,...:::::=.. xz 3,247 20,4832 2 139 Xcalc = 3 =46,333 Con10 X ~a i c E RC, rejeita-se Ho , isto é, a 5% é significativo que a a2 st:ia diferente de 3. 4. A variância de l O lân1padas elétricas produzidas por uma fábrica é de 120 horas. Construir um IC para a variâ11cia de todas as lân1padas da empresa, ao nível de 90%. Resolução: n = 10 </> = 9 a= 10% X2- x 2 - ""2s1 1 - 9.95% - .) •-' x; = x;.s% = 16,9190 p(9·14.400 < ª 2 ~ 9·14.400)=0 90 16,9190 3,3251 ' 90% P(8.004,94!f a 2 <38.976,27)=0,90 ~- .1_ _____ _1.._ _ _::::::=.. x2 X ~ X~ 5. Observou-se durante vários anos a produção mensal de uma indústria, verificando-se que essa produção se distribuía normahnente co1n variância 300. Foi adotada tuna nova técnica e, durante 24 1neses, verificou-se a produção 1nensaJ, constatando-se que :X = 10.000 e s2 = 400. Há razões para se acreditar que a qualidade da produção piorou, ao nível de l 0%? Capítulo 16- Distribuição de x• (qui-quadrado), IC e TH para a variância de populações normais 305 Resolução: RNR 95% n=24 RC </> = 23 s 2 =400 2 23·400 X cale = 300 ? X ;,e = 30, 667 L-----,----_l_---=~ x2 32,0069 ? ? X2 = X23; io% =32,0069 2 X"'"º Con10 X ~ . 1c < x: -7 não se rejeita Ho , isto é, não é significativa a queda da qualidade da produção com a nova técnica apresentada, ao nível de l 0%. 6. De uma população normal com média desconhecida, levantou-se u1na a1nostra casu- al de 2 1 elementos: 1, 2, 2, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 6, 6, 7. a) ao nível de 10%, construir u1n IC para a2; b) e, ao mesmo nível, testar se a variância populacional é menor que 4. Resolução: a) n = 2 l 21 LX; =85 i=I f <x2) s2 = 2,148 90% 21 2:x? =387 i=I p(20·2,148 ::5 ª2 < 20·2,148)=0 90 31,4104 10,8508 ' P(l,368 < a 2 < 3,959) = 0,90 1 sz = - 20 387- 852 21 1> = 20 s2 = 2,148 2 2 X1 = X20;953 = 10,8508 X ~ = X!0.53 = 3 1,4104 306 b) Estatística básica Ho: a2 =4 H,: a 2 <4 90% L_~_L_ ______ ___:::::::::... x2 12,4426 2 X cale </> = 20 2 =20· 2,148=10740 X cale 4 ' X 1 2 = X io:90"1o = 12, 4426 ? ? Cotno x:aic < x;,, rejeita-se Ho , isto é, é significativo que a2 seja 1nenor que 4, ao nível de 10%. Exercícios propostos 1. O te1npo de vida das lân1padas da rnarca X ten1 distribuição aproxi1nada1nente normal, com média de 1.200 horas. Uma amostra de 16 lâmpadas forneceu os dados: 1.200, 1.100, 900, 1.250, 1.300, 1.290, l.100, 1.060, 1.180, 1.120, 1.160, 1.140, 1.190, 1.11 O, 1.100 e 1.220 horas. Fazer um IC para a variância da população normal de 10%. 2. De tuna população nonnal com média 4, levantou-se uma an1ostra casual de 21 ele1nentos, obtendo-se 1, 2, 2, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 6, 6, 7. Ao nível de l Oo/o, construir u.rn. JC para a variância a2 da população. Ao n1esn10 nível, testar que a variância seja nlenor que 3. 3. Quere1nos estimar a2 de u1na população nonnal, da qual desconhece-se a média. Para isso, usatnos uma an1ostra casual de 5 observações: - 1,33; 1,28; 0,62; 0,70 e O, I O. Ao nível de 2%, construir um IC para a variância populacional. 4. De u1na população normal X com média desconhecida, levantou-se un1a a1nostra 20 20 de tamanho 20, obtendo-se ,2: X; = 114 e 2: x; = 846 . Ao nível de 10%: i = I i = I a) construir u1n IC para a variância da população; H : a 2 =18 b) testar as hipóteses 0 2 H 1: a > 18 5. De uma população 1101mal cotn média desconhecida, levantaran1-se 24 observações, obtendo-se ,2:x; =480 e ,2: x;2 =10.060.Aonívelde I0%, construirumICparaa2 da população. Ao nível de 5%, testar que a variância populacional seja diferente de 16. Respostas Capítulo 16- Dislribuição de ;/ (qui-quadrado), IC e TH para a variância de populações normais 307 16.4 Resumo 1. IC para a média de populações normais com variância conhecida e para proporções: a) P (.~ -Zªa x < µ <X+ Zª - ax) = 1-a b) P(p-Zª a µ<µ <p+Zª o:., )= 1- a 2. lC para a média de populações normais co1n variância desconhecida: a) n ~ 30, usa-se t de Student com</> = n- 1. P { 1 X± tª · s.'i' 1 < µ} = 1-a b) n > 30, usa-se a distribuição nonnal. p (1 X ± Za . Sx 1 < µ) = 1-a 3. IC paraa2 de populações nor1nais: uso da X2: a) µ conhecida: <P = n. 2 .2 ns ? ns P <a-<-? ? Xi Xi b) µ desconhecida: <P = n - 1. =1-a P (n - I)s2 2 (n- l)s 2 --- 2 -<a < 2 =1-a X2 X1 17 .1 Testes de aderência e tabelas de contingência Testes de aderência Consideremos urn experimento aleatório onde: k - categoria de provas ou classes; O; - frequência absoluta observada da i-ésin1a categoria; e; - frequência absoluta esperada da i-ésima categoria. Definiinos ? ~(0 :-e . ) 2 X ; =(k-i)-P = L.J ' ' , onde JJ é o n(11nero de parâ1netros a sere1n . ' e. r= 1 esti1nados. 0.2 2o.e. e.2 k 2 k k 2 ±(o; -e;) 2 ± = 2:~-2Lo ;+ 2: e; . 1 1 1 + -'--X - - - -• • - - i=I e. 1 i=I e. ' e. 1 e. 1 · 1 e. · 1 · 1 1= 1 1= r.= k k Como necessariamente L e; = Lo; = 1i, temos: i = I J=I k ( ) 2 k 2 X 2 = L O; - e; = L O; - n i =I e; i = J e; Por 1neio dessa expressão, pode1nos realizar testes que per1nitarn verificar se os resultados práticos obtidos ern u1n experirnento aleatório segue111 u111a deter1n inada distribuição. No teste, só há uma região de rejeição à direita, pois quanto mais próximo for O; de e;, portanto 1nais próximo ao zero (à esquerda da X 2 ) , 1nais perfeita será a aderência testada. Capitulo 17 - Testes de aderência e tabelas de contingência 309 Fare1nos testes de aderência para verificar se determinados dados seguem urna distribuição de probabi lidade, co1no bino1uinal, Poissonou nor1nal. Podemos verificar ta1nbém se há distribuição de famílias por classes de renda, por exemplo. Ajustamentos e testes de aderência Apresentarnos u1n proced imento para efetuannos u1n ajustan1ento e o teste de ade- rência desse ajusta1nento: 1. realiza-se um levantamento da amostra e ordenam-se os dados; 2. observa-se o tipo de distribuição e propõe-se um modelo para a distribuição: binominal, Poisson, normal etc. 3. estimam-se os parân1etros de que depende1n essa distribuição proposta; 4. co1n estas estirnativas, executa-se o ajustarnento, verificando quais seriarn os va]ores esperados, co1n base nessa estitnativa, isto é, testa-se a aderência, verifi- cando-se se é possível admitir que os valores observados seguem a distribuição proposta. EXEMPLO Um dado é lançado 120 vezes, obtendo-se os resultados: faces O; 1 25 2 17 .... .) 15 4 23 5 24 6 26 Testar a hipótese de que os dados sejan1 perfeitos, ao nível de 5%. H0 : O dado é perfeito (honesto). H,: O dado não é perfeito Nota-se que as hipóteses são qualitativas. Co1no por f/0 o dado é perfeito, deveremos ter como e; = valor esperado de cada l l face 20 vezes, pois as faces são equiprováveis e p = "6 :. 120 · 6 = 20 vezes cada face. li 2 ~ o. Farernos a tabela para deter1ninar o X cale = L.J-1 - n usando Ho e n = 120: . i e. 1= 1 310 Estatística básica x:alc = 125-120 a = 5% <j> = (k - 1) -P k = 6 classes O; 25 17 15 23 24 16 120 e; 20 20 20 20 20 20 120 ? x:alc = 5 P =O (não é calculado neohutn estimador) <j> = 6-l-0 <j> =5 2 2 Xa = Xs:S% = 11,0705 o: 625 289 225 529 576 256 RNR 95% o:le; 31,25 14,45 11 ,25 26,45 28.80 12.80 125.00 RC IL.__-r-_____ _L_ _ __:~,__ x2 11,0705 2 X cale Con10 X~. 1c <X:,, não se rejeita H0, isto é, ao nível de 5%, poden1os concluir que o dado é perfeito, honesto. Ta1ubém podemos verificar se duas amostras são de uma rnesrna população, ou seja, se seguetn uma 1nesma lei (a lei específica não está etn jogo). • EXEMPLO A distribuição percentual de fan1ílias segundo classes de renda de utn certo país, etn 1960, foi dada no quadro a seguir. Em 1970, foi tomada uma amostra de 200 fa- 1nílias, cuja distribuição pelas classes de renda foi : 14, 24, 20, 22, 24, 52 e 44, respec- tivan1ente. Verificar se, ao nível de l 0%, houve 1nudança na distribuição de famílias por classes de renda. Classes o/o o f- 1.000 13 1 .000 f- 2.000 15 2.000 1- 3.000 18 3.000 f- 4.000 18 4.000 f- 5.000 15 5.000 f- 7.500 14 7.500 f- 10.000 07 Ho: a distribuição das fatnílias por classes de renda não Lnudou de 1960 a 1970. Hi: houve mudança na distribuição de fa1ní lias por classes de renda. Capitulo 17 - Testes de aderência e tabelas de contingência 311 Co1n Ho constrói-se e;. e; = o/o de 200 O; 14 24 20 22 24 52 44 200 e; 26 30 36 36 30 28 14 200 ? 7 0 2 x;alc = 2: .....!.... -n = 305,3511-200 . t e. t= I o1 196 576 400 484 576 2.704 1.936 ? /~) X~ alc = 105,35 k = 7 p =o <j> =k-l-p =7-1-0 </> = 6 a= 10% X~alc = X~c = 10,6446 o1le; 7,5385 19,2000 11,11 11 13,4444 19,2000 96,5714 138.2857 305,3511 RNR RC 90% 10,6446 x2 2 X cale Co1no x ~ 11 c > X ~ , rejeita-se flo, isto é, a l 0%, é significativo que houve mudança I na distribuição de fa1nílias por classes de rendas. • 17.2 Tabelas de contingência São tabelas de dupla entrada construídas co1n o propósito de estudar a relação entre as duas variáveis de classificaçã.o. Em particular, pode-se desejar saber se as duas variá- veis são relacionadas de algum modo. Por meio do teste X 2 , é possível verificar se as variáveis são independentes. Ser = número de linhas e e= número de colunas, então o n(unero de graus de li- berdade é</> = (r - 1 )(e - 1 ). EXEMPLO No Congresso An1ericano, grupos de den1ocratas e republicanos votaram e1n un1 projeto de interesse nacional como está na tabela abaixo. Ao nível de 5%, testar a hipótese de não haver diferença entre os dois partidos, co1n relação a esse projeto. 3 12 Estatística básica - ~s Partido A favor Contra Indecisos Democratas 85 78 37 Republicanos 118 61 25 Total 203 139 62 J H0 : As variáveis são independentes (votação e partido). l H 1: Não são independentes. Os valores do quadro anterior são os observados: O;. Determinação dos e1: 200 203 . P(D)= P(F)= se são independentes por fio. 404 404 P(Dn F )= 203 · 203 = O 2488 404 404 , Total 200 204 404 e1 = n · P(Dn F) = 404·0,2488=100,495 P(R)= 204 404 P(F) = 203 _,, p (R e F) = 204. 203 =O 2537 404 404 404 ' e; = 404 ·O, 2537=102,505 P(C)= 139 404 P(l)= 62 404 P(Dn C)= 203 · 1 39 =O1729 404 404 ' P(DeC)= 204 ·1 39 =O 1737 404 404 ' P(D e l)= 203 · 62 =O 0771 404 404 , P(R e 1) = 204 · 62 =O 0775 404 404 ' e; = 404 · 0,1729 = 69,844 e; = 404 · O, 173 7 = 70, 188 e; = 404 · O, 0771 = 31, 154 e; = 404 · 0,0775 = 31,307 De posse desses valores, fonnamos o quadro que se segue, com os devidos ajustes de an·edonda1nento: ~ F e 1 Total D JOO 69 31 200 R 103 70 31 204 T 203 139 62 404 Capitulo 17 - Testes de aderência e tabelas de contingência 313 O; e; (O; - e;) 85 100 -15 78 69 9 37 31 6 118 103 15 61 70 -9 25 31 - 6 404 404 r = 2 c=3 :. X~a lc = 9,088 J </> = (2 - 1) (3 - 1) = 2 a = 5% ? ? X~ ,= x;,s% = 5,9915 RNR 95% (o; - e;)2 (o; - e;) 2 e; 225 2,2500 81 1, 1739 36 l ,1613 225 2, 1845 81 1, 1571 36 1,1613 9,0881 RC 5,9915 xz 2 X cale Rejeitando-se Ho :. ao nível de 5%, pode1nos afirmar que os políticos não votaram independenteme11te da orientação de seus partidos. Obs.: Quando</>= 1, o teste não é tão eficiente co1no nos outros casos. Yates suge- riu que fosse feita tnna correção de continuidade: Exercícios resolvidos • 1. Levantou-se uma a1nostra de tamanho 100 en1 que se observava a altura das pessoas. Realizar um ajustamento desses dados a u1na distribuição conveniente e testar a ade- rência, ao nível de 2,5%. 314 Estatística básica 25 20 15 10 5 o • ' Classes 150r155 155 r 160 160 r 165 165 r 110 110 r 115 115 r 180 180r185 185 r t9o 190 r 195 195 r2oo I O; 1 2 5 13 20 23 19 11 4 2 100 152,5 157 ,5 162,5 167 ,5 172,5 177 ,5 182,5 187 ,5 192,5 197 ,5 1 1 Analisando o histogra1na aci1na, concluín1os que tipo de função se ajusta aos dados. Ajustaren1os tuna distribuição normal. H 0 : os dados segue1n u1na distribuição nonnal. H 1: os dados não possuem distribuição nor1nal. Con10 Ho não especifica quais são os parâmetrosµ e a2, é necessário estin1á-los. X; O; X; O; xI. 01 152,5 1 152,5 23.256,25 157,5 2 315,0 49.612,50 162,5 5 812,5 132.031,25 167,5 13 2.177,5 364.731 ,25 172,5 20 3.450,0 595.125,00 177,5 23 4.082,5 724.643,75 182,5 19 3.467,5 632.818, 75 187,5 1 1 2 .062,5 386.718,75 192,5 4 770,0 148.225,00 197,5 2 315,0 62.212,50 I 100 17.605,0 3.119.375,00 Capitulo 17 - Testes de aderência e tabelas de contingência 315 x = L X;O; = 17.605 =176 05 cm n 100 ' s2= 1 "' x20_- (L x;o;)2 =_!_ 3.119·375,00-(17.605)2 n - 1 L.J ' ' n 99 00 s2 =202,1692~s=14,2186 cm s = 0,142186 n1 Verificaremos se os dados têm aproximadamente uma distribuiçã.o normal com mé- dia 1,76 me desv io 0,1 4 n1. Verificarernos quais são as frequências sob Ho, X: JV(l ,76; (O, 14 )2) . z = l,5-1,76 = -1 86 1,50 0,14 ' z160 = -1,14 ' z1•15 =-0,011 z1•90 =1,00 Z1•65 = - O, 79 z1•80 = 0,29 z,_95 = 1,36 z = 1,55-1,76 = -15 l.SS 0,14 ' z, 70 = -0,43 , z,_85 = o,64 22.00 = l, 71 P(l50~155) = P(-l,86 < Z < -1,5) = 0,468557- 0,433193 = 0,035364 Devemos calcular da 111esn1a forma as probabilidades de todas as classes, o que está lançado no quadro seguinte: Classes 150 l- 155 155 1- 160 160 l-165 1651-170 1701-175 1751-180 1801-185 185 1- 190 1901-195 1951-200 L: Prob0,035364 0,060336 0,087621 0, 118834 o, 138499 0,1 41995 0,124822 0, 102431 0,71740 0,043282 • •• e;= n • prob O; ei/'f.e1 =Tui 4 1 4 6 3 7 9 8 9 12 14 12 14 19 14 14 2 1 15 12 17 13 10 10 11 7 5 8 4 2 5 92 100 98 ( ) 2 'º o -e 2 ="" ; i = 13 4125 Xcalc L.J > i=I ei (O; - e;)1 (o; - e;)1/e; 9 2,2500 16 2,2857 1 O, 1111 4 o "3"" ,.) .) .) 25 1,7857 36 2,4000 16 l,2308 1 0,0909 9 1, 1250 9 1,800 13,4125 316 Estatística básica Calculamos x e sp = 2 k=lO </>=10-1-2 :. </>=7 x; = xi:z.5% = 16, 0128 RNR 97,5% RC 16,0128 x2 2 X cak Con10 X~1c <X ~ :. não se rejeita Ho , isto é, a 2,5% podemos aceitar que os dados sigan1 un1a distribuição nonnal con1 médiaµ = 1,76 c1n e desvio padrão a = O, 14 m. 2. A tabela dá a frequência do nú1nero de e1Tos de itnpressão por página de detenninado livro: Número de erros por página: x o l 2 3 4 Total Número de páginas: O; 500 340 120 30 lO 1.000 Ajustar essa distribuição a tuna distribuição de Poisson e testar a aderência do ajus- tan1ento, ao nível de 1 %. Deven1os estudar co1no se apresentará a distribuição teórica de Poisson co1n 1nédia  =x. X= Li. x, = (0,500 + l,340 + 2,120 + 3,30+4,10) / 1.000 o. r x= 71 º=071 100 , Ji. =O, 71 e-0,11 =O 491644=0 492 , ' Calculare1nos as probabilidades de X: nú1nero de erros por páginas. Assumir os va- lores O, 1, 2, 3 ou 4. P(X =O)= e-0,11 (0, 71)º =O 492 O! ' - 0 11 (o 11)1 P(X = 1) = e . . ' =O 34932 1 ! ' -o 71 (O 71)2 P(X = 2) =e . . ' =O 124 2! , P(X = 3) = e-o, 71 • (O, 7 l) 3 =O 0293487 3 ! ' - o 11 (o 7 )4 P(X = 4) = e . . ' l =O 005 4! , Capitulo 17 - Testes de aderência e tabelas de contingência 317 X O; e;= n · P(X=x) o 500 1 340 2 120 3 30 4 10 L: 1.000 2 :. Xcaic=5,4912 Co1no cal.culamos x, então p = 1. k=5 • • • ef>=5 - 1- 1=3 X~ = X~ ; 1 % = 11,3449 2 X.,.1c 492 349 124 30 5 1.000 RNR 99% 11,3449 (O; - e;)2 (o;-e;)2 e. 1 64 0,13008 81 0,2309 16 0,12903 o 0,00000 25 5,00000 5,49120 RC Podetnos não rejeitar Ho, isto é, os dados observados, o número de erros por páginas seguen1 uma distribuição de Poisson con1  = 0,71 . 3. Resolver o mesmo problema, testando Ho: a distribuição dos valores observados segue uma distribuição de Poisson con1 J.. = 1. 4. U1na moeda é lançada 50 vezes, fornecendo os resultados: Categoria O; e 22 ,. 28 Ao nível de 5%, testar a hipótese de que a n1oeda não é viciada. H 0 : p(face) = 0,5 a ruoeda é l1onesta, não viciada. H,: p * 0,5 a tnoeda não é honesta (é viciada). 318 Estatística básica Classe O; e; =n · PH0 1 O; - e; 1 - 0,5 { 1 O;- e; 1 - 0,5} 2/e; e 22 r 28 2: 50 2 :. Xcaic= 0,5 k=2 1>=2 - 1=1 Co1no 1> = 1, usa1nos a correção x! = Xi~s % =3,8415 ?-_) 25 50 2,5 2,5 RNR 95% 0,25 0,25 0,5 RC ll__y-_____ 1__....:::::=- x2 2 X u 1c ? ? Co1no X ~a1c < x;, não se rejeita Ho , isto é, a 5% de risco não rejeitan1os que a moeda ' . é honesta, não viciada. 5. Deseja-se saber se o fato de u111a pessoa ficar resfriada está relacionado ao fato de ton1ar u1na certa vacina. Para isso, levantou-se un1a a1nostra casual de 100 indivídu- os, obtendo-se o quadro. Ficar resfriado Resfriado Não resfriado Ser vacinado Vacinado 15 20 Não vacinado 25 40 Ao nível de 5%, testar as hipóteses de independência entre as danificações: ser vaci- nado e ficar resfriado. Sob Ho: com independência entre as duas classificações, construiremos a tabela teó- rica de valores esperados. P(V)= 35 100 P(V)= 65 100 P(Ve R)= 35 · 4 ü =014 100 100 ' 40 P(R)= 100 P(R)= 60 100 Capitulo 17 - Testes de aderência e tabelas de contingência 319 P(VeR)= 35 · 60 =O 21 100 100 ' - 65 40 P(VeR)= · =O 26 100 100 ' P(VeR)= 65 · 60 =O 39 100 100 ' Independentes R -R V O, 14 0,21 V 0,26 0,39 A tabela anterior refere-se aos valores esperados, que são obtidos e;= n · P(X = i) . R - Total e; R V 14 21 35 - V 26 39 65 Total 40 60 100 n = 100 Calcu lan1os , ~ {lo; - e;l -0,5}2 (114- 151-0,5)2 (J20-21 J-0,5)2 x:.11c = {;;: e; = 14 + 21 + + (J25-26 J- 0,5)2 + (J40 -39 J- 0,5)2 =0,0178+0,0119+ 26 39 +O, 0096 +O, 0064 =O, 0457 :. X ~ ,e = 0,0457 <P = (c-1) · (r-1) = (2-1)·(2-1) = 1 x; = x,~s % = 3,8415 320 Estatística básica RNR 95% RC ll__ -x-_____ J__....::::::=- x2 3,8415 2 Xea1. Co1noX~. 1 0 <X;,, não se rejeitaH0 , isto é, a 5% não rejeitamos a independência entre as duas classificações. Pode-se dizer que estar resfriado e ser vacinado são indepen- dentes. Exercícios propostos l . Ajustar tuna curva non11al aos dados da tabela abaixo e, a 5o/o, testar a aderência do ajusta1nento. Alturas 01 1511- 159 5 159 l-167 18 1671-175 42 1751-183 27 183 1- 191 8 2. Durante longo período de tempo, os conceitos dados por um grupo de instrutores de tun curso foram e1u média: A-12% B-18% C-40% D - 18% E-12% U1n novo instrutor atribuiu 22%, 20%, 30%, 16%, respectivamente, de A, B, C, De E, durante dois sen1estres. Detenninar ao nível de 5% se o novo instrutor está agindo segundo o padrão de conceitos estabelecidos pelos de1nais instrutores ou não. 3. A tabela a seguir mostra a distribuição em toneladas das cargas 1náxil11as suporta- das por ce11os cabos produzidos por uma e1npresa. Ajustar uma distribuição teóri- ca conveniente e testar, ao nível de 5%, a aderência do ajustamento. Respostas Capitulo 17 - Testes de aderência e tabelas de contingência 321 Carga máxima (toneladas) O; 9,3 a 9,7 2 9,8aJ0,2 5 10,3 a 10,7 12 10,8all ,2 17 11 ,3 a 11 , 7 14 11,8 a 12,2 6 12,3 a 12,7 ,., .) 12,8 a 13,2 1 4. Dois grupos, A e B são fonnados cada un1 por 100 pessoas que tê1n a 1nesma en-, fern1idade. E 1ninistrado u1n soro ao g111po A, 1n.as não ao B (grupo de controle). Nos demais cuidados, os dois grupos são tratados de modo idêntico. Determina-se que 75 e 65 pessoas dos grupos A e B, respectivamente, curaratn-se da enfermidade. Tes- tar a hipótese de que o soro auxilia na cura da enfermidade, ao nível de 5%. 5. Na tabela a seguir, testar a hipótese de que não há relação entre o nível educacional de u1n indivíduo e o êxito no seu casa1nento, isto é, ao nível de 5o/o, testar a hipótese da independência entre as classificações. Ajustamento no casal Muito Baixo Alto Muito Nível educacional baixo alto Universitário 18 29 70 11 5 Ensino médio 17 28 30 41 Ensino fLtndamental 1 1 10 1 1 20 6. A um grupo de doentes foram ministrados soníferos e, a um outro grupo, pílulas de açúcar (placebo). Foi perguntado depois aos doentes se os soníferos tinham ajudado ou não a dor1nir n1elhor. O quadro de respostas é apresentado abaixo: Dormir Dormiram Não dormiram Pílulas melhor melhor Sonífero 26 14 Placebo 32 28 Testar, ao nível de 5%, a hipótese de não haver diferença entre o fato do doente tomar sonífero e dorn1ir 1nelhor. 7. A tabela abaixo mostra a relação entre o aproveitamento dos alunos em fís ica e e1n 1natemática. Testar a hipótese de que o aproveitan1ento e1n fisica é independente ao de matemática, ao nível de 5o/o. Respostas 322 Estatística básica ~ Grau Grau Grau alto médio baixo a Grau alto 56 71 12 Grau médio 47 163 38 Grau baixo 14 42 85 8. Deseja-se saber se a audiência de quatro e1nissoras A, B, C e D não depende de suas programações, divididas en1 três tipos: n1usical, noticiosa e esportiva. Para isso, levan- tou-se uma a1nostra de 200 ouvintes, obtendo-se o quadro abaixo. Ao nível de 2,5%, testar a independência entTe a escolha da emissora pelos ouvintes e sua programação. Programa Musical Noticioso Esportivo Emissora A 10 10 5 B 25 20 15 e 15 10 10 D 30 20 30 Respostas Distribuição de F de Fisher- ·Snedecor, IC e TH para quociente de variâncias 18.1 Distribuicão F de Fisher-Snedecor • DEFINIÇÃO Denon1iJ1a-se variável F corn </>1 , </>2 graus de liberdade e indica-se por F<1>,.<1>2ou F (</>1, </>2) a função definida por: onde </>1 e </>2 são os graus de liberdade de X~ ex;, respectivan1ente, e as duas X2 são independentes. 1 li Con10 s2 = ,L(x; -x ) 2 e n - 1 i=I 1 li 2 ~( _)2 X.p=11 - 1 = 2 L.J X; - x , temos (J i =I 2 2 ,i,2 2 2 . S X 'f"s =a ·x .. .. - ,= . .,, a- </> Substituindo-se na definição, temos: s 2 la 2 F (</>,, </>2) = ~ / ~ s- a- 2 2 onde s~ e s~ são estin1ativas independentes de a1 e~, respectivamente. 324 Estatística básica Obs.: Se X11 , X12, ... , X1,, 1 e X21, X22, ... , X:z,,2 são independentes con1 2 j = I e s. = ~ ---- ' n. - 1 ' 1 .., ' s- a- Como F (</>,, </>,) = -', ·-+, - s2 ªI 1 então F (</>" </>.., ) = , 2 , o que resulta - s- a 2 1 - · - s2 a2 1 2 A função densidade de probabi lidade de Fé: </> ( ~) <f>1 - 1 _ 1 ·F 2 . </>2 De1nonstra-se que: f (F) F _<Ji. (</>, - 2) máx - </>, (</> 2 + 2) -( <f>1 +<1>2) l+!fiF 2 </>2 ' F>O. L_ __ ___,F_mã•-. ____ .::::::::0.--F(</>1, </>J A média e a variância da distribuição F são: E(F)=µF=</>:~ 2 , se n>2. 2</> 2 (</> + </> - 2) VAR(F)=a2 (F)= . 2 1 2 2 , se n>4. </>, (</>2 -2) (</>2 - 4) Uso de tabelas Para cada nível a , te1nos u1na tabela da distribuição F. A entrada na tabela é dupla e leva e1n consideração os graus de liberdade do nurnerador (</>1) e denon1inador (</>2). Capítulo 18- Distribuição de F de Fisher-Snedecor. IC e TH para quociente de variâncias 325 A tabela nos dá Fa, fixados a, </> 1 e </>2 nesta orde1n: P(F (</>1, </>2) > Fa) = a f (F) Exemplos l. Determinar F(l, tal que P{F(6, 20) 2: Fa} = 5%. f (F) F. = F, 5% = 2 5990 (l 6.20 ' 2. Determinar F.,, tal que P{F(6,15)2:Fa} = 0,05%. f (F) F. = F, 5% = 2 7905 (l 6.15 ' 3. Determinar F,,, tal que P{F(I0,20) > Fa} = 0,95%. 2,7905% 326 Estatística básica f (F) F,, P {F(l 0,20) > F« = 0,05% F - p 5% - 2 34"'7 (1 - 10.20 - ' .) 4. Detenninar Fa, tal que P {F(8, 1 O) < F,, = 0,01 o/o. f(F) F(8, 1 O) < F«. Os valores de F« que satisfazem esta relação satisfaze1n também 1 1 --->- F (8,10) - Fª 1 F(l0,8) ;::: - Fª 1 :. P{F(8,lO)s;Fª }=P F(l0,8)2!: - =0,01 Fª F;~ ~ = 5,81 1 :. F = =O 17 ª 5,8 143 ' P {F(8,10) < 0,17} = 0,01 18.2 Intervalos de confiança para um quociente de . " . var1anc1as Capítulo 18- Distribuição de F de Fisher-Snedecor. IC e TH para quociente de variâncias 327 onde: a/2 F;: P{F(</>1,</>2 )<F;}= ~ F2 : P {F(</>.,</>2 ) > F2 } = ~ (1 -a) Da relação 1 obteremos a expressão do IC para cf./m: Invertendo-se a relação, te1nos: ? ? ? s,- l Oj Sj 1 - · - < - < - · -2 - 2 - _i S2 F; 0 2 S2 F; ª2 logo, a expressão para o TC para -+ é: ª2 ' > ' </>1 ~ s ~ COl11 SI - S2 e Aplicações 1. De duas populações nonnais levantara1n-se a1nostras de tamanhos 9 e 11, respectiva- 1nente, obtendo-ses ~ = 7,14 e s ~ = 3,21. Construir um IC para o quociente das va- riâncias das duas populações ao nível de 10%. 328 Estatística básica Ten1os: s~ = 7,14 = 2 22 2 ' s2 3,21 ? Sz =3,21 </J1 = n1 - 1 = 9 - l = 8 ,,, =n -1=11-1=10 'f' 2 2 F; :P {F(8,10) $ F; } = 0,05 1 1 p ( ) >- =0,05 F 8,10 F; P F(l0,8) > _l = 0,05 F; F.5% =__!__ . 10,8 F. 1 __!_=3,3472 F; F2: P{F(8, 10) > Fz} = 0,05 5% . 1 F2 = f's,10 = 3, 0717 __,. Fi = 0,33 ? <J" p 2,22·0,33$-+$2,22·3,3472 =0,90 <J" 2 Capítulo 18- Distribuição de F de Fisher-Snedecor. IC e TH para quociente de variâncias 329 2. De duas populações nor1nais, I e II, levantara1n-se amostras de tamanhos 1 O e 16, respectivamente, obtendo-ses~= 5,22 e s1 = l ,69, respectivame11te. Ao nível de 5%, construir um IC para o quociente das variâncias populacionais. Consideramos: s~ = 16,9 s1= 5,22 s2 1 s2 2 16,9 = 3 23 5 22 ' </>1 = 15 ' Fi = P(F1( 15,9) < F 1) = 0,025 P F(9,5)2:::_!_ =0,025 F; p;2.5% = _!_ 9,15 F. t :. _!_=3,1227 F. 1 F = F.2·5% = 3 7693 2 15.9 ' ª2 p 3,23. 0,27 <-+ < 3,23. 3,12 ª2 =O 95 , • • • - 1 =o 27 F2 3,7693 ' 1 =O 95 ' 330 Estatística básica 18.3 Testes de hipóteses para quociente de variâncias ª 2 onde k = ~ a; H - o 2 a, k -> ? a- 2 2 a, k ou - , < a- 2 s2 ~ale=~ · Si a 2 s 2 1 ---1.. - _L. - a 2 - si k 1 Ho 2 En1 particular, quando k = 1, estare1nos testando a igualdade de variâncias. H 0 : a ~= a; H 1 :a~;t:a;; 0 2 >ai 1 2 ou ª 2 < ª2 1 2 Aplicações 1. De duas populações nonnais levantarrun-se arnostras com as seguintes características: População A n = 2l LX = 100 LX2 = 496 Ao nível de 10%, testar as hipóteses: ª2 H0 : -J;-=1 a; ª 2 H1: --t ;t: 1 ª 2 PopulaçãoB n = 9 Lx=45 LX2 = 273 2 1 Ss =- 8 (45)2 2 2 273 - = 6 :. s8 = 6 :. s1 = 6 9 1 s2= - ,, 20 496 - (100)2 21 s~ 6 = 6 06 s; 0,99 ' </>1 = 8 e </>2 = 20 =0,99 :. s,7 =0,99 :. si =0,99 Capítulo 18- Distribuição de F de Fisher-Snedecor. IC e TH para quociente de variâncias 331 F; = P(Fg.20 :5 F;) = 0,05 1 F; = p F20.s ~ F =O, 05 1 S% - 1 . -1 = 3, 1503 F20,s - F; · · F. F2 = Fg~~ = 2,4471 F; = 0,32 RC 0,32 RNR 90% 2,4471 RC !fale Con10 Fea1c > F,,, reje ita-se Ho, isto é, é significativa a diferença entre as variân- cias (a2, * ~ ), a 10%. 2. Deseja-se testar ao 11ível de 5% se duas populações têm as 1nesn1as variâncias. Os dados obtidos nas a1nostras são: s~ = 5,22 n, = 10 n1 = 21 s~ = 16,9. Qual a conclusão fornecida pelos dados? H . (}2 = (}2 o· 1 2 H,: a ~ ;é ai ou ? 5- = 16, 9 = 3 23 si 5,22 ' RC 2,5% RNR 95% RC 1L___1_ ____ _J__-;.=-- F 0,27 2,84 a=5% f'.:alc = 3, 23·1 = 3, 23 </>, = 9 </>2 = 20 F. =P(~. 20 :5f'..)=0,025 1 F; = P F20,9 ~ F 0,025 1 p_2.S% = _!_ 20,9 F 1 1 :. - = 3,669 F. F; = 0,27 F2 = ~~ 25(; = 2,8365 Como F caic E RC, rejeita-se fio, isto é, a diferença entre as variâncias das duas popu- lações é significativa, ao nível de 5%. 332 Estatística básica Exercícios propostos 1. A variabilidade no levantamento de impurezas de u1na certa substância depende da duração do processo usado. Usando dois processos, u1n químico 1nelhorou o segundo, esperando com isso reduzir essa variabilidade. Levantaran1-se duas amos- tras, u1na utilizando o prilneiro processo e outra utilizando o segundo, de tamanhos 26 e 13, respectivamente, obtendo-ses ~ = 1,04 e s ~ = 0,5 l. a) Detenninar un1 IC para o quociente das variâncias, ao nível de 10%. b) Testar as hipóteses: H 0 : a~ =a; H,: a~ >ai ,, ao nível de 5o/o 2. De duas populações norn1ais A e B extraíra1n-se a1nostras, obtendo-se: População A PopulaçãoB l"' nA = J nn = 9 LX,1= 91 LX11 = 63 I.x ~ = 697 I.x1} = 497 a) Deter1ninar um IC para o quociente das variâncias das duas populações, ao nível de 2%. b) Ao mesmo nível, testar as hipóteses: 3. Deseja-se comparar dois analistas quanto à precisão na análise de u1na ceita substân- cia que contétn carbono. O analista A é experiente, e o B é novo no serviço, sendo, portanto, de experiência desconhecida. Os resu ltados obtidos fora1n os seguintes: A: - 10, 16, - 8, 9,5, - 5, 5, - 1l, 25, 25, 22, 16, -3, 40, O, - 5, 16, 30, 14, 22, 22. B: -8, - 3,20,22, 3, 5, 10, 14, - 21,22, 8. E1n vista desses resultados, pode-se concluir que os dois analistas têm a mesma ex- periência no trabalho, ao nível de 10%? Obs.: O teor de carbono da substância analisada é conhecido, porérn não foi infor- mado aos analistas antes da experiência. Corn base nesse teor, foran1 calculados os desvios que permitira1n medir a precisão de an1bos (usar s2 = .!. L (x; - µ )2 ). n Respostas Capítulo 18- Distribuição de F de Fisher-Snedecor. IC e TH para quociente de variâncias 333 18.4 Resumo Variável Calcula-se Condições t/> z [C e TH paraµ eµ1 - µ 2 a2 conhecida IC e THparaµ a2 desconhecida n - 1 t (µ 1 - µ i com variâncias eµ1 - ,U2 desconhecidas e iguais) n1 + ni - 2 Seµ conhecido n IC e TH para a2 Se µ desconhecido n-l ' x· Teste de aderência :Eo, = :Ee, (estimam-sep k - l - p Tabelas de contingência parâmetros) (k: n2 de classes) L01 = L B1 (C - l) (l- 1) IC e TH para o quociente de ,u 1 e µi desconhecidas c/J1 = n1 - 1 F variâncias (teste de igualdade de sí >si c/J2 = n1 - 1 n1edidas) Respostas , PAGINA EM BRANCO Tabelas de distribuições: Normal: N(O, 1) Poisson Binomial tde Student X2 de qui-quadrado F de Fisher-Snedecor , PAGINA EM BRANCO Tabelas de distribuições Distribuicão normal: N(O, 1) • P(O < z < z<,) = a o z. Za 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 -'ª 0,00 -0,000000 0,003989 0,007978 0,011967 0,015953 0,019939 0,023922 0,027903 0,031881 0,035856 0,00 0,10 0,039828 0,043795 0,047758 0,05 1717 0,055670 0,059618 0,063559 0,067495 0,071424 0,075345 0, 10 0,20 0,079260 0,083166 0,087064 0,090954 0,094835 0.098706 o, 102568 0,106420 o, 110261 0,114092 0,20 0,30 0, 117911 0, 121719 0,125516 0,129300 0,133072 o, 136831 o, 140576 º· 1,14309 0,148027 0,151732 0,30 0,40 0,155422 o, 159097 0,162757 0, 166402 0,170031 o, 173645 O, 177242 0, 180822 0,184386 o, 187933 0,40 0,50 0,.191462 0,194974 0,198468 0,201944 0,205402 0,208840 0,212260 0,21566 1 0,219043 0,222405 0,50 0,60 0,225747 0,229069 0,232371 0,235653 0,238914 0,2421 54 0,245373 0,248571 0,251748 0,254903 0,60 0,70 0,258036 0,261148 0,264238 0,267305 0,270350 0,273373 0,276373 0,279350 0,282305 0,285236 0,70 0,80 0,288 145 0,291030 0,293892 0,296731 0,299546 0,302338 0,305106 0,307850 0,310570 0,313267 0,80 0,90 0,315940 0,318589 0)212 14 0,323814 0,326391 o 328944 ' 0,331472 0,333977 0,336457 0,338913 0,90 1,00 0,341345 0,343752 0,346136 0,348495 0,350830 0,353141 0,355428 0,357690 0,359929 0,362143 1,00 J,JO 0,364334 0,366500 0,368643 0,370762 0,372857 0,374928 0,376976 0,378999 0,381000 0,382977 1, 1 o J,20 0,384930 0,386860 0,388767 0,39065 1 0,392512 0,394350 0,396165 0,397958 0,399727 0,40 1475 1,20 1,30 0,403 199 0,404902 0,406582 0,408241 0,409877 0,4 11 492 0,413085 0,414656 0,416207 0,417736 l ,30 1,40 0,419243 0,420730 0,422196 0,423641 0,425066 0,426471 0,427855 0,429219 0,430563 0,431888 1,40 1,50 0,433 193 0,434478 0,435744 0,436992 0,438220 0,439429 0,440620 0,44 1792 0,442947 0,444083 1,50 338 Estatística básica Za o,oo 0,01 0,02 0,03 o 04 ' 0,05 0,06 0,07 0,08 0,09 Za 1,60 0,445201 0,446301 0,447384 0,448449 0,449497 0,450529 0,451543 0,452540 0,453521 0,454486 l,60 1,70 0,455435 0,456367 0,457284 0,458185 0,45907 1 0,459941 0,460796 0,461636 0,462462 0,463273 1,70 J,80 0.464070 0.464852 0.46562 1 0.466375 0.467 11 6 0.467843 0,468557 0,469258 0,469946 0,470621 1,80 1,90 0,471284 0,4 71933 0,47257 1 0,473197 0,473810 0,4744 12 0,475002 0,475581 0,476 148 0,476705 1,90 2,00 0,477250 0,477784 0,478308 0,478822 0,479325 0,479818 0,480301 0,480774 0,481237 0,481691 2,00 2,10 0,482136 0,482571 0,482997 0,483414 0,483823 0,484222 0,484614 0,484997 0,485371 0,485738 2, 10 2,20 0.486097 0,486447 0,48679 1 0,487126 0,487455 0,487776 0,488089 0,488396 0,488696 0,488989 2,20 2,30 0,489276 0,489556 0.489830 0,490097 0,490358 0,4906.13 0,490863 0.491106 0,491344 0,491576 2,30 2,40 0,491802 0,492024 0,492240 0,49245 1 0,492656 0,492857 0,493053 0,493244 0,493431 0,493613 2,40 2,50 0,493790 0,493963 0,494132 0,494297 0,494457 0,494614 0,494766 0,494915 0,495060 0,495201 2,50 2,60 0,495339 0,495473 0,495603 0,49573 1 0,495855 0,495975 0,496093 0,496207 0,4963 19 0,496427 2,60 2,70 0,496533 0,496636 0,496736 0,496833 0,496928 0,497020 0,4971 10 0,497197 0,497282 0,497365 2,70 2,80 0,497445 0,497523 0,497599 0,497673 0,497744 0,4978 14 0,497882 0,497948 0,4980 12 0,498074 2,80 2,90 0,498134 0,498193 0,498250 0,498305 0,498359 0,498411 0,498462 0,498511 0,498559 0,498605 2,90 3,00 0,498650 0,498694 0,498736 0,498777 0,498817 0,498856 0,498893 o 498930 ' 0,498965 0,498999 3,00 3,10 0,499032 0.499064 0.499096 0,499 126 0,499155 0,499184 0,499211 0,499238 0.499264 0,499289 3,10 3,20 0,499313 0,499336 0,499359 0,499381 0,499402 0,499423 0,499443 0,499462 0,499481 0,499499 3,20 3,30 0,499517 0,499533 0,499550 0,499566 0,499581 0,499596 0,499610 0,499624 0,499638 0,499650 3,30 3,40 0,499663 0,499675 0,499687 0,499698 0,499709 0,499720 0,499730 0,499740 0,499749 0,499758 3,40 3,50 0,499767 0,499776 0,499784 0,499792 0,499800 0,499807 0,4998 15 0,499821 0,499828 0,499835 3,50 3,60 0,499841 0,499847 0,499853 0,499858 0,499864 0,499869 0,499874 0,499879 0,499883 0,499888 3,60 3,70 0,499892 0,499896 0,499900 0,499904 0,499908 0,4999 12 0,4999 15 0,4999.18 0,499922 0,499925 3,70 3,80 0,499928 0,499930 0,499933 0,499936 0,499938 0,499941 0,499943 0,499946 0,499948 0,499950 3,80 3,90 0,499952 0,499954 0,1199956 0.499958 0,499959 0,49996 1 0,499963 0,499964 0,499966 0,499967 3,90 4,00 0,499968 0,499970 0,499971 0,499972 0,499973 0,499974 0,499975 0,499976 0,499977 0,499978 4,00 Distribuicão de Poisson I P(X- e-~ 1 k - k) = _ _:_:_A. k' • K 0,1 0,2 0,5 1,0 1,5 2,0 2,5 3,0 3,5 o 904837 818731 606531 367879 223 130 135335 082085 049787 030197 1 090484 163746 303265 367879 334695 27067 1 205212 149361 105691 2 004524 016375 0758 16 183940 251021 27067 1 256516 224042 184959 3 00015 1 001091 0.12636 0613 13 125511 180447 213763 224042 215786 4 000004 000055 001580 015329 047067 090224 133602 168031 188812 5 000000 000002 000158 003066 014120 036089 066801 100819 132169 6 000000 000000 000013 0005 11 003530 012030 027834 050409 077098 7 000000 000000 000001 000073 000756 003437 009941 021604 038549 8 000000 000000 000000 000009 000142 000859 003106 008102 016865 9 000000 000000 000000 000001 000024 000191 000863 002701 006559 10 000000 000000 000000 000000 000004 000038 000216 0008 10 002296 11 000000 000000 000000 000000 000001 000007 000049 000221 000731 12 000000 ºººººº 000000 ºººººº 000000 00000 1 000010 000055 0002 13 13 000000 000000 000000 000000 000000 000000 000002 000013 000057 14 000000 000000 000000 ºººººº 000000 000000 000000 000003 000014 15 000000 000000 000000 000000 000000 000000 000000 000001 000003 .16 000000 000000 000000 000000 000000 000000 000000 000000 OOOOOJ 17 000000 000000 000000 000000 000000 000000 000000 000000 000000 18 000000 000000 000000 000000 000000 000000 000000 000000 000000 19 000000 000000 000000 000000 000000 000000 000000 000000 000000 20 000000 000000 000000 000000 000000 000000 000000 000000 000000 21 000000 000000 000000 000000 000000 000000 000000 000000 000000 22 000000 000000 000000 000000 000000 000000 000000 000000 000000 23 000000 000000 000000 000000 000000 000000 000000 000000 000000 24 000000 000000 000000 000000 000000 000000 000000 000000 000000 25 000000 000000 000000 000000 000000 000000 000000 000000 000000 26 000000 000000 000000 000000 000000 000000 000000 000000 000000 27 000000 000000 000000 000000 000000 000000 000000 000000 000000 28 000000 000000 000000 000000 000000 000000 000000 000000 000000 29 000000 000000 000000 000000 000000 000000 000000 000000 000000 30 000000 000000 000000 000000 000000 000000 000000 000000 000000 4,0 4,5 5,0 6,0 7,0 018316 o li 109 006738 002479 0009 12 073263 049990 033690 014873 006383 146525 li 2479 084224 044618 02234 1 195367 1687 18 140374 089235 052129 195367 189808 175467 133853 09 1226 156293 170827 175467 160623 127718 104196 128120 146223 160623 149003 059540 082363 104445 137677 149003 029770 046330 065278 103258 130377 013231 023165 036266 068838 101405 005292 010424 018133 041303 070983 001925 004264 008242 022529 045171 000642 001599 003434 011265 026350 000197 000553 001321 005 199 014 188 000056 000178 000472 002228 007094 000015 000053 000157 000891 0033 ll 000004 000015 000049 000334 001448 000001 000004 000015 000118 000596 000000 00000 1 000004 000039 000232 000000 000000 00000 1 000012 000086 000000 000000 000000 000004 000030 000000 000000 000000 000001 000010 000000 000000 000000 000000 000003 000000 000000 000000 000000 00000 1 000000 000000 000000 000000 000000 000000 000000000000 000000 000000 000000 000000 000000 000000 000000 000000 000000 000000 000000 000000 000000 000000 000000 000000 000000 000000 000000 000000 000000 000000 000000 000000 000000 000000 000000 8,0 9,0 10,0 000336 000123 000045 002684 001111 000454 010735 004998 002270 028626 014994 007567 057252 033737 0189 17 09 1603 060727 037833 122 138 091090 063055 139587 11711 6 090079 139587 131756 112599 124077 131756 125110 099261 118580 1251 1 o 072190 097020 11 3736 048127 072765 094780 029616 050376 072908 016924 032384 052077 009026 019431 034718 0045)3 010930 02)699 002 124 005786 012764 000944 002893 00709 1 000397 001371 003732 000159 0006 17 001866 000061 000264 000889 000022 000108 000404 000008 000042 000176 000002 000016 000073 000001 000006 000029 000000 000002 000012 000000 000001 000004 000000 000000 000002 000000 000000 000001 000000 000000 000000 >< o 1 2 3 4 5 6 7 8 9 10 1 1 12 13 .14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 ~ g õr "' a. <l> a. ;;;· ~ :::! . 0- c & (!) "' ~ 340 Estatística básica Distribuicão binomial • 5 P(X = k) = (: )JJkqn-k 6 10 X 0,01 0,05 0,10 0,20 0,25 0,30 0,40 0,50 N=5 o 95099 77378 59049 32768 23730 16807 07776 03125 05 1 04803 20363 32805 40960 39551 36015 25920 1 -6,, -) _, 04 2 00097 02143 07290 20480 26367 30870 34560 31250 03 3 00001 001 13 00810 05120 08789 13230 23040 31250 02 4 00000 00003 00045 00640 01465 02835 07680 1-6,-) _, 01 5 00000 00000 00001 00032 00098 00243 01024 03125 00 N= 5 0,99 0,95 0,90 0,80 0,75 0,70 0,60 0,SO X X 0,01 o.os 0,10 0,20 0,25 0,30 0,40 0,50 N=6 o 94 148 73509 53144 262 14 17798 11765 04666 01563 06 1 05706 23213 35429 39322 35596 30253 18662 09375 05 2 00144 03055 09842 24576 29663 32413 31104 23437 04 3 00002 00214 01458 08192 13184 18522 27648 31250 03 4 00000 00009 00 122 01536 03296 05953 13824 23437 02 5 00000 00000 00005 00154 00<139 0102 1 03686 09375 01 6 00000 00000 00000 00006 00024 00073 00410 01563 00 N= 6 0,99 0,95 0,90 0,80 0,75 0,70 0,60 0,50 X X 0,01 0,05 0,10 0,20 0,25 0,30 0,40 0,50 1\'= 10 o 90438 59874 34868 10737 Q5631 02825 00605 00098 JO 1 09 135 31513 38742 26844 18771 12106 04031 00977 09 2 00415 07463 19371 30199 28157 23347 12093 04394 08 3 00011 01048 05739 20133 25028 26683 21499 11 719 07 4 00001 00096 o 1116 08808 14600 20012 25082 20508 06 5 00000 00006 00149 02642 05840 10292 20066 24608 05 6 00000 00000 00014 00551 01622 03676 1 1 148 20508 04 7 00000 00000 00001 00079 00309 00900 04247 11719 03 8 00000 00000 00000 00007 00039 00144 01062 04394 02 9 00000 00000 00000 00000 00003 00014 00157 00977 01 10 00000 00000 00000 00000 00000 00001 00010 00098 00 IV= 10 0,99 0,95 0,90 0,80 0,75 0,70 0,60 o,so X Tabelas de distribuições 341 Distribuicão binomial I 9 15 X 0,0 1 0,05 0,10 0,20 0,25 0,30 0,40 0,50 1V=9 o 91352 63025 38742 13422 07509 04035 01008 00196 09 1 08305 29854 38742 30199 22525 15565 06047 01758 08 2 00335 06285 17219 30199 30034 26683 16124 0703 1 07 3 00008 00772 04464 17616 23360 26683 25082 16406 06 4 00000 0006 1 00744 06606 11680 17153 25082 24609 os s 00000 00003 00083 01652 03893 07351 16722 24609 04 6 00000 00000 00006 00275 00865 02101 07432 16406 03 7 00000 00000 00000 00029 00124 00386 02123 07031 02 8 00000 00000 00000 00002 00010 00041 00354 01758 01 9 00000 00000 00000 00000 00000 00002 00026 00196 00 N=9 0,99 0,95 0,90 0,80 0,75 0,70 0,60 0,50 X X 0,01 0,05 O,JO 0,20 0,25 0,30 0,40 0,50 N= IS o 86006 46329 20589 03519 0.1336 00475 00047 00003 15 1 13031 36576 34315 13194 06682 03052 00470 00046 .14 2 00922 13476 26690 23090 15591 091 56 02194 00320 13 3 00040 03073 12851 25014 22520 17004 06339 01389 12 4 00001 00485 04283 18760 22520 21862 12678 04166 11 s 00000 00056 01047 103 18 165 14 20613 18594 09164 10 6 00000 00005 00194 04299 09 175 14724 20660 15274 09 7 00000 00000 00028 01382 03932 0811 3 17708 19638 08 8 00000 00000 00003 00346 01311 03477 11806 19638 07 9 00000 00000 00000 00067 00340 01159 06121 15274 06 10 00000 00000 00000 000 10 00068 00298 02449 09164 os li 00000 00000 00000 00001 00010 00058 00742 04166 04 12 00000 00000 00000 00000 00001 00008 00165 01389 03 l3 00000 00000 00000 00000 00000 00001 00025 00320 02 14 00000 00000 00000 00000 00000 00000 00002 00046 01 15 00000 00000 00000 00000 00000 00000 00000 00003 00 N = IS 0,99 0,95 0,90 0,80 0,75 0,70 0,60 0,50 ~ 342 Estatística básica Distribuicão binomial , 7 P(X = k) = (~)p k q 11-k 20 X 0,0l. o.os 0,10 0,20 0,25 0,30 0,40 0,50 N=1 o 93207 69834 47830 20972 13348 08235 02800 00781 7 1 06590 25728 37201 36700 31146 24706 13064 05469 6 2 00200 04062 12400 27525 31146 31765 26127 16406 5 3 00003 00356 02296 11469 17304 22690 29030 27344 4 4 00000 000 19 00255 02867 05768 09724 19354 27344 3 5 00000 00001 00017 00430 01154 0250 1 0774 1 16406 2 6 00000 00000 00001 00036 00 128 00357 01720 05469 1 7 00000 00000 00000 00001 00006 00022 00164 00781 o N =1 0,99 0,95 0,90 0,80 0,75 0,70 0,60 0,50 X X 0,01 0,05 0,10 0,20 0,25 0,30 0,40 0,50 N= 20 o 81791 35849 12158 01153 00317 00079 00003 00000 20 1 ]6523 37735 27017 05765 021 14 00684 00049 00002 19 2 01586 18868 285 18 13691 06695 02785 00309 0001 8 18 3 00096 05958 19012 20536 13390 07 160 01235 00109 17 4 00004 01333 08978 21820 18969 t3042 03499 00462 16 5 00000 00224 03192 17456 20233 17886 07465 01479 15 6 00000 00030 00887 109.10 1.686 1 19164 12441 03696 14 7 00000 00003 00 197 05455 11241 16426 16588 07393 13 8 00000 00000 00035 02216 06089 11440 17970 12013 12 9 00000 00000 00005 00739 02706 06537 15974 16018 li 10 00000 00000 00001 00203 00992 03082 11 714 17620 10 li 00000 00000 ººººº 00046 0030 1 0120 1 07100 160 18 09 12 00000 00000 00000 00009 00075 00386 03550 12013 08 13 00000 00000 00000 00001 00015 00102 01456 07393 07 14 00000 00000 00000 00000 00002 00022 00485 03696 06 IS 00000 00000 00000 00000 00000 00003 00130 01479 05 16 00000 00000 00000 00000 00000 0000 1 00027 00462 04 J7 00000 00000 00000 00000 00000 00000 00004 00 109 03 18 00000 00000 00000 00000 00000 00000 00001 00018 02 19 00000 00000 00000 00000 00000 00000 00000 00002 OJ 20 00000 00000 00000 00000 00000 00000 00000 00000 00 N= 20 0,99 0,95 0,90 0,80 0,75 0,70 0,60 0,50 X Distribuicão binomial I (n) k 11- k P(X=k)= ,k P q ~ 0,01 0,05 0,10 0,20 o 92274 66342 43047 16777 1 07457 27933 38264 33554 2 00264 05146 14880 29360 3 00005 00542 03307 14680 4 00000 00036 00459 04587 5 00000 00001 00041 00917 6 00000 00000 00002 001 15 7 00000 00000 00000 00008 8 00000 00000 00000 00002 N=8 0,99 0,95 0,90 o,so 0,25 0,30 0,40 10011 05765 01680 26697 19765 08958 31146 29648 20902 20764 254 12 27869 08652 13614 23224 02307 04667 12386 00385 01000 04129 00037 00122 .00786 00001 00007 00066 0,75 0,70 0,60 0,50 00390 03 125 10938 21875 27344 21875 10938 03 125 00390 0,50 1\'= 8 8 7 6 5 4 3 2 1 o ---;-..z_ n;i g õi "' a. <l> a. ~ · :::!. O" e .i)' °' <l> "' ~ 344 Estatística básica Distribuicão binomial • 25 P( X = k) = ( ~) pk q"-k ~ 0,0l 0,05 0,10 0,20 0,25 0,30 0,40 0,50 N=2S o 77782 27739 07179 00378 00075 00013 00000 00000 25 1 19642 36499 19942 02361 00627 00 144 00005 00000 24 2 0238 1 ?30-., - ~ .)_ 26589 07084 02508 00739 00038 00001 23 3 00184 09302 22650 13577 064 10 02428 00194 00007 22 4 00010 02692 13841 18668 11 753 05723 00710 00038 21 5 00001 00595 06459 19602 16454 10302 01989 00158 20 6 00000 00104 02392 16335 18282 14717 04420 00528 19 7 00000 00015 00722 11084 1654 1 17119 07999 01433 18 8 00000 00002 00 180 06235 12406 16508 11998 03??' . _ .. J 17 9 00000 00000 00038 02944 078) 1 13364 15109 06088 .16 10 00000 00000 00007 01178 04166 09164 16116 09742 15 li 00000 00000 00001 00401 01894 05355 14651 13284 14 12 ººººº 00000 0000000117 00736 02678 11 395 15498 13 13 00000 00000 00000 00029 00245 01148 07597 15498 12 14 00000 00000 00000 00006 00070 00421 04341 13284 li 15 00000 00000 00000 00001 00017 00133 02 122 09742 10 16 00000 00000 00000 00000 00004 00035 00884 06088 09 17 00000 00000 00000 00000 00001 00008 00312 03223 08 18 00000 00000 00000 00000 00000 00001 00091 01433 07 19 00000 00000 00000 00000 00000 00000 00023 00528 06 20 00000 00000 00000 00000 00000 00000 00005 00 158 05 21 00000 00000 00000 00000 00000 00000 00001 00038 04 22 00000 00000 00000 00000 00000 00000 00000 00007 03 23 00000 00000 00000 00000 00000 00000 00000 00001 02 24 00000 00000 00000 00000 00000 00000 00000 00000 01 25 00000 00000 00000 00000 00000 00000 00000 00000 00 N= lS 0,99 0,95 0,90 0,80 0,75 0,70 0,60 0,50 X ) Tabelas de distribuições 345 Distribuicão binomial I 30 P(X = k) =(~)pkqn-k X 0,01 0,05 0,10 0,20 0,25 0,30 0,40 o,so N=30 o 73970 21464 04239 00124 00018 00002 00000 00000 30 1 22415 33890 14130 00929 00179 00029 00000 00000 29 2 03283 25864 22766 03366 00863 00180 00004 ººººº 28 3 00310 12705 23609 07853 02685 00720 00027 00000 27 4 00021 04514 17707 13252 06042 02084 00120 00002 26 s 00001 01235 10231 17228 10473 04644 00415 00013 25 6 00000 0027 1 04736 17946 14546 08293 01 152 00055 24 7 00000 00049 01804 15382 16624 12 185 02634 00190 23 8 00000 00007 00576 11056 15931 15014 05049 00545 ?? -- 9 00000 0000 1 00157 06756 12981 15729 08227 01333 21 10 00000 00000 00037 03547 09086 14156 11 519 02798 20 II 00000 00000 00007 01612 05507 11031 13962 05088 19 12 00000 00000 00001 00638 02906 07485 14738 08055 18 13 00000 00000 00000 00221 01341 04442 13604 11154 17 14 00000 00000 00000 00067 00543 02312 11013 13544 16 15 00000 00000 00000 00018 00193 01057 0783 1 14446 IS 16 00000 00000 00000 00004 00060 00425 04894 13544 14 17 00000 00000 00000 00001 00017 00150 02687 11154 13 18 00000 00000 00000 00000 00004 00046 01294 08055 12 19 00000 00000 00000 00000 00001 00012 00545 05088 11 20 00000 00000 00000 00000 00000 00003 00200 02798 10 21 00000 00000 00000 00000 00000 0000 1 00063 01333 09 22 00000 00000 00000 00000 00000 00000 00017 00545 08 23 00000 00000 00000 00000 00000 00000 00004 00190 07 24 00000 00000 00000 00000 00000 00000 00001 00055 06 25 00000 00000 00000 00000 00000 00000 00000 000 13 05 26 00000 00000 00000 00000 00000 00000 00000 00002 04 27 00000 00000 00000 00000 00000 00000 00000 00000 03 28 00000 00000 00000 00000 00000 00000 00000 00000 02 29 00000 00000 00000 00000 00000 00000 00000 00000 Ol 30 00000 00000 00000 00000 00000 00000 00000 00000 00 .N= 30 0,99 0,95 0,90 0,80 0,75 0,70 0,60 0,50 X Distribuicão binomial I P(X = k) = ( ~) pk q"-k ~ , 5 6 7 8 9 10 15 o 40188 33490 27908 23257 19381 16150 06491 1 40 188 40 188 39071 37211 34885 32301 19472 2 16075 20094 23443 26048 27908 29071 27260 3 03215 05358 07814 10419 13024 15505 23626 4 00322 00804 01563 02605 03907 05427 14175 5 00012 00064 00188 00417 00781 01302 06237 6 00002 00013 00041 00104 002 17 02079 7 00000 00002 00009 00025 00535 8 00000 00001 00002 00107 9 00000 00000 00016 10 00000 00002 li 00000 12 00000 13 00000 14 00000 15 00000 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 20 25 30 02609 01048 00421 10434 05241 02528 19824 12579 07330 23789 19288 13683 20220 212 17 18472 12941 17822 l 921.1 06471 11881 16009 02588 06450 10978 00841 02903 063 12 00224 01097 03086 00049 00351 01296 00009 00096 00471 00001 00022 00149 00000 00004 00041 00000 00001 00010 00000 00000 00002 00000 00000 00001 00000 00000 00000 00000 00000 00000 00000 00000 00000 00000 00000 00000 00000 00000 00000 00000 00000 00000 00000 00000 00000 00000 00000 00000 00000 00000 00000 1 p=6 ~ o 1 2 3 4 5 6 7 8 9 10 li 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 w ... O> m "' íii -c;; ':. () !l> Cf ,.,.. "' õ. Ql Tabelas de distribuições 347 Distribuicão t de Student I P(t> ta) = a q>!a 0,1 0,05 0,025 0,01 0,005 alq> l 3,0777 6,3 137 12, 7062 3 1,8210 63,559 1 2 1 ,8856 2,9200 4,3027 6,9645 9,9250 2 3 1,6377 2,3534 3,1824 4,5407 5,8408 3 4 1 ,5332 2,13 18 2,7765 3,7469 4,604 1 4 5 1,4759 2,0 150 2,5706 3,3649 4,032 1 5 6 1 ,4398 1,9432 2,4469 3, 1427 3,7074 6 7 1,4 149 1 ,8946 2,3646 2,9979 3,4995 7 8 1 ,3968 1,8595 2,3060 2,8965 3,3554 8 9 1 ,3830 1,8331 2,2622 2,8214 3,2498 9 10 1,3722 1,8125 2,2281 2,7638 3, 1693 10 li 1,3634 1,7959 2,20 1 o 2,718 1 3,1058 11 12 1 ,3562 1,7823 2,1788 2,6810 3,0545 12 13 1,3502 1,7709 2, 1604 2,6503 3,0123 13 14 1,3450 1, 76 13 2,1448 2,6245 2,9768 14 15 1,3406 1 ,7531 2, 1315 2,6025 2,9467 15 16 1,3368 1,7459 2,1199 2,5835 2,9208 16 17 1 ... ~ .. 4 ,..'>~,., 1 ,7396 2, 1098 2,5669 2,8982 17 18 1 ,3304 1,7341 2, 1009 2,5524 2,8784 18 19 1,3277 1,7291 2,0930 2,5395 2,8609 19 20 1,3253 1,7247 2,0860 2,5280 2,8453 20 21 1,3232 1,7207 2,0796 2,5176 2,83 14 2.1 22 1,3212 1,7171 2,0739 2,5083 2,8188 22 23 1,3195 1,7139 2,0687 2,4999 2,8073 23 24 1,3 1 78 1,7109 2,0639 24922 ' 2,7970 24 25 1,3 163 1, 7081 ., 0-9 --, ) :> 2,485 1 2,7874 2S 26 1,3150 1,7056 2,0555 2,4786 2,7787 26 27 1,3137 1,7033 2,05 18 2,4727 2.7707 27 28 1,3125 1,7011 2,0484 2,467 l 2,7633 28 29 1,3 114 1,6991 2,0452 2,4620 2,7564 29 30 1,3104 1,6973 2,0423 2,4573 2,7500 30 35 1,3062 1,6896 2,0301 2,4377 2,7238 35 40 1,3031 1,6839 2,021 1 2 4'' ' ' ..... l~l 2,7045 40 45 1,3007 1,6794 2,0141 2,4 12 1 2,6896 45 50 1,2987 1 ,6759 2,0086 2,4033 2,6778 50 60 1,2958 1,6706 2,0003 2,390 1 2,6603 60 70 1,2938 1,6669 1 ,9944 2,3808 2,6479 70 80 1,2922 1,6641 1,9901 2,3739 2,6387 80 90 1,291 o 1,6620 1 ,9867 2,3685 2,6316 90 100 1,2901 1,6602 1 ,9840 2,3642 2,6259 100 1000 1,2824 1,6464 1 ,9623 2,330 1 2,5807 1000 348 Estatística básica Distribuição X2 de qui-quadrado P(X2 >X ~ ) = a -+-~~~~~~~-1~---=: === ~ x z x! 9 1a 0,995 0,99 0,975 0,95 0.9 0,8 0.75 0;25 0,2. O.l o.os 0.025 0.01 0,005 a/9 1 3,927E.-5 0,0002 0,0010 0,0039 0,0158 0,0642 0,1015 1,3233 1,6424 2,7055 3,8415 5,0239 6,6349 7,8794 1 2 0.0100 0,0201 0.0506 º· 1026 0.2107 0.4463 0,5754 2.7726 3.2189 4.6052 5.9915 7.3778 9,2104 10.5965 2 3 0.07Ji 0.1148 0.2158 0.35 JS 0.5844 1.0052 1,2125 4, 1083 4.64 16 6.2514 7,8147 9.3484 JJ .3449 12.8381 3 4 0,2070 0,2971 0,4844 0.7107 1,0636 1,6488 1,9226 S,3853 S,9886 7,7794 9,4877 11,1433 13,2767 14.8602 4 5 0,411 8 0,5543 0,8312 1,1 455 1.6 103 2,3425 2,6746 6,6257 7.2893 9,236:1 1 J,0705 12,8325 15,0863 16,7496 5 6 0,6757 0,8721 1,2373 1,6354 2,2041 3,0701 3,4546 7,8408 8,$581 10,6446 12,5916 14,4494 16.8 11 9 18,5475 6 7 0,9893 1,2390 1,6899 2.1673 2,8331 3,8223 4,2549 9,0371 9,8032 12,0170 14,0671 16,0128 IS,4753 20,2777 7 8 1.3444 1.6465 2, 1797 ? T?6 - · >- 3.4895 4,5936 5.0706 10,2 189 11.0301 13.3616 15,5073 175345 20,0902 21.9549 8 9 1.7349 2.0879 2,7004 3.3251 4, 1682 5,3801 5.8988 11 .3887 12,2421 14,6837 16,9190 19.0228 21.6660 23,5893 9 10 2, 1558 2,5582 3,2470 3,9403 4,8652 6,1791 6,7372 12,5489 13,4420 15,9872 18,3070 20,4832 23,2093 25, 1881 10 li 2,6032 3,0535 3.8157 4.5748 5.5778 6.9887 7,5841 13.7007 14.6314 17,2750 19.6752 2 1.9200 24.7250 26.7569 li 12 3,0738 3,5706 4,4038 5,2260 6,3038 7,8073 8,4384 14,8454 15,8120 18,5493 21 ,0261 23.3367 26,2170 28,2997 12 13 3.5650 4,1069 5.0087 S,8919 7,0415 8,6339 9.2991 15.9839 16.9848 19.81 19 22,3620 2•1.7356 27.6882 29,8193 13 14 4,0747 4,6604 5,6287 6,5706 7,7895 9,4673 10,1653 17,1169 18,1508 21 ,0641 23,6848 26,1189 29,1412 31,3194' 14 IS 4.6009 5,2294 6.2621 7.2609 S.5468 10,3070 11.0365 18.2451 19.3 107 22.3071 24.995$ 27.4884 30.57$0 32.$015 15 16 5, 1422 5.8 122 6,9077 7,%16 9,3 122 11, 1521 11,9122 19,3689 20,4651 23,5418 26,2962 28,8453 31 ,9999 34,2671 16 17 5,6973 6.4077 7,5642 S.6718 10.0852 12,0023 12.7919 20,4887 2 1.6 146 24,7690 27.5871