Prévia do material em texto
Probabilidade Atividade de lançamento de dados Formação de números Problema dos oito casais Ideias iniciais D1 D2 soma Soma Fi fi dígitos : 1, 4, 7, 8, 9 7por10 15por20 19por30 1 9 3 14 8 1 3 16 5 9 12 10 - Experimentação 2 5 7 2 2 0,020 147 417 714 814 914 419 791 974 2 10 16 11 3 9 4 6 1 15 4 12 - Experimentos determinísticos e aleatórios 2 6 8 3 3 0,030 148 418 718 817 917 917 479 918 3 11 c c 5 3 8 4 10 0,100 149 419 719 819 918 871 489 174 4 12 A teoria das probabilidades estuda a forma de estabelecer as possibilidades de ocorrência de cada experimento aleatório. 4 1 5 5 11 0,110 174 471 741 841 941 871 491 784 5 13 3 2 5 6 13 0,130 178 478 748 847 947 478 194 741 6 14 Experimento aleatório - É aquele que quando repetido em iguais condições podem fornecer resultados diferentes, ou seja, são resultados explicados ao acaso. 5 4 9 7 17 0,170 179 479 749 849 948 714 789 941 7 15 3 5 8 8 13 0,130 184 481 781 871 971 198 198 748 8 16 Elementos (o que temos que conhecer para se compreender probabilidade) 1 1 2 9 16 0,160 187 487 784 874 974 847 814 948 Espaço amostral - descrição dos possíveis resultados de um experimento. Denotamos pela letra S 5 2 7 10 8 0,080 189 489 789 879 978 791 947 187 5 3 8 11 6 0,060 194 491 791 891 981 497 189 817 Evento - um dos resultados contidos no espaço amostral. Denotamos com as letras A, B etc 5 4 9 12 1 0,010 197 497 794 894 984 417 978 1 2 3 Σ 100 1,000 198 498 798 897 987 481 194 Nomenclatura - Sabemos que, pela teoria dos conjuntos, n(A) é o número de elementos do conjunto A. Se A é um subconjunto de S, então P(A) = n(A)/n(S) 5 4 9 789 498 4 5 9 30por50 479 978 3 6 9 987 841 719 Assim, probabilidade é a associação quantitativa à ocorrência de um evento dentro de seu espaço amostral. 4 1 5 981 918 718 5 2 7 978 491 198 O que acabamos de ver foi a definição de probabilidade teórica. Essa probabilidade serve apenas para experimentos que se encaixam perfeitamente em espaços amostrais bem definidos (que estão em nossas mentes). 3 1 4 479 814 817 6 5 11 148 718 814 1 5 6 947 491 897 Excercícios iniciais 1 3 4 948 849 No caso de um experimento empírico 1 6 7 198 481 Precisamos de um número, associado a um evento, que avaliará o quão verossível será a ocorrência desse evento quando o experimento for realizado. 1 6 7 918 498 3 3 6 917 481 Ao repetirmos um experimento várias vezes, digamos n vezes, veremos que os resultados seguirão uma certa tendência. Isso é verificado pela frequência relativa f do evento em questão, fA = n(A)/n,ou seja, o número de vezes que o evento A se repete dividido pelo número de repetições do experimento. Jogue uma moeda para cima e observe o resultado, faça isso umas 1.000 vezes e verifique qual a frequência relativa de cada face da moeda. Faça o mesmo com um dado de 6 faces e verifique a frequência relativa de cada face. 6 4 10 947 784 2 2 4 184 894 1 1 2 874 198 1 6 7 714 874 1 3 4 198 974 6 1 7 417 971 4 4 8 897 Francês conde de Buffon (1707 - 1788) lançou uma moeda 4.040 vezes resultando 2.048 caras. Assim, fC = 2048/4040 = 0,507 = 50,7% . O Sul- africano John Kerrich durante a 2° guerra lançou uma moeda 10.000 vezes e obteve 5.067 caras, ou seja, fC = 0,507 = 50,7%. Antes disso, em 1900, o inglês Karl Pearson lançou uma moeda 24.000 vezes resultando 12.012 caras. Então, fC = 12012/24000 = 0,5005 = 50,05% . 3 5 8 894 2 1 3 894 2 4 6 978 4 6 10 187 5 4 9 941 É possível mostrar matematicamente, mas também empiricamente, que para n suficientemente grande (geralmente tendendo ao infinito) fA ~ P(A) . 4 2 6 419 3 2 5 471 6 4 10 978 Propriedades : 2 2 4 817 1 5 6 784 1) P(A) estará sempre entre 0 e 1 , podendo assumir valor 0, se o evento nunca ocorrer e, assumir valor 1, se o evento ocorrer em todas as repetições do experimento. 6 3 9 784 4 3 7 487 2) Σ pi = 1 ( a soma de todas as probabilidades de S é 1,00) 5 6 11 189 3) A U B (união de eventos) significa que A ou B ocorre, ou ambos. 6 2 8 481 4) A ∩ B (interseccão de eventos) significa que A e B ocorreram . 5 1 6 789 5) A' (ou A barra, ou A complementar) significa que o evento não ocorreu. 1 5 6 984 3 4 7 791 Operações: 1 2 3 918 1) P(A U B) = P(A) + P(B) - P(A ∩ B) 2 2 4 719 2) P(A') = 1- P(A) 3 6 9 847 3) P(A/B) = P(A ∩ B)/P(B) probabilidade condicionada 4 4 8 487 Observações importantes que devem ser consideradas em muitas situações 5 1 6 741 Se P(A/B) for igual a P(A), então os eventos A e B são independentes. 1 5 6 487 Se dois eventos são independentes, então P(A ∩ B) = P(A).P(B) 3 3 6 871 Se dois eventos são mutuamente excludentes, P(A ∩ B) = 0, então P(A U B) = P(A) + P(B) 6 5 11 879 5 5 10 784 5 4 9 814 Exemplo: Lançaremos dois dados equilibrados. Qual a probabilidade da soma ser 8 e um dos dados apresentar 6 pontos? Verifique a dependência desses eventos. 6 6 12 471 5 3 8 481 4 3 7 184 Utilizaremos uma tabela de contingência para colocar a frequência relativa de cada evento, um evento na linha e outro na coluna com seus respectivos complementares. (isso nos traz um entendimento melhor das operações). 4 3 7 149 4 5 9 847 4 5 9 917 Espaço amostral n(S) = 36 5 2 7 A : a soma dá 8 {(2,6),(3,5),(4,4),(5,3),(6,2)} 1 2 3 4 5 6 2 2 4 B: um dos dados apresenta 6 {(1,6),(2,6),(3,6),(4,6), (5,6),(6,6),(6,1),(6,2), (6,3),(6,4), (6,5)} 1 2 3 4 5 6 7 3 2 5 2 3 4 5 6 7 8 3 1 4 3 4 5 6 7 8 9 6 5 11 A ∩ B : {(2,6),(6,2)} 4 5 6 7 8 9 10 1 5 6 n(A ∩ B) = 2 5 6 7 8 9 10 11 3 1 4 P(A ∩ B) = 2/36 = 0,056 6 7 8 9 10 11 12 6 5 11 e 4 3 7 n(A) = 5 --> P(A) = 5/36 = 0,139 1 6 7 n(B) = 11 --> P(B) = 11/36 = 0,306 3 5 8 P(A') = 0,861 P(B') = 0,694 2 3 5 No total, temos a probabilidade de cada evento e seu complementar, no interior temos as probabilidades das intersecções dos eventos (evento e). 3 1 4 A A' total 3 2 5 B 0,056 0,250 0,306 4 2 6 B' 0,083 0,611 0,694 4 5 9 total 0,139 0,861 1,000 2 5 7 5 3 8 Pelo que foi visto, se P(A∩B) for igual a P(A).P(B), então A e B são independentes 4 6 10 P(A).P(B) = 0,139*0,306 = 0,043 ≠ P(A∩B) 4 1 5 5 2 7 Exemplo de evento união. 6 4 10 Qual a probabilidade de apresentar soma 8 ou um dos dados apresntar 6? 1 5 6 P(AUB) = P(A) + P(B) - P(A∩B) = 0,139 + 0,306 - 0,056 = 0,389 6 4 10 6 5 11 Probabilidade condicional (a probabilidade da soma ser 8, sabendo que um dos dados apresenta 6 pontos). 3 4 7 3 6 9 P(A/B) = P(A∩B)/P(B) = 0,056/0,306 = 0,183 3 6 9 5 5 10 Atividades 2 3 5 exercícios cap. 4 do livro do Martins 3 6 9 atividade probabilidade condicional morettin (site) 4 1 5 1 4 5 Considerações sobre o espaço amostral. 6 2 8 O espaço amostral é formado pelos resultados de um experimento realizado numa determinada população. Se o experimento consiste em escolher uma quantia de individuos de uma população, o espaço amostral será composto de uma combinação específica de indivíduos.... 4 4 8 6 3 9 Operaçãoes com probabilidades. (Utililizando Tabelas de contingência, dupla entrada) Numa universidade foi feito um levantamento que resultou num cruzamento entre as variáveis gênero e curso escolhido. Gênero façamos: Curso MasculinoFeminino Total A -> Ser masculino Administração 60 80 140 B -> ser do curso de Adm. Outro 258 200 458 Total 318 280 598 Escolhendo-se um estudante ao acaso (aleatoriamente), Gênero Curso A A' Total B 0,100 0,134 0,234 B' 0,432 0,334 0,766 Total 0,532 0,468 1,000 Qual a probabilidade de ele ser do sexo masculino? P(A) Qual a probabilidade de ele ser do curso de Adm? P(B) Qual a probabilidade de ele ser do sexo masculino e do curso de Adm? P(A e B) , P(A ∩ B) Qual a probabilidade de ele ser do sexo masculino ou do curso de Adm? P (A ou B) , P(A U B) Sabendo que o aluno escolhido é do curso de Adm, qual a probabilidade de ele ser do sexo masculino? P(A/B) Agora faça você mesmo. 1) Num quartel 2) Num clube promoção sexo total Idade Estado civil totalM F solteiro casado sim 288 36 324 < 30 77 14 91 não 672 204 876 >= 30 28 21 49 total 960 240 1.200 total 105 35 140 P(M|S) 0,89 P(M|N) 0,77 P(F|S) 0,11P(F|N) 0,23 De acordo com o quadro 01, 80% dos indivíduos que servem o quartel são do sexo masculino enquanto que 20% são do sexo feminino. Quanto à promoção, tem-se a seguinte análise: Dentre os homens, 30% foram promovidos, enquanto que dentre as mulheres, apenas 15% tiveram algum tipo de promoção. Nota-se, assim, que os homens são promovidos duas vezes mais que as mulheres. olhando por outro lado, apenas 27% do quadro geral foi promovido. Sendo desses, 89% do sexo masculino e 11% do sexo feminino. Mais umas vez comprovando que mais homens são promovidos do que mulheres. De acordo com o que foi expoto, temos indícios de que a promoção nesse quartel depende do sexo do indivíduo. Verificamos uma situação hipotética: A probabilidade da Dilma sofrer impeachment é de 57%, a do Cunha renunciar a presidência do comgresso é de 48%. A probabilidade desses políticos saírem juntos é de 27,36%. Será que esses eventos são independentes? Ou seja, será que a ocorrência de um deles afeta a probabilidade do outro? Para responder essa questão, chamamos os eventos: A: Dilma sofrer impeachment P(A) = 0,57 B : Cunha renunciar a presidência do comgressoP(B) = 0,48 A e B ( A ∩ B) : os dois políticos saírem juntos P(A ∩ B) = 0,2736 Aplicamos a probabilidade condicionada P(A/B) = P(A ∩ B)/P(B) = 0,2736/0,4800 = 0,57 Como P(A/B) = P(A) , os eventos A e B são independentes. A A' Total B 0,2736 0,4800 B' Total 0,5700 1,0000 Assim, a renúncia de Cunha não altera a probabilidade do Impeachment de Dilma. Poderíamos interpretar de uma forma bem parecida, verificando a informação a respeito da ocorrência de um dos eventos. Quer dizer, se soubermos que Cunha renunciou, ou poderá renunciar, não podemos concluir nada a respeito da mudança das chances de ocorrência do Impeachment da presidente. Assim, a renúncia de Cunha não altera a probabilidade do Impeachment de Dilma. Poderíamos interpretar de uma forma bem parecida, verificando a informação a respeito da ocorrência de um dos eventos. Quer dizer, se soubermos que Cunha renunciou, ou poderá renunciar, não podemos concluir nada a respeito da mudança das chances de ocorrência do Impeachment da presidente. Probabilidade total Teorema de Bayes , uma extensão das condicionais e probabilidade total A probabilidade total é uma forma de escrevermos a probabilidade de um evento decomposta em várias parcelas (várias somas) Essa fórmula reavalia as probabilidades a priori por meio de probabilidades posterioris ao evento. Fórmula geral Fórmula geral P(B) = Σ P(Ai ∩ B) = Σ P(Ai).P(B/Ai) (sucessivas somas de intersecções) Sendo Ai um dos eventos causa (a priori) e B um evento efeito (posteriori), de acordo com Bayes, é possível verificar a probabilidade de um dos eventos causa ter ocorrido tendo conhecimento prévio de um evento efeito.Se tivermos apenas dois eventos em questão, então a probabilidade total fica assim: P(A) = P(A ∩ B) + P(A ∩ B') , como podemos verificar no esquema a seguir. P(Ai/B) =(Ai ∩ B)/P(B) A A' Total B P(A ∩ B) P(A' ∩ B) P(A ∩ B) + P(A' ∩ B) P(Ai ∩ B) --> regra do produto --> P(Ai).P(B/Ai) B' P(A ∩ B') P(A' ∩ B') P(A ∩ B') + P(A' ∩ B') Total P(A ∩ B) + P(A ∩ B') P(A' ∩ B) + P(A' ∩ B') P(B) --> probabilidade total --> Σ P(Ai).P(B/Ai) O mesmo se pode fazer para P(B) e os demais eventos. Exemplo 1 - Um grande gurú do agronegócio consegue prever a germinação de plantações de tomate com boa margem de acerto. Sabe-se que plantações de tomate, de um modo geral, tem 10% de probabilidade de não germinarem. Nosso grande gurú acerta em 90% de todas vezes em que diz que a plantação germina e 80% quando diz que a plantação não germina. Qual a probabilidade de uma plantação de tomate não germinar, sabendo que o gurú disse que ela não germina? Quando tivermos um evento (D) que faz intersecção como outros três eventos mutuamente exclusivos (A , B e C), então a probabilidade total fica assim: P(D) = P(A ∩ D) + P(B ∩ D) + P(C ∩ D) Como, pelas condicionas, P(A ∩ D) = P(A).P(D/A) Sejam os eventos P(B ∩ D) = P(B).P(D/B) A: a plantação germina A': a plantação não germina P(C ∩ D) = P(C).P(D/C) B: o gurú diz que germina B': o gurú diz que não germina Substituindo, teremos: P(A) = 0,9 P(A') = 0,1 O Gurú de fato anunciou a perda da colheita. Então estamos interessados e verificar qual a prob de isso acontecer. P(D) = P(A).P(D/A) + P(B).P(D/B) + P(C).P(D/C) P(B/A) = 0,9 P(B'/A') = 0,8 P(B'/A) = 0,1 P(B/A') = 0,2 Exemplo 1: Sabendo que o estudante é homem, a probailidade dele ser do curso de engenharia é de 30%, se ele for mulher, a probabilidade é de 12%. Se 60% dos estudantes da universidade são mulheres, qual a probabiilidade de um estudante (aleatoriamente escolhido) ser do curso de engenharia? P(A'/B') = P(A' ∩ B') / P(B') Eventos: com P(A' ∩ B') = P(A').P(B'/A') A: o estudante é homem , A' é mulher e P(A' ∩ B') = 0,1.0,8 = 0,08 B: o estudante é do curso de engenharia, B' outro curso P(B') = P(A ∩ B') + P(A' ∩ B') = P(A).P(B'/A) + P(A').P(B'/A') P(B/A) = 0,30 P(B') = 0,9.0,1 + 0,1.0,8 = 0,17 P(B/A') = 0,12 Pelo que foi visto inicialmente: P(A') = 0,60 P(B) = P(A ∩ B) + P(A' ∩ B) = P(A).P(B/A) + P(A').P(B/A')P(A'/B') = 0,08/0,17 = 0,471 P(A) = 0,40 P(B) = 0,40.0,30 + 0,60.0,12 P(B) = ? P(B) = 0,192 Dessa forma, sabendo que o Gurú disse que plantação não germina, a probabilidade de ela não germinar é de 47,1%. Assim, a probabilidade de um estudante ser do curso de engenharia é de 19,2%. Exemplo 2: Controle de qualidade. (garantir a conformidade dos produtos além de diminuir custos). Numa fábrica, 90% dos produtos com defeito são classificados como produtos defeituosos pelo teste de controle de qualidade. 1% dos produtos bons são classificados como defeituosos. Num lote com 5% de produtos defeituosos, se o teste de controle indicar que o produto deva ser rejeitado, qual a probabilidad e ele estar bom? (Nesse caso, um produto bom estaria sendo rejeitado) Exemplo 2: O movimento no centro de Cacoal é formado por clientes oriundos de várias partes da cidade. 50% deles são da zona leste, 20% da zona oeste e 30% da zona sul. Sabendo que o cliente é da zona leste, a probabilidade de ele ter consumido algo no centro é de 20%, se for da zona oeste, a probabilidade é de 15% e, se o cliente for da zona sul, a probabilidade é de 30%. Num certo dia, escolhendo-se um cliente que esteja no centro da cidade, qual a probabilidade dele ter consumido algum produto? Sejam os eventos: Sejam os eventos: A: o produto é bom A: clientes da zona leste , P(A) = 0,50 A': o produto tem defeito (não é bom) B: clientes da zona oeste, P(B) = 0,20 B: O produto foi classificado como bom pelo teste de controle C: clientes da zona sul , P(C) = 0,30 B': O produto foi classificado como defeituoso pelo teste de controle D: clientes que adquiriu (consumiu) um produto P(D/A) = 0,20 Num lote com 5% de produtos defeituosos, tem-se: P(D/B) = 0,15 P(A) = 0,95 e P(A') = 0,05 P(D/C) = 0,30 Sabendo que P(B'/A) = 0,01 , P(B'/A') = 0,90 , procura-se P(A/B') . Pelo que foi visto, P(D) = P(A).P(D/A) + P(B).P(D/B) + P(C).P(D/C) Pelo que foi exposto no início, P(D) = 0,50.0,20 + 0,20.0,15 + 0,30.0,30 P(D) = 0,220 P(A/B') = P(A ∩ B')/ P(B') Dessa forma, a probabilidade de um cliente qualquer vir a consumir um produto do centro da cidade de Cacoal é de 22,0%, ou seja, somente 22% das pessoas que frequentam o centro da cidade efetivamente adquirem algum produto. P(A/B') = P(A).P(B'/A) / P(A).P(B/A) + P(A').P(B/A') P(A/B') = 0,95.0,01 / 0,95.0,01 + 0,05.0,90 P(A/B') = 0,0095 / 0,05450 P(A/B') = 0,174 Distribuição de variáveis categóricas Tabela 03 - Gênero dos funcionário da companhia XPTO Gênero Frequência Porcentagem Masculino 28 56,0% Feminino 22 44,0% Soma 50 100,0% Fonte: Martins, 2011 Tabela 08 - Grau de ralacionamento dos funcionários da companhia XPTO Grau de satisfação com o chefeFrequência Porcentagem Faça os gráficos Muito bom 14 28,0% Bom 15 30,0% Regular 14 28,0% Ruim 2 4,0% Muito Ruim 5 10,0% Soma 50 100,0%Fonte: Martins, 2011 Tabela 3 - Percentual, por área, de estudantes que pretendem um nível superior Área de estudo Frequência Percentual Artes & Humanidades 323 13,5 Ciências Biológicas 222 9,3 Administração 404 16,9 Educação 196 8,2 Engenharia 225 9,4 Ciências Físicas 76 3,2 Profissional 330 13,8 Ciências Sociais 275 11,5 Técnico 24 1,0 Outra 315 13,2 Soma 2.390 100,0 Fonte: Moore, 2014 Tabela 4 - Impactos causados sobre sua vida pelos aparelhos/plataformas Plataforma/Aparelho Percentual de usuários que disseram grande impacto Celunar 54,0 Banda Larga 49,0 iPhone 45,0 Blackberry 44,0 Televisão 34,0 Radio Satélite 27,0 iPod 27,0 Gravador Vídeo Digital 27,0 E-Leitora 24,0 Rádio AM-FM 22,0 Redes Sociais 20,0 Fonte: Moore, 2014 Tabela 5 - Níveis de audiência em um dado instante de tempo, para os formatos mais populares de programa de rádio Formato Nível Audiência (%) Notícias/Conversa/Informação12,6 Sertaneja 12,5 Contemporâneo Adulto 8,2 Sucessos Contemporâneos Pop 5,9 Rock Clássico 4,7 Sucessos Clássicos 3,9 Sucesso Contemporâneo Rítmico3,7 Contemporâneo Urbano Adulto3,6 Contemporâneo Adulto Picante 3,5 Contemporâneo Urbano 3,3 Regional Mexicano 2,9 Esportes 2,5 Soma 67,3 Fonte: Moore, 2014 Tabela 6 - Fontes de recursos que os estudantes utilizam para as despesas da faculdade Fonte Percentual Recursos Familiares 78,2 Recursos Estudante 62,8 Ajuda Não Reembolsável 70,0 Ajuda Reembolsável 53,4 Outra 6,5 Fonte: Moore, 2014 Tabela 7 - Números médios de bebês nascidos em cada dia da semana, em 2008 Dia Nascimentos Porecentagem Dom 7.534 Seg 12.371 Ter 13.415 Qua 13.171 Qui 13.147 Sex 12.919 Sab 8.617 Σ 81.174 Fonte: Moore, 2014 Distribuição de variáveis quantitativas contínuas Quadro 1 - Dados dos funcionários da companhia XPTO (anexo A do livro texto) Ordem Idade Escolaridade em anosGenero Renda anual em 1.000,00Renda familiar anual em 1.000,00Tempo de trabalho em anosTempo de trabalho na empresaGrau de ralacionamento entre empregado e chefe 43 18 12 Masculino 11,5 55,5 1 1 Muito ruim 2 20 20 11 Masculino 10,5 14,3 3 1 Muito bom 5 47 21 14 feminino 16,3 60,7 3 0,66 Muito bom 16 4 23 14 Masculino 20,2 20,2 3 1,5 Muito bom 17 22 24 12 feminino 24,3 27,4 7 5 Bom 20 8 25 13 feminino 18 49,5 10 1,5 Bom 26 19 25 16 Masculino 33,1 33,1 7 1 Bom 27 48 26 16 feminino 44,7 65,3 13 3,5 Muito bom 28 35 27 17 feminino 20,4 36,2 11 7 Bom 38 42 28 16 feminino 17 20 7 2 Muito ruim 39 50 28 10 Masculino 15 20 6 5 Bom 40 24 30 16 Masculino 33,8 33,8 14 5 Regular 41 40 32 12 Masculino 15,4 15,4 16 0,16 Regular 42 3 33 15 Masculino 40,5 85,6 12 9 Bom 45 5 33 12 feminino 25,2 25,2 15 4 Muito bom 46 23 33 10 Masculino 33,3 42,8 17 5 Bom 47 37 33 16 feminino 21,6 46,6 12 2,58 Muito ruim 48 44 33 16 feminino 17,7 19,3 14 3 Muito bom 52 13 34 12 feminino 33,3 55,2 12 6 Regular 56 30 34 12 feminino 31,3 67,7 18 3 Bom 59 32 34 12 feminino 30,3 34,2 15 8 Regular 60 45 34 9 feminino 11,8 43,7 18 1,5 Bom 61 1 35 20 Masculino 78,3 85,3 14 3 Regular 62 10 35 16 Masculino 38,4 38,4 15 3 Bom 63 11 35 12 feminino 31 33,5 13 1,5 Regular 68 27 35 15 Masculino 42,7 51,8 18 0,5 Bom 69 28 35 16 Masculino 14,7 46,9 15 0,75 Bom 70 7 37 14 feminino 15 15 10 1,5 Muito bom 72 21 37 13 feminino 35,7 35,7 20 3 Regular 74 38 38 19 Masculino 48,7 68 19 15 Muito bom 80 9 39 18 Masculino 60,8 60,8 15 5 Regular 81 16 39 16 Masculino 64,2 67,2 23 0,5 Muito bom 82 49 39 18 Masculino 75,6 91,8 23 3 Muito bom 83 36 40 13 Masculino 26,3 29,9 23 10 Bom 84 33 41 13 Masculino 16,4 18,5 24 2 Muito bom 85 39 41 15 Masculino 18,4 19,2 23 1 Regular 93 29 42 16 feminino 23,7 51,2 25 5,5 Bom 86 25 43 13 Masculino 25,2 91,8 27 12 Bom 87 34 44 16 feminino 17,9 34,2 9 5,5 Bom 88 46 48 17 feminino 32,8 33,5 22 6 Bom 90 12 49 13 Masculino 76,6 93,5 30 5 Muito bom 92 15 49 4 Masculino 27,5 27,6 31 22,08 Regular 96 14 50 14 feminino 15,8 17,4 20 10 Regular 100 31 50 14 feminino 24,1 69,6 33 3,5 Regular 101 26 56 16 feminino 36,1 36,9 36 30 Muito bom 104 41 58 14 Masculino 53,7 56,5 42 36 Muito bom 107 18 59 16 Masculino 26,6 35,4 43 1,5 Muito bom 108 6 60 14 Masculino 36,7 35,7 40 20 Muito bom 117 17 61 12 feminino 32 34,6 20 0,75 Muito bom 119 2 64 14 feminino 25,7 81,9 25 11 Muito bom 120 51 30 15 feminino 22 32 20 20 Muito bom 52 18 6 Masculino 18 24,5 0,5 0,5 Regular 53 60 14 Masculino 35 45,2 42 25 Bom 54 32 12 Masculino 28 37,8 12 12 Ruim 55 35 15 feminino 30 40,7 10 4 Muito ruim 56 42 15 Masculino 42 42 20 2,5 Bom 57 50 10 feminino 53 60 30 15 Muito bom 58 27 12 Masculino 22,5 32,5 10 5 Muito bom 59 40 17 Masculino 20,1 35,1 18 11,83 Bom 60 27 9 feminino 11,6 48,9 4 4 Muito bom 61 53 16 Masculino 50,6 75,1 36 10 Regular 62 39 13 feminino 22,5 50,3 23 1 Muito bom 63 47 14 Masculino 56,7 59,5 27 5 Regular 64 27 11 feminino 15,5 30,4 5 2 Bom 65 40 10 feminino 17 19,3 13 4 Bom 66 27 12 Masculino 16,5 17 27 0,5 Muito bom 67 35 15 Masculino 43,3 43,3 18 10 Muito bom 68 25 16 Masculino 22 52,3 8 2,5 Muito bom 69 53 9 Masculino 10,2 15,6 34 5 Regular 70 35 16 Masculino 41,3 41,3 13 6,41 Bom 71 43 12 Masculino 54,2 67,9 26 11 Regular 72 33 14 feminino 19,8 62,5 12 2 Bom 73 48 12 Masculino 50 54,1 32 21 Regular 74 29 16 Masculino 23,6 34,8 11 1 Muito bom 75 26 13 feminino 19,3 19,6 10 40 Bom 76 23 16 feminino 16 16,9 6 0,75 Bom 77 30 14 feminino 18,1 41,8 4 1 Muito bom 78 53 12 feminino 21,7 35,7 15 12,5 Ruim 79 53 12 Masculino 39 43,9 30 0,08 Bom 80 43 14 Masculino 30,9 30,9 37 2 Muito bom 81 30 13 Masculino 32,3 39,3 11 10 Bom 82 27 14 Masculino 17,9 46,5 17 0,5 Bom 83 59 15 Masculino 39,8 69 42 6 Muito bom 84 36 16 feminino 37,2 38,8 19 12,5 Regular 85 52 16 Masculino 54,6 56,7 30 21 Regular 86 40 14 Masculino 18,8 57,4 24 1,5 Muito bom 87 29 17 Masculino 39,6 46,6 8 2,83 Ruim 88 40 14 Masculino 78 92,9 23 4,33 Muito ruim 89 36 12 feminino 25,2 25,9 20 10 Bom 90 38 20 Masculino 64,5 65,7 21 4 Bom 91 64 13 feminino 28,6 35,2 21 7 Bom 92 43 16 feminino 61,7 78,8 35 18 Bom 93 28 16 feminino 35,1 38,3 12 0,16 Bom 94 52 14 feminino 20,6 47,3 20 3 Bom 95 48 12 feminino 13,7 36,1 15 1,66 Muito bom 96 52 12 Masculino 40,8 96,2 35 0,08 Muito bom 97 43 12 feminino 19,7 57,8 27 9,41 Bom 98 39 13 feminino 27,1 31,2 21 16 Regular 99 29 15 Masculino 39,2 63,6 8 1 Bom 100 34 14 Masculino 21,1 33,4 17 10 Muito bom 101 25 14 Masculino 28,4 29,9 8 3 Muito ruim 102 32 12 Masculino 15 15 14 1 Muito ruim 103 49 12 feminino 14,6 82,5 20 4 Muito bom 104 40 12 feminino 17,8 17,8 20 0,5 Muito bom 105 39 18 Masculino 29,2 62,6 18 2 Regular 106 32 16 Masculino 23 23,5 15 3 Bom 107 25 10 Masculino 20 20 8 2 Bom 108 42 16 feminino 23,1 34,2 25 12 Ruim 109 37 13 Masculino 26,8 34 18 16 Muito ruim 110 28 12 feminino 19,3 19,3 8 3 Regular 111 23 16 Masculino 10,3 38,4 6 1 Bom 112 37 12 feminino 16,7 26,5 20 10 Muito bom 113 35 12 feminino 15,9 15,9 8 1,5 Regular 114 63 12 feminino 25,8 38,7 45 22 Muito bom 115 29 13 Masculino 23,9 43 10 3 Bom 116 33 14 Masculino 18,9 22,4 16 1 Regular 117 26 12 Masculino 36,3 36,3 10 2,5 Regular 118 50 20 feminino 58 98,7 34 8 Ruim 119 49 15 feminino 25,7 50,8 25 3,41 Regular 120 44 17 Masculino 51,8 61,6 27 22 Muito bom Total 38,1 13,9 120 3632,2 120 120 120 120 25,70 18,325 Faça uma distribuição de frequência para cada variável Calcule as medidas de tendência central e dispersão. Faça interpretações razoáveis 23 Tabela 01 - Idade dos funcinários da companhia XPTO Idade Ponto médio Frequência Porcentagem Acumulada (%) 18|----------28 23 6 12,0% 12,0% 28|----------38 33 17 34,0% 46,0% 38|----------48 43 12 24,0% 70,0% 48|----------58 53 12 24,0% 94,0% 58|----------68 63 3 6,0% 100,0% Σ --------- 50 100,0% ------- Fonte: Martins, 2011 Tabela 3 - Anos de escolaridade dos funcinários................ Escolaridade em anosIdade Média Frequência Porcentagem Acumulada (%) 4|------------8 8|-----------12 12|-----------16 16|-----------|20 Σ Fonte: Martins, 2011 Tabela 4 - Renda anual dos funcinários................ Renda em 1000 reaisRenda Média Frequência Porcentagem Acumulada (%) 10|------------25 25|------------40 40|------------5555|------------70 70|------------85 Σ Fonte: Martins, 2011 Tabela 5 - Renda anual familiar dos funcinários................ Renda em 1000 reaisRenda Média Frequência Porcentagem Acumulada (%) 10|------------25 25|------------40 40|------------55 55|------------70 70|------------85 85|------------100 Σ Fonte: Martins, 2011 Tabela 6 - Tempo de trabalho dos funcionários ................ Tempo em anosTempo médio Frequência Porcentagem Acumulada (%) 0|------------10 10|------------20 20|------------30 30|------------40 40|------------50 Σ Fonte: Martins, 2011 Sendo a variável explorada uma variável quantitativa, então, antes de seguirmos com as análises de correlação, devemos calcular as medidas de centro e dispersão dessa variável. São as medidas descritivas. Moda (Mo) A moda de um conjunto de valores é o valor que mais aparece. Em outras palavras, é o valor de maior frequência, consequentemente maior probabilidade em relação aos demais. Se um conjunto de valores não houver pelo menos uma repetição, então esse conjunto é amodal. Também é possível que num conjunto de valores haja mais de uma moda. Medidas de centro (média , moda e mediana) Média aritmética simples A média aritmética simples é a medida mais difundida num conjunto de dados numéricos. Por definição, a média aritmética é um valor x cuja a soma das distâncias dos valores abaixo dela é igual à soma das distâncias dos valores acima dela, sendo todas as distâncias centradas em x. Classes xi Fi fi (p(xi)) fi Acum Como podemos verificar, a moda está entre 10 e 20 minutos. O valor representativo desse intervalo é o ponto médio 15 minutos. 0|--10 5 8 0,211 0,211 10|--20 15 16 0,421 0,632 20|--30 25 10 0,263 0,895 Seja um conjunto de dados ordenados 30|--40 35 4 0,105 1,000 Digamos que a média aritmética desse conjunto esteja entre o terceiro e o quarto elementos. Então, pela definição, tem-se: Σ ---------- 38 1,000 ---------- Pelo que foi exposto, a maioria das pessoas, 42,1%, utilizam o celular por 15 minutos em média durante todo o dia. Na planilha "variáveis quantitativas", compare a moda da variável antes de organizar os dados numa tabela com a moda depois dos dados organizados em intervalos. Percentis (Pi) Os percentis são probabilidades acumuladas [mais pra frente veremos que os percentis fazem parte de uma função de probabilidade acumulada] De um modo geral, a média aritmética de um conjunto de dados é a soma de todos os valores dividida pelo número de elementos do conjunto. (ou quantis) Em estatística, a média aritmética é representada pela letra x com um traço acima. E as fórmulas como seguem. Classes xi Fi fi (p(xi)) fi Acum Percentil é um valor da variável que abaixo dele há um percentual pré estabelecido de valores. Esses valores devem estar em ordem crescente. caso os valores sejam pontuais e 0|--10 5 8 0,211 0,211 10|--20 15 16 0,421 0,632 20|--30 25 10 0,263 0,895 ou caso os valores sejam intervalares 30|--40 35 4 0,105 1,000 Σ ---------- 38 1,000 ---------- Estas últimas são denominadas médias ponderadas. De acordo com a frequência relativa acumulada (probabilidade acumulada), 21,1% dos usuários de culular utilizam o aparelho por no máximo 10 minutos durante o dia. 63,2%, utilizam o aparelho por no máximo 20 minutos por dia de uso. Assim,P21 = 10 minutos e P63 = 20 minutos. A média amostral (x barra) será um valor próximo à média da população (µ), a diferença é denominada erro amostral da média (e). Assim, , com certa probabilidade de aceitação. Vamos exemplificar com uma variável X: tempo em que a pessoa fica no celular durante dia, em minutos. (essa variável será usada em todas as estatísticas). Há sempre uma pergunta ralacionada ao percentil: Qual é o tempo de uso do celular (neste caso em minutos) que abaixo desse tempo encontramos 25% de todos os usuários? De outra forma, qual é o tempo cuja probabilidade de estar abaixo dele é de 25%? Classes xi Fi fi (p(xi)) fi Acum 0|--10 5 8 0,211 0,211 Neste caso estamos interessados no P25 10|--20 15 16 0,421 0,632 20|--30 25 10 0,263 0,895 Alguns percentis mais usuais: (quartis) 30|--40 35 4 0,105 1,000 P25 --> 1° Quartil, Q1 (abaixo dele se encontram os primeiros 25% elementos do conjunto de valores da variável).Σ ---------- 38 1,000 ---------- P50 --> 2° Quartil, Q2 (também conhecido como mediana, abaixo dele econtramos os primeiros 50% elementos da série), é uma das medidas de centro. P75 --> 3° Quartil, Q3 (abaixo dele encontramos os primeiros 75% elementos da variável). Com este cálculo, conclui-se que o tempo médio de uso do celular durante um dia é de 17,6 minutos, com algum erro probabilístico. Há duas meneiras de encontrar um percentil. Uma, quando os dados formam um ROL (uma lista de valores ordenados) e outra, quando os dados estiverem numa tabela estatística. De qualquer forma, o conjunto de valores deve estar em ordem crescente. Na planilha "variáveis quantitativas", calcule a média, bem como todas as outras estatísticas descritivas. 1 3 3 6 7 8 8 9 10 10 11 11 12 14 14 14 15 16 17 17 17 17 19 19 20 20 21 21 23 24 25 25 26 28 30 33 33 37 25% de 38 dá 9,5 , isso quer dizer que o décimo elemento separa os primeiros 25% elementos da série. Olhando a série, o décimo elemento corresponde a 10 minutos. Assim, 25% dos usuários de celular utilizam o aparelho por no máximo 10 minutos durante um dia. Caso os valores da variável esteja resumida numa tabela de frequência, utilizamos a seguinte fórmula: i --> é a proporção desejada para o percentil, vai de 1 a 100; Linf --> é o limite inferior do intervalo que contém o percentil desejado; h --> é a amplitude do intervalo; Fi --> é a frequência absoluta do intervalo que contém o percentil; n --> é o número de elementos da amostra; ΣFant --> é a soma das frequencias anteriores à classe do percentil. Vamos usar esta fórmula para estimar o P25 dos dados da tabela acima. Antes, porém, devemos identificar na tabela qual é o intervalo de classe que contém o percentil 25, isto se verifica por meio da frequência acumulada relativa (fi acumulada). Veja que na primeira linha (classe) encontramos os primeiros 21,1% elementos da série, enquanto que na segunda linha encontramos acumuladamente 63,2% dos elementos da variável. Então, é razoável crermos que o percentil 25 está no intervalo de 10 a 20 minutos. Listamos os elementos da fórmula de acordo com as instruções anteriores. i = 25 ; Linf = 10; h = 10; Fi = 16; n = 38; ΣFant = 8 Substituindo na fórmula, teremos: Assim, concluí-se que 25% dos usuários utilizam o celular por no máximo 10,9 minutos durante um dia. Perceba que tanto pelo rol quanto pela fórmula, os resultados são bem próximos. Agora faremos uma análise dos percentis por meio de um gráfico de probabilidade. No eixo horizontal iremos colocar o limite inferior do primeiro intervalo, que neste caso será zero, com probabilidade 0, e todos os limites superiores com suas respectivas probabilidades acumuladas. Classes fi Acum 0 0 10 0,211 20 0,632 30 0,895 40 1,000 Pelo gráfico, verifica-se que 30% dos usuários utilizam o aparelho por 12 minutos no máximo, P30. Também nota-se que 10% dos usuários gastam mais de 30 minutos por dia no celular, P90. Assista no canal Aulanet Unir como fazer um gráfico desses no Excel 2013. Medidas de dispersão Desvio padrão (Dp; s; σ ) Simetria Escores padronizados (z) e Outliers A dispersão, em estatística, mede o quão dispersos estão os valores de um conjunto de dados. As mais comuns são: A amplitude total (R) , variância, desvio padrão, coeficiente de variação e intervalos de variação da média. O desvio padrão é determinado pela raiz quadrada da variância, é uma medida de dispersão absoluta em torno da média. Numa distribuição simétrica é possível determinar a probabilidade de um elemento estar a K desvio padrão distante da média, tanto acima quanto abaixo dela. Simetria diz respeito à coisas idênticas, porém opostas por um eixo, como se fosse um espelho. Váriosobjetos são simétricos, isto é, possuem um eixo imaginário que corta-os ao meio longitudinal ou transversalmente de forma que surjam duas partes idênticas, mas opostas por este eixo. O escore padronizado é uma medida de dispersão que indica a distância que um valor está da média em desvios padrão. Os escores padronizados variam de - ∞ a + ∞, porém, 99,7% deles variam de -3 a +3. Amplitude toal ( R) Os valores de uma variável podem estar distribuídos simetricamente em torno de algum valor central (média, moda ou mediana) onde estará situado o eixo de simetria. De fato, existirá simetria perfeita se os percentis estiverem equidistantes da mediana, algo que pode ser visualizado por meio de um histograma, gráfico de pontos ou mesmo por um diagrama de caixa (box- plot). Se, numa distribuição de probabilidade, tivermos a média = mediana = moda, então esta variável apresentará distribuição simétrica. Caso o gráfico dessa variável tenha forma de sino, então a distribuiçao de probabilidade é dita NORMAL. Para maiores detalhes sobre simetria consultar Martins (2011, p. 93) e Morettin (2011, p. 51). A amplitude total de um conjunto de valores é a diferença entre o maior valor e menor valor da série. Assim, com a amplitude todal, é possível verificar qual a maior diferença encontrada dentro dos valores coletados. Fórmula O desvio padrão é expresso nas mesmas unidades de medida da média Fórmula: ou ou O sinal do escore indica se o valor x é menor ou maior que a média. Se uma distribuição é simétrica, então as seguintes probabilidades são observadas: Exemplo: De acordo com a tabela, a amplitude total é de 40 minutos, pois o valor máximo é 40 e o valor mínimo é 0. A probabilidade dos elementos amostrais estarem a uma distância de 1 desvio padrão para mais ou para menos da média é de aproximadamente 68%. Exemplos práticos 1) Comparando performances em testes e concursos Classes xi Fi fi (p(xi)) fi Acum A probabilidade dos elementos amostrais estarem a uma distância de 2 desvio padrão para mais ou para menos da média é de aproximadamente 95%. Vamos supor que você tirou 7,5 em português e 6,0 em matemática. É claro que sua nota de português é maior que a de matemática, então a conclusão é de que você se saiu melhor em português do que matemática. Vamos olhar por um outro ângulo. Vamos supor que os professores tenham informado a média e o desvio padrão de cada matéria. Agora é possível saber qual a sua posição relativa às duas médias da turma. Veja: 0|--10 5 8 0,211 0,211 Qualquer outra diferença entre outros dois valores é menor que 40 minutos. A medida R e suas variações é largamente utilizada em gráficos de controle de qualidade. O grau de asssimetria pode ser mensurado por duas fórmulas: uma fórmula que ralaciona a mediana e os quartis e outra que relaciona moda e média com o desvio padrão. 10|--20 15 16 0,421 0,632 A probabilidade dos elementos amostrais estarem a uma distância de 3 desvio padrão para mais ou para menos da média é de aproximadamente 99%.20|--30 25 10 0,263 0,895 30|--40 35 4 0,105 1,000 Fórmulas. Σ ---------- 38 1,000 ---------- Esses intervalos (dados em desvios padrão) são denominados Intervalos de Variação para o intervalo com 1 dp Ainda é possível determinar a probabilidade para qualquer intervalo em torno da média Variância (Var(x); s²; σ² ) para o intervalo com 2 dp A interpretação é bastante simples: Se As = 0 , então a distribuição dos valores da variável é simétrica, caso contrário, é dita assimétrica, negativa ou positiva, conforme o caso. Matéria Média Dp A variância é uma medida de dispersão que auxilia o pesquisador nos estudos da variabilidade de dados quantitativos. Com a variância é possível determinar o desvio padrão, fazer comparações entre médias amostrais, realizar testes de correlação entre variáveis, além de ser muito útil para quem deseja de aprofundar em análise quantitativa de dados. Para maiores detalhes sobre a teoria da variância convém consultar nossa bibliografica indicativa do curso. para o intervalo com 3 dp Português 6,5 1,2 Matemática 5 0,9 Coeficiente de variação (Cv) (coeficiente de variação de Pearson) O coeficiente de variação é utilizado para verificar a variabilidade relativa dos dados e para comparar variabilidade relativa entre duas amostras de populações distintas. Se o coeficiente de variação for pequeno, então diz-se que os dados são homogêneos (estão próximos da média), caso contrário, são heterogêneos (estão bem distantes da média). Gráficos para visualização da assimetria dos dados Diaframa de caixa e histograma Para calcular a variância é necessário conhecer o desvio que cada elemento apresenta em relação à média, já que a variância é uma medida de dispersão em relação à média aritmética. Depois de calcular os desvios, é necessário elevar cada diferença ao quadrado para que todos os valores fiquem positivos, já que a soma dos desvios em relação à média é zero. Aí é só somar e dividir pela quantidade de elementos da amostra. (melhor usar um computador!) Assim, concluí-se que no quesito comparativo com a média da turma, você se saiu melhor em matemática, apesar da nota mais baixa. Fórmula 2) Verifacando Outliers (valores atípicos) O resultado geralmente é expresso em termos percentuais. Um valor atípico é um valor não muito frequente, com probabilidade bem próxima de zero. Uma regra simples verifica se um determinado valor é um outlier. Diz que x é um outlier se este estiver a mais de 3 desvios padrão distante da média. Se Cv < 15%, então a amostra apresenta baixa dispersão relativa, os dados são homogênios;Fórmulas da variância Vejamos: Para dados amostrais distribuidos num ROL Se 15% < Cv < 30% então a amostra apresenta média dispersão relativa, os dados são mais ou menos homogêneos; Classes xi Fi fi (p(xi)) fi Acum 0|--10 5 8 0,211 0,211 Esta é a distribuição do tempo de uso do celular pelos usuários em 1 dia. Para dados amostrais numa tabela estatística Se Cv > 30%, então a amostra apresenta alta dispersão relativa, os dados são heterogêneos. A média não os representa bem! 10|--20 15 16 0,421 0,632 20|--30 25 10 0,263 0,895 * Em inferência, em vez de nos referirmos á variabilidade da amostra, referimo-nos à variabilidade da população com base nesse coeficiente. Percebe-se, de acordo com o histograma, que a distribuição do tempo de uso do celular é assimétrica positiva, pois a cauda direita é maior que a esquerda, em relação ao intervalo mais frequente (moda). 30|--40 35 4 0,105 1,000 Σ ---------- 38 1,000 ---------- Para toda população de pesquisa Exemplo: Determiniar o desvio padrão do tempo de uso do celular durante um dia, interpretar o os três intervalos de variação e interpretar o coeficiente de variação. Sabendo que a média é de 17,6 min e o desbio padrão de 9,2 min, verificaremos se o menor valor (0) e o maior valor (40) são outliers.Gráfico de caixa (box plots) Para o desvio padrão precisamos da variância que neste caso é de 84,8 min². Para construir um gráfico de caixa necessitamos das medidas: Min, P25, P50, P75 e Máx. Isso mostrará em qual lado da mediana os dados estão mais dispersos. * Ainda existem outros métodos computacionais para o cálculo da variâcia. Intervalos: De acordo com nosso exemplo, as medidas são: Exemplo: Vamos calcular a variância para o tempo de uso do celular durante o dia. Min 0 Assim, cocluímos que não há outliers nessa série de dados, pois o menor valor e o maior valor se encontram a menos de 3 desvios padrão da média. Classes xi Fi fi (p(xi)) fi Acum P25 10,9 0|--10 5 8 0,211 0,211 Lembrando que a média já foi determinada anteriormente e é 17,6 min P50 16,9 10|--20 15 16 0,421 0,632 P75 24,5 20|--30 25 10 0,263 0,895 Coeficiente de variação Máx 40 30|--40 35 4 0,105 1,000 Como o coeficiente de variação é maior que 30%, então o tempo de uso do celular durante o dia é bastante disperso. Σ ---------- 38 1,000 ---------- Assim, a variância do tempo de uso do celular durante umdia é de 84,8 minutos ao quadrado. A variância amostral (s²) contém algum erro em relação à variância populacional de acordo com a probabilidade associada. * A variância não tem interpretação prática. Porém, ela é utilizana na correlação envolvendo variáveis quantitativas Medidas de associaçao entre variáveis Análise gráfica Associação entre variáveis qualitativas e quantitativas Análise gráfica Associação entre variáveis quantitativas (regressão linear simples) A associação de variáveis quali e quanti exige um conhecimentto prévio da variância dos dados quantitativos, o que pode ser visto no capitulo medidas de dispersão. A ideia principal é analisar o que acontece com a variável quantitativa dentro de cada categoria da variável qualitativa. As medidas de associação entre variáves são indicadas para verificar: O grau de dependência estatística entre duas variáveis qualitativas, a existência de correlação entre duas variáveis quantitativas e o grau de associação entre uma variável quali e outra quanti. Seguiremos com duas metodologias em paralelo: uma numérica e outra gráfica. A análise gráfica é feita por meio de um gráfico de probabilidades condicionadas. Cores iguais devem apresentar as mesmas probabilidades dentro de cada grupo. Em geral a variável disposta na linha estará condicionada à variável da coluna. O gráfico pode ser feito com uma tabela de contingência de frequência absoluta ou relativa. Aqui utilizamos o Action para facilitar Quadro 1 - Instrução, procedência e salário dos funcionários da companhia MB Média e variância dos salários total e por grau de instrução Grau de associação entre variávies qualitativas (coeficiente de contingência) Instrução Salário Procedência Grau de instrução Média A medida Qui-quadrado (X²), largamente utilizado em inferência, é utilizado na fórmula do cálculo do coeficiente de contingência de Pearson, C. Ainda temos os coeficientes de Tschuprow,T e de Cramér,V. Os cálculos podem ser feitos com uso de softwares estatísticos apropriados, como Action, Minitab, Spss, etc. Em geral, esses coeficientes variam de 0 e 1, com uma classificação para cada faixa de valores. ensino fundamental4,00 Interior Fundamental 7,8 ensino fundamental4,56 Capital Médio 11,5 ensino fundamental5,25 Capital Superior 16,9 ensino fundamental6,26 Outro Todos 11,1 ensino fundamental6,66 Interior Para C entre 0 a 0,1 temos associação fraca ou nenhuma; C de 0,1 a 0,3 associação baixa; C entre 0,3 a 0,5 associação moderada e C maior que 0,5 associação forte. ensino fundamental6,86 Interior Grau de instrução n Var ensino fundamental7,39 Capital Fundamental 12 7,8 ensino fundamental8,46 Capital Médio 18 13,1 Considere a tabela de contingência abaixo ensino fundamental8,95 Outro Superior 6 16,9 Curso Gênero Fórmula ensino fundamental9,80 Outro Todos 36 20,5 Masculino Feminino Total ensino fundamental12,00 Outro Administração 60 80 140 ensino fundamental13,60 Outro Se a variância dentro de cada categoria for pequena e menor do que a global, significa que a variável qualitativa melhora a capacidade de previsão da quantitativa e portanto existe uma relaçao entre as duas variáveis. Outro 258 200 458 ensino médio 5,73 Outro Total 318 280 598 ensino médio 7,59 Capital ensino médio 7,44 Outro Com o uso do programa Action, obtivemos os seguintes resultados: ensino médio 8,12 Interior ensino médio 8,74 Outro Teste Qui-Quadrado Essa estatística é comparada com uma tabela de valores que indicam a existência ou não de dependência. Porém, o p-valor indica a probabilidade das variáveis serem independentes, sendo mais utilizado entre os pesquisadores. ensino médio 9,13 Interior Percebe-se, pela figura, que o grau de instrução melhora a previsão dos salários Estatistica X² 7,287167654 ensino médio 9,35 Outro Dessa forma, define-se o grau de associação entre as duas variáveis como o ganho relativo na variância, obtido pela introdução da variável qualitativa. Graus de Liberdade 1 ensino médio 9,77 Capital P-Valor 0,00694488815 ensino médio 10,76 Interior ensino médio 11,06 Outro O erro adotado nos testes estatíticos geralmente é de 5,0% Faça uma análise de dependência para os dados da tabela abaixo ensino médio 11,59 Capital ensino médio 13,23 Interior Coeficiente de contingencia 1) Num quartel ensino médio 13,85 Outro O ganho relativo é dado pela fórmula: Promo vido sexo total ensino médio 14,69 Interior = 0,109 M F ensino médio 14,71 Interior sim 288 36 324 0,24 0,03 ensino médio 15,99 Capital em que não 672 204 876 0,56 0,17 ensino médio 16,61 Interior Pelo coeficiente de contingêcia de Pearson, há uma baixa associação de dependência entre as variáveis curso escolhido e sexo, pois C está entre 0,1 e 0,3. total 960 240 1.200 ensino médio 19,40 Capital superior 10,53 Interior Porém, essa associação é significativa, uma vez que a probabilidade de independência é menor que 1,0% , indicada pelo p-valor da estatística X². Fazendo as condicionais na coluna, teremos: superior 12,79 Outro Veja que dentro do masculino há 30% que foram promovidos, enquanto que dentro do feminino há apenas 15% promovidos. Todos dois diferentes do total da linha (sim) que é de 27%, mesmo considerando um erro de 5,0% superior 16,22 Outro Promo vido sexo total superior 17,26 Capital A dependência entre variáveis qualitativas (categóricas) pode ser verificada por meio das probabilidades condicionais, considerando, para tanto, um erro estatístico. Primeiramente organize uma tabela de probabilidades e uma de condicionadas na linha ou na coluna. Analise de acordo com a regra estudada no tópico independência estatística, porém, devemos considerar algum erro probabilístico. M F superior 18,75 Capital sim 0,30 0,15 0,27 superior 23,30 Interior não 0,70 0,85 0,73 total 1,00 1,00 1,00 Assim, fica evidenciado que 41,5% da variação total do salário é explicada pela variável grau de instrução. Assim, no quartel, as variáveis promovido e sexo são estatisticamente dependentes. A medida R² é usul em análise da variância e regressão e é dado em termos percentuais.Considere as informações na tabela de contingência abaixo. Há evidências de que a escolha pelo curso de administração dependa do gênero do acadêmico? Curso Gênero Masculino Feminino Total Ao analisar esta atividade hipotética, percebe-se que a promoção nesse quartel é mais favorável ao grupo dos homens que das mulheres, talvez porque os homens sejam melhores que as mulheres, ou porque as mulheres tenham maior dificuldade de realizar as tarefas impostas para a promoção. Na probabilidade teórica, a dependência se dá pela análise das probabilidades de sucesso para um mesmo atributo em categorias diferentes. Dessa forma, verifica-se que o indivíduo tem maior probabilidade de promoção pelo simples fato de ser homem e não por seus méritos! O que estaria fora de nosso alcance por hora. Administração 10,0% 13,4% 23,4% Outro 43,1% 33,4% 76,6% Total 53,2% 46,8% 100,0% Para fazer as condicionais, basta dividir cada valor da tabela pelo total da coluna (ou linha). Posteriormente organize esses resultados em outra tabela. Veja: Tabela de condicionais por coluna. Curso condicionada ao gênero. Curso Gênero Masculino Feminino Total intervalo de erro Administração 18,9% 28,6% 23,4% 23,4 - 5 ; 23,4 + 5 Outro 81,1% 71,4% 76,6% 76,6 - 5 ; 76,6 + 5 Total 100,0% 100,0% 100,0% Olhando para a primeira linha, e considerando um erro de 5,0% , o intervalo para o percentual total vai de 18,4% a 28,4%. Já o intervalo percentual para o total da segunda linha vai de 71,6% a 81,6%. Análise: (cada linha com seu total) Como há valores no interior da tabela que estão fora dos intervalos estabelecidos, concui-se que há evidências de que a escolha do curso dependa do gênero do estudante. Variável aleatóriaV.A Variável aleatória (V.A) é uma função que associa cada elemento do espaço amostral a um número real x. Por exemplo, considere a variável aleatória X representando a quantidadede caras num experimento aleatório realizado com 3 moedas. Já conhecemos o espaço amostral desse experimento. S = {KKK, KKC, KCK, CKK, KCC, CKC, CCK, CCC} a V.A X poderá assumir os valores {0, 1, 2, 3}, pois nesse espaço amostral há eventos em que não aparece caras (0), há eventos que aparece uma cara (1), duas (2) e três (3) caras. S f X Funçao densidade de probabilidade (fdp) A função densidade de probabilidade (fdp) é uma função que associa cada número da V.A X a uma probabilidade relacionada ao espaço amostral da varável aleatória. Veja: X Fi p(x) Lembrando que Fi é a frequência absoluta da V.A e p(x) é a frequência relativa fi da V.A 0 1 0,125 1 3 0,375 2 3 0,375 3 1 0,125 Σ 8 1,000 Função de distribuição acumulada (Fd) A função de distribuição de probabilidade acumulada, Fd, é aquela que associa cada valor da V.A X a um percentil da distribuiçao de X.(soma de todas as probabilidades anteriores ao pondo dado, Pi). Assim, F(2) siginifica probabilidade acumulada até x = 2 que dá 0,875, ou seja, a probabilidade de x ser menor ou igual a 2 é de 87,5%. Dessa forma, F (2) = P87,5 (percentil 87,5). Outra forma de escrever a respeito de probabilidade acumulada é: P( x < 2); P(x > 1); entre outras. Ainda pode-se fazer operações com probabilidades acumuladas, como por exemplo quanto que dá F(2) - F(0)? Que ambém pode ser escrita da forma P (0 < x <=2) que dá 0,875 - 0,125 = 0,750. Em outras palavras, a probabilidade de x ser maior que 0 e menor ou igual a 2 é de 75,0%. (verifique na tabela!) A função de distribuição de probabilidade acumulada, Fd, é mais útil do que a função densidade de probabilidade (fdp), pois conhecendo as acumuladas de X pode-se calcular qualquer p(x) por meio das diferenças, assim como no exemplo acima. Esperança matemática da V.A X (E(x) ou µ) A esperança matemática da variável aletória X é o valor esperado para X quando o experimento for realizado inúmeras vezes. Por exemplo, quanto eu ganharia em média se aplicasse R$ 500,00 todo mês em fundos de renda fixa? Ou seja, o que eu espero receber em troca, caso invista meu dinheiro nesse fundo? O valor esperado de X é dado pela fórmula: que é a mesma fórmula da média aritmética. De acordo com a tabela acima, o valor esperado de X é: Assim, no lançamento de 3 moedas, o número de caras esperado é de 1,5 caras (uma cara e meia). De outra forma, em n lançamentos sairiam 1,5 caras em média. Variância da variável aleatória. (Var(x) ou σ²) A variância da variável aleatória X é dada pela fórmula: A eperança de x² é a soma de x².p(x), eleva- se x ao quadrado e multiplica pela probabilidade do x associado. X Fi p(x) x².p(x) 0 1 0,125 0,000 1 3 0,375 0,375 2 3 0,375 1,500 3 1 0,125 1,125 Σ 8 1,000 3,0 este número é a esperança do x² com E(X) = 1,5 já calculado anteriormente, a variância de X será: caras² o desvio padrão σ é a raiz quadrada da variância caras As interpretações do desvio padrão da V.A será discutido posteriormente no estudo da distribuição normal de probabilidade. Exercícios 5.5; 5.7; 5.10 Martins, 2011. 5.10) 70% das pessos que trabalham em escritórios utilizam computadores da IBM. 2 indivíduos são selecionados aleatoriamente, faça a distribuição de probabilidade da variável X: número de usuários de pcs IBM. Calcular a média e desvio padrão. p = 0,7 q = 0,3 Se dois indivíduos são selecionados, então a variável X poderá assumir três valores: 0, 1 e 2. X cálculo P(x) x.P(x) x².P(x) 0 0,3.0,3 0,09 0,00 1 0,7.0,3 +0,3.0,7 0,42 0,42 2 0,7.0,7 0,49 0,98 Σ 1,00 1,4 Distribuições teóricas de probabilidade Atividade prática O processo de Poisson. Modelo discreto Você faz parte de um jogo de dados e nesse jogo você tem três chances, se sair soma 7 no lançamento de dois dados, você ganha um prêmio. Qual a probabilidade que você tem de ganhar um prêmio? Suponhamos que num banco são atendidas 280 pessoas em 3 horas. Isso nos dá um parâmetro de 1,6 pessoas por minuto (aproximadamente). Se esse parâmetro permanecer constante para todo intervalo de 1 minuto, e sendo a V. A. X o número de pessoas atendidas no próximo minuto, X terá distribuição de Poisson com parâmetro λ = 1,6 . Escreve-se X ~P(λ). Distribuição teórica de probabilidade é a distribuição de probabilidade de um experimento teórico. Os experimentos teóricos são simples, porém sofisticados, pois podem descrever várias situações reais. O experimento mais simples se chama prova de Bernoulli. Tal experimento admite apenas dois resultados possíveis, sucesso ou fracasso. Quando o experimento é repetido inúmeras vezes dizemos que foram realizadas n provas de Bernoulli. Ex.: laçar uma moeda, cara (sucesso) e coroa (fracasso); escolher uma pessoa dentre muitas, mulher (sucesso) e homem (fracasso); escolher o candidato Y, sim (sucesso) e não (fracasso). Qual seria a variável aleatória para um experimento de Bernoulli? Quais seriam suas características? Para solucionar o problema vamos idealizar o seguinte: "devo realizar um experimento teórico com dois dados que me forneça todas as possibilidades de soma de seus pontos, assim poderei calcular a probabilidade da soma ser igual a 7". Parêmetro λ (por unidade de tempo, área, etc) e é o número de Euler = 2,71828... Como o espaço amostral já é conhecido, temos aqui a distribuição de probabiliade de acordo com espaço amostral. A média e a variância, só pra constar. Características x é o número de sucessos (0, 1, 2, 3, ...) E(X) = µ = λ Var(X) = σ² = λ Comparação entre as distribuições de Poisson e a binomial. O número de provas n da binomial deve ser grande e p pequeno. X (soma) p(x) x.p(x) x².p(x) 2 0,028 0,056 0,111 µ E(X) = 7 λ = 1,6 Distribuição binomial (n provas de Bernoulli)X ~ B( n ; p ) 3 0,056 0,167 0,500 σ² Var(x) = 5,8 x = 0, 1, 2, 3, .... A distribuição binomial é uma função de probabilidade associada à variável aleatória número de sucesso para n provas de Bernoulli. Seus parâmetros são: n, que é o número de repetições do experimento e p, que é a probabilidade de sucesso. A V.A. X assumirá os seguintes valores: 0, 1, 2, ..., n. A função binomial é dada pela fórmula: 4 0,083 0,333 1,333 σ Desv Pad = 2,4 Pela Poisson Pela binomial p 0,027 5 0,111 0,556 2,778 N° sucessos Probabilidade N° sucessosProbabilidade q 0,973 6 0,139 0,833 5,000 Em várias repetições, espera-se obter 7 pontos em média, com desvio padrão de 2,4 pontos. x p(x) x.p(x) x p(x) x.p(x) n 60 7 0,167 1,167 8,167 0 0,202 0,000 0 0,198 0,000 média 1,6 8 0,139 1,111 8,889 1 0,323 0,323 1 0,325 0,325 9 0,111 1,000 9,000 2 0,258 0,517 2 0,262 0,525 Características: valor esperado, variância e função acumulada. 10 0,083 0,833 8,333 3 0,138 0,413 3 0,139 0,417 E(x) = n.p F(x) = P(X<= x) = p(0) + p(1) + p(2) + ... + p(x) 11 0,056 0,611 6,722 4 0,055 0,221 4 0,054 0,217 Va(x) = n.p.q P(X >= x) = 1 - P(X < x) 12 0,028 0,333 4,000 5 0,018 0,088 5 0,017 0,083 Σ 1,000 7,0 54,833 6 0,005 0,028 6 0,004 0,025 Vamos supor o seguinte experimento: Lance uma moeda dez vezes. Qual a probabilidade de termos 3 caras? Qual o número de caras esperado caso repetíssemos este experimento inúmeras vezes? 7 0,001 0,008 7 0,001 0,006 Por meio do modelo da distribuição binomial, pode-se estimar a probabilidade de você ganhar o jogo, desde que admita os parâmetros: probabilidade de sucesso (sair soma 7) é p= 0,167 e n = 3 8 0,000 0,002 8 0,000 0,001 9 0,000 0,000 9 0,000 0,000 10 0,000 0,000 10 0,000 0,000 sucesso = sair cara n = 10 p = 0,5 q=0,5 11 0,000 0,000 11 0,000 0,000 p = 0,167 n = 3 Solução: P(X > 0) = 0,422 12 0,000 0,000 12 0,000 0,000 q = 0,833 De acordo com o modelo, a probabilidade de que saia soma 7 pelo menos uma vez em três jogadas é de 0,422. Dessa forma, a probabilidade de eu ganhar um prêmio é de 42,2%. 13 0,000 0,000 13 0,000 0,000 x p(x) x.p(x) 14 0,000 0,000 14 0,000 0,000 0 0,578 0,000 15 0,000 0,000 15 0,000 0,000 1 0,348 0,348 Σ 1,000 1,600 Σ 1,000 1,6002 0,070 0,139 Distribuição de probabilidade do número de caras para o lançamento de uma moeda 10 vezes. 3 0,005 0,014 Questionamento: Qual a probabilidade de que 5 pessoas sejam atendidas nos próximos 3 minutos?Σ 1,000 0,501 N° de caras Probabilidade Como a média é a mesma em todo instante, 1,6 pessoas por minuto corresponde a 4,8 pessoas atendidas em 3 minutos. Dessa forma, teremos um novo parâmetro λ = 4,8. Agora, é só substituir na fórmula com x = 5. x p(x) x.p(x) x².p(x) F(x) 0 0,001 0,000 0,000 0,001 F(0) = P(X=0) 1 0,010 0,010 0,010 0,011 F(1) - F(0) = P(X=1) 2 0,044 0,088 0,176 0,055 F(2) - F(1) = P(X=2) Veja que o parâmetro λ muda quando o intervalo considerado mudar. 3 0,117 0,352 1,055 0,172 F(3) - F(2) = P(X=3) Atividade 4 0,205 0,820 3,281 0,377 . Chegam caminhões a um depósito à razão de 2,8 caminhões/hora, segundo uma distribuição de Poisson. Determine a probabilidade de chegarem dois ou mais caminhões: 5 0,246 1,230 6,152 0,623 . 6 0,205 1,230 7,383 0,828 . 7 0,117 0,820 5,742 0,945 . a) num período de 30 minutos; 8 0,044 0,352 2,813 0,989 . b) num período de 1 hora; e 9 0,010 0,088 0,791 0,999 . c) num período de 2 horas. 10 0,001 0,010 0,098 1,000 F(10) - F(9)=P(X=10) Σ 1,000 5,0 27,500 --------- R: 1- [P(0) + P(1)] a) λ = 1,4 R= 0,40817 b) λ = 2,8 R=0,76892 Modelo contínuo n p (sucesso) c) λ = 5,6 R=0,97559 Distribuição normal de probabilidade X ~ N( µ ; σ² ) 100 0,5 x p(x) F(X) Z Questionamento Vamos considerar uma distribuição de probabilidade discreta, assim como a dada anteriormente. Vamos supor que a área ocupada por cada coluna seja representada pela sua probabilidade. Assim, cada coluna é uma fração de toda a área da figura que tem probabilidade igual a soma de todas as colunas, ou seja, P(0 ≤ X ≤ 10 ) = 1,0. 0 0,0000 0,0000 -10,00 Sabendo que a média de gols é de 1,3 por partida, qual a probabilidade de marcar mais de 2 gols em pelo menos 4 das 6 partidas? 1 0,0000 0,0000 -9,80 2 0,0000 0,0000 -9,60 1°) Calcular a probabilidade de sair mais de 2 gols por partida pela poisson 3 0,0000 0,0000 -9,40 2°) Essa será a probabiliadade de sucesso. Utilizando o exemplo anterior, porém lançando a moeda 100 vezes, podemos ter uma noção intuitiva do que venha a ser uma distribuição contínua de probabilidade, é como se não houvesse espaços entre um x e outro. Nas distribuições contínuas, as probabilidades da V.A é verificada por meio de uma função de probabilidade acumulada, Fd. 4 0,0000 0,0000 -9,20 3°) Depois, calcular a probabilidade de ter sucesso em pelo menos 4 partidas nas 6 restantes.5 0,0000 0,0000 -9,00 6 0,0000 0,0000 -8,80 7 0,0000 0,0000 -8,60 8 0,0000 0,0000 -8,40 Distribuição exponencial Como por exemplo: qual a probabilidade se sair entre 40 e 45 caras? De acordo com a distribuição binomial essa probabilidade é dada mediante a soma de P(40) a P(45) que dá 16,7%. 9 0,0000 0,0000 -8,20 10 0,0000 0,0000 -8,00 O modelo da distribuiçao exponencial foi idealizado a partir da distribuição de Poisson, mas no sentido de querer saber qual a probabilidade do primeiro sucesso após um intervalo de tamanho x. Seu parâmetro é λ e a probabilidade de ocorrer o primeiro sucesso após x intervalos iguais é dado por : 11 0,0000 0,0000 -7,80 A distribuição NORMAL de probabilidade é uma distribuição contínua que tem como parâmetros a média (µ) e a variância (σ²) do fenômeno estudado. Os valores das probabilidades acumuladas da distribuição normal estão numa tabela denominada Distribuição normal padronizada de acordo com os escores padronizados Z. Dessa forma, para encontrar a probabilidade de ocorrência de um elemento x da variável aleatória num determinado intervalo, devemos converter os valores da V.A em valores padronizados de acordo com a fórmula: . Posteriormente, procura-se as probabilidades associadas aos valores de Z na tabela. 12 0,0000 0,0000 -7,60 µ E(X) = 50 13 0,0000 0,0000 -7,40 σ² Var(x) = 25 14 0,0000 0,0000 -7,20 σ Desv Pad = 5 15 0,0000 0,0000 -7,00 16 0,0000 0,0000 -6,80 Características Esperança e variância 17 0,0000 0,0000 -6,60 função densidade e acumulada 18 0,0000 0,0000 -6,40 fdp Fd 19 0,0000 0,0000 -6,20 20 0,0000 0,0000 -6,00 Para exemplificar, vamos considerar o número de caras no lançamento de uma moeda 100 vezes, com média de 50 caras e a variância 25 caras². A distribuição de probabilidade do número de caras no lançamento de uma moeda pode ser comparada a uma distribuição normal, pois seu gráfico é em forma de sino. Veja o gráfico ao lado. Então, vamos calcular a probabilidade de sair entre 40 e 45 caras de acordo com a distribuição padronizada Z. 21 0,0000 0,0000 -5,80 Fixação - O tempo médio de espera para atendimento numa loja é de 2 minutos. Qual a probabilidade de você ter de esperar mais de dois minutos para ser atendido? 22 0,0000 0,0000 -5,60 23 0,0000 0,0000 -5,40 24 0,0000 0,0000 -5,20 E(X) = 2 0,5 25 0,0000 0,0000 -5,00 26 0,0000 0,0000 -4,80 x P(X < x) P(X > x) intervalo f(x) 0,05f(x) F(X) Dados do problema 27 0,0000 0,0000 -4,60 0,05 0,024690087970,975309912 0,05 0,4876549560,02438274780,0243827478 µ = 50 x1 = 39,5 o que queremos saber é P(39,5 < X < 45,5) = ........ 28 0,0000 0,0000 -4,40 0,1 0,04877057550,9512294245 0,05 0,47561471230,023780735610,04816348341 σ = 5 x2 = 45,5 29 0,0000 0,0000 -4,20 0,15 0,072256513670,9277434863 0,05 0,46387174320,023193587160,07135707057 30 0,0000 0,0000 -4,00 0,2 0,095162581960,904837418 0,05 0,4524187090,022620935450,09397800602 Transformações: Procurar na tabela as probabilidades associadas aos valores 0,90 e 2,10 (desconsidere o sinal) e fazer as operções necessárias. Acomplanhe. 31 0,0001 0,0001 -3,80 0,25 0,11750309740,8824969026 0,05 0,44124845130,022062422560,1160404286 32 0,0001 0,0002 -3,60 0,3 0,13929202360,8607079764 0,05 0,43035398820,021517699410,137558128 33 0,0002 0,0004 -3,40 0,35 0,16054297920,8394570208 0,05 0,41972851040,020986425520,1585445535 Para F(z = 0,90) a acumulada dá 0,3159 e para F(z = 2,10) a acumulada dá 0,4821. Então, 0,4821 - 0,3159 = 0,166. 34 0,0005 0,0009 -3,20 0,4 0,18126924690,8187307531 0,05 0,40936537650,020468268830,1790128223 35 0,0009 0,0018 -3,00 0,45 0,20148378120,7985162188 0,05 0,39925810940,019962905470,1989757278 36 0,0016 0,0033 -2,80 0,5 0,22119921690,7788007831 0,05 0,38940039150,019470019580,2184457474 Assim, se a distribuição de probabilidade do número de caras segue os moldes de uma distribuição normal, então, em 100 lançamentos, a probabilidade de sair entre 40 e 45 caras é de 16,6%. 37 0,0027 0,0060 -2,60 0,55 0,24042787680,7595721232 0,05 0,37978606160,018989303080,2374350505 38 0,0045 0,0105 -2,40 0,6 0,25918177930,7408182207 0,05 0,37040911030,018520455520,255955506 39 0,0071 0,0176 -2,20 0,65 0,27747264640,7225273536 0,05 0,36126367680,018063183840,2740186898 40 0,0108 0,0284 -2,00 0,7 0,29531191030,7046880897 0,05 0,35234404490,017617202240,2916358921 Considerações 41 0,0159 0,0443 -1,80 0,75 0,31271072120,6872892788 0,05 0,34364463940,017182231970,308818124 a) Numa distribuição contínua não se faz distinção entre os símbolos < e ≤ ; > e ≥ ;42 0,0223 0,0666 -1,60 0,8 0,3296799540,670320046 0,05 0,3351600230,016758001150,3255761252 b) Quando utilizamos uma distribuição contínua para fazer inferência sobre uma variável discreta, os valores devem ser ajustados para evitar descontinuidade. No nosso exemplo o valor 40 foi substituido por 39,5 e o valor 45 pelo valor 45,5. 43 0,0301 0,0967 -1,40 0,85 0,34623021490,6537697851 0,05 0,32688489260,016344244630,3419203698 44 0,0390 0,1356 -1,20 0,9 0,36237184840,6376281516 0,05 0,31881407580,015940703790,3578610736 45 0,0485 0,1841 -1,00 0,95 0,37811494350,6218850565 0,05 0,31094252820,015547126410,3734082 c) A tabela normal padronizada contém probabilidades acumuladas em relação à média ( 0 ), que está no centro. Mas há tabelas que trazem as acumuladas em relação ao menor valor, que pode ser considerado como -4. Por isso deve-se tomar cuidado ao realizar operações entre as probabilidadesacumuladas da tabela Z. 46 0,0580 0,2421 -0,80 1 0,39346934030,6065306597 0,05 0,30326532990,015163266490,3885714665 47 0,0666 0,3086 -0,60 1,05 0,40844463560,5915553644 0,05 0,29577768220,014788884110,4033603506 48 0,0735 0,3822 -0,40 1,1 0,42305018960,5769498104 0,05 0,28847490520,014423745260,4177840959 49 0,0780 0,4602 -0,20 1,15 0,43729513120,5627048688 0,05 0,28135243440,014067621720,4318517176 50 0,0796 0,5398 0,00 1,2 0,45118836390,5488116361 0,05 0,2744058180,01372029090,4455720085 Questionamentos 51 0,0780 0,6178 0,20 1,25 0,46473857150,5352614285 0,05 0,26763071430,013381535710,4589535442 No Brasil, a proporção de microempresas que fecham em até um ano é de 10%. Em uma amostra aleatória de 20 microempresas, qual a probabilidade de no máximo cinco microempresas terem as portas fechadas em até um ano de criação? 52 0,0735 0,6914 0,40 1,3 0,47795422320,5220457768 0,05 0,26102288840,013051144420,4720046886 53 0,0666 0,7579 0,60 1,35 0,49084357940,5091564206 0,05 0,25457821030,012728910520,4847335992 54 0,0580 0,8159 0,80 1,4 0,50341469620,4965853038 0,05 0,24829265190,012414632590,4971482317 55 0,0485 0,8644 1,00 1,45 0,5156754310,484324569 0,05 0,24216228450,012108114220,509256346 Se numa comunidade, a proporção de famílias com 4 filhos é de 25%, qual a probabilidade de encontrarmos mais de 100 famílias com 4 filhos numa amostra de 345 famílias? 56 0,0390 0,9033 1,20 1,5 0,52763344730,4723665527 0,05 0,23618327640,011809163820,5210655098 57 0,0301 0,9334 1,40 1,55 0,5392962190,460703781 0,05 0,23035189050,011517594520,5325831043 58 0,0223 0,9557 1,60 1,6 0,55067103590,4493289641 0,05 0,22466448210,01123322410,5438163284 59 0,0159 0,9716 1,80 1,65 0,56176500750,4382349925 0,05 0,21911749620,010955874810,5547722032 Exemplo: Vamos calcular alguns percentis e comparar com a acumulada padrão Z 60 0,0108 0,9824 2,00 1,7 0,57258506810,4274149319 0,05 0,2137074660,01068537330,5654575765 Tempo de uso do celular durante o dia, em minutos 61 0,0071 0,9895 2,20 1,75 0,58313798030,4168620197 0,05 0,20843100980,010421550490,575879127 Classes xi Fi fi (p(xi)) fi Acum 62 0,0045 0,9940 2,40 1,8 0,59343034030,4065696597 0,05 0,20328482990,010164241490,5860433685 0|--10 5 8 0,211 0,211 63 0,0027 0,9967 2,60 1,85 0,60346858090,3965314191 0,05 0,19826570950,0099132854770,595956654 10|--20 15 16 0,421 0,632 64 0,0016 0,9982 2,80 1,9 0,61325897650,3867410235 0,05 0,19337051170,0096685255860,6056251796 20|--30 25 10 0,263 0,895 65 0,0009 0,9991 3,00 1,95 0,62280764640,3771923536 0,05 0,18859617680,0094298088390,6150549884 30|--40 35 4 0,105 1,000 66 0,0005 0,9996 3,20 2 0,63212055880,3678794412 0,05 0,18393972060,0091969860290,6242519744 Σ ---------- 38 1,000 ---------- 67 0,0002 0,9998 3,40 2,05 0,64120353460,3587964654 0,05 0,17939823270,0089699116350,6332218861 68 0,0001 0,9999 3,60 2,1 0,65006225090,3499377491 0,05 0,17496887460,0087484437280,6419703298 média = 17,6 var(x) = 84,2 Desv pad = 9,2 69 0,0001 1,0000 3,80 2,15 0,65870224470,3412977553 0,05 0,17064887770,0085324438830,6505027737 70 0,0000 1,0000 4,00 2,2 0,66712891630,3328710837 0,05 0,16643554180,0083217770920,6588245508 calcular z x 71 0,0000 1,0000 4,20 2,25 0,67534753260,3246524674 0,05 0,16232623370,0081163116840,6669408625 P35 13,3 P(X < x) = 0,35 -0,38 14,1 72 0,0000 1,0000 4,40 2,3 0,68336323060,3166367694 0,05 0,15831838470,0079159192340,6748567817 P80 26,4 P(X < x) = 0,80 0,84 25,3 73 0,0000 1,0000 4,60 2,35 0,69118102030,3088189797 0,05 0,15440948980,0077204744920,6825772562 74 0,0000 1,0000 4,80 2,4 0,69880578810,3011942119 0,05 0,1505971060,0075298552980,6901071115 75 0,0000 1,0000 5,00 2,45 0,70624229970,2937577003 0,05 0,14687885020,0073439425080,697451054 76 0,0000 1,0000 5,20 2,5 0,71349520310,2865047969 0,05 0,14325239840,0071626199220,7046136739 77 0,0000 1,0000 5,40 2,55 0,72056903180,2794309682 0,05 0,13971548410,0069857742060,7115994481 78 0,0000 1,0000 5,60 2,6 0,7274682070,272531793 0,05 0,13626589650,0068132948260,718412743 79 0,0000 1,0000 5,80 2,65 0,73419704090,2658029591 0,05 0,13290147950,0066450739770,7250578169 80 0,0000 1,0000 6,00 2,7 0,74075973940,2592402606 0,05 0,12962013030,0064810065160,7315388234 81 0,0000 1,0000 6,20 2,75 0,74716040420,2528395958 0,05 0,12641979790,0063209898950,7378598133 82 0,0000 1,0000 6,40 2,8 0,75340303610,2465969639 0,05 0,1232984820,0061649240990,7440247374 83 0,0000 1,0000 6,60 2,85 0,75949153680,2405084632 0,05 0,12025423160,006012711580,750037449 84 0,0000 1,0000 6,80 2,9 0,76542971190,2345702881 0,05 0,1172851440,0058642572020,7559017062 85 0,0000 1,0000 7,00 2,95 0,7712212730,228778727 0,05 0,11438936350,0057194681760,7616211744 86 0,0000 1,0000 7,20 3 0,77686983990,2231301601 0,05 0,11156508010,0055782540040,7671994284 87 0,0000 1,0000 7,40 3,05 0,78237894310,2176210569 0,05 0,10881052840,0054405264220,7726399548 88 0,0000 1,0000 7,60 3,1 0,78775202620,2122479738 0,05 0,10612398690,0053061993460,7779461542 89 0,0000 1,0000 7,80 3,15 0,79299244730,2070075527 0,05 0,10350377630,0051751888170,783121343 90 0,0000 1,0000 8,00 3,2 0,7981034820,201896518 0,05 0,1009482590,005047412950,7881687559 91 0,0000 1,0000 8,20 3,25 0,80308832480,1969116752 0,05 0,09845583760,004922791880,7930915478 92 0,0000 1,0000 8,40 3,3 0,80795009140,1920499086 0,05 0,096024954310,0048012477160,7978927955 93 0,0000 1,0000 8,60 3,35 0,81269182050,1873081795 0,05 0,093654089740,0046827044870,8025755 94 0,0000 1,0000 8,80 3,4 0,81731647590,1826835241 0,05 0,091341762030,0045670881010,8071425881 95 0,0000 1,0000 9,00 3,45 0,82182694820,1781730518 0,05 0,089086525890,0044543262940,8115969144 96 0,0000 1,0000 9,20 3,5 0,82622605650,1737739435 0,05 0,086886971730,0043443485860,815941263 97 0,0000 1,0000 9,40 3,55 0,83051655050,1694834495 0,05 0,084741724750,0042370862370,8201783492 98 0,0000 1,0000 9,60 3,6 0,83470111180,1652988882 0,05 0,082649444110,0041324722060,8243108214 99 0,0000 1,0000 9,80 3,65 0,83878235590,1612176441 0,05 0,080608822060,0040304411030,8283412625 100 0,0000 1,0000 10,00 3,7 0,84276283370,1572371663 0,05 0,078618583160,0039309291580,8322721917 3,75 0,84664503320,1533549668 0,05 0,076677483420,0038338741710,8361060659 3,8 0,85043138080,1495686192 0,05 0,074784309610,0037392154810,8398452814 3,85 0,85412424310,1458757569 0,05 0,072937878430,0036468939210,8434921753 3,9 0,85772592840,1422740716 0,05 0,071137035790,003556851790,8470490271 3,95 0,86123868780,1387613122 0,05 0,069380656120,0034690328060,8505180599 4 0,86466471680,1353352832 0,05 0,067667641620,0033833820810,853901442 4,05 0,86800615680,1319938432 0,05 0,065996921590,003299846080,857201288 4,1 0,87126509640,1287349036 0,05 0,064367451790,003218372590,8604196606 4,15 0,87444357250,1255564275 0,05 0,062778213750,0031389106870,8635585713 4,2 0,87754357170,1224564283 0,05 0,061228214130,0030614107060,866619982 4,25 0,88056703170,1194329683 0,05 0,059716484130,0029858242070,8696058062 4,3 0,88351584220,1164841578 0,05 0,058242078890,0029121039440,8725179102 4,35 0,88639184630,1136081537 0,05 0,056804076840,0028402038420,875358114 4,4 0,88919684160,1108031584 0,05 0,055401579180,0027700789590,878128193 4,45 0,89193258140,1080674186 0,05 0,054033709320,0027016854660,8808298784 4,5 0,89460077540,1053992246 0,05 0,052699612280,0026349806140,8834648591 4,55 0,89720309160,1027969084 0,05 0,051398454220,0025699227110,8860347818 4,6 0,89974115630,1002588437 0,05 0,050129421860,0025064710930,8885412529 4,65 0,90221655590,097783444050,05 0,048891722030,0024445861010,890985839 4,7 0,90463083780,095369162220,05 0,047684581110,0023842290550,893370068 4,75 0,90698551080,093014489210,05 0,046507244610,002325362230,8956954302 4,8 0,90928204670,090717953290,05 0,045358976640,0022679488320,8979633791 4,85 0,9115218810,088478119040,05 0,044239059520,0022119529760,900175332 4,9 0,91370641350,0862935865 0,05 0,043146793250,0021573396620,9023326717 4,95 0,91583700970,084162990260,05 0,042081495130,0021040747560,9044367465 5 0,91791500140,082084998620,05 0,041042499310,0020521249660,9064888714 5,05 0,91994168720,080058312790,050,040029156390,002001457820,9084903293 5,1 0,9219183340,078081666 0,05 0,0390408330,001952041650,9104423709 5,15 0,92384617720,0761538228 0,05 0,03807691140,001903845570,9123462165 5,2 0,92572642180,074273578210,05 0,037136789110,0018568394550,9142030559 5,25 0,9275602430,072439757030,05 0,036219878520,0018109939260,9160140499 5,3 0,92934878690,070651213060,05 0,035325606530,0017662803270,9177803302 5,35 0,93109317160,068906828390,05 0,03445341420,001722670710,9195030009 5,4 0,93279448730,067205512740,05 0,033602756370,0016801378180,9211831387 5,45 0,93445379730,065546202720,05 0,032773101360,0016386550680,9228217938 5,5 0,93607213880,063927861210,05 0,03196393060,001598196530,9244199903 5,55 0,93765052330,062349476690,05 0,031174738340,0015587369170,9259787272 5,6 0,93918993740,060810062630,05 0,030405031310,0015202515660,9274989788 5,65 0,94069134320,059308656830,05 0,029654328410,0014827164210,9289816952 5,7 0,94215567910,057844320870,05 0,028922160440,0014461080220,9304278032 5,75 0,94358386050,0564161395 0,05 0,028208069750,0014104034880,9318382067 5,8 0,94497677990,055023220060,05 0,027511610030,0013755805010,9332137872 5,85 0,94633530810,053664691910,05 0,026832345960,0013416172980,9345554045 5,9 0,94766029410,052339705950,05 0,026169852970,0013084926490,9358638972 5,95 0,9489525660,051047434 0,05 0,0255237170,001276185850,937140083 6 0,95021293160,049787068370,05 0,024893534180,0012446767090,9383847597 6,05 0,95144217870,048557821270,05 0,024278910640,0012139455320,9395987053 6,1 0,95264107560,047358924390,05 0,02367946220,001183973110,9407826784 6,15 0,95381037160,046189628380,05 0,023094814190,001154740710,9419374191 6,2 0,95495079760,045049202390,05 0,02252460120,001126230060,9430636491 6,25 0,95606306640,043936933620,05 0,021968466810,0010984233410,9441620725 6,3 0,95714787310,042852126870,05 0,021426063430,0010713031720,9452333757 6,35 0,95820589590,041794104080,05 0,020897052040,0010448526020,9462782283 6,4 0,9592377960,040762203980,05 0,020381101990,0010190550990,9472972834 6,45 0,96024421840,039755781580,05 0,019877890790,00099389453940,9482911779 6,5 0,96122579220,038774207830,05 0,019387103920,00096935519580,9492605331 6,55 0,96218313080,037816869230,05 0,018908434610,00094542173070,9502059548 6,6 0,96311683260,0368831674 0,05 0,01844158370,0009220791850,951128034 6,65 0,96402748120,035972518750,05 0,017986259380,00089931296880,952027347 6,7 0,96491564590,0350843541 0,05 0,017542177050,00087710885250,9529044558 6,75 0,96578188170,034218118310,05 0,017109059160,00085545295780,9537599088 6,8 0,966626730,033373269960,05 0,016686634980,0008343317490,9545942405 6,85 0,9674507190,032549280990,05 0,016274640490,00081373202470,9554079726 6,9 0,96825436360,031745636380,05 0,015872818190,00079364090950,9562016135 6,95 0,96903816620,030961833820,05 0,015480916910,00077404584560,9569756593 7 0,96980261660,030197383420,05 0,015098691710,00075493458560,9577305939 7,05 0,97054819260,029451807370,05 0,014725903680,00073629518420,9584668891 7,1 0,97127536030,028724639650,05 0,014362319830,00071811599140,9591850051 7,15 0,97198457420,028015425770,05 0,014007712890,00070038564440,9598853907 7,2 0,97267627760,027323722450,05 0,013661861220,00068309306120,9605684838 7,25 0,97335090270,026649097340,05 0,013324548670,00066622743340,9612347112 7,3 0,97400887120,025991128780,05 0,012995564390,00064977821950,9618844894 7,35 0,97465059450,025349405520,05 0,012674702760,00063373513810,9625182246 7,4 0,97527647350,024723526470,05 0,012361763240,00061808816180,9631363127 7,45 0,97588689960,024113100430,05 0,012056550210,00060282751070,9637391402 7,5 0,97648225410,023517745860,05 0,011758872930,00058794364640,9643270839 7,55 0,97706290940,022937090640,05 0,011468545320,0005734272660,9649005112 7,6 0,97762922810,022370771860,05 0,011185385930,00055926929640,9654597805 7,65 0,97818156450,021818435530,05 0,010909217770,00054546088830,9660052413 7,7 0,97872026360,021279736440,05 0,010639868220,0005319934110,9665372347 7,75 0,97924566210,020754337870,05 0,010377168940,00051885844680,9670560932 7,8 0,97975808860,020241911450,05 0,010120955720,00050604778610,967562141 7,85 0,98025786310,019742136870,05 0,0098710684360,00049355342180,9680556944 7,9 0,98074529820,019254701780,05 0,0096273508880,00048136754440,9685370619 7,95 0,98122069850,018779301490,05 0,0093896507470,00046948253740,9690065445 8 0,98168436110,018315638890,05 0,0091578194440,00045789097220,9694644355 8,05 0,98213657580,017863424150,05 0,0089317120770,00044658560380,9699110211 8,1 0,98257762540,017422374640,05 0,008711187320,0004355593660,9703465804 8,15 0,98300778530,016992214680,05 0,0084961073380,00042480536690,9707713858 8,2 0,98342732460,0165726754 0,05 0,0082863377010,0004143168850,9711857027 8,25 0,98383650540,016163494590,05 0,0080817472940,00040408736470,97158979 8,3 0,98423558350,015764416480,05 0,0078822082420,00039411041210,9719839005 8,35 0,98462480830,015375191660,05 0,0076875958280,00038437979140,9723682802 8,4 0,98500442320,014995576820,05 0,007497788410,00037488942050,9727431697 8,45 0,98537466530,014625334710,05 0,0073126673550,00036563336770,973108803 8,5 0,98573576610,014264233910,05 0,0071321169540,00035660584770,9734654089 8,55 0,98608795130,013912048720,05 0,0069560243590,0003478012180,9738132101 8,6 0,9864314410,013568559010,05 0,0067842795060,00033921397530,9741524241 8,65 0,98676644990,0132335501 0,05 0,0066167750480,00033083875240,9744832628 8,7 0,98709318740,012906812580,05 0,006453406290,00032267031450,9748059331 8,75 0,98741185780,012588142240,05 0,0062940711210,00031470355610,9751206367 8,8 0,98772266010,0122773399 0,05 0,0061386699520,00030693349760,9754275702 8,85 0,98802578870,0119742113 0,05 0,005987105650,00029935528250,9757269255 8,9 0,9883214330,011678566970,05 0,0058392834850,00029196417430,9760188897 8,95 0,98860977790,011390222120,05 0,0056951110620,00028475555310,9763036452 9 0,98889100350,011108996540,05 0,0055544982690,00027772491350,9765813701 9,05 0,98916528560,010834714440,05 0,0054173572180,00027086786090,976852238 9,1 0,98943279560,010567204380,05 0,0052836021920,00026418010960,9771164181 9,15 0,98969370080,010306299180,05 0,0051531495890,00025765747950,9773740756 9,2 0,98994816430,010051835740,05 0,0050259178720,00025129589360,9776253715 9,25 0,9901963450,0098036550360,05 0,0049018275180,00024509137590,9778704628 9,3 0,99043839810,0095616019310,05 0,0047808009650,00023904004830,9781095029 9,35 0,99067447490,0093255251380,05 0,0046627625690,00023313812840,978342641 9,4 0,99090472290,0090952771020,05 0,0045476385510,00022738192750,9785700229 9,45 0,99112928610,008870713910,05 0,0044353569550,00022176784770,9787917908 9,5 0,99134830480,0086516952030,05 0,0043258476020,00021629238010,9790080832 9,55 0,99156191590,0084380840870,05 0,0042190420440,00021095210220,9792190353 9,6 0,9917702530,0082297470490,05 0,0041148735250,00020574367620,979424779 9,65 0,99197344610,008026553870,05 0,0040132769350,00020066384680,9796254428 9,7 0,99217162250,0078283775490,05 0,0039141887750,00019570943870,9798211522 9,75 0,99236490580,0076350942190,05 0,0038175471090,00019087735550,9800120296 9,8 0,99255341690,0074465830710,05 0,0037232915350,00018616457680,9801981942 9,85 0,99273727370,007262726280,05 0,003631363140,0001815681570,9803797623 9,9 0,99291659110,0070834089290,05 0,0035417044650,00017708522320,9805568475 9,95 0,99309148110,0069085189390,05 0,003454259470,00017271297350,9807295605 10 0,9932620530,0067379469990,05 0,00336897350,0001684486750,9808980092 10,05 0,99342841350,0065715864950,05 0,0032857932470,00016428966240,9810622989 10,1 0,99359066660,0064093334460,05 0,0032046667230,00016023333620,9812225322 10,15 0,99374891360,006251086440,05 0,003125543220,0001562771610,9813788094 10,2 0,99390325340,0060967465660,05 0,0030483732830,00015241866410,981531228 10,25 0,99405378260,0059462173560,05 0,0029731086780,00014865543390,9816798835 10,3 0,99420059530,0057994047270,05 0,0028997023630,00014498511820,9818248686 10,35 0,99434378310,0056562169140,05 0,0028281084570,00014140542280,98196627410,4 0,99448343560,0055165644210,05 0,002758282210,00013791411050,9821041881 10,45 0,994619640,005380359960,05 0,002690179980,0001345089990,9822386971 10,5 0,99475248160,0052475183990,05 0,00262375920,000131187960,9823698851 10,55 0,99488204330,0051179567080,05 0,0025589783540,00012794891770,982497834 10,6 0,99500840610,0049915939070,05 0,0024957969530,00012478984770,9826226238 10,65 0,9951316490,0048683510140,05 0,0024341755070,00012170877540,9827443326 10,7 0,9952518490,0047481509990,05 0,00237407550,0001187037750,9828630364 10,75 0,99536908130,0046309187340,05 0,0023154593670,00011577296830,9829788094 10,8 0,99548341910,0045165809430,05 0,0022582904710,00011291452360,9830917239 10,85 0,99559493380,0044050661620,05 0,0022025330810,0001101266540,9832018505 10,9 0,99570369530,0042963046910,05 0,0021481523450,00010740761730,9833092581 10,95 0,99580977150,004190228550,05 0,0020951142750,00010475571370,9834140139 11 0,99591322860,0040867714380,05 0,0020433857190,0001021692860,9835161831 11,05 0,99601413130,0039858686920,05 0,0019929343460,00009964671730,9836158299 11,1 0,99611254280,0038874572430,05 0,0019437286220,000097186431090,9837130163 11,15 0,99620852440,0037914755820,05 0,0018957377910,000094786889550,9838078032 11,2 0,99630213630,0036978637160,05 0,0018489318580,000092446592910,9839002498 11,25 0,99639343690,0036065631360,05 0,0018032815680,00009016407840,9839904139 11,3 0,99648248320,0035175167750,05 0,0017587583870,000087937919370,9840783518 11,35 0,9965693310,0034306689760,05 0,0017153344880,000085766724410,9841641185 11,4 0,99665403450,0033459654570,05 0,0016729827290,000083649136440,9842477676 11,45 0,99673664670,0032633532760,05 0,0016316766380,00008158383190,9843293515 11,5 0,99681721920,0031827807970,05 0,0015913903980,000079569519910,984408921 11,55 0,99689580230,0031041976590,05 0,0015520988290,000077604941470,9844865259 11,6 0,99697244530,0030275547450,05 0,0015137773730,000075688868630,9845622148 11,65 0,99704719580,0029528041520,05 0,0014764020760,000073820103810,9846360349 11,7 0,99712010080,0028798991580,05 0,0014399495790,000071997478950,9847080324 11,75 0,99719120580,0028087941950,05 0,0014043970970,000070219854860,9847782522 11,8 0,99726055520,0027394448190,05 0,0013697224090,000068486120470,9848467384 11,85 0,99732819230,0026718076850,05 0,0013359038430,000066795192130,9849135335 11,9 0,99739415950,0026058405180,05 0,0013029202590,000065146012960,9849786796 11,95 0,99745849790,0025415020870,05 0,0012707510430,000063537552170,9850422171 12 0,99752124780,0024787521770,05 0,0012393760880,000061968804420,9851041859 100 1 0 0 0,9851041859 110 1 0 0 0,9851041859 Resumo estatístico com base nas amostras que os alunos retiraram do anexo A, aleatoriamente. n = 30 sexo idade escolari dade renda emprega do renda familiar anos de trabalho trabalho na empres a grau de relacionamento com o chefe Amostra masc fem muito bombom regular ruim muito ruim Ordem masc fem idade esc rendai rendaf temptr tempe mbom bom reg ruim mruim 1 50,0% 50,0% 41,03 13,20 30,77 40,44 19,96 8,72 33,5% 33,5% 23,0% 7,0% 3,0% 2 54,0% 47,0% 35,53 14,43 28,72 44,31 16,20 5,18 37,0% 37,0% 3,0% 13,0% 10,0% 3 57,0% 43,0% 35,30 13,90 26,60 38,20 16,40 5,90 30,0% 41,0% 23,0% 3,0% 3,0% 4 53,0% 47,0% 40,63 14,90 32,80 46,60 20,00 8,00 40,0% 30,0% 17,0% 3,0% 10,0% 5 52,0% 48,0% 36,50 13,50 29,30 37,18 19,24 7,61 46,0% 32,0% 14,0% 4,0% 4,0% 6 56,0% 44,0% 39,65 15,30 31,23 42,03 14,49 7,23 26,0% 36,0% 15,0% 17,0% 6,0% 7 57,0% 43,0% 39,73 13,63 30,00 40,06 19,73 7,82 40,0% 23,0% 20,0% 0,0% 17,0% 8 55,0% 45,0% 36,70 15,30 30,10 42,70 16,40 6,20 30,0% 42,0% 20,0% 5,0% 3,0% 9 50,0% 50,0% 39,10 14,73 34,30 50,35 20,37 8,52 34,0% 37,0% 20,0% 3,0% 6,0% 10 70,0% 30,0% 35,96 13,73 32,08 43,36 17,28 6,00 20,0% 30,0% 36,7% 6,7% 6,6% 11 60,0% 40,0% 41,30 14,20 33,69 46,60 21,80 8,02 40,0% 36,7% 16,7% 3,3% 3,3% 12 60,0% 40,0% 39,93 14,60 28,68 40,50 18,75 6,30 37,0% 40,0% 13,0% 7,0% 3,0% 13 50,0% 50,0% 35,80 13,63 27,58 42,67 14,77 5,60 40,0% 30,0% 17,0% 3,0% 10,0% 14 53,0% 47,0% 40,64 14,50 32,77 46,64 19,98 8,03 40,0% 30,0% 17,0% 3,0% 10,0% 15 45,0% 55,0% 39,50 13,80 32,10 40,30 17,64 7,54 22,0% 38,0% 25,0% 11,0% 4,0% 16 63,0% 37,0% 37,83 14,16 26,74 40,66 18,83 6,87 37,0% 40,0% 13,0% 7,0% 13,0% 17 53,0% 47,0% 35,00 14,00 30,59 40,75 19,00 6,80 34,0% 40,0% 20,0% 0,0% 6,0% 18 47,0% 53,0% 38,90 14,40 29,30 41,50 17,95 6,50 20,0% 40,0% 23,0% 10,0% 7,0% 19 60,0% 40,0% 34,80 13,60 27,91 43,60 16,13 5,90 43,4% 30,0% 3,3% 10,0% 13,3% 20 53,3% 46,7% 34,90 14,40 28,17 37,30 16,10 8,85 23,3% 43,4% 23,3% 0,0% 10,0% 21 60,0% 40,0% 42,00 13,93 31,53 49,65 18,61 5,69 33,3% 36,7% 20,0% 10,0% 0,0% 22 40,0% 60,0% 38,10 13,64 25,84 41,96 17,93 6,60 33,3% 40,0% 16,7% 3,3% 6,7% 23 66,7% 33,3% 37,73 13,66 34,80 48,25 18,40 8,01 23,3% 43,4% 20,0% 3,3% 10,0% 24 46,7% 53,3% 33,70 13,76 31,17 44,50 17,43 6,04 40,0% 46,7% 6,7% 3,3% 3,3% 25 56,7% 43,3% 35,76 12,40 33,67 46,51 18,60 5,95 36,7% 36,7% 26,6% 0,0% 0,0% 26 50,0% 50,0% 38,50 13,73 29,70 45,70 17,83 6,70 30,0% 43,3% 10,0% 6,7% 10,0% 27 50,0% 50,0% 38,50 14,47 31,96 40,02 18,73 7,61 23,3% 33,4% 33,4% 3,3% 6,7% 28 69,0% 31,0% 37,00 14,00 33,00 41,00 17,00 7,00 47,0% 37,0% 6,0% 5,0% 5,0% 29 50,0% 50,0% 40,60 6,97 32,60 45,59 19,53 5,36 36,7% 30,0% 13,3% 13,3% 6,7% 30 57,0% 43,0% 36,20 14,00 31,20 47,02 15,45 5,05 30,0% 26,7% 26,7% 6,6% 10,0% 31 57,0% 43,0% 36,53 13,53 30,44 41,56 16,05 5,29 30,0% 46,7% 13,3% 3,3% 6,7% 32 53,3% 46,7% 40,37 13,80 30,19 41,67 18,27 6,15 33,3% 36,8% 23,3% 3,3% 3,3% 33 50,0% 50,0% 32,33 14,97 32,94 42,99 17,83 7,25 40,0% 33,3% 16,7% 0,0% 10,0% 34 46,7% 53,3% 39,36 13,93 30,11 46,17 18,34 6,34 30,0% 33,3% 23,3% 6,7% 6,7% 35 43,3% 56,7% 39,70 13,60 28,54 45,27 17,23 6,44 36,7% 43,3% 10,0% 3,3% 0,0% 36 67,0% 33,0% 39,20 14,30 33,42 40,79 18,83 7,04 33,3% 30,0% 30,0% 0,0% 6,7% 37 46,7% 53,3% 35,56 13,93 30,45 40,63 18,55 3,86 36,7% 36,7% 16,7% 3,2% 6,7% 38 60,0% 40,0% 38,70 13,44 31,01 43,05 19,70 6,07 36,7% 30,0% 26,7% 0,0% 6,6% 39 66,7% 33,3% 37,96 13,97 33,02 44,11 19,95 8,46 30,0% 36,7% 26,7% 3,3% 3,3% 40 66,7% 33,3% 38,13 13,97 27,71 44,27 19,92 7,96 40,0% 23,3% 23,3% 6,7% 6,7% 41 50,0% 50,0% 38,13 13,20 29,39 40,82 16,48 5,28 20,0% 46,7% 23,3% 6,7% 3,3% 42 56,7% 43,3% 40,30 13,30 27,70 48,70 19,90 6,80 23,3% 43,4% 20,0% 3,3% 10,0% 43 50,0% 50,0% 36,60 13,50 26,49 45,80 16,30 5,06 30,0% 40,0% 13,3% 10,0% 6,7% 44 56,7% 43,3% 39,70 14,47 30,65 47,82 18,50 7,16 36,7% 26,7% 20,0% 6,6% 10,0% 45 53,3% 46,7% 35,93 14,30 30,17 41,38 16,77 6,11 16,7% 56,7% 16,7% 0,0% 9,9% 46 50,0% 50,0% 41,06 14,30 31,88 42,51 20,13 8,24 23,3% 43,4% 30,0% 3,3% 0,0% 47 53,3% 46,7% 40,06 14,70 31,77 43,39 18,23 6,58 26,7% 40,0% 30,0% 0,0% 3,3% 48 43,3% 56,7% 36,70 13,83 28,01 44,91 16,43 5,89 36,7% 43,4% 13,3% 3,3% 3,3% 49 50,0% 50,0% 37,90 13,70 27,90 40,10 17,80 5,29 30,0% 46,7% 23,3% 0,0% 0,0% 50 60,0% 40,0% 33,77 12,30 28,38 41,18 17,40 5,05 33,3% 36,7% 20,0% 0,0% 10,0% 51 63,3% 36,7% 37,60 13,40 27,68 43,89 17,27 6,11 30,0% 40,1% 23,3% 3,3% 3,3% 52 46,7% 53,3% 37,76 13,90 28,06 48,41 18,40 5,30 33,3% 33,4% 23,3% 3,3% 6,7% 53 53,3% 46,7% 38,83 14,43 28,87 47,56 18,50 5,34 36,7% 46,7% 3,2% 6,7% 6,7% 54 50,0% 50,0% 36,43 13,50 29,78 44,92 17,16 6,42 40,0% 40,0% 10,0% 3,3% 6,7% 55 63,3% 36,7% 40,77 12,97 30,74 45,50 18,10 6,60 36,8% 33,3% 23,3% 3,3% 3,3% 56 56,7% 43,3% 37,23 13,37 28,70 45,32 18,70 6,40 16,7% 33,3% 33,3% 6,7% 10,0% 57 50,0% 50,0% 39,43 14,40 34,82 49,43 19,67 7,80 23,3% 46,8% 23,3% 3,3% 3,3% 58 57,7% 43,3% 36,33 13,20 28,67 39,30 19,00 8,65 26,7% 40,0% 23,3% 3,3% 6,7% 59 60,0% 40,0% 36,60 13,80 27,40 41,09 17,48 6,80 40,0% 36,7% 20,0% 0,0% 3,3% 60 53,3% 46,7% 38,00 13,26 31,97 44,53 17,98 6,33 36,7% 30,0% 20,0% 3,3% 10,0% 61 56,7% 43,3% 36,93 14,20 31,64 45,13 17,97 7,97 36,7% 36,7% 20,0% 3,3% 3,3% 62 43,3% 56,7% 37,00 14,03 29,80 45,76 16,95 4,75 23,3% 33,4% 30,0% 3,3% 10,0% 63 46,7% 53,3% 37,80 13,00 27,00 41,80 16,90 6,50 26,7% 40,0% 26,7% 3,3% 3,3% 64 60,0% 40,0% 38,00 14,36 29,73 46,01 18,90 5,90 40,0% 33,3% 16,7% 3,3% 6,7% 65 56,7% 43,3% 33,82 13,8331,39 43,90 16,18 5,15 43,4% 26,7% 23,3% 3,3% 3,3% 66 53,3% 46,7% 34,20 13,60 28,02 38,47 14,86 6,06 23,3% 40,0% 23,3% 6,7% 6,7% 67 50,0% 50,0% 38,90 13,97 34,50 47,60 19,40 7,70 33,4% 23,3% 33,3% 3,3% 6,7% 68 50,0% 50,0% 36,96 13,70 28,29 47,09 17,30 5,53 43,3% 36,7% 10,0% 0,0% 10,0% 69 56,7% 43,3% 37,50 15,03 27,90 46,50 16,85 6,60 27,0% 40,0% 23,0% 3,0% 7,0% 70 53,3% 46,7% 35,90 14,17 29,57 45,37 15,73 6,69 33,3% 36,8% 23,3% 3,3% 3,3% 71 57,0% 43,0% 38,90 14,40 27,50 43,00 19,20 6,70 23,0% 53,0% 20,0% 3,0% 0,0% 72 63,3% 36,7% 36,60 14,23 34,00 49,13 17,50 6,17 26,7% 33,3% 26,7% 6,7% 6,6% 73 60,0% 40,0% 39,43 14,60 31,25 44,85 20,50 4,59 34,0% 34,0% 23,0% 6,0% 3,0% 74 46,7% 53,3% 37,43 13,23 32,07 47,71 17,51 6,69 26,7% 36,7% 26,7% 0,0% 9,9% 75 56,7% 43,3% 37,10 14,53 31,28 42,14 19,37 6,94 46,7% 20,0% 23,3% 3,3% 6,7% 76 60,0% 40,0% 34,67 13,80 31,17 44,76 15,58 5,35 34,0% 23,0% 20,0% 13,0% 10,0% 77 40,0% 60,0% 39,30 13,67 29,11 44,81 18,77 6,23 43,3% 26,7% 26,7% 0,0% 3,3% 78 50,0% 50,0% 36,67 14,17 29,77 44,86 17,50 7,31 26,7% 36,7% 20,0% 3,3% 13,3% 79 50,0% 50,0% 37,50 14,70 29,70 44,90 17,70 4,70 27,0% 43,0% 20,0% 3,0% 7,0% 80 57,0% 43,0% 35,83 13,57 25,42 43,46 17,77 5,04 45,0% 38,0% 17,0% 0,0% 0,0% 81 66,7% 33,3% 40,27 13,80 33,92 50,49 19,30 6,82 33,4% 33,4% 23,2% 3,3% 6,7% 82 63,3% 36,7% 39,10 14,00 26,45 42,92 19,57 7,14 23,3% 36,7% 20,0% 6,7% 13,3% 83 60,0% 40,0% 38,50 14,00 32,40 46,30 19,40 6,60 33,3% 36,7% 13,3% 3,3% 13,3% 84 60,0% 40,0% 38,00 14,13 28,40 41,21 16,63 5,89 30,0% 33,4% 20,0% 6,6% 10,0% 85 46,7% 53,3% 36,40 14,00 28,00 41,10 17,00 7,60 26,7% 33,3% 20,0% 3,3% 16,7% 86 50,0% 50,0% 38,86 14,13 30,10 45,60 20,17 7,03 46,7% 30,0% 16,7% 6,6% 0,0% 87 44,0% 56,0% 37,60 14,10 29,81 45,88 17,22 5,96 32,0% 40,0% 22,0% 2,0% 4,0% 88 56,0% 44,0% 37,28 13,72 29,30 44,02 18,98 6,80 34,0% 40,0% 20,0% 4,0% 2,0% 89 58,0% 42,0% 36,60 14,20 32,40 40,80 18,00 9,00 32,0% 44,0% 18,0% 2,0% 4,0% 90 54,0% 46,0% 40,20 14,20 31,60 44,80 21,40 9,20 26,0% 38,0% 28,0% 2,0% 6,0% 91 56,0% 44,0% 41,40 14,40 33,80 50,00 20,30 10,20 30,0% 36,0% 24,0% 6,0% 4,0% 92 58,0% 42,0% 38,80 14,02 30,00 46,32 14,80 7,60 38,0% 32,0% 20,0% 2,0% 8,0% 93 54,0% 46,0% 38,60 14,18 29,60 45,20 19,80 7,80 36,0% 22,0% 30,0% 4,0% 8,0% 94 56,0% 44,0% 37,80 14,40 29,20 42,00 18,40 8,00 42,0% 36,0% 14,0% 4,0% 4,0% 95 52,0% 48,0% 37,70 14,10 30,90 44,70 17,80 5,90 36% 34% 24% 0% 6% 96 54,0% 46,0% 39,80 13,67 33,06 46,98 19,80 7,08 18% 42% 24% 10% 6% 97 54,0% 46,0% 37,50 14,20 32,40 38,80 18,10 7,00 30% 44% 14% 4% 8% 98 52,0% 48,0% 39,40 14,40 29,20 44,10 20,60 6,24 30% 36% 26% 2% 6% 99 58,0% 42,0% 38,40 14,30 32,90 44,80 17,30 6,10 44% 22% 26% 4% 4% 100 54,0% 46,0% 39,20 14,80 28,00 43,80 19,50 9,40 26,0% 30,0% 32,0% 6,0% 6,0% Total 54,5% 45,5% 37,9 13,9 30,3 44,0 18,1 6,7 32,6% 36,3% 20,5% 4,2% 6,4% mi = 38,1 idade Soma Supor uma população composta de 3 elementos µ σ² 41,03 1.230,9 1 2 3 2 0,7 35,53 1.065,9 35,30 1.059,0 Retirar todas as amostra de 2 elementos (n = 2) 40,63 1.218,9 Soma média 36,50 1.095,0 1 1 1 2 2 2 3 3 3 18 2 39,65 1.189,5 1 2 3 1 2 3 1 2 3 18 2 39,73 1.191,9 Soma 2 3 4 3 4 5 4 5 6 36 4 36,70 1.101,0 média 1 1,5 2 1,5 2 2,5 2 2,5 3 18 2 39,10 1.173,0 S² 0 0,5 2 0,5 0 0,5 2 0,5 0 6 0,6666666667 35,96 1.078,8 var(media) 0,3 41,30 1.239,0 39,93 1.197,9 Bloco Bloco Freqüência 35,80 1.074,0 1 1 1 40,64 1.219,2 1,5 1,5 2 39,50 1.185,0 2 2 3 37,83 1.134,9 2,5 2,5 2 35,00 1.050,0 3 3 1 38,90 1.167,0 Mais 0 34,80 1.044,0 34,90 1.047,0 42,00 1.260,0 38,10 1.143,0 Bloco Freqüência 37,73 1.131,9 34 4 33,70 1.011,0 36 14 35,76 1.072,8 38 31 38,50 1.155,0 40 25 38,50 1.155,0 42 12 37,00 1.110,0 Mais 0 40,60 1.218,0 36,20 1.086,0 36,53 1.095,9 40,37 1.211,1 32,33 969,9 5 50000 39,36 1.180,8 20 7000 39,70 1.191,0 16 50000 39,20 1.176,0 15 170000 35,56 1.066,8 6 10100 1148400 0,007545183366 38,70 1.161,0 57420 1139800 37,96 1.138,8 4391432000 38,13 1.143,9 13253,57612 38,13 1.143,9 40,30 1.209,0 População de 4 elementos Var = soma(x - media)²/N 36,60 1.098,0 1 2 3 4 N é o tamanho da pop 39,70 1.191,0 µ 2,5 n é o tamanho da amostra 35,93 1.077,9 Var(X) = σ² 1,25 quantas amostras de 3 elementos serão possíveis com reposição 41,06 1.231,8 são 64 amostras. 40,06 1.201,8 Amostras de 3 elementos 36,70 1.101,0 37,90 1.137,0 x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12 x13 x14 x15 x16 x17 x18 x19 x20 x21 x22 x23 x24 x25 x26 x27 x28 x29 x30 x31 x32 x33 x34 x35 x36 x37 x38 x39 x40 x41 x42 x43 x44 x45 x46 x47 x48 x49 x50 x51 x52 x53 x54 x55 x56 x57 x58 x59 x60 x61 x62 x63 x64 33,77 1.013,1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 37,60 1.128,0 1 1 1 1 2 2 2 2 3 3 3 3 4 4 4 4 1 1 1 1 2 2 2 2 3 3 3 3 4 4 4 4 1 1 1 1 2 2 2 2 3 3 3 3 4 4 4 4 1 1 1 1 2 2 2 2 3 3 3 3 4 4 4 4 37,76 1.132,8 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 38,83 1.164,9 soma 3,0 4,0 5,0 6,0 4,0 5,0 6,0 7,0 5,0 6,0 7,0 8,0 6,0 7,0 8,0 9,0 4,0 5,0 6,0 7,0 5,0 6,0 7,0 8,0 6,0 7,0 8,0 9,0 7,0 8,0 9,0 10,0 5,0 6,0 7,0 8,0 6,0 7,0 8,0 9,0 7,0 8,0 9,0 10,0 8,0 9,0 10,0 11,0 6,0 7,0 8,0 9,0 7,0 8,0 9,0 10,0 8,0 9,0 10,0 11,0 9,0 10,0 11,0 12,0 36,43 1.092,9 média 1,0 1,3 1,7 2,0 1,3 1,7 2,0 2,3 1,7 2,0 2,3 2,7 2,0 2,3 2,7 3,0 1,3 1,7 2,0 2,3 1,7 2,0 2,3 2,7 2,0 2,3 2,7 3,0 2,3 2,7 3,0 3,3 1,7 2,0 2,3 2,7 2,0 2,3 2,7 3,0 2,3 2,7 3,0 3,3 2,7 3,0 3,3 3,7 2,0 2,3 2,7 3,0 2,3 2,7 3,0 3,3 2,7 3,0 3,3 3,7 3,0 3,3 3,7 4,0 40,77 1.223,1 variância 0,0 0,3 1,3 3,0 0,3 0,3 1,0 2,3 1,3 1,0 1,3 2,3 3,0 2,3 2,3 3,0 0,3 0,3 1,0 2,3 0,3 0,0 0,3 1,3 1,0 0,3 0,3 1,0 2,3 1,3 1,0 1,3 1,3 1,0 1,3 2,3 1,0 0,3 0,3 1,0 1,3 0,3 0,0 0,3 2,3 1,0 0,3 0,3 3,0 2,3 2,3 3,0 2,3 1,3 1,0 1,3 2,3 1,0 0,3 0,3 3,0 1,3 0,3 0,0 37,23 1.116,9 média da médias 2,5 var(amost) = soma(x - media)²/n-1 39,43 1.182,9 variância das médias 0,417 36,33 1.089,9 Var da pop (pelo teorema) var(méd) = Var(X)/n 1,25/3 = 0,417 36,60 1.098,0 soma Bloco Freqüência 38,00 1.140,0 3 3 1 36,93 1.107,9 4 4 3 37,00 1.110,0 5 5 6 37,80 1.134,0 6 6 10 38,00 1.140,0 7 7 12 33,82 1.014,6 8 8 12 34,20 1.026,0 9 9 10 38,90 1.167,0 10 10 6 36,96 1.108,8 11 11 3 37,50 1.125,0 12 12 1 35,90 1.077,0 Mais 0 38,90 1.167,0 36,60 1.098,0 Bloco Freqüência 39,43 1.182,9 1 1 37,43 1.122,9 1,375 3 37,10 1.113,0 1,75 6 34,67 1.040,1 2,125 10 39,30 1.179,0 2,5 12 36,67 1.100,1 2,875 12 37,50 1.125,0 3,25 10 35,83 1.074,9 3,625 6 40,27 1.208,1 3,8 3 39,10 1.173,0 4 1 38,50 1.155,0 38,00 1.140,0 36,40 1.092,0 38,86 1.165,8 Soma 3.245,4 97.360,8 Esperança 37,7 1.132,1 var(x) 4,0 3.586,1 7.1) N = 4 µ 3,5 2 3 4 5 σ² 1,25 A1 A2 A3 A4 A5 A6 A7 A8 A9 A10 A11 A12 A13 A14 A15 A16 2 2 2 2 3 3 3 3 4 4 4 4 5 5 5 5 2 3 4 5 2 3 4 5 2 3 4 5 2 3 4 5 Médias 2 2,5 3 3,5 2,5 3 3,5 4 3 3,5 4 4,5 3,5 4 4,5 5 variancias 0 0,5 2 4,5 0,5 0 0,5 2 2 0,5 0 0,5 4,5 2 0,5 0 Médias variâncias (s) A1 2 0 Tabela para o gráfico A2 2,5 0,5 Xi Fi A3 3 2 2 1 A4 3,5 4,5 2,5 2 A5 2,5 0,5 3 3 A6 3 0 3,5 4 A7 3,5 0,5 4 3 A8 4 2 4,5 2 A9 3 2 5 1 A10 3,5 0,5 A11 4 0 µ(x) = 3,5 A12 4,5 0,5 σ²(x) = 0,625 A13 3,5 4,5 A14 4 2 Média das variânci as 1,25 A15 4,5 0,5 A16 5 0 Var da var 2,0625 Simulação de experimentos problema: 5 dados são lançados, qual a probabilidade de ocorrer o número 1? p = 0,1667 modelo: supor um modelo binomial em que x varia de 0 a 5 sucessos q = 0,8333 soma dos pontos na casa x (sucesso) p(x) 1 2 3 4 5 6 Fu sequência quadra gerneral 0 0,4018 0 0 0 0 0 0 0 1 0,4019 1 2 3 4 5 6 0 2 0,1608 2 4 6 8 10 12 0 3 0,0322 3 6 9 12 15 18 0 4 0,0032 4 8 12 16 20 24 40 0 5 0,0001 5 10 15 20 25 30 50 0,01930478796 Qual a contribuição da turma para o investimento. População Amostras tamanho 3 contribuição em milhoes de reais 20 40 20 23 20 19 24 23 20 20 24 19 40 média µ 23,6 20 20 19 24 23 20 40 20 23 23 20 23 20 σ² 41,2 24 23 20 40 20 23 20 19 24 19 40 24 23 Média (x) 21,3 27,7 19,7 29,0 21,0 20,7 28,0 20,7 22,3 20,7 28,0 22,0 20 S² 5,3 116,3 0,3 91,0 3,0 4,3 112,0 4,3 4,3 4,3 112,0 7,0 19 20 Média das médiasamostrais Bloco Freqüência 23 23,4 19,7 1 24 Variância das médias amostrais 22,8 7 189 170 11,8 25,9 0 Dp Mais 4 3,4 Regressão Linear cap. 13 e 14 Covariância, medida de direção da correlação linear. Indica também se as variáveis tem alguma dependência estatística. A regressão linear (e não-linear) é uma forma de converter uma posssível relação entre duas variáveis numa relação de dependência por meio de uma função linear (ou não-linear). Covariância é a média dos produtos dos valores centrados de cada variável que é igual a Sxy/n Vamos supor que duas características de uma população de indivíduos foram coletadas e dispostos em uma tabela. veja: x y 1 2 1 4 -2,5 -3,8 9,6 /n 2 4 2 3 -1,5 -4,8 7,3 Sxy = 39,5 6,6 3 6 3 6 -0,5 -1,8 0,9 Sxx = 17,5 2,9 4 8 4 9 0,5 1,2 0,6 Syy = 98,8 16,5 5 10 5 10 1,5 2,2 3,3 raiz(Sxx/n) = Dpx 1,7 6 12 6 15 2,5 7,2 17,9 raiz(Sxy/n) = Dpy 4,1 7 14 39,5 8 16 média x 3,5 Cov(xy) = 6,6 9 18 média y 7,8 10 20 n = 6 0,95 Dp(x) 1,7 Dp(y) 4,1 O gráfico acima é um diagrama de dispersão em que x supostamente seja a variável independente e y a variável dependente (pode ocorrer o contrário). Perceba que os pontos do gráfico aparentemente estão alinhados (sobre uma reta), se isso acontecer é porque a correlação entre x e y é perfeita e existe uma função de 1° grau que fornece o valor de y conhecendo apenas o valor de x. A regressão linear consiste em encontrar esta função. (desvio da população) Exemplo anos de serviço num. Cliente s Renda mensal gasto saúde (%) 2 48 12 7,2 3 50 16 7,4 O exemplo a seguir mostra uma correlação imperfeita entre x e y, mas ainda assim é possível encontrar uma função de 1° grau que se ajusta à maioria dos pontos. 4 56 18 7,0 5 42 20 6,5 4 53 28 6,6 x y 6 60 30 6,7 1 4 7 62 40 6,0 2 3 8 58 48 5,6 3 6 8 64 50 6,0 4 9 10 72 54 5,5 5 10 6 15 r = 0,8134100509 r = -0,9404625287 Karl Pearson desenvolveu uma fórmula para verificar o quão razoável é essa correlação. Se chama coeficiente de correlação Pearson, ρ, e é largamente utilizado em análises estatísticas envolvendo muitas variáveis. Calcular as retas de regressão Anos de experie ncia tempo execuç ãoρ sempre será um número entre -1 e +1, quanto mais próximo de zero, mais fraca será a correlação linear entre as variáveis. 1 7 em que: 2 8 4 3 4 2 5 2 Para calcular o valor de ρ entre as variáveis x e y citadas, é necessário um quadro que facilite os cálculos em cada etapa. Veja: x y xy x² y² 1 4 4 1 16 Se a correlação for boa, então vale o esforço para determinnar a função que relacione x e y conforme valores observados. 2 3 6 4 9 3 6 18 9 36 4 9 36 16 81 5 10 50 25 100 6 15 90 36 225 21 47 204 91 467 O modelo linear O modelo linear é o modelo matemático que fornece a relação entre duas variáveis, uma dependente e outra independente, por meio de uma função de 1° grau, cuja fórmula matemática e dada por: O modelo linear é o modelo matemático que fornece a relação entre duas variáveis, uma dependente e outra independente, por meio de uma função de 1° grau, cuja fórmula matemática e dada por: em que: Y é o valor da variável dependente quando X for igual a xi, alfa e beta são os coeficientes linear e angular (inclinação da reta) e ε o erro aleatório. O problema da regressão linear consiste em determinar os valores de alfa e beta com base numa amostra de valores supostamente correlacionados. Agora, alfa e beta serão representados por a e b de modo que y = a + bx e o erro ignorado. A estimação dos parâmetros a e b se dá por meio de uma fórmula baseada na técnica de modelagem matemática proposto por Gauss denominada método dos mínimos quadrados ou Quadrados Mínimos Ordinários (MQO) ou OLS (do inglês Ordinary Least Squares). consultar cap. 14 Martins, 2011 para mais detalhes. Exemplo: X : Valor contábil Y : Preço de venda consultou 5 residências e registrou os valores contábil e de venda (imobiliária). Valores explressos em unidades de 100.000 $. x y xy x² y² A escolha de x e y para as variáveis envolvidas fica a critério do pesquisador. 2 2 4 4 4 3 5 15 9 25 4 7 28 16 49 5 10 50 25 100 6 11 66 36 121 Σ 20 35 163 90 299 n = 5 Verificação do modelo: R² Verificação dos resíduos Resíduos x y Y y - Y 2 2 2,4 -0,4 3 5 4,7 0,3 4 7 7 0 5 10 9,3 0,7 6 11 11,6 -0,6 20 35 35 0,0 O método dos mínimos quadrados tem por base a minimização dos resíduos devido ao modelo adotado. Quanto menor esses resíduos, melhor o modelo representará a relação entre as variáveis envolvidas. O coeficiente de determinação R², em %, vai nos indicar o quanto da variabilidade de y é explicada pela variável independente X. "na realidade, ...a minimização dos quadrados dos resíduos". No exemplo da potência do motor e o preço do veículo, podemos verificar, já no gráfico, que a variável potência (x) não explica toda formação do preço do veículo (y). Por isso R² ficou tão baixo, 33,8%. Veja os cálculos. Motor (100 CV)Preço (1.000 $)Y y - Y 0,40 9,4 3,28 6,1 1,25 38,9 20,45 18,5 1,10 10,5 17,42 -6,9 1,06 16,3 16,61 -0,3 0,60 6,1 7,32 -1,2 1,00 12,5 15,40 -2,9 1,10 13,1 17,42 -4,3 1,15 31,6 18,43 13,2 1,21 11,6 19,64 -8,0 0,76 6,7 10,55 -3,9 1,27 12,9 20,85 -8,0 0,57 5,2 6,71 -1,5 11,5 174,8 174,1 0,7 Análise do modelo (hipótese sobre o modelo) Situação: X é a quantidade produzida de um objeto, Y é a o custo total de produção de X obs obs Reta SQExp SQRes SQTot x y Y média y 38 375 378,5 5,8 -3,5 2,3 33,7 12,1 5,4 372,7 48 500 475,2 102,5 24,8 127,3 10516,3 614,2 16213,7 372,7 71 720 697,7 325,1 22,3 347,3 105664,3 496,1 120640,2372,7 64 600 630,0 257,3 -30,0 227,3 66223,7 900,4 51680,3 372,7 60 580 591,3 218,6 -11,3 207,3 47804,3 127,9 42987,0 372,7 8 95 88,2 -284,4 6,8 -277,7 80898,6 45,7 77099,0 372,7 45 460 446,2 73,5 13,8 87,3 5406,1 190,6 7627,1 372,7 34 350 339,8 -32,9 10,2 -22,7 1081,9 104,6 513,8 372,7 28 250 281,7 -90,9 -31,7 -122,7 8269,9 1006,7 15047,2 372,7 15 160 156,0 -216,7 4,0 -212,7 46961,5 16,3 45227,3 372,7 50 490 494,6 121,9 -4,6 117,3 14859,1 20,8 13767,0 372,7 40 410 397,8 25,2 12,2 37,3 632,7 148,3 1393,8 372,7 30 270 301,1 -71,6 -31,1 -102,7 5125,1 965,8 10540,5 372,7 20 230 204,3 -168,3 25,7 -142,7 28336,3 658,8 20353,9 372,7 10 100 107,6 -265,1 -7,6 -272,7 70266,3 57,6 74347,3 372,7 0,0 0,0 0,0 492079,9 5365,9 497443,3 Y = 10,845 + 9,6744X SQT = SQE + SQR R² = 0,9892179917 = 98,9% Pequena revisão Construir uma tabela para a variável quantitativa X : número de filhos na família x frequencia freq. Relativa ou p(x) porcentagem Acumulada % 0 4 0,143 14,3% 14,3% 1 8 0,286 28,6% 42,9% 2 6 0,214 21,4% 64,3% linha da mediana (50% ou mais) 3 4 0,143 14,3% 78,6% 4 3 0,107 10,7% 89,3% 5 2 0,071 7,1% 96,4% 6 1 0,036 3,6% 100,0% soma 28 1,000 100,0% ------- soma freq = n (total) a) Quantas famílias foram consultadas? 28 famílias foram consultadas b) Qual a porcentagem de familias com 2 filhos? 21,4% das familias tem 2 filhos c) Escolhendo uma família aleatoriamente, qual a probabilidade dela ter 4 filhos? A probabilidade de uma familia ter 4 filhos é de 10,7% d) Qual a porcentagem de familia com 3 filhos ou mais? P(X> 3) = 45,7% das familias tem 3 filhos ou mais Calcular as medidas de tendência central moda (elemento x de maior frequencia ou porcentagem) Mo = 1 (filhos) Resposta A maioria das familias, 28,6%, tem 1 filho. Mediana (elemento que separa a distribuição de freq em duas partes, 50% para cada lado) Md = 2 (filhos) Resp. 50% dessas familias tem 2 filhos ou menos (a mesma coisa que 2 filhos ou mais) Média x frequencia x.Freq 0 4 0 1 8 8 2 6 12 3 4 12 4 3 12 5 2 10 6 1 6 soma 28 60 média = 60/28 = 2,1 filhos em média obs. : caso os numeros estejam num rol (lista) rol : 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, etc. Utilizar a formula simples soma todos/quantidade Variância (Var(x) ou ) por se tratar de uma amostra, usa-se n-1 x frequencia (x - média)².Freq 0 4 17,640 1 8 9,680 2 6 0,060 3 4 3,240 4 3 10,830 5 2 16,820 6 1 15,210 soma 28 73,480 Var(x) = 73,48/27 = 2,7 filhos²desvio padrão (Dp , ) Dp = raiz quadrada da variância Dp = raiz(2,7) = 1,6 filhos Variáveis aleatórias exemplo Experimento experimento 5 boas 4 defeit total de 9 peças retira 3 peças V.A X : número de peças boas X combinaçõe cálculo p(x) 0 1 2 3 Soma Distribuição de probabilidade da V.A X: número de peças boas X p(x) F(X) (acumulada) 0 1 2 3 Soma * V.A --> variável aleatória problema das caras cc (0 caras) x (n° caras) p(x) p(x) ck (1 cara) kc (1 cara) kk (2 caras) x p(x) F(x) 0 1 2 soma ----- Cálculo da Esperança E(x) , valor esperado ou média n° peças boas X p(x) x.p(x) 0 0,048 1 0,357 2 0,476 3 0,119 soma 1,000 essa soma já é a esperança (média) E(x) 0,0 Resposta. Retirando-se 3 peças aleatoriamente, espera-se 1,7 peças boas em média. Cálculo da variancia para uma variavel aleatoria n° peças boas X p(x) x².p(x) 0 0,048 1 0,357 2 0,476 3 0,119 soma 1,000 Var(x) = Exercicios cap 5 5.1 ao 5.10 Variáveis aleatórias Experimento aleatório experimento 5 boas 4 defeit total de 9 peças retira 3 peças, sem repor V.A (variavel aleatoria) declara boa , boa, def ou boa, boa, boa, ou def, def, boa ou .... X : número de peças boas X combinaçõe cálculo p(x) função que calcula a distribuição de probabilidade de uma V.A (fdp)0 DDD 4/9*3/8*2/7 0,048 1 BDD ou DBD ou DDB 5/9*4/8*3/7 *(3) 0,357 2 BBD ou BDB ou DBB 5/9*4/8*4/7 *(3) 0,476 Obs.: soma p(x) =1,000 3 BBB 5/9*4/8*3/7 0,119 0,999 ou 1,001 tambem vale Soma 1,000 Distribuição de probabilidade da V.A X: número de peças boas X p(x) F(X) (acumulada) 0 0,048 0,048 1 0,357 0,405 2 0,476 0,881 3 0,119 1,000 Soma 1,000 ------ * V.A --> variável aleatória problema das caras x (n° caras) p(x) p(x) cc (0 caras) ck (1 cara) kc (1 cara) kk (2 caras) x p(x) F(x) 0 1 2 soma ----- Cálculo da Esperança E(x) , valor esperado ou média média baseada em probabilidades n° peças boas X p(x) x.p(x) 0 0,048 0,000 1 0,357 0,357 2 0,476 0,952 3 0,119 0,357 soma 1,000 1,666 essa soma já é a esperança (média) E(x) = 1,7 Resposta. Retirando-se 3 peças aleatoriamente, espera-se 1,7 peças boas em média. Cálculo da variância para uma variavel aleatoria n° peças boas X p(x) x².p(x) 0 0,048 0,000 1 0,357 0,357 2 0,476 1,904 3 0,119 1,071 soma 1,000 3,332 E(x²) Var(x) = 3,332 - 1,7^2 = 0,4 Dp (ou sigma) = raiz (0,4) = 0,6 Resposta. Retirando-se 3 peças aleatoriamente, o desvio padrão do número de peças boas é de 0,6 peças. Exercicios cap 5 5.1 ao 5.10 (5.1 ao 5.4 fazer as distribuiçoes de probabilidade e gráfico) (5.5 ao 5.10 fazer a tabela e calcular a esperança e a variância) 5.5 Uma variável aleatória discreta pode assumir cinco valores, conforme a distribuição de probabilidade: x p(x) 1 0,20 2 0,25 3 … 5 0,30 8 0,10 a) Encontrar o valor de p(3). b) Qual é o valor da função acumulativa para x = 5? c) Encontrar a média da distribuição. d) Calcular a variância e o desvio-padrão. 5.6 A distribuição de probabilidade de uma variável aleatória discreta X é dada pela fórmula:p(x) = (0,8) (0,2)x –1 x = 1, 2, 3, … a) Calcular p(x) para x = 1, x = 2, x = 3, x = 4 e x = 5. b) Some as probabilidades obtidas no item a. O que você diria a respeito das probabilidades para valores maiores do que 5? 5.7 O número de chamadas telefônicas recebidas por uma central e suas respectivas probabilidades para um intervalo de um minuto são: Número de chamadas (x)Probabilidades 0 0,55 1 0,25 2 0,1 3 0,04 4 0,04 5 0,02 a) Calcular F(2). b) Determinar P(1 ≤ x ≤ 4) e P(x > 1). c) Qual é o número esperado de chamadas em um minuto? d) Como vimos no Capítulo 3, o coeficiente de variação é dado pelo quociente entre o desvio-padrão e a média. Avalie o coeficiente de variação para essa distribuição. 5.8 Seja Z a variável aleatória correspondente ao número de pontos de uma peça de dominó. a) Construir a tabela de distribuição de probabilidade e o gráfico para Z. b) Calcular P(2 ≤ z < 6). c) Calcular F(8). d) Qual é o número médio de pontos? 5.9 Em uma sala, temos cinco rapazes e quatro moças. São escolhidas aleatoriamente três pessoas. Fazer X a variável aleatória: número de rapazes. a) Determinar a distribuição de probabilidade da variável X. Construir uma tabela. b) Calcular as probabilidades: I – P(x ≤ 2); II – P(x ≤ 0); III – P(1 < x ≤ 3); IV – P(2 < x < 3); V – P(x > 2); VI – P(x > –1); VII – P(x < 5). c) Determinar: F(2,5); F(3); F(0,5); F(3,5); F(2); F(1); F(6); F(– 0,5). 5.10 De acordo com uma pesquisa do Data Journal, 70% das pessoas que trabalham em escritórios utilizam PCs da IBM. Se dois indivíduos que trabalham em escritórios são selecionados, encontrar a distribuição de probabilidade da variável X – número de usuários dos PCs da IBM. Calcular a média e o desvio-padrão dessa variável. (Andrade, 06/2017, p. 80) Distribuição Binomial X ~B(n,p) Exemplo 01 V.A X : numero de caras no lançamento de uma moeda 5 vezes n = 5 prob = numero sucessos/n° total Fórmulas p (sucesso) = 0,5 =1/2 x (n° sucessos) = 3 q é o fracasso (não sair cara) = 1-p q (fracasso) = 0,5 Fórmula kkkkk kkkkc ..... numero de comb para 2 caras Comb(5;2) --> 5 TECLA nCr 2 p(x) = 0,313 31,3% 10 conjuntos contendo 3 caras Distribuição Valor esperado Variância (var ou sigma²) = E(x²) - [E(x)]² esta última fórmula é da distribuiçã de Poisson x p(x) E(x) = Soma[x.p(x)] E(x²) 0 0,031 0,000 0,000 1 0,156 0,156 0,156 2 0,313 0,625 1,250 3 0,313 0,938 2,813 4 0,156 0,625 2,500 5 0,031 0,156 0,781 soma 1,000 2,500 7,500 Mesmo significado Qual o numero médio de caras? Qual a esperança matematica? Espera-se quantas caras no lançamento de uma moeda 5 vezes? resposta: Espera-se 2,5 caras em média Qual a variância Var = 1,3 caras² Qual o desvio padrão Dp = 1,1 caras Cálculo da esperança (E(x)) e Variância quando se tratar de uma distribuição binomial E(x) = n.p = 5 x 0,5 = 2,5 (média de x) Var(x) = n.p.q = 5 x 0,5 x 0,5 = 1,3 (variância de x) adquirir a distribuição binomial por meio de uma função embutida Funçao DISTRBINOM( x ; n ; p ; falso) P(x=0) 0,031 Acumulada P(X <= x) Funçao DISTRBINOM( x ; n ; p ; verdadeiro) P(X <= 3) 0,813 5.15) Um time X tem 2/3 de probabilidade de vitória sempre que joga. Se X jogar cinco partidas, calcule a probabilidade de: a) X vencer exatamente três partidas. x= 3 b) X vencer ao menos uma partida. x>=1 c) X vencer mais da metade das partidas. x>2,5 d) Calcule o numero esperado de vitorias e o desvio padrão 5.19 Se 5% das lâmpadas de certa marca são defeituosas, ache a probabilidade de que, numa amostra de 100 lâmpadas, escolhidas ao acaso, haja: a) nenhuma defeituosa; b) três defeituosas; c) mais do que uma boa. d) O numero esperado de lampadas defeituosas e o desvio padrão 5.15) a n = 5 p(3) = 0,329 x = 3 p = 0,667 q = 0,333 Atividades 5.15) Um time X tem 2/3 de probabilidade de vitória sempre que joga. Se X jogar cinco partidas, calcule a probabilidade de: a) X vencer exatamente três partidas. x= 3 b) X vencer ao menos uma partida. x>=1 c) X vencer mais da metade das partidas. x>2 d) Calcule o numero esperado de vitorias e o desvio padrão 5.19 Se 5% das lâmpadas de certa marca são defeituosas, ache a probabilidade de que, numa amostra de 100 lâmpadas, escolhidas ao acaso, haja: a) nenhuma defeituosa; b) três defeituosas; c) mais do que uma boa. d) O numero esperado de lampadas defeituosas e o desvio padrão Sucesso escolher uma peça defeituosa p = 0,05 q= 0,95 n= 100 a) X = 0 p(0) = 0,006 b) X = 3 p(3) = 0,140 C) Sucesso escolher uma peça boa p= 0,95 q= 0,05 x > 1 (boa) p(x > 1) = p(2) + p(3) + (p4) + ... + p(100) p(x > 1) = 1- [p(0) + p(1)] p(0) 0,000 p(1) 0,000 p(x > 1) = 1,000 d) Número esperado de lâmpadas defeituosas E(x) = n.p 100x0,05 E(x) = 5,0 Desvio padrão do numero de lampadas defeituosas Var(x) = npq 100x0,05x0,95 Var(x) = 4,8 Desvio padrã = Raiz (var) Dp = 2,2 Num lote de 100 lampadas, espera-se encontrar 5 lampadas defeituosas com um desvio padrão de 2,2 lâmpadas Distribuição de Poisson Exercícios 5.20 ao 5.36 Suponhamos que num bancosão atendidas 280 pessoas em 3 horas. Isso nos dá um parâmetro de 1,6 pessoas por minuto (aproximadamente). Se esse parâmetro permanecer constante para todo intervalo de 1 minuto, e sendo a V.A. X o número de pessoas atendidas no próximo minuto, X terá distribuição de Poisson com parâmetro λ = 1,6 . Escreve-se X ~P(λ). Parêmetro λ (por unidade de tempo, área, etc) e é o número de Euler = 2,71828... Características x é o número de sucessos (0, 1, 2, 3, ...) E(X) = µ = λ Var(X) = σ² = λ Comparação entre as distribuições de Poisson e a binomial. O número de provas n da binomial deve ser grande e p pequeno. s λ = 1,6 x = 0, 1, 2, 3, .... Pela Poisson Pela binomial p 0,027 N° sucessos Probabilidade N° sucessos Probabilidade q 0,973 x p(x) x.p(x) x p(x) x.p(x) n 60 0 0,202 0,000 0 0,198 0,000 média 1,6 1 0,323 0,323 1 0,325 0,325 2 0,258 0,517 2 0,262 0,525 3 0,138 0,413 3 0,139 0,417 4 0,055 0,221 4 0,054 0,217 5 0,018 0,088 5 0,017 0,083 6 0,005 0,028 6 0,004 0,025 7 0,001 0,008 7 0,001 0,006 8 0,000 0,002 8 0,000 0,001 9 0,000 0,000 9 0,000 0,000 10 0,000 0,000 10 0,000 0,000 11 0,000 0,000 11 0,000 0,000 12 0,000 0,000 12 0,000 0,000 13 0,000 0,000 13 0,000 0,000 14 0,000 0,000 14 0,000 0,000 15 0,000 0,000 15 0,000 0,000 Σ 1,000 1,600 Σ 1,000 1,600 Questionamento: Qual a probabilidade de que 5 pessoas sejam atendidas nos próximos 3 minutos? Como a média é a mesma em todo instante, 1,6 pessoas por minuto corresponde a 4,8 pessoas atendidas em 3 minutos. Dessa forma, teremos um novo parâmetro λ = 4,8. Agora, é só substituir na fórmula com x = 5. Veja que o parâmetro λ muda quando o intervalo considerado mudar. Atividade Chegam caminhões a um depósito à razão de 2,8 caminhões/hora, segundo uma distribuição de Poisson. Determine a probabilidade de chegarem dois ou mais caminhões: a) num período de 30 minutos; b) num período de 1 hora; e c) num período de 2 horas. R: 1- [P(0) + P(1)] a) λ = 1,4 R= 0,40817 b) λ = 2,8 R=0,76892 c) λ = 5,6 R=0,97559 Questionamento Sabendo que a média de gols é de 1,3 por partida, qual a probabilidade de marcar mais de 2 gols em pelo menos 4 das 6 partidas? 1°) Calcular a probabilidade de sair mais de 2 gols por partida pela poisson 2°) Essa será a probabiliadade de sucesso. 3°) Depois, calcular a probabilidade de ter sucesso em pelo menos 4 partidas nas 6 restantes. 5.28 Suponha que haja em média 2 suicídios por ano numa população de 50.000. Em cada cidade de 100.000 habitantes, encontre a probabilidade de que em dado ano tenha havido: a) 0; b) 1; c) 2; d) 2 ou mais suicídios. 5.29 Suponha 400 erros de impressão distribuídos aleatoriamente em 1 livro de 500 páginas. Encontre a probabilidade de que dada página contenha: a) Nenhum erro. b) Exatamente 2 erros. 5.30 Certa loja recebe em média 5 clientes por hora. Qual a probabilidade de: a) Receber 2 clientes em 24 minutos? b) Receber pelo menos 3 clientes em 18 minutos? 5.31 A média de chamadas telefônicas em 1 hora é 3. Qual é a probabilidade de: a) Receber 3 chamadas em 20 minutos? b) Receber no máximo 2 chamadas em 30 minutos? 5.32 De acordo com o National Office of Vital Statistics of U.S. Department of Health, Education and Welfare, o número médio de acidentes ocorridos por ano é 3,0 por 100.000 pessoas. Determinar a probabilidade de em uma cidade de 200.000 habitantes haver menos de 3 acidentes. 5.33 Um contador Geiser marca em média 40 sinais por minuto, quando nas proximidades de certa substância radioativa. Determinar a probabilidade de que haja 2 sinais em um período de 6 segundos. 5.34 Em uma estrada, passam em média 1,7 carro por minuto. Qual é a probabilidade de passarem exatamente 2 carros em 2 minutos? 5.35 Um distribuidor de gasolina tem capacidade de receber, nas condições atuais, no máximo 3 caminhões por dia. Se chegarem mais de 3 caminhões, o excesso deve ser enviado a outro distribuidor. Sabendo que, em média, chegam diariamente 2 caminhões, qual a probabilidade de, em certo dia, ter que enviar caminhões para outro distribuidor? 5.36 Uma fábrica produz tecidos com 2,2 defeitos, em média, por peça. Determinar a probabilidade de haver ao menos 2 defeitos em 2 peças. Distribuição normal de probabilidade Essa fórmula não calcula p(x) A probabilidade de um intervalo específico é dada pela integral dessa função entre os valores desejados. Por tratar-se de um modelo de distribuição contínua, a probabilidade de X assumir um particular valor x é zero, isto é, P(X = x) = 0 Curva carcteristica é a curva de Gauss Para se calcular a probabilidade de x num intervalo, utiliza-se a tabela da distribuição padronizada. Anexo D no livro texto, ou a planilha disponível na nossa pasta cálculo para desenhar o gráfico Para usar essa tabela, é necessário usar a transformação para os escores Z por meio da fórmula -3 0,004431848412 -2,5 0,01752830049 -2 0,05399096651 -1,5 0,1295175957 -1 0,2419707245 -0,5 0,3520653268 Resolver os exercícios listados a seguir usando o processo de cálculo manual com auxílio da tabela e empregando diretamente as funções do Excel. 0 0,3989422804 0,5 0,3520653268 6.1 Fazer z uma variável com distribuição normal padronizada e, com auxílio da tabela do Anexo D, encontrar: 1 0,2419707245 1,5 0,1295175957 a) P(0 ≤ Z ≤ 1,44); conforme a tabela, P(0 < Z < 1,44) = 0,425 = 42,5% 2 0,05399096651 b) P(– 0,85 < Z < 0); Pelo planilhas norm.dist(x; media; desvio-padrao; cumulativa) 2,5 0,01752830049 c) P(– 1,48 < Z < 2,05); P(0 < Z < 1,44) 0,425 3 0,004431848412 d) P(0,72 < Z < 1,89); e) P(Z ≥ 1,08); b) 0,302 ou 30,2% d) 0,2064 ou 20,6% f) P(Z ≥ –0,66); c) 01,0% e) g) P(|Z| ≤ 0,5) = P(-0,5 < Z < 0,5) 6.2 A duração de certo componente eletrônico pode ser considerada normalmente distribuída com média de 850 dias e desvio-padrão de 45 dias. Calcular a probabilidade de um componente durar: a) Entre 700 e 1.000 dias. b) Mais que 800 dias. c) Menos que 750 dias. d) Exatamente 1.000 dias. 6.3 Os pesos de 600 estudantes são normalmente distribuídos com média de 65,3 kg e desvio-padrão 5,5 kg. Encontrar o número de alunos que pesam: a) Entre 60 e 70 kg. b) Mais que 63,2 kg. 6.4 Suponha que as notas de uma prova sejam normalmente distribuídas com média 73 e desvio-padrão 15. Dos alunos mais adiantados, 15% recebem a nota A, e 12% dos mais atrasados recebem nota F. Encontrar o mínimo para receber A e o mínimo para passar, não receber F. 6.5 Uma fábrica de pneumáticos fez um teste para medir o desgaste de seus pneus e verificou que ele obedecia a uma distribuição normal de média 48.000 km e desvio-padrão de 2.000 km. Calcular a probabilidade de um pneu escolhido ao acaso: a) Durar mais que 46.000 km. b) Durar entre 45.000 e 50.000 km. 6.6 X é uma variável aleatória contínua, tal que X = N(12; 25). Qual é a probabilidade de uma observação ao acaso: a) Ser menor do que – 3? b) Cair entre – 1 e 15? 6.7 O salário semanal dos operários industriais é distribuído normalmente em torno de uma média de $ 180 com desvio-padrão de $ 25. Pede-se: a) Encontrar a probabilidade de um operário ter salário semanal situado entre $ 150 e $ 178. b) Dentro de que desvio, de ambos os lados da média, cairão 96% dos salários? 6.8 Certo produto tem peso médio de 10 g e desvio-padrão de 0,5 g. É embalado em caixas de 120 unidades que pesam em média 150 g e têm desvio-padrão de 8 g. Qual é a probabilidade de que uma caixa cheia pese mais de 1.370 g? 6.9 Um avião de turismo de quatro lugares pode levar uma carga útil de 350 kg. Supondo que os passageiros tenham peso de 70 kg, com distribuição normal de peso, e desvio-padrão de 20 kg, e que a bagagem de cada passageiro pese em média 12 kg, com desvio-padrão de 5 kg e distribuição normal do peso, calcule a probabilidade de: a) Haver sobrecarga se o piloto não pesar os quatro passageiros e as respectivas bagagens. b) Que o piloto tenha de tirar pelo menos 50 kg de gasolina para evitar sobrecarga. 6.10 Em uma distribuição normal, 28% dos elementos são superiores a 34 e 12% inferiores a 19. Encontrar a média e a variânciada distribuição. 6.11 As variáveis: são independentes. Determinar a distribuição de: Y = X1 + X2 + X3. 6.12 Suponha que o diâmetro médio dos parafusos produzidos por uma fábrica seja de 0,25 polegadas, e o desvio-padrão de 0,02 polegadas. Um parafuso é considerado defeituoso se seu diâmetro é maior que 0,28 polegadas ou menor que 0,20 polegadas. a) Encontrar a porcentagem de parafusos defeituosos. b) Qual deve ser a medida mínima na cauda à esquerda para que tenhamos no máximo 12% de parafusos defeituosos? 6.13 Suponha que a duração de vida de dois equipamentos, E1 e E2, tenha respectivamente distribuições: N(45; 9) e N(40; 36). Se o equipamento tiver de ser usado por um período de 45 horas, qual deles deve ser preferido? 6.14 Certa máquina de empacotar determinado produto oferece variações de peso com desvio-padrão de 20 g. Em quanto deve ser regulado o peso médio do pacote para que apenas 10% tenham menos que 400 g? 6.15 Sendo X , determinar: a) P(μ – σ ≤ X ≤ μ + σ); b) P(μ – 2σ ≤ X ≤ μ + 2σ); c) P(μ – 3σ ≤ X ≤ μ + 3σ); d) P(μ – 1,5σ ≤ X ≤ μ + 1,5σ); e) P(μ –3,5σ ≤ X ≤ μ + 3,5σ); 6.16 Com base nas respostas obtidas no exercício anterior, podemos concluir que, para qualquer distribuição normal: a) O intervalo compreendido entre o valor da média – 1 desvio-padrão e o valor da média + 1 desvio-padrão contém aproximadamente 68% das observações. Elabore conclusões semelhantes, considerando os resultados obtidos nos outros itens do Exercício 6.15. 6.17 Como visto no Capítulo 3, os percentis (Pi) são medidas estatísticas que dividem uma distribuição em 100 partes iguais. Da mesma forma, os decis (Di) dividem a distribuição em 10 partes iguais, enquanto os quartis (Qi) dividem a distribuição em quatro partes iguais, e a mediana (Me) divide a distribuição em duas partes iguais. Ou seja: Determine o que se pede: a) P5 de uma N(18; 64); b) P85 de uma N(20; 100); c) D1 de uma N(30; 49); d) D7 de uma N(120; 81); e) Q1 de uma N(5; 9); f) Q3 de uma N(78; 121); g) Md de uma N(30; 40). 6.18 Usando a tabela da distribuição N(0; 1), determine Z0 tal que: a) P(Z < Z0) = 0,05; b) P(Z < Z0) = 12%; c) P(Z < Z0) = 35%; d) P(Z < Z0) = 50%; e) P(Z < Z0) = 60%; f) P(Z < Z0) = 75%; g) P(Z < Z0) = 90%; h) P(Z > Z0) = 72%; i) P(Z > Z0) = 0,65; j) P(Z > Z0) = 0,38; k) P(Z > Z0) = 0,08. 6.19 Um exame que foi submetido a um grande número de estudantes acusa média 65 e desvio-padrão 10. Se desejarmos atribuir aos 15% superiores o grau A, aos 20% seguintes o grau B, aos 30% médios o grau C, aos próximos 25% o grau D e aos últimos 10% o grau E, quais os intervalos de notas que serão abrangidos por essa classificação, admitindo que as notas tenham distribuição normal? 6.20 Uma fábrica automática produz resistências segundo uma distribuição normal de média de 50 ohms e variância de 40 ohms2. Achar quais limites de tolerância devem ser postos nas resistências para garantir que não mais do que uma em cem esteja fora dos limites fixados. As resistências serão marcadas: R ± 50. 6.21 Em uma grande empresa, a avaliação do desempenho profissional dos funcionários acusou média 70 e desvio-padrão 10. Se desejarmos atribuir aos 15% superiores o grau A, aos 20% seguintes o grau B, aos 30% médios o grau C, aos próximos 25% o grau D e aos últimos 10% o grau E, quais os intervalos de notas que serão abrangidos por essas classificações? 6.22 A vida média útil de lavadoras de pratos automáticas é de 1,5 ano, com desvio-padrão de 0,3 ano. Se forem vendidas 12.000 unidades, quantas esperamos que necessitarão de conserto antes de expirar o período de garantia de um ano? 6.23 Uma pessoa tem 20 minutos para chegar ao escritório. Para tal, pode optar entre dois caminhos: A ou B. Sabendo que o tempo para percorrer o caminho A é N(18; 25) e que o tempo para percorrer B é N(20; 4), qual é a melhor escolha do trajeto? 6.24 Entre os 4.000 empregados de uma grande empresa, o QI (quociente de inteligência) é normalmente distribuído com uma média de 104 e desvio-padrão de 16. Sabendo que uma tarefa específica requer um QI mínimo de 98 e que aborrece aqueles com QI acima de 110, quantos empregados estarão adaptados para executar essa tarefa, com base apenas no QI? 6.25 O número de pessoas que almoçam num restaurante suburbano é aproximadamente normal, com média de 250 e desvio-padrão de 20 por dia. a) Qual a probabilidade de haver pelo menos 200 clientes em determinado dia? b) Se o preço médio pago por cliente é $ 4,00, qual a probabilidade de a receita exceder $ 1.150,00? 6.26 Um processo industrial produz canos com diâmetro médio de 2,00 polegadas e desvio-padrão de 0,01 polegada. Os canos com diâmetro que varia de mais de 0,03 polegada a contar da média são considerados defeituosos. Em uma produção de 10.000 canos, quantos esperaríamos defeituosos? 6.27 O tempo necessário em uma oficina para o conserto da transmissão de um tipo de carro segue uma distribuição normal, com média 45 minutos e desvio-padrão de 8 minutos. a) O mecânico comunicou a um cliente que o carro estará pronto em 50 min. Qual é a probabilidade de que o mecânico esteja enganado? b) Qual deve ser a previsão de tempo de trabalho para que haja 90% de probabilidade de que o conserto da transmissão seja efetuado dentro do tempo previsto? 6.28 Um caminhão transporta 22 refrigeradores, 14 televisores e 120 rádios. Os pesos em quilogramas, incluindo as embalagens, têm as seguintes distribuições estatisticamente independentes: cada refrigerador N(94; 2,98); cada TV N(42; 1,21); cada rádio N(3,35; 0,04). Sabendo-se que o caminhão vazio pesa 1.385 kg e o motorista vestido, 75 kg, qual a probabilidade de não ser multado o caminhão, ao transitar por uma estrada cuja tonelagem máxima permitida é de 4,5 t por veículo? 6.29 Constatou-se que o tempo médio para se fazer um teste-padrão de matemática é aproximadamente normal, com média de 80 minutos e desvio-padrão de 20 minutos. a) Que porcentagem de candidatos levará menos de 80 minutos? b) Que porcentagem não terminará o teste, se o tempo máximo concedido é de duas horas? c) Se 200 pessoas fazem o teste, quantas podemos esperar que o terminem na primeira hora? 6.30 O número de vezes que um adulto respira, por minuto, depende da idade e varia muito de pessoa para pessoa. Suponha que a distribuição dessa variável aleatória Y seja normal, com média de 16 e desvio-padrão igual a 4. Se uma pessoa é escolhida aleatoriamente e o número Y de respirações por minuto for anotado, qual a probabilidade de Y exceder 22? E de ser menor do que 15? 6.31 Os peixes pescados por uma traineira têm peso médio de 800 g e desvio-padrão de 90 g. a) Qual é a porcentagem de peixes que pesam menos de 700 g? b) Qual é a porcentagem de peixes cujos pesos estão a 20 g do peso médio? c) Escolhidos ao acaso dois peixes, qual é a probabilidade de um pesar mais e o outro menos que a média? 6.32 Em uma linha de produção, quatro peças de cobre são soldadas para compor outro item. Os tamanhos dessas peças seguem distribuição normal, com as seguintes características: Média (cm) Peça (tipo) Desvio-padrão (cm) 2 I 0,1 1 II 0,0775 0,5 III 0,0632 1,5 IV 0,1049 Qual é a probabilidade de que o tamanho total da peça atinja 5 ± 0,1 cm? (Andrade, 06/2017, pp. 101-103) Andrade, M. d., Osmar, D. (2017). Estatística Geral e Aplicada, 6ª edição. [[VitalSource Bookshelf version]]. Retrieved from vbk://9788597012675 Verifique as citações para exatidão antes de usar. Avaliação Neste fórum vamos fazer uma verificação de aprendizagem, em que seu conhecimento poderá ser expressado na íntegra. Para isso, acesse o tópico abaixo! Participe das mais diversas formas, sejam elas textos, tabelas ou gráficos, para poder mostrar seu conhecimento estatístico. Até aqui já foram 6 fóruns e muita conversa, alguns vídeos, vários textos e bastante exercícios. Você deve ter estudado pra caramba! Sendo assim, no lançamento de dois dados, forneça a distribuição de probabilidade da V.A soma dos pontos obtidos. Qual o valor esperado num lançamento? Qual o desvio padrão dessa variável aleatória? Façaum gráfico para melhor visualização. Agora, suponha que seu irmão irá realizar um teste em que as questões são de múltipla escolha, cada questão tem 3 alternativas, sendo apenas uma correta e ele irá escolher de forma aleatória a resposta em cada uma das 30 questões. Quantas questões você espera que ele acerte? Faça esse questionamento para seus colegas ou familiares e anote a resposta. Analisando as distribuições de probabilidade, será que seria possível explicar a curva normal de probabilidade por meio da distribuição binomial? Em outras palavras, existe uma situação em que essas duas distribuições de probabilidade se parecem? Exemplifique por meio de gráficos. Para não dizer que não falei do velho amigo Siméon Denis Poisson, que desenvoleu uma distribuição de probabilidade de variáveis aleatórias que anota o número de ocorrências de um certo fenômeno durante um intervalo de tempo, explique a fórmula que ele utilizou para calcular as probabilidades da distribuição que leva seu sobrenome, além de suas propriedades. Dê um exemplo fornecendo a distribuição e o gráfico. Exercício da normal e cap 7 6.19 Um exame que foi submetido a um grande número de estudantes acusa média 65 e desvio- padrão 10. Se desejarmos atribuir aos 15% superiores o grau A, aos 20% seguintes o grau B, aos 30% médios o grau C, aos próximos 25% o grau D e aos últimos 10% o grau E, quais os intervalos de notas que serão abrangidos por essa classificação, admitindo que as notas tenham distribuição normal? média = 65 e Dp = 10 Z1 = -1,28 Z2 = -0,38 X1 = -1,28*10 + 65 = 52,2 X2 = -0,38*10 + 65 = 61,2 Z3 = 0,38 Z4 = 1,03 X3 = 0,38*10 + 65 = 68,8 X4 = 1,03*10 + 65 = 75,3 Resposta: Conforme a figura acima, a tabela Z e as fómulas, concluímos que o aluno terá grau E caso tire menos que 52,2, grau D caso tire entre 52,2 e 61,2, grau C caso tire entre 61,2 e 68,8, grau B caso tire entre 68,8 e 75,3 e, por fim, o aluno reberá grau A caso tire nota acima de 75,3. 6.20) Uma fábrica automática produz resistências elétricas segundo uma distribuição normal de média de 50 ohms e variância de 40 ohms². Achar quais limites de tolerância devem ser postos nas resistências para garantir que não mais do que uma em cem esteja fora dos limites fixados. As resistências serão marcadas: 50 ± R. 1% tá fora média = 50 Dp = raiz(40) =6,3 Z1 = - 2,57 X1 = -2,57*6,3+50 = 33,8 Z2 = 2,57 X2 = 2,57*6,3 +50 = 66,2 R = desvio da média = 50 - 33,8 ou 66,2 - 50 = 16,2 ohms Assim, as resistências devem ser marcadas da seguinte forma: 50 +/- 16,2 ohms Assim, as resistências devem ser marcadas da seguinte forma: 50 +/- 16,2 ohms Inferência estatística Cap 7 Distribuições amostrais 7.1) Uma população é constituída pelos números 2, 3, 4, 5. Considerar todas as amostras possíveis, de tamanho 2, que podem ser extraídas dessa população com reposição. Determinar: (a) a média da população, (b) o desvio-padrão da população, (c) a média da distribuição amostral das médias, (d) o desvio-padrão da distribuição amostral das médias. Constatar que: 7.5) Uma amostra simples ao acaso de 30 residências foi selecionada de uma zona urbana que contém 15.000 residências. O número de pessoas de cada um dos domicílios que integram a amostra é o seguinte: 5 6 3 3 2 3 3 3 4 4 3 2 7 4 3 5 4 4 3 3 4 3 3 1 2 4 3 4 2 4 Estimar o número total de pessoas que vivem nesta área. Usar o estimador: 7.6 As assinaturas de um requerimento foram colhidas em 676 folhas. Cada folha é composta de 42 assinaturas, mas em muitas folhas foi registrado número menor de assinaturas. Retirou-se uma amostra de 50 folhas, obtendo: No de assinaturas N° de folhas 42 23 41 4 36 1 32 1 29 1 27 2 23 1 19 1 16 2 15 2 14 1 11 1 10 1 9 1 7 1 6 3 5 2 4 1 3 1 Estimar o número total de assinaturas. Estimadores de máxima verossimilhança Os estimadores são as fórmulas que determinam as medidas de tendencia central e de dispersão de um amostra estimador da média populacional pelo rol por uma tabela estimador da variância estimador da proporção populacional (frequencia relativa, porcentagens) estimador da soma total