Prévia do material em texto
Probabilidade Atividade de lançamento de dados Formação de números Problema dos oito casais Ideias iniciais D1 D2 soma Soma Fi fi dígitos : 1, 4, 7, 8, 9 7por10 15por20 19por30 1 9 3 14 8 1 3 16 5 9 12 10 - Experimentação 2 5 7 2 2 0,020 147 417 714 814 914 419 791 974 2 10 16 11 3 9 4 6 1 15 4 12 - Experimentos determinísticos e aleatórios 2 6 8 3 3 0,030 148 418 718 817 917 917 479 918 3 11 c c 5 3 8 4 10 0,100 149 419 719 819 918 871 489 174 4 12 A teoria das probabilidades estuda a forma de estabelecer as possibilidades de ocorrência de cada experimento aleatório. 4 1 5 5 11 0,110 174 471 741 841 941 871 491 784 5 13 3 2 5 6 13 0,130 178 478 748 847 947 478 194 741 6 14 Experimento aleatório - É aquele que quando repetido em iguais condições podem fornecer resultados diferentes, ou seja, são resultados explicados ao acaso. 5 4 9 7 17 0,170 179 479 749 849 948 714 789 941 7 15 3 5 8 8 13 0,130 184 481 781 871 971 198 198 748 8 16 Elementos (o que temos que conhecer para se compreender probabilidade) 1 1 2 9 16 0,160 187 487 784 874 974 847 814 948 Espaço amostral - descrição dos possíveis resultados de um experimento. Denotamos pela letra S 5 2 7 10 8 0,080 189 489 789 879 978 791 947 187 5 3 8 11 6 0,060 194 491 791 891 981 497 189 817 Evento - um dos resultados contidos no espaço amostral. Denotamos com as letras A, B etc 5 4 9 12 1 0,010 197 497 794 894 984 417 978 1 2 3 Σ 100 1,000 198 498 798 897 987 481 194 Nomenclatura - Sabemos que, pela teoria dos conjuntos, n(A) é o número de elementos do conjunto A. Se A é um subconjunto de S, então P(A) = n(A)/n(S) 5 4 9 789 498 4 5 9 30por50 479 978 3 6 9 987 841 719 Assim, probabilidade é a associação quantitativa à ocorrência de um evento dentro de seu espaço amostral. 4 1 5 981 918 718 5 2 7 978 491 198 O que acabamos de ver foi a definição de probabilidade teórica. Essa probabilidade serve apenas para experimentos que se encaixam perfeitamente em espaços amostrais bem definidos (que estão em nossas mentes). 3 1 4 479 814 817 6 5 11 148 718 814 1 5 6 947 491 897 Excercícios iniciais 1 3 4 948 849 No caso de um experimento empírico 1 6 7 198 481 Precisamos de um número, associado a um evento, que avaliará o quão verossível será a ocorrência desse evento quando o experimento for realizado. 1 6 7 918 498 3 3 6 917 481 Ao repetirmos um experimento várias vezes, digamos n vezes, veremos que os resultados seguirão uma certa tendência. Isso é verificado pela frequência relativa f do evento em questão, fA = n(A)/n,ou seja, o número de vezes que o evento A se repete dividido pelo número de repetições do experimento. Jogue uma moeda para cima e observe o resultado, faça isso umas 1.000 vezes e verifique qual a frequência relativa de cada face da moeda. Faça o mesmo com um dado de 6 faces e verifique a frequência relativa de cada face. 6 4 10 947 784 2 2 4 184 894 1 1 2 874 198 1 6 7 714 874 1 3 4 198 974 6 1 7 417 971 4 4 8 897 Francês conde de Buffon (1707 - 1788) lançou uma moeda 4.040 vezes resultando 2.048 caras. Assim, fC = 2048/4040 = 0,507 = 50,7% . O Sul- africano John Kerrich durante a 2° guerra lançou uma moeda 10.000 vezes e obteve 5.067 caras, ou seja, fC = 0,507 = 50,7%. Antes disso, em 1900, o inglês Karl Pearson lançou uma moeda 24.000 vezes resultando 12.012 caras. Então, fC = 12012/24000 = 0,5005 = 50,05% . 3 5 8 894 2 1 3 894 2 4 6 978 4 6 10 187 5 4 9 941 É possível mostrar matematicamente, mas também empiricamente, que para n suficientemente grande (geralmente tendendo ao infinito) fA ~ P(A) . 4 2 6 419 3 2 5 471 6 4 10 978 Propriedades : 2 2 4 817 1 5 6 784 1) P(A) estará sempre entre 0 e 1 , podendo assumir valor 0, se o evento nunca ocorrer e, assumir valor 1, se o evento ocorrer em todas as repetições do experimento. 6 3 9 784 4 3 7 487 2) Σ pi = 1 ( a soma de todas as probabilidades de S é 1,00) 5 6 11 189 3) A U B (união de eventos) significa que A ou B ocorre, ou ambos. 6 2 8 481 4) A ∩ B (interseccão de eventos) significa que A e B ocorreram . 5 1 6 789 5) A' (ou A barra, ou A complementar) significa que o evento não ocorreu. 1 5 6 984 3 4 7 791 Operações: 1 2 3 918 1) P(A U B) = P(A) + P(B) - P(A ∩ B) 2 2 4 719 2) P(A') = 1- P(A) 3 6 9 847 3) P(A/B) = P(A ∩ B)/P(B) probabilidade condicionada 4 4 8 487 Observações importantes que devem ser consideradas em muitas situações 5 1 6 741 Se P(A/B) for igual a P(A), então os eventos A e B são independentes. 1 5 6 487 Se dois eventos são independentes, então P(A ∩ B) = P(A).P(B) 3 3 6 871 Se dois eventos são mutuamente excludentes, P(A ∩ B) = 0, então P(A U B) = P(A) + P(B) 6 5 11 879 5 5 10 784 5 4 9 814 Exemplo: Lançaremos dois dados equilibrados. Qual a probabilidade da soma ser 8 e um dos dados apresentar 6 pontos? Verifique a dependência desses eventos. 6 6 12 471 5 3 8 481 4 3 7 184 Utilizaremos uma tabela de contingência para colocar a frequência relativa de cada evento, um evento na linha e outro na coluna com seus respectivos complementares. (isso nos traz um entendimento melhor das operações). 4 3 7 149 4 5 9 847 4 5 9 917 Espaço amostral n(S) = 36 5 2 7 A : a soma dá 8 {(2,6),(3,5),(4,4),(5,3),(6,2)} 1 2 3 4 5 6 2 2 4 B: um dos dados apresenta 6 {(1,6),(2,6),(3,6),(4,6), (5,6),(6,6),(6,1),(6,2), (6,3),(6,4), (6,5)} 1 2 3 4 5 6 7 3 2 5 2 3 4 5 6 7 8 3 1 4 3 4 5 6 7 8 9 6 5 11 A ∩ B : {(2,6),(6,2)} 4 5 6 7 8 9 10 1 5 6 n(A ∩ B) = 2 5 6 7 8 9 10 11 3 1 4 P(A ∩ B) = 2/36 = 0,056 6 7 8 9 10 11 12 6 5 11 e 4 3 7 n(A) = 5 --> P(A) = 5/36 = 0,139 1 6 7 n(B) = 11 --> P(B) = 11/36 = 0,306 3 5 8 P(A') = 0,861 P(B') = 0,694 2 3 5 No total, temos a probabilidade de cada evento e seu complementar, no interior temos as probabilidades das intersecções dos eventos (evento e). 3 1 4 A A' total 3 2 5 B 0,056 0,250 0,306 4 2 6 B' 0,083 0,611 0,694 4 5 9 total 0,139 0,861 1,000 2 5 7 5 3 8 Pelo que foi visto, se P(A∩B) for igual a P(A).P(B), então A e B são independentes 4 6 10 P(A).P(B) = 0,139*0,306 = 0,043 ≠ P(A∩B) 4 1 5 5 2 7 Exemplo de evento união. 6 4 10 Qual a probabilidade de apresentar soma 8 ou um dos dados apresntar 6? 1 5 6 P(AUB) = P(A) + P(B) - P(A∩B) = 0,139 + 0,306 - 0,056 = 0,389 6 4 10 6 5 11 Probabilidade condicional (a probabilidade da soma ser 8, sabendo que um dos dados apresenta 6 pontos). 3 4 7 3 6 9 P(A/B) = P(A∩B)/P(B) = 0,056/0,306 = 0,183 3 6 9 5 5 10 Atividades 2 3 5 exercícios cap. 4 do livro do Martins 3 6 9 atividade probabilidade condicional morettin (site) 4 1 5 1 4 5 Considerações sobre o espaço amostral. 6 2 8 O espaço amostral é formado pelos resultados de um experimento realizado numa determinada população. Se o experimento consiste em escolher uma quantia de individuos de uma população, o espaço amostral será composto de uma combinação específica de indivíduos.... 4 4 8 6 3 9 Operaçãoes com probabilidades. (Utililizando Tabelas de contingência, dupla entrada) Numa universidade foi feito um levantamento que resultou num cruzamento entre as variáveis gênero e curso escolhido. Gênero façamos: Curso MasculinoFeminino Total A -> Ser masculino Administração 60 80 140 B -> ser do curso de Adm. Outro 258 200 458 Total 318 280 598 Escolhendo-se um estudante ao acaso (aleatoriamente), Gênero Curso A A' Total B 0,100 0,134 0,234 B' 0,432 0,334 0,766 Total 0,532 0,468 1,000 Qual a probabilidade de ele ser do sexo masculino? P(A) Qual a probabilidade de ele ser do curso de Adm? P(B) Qual a probabilidade de ele ser do sexo masculino e do curso de Adm? P(A e B) , P(A ∩ B) Qual a probabilidade de ele ser do sexo masculino ou do curso de Adm? P (A ou B) , P(A U B) Sabendo que o aluno escolhido é do curso de Adm, qual a probabilidade de ele ser do sexo masculino? P(A/B) Agora faça você mesmo. 1) Num quartel 2) Num clube promoção sexo total Idade Estado civil totalM F solteiro casado sim 288 36 324 < 30 77 14 91 não 672 204 876 >= 30 28 21 49 total 960 240 1.200 total 105 35 140 P(M|S) 0,89 P(M|N) 0,77 P(F|S) 0,11P(F|N) 0,23 De acordo com o quadro 01, 80% dos indivíduos que servem o quartel são do sexo masculino enquanto que 20% são do sexo feminino. Quanto à promoção, tem-se a seguinte análise: Dentre os homens, 30% foram promovidos, enquanto que dentre as mulheres, apenas 15% tiveram algum tipo de promoção. Nota-se, assim, que os homens são promovidos duas vezes mais que as mulheres. olhando por outro lado, apenas 27% do quadro geral foi promovido. Sendo desses, 89% do sexo masculino e 11% do sexo feminino. Mais umas vez comprovando que mais homens são promovidos do que mulheres. De acordo com o que foi expoto, temos indícios de que a promoção nesse quartel depende do sexo do indivíduo. Verificamos uma situação hipotética: A probabilidade da Dilma sofrer impeachment é de 57%, a do Cunha renunciar a presidência do comgresso é de 48%. A probabilidade desses políticos saírem juntos é de 27,36%. Será que esses eventos são independentes? Ou seja, será que a ocorrência de um deles afeta a probabilidade do outro? Para responder essa questão, chamamos os eventos: A: Dilma sofrer impeachment P(A) = 0,57 B : Cunha renunciar a presidência do comgressoP(B) = 0,48 A e B ( A ∩ B) : os dois políticos saírem juntos P(A ∩ B) = 0,2736 Aplicamos a probabilidade condicionada P(A/B) = P(A ∩ B)/P(B) = 0,2736/0,4800 = 0,57 Como P(A/B) = P(A) , os eventos A e B são independentes. A A' Total B 0,2736 0,4800 B' Total 0,5700 1,0000 Assim, a renúncia de Cunha não altera a probabilidade do Impeachment de Dilma. Poderíamos interpretar de uma forma bem parecida, verificando a informação a respeito da ocorrência de um dos eventos. Quer dizer, se soubermos que Cunha renunciou, ou poderá renunciar, não podemos concluir nada a respeito da mudança das chances de ocorrência do Impeachment da presidente. Assim, a renúncia de Cunha não altera a probabilidade do Impeachment de Dilma. Poderíamos interpretar de uma forma bem parecida, verificando a informação a respeito da ocorrência de um dos eventos. Quer dizer, se soubermos que Cunha renunciou, ou poderá renunciar, não podemos concluir nada a respeito da mudança das chances de ocorrência do Impeachment da presidente. Probabilidade total Teorema de Bayes , uma extensão das condicionais e probabilidade total A probabilidade total é uma forma de escrevermos a probabilidade de um evento decomposta em várias parcelas (várias somas) Essa fórmula reavalia as probabilidades a priori por meio de probabilidades posterioris ao evento. Fórmula geral Fórmula geral P(B) = Σ P(Ai ∩ B) = Σ P(Ai).P(B/Ai) (sucessivas somas de intersecções) Sendo Ai um dos eventos causa (a priori) e B um evento efeito (posteriori), de acordo com Bayes, é possível verificar a probabilidade de um dos eventos causa ter ocorrido tendo conhecimento prévio de um evento efeito.Se tivermos apenas dois eventos em questão, então a probabilidade total fica assim: P(A) = P(A ∩ B) + P(A ∩ B') , como podemos verificar no esquema a seguir. P(Ai/B) =(Ai ∩ B)/P(B) A A' Total B P(A ∩ B) P(A' ∩ B) P(A ∩ B) + P(A' ∩ B) P(Ai ∩ B) --> regra do produto --> P(Ai).P(B/Ai) B' P(A ∩ B') P(A' ∩ B') P(A ∩ B') + P(A' ∩ B') Total P(A ∩ B) + P(A ∩ B') P(A' ∩ B) + P(A' ∩ B') P(B) --> probabilidade total --> Σ P(Ai).P(B/Ai) O mesmo se pode fazer para P(B) e os demais eventos. Exemplo 1 - Um grande gurú do agronegócio consegue prever a germinação de plantações de tomate com boa margem de acerto. Sabe-se que plantações de tomate, de um modo geral, tem 10% de probabilidade de não germinarem. Nosso grande gurú acerta em 90% de todas vezes em que diz que a plantação germina e 80% quando diz que a plantação não germina. Qual a probabilidade de uma plantação de tomate não germinar, sabendo que o gurú disse que ela não germina? Quando tivermos um evento (D) que faz intersecção como outros três eventos mutuamente exclusivos (A , B e C), então a probabilidade total fica assim: P(D) = P(A ∩ D) + P(B ∩ D) + P(C ∩ D) Como, pelas condicionas, P(A ∩ D) = P(A).P(D/A) Sejam os eventos P(B ∩ D) = P(B).P(D/B) A: a plantação germina A': a plantação não germina P(C ∩ D) = P(C).P(D/C) B: o gurú diz que germina B': o gurú diz que não germina Substituindo, teremos: P(A) = 0,9 P(A') = 0,1 O Gurú de fato anunciou a perda da colheita. Então estamos interessados e verificar qual a prob de isso acontecer. P(D) = P(A).P(D/A) + P(B).P(D/B) + P(C).P(D/C) P(B/A) = 0,9 P(B'/A') = 0,8 P(B'/A) = 0,1 P(B/A') = 0,2 Exemplo 1: Sabendo que o estudante é homem, a probailidade dele ser do curso de engenharia é de 30%, se ele for mulher, a probabilidade é de 12%. Se 60% dos estudantes da universidade são mulheres, qual a probabiilidade de um estudante (aleatoriamente escolhido) ser do curso de engenharia? P(A'/B') = P(A' ∩ B') / P(B') Eventos: com P(A' ∩ B') = P(A').P(B'/A') A: o estudante é homem , A' é mulher e P(A' ∩ B') = 0,1.0,8 = 0,08 B: o estudante é do curso de engenharia, B' outro curso P(B') = P(A ∩ B') + P(A' ∩ B') = P(A).P(B'/A) + P(A').P(B'/A') P(B/A) = 0,30 P(B') = 0,9.0,1 + 0,1.0,8 = 0,17 P(B/A') = 0,12 Pelo que foi visto inicialmente: P(A') = 0,60 P(B) = P(A ∩ B) + P(A' ∩ B) = P(A).P(B/A) + P(A').P(B/A')P(A'/B') = 0,08/0,17 = 0,471 P(A) = 0,40 P(B) = 0,40.0,30 + 0,60.0,12 P(B) = ? P(B) = 0,192 Dessa forma, sabendo que o Gurú disse que plantação não germina, a probabilidade de ela não germinar é de 47,1%. Assim, a probabilidade de um estudante ser do curso de engenharia é de 19,2%. Exemplo 2: Controle de qualidade. (garantir a conformidade dos produtos além de diminuir custos). Numa fábrica, 90% dos produtos com defeito são classificados como produtos defeituosos pelo teste de controle de qualidade. 1% dos produtos bons são classificados como defeituosos. Num lote com 5% de produtos defeituosos, se o teste de controle indicar que o produto deva ser rejeitado, qual a probabilidad e ele estar bom? (Nesse caso, um produto bom estaria sendo rejeitado) Exemplo 2: O movimento no centro de Cacoal é formado por clientes oriundos de várias partes da cidade. 50% deles são da zona leste, 20% da zona oeste e 30% da zona sul. Sabendo que o cliente é da zona leste, a probabilidade de ele ter consumido algo no centro é de 20%, se for da zona oeste, a probabilidade é de 15% e, se o cliente for da zona sul, a probabilidade é de 30%. Num certo dia, escolhendo-se um cliente que esteja no centro da cidade, qual a probabilidade dele ter consumido algum produto? Sejam os eventos: Sejam os eventos: A: o produto é bom A: clientes da zona leste , P(A) = 0,50 A': o produto tem defeito (não é bom) B: clientes da zona oeste, P(B) = 0,20 B: O produto foi classificado como bom pelo teste de controle C: clientes da zona sul , P(C) = 0,30 B': O produto foi classificado como defeituoso pelo teste de controle D: clientes que adquiriu (consumiu) um produto P(D/A) = 0,20 Num lote com 5% de produtos defeituosos, tem-se: P(D/B) = 0,15 P(A) = 0,95 e P(A') = 0,05 P(D/C) = 0,30 Sabendo que P(B'/A) = 0,01 , P(B'/A') = 0,90 , procura-se P(A/B') . Pelo que foi visto, P(D) = P(A).P(D/A) + P(B).P(D/B) + P(C).P(D/C) Pelo que foi exposto no início, P(D) = 0,50.0,20 + 0,20.0,15 + 0,30.0,30 P(D) = 0,220 P(A/B') = P(A ∩ B')/ P(B') Dessa forma, a probabilidade de um cliente qualquer vir a consumir um produto do centro da cidade de Cacoal é de 22,0%, ou seja, somente 22% das pessoas que frequentam o centro da cidade efetivamente adquirem algum produto. P(A/B') = P(A).P(B'/A) / P(A).P(B/A) + P(A').P(B/A') P(A/B') = 0,95.0,01 / 0,95.0,01 + 0,05.0,90 P(A/B') = 0,0095 / 0,05450 P(A/B') = 0,174 Distribuição de variáveis categóricas Tabela 03 - Gênero dos funcionário da companhia XPTO Gênero Frequência Porcentagem Masculino 28 56,0% Feminino 22 44,0% Soma 50 100,0% Fonte: Martins, 2011 Tabela 08 - Grau de ralacionamento dos funcionários da companhia XPTO Grau de satisfação com o chefeFrequência Porcentagem Faça os gráficos Muito bom 14 28,0% Bom 15 30,0% Regular 14 28,0% Ruim 2 4,0% Muito Ruim 5 10,0% Soma 50 100,0%Fonte: Martins, 2011 Tabela 3 - Percentual, por área, de estudantes que pretendem um nível superior Área de estudo Frequência Percentual Artes & Humanidades 323 13,5 Ciências Biológicas 222 9,3 Administração 404 16,9 Educação 196 8,2 Engenharia 225 9,4 Ciências Físicas 76 3,2 Profissional 330 13,8 Ciências Sociais 275 11,5 Técnico 24 1,0 Outra 315 13,2 Soma 2.390 100,0 Fonte: Moore, 2014 Tabela 4 - Impactos causados sobre sua vida pelos aparelhos/plataformas Plataforma/Aparelho Percentual de usuários que disseram grande impacto Celunar 54,0 Banda Larga 49,0 iPhone 45,0 Blackberry 44,0 Televisão 34,0 Radio Satélite 27,0 iPod 27,0 Gravador Vídeo Digital 27,0 E-Leitora 24,0 Rádio AM-FM 22,0 Redes Sociais 20,0 Fonte: Moore, 2014 Tabela 5 - Níveis de audiência em um dado instante de tempo, para os formatos mais populares de programa de rádio Formato Nível Audiência (%) Notícias/Conversa/Informação12,6 Sertaneja 12,5 Contemporâneo Adulto 8,2 Sucessos Contemporâneos Pop 5,9 Rock Clássico 4,7 Sucessos Clássicos 3,9 Sucesso Contemporâneo Rítmico3,7 Contemporâneo Urbano Adulto3,6 Contemporâneo Adulto Picante 3,5 Contemporâneo Urbano 3,3 Regional Mexicano 2,9 Esportes 2,5 Soma 67,3 Fonte: Moore, 2014 Tabela 6 - Fontes de recursos que os estudantes utilizam para as despesas da faculdade Fonte Percentual Recursos Familiares 78,2 Recursos Estudante 62,8 Ajuda Não Reembolsável 70,0 Ajuda Reembolsável 53,4 Outra 6,5 Fonte: Moore, 2014 Tabela 7 - Números médios de bebês nascidos em cada dia da semana, em 2008 Dia Nascimentos Porecentagem Dom 7.534 Seg 12.371 Ter 13.415 Qua 13.171 Qui 13.147 Sex 12.919 Sab 8.617 Σ 81.174 Fonte: Moore, 2014 Distribuição de variáveis quantitativas contínuas Quadro 1 - Dados dos funcionários da companhia XPTO (anexo A do livro texto) Ordem Idade Escolaridade em anosGenero Renda anual em 1.000,00Renda familiar anual em 1.000,00Tempo de trabalho em anosTempo de trabalho na empresaGrau de ralacionamento entre empregado e chefe 43 18 12 Masculino 11,5 55,5 1 1 Muito ruim 2 20 20 11 Masculino 10,5 14,3 3 1 Muito bom 5 47 21 14 feminino 16,3 60,7 3 0,66 Muito bom 16 4 23 14 Masculino 20,2 20,2 3 1,5 Muito bom 17 22 24 12 feminino 24,3 27,4 7 5 Bom 20 8 25 13 feminino 18 49,5 10 1,5 Bom 26 19 25 16 Masculino 33,1 33,1 7 1 Bom 27 48 26 16 feminino 44,7 65,3 13 3,5 Muito bom 28 35 27 17 feminino 20,4 36,2 11 7 Bom 38 42 28 16 feminino 17 20 7 2 Muito ruim 39 50 28 10 Masculino 15 20 6 5 Bom 40 24 30 16 Masculino 33,8 33,8 14 5 Regular 41 40 32 12 Masculino 15,4 15,4 16 0,16 Regular 42 3 33 15 Masculino 40,5 85,6 12 9 Bom 45 5 33 12 feminino 25,2 25,2 15 4 Muito bom 46 23 33 10 Masculino 33,3 42,8 17 5 Bom 47 37 33 16 feminino 21,6 46,6 12 2,58 Muito ruim 48 44 33 16 feminino 17,7 19,3 14 3 Muito bom 52 13 34 12 feminino 33,3 55,2 12 6 Regular 56 30 34 12 feminino 31,3 67,7 18 3 Bom 59 32 34 12 feminino 30,3 34,2 15 8 Regular 60 45 34 9 feminino 11,8 43,7 18 1,5 Bom 61 1 35 20 Masculino 78,3 85,3 14 3 Regular 62 10 35 16 Masculino 38,4 38,4 15 3 Bom 63 11 35 12 feminino 31 33,5 13 1,5 Regular 68 27 35 15 Masculino 42,7 51,8 18 0,5 Bom 69 28 35 16 Masculino 14,7 46,9 15 0,75 Bom 70 7 37 14 feminino 15 15 10 1,5 Muito bom 72 21 37 13 feminino 35,7 35,7 20 3 Regular 74 38 38 19 Masculino 48,7 68 19 15 Muito bom 80 9 39 18 Masculino 60,8 60,8 15 5 Regular 81 16 39 16 Masculino 64,2 67,2 23 0,5 Muito bom 82 49 39 18 Masculino 75,6 91,8 23 3 Muito bom 83 36 40 13 Masculino 26,3 29,9 23 10 Bom 84 33 41 13 Masculino 16,4 18,5 24 2 Muito bom 85 39 41 15 Masculino 18,4 19,2 23 1 Regular 93 29 42 16 feminino 23,7 51,2 25 5,5 Bom 86 25 43 13 Masculino 25,2 91,8 27 12 Bom 87 34 44 16 feminino 17,9 34,2 9 5,5 Bom 88 46 48 17 feminino 32,8 33,5 22 6 Bom 90 12 49 13 Masculino 76,6 93,5 30 5 Muito bom 92 15 49 4 Masculino 27,5 27,6 31 22,08 Regular 96 14 50 14 feminino 15,8 17,4 20 10 Regular 100 31 50 14 feminino 24,1 69,6 33 3,5 Regular 101 26 56 16 feminino 36,1 36,9 36 30 Muito bom 104 41 58 14 Masculino 53,7 56,5 42 36 Muito bom 107 18 59 16 Masculino 26,6 35,4 43 1,5 Muito bom 108 6 60 14 Masculino 36,7 35,7 40 20 Muito bom 117 17 61 12 feminino 32 34,6 20 0,75 Muito bom 119 2 64 14 feminino 25,7 81,9 25 11 Muito bom 120 51 30 15 feminino 22 32 20 20 Muito bom 52 18 6 Masculino 18 24,5 0,5 0,5 Regular 53 60 14 Masculino 35 45,2 42 25 Bom 54 32 12 Masculino 28 37,8 12 12 Ruim 55 35 15 feminino 30 40,7 10 4 Muito ruim 56 42 15 Masculino 42 42 20 2,5 Bom 57 50 10 feminino 53 60 30 15 Muito bom 58 27 12 Masculino 22,5 32,5 10 5 Muito bom 59 40 17 Masculino 20,1 35,1 18 11,83 Bom 60 27 9 feminino 11,6 48,9 4 4 Muito bom 61 53 16 Masculino 50,6 75,1 36 10 Regular 62 39 13 feminino 22,5 50,3 23 1 Muito bom 63 47 14 Masculino 56,7 59,5 27 5 Regular 64 27 11 feminino 15,5 30,4 5 2 Bom 65 40 10 feminino 17 19,3 13 4 Bom 66 27 12 Masculino 16,5 17 27 0,5 Muito bom 67 35 15 Masculino 43,3 43,3 18 10 Muito bom 68 25 16 Masculino 22 52,3 8 2,5 Muito bom 69 53 9 Masculino 10,2 15,6 34 5 Regular 70 35 16 Masculino 41,3 41,3 13 6,41 Bom 71 43 12 Masculino 54,2 67,9 26 11 Regular 72 33 14 feminino 19,8 62,5 12 2 Bom 73 48 12 Masculino 50 54,1 32 21 Regular 74 29 16 Masculino 23,6 34,8 11 1 Muito bom 75 26 13 feminino 19,3 19,6 10 40 Bom 76 23 16 feminino 16 16,9 6 0,75 Bom 77 30 14 feminino 18,1 41,8 4 1 Muito bom 78 53 12 feminino 21,7 35,7 15 12,5 Ruim 79 53 12 Masculino 39 43,9 30 0,08 Bom 80 43 14 Masculino 30,9 30,9 37 2 Muito bom 81 30 13 Masculino 32,3 39,3 11 10 Bom 82 27 14 Masculino 17,9 46,5 17 0,5 Bom 83 59 15 Masculino 39,8 69 42 6 Muito bom 84 36 16 feminino 37,2 38,8 19 12,5 Regular 85 52 16 Masculino 54,6 56,7 30 21 Regular 86 40 14 Masculino 18,8 57,4 24 1,5 Muito bom 87 29 17 Masculino 39,6 46,6 8 2,83 Ruim 88 40 14 Masculino 78 92,9 23 4,33 Muito ruim 89 36 12 feminino 25,2 25,9 20 10 Bom 90 38 20 Masculino 64,5 65,7 21 4 Bom 91 64 13 feminino 28,6 35,2 21 7 Bom 92 43 16 feminino 61,7 78,8 35 18 Bom 93 28 16 feminino 35,1 38,3 12 0,16 Bom 94 52 14 feminino 20,6 47,3 20 3 Bom 95 48 12 feminino 13,7 36,1 15 1,66 Muito bom 96 52 12 Masculino 40,8 96,2 35 0,08 Muito bom 97 43 12 feminino 19,7 57,8 27 9,41 Bom 98 39 13 feminino 27,1 31,2 21 16 Regular 99 29 15 Masculino 39,2 63,6 8 1 Bom 100 34 14 Masculino 21,1 33,4 17 10 Muito bom 101 25 14 Masculino 28,4 29,9 8 3 Muito ruim 102 32 12 Masculino 15 15 14 1 Muito ruim 103 49 12 feminino 14,6 82,5 20 4 Muito bom 104 40 12 feminino 17,8 17,8 20 0,5 Muito bom 105 39 18 Masculino 29,2 62,6 18 2 Regular 106 32 16 Masculino 23 23,5 15 3 Bom 107 25 10 Masculino 20 20 8 2 Bom 108 42 16 feminino 23,1 34,2 25 12 Ruim 109 37 13 Masculino 26,8 34 18 16 Muito ruim 110 28 12 feminino 19,3 19,3 8 3 Regular 111 23 16 Masculino 10,3 38,4 6 1 Bom 112 37 12 feminino 16,7 26,5 20 10 Muito bom 113 35 12 feminino 15,9 15,9 8 1,5 Regular 114 63 12 feminino 25,8 38,7 45 22 Muito bom 115 29 13 Masculino 23,9 43 10 3 Bom 116 33 14 Masculino 18,9 22,4 16 1 Regular 117 26 12 Masculino 36,3 36,3 10 2,5 Regular 118 50 20 feminino 58 98,7 34 8 Ruim 119 49 15 feminino 25,7 50,8 25 3,41 Regular 120 44 17 Masculino 51,8 61,6 27 22 Muito bom Total 38,1 13,9 120 3632,2 120 120 120 120 25,70 18,325 Faça uma distribuição de frequência para cada variável Calcule as medidas de tendência central e dispersão. Faça interpretações razoáveis 23 Tabela 01 - Idade dos funcinários da companhia XPTO Idade Ponto médio Frequência Porcentagem Acumulada (%) 18|----------28 23 6 12,0% 12,0% 28|----------38 33 17 34,0% 46,0% 38|----------48 43 12 24,0% 70,0% 48|----------58 53 12 24,0% 94,0% 58|----------68 63 3 6,0% 100,0% Σ --------- 50 100,0% ------- Fonte: Martins, 2011 Tabela 3 - Anos de escolaridade dos funcinários................ Escolaridade em anosIdade Média Frequência Porcentagem Acumulada (%) 4|------------8 8|-----------12 12|-----------16 16|-----------|20 Σ Fonte: Martins, 2011 Tabela 4 - Renda anual dos funcinários................ Renda em 1000 reaisRenda Média Frequência Porcentagem Acumulada (%) 10|------------25 25|------------40 40|------------5555|------------70 70|------------85 Σ Fonte: Martins, 2011 Tabela 5 - Renda anual familiar dos funcinários................ Renda em 1000 reaisRenda Média Frequência Porcentagem Acumulada (%) 10|------------25 25|------------40 40|------------55 55|------------70 70|------------85 85|------------100 Σ Fonte: Martins, 2011 Tabela 6 - Tempo de trabalho dos funcionários ................ Tempo em anosTempo médio Frequência Porcentagem Acumulada (%) 0|------------10 10|------------20 20|------------30 30|------------40 40|------------50 Σ Fonte: Martins, 2011 Sendo a variável explorada uma variável quantitativa, então, antes de seguirmos com as análises de correlação, devemos calcular as medidas de centro e dispersão dessa variável. São as medidas descritivas. Moda (Mo) A moda de um conjunto de valores é o valor que mais aparece. Em outras palavras, é o valor de maior frequência, consequentemente maior probabilidade em relação aos demais. Se um conjunto de valores não houver pelo menos uma repetição, então esse conjunto é amodal. Também é possível que num conjunto de valores haja mais de uma moda. Medidas de centro (média , moda e mediana) Média aritmética simples A média aritmética simples é a medida mais difundida num conjunto de dados numéricos. Por definição, a média aritmética é um valor x cuja a soma das distâncias dos valores abaixo dela é igual à soma das distâncias dos valores acima dela, sendo todas as distâncias centradas em x. Classes xi Fi fi (p(xi)) fi Acum Como podemos verificar, a moda está entre 10 e 20 minutos. O valor representativo desse intervalo é o ponto médio 15 minutos. 0|--10 5 8 0,211 0,211 10|--20 15 16 0,421 0,632 20|--30 25 10 0,263 0,895 Seja um conjunto de dados ordenados 30|--40 35 4 0,105 1,000 Digamos que a média aritmética desse conjunto esteja entre o terceiro e o quarto elementos. Então, pela definição, tem-se: Σ ---------- 38 1,000 ---------- Pelo que foi exposto, a maioria das pessoas, 42,1%, utilizam o celular por 15 minutos em média durante todo o dia. Na planilha "variáveis quantitativas", compare a moda da variável antes de organizar os dados numa tabela com a moda depois dos dados organizados em intervalos. Percentis (Pi) Os percentis são probabilidades acumuladas [mais pra frente veremos que os percentis fazem parte de uma função de probabilidade acumulada] De um modo geral, a média aritmética de um conjunto de dados é a soma de todos os valores dividida pelo número de elementos do conjunto. (ou quantis) Em estatística, a média aritmética é representada pela letra x com um traço acima. E as fórmulas como seguem. Classes xi Fi fi (p(xi)) fi Acum Percentil é um valor da variável que abaixo dele há um percentual pré estabelecido de valores. Esses valores devem estar em ordem crescente. caso os valores sejam pontuais e 0|--10 5 8 0,211 0,211 10|--20 15 16 0,421 0,632 20|--30 25 10 0,263 0,895 ou caso os valores sejam intervalares 30|--40 35 4 0,105 1,000 Σ ---------- 38 1,000 ---------- Estas últimas são denominadas médias ponderadas. De acordo com a frequência relativa acumulada (probabilidade acumulada), 21,1% dos usuários de culular utilizam o aparelho por no máximo 10 minutos durante o dia. 63,2%, utilizam o aparelho por no máximo 20 minutos por dia de uso. Assim,P21 = 10 minutos e P63 = 20 minutos. A média amostral (x barra) será um valor próximo à média da população (µ), a diferença é denominada erro amostral da média (e). Assim, , com certa probabilidade de aceitação. Vamos exemplificar com uma variável X: tempo em que a pessoa fica no celular durante dia, em minutos. (essa variável será usada em todas as estatísticas). Há sempre uma pergunta ralacionada ao percentil: Qual é o tempo de uso do celular (neste caso em minutos) que abaixo desse tempo encontramos 25% de todos os usuários? De outra forma, qual é o tempo cuja probabilidade de estar abaixo dele é de 25%? Classes xi Fi fi (p(xi)) fi Acum 0|--10 5 8 0,211 0,211 Neste caso estamos interessados no P25 10|--20 15 16 0,421 0,632 20|--30 25 10 0,263 0,895 Alguns percentis mais usuais: (quartis) 30|--40 35 4 0,105 1,000 P25 --> 1° Quartil, Q1 (abaixo dele se encontram os primeiros 25% elementos do conjunto de valores da variável).Σ ---------- 38 1,000 ---------- P50 --> 2° Quartil, Q2 (também conhecido como mediana, abaixo dele econtramos os primeiros 50% elementos da série), é uma das medidas de centro. P75 --> 3° Quartil, Q3 (abaixo dele encontramos os primeiros 75% elementos da variável). Com este cálculo, conclui-se que o tempo médio de uso do celular durante um dia é de 17,6 minutos, com algum erro probabilístico. Há duas meneiras de encontrar um percentil. Uma, quando os dados formam um ROL (uma lista de valores ordenados) e outra, quando os dados estiverem numa tabela estatística. De qualquer forma, o conjunto de valores deve estar em ordem crescente. Na planilha "variáveis quantitativas", calcule a média, bem como todas as outras estatísticas descritivas. 1 3 3 6 7 8 8 9 10 10 11 11 12 14 14 14 15 16 17 17 17 17 19 19 20 20 21 21 23 24 25 25 26 28 30 33 33 37 25% de 38 dá 9,5 , isso quer dizer que o décimo elemento separa os primeiros 25% elementos da série. Olhando a série, o décimo elemento corresponde a 10 minutos. Assim, 25% dos usuários de celular utilizam o aparelho por no máximo 10 minutos durante um dia. Caso os valores da variável esteja resumida numa tabela de frequência, utilizamos a seguinte fórmula: i --> é a proporção desejada para o percentil, vai de 1 a 100; Linf --> é o limite inferior do intervalo que contém o percentil desejado; h --> é a amplitude do intervalo; Fi --> é a frequência absoluta do intervalo que contém o percentil; n --> é o número de elementos da amostra; ΣFant --> é a soma das frequencias anteriores à classe do percentil. Vamos usar esta fórmula para estimar o P25 dos dados da tabela acima. Antes, porém, devemos identificar na tabela qual é o intervalo de classe que contém o percentil 25, isto se verifica por meio da frequência acumulada relativa (fi acumulada). Veja que na primeira linha (classe) encontramos os primeiros 21,1% elementos da série, enquanto que na segunda linha encontramos acumuladamente 63,2% dos elementos da variável. Então, é razoável crermos que o percentil 25 está no intervalo de 10 a 20 minutos. Listamos os elementos da fórmula de acordo com as instruções anteriores. i = 25 ; Linf = 10; h = 10; Fi = 16; n = 38; ΣFant = 8 Substituindo na fórmula, teremos: Assim, concluí-se que 25% dos usuários utilizam o celular por no máximo 10,9 minutos durante um dia. Perceba que tanto pelo rol quanto pela fórmula, os resultados são bem próximos. Agora faremos uma análise dos percentis por meio de um gráfico de probabilidade. No eixo horizontal iremos colocar o limite inferior do primeiro intervalo, que neste caso será zero, com probabilidade 0, e todos os limites superiores com suas respectivas probabilidades acumuladas. Classes fi Acum 0 0 10 0,211 20 0,632 30 0,895 40 1,000 Pelo gráfico, verifica-se que 30% dos usuários utilizam o aparelho por 12 minutos no máximo, P30. Também nota-se que 10% dos usuários gastam mais de 30 minutos por dia no celular, P90. Assista no canal Aulanet Unir como fazer um gráfico desses no Excel 2013. Medidas de dispersão Desvio padrão (Dp; s; σ ) Simetria Escores padronizados (z) e Outliers A dispersão, em estatística, mede o quão dispersos estão os valores de um conjunto de dados. As mais comuns são: A amplitude total (R) , variância, desvio padrão, coeficiente de variação e intervalos de variação da média. O desvio padrão é determinado pela raiz quadrada da variância, é uma medida de dispersão absoluta em torno da média. Numa distribuição simétrica é possível determinar a probabilidade de um elemento estar a K desvio padrão distante da média, tanto acima quanto abaixo dela. Simetria diz respeito à coisas idênticas, porém opostas por um eixo, como se fosse um espelho. Váriosobjetos são simétricos, isto é, possuem um eixo imaginário que corta-os ao meio longitudinal ou transversalmente de forma que surjam duas partes idênticas, mas opostas por este eixo. O escore padronizado é uma medida de dispersão que indica a distância que um valor está da média em desvios padrão. Os escores padronizados variam de - ∞ a + ∞, porém, 99,7% deles variam de -3 a +3. Amplitude toal ( R) Os valores de uma variável podem estar distribuídos simetricamente em torno de algum valor central (média, moda ou mediana) onde estará situado o eixo de simetria. De fato, existirá simetria perfeita se os percentis estiverem equidistantes da mediana, algo que pode ser visualizado por meio de um histograma, gráfico de pontos ou mesmo por um diagrama de caixa (box- plot). Se, numa distribuição de probabilidade, tivermos a média = mediana = moda, então esta variável apresentará distribuição simétrica. Caso o gráfico dessa variável tenha forma de sino, então a distribuiçao de probabilidade é dita NORMAL. Para maiores detalhes sobre simetria consultar Martins (2011, p. 93) e Morettin (2011, p. 51). A amplitude total de um conjunto de valores é a diferença entre o maior valor e menor valor da série. Assim, com a amplitude todal, é possível verificar qual a maior diferença encontrada dentro dos valores coletados. Fórmula O desvio padrão é expresso nas mesmas unidades de medida da média Fórmula: ou ou O sinal do escore indica se o valor x é menor ou maior que a média. Se uma distribuição é simétrica, então as seguintes probabilidades são observadas: Exemplo: De acordo com a tabela, a amplitude total é de 40 minutos, pois o valor máximo é 40 e o valor mínimo é 0. A probabilidade dos elementos amostrais estarem a uma distância de 1 desvio padrão para mais ou para menos da média é de aproximadamente 68%. Exemplos práticos 1) Comparando performances em testes e concursos Classes xi Fi fi (p(xi)) fi Acum A probabilidade dos elementos amostrais estarem a uma distância de 2 desvio padrão para mais ou para menos da média é de aproximadamente 95%. Vamos supor que você tirou 7,5 em português e 6,0 em matemática. É claro que sua nota de português é maior que a de matemática, então a conclusão é de que você se saiu melhor em português do que matemática. Vamos olhar por um outro ângulo. Vamos supor que os professores tenham informado a média e o desvio padrão de cada matéria. Agora é possível saber qual a sua posição relativa às duas médias da turma. Veja: 0|--10 5 8 0,211 0,211 Qualquer outra diferença entre outros dois valores é menor que 40 minutos. A medida R e suas variações é largamente utilizada em gráficos de controle de qualidade. O grau de asssimetria pode ser mensurado por duas fórmulas: uma fórmula que ralaciona a mediana e os quartis e outra que relaciona moda e média com o desvio padrão. 10|--20 15 16 0,421 0,632 A probabilidade dos elementos amostrais estarem a uma distância de 3 desvio padrão para mais ou para menos da média é de aproximadamente 99%.20|--30 25 10 0,263 0,895 30|--40 35 4 0,105 1,000 Fórmulas. Σ ---------- 38 1,000 ---------- Esses intervalos (dados em desvios padrão) são denominados Intervalos de Variação para o intervalo com 1 dp Ainda é possível determinar a probabilidade para qualquer intervalo em torno da média Variância (Var(x); s²; σ² ) para o intervalo com 2 dp A interpretação é bastante simples: Se As = 0 , então a distribuição dos valores da variável é simétrica, caso contrário, é dita assimétrica, negativa ou positiva, conforme o caso. Matéria Média Dp A variância é uma medida de dispersão que auxilia o pesquisador nos estudos da variabilidade de dados quantitativos. Com a variância é possível determinar o desvio padrão, fazer comparações entre médias amostrais, realizar testes de correlação entre variáveis, além de ser muito útil para quem deseja de aprofundar em análise quantitativa de dados. Para maiores detalhes sobre a teoria da variância convém consultar nossa bibliografica indicativa do curso. para o intervalo com 3 dp Português 6,5 1,2 Matemática 5 0,9 Coeficiente de variação (Cv) (coeficiente de variação de Pearson) O coeficiente de variação é utilizado para verificar a variabilidade relativa dos dados e para comparar variabilidade relativa entre duas amostras de populações distintas. Se o coeficiente de variação for pequeno, então diz-se que os dados são homogêneos (estão próximos da média), caso contrário, são heterogêneos (estão bem distantes da média). Gráficos para visualização da assimetria dos dados Diaframa de caixa e histograma Para calcular a variância é necessário conhecer o desvio que cada elemento apresenta em relação à média, já que a variância é uma medida de dispersão em relação à média aritmética. Depois de calcular os desvios, é necessário elevar cada diferença ao quadrado para que todos os valores fiquem positivos, já que a soma dos desvios em relação à média é zero. Aí é só somar e dividir pela quantidade de elementos da amostra. (melhor usar um computador!) Assim, concluí-se que no quesito comparativo com a média da turma, você se saiu melhor em matemática, apesar da nota mais baixa. Fórmula 2) Verifacando Outliers (valores atípicos) O resultado geralmente é expresso em termos percentuais. Um valor atípico é um valor não muito frequente, com probabilidade bem próxima de zero. Uma regra simples verifica se um determinado valor é um outlier. Diz que x é um outlier se este estiver a mais de 3 desvios padrão distante da média. Se Cv < 15%, então a amostra apresenta baixa dispersão relativa, os dados são homogênios;Fórmulas da variância Vejamos: Para dados amostrais distribuidos num ROL Se 15% < Cv < 30% então a amostra apresenta média dispersão relativa, os dados são mais ou menos homogêneos; Classes xi Fi fi (p(xi)) fi Acum 0|--10 5 8 0,211 0,211 Esta é a distribuição do tempo de uso do celular pelos usuários em 1 dia. Para dados amostrais numa tabela estatística Se Cv > 30%, então a amostra apresenta alta dispersão relativa, os dados são heterogêneos. A média não os representa bem! 10|--20 15 16 0,421 0,632 20|--30 25 10 0,263 0,895 * Em inferência, em vez de nos referirmos á variabilidade da amostra, referimo-nos à variabilidade da população com base nesse coeficiente. Percebe-se, de acordo com o histograma, que a distribuição do tempo de uso do celular é assimétrica positiva, pois a cauda direita é maior que a esquerda, em relação ao intervalo mais frequente (moda). 30|--40 35 4 0,105 1,000 Σ ---------- 38 1,000 ---------- Para toda população de pesquisa Exemplo: Determiniar o desvio padrão do tempo de uso do celular durante um dia, interpretar o os três intervalos de variação e interpretar o coeficiente de variação. Sabendo que a média é de 17,6 min e o desbio padrão de 9,2 min, verificaremos se o menor valor (0) e o maior valor (40) são outliers.Gráfico de caixa (box plots) Para o desvio padrão precisamos da variância que neste caso é de 84,8 min². Para construir um gráfico de caixa necessitamos das medidas: Min, P25, P50, P75 e Máx. Isso mostrará em qual lado da mediana os dados estão mais dispersos. * Ainda existem outros métodos computacionais para o cálculo da variâcia. Intervalos: De acordo com nosso exemplo, as medidas são: Exemplo: Vamos calcular a variância para o tempo de uso do celular durante o dia. Min 0 Assim, cocluímos que não há outliers nessa série de dados, pois o menor valor e o maior valor se encontram a menos de 3 desvios padrão da média. Classes xi Fi fi (p(xi)) fi Acum P25 10,9 0|--10 5 8 0,211 0,211 Lembrando que a média já foi determinada anteriormente e é 17,6 min P50 16,9 10|--20 15 16 0,421 0,632 P75 24,5 20|--30 25 10 0,263 0,895 Coeficiente de variação Máx 40 30|--40 35 4 0,105 1,000 Como o coeficiente de variação é maior que 30%, então o tempo de uso do celular durante o dia é bastante disperso. Σ ---------- 38 1,000 ---------- Assim, a variância do tempo de uso do celular durante umdia é de 84,8 minutos ao quadrado. A variância amostral (s²) contém algum erro em relação à variância populacional de acordo com a probabilidade associada. * A variância não tem interpretação prática. Porém, ela é utilizana na correlação envolvendo variáveis quantitativas Medidas de associaçao entre variáveis Análise gráfica Associação entre variáveis qualitativas e quantitativas Análise gráfica Associação entre variáveis quantitativas (regressão linear simples) A associação de variáveis quali e quanti exige um conhecimentto prévio da variância dos dados quantitativos, o que pode ser visto no capitulo medidas de dispersão. A ideia principal é analisar o que acontece com a variável quantitativa dentro de cada categoria da variável qualitativa. As medidas de associação entre variáves são indicadas para verificar: O grau de dependência estatística entre duas variáveis qualitativas, a existência de correlação entre duas variáveis quantitativas e o grau de associação entre uma variável quali e outra quanti. Seguiremos com duas metodologias em paralelo: uma numérica e outra gráfica. A análise gráfica é feita por meio de um gráfico de probabilidades condicionadas. Cores iguais devem apresentar as mesmas probabilidades dentro de cada grupo. Em geral a variável disposta na linha estará condicionada à variável da coluna. O gráfico pode ser feito com uma tabela de contingência de frequência absoluta ou relativa. Aqui utilizamos o Action para facilitar Quadro 1 - Instrução, procedência e salário dos funcionários da companhia MB Média e variância dos salários total e por grau de instrução Grau de associação entre variávies qualitativas (coeficiente de contingência) Instrução Salário Procedência Grau de instrução Média A medida Qui-quadrado (X²), largamente utilizado em inferência, é utilizado na fórmula do cálculo do coeficiente de contingência de Pearson, C. Ainda temos os coeficientes de Tschuprow,T e de Cramér,V. Os cálculos podem ser feitos com uso de softwares estatísticos apropriados, como Action, Minitab, Spss, etc. Em geral, esses coeficientes variam de 0 e 1, com uma classificação para cada faixa de valores. ensino fundamental4,00 Interior Fundamental 7,8 ensino fundamental4,56 Capital Médio 11,5 ensino fundamental5,25 Capital Superior 16,9 ensino fundamental6,26 Outro Todos 11,1 ensino fundamental6,66 Interior Para C entre 0 a 0,1 temos associação fraca ou nenhuma; C de 0,1 a 0,3 associação baixa; C entre 0,3 a 0,5 associação moderada e C maior que 0,5 associação forte. ensino fundamental6,86 Interior Grau de instrução n Var ensino fundamental7,39 Capital Fundamental 12 7,8 ensino fundamental8,46 Capital Médio 18 13,1 Considere a tabela de contingência abaixo ensino fundamental8,95 Outro Superior 6 16,9 Curso Gênero Fórmula ensino fundamental9,80 Outro Todos 36 20,5 Masculino Feminino Total ensino fundamental12,00 Outro Administração 60 80 140 ensino fundamental13,60 Outro Se a variância dentro de cada categoria for pequena e menor do que a global, significa que a variável qualitativa melhora a capacidade de previsão da quantitativa e portanto existe uma relaçao entre as duas variáveis. Outro 258 200 458 ensino médio 5,73 Outro Total 318 280 598 ensino médio 7,59 Capital ensino médio 7,44 Outro Com o uso do programa Action, obtivemos os seguintes resultados: ensino médio 8,12 Interior ensino médio 8,74 Outro Teste Qui-Quadrado Essa estatística é comparada com uma tabela de valores que indicam a existência ou não de dependência. Porém, o p-valor indica a probabilidade das variáveis serem independentes, sendo mais utilizado entre os pesquisadores. ensino médio 9,13 Interior Percebe-se, pela figura, que o grau de instrução melhora a previsão dos salários Estatistica X² 7,287167654 ensino médio 9,35 Outro Dessa forma, define-se o grau de associação entre as duas variáveis como o ganho relativo na variância, obtido pela introdução da variável qualitativa. Graus de Liberdade 1 ensino médio 9,77 Capital P-Valor 0,00694488815 ensino médio 10,76 Interior ensino médio 11,06 Outro O erro adotado nos testes estatíticos geralmente é de 5,0% Faça uma análise de dependência para os dados da tabela abaixo ensino médio 11,59 Capital ensino médio 13,23 Interior Coeficiente de contingencia 1) Num quartel ensino médio 13,85 Outro O ganho relativo é dado pela fórmula: Promo vido sexo total ensino médio 14,69 Interior = 0,109 M F ensino médio 14,71 Interior sim 288 36 324 0,24 0,03 ensino médio 15,99 Capital em que não 672 204 876 0,56 0,17 ensino médio 16,61 Interior Pelo coeficiente de contingêcia de Pearson, há uma baixa associação de dependência entre as variáveis curso escolhido e sexo, pois C está entre 0,1 e 0,3. total 960 240 1.200 ensino médio 19,40 Capital superior 10,53 Interior Porém, essa associação é significativa, uma vez que a probabilidade de independência é menor que 1,0% , indicada pelo p-valor da estatística X². Fazendo as condicionais na coluna, teremos: superior 12,79 Outro Veja que dentro do masculino há 30% que foram promovidos, enquanto que dentro do feminino há apenas 15% promovidos. Todos dois diferentes do total da linha (sim) que é de 27%, mesmo considerando um erro de 5,0% superior 16,22 Outro Promo vido sexo total superior 17,26 Capital A dependência entre variáveis qualitativas (categóricas) pode ser verificada por meio das probabilidades condicionais, considerando, para tanto, um erro estatístico. Primeiramente organize uma tabela de probabilidades e uma de condicionadas na linha ou na coluna. Analise de acordo com a regra estudada no tópico independência estatística, porém, devemos considerar algum erro probabilístico. M F superior 18,75 Capital sim 0,30 0,15 0,27 superior 23,30 Interior não 0,70 0,85 0,73 total 1,00 1,00 1,00 Assim, fica evidenciado que 41,5% da variação total do salário é explicada pela variável grau de instrução. Assim, no quartel, as variáveis promovido e sexo são estatisticamente dependentes. A medida R² é usul em análise da variância e regressão e é dado em termos percentuais.Considere as informações na tabela de contingência abaixo. Há evidências de que a escolha pelo curso de administração dependa do gênero do acadêmico? Curso Gênero Masculino Feminino Total Ao analisar esta atividade hipotética, percebe-se que a promoção nesse quartel é mais favorável ao grupo dos homens que das mulheres, talvez porque os homens sejam melhores que as mulheres, ou porque as mulheres tenham maior dificuldade de realizar as tarefas impostas para a promoção. Na probabilidade teórica, a dependência se dá pela análise das probabilidades de sucesso para um mesmo atributo em categorias diferentes. Dessa forma, verifica-se que o indivíduo tem maior probabilidade de promoção pelo simples fato de ser homem e não por seus méritos! O que estaria fora de nosso alcance por hora. Administração 10,0% 13,4% 23,4% Outro 43,1% 33,4% 76,6% Total 53,2% 46,8% 100,0% Para fazer as condicionais, basta dividir cada valor da tabela pelo total da coluna (ou linha). Posteriormente organize esses resultados em outra tabela. Veja: Tabela de condicionais por coluna. Curso condicionada ao gênero. Curso Gênero Masculino Feminino Total intervalo de erro Administração 18,9% 28,6% 23,4% 23,4 - 5 ; 23,4 + 5 Outro 81,1% 71,4% 76,6% 76,6 - 5 ; 76,6 + 5 Total 100,0% 100,0% 100,0% Olhando para a primeira linha, e considerando um erro de 5,0% , o intervalo para o percentual total vai de 18,4% a 28,4%. Já o intervalo percentual para o total da segunda linha vai de 71,6% a 81,6%. Análise: (cada linha com seu total) Como há valores no interior da tabela que estão fora dos intervalos estabelecidos, concui-se que há evidências de que a escolha do curso dependa do gênero do estudante. Variável aleatóriaV.A Variável aleatória (V.A) é uma função que associa cada elemento do espaço amostral a um número real x. Por exemplo, considere a variável aleatória X representando a quantidadede caras num experimento aleatório realizado com 3 moedas. Já conhecemos o espaço amostral desse experimento. S = {KKK, KKC, KCK, CKK, KCC, CKC, CCK, CCC} a V.A X poderá assumir os valores {0, 1, 2, 3}, pois nesse espaço amostral há eventos em que não aparece caras (0), há eventos que aparece uma cara (1), duas (2) e três (3) caras. S f X Funçao densidade de probabilidade (fdp) A função densidade de probabilidade (fdp) é uma função que associa cada número da V.A X a uma probabilidade relacionada ao espaço amostral da varável aleatória. Veja: X Fi p(x) Lembrando que Fi é a frequência absoluta da V.A e p(x) é a frequência relativa fi da V.A 0 1 0,125 1 3 0,375 2 3 0,375 3 1 0,125 Σ 8 1,000 Função de distribuição acumulada (Fd) A função de distribuição de probabilidade acumulada, Fd, é aquela que associa cada valor da V.A X a um percentil da distribuiçao de X.(soma de todas as probabilidades anteriores ao pondo dado, Pi). Assim, F(2) siginifica probabilidade acumulada até x = 2 que dá 0,875, ou seja, a probabilidade de x ser menor ou igual a 2 é de 87,5%. Dessa forma, F (2) = P87,5 (percentil 87,5). Outra forma de escrever a respeito de probabilidade acumulada é: P( x < 2); P(x > 1); entre outras. Ainda pode-se fazer operações com probabilidades acumuladas, como por exemplo quanto que dá F(2) - F(0)? Que ambém pode ser escrita da forma P (0 < x <=2) que dá 0,875 - 0,125 = 0,750. Em outras palavras, a probabilidade de x ser maior que 0 e menor ou igual a 2 é de 75,0%. (verifique na tabela!) A função de distribuição de probabilidade acumulada, Fd, é mais útil do que a função densidade de probabilidade (fdp), pois conhecendo as acumuladas de X pode-se calcular qualquer p(x) por meio das diferenças, assim como no exemplo acima. Esperança matemática da V.A X (E(x) ou µ) A esperança matemática da variável aletória X é o valor esperado para X quando o experimento for realizado inúmeras vezes. Por exemplo, quanto eu ganharia em média se aplicasse R$ 500,00 todo mês em fundos de renda fixa? Ou seja, o que eu espero receber em troca, caso invista meu dinheiro nesse fundo? O valor esperado de X é dado pela fórmula: que é a mesma fórmula da média aritmética. De acordo com a tabela acima, o valor esperado de X é: Assim, no lançamento de 3 moedas, o número de caras esperado é de 1,5 caras (uma cara e meia). De outra forma, em n lançamentos sairiam 1,5 caras em média. Variância da variável aleatória. (Var(x) ou σ²) A variância da variável aleatória X é dada pela fórmula: A eperança de x² é a soma de x².p(x), eleva- se x ao quadrado e multiplica pela probabilidade do x associado. X Fi p(x) x².p(x) 0 1 0,125 0,000 1 3 0,375 0,375 2 3 0,375 1,500 3 1 0,125 1,125 Σ 8 1,000 3,0 este número é a esperança do x² com E(X) = 1,5 já calculado anteriormente, a variância de X será: caras² o desvio padrão σ é a raiz quadrada da variância caras As interpretações do desvio padrão da V.A será discutido posteriormente no estudo da distribuição normal de probabilidade. Exercícios 5.5; 5.7; 5.10 Martins, 2011. 5.10) 70% das pessos que trabalham em escritórios utilizam computadores da IBM. 2 indivíduos são selecionados aleatoriamente, faça a distribuição de probabilidade da variável X: número de usuários de pcs IBM. Calcular a média e desvio padrão. p = 0,7 q = 0,3 Se dois indivíduos são selecionados, então a variável X poderá assumir três valores: 0, 1 e 2. X cálculo P(x) x.P(x) x².P(x) 0 0,3.0,3 0,09 0,00 1 0,7.0,3 +0,3.0,7 0,42 0,42 2 0,7.0,7 0,49 0,98 Σ 1,00 1,4 Distribuições teóricas de probabilidade Atividade prática O processo de Poisson. Modelo discreto Você faz parte de um jogo de dados e nesse jogo você tem três chances, se sair soma 7 no lançamento de dois dados, você ganha um prêmio. Qual a probabilidade que você tem de ganhar um prêmio? Suponhamos que num banco são atendidas 280 pessoas em 3 horas. Isso nos dá um parâmetro de 1,6 pessoas por minuto (aproximadamente). Se esse parâmetro permanecer constante para todo intervalo de 1 minuto, e sendo a V. A. X o número de pessoas atendidas no próximo minuto, X terá distribuição de Poisson com parâmetro λ = 1,6 . Escreve-se X ~P(λ). Distribuição teórica de probabilidade é a distribuição de probabilidade de um experimento teórico. Os experimentos teóricos são simples, porém sofisticados, pois podem descrever várias situações reais. O experimento mais simples se chama prova de Bernoulli. Tal experimento admite apenas dois resultados possíveis, sucesso ou fracasso. Quando o experimento é repetido inúmeras vezes dizemos que foram realizadas n provas de Bernoulli. Ex.: laçar uma moeda, cara (sucesso) e coroa (fracasso); escolher uma pessoa dentre muitas, mulher (sucesso) e homem (fracasso); escolher o candidato Y, sim (sucesso) e não (fracasso). Qual seria a variável aleatória para um experimento de Bernoulli? Quais seriam suas características? Para solucionar o problema vamos idealizar o seguinte: "devo realizar um experimento teórico com dois dados que me forneça todas as possibilidades de soma de seus pontos, assim poderei calcular a probabilidade da soma ser igual a 7". Parêmetro λ (por unidade de tempo, área, etc) e é o número de Euler = 2,71828... Como o espaço amostral já é conhecido, temos aqui a distribuição de probabiliade de acordo com espaço amostral. A média e a variância, só pra constar. Características x é o número de sucessos (0, 1, 2, 3, ...) E(X) = µ = λ Var(X) = σ² = λ Comparação entre as distribuições de Poisson e a binomial. O número de provas n da binomial deve ser grande e p pequeno. X (soma) p(x) x.p(x) x².p(x) 2 0,028 0,056 0,111 µ E(X) = 7 λ = 1,6 Distribuição binomial (n provas de Bernoulli)X ~ B( n ; p ) 3 0,056 0,167 0,500 σ² Var(x) = 5,8 x = 0, 1, 2, 3, .... A distribuição binomial é uma função de probabilidade associada à variável aleatória número de sucesso para n provas de Bernoulli. Seus parâmetros são: n, que é o número de repetições do experimento e p, que é a probabilidade de sucesso. A V.A. X assumirá os seguintes valores: 0, 1, 2, ..., n. A função binomial é dada pela fórmula: 4 0,083 0,333 1,333 σ Desv Pad = 2,4 Pela Poisson Pela binomial p 0,027 5 0,111 0,556 2,778 N° sucessos Probabilidade N° sucessosProbabilidade q 0,973 6 0,139 0,833 5,000 Em várias repetições, espera-se obter 7 pontos em média, com desvio padrão de 2,4 pontos. x p(x) x.p(x) x p(x) x.p(x) n 60 7 0,167 1,167 8,167 0 0,202 0,000 0 0,198 0,000 média 1,6 8 0,139 1,111 8,889 1 0,323 0,323 1 0,325 0,325 9 0,111 1,000 9,000 2 0,258 0,517 2 0,262 0,525 Características: valor esperado, variância e função acumulada. 10 0,083 0,833 8,333 3 0,138 0,413 3 0,139 0,417 E(x) = n.p F(x) = P(X<= x) = p(0) + p(1) + p(2) + ... + p(x) 11 0,056 0,611 6,722 4 0,055 0,221 4 0,054 0,217 Va(x) = n.p.q P(X >= x) = 1 - P(X < x) 12 0,028 0,333 4,000 5 0,018 0,088 5 0,017 0,083 Σ 1,000 7,0 54,833 6 0,005 0,028 6 0,004 0,025 Vamos supor o seguinte experimento: Lance uma moeda dez vezes. Qual a probabilidade de termos 3 caras? Qual o número de caras esperado caso repetíssemos este experimento inúmeras vezes? 7 0,001 0,008 7 0,001 0,006 Por meio do modelo da distribuição binomial, pode-se estimar a probabilidade de você ganhar o jogo, desde que admita os parâmetros: probabilidade de sucesso (sair soma 7) é p= 0,167 e n = 3 8 0,000 0,002 8 0,000 0,001 9 0,000 0,000 9 0,000 0,000 10 0,000 0,000 10 0,000 0,000 sucesso = sair cara n = 10 p = 0,5 q=0,5 11 0,000 0,000 11 0,000 0,000 p = 0,167 n = 3 Solução: P(X > 0) = 0,422 12 0,000 0,000 12 0,000 0,000 q = 0,833 De acordo com o modelo, a probabilidade de que saia soma 7 pelo menos uma vez em três jogadas é de 0,422. Dessa forma, a probabilidade de eu ganhar um prêmio é de 42,2%. 13 0,000 0,000 13 0,000 0,000 x p(x) x.p(x) 14 0,000 0,000 14 0,000 0,000 0 0,578 0,000 15 0,000 0,000 15 0,000 0,000 1 0,348 0,348 Σ 1,000 1,600 Σ 1,000 1,6002 0,070 0,139 Distribuição de probabilidade do número de caras para o lançamento de uma moeda 10 vezes. 3 0,005 0,014 Questionamento: Qual a probabilidade de que 5 pessoas sejam atendidas nos próximos 3 minutos?Σ 1,000 0,501 N° de caras Probabilidade Como a média é a mesma em todo instante, 1,6 pessoas por minuto corresponde a 4,8 pessoas atendidas em 3 minutos. Dessa forma, teremos um novo parâmetro λ = 4,8. Agora, é só substituir na fórmula com x = 5. x p(x) x.p(x) x².p(x) F(x) 0 0,001 0,000 0,000 0,001 F(0) = P(X=0) 1 0,010 0,010 0,010 0,011 F(1) - F(0) = P(X=1) 2 0,044 0,088 0,176 0,055 F(2) - F(1) = P(X=2) Veja que o parâmetro λ muda quando o intervalo considerado mudar. 3 0,117 0,352 1,055 0,172 F(3) - F(2) = P(X=3) Atividade 4 0,205 0,820 3,281 0,377 . Chegam caminhões a um depósito à razão de 2,8 caminhões/hora, segundo uma distribuição de Poisson. Determine a probabilidade de chegarem dois ou mais caminhões: 5 0,246 1,230 6,152 0,623 . 6 0,205 1,230 7,383 0,828 . 7 0,117 0,820 5,742 0,945 . a) num período de 30 minutos; 8 0,044 0,352 2,813 0,989 . b) num período de 1 hora; e 9 0,010 0,088 0,791 0,999 . c) num período de 2 horas. 10 0,001 0,010 0,098 1,000 F(10) - F(9)=P(X=10) Σ 1,000 5,0 27,500 --------- R: 1- [P(0) + P(1)] a) λ = 1,4 R= 0,40817 b) λ = 2,8 R=0,76892 Modelo contínuo n p (sucesso) c) λ = 5,6 R=0,97559 Distribuição normal de probabilidade X ~ N( µ ; σ² ) 100 0,5 x p(x) F(X) Z Questionamento Vamos considerar uma distribuição de probabilidade discreta, assim como a dada anteriormente. Vamos supor que a área ocupada por cada coluna seja representada pela sua probabilidade. Assim, cada coluna é uma fração de toda a área da figura que tem probabilidade igual a soma de todas as colunas, ou seja, P(0 ≤ X ≤ 10 ) = 1,0. 0 0,0000 0,0000 -10,00 Sabendo que a média de gols é de 1,3 por partida, qual a probabilidade de marcar mais de 2 gols em pelo menos 4 das 6 partidas? 1 0,0000 0,0000 -9,80 2 0,0000 0,0000 -9,60 1°) Calcular a probabilidade de sair mais de 2 gols por partida pela poisson 3 0,0000 0,0000 -9,40 2°) Essa será a probabiliadade de sucesso. Utilizando o exemplo anterior, porém lançando a moeda 100 vezes, podemos ter uma noção intuitiva do que venha a ser uma distribuição contínua de probabilidade, é como se não houvesse espaços entre um x e outro. Nas distribuições contínuas, as probabilidades da V.A é verificada por meio de uma função de probabilidade acumulada, Fd. 4 0,0000 0,0000 -9,20 3°) Depois, calcular a probabilidade de ter sucesso em pelo menos 4 partidas nas 6 restantes.5 0,0000 0,0000 -9,00 6 0,0000 0,0000 -8,80 7 0,0000 0,0000 -8,60 8 0,0000 0,0000 -8,40 Distribuição exponencial Como por exemplo: qual a probabilidade se sair entre 40 e 45 caras? De acordo com a distribuição binomial essa probabilidade é dada mediante a soma de P(40) a P(45) que dá 16,7%. 9 0,0000 0,0000 -8,20 10 0,0000 0,0000 -8,00 O modelo da distribuiçao exponencial foi idealizado a partir da distribuição de Poisson, mas no sentido de querer saber qual a probabilidade do primeiro sucesso após um intervalo de tamanho x. Seu parâmetro é λ e a probabilidade de ocorrer o primeiro sucesso após x intervalos iguais é dado por : 11 0,0000 0,0000 -7,80 A distribuição NORMAL de probabilidade é uma distribuição contínua que tem como parâmetros a média (µ) e a variância (σ²) do fenômeno estudado. Os valores das probabilidades acumuladas da distribuição normal estão numa tabela denominada Distribuição normal padronizada de acordo com os escores padronizados Z. Dessa forma, para encontrar a probabilidade de ocorrência de um elemento x da variável aleatória num determinado intervalo, devemos converter os valores da V.A em valores padronizados de acordo com a fórmula: . Posteriormente, procura-se as probabilidades associadas aos valores de Z na tabela. 12 0,0000 0,0000 -7,60 µ E(X) = 50 13 0,0000 0,0000 -7,40 σ² Var(x) = 25 14 0,0000 0,0000 -7,20 σ Desv Pad = 5 15 0,0000 0,0000 -7,00 16 0,0000 0,0000 -6,80 Características Esperança e variância 17 0,0000 0,0000 -6,60 função densidade e acumulada 18 0,0000 0,0000 -6,40 fdp Fd 19 0,0000 0,0000 -6,20 20 0,0000 0,0000 -6,00 Para exemplificar, vamos considerar o número de caras no lançamento de uma moeda 100 vezes, com média de 50 caras e a variância 25 caras². A distribuição de probabilidade do número de caras no lançamento de uma moeda pode ser comparada a uma distribuição normal, pois seu gráfico é em forma de sino. Veja o gráfico ao lado. Então, vamos calcular a probabilidade de sair entre 40 e 45 caras de acordo com a distribuição padronizada Z. 21 0,0000 0,0000 -5,80 Fixação - O tempo médio de espera para atendimento numa loja é de 2 minutos. Qual a probabilidade de você ter de esperar mais de dois minutos para ser atendido? 22 0,0000 0,0000 -5,60 23 0,0000 0,0000 -5,40 24 0,0000 0,0000 -5,20 E(X) = 2 0,5 25 0,0000 0,0000 -5,00 26 0,0000 0,0000 -4,80 x P(X < x) P(X > x) intervalo f(x) 0,05f(x) F(X) Dados do problema 27 0,0000 0,0000 -4,60 0,05 0,024690087970,975309912 0,05 0,4876549560,02438274780,0243827478 µ = 50 x1 = 39,5 o que queremos saber é P(39,5 < X < 45,5) = ........ 28 0,0000 0,0000 -4,40 0,1 0,04877057550,9512294245 0,05 0,47561471230,023780735610,04816348341 σ = 5 x2 = 45,5 29 0,0000 0,0000 -4,20 0,15 0,072256513670,9277434863 0,05 0,46387174320,023193587160,07135707057 30 0,0000 0,0000 -4,00 0,2 0,095162581960,904837418 0,05 0,4524187090,022620935450,09397800602 Transformações: Procurar na tabela as probabilidades associadas aos valores 0,90 e 2,10 (desconsidere o sinal) e fazer as operções necessárias. Acomplanhe. 31 0,0001 0,0001 -3,80 0,25 0,11750309740,8824969026 0,05 0,44124845130,022062422560,1160404286 32 0,0001 0,0002 -3,60 0,3 0,13929202360,8607079764 0,05 0,43035398820,021517699410,137558128 33 0,0002 0,0004 -3,40 0,35 0,16054297920,8394570208 0,05 0,41972851040,020986425520,1585445535 Para F(z = 0,90) a acumulada dá 0,3159 e para F(z = 2,10) a acumulada dá 0,4821. Então, 0,4821 - 0,3159 = 0,166. 34 0,0005 0,0009 -3,20 0,4 0,18126924690,8187307531 0,05 0,40936537650,020468268830,1790128223 35 0,0009 0,0018 -3,00 0,45 0,20148378120,7985162188 0,05 0,39925810940,019962905470,1989757278 36 0,0016 0,0033 -2,80 0,5 0,22119921690,7788007831 0,05 0,38940039150,019470019580,2184457474 Assim, se a distribuição de probabilidade do número de caras segue os moldes de uma distribuição normal, então, em 100 lançamentos, a probabilidade de sair entre 40 e 45 caras é de 16,6%. 37 0,0027 0,0060 -2,60 0,55 0,24042787680,7595721232 0,05 0,37978606160,018989303080,2374350505 38 0,0045 0,0105 -2,40 0,6 0,25918177930,7408182207 0,05 0,37040911030,018520455520,255955506 39 0,0071 0,0176 -2,20 0,65 0,27747264640,7225273536 0,05 0,36126367680,018063183840,2740186898 40 0,0108 0,0284 -2,00 0,7 0,29531191030,7046880897 0,05 0,35234404490,017617202240,2916358921 Considerações 41 0,0159 0,0443 -1,80 0,75 0,31271072120,6872892788 0,05 0,34364463940,017182231970,308818124 a) Numa distribuição contínua não se faz distinção entre os símbolos < e ≤ ; > e ≥ ;42 0,0223 0,0666 -1,60 0,8 0,3296799540,670320046 0,05 0,3351600230,016758001150,3255761252 b) Quando utilizamos uma distribuição contínua para fazer inferência sobre uma variável discreta, os valores devem ser ajustados para evitar descontinuidade. No nosso exemplo o valor 40 foi substituido por 39,5 e o valor 45 pelo valor 45,5. 43 0,0301 0,0967 -1,40 0,85 0,34623021490,6537697851 0,05 0,32688489260,016344244630,3419203698 44 0,0390 0,1356 -1,20 0,9 0,36237184840,6376281516 0,05 0,31881407580,015940703790,3578610736 45 0,0485 0,1841 -1,00 0,95 0,37811494350,6218850565 0,05 0,31094252820,015547126410,3734082 c) A tabela normal padronizada contém probabilidades acumuladas em relação à média ( 0 ), que está no centro. Mas há tabelas que trazem as acumuladas em relação ao menor valor, que pode ser considerado como -4. Por isso deve-se tomar cuidado ao realizar operações entre as probabilidadesacumuladas da tabela Z. 46 0,0580 0,2421 -0,80 1 0,39346934030,6065306597 0,05 0,30326532990,015163266490,3885714665 47 0,0666 0,3086 -0,60 1,05 0,40844463560,5915553644 0,05 0,29577768220,014788884110,4033603506 48 0,0735 0,3822 -0,40 1,1 0,42305018960,5769498104 0,05 0,28847490520,014423745260,4177840959 49 0,0780 0,4602 -0,20 1,15 0,43729513120,5627048688 0,05 0,28135243440,014067621720,4318517176 50 0,0796 0,5398 0,00 1,2 0,45118836390,5488116361 0,05 0,2744058180,01372029090,4455720085 Questionamentos 51 0,0780 0,6178 0,20 1,25 0,46473857150,5352614285 0,05 0,26763071430,013381535710,4589535442 No Brasil, a proporção de microempresas que fecham em até um ano é de 10%. Em uma amostra aleatória de 20 microempresas, qual a probabilidade de no máximo cinco microempresas terem as portas fechadas em até um ano de criação? 52 0,0735 0,6914 0,40 1,3 0,47795422320,5220457768 0,05 0,26102288840,013051144420,4720046886 53 0,0666 0,7579 0,60 1,35 0,49084357940,5091564206 0,05 0,25457821030,012728910520,4847335992 54 0,0580 0,8159 0,80 1,4 0,50341469620,4965853038 0,05 0,24829265190,012414632590,4971482317 55 0,0485 0,8644 1,00 1,45 0,5156754310,484324569 0,05 0,24216228450,012108114220,509256346 Se numa comunidade, a proporção de famílias com 4 filhos é de 25%, qual a probabilidade de encontrarmos mais de 100 famílias com 4 filhos numa amostra de 345 famílias? 56 0,0390 0,9033 1,20 1,5 0,52763344730,4723665527 0,05 0,23618327640,011809163820,5210655098 57 0,0301 0,9334 1,40 1,55 0,5392962190,460703781 0,05 0,23035189050,011517594520,5325831043 58 0,0223 0,9557 1,60 1,6 0,55067103590,4493289641 0,05 0,22466448210,01123322410,5438163284 59 0,0159 0,9716 1,80 1,65 0,56176500750,4382349925 0,05 0,21911749620,010955874810,5547722032 Exemplo: Vamos calcular alguns percentis e comparar com a acumulada padrão Z 60 0,0108 0,9824 2,00 1,7 0,57258506810,4274149319 0,05 0,2137074660,01068537330,5654575765 Tempo de uso do celular durante o dia, em minutos 61 0,0071 0,9895 2,20 1,75 0,58313798030,4168620197 0,05 0,20843100980,010421550490,575879127 Classes xi Fi fi (p(xi)) fi Acum 62 0,0045 0,9940 2,40 1,8 0,59343034030,4065696597 0,05 0,20328482990,010164241490,5860433685 0|--10 5 8 0,211 0,211 63 0,0027 0,9967 2,60 1,85 0,60346858090,3965314191 0,05 0,19826570950,0099132854770,595956654 10|--20 15 16 0,421 0,632 64 0,0016 0,9982 2,80 1,9 0,61325897650,3867410235 0,05 0,19337051170,0096685255860,6056251796 20|--30 25 10 0,263 0,895 65 0,0009 0,9991 3,00 1,95 0,62280764640,3771923536 0,05 0,18859617680,0094298088390,6150549884 30|--40 35 4 0,105 1,000 66 0,0005 0,9996 3,20 2 0,63212055880,3678794412 0,05 0,18393972060,0091969860290,6242519744 Σ ---------- 38 1,000 ---------- 67 0,0002 0,9998 3,40 2,05 0,64120353460,3587964654 0,05 0,17939823270,0089699116350,6332218861 68 0,0001 0,9999 3,60 2,1 0,65006225090,3499377491 0,05 0,17496887460,0087484437280,6419703298 média = 17,6 var(x) = 84,2 Desv pad = 9,2 69 0,0001 1,0000 3,80 2,15 0,65870224470,3412977553 0,05 0,17064887770,0085324438830,6505027737 70 0,0000 1,0000 4,00 2,2 0,66712891630,3328710837 0,05 0,16643554180,0083217770920,6588245508 calcular z x 71 0,0000 1,0000 4,20 2,25 0,67534753260,3246524674 0,05 0,16232623370,0081163116840,6669408625 P35 13,3 P(X < x) = 0,35 -0,38 14,1 72 0,0000 1,0000 4,40 2,3 0,68336323060,3166367694 0,05 0,15831838470,0079159192340,6748567817 P80 26,4 P(X < x) = 0,80 0,84 25,3 73 0,0000 1,0000 4,60 2,35 0,69118102030,3088189797 0,05 0,15440948980,0077204744920,6825772562 74 0,0000 1,0000 4,80 2,4 0,69880578810,3011942119 0,05 0,1505971060,0075298552980,6901071115 75 0,0000 1,0000 5,00 2,45 0,70624229970,2937577003 0,05 0,14687885020,0073439425080,697451054 76 0,0000 1,0000 5,20 2,5 0,71349520310,2865047969 0,05 0,14325239840,0071626199220,7046136739 77 0,0000 1,0000 5,40 2,55 0,72056903180,2794309682 0,05 0,13971548410,0069857742060,7115994481 78 0,0000 1,0000 5,60 2,6 0,7274682070,272531793 0,05 0,13626589650,0068132948260,718412743 79 0,0000 1,0000 5,80 2,65 0,73419704090,2658029591 0,05 0,13290147950,0066450739770,7250578169 80 0,0000 1,0000 6,00 2,7 0,74075973940,2592402606 0,05 0,12962013030,0064810065160,7315388234 81 0,0000 1,0000 6,20 2,75 0,74716040420,2528395958 0,05 0,12641979790,0063209898950,7378598133 82 0,0000 1,0000 6,40 2,8 0,75340303610,2465969639 0,05 0,1232984820,0061649240990,7440247374 83 0,0000 1,0000 6,60 2,85 0,75949153680,2405084632 0,05 0,12025423160,006012711580,750037449 84 0,0000 1,0000 6,80 2,9 0,76542971190,2345702881 0,05 0,1172851440,0058642572020,7559017062 85 0,0000 1,0000 7,00 2,95 0,7712212730,228778727 0,05 0,11438936350,0057194681760,7616211744 86 0,0000 1,0000 7,20 3 0,77686983990,2231301601 0,05 0,11156508010,0055782540040,7671994284 87 0,0000 1,0000 7,40 3,05 0,78237894310,2176210569 0,05 0,10881052840,0054405264220,7726399548 88 0,0000 1,0000 7,60 3,1 0,78775202620,2122479738 0,05 0,10612398690,0053061993460,7779461542 89 0,0000 1,0000 7,80 3,15 0,79299244730,2070075527 0,05 0,10350377630,0051751888170,783121343 90 0,0000 1,0000 8,00 3,2 0,7981034820,201896518 0,05 0,1009482590,005047412950,7881687559 91 0,0000 1,0000 8,20 3,25 0,80308832480,1969116752 0,05 0,09845583760,004922791880,7930915478 92 0,0000 1,0000 8,40 3,3 0,80795009140,1920499086 0,05 0,096024954310,0048012477160,7978927955 93 0,0000 1,0000 8,60 3,35 0,81269182050,1873081795 0,05 0,093654089740,0046827044870,8025755 94 0,0000 1,0000 8,80 3,4 0,81731647590,1826835241 0,05 0,091341762030,0045670881010,8071425881 95 0,0000 1,0000 9,00 3,45 0,82182694820,1781730518 0,05 0,089086525890,0044543262940,8115969144 96 0,0000 1,0000 9,20 3,5 0,82622605650,1737739435 0,05 0,086886971730,0043443485860,815941263 97 0,0000 1,0000 9,40 3,55 0,83051655050,1694834495 0,05 0,084741724750,0042370862370,8201783492 98 0,0000 1,0000 9,60 3,6 0,83470111180,1652988882 0,05 0,082649444110,0041324722060,8243108214 99 0,0000 1,0000 9,80 3,65 0,83878235590,1612176441 0,05 0,080608822060,0040304411030,8283412625 100 0,0000 1,0000 10,00 3,7 0,84276283370,1572371663 0,05 0,078618583160,0039309291580,8322721917 3,75 0,84664503320,1533549668 0,05 0,076677483420,0038338741710,8361060659 3,8 0,85043138080,1495686192 0,05 0,074784309610,0037392154810,8398452814 3,85 0,85412424310,1458757569 0,05 0,072937878430,0036468939210,8434921753 3,9 0,85772592840,1422740716 0,05 0,071137035790,003556851790,8470490271 3,95 0,86123868780,1387613122 0,05 0,069380656120,0034690328060,8505180599 4 0,86466471680,1353352832 0,05 0,067667641620,0033833820810,853901442 4,05 0,86800615680,1319938432 0,05 0,065996921590,003299846080,857201288 4,1 0,87126509640,1287349036 0,05 0,064367451790,003218372590,8604196606 4,15 0,87444357250,1255564275 0,05 0,062778213750,0031389106870,8635585713 4,2 0,87754357170,1224564283 0,05 0,061228214130,0030614107060,866619982 4,25 0,88056703170,1194329683 0,05 0,059716484130,0029858242070,8696058062 4,3 0,88351584220,1164841578 0,05 0,058242078890,0029121039440,8725179102 4,35 0,88639184630,1136081537 0,05 0,056804076840,0028402038420,875358114 4,4 0,88919684160,1108031584 0,05 0,055401579180,0027700789590,878128193 4,45 0,89193258140,1080674186 0,05 0,054033709320,0027016854660,8808298784 4,5 0,89460077540,1053992246 0,05 0,052699612280,0026349806140,8834648591 4,55 0,89720309160,1027969084 0,05 0,051398454220,0025699227110,8860347818 4,6 0,89974115630,1002588437 0,05 0,050129421860,0025064710930,8885412529 4,65 0,90221655590,097783444050,05 0,048891722030,0024445861010,890985839 4,7 0,90463083780,095369162220,05 0,047684581110,0023842290550,893370068 4,75 0,90698551080,093014489210,05 0,046507244610,002325362230,8956954302 4,8 0,90928204670,090717953290,05 0,045358976640,0022679488320,8979633791 4,85 0,9115218810,088478119040,05 0,044239059520,0022119529760,900175332 4,9 0,91370641350,0862935865 0,05 0,043146793250,0021573396620,9023326717 4,95 0,91583700970,084162990260,05 0,042081495130,0021040747560,9044367465 5 0,91791500140,082084998620,05 0,041042499310,0020521249660,9064888714 5,05 0,91994168720,080058312790,050,040029156390,002001457820,9084903293 5,1 0,9219183340,078081666 0,05 0,0390408330,001952041650,9104423709 5,15 0,92384617720,0761538228 0,05 0,03807691140,001903845570,9123462165 5,2 0,92572642180,074273578210,05 0,037136789110,0018568394550,9142030559 5,25 0,9275602430,072439757030,05 0,036219878520,0018109939260,9160140499 5,3 0,92934878690,070651213060,05 0,035325606530,0017662803270,9177803302 5,35 0,93109317160,068906828390,05 0,03445341420,001722670710,9195030009 5,4 0,93279448730,067205512740,05 0,033602756370,0016801378180,9211831387 5,45 0,93445379730,065546202720,05 0,032773101360,0016386550680,9228217938 5,5 0,93607213880,063927861210,05 0,03196393060,001598196530,9244199903 5,55 0,93765052330,062349476690,05 0,031174738340,0015587369170,9259787272 5,6 0,93918993740,060810062630,05 0,030405031310,0015202515660,9274989788 5,65 0,94069134320,059308656830,05 0,029654328410,0014827164210,9289816952 5,7 0,94215567910,057844320870,05 0,028922160440,0014461080220,9304278032 5,75 0,94358386050,0564161395 0,05 0,028208069750,0014104034880,9318382067 5,8 0,94497677990,055023220060,05 0,027511610030,0013755805010,9332137872 5,85 0,94633530810,053664691910,05 0,026832345960,0013416172980,9345554045 5,9 0,94766029410,052339705950,05 0,026169852970,0013084926490,9358638972 5,95 0,9489525660,051047434 0,05 0,0255237170,001276185850,937140083 6 0,95021293160,049787068370,05 0,024893534180,0012446767090,9383847597 6,05 0,95144217870,048557821270,05 0,024278910640,0012139455320,9395987053 6,1 0,95264107560,047358924390,05 0,02367946220,001183973110,9407826784 6,15 0,95381037160,046189628380,05 0,023094814190,001154740710,9419374191 6,2 0,95495079760,045049202390,05 0,02252460120,001126230060,9430636491 6,25 0,95606306640,043936933620,05 0,021968466810,0010984233410,9441620725 6,3 0,95714787310,042852126870,05 0,021426063430,0010713031720,9452333757 6,35 0,95820589590,041794104080,05 0,020897052040,0010448526020,9462782283 6,4 0,9592377960,040762203980,05 0,020381101990,0010190550990,9472972834 6,45 0,96024421840,039755781580,05 0,019877890790,00099389453940,9482911779 6,5 0,96122579220,038774207830,05 0,019387103920,00096935519580,9492605331 6,55 0,96218313080,037816869230,05 0,018908434610,00094542173070,9502059548 6,6 0,96311683260,0368831674 0,05 0,01844158370,0009220791850,951128034 6,65 0,96402748120,035972518750,05 0,017986259380,00089931296880,952027347 6,7 0,96491564590,0350843541 0,05 0,017542177050,00087710885250,9529044558 6,75 0,96578188170,034218118310,05 0,017109059160,00085545295780,9537599088 6,8 0,966626730,033373269960,05 0,016686634980,0008343317490,9545942405 6,85 0,9674507190,032549280990,05 0,016274640490,00081373202470,9554079726 6,9 0,96825436360,031745636380,05 0,015872818190,00079364090950,9562016135 6,95 0,96903816620,030961833820,05 0,015480916910,00077404584560,9569756593 7 0,96980261660,030197383420,05 0,015098691710,00075493458560,9577305939 7,05 0,97054819260,029451807370,05 0,014725903680,00073629518420,9584668891 7,1 0,97127536030,028724639650,05 0,014362319830,00071811599140,9591850051 7,15 0,97198457420,028015425770,05 0,014007712890,00070038564440,9598853907 7,2 0,97267627760,027323722450,05 0,013661861220,00068309306120,9605684838 7,25 0,97335090270,026649097340,05 0,013324548670,00066622743340,9612347112 7,3 0,97400887120,025991128780,05 0,012995564390,00064977821950,9618844894 7,35 0,97465059450,025349405520,05 0,012674702760,00063373513810,9625182246 7,4 0,97527647350,024723526470,05 0,012361763240,00061808816180,9631363127 7,45 0,97588689960,024113100430,05 0,012056550210,00060282751070,9637391402 7,5 0,97648225410,023517745860,05 0,011758872930,00058794364640,9643270839 7,55 0,97706290940,022937090640,05 0,011468545320,0005734272660,9649005112 7,6 0,97762922810,022370771860,05 0,011185385930,00055926929640,9654597805 7,65 0,97818156450,021818435530,05 0,010909217770,00054546088830,9660052413 7,7 0,97872026360,021279736440,05 0,010639868220,0005319934110,9665372347 7,75 0,97924566210,020754337870,05 0,010377168940,00051885844680,9670560932 7,8 0,97975808860,020241911450,05 0,010120955720,00050604778610,967562141 7,85 0,98025786310,019742136870,05 0,0098710684360,00049355342180,9680556944 7,9 0,98074529820,019254701780,05 0,0096273508880,00048136754440,9685370619 7,95 0,98122069850,018779301490,05 0,0093896507470,00046948253740,9690065445 8 0,98168436110,018315638890,05 0,0091578194440,00045789097220,9694644355 8,05 0,98213657580,017863424150,05 0,0089317120770,00044658560380,9699110211 8,1 0,98257762540,017422374640,05 0,008711187320,0004355593660,9703465804 8,15 0,98300778530,016992214680,05 0,0084961073380,00042480536690,9707713858 8,2 0,98342732460,0165726754 0,05 0,0082863377010,0004143168850,9711857027 8,25 0,98383650540,016163494590,05 0,0080817472940,00040408736470,97158979 8,3 0,98423558350,015764416480,05 0,0078822082420,00039411041210,9719839005 8,35 0,98462480830,015375191660,05 0,0076875958280,00038437979140,9723682802 8,4 0,98500442320,014995576820,05 0,007497788410,00037488942050,9727431697 8,45 0,98537466530,014625334710,05 0,0073126673550,00036563336770,973108803 8,5 0,98573576610,014264233910,05 0,0071321169540,00035660584770,9734654089 8,55 0,98608795130,013912048720,05 0,0069560243590,0003478012180,9738132101 8,6 0,9864314410,013568559010,05 0,0067842795060,00033921397530,9741524241 8,65 0,98676644990,0132335501 0,05 0,0066167750480,00033083875240,9744832628 8,7 0,98709318740,012906812580,05 0,006453406290,00032267031450,9748059331 8,75 0,98741185780,012588142240,05 0,0062940711210,00031470355610,9751206367 8,8 0,98772266010,0122773399 0,05 0,0061386699520,00030693349760,9754275702 8,85 0,98802578870,0119742113 0,05 0,005987105650,00029935528250,9757269255 8,9 0,9883214330,011678566970,05 0,0058392834850,00029196417430,9760188897 8,95 0,98860977790,011390222120,05 0,0056951110620,00028475555310,9763036452 9 0,98889100350,011108996540,05 0,0055544982690,00027772491350,9765813701 9,05 0,98916528560,010834714440,05 0,0054173572180,00027086786090,976852238 9,1 0,98943279560,010567204380,05 0,0052836021920,00026418010960,9771164181 9,15 0,98969370080,010306299180,05 0,0051531495890,00025765747950,9773740756 9,2 0,98994816430,010051835740,05 0,0050259178720,00025129589360,9776253715 9,25 0,9901963450,0098036550360,05 0,0049018275180,00024509137590,9778704628 9,3 0,99043839810,0095616019310,05 0,0047808009650,00023904004830,9781095029 9,35 0,99067447490,0093255251380,05 0,0046627625690,00023313812840,978342641 9,4 0,99090472290,0090952771020,05 0,0045476385510,00022738192750,9785700229 9,45 0,99112928610,008870713910,05 0,0044353569550,00022176784770,9787917908 9,5 0,99134830480,0086516952030,05 0,0043258476020,00021629238010,9790080832 9,55 0,99156191590,0084380840870,05 0,0042190420440,00021095210220,9792190353 9,6 0,9917702530,0082297470490,05 0,0041148735250,00020574367620,979424779 9,65 0,99197344610,008026553870,05 0,0040132769350,00020066384680,9796254428 9,7 0,99217162250,0078283775490,05 0,0039141887750,00019570943870,9798211522 9,75 0,99236490580,0076350942190,05 0,0038175471090,00019087735550,9800120296 9,8 0,99255341690,0074465830710,05 0,0037232915350,00018616457680,9801981942 9,85 0,99273727370,007262726280,05 0,003631363140,0001815681570,9803797623 9,9 0,99291659110,0070834089290,05 0,0035417044650,00017708522320,9805568475 9,95 0,99309148110,0069085189390,05 0,003454259470,00017271297350,9807295605 10 0,9932620530,0067379469990,05 0,00336897350,0001684486750,9808980092 10,05 0,99342841350,0065715864950,05 0,0032857932470,00016428966240,9810622989 10,1 0,99359066660,0064093334460,05 0,0032046667230,00016023333620,9812225322 10,15 0,99374891360,006251086440,05 0,003125543220,0001562771610,9813788094 10,2 0,99390325340,0060967465660,05 0,0030483732830,00015241866410,981531228 10,25 0,99405378260,0059462173560,05 0,0029731086780,00014865543390,9816798835 10,3 0,99420059530,0057994047270,05 0,0028997023630,00014498511820,9818248686 10,35 0,99434378310,0056562169140,05 0,0028281084570,00014140542280,981966274