Baixe o app para aproveitar ainda mais
Prévia do material em texto
Distribuição NORMAL Prof. Elisson de Andrade eapandra@uol.com.br AVISO No site existe uma TABELA para vocês imprimirem para a próxima aula Vamos utilizar na prova, ok? O que é uma distribuição de probabilidade? Mostra o comportamento de uma variável aleatória, vinculada às suas probabilidades de ocorrência Vamos mostrar isso com o exemplo de uma MOEDA CARA = Sucesso → p = 0,8 COROA = Fracasso → q = 0,2 Ao jogar apenas UMA moeda, qual a distribuição de probabilidade? N. Caras P(X) 0 0,2 1 0,8 Distribuição de Probabilidade 0 1 0.19999999999999998 0.8 AGORA VOCÊ: ao jogar DUAS moedas, qual a distribuição de probabilidade? Distribuição de Probabilidade N. Caras P(X) 0 0,04 1 0,32 2 0,64 0 1 2 3.9999999999999987E-2 0.31999999999999995 0.64 Mais Uma: ao jogar TRÊS moedas, qual a distribuição de probabilidade? Distribuição de Probabilidade N. Caras P(X) 0 0,008 1 0,096 2 0,384 3 0,512 0 1 2 3 7.9999999999999967E-3 9.599999999999996E-2 0.38400000000000001 0.51200000000000012 Finalmente: ao jogar CINCO moedas, qual a distribuição de probabilidade? Distribuição de Probabilidade N. Caras P(X) 0 0,00032 1 0,0064 2 0,0512 3 0,2048 4 0,4096 5 0,32768 0 1 2 3 4 5 3.2000000000000008E-4 6.3999999999999968E-3 5.1199999999999954E-2 0.20479999999999993 0.40959999999999996 0.32768000000000008 Agora vejamos no Excel, a distribuição de probabilidade desse mesmo problema, para 7, 10, 20, 50 e 100 jogadas de moeda Veja que uma distribuição BINOMIAL, quando n é grande, se aproxima do seguinte formato: A esse tipo de formato, damos o nome de DISTRIBUIÇÃO NORMAL Observação: vejam uma diferença Variável Discreta Variável Contínua 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 8.1355695265186419E-4 1.5792576139712659E-3 2.9296373128742371E-3 5.1896432399486485E-3 8.7712280111808157E-3 1.4131422906902429E-2 2.168108719963116E-2 3.1642667804867075E-2 4.3877832689415669E-2 5.7733990380810063E-2 7.1980039955295658E-2 8.4899534306246208E-2 9.4571633151261603E-2 9.9300214808824727E-2 9.8074286230937988E-2 9.0898118945747466E-2 7.8851380290286918E-2 6.3832069758803692E-2 4.806179370074630 7E-2 3.3531483977264902E-2 2.1583483939388894E-2 1.2753876873275253E-2 6.878495392328242E-3 3.3628199695826867E-3 1.4781626239923913E-3 5.7841146156224093E-4 1.9902329860206126E-4 5.9283535753805565E-5 Ou seja, vamos poder fazer cálculos referentes a uma DISTRIBUIÇÃO BINOMIAL, utilizando a DISTRIBUIÇÃO NORMAL, quando n for grande PORÉM, isso sempre será uma aproximação Mas por qual razão utilizar essa aproximação? Por que a distribuição normal é tão importante? 1. Teorema do Limite Central: para um n grande, a distribuição da MÉDIA de qualquer distribuição tende a uma normal Vejamos um exemplo: cada aluno vai jogar um dado 4 vezes, anotar os valores e calcular a média. Repetir isso 2 vezes. Depois, me passem os 2 valores de média para eu inserir no Excel. VAMOS ANOTAR A MÉDIA E DESVIO PADRÃO 2. Toda distribuição normal poderá ser obtida conhecendo-se apenas 2 PARÂMETROS: média e desvio padrão 3. O ponto máximo da curva normal está na MÉDIA, que também é mediana e moda da distribuição 4. A média poderá ser um valor positiva, zero ou negativo. 5. A distribuição normal é SIMÉTRICA. Extremos tendem ao infinito. 6. Desvio padrão define o quanto uma curva é achatada ou larga. Valores maiores: curvas mais largas e achatadas (maior variabilidade) Ativo 1 -9.9915735675870601E-2 -9.5339871689375993E-2 -9.0764007702881386E-2 -8.6188143716386778E-2 -8.161227972989217E-2 -7.7036415743397563E-2 -7.2460551756902955E-2 -6.7884687770408347E-2 -6.330882378391374E-2 -5.8732959797419132E-2 -5.4157095810924524E-2 -4.9581231824429917E-2 -4.5005367837935309E-2 -4.0429503851440701E-2 -3.5853639864946094E-2 -3.1277775878451486E-2 -2.6701911891956878E-2 -2.2126047905462271E-2 -1.7550183918967663E-2 -1.2974319932473055E-2 -8.3984559459784475E-3 -3.822591959483838 9E-3 7.5327202701076963E-4 5.3291360135053782E-3 9.9049999999999867E-3 1.4480863986494594E-2 1.9056727972989202E-2 2.363259195948381E-2 2.8208455945978417E-2 3.2784319932473029E-2 3.7360183918967636E-2 4.1936047905462244E-2 4.6511911891956852E-2 5.1087775878451459E-2 5.5663639864946067E-2 6.0239503851440675E-2 6.4815367837935289E-2 6.9391231824429897E-2 7.3967095810924505E-2 7.8542959797419112E-2 8.311882378391372E-2 8.7694687770408328E-2 9.2270551756902935E-2 9.6846415743397543E-2 0.10142227972989215 0.10599814371638676 0.11057400770288137 0.11514987168937597 0.11972573567587058 0.12430159966236519 1.3607954676411745E-14 2.4344568380458053E-13 3.852199617965412E-12 5.3915416980105631E-11 6.6744369169927819E-10 7.3082564212836018E-9 7.077997432089126E- 8 6.0632364436920369E-7 4.5940539174418778E-6 3.0788260409368288E-5 1.8250370869190536E-4 9.5687612163069472E-4 4.4374882873574354E-3 1.8201878127748112E-2 6.6037810304643119E-2 0.21191739483636843 0.60150331921604672 1.5101042498508701 3.3533069663464534 6.5862342393142548 11.44190962895825 17.581557041186297 23.895363119409584 28.725487965085396 30.543491089465629 28.725487965085421 23.895363119409623 17.58155704118634 11.441909628958287 6.5862342393142814 3.3533069663464685 1.5101042498508783 0.60150331921605049 0.21191739483636993 6.6037810304643521E-2 1.8201878127748275E-2 4.4374882873574519E-3 9.5687612163069809E-4 1.8250370869190701E-4 3.0788260409368396E-5 4.5940539174419015E-6 6.0632364436920581E-7 7.0779974320891776E-8 7.3082564212837052E-9 6.6744369169928284E-10 5.3915416980106013E -11 3.8521996179654395E-12 2.4344568380458401E-13 1. 3607954676411939E-14 6.7279244957413993E-16 Ativo 2 -9.9915735675870601E-2 -9.5339871689375993E-2 -9.0764007702881386E-2 -8.6188143716386778E-2 -8.161227972989217E-2 -7.7036415743397563E-2 -7.2460551756902955E-2 -6.7884687770408347E-2 -6.330882378391374E-2 -5.8732959797419132E-2 -5.4157095810924524E-2 -4.9581231824429917E-2 -4.5005367837935309E-2 -4.0429503851440701E-2 -3.5853639864946094E-2 -3.1277775878451486E-2 -2.6701911891956878E-2 -2.2126047905462271E-2 -1.7550183918967663E-2 -1.2974319932473055E-2 -8.3984559459784475E-3 -3.8225919594838389E-3 7.5327202701076963E-4 5.3291360135053782E-3 9.9049999999999867E-3 1.4480863986494594E-2 1.9056727972989202E-2 2.363259195948381E-2 2.8208455945978417E-2 3.2784319932473029E-2 3.7360183918967636E-2 4.1936047905462244E-2 4.6511911891956852E-2 5.1087775878451459E-2 5.5663639864946067E-2 6.0239503851440675E-2 6.4815367837935289E-2 6.9391231824429897E-2 7.3967095810924505E-2 7.8542959797419112E-2 8.311882378391372E-2 8.7694687770408328E-2 9.2270551756902935E-2 9.6846415743397543E-2 0.10142227972989215 0.10599814371638676 0.11057400770288137 0.11514987168937597 0.11972573567587058 0.12430159966236519 0.2195081518142161 0.29987790559641631 0.40427100166828855 0.53781760922722366 0.70604397404855834 0.91466653422598543 1.1693058805990657 1.4751214693502623 1.8363765558855574 2.2559527600140949 2.7348440625313146 3.27166962081728 3.8622521179176865 4.4993119424703352 5.1723260563454838 5.8675931131030143 6.5685330833230768 7.256230981773542 7.9102117926905224 8.509409627591614 9.0332713175740267 9.4629159925 200863 9.7822604219665994 9.9790169844415111 10.045478048050866 9.9790169844415129 9.7822604219666029 9.4629159925200899 9.0332713175740302 8.5094096275916176 7.9102117926905269 7.2562309817735464 6.5685330833230822 5.8675931131030179 5.1723260563454874 4.4993119424703396 3.8622521179176892 3.2716696208172809 2.734844062531316 2.2559527600140967 1.8363765558855587 1.4751214693502628 1.1693058805990666 0.91466653422598632 0.70604397404855834 0.5378176092272241 0.40427100166828889 0.29987790559641631 0.21950815181421635 0.15855908940592633 7. As probabilidades da variável aleatória normal são dadas pelas áreas sob a curva. Área total = 1. Área à esquerda da média é igual a área à direita (ambas = 0,5) 8. Devido à simetria, as % das áreas sob a curva são padronizadas. Sendo as mais comuns, relacionadas ao desvio padrão Veja o seguinteexercício Mês Retorno ATIVO 1 Retorno ATIVO 2 1 1,00% 2,00% 2 -0,89% -3,00% 3 2,00% 5,00% 4 1,50% 6,00% 5 -0,30% -4,00% 6 3,00% 0,00% 7 0,80% 0,50% 8 3,00% 2,50% 9 -1,50% -4,00% 10 2,50% 7,00% 11 2,00% 3,00% 12 0,70% -2,00% 13 -0,50% -3,00% 14 1,00% 8,00% 15 1,50% -4,00% 16 2,20% 5,00% 17 -1,00% -2,00% 18 0,00% 3,00% 19 0,80% 4,00% 20 2,00% -4,19% Média Desvio Padrão ATIVO 1 0,9905% 1,3061% ATIVO 2 0,9905% 3,9714% Assumindo que os retornos possuem distribuição Normal Média - Desvio Média Média + Desvio Ativo 1 -0,3156% 0,9905% 2,2966% Ativo 2 -2,9809% 0,9905% 4,9619% Binomial versus Normal Binomial – Variável Discreta; Normal – Variável Contínua Resultado importante: em uma distribuição binomial, com parâmetros n e p, à medida que n cresce, ela se aproxima de uma distribuição normal Regra geral: np>5 quando p<=5, ou nq>5 quando p>5 Portanto, para uma distribuição binomial, quando n é grande, podemos chegar a resultados muito bons, se utilizarmos a distribuição Normal (transformando um problema discreto em contínuo) DISTRIBUIÇÃO NORMAL REDUZIDA (PADRÃO) Vamos deixar de lado a DISTRIBUIÇÃO BINOMIAL e focar apenas na DISTRIBUIÇÃO NORMAL Normal Reduzida (padronizada) Cria-se uma nova variável: Z Que é calculada através da seguinte expressão Vamos para um EXEMPLO? Dados 4 5 2 9 8 5 Considere os seguintes dados: Calcule Média e Desvio Padrão: Resp: Média = 5,5 e DP = 2,5884 Agora vamos PADRONIZAR os dados ao lado, criando uma coluna Z Z -0,5795 -0,1931 -1,3521 1,3521 0,9658 -0,1931 Calcule Média e Desvio Padrão de Z: Resp: Média = 0 e DP = 1 Normal Reduzida/Padronizada Normal Reduzida (padronizada) Ou seja, parte-se de uma variável original X Chegamos a uma variável PADRONIZADA Z Essa variável padrão tem média zero e desvio um Sendo que temos uma TABELA com todos os valores de probabilidades para cada Z Mas para tal, precisamos entender COMO FUNCIONA nossa tabela A Tabela dá a probabilidade da variável assumir qualquer valor, entre a média zero e um valor positivo qualquer Z. Z A tabela nos dá a probabilidade dessa área IMPORTANTÍSSIMO E sabemos que essa área pontilhada possui probabilidade de 0,5 1) Seja X uma variável com distribuição normal de média 20 e desvio-padrão 4, determinar P(X < 24): A tabela vai nos fornecer a probabilidade dessa área Sabemos que a probabilidade dessa área é 0,5 1) Seja X uma variável com distribuição normal de média 20 e desvio-padrão 4, determinar P(X < 24): 1) Seja X uma variável com distribuição normal de média 20 e desvio-padrão 4, determinar P(X < 24): 0,8413 Deu para perceber que a NORMAL é uma distribuição com características únicas? Isso porque podemos calcular as probabilidades de sua distribuição apenas conhecendo sua média e desvio padrão 2) Seja X uma variável com distribuição normal de média 20 e desvio-padrão 4, determinar P(X > 25): 0,1056 3) Seja X uma variável com distribuição normal de média 20 e desvio-padrão 4, determinar P(X < 12): 0,0228 4) Seja X uma variável com distribuição normal de média 20 e desvio-padrão 4, determinar P(22 < X < 25): 0,2029 0,5 5) Seja X uma variável com distribuição normal de média 20 e desvio-padrão 4, determinar P(14 < X < 22): 0,6247 1,5 0,5 Lembra-se do exercício dos DADOS? Com o valor da média e desvio-padrão de nosso experimento Considere que esses dados tenham DISTRIBUIÇÃO NORMAL E calcule qual a probabilidade de P(X<4) 1 4 20 24 = - = - = s m X Z 1 4 20 24 = - = - = s m X Z ( ) ( ) ?????? 5 , 0 1 24 = + = < = < TABELA Z P X P 1 4 20 24 = - = Z ( ) ( ) % 13 , 84 8413 , 0 3413 , 0 5 , 0 1 24 ou Z P X P = + = < = < 25 , 1 4 20 25 = - = Z ( ) ( ) 1056 , 0 3944 , 0 5 , 0 25 , 1 25 = - = > = > Z P X P 2 4 20 12 - = - = Z ( ) ( ) ( ) 0228 , 0 4772 , 0 5 , 0 2 2 12 = - = > = - < = < Z P Z P X P 25 , 1 4 20 25 e 5 , 0 4 20 22 = - = = - = Z Z ( ) ( ) 2029 , 0 1915 , 0 3944 , 0 25 , 1 5 , 0 25 22 = - = < < = < < Z P X P 5 , 0 4 20 22 e 5 , 1 4 20 14 = - = - = - = Z Z ( ) ( ) ( ) 6247 , 0 1915 , 0 4332 , 0 5 , 0 0 5 , 1 0 22 14 = + = < < + < < = < < Z P Z P X P
Compartilhar