Baixe o app para aproveitar ainda mais
Prévia do material em texto
24/01/2019 1 Prof.ª Elizangela Cabral dos Santos Unidade III e IV Distribuições contínuas de probabilidade Universidade Federal Rural do Semi-Árido Departamento de Ciências Naturais, Matemática e Estatística Disciplina: Estatística Variável Aleatória Contínua Associamos probabilidades a intervalos de valores da variável. Assume valores num intervalo de números reais. Não é possível listar, individualmente, todos os possíveis valores de uma v.a. contínua. Uma v.a. X contínua é caracterizada por sua função densidade de probabilidade f(x) (f.d.p) com as propriedades: Função de Densidade de Probabilidade 24/01/2019 2 A área sob a curva de densidade é 1, isto é, f(x) 0, para todo x; P(a X b) = área sob a curva da densidade f(x) e acima do eixo x, entre os pontos a e b; P(X = x0) = 0, para x0 fixo. Assim, P(a < X < b) = P(a X < b) = P(a < X b) = P(a X b)= 1)( dxxf R dxxf b a )( Ex.: Seja X uma v.a.c. com a seguinte função densidade f(x)= Verifique se f(x) é uma função densidade de probabilidade e calcule a probabilidade de x ocorre entre 1/4e ½. 3x2, 0<x<1 0, qualquer outro valor Parâmetros Valor Esperado: Dada a v. a. X, o valor esperado ou esperança matemática de X é dada por E(X) μ Notação: dxxxf )( E(X) 24/01/2019 3 Variância 222 ))(()()() - (x Var(X) XEXEdxxf (X)V 2 ar Notação: Parâmetros DISTRIBUIÇÕES CONTÍNUAS UNIFORME OU RETANGULAR NORMAL BIVARIADA NORMAL EXPONENCIAL LOGNORMAL WEIBULL QUI-QUADRADO 2 t DE STUDENT F DE SNEDECOR GAMA BETA ERLANG ( formas) Distribuições Contínuas 24/01/2019 4 Distribuições especiais Uniforme (a) Normal ou Gaussiana (b) t de Student (c) 2 (d) F (e) (a) (b) (c) (d) (e) ( ) 1P a X b Distribuição Uniforme 11 ( ) 2 a b E X 2( ) ( ) 12 b a Var X Uma variável aleatória X tem distribuição Uniforme no intervalo [a, b] se sua função densidade de probabilidade for dada por: se a ≤ x ≤ b1 ( ) 0 f x b a caso contrário (7 9) ?P X Exemplo: ~ (5,10)X U 9 7 ( )f x dx 5 10 1 ( ) 5 x f x f(x) X5 10 1 5 f(x) Xa b 1 b a (7 9)P X 1 2 (9 7). 0,4 5 5 Parâmetros Distribuição Normal 30 40 50 60 70 80 90 100 0.00 0.01 0.02 0.03 0.04 Peso D e n si d a d e - a distribuição dos valores é aproximadamente simétrica em torno de 70kg; A análise do histograma indica que: - a maioria dos valores (88%) encontra- se no intervalo (55;85); - existe uma pequena proporção de valores abaixo de 48kg (1,2%) e acima de 92kg (1%). Observamos o peso, em kg, de 1500 pessoas adultas selecionadas ao acaso em uma população. 24/01/2019 5 Forma curiosa 0,00 0,05 0,10 0,15 0,20 25 40 55 70 85 10 0 11 5 Peso da população adulta n = 5000 µ = 75 kg s = 12 kg 0,00 0,05 0,10 0,15 0,20 13 3 13 7 14 1 14 5 14 9 15 3 15 7 16 1 16 5 16 9 Altura de universitários n = 3000 µ = 152 cm s = 5 cm 0,00 0,05 0,10 0,15 29 ,5 29 ,6 29 ,7 29 ,8 29 ,9 30 30 ,1 30 ,2 30 ,3 30 ,4 30 ,5 Comprimento de uma régua n = 1000 µ = 30cm s = 0,15cm 0 0,05 0,1 0,15 0,2 19 7 21 5 23 3 25 1 26 9 28 7 30 5 Pessoas num restaurante µ = 250 por dia s = 20 por dia Distribuição Normal - Exemplos A probabilidade de uma variável aleatória tomar um valor entre dois pontos quaisquer é igual à área sob a curva normal entre aqueles pontos µ a b P (a < x < b) = área hachurada sob a curva Distribuição Normal ).,(~: 2NXNotação 24/01/2019 6 OBSERVAÇÃO: x - µ = distância do ponto considerado à média x - µ z = número de desvios padrões a contar da média. Ex.: 2,5 desvios padrões z = valor z ou score z. Pode-se obter valores negativos de z para valores de x inferiores à média e f(x) = x – ponto considerado da distrib. µ - média da distribuição - desvio padrão da distribuição -1 2 ( )x - µ 2 2 1 Propriedades • Suas média, mediana e moda são iguais. • Tem forma de sino e é simétrica em torno da média. • A área total sob a curva é de 100%. x À medida que a curva se afasta da média, aproxima-se cada vez mais do eixo x, mas nunca o toca. Os pontos em que a curvatura muda são chamados pontos de inflexão. O gráfico curva-se para baixo entre os pontos de inflexão e, para cima, à esquerda e à direita deles. x Ponto de inflexãoPonto de inflexão 24/01/2019 7 Regra Empírica Cerca de 95% da área está a dois desvios padrão. Cerca de 99,7% da área está a três desvios padrão da média. Cerca de 68% da área está a um desvio padrão da média. 68% Médias e desvios padrão 2012 15 1810 11 13 14 16 17 19 21 229 12 15 1810 11 13 14 16 17 19 20 Curvas com médias diferentes e desvios padrão diferentes Curvas com médias diferentes e o mesmo desvio padrão Distribuições normais com médias diferentes e variâncias iguais. Distribuições normais com médias iguais e variâncias diferentes 24/01/2019 8 Probabilidade é a área sob a curva! c d X f(X) P c X d f X dx c d ( ) ( ) ? ∫ A distância entre a média e um ponto qualquer é dado em número de desvios padrões (z) Normal padronizada Normal não padronizada z = x - µ µ x 0 z PP Distribuição Normal Padronizada 70 80 90 100 110 120 130 -3 -2 -1 0 +1 +2 +3 µ = 100,0 = 10,0 escala efetiva escala padronizada Escala efetiva X Escala padronizada 24/01/2019 9 z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,5000 0,4960 0,4920 0,4880 0,4840 0,4801 0,4761 0,4721 0,4681 0,4641 0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247 0,2 0,4207 0,4168 0,4129 0,4090 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859 0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483 0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121 0,5 0,3085 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2843 0,2810 0,2776 0,6 0,2743 0,2709 0,2676 0,2643 0,2611 0,2578 0,2546 0,2514 0,2483 0,2451 0,7 0,2420 0,2389 0,2358 0,2327 0,2296 0,2266 0,2236 0,2206 0,2177 0,2148 0,8 0,2119 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0,1894 0,1867 0,9 0,1841 0,1814 0,1788 0,1762 0,1736 0,1711 0,1685 0,1660 0,1635 0,1611 1,0 0,1587 0,1562 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379 1,1 0,1357 0,1335 0,1314 0,1292 0,1271 0,1251 0,1230 0,1210 0,1190 0,1170 1,2 0,1151 0,1131 0,1112 0,1093 0,1075 0,1056 0,1038 0,1020 0,1003 0,0985 1,3 0,0968 0,0951 0,0934 0,0918 0,0901 0,0885 0,0869 0,0853 0,0838 0,0823 1,4 0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0721 0,0708 0,0694 0,0681 1,5 0,0668 0,0655 0,0643 0,0630 0,0618 0,0606 0,0594 0,0582 0,0571 0,0559 1,6 0,0548 0,0537 0,0526 0,0516 0,0505 0,0495 0,0485 0,0475 0,0465 0,0455 1,7 0,0446 0,0436 0,0427 0,0418 0,0409 0,0401 0,0392 0,0384 0,0375 0,0367 1,8 0,0359 0,0351 0,0344 0,0336 0,0329 0,0322 0,0314 0,0307 0,0301 0,0294 1,9 0,0287 0,0281 0,0274 0,0268 0,0262 0,0256 0,0250 0,0244 0,0239 0,0233 2,0 0,0228 0,0222 0,0217 0,0212 0,0207 0,0202 0,0197 0,0192 0,0188 0,0183 2,1 0,0179 0,0174 0,0170 0,0166 0,0162 0,0158 0,0154 0,0150 0,0146 0,0143 2,2 0,0139 0,0136 0,0132 0,0129 0,0125 0,0122 0,0119 0,0116 0,0113 0,0110 2,3 0,0107 0,01040,0102 0,0099 0,0096 0,0094 0,0091 0,0089 0,0087 0,0084 2,4 0,0082 0,0080 0,0078 0,0075 0,0073 0,0071 0,0069 0,0068 0,0066 0,0064 2,5 0,0062 0,0060 0,0059 0,0057 0,0055 0,0054 0,0052 0,0051 0,0049 0,0048 2,6 0,0047 0,0045 0,0044 0,0043 0,0041 0,0040 0,0039 0,0038 0,0037 0,0036 2,7 0,0035 0,0034 0,0033 0,0032 0,0031 0,0030 0,0029 0,0028 0,0027 0,0026 2,8 0,0026 0,0025 0,0024 0,0023 0,0023 0,0022 0,0021 0,0021 0,0020 0,0019 2,9 0,0019 0,0018 0,0018 0,0017 0,0016 0,0016 0,0015 0,0015 0,0014 0,0014 3,0 0,0013 0,0013 0,0013 0,0012 0,0012 0,0011 0,0011 0,0011 0,0010 0,0010 Distribuição Normal Padrão (tabelas) 25 ( 2,17) ?P Z ( 2,17) 0,0150P Z 0 0,02 0,04 0,06 0,08 0,1 0,12 0,14 0 5 10 15 20- +0 z ( )P Z z 0 0,02 0,04 0,06 0,08 0,1 0,12 0,14 0 5 10 15 20- +0 1,5 Exemplos 26 ( 1,5) ?P Z ( 1,5) ( 1,5) 0,0668P Z P Z = 0,0668 0 0,02 0,04 0,06 0,08 0,1 0,12 0,14 0 5 10 15 20- +0-1,5 24/01/2019 10 0 0,02 0,04 0,06 0,08 0,1 0,12 0,14 0 5 10 15 20- +0 1,5 (0 1,5) ?P Z P(Z>1,5)= ? P(Z<1,5)= ? 24/01/2019 11 (1 2) ?P Z = 0 0,02 0,04 0,06 0,08 0,1 0,12 0,14 0 5 10 15 20- +0 21 0 0,02 0,04 0,06 0,08 0,1 0,12 0,14 0 5 10 15 20- +0 1 0,1587 0 0,02 0,04 0,06 0,08 0,1 0,12 0,14 0 5 10 15 20- +0 2 0,0228 _ = 0 0,02 0,04 0,06 0,08 0,1 0,12 0,14 0 5 10 15 20- +0 21 0 0,02 0,04 0,06 0,08 0,1 0,12 0,14 0 5 10 15 20- +0 1 0,3413 0 0,02 0,04 0,06 0,08 0,1 0,12 0,14 0 5 10 15 20- +0 2 0,4772 _ (1 2) 0,1587 0,0228 0,1359P Z P(1< Z <2) = 0,4772-0,3413 = 0,1359 Exemplos ~ (10,4)X N (8 11) ?P X X Z ~ (0,1)N (8 10 10 11 10) ?P X 8 10 10 11 10 ( ) ? 2 2 2 X P ( 1 0,5) ?P Z Z 0 0,02 0,04 0,06 0,08 0,1 0,12 0,14 0 5 10 15 20- +0 0,5-1 Z 0 0,02 0,04 0,06 0,08 0,1 0,12 0,14 0 5 10 15 20- +10 118 X 0,5328 0,5328 0,5328 0,5328 Você trabalha no setor de Controle de Qualidade da GE. A vida útil de uma lâmpada tem Distribuição Normal com mx= 2000 horas & sx=200 horas. Qual é a probabilidade de uma lâmpada durar: a) entre 2000 & 2400 horas? b) menos de 1470 horas? 24/01/2019 12 Numa variedade de milho onde a altura é uma variável aleatória X com distribuição normal de média 200 cm e variância 100 cm². Qual a probabilidade de uma planta dessa variedade ter altura entre 190 e 195 cm? P(190<x<195)= ? Z= X- μ σ σ²=100; σ= 10 p/x=190 Z=190 -200 = -1 10 p/x=195 Z=195 -200 = -0,5 10 P(190<x<195)= P(-1,0<Z<0,0) – P(-0,5<Z<0,0) = 0,3413 – 0,1915 = 0,1498 ~ 14,98% 24/01/2019 13 Uma variedade de tomate possui produtividade média de 7,9kg/planta e variância de 0,97 (kg/planta)². Supor que a distribuição seja normal e calcular a probabilidade de a produtividade (X) de uma planta sorteada dessa variedade estar de acordo com: P(X>9,0)=? Z= X- μ σ σ²=0,97; p/x>9,00 Z=9,0 -7,9 = 1,12 0,98 P(x>9,0)= P(Z>1,12)=0,5 – P(0<Z<1,12) =0,5 – 0,33686 = 0,1314 ~ 13,14% 24/01/2019 14 O tempo gasto no exame vestibular de uma universidade tem distribuição normal com média 120 minutos e desvio padrão 15 minutos. (a)Sorteando-se um aluno ao acaso, qual é probabilidade dele terminar o exame antes de 100 minutos? (b)Qual deve ser o tempo de prova de modo que permita o 95% dos vestibulandos terminem no prazo estipulado? (c)Qual o intervalo central de tempo, tal que 80% dos estudantes gastam para completar o exame? X: tempo gasto no exame vestibular. 0,0917690,9082411)33,1(1 )33,1(1 )33,1( 15 120100 )100( ).15,120(~ 2 ZP ZPZPXP NX 95,0 15 120 )( 95,0)( x ZPxXP xXP z=? , tal que (z)=0,95 Da tabela z= 1,64 (c) Qual o intervalo central de tempo, tal que 80% dos estudantes gastam para completar o exame? 6,1521564,1120 x 24/01/2019 15 80.0 15 120 15 120 80,0)( 2121 x Z x PxXxP z=? , tal que (z)=0,90 Da tabela z= 1,28 .min2,13928,11512028,1 15 120 .min8,10028,11512028,1 15 120 22 2 11 1 xx x xx x Exemplo: Estudo do Sindicato de Bancários indica que cerca de 30% dos funcionários de banco têm problemas de estresse, provenientes das condições de trabalho. Numa amostra de 200 bancários, qual seria a probabilidade de pelo menos 50 com essa doença? )3,0 ,200(~problema o com bancários de N : o BXX 948,0)7,0()3,0)( 200 ()50( 200 50 200 k kk k XP Resultado muito trabalhos: 151 termos para somar A aproximação pela Normal é baseada no Teorema Limite Central. Em geral quanto mais simétrica for a f.p. da Binomial, melhor será a aproximacão. Aproximação da Binomial pela Normal Distribuição Binomial n = 10 p = 0,2 24/01/2019 16 Distribuição Binomial n = 20 p = 0,2 Distribuição Binomial n = 50 p = 0,2 5.0p sendo Y ~ N(np ; np(1 – p) ). Aproximar a distribuição de probabilidades de X pela distribuição de probabilidades de uma variável aleatória Y tal que Portanto, • P( a X b) P(a Y b) • P( X a) P(Y a) • P( X b) P(Y b) X ~ b(n ; p) E(X) = np Var(X) = np(1 – p) Y ~ N( y, y 2) com y = n p e y 2 = n p (1 – p). Idéia Básica 24/01/2019 17 Logo temos que , desta forma 938,0)54,1() 42 6050 42 60 ()50()50( ZP Y PYPXP )42,60(~ NY No Exemplo anterior temos que: 42)1()( e 60)( com ),3,0 ,200(~ pnpXVarnpXEBX Probabilidade exata = 0,948 (usando a distribuição binomial). Correção de Continuidade Correção de Continuidade 9478,0)-1.62() 42 605,49 42 60 ()5,49()50( ZP Y PYPXP 9292,0)46.1() 42 605,50 42 60 ()5,50()50( ZP Y PYPXP 0182,0) 42 605,50 42 60 42 605,49 ()5,505,49()50( Y PYPXP Para probabilidade pontuais, criamos um intervalo artificial: Probabilidade exata = 0,0190 (usando a distribuição binomial). Exemplo: Um sistema é formado por 100 componentes, cada um dos quais com confiabilidade (probabilidade de funcionar adequadamente num certo período) igual a 0,9. Se esses componentes funcionarem de forma independente um do outro e se o sistema funcionar adequadamente enquanto pelo menos 87 componentes estiverem funcionando, qual é a confiabilidade do sistema? X : número de componentes que funcionam adequadamente dos 100 X ~ b(100; 0,9) n = 100 p = 0,9 E(X) = np = 1000,9 = 90 Var(X) = np(1 – p) = 100 0,9 0,1 = 9 Confiabilidade do sistema: P(X 87)=?? P(X 87) P(Y 87) P(Y 86,5) Y ~ N(90 ; 9) 876976.0)16,1( )16.1() 3 905,86 9 90 ( ZP Y P Probabilidade exata = 0.8761232 (usando a distribuição binomial). 24/01/2019 18 Considere o experimento: retiram-se 100 bolas da urna (com reposição). Define-se uma v.a. X cujos valores representam o número total de bolas vermelhas dentre as 100 escolhidas. Calcule: P(30 X 51) 2 100 0,4 5 n p ( ) x n x n f x p q x 100 100 ( ) 0,4 0,6x xf x x 51 100 30 100 (30 51) 0,4 0,6x x x P X x 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0 20 40 60 80 100 Aproximando-se à Normal... (valor exato) 2 100 0,4 5 ( ) 100*0,4 40 ( ) 100*0,4*0,6 24 n p E X np Var X npq ~ (40,24)X N 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0 20 40 60 80 100 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0 20 40 60 80 100(30 51) ?P X 30 (29,5 51,5) ?P X (correção de continuidade) 29,5 40 51,5 40 24 24 P Z 0,9745 (valor exato para Binomial 0,9752) Pelo TLC: 2,143 2,347P Z Quando a média “λ” de uma distribuição de Poisson for relativamente grande, a distribuição Normal de probabilidade pode ser usada como uma aproximação das probabilidades de Poisson. Regra : λ≥10,0. A média e o desvio padrão se baseia na Distribuição de Poisson A média µ=λ O desvio padrão δ= √λ Aproximação Normal da Probabilidade de Poisson 24/01/2019 19 Um departamento de conserto de máquinas recebe em média, 10 chamadas em cada período de 8 horas. Podemos determinar a probabilidade de que mais do que 15 chamadas serão recebidas em um período de 8 horas. P(X>15/ λ=10,00)=? P(X>15/ λ=10,00)=? • µ= λ=10 • δ= √λ = √10 = 3,16 • Ppoisson(X>15/λ=10,00) ~ Pnormal(X≥15,5/ µ=10,00, δ= 3,16) • Z=X- µ = 15,5-10,0 = 5,5 = 1,74 δ 3,16 3,16 P(Z>1,74)= 0,5-P(0<z<1,74) = 0,5 - 0,4591 = 0,0409 ou 4,09% Distribuição do Qui-quadrado É uma distribuição contínua, cuja curva ajustada é assimétrica à direita e tem por origem o zero, que é o valor mínimo que X² pode assumir. Essa distribuição é uma função direta do número de graus de liberdade (ν). A variável aleatória “X” tem uma Distribuição do Qui- quadrado, com “ν” graus de liberdade, se sua função densidade de probabilidade for dada por: 24/01/2019 20 Distribuição Qui-Quadrado Xφ 2 = 2 x = ∑ Zi 2, X2 >0, - Média da distribuição: E [Xφ2] = µ (Xφ2) = φ. - Variância da distribuição: Var [Xφ2] = σ2 (Xφ2) = 2φ. - A área sob a curva vale 1 ou 100 %. A área total sob a curva χ² é igual a 1. A curva do χ² inicia no 0 no eixo horizontal e extende indefinidamente para direita tendendo a aproximar-se do eixo horizontal. A curva de χ² não é simétrica. Ela é assimetrica à direita. Quando o número de graus de liberdade aumenta, a curva de χ² tende para a curva normal, ou seja, o índice de assimetria menor, tal que ν≥100 considera-se χ² ~N. Propriedades da curva do Qui-quadrado Uma amostra n=15, V=n-1 = 15-1=14gl α =5% ou 0,05; 1-0,05= 0,95% ou 0,95 X²=X²0,05 = 23,685; X1- α=X²0,95 = 6,571; Conhecendo a tabela 24/01/2019 21 Esta Distribuição foi desenvolvida por W.S. Gosset, em 1908, ele publicou um trabalho onde apresentou a equação de Distribuição teórica de “t”, hoje conhecida como Distribuição t de Student. Distribuição t-Student Verifica-se que a Distribuição de “t” depende apenas do valor “v”, desde que a variável básica “x” possua uma Distribuição Normal. Para cada grau de liberdade existe uma curva de “t” e a medida que aumenta ‘v” a curva vai se aproximando de uma curva Normal. Distribuição t-Student 24/01/2019 22 É semelhante a distribuição Z, pois ambas são simétricas em relação à média zero. Os valores são positivos à direita da média e negativos à sua esquerda; Para cada tamanho de n de amostra existe uma curva t. A f(t) depende de n; Todas curvas têm máximo para t=0; À medida que n cresce, a curva t se aproxima da curva de Z. O valor v=n-1 (nº de graus de liberdade) é usado para obtenção de probabilidades em tabelas próprias. Propriedades da Distribuição t- Student A principal aplicação desta distribuição é auxiliar na tomada de decisão em relação à média de uma Distribuição Normal quando sua variância é desconhecida. Aplicação 24/01/2019 23 Estatística t Onde: x=média amostral μ = média populacional. Sx = desvio padrão amostral. n = tamanho da amostra. n Sx x t 24/01/2019 24 Seja uma amostra n=15. Qual o valor de t acima do qual se tem 5% de área? Tabela t Conhecendo a tabela É a distribuição de probabilidade que associa duas variáveis aleatórias que seguem uma distribuição do Qui-quadrado com v1 e v2 graus de liberdade respectivamente. Sua função é designada por: Distribuição de F A sua aplicação mais importante é auxiliar na comparação das variâncias de duas distribuições Normais. É a distribuição de probabilidade que associa duas variáveis aleatórias que seguem uma distribuição do Qui-quadrado com v1 e v2 graus de liberdade respectivamente. Contribuiu para uma grande avanço na Estatística Aplicada, principalmente pela aplicação na metodologia da Análise de variância. Distribuição de F 24/01/2019 25 A curva de F depende dos valores v1 e v2 e da ordem dos mesmos, pois existe uma curva para cada par (v1, v2). v1 = gl associado à variância do numerador; v2 = gl associado à variância do denominador. Valores de probabilidades na distribuição F são obtidos em tabelas próprias para as combinações v1 e v2. Distribuição de F A área total sob uma curva “F” é 1. Uma curva “F” começa no 0 e extende-se indefinidamente para a direita, aproximando-se do eixo horizontal. Uma curva “F” não é simétrica, mas é assimetrica à direita. Propriedades básicas da curva F Duas amostras: -n1=8 e n2=6; - α =5% Tabela F Conhecendo a tabela 24/01/2019 26 Duas amostras: -n1=16 e n2=20; - α =1% Tabela F Conhecendo a tabela
Compartilhar