Baixe o app para aproveitar ainda mais
Prévia do material em texto
Professor: Hiron Pereira Farias Disciplina:Probabilidade Estatística 1 Distribuição Normal Dizemos que a variável aleatória contínua X tem distribuição normal com parâmetros µ e σ2, −∞ < µ < +∞ e 0 < σ2 <∞, se sua função densidade de probabilidade (f.d.p) é dada por f(x;µ, σ2) = 1 σ √ 2pi e− 1 2 (x−µ σ )2 , −∞ < x < +∞ (1.1) em que: pi = 3,1415 . . . e = 2,718281828 . . . Os parâmetros µ e σ2 representam, respectivamente, a média e a variância da distribuição, neste caso escrevemos que E(X) = µ e V ar(X) = σ2 respectivamente . Usaremos a notação X ∼ N(µ, σ2), para indicar que X tem distribuição Normal com parâmtros µ e σ2 . A densidade f(x;µ, σ2) é simétrica em relação a reta x = µ, isto é: f(µ+ x;µ, σ2) = f(µ− x;µ, σ2) para todo x real; Para x = µ f(x;µ, σ2) assumi valor máximo ,isto é, f(x;µ, σ2) = 1 σ √ 2pi ; Para x = µ− σ e x = µ+ σ são pontos de inflexão de f(x;µ, σ2); Para f(x;µ, σ2) −→ 0, quando x−→ ±∞. Com auxílio do Cálculo, vamos verificar as afirmações sobre a função fazendo o esboço do gráfico de f(x;µ, σ2), e para que não se perca nos cálculos o leitor tem que ater ao fato que os parâmetros µ e σ2 são conhecidos ou estimáveis, sendo assim sempre olharemos os parâmetros µ e σ2 como constantes. Para esboçar o gráfico de f(x;µ, σ2) seguiremos o seguinte roteiro: Primeiro, determinaremos o domínio de f(x;µ, σ2), identificando assim, para quais valores reais a função f(x;µ, σ2) terá como valor um número real; Segundo, faremos a derivada primeira de f(x;µ, σ2) e igualaremos a zero para determinarmos os candidatos a máximos e mínimos da função em estudo; Terceiro, faremos a derivada segunda de f(x;µ, σ2) e ao igualar a zero e resolvendo esta equação encontraremos caso exista os pontos de inflexão, isto é, os valores de x onde a função muda de concavidade; Quarto, estudaremos o sinal da função f ′(x;µ, σ2) determinando os pontos de máximos e ou míni- mos caso existam de f(x;µ, σ2); Quinto, estudo do sinal de f ′′(x;µ, σ2), determinando assim os valores de x para os quais a função assume o valor zero, ao determinarmos estes valores, estudaremos o sinal de f ′′(x;µ, σ2) nos in- tervalos gerados, tendo assim conclusão a respeito do comportamento da função nos intervalos gerados. Podemos olhar a função f(x;µ, σ2) como o produto de dois fatores, a saber, 1 σ √ 2pi e e− 1 2 (x−µ σ )2 . Observe que o primeiro fator é uma constante positiva e o segundo uma função exponencial, que como sabemos so assume valores positivos, desta observação conclui-se que a função f(x;µ, σ2) = 1 σ √ 2pi e− 1 2 (x−µ σ )2 tem como domínio os reais, isto é, para qualquer x real f(x;µ, σ2) terá como valor um número real e positivo, ou seja, f(x) > 0 para todo x real. Sabendo que o domínio de f(x) é os reais podemos calcular o limite dessa função quando x tende para +∞ e quando x tende para −∞, mas é fácil ver que ambos os limites tenderam para zero, pois, a medida que x assume valores cada vez maiores o valor de f(x) assume valor cada vez menor, tendo em vista que o expoente −1 2 (x−µ σ )2 é negativo e cada vez menor levando assim a potência e− 1 2 (x−µ σ )2 assumir valores cada vez menor, matemáticamente podemos escreve lim x→+∞ f(x) = 1 σ √ 2pi lim x→+∞ e− 1 2 (x−µ σ )2 = 0 e lim x→−∞ f(x) = 1 σ √ 2pi lim x→−∞ e− 1 2 (x−µ σ )2 = 0. Um fato importante que se apresenta é que aos estudarmos os sinais das derivadas primeira e segunda de f(x;µ, σ2) não precisaremos considerar o fator e− 1 2 (x−µ σ )2 , pois , será positivo para qualquer valor de x, sendo assim, não infuenciará no estudo do sinal das funções f ′(x) e f ′′(x). Sendo X ∼ N(µ, σ2) , sua f.d.p é f(x;µ, σ2) = 1 σ √ 2pi e− 1 2 (x−µ σ )2 e sua derivada é dada por f ′(x;µ, σ2) = 1 σ √ 2pi e− 1 2 (x−µ σ )2 .− 1 2 .2( x− µ σ ). 1 σ reescrevendo f ′(x;µ, σ2), temos f ′(x;µ, σ2) = − 1 σ2 √ 2pi .( x− µ σ )e− 1 2 (x−µ σ )2 (1.2) fazendo f ′(x) = 0, temos −x+µ σ = 0⇒ x = µ. Neste caso, temos que para x = µ é um ponto de máximo, pois, para x = µ − σ temos que f ′(x) = 1 σ2 √ 2pi e− 1 2 > 0 e para x = µ+ σ temos que f ′(x) = − 1 σ2 √ 2pi e− 1 2 < 0 e consequentemente a função f(x;µ, σ2) e crescente no intervalo (−∞;µ] e decrescente no intervalo (µ; +∞] . Fazendo a derivada segunda, temos o seguinte resultado f ′′(x) = 1 σ √ 2pi e− 1 2 (x−µ σ )2 . [(−x+ µ σ2 )2 − 1 σ ] que pode ser reescrito assim, f ′′(x) = f(x). [(−x+ µ σ2 )2 − 1 σ2 ] . (1.3) Como f(x) > 0, fazendo f ′′(x) = 0, obtemos ( −x+µ σ2 )2 = 1 σ2 o que implica que ∣∣∣−x+µσ ∣∣∣ = 1σ . Daí x = µ± σ. Para x = µ − 2.σ , temos que f ′′(µ − 2.σ) = 3 σ3 √ 2pi e−2 > 0 , para x = µ + 2.σ , temos que f ′′(µ + 2.σ) = 3 σ3 √ 2pi e−2 > 0 e para x = µ , temos que f ′′(µ) = −1 σ3 √ 2pi < 0. Desses resultados obtidos, temos que, a função f(x;µ, σ2) tem concavidade para cima nos intervalos (−∞;µ− σ] e (µ+ σ; +∞] e concavidade para baixo no intervalo (µ− σ;µ+ σ) . Uma propriedade muito importante do modelo normal, cuja demonstração será omitida, é aquela que garante que qualquer combinação linear de variáveis Normais independentes, também, terá distribuição normal. Em outras palavras, se X1, X2, . . . , Xn formam uma sequência de va- riáveis aleatórias N(µi, σ2i ) independentes e a1, a2, . . . , an, são constantes quaisquer, então W= n∑ i=1 aiXi terá distribuição normal. Seus parâmetros são determinados a partir das propriedades do valor esperado e da variância, ou seja, µw = E( n∑ i=1 aiXi) = n∑ i=1 E(aiXi) = n∑ i=1 aiE(Xi) = n∑ i=1 aiµi σ2w = V ar( n∑ i=1 aiXi) = n∑ i=1 V ar(aiXi) = n∑ i=1 a2iV ar(Xi) = n∑ i=1 a2iσ 2 i este resultado amplia, consideravelmente, o uso da Normal em várias situações. No cálculo de probabilidades para variáveis contínuas, devemos resolver a integral da função densidade, isto é, P (a ≤ X ≤ b) = ∫ b a f(x)dx = ∫ b a 1 σ √ 2pi e− 1 2 (x−µ σ )2dx (1.4) Entretanto, a integral só pode ser resolvida de modo aproximado e por métodos numéricos. Por essa razão utiliza-se uma transformação da Variável aleatória na variável aletória padrão Z de parâmtros (0, 1), isto é, média 0 e variância 1 e as probabilidades para o modelo normal são calculadas com auxílio de tabelas. Considere X ∼ N(µ, σ2) e defina uma nova variável Z= X−µ σ . Pode-se verificar que essa transformação não afeta a normalidade e, assim, a variável aleatória Z terá distribuição N(0, 1) e será denominada de Normal Padrão ou normal reduzida. No caso específico da normal padrão sua função de distribuição acumulada definida como P (Z ≤ z), será denotada utilizamos a seguinte notação universal: Φ(z) = ∫ z −∞ 1√ 2pi e− z2 2 para −∞ < z < Z (1.5) Isto é, F (z) = P (Z ≤ z) = Φ(z) Pelas propriedades do valor esperado e da variância segue que E(Z) = E(X−µ σ ) = 1 σ E(X − µ) = 1 σ [E(X)− µ] = 1 σ [µ− µ] = 0 V ar(Z) = V ar(X−µ σ ) = 1 σ2 V ar(X − µ) = 1 σ2 V ar(X) = 1. Para determinar a probabilidade de X� [a, b], procedendo da seguinte forma: Padroniza-se os valores que variável aleatória X assumi e com auxílio da tabela da distribuição normal padrão acu- mulada, encontraremos a área compreendida entre os valores a e b que é a probabilidade desejada. De modo geral, podemos calcular, como se segue. P (a ≤ X ≤ b) = P (a− µ ≤ X − µ ≤ b+ µ) = P (a−µ σ ≤ X−µ σ ≤ b+µ σ ) = P (a−µ σ ≤ Z ≤ b+µ σ ) = Φ( b+µ σ )− Φ(a+µ σ ). Conclui-se de modo geral que, calcular probabilidade de uma variável aleatória contínua X com dada distribuição de assumir valor em um intervalo qualquer, resume em um cálculo de área. Consideremos o intervalo ( µ−kσ;µ+k.σ), para todo x pertencente a este intervalo a desigual- dade se verifica ∣∣X − µ∣∣ ≤ k.σ , isto é, ∣∣X − µ∣∣ ≤ k.σ ⇔ −k.σ ≤ X − µ ≤ k.σ . logo calculemos a probabilidade de P ( ∣∣X − µ∣∣ ≤ k.σ) = P (−k.σ ≤ X − µ ≤ k.σ) = P(µ− kσ ≤ X ≤ µ+ k.σ) como X ∼ N(µ, σ2) , padronizando a variável aletória X , ou seja fazendo a transformação linear Z = X − µ σ , obteremos a variável normal padrão Z , em que sua distribuição é assim Z ∼ N(0; 1).Daí P (µ− kσ ≤ X ≤ µ+ kσ) = P(µ− kσ − µ σ ≤ X − µ σ ≤ µ+ kσ − µ σ ) = P (−k ≤ Z ≤ k) = Φ(k)− Φ(−k) = Φ(k)− [1− Φ(k)] = 2.Φ(k)− 1 Portanto, conclui-se que para qualquer intervalo simétrico em que X ∼ N(µ, σ2), é sempre verdade que P ( ∣∣X − µ∣∣ ≤ k.σ) = 2.Φ(k)− 1 Para k = 1, temos que P ( ∣∣X − µ∣∣ ≤ σ) = 2.Φ(1,00)− 1 = 68,26% podemos concluir, que sendo X uma variável aleatória com distribuição normal com média µ e variância σ2, a probabilidade de encontrarmos um valor de X no intervalo delimitado pelos pontos de inflexão é de 68,26% , deixando claro o grau de concentração das observações em torno da média. Para k = 2, temos que P ( ∣∣X − µ∣∣ ≤ σ) = 2.Φ(2,00)− 1 = 95,45% podemos concluir, que sendo X uma variável aleatória com distribuição normal com média µ e variância σ2, a probabilidade de encontrarmos um valor deX no intervalo delimitado pelo intervalo( µ − 2.σ;µ + 2.σ) é de 95,45% de chance, sendo quase a totalidade dos valores observados de variável aleatória X encontrase no intervalo que vai de ( µ− 2.σ) a (µ+ 2.σ). Para k = 3, temos que P ( ∣∣X − µ∣∣ ≤ σ) = 2.Φ(3,00)− 1 = 99,73% Conclui-se que existe uma pequena probabilidade de encontrar um valor fora do intervalo de( µ − 3.σ;µ + 3.σ), ou seja, se X uma variável aleatória com distribuição normal com média µ e variância σ2 constitui-se um evento raro encontrar um valor de X fora deste intervalo determinado, a saber a probabilidade é P ( ∣∣X − µ∣∣ ≥ 3σ) = 1− P (∣∣X − µ∣∣ ≤ σ) = 1− 0,9973 = 0,7.% Sendo X uma variável aleatória qualquer, média µ e variância σ2, para k > 1 é sempre verdade que P (∣∣X − µ∣∣ ≥ kσ) ≤ 1 k2 . (1.6) Esta expressão é conhecida pelo nome de Desigualdade de Chebyshev. A desigualdade indica que a probabilidade que X tome algúm valor fora do intervalo ( µ− k.σ;µ+ k.σ) é não mais que 1 k2 . Veja que podemos reescrevê-la de várias maneiras e também interpretá-la de várias formas: i) Como o complementar da inequação acima, isto é, P (∣∣X − µ∣∣ < kσ) ≥ 1− 1 k2 . (1.7) Sendo {∣∣X − µ∣∣ ≥ k.σ} {∣∣X − µ∣∣ < k.σ} eventos complementares, então 1 − 1 k2 indica a probabilidade de que X tome valores dentro do intervalo ( µ− k.σ;µ+ k.σ). ii) fazendo ε = k.σ, em que ε representa o erro máximo permitido entre X e µ.Temos que k = ε σ e 1 k2 = σ2 ε2 . Logo a Desigualdade de Chebyshev, pode ser expressa como P (∣∣X − µ∣∣ ≥ ε) ≤ σ2 ε2 . (1.8) ou P (∣∣X − µ∣∣ < ε) ≥ 1− σ2 ε2 . (1.9) Assim como várias maneiras de escrever a desigualdade de Chebyshev, temos várias maneiras de interpretar. Exemplo1 - SeX é uma variável aleatória com média 33 e variância 16. Obter uma cota inferior para P [ 23 < X < 43 ] . Exemplo2 - Seja Sn o número de caras obtidos em 1000 lançamentos sucessivos de uma moeda viciada ( P [cara] = 0.25 ) . Estabeça uma cota superior para a probabilidade de 225 ≤ Sn ≤ 275 , utilizando a desigualdade de Chebyshev. Exemplo3 - Suponha que 30% dos estudantes de uma escola sejam mulheres. Colhemos uma AAS de tamanho 10 estudantes e calculamos p̂ e a proporção de mulheres na amostra. Qual a probabilidade de que p̂ difira de p em menos de 0,001? Exemplo 4 - suponha que numa pesquisa de mercado estima-se que no máximo 60% das pes- soas entrevistadas preferirão a marca A de um produto. Essa informação é baseada em pesquisas anteriores. se quizermos que o erro amostral de p̂ seja menor do que ε = 0,03 com probabilidade γ = 0,95, teremos n= 1024. EXERCÍCIOS Questão 1: Determine o que se pede: a) O primeiro quartil da variável aleatória X, em que X tem distribuição N(100; 49); b) Z0 tal que : P(Z > Z0) = 0,65; c) Z0 tal que : P(Z < Z0 ) = 0,80; d) P(−1,57 ≤ Z ≤ 2,42). e) Md de uma N(30; 40); f) Q3 de uma N(78; 121). Questão 2: Para X∼N(100 ; 100), calcule: a) P(X < 115); ( Resp. 0,9332) b) P(X > 80); ( Resp. 0,9772) c) P (|X − 100| ≤ 10); ( Resp. 0,6826) d) O valor a, tal que P (100− a ≤ X ≤ 100 + a) = 0,95; ( Resp. a = 19,6) Questão 3: Suponha que as notas de uma prova sejam normalmente distribuídas com média 73 e desvio padrão 15. 15% dos alunos mais adiantados recebem a nota A e 12% mais atrasados re- cebem nota F. Encontre o mínimo para receber A e o mínimo para para passar, não receber F. Questão 4: Em uma distribuição normal, 28% dos elementos são superiores a 34 e 12% inferiores a 19. Encontrar a média e a variância da distribuição. Questão 5: Uma clinica de emagrecimento recebe pacientes adultos com peso seguindo uma dis- tribuição Normal de média 130 kg e desvio padrão 20 kg. Para efeito de determinar o tratamento mais adequado, os 25% pacientes de menor peso são classificados de “magros”, enquanto os 25% de maior peso de “obesos”. Determine os valores que delimitam cada uma dessas classificações. Questão 6: Seja X uma função tal que X = X1 +X2 +X3 e as variáveis Xi , com i = 1, 2 e 3 são independentes com as seguintes distribuições: X1 ∼ N(10; 9); X2 ∼ N(−2; 4); X3 ∼ N(5; 25). Determine: a) a distribuição da v.a. X; b) P(X1 +X2 +X3 > 13); c) P ( X1+X2+X3 3 < 13. ) Questão 7: SendoX1, X2 eX3 variáveis aleatórias independentes, seguindo o modelo Bernoulli de parâmetro p, pergunta-se: a) Qual é a função de probabilidade de X = X1 +X2 +X3? Você reconhece essa variável? b) Qual é a E ( X1+X2+X3 3 ) e a Var ( X1+X2+X3 3 ) ? Questão 8: Estudo do sindicato dos Bancários indica que cerca de 30% dos funcionários de banco têm problemas de estresse, proveniente das condições de trabalho. Numa amostra de 200 bancários, qual seria a probabilidade de pelo menos 50 com essa doença? Questão 9: Uma corretora negocia títulos na Bolsa de Valores e utiliza um modelo probabilístico para avaliar seus lucros. Suas aplicações financeiras de compra e venda atingem três áreas: agri- cultura, indústria e comércio. Admita que o seguinte modelo representa o comportamento do lucro diário da corretora (em milhares de reais). L = 2.LA + 5.LI + 3.Lc, com LA, LI , LC representando, respectivamente, os lucros diários nos setores de agricultura, indús- tria e comércio. As distribuições de probabilidade dessas variáveis aleatórias são LA ∼ N(3; 4), LI ∼ N(6; 9) e LC ∼ N(4; 16). Supondo indepedência entre os setores, qual será a probabilidade de um lucro diário acima de 50 mil? (Resp. P(L > 50) = 46,02 %) Questão 10: Para uma Normal (5; 10) coletou-se uma amostra de tamanho 25. Calcule: a) P(X ≤ 4,8); ( Resp. 0,3745 ) b) P(4,5 ≤ X ≤ 5,3); ( Resp. 0,466 ) c) P(X ≤ 4,7 ou X ≥ 5,1) ( Resp. 0,7556 ). Questão 11: A máquina de empacotar um determinado produto o faz segundo uma distribuição normal, com média µ de desvio padrão 10 g. a) Em quanto deve ser regulado o peso médio µ para que apenas 10% dos pacotes tenham menos do que 500 g? ( Resp. µ = 512,9 g) b) Com a máquina assim regulada, qual a probabilidade de que o peso total de 4 pacotes escolhidos ao acaso seja inferior a 2 kg? (Resp. 0,494%) Questão 12: As alturas de 10.000 alunos de um colégio tem distribuição aproximadamente normal, com média 170 cm e desvio padrão 5 cm. a) Qual o número esperado de alunos com altura superior a 165 cm? (Resp. 8.413) b) Qual o intervalo simétrico em torno da média que conterá 75% das alturas dos alunos? (Resp. [164,25 ; 175,75]) Questão 13: Para X∼ N(µ;σ2), calcule: a) P (X ≤ µ+ 2.σ); ( Resp. 0,977) b) P (|X − µ| ≤ σ); ( Resp. 0,68) c) o número a tal que P (µ− aσ ≤ X ≤ µ+ aσ) = 0,99 ( Resp. a = 2,58) d) o número b tal que P(X > b)= 0,90. ( Resp. b = µ− 1,29.σ) Questão 14: SendoX1, X2, . . . , Xn variáveis aleatórias independentes, seguindo o modelo Bernoulli de parâmetro p, pergunta-se: a) Qual é a função de probabilidade da variável aleatória X1 +X2 + . . .+Xn? b) Qual é a E(X1+X2+...+Xn n ) e a Var(X1+X2+...+Xn n )?
Compartilhar