Baixe o app para aproveitar ainda mais
Prévia do material em texto
Distribuição Gaussiana Modelo Probabilístico para Variáveis Contínuas Distribuição de Frequências do Peso, em gramas, de 10000 recém-nascidos frequência relativadensidade tamanho da classe = Peso ao nascer F r e q u e n c i a 1000 2000 3000 4000 5000 0 5 0 0 1 0 0 0 1 5 0 0 2 0 0 0 2 5 0 0 3 0 0 0 3 5 0 0 Histograma de Densidade Peso ao nascer D e n s i d a d e 1000 2000 3000 4000 5000 0 e + 0 0 2 e - 0 4 4 e - 0 4 6 e - 0 4 8 e - 0 4 P[2500 < X < 3500] = àrea da barra =densidade x largura da barra soma das àreas das barras entre 2500 e 3500 g. àrea da barra =probabilidade de X estar entre os limites da barra Histograma de Densidade Peso ao nascer D e n s i d a d e 1000 2000 3000 4000 5000 0 e + 0 0 2 e - 0 4 4 e - 0 4 6 e - 0 4 8 e - 0 4 àrea da barra =probabilidade de X estar entre os limites da barra soma das àreas das barras entre 1000 e 2125P[X < 2125] = Muitas vezes, as barras do histograma podem ser aproximadas por uma curva mais suave … mais classes Essa curva suave é chamada função de densidade de X, ou f(x) f(x) Como calcular probabilidades usando f(x) ? a b P[a < X < b ] P[a < X < b ] é a área abaixo da curva f(x) entre a e b Propriedades de f(x) 1) f(x) ≥ 0 2) A área abaixo de toda a curva f(x) é igual a 1. P[X=a] = 0 � P[X < b] = P[X ≤ b] Como X é uma variável aleatória contínua, então Algumas variáveis contínuas exibem um comportamento muito particular quando visualizamos a distribuição de frequências de seus valores. • Concentração de valores em torno de um valor central; • Simetria em torno do valor central; • Frequência pequena de valores muito extremos. F r e q u ê n c i a Valores O Modelo Probabilístico Gaussiano (ou Normal) O Modelo Probabilístico Gaussiano O matemático alemão Karl Gauss popularizou um modelo proposto para a distribuição de probabilidades de variáveis do tipo descrito anteriormente. A curva descrita por este modelo é conhecida como Curva de Gauss (ou também como Curva Normal) O Modelo Probabilístico Gaussiano 21 21( ) , 2 x f x xe µ σ piσ − − = −∞ < < ∞ A função de densidade de X só depende de dois valores: a média µ e o desvio-padrão σ π e e são constantes conhecidas (π ≈ 3,14159… e e ≈ 2.71828…) A média µ de uma variável aleatória X que siga o modelo Gaussiano pode assumir qualquer valor na reta real O Modelo Probabilístico Gaussiano µ−∞ < < ∞ O desvio-padrão σ de qualquer variável aleatória X só pode assumir valores maiores do que zero 0σ > µ e σ são os parâmetros do Modelo Gaussiano Dizemos que X ~ Normal (µ,σ) A curva gaussiana (ou curva Normal) é definida pela média µµµµ e pelo desvio-padrão σ.σ.σ.σ. O Modelo Probabilístico Gaussiano O parâmetro µ informa onde está centrada a curva gaussiana A forma do sino (mais “achatado” ou mais “alongado”) é dada pelo valor do desvio-padrão σ Para cada combinação de µ e σ, existe uma curva gaussiana diferente A curva gaussiana tem a forma de um sino e é simétrica em torno da média µ; Simetria a a P(X < 3000-a ) = P(X > 3000+a ) 3000 + a3000 - a Propriedades da Distribuição Normal Área fixa entre intervalos simétricos Probabilidade de X estar entre x1 e x2: P( x1 < X < x2 ) Cálculo de Probabilidade na Curva Normal Considere uma variável aleatória X com distribuição Normal (µ,σ). Ou seja, X ~ Normal(µ,σ) P( x1 < X < x2 )P( x1 < X < x2 ) Área sob a curva Normal entre x1 e x2. Cálculo de Probabilidade na Curva Normal P( x1 < X < x2 ) curvas Normais diferentes � áreas diferentes Exemplo: Suponha que X é o peso de bebês ao nascer e que, em certa população, X tem distribuição de probabilidade que pode ser aproximada pela Normal com µ = 3000g e σ = 1000g. Qual é a porcentagem de bebês que nascem com peso abaixo de 1500g ? A Distribuição Normal Padrão Z ~ Normal (µ=0 ; σ=1) Como existem infinitas combinações dos valores para µ e σ, seria inviável tabelar as probabilidades de todas as distribuições Normais possíveis. As probabilidades na curva Normal são calculadas com o auxílio de uma tabela. Sendo assim, uma única variável Normal possui suas probabilidades tabeladas: a variável Z com média igual a 0 e desvio-padrão igual a 1. A variável aleatória Normal com média µ=0 e desvio-padrão σ=1 é chamada de Variável Normal Padrão Z ~ N(0,1) P( Z < z ) a variável aleatória Z tem distribuição de probabilidade Normal com média=0 e d.p.=1 A Tabela Normal Padrão (Tabela Z) Parte Negativa P( Z < -0.83 ) -0.83 Coluna: Segunda casa decimal de z Linha: Parte inteira e primeira casa decimal de z -2.9 -0.8 0.0019 0.0018 0.0017 0.0017 0.2119 0.2090 0.2061 0.2033 P( Z < 1.5 ) Coluna: Segunda casa decimal de z Linha: Parte inteira e primeira casa decimal de z A Tabela Normal Padrão (Tabela Z) Parte Positiva Exemplo: Seja Z uma v.a. normal padronizada. Calcule: P( Z < -1.97) = ? P( Z > 1.84) = ? P( Z < -1.97 ) = 0.0244, obtida direto da tabela. P( Z >1.84) = P( Z < -1.84) = 0.0329, obtida direto da tabela e por simetria. P( -1.97 < Z < 0.86 ) = P( Z < 0.86 ) - P( Z < -1.97 ) = 0.8051 - 0.0244 = 0.7807 = - Cálculo de percentis na curva Normal Percentil de ordem 2.5 Que valor de Z na tabela Normal Padrão deixa uma área de 0.0250 abaixo dele ? 0.0250 a=-1.96 Ou seja, quem é a tal que P[Z < a ]=0.0250 ? a é o percentil 2.5 da curva Normal Padrão Cálculo de percentis na curva Normal Percentil de ordem 97.5 Que valor de Z na tabela Normal Padrão deixa uma área de 0.9750 abaixo dele ? Ou seja, quem é b tal que P[Z < b ]=0.9750 ? b é o percentil 97.5 da curva Normal Padrão 0.9750 b=1.96 0.0250b é o simétrico de a em relação à média da curva Normal Cálculo de percentis na curva Normal P[Z < b ]=0.9500 b é o percentil 95 da curva Normal Padrão b=1.645 Percentil de ordem 95 Na tabela Z: z = 1.65 � área abaixo = 0.9505 z = 1.64 � área abaixo = 0.9495 Escolher o valor mais próximo da probabilidade desejada. Cálculo de percentis na curva Normal P[-b < Z < b ]=0.9800 P[Z< -b ] =0.0100 -b = ? Percentil de ordem 1 P[Z < b ]=0.0100 b é o percentil 1 da curva Normal Padrão Na tabela Z: z = -2.33 � área abaixo = 0.0099 z = -2.32 � área abaixo = 0.0102 b=2.33-b=2.33 0.0100 0.0100 0.9800 Usar o valor de z que forneça a área mais próxima do desejada (-2.33) Como usar a tabela Normal Padrão para calcular probabilidades em uma curva Normal qualquer? Z ~ Normal (µ=0 ; σ=1) X ~ Normal (µ=10 ; σ=2) Distribuição de Distribuição de Podemos transformar uma variável aleatória X ~ Normal ( µ , σ ) em uma variável aleatória Z ~ Normal ( 0, 1) usando a expressão: XZ µ σ − = Padronização de uma variável aleatória Normal X ~ Normal (µ ,σ ) Z ~ Normal (0,1) 1 1 x z µ σ − = 2 2 x z µ σ − = Calculando probabilidades de X utilizandoa tabela Z [ 9]P X < = 9XP µ µ σ σ − − < = 10 9 10 2 2 XP − − < [ 0.5] 0.3085P Z= < − = [ 13]P X > = 10 13 10[ ]2 2 XP − −> = [ 1.5]P Z > [ 1.5] 0.0668P Z= < − = Exemplo 1: Se X tem distribuição Normal com µ = 40 e σ = 6, encontre o valor de x tal que P[X < x] =0.45. então P( Z < (x-40)/6 ) = 0.45. Mas P( Z < -0.13 ) = 0.45 (da tabela); Se P[X < x] =0.45. Logo (x-40)/6 = -0.13 ���� x = 40 + (-0.13)6 = 40 - 0.78 = 39.22. Ou seja, 39.22 é o percentil 45 da distribuição de X. então P( Z < (x-40)/6 ) = 0.86. Mas P( Z > 1.08) = P( Z < -1.08) = 0.14 (da tabela); Se P[X < x] = 0.86 Logo (x-40)/6 = 1.08 ���� x = 40 + (1.08)6 = 46.48 Ou seja, 46.48 é o percentil 86 da distribuição de X. Exemplo 2: Se X tem distribuição Normal com µ = 40 e σ = 6, encontre o valor de x tal que P[X > x] =0.14. Cálculo do Percentil de ordem 100α da distribuição Normal 100 (1 )P zα αµ σ−= + ⋅ α z(1-α) 1-α onde α é a ordem do percentil (0 < α < 1) e z(1-α) é o valor na tabela Z que deixa uma área de (1-α) acima dele. 45 (1 0.4500) (0.5500) 0.45 40 6 40 6 40 0.13 6 P z z α − = = + × = + × = − × 86 (1 0.8600) (0.1400) 0.86 40 6 40 6 40 1.08 6 P z z α − = = + × = + × = + × Conferindo os dois exemplos anteriores, onde µ = 40 e σ= 6 : Cálculo do Percentil de ordem 100α da distribuição Normal Exemplo Inicial: Suponha que X é o peso de bebês ao nascer e que, em certa população, X tem distribuição que pode ser aproximada pela Normal com µ = 3000g e σ = 1000g. Qual é a porcentagem de bebês que nascem com peso abaixo de 1500g ? [ ] 3000 1500 3000[ 1500] 1000 1000 1.5 0.0068 XP X P P Z − − < = < = < − = 0.68% dos bebês têm peso inferior a 1500g. Qual é a porcentagem de bebês que nascem com peso acima de 4000g ? [ ] [ ] 4000 3000[ 4000] 1000 1.0 1.0 0.1587 P X P Z P Z P Z − > = > = > = < − = [2500 3500] [ 3500] [ 2500]P X P X P X< < = < − < Qual é a porcentagem de bebês que nascem com peso entre 2500 e 3500g ? 3500 3000 2500 3000 1000 1000 P Z P Z− − = < − < [ ] [ ] 0.5 0.5P Z P Z= < − < − 0.6915 0.3085 0.3830= − = 38.30% dos bebês Qual valor de peso dos bebês separa os 10% mais leves? 1720 gramas 10 (1 0.1000) (0.9000) 0.10 3000 1000 3000 1000 3000 ( 1.28) 1000 3000 1280 1720 P z z α − = = + × = + × = + − × = − = 0.10 P10 3000 Qual valor de peso dos bebês separa os 10% mais pesados? 4280 gramas 10 (1 0.9000) (0.1000) 0.90 3000 1000 3000 1000 3000 1.28 1000 3000 1280 4280 P z z α − = = + × = + × = + × = + = 0.10 P903000 Aplicações do Modelo Gaussiano: Cálculo de Faixas de Referência Faixas de Referência são formadas por dois percentis Exemplo: uma faixa de referência de 90% é formada pelos percentis 5 e 95 P95P5 5% 5% 90% Cálculo de Faixas de Referência utilizando o modelo Gaussiano Seja X a variável aleatória que representa a característica para a qual queremos construir uma faixa de referência. Exemplo: X é o peso de recém-nascidos Se X ~ Normal (µ,σ), então uma faixa de referência de (1-α)100% é formada pelos percentis P(α/2)100 e P(1-α/2)100 Exemplo: uma faixa de referência de 90% (α=0.10) é formada pelos percentis P5 e P95 Cálculo de Faixas de Referência utilizando o modelo Gaussiano No exemplo do peso dos recém-nascidos (X), se pudermos supor que X ~ Normal (µ=3000 ; σ=1000), uma faixa de referência de 80% seria dada pelos percentis P10= 1720 e P90 = 4280 (já calculados anteriormente) Faixa de Referência de 80% para o peso de recém-nascidos 1720 gramas a 4280 gramas Cálculo de Faixas de Referência utilizando o modelo Gaussiano Relembrando o cálculo de percentis com o modelo gaussiano e a definição de faixa de referência, uma faixa de referência de (1-α)100% é dada pela expressão (1 / 2) ( / 2)[ ; ]z zα αµ σ µ σ−+ ⋅ + ⋅ ( / 2) ( / 2)[ ; ]z zα αµ σ µ σ− ⋅ + ⋅ (1 / 2) ( / 2) (por simetria) z zα α− = − Para aprender (I)… Para o exemplo do peso dos recém-nascidos, calcule as seguintes faixas de referência: � 90% � 95% Antes de calcular essas faixas, responda: qual delas você espera que seja a mais larga? Justifique. Para aprender (II)… Exercícios da Seção 7 (Modelo Probabilístico Gaussiano)
Compartilhar