Baixe o app para aproveitar ainda mais
Prévia do material em texto
Distribuições Contínuas de Probabilidade Introdução Uma variável aleatória contínua é aquela que pode apresentar qualquer valor numérico real em determinado intervalo. Conseqüentemente, entre dois valores quaisquer a e b ( a≠b ), assumidos pela variável aleatória contínua, existe um número infinito de valores. Exemplos de variáveis aleatórias contínuas: 1. A altura H acima do solo onde um dardo atinge o painel; 2. O tempo de duração de uma lâmpada; 3. O tempo de vida de uma pessoa. A distribuição de probabilidade de uma variável aleatória contínua é denominada distribuição contínua de probabilidade. Contudo, não é possível definir uma função de probabilidade para uma variável aleatória contínua do mesmo modo como foi feito para uma variável aleatória discreta. O exemplo esclarece este fato. Exemplo: o ponteiro dos segundos de um relógio pode parar a qualquer instante por defeito técnico. Seja X a variável aleatória que denota o ângulo (em graus) do ponteiro ao parar. 180o 0o 90o270o X 1O Caso – Variável X discreta O relógio é mecânico e o ponteiro dá um “salto” a cada segundo. Neste caso, a variável aleatória X assume valores discretos e a função de probabilidade P(X) é constante (distribuição uniforme): X P(X) 0o 1/60 6o 1/60 12o 1/60 ... ... 354o 1/60 2O Caso – Variável X contínua O relógio é elétrico e o ponteiro dos segundos move-se continuamente. Neste caso, a variável aleatória X é contínua, assumindo qualquer valor real no intervalo [0o,360o) : X={x∈ℝ∣0ox360o} Como X pode assumir infinitos valores no intervalo dado, a probabilidade de que X seja igual a um certo valor específico x 0 pertencente ao mesmo é nula: P x 0=0 . Esta é uma propriedade que vale de modo geral: Para uma variável aleatória contínua X, a probabilidade em um ponto específico é sempre nula, mas a probabilidade de que X pertença a algum intervalo de tamanho arbitrário pode ser não nula. No presente exemplo do relógio elétrico, é fácil concluir que a probabilidade é proporcional à largura do intervalo, P axb=b−a 360 para a e b ( ab ) pertencentes ao intervalo [0o ,360o ) . Assim, por exemplo, A probabilidade de qualquer variável aleatória contínua ser igual a algum valor específico é zero. P 120x150=150−120 360 = 1 12 Note também que, se a variável aleatória for contínua, então P axb=P axb=P axb=P axb Para um pequeno intervalo [ x , x x ] , podemos sempre calcular a probabilidade de o ponteiro parar num ponto do mesmo, por menor que seja o intervalo: P xXx x= x 360 É importante observar que a letra X (maiúscula) denota a variável aleatória, enquanto a letra x (minúscula) denota algum valor específico que a variável aleatória pode assumir. No limite em que x0 , a probabilidade se anula ( P X=x0 ), mas a função densidade de probabilidade definida como f x = lim x0 P xXx x x pode ser calculada em um ponto específico x e resultar em um valor não nulo. Neste exemplo do relógio elétrico, em particular, obtém-se uma densidade de probabilidade constante (distribuição uniforme), f x = 1 360 . Em geral, contudo, a densidade de probabilidade pode depender de x. Função Densidade de Probabilidade Um histograma é um gráfico de barras contíguas que representa as densidades de freqüências relativas correspondentes a classes de valores de uma variável aleatória X. A figura a seguir ilustra, como exemplo, o histograma da precipitação mensal média em mm (x) de várias cidades norte-americanas (retângulos em amarelo). A probabilidade P xXx x de que a precipitação mensal X esteja em uma dada classe de valores [ x , x x ] é dada pela área do retângulo correspondente. A soma das áreas de todos os retângulos do histograma é, portanto, igual a 1. Para uma variável aleatória contínua X, o histograma é apenas uma representação aproximada da função densidade de probabilidade f(x). Contudo, a aproximação melhora conforme tornamos os retângulos cada vez mais estreitos, o que significa fazer a largura de cada classe tender a zero x0 . No limite x0 , o histograma passa a ser representado por uma curva suave, definida pela função densidade de probabilidade f(x) como: f x= lim x0 P xXx x x . Na figura, a curva contínua é um modelo teórico para a função densidade de probabilidade f(x) da precipitação média mensal x das cidades norte-americanas; o modelo foi construído a partir do histograma que, por sua vez, baseia-se em dados empíricos. Analogamente, a área sob a curva f(x) deve ser igual a 1; e a probabilidade P x 1Xx2 de que a precipitação esteja no intervalo [ x1 , x2] é dada pela área abaixo da curva f(x) no intervalo considerado. Uma função f(x) ( f x 0 ) é uma função densidade de probabilidade para uma variável aleatória X se satisfizer à propriedade de que a área sob a curva y=f(x) (acima do eixo x) no intervalo [ x1 , x2] é igual à probabilidade P x 1Xx2 . Outrossim, a área total sob a curva y=f(x) (no intervalo −∞ ,∞ ) deve ser igual a 1. O cálculo da área sob uma curva envolve uma técnica matemática conhecida como integração. Entretanto, nem sempre é possível obter uma fórmula analítica para o cálculo destas áreas, tornando-se necessário o uso de tabelas numéricas em determinados modelos de densidade de probabilidade. Densidade de Probabilidade: f x f x0 P x 1Xx2 = [ Área sob f xno intervalo [ x1 , x 2]] = ∫x 1x 2 f x dx P −∞X ∞ = [ Área total sob f x no intervalo [−∞ ,∞]] = ∫−∞∞ f x dx = 1 Valor Esperado, Variância e Desvio-Padrão O valor esperado E(X) e variância Var(X) de uma uma variável aleatória contínua X são calculados como: ∫+ ∞ ∞− = dxxfxXE )()( ; [ ] [ ] 222 )()()()()( XEXEdxxfXExXVar −=−= ∫+ ∞ ∞− , em que ∫+ ∞ ∞− = dxxfxXE )()( 22 . O desvio-padrão é simplesmente DP X =Var X O Modelo Uniforme É possível construir modelos teóricos para variáveis aleatórias contínuas, escolhendo adequadamente as funções densidade de probabilidade. Teoricamente, qualquer função f, que seja não negativa e cuja área total sob a curva seja igual à unidade pode ser considerada uma densidade de probabilidade para uma variável aleatória contínua. O modelo mais simples para uma variável aleatória contínua é o modelo uniforme. Uma variável aleatória contínua X tem distribuição uniforme com parâmetros a e b se sua função densidade de probabilidade for dada por f x = 1 b−a , se axb ; f x = 0 , caso contrário . O valor esperado e a variância de uma variável aleatória com distribuição uniforme (com parâmetros a e b) são dados por E X =ab 2 ; Var X =b−a 2 12 Exemplo: O ponteiro dos segundos de um relógio elétrico move-se continuamente e pode parar a qualquer momento por defeito técnico, formando um ângulo X. Este problema já foi tratado na seção introdutória; a variável aleatória X tem distribuição uniforme com parâmetros a = 0o e b = 360o: f x= 1 360 , se 0 ox360o ; f x = 0 , caso contrário . Portanto, ao parar, o ponteiro forma um ângulo X igual a, em média, E X =180o , com variância igual a Var X =10800 e desvio-padrão DP X ≈103,9o . ba 1/(b-a) f(x) x O Modelo Normal A mais importante distribuição contínua de probabilidade em estatística é a distribuição normal. A fórmula matemáticapara o modelo normal foi primeiramente publicada por Abraham De Moivre (1667-1754) em 1733. Muitos outros matemáticos figuram com proeminência na história da distribuição normal, incluindo Pierre Simon Laplace (1749-1827) e Carl Friedrich Gauss (1777-1855). Por tais razões, a distribuição é freqüentemente denominada distribuição de Gauss (Gaussiana) ou distribuição de Laplace-Gauss. Inúmeras variáveis contínuas que descrevem fenômenos naturais e sociais apresentam distribuições de probabilidade próximas do modelo normal. O nome normal deve-se ao fato de que muitas distribuições de freqüências de erros de observações e mensurações podem ser descritas por este modelo. Além de sua utilidade prática, a distribuição de Gauss constitui a base teórica de toda inferência estatística. Densidade de Probabilidade Uma variável aleatória contínua X tem distribuição normal com parâmetros μ (média) e σ2 (variância) se sua função densidade de probabilidade for dada por f x = 1 2 e −x−2 22 em que e=2,71828 , =3,14159 . Uma distribuição normal pode ter qualquer média μ e qualquer desvio-padrão σ positivo. Estes dois parâmetros determinam completamente a distribuição. Utiliza-se a seguinte notação compacta para caracterizar uma variável aleatória X com distribuição normal com média μ e variância σ2 : X : N ,2 Gráfico O gráfico da densidade de probabilidade f(x) de um modelo normal é uma curva em forma de sino, conhecido como curva normal (ver figura). Propriedades 1. A curva normal tem formato de de sino e é simétrica em torno da média. 2. A área total sob f(x) é igual a 1, como em toda distribuição contínua de probabilidade. 3. A média, a mediana e a moda são iguais. 4. A curva normal tende a tangenciar o eixo x à medida que se afasta da média em ambos os lados: f x 0 se x±∞ . 5. Os pontos x=− e x= são pontos de inflexão (nos quais a curva muda sua curvatura para cima ou para baixo). 6. O ponto de máximo ocorre em x= e o valor máximo é f =1 /2 . Parâmetros μ e σ Cada par de parâmetros μ e σ determina uma particular curva normal. Diferentes valores de μ deslocam a curva normal ao longo do eixo x para a direita (se μ aumenta) ou para a esquerda (se μ diminui). O valor de σ determina o grau de achatamento do gráfico: conforme σ aumenta, o valor máximo diminui e a curva normal fica cada vez mais achatada. A figura abaixo ilustra estes fatos. Distribuição Normal Padrão Como cada par de parâmetros μ e σ especifica uma particular curva normal, existem infinitas distribuições normais, cada qual com sua própria média e desvio- padrão. O membro mais importante desta família de distribuições é a distribuição normal padrão (ou unitária) que tem média μ = 0 e desvio-padrão unitário σ = 1. Uma variável aleatória Z com distribuição normal padrão é denotada como Z : N 0,1 e tem função densidade de probabilidade dada por f z = 1 2 e−z 2/2 . Transformação para a Distribuição Normal Padrão Se uma variável aleatória X tem distribuição normal com média μ e variância σ2 (ou seja, X : N , 2 ), então a transformação Z = X− define uma variável aleatória Z com distribuição normal padrão ( Z : N 0,1 ). A figura ilustra a transformação de uma distribuição normal com média μ=-2 e variância σ2=0.5 em uma distribuição normal padrão. Cálculo de Probabilidades A probabilidade de uma variável X normalmente distribuída tomar um valor entre dois pontos quaisquer a e b é igual à área sob a curva normal compreendida entre estes dois pontos (ver figura). O valor numérico desta área é o resultado da integral de f(x) entre a e b, isto é P aXb=∫a b f xdx em que f x é a densidade de probabilidade da variável aleatória X : N , 2 . Esta integração não pode ser calculada analiticamente e deve ser computada por métodos numéricos. Existem tabelas numéricas que fornecem valores de áreas sob a curva normal padrão. Na prática, se X : N , 2 , a probabilidade P aXb é calculada identificando-a primeiramente com uma área equivalente sob a distribuição normal padrão, conforme mostrado abaixo: P a X b = P a− X− b− = P z1 Z z2 ; z1= a− ; z 2= b− . Em seguida, utiliza-se a tabela da distribuição normal padrão (ver adiante) para a determinação da probabilidade P z1 Z z 2 . Exemplo: Considere a variável normalmente distribuída X : N =−2 , 2=0,5 . A probabilidade P −2X−1 pode ser identificada com a área sob a curva normal padrão entre z1=0 e z2=2≈1,41 (ver figura): P −2 X −1 = P−2−−21/2 X− −1−−21 /2 = P 0 Z 1,41 Uso da Tabela da Distribuição Normal Padrão A tabela da Distribuição Normal Padrão (em anexo) fornece a probabilidade P 0Zz c de que a variável Z esteja entre 0 e um valor crítico zc . Como exemplo de uso da tabela, obteremos a probabilidade P(0<Z<1,41), que corresponde a uma das áreas hachuradas na figura anterior. Um trecho da tabela é apresentado a seguir. A célula correspondente à intersecção da linha indicada por 1,40 com a coluna indicada por 0,01 fornece a probabilidade P 0Z zc , para zc=1,400,01=1,41 . Logo: P 0Z1,41=0,42073 Zc 0,00 0,01 0,02 ... 0,00 0,00000 0,00399 0,00798 ... 0,10 0,03983 0,04380 0,04776 ... 0,20 0,07926 0,08317 0,08706 ... 0,30 0,11791 0,12172 0,12552 ... 0,40 0,15542 0,15910 0,16276 ... 0,50 0,19146 0,19497 0,19847 ... 0,60 0,22575 0,22907 0,23237 ... 0,70 0,25804 0,26115 0,26424 ... 0,80 0,28814 0,29103 0,29389 ... 0,90 0,31594 0,31859 0,32121 ... 1,00 0,34134 0,34375 0,34614 ... 1,10 0,36433 0,36650 0,36864 ... 1,20 0,38493 0,38686 0,38877 ... 1,30 0,40320 0,40490 0,40658 ... 1,40 0,41924 0,42073 0,42220 ... 1,50 0,43319 0,43448 0,43574 ... ... ... ... ... ... O fato de que a área total sob a curva é unitária e as propriedades de simetria da distribuição são utilizados para relacionar probabilidades não obtidas diretamente da tabela com os valores tabelados. Exemplos: 1. P Z0=P Z0 =0,5 2. P −1,12Z0=P 0Z1,12=0,36864 3. P Z1,12=0,5−P 0Z1,12=0,5−0,36864=0,13136 4. P 0,47Z1,73=P0Z1,73−P 0Z0,47=0,4582−0,1808=0,2774 5. P −0,47Z1,73=P 0Z0,47P 0Z1,73=0,18080,4582=0,6390 Ilustração: Área hachurada = P 0,47Z1,73=0,2774 Problema envolvendo Distribuição Normal Um levantamento indica que tempo X gasto para fazer compras em um supermercado é uma variável normalmente distribuída com média =45 minutos e desvio padrão =12 minutos. Calcule a probabilidade de que um comprador fique no supermercado entre 24 minutos e 54 minutos. X : N =45, 2=122 P 24 X 54 = P 24−4512 X −4512 54−4512 = P −1,75 Z 0,75 = P 0Z1,75P 0Z0,75 = 0,459940,27337=0,73331 Uma outra forma de interpretar esta probabilidade é afirmar que 73,33% dos compradores passarão entre 24 e 54 minutos no supermercado. Como exercício para o leitor, mostre que a probabilidade de que o comprador fique mais de 39 minutos no supermercado é P X39=0,6915 .
Compartilhar