Baixe o app para aproveitar ainda mais
Prévia do material em texto
Bioestatística – Material de apoio – Resumo unidade 5 Distribuição Normal A distribuição normal é a distribuição contínua mais habitual na estatística. É de vital importância por uma série de razões. As principais são: Inúmeras variáveis contínuas comuns no mundo dos negócios, como medidas de produtos fabricados, e na área da saúde, tais como a maior parte das medidas biológicas se assemelha estreitamente à distribuição normal. A distribuição normal pode ser usada para fazer aproximações para várias distribuições de probabilidade discretas, proporcionando a base para a inferência estatística clássica. Esta distribuição tem as seguintes características: Em sua aparência, a curva da distribuição normal tem o formato de um sino (figura 1), sendo simétrica em torno de um valor muito específico: a média, que se denomina mi e denota-se por µ. Sendo a curva simétrica, as medidas de tendência central (média, mediana e moda) da variável com distribuição normal coincidem; A variável que segue distribuição normal pode assumir qualquer valor no conjunto dos números reais. Assim, a curva tem amplitude infinita (-∞ < X < ∞); Valores maiores que a média e menores que ela ocorrem com igual probabilidade; A área total sob a curva é igual a 1, uma vez que corresponde à probabilidade de a variável assumir qualquer valor real. Como a curva é simétrica em torno da média, a área abaixo da curva à esquerda da média é igual a 0,5, assim como a área abaixo da curva à direita da média. A configuração da curva normal é dada por dois parâmetros: µ, a média, que é o parâmetro de posição, e σ2, a variância, ou o parâmetro de dispersão. Figura 1. Aparência da curva de distribuição normal A expressão matemática que define a distribuição dos valores para uma variável normal é: ( ) √ ( ) Em que: x = qualquer valor da variável X contínua, -∞ < x < ∞ µ = média aritmética da variável X σ = desvio-padrão da variável X Essa função é chamada função densidade de probabilidade da distribuição normal. A probabilidade de acontecer um dado valor x dentro de um intervalo qualquer de valores [a,b] corresponde à área abaixo da curva normal delimitada pelos valores a e b, e é calculada por meio da integral da função densidade de probabilidade no intervalo [a,b]. Este procedimento de cálculo de probabilidades pode ser complicado quando não se tem familiaridade com o cálculo diferencial, e para evitar as dificuldade envolvidas, pode-se converter qualquer variável X com distribuição normal (X ( )) em uma variável Z com distribuição normal reduzida ou normal padronizada (Z ( )), cujas probabilidades associadas podem ser facilmente obtidas pelo uso de uma tabela. Para transformar uma variável X ( ) numa variável Z ( ), é preciso padronizar ou reduzir a variável X, o que significa fazer a seguinte transformação: e a partir disso, calcula-se a probabilidade de Z assumir um valor qualquer não mais entre a e b, mas agora entre: z1 = e z2 = . A curva da distribuição normal padronizada tem a seguinte aparência: Figura 2. Aparência da curva normal reduzida A tabela de distribuição normal reduzida traz as probabilidades de X assumir um valor qualquer entre 0 e z, ou seja, traz a área abaixo da curva normal reduzida delimitada pelos valores 0 e z, preenchida com cor cinza na figura 3: Figura 3. Área abaixo da curva normal reduzida entre 0 e z (P(0 < Z < z)) Exemplo de aplicação Considere uma variável aleatória X com distribuição normal, com média 10 e desvio-padrão 4 (X ( )). Calcule a probabilidade de X assumir um valor entre 10 e 15. 1) Transformando os valores da variável X em valores da variável Z: x1 = 10 z1 = x2 = 15 z2 = Agora buscamos a probabilidade de Z assumir valores entre 0 e 1,25, ou seja, busca-se determinar a área abaixo da curva da distribuição normal reduzida delimitada entre 0 e 1,25, como mostra a figura abaixo: Figura 4. Transformação da variável X em uma variável Z com distribuição normal reduzida para cálculo de probabilidades Essa probabilidade é encontrada na tabela de distribuição normal reduzida da seguinte maneira (figura 5): 1) Na coluna inicial, buscam-se os dois primeiros dígitos do valor de z, a parte inteira e o primeiro decimal (nesse caso, 1,2). 2) Na linha inicial, busca-se o segundo decimal (os centésimos) de z (nesse caso, 5). 3) Localiza-se o valor na tabela o cruzamento da linha 1,2 com a coluna 5, obtendo-se 0,3944. Esta é a probabilidade de z assumir um valor entre 0 e 1,25, o que corresponde à probabilidade de X assumir um valor entre 10 e 15. Figura 5. Obtenção da probabilidade de Z assumir valor entre 0 e 1,25. Assim, P(10 < X < 15) = P (0 < Z < 1,25) = 0,3944. Disso, decorrem algumas coisas importantes, como: 1) A probabilidade de X ser maior que 15, ou seja, se Z ser maior que 1,25, é dada por: P( X > 15) = P(Z > 1,25) = 0,50 – P(0 < Z < 1,25) = 0,5 – 0,3944 = 0,1056 2) A probabilidade de X assumir valor entre 5 e 10 é igual à probabilidade de Z assumir valor entre - 1,25 e 0, que por sua vez, devido à simetria da curva normal reduzida, é igual à probabilidade de Z assumir valor entre 0 e 1,25: P(5 < X < 10) = P(-1,25 < Z < 0) = P(0 < Z < 1,25) = 0,3944 3) A probabilidade de X assumir valor menor que 5 é igual à probabilidade de Z assumir valor menor que -1,25. Pela simetria da curva normal reduzida, essa probabilidade é igual à probabilidade de Z assumir valor maior que 1,25: P( x < 5) = P( Z < -1,25) = P(Z > 1,25) = 0,1056 Calcule agora a probabilidade de X assumir valor entre 3 e 12. Solução: x1 = 3 z1 = x2 = 12 z2 = P(3 < X < 12) = P( -1,75 < Z < 0,5) = P( -1,75 < Z < 0) + P(0 < Z < 0,5) = P(0 < Z < 1,75) + P(0 < Z < 0,5) = 0,4599 + 0,1915 = 0,6514
Compartilhar