Prévia do material em texto
BIOESTATÍSTICA DISTRIBUIÇÃO NORMAL Prof. Dr. Eduardo Rodrigues SÃO LUIS 2022 BIOESTATÍSTICA 1 Introdução Um dos mais importantes exemplos de uma distribuição continua de probabilidade é a distribuição normal, ou curva normal, distribuição de Gauss (Karls Friedrich, 1777-1855), que constitui a base teórica de toda inferência estatística. A função de densidade de probabilidade de uma curva variável X com distribuição normal é definida pela seguinte equação: Onde, x e y são variáveis estatísticas M = média da distribuição σ = desvio-padrão da distribuição π (pi) = 3,1415.... (constante) e = 2,71828.... É a base dos logaritmos naturais (constante) 2 A média refere-se ao centro da distribuição e o desvio padrão ao espalhamento (ou achatamento) da curva. A distribuição normal é simétrica em torno da média o que implica que e média, a mediana e a moda são todas coincidentes. Introdução Um dos mais importantes exemplos de uma distribuição continua de probabilidade é a distribuição normal, ou curva normal, distribuição de Gauss (Karls Friedrich, 1777-1855), que constitui a base teórica de toda inferência estatística. A função de densidade de probabilidade de uma curva variável X com distribuição normal é definida pela seguinte equação: Onde, x e y são variáveis estatísticas M = média da distribuição σ = desvio-padrão da distribuição π (pi) = 3,1415.... (constante) e = 2,71828.... É a base dos logaritmos naturais (constante) 3 Gráfico da curva normal Introdução Principais característica da curva normal: 4 Tem um ponto máximo no eixo dos y (eixo vertical), que corresponde à media no eixo x (eixo horizontal). É simétrica em relação ao eixo do y, no ponto correspondente à média no eixo dos Y. Tem dois pontos de inflexão (pontos nos quais a curva muda de concavidade), que correspondem a M ± σ. É assintótica em relação ao eixo dos x, isto é, a curva mão intercepta o eixo dos x. Prolonga-se no eixo dos x de - ꝏ a + ꝏ Tem forma de “sino” Área de probabilidade Lembremos que a integral definida de uma função f(x), em um intervalo [a,b], nos dá a área sob a função, compreendida entre os valores a e b da variável x. Assim, a integral definida da equação normal, no intervalo [a,b], representada a área sob a curva normal, no intervalo [a,b]. Como temos 50% das observações abaixo da média e 50% acima, a área total sob a curva normal corresponde a uma probabilidade de 100%. Na figura a seguir, a área A sob a curva normal nos dá a probabilidade de uma variável x esta compreendida entre os intervalos a e b. 5 Acima da média Abaixo da média MÉDIA O coeficiente Z Uma amostra de dados reais nunca se ajusta perfeitamente a uma distribuição normal teórica, mas frequentemente ela se aproxima bem. Quando esta aproximação for razoável, podemos fazer inferência de probabilidades sabendo apenas as estimativas amostrais de µ (média) e σ (desvio-padrão), pois a área sob a curva é conhecida matematicamente. “Padronizar” significa remover a escala da variável original, em geral transformando-a em um índice. Índices são úteis pois permitem a comparação entre variáveis. A principal transformação da curva normal é a Z. Para transformar sua variável no índice Z utiliza-se a seguinte formula: 6 Valor da variável (X), a média (µ), e o desvio padrão (σ) . 7 Como utilizar a tabela de Coeficiente Z A tabela indica as proporções de áreas para vários intervalos de valores para a distribuição de probabilidade normal padronizada, com a fronteira inferior começando sempre na média. Essa tabela elimina o uso da equação. Na 1° coluna da tabela, descendo até a linha 1,2, e percorrendo-a à sua linha direita até chegar na sua casa (célula) da coluna, encontraremos o valor 0,3997. Portanto a área de probabilidade correspondente a Z= 1,28 é 0,3997 (39,97%), que representa a região localizada à direita da linha da média (no ponto z=0) do gráfico da curva normal, conforme mostra a figura. Exemplos: Na tabela seguinte, encontre a probabilidade correspondente aos seguintes valores do coeficiente Z. Z = 1,28 >> é o mesmo que 1,2 + 0,08 Como utilizar a tabela de Coeficiente Z Exemplos: Na tabela seguinte, encontre a probabilidade correspondente aos seguintes valores do coeficiente Z. Z = 1,28 >> é o mesmo que 1,2 + 0,08 8 Como utilizar a tabela de Coeficiente Z Exemplos: Na tabela seguinte, encontre a probabilidade correspondente aos seguintes valores do coeficiente Z. Z = - 0,67 9 O valor negativo de z nos indica que a área se localiza à esquerda da linha da média no gráfico da curva normal. Como utilizar a tabela de Coeficiente Z Exemplos: Na tabela seguinte, encontre a probabilidade correspondente aos seguintes valores do coeficiente Z. Z = 1,28 >> é o mesmo que 1,2 + 0,08 10 Como utilizar a tabela de Coeficiente Z Exemplos: Na tabela seguinte, encontre a probabilidade correspondente aos seguintes valores do coeficiente Z. 11 Z= 0,15 Z= 0,29 Z= - 0,36 Z= 0,51 Z= 1,11 Z= 1,01 Z= - 1,26 Z= 1,31 Z= 1,40 Z= 0,00 Z= 0,01 Z= 1,35 Z= - 1,46 12 13 Aplicações da distribuição normal O peso médio de um grupo de 500 estudantes do sexo masculino é de 75,5 kg e o desvio padrão 7,5 kg. Admitindo-se que os pesos estão distribuídos normalmente, determine o número esperado de estudantes desse grupo que pesam: a) Entre 60 e 77,5 kg b) Entre 81,2 e 86 kg Solução: As medidas dos pesos X1 = 60 e X2 = 77,5 correspondem às seguintes unidades (z): Z1 = Z1 = = Z1 = - 2,07 Z2 = = Z2 = 0,27 Valor correspondente na Tabela 01 0,4808 (48,08%) Valor correspondente na Tabela 01 0,1064 (10,64%) 14 Aplicações da distribuição normal O peso médio de um grupo de 500 estudantes do sexo masculino é de 75,5 kg e o desvio padrão 7,5 kg. Admitindo-se que os pesos estão distribuídos normalmente, determine o numero esperado de estudantes desse grupo que pesam: O valor da área de probabilidade é: 0,4808 + 0,1064 = 0,5872 (58,72%), ou seja, esperamos que 58,72% desses estudantes tenham o peso compreendido entre 60 e 77,5 kg. Portanto, o número esperado de estudantes desse grupo é de: 500 *0,5872 = 293,6 = 294 estudantes IMPORTANTE 15 Aplicações da distribuição normal O peso médio de um grupo de 500 estudantes do sexo masculino é de 75,5 kg e o desvio padrão 7,5 kg. Admitindo-se que os pesos estão distribuídos normalmente, determine o numero esperado de estudantes desse grupo que pesam: c) Acima de 83,7 kg Solução: A medida do peso X1 = 83,7 correspondem às seguintes unidades (z): Z1 = Z1 = = Z1 = 1,09 Valor correspondente na Tabela 01 0,3621 (36,21%) Acima de 79 kg 16 Aplicações da distribuição normal 50% 50% 17 Aplicações da distribuição normal Logo, a área de probabilidade é de 0,5 (50%) – 0,3621 = 0,1379 (13,79%). Portanto, o número esperado é de 500*0,1379 = 68,95 = 69 estudantes 18 Aplicações da distribuição normal O peso médio de um grupo de 500 estudantes do sexo masculino é de 75,5 kg e o desvio padrão 7,5 kg. Admitindo-se que os pesos estão distribuídos normalmente, determine o numero esperado de estudantes desse grupo que pesam: c) Acima de 69 kg Solução: A medida do peso X1 = 69 correspondem às seguintes unidades (z): Z1 = Z1 = = Z1 = - 0,87 Valor correspondente na Tabela 01 0,3078 (30,78%) Acima de 58,6 kg 19 Aplicações da distribuição normal Logo, a área de probabilidade é de 0,5 (50%) + 0,3078 = 0,8078 (80,78%). Portanto, o número esperado é de 500*0,8078 = 403,9 = 404 estudantes 20 Aplicações da distribuição normal O peso médio de um grupo de 500 estudantes do sexo masculino é de 75,5 kg e o desvio padrão 7,5 kg. Admitindo-se que os pesos estão distribuídos normalmente, determine o numero esperado de estudantes desse grupo que pesam: c) Inferior a 85,6 kg Solução: A medidas do peso X1 = 85,6 correspondem às seguintes unidades (z): Z1 = Z1 = = Z1 = 1,35 Valor correspondente na Tabela 01 0,4115 (41,15%) Inferior a 72,8 kg 21 Aplicações da distribuição normal Logo, a área de probabilidade é de 0,5 (50%) + 0,4115 = 0,9115 (91,15%). Portanto, onúmero esperado é de 500*0,9115 = 455,17 = 456 estudantes 22 atividade Uma aluna do curso de psicologia está desenvolvendo uma pesquisa sobre a compulsão alimentar em adultos isolados durante a pandemia. A coleta de dados se deu por meio de entrevista com auxilio de questionários misto, ou seja com questões aberta e fechadas. A partir dos dados, foram calculados o tempo médio necessário para que cada entrevistado pudesse responder a pesquisa. O tempo médio foi de 35 minutos com um desvio padrão de 2,89 minutos. Sorteando-se um entrevistado ao acaso, qual é a probabilidade dele terminar de responder ao questionário: Antes de 20 minutos Entre 15 e 25 minutos Após o tempo médio Após 40 minutos Z00,010,020,030,040,050,060,070,080,09 0 0,1 0,2 . . . 1,1 1,20,3997 1,3 Z00,010,020,030,040,050,060,070,080,09 0 0,1 0,2 0,3 0,4 0,5 0,60,2486 0,7