Baixe o app para aproveitar ainda mais
Prévia do material em texto
Distribuição Normal - part 1 Histogramas foi apresentado na aula passada e esse tipo de gráfico é muito útil na medida em que mostra a configuração de distribuições empíricas, ou seja aquelas distribuições que foram obtidas a partir de dados observados na pratica nos serviços de saúde ou em pesquisa, por exemplo: Histograma - de peso ao nascer no DF em determinado ano. Os dados foram coletados no sistema de informações de nascidos vivos - SINAP. • Distribuição empírica Algumas distribuições empíricas se aproximam de uma d ist r i b u i ç ão te ó r ica basta nte con hec i da : DISTRIBUIÇÃO NORMAL ou distribuição de Gauss ou Gassiana. Nem uma distribuição empírica tem todas as característica da distribuição normal, mas o interessante é que so de pressupor que uma variável tem distribuição normal é possível resolver muitos problemas em estatística. Esses dois gráficos tem configuração semelhante, mas 1 é empírico - uma vez que foi elaborado uma parte de dados observados em uma pesquisa. O outro é teórico. Essa curva é de suma importância na estatística e por consequência na bioestatística. Algumas características da distribuição normal são bastante conhecidas, como a média, mediana e moda coincidem e estão no centro da distribuição. A forma gráfica da distribuição normal lembra um sino, por isso conhecida também por curva em sino. Se é uma curva em forma de sino e a media esta no centro da distribuição ela é simétrica em torno da media, quando uma curva é simétrica em torno da media 50% dos va lores são i g u a i s o u maiores que a media e 50% dos va l o re são iguais ou menores do que a media. Falsa, pois uma vez que os valores extremos são os mais raros e os valores centrais são os mais frequentes e o que torna a afirmação falsa é essa primeira metade dela, uma vez que é o oposto disso ate a primeira virgula. A curva abriga toda a população sob estudo então: Abaixo da curva normal temos, portanto todas as possibilidades da variável X que estamos estudando. A distribuição normal é uma das mais importantes d ist r i b u i ç õ es d e probabilidade, isso se deve não só aos próprios recursos que ela oferece, mas também ao fato de que muitas outras distribuições de probabilidade convergem para ela. Assim como um rio tem vários afluentes a distribuição normal representa então a distribuição de probabilidades mais importante e mais atualmente utilizada dentro de todas as outras distribuições de probabilidade. Foi observado que variáveis aleatórias com continuas que representam por exemplo estatura, peso de pessoas ou embalagens, vida útil de um item como aparelho hospitalar bem como o tempo gasto para c o m p l e ta r u m a d ete r m i n a da ta refa a te aproximadamente uma distribuição normal. n A variável X em uma distribuição normal com media mi e variância ². Dessa forma a distribuição normal fica definida quando temos essas dois parâmetros: Media representado por mi e a Variância que esta representada pela letra grega sigma ². A distribuição normal é uma distribuição continua o que significa dizer que x pode assumir quaisquer valores do campo real desde menos infinito até mais infinito. Se X tiver distribuição binomial, só poderá ter valores inteiros: 0, 1, 2, 3 etc. Ao contrario da distribuição normal. A curva normal é assintótica em relação ao eixo horizontal isto é, suas caudas aproximam-se dele, mas não o tocam jamais. elas se estende infinitamente em ambas as direções sem tocar ou cruzar o eixo horizontal. Aqui cabe diferenciar três palavras que normalmente utilizamos como sinônimas no cotidiano, que são: normal, ideal e comum. Na estatística há uma diferença entre elas. Normal Um fenômeno é normal quando os valores da variável encontram abrigo sobre a curva normal. Por exemplo ja falamos que altura tem distribuição normal uma vez que não ha uma pessoas por mais alta ou mais baixa que seja que não se encaixe sob a curva. Ideal Um fenômeno ideal quando sua ocorrência é desejável. Por exemplo ter miopia é normal, ainda que não seja ideal. Comum Um fenômeno comum é o que acontece habitualmente as ocorrências estão localizadas no meio da curva, as mais raras distanciais da media e localizam-se nas caudas da nossa curva. Estaturas muito pequenas ou muitas grandes podem não ser comuns uma vez que estão nas caudas, mas significa que elas não sejam normais, em geral denominamos comuns aquelas ocorrências que estão localizadas no meio da curva ... I. Um teste de inteligência foi idealizado pressupondo que quociente de inteligência (QI) tem distribuição normal. As pessoas tem em media QI = 100 . Se em uma distribuição normal a média esta no centro, tenho nesta imagem o 100 bem no centro, se a curva é simétrica significa dizer que metade das pessoas tem QI igual ou maior que 100 e metade tem QI igual ou menor que 100. Pessoas com QI muito alto estão localizadas na cauda a direita da curva são raras igual as pessoas com QI muito baixo na cauda a esquerda. No meio tem a m é d i a , s e cons idera rmos um desvio para m a i s e p a r a menos entorno da media, temos 68,26% da área abaixo da curva. Ja para dois desvios para mais e para menos entorno da media, temos 95,44% da área. Com três desvios para mais e para menos em torno da media temo 99,74% da área abaixo da curva, quase a totalidade. Se a variável tem uma distribuição normal, 34,13% (metade da media) sob a curva estarão entre a media e um ponto igual a media mais o desvio padrão, se ela é simétrica em torno da media temos 34,13% da área sob a curva entre a media e um ponto igual a media menos o desvio padrão, se somarmos essa porcentagens, ou seja 34, 13% + 34, 13% = 68,26%. Isso significa dizer que a media menos o desvio padrão e a media mais o desvio padrão estão 68,26% da área da curva. Voltando para o ex de teste de QI com a media igual a 100 e um desvio igual a 15 - podemos dizer com base no que aprendemos que 34,13% das pessoas : Tem o QI entre a media mais o desvio padrão. Se a curva é simétrica em torno da media significa que 34,13% das pessoas tem o QI entre a media e um ponto entre a media menos o desvio padrão. O que significa dizer que 68,26% das pessoas tem segundo o teste o QI entre 85 e 115. As áreas sob a curva diminuem a medida que os valores de x se a f a s t a m d a media 13,59% da área sob a c u r va e st ã o entre a media + um desvio padrão e um ponto de abcissa + dois desvios padrões. Então 13,59% da área sob a curva esta entre mi + sigma e mi +2 vezes sigma. Se a curva é simétrica em torno da media 13,59% da área sob a curva estão entre a media menos o desvio padrão e o ponto de abcissa é igual a media - 2 desvios padrões. Somando Significa dizer que 95,44% das pessoas tem o QI entre 70 e 130. A área sob a curva depois do ponto de abcissa mi mais 2 vezes o sigma, ou seja, media+2xdesvio padrão e muito pequena. - Sabemos que metade da curva é 50%. Entre mi e mi-sigma = 34,13%; Entre mi-sigma e mi-2xsigma temos 13,59%; Area pequena corresponde a 2,28%. Então as pessoas que estão nos extremos, tanto na cauda a direita da curva quanto na cauda a esquerda da curva tem quanto de QI ? I. Qual é o valor da abcissa que delimita os 2,28% de QI mais alto? E qual é o valor da abcissa (QI) que delimita os 2,28% de QI mais baixo? 2,28% das pessoas com QI mais alto 130 e o mais baixo é 70. Distribuição normal - part 2 É importante enfatizar que existem infinitas distribuições normais, basta fazer alterações em um dos paramentos para obtermos uma outra distribuição Conhecendo os valores para os dois parâmetros podemos encontrar a área sob a curva da distribuição normal para qualquer intervalo, não existem então apenas uma única curva da distribuição normal, mas uma família de curvas de distribuições normais. Cada conjunto de valores diferentepara a media e variância, um distribuição normal diferente. Se existem uma família de curvas de distribuições normais, oque devemos fazer: Teremos construindo uma distribuição normal reduzida, também chamada de distribuição normal padronizada. Com os seguintes parâmetros: Essas operações e esses dados são muito importantes por algumas razoes: 2 A variável Z é desprovida de unidade de medida, ou seja, constitui um número puro. 3 As probabilidades associadas à distribuição normal reduzida são dadas em tabelas > o que torna fácil saber as probab il idades associadas a essa distribuição. A função que resulta na curva de Galss é complicada é precisa ser resolvida por integrais, por esse motivo temos a tabela normal padrão: que considera as áreas abaixo da curva normal como sendo media 0 variância igual a 1 e desvio padrão igual a 1. Para a utilização da distribuição para qualquer variável x com media diferente de 0 e desvio padrão diferente de 1, precisamos padronizar a variável para a variável Z. O desvio padrão e a raiz quadrada da variância. 1,17 desvio padrão à esquerda da média (lembrar que o desvio padrão é sempre positivo) Com uma única tabela é possível resolver os infinitos problemas que envolvam uma variável X normalmente distribuída Basta transformar X em Z e ler na tabela N(0; 1) a probabilidade correspondente Na tabela de distribuição normal Para praticar o Zc vamos usar 1,39. Para consultar o Zc é preciso decompor Em outro ex: Se Zc = 2,00 > 1ª 2,0 e 2ª 0,00 Essa é a tabela no Zc de 1,39. Devemos procurar 1.3 que é a 1ª parcela na linha a esquerda vertical e em seguida devemos procurar 0.09 na margem superior na horizontal. Em seguida, fazemos o cruzamento das linhas e encontramos o valor de 0,4177 I. Suponhamos X → N(40; 16). Qua l a probabilidade de X pertencer ao intervalo 40┣┫45? * media: 40 e variância: 16 e o desvio padrão: 4 ~ Aprendemos que em uma distribuição normal a media esta no c e n t r o d a distribuição. O prob lema nos p e d e p a r a ca lcu lar essa aérea entre 40 e 45. Para consultar esse Zc na tabela, precisaremos decompor esse valor : Localizamos na tabela o valor da probabilidade de 0,3944 Essa probabilidade mede a área da porção quadriculada da curva, que vimos anteriormente no gráfico de sino. Então: Se Consultando na tabela temos: 0,4938 Corresponde 30-40 mas eu quero o valor de 4o - x. Para isso: Vemos que toda essa área é o,50, como eu sei isso? Ja aprendemos que a curva abriga toda a população sob estudo, então a área total sob a curva é 1 e a metade dela será o,5. Ja calculamos a área do 0 ate 2,50 sabendo que a probabilidade é 0,4938. Para saber essa referente a área quadriculada Basta subtrair esses dois valores e vamos encontrar a probabilidade referente a ela, que é 0,0062. - recomenda-se que sempre desenhe, para resolver. Se Devemos encontrar dois valores para o Zc: um para o 35 e outro para o x < 42. Primeiro para 35 Consultamos esse valor na tabela e encontramos: 0,3944 Agora para 42 Na tabela 0,4987 O que calculamos Para achar a área quadriculada, que é justamente o que o problema pede. Com o desenho da curva fica mais tranquilo perceber que para encontrar essa area basta fazer uma subtração Esse valor encontrado corresponde à essa area quadriculada. II. A quantidade de colesterol em 100 ml de plasma sanguíneo tem distribuição normal com média 200 mg e desvio padrão 20mg. Qual é a probabilidade de uma pessoa apresentar entre 200 e 225 mg de colesterol por 100 ml de plasma? O queremos saber é essa área quadriculada. Consultando na tabela, encontramos a probabilidade de 0,3944 A probabilidade de uma pessoa apresentar taxa de colesterol entre 200 e 225 mg por 100 ml de plasma é 0,3944 ou 39,44% III. Em homens, a quantidade de hemoglobina por 100 ml de sangue é uma variável aleatória com distribuição normal de média µ = 16 g e desvio padrão σ = 1 g. Calcule a probabilidade de um homem apresentar de 16 a 18 g de hemoglobina por 100 ml de sangue. O Zc é negativo mas a probabilidade procurada é positivo, pois não existem probabilidade negativa. Na tabela a probabilidade encontrada foi de 0,4772. A probabilidade de um homem apresentar de 16 a 18 g de hemoglobina por 100 ml de sangue é 0,4772 ou 47,72% IV. No problema anterior, qual a probabilidade de um homem apresentar mais de 18 g de hemoglobina por 100 ml de sangue? Basta subtrair um valor pelo outro. 0,4987 - 0,3944 = 0,1043 0,5000 - 0,4772 = 0,0228 ou 2,28%
Compartilhar