Baixe o app para aproveitar ainda mais
Prévia do material em texto
Distribuição Normal - Cap 10 ● Característica de distribuição normal ● Distribuição normal reduzida Distribuição de frequência de algum tipo de evento, ou seja, quantas vezes um evento aparece. Então nós podemos ter um conjunto de eventos acontecendo, e cada um desses eventos vai aparecer com uma certa frequência. histograma → observar a distribuição de frequência - Considere um dado não viciado de 6 faces. vamos lançar esse dado 6000 vezes sobre uma superfície plana e construir um histograma com os números das faces que aparecem voltados para cima quando o dado entra em repouso. Como seria esse histograma? Cada número aparece 1000 vezes (distribuição de frequência uniforme e ideal) → isso daria certo se todas as condições fossem perfeitas (distância, dado, resistência do ar, superfície…), na natureza não achamos esse caso. Quanto mais repetições, a distribuição fica mais uniforme, pode chegar muito próxima do ideal, mas o ideal não ocorre. Representação da distribuição em termos de frequência relativa (fr) ou distribuição de probabilidades! 16,7% aproximadamente. Se o número de experimentos que eu faço é muito grande, a própria frequência relativa pode ser confundida com a probabilidade do evento acontecer. Qual a probabilidade de aparecer o número 2? 16,7%. Cada número que aparece na face superior do dado ocorre 1000 vezes em 6000 lances, isto é, ⅙ ou 16,67% dos lances. Então, cada número (1, 2, 3, 4, 5 e 6) está associado a uma probabilidade de ocorrência igual a ⅙. A soma das probabilidades de ocorrência de todos os números deve dar 1 (100%). No caso do lançamento do dado temos uma distribuição uniforme de probabilidades. Na prática: Observando o histograma de lançamentos de um dado abaixo, o que podemos afirmar sobre o dado? O número mais provável desse dado lançado é o 5 e o número menos provável é o 1. Nessa distribuição de frequência está embutida todos os fenômenos prováveis de acontecer. Nesse caso, temos uma distribuição não uniforme de probabilidade, indicando que o dado é viciado. Além disso, parece que os números de ocorrência menos provável e o mais provável num lançamento são 1 e 5, respectivamente. Na prática é muito difícil obter um dado com distribuição uniforme de probabilidade. Podemos observar na prática em um histograma os dados de: mortalidade infantil, desnutrição, falta de vitamina e minerais em uma população…O histograma consegue representar o evento levando em consideração qualquer tipo de interferência que aconteça. O número de eventos que eu estou interessado não me diz qual a probabilidade do evento acontecer, exemplo: qual a probabilidade da pessoa nascer com o olho escuro ou claro? Não é 50/50% (como o da moeda - cara ou coroa) pois depende da população estudada, pode ser 80/20% ou seja, a probabilidade não tem nada haver com a quantidade de eventos. Espaço amostral = todos os eventos possíveis - dado → 1 a 6 - moeda → cara ou coroa - tonalidade dos olhos → claro ou escuro Para conseguir montar uma distribuição de probabilidades eu preciso conhecer o meu espaço amostral e a frequência de todos os eventos do fenômeno que estou estudando. Distribuição normal de probabilidades ou normal de frequência relativa Em geral, medidas (diferentemente de contagens) possuem distribuição de probabilidades normal (não uniforme), ou de Gauss, ou ainda Gaussiana. Existem vários fenômenos na natureza que obedecem essa distribuição. Essa distribuição tem uma característica interessante, por exemplo, se eu fizer medidas de pressão sistólica, carga glicêmica, concentração de vitamina C… tudo que eu meço é distribuição normal, já as coisa que eu conto não obedecem a distribuição normal (números de pessoas com uma certa característica - não obedece uma distribuição normal, em alguns caso pode até aparecer, porém não é comum). O histograma acima é de algum fenômeno que estou estudando, no caso o valor mais provável é o 10, pois a frequência é mais de 35% e com isso é a mais alta de todas. A curva vermelha se chama distribuição matemática (distribuição teórica). Quanto mais eventos eu colecionar (↑n), mais fina ficará a minha barra e a distribuição ficará mais próxima da curva vermelha. Se eu tiver uma curva teórica, eu consigo ter uma fórmula matemática que descreve o evento que estou estudando, assim eu consigo extrair mais informações através de fórmula que representa o fenômeno real (distribuição empírica). Características importantes da distribuição normal: ● A média, moda e mediana coincidem no centro da distribuição; ● Curva em forma de sino simétrica em torno da média; ● 50% dos valores são maiores do que a média; pois ela é simétrica, ou seja, a chance de ocorrer 9 e 11 do exemplo é igual. ● A curva nunca encosta no eixo horizontal do gráfico; ● A probabilidade de ocorrência de um intervalo de valores é igual à área sob a curva. O valor mais provável de aparecer é o 10. Se a distribuição é normal, eu posso conferir na tabela e no histograma que a média, moda e mediana seria o mesmo valor 10 (só pq a distribuição é normal). Se eu tenho uma média, eu consigo definir o desvio padrão. Toda vez que usar 1 desvio padrão é gerado um intervalo (área amarela = 68,26%), a chance da sua média verdadeira está dentro desse intervalo é de 68,26%. Eu poderia aumentar o meu intervalo de confiança aumentando o meu desvio padrão para 2. Qual a probabilidade de ocorrer um valor entre 11 e 12? A probabilidade de ocorrer um valor entre 11 e 12 abrange a área amarela do histograma acima, ou seja, 13,59%. Para achar uma área específica, a probabilidade que eu quero, utilizo a distribuição normal reduzida. Distribuição normal reduzida Estamos estudando a probabilidade dos eventos acontecerem: Os cálculos de probabilidade em distribuições normais podem ser facilitados se utilizarmos uma distribuição normal padronizada, isto é, com média 0 e desvio padrão =1. Não importa a amplitude dos dados coletados para a formação da amostra. Para isso, fazemos a seguinte transformação da variável. Onde X é um valor da variável aleatória estudada, μ é a média e σ é o desvio padrão da população. Exemplo: calcule z para uma medida de pressão igual a 100 mmHg, sendo a média da população igual a 110 mmHg e o desvio padrão igual a 10 mmHg (OBS: x é admensional) A ordem foi trocada de X e μ para não dar negativo na fórmula. Os valores de Z podem ser negativos, mas quando vamos olhar na tabela que tem a probabilidade (não preciso mais calcular a probabilidade, tem uma tabela agora), não importa o assunto, os valores de Z vão de 0 a 4. Por que transformamos a variável aleatória X na variável aleatória Z? ● As probabilidades associadas a distribuição normal reduzida são dadas em tabelas, o que torna fácil saber as probabilidades associadas a essa distribuição. Basta procurar na tabela. ● Podemos transformar qualquer variável aleatória X com distribuição normal de média e desvio padrão conhecidos numa distribuição normal conhecida. ● Dos itens 1 e 2 segue-se que qualquer probabilidade associada a X pode ser obtida transformando X (distribuição normal) em Z (distribuição normal reduzida). A distribuição normal reduzida eu uso quando quero fazer perguntas para os meus dados, ex: qual a probabilidade das pessoas ter diabetes?
Compartilhar