Buscar

Distribuição Normal - Cap 10

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 3, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 6, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Prévia do material em texto

Distribuição Normal - Cap 10
● Característica de distribuição normal
● Distribuição normal reduzida
Distribuição de frequência de algum tipo de evento, ou seja, quantas vezes um
evento aparece. Então nós podemos ter um conjunto de eventos acontecendo, e
cada um desses eventos vai aparecer com uma certa frequência.
histograma → observar a distribuição de frequência
- Considere um dado não viciado de 6 faces. vamos lançar esse dado 6000
vezes sobre uma superfície plana e construir um histograma com os números
das faces que aparecem voltados para cima quando o dado entra em
repouso. Como seria esse histograma?
Cada número aparece 1000 vezes (distribuição de frequência uniforme e ideal) →
isso daria certo se todas as condições fossem perfeitas (distância, dado, resistência
do ar, superfície…), na natureza não achamos esse caso. Quanto mais repetições, a
distribuição fica mais uniforme, pode chegar muito próxima do ideal, mas o ideal não
ocorre.
Representação da distribuição em termos de frequência relativa (fr) ou distribuição
de probabilidades! 16,7% aproximadamente.
Se o número de experimentos que eu faço é muito grande, a própria frequência
relativa pode ser confundida com a probabilidade do evento acontecer. Qual a
probabilidade de aparecer o número 2? 16,7%.
Cada número que aparece na face superior do dado ocorre 1000 vezes em 6000
lances, isto é, ⅙ ou 16,67% dos lances. Então, cada número (1, 2, 3, 4, 5 e 6) está
associado a uma probabilidade de ocorrência igual a ⅙. A soma das probabilidades
de ocorrência de todos os números deve dar 1 (100%). No caso do lançamento do
dado temos uma distribuição uniforme de probabilidades.
Na prática: Observando o histograma de lançamentos de um dado abaixo, o que
podemos afirmar sobre o dado?
O número mais provável desse dado lançado é o 5 e o número menos provável é o
1. Nessa distribuição de frequência está embutida todos os fenômenos prováveis de
acontecer.
Nesse caso, temos uma distribuição não uniforme de probabilidade, indicando que o
dado é viciado. Além disso, parece que os números de ocorrência menos provável e
o mais provável num lançamento são 1 e 5, respectivamente. Na prática é muito
difícil obter um dado com distribuição uniforme de probabilidade.
Podemos observar na prática em um histograma os dados de: mortalidade infantil,
desnutrição, falta de vitamina e minerais em uma população…O histograma
consegue representar o evento levando em consideração qualquer tipo de
interferência que aconteça.
O número de eventos que eu estou interessado não me diz qual a probabilidade do
evento acontecer, exemplo: qual a probabilidade da pessoa nascer com o olho
escuro ou claro? Não é 50/50% (como o da moeda - cara ou coroa) pois depende
da população estudada, pode ser 80/20% ou seja, a probabilidade não tem nada
haver com a quantidade de eventos.
Espaço amostral = todos os eventos possíveis
- dado → 1 a 6
- moeda → cara ou coroa
- tonalidade dos olhos → claro ou escuro
Para conseguir montar uma distribuição de probabilidades eu preciso conhecer o
meu espaço amostral e a frequência de todos os eventos do fenômeno que estou
estudando.
Distribuição normal de probabilidades ou normal de frequência relativa
Em geral, medidas (diferentemente de contagens) possuem distribuição de
probabilidades normal (não uniforme), ou de Gauss, ou ainda Gaussiana.
Existem vários fenômenos na natureza que obedecem essa distribuição. Essa
distribuição tem uma característica interessante, por exemplo, se eu fizer medidas
de pressão sistólica, carga glicêmica, concentração de vitamina C… tudo que eu
meço é distribuição normal, já as coisa que eu conto não obedecem a distribuição
normal (números de pessoas com uma certa característica - não obedece uma
distribuição normal, em alguns caso pode até aparecer, porém não é comum).
O histograma acima é de algum fenômeno que estou estudando, no caso o valor
mais provável é o 10, pois a frequência é mais de 35% e com isso é a mais alta de
todas.
A curva vermelha se chama distribuição matemática (distribuição teórica). Quanto
mais eventos eu colecionar (↑n), mais fina ficará a minha barra e a distribuição ficará
mais próxima da curva vermelha. Se eu tiver uma curva teórica, eu consigo ter uma
fórmula matemática que descreve o evento que estou estudando, assim eu consigo
extrair mais informações através de fórmula que representa o fenômeno real
(distribuição empírica).
Características importantes da distribuição normal:
● A média, moda e mediana coincidem no centro da distribuição;
● Curva em forma de sino simétrica em torno da média;
● 50% dos valores são maiores do que a média; pois ela é simétrica, ou seja, a
chance de ocorrer 9 e 11 do exemplo é igual.
● A curva nunca encosta no eixo horizontal do gráfico;
● A probabilidade de ocorrência de um intervalo de valores é igual à área sob a
curva.
O valor mais provável de aparecer é o 10. Se a distribuição é normal, eu posso
conferir na tabela e no histograma que a média, moda e mediana seria o mesmo
valor 10 (só pq a distribuição é normal).
Se eu tenho uma média, eu consigo definir o desvio padrão. Toda vez que usar 1
desvio padrão é gerado um intervalo (área amarela = 68,26%), a chance da sua
média verdadeira está dentro desse intervalo é de 68,26%.
Eu poderia aumentar o meu intervalo de confiança aumentando o meu desvio
padrão para 2.
Qual a probabilidade de ocorrer um valor entre 11 e 12?
A probabilidade de ocorrer um valor entre 11 e 12 abrange a área amarela do
histograma acima, ou seja, 13,59%.
Para achar uma área específica, a probabilidade que eu quero, utilizo a distribuição
normal reduzida.
Distribuição normal reduzida
Estamos estudando a probabilidade dos eventos acontecerem:
Os cálculos de probabilidade em distribuições normais podem ser facilitados se
utilizarmos uma distribuição normal padronizada, isto é, com média 0 e desvio
padrão =1. Não importa a amplitude dos dados coletados para a formação da
amostra. Para isso, fazemos a seguinte transformação da variável.
Onde X é um valor da variável aleatória estudada, μ é a média e σ é o desvio
padrão da população. Exemplo: calcule z para uma medida de pressão igual a 100
mmHg, sendo a média da população igual a 110 mmHg e o desvio padrão igual a 10
mmHg (OBS: x é admensional)
A ordem foi trocada de X e μ para não dar negativo na fórmula. Os valores de Z
podem ser negativos, mas quando vamos olhar na tabela que tem a probabilidade
(não preciso mais calcular a probabilidade, tem uma tabela agora), não importa o
assunto, os valores de Z vão de 0 a 4.
Por que transformamos a variável aleatória X na variável aleatória Z?
● As probabilidades associadas a distribuição normal reduzida são dadas em
tabelas, o que torna fácil saber as probabilidades associadas a essa
distribuição. Basta procurar na tabela.
● Podemos transformar qualquer variável aleatória X com distribuição normal
de média e desvio padrão conhecidos numa distribuição normal conhecida.
● Dos itens 1 e 2 segue-se que qualquer probabilidade associada a X pode ser
obtida transformando X (distribuição normal) em Z (distribuição normal
reduzida).
A distribuição normal reduzida eu uso quando quero fazer perguntas para os meus
dados, ex: qual a probabilidade das pessoas ter diabetes?

Outros materiais