MODELOS PROBABILÍSTICOS CONTÍNUOS

•

UFOP

3

0

3

0

Brenda Lima

20/08/2014

Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original

� PAGE \* MERGEFORMAT �11�
UNIVERSIDADE FEDERAL DE OURO PRETO
Instituto de Ciências Exatas e Aplicadas - ICEA
Departamento de Ciências Exatas e Aplicadas - DECEA
Engenharia da Computação
Campus João Monlevade
�
ALEXSANDER MUNIZ
BRENDA LIMA
JUSSARA DIAS CAMARGOS
LEANDRO XAVIER
LUCIANA CAMPOS
LUÍSA SANTOS ALMEIDA
MAICON CASTRO
NATHANY SALLES
RAFAEL FERNANDES
VANESSA SALGADO
�
MODELOS PROBABILÍSTICOS CONTÍNUOS:
Distribuição Normal
João Monlevade
2014
�
INTRODUÇÃO
A distribuição Normal é a mais familiar das distribuições contínuas de probabilidade e também uma das mais importantes em estatística, já que muitos fenômenos aleatórios comportam-se de forma próxima a essa distribuição, por exemplo: a altura, pressão sanguínea e o peso. Ela também é conhecida como distribuição gaussiana ou curva do sino, devido ao seu formato, e sua importância se deve ao Teorema Central do Limite.
Teorema Central do Limite
Definição: Qualquer que seja a forma da distribuição original de variáveis contínuas, suas médias resultam em uma distribuição normal.
Em outras palavras temos que, o Teorema Central do Limite é um resultado que nos diz que as somas e as médias das variáveis independentes são aproximadamente normais, não importando qual a densidade das variáveis contínuas que estão sendo somadas.
Propriedades
Uma variável aleatória contínua pode ter uma distribuição qualquer (normal, uniforme,...), possuindo uma média μ e um desvio-padrão σ.
Quanto maior o tamanho das amostras, a distribuição das médias será mais próxima de uma distribuição normal.
Se a distribuição da variável ‘x’ for originalmente uma distribuição normal, então a distribuição das médias amostrais terá distribuição normal para qualquer tamanho amostral n.
Exemplo: Os diagramas abaixo simulam os resultados de um experimento no qual foi utilizado um computador para gerar 2000 observações de duas distribuições bem diferentes (Fig. 1a). Logo, foram gerados uma amostra de tamanho 2 de cada distribuição e foram calculadas as médias. Este procedimento foi repetido 1999 vezes e a Figura 1b mostra os histogramas das médias resultantes das amostras de tamanho 2. Isto foi repetido com médias amostrais, tendo as amostras com tamanhos 5 (Fig. 1c) e 10 (Fig. 1d). Note que:
A forma da distribuição muda à medida que o tamanho da amostra aumenta;
As duas distribuições usadas como exemplo, tornam-se mais similares nas suas formas à medida que o tamanho das amostras aumenta;
Cada distribuição parece mais e mais com uma distribuição normal à medida que o tamanho das amostras aumenta, logo não é necessária uma amostra de tamanho muito grande para ver uma forma Normal.
Figura 1: a. Resultados do experimento.
Figura 1: b. Amostras de tamanho 2.
Figura 1: c. Amostras de tamanho 5.
Figura 1: d. Amostras de tamanho 10.
DISTRIBUIÇÃO NORMAL
Uma razão para a distribuição normal ser considerada tão importante é porque qualquer que seja a distribuição da variável contínua de interesse para grandes amostras, a distribuição das médias amostrais serão aproximadamente normalmente distribuídas, e tenderão a uma distribuição normal à medida que o tamanho de amostra crescer. Logo, a aproximação para a normal melhora, à medida que o tamanho amostral cresce. Este resultado é conhecido como o Teorema Central do Limite, abordado na seção 1.2.
A variável aleatória X tem distribuição normal com parâmetros ( e (² se sua função densidade de probabilidade é dada por:
Usamos a notação: .
Figura 2:
Propriedades da função
(= é o valor esperado (média) de X(-(<(<(): E(X) = (;
(² = é a variância de X((²> 0): Var(X) = (²;
f (x) (0 quando x (((;
A média refere-se ao centro da distribuição e o desvio padrão ao espalhamento (ou achatamento) da curva;
A distribuição normal é simétrica em torno da média o que implica que e média, a mediana e a moda são todas coincidentes;
O ponto de máximo de f(x) é o ponto X= (;
Os pontos de inflexão da função são X=(+( e X=(-(;
A curva é simétrica com relação à (;
Influência de ( e (² sobre a distribuição normal
Considere o gráfico a da figura 3. Nele estão esboçadas duas curvas normais com o mesmo desvio padrão, mas diferentes médias. As duas curvas são idênticas na forma, mas são centradas em diferentes posições ao longo do eixo horizontal.
�
�
Mesmo desvio padrão.
Mesma média.�
Figura 3: Curvas normais
�
Enquanto que no gráfico b da figura 3 há duas curvas normais com a mesma média, mas diferentes desvios-padrão. Vemos que as duas curvas são centradas exatamente na mesma posição no eixo horizontal, mas a curva com o maior desvio padrão é menor e se “espalha” mais.
Com isso, podemos concluir que a distribuição normal depende ( e (2 sendo que quanto maior o desvio padrão, maior o afastamento da média, portanto a curva fica mais aberta, mais espalhada.
Probabilidade
Considerando o gráfico a (Fig. 4), se quisermos calcular a probabilidade entre dois pontos a e b precisaríamos calcular a área sobre a curva indicado no gráfico b (Fig. 4).
�
Gráfico para probabilidade.
Probabilidade entre a e b.�
Figura 4
Logo a probabilidade será dada por:
que apresenta um grau relativo de dificuldade, então, usaremos a notação: . Onde X é a distribuição normal, com média ( e variância (². Por causa da dificuldade envolvendo este cálculo, foi criada uma tabela com valores já estabelecidos, basta consultar a tabela e obter a probabilidade.
Portanto, das inúmeras distribuições possíveis, a mais utilizada é a Normal Padronizada que possui média igual a 0 e desvio padrão igual a 1. Podemos definir:
em que Z tem distribuição normal e é chamado de Variável Normal Reduzida, Normal Padronizada ou Variável Normalizada. A variável Z indica quantos desvios padrões a variável X está afastada da média.
Normal Padronizada
Como já dito anteriormente, a normal padronizada é a mais utilizada e possui média igual a 0 e desvio padrão igual a 1.
Demonstração: Sabendo que (= E(X) e (²= Var(X), vamos demonstrar que (=0 e (²=1.
Para melhor entendimento do conceito de distribuição normal, probabilidade e normal padronizada, segue o exemplo abaixo.
Exemplo 1: Considere X a altura de uma pessoa. Se a altura tem distribuição normal com média 1,7m e desvio padrão 0,08m, qual é a probabilidade da altura de uma pessoa estar entre 1,7m e 1,8m?
�
Figura 5: Probabilidade entre a média e 1,8m.
Para calcular essa probabilidade, precisamos usar o valor da tabela da normal padronizada e devemos padronizar o valor de 1,8, ou seja, precisamos calcular a distância de 1,8 até a média. O cálculo é feito através da Variável Normal Reduzida:
Logo a distância de 1,8 à média é de 1,25(. Este é o valor padronizado denotado por Z. Assim, podemos usar a Normal Padronizada, pois a probabilidade do indivíduo estar entre 1,7 e 1,8m é igual à probabilidade de na normal padronizada o valor d Z esta entre 0 e 1,25.
Figura 6: Normal padronizada Z.
Uso da tabela
A tabela de distribuição Normal, indica a probabilidade de 0 até o valor de Z. No nosso caso, Z=1,25. Logo devemos achar o valor de Z na tabela. A primeira coluna à esquerda da tabela representa o valor inteiro e a primeira decimal do valor padronizado de Z e a primeira linha superior da tabela representa a segunda decimal do valor de Z padronizado (Fig. 7 e anexo).
Figura 7: Probabilidade não acumulada de Z=1,25
Logo, a probabilidade a probabilidade do valor de Z esta entre 0 e 1,25 é de 0,3944. Por equivalência, temos que o valor obtido na normal padronizada é equivalente ao que queremos. Portanto, a probabilidade da altura de uma pessoa estar entre 1,7m e 1,8m é de 39,44%.
Observação: Há diversos tipos de tabelas, então cada tabela implica uma probabilidade diferente, esteja atento a isso!
Normal acumulada
Retomando ao exemplo anterior, usando uma tabela de probabilidade acumulada, ou seja, o
valor acumulado até o valor de Z, veja:
Figura 9: Probabilidade de Z=1,25
Logo, existe diferença entre a probabilidade a partir da média (de 0 a Z) e a probabilidade acumulada (acumula todos os valores até Z).
�
Normal acumulada
Normal a partir da média
�
Figura 8: Diferença entre as normais
Exemplo 2: Considere X a altura de uma pessoa. Se a altura tem distribuição normal com média 1,7m e desvio padrão 0,08m, qual a probabilidade da altura do individuo estar entre 1,75m e 1,8m?
Note na Fig.9 que a área pretendida é igual à área acumulada até 1,8m menos a área acumulada até 1,75m.
Figura 9: Probabilidade entre 1,75 e 1,80.
Agora basta padronizar os valores, como é feito na Fig. 11. Considere
o valor padronizado para 1,75m teremos e para 1,80m. Teremos então:
�

�
Usando a tabela de Normal acumulada temos 0,8944 para e 0,7357 para . Fazendo a subtração entre esses dois valores obtemos:
0,8944 – 0,7357= 0,1587.
Portanto a probabilidade da altura de um indivíduo estar entre 1,75m e 1,80m é de 15,87%.
Figura 10: Padronização dos valores.
Regra Empírica
Numa distribuição normal com média ( e desvio padrão σ, pode-se aproximar áreas sob a curva normal como mostra a Fig. 11. A área em azul escuro está a menos de um desvio padrão (σ) da média. Em uma distribuição normal, isto representa aproximadamente 68% do conjunto, ou seja, 68% dos dados estão entre . Enquanto (azul médio e escuro) representam que aproximadamente 95% dos dados estão dentro deles. E (azul claro, médio e escuro) cobrem aproximadamente 99.7%. Este fato é conhecido como regra 68-95-99.7, ou a regra empírica, ou a regra dos 3-sigmas.
Figura 12: Representação da Regra 68-95-99.7
�
ANEXOS
�
�
REFERÊNCIAS
USP. Distribuição Normal. Disponível em: <http://www.ime.usp.br/~chang/home/mae116/aulas/Aula%206_distribui%E7%E3o%20Normal.pdf>. Acesso em: 19 jun. 2014.
DISTRIBUIÇÃO de Probabilidade - Como usar a tabela da distribuição normal. 08/10/2013. Son., color. Disponível em: <https://www.youtube.com/watch?v=ec9HWoY2kt8>. Acesso em: 19 jun. 2014.
DISTRIBUIÇÃO Normal - Exemplo A - Profª Suzi Samá Pinto. [s.i.]: Suzi Samá Pinto, 13/08/2013. Son., color. Disponível em: <https://www.youtube.com/watch?v=gWDjdP_dFf4>. Acesso em: 20 jun. 2014.
DISTRIBUIÇAO NORMAL DE PROBABILIDADE. [s.i]: Puc, 2012. 29 slides, color. Disponível em: <http://www.bessegato.com.br/PUC/iec_transp_07.pdf>. Acesso em: 20 jun. 2014.
TEOREMA do Limite Central e Intervalo de Confiança. [s.i], 2006. 34 slides, color. Disponível em: <http://http://www.reocities.com/researchtriangle/4480/classroom/prob_estatistica/2006_2/lecture_slides/aula15.pdf>. Acesso em: 24 jun. 2014.
SILVIA. Teorema Central do Limite. Disponível em: <http://leg.ufpr.br/~silvia/CE701/node45.html>. Acesso em: 24 jun. 2014.
HERONDINO. Distribuição Normal. [s.i]: Unifap, 2013. 46 slides, color. Disponível em: <http://www.google.com.br/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&ved=0CB4QFjAA&url=http://www2.unifap.br/herondino/files/2013/10/7-DISTRIBUI%C3%87%C3%83O-NORMAL.pptx&ei=oz65U7GRAdOzsQTm94HYDQ&usg=AFQjCNE5BK9zpOms2or_6W5lZj1vGGJC0g&bvm=bv.70138588,d.cWc>. Acesso em: 24 jun. 2014.
Teorema Central do Limite. Disponível em: <http://www.portalaction.com.br/1382-723-teorema-central-do-limite>. Acesso em: 24 jun. 2014.