Buscar

Prévia do material em texto

Estatística Aplicada à Economia
Distribuição Normal
Carlos Alberto Gonçalves Junior
A Distribuição Normal como Limite de uma Distribuição Binomial
Consideremos três distribuições binomiais: a primeira com parâmetros n = 6 e p = 1/3, a segunda com parâmetros n = 18 e p = 1/3, e a terceira com parâmetros n = 72 e p = 1/3.
É fácil verificar que a primeira distribuição tem média e variância a segunda distribuição tem média e variância 4 e a terceira distribuição tem média e variância .
Portanto, as três distribuições apresentadas ocupam diferentes posições e têm diferentes graus de dispersão. Para comparar a forma dessas distribuições, independentemente das suas posições e dispersões, fazemos uma transformação de variáveis:
A Distribuição Normal como Limite de uma Distribuição Binomial
Pode-se verificar que E(Z) = 0 e V(Z) = 1. A nova variável Z, que tem média 0 e variância 1, é denominada variável reduzida.
Vejamos, como exemplo, a transformação de variáveis para a distribuição binomial com n = 18 e p = 1/3. Nessa distribuição a variável X assume os valores 0,1, 2,...,18. Aplicando a equação da normal reduzida tem-se que a variável assume os valores -3; -2,5; -2; -1,5;...;6.
Para comparar a forma das distribuições, construímos os histogramas apresentados na sequência.
Distribuição Normal
asdfa
Os histogramas mostram respectivamente a primeira a segunda e a terceira distribuições. O valor de Z está no eixo das abscissas.
Distribuição Normal
Vejamos, por exemplo, como foi construído o retângulo correspondente a X = 3 na distribuição n = 18 e p = 1/3.
Na distribuição, o valor da variável reduzida corresponde a X = 3, o que é Z = -1,5
Utilizando a equação para calcular a P(X = 3):
Como a diferença entre dois valores consecutivos de Z é igual a 0,5, o retângulo correspondente a Z = - 1,5 tem por base o segmento limitado pelos valores – 1,75 e – 1,25, no eixo das abscissas, e altura:
Sabendo que a área precisa ser P(Z = 1,5) = 0,069, e que a área do retângulo é (b.h) a equação acima dá a altura para a área de 0,069 e a base igual a 0,5. 
Distribuição Normal
Examinando os três histogramas, verificamos que, com n = 6, a distribuição é nitidamente assimétrica. Entretanto, com n = 18 e n = 72, a distribuição é praticamente simétrica. Isto é, à medida que n cresce, a distribuição de Z se aproxima de uma determinada distribuição simétrica.
Demonstra-se que, dada uma variável aleatória X com distribuição binomial, quando n cresce, mas p permanece fixo, a distribuição de Z calculado por:
Tende a distribuição normal reduzida, cuja função de densidade é. 
Distribuição Normal
A equação anterior é a função de densidade da normal reduzida, a função de densidade para média e variância é:
Distribuição Normal
Na prática, para saber se a forma de uma distribuição binomial pode ser considerada aproximadamente igual à forma da distribuição normal, usamos a seguinte regra empírica: se np > 5 quando p0,5, ou nq > 5 quando p > 0,5, a aproximação é aceitável. Para maior exatidão, devemos ter np e nq maiores do que 15.
Teorema do Limite Central
Seja X a variável aleatória que se obtém lançando um tetraedro regular, em cujas faces estão marcados os números 0, 2, 4, 6. Vimos, que E(X) = 3 e V(X) = 5.
Seja Y a soma dos resultados obtidos lançando cinco desses tetraedros. Então a variável Y assume os valores 0, 2, 4, ..., 30, como:
Temos:
Como o resultado obtido em um determinado tetraedro é independente dos resultados obtidos pelos demais:
E(X1+X2+X3+X4+X5)=E(X1)+E(X2)+E(X3)+E(X4)+E(X5)
V(X1+X2)=V(X1)+V(X2)+2(COV(X1,X2)
Teorema do Limite Central
Considerando a variável reduzida, relativa aos valores assumidos por Y:
Tem-se o histograma:
A comparação da forma desse histograma com a forma da distribuição normal reduzida, sugere que a distribuição da soma dos resultados do lançamento de n tetraedros é aproximadamente normal quando n é bastante grande.
Essa é uma aplicação do teorema do limite central.
Teorema do Limite Central
O TEOREMA DO LIMITE CENTRAL diz que: Se X1, X2, ..., Xn são variáveis aleatórias independentes com média e variância e se e são valores finitos, a distribuição de tende a uma distribuição normal com média E(Y) = e variância V(Y) = , à medida que n cresce; em outras palavras, a distribuição limite de:
quando n tende para infinito, é uma distribuição normal reduzida.
Como no exemplo do tetraedro, um tetraedro apenas tem distribuição uniforme com ¼ de probabilidade de ocorrência para qualquer valor. No entanto, ao jogarmos 5 dados a soma dos valores obtidos a cada lançamento, constitui a variável Y e Y por sua vez tem distribuição normal, a medida em que o número de dados aumenta.
Teorema do Limite Central
Vimos anteriormente que uma distribuição binomial tende a uma distribuição normal quando o número n de ensaios cresce.
 Esse é um exemplo de aplicação do teorema do limite central, pois o número de resultados favoráveis, nos n ensaios, é igual à soma de n variáveis aleatórias independentes de média e variância , com cada variável assumindo o valor 1 ou 0, conforme seja favorável ou desfavorável o ensaio. 
Uma versão mais geral do teorema do limite central admite que as variáveis que constituem as parcelas da soma tenham diferentes médias e variâncias. Então sejam Xi (i = 1, 2, ..., n) variáveis aleatórias independentes com média (i = 1, 2, ..., n) e variâncias (i = 1, 2, ..., n).
Teorema do Limite Central
Se temos:
 Quando n tende a infinito é, no limite, uma distribuição normal reduzida. É condição necessária, mas não suficiente que:
Em outras palavras, a soma de um número bastante grande de variáveis aleatórias independentes tem distribuição aproximadamente normal, desde que nenhuma delas seja dominante.
Teorema do Limite Central
Essa versão mais geral do teorema do limite central deve ser relacionada com o fato de muitas variáveis biológicas (altura de indivíduos adultos de mesmo sexo, largura das folhas de determinada espécie vegetal etc.) apresentarem distribuição aproximadamente normal.
Isso ocorre porque essas variáveis biológicas são afetadas por grande número de fatores. A altura de um adulto, por exemplo é determinada pelas condições em que se deu seu crescimento (alimentação, doenças etc.) e pelo seu genótipo, que por sua vez, é igual à soma das cargas genéticas que recebeu de seus ancestrais.
Características da Distribuição Normal
A função de densidade da distribuição normal, definida anteriormente mostra que o valor da função é o mesmo para dois pontos equidistantes de , 
isto é, definido um acréscimo u, se somarmos e subtrairmos esse acréscimo à media teremos sempre:
Podemos concluir que a distribuição normal é simétrica em torno da média, que implica que a média também é a mediana e também é a moda.
A curva normal é assintótica ao eixo das abscissas, o que se verifica facilmente. Basta observar que: (observando a função, o exponencial de um número negativo muito grande tende a zero mas não é zero)
Características da Distribuição Normal
A curva normal tem dois pontos de inflexão, cujas abscissas são Para verificar essa afirmativa, basta obter os valores de X que tornam f’’(X) = 0
O ponto de inflexão é o ponto em que muda o sinal da derivada segunda, isto é, é o ponto em que a concavidade da função se altera. Nesse ponto, o coeficiente angular da reta tangente à função que estava decrescendo/crescendo, passa a crescer/decrescer.
Uma propriedade importante da distribuição normal: a soma de variáveis com distribuição normal também tem distribuição normal. 
A Função de Distribuição e o Uso da Tabela
A função de distribuição da normal é dada por:
Que depende apenas de Z, permitindo a construção de uma tabela simples, que dá a probabilidade de a variável assumir qualquer valor, de a Z, para diversos valores de Z.
Para mostrar como se usa a tabela da distribuição normal, vejamos alguns exemplos:
Então, seja Xuma variável com distribuição normal de média e desvio padrão . Determinemos.
(a) P(X < 24)
A Função de Distribuição e o Uso da Tabela
A Função de Distribuição e o Uso da Tabela
(b) P(X > 25)
A Função de Distribuição e o Uso da Tabela
(c) P(X < 12)
A Função de Distribuição e o Uso da Tabela
(d) P(22< X < 25)
A Função de Distribuição e o Uso da Tabela
(e) P(14 < X < 22)
A Aproximação Normal da Distribuição Binomial e a Correção de Continuidade
Vimos anteriormente as condições nas quais uma distribuição binomial se torna aproximadamente normal;
É interessante frisar, nesse ponto, que na distribuição binomial a variável aleatória só assume valores inteiros, mas que na distribuição normal a variável aleatória é contínua;
Então, ao valor X = k, na distribuição binomial, corresponde o intervalo de k - 0,5 a k + 0,5, na distribuição normal. Consequentemente, ao intervalo , da distribuição binomial de parâmetros n e p, corresponde o intervalo de a da distribuição normal de média e variância . 
A Aproximação Normal da Distribuição Binomial e a Correção de Continuidade
Na distribuição normal reduzida, esse intervalo corresponde a:
O valor de 0,5, que é adicionado ou subtraído de X, é denominado correção de continuidade. O sinal dessa correção é diferente se o intervalo de X não inclui os extremos.
A Aproximação Normal da Distribuição Binomial e a Correção de Continuidade
Para exemplificar, consideremos a distribuição binomial com parâmetros n = 18 e p = 1/3.
A Aproximação Normal da Distribuição Binomial e a Correção de Continuidade
A Aproximação Normal da Distribuição Binomial e a Correção de Continuidade
O cálculo pela aproximação normal é bem menos trabalhoso. Para um dado valor p, quanto maior for o valor de n, maior será a vantagem em calcular a probabilidade por meio da aproximação normal, pois a aproximação obtida será melhor e o cálculo do valor exato, utilizando a equação da probabilidade binomial será mais trabalhoso.
A Aproximação Normal da Distribuição Binomial e a Correção de Continuidade
Exemplo: Considere uma população com 25% de analfabetos, tiramos uma amostra aleatória de 300 indivíduos. Vimos que o número (X) de analfabetos na amostra é uma variável aleatória que tem n = 300 e p = 0,25. Como p < 0,5 e np = 75 > 5. Sabemos agora, que a distribuição de X é aproximadamente normal com média np = 75 e desvio padrão Determine a probabilidade de que o número de analfabetos na amostra seja igual ou inferior a 65.
EXERCÍCIOS
(apenas os pares)
image1.png
image2.png
image3.jpeg
image4.png
image4.emf
image5.emf
image6.emf
image7.emf
image8.png
image9.emf
image10.emf
image11.emf
image12.png
image12.emf
image13.emf
image14.png
image14.emf
image15.emf
image16.emf
image17.emf
image18.emf
image20.png
image19.emf
image22.png
image21.png
image20.emf
image21.emf
image25.png
image22.emf
image23.emf
image29.png
image24.png
image30.png
image25.emf
image250.png
image26.emf
image27.emf
image28.emf
image29.emf
image30.emf
image35.png
image31.emf
image32.emf
image33.emf
image34.emf
image40.png
image35.emf
image36.emf
image37.emf
image38.emf
image39.emf
image40.emf
image41.emf
image42.emf
image43.emf
image44.emf
image45.emf
image46.emf
image47.emf
image48.emf
image49.emf

Mais conteúdos dessa disciplina