Prévia do material em texto
Estatística Aplicada à Economia Distribuição Normal Carlos Alberto Gonçalves Junior A Distribuição Normal como Limite de uma Distribuição Binomial Consideremos três distribuições binomiais: a primeira com parâmetros n = 6 e p = 1/3, a segunda com parâmetros n = 18 e p = 1/3, e a terceira com parâmetros n = 72 e p = 1/3. É fácil verificar que a primeira distribuição tem média e variância a segunda distribuição tem média e variância 4 e a terceira distribuição tem média e variância . Portanto, as três distribuições apresentadas ocupam diferentes posições e têm diferentes graus de dispersão. Para comparar a forma dessas distribuições, independentemente das suas posições e dispersões, fazemos uma transformação de variáveis: A Distribuição Normal como Limite de uma Distribuição Binomial Pode-se verificar que E(Z) = 0 e V(Z) = 1. A nova variável Z, que tem média 0 e variância 1, é denominada variável reduzida. Vejamos, como exemplo, a transformação de variáveis para a distribuição binomial com n = 18 e p = 1/3. Nessa distribuição a variável X assume os valores 0,1, 2,...,18. Aplicando a equação da normal reduzida tem-se que a variável assume os valores -3; -2,5; -2; -1,5;...;6. Para comparar a forma das distribuições, construímos os histogramas apresentados na sequência. Distribuição Normal asdfa Os histogramas mostram respectivamente a primeira a segunda e a terceira distribuições. O valor de Z está no eixo das abscissas. Distribuição Normal Vejamos, por exemplo, como foi construído o retângulo correspondente a X = 3 na distribuição n = 18 e p = 1/3. Na distribuição, o valor da variável reduzida corresponde a X = 3, o que é Z = -1,5 Utilizando a equação para calcular a P(X = 3): Como a diferença entre dois valores consecutivos de Z é igual a 0,5, o retângulo correspondente a Z = - 1,5 tem por base o segmento limitado pelos valores – 1,75 e – 1,25, no eixo das abscissas, e altura: Sabendo que a área precisa ser P(Z = 1,5) = 0,069, e que a área do retângulo é (b.h) a equação acima dá a altura para a área de 0,069 e a base igual a 0,5. Distribuição Normal Examinando os três histogramas, verificamos que, com n = 6, a distribuição é nitidamente assimétrica. Entretanto, com n = 18 e n = 72, a distribuição é praticamente simétrica. Isto é, à medida que n cresce, a distribuição de Z se aproxima de uma determinada distribuição simétrica. Demonstra-se que, dada uma variável aleatória X com distribuição binomial, quando n cresce, mas p permanece fixo, a distribuição de Z calculado por: Tende a distribuição normal reduzida, cuja função de densidade é. Distribuição Normal A equação anterior é a função de densidade da normal reduzida, a função de densidade para média e variância é: Distribuição Normal Na prática, para saber se a forma de uma distribuição binomial pode ser considerada aproximadamente igual à forma da distribuição normal, usamos a seguinte regra empírica: se np > 5 quando p0,5, ou nq > 5 quando p > 0,5, a aproximação é aceitável. Para maior exatidão, devemos ter np e nq maiores do que 15. Teorema do Limite Central Seja X a variável aleatória que se obtém lançando um tetraedro regular, em cujas faces estão marcados os números 0, 2, 4, 6. Vimos, que E(X) = 3 e V(X) = 5. Seja Y a soma dos resultados obtidos lançando cinco desses tetraedros. Então a variável Y assume os valores 0, 2, 4, ..., 30, como: Temos: Como o resultado obtido em um determinado tetraedro é independente dos resultados obtidos pelos demais: E(X1+X2+X3+X4+X5)=E(X1)+E(X2)+E(X3)+E(X4)+E(X5) V(X1+X2)=V(X1)+V(X2)+2(COV(X1,X2) Teorema do Limite Central Considerando a variável reduzida, relativa aos valores assumidos por Y: Tem-se o histograma: A comparação da forma desse histograma com a forma da distribuição normal reduzida, sugere que a distribuição da soma dos resultados do lançamento de n tetraedros é aproximadamente normal quando n é bastante grande. Essa é uma aplicação do teorema do limite central. Teorema do Limite Central O TEOREMA DO LIMITE CENTRAL diz que: Se X1, X2, ..., Xn são variáveis aleatórias independentes com média e variância e se e são valores finitos, a distribuição de tende a uma distribuição normal com média E(Y) = e variância V(Y) = , à medida que n cresce; em outras palavras, a distribuição limite de: quando n tende para infinito, é uma distribuição normal reduzida. Como no exemplo do tetraedro, um tetraedro apenas tem distribuição uniforme com ¼ de probabilidade de ocorrência para qualquer valor. No entanto, ao jogarmos 5 dados a soma dos valores obtidos a cada lançamento, constitui a variável Y e Y por sua vez tem distribuição normal, a medida em que o número de dados aumenta. Teorema do Limite Central Vimos anteriormente que uma distribuição binomial tende a uma distribuição normal quando o número n de ensaios cresce. Esse é um exemplo de aplicação do teorema do limite central, pois o número de resultados favoráveis, nos n ensaios, é igual à soma de n variáveis aleatórias independentes de média e variância , com cada variável assumindo o valor 1 ou 0, conforme seja favorável ou desfavorável o ensaio. Uma versão mais geral do teorema do limite central admite que as variáveis que constituem as parcelas da soma tenham diferentes médias e variâncias. Então sejam Xi (i = 1, 2, ..., n) variáveis aleatórias independentes com média (i = 1, 2, ..., n) e variâncias (i = 1, 2, ..., n). Teorema do Limite Central Se temos: Quando n tende a infinito é, no limite, uma distribuição normal reduzida. É condição necessária, mas não suficiente que: Em outras palavras, a soma de um número bastante grande de variáveis aleatórias independentes tem distribuição aproximadamente normal, desde que nenhuma delas seja dominante. Teorema do Limite Central Essa versão mais geral do teorema do limite central deve ser relacionada com o fato de muitas variáveis biológicas (altura de indivíduos adultos de mesmo sexo, largura das folhas de determinada espécie vegetal etc.) apresentarem distribuição aproximadamente normal. Isso ocorre porque essas variáveis biológicas são afetadas por grande número de fatores. A altura de um adulto, por exemplo é determinada pelas condições em que se deu seu crescimento (alimentação, doenças etc.) e pelo seu genótipo, que por sua vez, é igual à soma das cargas genéticas que recebeu de seus ancestrais. Características da Distribuição Normal A função de densidade da distribuição normal, definida anteriormente mostra que o valor da função é o mesmo para dois pontos equidistantes de , isto é, definido um acréscimo u, se somarmos e subtrairmos esse acréscimo à media teremos sempre: Podemos concluir que a distribuição normal é simétrica em torno da média, que implica que a média também é a mediana e também é a moda. A curva normal é assintótica ao eixo das abscissas, o que se verifica facilmente. Basta observar que: (observando a função, o exponencial de um número negativo muito grande tende a zero mas não é zero) Características da Distribuição Normal A curva normal tem dois pontos de inflexão, cujas abscissas são Para verificar essa afirmativa, basta obter os valores de X que tornam f’’(X) = 0 O ponto de inflexão é o ponto em que muda o sinal da derivada segunda, isto é, é o ponto em que a concavidade da função se altera. Nesse ponto, o coeficiente angular da reta tangente à função que estava decrescendo/crescendo, passa a crescer/decrescer. Uma propriedade importante da distribuição normal: a soma de variáveis com distribuição normal também tem distribuição normal. A Função de Distribuição e o Uso da Tabela A função de distribuição da normal é dada por: Que depende apenas de Z, permitindo a construção de uma tabela simples, que dá a probabilidade de a variável assumir qualquer valor, de a Z, para diversos valores de Z. Para mostrar como se usa a tabela da distribuição normal, vejamos alguns exemplos: Então, seja Xuma variável com distribuição normal de média e desvio padrão . Determinemos. (a) P(X < 24) A Função de Distribuição e o Uso da Tabela A Função de Distribuição e o Uso da Tabela (b) P(X > 25) A Função de Distribuição e o Uso da Tabela (c) P(X < 12) A Função de Distribuição e o Uso da Tabela (d) P(22< X < 25) A Função de Distribuição e o Uso da Tabela (e) P(14 < X < 22) A Aproximação Normal da Distribuição Binomial e a Correção de Continuidade Vimos anteriormente as condições nas quais uma distribuição binomial se torna aproximadamente normal; É interessante frisar, nesse ponto, que na distribuição binomial a variável aleatória só assume valores inteiros, mas que na distribuição normal a variável aleatória é contínua; Então, ao valor X = k, na distribuição binomial, corresponde o intervalo de k - 0,5 a k + 0,5, na distribuição normal. Consequentemente, ao intervalo , da distribuição binomial de parâmetros n e p, corresponde o intervalo de a da distribuição normal de média e variância . A Aproximação Normal da Distribuição Binomial e a Correção de Continuidade Na distribuição normal reduzida, esse intervalo corresponde a: O valor de 0,5, que é adicionado ou subtraído de X, é denominado correção de continuidade. O sinal dessa correção é diferente se o intervalo de X não inclui os extremos. A Aproximação Normal da Distribuição Binomial e a Correção de Continuidade Para exemplificar, consideremos a distribuição binomial com parâmetros n = 18 e p = 1/3. A Aproximação Normal da Distribuição Binomial e a Correção de Continuidade A Aproximação Normal da Distribuição Binomial e a Correção de Continuidade O cálculo pela aproximação normal é bem menos trabalhoso. Para um dado valor p, quanto maior for o valor de n, maior será a vantagem em calcular a probabilidade por meio da aproximação normal, pois a aproximação obtida será melhor e o cálculo do valor exato, utilizando a equação da probabilidade binomial será mais trabalhoso. A Aproximação Normal da Distribuição Binomial e a Correção de Continuidade Exemplo: Considere uma população com 25% de analfabetos, tiramos uma amostra aleatória de 300 indivíduos. Vimos que o número (X) de analfabetos na amostra é uma variável aleatória que tem n = 300 e p = 0,25. Como p < 0,5 e np = 75 > 5. Sabemos agora, que a distribuição de X é aproximadamente normal com média np = 75 e desvio padrão Determine a probabilidade de que o número de analfabetos na amostra seja igual ou inferior a 65. EXERCÍCIOS (apenas os pares) image1.png image2.png image3.jpeg image4.png image4.emf image5.emf image6.emf image7.emf image8.png image9.emf image10.emf image11.emf image12.png image12.emf image13.emf image14.png image14.emf image15.emf image16.emf image17.emf image18.emf image20.png image19.emf image22.png image21.png image20.emf image21.emf image25.png image22.emf image23.emf image29.png image24.png image30.png image25.emf image250.png image26.emf image27.emf image28.emf image29.emf image30.emf image35.png image31.emf image32.emf image33.emf image34.emf image40.png image35.emf image36.emf image37.emf image38.emf image39.emf image40.emf image41.emf image42.emf image43.emf image44.emf image45.emf image46.emf image47.emf image48.emf image49.emf