Baixe o app para aproveitar ainda mais
Prévia do material em texto
Pacote de Teoria e Exercícios para Analista do BACEN – Área 2 Estatística – Prof. Alexandre Lima Prof. Alexandre Lima www.pontodosconcursos.com.br 1 Estatística Aula 03 Variável Aleatória 1 Variável Aleatória .................................................................................................................. 2 1.1 Definição ............................................................................................................................ 2 1.2 Função Discreta de Probabilidade ............................................................................ 3 1.3 Função de Distribuição de Probabilidade ............................................................... 5 1.4 Funções de Distribuição e de Densidade para Variáveis Contínuas ........... 7 2 Valor Esperado ..................................................................................................................... 13 2.1 Média ................................................................................................................................. 13 2.2 Valor Esperado de Uma Função de Variável Aleatória ................................... 16 2.3 Variância .......................................................................................................................... 17 3 Desigualdade de Chebyshev ........................................................................................... 19 4 Distribuições de Probabilidade ....................................................................................... 22 4.1 Distribuições Discretas ............................................................................................... 22 4.2 Distribuições Contínuas .............................................................................................. 36 5 Resumo.................................................................................................................................... 51 6 Exercícios de Fixação ......................................................................................................... 54 8 Gabarito .................................................................................................................................. 63 9 Resolução dos Exercícios de Fixação ........................................................................... 64 APÊNDICE ....................................................................................................................................... 86 Pacote de Teoria e Exercícios para Analista do BACEN – Área 2 Estatística – Prof. Alexandre Lima Prof. Alexandre Lima www.pontodosconcursos.com.br 2 1 Variável Aleatória 1.1 Definição Uma variável aleatória é uma descrição numérica do resultado de um experimento. Por exemplo, considere o experimento “contactar cinco clientes”. Seja X a variável aleatória que representa o número de clientes que colocam um pedido de compra. Então os valores possíveis de X são: 0, 1, 2, 3, 4 e 5. Uma variável aleatória X é denominada discreta se assume valores num conjunto contável ou enumerável (como o conjunto dos números inteiros Ζ ou o conjunto dos números naturais Ν), com certa probabilidade. Formalmente, uma variável aleatória é uma função, e não uma “variável” propriamente dita. A variável aleatória do exemplo anterior é discreta. Também são exemplos de variáveis aleatórias discretas: • Número de coroas obtido no lançamento de duas moedas; • Número de itens defeituosos em uma amostra retirada, aleatoriamente, de um lote; • Número de defeitos em um carro que sai de uma linha de produção. Vejamos um outro exemplo. Considere o lançamento de duas moedas mencionado acima. O espaço amostral (isto é, o conjunto de todos os resultados possíveis do experimento) é Ω = {(cara, cara), (cara, coroa), (coroa, cara), (coroa, coroa)}, e os valores que a variável aleatória X (número de coroas) pode assumir são X = {0, 1, 2}. Observe que o valor x = 0 está associado ao resultado (cara, cara), o valor x = 1 está associado aos resultados (cara, coroa) e (coroa, cara) e o valor x = 2 está associado ao resultado (coroa, coroa). Uma variável aleatória contínua é uma função que associa elementos do espaço amostral ao conjunto dos números reais (conjunto não enumerável). Exemplos de variáveis aleatórias contínuas: • Tempo de resposta de um sistema computacional; • Volume de água perdido por dia, num sistema de abastecimento; • Resistência ao desgaste de um tipo de aço, num teste padrão. Pacote de Teoria e Exercícios para Analista do BACEN – Área 2 Estatística – Prof. Alexandre Lima Prof. Alexandre Lima www.pontodosconcursos.com.br 3 1.2 Função Discreta de Probabilidade A função que atribui a cada valor de uma variável aleatória discreta sua probabilidade é chamada de função discreta de probabilidade ou, simplesmente, função de probabilidade (1) )x(f]xX[P ii == ,...2,1i = Uma função de probabilidade satisfaz as seguintes: i) 0 ≤ f(xi) ≤ 1 (porque não existe probabilidade negativa) e ii) ∑i f(xi) = 1 (é a probabilidade do evento certo). As variáveis aleatórias discretas são completamente caracterizadas pela sua função de probabilidade. Exemplo. Considere o lançamento de um dado não viciado. A probabilidade de se obter um resultado de 1 a 6 é igual a 1/6. O espaço amostral é Ω = {1, 2, 3, 4, 5, 6}. A Fig. abaixo ilustra a função de probabilidade f(xi) =1/6, i = 1, 2, 3, 4, 5, 6, da variável aleatória X. x1 2 3 4 5 60 7 f(x) 1/6 1/6 1/6 1/6 1/6 1/6 Já caiu em prova! (Analista do BACEN/Área 3/2005/FCC) O número de televisores modelo M vendidos diariamente numa loja é uma variável aleatória discreta (X) com a seguinte distribuição de probabilidades: X 0 1 2 3 P(x) p 1,5p 1,5p p O preço unitário de venda do televisor modelo M é de R$ 1.000,00. Se num determinado dia a receita de vendas referente a este modelo for inferior a R$ 3.000,00, a probabilidade dela ser positiva é Pacote de Teoria e Exercícios para Analista do BACEN – Área 2 Estatística – Prof. Alexandre Lima Prof. Alexandre Lima www.pontodosconcursos.com.br 4 A) 20% B) 30% C) 50% D) 60% E) 75% Resolução Muitas vezes, o fato de sabermos que certo evento ocorreu faz com que se modifique a probabilidade que atribuímos a outro evento. Denotamos por P(A|B) a probabilidade do evento A, sabendo que B ocorreu, ou probabilidade de A condicionada a B. Temos , )B(P )BA(P)B|A(P ∩= .0)( >BP A questão pede que se calcule a probabilidade de a receita de vendas num dado dia ser positiva sabendo-se que ela é inferior a R$ 3.000,00 naquele mesmo dia, ou seja, deve ser calculada a probabilidade condicional P(receita de vendas > 0 | receita de vendas < R$ 3.000,00). Ora, a probabilidade acima é igual à probabilidade P(X > 0 | X < 3) = P[(X > 0) ∩ (X < 3)]/ P(X < 3), em que X é a variável aleatória que denota o número de televisores modelo M vendidos diariamente. Precisamos encontrar o valor da incógnita p para resolver a questão. Para tal, usaremos a equação ∑P(X) = 1 Então, p + 1,5p + 1,5p + p = 1 ⇒ p = 1/5 = 0,20 Assim: X 0 1 2 3 P(x) 0,20 0,30 0,30 0,20 P[(X > 0) ∩ (X < 3)] = P(X = 1) + P(X = 2) = 0,30 + 0,30 = 0,60 Pacote de Teoria e Exercícios para Analista do BACEN – Área 2 Estatística – Prof. Alexandre Lima Prof. Alexandre Lima www.pontodosconcursos.com.br 5 P(X < 3) = P(X = 0) + P(X = 1) + P(X = 2) = 0,20 + 0,60 = 0,80 Logo, P(X > 0 | X < 3) = P[(X > 0) ∩ (X < 3)]/ P(X < 3) = 0,60/0,80 = 3/4 = 75% GABARITO: E 1.3 Função de Distribuição de Probabilidade A função de distribuição de probabilidade (ou função acumulada de probabilidade) de uma variávelaleatória discreta X é definida pela expressão (2) ]xX[P)x(F ≤= . A figura a seguir mostra a função de distribuição F(x) da variável aleatória do exemplo do lançamento de um dado não viciado. 1 2 3 4 5 6 x 1/6 1/3 1/2 2/3 5/6 1 F(x) Observe que a amplitude do “degrau” em X = 1 é igual a P(X = 1) = 1/6. A amplitude do degrau em X = 2 é igual a P(X = 2) = 1/6 (= 1/3 – 1/6). A amplitude do degrau em X = 3 é igual a P(X = 3) = 1/6 (= 1/2 – 1/3) e assim por diante. Propriedades de F(x) 1. 0 ≤ F(x) ≤ 1 2. F(x = -∞) = limx→ -∞ F(x) = 0 3. F(x = +∞) = limx→ +∞ F(x) = 1 Pacote de Teoria e Exercícios para Analista do BACEN – Área 2 Estatística – Prof. Alexandre Lima Prof. Alexandre Lima www.pontodosconcursos.com.br 6 4. F(x) é descontínua nos pontos X = x0 onde P(X=x0) ≠ 0, ou seja, nos pontos X = x0 em que há saltos. 5. F(x) é contínua à direita dos pontos X = x0 onde P(X=x0) ≠ 0. 6. P(a < X ≤ b) = F(b) – F(a) 7. P(a ≤ X ≤ b) = F(b) – F(a) + P(X = a) 8. P(a < X < b) = F(b) – F(a) – P(X = b) 9. F(x) é uma função não descrescente monotônica (*). (*) P(a < X ≤ b) = F(b) – F(a) ≥ 0, temos que F(x) é não descrescente. Note que F(x) é uma função não descrescente monotônica porque a curva descrita por F(x) nunca decresce indo da esquerda para a direita (veja o gráfico de F(x) para a variável aleatória do exemplo do lançamento de um dado não viciado). Já caiu em prova! (BACEN/Área 3/2010/CESGRANRIO) Se X é uma variável aleatória descrita por uma função conjunto de probabilidades PX(.), a função de distribuição de probabilidade de X, F(x) terá, entre outras, as seguintes propriedades: I - F(x) é monotônica não decrescente; II - limx→-∞ F(x) = 0 e limx→∞ F(x) = 0 III- F(x) é contínua à direita. É (São) correta(s) a(s) propriedade(s) (A) II, apenas. (B) I e II, apenas. (C) I e III, apenas. (D) II e III, apenas. (E) I, II e III. Resolução Análise das afirmativas: I- F(x) é monotônica não decrescente porque a curva descrita por F(x) nunca decresce indo da esquerda para a direita. Afirmativa incorreta. II- Afirmativa incorreta. A afirmativa correta seria: limx→-∞ F(x) = 0 e limx→∞ F(x) = 1 Pacote de Teoria e Exercícios para Analista do BACEN – Área 2 Estatística – Prof. Alexandre Lima Prof. Alexandre Lima www.pontodosconcursos.com.br 7 III- Afirmativa correta, por definição: F(x) é contínua à direita dos pontos X = x0 onde P(X=x0) ≠ 0. GABARITO: C 1.4 Funções de Distribuição e de Densidade para Variáveis Contínuas Diz-se que f(x) é uma função contínua de probabilidade ou função densidade de probabilidade para uma variável aleatória contínua X, se satisfaz duas condições: 1. f(x) > 0 para todo x ∈ (-∞,∞); 2. a área definida por f(x) é igual a 1. A condição 2 é dada pela integral (3) ∫∞ ∞− = 1dx)x(f . A figura a seguir ilustra uma função densidade que satisfaz (3): f(x) = 1/T, em que T é uma constante, para –T/2≤x≤T/2 e f(x) = 0 para os demais valores, de maneira que a função tem a forma de um pulso retangular. Observe que f(x) deve ser igual a 1/T para –T/2≤x≤T/2, pois a área sob a função densidade é unitária (como a base do pulso é T, então a altura do pulso deve ser 1/T, para que a área do pulso seja igual a 1). Para calcular probabilidades, temos que, para a ≤ b Pacote de Teoria e Exercícios para Analista do BACEN – Área 2 Estatística – Prof. Alexandre Lima Prof. Alexandre Lima www.pontodosconcursos.com.br 8 (4) ∫=≤≤ b a dx)x(f]bXa[P . A figura abaixo mostra o significado geométrico de (4): a probabilidade P(a≤X≤b) é igual a área sob f(x) no intervalo [a,b]. x f(x) ba-T/2 -T/2 1/T 0 P(a≤X≤b) Observe que a probabilidade de ocorrência de um dado valor isolado “k” é sempre nula, ou seja, P[x = k] = 0. A função de distribuição de uma variável aleatória contínua X também é definida pela expressão (2), que pode ser posta na forma (5) ∫ ∞− λλ= x d)(f)x(F . As próximas duas figuras ilustram, respectivamente, as funções densidade de probabilidade e de distribuição de uma variável aleatória normal (a expressão matemática da densidade normal será fornecida mais adiante). Pacote de Teoria e Exercícios para Analista do BACEN – Área 2 Estatística – Prof. Alexandre Lima Prof. Alexandre Lima www.pontodosconcursos.com.br 9 -3 -2 -1 0 1 2 3 0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 x f( x ) Densidade normal -3 -2 -1 0 1 2 3 0 0.2 0.4 0.6 0.8 1 x F( x ) Função de distribuição normal A função densidade de probabilidade corresponde à derivada da função distribuição em relação a x, ou seja, f(x) = dF(x)/dx = F(x)’. Já caiu em prova! (BACEN/Área 2/2010/CESGRANRIO) A variável aleatória contínua x tem a seguinte função de densidade de probabilidade: k 12 x)x(f −= se 03x0 =≤≤ , para todos os outros valores de x. Sendo k uma constante, seu valor é igual a A) 1 B) 3/4 C) 2/3 D) 5/24 Pacote de Teoria e Exercícios para Analista do BACEN – Área 2 Estatística – Prof. Alexandre Lima Prof. Alexandre Lima www.pontodosconcursos.com.br 10 E) 1/12 Resolução O enunciado está “truncado”, haja vista a descrição da função densidade de probabilidade ( k12/x)x(f −= se 03x0 =≤≤ ?). A descrição correta seria: k 12 x)x(f −= se 3x0 ≤≤ e 0)x(f = caso contrário. Isso já seria motivo suficiente para anular esta questão. Não obstante, prosseguiremos com a resolução. Para determinar o valor de k, basta lembrar que a área sob a função densidade de probabilidade é igual a 1. Logo, 1dx)x(f =∫∞ ∞− . Gostaríamos de apresentar para vocês um “bizu” de integração antes de prosseguir com a resolução da questão. De acordo com a fórmula de Newton- Leibniz, temos que ),a(F)b(F)x(Fdx)x(g b a b a −==∫ em que F(x)’ = g(x), quando a ≤ x ≤ b. A função F(x) é denominada primitiva de g(x). Suponha que g(x) = x3, a=-1 e b=0. Logo, F(x) = x4/4, pois F(x)’ = 4x(4-1)/4 = x3. Assim, 4 3 4 )1( 4 03 4 x3dxx3dxx3dxx3x 440 1 40 1 30 1 30 1 2 −⎟ =⎟⎠ ⎞⎜⎜⎝ ⎛ −−==== − −−− ∫∫∫ Podemos generalizar a integração exemplificada acima para integrandos do tipo g(x) = xn, em que n é um valor inteiro: 1n a 1n b 1n xdxxdx)x(g 1n1nb a 1nb a nb a +−+=+== +++∫∫ . Vamos retornar para a resolução? Precisamos substituir a função f(x) na integral 1dx)x(f =∫ ∞ ∞− . Note que f(x)=0 para x<0 e x>3. Pacote de Teoria e Exercícios para Analista do BACEN – Área 2 Estatística – Prof. Alexandre Lima Prof. Alexandre Lima www.pontodosconcursos.com.br 11 1dx0dxk 12 xdx0 3 3 0 0 =+⎟⎠ ⎞⎜⎝ ⎛ −+ ∫∫∫ ∞ ∞− 10dxk 12 x0 3 0 =+⎟⎠ ⎞⎜⎝ ⎛ −+ ∫ 1dx1kdxx 12 1 3 0 3 0 =− ∫∫ 1xk 2 x 12 1 3 0 3 0 2 =−⎟⎟⎠ ⎞⎜⎜⎝ ⎛ 1)03(k 2 0 2 3 12 1 22 =−⎟ −⎟⎠ ⎞⎜⎜⎝ ⎛ − 1k3 24 9 =− 24 151 24 9k3 −=−= 24 5k −= A banca anulou a questão, pois não há alternativa com o valor 24 5k −= . Um alerta: você precisa estar preparado psicologicamente para enfrentar este tipo de problema quando estiver numa situação real de prova. Resolva as questões “esquisitas” no final da prova, após ter solucionado todas as questões que são de seu conhecimento, se houver tempo para isso. Nós podemos errar questões difíceis/”esquisitas” em uma prova de concurso público. Porém, errar o que a gente sabe, é mortal: leva à não aprovação/classificação. GABARITO: ANULADA Exemplo (Analista/SUSEP/2006/ESAF) Se a variável X pode assumir um conjuntoinfinito (contínuo) de valores, o polígono de freqüência relativa de uma amostra torna-se uma curva contínua, cuja equação é Y = p(X). A área total limitada por essa curva e pelo eixo dos X é igual a 1 e a área compreendida entre as verticais X = a e X = b, sendo a < b e, ambos, contidos na área total da curva, a probabilidade de X cair neste intervalo a e b é dada por Pacote de Teoria e Exercícios para Analista do BACEN – Área 2 Estatística – Prof. Alexandre Lima Prof. Alexandre Lima www.pontodosconcursos.com.br 12 A) P(a<X<b), composta pela soma de P(X=a) + P(X=b). B) P(a<X<b), composta pela integral de P(X=a) até P(X=b). C) P(a>X>b), composta pela soma de P(X=a) - P(X=b). D) P(a>X>b), composta pela integral de P(X=a) até P(X=b). E) P(a<X<b), composta pela P(X=b), de forma cumulativa até o ponto b. Resolução Deve-se descartar as opções A, C e E, pois a probabilidade de X cair no intervalo [a,b] é dada pela seguinte integral (observe que o enunciado afirma que “(..) o polígono de freqüência relativa de uma amostra torna-se uma curva contínua”): ∫=≤≤ ba dx)x(p)bXa(P A opção D é incorreta porque o sinal da desigualdade está trocado (P(a>X>b) no lugar de P(a<X<b)). Logo, B é a opção correta. GABARITO: B Exemplo (SUSEP/Atuária/2010/ESAF) Sejam n variáveis aleatórias iid, isto é, independentes e identicamente distribuídas X1, X2,..., Xn com função densidade de probabilidade f(x) e função de distribuição F(x), onde -∞ < x < ∞. Considere uma nova variável aleatória Xmin tal que Xmin > x se e somente se Xi > x para todo i, i = 1, 2, ..., n. Obtenha fmin(x), a função densidade de probabilidade da variável aleatória Xmin. A) fmin(x) = n(F(x))n-1f(x). B) fmin(x) = n(1 - F(x))n-1 f(x). C) fmin(x) = 1 - (1 - F(x))n. D) fmin(x) = (F(x))n. E) fmin(x) = exp(-|x|)/2. Resolução O enunciado diz que Xmin > x se e somente se Xi > x para todo i, i = 1, 2, ..., n. Logo, P(Xmin > x) = P(X1 > x) . P(X2 > x) … . P(Xn > x) Mas, P(Xi > x) = 1 - P(Xi ≤ x) = 1 - F(x), i = 1, 2, ..., n. Então, P(Xmin > x) = (1 – F(x))n e Pacote de Teoria e Exercícios para Analista do BACEN – Área 2 Estatística – Prof. Alexandre Lima Prof. Alexandre Lima www.pontodosconcursos.com.br 13 P(Xmin ≤ x) = Fmin(x) = 1 - (1 – F(x))n. A função densidade de probabilidade corresponda à derivada da função distribuição em relação a x. Portanto, fmin(x) = (Fmin(x))’ = -n(1 – F(x))n-1(1 – F(x))’ = -n(1 – F(x))n-1(–f(x)) (lembre que F(x)’ = f(x)) fmin(x) = n(1 – F(x))n-1f(x) Nota: regra de derivação de uma função composta: f(x) = u[v(x)] ⇒ f’(x) = u’[v(x)].v’(x). GABARITO: B 2 Valor Esperado Já dissemos que uma variável aleatória é completamente caracterizada (ou especificada) pela sua função de probabilidade. Isto quer dizer que temos toda a informação acerca de X quando sabemos quem é fX(x) (isto é, quando conhecemos a fórmula de fX(x)). Na prática, é bastante comum não conhecermos fX(x). Neste caso, como faríamos para caracterizar X? O fato é que normalmente temos acesso a diversas observações de uma variável aleatória e podemos nos aproveitar deste fato para tentar obter uma descrição, ainda que parcial, da mesma. Uma maneira alternativa de caracterizar uma variável aleatória envolveria a obtenção de estimativas de alguns de seus momentos ou “médias” estatísticas. Na prática, os momentos mais importantes são a média (momento de 1ª ordem) e a variância (momento de 2ª ordem). A média é uma medida de posição de fX(x), ao passo que a variância é uma medida de dispersão (ou do grau de variabilidade) de fX(x) (aprendemos este conceito na aula 0). 2.1 Média A média (também conhecida como valor esperado ou esperança) é uma medida de posição de uma função de probabilidade, servindo para localizar a função sobre o eixo de variação da variável em questão. Em particular, a média caracteriza o centro de uma função de probabilidade. A média é uma característica numérica de uma função de probabilidade. Se X for uma variável aleatória discreta que pode tomar os valores x1, x2, ..., xn com probabilidades f(x1), f(x2), ..., f(xn), então a média de X é definida por Pacote de Teoria e Exercícios para Analista do BACEN – Área 2 Estatística – Prof. Alexandre Lima Prof. Alexandre Lima www.pontodosconcursos.com.br 14 (6) ∑ = =+++= n 1i iinn211 )x(fx)x(fx...)2x(fx)x(fx]X[E em que E denota o operador esperança matemática. A média de X também é usualmente representada por X (leia-se “X barra”) ou pela letra grega μ (leia-se “mi”). Exemplo (Administrador(a) Júnior Petrobrás/2007/Cespe-UnB) número de pedidos probabilidade 0 0,4 1 0,2 2 0,1 3 0,1 4 0,1 5 ou mais 0,1 O departamento de recursos humanos de uma empresa recebe diariamente uma quantdade aleatória X de pedidos de auxílio- transporte. Considerando a tabela acima, que mostra a distribuição de probabilidade de X, julgue os itens seguintes. 1. O número médio de pedidos é superior a 1,5. Resolução E(X) = ∑ X.f(x) = (0 x 0,4) + (1 x 0,2) + (2 x 0,1) + (3 x 0,1) + (4 x 0,1) + (5 x 0,1) = 1,6 > 1,5 GABARITO: CERTO 2. O número de pedidos X é igual a 1 com probabilidade igual a 0,6. Resolução A tabela com a distribuição de probabilidades de X mostra que f(X=1) = 0,2. Logo o item está errado. Cabe ressaltar que P(X ≤ 1) = f(X = 0) + f(X=1) = 0,4 + 0,2 = 0,6. GABARITO: ERRADO Se a variável aleatória discreta X puder tomar um número infinito de valores, então (6) pode ser generalizada na forma Pacote de Teoria e Exercícios para Analista do BACEN – Área 2 Estatística – Prof. Alexandre Lima Prof. Alexandre Lima www.pontodosconcursos.com.br 15 (7) ∑=++++= i iinn211 )x(fx...)x(fx...)2x(fx)x(fx]X[E . O valor esperado de uma variável aleatória contínua X com densidade de probabilidade fX(x) é dado pela integral (8) ∫∞∞−= dx)x(xf]X[E . Exemplo (AFRFB/2009/ESAF/adaptada) A função densidade de probabilidade de uma variável aleatória contínua x é dada por: ⎩⎨ ⎧ ≤≤−= .c.c,0 0x1,x3 )x(f 2 Obs.: c.c. denota “caso contrário”. Para esta função, a média de x, também denominada expectância de x e denotada por E(x) é igual a: 4 A) 3 3 B) 4 C) 4 3− D) x 4 3− E) x 3 4− Resolução Primeiramente, devemos descartar as opções D e E, pois a média de uma variável aleatória é um número. Observe que as opções apontadas são funções de x e não números! O cálculo da esperança E[x] da variável aleatória contínua x é feito pela integração ∫∞∞−= dx)x(xf]X[E . Observe que a função densidade de probabilidade é nula para x < -1 e x > 0. Logo o limite inferior da integral é -1 e o superior é 0. Portanto, Pacote de Teoria e Exercícios para Analista do BACEN – Área 2 Estatística – Prof. Alexandre Lima Prof. Alexandre Lima www.pontodosconcursos.com.br 16 ∫∫∫ −−− === 01 301 301 2 dxx3dxx3dxx3x]X[E . Como a primitiva da integral ∫ dxx3 é 4/x4 , temos que 4 3 4 )1(03 4 x3]X[E 40 1 4 −=⎥⎦ ⎤⎢⎣ ⎡ ⎟⎟⎠ ⎞⎜⎜⎝ ⎛ −−=⎥⎦ ⎤⎢⎣ ⎡= − GABARITO: C 2.2 Valor Esperado de Uma Função de Variável Aleatória Seja X uma variável aleatória discreta com função de probabilidade fX(xi) e g(X) uma função de X. Então o valor esperado de g(X) é (9) ∑= i iXi )x(f)x(g)]X(g[E . Caso X seja uma variável aleatória contínua com densidade de probabilidade fX(x), o valor esperado de g(X) é dado por (10) ∫∞ ∞− = dx)x(f)x(g)]X(g[E X . Se )X(g)X(g)X(g 21 += , em que g1(X) e g2(X) também são funções de X, então vale (11) )]X(g[E)]X(g[E)]X(g[E 21 += . Relacionamos abaixo algumas propriedades importantes da esperança matemática E(.). Sejam“a” e “c” valores constantes e X uma variável aleatória (tanto faz se contínua ou discreta), então valem: • c]c[E = ⇒ a média de um número qualquer “c” é o próprio número “c”; • ]X[cE]cX[E = ⇒ a média de uma variável multiplicada por um número é igual ao número multiplicado pela média de X; • ]X[cEa]cXa[E +=+ ⇒ a média da soma de um número qualquer “a” com a variável X multiplicada por um número qualquer c é igual à soma do número “a” com a média de X multiplicada por “c”. Pacote de Teoria e Exercícios para Analista do BACEN – Área 2 Estatística – Prof. Alexandre Lima Prof. Alexandre Lima www.pontodosconcursos.com.br 17 2.3 Variância Sejam X uma variável aleatória (discreta ou contínua) e 2]XX[)X(g −= uma função de X. Define-se a variância de X (denotada por var(X) ou 2Xσ ) como o valor esperado E[g(X)] dado por (12) 2]XX[E)]X(g[E)Xvar( −== . Note que ]X[E]XX2[E]X[E]XXX2X[E]XX[E 22222 +−=+−=− ]X[E]X[EX2]X[E]XX[E 222 +−=− (colocamos X2 em evidência no segundo termo do lado direito da igualdade) 222222 X]X[EXX2]X[E]XX[E −=+−=− 22 X]X[E)Xvar( −= ⇒ variância de X é igual a média do quadrado de X subtraída da média de X ao quadrado. Sejam “a” e “c” constantes e Z = a + cX. Observe que Z é uma transformação linear de X, porque Z = a+cX define a equação de uma reta com declividade “c” e intercepto “a”. Não é difícil demonstrar que vale a propriedade (13) var(a+cX) = c2var(X). A raiz quadrada positiva da variância é chamada de desvio-padrão ou erro-padrão, sendo denotada pelo símbolo σ. Exemplo (AFRFB/2009/ESAF) A tabela mostra a distribuição de freqüências relativas populacionais (f’) de uma variável X: X f ' – 2 6a 1 1a 2 3a Sabendo que “a” é um número real, então a média e a variância de X são, respectivamente: A) 5,0x −=μ e 45,32x =σ Pacote de Teoria e Exercícios para Analista do BACEN – Área 2 Estatística – Prof. Alexandre Lima Prof. Alexandre Lima www.pontodosconcursos.com.br 18 B) 5,0x =μ e 45,32x −=σ C) 0x =μ e 12x =σ D) 5,0x −=μ e 7,32x =σ E) 5,0x =μ e 7,32x =σ Resolução Em primeiro lugar, deve-se eliminar a opção B, pois não existe variância com valor negativo. Assim, esta opção é absurda. Soma das Freqüências Relativas = 6a + 1a + 3a = 10a = 1. Logo a = 0,1. X f ' X.f ' X2.f ' – 2 6a = 6 x 0,1 = 0,6 -1,2 2,4 1 1a = 1 x 0,1 = 0,1 0,1 0,1 2 3a = 3 x 0,1 = 0,3 0,6 1,2 Total 1 -0,5 3,7 Vimos que a média de uma variável aleatória discreta é calculada pela fórmula ∑ = =+++= n 1i iinn211 )x(fx)x(fx...)2x(fx)x(fx]X[E Para a questão temos 5,06,01,02,1)x(fx)2x(fx)x(fx]X[E n3211 −=++−=++= ⇒ podemos eliminar as opções C e E (sobraram A e D). A variância é dada por 222 X ]X[]X[Eσ)Xvar( −== sendo que ∑ = =++== n 1i i 2 i 2 7,32,11,04,2)x(fx]X[E (reparou que a opção D é uma “pegadinha”?). Logo, 45,325,07,3)5,0(7,3σ 22X =−=−−= . GABARITO: A Pacote de Teoria e Exercícios para Analista do BACEN – Área 2 Estatística – Prof. Alexandre Lima Prof. Alexandre Lima www.pontodosconcursos.com.br 19 Já caiu em prova! (Analista/Área 3/BACEN/2006/FCC) Um empresário, investindo em um determinado empreendimento, espera ter os seguintes lucros em função dos cenários “Bom”, “Médio” e “Ruim”: Cenário Lucro (R$) Distribuição de Probabilidades do Cenário Bom R$ 8 000,00 0,25 Médio R$ 5 000,00 0,60 Ruim R$ 2 000,00 0,15 A expectância e a variância do lucro são, em R$ e (R$)2, respectivamente, A) 5 500,00 e 3 160,00 B) 5 300,00 e 3 510,00 C) 5 300,00 e 3 160,00 D) 5 000,00 e 3 510,00 E) 5 000,00 e 3 160,00 Resolução Expectância: E(X) Variância: Var(X) = E(X2) – [E(X)]2 E(X) = ∑X.P(X) = 8 x 0,25 + 5 x 0,60 + 2 x 0,15 = 5,3 mil = 5.300,00 E(X2) = 82 x 0,25 + 52 x 0,60 + 22 x 0,15 = 31,6 mil Var(X) = 31,6 – 5,32 = 3,51 mil = 3.510,00 GABARITO: B 3 Desigualdade de Chebyshev A desigualdade de Chebyshev (ou Tchebysheff) fornece um limitante superior da probabilidade de quanto uma variável aleatória X pode desviar-se de sua média μ. Seja X uma variável aleatória arbitrária com média μ e variância σ2. Então, para qualquer δ > 0 .]|X[|P 2 2 δ σ≤δ≥μ− Comentários: Pacote de Teoria e Exercícios para Analista do BACEN – Área 2 Estatística – Prof. Alexandre Lima Prof. Alexandre Lima www.pontodosconcursos.com.br 20 - Observe que o teorema de Chebyshev não requer que a distribuição de probabilidades de X seja conhecida. - Como Ω=δ<μ−δ≥μ− }|X{|}|X{| U (evento certo), segue-se que .1]|X[|P 2 2 δ σ−≥δ<μ− Às vezes, é mais conveniente expressar δ em termos de σ, de forma que δ = kσ, em que k é um valor constante. Então o teorema de Chebyshev pode ser expresso nas formas equivalentes: 2k 11]k|X[|P −≥σ<μ− 2k 1]k|X[|P ≤σ≥μ− 10 10.5 11 11.5 12 12.5 13 13.5 14 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 x D en si da de μ μ + kσμ - kσ f(x) P(X - μ < -kσ) P(X - μ > kσ) Note que a soma das áreas azul e vermelha na figura acima é 1/k2, pois o limite superior da área azul é μ - kσ e o limite inferior da área vermelha é μ + kσ. Por outro lado, a área para |x - μ|> kσ sempre será menor que 1/k2. Exemplo (AFPS/2002/ESAF) Sejam X1,...,Xn observações de um atributo X. Sejam: ∑ = = n 1i iXn 1X e 2 n 1i i 2 )XX( n 1S ∑ = −= Assinale a opção correta. Pacote de Teoria e Exercícios para Analista do BACEN – Área 2 Estatística – Prof. Alexandre Lima Prof. Alexandre Lima www.pontodosconcursos.com.br 21 A) Pelo menos 95% das observações de X diferem de X em valor absoluto por menos que 2S. B) Pelo menos 99% das observações de X diferem de X em valor absoluto por menos que 2S. C) Pelo menos 75% das observações de X diferem de X em valor absoluto por menos que 2S. D) Pelo menos 80% das observações de X diferem de X em valor absoluto por menos que 2S. E) Pelo menos 90% das observações de X diferem de X em valor absoluto por menos que 2S. Resolução Note que todas as opções envolvem a seguinte frase padrão: “pelo menos Y% das observações de X diferem de X em valor absoluto por menos que 2S”. Vamos equacionar esta frase? Fica da seguinte forma: %Y]S2|XX[|P ≥<− A expressão acima sugere que trata-se de uma questão que cobra a aplicação da desigualdade de Chebyshev. Vamos relembrar a definição da desigualdade? Seja X uma variável aleatória com média μ e variância σ2. Então, para qualquer δ > 0 valem as seguintes relações: 2 2 ]|X[|P δ σ≤δ≥μ− ou 2 2 1]|X[|P δ σ−≥δ<μ− . Observe que as expressões ∑ = = n 1i iXn 1X e 2 n 1i i 2 )XX( n 1S ∑ = −= correspondem, respectivamente, à média aritmética e a variância de um conjunto de dados X1,...,Xn que foram vistas na aula demonstrativa. Suponha que você tenha à sua disposição um número n muito grande de observações da variável aleatória X. Neste caso, é razoável supor que μ≈X e 22S σ≈ (é assim que a gente faz na prática!). Substituindo μ≈X , 22S σ≈ e S2=δ na desigualdade, obtemos 2 2 )S2( S1]S2|XX[|P −≥<− ⇒ 2 2 S4 S1]S2|XX[|P −≥<− ⇒ 4 11]S2|XX[|P −≥<− ⇒ 4 3]S2|XX[|P ≥<− Pacote de Teoria e Exercícios para Analista do BACEN – Área 2 Estatística – Prof. Alexandre Lima Prof. Alexandre Lima www.pontodosconcursos.com.br 22 ⇒ %75]S2|XX[|P ≥<− Concluímos que pelo menos 75% das observações de X diferem de X em valor absoluto por menos que 2S. GABARITO: C 4 Distribuições de Probabilidade Daqui para frente, usaremos o termo distribuição como sendo sinônimo de função de probabilidade,o que é usual na literatura da área. 4.1 Distribuições Discretas Distribuição de Bernoulli Considere os seguintes experimentos: • uma moeda é lançada: o resultado ou é cara, ou não (ou seja, é coroa); • um dado é lançado: ou ocorre a face 6 ou não (neste caso, ocorre uma das faces 1, 2, 3, 4 ou 5); • uma pessoa escolhida ao acaso dentre 10.000 é ou não do sexo feminino; • uma peça é selecionada ao acaso de um lote contendo 1.000 peças: essa peça é defeituosa ou não. Em todos os casos acima, estamos interessados na ocorrência de uma determinada característica. Se essa característica é observada, então temos a ocorrência de sucesso (cara, face 6, pessoa do sexo feminino e peça defeituosa) ou fracasso (coroa, face diferente de 6, pessoa do sexo masculino e peça não defeituosa). Para cada experimento acima, podemos definir uma variável aleatória X que assume apenas dois valores: 1, se ocorrer sucesso, e 0, se ocorrer fracasso. Indicaremos por p a probabilidade de sucesso, ou seja, P(sucesso) = P(X=1) = p, 0<p<1. A probabilidade de fracasso é P(X=0) = 1–p = q. Definição: a variável aleatória X, que assume apenas os valores 0 e 1, com função de probabilidade f(x) tal que: (14) ⎩⎨ ⎧ ==== =−==== p)1X(P)1x(f qp1)0X(P)0x(f é chamada variável aleatória de Bernouilli. Pacote de Teoria e Exercícios para Analista do BACEN – Área 2 Estatística – Prof. Alexandre Lima Prof. Alexandre Lima www.pontodosconcursos.com.br 23 Demonstra-se que: • E(X) = p; • Var(X) = p – p2 = p(1–p) = pq • ⎪⎩ ⎪⎨ ⎧ ≥ <≤− < = 1x,1 1x0,p1 0x,0 )x(F Exemplo. Um dado perfeito é lançado: ou ocorre a face 6 ou não. Então teremos P(X=0) = q = 5/6 e P(X=1) = p = 1/6. A média é E(X) = p = 1/6. A variância é Var(X) = pq = (1/6).(5/6) = 5/36. Nota: experimentos que resultam numa variável aleatória de Bernoulli são denominados ensaios ou tentativas de Bernoulli. A Tabela a seguir fornece a média, a variância e o desvio padrão da Distribuição de Bernoulli. Tabela: Caracterização da Distribuição de Bernoulli Média p)X(E = Variância pq)X(Var = Desvio Padrão pq)X(σ = Distribuição Binomial Considere os seguintes experimentos e variáveis aleatórias: 1. Jogue uma moeda 50 vezes. Seja X = número de caras obtidas. 2. Nos próximos 30 nascimentos em uma maternidade, seja X = número de nascimentos de meninos. Cada um desses experimentos pode ser pensado como consistindo em uma série de tentativas de Bernoulli: 50 arremessos de moedas no experimento (1) e 30 nascimentos de bebês no experimento (2). A variável aleatória em cada caso é uma contagem do número de tentativas que satisfazem um determinado critério. O resultado de cada tentativa satisfaz ou não o critério que X conta; por conseguinte, cada tentativa pode ser sumarizada como resultando em um sucesso ou um fracasso (falha ou insucesso), respectivamente. Por exemplo, sucesso, no experimento (1), é a obtenção de Pacote de Teoria e Exercícios para Analista do BACEN – Área 2 Estatística – Prof. Alexandre Lima Prof. Alexandre Lima www.pontodosconcursos.com.br 24 cara no lançamento da moeda. No experimento (2), o nascimento de uma menina é um fracasso. Como já visto, uma tentativa com somente dois resultados possíveis é denominada ensaio de Bernoulli. Considera-se que as tentativas que constituem o experimento aleatório sejam independentes. Ou seja, o resultado de uma tentativa não tem efeito sobre o resultado da tentativa seguinte. Além disso, admitimos que a probabilidade de um sucesso em cada tentativa seja constante. Definição: Um experimento aleatório, consistindo em n repetidas tentativas, de modo que (1) as tentativas sejam independentes, (2) cada tentativa resulte em somente dois resultados possíveis, designados por “sucesso” e “fracasso”, (3) a probabilidade de um sucesso em cada tentativa seja p é chamado de experimento Binomial. A variável aleatória X, que conta o número de sucessos em n tentativas, tem distribuição binomial com parâmetros p e n. A função de probabilidade de X (distribuição binomial) é (15) xnx )p1(p x n )x(f −⎟ −⎟⎠ ⎜ ⎞⎜⎝ ⎛= , n,...,2,1,0x = Se fizermos (1-p) = q (é a probabilidade de insucesso em uma tentativa) em (15), obtemos (16) xnxqp x n )x(f −⎟⎟⎠ ⎞⎜⎜⎝ ⎛= , n,...,2,1,0x = . Alguns autores optam por definir a distribuição binomial (15) como a probabilidade de se ter k sucessos em n tentativas: knk )p1(p k n )kX(P −⎟ −⎟⎠ ⎜ ⎞⎜⎝ ⎛== . A figura a seguir mostra a distribuição da Binomial para n=10 e p=1/2. Pacote de Teoria e Exercícios para Analista do BACEN – Área 2 Estatística – Prof. Alexandre Lima Prof. Alexandre Lima www.pontodosconcursos.com.br 25 0 1 2 3 4 5 6 7 8 9 10 0 0.05 0.1 0.15 0.2 0.25 Binomial: n=10 e p=1/2 A distribuição binomial é uma extensão direta da Distribuição de Bernoulli, uma vez que o experimento aleatório que caracteriza a binomial nada mais é do que um Experimento de Bernoulli repetido n vezes. A Tabela a seguir fornece a média, a variância e o desvio padrão da Distribuição Binomial. Tabela: Caracterização da Binomial Média np)X(E = Variância npq)X(Var = Desvio Padrão npq)X(σ = Exemplo. A probabilidade de obter exatamente 2 caras em 6 lançamentos de uma moeda não viciada é (n=6, p=0,5) 2344,0625,025,0 )12()1234( 1234565,05,0 2 6 )2x(f)2X(P 42 =××××××× ×××××=⎟ ×⎟⎠ ⎜ ⎞⎜⎝ ⎛==== . Exemplo. A probabilidade de obter pelo menos 5 caras em 6 lances de uma moeda não viciada é P(X=5 ou X=6) = .1094,00156,00938,05,05,0 6 6 5,05,0 5 6 )6(f)5(f 065 =+=⎟ ×⎟⎠ ⎜ ⎞⎜⎝ ⎛+⎟ ×⎟⎠ ⎜ ⎞⎜⎝ ⎛=+= Exemplo (ICMS-RJ/2010/FGV). 40% dos eleitores de uma certa população votaram, na última eleição, num certo candidato A. Se cinco eleitores forem escolhidos ao acaso, com reposição, a probabilidade de que três tenham votado no candidato A é igual a: Pacote de Teoria e Exercícios para Analista do BACEN – Área 2 Estatística – Prof. Alexandre Lima Prof. Alexandre Lima www.pontodosconcursos.com.br 26 A) 12,48%. B) 17,58%. C) 23,04%. D) 25,78%. E) 28,64%. Resolução A probabilidade de que três eleitores tenham votado no candidato A (k=3 “sucessos”) em n=5 tentativas, sendo p=0,4 (probabilidade de sucesso), é dada pela distribuição binomial knk )p1(p k n )kX(P −⎟ −⎟⎠ ⎜ ⎞⎜⎝ ⎛== Logo, %04,23)4,01(4,0 3 5 )3X(P 23 =−⎟⎟⎠ ⎞⎜⎜⎝ ⎛== GABARITO: C Exemplo (Analista/SUSEP/2006/ESAF). Um grupo de 1.000 pessoas tem a seguinte composição etária (em anos): - [0 - 20]: 200 pessoas; - [21 - 30]: 200 pessoas; - [31 - 40]: 200 pessoas; - [41 - 50]: 200 pessoas; - de 51 anos em diante: 200 pessoas; Considerando que as probabilidades média de morte (qx), segundo uma determinada tábua, é de: - [0 - 20] até 20 anos: 0,600% o (por mil); - [21 - 30]: 0,800% o (por mil); - [31 - 40]: 1,500% o (por mil); - [41 - 50]: 5,000% o (por mil); - de 51 anos em diante: 20,000% o (por mil). Pode-se afirmar que a possibilidade de ocorrer a morte de exatamente 10 pessoas com idade superior a 51 anos é um evento: (A) Certo. Pacote de Teoria e Exercícios para Analista do BACEN – Área 2 Estatística – Prof. Alexandre Lima Prof. Alexandre Lima www.pontodosconcursos.com.br 27 (B) Impossível. (C) Provável. (D) Muito Provável. (E) Pouco Provável. Resolução O problema é uma mera aplicação da Lei Binomial. Seja X a variável aleatória que denota o número de mortes de pessoas com idade de 51 anos em diante. Neste caso, temos um “sucesso” quando alguém desta faixa etária morre. A probabilidade de sucesso é 02,0100/2000.1/20qx === . Lembreque a distribuição binomial é dada pela fórmula (probabilidade de X = k sucessos) kn x k x )q1()q(k n )kX(P −−⎟⎟⎠ ⎞⎜⎜⎝ ⎛== Logo, a possibilidade de ocorrer a morte de exatamente 10 pessoas com idade superior a 51 anos é dada por 19010 98,002,0 10 200 )10X(P ×⎟×⎟⎠ ⎞⎜⎜⎝ ⎛== Como é proibido usar calculadora na prova, deve-se partir para uma análise qualitativa dos fatores da probabilidade P(X = 10): - ⎟⎟⎠ ⎞⎜⎜⎝ ⎛ 10 200 representa um número muito grande; - 0,0210 representa um número “absurdamente” próximo de zero, ou seja, é um infinitesimal; - 0,98100 representa um número próximo de zero, pois elevar um número menor que 1, ainda que bastante próximo da unidade, à centésima potência, resulta em um valor próximo de zero. Note que, se 0,0210 é um infinitesimal, então o produto 19010 98,002,0 × também é um infinitesimal (ainda mais próximo de zero que 0,0210). Assim, o número 19010 98,002,0 10 200 ×⎟ ×⎟⎠ ⎞⎜⎜⎝ ⎛ deve estar próximo de zero, pois corresponde ao produto de um valor muito grande por um infinitesimal. Ou seja, 19010 98,002,0 10 200 ×⎟ ×⎟⎠ ⎞⎜⎜⎝ ⎛ é um valor “pouco provável” (opção E). Nota: obtivemos 31095,4)10X(P −×≈= com uma calculadora científica. Pacote de Teoria e Exercícios para Analista do BACEN – Área 2 Estatística – Prof. Alexandre Lima Prof. Alexandre Lima www.pontodosconcursos.com.br 28 GABARITO: E Já caiu em prova! (BACEN/Área 3/2010/CESGRANRIO) Sobre variáveis aleatórias, considere as afirmações a seguir. I - Para toda e qualquer variável aleatória, sua função de densidade de probabilidade fornece a probabilidade de ocorrência de cada valor da variável aleatória considerada, exceto no caso de variáveis aleatórias contínuas, para as quais a probabilidade de ocorrência de um valor específico é zero. II - A esperança matemática (expectância) de uma variável aleatória discreta, ou seja, seu valor esperado, é a média dessa variável aleatória, que é definida como um n-avos do somatório dos valores possíveis dessa variável multiplicados por suas respectivas probabilidades. III- A distribuição binomial é uma extensão direta da Distribuição de Bernoulli, uma vez que o experimento aleatório que caracteriza a binomial nada mais é do que um Experimento de Bernoulli repetido n vezes. É correto APENAS o que se afirma em (A) II. (B) III. (C) I e II. (D) I e III. (E) II e III. Resolução Análise das afirmativas: I- Não é correto afirmar que “Para toda e qualquer variável aleatória, sua função de densidade de probabilidade fornece a probabilidade de ocorrência de cada valor da variável aleatória considerada (...)” A afirmativa correta seria: Para uma variável aleatória discreta, sua função de probabilidade fornece a probabilidade de ocorrência de cada valor da variável aleatória considerada (...) Pacote de Teoria e Exercícios para Analista do BACEN – Área 2 Estatística – Prof. Alexandre Lima Prof. Alexandre Lima www.pontodosconcursos.com.br 29 Ou seja, é incorreto afirmar que uma variável aleatória discreta possui uma função densidade de probabilidade. Este tipo de função só é definida para variáveis aleatórias contínuas. Vamos aproveitar a oportunidade para formalizar o conceito de função de probabilidade. Seja x um valor da variável aleatória X e f(x) a probabilidade de X tomar o valor x. Então o conjunto {xi, f(xi), i=1,2,...,n} é denominado função de probabilidade (*) da variável aleatória X (**). (*) Na literatura, é bastante comum o uso da terminologia distribuição de probabilidades no lugar de função de probabilidade. (**) A definição apresentada é rigorosa. Contudo, é comum (e não é considerado errado!) chamar f(x) de função de probabilidade. II- Afirmativa incorreta. A afirmativa correta seria: A esperança matemática (expectância) de uma variável aleatória discreta, ou seja, seu valor esperado, é a média dessa variável aleatória, que é definida como o somatório dos valores possíveis dessa variável multiplicados por suas respectivas probabilidades III- Afirmativa correta. Sem maiores comentários. GABARITO: B Distribuição de Poisson A distribuição de Poisson com parâmetro a (a > 0) é dada por (17) !x ae)x(f x a−= ...3,2,1,0x = . A Tabela a seguir fornece a média, a variância e o desvio padrão da Distribuição de Poisson. Tabela: Caracterização da Poisson Média a)X(E = Variância a)X(Var = Desvio Padrão a)X(σ = Repare que a média é igual a variância, e que ambas são iguais ao parâmetro a. Pacote de Teoria e Exercícios para Analista do BACEN – Área 2 Estatística – Prof. Alexandre Lima Prof. Alexandre Lima www.pontodosconcursos.com.br 30 Com λτ=a em (17), em que λ é o número médio de eventos por unidade da grandeza τ e τ é o tamanho do intervalo (t, t+τ), a probabilidade de ocorrerem x eventos em τ é (18) , !x )(e)x(f xλτ= λτ− ,0≥τ ...3,2,1,0x = . A Eq. (18) caracteriza o processo de contagem de Poisson, o qual é apropriado para aplicações que envolvam a contagem do número de vezes que um evento aleatório ocorre em um dado intervalo de tempo, distância, área, etc. Algumas aplicações que envolvem a distribuição de Poisson incluem o número de clicks por segundo de um contador Geiger, o número de pessoas que entram em uma loja em uma hora e o número de falhas por 1.000 metros de fita de vídeo. Neste ponto, estamos prontos para apresentar a definição formal da Lei ou Distribuição de Poisson, o que será feito a seguir. Seja a contagem do número de ocorrências de eventos no intervalo (t, t+τ). Se o intervalo puder ser dividido em subintervalos suficientemente pequenos tal que (1) a probabilidade de mais de uma contagem em um subintervalo seja zero, (2) a probabilidade de uma contagem em um subintervalo seja a mesma para todos os subintervalos e proporcional ao comprimento do subintervalo e (3) a contagem em cada subintervalo seja independente de outros subintervalos, então esse experimento aleatório será designado por processo de Poisson. Se o número médio de contagens no intervalo for a > 0, a variável aleatória X, que representa o número de contagens no intervalo, terá uma distribuição de Poisson, com parâmetro a, dada por (17). De forma geral, a grandeza t do intervalo (t, t+τ) pode representar tempo, volume, distância, etc. Ou seja, o processo de Poisson não é necessariamente um processo de contagem no tempo. Nota: na literatura (e também nas provas!), é bastante comum encontrarmos a seguinte definição para a Lei (distribuição) de Poisson: !x e)x(f xλ= λ− , ...3,2,1,0x = Observe que a fórmula acima pode ser obtida a partir de (17) fazendo-se a = λ. Neste caso, subentende-se que o intervalo de contagem é unitário, ou seja, τ = 1. Pacote de Teoria e Exercícios para Analista do BACEN – Área 2 Estatística – Prof. Alexandre Lima Prof. Alexandre Lima www.pontodosconcursos.com.br 31 A figura a seguir representa a distribuição de Poisson com λ = 5 (utilizamos a definição !x/e)x(f xλ= λ− ). 0 5 10 15 0 0.02 0.04 0.06 0.08 0.1 0.12 0.14 0.16 0.18 Poisson, λ=5 Exemplo. Suponha que o número de falhas em um fio delgado de cobre siga a distribuição de Poisson, com uma média de 2,3 falhas por milímetro. Calcule a probabilidade de existirem exatamente 2 falhas em 1 milímetro de fio. Dados: λ = 2,3 falhas/mm. ⇒ .2652,0 !2 3,2e)2(f)2X(P 2 3,2 ==== − Exemplo. Considerando os dados do exemplo anterior, determine a probabilidade de ocorrerem 10 falhas em 5 milímetros de fio. λ = 2,3 falhas/mm; τ = 5mm ⇒ λτ = a = 11,5 falhas. .1129,0 !10 5,11e)10X(P 10 5,11 =×== −Exemplo (AFRFB/2009/ESAF) O número de petroleiros que chegam a uma refinaria ocorre segundo uma distribuição de Poisson, com média de dois petroleiros por dia. Desse modo, a probabilidade de a refinaria receber no máximo três petroleiros em dois dias é igual a: A) 4e 73 32 − B) 4e 71 3 Pacote de Teoria e Exercícios para Analista do BACEN – Área 2 Estatística – Prof. Alexandre Lima Prof. Alexandre Lima www.pontodosconcursos.com.br 32 C) 4e 3 71 − D) 3e 3 71 − E) 2e 3 32 − Resolução Aprendemos que a distribuição de Poisson pode ser dada por , !x )(e)x(f xλτ= λτ− ,0≥τ ...3,2,1,0x = . em que λ denota a taxa média de ocorrência dos eventos por unidade de tempo e τ é o tamanho do intervalo (t, t+τ). Dados da questão: - λ = dois petroleiros por dia; - τ = 2 dias. Portanto, λτ = 2 x 2 = 4 petroleiros. A probabilidade de a refinaria receber no máximo três petroleiros em dois dias, denotada por P(X≤3), é dada por P(X≤3) = f(0) + f(1) + f(2) + f(3) 44 3 4 2 4 1 4 0 4 e 3 71 6 64 2 1641e !3 4e !2 4e !1 4e !0 4e)3X(P −−−−−− =⎟⎠ ⎞⎜⎝ ⎛ +++=+++=≤ GABARITO: C Exemplo (ICMS-SP/2009/FCC) O número de pessoas que chega ao guichê de uma repartição pública para autuação de processos apresenta uma distribuição de Poisson a uma taxa de duas pessoas por minuto. A probabilidade de que nos próximos 2 minutos chegue pelo menos uma pessoa neste guichê é A) (e4 - 1).e-4 Observação: B) 4e-4 e = 2,71828... C) (e4 - 4).e-4 D) 2[(e2 - 1)].e-2 E) (e2 - 2).e-2 Pacote de Teoria e Exercícios para Analista do BACEN – Área 2 Estatística – Prof. Alexandre Lima Prof. Alexandre Lima www.pontodosconcursos.com.br 33 Resolução A distribuição de Poisson com parâmetro a (a > 0) é dada por !x ae)x(f x a−= ...3,2,1,0x = . Com λτ=a , em que λ é o número médio de eventos por unidade da grandeza τ e τ é o tamanho do intervalo (t, t+τ), a probabilidade de ocorrerem x eventos em τ é , !x )(e)x(f xλτ= λτ− ,0≥τ ...3,2,1,0x = . Dados: 2=λ pessoas/minuto, 2=τ minutos ∴ 4=λτ pessoas. A probabilidade de que nos próximos 2 minutos chegue pelo menos uma pessoa é dada por: P(X ≥ 1) = 1 – P(X = 0) )1e(ee1)1X(Pe !0 )2(e)0(f)0X(P 4444 0 4 −=−=≥∴=λ=== −−−− . GABARITO: A Exemplo (ICMS-RJ/2009/FGV) O número de clientes que buscam, em cada dia, os serviços de um renomado cirurgião tem uma distribuição de Poisson com média de 2 pacientes por dia. Para cada cirurgia efetuada, o cirurgião recebe R$ 10.000,00. No entanto, ele consegue fazer o máximo de duas cirurgias em um dia; clientes excedentes são perdidos para outros para outros cirurgiões. Assinale a alternativa que indique o valor esperado da receita diária do cirurgião. (considere e-2 = 0,14) A) R$ 5.600,00 B) R$ 8.400,00 C) R$ 10.000,00 D) R$ 14.400,00 E) R$ 20.000,00 Pacote de Teoria e Exercícios para Analista do BACEN – Área 2 Estatística – Prof. Alexandre Lima Prof. Alexandre Lima www.pontodosconcursos.com.br 34 Resolução Seja R a variável aleatória que representa a receita diária do cirurgião. Essa variável aleatória só pode assumir três valores possíveis, quais sejam: r1 = R$ 0,00 (zero cirurgia), r2 = R$ 10.000,00 (uma cirurgia) e r3 = R$ 20.000,00 (duas cirurgias). Sabe-se que o valor esperado da receita diária do cirurgião, denotado por E(R), é dado pela fórmula E(R) = Σ rk f(rk) = r1 f(r1) + r2 f(r2) + r3 f(r3), em que f(r1) + f(r2) + f(r3) = 1. Os valores de r1, r2 e r3 foram dados. Calcularemos E(R) se soubermos qual é a distribuição de probabilidades f(rk) da receita diária. Será que ela é uma distribuição de Poisson? A resposta é NÃO e a justificativa é simples: a distribuição de R é discreta e possui apenas três probabilidades. A probabilidade do cirurgião não faturar num determinado dia (denotada por P(R=0)) é igual à probabilidade da variável aleatória X (que representa o número de clientes que buscam, em cada dia, o cirurgião) ser igual a zero. De acordo com o enunciado, X tem distribuição de Poisson. Logo, P(R=0)=P(X=0) é dada por: 14,0 1 114,0 !0 2)0()0( 0 2 =×≈==== −exfRP . A probabilidade de o cirurgião faturar R$ 10.000,00 num determinado dia (P(R=10.000)) é igual à probabilidade da variável aleatória X ser igual a um: 28,0 1 214,0 !1 2)1()1( 1 2 =×≈==== −exfRP . O cirurgião consegue fazer o máximo de duas cirurgias em um dia; clientes excedentes são perdidos para outros cirurgiões. Sendo assim, o cirurgião faturará R$ 20.000,00 num determinado dia caso seja procurado por 2 ou mais clientes. Portanto, P(R=20.000) = P(X ≥ 2) = 1 – [P(X = 0) + P(X = 1)] = 1 – 0,14 – 0,28 = 0,58. O valor esperado da receita diária do cirurgião é então E(R) = 0x0,14 + 10.000,00x0,28 + 20.000,00x0,58 = R$ 14.400,00 GABARITO: D Pacote de Teoria e Exercícios para Analista do BACEN – Área 2 Estatística – Prof. Alexandre Lima Prof. Alexandre Lima www.pontodosconcursos.com.br 35 Comportamento Assintótico da Lei Binomial: Lei de Poisson Suponha n>>1 (isto é, que n seja grande), p<<1 (probabilidade de sucesso próxima de zero), mas de tal forma que np permaneça constante, digamos np = a, na distribuição binomial (probabilidade de obter k sucessos em n tentativas). Neste caso, obtemos knk knk n a1 !k a)p1(p k n −− ⎟⎠ ⎞⎜⎝ ⎛ −≈⎟ −⎟⎠ ⎜ ⎞⎜⎝ ⎛ em que foi usada a aproximação kn)1kn)...(1n(n ≈−−− . No limite, para ∞→n , 0p → (admitindo-se k<<n), obtemos a kknk e !k a n a1 !k a − − →⎟⎠ ⎞⎜⎝ ⎛ − . Este resultado mostra que a distribuição Binomial pode ser aproximada pela Distribuição de Poisson quando n>>1, p<<1, np=a. Exemplo. Dez por cento das peças produzidas por um determinado processo de fabricação são defeituosas. Qual é a probabilidade de, em uma amostra de 10 peças escolhidas ao acaso, exatamente duas serem defeituosas? Probabilidade de uma peça ser defeituosa = p = 0,1 Cálculo pela Binomial .1937,09,01,0 !2!8 !109,01,0 2 10 )2(f)2X(P 8282 ==⎟⎟⎠ ⎞⎜⎜⎝ ⎛=== Cálculo por Poisson Dados: n = 10 >> 1; p = 0,1 << 1; np = a = 1 .1840,0 718,2 1 e2 1 !2 1e)2(f)2X(P 2 1 ≈≈==== − Em geral, a aproximação é boa quando p ≤ 0,1 e a = np ≤ 5. Exemplo (Analistada SUSEP/Atuária/2010/ESAF). Qual o limite de f(x) = Cn,x px(1-p)n-x, onde x =0,1,2,…,n, quando n → ∞, p → 0, e np → λ. A) f(x) = (2π)-1/2 exp(-(x - λ)2/2). B) f(x) = e-λλx/x!. C) f(x) = e-x/λ/λ. Pacote de Teoria e Exercícios para Analista do BACEN – Área 2 Estatística – Prof. Alexandre Lima Prof. Alexandre Lima www.pontodosconcursos.com.br 36 D) f(x) = λe-λx. E) f(x) = exp(-λ) xλ/x!. Resolução Esta questão aborda o comportamento assintótico da Lei Binomial (lei de Poisson). Suponha n >> 1 (isto é, que n seja grande), p << 1 (probabilidade de sucesso próxima de zero), mas de tal forma que np permaneça constante, digamos np = λ, na distribuição binomial xnx )p1(p x n )x(f −⎟ −⎟⎠ ⎜ ⎞⎜⎝ ⎛= , n,...,2,1,0x = Portanto, xn xxnx n 1 !x 1)p1(p x n −− ⎟⎠ ⎞⎜⎝ ⎛ λ−λ≈⎟ −⎟⎠ ⎜ ⎞⎜⎝ ⎛ em que kn)1kn)...(1n(n ≈+−− . No limite, para ∞→n , 0p → (admitindo-se k << n), obtemos λ− − λ→⎟⎠ ⎞⎜⎝ ⎛ λ−λ e !xn 1 !x 1 xxnx . O resultado acima mostra que a distribuição Binomial pode ser aproximada pela Distribuição de Poisson quando n >> 1, p << 1, np=λ. GABARITO: B 4.2 Distribuições Contínuas Distribuição Uniforme Uma variável aleatória contínua X com uma função densidade de probabilidade (19) ab 1)x(f −= , bxa ≤≤ tem distribuição uniforme (veja a figura aseguir). Pacote de Teoria e Exercícios para Analista do BACEN – Área 2 Estatística – Prof. Alexandre Lima Prof. Alexandre Lima www.pontodosconcursos.com.br 37 a b 1/(b-a) f(x) x A média de uma variável aleatória uniforme é (20) 2 ba ab x5,0dx ab x)X(E b a 2b a +=⎥⎦ ⎤⎢⎣ ⎡ −=−= ∫ . A variância de X é (21) 1212 )ab(dx 2 bax ab 1dx))X(Ex)(x(f)Xvar( 22b a 2 2 X Δ=−=⎟⎟⎠ ⎞⎜⎜⎝ ⎛ ⎟⎠ ⎞⎜⎝ ⎛ +−−=−= ∫∫ ∞ ∞− . em que Δ = (b – a). Nota: os limites inferior e superior da integral de (21) são a e b respectivamente, porque a função densidade de probabilidade é nula para x < a e x > b. Observe que 12 )ab( 2 bax 3 1 ab 1dx 2 bax ab 1dx 2 bax ab 1 2 b a 3b a 2b a 2 −=⎟⎟⎠ ⎞⎜⎜⎝ ⎛ ⎟⎠ ⎞⎜⎝ ⎛ +−××−⎟ =⎟⎠ ⎞⎜⎜⎝ ⎛ ⎟⎠ ⎞⎜⎝ ⎛ +−−=⎟⎟⎠ ⎞⎜⎜⎝ ⎛ ⎟⎠ ⎞⎜⎝ ⎛ +−− ∫∫ Exemplo. Uma variável aleatória contínua X representa a corrente medida em um fio delgado de cobre em miliampères. Assuma que a faixa de X seja [0, 40 mA]. Qual é a probabilidade da medida da corrente estar entre 10 e 20 mA? ⇒ 025,0 40 1 ab 1)x(f ==−= [ ] .25,0)1020(025,0x025,0dx025,0)20X10(P 20 10 20 10 =−×=×==≤≤ ∫ A Tabela a seguir sumariza a média, a variância e o desvio padrão da Distribuição Uniforme X para bxa ≤≤ . Pacote de Teoria e Exercícios para Analista do BACEN – Área 2 Estatística – Prof. Alexandre Lima Prof. Alexandre Lima www.pontodosconcursos.com.br 38 Tabela: Caracterização da Distribuição Uniforme Média 2 ba)X(E += Variância 12 )ab()X(Var 2−= Desvio Padrão 12 )ab()X( −=σ Exemplo (AFPS/2002/ESAF). A variável aleatória X tem distribuição uniforme no intervalo (0, α), onde α é uma constante maior do que 0,5. Determine o valor de α tal que F(0,5) = 0,7, sendo F(x)a função de distribuição de X. A) 3/4 B) 1/4 C) 1 D) 5/7 E) 1/2 Resolução O enunciado define a distribuição uniforme ilustrada pela figura abaixo. Sabemos que F(0,5) = P(X ≤ 0,5) = 0,7 ⇒ área sob a curva uniforme entre x = 0 e x = 0,5. Pacote de Teoria e Exercícios para Analista do BACEN – Área 2 Estatística – Prof. Alexandre Lima Prof. Alexandre Lima www.pontodosconcursos.com.br 39 Como α > 0,5, a área remanescente sob a uniforme, ou seja, a área sob a curva entre x = 0,5 e x = α, deve ser igual a 1 – 0,7 = 0,3, pois F(α) = P(X ≤ α) = 1. Então, 3,01)5,0( =α×−α ⇒ α=−α 3,05,0 ⇒ 5,03,0 =α−α ⇒ 5,02,0 =α ⇒ 7/5=α GABARITO: D Distribuição Normal Uma variável aleatória tem distribuição normal com parâmetros μ e σ2 se sua função densidade é dada por (22) 2 2 2 )x( e 2 1)x(f σ μ−− πσ= , ∞<<∞− x . Não fique assustado com a fórmula acima. Você não precisará decorá-la para a prova, pois os exercícios que envolvam a distribuição normal serão resolvidos com o auxílio de uma tabela de probabilidades, como será visto mais adiante. -3 -2 -1 0 1 2 3 0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 normal padrão Neste curso, usaremos a notação X ∼ N(μ, σ2) para indicar que X tem distribuição normal com parâmetros μ e σ2. A figura acima mostra a curva normal padrão. Repare que o seu formato é parecido com o de um sino. A distribuição normal possui as seguintes propriedades: • f(x) é simétrica em relação a μ; Pacote de Teoria e Exercícios para Analista do BACEN – Área 2 Estatística – Prof. Alexandre Lima Prof. Alexandre Lima www.pontodosconcursos.com.br 40 • f(x) tende a zero quando x → ± ∞; • o valor máximo de f(x) se dá em x = μ. Demonstra-se que os parâmetros μ e σ2 denotam a média e a variância da distribuição normal, respectivamente. Considere X ∼ N(μ, σ2) e seja a nova variável Z = (X – μ)/σ. Demonstra-se que Z tem média zero e variância 1. Não é fácil mostrar que Z também tem distribuição normal, ou seja, Z ∼ N(0, 1). Isso não será feito neste curso. Diz- se que Z tem distribuição normal padrão ou normal reduzida. Esta distribuição é muito importante para a prova. x f(x) normal Da simetria de f(x), resulta que P(X > μ) = P(X < μ) = 0,5. A figura acima mostra que: - o intervalo (μ-σ, μ+σ) contém 68,27% dos valores da distribuição normal; - o intervalo (μ-2σ, μ+2σ) contém 95,45% dos valores da distribuição normal. - o intervalo (μ-3σ, μ+3σ) contém 99,73% dos valores da distribuição normal. A função de distribuição acumulada de uma variável aleatória normal padrão é usualmente denotada por Φ(z). Ressaltamos que Pacote de Teoria e Exercícios para Analista do BACEN – Área 2 Estatística – Prof. Alexandre Lima Prof. Alexandre Lima www.pontodosconcursos.com.br 41 Φ(z) = P(Z ≤ z) = 1/2 + P(0≤ Z ≤ z). O apêndice desta aula contém tabelas auxiliares que fornecem os valores das seguintes probabilidades: i) P(Z>Zc) = 1 - Φ(Zc) (Tabela I) ii) P(0≤ Z ≤ Zc) = 1/2 - Φ(Zc) (Tabela II) Dê uma olhada nas tabelas auxiliares da normal padrão; é importante que você esteja familiarizado com o uso das tabelas! Exemplo. Seja a variável aleatória normal padrão Z e as tabelas auxiliares da normal. (1) Calcule P(Z>1,26). A Tabela II do apêndice da normal reduzida indica que P(0≤Z≤1,26) = 0,3962 = 39,62%. Logo, P(Z>1,26) = 1 - Φ(1,26) = 1 – (0,5 + 0,3962) = 1 – 0,8962 = 0,1038 (veja a figura a seguir). A Tabela I nos dá esse resultado de forma direta, pois P(Z>1,26) = 0,1038. (2) P(Z<-0,86) = 0,5 – P(0<Z<0,86) = 0,5 – 0,3051 = 0,1949. (3) P(-1,25<Z<0,37) = P(0<Z<1,25) + P(0<Z<0,37) = 0,3944 + 0,1443 = 0,5387. Forma alternativa de cálculo: P(-1,25<Z<0,37) = Φ(0,37) – Φ(-1,25) = (0,5 + 0,1443) – (0,5 – 0,3944) = 0,6443 – 0,1056 = 0,5387. (4) P(-1,96<Z<1,96) = 2 x P(0<Z<1,96) = 2 x 0,475 = 95%. Pacote de Teoria e Exercícios para Analista do BACEN – Área 2 Estatística – Prof. Alexandre Lima Prof. Alexandre Lima www.pontodosconcursos.com.br 42 Atenção: podemos generalizar o resultado (4) para qualquer variável aleatória normal X com média μ e desvio padrão σ: P(μ - 1,96σ< X <μ + 1,96σ) = 95% O resultado obtido acima será muito utilizado para resolver questões de Estatística que envolvam a distribuição normal (vide figura a seguir). Exemplo (APOFP-SP/2010/FCC/Adaptada) Instruções: para resolver às próximas duas questões utilize as informações abaixo referentes à distribuição normal padrão Z: z 1,00 1,25 1,50 1,75 2,00 2,25 P(0<Z<z) 0,34 0,39 0,43 0,46 0,48 0,49 Os salários dos empregados de uma determinada categoria profissional apresentam uma distribuição normal com média igual a R$ 1.200,00 e desvio padrão igual a R$ 160,00. A proporção dos empregados com salários superiores a R$ 1.000,00 e inferiores a R$ 1.520,00 é (A) 98% (B) 96% (C) 92% (D) 89% (E) 87% Resolução Pacote de Teoria e Exercícios para Analista do BACEN – Área 2 Estatística – Prof. Alexandre Lima Prof. Alexandre Lima www.pontodosconcursos.com.br 43 De acordo com o enunciado, a distribuição dos salários dos empregados (variável X) é normal com parâmetros μ = 1.200 (média) e σ = 160 (desvio padrão). Pede-se a proporção dos empregados com salários superiores a R$ 1.000,00 e inferiores a R$ 1.520,00, ou seja, a probabilidade P[1.000<X<1.520]. Seja a nova variável Z = (X - μ)/σ, em que Z é a normal padrão. Aprendemos que P[1.000<X<1.520] = P[(1.000-1.200)/160<Z<(1.520-1.200)/160], P[1.000<X<1.520] = P[-1,25<Z<2,00] = P[-1,25<Z<0] + P[0<Z<2,00]. A Tabela II da normal padrão fornece a seguinte probabilidade: - P[0<Z<1,25] = 0,39. Mas P[0<Z<1,25] = P[-1,25<Z<0], pois a normal padrão é simétrica em relação à origem z =0. - P[0<Z<2,00] = 0,48.Assim, P[1.000<X<1.520] = 0,39 + 0,48 = 0,87 = 87% GABARITO: E A distribuição das medidas dos cabos fabricados por uma indústria é considerada normal. Sabe-se que 7% dos cabos medem no máximo 2,4 metros e apenas 2% medem no mínimo 16,4 metros. A média das medidas destes cabos é igual a (A) 9,4 metros. (B) 8,4 metros. (C) 8,2 metros. (D) 8,0 metros. (E) 7,8 metros. Resolução Foram dadas as seguintes probabilidades: P(X<2,4) = 0,07 e P(X>16,4) = 0,02. É razoável supor que a banca tenha fornecido dois valores extremos da normal (x1=2,4 e x2=16,4) e que a média esteja situada em algum valor entre os dois extremos (uma rápida olhada nas opções confirma essa suspeita!). De acordo com a tabela, P(0<Z<1,5) = 0,43 = P(-1,5<Z<0) (lembre que a normal é simétrica). Logo, P(Z<-1,5) = 0,5 - P(-1,5<Z<0) = 0,5 – 0,43 = 0,07, o que nos leva a afirmar (sem medo de errar!) que z=-1,5 é o valor Pacote de Teoria e Exercícios para Analista do BACEN – Área 2 Estatística – Prof. Alexandre Lima Prof. Alexandre Lima www.pontodosconcursos.com.br 44 transformado de x=2,4. Similarmente, P(Z>2,0) = 0,5 - P(0<Z<2,0) = 0,5 – 0,48 = 0,02, e isto indica que z=2,0 corresponde ao valor reduzido de x=16,4. A média μ das medidas dos cabos é então determinada resolvendo-se o seguinte sistema de equações: (1) (2,4-μ)/σ = -1,5 (2) (16,4-μ)/σ = 2,0 A solução do sistema é: μ = 8,4; σ=4,0. COMENTÁRIOS ADICIONAIS O fato dos erros associados às medições serem bem modelados pela distribuição normal é um dos motivos de sua grande popularidade. Além disso, a distribuição da soma de um grande número de observações independentes e identicamente distribuídas tende para a distribuição normal. Este teorema, denominado “Teorema Central do Limite” (ou Teorema do Limite Central), será apresentado de forma mais detalhada em outra aula. GABARITO: B Exemplo (Administrador(a) Júnior Petrobrás/2007/Cespe-UnB) Considere que a vazão V de um oleoduto seja uma variável aleatória que siga uma distribuição normal com média igual a 1.000 m3 por dia e desvio-padrão igual a 500 m3 por dia. Nessa situação, julgue os itens subseqüentes. A quantidade 100 000.1V − m3 segue uma distribuição normal com média zero e desvio-padrão igual a 5. Resolução Sabemos que a quantidade 500 000.1VX −= tem distribuição normal padrão, ou seja, N(μ=0, σ2=1) . Então a quantidade 100 000.1V 500 000.1V5X5Y −=−×== também tem distribuição normal. Precisamos calcular a média e a variância da nova variável Y. Média de Y: E(Y) = E(5X) = 5E(X) = 5 x 0 = 0 ⇒ a média de Y é igual a média de X. Variância de Y: Var(Y) = Var(5X) = 52.Var(X) = 25.1 = 25. Conclusão: Y tem distribuição N(μ = 0, σ2 = 25). Se Var(y) = 25 ⇒ σY = 5. Pacote de Teoria e Exercícios para Analista do BACEN – Área 2 Estatística – Prof. Alexandre Lima Prof. Alexandre Lima www.pontodosconcursos.com.br 45 GABARITO: CERTO Propriedade reprodutiva da Distribuição Normal: se X1, X2, ..., Xn forem variáveis aleatórias normais e independentes, com E(Xi) = μi e Var(Xi) = σ2i para i =1, 2, ..., n, então Y = c1X1 + c2X2 + ... + cnXn em que c1, c2, ..., cn são constantes, será uma variável aleatória normal com média E(Y) = c1μ1 + c2μ2 + ... + cnμn e variância Var(Y) = 21c σ21 + 22c σ22 + ... + 2nc σ2n. Faça c1, c2, ..., cn = 1 Y = X1 + X2 + ... + Xn. Então a média da soma de n variáveis normais e independentes é igual à soma das n médias individuais E(Y) = μ1 + μ2 + ... + μn, e a variância da soma de n variáveis normais e independentes é igual à soma das variâncias individuais Var(Y) = σ21 + σ22 + ... + σ2n. Aproximação da Binomial pela Normal Seja a Distribuição Binomial (15). Vimos que a variável aleatória binomial X conta o número de sucessos em n tentativas. A probabilidade de sucesso em uma tentativa é p e a probabilidade de insucesso é q = 1 – p. Aprendemos que o desvio padrão de X é igual a (npq)1/2 e a média é igual np. Se “n” é grande e se “p” e “q” não estão muito próximos de zero, então a distribuição binomial é bem aproximada por uma distribuição normal padrão em que a variável transformada é dada por npq npX )X( )X(EXZ −=σ −= . Pacote de Teoria e Exercícios para Analista do BACEN – Área 2 Estatística – Prof. Alexandre Lima Prof. Alexandre Lima www.pontodosconcursos.com.br 46 Na prática, a aproximação é muito boa se np e nq forem maiores que 5. No limite, temos que ∫ −∞→ π=⎟⎟⎠ ⎞⎜⎜⎝ ⎛ ≤−≤ b a 2/u n due 2 1b npq npXaPlim 2 . A relação acima nos diz que a variável aleatória padronizada npq npXZ −= é assintoticamente normal. A aproximação da binomial pela normal é importante e será usada nas aulas de inferência estatística. Aguarde! Distribuição Qui-quadrado A distribuição qui-quadrado com parâmetro n>0 (n é um inteiro) de uma variável aleatória X é definida pelo modelo contínuo (23) 2x/2 2n exK)x(f − − χ= para x ≥ 0 ( )x(f = 0 para x < 0) em que )2n/(2 1K 2n/ Γ=χ e Γ(.) é a função gama. Não se assuste com a fórmula (23). Você não precisa decorar essa expressão porque ela não cairá na prova! Nós a colocamos nesta aula para que você saiba que a distribuição qui-quadrado possui uma expressão analítica. Na prova, será dada uma tabela de valores da qui-quadrado, caso haja alguma questão que envolva o uso dessa distribuição. Entretanto, não faremos uso da tabela da qui-quadrado nesta aula, pois esta distribuição será bastante explorada em aulas posteriores (veremos que ela tem um papel relevante na Inferência Estatística). A Eq. (23) define a família das distribuições qui-quadrado com n graus de liberdade , usualmente representada por 2nχ . A distribuição qui-quadrado está relacionada à distribuição normal. Sejam as observações X1, X2, ..., Xn provenientes de uma população normal de média μ e desvio-padrão σ2. Então a transformação (24) ∑∑ == =⎟⎠ ⎞⎜⎝ ⎛ σ μ−=χ n 1i 2 i n 1i 2 i2 n Z X tem distribuição qui-quadrado com n graus de liberdade. Note que a variável Zi em (24) é a variável aleatória normal padrão. Logo, a variável 2nχ é a soma dos Pacote de Teoria e Exercícios para Analista do BACEN – Área 2 Estatística – Prof. Alexandre Lima Prof. Alexandre Lima www.pontodosconcursos.com.br 47 quadrados de n variáveis aleatórias normais padronizadas. Não fique preocupado em entender (24) neste momento, pois a relação entre a qui- quadrado e a normal será vista em detalhe nas aulas de Inferência Estatística. A figura a seguir ilustra gráficos de densidades qui-quadrado com 1, 3, 6 e 10 graus de liberdade (curvas azul, preta, vermelha e rosa, respectivamente). 0 5 10 15 20 25 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 X1 X3 X6 X10 A Tabela a seguir fornece a média, a variância e o desvio padrão da distribuição qui-quadrado com n graus de liberdade. Tabela: Caracterização da Distribuição Qui-quadrado Média n)X(E = Variância n2)X(Var = Desvio Padrão n2)X(σ = Distribuição t de Student A distribuição t de Student com n graus de liberdade é dada por (25) ⎟⎠ ⎞⎜⎝ ⎛ +− ⎟⎟⎠ ⎞⎜⎜⎝ ⎛ += 2 1n 2 st n x1K)x(f em que [ ] πn)2n/(Γ 2/)1n(ΓKst += . Pacote de Teoria e Exercícios para Analista do BACEN – Área 2 Estatística – Prof. Alexandre Lima Prof. Alexandre Lima www.pontodosconcursos.com.br 48 Na prova, também deverá ser dada a tabela de valores da distribuição t de Student caso haja alguma questão que envolva o uso dessa distribuição. Não trabalharemos com a tabela da t de Student neste momento, pois este tópico será visto quandoestudarmos a Inferência Estatística. A figura a seguir mostra os gráficos da distribuição t de Student para 1, 10 e 20 graus de liberdade (curvas azul, verde e vermelha, respectivamente). Note que o formato da t de Student se aproxima da normal (curva preta tracejada) conforme aumenta o número de graus de liberdade. -3 -2 -1 0 1 2 3 0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 normal t1 t10 t20 Veremos posteriormente por que a distribuição t de Student é relevante no estudo da Estatística Indutiva. Mas é bom que você comece a se familiarizar com variáveis aleatórias do tipo t de Student desde já. Como elas surgem na Estatística? Esta pergunta será respondida de forma sucinta a seguir. Considere um conjunto de n valores retirados de uma população normal de média μ e desvio-padrão σ. Defina a variável n/S Xt μ−= , em que X e S denotam a média aritmética e o desvio-padrão das n observações, respectivamente. Veremos que a distribuição de t não é normal, apesar da fórmula acima ser similar à da normal reduzida. De fato, trata-se de uma variável com distribuição t de Student. Esta distribuição é simétrica e tem média nula, assim como a normal padrão. Pacote de Teoria e Exercícios para Analista do BACEN – Área 2 Estatística – Prof. Alexandre Lima Prof. Alexandre Lima www.pontodosconcursos.com.br 49 Distribuição F de Snedecor Define-se a variável F com n1 graus de liberdade no numerador e n2 graus de liberdade no denominador, ou simplesmente, 21 n,n F , por (26) 2 2 1 2 ,nn /n /n F 2n 1n 21 χ χ= onde 2 in χ designa uma variável aleatória com distribuição qui-quadrado com ni graus de liberdade. A figura abaixo mostra a densidade F3,5. 0 1 2 3 4 5 6 7 8 9 10 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 F3,5 A distribuição F de Snedecor tem um papel importante na Inferência Estatística. Estudaremos essa distribuição com mais detalhes em aulas posteriores. Distribuição Log-Normal A distribuição log-normal está relacionada à normal. Se X é log-normal com parâmetros µ e σ2, então ln(X) é normal com parâmetros µ e σ2. A densidade de probabilidade log-normal é dada por (27) 2 2 2 )x(ln e 2x 1)x(f σ μ−− πσ= , 0x > . A distribuição log-normal é aplicável quando a quantidade de interesse é positiva, haja vista que ln(X) existe somente quando a variável X é positiva. Os economistas frequentemente utilizam a log-normal para modelar a distribuição de renda. Pacote de Teoria e Exercícios para Analista do BACEN – Área 2 Estatística – Prof. Alexandre Lima Prof. Alexandre Lima www.pontodosconcursos.com.br 50 Suponha que a renda anual das famílias paulistas de 4 pessoas, denotada por X, seja bem ajustada pela distribuição log-normal com µ = ln(20.000) e σ2 = 1. Então a figura a seguir mostra o plot da densidade da renda. 0 $30,000 $60,000 $90,000 $120,000 0 0.5 1 1.5 2 2.5 3 3.5 x 10-5 log-normal A Tabela a seguir fornece a média e a variância da distribuição log-normal. Tabela: Caracterização da Distribuição Log-Normal Média 2 2 e)X(E σ+μ= Variância ( ) 22 2e1e)X(Var σ+μσ −= Exemplo (CVM/2000/ESAF) Acredita-se que o logaritmo neperiano da variável renda (X), medida em milhares de reais, tenha distribuição populacional normal com média 2 e variância unitária. Assinale a opção que corresponde ao valor esperado de X. Em todas as opções a constante e representa a base do sistema de logaritmos neperiano. (A) e2,5 (B) e2,0 (C) loge 2,0 (D) 1+ loge 2,0 (E) e3,0 Resolução Se X é log-normal com parâmetros µ e σ2, então Y=ln(X) é normal com parâmetros µ e σ2. De acordo com o enunciado, a distribuição da Y tem µ=2 e Pacote de Teoria e Exercícios para Analista do BACEN – Área 2 Estatística – Prof. Alexandre Lima Prof. Alexandre Lima www.pontodosconcursos.com.br 51 σ2=1. Sabemos que ( )2/exp)X(E 2σ+μ= para X log-normal. Então, 5,2e)2/12exp()X(E =+= . GABARITO: A 5 Resumo - Uma função discreta de probabilidade f(xi) (i=1,2,...,n) satisfaz às seguintes condições: 0 ≤ f(xi) ≤ 1 e ∑i f(xi) = 1. - A função de distribuição (ou acumulada) de probabilidade F(x) de uma variável aleatória X é definida por F(x) = P(X≤x). - A área sob a função densidade de probabilidade de uma variável aleatória contínua X é igual a 1, ou seja, ∫∞ ∞− = 1dx)x(f . Além disso, f(x) não pode ser negativa (f(x) ≥ 0). - A função densidade de probabilidade de uma variável aleatória contínua X é igual à derivada da função de distribuição de X em relação a x, ou seja, f(x) = dF(x)/dx = F(x)’ - ∫=≤≤ b a dx)x(f]bXa[P . - Se X for uma variável aleatória discreta que pode tomar os valores x1, x2, ..., xn com probabilidades f(x1), f(x2), ..., f(xn), então a média (ou valor esperado) de X é definida por ∑ = =+++= n 1i iinn211 )x(fx)x(fx...)2x(fx)x(fx]X[E . - A média de uma variável aleatória contínua X com densidade de probabilidade fX(x) é dada pela integral ∫∞∞−= dx)x(xf]X[E . - Sejam “a” e “c” valores constantes e X uma variável aleatória. Então a média possui as seguintes propriedades: • c]c[E = ⇒ a média de um número qualquer “c” é o próprio número “c”; • ]X[cE]cX[E = ⇒ a média de uma variável multiplicada por um número é igual ao número multiplicado pela média de X; Pacote de Teoria e Exercícios para Analista do BACEN – Área 2 Estatística – Prof. Alexandre Lima Prof. Alexandre Lima www.pontodosconcursos.com.br 52 • ]X[cEa]cXa[E +=+ ⇒ a média da soma de um número qualquer “a” com a variável X multiplicada por um número qualquer c é igual à soma do número “a” com a média de X multiplicada por “c”. - var(X) = E(X2) – μ2 ⇒ a variância de X é igual a média do quadrado de X subtraída da média de X ao quadrado. - Sejam “a” e “c” constantes, X uma variável aleatória e Z = a + cX (Z é uma transformação linear da variável X). Então var(a+cX) = c2var(X). - A raiz quadrada positiva da variância é chamada de desvio-padrão ou erro- padrão, sendo denotada pelo símbolo σ. - Desigualdade de Chebyshev: seja X uma variável aleatória com média μ e variância σ2. Então temos, para qualquer δ > 0: .]|X[|P 2 2 δ σ≤δ≥μ− - Variável aleatória de Bernoulli: ⎩⎨ ⎧ ==== =−==== p)1X(P)1x(f qp1)0X(P)0x(f - Tabela: Caracterização da Bernoulli Média p=μ Variância pq2 =σ Desvio Padrão pq=σ - A Distribuição Binomial nos dá a probabilidade de k sucessos em n tentativas: knk )p1(p k n )kX(P −⎟ −⎟⎠ ⎜ ⎞⎜⎝ ⎛== . - Tabela: Caracterização da Binomial Média np=μ Variância 2 npq=σ Desvio Padrão =σ npq - Distribuição de Poisson com parâmetro a > 0: !x ae)x(f x a−= , ...3,2,1,0x = . Lembre que a = λτ, em que λ denota o número médio de eventos por unidade de tempo. Se fizermos τ = 1, obtemos !x e)x(f xλ= λ− . - Tabela: Caracterização da Poisson Pacote de Teoria e Exercícios para Analista do BACEN – Área 2 Estatística – Prof. Alexandre Lima Prof. Alexandre Lima www.pontodosconcursos.com.br 53 Média a=μ Variância a2 =σ Desvio Padrão a=σ - A Binomial pode ser aproximada pela Poisson se n>>1 (número de tentativas é grande) e p<<1 (probabilidade de sucesso próxima de zero). Então o parâmetro “a” da Poisson aproximante é dado por np=a. A aproximação é boa quando p ≤ 0,1 e a = np ≤ 5. - X ∼ N(μ, σ2) denota uma variável aleatória X com distribuição normal com média μ e variância σ2. - A normal padrão Z ∼ N(0, 1) é obtida através da transformação Z=(X-μ)/σ. - A normal é simétrica em relação à sua média, de modo que P(X≤μ) = P(X>μ) = 50% =1/2. - Se X é normal, então P(μ - 1,96σ<X<μ + 1,96σ)
Compartilhar