Baixe o app para aproveitar ainda mais
Prévia do material em texto
MOQ-13 PROBABILIDADE E ESTATÍSTICA Professor: Rodrigo A. Scarpel rodrigo@ita.br www.mec.ita.br/~rodrigo ProgramaPrograma do do cursocurso:: Regressão linear simples e correlação. Aplicações de modelos de regressão linear.15 e 16 Prova14 Feriado (4/6)13 Testes não-paramétricos (associação, independência e de aderência).12 Testes de Hipóteses. Inferência baseada em 2 amostras (entre parâmetros de populações distintas).11 Propriedades dos estimadores. Intervalos de confiança (estimação por intervalo). Tamanho da amostra. Princípios de testes de hipóteses.10 Amostras aleatórias. Distribuições amostrais. Teorema do limite central. Variáveis aleatórias Qui-quadrado e t-Student.9 Princípios de estatística. Estimadores e estimativas. Estimação pontual de parâmetros (Métodos dos momentos e da máxima verossimilhança). Estatística Descritiva.8 Prova7 Variáveis aleatórias conjuntas, função distribuição conjunta e marginal. Independência estatística. Covariância e Coeficiente de Correlação.6 Feriado (2/4)5 Principais distribuições de probabilidade contínuas (Exponencial negativa e Normal).4 Valor esperado e variância. Momentos de uma variável aleatória. Função geradora de momentos. Principais distribuições de probabilidade discretas (Bernoulli, Binomial e Poisson).3 Teorema da probabilidade total e teorema de Bayes. Variáveis aleatórias. Distribuições de probabilidade. Funções massa, densidade, e distribuição acumulada. Funções de variáveis aleatórias.2 Introdução à probabilidade (eventos, espaço amostral, axiomas, propriedades, probabilidade condicional e independência).1 ConteúdoSemanas Professor: Rodrigo A. Scarpel rodrigo@ita.br www.mec.ita.br/~rodrigo DISTRIBUIÇÕES AMOSTRAIS Estatísticas e suas distribuições: �Quando estudamos estatística descritiva, observamos uma amostra única (x1, x2, …,xn) de tamanho n da população para obter estimativas pontuais dos momentos amostrais (x e s2). �Se selecionarmos 2 amostras (cada uma de tamanho n) é de se esperar que as observações da segunda amostra serão diferentes das observações da primeira amostra. Por exemplo: Amostra 1 (n=3 carros) →→→→ x1=30,7 x2=29,4 x3=31,1 Amostra 2 (n=3 carros) →→→→ x1=28,8 x2=30,0 x3=31,3 �Essas estimativas pontuais são utilizadas para fazer inferências em relação ao valor esperado e ao desvio-padrão / variância da população, os quais são desconhecidos. Estatísticas e suas distribuições: �Def: ESTATÍSTICA é qualquer quantidade cujo valor pode ser calculado a partir de uma amostra. Como há incerteza em relação a esses valores toda estatística é uma variável aleatória (iid). �Toda estatística, por ser uma variável aleatória, tem uma distribuição de probabilidade. A distribuição de probabilidade de uma estatística é chamada distribuição amostral. �Def: Distribuição amostral é a distribuição de probabilidade de uma estatística e descreve como o valor da estatística varia em função das amostras selecionadas. �A distribuição amostral depende da distribuição de probabilidade da população, do tamanho da amostra e do método de amostragem (neste curso vamos estudar apenas a aleatória) Distribuição da média amostral (x): � Sejam x1, x2, …, xn n elementos de uma amostra aleatória de uma população normal com parâmetros E[x] = µµµµ e Var[x] = σσσσ2. Então: i. E[ x ] = µµµµ ii. Var[ x ] = σσσσ2/n iii. To = x1 + … + xn , E[To] = nµµµµ, Var[To] = nσσσσ2 � De acordo com i a distribuição amostral de x é centrada no valor esperado da população da qual a amostra foi selecionada, com ii que a distribuição se torna mais concentrada em torno de µµµµ com o crescimento do tamanho da amostra (n). � Proposição: Seja x1, x2, …, xn uma amostra aleatória de uma população normal com E[x] = µµµµ e Var[x] = σσσσ2, então, para qualquer n: n Nx 2 ,~ σµ ( )2,~ σµ nnNTo Distribuição da média amostral (x): Z n x ~ σ µ− ⇒ Z n nTo ~ σ µ− ⇒ X P(X) A B Menor Menor tamanho tamanho de de amostraamostra Maior Maior tamanho tamanho de de amostraamostra µµµµµµµµ X P(X) A B Menor Menor tamanho tamanho de de amostraamostra Maior Maior tamanho tamanho de de amostraamostra µµµµµµµµ X P(X) A B Menor Menor tamanho tamanho de de amostraamostra Maior Maior tamanho tamanho de de amostraamostra µµµµµµµµ X P(X) A B Menor Menor tamanho tamanho de de amostraamostra Maior Maior tamanho tamanho de de amostraamostra µµµµµµµµ � Sendo Y = a1X1 +…+ anXn ⇒⇒⇒⇒ E[Y] = a1E[X1] +…+ anE[Xn] = a1µµµµ1+ … + anµµµµn Distribuição de uma combinação linear de v.as: Se as variáveis aleatórias são independentes, Var[a1X1 +…+ anXn] = a12Var[X1] + … + an2Var[Xn] �Distribuição da diferença entre médias de populações normais: Sejam A e B duas populações normais com parâmetros µµµµA, σσσσA, µµµµB e σσσσB. Assim, ( )AAAA nNX 2,~ σµ ( )BBBB nNX 2,~ σµe +−− B B A A BABA nn NXX 22 ,~ σσµµ ( ) ( ) Z nn XX B B A A BABA ~ 22 σσ µµ + −−− ⇒ Distribuição amostral de estatísticas: �Existem dois métodos para obter a distribuição amostral de uma estatística: � Método 1: Utilizando regras da probabilidade Ex: � Método 2: Realização de um experimento de simulação Usa-se um computador para obter k amostras aleatórias de tamanho n da distribuição designada. Para cada amostra calcula-se as estatísticas de interesse e cria-se um histograma para avaliar a distribuição amostral aproximada da estatística. Serviço A B C Preço: x 40 45 50 p(x) 0,2 0,3 0,5 µµµµ = E[x] = 40 * 0,2 + 45 * 0,3 + 50 * 0,5 = 46,5 σσσσ2 = Var[x] = 0,2 * (40-46,5)2 +0,3 * (45-46,5)2 +0,5 * (50-46,5)2 =15,25 DISTRIBUIÇÃO DE PROBABILIDADE DA MÉDIA 0 0,05 0,1 0,15 0,2 0,25 0,3 0,35 40 42,5 45 47,5 50 VALORES P R O B A B I L I D A D E x1 x2 p(x1) p(x2) p(x1,x2) x s2 40 40 0,2 0,2 0,04 40 0 40 45 0,2 0,3 0,06 42,5 12,5 40 50 0,2 0,5 0,1 45 50 45 40 0,3 0,2 0,06 42,5 12,5 45 45 0,3 0,3 0,09 45 0 45 50 0,3 0,5 0,15 47,5 12,5 50 40 0,5 0,2 0,1 45 50 50 45 0,5 0,3 0,15 47,5 12,5 50 50 0,5 0,5 0,25 50 0 Distribuição amostral de estatísticas: �Método 1: n=2 E[ x ] = 40 * 0,04 + 42,5 * 0,12 + ... + 50 * 0,25 = 46,5 Var[ x ] = 0,04 * (40-46,2)2 + ... + 0,25 * (50-46,5)2 = 7,625 E[ s2 ] = 0 * 0,38 + 12,5 * 0,42 + 50 * 0,20 = 15,25 Distribuição amostral de estatísticas: �Método 1: n=4 E[ x ]=40*0,016+...+50*0,0625=46,5 Var[ x ] = 3,8125 (s2 / 4) DISTRIBUIÇÃO DE PROBABILIDADE DA MÉDIA 0 0,05 0,1 0,15 0,2 0,25 40 41,25 42,5 43,75 45 46,25 47,5 48,75 50 VALORES P R O B A B I L I D A D E x1 x2 x3 x4 p(x1) p(x2) p(x3) p(x4) p(x1,x2,x3,x4) x s2 40 40 40 40 0,2 0,2 0,2 0,2 0,0016 40 0 40 40 40 45 0,2 0,2 0,2 0,3 0,0024 41,25 6,25 40 40 40 50 0,2 0,2 0,2 0,5 0,004 42,5 25 40 40 45 40 0,2 0,2 0,3 0,2 0,0024 41,25 6,25 40 40 45 45 0,2 0,2 0,3 0,3 0,0036 42,5 8,333 40 40 45 50 0,2 0,2 0,3 0,5 0,006 43,75 22,92 40 40 50 40 0,2 0,2 0,5 0,2 0,004 42,5 25 40 40 50 45 0,2 0,2 0,5 0,3 0,006 43,75 22,92 40 40 50 50 0,2 0,2 0,5 0,5 0,01 45 33,33 50 50 50 40 0,5 0,5 0,5 0,2 0,025 47,5 25 50 50 50 45 0,5 0,5 0,5 0,3 0,0375 48,75 6,25 50 50 50 50 0,5 0,5 0,5 0,5 0,0625 50 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . E[x] = 1 * 0,25 + 2 * 0,25 + 3 * 0,25 + 4 * 0,25 = 2,5 Var[x] = E[x-E(x)] = 0,25 * (1-2,5)2 +0,25 * (2-2,5)2 + 0,25 * (3-2,5)2 + 0,25* (4-2,5)2 =1,12 0,25 0,25 0,25 0,25 ,0 ,1 ,2 ,3 1 2 3 4 Distribuição da média amostral (x): � Distribuição de x para uma população não normal: 1a 2a Observação Obs 1 2 3 4 1 1,1 1,2 1,3 1,4 2 2,1 2,2 2,3 2,4 3 3,1 3,2 3,3 3,4 4 4,1 4,2 4,3 4,4 1a 2a Observação Obs 1 2 3 4 1 1,0 1,5 2,0 2,5 2 1,5 2,0 2,5 3,0 3 2,0 2,5 3,0 3,5 4 2,5 3,0 3,5 4,0 AMOSTRAS (1a,2a): MÉDIAS DAS AMOSTRAS: ,0 ,1 ,2 ,3 1,0 1,5 2,0 2,5 3,0 3,5 4,0 x P(x) 5,2 16 0,45,10,11 = +++ == ∑ = L N x N i i xµ ( ) ( ) 79,0 16 5,20,1 21 2 = +− = − = ∑ = L N x N i xi x µ σ Distribuição da média amostral (x): � Distribuição de x para uma população não normal: Teorema do limite central: �TLC: Seja x1, x2,…, xn uma amostra aleatória de uma distribuição qualquer com parâmetros E[X] = µµµµ e Var[X] = σσσσ2. Se n é suficientemente grande, a distribuição de x aproxima-se a uma normal com E[x] = µµµµ e Var[x] = σσσσ2/n e a distribuição do Total (x1+…+xn) aproxima-se a uma distribuição normal com E[To] =nµµµµ e Var[To] =nσσσσ2. Assim, n Nx 2 ,~ σµ& Z n x ~& σ µ− ⇒ ( )2,~ σµ nnNTo & Z n nTo ~& σ µ− ⇒ µµµµ = 50 σσσσ = 10 Xµµµµ = 50 σσσσ = 10 X Distribuição PopulacionalDistribuição PopulacionalDistribuição Populacional µµµµ = 50 σσσσ = 10 Xµµµµ = 50 σσσσ = 10 X Distribuição PopulacionalDistribuição PopulacionalDistribuição Populacional Distribuição amostralDistribuição Distribuição amostralamostral µµµµX = 50- XµµµµX = 50- X n =30n =30 σσσσσσσσ XX = 1.8= 1.8 n = 4n = 4 σσσσσσσσ XX = 5= 5 Distribuição amostralDistribuição Distribuição amostralamostral µµµµX = 50- XµµµµX = 50- X n =30n =30 σσσσσσσσ XX = 1.8= 1.8 n = 4n = 4 σσσσσσσσ XX = 5= 5 Distribuição amostral da proporção (e frequência): �O TLC pode ser utilizado para justificar a aproximação da Binomial pela Normal pois se X é uma variável aleatória que “conta” o número de sucessos em n tentativas independentes, como a probabilidade de sucesso é constante os Xs são iid. � Portanto, se n é suficientemente grande ( ) ( )npppNp n X pnpnpNXsucessosno )1(,~ˆ )1(,~ −= −= & & Z ppn pnX ~ )1.(. . & − − ⇒ Z npp pp ~ )1.( ˆ & − − ⇒ Distribuição amostral de s2: �Quando há incerteza em relação ao valor de σσσσ estima-se o seu valor por: �Teorema: Se s2 é a variância de uma amostra aleatória de tamanho n, retirada de uma população normal com parâmetros µµµµ e σσσσ2, então a estatística tem distribuição χχχχ2 com n-1 graus de liberdade. �Na utilização é necessário obter χχχχ2calc= (n-1)s2/σσσσ2 ( ) 1ˆ 1 2 22 − − == ∑ = n xx s n i i σ ( ) 2 2 2 1 2 )1( σσ sn xx n i i − = −∑ = Distribuição amostral de s2: Graus de liberdade: �Os graus de liberdade podem ser vistos como uma medida da informação amostral. � Sabendo que quando µµµµ não é conhecido há 1 grau de liberdade a menos ou considera-se que um grau de liberdade é perdido na estimação de µµµµ. �Generalização: Há n graus de liberdade, ou partes de informação independentes, em uma amostra aleatória de uma população normal e cada vez que se utiliza uma estatística em substituição a um parâmetro perde-se um grau de liberdade. ( ) ( ) 444 3444 21444 3444 21 2 1 2 ~ 2 1 2 ~ 2 1 2 − ∑∑ == −→− nn n i i n i i xxx χχ σσµ � A dificuldade prática em relação ao TLC é que ele demanda o conhecimento de σσσσ. � A ferramenta utilizada para lidar com essa dificuldade é a distribuição t (William Gosset, 1908) que é formada pela divisão Assim, é possível fazer inferências em relação a µµµµ usando uma estimativa de σσσσ fornecida pela mesma amostra que gerou x. �Def: Seja x1, …, xn uma amostra aleatória de uma população normal com E[X] = µµµµ e Var[X] = σσσσ2, então tem distribuição t com n-1 graus de liberdade. x, s e a distribuição t-Student: ns x sn x n sn nx n Z n / . / 1 /)1( / 1 222 1 µσ σ µ σ σµ χ − = − = − − − = − − ( ) ( )nsxT /µ−= � Propriedades das distribuições t-student: Seja tνννν a curva da função densidade dos gl de νννν. 1. Cada curva tνννν possui um formato de sino e está centrada em 0. 2. Toda curva tνννν é mais dispersa que a curva normal padronizada (Z). 3. À medida que νννν aumenta, a dispersão da curva tνννν correspondente diminui. 4. À medida que νννν →→→→ ∞∞∞∞ a seqüência das curvas tνννν se aproxima da curva normal padronizada (de forma que a curva Z é chamada geralmente de t com gl= ∞∞∞∞). x, s e a distribuição t-Student: x, s e a distribuição t-Student: Para casa: • Lista de Exercícios 7 (site: www.mec.ita.br/~rodrigo/) • Leitura: Devore – cap. 5: Distribuições … e amostras aleatórias (5.3 a 5.5) Walpole et al. – cap. 8: Distribuições amostrais … (8.1 a 8.7)
Compartilhar