Baixe o app para aproveitar ainda mais
Prévia do material em texto
Distribuições Amostrais Referência: Estas notas de aula baseiam-se na seguinte referência bibliográfica: ESTATÍSTICA BÁSICA - Wilton de O. Bussab, Pedro A. Morettin - 5a ed. - São Paulo - Saraiva, 2002. Amostragem Aleatória Simples A Amostragem Aleatória Simples é uma amostragem probabilística em que cada elemento da população tem a mesma probabilidade de seleção. Procedimento para obter uma amostra aleatória simples de n elementos: todos os N elementos da população são numerados; em seguida, n elementos da população são sorteados por meio de uma tabela de números aleatórios ou por meio do uso de computadores, que podem gerar números aleatórios. Amostragem Aleatória Simples com Reposição (AAS): se for permitido que uma unidade da população possa ser sorteada mais de uma vez; implica em independência entre as unidades selecionadas. Amostragem Aleatória Simples sem Reposição: se a unidade sorteada for removida da população, não podendo ser sorteada novamente. Exemplo (AAS): Uma urna tem cinco bolas marcadas com os seguintes números: 1, 3, 5, 5 e 7. Considere todas as possíveis amostras de tamanho n=2, com reposição, da população. Sejam as variáveis aleatórias: X → valor assumido pelo elemento na população. X1 → número selecionado na 1A extração; X2 → número selecionado na 2A extração. Distribuição de probabilidade de X: X 1 3 5 7 P(X=x) 1/5 1/5 2/5 1/5 Amostra: (X1 , X2) Diagrama em árvore para duas extrações com reposição : Probabilidade conjunta: P(X1, X2) Como a amostragem é com reposição, as variáveis X1 e X2 são independentes. Logo: 1 2 1 2 1 1 2( , ) ( ). ( ) ( ). ( )P X x X y P X x P X y X x P X x P X y= = = = = = = = = Por exemplo: 1 2 1 2 2 1 2(5,3) ({ 5} { 3}) ({ 5}) ({ 3}) 5 5 25 P P X X P X P X= = ∩ = = = × = = × = Distribuição conjunta de (X1, X2): Conclusão: AAS (X1,X2) com X1 e X2 são independentes e tais que 1 2( ) ( ) ( ) p/ todoP X x P X x P X x x= = = = = X1 X2 1 3 5 7 P(X2) 1 1/25 1/25 2/25 1/25 5/25 3 1/25 1/25 2/25 1/25 5/25 5 2/25 2/25 4/25 2/25 10/25 7 1/25 1/25 2/25 1/25 5/25 P(X1) 5/25 5/25 10/25 5/25 1 Definição: Amostra Aleatória Simples Uma amostra aleatória simples de tamanho n de uma variável aleatória X com uma dada distribuição de probabilidade P(X) é o conjunto de n variáveis aleatórias independentes X1, X2, ... Xn, cada uma com a mesma distribuição de probabilidade de X. Amostra Aleatória Simples ⇔ n-upla (X1,X2,...Xn) Xi → i-ésima observação (i-ésimo elemento sorteado) 1 2( ) ( ) ( ) ( )nP X x P X x P X x P X x= = = = = = = =K Estatísticas e Parâmetros Estatística: é uma característica da amostra, ou seja, uma estatística T é uma função de X1, X2,...,Xn: 1, 2( ,..., )nT f X X X= T é também uma nova variável aleatória, por sua vez. As estatísticas mais comuns são: 1 1 ( ) n i i X X média da amostra n = = ∑ s2= 1 n−1∑i=1 n X i− X 2 (variância da amostra) 2 2 1 1ˆ ( ) n i i X X n σ = = −∑ X(1) = min (X1, X2,..., Xn) → menor valor da amostra; X(n) = max (X1, X2,..., Xn) → maior valor da amostra; W = X(n) – X(1) → amplitude total da amostra X(i) → i-ésima maior observação da amostra Parâmetro: medida para descrever uma característica da população. Exemplos de estatísticas e parâmetros mais comuns (com símbolos usuais): 2 2 Amostra População (Estatística) (Parâmetro) Média ( ) Variância ( ) Nº Elementos ˆProporção X E X s Var X n N p p µ σ = = Distribuições Amostrais Sejam: θ → parâmetro da população (média, variância, etc) T → estatística amostral correspondente Extração de amostra aleatória simples, com reposição (AAS): 1, 2 1 2 0 ( ,..., ) ( , ,..., ) n n X X X T f X X X t ⇓ = = Inferência estatística: Baseado em t0 ⇒ faz-se afirmação sobre θ Distribuição amostral da estatística T A distribuição amostral de uma estatística T é a distribuição de probabilidade de T quando retiramos todas as possíveis amostras da população, isto é, quando (X1, X2,..., Xn) assume todos os valores possíveis. Distribuição amostral da média: É a distribuição de probabilidade da variável aleatória X (média da amostra de tamanho n) , 1 2 1 ( ... )( ,..., ) nn X X XX f X X n + + + = = . Exemplo de distribuição amostral da média: Considere a população: :{1,3,5,5,7}X Média da população: ( ) 4,2E Xµ = = Variância da população: 2 ( ) 4,16Var Xσ = = t 1 t 2 t k . . . X θ Populaçã o Amostras θ t Distribuição amostral da média (amostragem com n=2): Para cada par da distribuição conjunta de (X1,X2), calcula-se a média da amostra: 1 2 2 X XX += Distribuição amostral de X x 1 2 3 4 5 6 7 )( xXP = 1/25 2/25 5/25 6/25 6/25 4/25 1/25 Valor esperado de X : 1 2 5 6 6 4 1( ) 1 2 3 4 5 6 7 25 25 25 25 25 25 25 ( ) 4,2 i i i E X p x E X = = × + × + × + × + × + × + × = = ∑ Variância de X : 2 2 2( ) ( ( )) ( ) ( ) ( ) 2,08i i i Var X x E X p x E X E X= − = − =∑ Note que, com n=2: Var X =Var X 2 X1 X2 1 3 5 7 1 1/25 1=X 1/25 2=X 2/25 3=X 1/25 4=X 3 1/25 2=X 1/25 3=X 2/25 4=X 1/25 5=X 5 2/25 3=X 2/25 4=X 4/25 5=X 2/25 6=X 7 1/25 4=X 1/25 5=X 2/25 6=X 1/25 7=X • Gráfico da Distribuição de X : ( ) 4,2E Xµ = = 2 ( ) 4,16Var Xσ = = • Gráfico da Distribuição Amostral de X : E X =E X =4,2 Var X =Var X n =2,08 0 1 2 3 4 5 6 7 8 0,00 0,05 0,10 0,15 0,20 D en si da de d e P ro ba b ili d ad e X 1 2 3 4 5 6 7 0,00 0,05 0,10 0,15 0,20 0,25 D en si da de d e Pr ob ab ilid ad e Media amostral <X> Teorema: Seja X uma V.A. com média ( )E X µ= e variância 2( )Var X σ= e seja (X1,X2,...Xn) uma amostra aleatória simples. Então, se; 1 2 ( ... )nX X XX n + + + = temos: 2 ( ) ( )( ) E X Var XVar X n n µ σ = = = Prova: Se (X1,X2,...Xn) são independentes, então: [ ] µ=++= +++= )(...)(1)...(1)( 121 nn XEXEn XXX n EXE 2 2 1 2 2 2 1 1 1( ) ( ... ) ( )n i i Var X Var X X X Var X n n n n n σ σ/ = + + = = = ∑ O que acontece com a forma da distribuição amostral de X quando n aumenta? Se n → aumentar ⇒ histograma mais serrilhado e concentrado em )(XE No limite n → ∞ ⇒ distribuição tende a uma “ distribuição normal” { variáveis independentes n=2 Populaç ão n=5 X X XXE µ=)( n=25 X Teorema Central do Limite (TCL) Para amostras aleatórias simples ),...,,( 21 nXXX retiradas de uma população com média µ e variância 2σ finita, a distribuição amostral da média 1 2( ... )nX X X X n= + + + aproxima-se de uma distribuição normal com média µ e variância n 2σ , se n grande. TCL AAS → 2 : N( , )X n σµ , se n→∞, 2 ( ) ( ) E X Var X µ σ = = . Se a variável X (população) for normal com média μ e desvio σ, então X terá distribuição normal exata. Corolário 1: ~ (0,1) XZ n µ σ − = Ν Corolário 2: Seja: e X µ= − Logo: 2 : 0,e n σ Ν Pois: n VarXVareVar EXEeE 2 )()()( 0)()()( σ =µ−+= =µ−µ=µ−= Regra prática para Teorema Central do Limite: Na prática, a aproximação normal já é considerada boa para 30n ≥ (amostras grandes). 2 , grandeX se n n σµ → Ν Exemplo: A distribuição dos pesos dos pacotes enchidos por uma máquina é )100,500( 2 =σ=µΝ . Colhe-se uma amostra de 100 pacotes. Seja X a média amostral dos pesosdos 100 pacotes. Qual a probabilidade de que esta média X seja diferente de 500, com uma diferença menor do que 2 gramas? Solução: 2 2 cot : ( 500, 100) 100 100. . . : ( ) 500, ( ) 1 : (500,1) 100 ( 500 2) ? 2 500 2( 500 2) ( 2 500 2) ( 2 2) 1 1 1 0,95 95% X peso do pa e X n X T L C X E X Var X ou X n P X XP X P X P P Z µ σ σ → Ν = = = ⇒ ⇒ Ν = = = = Ν − < = − − − < = − < − < = < < = − < < ≈ = Exemplo: O comprimento do crânio de uma população tem distribuição normal com média 185,6mm e desvio padrão 12,7 mm . Qual a probabilidade de que uma amostra aleatória simples de 10 pessoas sorteadas desta população tenha média acima de 190 mm? Solução: 2 2 2 2 2 comprimento do crânio de um indivíduo qualquer da população : ( 185,6 ; 12,7 ) 10 12,7. . . : ( ) 185,6, ( ) 10 190 185,6( 190) ( 1,09) 0,1379 13,8% 12,7 / 10 x x x X X n x T L C X E X Var X n xP x P P Z µ σ σ σ µ σ → Ν = = = ⇒ ⇒ Ν = = = = − − > = > = > = = Distribuição Amostral da Proporção A distribuição amostral da proporção é a distribuição de probabilidade da proporção amostral pˆ (proporção de elementos da amostra com uma dada característica). Considere uma população de elementos na qual cada elemento pode apresentar ou não uma dada característica. Por exemplo, em uma população, cada indivíduo pode ter ou não uma certa doença. Seja p a proporção de elementos portadores de uma certa característica na população. A cada elemento da população associamos uma variável aleatória X (variável de Bernoulli) tal que 1 , se o elemento apresentar a característica ; 0 , se o elemento não apresentar a característica . X = Então, p é a probabilidade de um elemento qualquer apresentar a característica (sucesso). A distribuição de probabilidade de X (distribuição de Bernoulli) é: x P(x) 0 1-p 1 p A média e a variância de de X são: 2 ( ) ( ) (1 ) E X p Var X p p µ σ = = = = − Considere uma amostra aleatória simples de tamanho n extraída da população. Seja: ˆ proporção de elementos com a característica (X=1) na amostrap → Para n grande, a distribuição de probabilidade da variável aleatória pˆ , a proporção da amostra, é normal com média ˆ( )E p p= e variância ˆ( ) (1 )Var p p p n= − : (1 )ˆ : , p pp p n − Ν Logo: ˆ : (0,1) (1 ) p pZ p p n − = Ν − 0 1 0 1 0 1 1 0 1 1 1 1 0 1 1 0 0 0 1 0 1 0 0 1 0 1 0 0 0 1 1 1 0 1 População: p 0 1 0 1 1 0 Amostra: pˆ Demonstração: Seja a variável Sn definida como: Sn → nº total de “sucessos” (indivíduos com a característica) na amostra. Logo: Sn : b(n,p) → distribuição binomial com parâmetros n, p. Então, se pˆ → proporção de “sucessos” na amostra Segue: 1 2 ...ˆ ˆn nS X X Xp p X n n + + + = ⇒ = = Supondo-se n suficientemente grande, tem-se, pelo TCL: ( ) (1 ): ( ) ( ) , ( ) Var X p pX E X E X p Var X n n − Ν = = = = Logo: (1 )ˆ : , p pp p n − Ν Exemplo: Em uma dada população, a proporção de indivíduos com sangue tipo A e Rh positivo é 36% . Calcule a probabilidade de que uma amostra aleatória de 30 indivíduos desta população contenha menos de 50% de indivíduos com sangue tipo A+ . Solução: P p0.5=P Z 0.5− p p 1− pn =P Z 0.5−0.36 0.36 1−0.3630 P p0.5=P Z1,60=0,50,4452=0,9452
Compartilhar