Baixe o app para aproveitar ainda mais
Prévia do material em texto
Estatística para Cursos de Engenharia e Estatística para Cursos de Engenharia e InformáticaInformática Pedro Alberto Barbetta / Marcelo Menezes Reis / Antonio Cezar Bornia São Paulo: Atlas, 2004 Cap. 7 Cap. 7 -- DistribuiçõesDistribuiçõesAmostrais Amostrais BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 Cap. 7 Cap. 7 -- DistribuiçõesDistribuiçõesAmostrais Amostrais ee EstimaçãoEstimaçãodedeParâmetrosParâmetros APOIO: Fundação de Apoio à Pesquisa Científica e Tecnológica do Estado de Santa Catarina (FAPESC) Departamento de Informática e Estatística – UFSC (INE/CTC/UFSC) Amostragem e Inferência estatísticaAmostragem e Inferência estatística POPULAÇÃO: todos os possíveis consumidores AMOSTRA: um subconjunto dos consumidores amostragem Ex. BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 consumidores inferência ConceitosConceitos • Parâmetro: alguma medida descritiva (média, variância, proporção, etc.) dos valores x1, x2, x3,..., associados à população. • Amostra aleatória simples: conjunto de n variáveis aleatórias independentes {X1, X2, ..., Xn}, cada uma com a mesma distribuição de probabilidades de uma certa variável aleatória X. Esta distribuição de probabilidades deve corresponder à distribuição de freqüências dos BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 de probabilidades deve corresponder à distribuição de freqüências dos valores da população (x1, x2, x3, ...). • Estatística: alguma medida descritiva (média, variância, proporção, etc.) das variáveis aleatórias X1, X2, ..., Xn, associadas à amostra Parâmetros e EstatísticasParâmetros e Estatísticas Amostra (X1, X2, ..., Xn) População (x1, x2, x3,..., xN) Parâmetros Estatísticas BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 N atributo o com elementos de np o = n atributo o com elementos de nP o = ˆ ∑ = = N i ixN 1 1µ ∑ = = n i iX n X 1 1 ( )∑ = −= N i ixN 1 22 1 µσ ( )∑ = − − = n i i XX n S 1 22 1 1 Proporção Média Variância Exemplos de parâmetrosExemplos de parâmetros • X variável aleatória discreta com função de probabilidade p Média ou valor esperado: ∑ = == k j jj pxXE 1 )(µ BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 Variância: ∑ = −== k j jj pxXV 1 22 )()( µσ 22 )()( µ−= XEXV ∑ = = k j jj pxXE 1 22 )(ou: onde: Exemplos de parâmetrosExemplos de parâmetros • X variável aleatória contínua com função de densidade f Média ou valor esperado: BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 Variância: 22 )()( µ−= XEXV ∫ ∞ ∞− = dxxfxXE )()( 2ou: onde: Exemplos de estatísticasExemplos de estatísticas • (X1, X2,..., Xn): uma amostra aleatória simples da população caracterizada por X. Média : ∑ = = +++ = n i i n X nn XXXX 1 21 1... BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 Variância: ( )∑ = − − = n i i XX n S 1 22 1 1 • Uma estatística é uma variável aleatória e a sua distribuição de probabilidades é chamada de distribuição amostral. EstatísticasEstatísticas • (x1, x2,..., xn): amostra efetivamente observada. Média : ∑ = = +++ = n i i n x nn xxx x 1 21 1... BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 Variância: ( )∑ = − − = n i i xx n s 1 22 1 1 − − = ∑ = 2 1 22 1 1 xnx n s n i iou: Ex. 7.2Ex. 7.2 • População: {2, 3, 4, 5} • Parâmetros: p(x) BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 5,3 4 15 4 14 4 13 4 12)( =×+×+×+×== XEµ ( ) [ ] 25,1)5,35()5,34()5,33()5,32( 4 1 .)( 2222 1 22 =−+−+−+−=−== ∑ = N i ii pxXV µσ x2 3 4 5 Distribuição da média amostral (Ex. 7.2)Distribuição da média amostral (Ex. 7.2) X Amostras possíveis Probabilidade ⁄ • Amostragem aleatória simples de tamanho n = 2. – Construção da distribuição amostral da média: BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 (2, 2) (2, 3), (3, 2) (2, 4), (3, 3), (4, 2) (2, 5), (3, 4), (4, 3), (5, 2) (3, 5), (4, 4), (5, 3) (4, 5), (5, 4) (5, 5) 2,0 2,5 3,0 3,5 4,0 4,5 5,0 1⁄16 2⁄16 3⁄16 4⁄16 3⁄16 2⁄16 1⁄16 Distribuição da média amostral (Ex. 7.2)Distribuição da média amostral (Ex. 7.2) p(x) Distribuição da população Distribuição da média amostral BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 )(xp x2 3 4 5x2 3 4 5 E(X) = 3,5 5,3)( =XE Média e variância da média amostral (Ex. 7.2)Média e variância da média amostral (Ex. 7.2) ( ) 5,3 16 15 16 25,4 16 34 16 45,3 16 33 16 25,2 16 12 = + + + + + + =XE BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 625,0 16 1)5,35(... 16 2)5,35,2( 16 1)5,32()( 222 =−++−+−=XV Distribuição amostral da médiaDistribuição amostral da média Amostra: (X1, X2, ..., Xn) População: N elementos X : variável quantitativa Parâmetros: Amostragem aleatória simples BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 (X1, X2, ..., Xn)Parâmetros: µµµµ = E(X), σσσσ2 = V(X) Estatísticas:X pode ser vista como uma variável aleatória se considerar a distribuição de freqüências da população como uma distribuição de probabilidades – a distribuição da população. ∑ = = n i iX n X 1 1 ( )∑ = − − = n i i XX n S 1 22 1 1 Exemplo de motivaçãoExemplo de motivação • População X uniforme em [0, 1]. ∉ ∈ − = ],[ para ,0 ],[ para,1)( βα βα αβ x x xf • Lembrando: X uniforme em [α, β]. 1)( =XE BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 xα0 f(x) β αβ − 1 2 )( βα +=XE ( ) 12 )( 2αβ − =XV 2 1)( =XE 12 1)( =XV • Simular dados numa numa planilha eletrônica e calcular estatísticas. Média e variância da média amostralMédia e variância da média amostral µ=)(XE XV 2 )( σ= se a amostragem for com reposição, • Seja a população com média µµµµ e variância σσσσ2. BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 n XV )( σ= se a amostragem for com reposição, ou N muito grande ou infinito 1 )( 2 − − ⋅= N nN n XV σ se a amostragem for sem reposição e N não muito grande, N < 20n Distribuição da média amostralDistribuição da média amostral • (Teorema do limite central) Se o tamanho da amostra for razoavelmente grande, então a distribuição amostral da média pode ser aproximada pela distribuição normal. BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 Distribuição da média amostralDistribuição da média amostral • População • Amostra ∑ = = n i iX n X 1 1 BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática.Atlas, 2004 µ=)(XE 2)( σ=XV σ=)(XDP µ=)(XE n XV 2 )( σ= n XDP σ=)( População de tamanho NPopulação de tamanho N População dos salários dos empregados de certo setor da economia (N =1.000) Distribuição de freqüências de médias de amostras de tamanho n = 100 BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 µ=)(XE 1 )( 2 − − ⋅= N nN n XV σ 1 )( − − = N nN n XDP σ µ=)(XE 2)( σ=XV σ=)(XDP Distribuição amostral da proporçãoDistribuição amostral da proporção População: elementos A A AA NNN += BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 Amostra: (X1, X2, ..., Xn) A 0 ou 1 (0 = sem o atributo; 1 = com o atributo) Parâmetro: p = proporção dos elementos que têm o atributo A Distribuição da população (caso de proporção)Distribuição da população (caso de proporção) x p(x) 0 1 1 – p p BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 µ = p σ2 = p(1 – p) Média e variância: Média e variância da proporção amostralMédia e variância da proporção amostral pPE =)ˆ( n ppPV )1()ˆ( −= se a amostragem for com reposição, ou N muito grande ou infinito BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 n PV )( = muito grande ou infinito 1 )1()ˆ( − − ⋅ − = N nN n ppPV ou: se a amostragem for sem reposição e N não muito grande, N < 20n Distribuição da proporção amostralDistribuição da proporção amostral • Se o tamanho da amostra for razoavelmente grande, então a distribuição amostral da proporção pode ser aproximada pela distribuição normal. BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 • OBS. Se n for pequeno, a distribuição exata é binomial ou hipergeométrica (dependendo se a amostragem for com ou sem reposição) universo do estudo (população) Estimação de ParâmetrosEstimação de Parâmetros BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 O raciocínio indutivo da estimação de parâmetros dados observados AMOSTRA POPULAÇÃO p = ? Estimação de ParâmetrosEstimação de Parâmetros BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 X1 X2 X3 ...Observações: pˆ p = ± erro amostralpˆ Estimação de parâmetros:Estimação de parâmetros: intervalo de confiança para proporçãointervalo de confiança para proporção = proporção na população (parâmetro que se quer estimar) = proporção na amostra (pode ser calculada com base na amostra) p p ˆ σ BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 = erro-padrão da proporção, que para amostra aleatória simples com reposição (ou sem reposição, mas com N >> n), pode ser estimado por: Pˆσ n pp sP )ˆ1(ˆ ˆ − = Estimação de parâmetros:Estimação de parâmetros: intervalo de confiança para proporçãointervalo de confiança para proporção Seja uma variável aleatória normal padrão, Z. Vale: { } 95,096,196,1 =≤≤− ZP 95,096,1 ˆ 96,1 ˆ = ≤ − ≤− P pPP σ n pp P )1( ˆ − =σEntão: sendo: BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 ˆ P { } 95,0)96,1(ˆ)96,1(ˆ ˆˆ =+≤≤− PP PpPP σσou: PpP ˆ)96,1(ˆ σ≤−com probabilidade de 95%: PppIC ˆ)96,1(ˆ%)95,( σ±= intervalo de confiança para p, com nível de confiança de 95%: Estimação de parâmetros:Estimação de parâmetros: intervalo de confiança para proporçãointervalo de confiança para proporção • Com dados de uma amostragem aleatória simples com reposição (ou sem reposição, mas com N >> n), tem-se um intervalo de confiança para p, com nível de confiança γ : BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 n pp zppIC )ˆ1(ˆˆ),( −±= γγ Estimação de parâmetros:Estimação de parâmetros: intervalo de confiança para proporçãointervalo de confiança para proporção n pp zppIC )ˆ1(ˆˆ),( −±= γγ n íve l de BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 0 Z γ - Z γ n íve l de con fiança desejado (γγγγ = 1-αααα ) α ⁄2 α ⁄2 γ 0,800 0,900 0,950 0,980 0,990 0.995 0,998 zγ 1,282 1,645 1,960 2,326 2,576 2,807 3,090 Resultados do Exemplo 7.3:Resultados do Exemplo 7.3: Intervalo de 95% de confiança para p Intervalo de 99% de confiança para p (60,0 ± 6,3%) 60,0% Intervalo de 95% de confiança para p (60,0 ± 4,8%) 55,2%53,7% 64,8% 66,2% Estimação de parâmetros:Estimação de parâmetros: intervalo de confiança para médiaintervalo de confiança para média = média na população (parâmetro que se quer estimar) = média na amostra (pode ser calculada com base na amostra)x σ µ BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 = erro-padrão da média.Xσ n X σ σ = Estimação de parâmetros:Estimação de parâmetros: intervalo de confiança para intervalo de confiança para média µmédia µ Seja uma variável aleatória normal padrão, Z. Vale: { } 95,096,196,1 =≤≤− ZP Então: γ σ µ γγ = ≤−≤− z n X zP{ } γγγ =≤≤− zZzP σσ BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 ou: com probabilidade de 95%: intervalo de confiança para µ, com nível de confiança de γ: γσµσ γγ = +≤≤− n zX n zXP n zxIC σγµ γ±=),( Estimação de parâmetros:Estimação de parâmetros: intervalo de confiança para médiaintervalo de confiança para média Caso o desvio padrão (populacional) seja conhecido: zxIC σγµ ±=),( BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 n zxIC σγµ γ±=),( Estimação de parâmetros:Estimação de parâmetros: intervalo de confiança para médiaintervalo de confiança para média Caso o desvio padrão (populacional) não seja conhecido: uso da distribuição t de Student. BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 A distribuição A distribuição t t dede StudentStudent • Supondo a população com distribuição normal, a estatística n S X T µ− = BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 tem distribuição de probabilidades conhecida como distribuição t de Student, com gl = n – 1 graus de liberdade. n A distribuição A distribuição t t dede StudentStudent t com gl = ∞ (normal padrão) t com gl = 3 f(x) BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 t com gl = 1 x0 A distribuição A distribuição t t dede StudentStudent Estimação de parâmetros:Estimação de parâmetros: intervalo de confiança para médiaintervalo de confiança para média Caso o desvio padrão (populacional) não seja conhecido: n s txIC γγµ ±=),( BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 n γ s = desvio padrão calculado na amostra Como usar a Tabela Como usar a Tabela tt (Tab. IV do Apêndice)(Tab. IV do Apêndice) • Ilustração com gl = 9 e nível de confiança de 95%. BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 Tamanho de amostraTamanho de amostra • Na fase do planejamento da pesquisa, muitasvezes precisamos calcular o tamanho n da amostra, para garantir uma certa precisão desejada, a qual é descrita em termos do erro amostral máximo tolerado (E0,) e do nível de confiança (γ) a ser adotado no processo de estimação. BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 de confiança (γ) a ser adotado no processo de estimação. • Suponha amostragem aleatória simples Tamanho de amostraTamanho de amostra • No caso de estimação de µ, podemos exigir 0EX ≤− µ ou: BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 0E n z ≤σγ E z n 0 2 22 σγ≥ ou: ou: Tamanho de amostraTamanho de amostra • No caso de estimação de p, a população é caracterizada por uma variável 0-1, portanto: 4 1)1.(2 ≤−= ppσ σσσσ 2 = p (1-p ) 1 ⁄4 Assim: BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 p 0 1 ⁄2 1 E ppz n 0 2 2 )1( − ≥ γ Ver discussão no livro.E z n 4 0 2 2 γ = Então, é suficiente para qualquer p. Tamanho mínimo de uma amostra aleatória simplesTamanho mínimo de uma amostra aleatória simples E z = n 0 2 22 0 σγ ( ) E ppz = n 0 2 2 0 1−γ Parâmetro de interesse Valor inicial do tamanho da amostra uma média (µµµµ): uma proporção (p): BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 E z = n 4 0 2 2 0 γ 0nn = 10 0 −nN + nN. n = várias proporções (p1, p2, ...): Tamanho da amostra População infinita: (arredondamento para o inteiro superior) População de tamanho N: (arredondamento para o inteiro superior)
Compartilhar