Baixe o app para aproveitar ainda mais
Prévia do material em texto
BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 Estatística para Cursos de Engenharia e Informática Pedro Alberto Barbetta / Marcelo Menezes Reis / Antonio Cezar Bornia São Paulo: Atlas, 2008 Cap. 7 - Distribuições Amostrais e Estimação de Parâmetros Departamento de Informática e Estatística (INE/CTC/UFSC) BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 Amostragem e Inferência estatística POPULAÇÃO: todos os possíveis consumidores AMOSTRA: um subconjunto dos consumidores inferência amostragem Ex. BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 Conceitos • Parâmetro: alguma medida descritiva (média, variância, proporção, etc.) dos valores x1, x2, x3,..., associados à população. • Amostra aleatória simples: conjunto de n variáveis aleatórias independentes {X1, X2, ..., Xn}, cada uma com a mesma distribuição de probabilidades de uma certa variável aleatória X. Esta distribuição de probabilidades deve corresponder à distribuição de freqüências dos valores da população (x1, x2, x3, ...). • Estatística: alguma medida descritiva (média, variância, proporção, etc.) das variáveis aleatórias X1, X2, ..., Xn, associadas à amostra BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 Parâmetros e Estatísticas N atributo o com elementos de no p Amostra (X1, X2, ..., Xn) População (x1, x2, x3,..., xN) n atributo o com elementos de no^ p N i ix N 1 1 n i ix n X 1 1 N i ix N 1 22 1 n i i xx n S 1 22 1 1 Variância Média Proporção Estatísticas Parâmetros BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 Estatística • Uma estatística é uma variável aleatória e a sua distribuição de probabilidades é chamada de distribuição amostral. BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 Atividade ex1 - pg173 – Seja a população dos 4 ônibus e a variável aleatória X. X= Número de vezes que o ônibus teve um defeito grave. • População: {2, 3, 4, 5} • Parâmetros: 5,35432 4 11 1 N i ix N 25,1)5,35()5,34()5,33()5,32( 4 11 2222 1 22 N i ix N BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 Distribuição da média amostral (Ex.7.2 - pg173) X 116 216 316 416 316 216 116 2,0 2,5 3,0 3,5 4,0 4,5 5,0 (2, 2) (2, 3), (3, 2) (2, 4), (3, 3), (4, 2) (2, 5), (3, 4), (4, 3), (5, 2) (3, 5), (4, 4), (5, 3) (4, 5), (5, 4) (5, 5) Probabilidade Amostras possíveis • Amostragem aleatória simples de tamanho n = 2 com reposição. Tabela1: Construção da distribuição amostral da média: BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 Distribuição da média amostral (Ex. 7.2) )(xp x 2 3 4 5 x p(x) 2 3 4 5 Distribuição da população Distribuição da média amostral E(X) = 3,5 5,3)( XE BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 Média e variância da média amostral - p173 Amostragem com reposição 5,3 16 1 5 16 2 5,4 16 3 4 16 4 5,3 16 3 3 16 2 5,2 16 1 2 XE 625.0)5.3(875.12)]([)()( 625,0 16 1 )5,35(... 16 2 )5,35,2( 16 1 )5,32()( 222 222 xExEXV ou XV BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 Distribuição amostral da média Amostra: (X1, X2, ..., Xn) População: N elementos X : variável quantitativa Parâmetros: = E(X), 2 = V(X) Estatísticas: Amostragem aleatória simples X pode ser vista como uma variável aleatória se considerar a distribuição de freqüências da população como uma distribuição de probabilidades – a distribuição da população. n i iX n X 1 1 n i i XX n S 1 22 1 1 BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 Média e variância da média amostral )(XE n XV 2 )( se a amostragem for com reposição, ou N muito grande ou infinito 1 )( 2 N nN n XV se a amostragem for sem reposição e N não muito grande, N < 20n • Seja a população com média e variância 2. BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 Distribuição da média amostral • (Teorema limite central) Se o tamanho da amostra for razoavelmente grande, então a distribuição amostral da média pode ser aproximada pela distribuição normal. BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 Distribuição amostral da proporção Amostra: (X1, X2, ..., Xn) População: elementos A 0 ou 1 (0 = sem o atributo; 1 = com o atributo) A Parâmetro: p = proporção dos elementos que têm o atributo A AA NNN BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 Distribuição da população (caso de proporção) Média e variância: x P(x) 0 1-p 1 p BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 pg-171- Em um estudo sobre emissões de CO2, definiu-se uma população como sendo composta por 4 ônibus de uma companhia de transporte urbano. Um ônibus estava com alto índice de emissão de CO2, e o restante dentro dos padrões. Variável aleatória - X: Número de ônibus c/ alto índice de emissão de CO2 x=0 (sem atributo) e x=1 (com atributo); logo População = {1,0,0,0}. p: proporção de elementos com o atributo. a) Calcular a proporção populacional (p). x=0 (sem atributo) e x=1 (com atributo) p = ¼ da frota fora dos padrões BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 X P(x) 0 0.5625 1 0.3750 2 0.0625 BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 Retirar as amostras n=2; e montar o espaço amostral Ω = [(1, 1) (1, 02) (1, 03) (1, 04) (02, 1) (02, 02) (02, 03) (02, 04) (03, 1) (03, 02) (03, 03) (03 ,04) (04 ,1) (04, 02) (04, 03) (04, 04)] X: Número de ônibus c/ alto índice de emissão de CO2, entre 2 ônibus selecionados ao acaso Para X=0 temos 9 pares logo p= 9/16 Para X=1 temos 6 pares logo p= 6/16 Para X=2 temos 1 par logo p= 1/16 X P(x) 0 0.5625 1 0.3750 2 0.0625 Distribuição de probabilidades BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 0 0.5625 ½ 0.3750 1 0.0625 0.25 0.09375 BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 Média e variância da proporção amostralpPE )ˆ( n pp PV )1( )ˆ( se a amostragem for com reposição, ou N muito grande ou infinito 1 )1( )ˆ( N nN n pp PV ou: se a amostragem for sem reposição e N não muito grande, N < 20n BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 Distribuição da proporção amostral • Se o tamanho da amostra for razoavelmente grande, então a distribuição amostral da proporção pode ser aproximada pela distribuição normal. • OBS. Se n for pequeno, a distribuição exata é binomial ou hipergeométrica (dependendo se a amostragem for com ou sem reposição) BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 universo do estudo (população) O raciocínio indutivo da estimação de parâmetros dados observados Estimação de Parâmetros BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 AMOSTRA POPULAÇÃO p = ? X1 X2 X3 ... Observações: pˆ p = ± erro amostral pˆ Estimação de Parâmetros BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 Estimação de parâmetros: intervalo de confiança para proporção = proporção na população (parâmetro que se quer estimar) = proporção na amostra (pode ser calculada com base na amostra) = erro-padrão da proporção, que para amostra aleatória simples com reposição (ou sem reposição, mas com N >> n), pode ser estimado por: P p p ˆ ˆ n pp s P )ˆ1(ˆ ˆ BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 Estimação de parâmetros: intervalo de confiança para proporção • n pp zppIC )ˆ1(ˆ ˆ)1,( 2 BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 Estimação de parâmetros: intervalo de confiança para proporção 0 Z - Z nível de confiança desejado ( = 1-) 2 2 1,282 1,645 1,960 2,326 2,576 2,807 3,090 z 0,800 0,900 0,950 0,980 0,990 0.995 0,998 BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 Ativ. 7B: Ex3 – pg186 Dois sistemas computacionais A e B, selecionadas 400 cargas de trabalho. O sistema A foi melhor que o B em 60% dos casos. Construir o I.C para proporção (proporção de vezes que o sistema A foi melhor que o B) n pp zppIC )ˆ1(ˆ ˆ)1,( 2 %]8.64%;2.55[%)95,( 048.06.0%)95,( 400 )6.01(6.0 )96.1(6.0%)95,( pIC pIC pIC BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 Estimação de parâmetros: intervalo de confiança para média = média na população (parâmetro que se quer estimar) = média na amostra (pode ser calculada com base na amostra) = erro-padrão da média. X x n X BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 Estimação de parâmetros: intervalo de confiança para média Caso o desvio padrão (populacional) seja conhecido: n zxIC 2 )1,( BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 Ativ.7B–Ex6-pg188 Em uma indústria de cerveja, a quantidade de cerveja inserida em latas tem média 350ml e desvio padrão populacional de 3ml. Retirou-se uima amostra de 20 latas acusou média de 346ml. Construir o IC para a verdadeira média. I.C para média ]31.347;69.344[%)95,( 31.1346%)95,( 20 3 )96.1(346%)95,( )1,( 2 IC mlIC IC n zxIC BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 Estimação de parâmetros: intervalo de confiança para média Caso o desvio padrão (populacional) não seja conhecido: uso da distribuição t de Student. BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 A distribuição t de Student • Supondo a população com distribuição normal, a estatística tem distribuição de probabilidades conhecida como distribuição t de Student, com gl = n – 1 graus de liberdade. n S X T BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 A distribuição t de Student t com gl = (normal padrão) t com gl = 3 t com gl = 1 x f(x) 0 BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 Estimação de parâmetros: intervalo de confiança para média Caso o desvio padrão (populacional) não seja conhecido: n s txIC 2 )1,( s = desvio padrão calculado na amostra BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 Como usar a Tabela t (Tab. IV do Apêndice) • Ilustração com gl = 9 e nível de confiança de 95%. BARBETTA, REIS e BORNIA – Estatística para Cursos de Engenharia e Informática. Atlas, 2004 Tiv. 7B –Ex8 – pg190 Para avaliar a dureza esperada μ do aço produzido sob um novo processo de têmpera. Uma amostra de dez corpos de prova de aço produziu os seguintes resultados, em HRc: {36.4, 35.7, 37.2, 36.5, 34.9, 35.2, 36.3, 35.8, 36.6, 36.9}. Construir o I.C. para a verdadeira média com alfa de 5%. I.C para média ]68.36;62.35[%)95,( 53.015.36%)95,( 10 7352.0 )262.2(15.36%)95,( )1,( 2 IC IC IC n s txIC
Compartilhar