Baixe o app para aproveitar ainda mais
Prévia do material em texto
Inferência Estatística INTRODUÇÃO • A Inferência Estatística é um conjunto de técnicas que objetiva estudar a população através de evidências fornecidas por uma amostra. • É a amostra que contém os elementos que podem ser observados e, a partir daí, quantidades de interesse podem ser medidas. Estimação de Parâmetros População Amostra Distribuição de Probabilidade (ou FDP) Parâmetros Distribuição Amostral (Frequências) Estatísticas(valor fixo) estimar (variável aleatória) pontual (estatísticas) por intervalo (intervalos de confiança) Estimação OBS:estatística: é a v.a. que estima (pontualmente) um parâmetro (populacional) as vezes é chamada simplesmente de estimador estimativa: é o valor do estimador obtido para uma amostra específica Estimação Distribuição Amostral • Retrata o comportamento de uma estatística (média, proporção, entre outras), caso retirássemos todas as possíveis amostras de tamanho “n” de uma população. • Uma estatística é uma função da amostra. Uma amostra consiste de observações de uma variável aleatória. • Assim,estatísticas também são variáveis aleatórias e, por isso, possuem uma distribuição de probabilidade. DISTRIBUIÇÃO AMOSTRAL DA MÉDIA • Considere uma população de 5 elementos (N = 5): 1, 2, 3, 4, 5. Determine todas as amostras possíveis de n=2 com reposição e calcule a média e a variância. • Solução: Na população, temos que µ=3 e σ2=2. DISTRIBUIÇÃO AMOSTRAL DA MÉDIA DISTRIBUIÇÃO AMOSTRAL DA MÉDIA DISTRIBUIÇÃO AMOSTRAL DA MÉDIA • Aqui µ e σ são a média e o desvio padrão populacionais das medidas individuais X , e n é o tamanho amostral. Denota-se • A aproximação para a normal melhora à medida que o tamanho amostral cresce. Este resultado é conhecido como o Teorema Central do Limite e é notável porque permite-nos conduzir alguns procedimentos de inferência sem qualquer conhecimento da distribuição da população. Qualidade do Estimador Qualidade do Estimador Qualidade do Estimador • Exemplo: Um pesquisador deseja estimar a produção média de um processo químico com base na observação da produção de três realizações X1, X2, X3 de um experimento. Considere dois estimadores da média ESTIMAÇÃO PONTUAL • No processo de estimação por ponto admite-se como valor numérico do parâmetro exatamente a estimativa calculada a partir de uma amostra aleatória extraída da população em estudo. Estimação Pontual Seja X uma v.a. normalmente distribuída com a média (µ) e a variância (σ2) desconhecidas. Retira-se uma amostra de tamanho n com a finalidade de se estimar µ e σ2. • média populacional µ De que maneira os valores da amostra podem ser combinados a fim de se produzir uma “boa” estimativa de µ? ˆkµ é o k-ésimo estimador de µ 1ˆ( ) ( )E E Xµ = • testando a tendenciosidade dos estimadores 1 2 nX X XE n + + + = L ( )1 21 nE X X X n = + + +L n n µ = µ= 1 n i i x n = = ∑ 1ˆ Xµ = 2ˆ ixµ = Estimação Pontual Seja X uma v.a. normalmente distribuída com a média (µ) e a variância (σ2) desconhecidas. Retira-se uma amostra de tamanho n com a finalidade de se estimar µ e σ2. • média populacional µ De que maneira os valores da amostra podem ser combinados a fim de se produzir uma “boa” estimativa de µ? 2ˆ( )E µ = • testando a tendenciosidade dos estimadores ( )iE X µ=1ˆ( )E µ µ=1 n i i x n = = ∑ 1ˆ Xµ = 2ˆ ixµ = ˆkµ é o k-ésimo estimador de µ Estimação Pontual Seja X uma v.a. normalmente distribuída com a média (µ) e a variância (σ2) desconhecidas. Retira-se uma amostra de tamanho n com a finalidade de se estimar µ e σ2. • média populacional µ De que maneira os valores da amostra podem ser combinados a fim de se produzir uma “boa” estimativa de µ? • procurando a menor variância 1ˆ( )E µ µ= 2ˆ( )E µ µ= 1ˆ( ) ( )Var Var Xµ = 1 2 n X X XVar n + + + = L ( )1 221 nVar X X Xn= + + +L 2 2 n n σ = 2 n σ = 1 n i i x n = = ∑ 1ˆ Xµ = 2ˆ ixµ = ˆkµ é o k-ésimo estimador de µ Estimação Pontual Seja X uma v.a. normalmente distribuída com a média (µ) e a variância (σ2) desconhecidas. Retira-se uma amostra de tamanho n com a finalidade de se estimar µ e σ2. • média populacional µ De que maneira os valores da amostra podem ser combinados a fim de se produzir uma “boa” estimativa de µ? • procurando a menor variância 1ˆ( )E µ µ= 2ˆ( )E µ µ= 2 1ˆ( )Var n σµ = 2ˆ( )Var µ = ( )iVar X 2σ=1 n i i x n = = ∑ 1ˆ Xµ = 2ˆ ixµ = ˆkµ é o k-ésimo estimador de µ Estimação Pontual Seja X uma v.a. normalmente distribuída com a média (µ) e a variância (σ2) desconhecidas. Retira-se uma amostra de tamanho n com a finalidade de se estimar µ e σ2. • média populacional µ De que maneira os valores da amostra podem ser combinados a fim de se produzir uma “boa” estimativa de µ? 1ˆ( )E µ µ= 2ˆ( )E µ µ= 2 1ˆ( )Var n σµ = 2 2ˆ( )Var µ σ= 1 n i i x n = = ∑ 1ˆ Xµ = 2ˆ ixµ = ˆkµ é o k-ésimo estimador de µ Estimação Pontual Seja X uma v.a. normalmente distribuída com a média (µ) e a variância (σ2) desconhecidas. Retira-se uma amostra de tamanho n com a finalidade de se estimar µ e σ2. • variância populacional σ2 De que maneira os valores da amostra podem ser combinados a fim de se produzir uma “boa” estimativa de σ2? ( )2 2 1 ˆ n i i x X n σ = − = ∑ Mas será tendenciosa? ( ) ( )2 2 2 1 1 2 n n i i i i i X X X XX X = = − = − +∑ ∑ Estimação Pontual Seja X uma v.a. normalmente distribuída com a média (µ) e a variância (σ2) desconhecidas. Retira-se uma amostra de tamanho n com a finalidade de se estimar µ e σ2. • variância populacional σ2 De que maneira os valores da amostra podem ser combinados a fim de se produzir uma “boa” estimativa de σ2? ( )2 2 1 ˆ n i i x X n σ = − = ∑ 2 2 1 1 2 n n i i i i X X X nX = = = − +∑ ∑ 1 1 n i n i i i X X X nX n = = = ⇒ = ∑ ∑ 2 2 1 n i i X nX = = −∑ 2 2 2 1 2 n i i X nX nX = = − +∑ Estimação Pontual Seja X uma v.a. normalmente distribuída com a média (µ) e a variância (σ2) desconhecidas. Retira-se uma amostra de tamanho n com a finalidade de se estimar µ e σ2. • variância populacional σ2 De que maneira os valores da amostra podem ser combinados a fim de se produzir uma “boa” estimativa de σ2? ( )2 2 1 ˆ n i i x X n σ = − = ∑ ( ) 2 2 2 1 ˆ n i i X nX E E n σ = − = ∑ ( )2 2 1 1 n i i E X E X n = = − ∑ ( ) ( )2 2 1 1 n i i E X E X n = = −∑ 2( )iVar X σ= ( ) ( )( )22i iE X E X= − ( )2 2iE X µ= − ( )2 2 2iE X σ µ⇒ = + Estimação Pontual Seja X uma v.a. normalmente distribuída com a média (µ) e a variância (σ2) desconhecidas. Retira-se uma amostra de tamanho n com a finalidade de se estimar µ e σ2. • variância populacional σ2 De que maneira os valores da amostra podem ser combinados a fim de se produzir uma “boa” estimativa de σ2? ( )2 2 1 ˆ n i i x X n σ = − = ∑ ( ) 2 2 2 1 ˆ n i i X nX E E n σ = − = ∑ ( )2 2 1 1 n i i E X E X n = = − ∑ ( ) ( )2 2 1 1 n i i E X E X n = = −∑ 2 ( )Var X n σ = ( ) ( )( )22E X E X= − ( )2 2E X µ= − ( ) 22 2E X n σ µ⇒ = + Estimação Pontual Seja X uma v.a. normalmente distribuída com a média (µ) e a variância (σ2) desconhecidas. Retira-se uma amostra detamanho n com a finalidade de se estimar µ e σ2. • variância populacional σ2 De que maneira os valores da amostra podem ser combinados a fim de se produzir uma “boa” estimativa de σ2? ( )2 2 1 ˆ n i i x X n σ = − = ∑ ( ) 2 2 2 1 ˆ n i i X nX E E n σ = − = ∑ ( )2 2 1 1 n i i E X E X n = = − ∑ ( ) ( )2 2 1 1 n i i E X E X n = = −∑ 2 2 2 2 n σ σ µ µ= + − − 2 2n n σ σ− = 21n n σ − = estimador tendencioso! ( )2 2 1 ˆ 1 n i i x X n n n σ = − = − ∑ Estimação Pontual Seja X uma v.a. normalmente distribuída com a média (µ) e a variância (σ2) desconhecidas. Retira-se uma amostra de tamanho n com a finalidade de se estimar µ e σ2. • variância populacional σ2 De que maneira os valores da amostra podem ser combinados a fim de se produzir uma “boa” estimativa de σ2? ( )2 2 1 1 n i i x X s n = − = − ∑ ( )2 2E s σ= estimador não tendencioso ESTIMAÇÃO PONTUAL ESTIMAÇÃO PONTUAL • Exemplo. Deseja-se conhecer o preço médio de determinado artigo em certa localidade. Para este fim, observou-se o preço do mesmo em 5 pontos de venda escolhidos aleatoriamente na localidade, encontrando-se os seguintes valores: 85, 80, 86, 88 e 83. Estime por ponto o preço médio do artigo em todos os pontos de venda da localidade. ESTIMAÇÃO PONTUAL Estimação Intervalar Introdução • No processo de estimação por intervalo, usa-se a distribuição amostral do estimador para a construção de um intervalo a partir de uma estimativa • Este intervalo tem uma probabilidade, especificada a priori, de conter o valor numérico do parâmetro estimado. • O intervalo é denominado intervalo de confiança e a probabilidade deste intervalo conter o valor numérico do parâmetro é denominada nível de confiança. • Genericamente, se θ é um parâmetro de uma população, o intervalo de confiança de 100(1−α)% para θ é • sendo 1−α a probabilidade de que o referido intervalo contenha o valor do parâmetro. • Esta probabilidade é denominada nível de confiança. supinf θθθ << Intervalo de confiança para a média populacional • Variância populacional seja conhecida – Suponha que uma variável X de uma população seja N(µ; σ2 ) – Se for extraída com reposição, uma amostra de tamanho n, – Pelo TEREMA CENTRAL DO LIMITE: n XZ X /σ µ− = Intervalo de confiança para a média populacional (cont.) • Considere a proporção 1−α de amostras da população em estudo tais que α αα −=<<− 1)( 2/2/ zZzP X Intervalo de confiança para a média populacional (cont.) α σ µ αα −=< − <− 1) / ( 2/2/ z n X zP • é denominado intervalo de confiança de 100(1−α)% para a média populacional. • Diz-se então que a probabilidade de que este intervalo contenha a média populacional é 1−α. α σµσ αα −=+<<− 1)( 2/2/ n zX n zXP Intervalo de confiança para a média populacional (cont.) • Se a amostragem é sem reposição, usando o mesmo raciocínio, tem-se que o intervalo de confiança de 100(1−α)%para a média populacional é – Observação: Se N >> n (para fins práticos, N ≥≥≥≥ 10n) o termo – e a amostragem sem reposição é equivalente à amostragem com reposição 11 2/2/ − −+<< − − − N nN n zxN nN n zx σµσ αα 11 ≅− − N nN Exemplo • Para estimar o salário médio de operários em certa localidade na qual o salário em R$ é uma VAC N(µ, 100), um pesquisador analisou os salários de 80 operários, escolhidos aleatoriamente na localidade, constatando que o salário médio dos mesmos é R$310,00. Construa e interprete um intervalo de confiança de 95% para o salário médio de todos dos operários da localidade considerada, admitindo- se que o número de operários na localidade seja muito maior que 100. Solução • Não tendo sido dado o tamanho da população (número de operários na localidade) admite-se amostragem com reposição • Então, sendo X o salário de um operário na localidade, o intervalo de confiança para o salário médio nesta localidade é n zx n zx σµσ αα 2/2/ +<<− Solução (cont.) • Pelo enunciado do problema tem-se que a estimativa do salário médio na localidade obtida a partir da amostra de tamanho n = 80 é = 310, sendo que o desvio padrão dos salários na localidade é σ = = 10. • Sendo = 0,95, α = 0,05 e o coeficiente de confiança, , é tal que como ilustra o gráfico a seguir. x 100 α−1 Solução (cont.) • Pela tabela do apêndice 1 tem-se que = 1,96. Assim sendo, o intervalo de 95% para o salário médio dos operários na localidade é 475,02/95,02/)()0( 2/2/2/ ==<<−=<< ααα zZzPzZP XX Solução (cont.) 80 1096,1310 80 1096,1310 +<<− µ • Este resultado significa que a probabilidade de que o intervalo acima contenha o salário médio dos operários na localidade é 0,95. 19,312$R81,307$R << µ Intervalo de confiança para a média populacional • Variância populacional é desconhecida. • Considerando-se amostragem com reposição, o erro padrão da média, é substituído por seu estimador n SS X = 1 )(1 2 − − = ∑ = n XX S n i i Intervalo de confiança para a média populacional (cont.) • Define-se a variável padronizada • Esta variável tem uma distribuição de probabilidade denominada distribuição t de Student com ν = n − 1 graus de liberdade. n S XTX µ− = Intervalo de confiança para a média populacional (cont.) • A forma da distribuição t depende do número de graus de liberdade da mesma. • Se ν é suficientemente grande (na prática, ν ≥ 30) a distribuição t se aproxima da distribuição normal padronizada, isto é, sendo Z a variável N(0, 1). ZT = ∞→ν lim Intervalo de confiança para a média populacional (cont.) • Considere a proporção 1−α de amostras da população em estudo, tais que – sendo o coeficiente de confiança neste caso. O gráfico a seguir ilustra esta situação. ααα −=<<− 1)( 2/2/ tTtP X 2/αt Intervalo de confiança para a média populacional (cont.) • é denominado intervalo de confiança de 100(1−α)% para a média populacional. • Diz-se então que a probabilidade de que este intervalo contenha a média populacional é 1−α. α µ αα −=< − <− 1)( 2/2/ t n S X tP αµ αα −=+<<− 1)( 2/2/ n StX n StXP Intervalo de confiança para a média populacional (cont.) • Se a amostragem é sem reposição, usando o mesmo raciocínio, tem-se que o intervalo de confiança de 100(1−α)%para a média populacional é – Observação: Se N >> n (para fins práticos, N ≥≥≥≥ 10n) o termo – e a amostragem sem reposição é equivalente à amostragem com reposição 11 ≅− − N nN 11 2/2/ − − +<< − − − N nN n stx N nN n stx αα µ Exemplo • Um pesquisador analisou o custo de produção, em R$, numa amostra de 10 unidades de um artigo produzido por certo fabricante escolhidas aleatoriamente da produção, encontrando os seguintes valores: 10, 11, 7, 9, 6, 7, 10, 7, 6 e 8. Construa e interprete um intervalo de 95% para o custo médio de produção do artigo considerado. Solução Não tendo sido informado o tamanho da população (número de unidades produzidas) admite-se amostragem com reposição. Então, sendo X o custo de produção de uma unidade, o intervalo de confiança para o custo médio de produção de uma unidade deste artigo é n stx n stx 2/2/ αα µ +<<− Tem-se a partir desta amostra de tamanho n = 10 que a estimativa da média amostral é 10 10 1∑ = = i ixx e a estimativa do desvio padrão amostral é ( ) ( ) 909)110(10110 210 1 10 1 2210 1 10 1 2 ∑∑∑∑ ==== −= − − − = i ii ii ii i xxxx s 818671076971110101 =+++++++++=∑ =i ix 6858671076971110 2222222222101 2 =+++++++++=∑ =i ix 1,810 81 ==x 79,1 90 81 9 685 2 =−=s Sendo α−1 = 0,95, α = 0,05 e o coeficiente de confiança, ,025,0t é tal que 95,0)( 025,0025,0 =<<− tTtP X como ilustra o gráfico a seguir. Figura 5 A variável XT tem distribuição t de Student com ν = n − 1 = 10 − 1 = 9 graus de liberdade. Pela tabela do apêndice 2 tem-se para ν = 9 e α = 0,05 que 025,0t = 2,26. Como não foi informado o tamanho da população (número de unidades produzidas) considera-se amostragem com reposição ou amostragem sem reposição de uma população muito maior que a amostra. Assim sendo, o intervalo de confiança de 95% para o custo médio deste artigo é 10 79,126,21,8 10 79,126,21,8 +<<− µ ∴ 38,9$R82,6$R << µ Este resultado significa que a probabilidade de que o intervalo acima contenha o custo médio das unidades deste artigo é 0,95. Intervalo de Confiança para a Proporção Populacional • Suponha que certa população tenha uma proporção pi de objetos com uma característica de interesse para o pesquisador (por exemplo, pi pode ser a proporção de unidades defeituosos de certo artigo numa linha de produção). • Neste caso, o estimador não tendencioso de pi é a proporção amostral P. Considerando-se amostragem com reposição, sabe-se da distribuição amostral da proporção que a proporção amostral P tem média igual a pi e desvio padrão n P )1( pipi σ − = Intervalo de Confiança para a Proporção Populacional (cont.) • Para grandes amostras (n ≥ 30), a proporção amostral P tem distribuição aproximadamente normal. Assim sendo, a variável normal padronizada associada a P é • tem distribuição aproximadamente normal padronizada. n pp PZP )1( − − = pi Intervalo de Confiança para a Proporção Populacional (cont.) Considere a proporção 1−α de amostras da população em estudo tais que ααα −=<<− 1)( 2/2/ zZzP P Intervalo de Confiança para a Proporção Populacional (cont.) α pi αα −=< − − <− 1))1(( 2/2/ z n pp p zP n pp zp n pp zp )1()1( 2/2/ −+<<−− αα pi Intervalo de confiança para a Proporção Populacional (cont.) • Se a amostragem é sem reposição, usando o mesmo raciocínio, tem-se que o intervalo de confiança de 100(1−α)% para a proporção populacional é – Observação: Se N >> n (para fins práticos, N ≥≥≥≥ 10n) o termo – e a amostragem sem reposição é equivalente à amostragem com reposição 11 ≅− − N nN 1 )1( 1 )1( 2/2/ − − − +<< − − − − N nN n pp zpN nN n pp zp αα pi Exemplo • Um produtor deseja estimar a proporção de itens de certo artigo na linha de produção de sua empresa que apresentam defeito de fabricação. Para esta finalidade, retirou uma amostra de 200 itens retirados aleatoriamente da linha de produção, constatando que 16 destes apresentam defeito de fabricação. Construa e interprete um intervalo de confiança de 95% para a proporção de itens na linha de produção que apresentam defeito de fabricação. Solução Não tendo sido informado o tamanho da população (número de itens produzidos) admite-se amostragem com reposição ou amostragem sem reposição de uma população infinita ou população finita muito maior que a amostra e o intervalo de confiança para a proporção de itens defeituosos na linha de produção é n pp zp n pp zp )1()1( 2/2/ −+<<−− αα pi onde p = x/n. Na amostra de tamanho n = 200 foram observados x = 16 itens defeituosos. Então a estimativa da proporção pi de itens defeituosos na linha de produção é 08,0 200 16 ==p Sendo 1 − α = 0,95, α = 0,05 e o coeficiente de confiança 2/αz é tal que 95,0)( 2/2/ =<<− αα zZzP P como ilustra o gráfico a seguir. Solução (cont.) 475,02/95,02/)()0( 2/2/2/ ==<<−=<< ααα zPZzPzPZP Pela tabela do apêndice 1 tem-se que 2/αz = 1,96. Assim sendo, o intervalo de 95% para a proporção de itens defeituosos na linha de produção é 200 )08,01(08,096,108,0200 )08,01(08,096,108,0 −+<<−− pi ∴ 118,0042,0 << pi Com este resultado, a probabilidade de que o intervalo acima contenha a proporção de itens defeituosos na linha de produção é 0,95. DETERMINAÇÃO DO TAMANHO DA AMOSTRA PARA ESTIMAÇÃO DA MÉDIA • Considere uma variável X N (µ, σ 2). Para um intervalo de confiança de 100(1−α)% para µ construído a partir de uma determinada amostra com média extraída com reposição tem-se que • onde é o erro de estimativa. Explicitando- se n tem-se que n x z σ µ α − = 2/ 2 0 22 2/ e z n σα = 0ex =− µ DETERMINAÇÃO DO TAMANHO DA AMOSTRA PARA ESTIMAÇÃO DA MÉDIA (cont.) • No caso da amostragem sem reposição de uma população finita de tamanho N tem-se que 1 2/ − − − = N nN n x z σ µ α 22 2/ 2 0 22 2/ )1( σ σ α α ze Nz n N +− = DETERMINAÇÃO DO TAMANHO DA AMOSTRA PARA ESTIMAÇÃO DA MÉDIA (cont.) • Se o desvio padrão populacional σ é desconhecido, substitui-se o mesmo por sua estimativa s obtida a partir de uma amostra inicial, denominada amostra piloto com n’ elementos (sendo n’ arbitrário) e procede-se do seguinte modo: – se n for maior que n’, o tamanho da amostra definitiva será n e deve-se acrescentar aos n’ elementos da amostra piloto até completar a amostra de tamanho n; – se n for menor ou igual a n’, a amostra piloto já é suficiente e o tamanho da amostra definitiva será n = n’ Exemplo • Um pesquisador deseja estimar o preço médio de um produto nos pontos de venda de certa região, de modo que o erro de estimação seja no máximo igual a R$2,00, admitindo-se um nível de confiança de 95%. O pesquisador dispõe de uma amostra piloto de 40 pontos de venda nos quais o desvio padrão do preço do produto é igual a R$12,00. Qual deve ser o tamanho da amostra? Solução Não tendo sido informado o tamanho da população (número de pontos de venda da região), o tamanho da amostra é 2 0 22 2/ e z n σα = Pelos dados do problema, tem-se que 0e = 2 e σ = 12. Sendo ,95,01 =−α 05,0=α e 025,0z é tal que 95,0)( 2/2/ =<<− αα zZzP X como ilustra o gráfico a seguir. Figura 5.8 Observando-se o gráfico acima tem-se que 475,02/95,02/)()0( 2/2/2/ ==<<−=<< ααα zZzPzZP XX Pela tabela do apêndice 1 tem-se que 2/αz = 1,96. Assim sendo, o tamanho da amostra para estimar o preço médio do produto nos pontos de venda da região é 2 22 2 1296,1 × =n ∴ 139 =n DETERMINAÇÃO DO TAMANHO DA AMOSTRA PARA A ESTIMAÇÃO DA PROPORÇÃO • Considere uma população com uma proporção pi de objetos e uma amostra extraída com reposição com uma proporção p de objetos • onde é o erro de estimativa n p z )1(2/ pipi pi α − − = 0ep =− pi 2 0 2 2/ )1( e z n pipiα − = DETERMINAÇÃO DO TAMANHO DA AMOSTRA PARA A ESTIMAÇÃO DA PROPORÇÃO (cont.) • No caso da amostragem sem reposição de uma população finita de tamanho N tem-se que • Como a proporção pi é desconhecida, emprega-se uma estimativa da mesma a partir de uma amostra piloto como no caso da média 1 )1(2/ − −− − = N nN n p z pipi pi α )(1 )1( )(1 2 2/ 2 0 2 2/ pipi pipi α α −+− − = zeN Nz n Exemplo • Com o objetivo de estimar a proporção de itens defeituosos numa produção, um administrador de produção deseja extrair uma amostra aleatória de itens da referida produção para tal fim. Uma amostra piloto de 40 itens apresentou 4 defeituosos. Qual deve ser o tamanho da amostradefinitiva para que o erro de estimação da proporção de defeituosos na população seja de no máximo 3% a um nível de confiança de 95%? Solução Não tendo sido informado o tamanho da população (número de itens produzidos) o tamanho da amostra é 2 0 2 2/ )1( e z n pipiα − = Sendo pi desconhecido, considera-se a partir da amostra piloto 1,0 40 4 ==pi Pelos dados do problema, tem-se que 0e = 0,03. Sendo ,95,01 =−α 05,0=α e 025,0z é tal que 95,0)( 2/2/ =<<− αα zZzP X como ilustra o gráfico a seguir. Solução (cont.) Observando-se o gráfico acima tem-se que 475,02/95,02/)()0( 2/2/2/ ==<<−=<< ααα zZzPzZP XX Pela tabela do apêndice 1 tem-se que 2/αz = 1,96. Assim sendo, o tamanho da amostra para estimar a proporção de itens defeituosos na produção é 203,0 )1,01(1,096,1 −× =n ∴ 385 =n Neste caso deve-se acrescentar 345 itens à amostra piloto. Intervalo de confiança para a variância de uma população • Seja uma amostra aleatória extraída uma população X~ N (µ, σ 2). A variável aleatória: • tem distribuição do chi-quadrado com n −1 graus de liberdade 2 2 12 ( 1) ~ n n s χ σ − − ⇒ DistribuiDistribuiçção ão χχ22 2 1 2 2 1( ) 0 2 ( 2) g x gf x x e xg − − = ≥ Γ ( )E X g= ( ) 2Var X g= 2 ~ gX χ (lê-se: X tem distribuição qui-quadrado com g graus de liberdade) 0 +∞ g ≤ 2 0 +∞ g > 2 Propriedades: a) se , então 2 21~Z χ~ (0,1)Z N b) se , então 2 1 ~ n i n i X χ = ∑21~iX χ Intervalo de ConfianIntervalo de Confiançça para a para σσ22 2 α 2 α IC para σ2 2 2 12 ( 1) ~ n n s χ σ − − 2 1nχ − 0 +∞ax bx 1 α− 2 1( ) 1a n bP x xχ α−< < = − 2 2 ( 1)( ) 1 a b n sP x x α σ − < < = − 2 2 1 1 1( 1)b a P x n s x σ α < < = − − 2 2 2( 1) ( 1) 1 b a n s n sP x x σ α − − < < = − χ2 Exemplo • Uma máquina produz uma grande quantidade de peças e o número de peças defeituosas da produção se distribui normalmente com variância σ²(x) = 16. Com o objetivo de diminuir a variabilidade do processo, foi providenciada uma reforma na máquina. Uma amostra aleatória de 51 peças produzidas após a reforma forneceu variância 14. Construa um intervalo de confiança de 98% para a nova variância populacional. Solução n = 51 , logo gl (grau de liberdade) = n – 1 = 50 s² = 14 χ²(1 – α/2) = χ²(0,99) = 76,2 χ² (α/2) = χ²(0,01) = 29,7 1 – α = 98% ; α = 0,02 ; α/2 = 0,01 Teremos então o seguinte intervalo de confiança para a variância: P ( ≤ σ² ≤ ) = 1 – α P ( ≤ σ² ≤ ) = 0,98 P ( 9,186 ≤ σ² ≤ 23,569) = 0,98 Intervalo de confiança para a diferença entre as médias de duas populações normais, variâncias desconhecidas Intervalo de ConfianIntervalo de Confiançça para a para µµ11 -- µµ22 1 ~ ?X 1 2 1 2 2 2 1 2 1 2 ( ) ( ) ~ ?X X n n µ µ σ σ − − − + (0,1)N -∞ +∞0 (0,1)N z-z 2 α 2 α 1 α− ( ) 1P z Z z α− < < = − 1 2 1 2 2 2 1 2 1 2 ( ) ( )( ) 1X XP z z n n µ µ α σ σ − − − − < < = − + 2 2 2 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 ( ) 1P X X z X X z n n n n σ σ σ σµ µ α− − + < − < − + + = − IC para µ1 - µ2 2 1 1 1~ ( , )X N µ σ 2 1 1 1 1 ~ ( , )X N n σµ Z 2 2 2 2~ ( , )X N µ σ desconhecidas, mas conhecidasiµ 2iσ 2 2 2 2 2 ~ ( , )X N n σµ 1 2 ~ ?X X− 2 2 1 2 1 2 1 2 1 2 ~ ( , )X X N n n σ σµ µ− − + Exemplo • Duas populações normais independentes, com distribuições x1 e x2, apresentam σ(x1) = 5 e σ(x2) = 2. Uma amostra aleatória de 12 elementos da primeira população apresentou x1 = 34. Uma amostra aleatória de 8 elementos da segunda população apresentou x2 = 9,4. Calcule o intervalo de confiança de 98% para a diferença µ₁ - µ₂. Solução P [ (34 – 9,4) – Zα/2 < (µ ₁ - µ₂) < (34 – 9,4) + Zα/2 ] = 0,98 1 – α = 98% ; α = 2% ; α/2 = 0,01 ; logo, Zα/2= 2,325 P [ 24,6 – 2,325(1,607) < (µ ₁ - µ₂) < 24,6 + 2,325(1,607) ] = 0,98 P [ 20,864 < (µ ₁ - µ₂) < 28,336 ] = 0,98 -∞ +∞0 gt t-t 2 α 2 α 1 α− ( ) 1P t T t α− < < = − Intervalo de ConfianIntervalo de Confiançça para a para µµ11 -- µµ22 1 2 1 2 2 2 1 2 1 2 ( ) ( ) ~ g X X t s s n n µ µ− − − + 2 1 1 1~ ( , )X N µ σ 22 2 2~ ( , )X N µ σ e desconhecidasiµ 2iσ 1 2 1 2 2 2 1 2 1 2 ( ) ( ) ~ ?X X n n µ µ σ σ − − − + (0,1)N 1 2 1 2 2 2 1 2 1 2 ( ) ( )( ) 1X XP t t s s n n µ µ α − − − − < < = − + 2 2 2 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 ( ) 1s s s sP X X t X X t n n n n µ µ α− − + < − < − + + = − IC para µ1 - µ2 (atenção: t heterocedástico)2 21 2σ σ≠ 22 2 1 2 1 2 2 22 2 1 2 1 2 1 21 1 s s n n g s s n n n n + ≈ + − − (considerando 2 21 2σ σ≠ ) Exemplo • Com os dados de resistências à compressão em concretos com cimentos das marcas A e B, considerando variâncias desconhecidas. E nível de confiança de 95%. Exemplo Exemplo Intervalo de ConfianIntervalo de Confiançça para a para pipi11 –– pipi22 Exemplo • Duas máquinas produzem o mesmo tipo de peça, que são misturadas para embalagem posterior. Uma amostra de 40 peças da primeira máquina apresentou 1 peça defeituosa, enquanto uma amostra de 36 peças da segunda máquina apresentou 2 peças defeituosas. Calcule, ao nível de 98%, um intervalo de confiança para a diferença das proporções de peças defeituosas na produção dessas máquinas. Solução
Compartilhar