Baixe o app para aproveitar ainda mais
Prévia do material em texto
Intervalo de Confianc¸a 1 Estimac¸a˜o A estimac¸a˜o e´ o processo que consiste em utilizar dados amostrais para estimar os valores de paraˆmetros populacionais desconhecidos. Essencialmente, qualquer caracter´ıstica de uma populac¸a˜o pode ser estimada a partir de uma amostra aleato´ria. Entre os mais comuns, esta˜o a me´dia e o desvio padra˜o de uma populac¸a˜o e a proporc¸a˜o populacional. 1.1 Estimac¸a˜o por ponto: E` o processo atrave´s do qual obteremos um u´nico ponto, ou seja, um u´nico valor para estimar o paraˆmetro. Exemplo: Amostra (1,3,2) X = ∑ xi n = 1+3+2 3 = 2 Estimativa pontual ou por ponto de µ. S2 = ∑ (xi−x)2 n−1 = 1 estimativa pontual ou por ponto de σ 2 1.2 Estimac¸a˜o por Intervalo: E´ um processo que permite obter um intervalo onde, com uma determinada probabilidade (n´ıvel de confianc¸a), podemos esperar encontrar o verdadeiro valor do paraˆmetro. LI < θ < LS As estimativas por intervalo sa˜o prefer´ıveis a`s estimativas por ponto porque indicam a precisa˜o, ou seja, sabemos a probabilidade de o intervalo conter o paraˆmetro. 2 Intervalo de Confianc¸a Trata-se de uma das te´cnicas para infereˆncia estat´ıstica, onde a partir de um intervalo de confianc¸a, constru´ıdo com os elementos da amostra, pode-se inferir sobre um paraˆmetro popu- lacional. Devido a` variabilidade amostral, as poss´ıveis amostras aleato´rias de mesmo tamanho reti- radas da mesma populac¸a˜o tera˜o medidas diferentes. Assim, surge naturalmente a pergunta: qual a confiabilidade de uma estimativa pontual? O intervalo de confianc¸a foi institu´ıdo para definir de forma objetiva a credibilidade da estimativa. INTERVALO DE CONFIANC¸A e´ o intervalo de valores que conte´m o paraˆmetro da pop- ulac¸a˜o, com uma determinada probabilidade de acerto, e e´ constru´ıdo a partir de uma amostra aleato´ria retirada da populac¸a˜o. Se pudessemos construir uma quantidade grande de intervalos (aleato´rios!) da forma ]X − 1, 96σX , X + 1, 96σX [, todos baseados em amostras de tamanho n, 95% deles conteriam o paraˆmetro µ. 1 Dizemos que 1−α = 0, 95 e´ o n´ıvel de confianc¸a e α e´ o n´ıvel de significaˆncia. Nessa figura esta˜o esquematizados o funcionamento e o significado de um intervalo de confianc¸a (IC) para µ, com 1− α = 0, 95 e σ2 conhecido. Escolhida uma amostra e encontrada sua me´dia x0, e admitindo-se σx conhecido, podemos construir o intervalo ]x0 − 1, 96σX , x0 + 1, 96σX [. Este intervalo pode ou na˜o conter o paraˆmetro µ. Suponha que tenhamos uma amostra de tamanho n e que constru´ımos um intervalo de confianc¸a com n´ıvel de confianc¸a 95% e obtemos o seguinte intervalo: 0, 476 < µ < 0, 544. 1. ERRADA: “Ha´ uma chance de 95% de que o verdadeiro valor de µ esta´ entre 0,476 e 0,544.” 2. CERTA: “Estamos 95% confiantes de que o intervalo de 0,476 e 0,544 realmente conte´m o verdadeiro valor de µ”. Isto significa que, se selecionarmos muitas diferentes amostras de mesmo tamanho n e constru´ıssemos os intervalos de confianc¸a correspondentes, 95% deles realmente conteriam o valor da me´dia populacional µ. O n´ıvel de 95% se refere a` taxa de sucesso do processo em uso para estimar a me´dia populacional, e na˜o se refere a` pro´pria me´dia populacional.) Consideremos o seguinte experimento de simulac¸a˜o. Geramos 20 amostras de tamanho n = 25 de uma distribuic¸a˜o normal de me´dia µ = 5 e desvio padra˜o σ = 3. Para cada amostra constru´ımos o intervalo de confianc¸a para µ, com n´ıvel de significaˆncia α = 0, 5 , que e´ da forma X ± 1, 176. Na figura abaixo temos esses intervalos representados e notamos que treˆs deles (amostras de nu´meros 5, 14 e 15) na˜o conte´m a me´dia µ = 5. 2 2.1 Intervalo de confianc¸a para a Me´dia de Populac¸o˜es Normais com Variaˆncia Conhecida Considere que desejamos estimar a media µ de uma populac¸a˜o X com variaˆncia σ2 conhecida. Para determinar o intervalo de confianc¸a (IC) para µ , utilizamos o estimador X . Conforme ja´ estabelecido, o estimador da me´dia populacional (µ) e´ a me´dia amostral (X), e a distribuic¸a˜o de probabilidade das me´dias e´ NORMAL com paraˆmetros: X ∼ N ( µ, σ2 n ) Logo, a varia´vel padronizada de X sera´ Z = X − µ σ√ n ∼ N(0, 1) Fixando-se um n´ıvel de confianc¸a 1− α , temos a seguinte representac¸a˜o da situac¸a˜o: ou seja, P ( −zα/2 ≤ Z ≤ zα/2 ) = 1− α Substituindo-se o valor de Z, tirado de Z = X−µσ , e resolvendo-se para as duas inequ¨ac¸o˜es, temos: P ( X − zα/2 σ√ n ≤ µ ≤ X + zα/2 σ√ n ) = 1− α Este intervalo de confianc¸a, tambe´m pode ser expresso da seguinte forma: IC(µ; 1− α) = X ± zα/2 σ√ n 3 2.1.1 Margem de Erro O Erro num intervalo de estimac¸a˜o diz respeito ao desvio (diferenc¸a) entre a me´dia amostral e a verdadeira me´dia da populac¸a˜o. Como o intervalo de confianc¸a tem centro na me´dia amostral, o erro ma´ximo prova´vel e´ igual a` metade da amplitude do intervalo. Logo, o intervalo X ± zα/2 σ√ n ou X ± � onde o erro � sendo dado por � = zα/2 σ√ n Exemplo: Em determinada populac¸a˜o, o peso dos homens adultos e´ distribu´ıdo normal- mente com um desvio padra˜o de 16kg. Uma amostra aleato´ria simples de 36 homens adultos e´ sorteada desta populac¸a˜o, obtendo-se um peso me´dio de 78, 2kg. Construa um intervalo de confianc¸a de n´ıvel de confianc¸a 0,95 para o peso me´dio de todos os homens adultos dessa populac¸a˜o. Exemplo: De uma populac¸a˜o normal com variaˆncia 25 extrai-se uma amostra aleato´ria simples de tamanho n com o objetivo de se estimar a me´dia populacional µ com um n´ıvel de confianc¸a de 90% e margem de erro de 2. Qual deve ser o tamanho da amostra? 2.2 Intervalo de Confianc¸a para uma Proporc¸a˜o - Amostras Grandes O procedimento de construc¸a˜o do intervalo de confianc¸a para a proporc¸a˜o populacional e´ to- talmente ana´logo ao do intervalo de confianc¸a para a me´dia de uma populac¸a˜o normal com variaˆncia conhecida. Ja´ foi estabelecido que o estimador para proporc¸a˜o p e´ a proporc¸a˜o amostral p̂, e a dis- tribuic¸a˜o de probabilidade da proporc¸a˜o amostral e´ Normal com paraˆmetros: p̂ ∼ N ( p; p(1− p) n ) (1) Assim, para o caso de populac¸o˜es infinitas, a varia´vel padronizada de p̂ e´ dada por: Z = p̂− p√ p(1−p) n ∼ N(0, 1) (2) Fixando-se um n´ıvel de confianc¸a 1− α, temos a seguinte representac¸a˜o da situac¸a˜o: Ou seja: P ( −zα/2 ≤ Z ≤ zα/2 ) = 1− α 4 Substituindo-se o valor de Z, tirado de Z = p̂−p√ p(1−p) n , e resolvendo-se para as duas inequ¨ac¸o˜es, temos: P p̂− zα/2 √ p(1− p) n ≤ p ≤ p̂+ zα/2 √ p(1− p) n = 1− α Reconhecemos a quantidade √ p(1−p) n como erro-padra˜o do estimador pontual p̂. Infeliz- mente, os limites superior e inferior do intervalo de confianc¸a dependem do paraˆmetro desco- nhecido p. No entanto, uma soluc¸a˜o satisfato´ria e´ substituir p por p̂ no erro-padra˜o, resultando em um erro-padra˜o estimado. Assim, P p̂− zα/2 √ p̂(1− p̂) n ≤ p ≤ p̂+ zα/2 √ p̂(1− p̂) n = 1− α Este intervalo de confianc¸a bilateral, tambe´m pode ser expresso da seguinte forma: IC(p̂; 1− α) = p̂± zα/2 √ p̂(1− p̂) n Exemplo: Um gerente de produc¸a˜o deseja estimar a proporc¸a˜o de pec¸as defeituosas em uma de suas linhas de produc¸a˜o. Para isso, ele seleciona uma amostra aleato´ria simples de 100 pec¸as dessa linha de produc¸a˜o, obtendo 30 defeituosas. Determine o intervalo de confianc¸a para a verdaeira proporc¸a˜o de pec¸as defeituosas nessa linha de produc¸a˜o, a um n´ıvel de significaˆncia de 5%. 5
Compartilhar