Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Um dos problemas mais comuns em amostragem é a determinação do tamanho de amostra necessário. Este problema está relacionado ao erro máximo que estamos dispostos a tolerar na estimação do parâmetro-alvo. 7 - Tamanho de Amostra para Estimar Médias e Totais 7.1 - Erro de Estimação, Absoluto e Relativo O erro de estimação é definido como a diferença entre o estimador e o valor real do parâmetro: . ˆ θ−θ Todavia, esta definição faz com que erros positivos e negativos de mesma magnitude se cancelem, o que é claramente inadequado. É comum trabalhar com funções do erro de estimação: o erro absoluto e o erro relativo. Erro Absoluto: é o valor absoluto do erro de estimação: . ˆ θ−θ Erro Relativo: é o módulo da razão entre o erro de estimação e o valor do parâmetro: O erro relativo expressa o quanto estamos errando em relação ao valor real de θ. . ˆ θ θ−θ Por exemplo, no caso da estimação da média populacional, o erro absoluto é: e o erro relativo é: . Y YYˆ − ,YYˆ − 7.2 – O Conceito de Margem de Erro A margem de erro ε é o valor máximo que o erro absoluto pode assumir, com uma probabilidade elevada (em geral, 0,95). Formalmente, ε é o valor tal que: ( ) .1ˆP α−=ε≤θ−θ 2 Do ponto de vista estatístico, veremos nesta seção que o primeiro passo para dimensionar uma amostra é especificar ε, a margem de erro desejada na estimação do parâmetro-alvo. Isto significa responder à questão: Qual o erro máximo de estimação que estamos dispostos a tolerar, com probabilidade (1-α)? Obs - é possível definir a margem de erro relativa (neste contexto, o que foi definido anteriormente é chamado de margem de erro absoluta). Retomaremos este ponto adiante. 7.3 - Tamanho da Amostra para Estimar a Média Populacional, sob AAS Para determinar n, o tamanho de amostra, é preciso primeiramente especificar ε, a margem de erro desejada na estimação de .Y Será utilizado o seguinte resultado aproximado: A partir deste resultado, que foi apresentado no módulo 5, é possível escrever a probabilidade do slide seguinte. pequeno. é n/N e grande én se ),1,0(N )Yˆ(EP YYˆ AAS AAS ≈ − )1(]z )Yˆ(EP YYˆ z[P 2AAS AAS 2 α−≅≤−≤− αα k tal que: P(Z≥k) = α/2, sendo Z ~N(0,1). Doravante, o subscrito α/2 será omitido na notação, ou seja, faremos: = z. 2 z α )1(z )Yˆ(EP YYˆP AAS AAS α−≅ ≤ − Esta probabilidade pode ser escrita como: )1()Yˆ(EP*zYYˆP AASAAS α−≅ ≤− Por outro lado, vimos que a definição de ε, para o caso da estimação da média, é: )1(YYˆP AAS α−= ε≤− 3 Conclui-se que ε pode ser escrito como: Para obter o valor de n, basta substituir a fórmula do erro padrão do estimador da média na expressão acima, e isolar n. )Yˆ(EP*z AAS≅ε n S N n1)Yˆ(V)Yˆ(EP 2 AASAAS −== Neste sentido, o desenvolvimento a seguir consiste na manipulação algébrica da expressão abaixo: com o objetivo de isolar n. n S N n1z 2 −=ε 22 2 222 2 22 2 SzN 1 n 1 N 1 n 1Sz n S N n1z n S N n1z ε =− −=ε −=ε −=ε . Sz n; N n1 n N Sz1 Sz N 1 Sz 1 n N 1 Szn 1 2 22 0 0 0 2 22 2 22 22 2 22 2 ε = + = ε + ε = + ε = + ε = Fórmula para o cálculo de n para estimar a média populacional sob AAS: . D Sz n; N n1 n n 2 22 0 0 0 = + = Em geral, N é muito maior do que n, e utiliza-se a aproximação: n = n0. Exemplo 7.1 - Considere o interesse em estimar a renda média domiciliar em uma população com 10.000 domicílios. Sabe- se que o desvio padrão das rendas dos domicílios na população é igual a R$ 1.000,00. Determine o tamanho de amostra necessário para que o erro máximo cometido na estimação seja de R$ 100,00, com probabilidade 0,95 (use z = 2). Faça o cálculo exato e em seguida recalcule o tamanho da amostra considerando n muito grande. Comente. 4 Resposta: o cálculo exato dá aproximadamente 400 e o cálculo aproximado dá aproximadamente 385, portanto os resultados são bem próximos. Por que isto ocorreu? Problema: S2 desconhecido. Soluções possíveis: 1 - Utilizar s2 de uma pesquisa anterior e com características similares. 2 - Utilizar s2 de uma amostra-piloto. 7.4 - Tamanho da Amostra para Estimar um Total Populacional, sob AAS O procedimento para determinar o valor de n para estimar um total Y é bem similar. A margem de erro ε para o total é tal que: [ ] )1(YYˆP AAS α−=ε≤− O resultado aproximado a ser utilizado será: A partir do resultado acima é possível escrever a probabilidade do slide seguinte. pequeno. é n/N e grande én se ),1,0(N)Yˆ(EP YYˆ AAS AAS ≈ − )1(]z)Yˆ(EP YYˆ z[P 2AAS AAS 2 α−≅≤−≤− αα Novamente, o subscrito α/2 será omitido na notação, e faremos: = z. 2 z α )1(z)Yˆ(EP YYˆP AAS AAS α−≅ ≤− A probabilidade do slide anterior pode ser escrita da seguinte forma: [ ] )1()Yˆ(EP*zYYˆP AASAAS α−≅≤− Por outro lado, vimos que a definição de ε, para o caso da estimação do total, é: [ ] )1(YYˆP AAS α−=ε≤− 5 Conclui-se que: Para obter n, basta substituir a fórmula do erro padrão do estimador do total sob AAS na expressão acima, e isolar n. )Yˆ(EP*z AAS≅ε n S N n1N)Yˆ(V)Yˆ(EP 2 2 AASAAS −== O desenvolvimento a seguir consiste na manipulação algébrica da expressão abaixo: com o objetivo de isolar n. n S N n1Nz 2 2 −=ε 22 2 222 2 222 2 2 SNz 1 n N 1 n NSNz n S N n1Nz n S N n1Nz ε =− −=ε −=ε −=ε . Sz n; Nn1 nN SNz1 SzN 1 SNz N n 1 SNz 1 N n 1 SNzn N 2 22 0 0 0 2 2 22 2 22 2 22 2 22 2 22 2 ε = + = ε + ε = + ε = + ε = + ε = Fórmula para o cálculo de n para estimar o total populacional sob AAS: . Sz n; Nn1 nN n 2 22 0 0 0 2 ε = + = Exemplo 7.2 - Seja o interesse em estimar a renda total na mesma população com 10.000 domicílios do exemplo 7.1 (desvio padrão R$ 1.000,00). Ache o tamanho de amostra tal que o erro máximo cometido na estimação seja igual a R$ 100.000, com probabilidade 0,95 (use z = 2). R: n ≅ 8.000. 6 Obs - o problema de S2 ser desconhecido persiste no caso da estimação do total. Os “paliativos” também são os mesmos. No módulo 8, veremos que, no caso da estimação de uma proporção, existe uma solução simples para este problema. 7.5 - Limitações de Custo e o Conceito de Margem de Erro Observada Embora não seja nosso foco aqui, deve ficar claro que, na maior parte das situações reais, o dimensionamento da amostra não terá como diretriz apenas a margem de erro desejada, mas também o orçamento disponível para a pesquisa. Neste caso, deverão ser selecionadas quantas unidades o orçamento suportar. Neste caso, deve ser calculada e divulgada a margem de erro observada associada às estimativas obtidas, a fim de que se tornem evidentes as limitações inerentes aos resultados obtidos. • Margem de Erro Observada A margem de erro observada εobs pode ser obtida facilmente, substituindo-se, na expressão de ε como função de n, o tamanho efetivo da amostra e a estimativa de S2. Interpretação: εobs é a semi-amplitude do IC, representando o erro máximo cometido na estimação, com grau de confiança 100(1-α)%.
Compartilhar