Buscar

M- ¦ódulo 7

Prévia do material em texto

1
Um dos problemas mais comuns em 
amostragem é a determinação do 
tamanho de amostra necessário.
Este problema está relacionado ao erro
máximo que estamos dispostos a tolerar 
na estimação do parâmetro-alvo.
7 - Tamanho de Amostra para 
Estimar Médias e Totais
7.1 - Erro de Estimação, Absoluto e Relativo
O erro de estimação é definido como a diferença 
entre o estimador e o valor real do parâmetro:
.
ˆ θ−θ
Todavia, esta definição faz com que erros 
positivos e negativos de mesma magnitude se 
cancelem, o que é claramente inadequado.
É comum trabalhar com funções do erro de 
estimação: o erro absoluto e o erro relativo.
Erro Absoluto: é o valor absoluto do erro de 
estimação:
.
ˆ θ−θ
Erro Relativo: é o módulo da razão entre o 
erro de estimação e o valor do parâmetro:
O erro relativo expressa o quanto estamos 
errando em relação ao valor real de θ.
.
ˆ
θ
θ−θ
Por exemplo, no caso da estimação da 
média populacional, o erro absoluto é:
e o erro relativo é:
.
Y
YYˆ −
,YYˆ −
7.2 – O Conceito de Margem de Erro
A margem de erro ε é o valor máximo que 
o erro absoluto pode assumir, com uma 
probabilidade elevada (em geral, 0,95).
Formalmente, ε é o valor tal que:
( ) .1ˆP α−=ε≤θ−θ
2
Do ponto de vista estatístico, veremos nesta 
seção que o primeiro passo para dimensionar 
uma amostra é especificar ε, a margem de erro 
desejada na estimação do parâmetro-alvo. 
Isto significa responder à questão: 
Qual o erro máximo de estimação que estamos 
dispostos a tolerar, com probabilidade (1-α)?
Obs - é possível definir a margem de erro 
relativa (neste contexto, o que foi definido 
anteriormente é chamado de margem de erro 
absoluta). Retomaremos este ponto adiante.
7.3 - Tamanho da Amostra para Estimar a 
Média Populacional, sob AAS
Para determinar n, o tamanho de amostra, é 
preciso primeiramente especificar ε, a margem 
de erro desejada na estimação de .Y
Será utilizado o seguinte resultado 
aproximado:
A partir deste resultado, que foi apresentado 
no módulo 5, é possível escrever a 
probabilidade do slide seguinte.
pequeno. é n/N e grande én se ),1,0(N
)Yˆ(EP
YYˆ
AAS
AAS
≈
−
)1(]z
)Yˆ(EP
YYˆ
z[P
2AAS
AAS
2
α−≅≤−≤− αα
k tal que: P(Z≥k) = α/2, sendo Z ~N(0,1).
Doravante, o subscrito α/2 será omitido 
na notação, ou seja, faremos: = z.
2
z α
)1(z
)Yˆ(EP
YYˆP
AAS
AAS α−≅








≤
−
Esta probabilidade pode ser escrita como:
)1()Yˆ(EP*zYYˆP AASAAS α−≅


 ≤−
Por outro lado, vimos que a definição de ε, 
para o caso da estimação da média, é:
)1(YYˆP AAS α−=


 ε≤−
3
Conclui-se que ε pode ser escrito como:
Para obter o valor de n, basta substituir a 
fórmula do erro padrão do estimador da média
na expressão acima, e isolar n.
)Yˆ(EP*z AAS≅ε
n
S
N
n1)Yˆ(V)Yˆ(EP
2
AASAAS 





−==
Neste sentido, o desenvolvimento a 
seguir consiste na manipulação 
algébrica da expressão abaixo:
com o objetivo de isolar n.
n
S
N
n1z
2






−=ε
22
2
222
2
22
2
SzN
1
n
1
N
1
n
1Sz
n
S
N
n1z
n
S
N
n1z
ε
=−






−=ε






−=ε






−=ε
.
Sz
n;
N
n1
n
N
Sz1
Sz
N
1
Sz
1
n
N
1
Szn
1
2
22
0
0
0
2
22
2
22
22
2
22
2






ε
=
+
=
ε
+
ε
=
+
ε
=
+
ε
=
Fórmula para o cálculo de n para 
estimar a média populacional sob AAS: 
.
D
Sz
n;
N
n1
n
n 2
22
0
0
0






=
+
=
Em geral, N é muito maior do que n, 
e utiliza-se a aproximação: n = n0. 
Exemplo 7.1 - Considere o interesse em 
estimar a renda média domiciliar em uma 
população com 10.000 domicílios. Sabe-
se que o desvio padrão das rendas dos 
domicílios na população é igual a R$ 
1.000,00. Determine o tamanho de 
amostra necessário para que o erro 
máximo cometido na estimação seja de 
R$ 100,00, com probabilidade 0,95 (use z 
= 2). Faça o cálculo exato e em seguida 
recalcule o tamanho da amostra 
considerando n muito grande. Comente.
4
Resposta: o cálculo exato dá
aproximadamente 400 e o cálculo 
aproximado dá aproximadamente 385, 
portanto os resultados são bem próximos.
Por que isto ocorreu?
Problema: S2 desconhecido.
Soluções possíveis:
1 - Utilizar s2 de uma pesquisa anterior e 
com características similares.
2 - Utilizar s2 de uma amostra-piloto.
7.4 - Tamanho da Amostra para Estimar 
um Total Populacional, sob AAS
O procedimento para determinar o valor de 
n para estimar um total Y é bem similar.
A margem de erro ε para o total é tal que:
[ ] )1(YYˆP AAS α−=ε≤−
O resultado aproximado a ser utilizado será:
A partir do resultado acima é possível 
escrever a probabilidade do slide seguinte.
pequeno. é n/N e grande én se ),1,0(N)Yˆ(EP
YYˆ
AAS
AAS
≈
−
)1(]z)Yˆ(EP
YYˆ
z[P
2AAS
AAS
2
α−≅≤−≤− αα
Novamente, o subscrito α/2 será omitido 
na notação, e faremos: = z.
2
z α
)1(z)Yˆ(EP
YYˆP
AAS
AAS α−≅








≤−
A probabilidade do slide anterior pode 
ser escrita da seguinte forma:
[ ] )1()Yˆ(EP*zYYˆP AASAAS α−≅≤−
Por outro lado, vimos que a definição de ε, 
para o caso da estimação do total, é:
[ ] )1(YYˆP AAS α−=ε≤−
5
Conclui-se que:
Para obter n, basta substituir a fórmula 
do erro padrão do estimador do total sob 
AAS na expressão acima, e isolar n.
)Yˆ(EP*z AAS≅ε
n
S
N
n1N)Yˆ(V)Yˆ(EP
2
2
AASAAS 





−==
O desenvolvimento a seguir consiste na 
manipulação algébrica da expressão 
abaixo:
com o objetivo de isolar n.
n
S
N
n1Nz
2
2






−=ε
22
2
222
2
222
2
2
SNz
1
n
N
1
n
NSNz
n
S
N
n1Nz
n
S
N
n1Nz
ε
=−






−=ε






−=ε






−=ε
.
Sz
n;
Nn1
nN
SNz1
SzN
1
SNz
N
n
1
SNz
1
N
n
1
SNzn
N
2
22
0
0
0
2
2
22
2
22
2
22
2
22
2
22
2






ε
=
+
=
ε
+
ε
=
+
ε
=
+
ε
=
+
ε
=
Fórmula para o cálculo de n para 
estimar o total populacional sob AAS: 
.
Sz
n;
Nn1
nN
n 2
22
0
0
0
2






ε
=
+
=
Exemplo 7.2 - Seja o interesse em estimar 
a renda total na mesma população com 
10.000 domicílios do exemplo 7.1 (desvio 
padrão R$ 1.000,00). Ache o tamanho de 
amostra tal que o erro máximo cometido 
na estimação seja igual a R$ 100.000, 
com probabilidade 0,95 (use z = 2).
R: n ≅ 8.000.
6
Obs - o problema de S2 ser desconhecido 
persiste no caso da estimação do total.
Os “paliativos” também são os mesmos.
No módulo 8, veremos que, no caso da 
estimação de uma proporção, existe uma 
solução simples para este problema.
7.5 - Limitações de Custo e o Conceito 
de Margem de Erro Observada
Embora não seja nosso foco aqui, deve 
ficar claro que, na maior parte das 
situações reais, o dimensionamento da 
amostra não terá como diretriz apenas a 
margem de erro desejada, mas também 
o orçamento disponível para a pesquisa.
Neste caso, deverão ser selecionadas 
quantas unidades o orçamento suportar.
Neste caso, deve ser calculada e 
divulgada a margem de erro observada
associada às estimativas obtidas, a fim 
de que se tornem evidentes as limitações 
inerentes aos resultados obtidos.
• Margem de Erro Observada 
A margem de erro observada εobs pode ser 
obtida facilmente, substituindo-se, na 
expressão de ε como função de n, o tamanho 
efetivo da amostra e a estimativa de S2.
Interpretação: εobs é a semi-amplitude do IC, 
representando o erro máximo cometido na 
estimação, com grau de confiança 100(1-α)%.

Continue navegando