A maior rede de estudos do Brasil

Grátis
154 pág.
apostilace003

Pré-visualização | Página 15 de 39

19 4 e 4 20 f, 20 f 20,0 0,0
20 4 e 5 20 f, 22 m 21,0 0,5
21 5 e 1 22 m, 22 f 22,0 0,5
22 5 e 2 22 m, 19 f 20,5 0,5
23 5 e 3 22 m, 19 m 20,5 1,0
24 5 e 4 22 m, 20 f 21,0 0,5
25 5 e 5 22 m, 22 m 22,0 1,0
Com os resultados da Tabela 4.2 podemos calcular a me´dia dos estimadores X¯ e pˆ.
Me´dia de X¯: ∑15
i=1 X¯i
15
= 20, 4 = µ
Me´dia de pˆ: ∑15
i=1 pˆi
15
= 0, 4 = p
Na˜o foi por acaso que as me´dias de X¯ e pˆ coincidiram com os valores dos corres-
pondentes paraˆmetros. Podemos demonstrar que a me´dia dessas estimativas e´ igual ao
4.2. Propriedades dos Estimadores 51
paraˆmetro que esta´ sendo estimado.
Para as variaˆncias de X¯ e pˆ, temos um outro resultado interessante. Denotando
tamanho da amostra por n, podemos mostrar tambe´m que
a variaˆncia de X¯ e´:
σ2
n
,
e a variaˆncia de pˆ e´:
p(1− p)
n
.
Verifique este resultados com os dados da Tabela 4.2. Nas fo´rmulas para a variaˆncia
dos estimadores, n aparece no denominador, isto quer dizer que quanto maior o tamanho
da amostra, menos dispersas sera˜o as estimativas.
Quando obtemos todas as amostras de tamanho da populac¸a˜o encontramos estima-
tivas diferentes para o mesmo paraˆmetro, pore´m, em me´dia, sa˜o iguais ao paraˆmetro; e
tendem a ser mais homogeˆneas com o aumento do tamanho da amostra. Este resultado e´
ta˜o surpreendente, que torna poss´ıvel o uso de uma amostra para estimar os paraˆmetros
da populac¸a˜o.
Podemos propor va´rios estimadores para um determinado paraˆmetro. Para estimar,
por exemplo, a me´dia populacional µ da varia´vel X, no´s poder´ıamos usar a me´dia amostral
X¯, a mediana amostral, ou a primeira observac¸a˜o X1, entre outras possibilidades. Alguns
estimadores em potencial na˜o tem sentido como X1, que considera a primeira observac¸a˜o
como estimador de µ e despreza toda a informac¸a˜o proveniente das outras observac¸o˜es na
amostra. Pode ser natural usar a estat´ıstica ana´loga para estimar o paraˆmetro, ou seja,
usar a me´dia amostral para estimar µ, mas esta estrate´gia nem sempre leva ao melhor
estimador. Basicamente, um bom estimador tem uma me´dia igual ao paraˆmetro sendo
estimado e desvio padra˜o pequeno.
4.2 Propriedades dos Estimadores
• V´ıcio
Um estimador e´ na˜o viciado se sua me´dia e´ igual ao paraˆmetro. A me´dia amostral
e´ um estimador na˜o viciado da me´dia populacional. Por outro lado, um estimador
viciado, em me´dia, tende a subestimar ou sobrestimar o paraˆmetro. As vezes, pode
ser interessante usar estimadores viciados, com v´ıcios que tendem a desaparecer
quando o tamanho da amostra aumenta.
• Eficieˆncia
Uma segunda propriedade interessante para um estimador e´ ter um erro padra˜o
pequeno, comparado a outros estimadores. Um estimador com essa propriedade e´
dito ser eficiente.
52 Infereˆncia Estat´ıstica Matuda, N. S. & Winter, E. M. W.
E´ deseja´vel que o estimador de um paraˆmetro deva ser na˜o viciado e eficiente. Vimos
que a me´dia amostral e a proporc¸a˜o amostral sa˜o estimadores na˜o viciados para µ e p,
respectivamente; e e´ poss´ıvel mostrar que sa˜o estimadores eficientes. Por outro lado,
σˆ2 =
∑n
i=1
(
Xi − X¯
)2
n
e´ um estimador viciado de σ2 e
S2 =
∑n
i=1
(
Xi − X¯
)2
n− 1
e´ na˜o viciado.
Uma boa maneira de visualizar as propriedades dos estimadores e´ fazer uma analogia
com o jogo de dardos. Na Figura 4.1 esta˜o esquematizados o desempenho de 4 jogadores,
cada um com 8 dardos. Os dardos sa˜o as amostras e os jogadores representam 4 tipos
de estimadores. O jogador da Figura 4.1a representa um bom estimador, pois os dardos
esta˜o em torno do alvo (na˜o viciado) e bem concentrados (eficiente). Nas Figuras 4.1b a
4.1d os jogadores na˜o tem um desempenho ta˜o bom. Na Figura 4.1b esta´ representado
o estimador mais eficiente, comparando com os outros estimadores, mas tem v´ıcios. Ja´ o
estimador caracterizado na Figura 4.1c na˜o tem v´ıcios pore´m, na˜o e´ eficiente. O jogador
da Figura 4.1d representa o pior dos 4 estimadores: e´ viciado e na˜o pode ser considerado
eficiente.
&%
'$
��
ff�
�
��brrrrrrrr
(a)
&%
'$
��
ff�
�
��b
rrrrrrrr
(b)
&%
'$
��
ff�
�
��b
r
r
rr rr r r
(c)
&%
'$
��
ff�
�
��br rrrr r
rr
(d)
Figura 4.1: Analogia entre as propriedades dos estimadores e o jogo de dardos.
E´ importante estudar as propriedades do estimador para verificar se e´ um bom
estimador para o paraˆmetro de interesse. Podemos tambe´m avaliar a qualidade de um
estimador associando um erro ma´ximo a`s estimativas. Este erro ma´ximo e´ um limite que
desejamos na˜o ser ultrapassado pela estimativa. Para verificar se um estimador e´ bom,
basta calcular a probabilidade do erro amostral na˜o ultrapassar o ma´ximo estipulado.
Esperamos que essa probabilidade seja muito alta, perto de 100%.
Na sec¸a˜o anterior, vimos que as estat´ısticas e portanto os estimadores sa˜o varia´-
veis aleato´rias. A distribuic¸a˜o de probabilidades de uma estat´ıstica e´ conhecida como
distribuic¸a˜o amostral e seu desvio-padra˜o e´ referido como erro padra˜o. Se conhecermos
a distribuic¸a˜o amostral do estimador podemos calcular as probabilidades que precisamos
para avaliar o estimador.
4.3. Distribuic¸o˜es Amostrais 53
4.3 Distribuic¸o˜es Amostrais
4.3.1 Introduc¸a˜o
Uma forma de obter a distribuic¸a˜o amostral de um estimador e´ pensarmos em todas
as amostras poss´ıveis de tamanho n que podem ser retiradas da populac¸a˜o, usando por
exemplo, amostragem aleato´ria simples com reposic¸a˜o, como foi feito para a populac¸a˜o de
5 alunos. Resumimos as informac¸o˜es sobre as estimativas da idade me´dia na Tabela 4.2
com a distribuic¸a˜o de probabilidades para X¯ (Tabela 4.3).
Tabela 4.3: Distribuic¸a˜o amostral da idade me´dia.
Poss´ıveis Probabilidades
valores de X¯
19,0 0,16
19,5 0,16
20,0 0,04
20,5 0,32
21,0 0,16
22,0 0,16
Total 1,00
Por que e´ ta˜o importante conhecer a distribuic¸a˜o de X¯? Vamos lembrar que estamos
procurando um bom estimador para µ, a me´dia populacional. Algue´m pode pensar que
X¯ e´ um bom estimador de µ quando o erro amostral, X¯ − µ, for pequeno. Mas como µ
e´ desconhecido na˜o e´ poss´ıvel mensurar o erro amostral. Vamos por um limite para esse
erro amostral e vamos denota´-lo por e. Se conhecermos a distribuic¸a˜o de X¯ e´ poss´ıvel
calcular a probabilidade do erro amostral ser no ma´ximo igual a e. Ja´ que o erro pode ser
cometido para mais ou para menos, a probabilidade que devemos calcular e´
P
(−e ≤ X¯ − µ ≤ e) .
Se esta fosse a u´nica forma de obter a distribuic¸a˜o amostral, o processo de infereˆncia
ficaria invia´vel para populac¸o˜es reais, pois e´ necessa´rio obter todas as poss´ıveis amostras
de tamanho n para construir a distribuic¸a˜o amostral. Felizmente, pela teoria de probabili-
dades podemos mostrar que se uma varia´vel X tem distribuic¸a˜o Normal, a me´dia amostral,
X¯, tambe´m tem distribuic¸a˜o Normal.
4.3.2 Distribuic¸a˜o amostral de X¯
Consideremos que uma amostra aleato´ria de tamanho n e´ selecionada da populac¸a˜o
de interesse, para observar a varia´vel aleato´ria cont´ınua, X, com distribuic¸a˜o Normal de
me´dia µ e desvio-padra˜o σ. A me´dia amostral, X¯ , tem distribuic¸a˜o Normal com me´dia µ
54 Infereˆncia Estat´ıstica Matuda, N. S. & Winter, E. M. W.
e desvio-padra˜o σ/
√
n. Tanto que
Z =
X¯ − µ
σ/
√
n
tem distribuic¸a˜o Normal Padra˜o.
A Figura 4.2 apresenta a forma da distribuic¸a˜o deX e de X¯ para diferentes tamanhos
de amostra. Observamos que a distribuic¸a˜o de X na populac¸a˜o e´ bem mais dispersa que a
de X¯; e a medida que aumentamos o tamanho da amostra, a distribuic¸a˜o de X¯ vai ficando
mais concentrada.
−10 0 10 20
0.0
0.2
0.4
0.6
0.8
X~N (5,25)
n=10
n=20
n=30
n=100
Figura 4.2: Distribuic¸a˜o