154 pág.

Pré-visualização | Página 15 de 39
19 4 e 4 20 f, 20 f 20,0 0,0 20 4 e 5 20 f, 22 m 21,0 0,5 21 5 e 1 22 m, 22 f 22,0 0,5 22 5 e 2 22 m, 19 f 20,5 0,5 23 5 e 3 22 m, 19 m 20,5 1,0 24 5 e 4 22 m, 20 f 21,0 0,5 25 5 e 5 22 m, 22 m 22,0 1,0 Com os resultados da Tabela 4.2 podemos calcular a me´dia dos estimadores X¯ e pˆ. Me´dia de X¯: ∑15 i=1 X¯i 15 = 20, 4 = µ Me´dia de pˆ: ∑15 i=1 pˆi 15 = 0, 4 = p Na˜o foi por acaso que as me´dias de X¯ e pˆ coincidiram com os valores dos corres- pondentes paraˆmetros. Podemos demonstrar que a me´dia dessas estimativas e´ igual ao 4.2. Propriedades dos Estimadores 51 paraˆmetro que esta´ sendo estimado. Para as variaˆncias de X¯ e pˆ, temos um outro resultado interessante. Denotando tamanho da amostra por n, podemos mostrar tambe´m que a variaˆncia de X¯ e´: σ2 n , e a variaˆncia de pˆ e´: p(1− p) n . Verifique este resultados com os dados da Tabela 4.2. Nas fo´rmulas para a variaˆncia dos estimadores, n aparece no denominador, isto quer dizer que quanto maior o tamanho da amostra, menos dispersas sera˜o as estimativas. Quando obtemos todas as amostras de tamanho da populac¸a˜o encontramos estima- tivas diferentes para o mesmo paraˆmetro, pore´m, em me´dia, sa˜o iguais ao paraˆmetro; e tendem a ser mais homogeˆneas com o aumento do tamanho da amostra. Este resultado e´ ta˜o surpreendente, que torna poss´ıvel o uso de uma amostra para estimar os paraˆmetros da populac¸a˜o. Podemos propor va´rios estimadores para um determinado paraˆmetro. Para estimar, por exemplo, a me´dia populacional µ da varia´vel X, no´s poder´ıamos usar a me´dia amostral X¯, a mediana amostral, ou a primeira observac¸a˜o X1, entre outras possibilidades. Alguns estimadores em potencial na˜o tem sentido como X1, que considera a primeira observac¸a˜o como estimador de µ e despreza toda a informac¸a˜o proveniente das outras observac¸o˜es na amostra. Pode ser natural usar a estat´ıstica ana´loga para estimar o paraˆmetro, ou seja, usar a me´dia amostral para estimar µ, mas esta estrate´gia nem sempre leva ao melhor estimador. Basicamente, um bom estimador tem uma me´dia igual ao paraˆmetro sendo estimado e desvio padra˜o pequeno. 4.2 Propriedades dos Estimadores • V´ıcio Um estimador e´ na˜o viciado se sua me´dia e´ igual ao paraˆmetro. A me´dia amostral e´ um estimador na˜o viciado da me´dia populacional. Por outro lado, um estimador viciado, em me´dia, tende a subestimar ou sobrestimar o paraˆmetro. As vezes, pode ser interessante usar estimadores viciados, com v´ıcios que tendem a desaparecer quando o tamanho da amostra aumenta. • Eficieˆncia Uma segunda propriedade interessante para um estimador e´ ter um erro padra˜o pequeno, comparado a outros estimadores. Um estimador com essa propriedade e´ dito ser eficiente. 52 Infereˆncia Estat´ıstica Matuda, N. S. & Winter, E. M. W. E´ deseja´vel que o estimador de um paraˆmetro deva ser na˜o viciado e eficiente. Vimos que a me´dia amostral e a proporc¸a˜o amostral sa˜o estimadores na˜o viciados para µ e p, respectivamente; e e´ poss´ıvel mostrar que sa˜o estimadores eficientes. Por outro lado, σˆ2 = ∑n i=1 ( Xi − X¯ )2 n e´ um estimador viciado de σ2 e S2 = ∑n i=1 ( Xi − X¯ )2 n− 1 e´ na˜o viciado. Uma boa maneira de visualizar as propriedades dos estimadores e´ fazer uma analogia com o jogo de dardos. Na Figura 4.1 esta˜o esquematizados o desempenho de 4 jogadores, cada um com 8 dardos. Os dardos sa˜o as amostras e os jogadores representam 4 tipos de estimadores. O jogador da Figura 4.1a representa um bom estimador, pois os dardos esta˜o em torno do alvo (na˜o viciado) e bem concentrados (eficiente). Nas Figuras 4.1b a 4.1d os jogadores na˜o tem um desempenho ta˜o bom. Na Figura 4.1b esta´ representado o estimador mais eficiente, comparando com os outros estimadores, mas tem v´ıcios. Ja´ o estimador caracterizado na Figura 4.1c na˜o tem v´ıcios pore´m, na˜o e´ eficiente. O jogador da Figura 4.1d representa o pior dos 4 estimadores: e´ viciado e na˜o pode ser considerado eficiente. &% '$ �� ff� � ��brrrrrrrr (a) &% '$ �� ff� � ��b rrrrrrrr (b) &% '$ �� ff� � ��b r r rr rr r r (c) &% '$ �� ff� � ��br rrrr r rr (d) Figura 4.1: Analogia entre as propriedades dos estimadores e o jogo de dardos. E´ importante estudar as propriedades do estimador para verificar se e´ um bom estimador para o paraˆmetro de interesse. Podemos tambe´m avaliar a qualidade de um estimador associando um erro ma´ximo a`s estimativas. Este erro ma´ximo e´ um limite que desejamos na˜o ser ultrapassado pela estimativa. Para verificar se um estimador e´ bom, basta calcular a probabilidade do erro amostral na˜o ultrapassar o ma´ximo estipulado. Esperamos que essa probabilidade seja muito alta, perto de 100%. Na sec¸a˜o anterior, vimos que as estat´ısticas e portanto os estimadores sa˜o varia´- veis aleato´rias. A distribuic¸a˜o de probabilidades de uma estat´ıstica e´ conhecida como distribuic¸a˜o amostral e seu desvio-padra˜o e´ referido como erro padra˜o. Se conhecermos a distribuic¸a˜o amostral do estimador podemos calcular as probabilidades que precisamos para avaliar o estimador. 4.3. Distribuic¸o˜es Amostrais 53 4.3 Distribuic¸o˜es Amostrais 4.3.1 Introduc¸a˜o Uma forma de obter a distribuic¸a˜o amostral de um estimador e´ pensarmos em todas as amostras poss´ıveis de tamanho n que podem ser retiradas da populac¸a˜o, usando por exemplo, amostragem aleato´ria simples com reposic¸a˜o, como foi feito para a populac¸a˜o de 5 alunos. Resumimos as informac¸o˜es sobre as estimativas da idade me´dia na Tabela 4.2 com a distribuic¸a˜o de probabilidades para X¯ (Tabela 4.3). Tabela 4.3: Distribuic¸a˜o amostral da idade me´dia. Poss´ıveis Probabilidades valores de X¯ 19,0 0,16 19,5 0,16 20,0 0,04 20,5 0,32 21,0 0,16 22,0 0,16 Total 1,00 Por que e´ ta˜o importante conhecer a distribuic¸a˜o de X¯? Vamos lembrar que estamos procurando um bom estimador para µ, a me´dia populacional. Algue´m pode pensar que X¯ e´ um bom estimador de µ quando o erro amostral, X¯ − µ, for pequeno. Mas como µ e´ desconhecido na˜o e´ poss´ıvel mensurar o erro amostral. Vamos por um limite para esse erro amostral e vamos denota´-lo por e. Se conhecermos a distribuic¸a˜o de X¯ e´ poss´ıvel calcular a probabilidade do erro amostral ser no ma´ximo igual a e. Ja´ que o erro pode ser cometido para mais ou para menos, a probabilidade que devemos calcular e´ P (−e ≤ X¯ − µ ≤ e) . Se esta fosse a u´nica forma de obter a distribuic¸a˜o amostral, o processo de infereˆncia ficaria invia´vel para populac¸o˜es reais, pois e´ necessa´rio obter todas as poss´ıveis amostras de tamanho n para construir a distribuic¸a˜o amostral. Felizmente, pela teoria de probabili- dades podemos mostrar que se uma varia´vel X tem distribuic¸a˜o Normal, a me´dia amostral, X¯, tambe´m tem distribuic¸a˜o Normal. 4.3.2 Distribuic¸a˜o amostral de X¯ Consideremos que uma amostra aleato´ria de tamanho n e´ selecionada da populac¸a˜o de interesse, para observar a varia´vel aleato´ria cont´ınua, X, com distribuic¸a˜o Normal de me´dia µ e desvio-padra˜o σ. A me´dia amostral, X¯ , tem distribuic¸a˜o Normal com me´dia µ 54 Infereˆncia Estat´ıstica Matuda, N. S. & Winter, E. M. W. e desvio-padra˜o σ/ √ n. Tanto que Z = X¯ − µ σ/ √ n tem distribuic¸a˜o Normal Padra˜o. A Figura 4.2 apresenta a forma da distribuic¸a˜o deX e de X¯ para diferentes tamanhos de amostra. Observamos que a distribuic¸a˜o de X na populac¸a˜o e´ bem mais dispersa que a de X¯; e a medida que aumentamos o tamanho da amostra, a distribuic¸a˜o de X¯ vai ficando mais concentrada. −10 0 10 20 0.0 0.2 0.4 0.6 0.8 X~N (5,25) n=10 n=20 n=30 n=100 Figura 4.2: Distribuic¸a˜o