Baixe o app para aproveitar ainda mais
Prévia do material em texto
CMIP- Centro de Metrologia e Inovação em ProcessosUFSC- UNIVERSIDADE FEDERAL DE SANTA CATARINA Profª Andréa TEORIA DA ESTIMAÇÃO Conceito : Estimação é o procedimento usado para obter informações sobre os parâmetros desconhecidos de uma população com base nos dados da amostra. Estimação de Parâmetros Conceito : Um estimador é uma estatística amostral utilizada para obter uma aproximação de um parâmetro populacional. Uma estimativa é um valor específico, ou intervalo de valores, usado para aproximar um parâmetro populacional. As estatísticas das amostras (médias, proporções, variâncias e desvios padrões) são estimadores naturais dos equivalentes populacionais. Estimador e Estimativa Propriedades Desejáveis de um Estimador • Não-tendenciosidade: um estimador é não tendencioso (não viesado; não viciado) se sua média (ou valor esperado) for o próprio parâmetro que se pretende estimar. Não Tendenciosidade E( ) = X − X − =X − Xi n = Não-tendencioso Não-tendencioso Número de ocorrências (binomial) n X p =ˆ pnp n XE n pE === . 1 )( 1 )ˆ( Estimação de Parâmetros Existem dois tipos fundamentais de estimação de um parâmetro populacional: por ponto e por intervalo. Estimação pontual Quando utilizamos dados amostrais calcula-se um valor da estimativa do parâmetro populacional e com isso tem-se uma estimativa por ponto do parâmetro analisado. Assim, a estatística amostral , média da amostra, pode ser usada como um estimador do parâmetro , média da população Por exemplo, uma amostra aleatória de 200 alunos de uma universidade de 20.000 estudantes revelou uma média amostral de 5,2. Logo = 5,2 é uma estimativa pontual da verdadeira nota média dos 20.000 alunos. x x Estimação de Parâmetros Estimativa por Intervalo Quando, a partir da amostra procura-se construir um intervalo de variação, de modo que esse intervalo tem uma probabilidade conhecida de conter o verdadeiro parâmetro populacional. Ao estimar um parâmetro populacional através de uma amostra, evidentemente estamos cometendo um erro. Portanto, a deficiência da estimação pontual reside no fato de que, neste procedimento, não ficamos conhecendo a medida do possível erro cometido na estimação do parâmetro de interesse. Desta limitação surge a idéia da estimação por intervalo. P(Linf < < Lsup) = 1- Estimação de Parâmetros Estimativa por Intervalo = nível de incerteza ou grau de desconfiança ou nível de significância. 1 - = coeficiente de confiança ou nível de confiabilidade ou grau de confiança ou nível de confiança. = é o parâmetro populacional de interesse Intervalos de Confiança (IC) para a Média Populacional A questão de quão próxima determinada média amostral pode estar da média da distribuição amostral, em unidades efetivas, depende da variabilidade na distribuição amostral (isto é, do desvio padrão da distribuição amostral). À medida que aumenta o tamanho amostral, o desvio padrão da distribuição amostral diminui. Logo, grandes amostras tenderão a produzir médias amostrais que estão mais próximas da média da população do que pequenas amostras. Além disso, quanto maior a variabilidade na população, maior a variabilidade na distribuição amostral. Intervalos de Confiança para a Média Populacional Utilizando a Distribuição Normal: n 30 (Grandes Amostras), conhecido n < 30 (Pequenas Amostras), conhecido ).X.-X(P 2/2/ xx zz += n σ σx = 1N nN n σ σx − − = População Infinita ou Amostragem com Reposição População Finita ou Amostragem sem Reposição sendo: O gráfico da função da variável normal padronizada “Z” é simétrico. Logo, o intervalo de confiança para um nível de significância é: = + x x xx z onde z ou zz . : .X .X.-X 2/ 2/ 2/2/ ( erro de estimação ou erro máximo permissível ) /2 f(x) z/2 /2 -z/2 1 - f(x) z/2 /2 -z/2 1 - f(x) z/2 /2 -z/2 1 - Intervalos de Confiança para a Média Populacional Intervalos de Confiança para a Média Populacional Valores selecionados para Zα/2 da tabela da distribuição Normal padronizada 1-0,025=0,975 =1,9 –coluna = 0,06 linha 1,96 0.01 0.02 0.05 0.10 Z/2 2.58 2.33 1.96 1.64 Nível de confiança 99% 98% 95% 90% Intervalo de Confiança para Exemplo: uma v.a. qualquer tem uma distribuição desconhecida com média também desconhecida e variância 2 = 16. Retira-se uma amostra de 25 valores e calcula-se a média amostral. Construa um IC de 95% para supondo que 12,7.X = 0 0,02 0,04 0,06 0,08 0,1 0,12 0,14 0 5 10 15 20- + 0 (0,1)N 95% z-z 2,5%2,5% ?1,96 4 4 (12,7 1,96 12,7 1,96 ) 0,95 25 25 P − + = (12,7 1,568 12,7 1,568) 0,95P − + = (11,132 14,268) 0,95P = xx zz .X.-X 2/2/ + Intervalos de Confiança para a Média Populacional EX: Uma população tem um desvio padrão igual a 10 e média desconhecida. Uma amostra de tamanho n = 100 é retirada e fornece uma média = 50. Qual o intervalo de 95% de confiança para a média desta população? Solução: Têm-se 1 - α = 95%, então α = 5% e α / 2 = 2,5%. 96,5104,48 100 10 96,150 100 10 96,150 .X.-X 2/2/ +− + xx zz x Intervalos de Confiança para a Média Populacional Utilizando a Distribuição Normal: n 30, desconhecido ).X.-X(P 2/2/ xx SzSz += População Infinita ou Amostragem com Reposição População Finita ou Amostragem sem Reposição sendo: n s sx = 1N nN n s sx − − = Ex.: Com a intenção de estimar o número de ações negociadas por dia na bolsa de valores foi realizada uma amostragem aleatória de tamanho n=81 dias. A amostra apresentou média de 12,8 milhões de ações por dia e desvio padrão s= 2,7 milhões de ações por dia. Estimar a média da população com intervalo de confiança de 95%. 59,08,12) 81 7,2 .,96112,8 81 7,2 .,961-(12,8P =+= Intervalos de Confiança para a Média Populacional Pequenas Amostras (Distribuição de Student “t” n<30) Foi desenvolvida por William S. Gosset que trabalhava na indústria de cervejas Guinness, em Dublin, na Irlanda. Gosset publicou suas descobertas utilizando o pseudônimo de Student. A distribuição t é chamada de distribuição t de Student. Intervalo de Confiança (IC) para Média Populacional Distribuição t de Student, tem forma parecida com a normal padrão, mas é um pouco mais dispersa. Essa dispersão varia com o tamanho da amostra. É bastante dispersa para amostras pequenas, ma se aproxima da normal para amostras grandes. Pequenas Amostras (Distribuição de Student “t” n<30) Propriedades da Distribuição t de Student •A distribuição t aproxima-se da distribuição normal à medida que “n” aumenta. Para n > 30 as diferenças são tão pequenas que podemos utilizar os valores críticos z; •A distribuição t tem a mesma forma geral simétrica (forma de sino) que a distribuição normal, mas reflete a maior variabilidade (com distribuições mais amplas) que é esperada em pequenas amostras Condições para utilização da Distribuição t de Student • O tamanho da amostra é pequeno (n < 30) • é desconhecido • A população original tem distribuição essencialmente normal (Como a distribuição da população original em geral é desconhecida, estimamo-la construindo um histograma de dados amostrais). Pequenas Amostras (Distribuição de Student “t” n<30) Utilizando a distribuição t : n s t n s t .X.-X 2/2/ + Pequenas Amostras (Distribuição de Student “t” n<30) n s sx = 1− − = N nN n s sx População Infinita ou Amostragem com Reposição População Finita ou Amostragem sem Reposição Utilizando a distribuição t : n s t n s t .X.-X 2/2/ + Para usar uma tabela t devemos conhecer o nível de confiança desejado, e o número de graus de liberdade (). O número de graus de liberdade, para um conjunto de dados, corresponde ao número de valores que podem variar após terem sido impostas certas restrições a todos os valores. Assim: = n –1 =gl (algumas bibliografias) = 2/ t número de desvio padrões utilizando a distribuição de Student (“t”). Pequenas Amostras (Distribuição de Student “t” n<30) Sabendo-se que uma amostra tem 20 elementos, que a sua média 120 e desvio padrão igual a 30. Represente um intervalo de confiança em nível de confiança de 95%. =(n - 1) = 20-1 = 19 referente aos graus de liberdade IC= 95% = alfa=0,05 /2 = 0,025 20 30 09,2120 20 30 09,2120 .X.-X 2/2/ +− =+ n s t n s t h 4,023198,051 h Pequenas Amostras (Distribuição de Student “t” n<30) Pequenas Amostras (Distribuição de Student “t” n<30) / 0,1 0,05 0,025 0,01 0,005 1 3,0777 0,3137 12,7062 31,8210 63,6559 2 1,8856 2,9200 4,3027 6,9645 9,9250 3 1,6377 2,3534 3,1824 4,5407 5,8408 4 1,5332 2,1318 2,7765 3,7469 4,6041 5 1,4759 2,0150 2,5706 3,3649 4,0321 6 1,4398 1,9432 2,4469 3,1427 3,7074 7 1,4149 1,8946 2,3646 2,9979 3,4995 8 1,3968 1,8595 2,3060 2,8965 3,3554 9 1,3830 1,8331 2,2622 2,8214 3,2498 10 1,3722 1,8125 2,2281 2,7638 3,1693 11 1,3634 1,7959 2,2010 2,7181 3,1058 12 1,3562 1,7823 2,1788 2,6810 3,0545 13 1,3502 1,7709 2,1604 2,6503 3,0123 14 1,3450 1,7613 2,1448 2,6245 2,9768 15 1,3406 1,7531 2,1315 2,6025 2,9467 16 1,3368 1,7459 2,1199 2,5835 2,9208 17 1,3334 1,7396 2,1098 2,5669 2,8982 18 1,3304 1,7341 2,1009 2,5524 2,8784 19 1,3277 1,7291 2,0930 2,5395 2,8609 20 1,3253 1,7247 2,0860 2,5280 2,8453 21 1,3232 1,7207 2,0796 2,5176 2,8314 Intervalo de Confiança para Proporção A utilização da distribuição normal como aproximação da binomial para construção do intervalo de confiança para proporções é apropriada se: n 30 n . p 5 e n . q 5, Seja a proporção observada de “sucessos” numa amostra aleatória de n observações de uma população com proporção p de sucessos. Então, se n é suficientemente grande para um intervalo de confiança para a proporção populacional de 100(1 - )% que é dado por n pp Zpp n pp Zp )1( ˆ )1( ˆ 2/2/ − + − − A proporção populacional p não é conhecida , pois este é o valor que está sendo estimado. Portanto amostradaelementosdenúmero ticacaracterís n X p ==ˆ Ex: Em 65 lances de uma moeda foram obtidas 26 caras. Determinar os limites de confiança de 90% para a proporção de caras que seria obtida em um grande número de lances da moeda. 4,0 65 26 ˆ === n X p 65 24,0 n ).(1 = ˆ = −pp p 0996,04,0 65 24,0 64,14,0 65 24,0 64,14,0 =+− p Intervalo de Confiança para Proporção Dimensionamento do Tamanho da Amostra A determinação do tamanho de uma amostra é um problema de grande importância, porque amostras desnecessariamente grandes acarretam desperdício de tempo e dinheiro; e amostras demasiadamente pequenas podem levar a resultados não confiáveis. O cálculo do tamanho da amostra para cada caso, é feito sempre em função das fórmulas já estabelecidas para os Intervalos de Confiança Para determinação do tamanho da amostra, algumas considerações iniciais devem ser feitas: a) Identificação da variável mais importante para o estudo a ser feito. b) Identificação da escala de mensuração da variável: nominal, ordinal ou intervalar. Isto direciona o tipo de estimativa que se vai fazer: variáveis categóricas admitirão estudo apenas de PROPORÇÕES, enquanto que para variáveis intervalares normalmente estaremos interessados na determinação da MÉDIA. c) Identificação do tamanho da população: infinita ou finita. d) Estabelecimento da variância da população: conhecida ou desconhecida. . Dimensionamento do Tamanho da Amostra Média 2 2/ . = e Z n População Infinita 22 2/ 2 22 2/ )1( +− = ZNe NZ n População Finita onde: n – tamanho da amostra; z/2 – número de desvios padrões utilizando a distribuição normal; - desvio padrão da população; e – erro amostral (máxima diferença admitida entre e N – tamanho da população x. Dimensionamento do Tamanho da Amostra Média EX: Um economista deseja estimar a renda média para o primeiro ano de trabalho de um bacharel em direito. Quantos valores de renda devem ser tomados, se o economista deseja ter 95% de confiança em que a média amostral esteja a menos de R$500,00 da verdadeira média populacional? Suponha que saibamos, por um estudo prévio, que para tais rendas, =R$ 6250,00. 60125,600 500 6250.96,1. 22 2/ == = = e Z n Dimensionamento do Tamanho da Amostra Média EX: Uma população composta por 200 elementos apresenta um desvio padrão de 5,04. Qual deve ser o tamanho de uma amostra aleatória que nos permita afirmar com 98% de confiança que não erraremos por mais que 1,8 unidades ao estimar a média populacional. . 36 )04,5()33,2()1200()8,1( 200)04,5()33,2( )1( 222 22 22 2/ 2 22 2/ = +− = +− = zNe NZ n A amostra deve conter 36 eltos Proporção Dimensionamento do Tamanho da Amostra 2 2 2/ ])ˆ1(.ˆ.[)( e ppZ n − = NA AMOSTRAGEM COM REPOSIÇÃO (pop. infinita) NOTA: No cálculo do tamanho da amostra para estimar a proporção (p), uma informação necessária é a estimativa preliminar da proporção p . Esta estimativa pode ser obtida por meio de: •dados históricos sobre a população de interesse; •resultados obtidos em estudos similares ao que está sendo realizado; •extração de uma amostra piloto. 25,0. 2 2/ = e Z n Proporção 683 )03,0( )8,0).(2,0()96,1(])ˆ1(.ˆ[.)( 2 2 2 2 2/ == − = e ppZ n NA AMOSTRAGEM COM REPOSIÇÃO (pop. infinita) Ex: Um instituto de pesquisa pretende avaliar a proporção de eleitores que votarão em determinado candidato com 95% de confiança de que não errará por mais de 3%. Para isto levantou-se uma pré-amostra de 100 eleitores selecionados ao acaso da população. A proporção de eleitores deste candidato foi de 20%. Determine o tamanho da amostra necessário para atingir precisão desejada Dimensionamento do Tamanho da Amostra Proporção EX: Um assistente social deseja saber o tamanho da amostra (n) necessário para determinar a proporção da população atendida por uma Unidade de Saúde, que pertence ao município de Cariacica. Não foi feito um levantamento prévio da proporção amostral e, portanto, seu valor é desconhecido. Ela quer ter 90% de confiança que sua o erro máximo de estimativa (E) seja de ±5% (ou 0,05). Quantas pessoas necessitam ser entrevistadas? 26996,268 05,0 25,0.64,1 25,0. 2 22 2/ === = e Z n Devemos, portanto, obter uma amostra de 269 pessoas para determinar a proporção da população atendida na Unidade de Saúde, que se origina do município de Cariacica. Dimensionamento do Tamanho da Amostra Proporção NA AMOSTRAGEM SEM REPOSIÇÃO (pop. finita) ( ) ( )ppZNe NppZ n ˆ1.ˆ.)1(. .)ˆ1(.ˆ.)( 2 2/ 2 2 2/ −+− − = Dimensionamento do Tamanho da Amostra Proporção Um despachante que cuida da documentação de automóveis está interessado em estimar a proporção de clientes que trocaram de carro no último ano para oferecer seus serviços. Para isto amostrou 80 do seu cadastro de 400 clientes e consultou-os por telefone verificando que 30 deles haviam trocado de carro no último ano. Determine o tamanho da amostra necessário para estimar com 90% de confiança esta proporção com erro máximo de 4% ( ) ( )ppZNe NppZ n ˆ1.ˆ.)1(. .)ˆ1(.ˆ.)( 2 2/ 2 2 2/ −+− − = Dimensionamento do Tamanho da Amostra Proporção . Um despachante que cuida da documentação de automóveis está interessado em estimar a proporção de clientes que trocaram de carro no último ano para oferecer seus serviços. Para isto amostrou 80 do seu cadastro de 400 clientes e consultou-os por telefone verificando que 30 deles haviam trocado de carro no último ano. Determine o tamanho da amostra necessário para estimar com 90% de confiança esta proporção com erro máximo de 4% ( ) 199 625,0(.)375,0(.64,1)399(.04,0 400.)625,0(.)375,0(.)64,1( 22 2 = + =n N= 400 n= 80 X= 30 375,0 80 30ˆ === n X p Dimensionamento do Tamanho da Amostra Slide 1 Slide 2 Slide 3 Slide 4: Propriedades Desejáveis de um Estimador Slide 5: Não Tendenciosidade Slide 6 Slide 7 Slide 8 Slide 9 Slide 10 Slide 11 Slide 12 Slide 13: Intervalo de Confiança para Slide 14 Slide 15 Slide 16 Slide 17 Slide 18 Slide 19 Slide 20 Slide 21 Slide 22 Slide 23 Slide 24 Slide 25 Slide 26 Slide 27 Slide 28 Slide 29 Slide 30 Slide 31 Slide 32 Slide 33 Slide 34 Slide 35 Slide 36
Compartilhar