Baixe o app para aproveitar ainda mais
Prévia do material em texto
* * ESTATÍSTICA APLICADA Estimação de Parâmetros Professor Rodrigo Vieira * * Aulas prévias Planejamento da pesquisa, técnicas de amostragem: generalização. Análise exploratória de dados: organização dos dados. Probabilidade, variável aleatória, modelos. Conceito de inferência estatística, distribuição amostral. * * Conteúdo desta aula Conceito de estimação de parâmetros. Estimação por ponto: propriedades dos estimadores, estimador de média e de proporção. Estimação por intervalo: de média e de proporção. Tamanho mínimo de amostra para estimação por intervalo. * * Estimação de parâmetros Parâmetros (medidas populacionais) são desconhecidos. Inviável pesquisar toda a população: retirar amostra aleatória. A partir da amostra estimar os parâmetros: por ponto, por intervalo. * * Estimação por ponto Há várias estatísticas amostrais (estimadores) disponíveis . Determinar qual é o melhor estimador para o parâmetro de interesse. Estatísticas são variáveis aleatórias: então os estimadores TAMBÉM são variáveis aleatórias. * * Critérios para escolha de estimadores Parâmetro , estimador T: T é justo se E(T) = . T é consistente se, além de justo, lim n-> V(T) = 0. Se há 2 ou mais estimadores justos de , o mais eficiente é o que apresentar menor variância. * * Estimação por ponto da média Melhor estimador da média populacional é a média amostral. Justo Consistente * * Estimação por ponto da proporção Melhor estimador da proporção populacional é a proporção amostral. Justo Consistente * * * * Estimação por intervalo Estimação por ponto é insuficiente. Chance de “acertar” o valor real do parâmetro? “Pescar com lança...” Serve como referência: pôr um intervalo de confiança em torno da estimativa. “Pescar com rede...” * * Nível de confiança (1- ) Probabilidade de que o valor do parâmetro esteja dentro do intervalo de confiança. Nível de significância (): probabilidade de que o valor NÃO esteja dentro do intervalo de confiança. Fixado arbitrariamente: espera-se que 1- próximo de 1 (100%). * * Determinação do intervalo de confiança Consiste em calcular os limites do intervalo. Dependerão do nível de confiança. Dependerão da distribuição amostral do estimador. Dependerão do próprio tamanho da amostra. * * Para média e proporção Z1 = - Z2 P(Z< Z1) = /2 = P(Z> Z2) P(Z>Zcrítico) = /2 * * Limites do intervalo LI = “média” – Zcrítico × “desvio padrão” LS = “média” + Zcrítico × “desvio padrão” Precisão = e0 = Zcrítico × “desvio padrão” * * Intervalo de confiança para média e0 dependerá de alguns aspectos: conhecimento da 2, e do tamanho de amostra. * * 2 conhecida Fixar 1 - , obter Zcrítico, calcular e0, obter os limites e interpretar o resultado. * * 2 desconhecida Usar s (desvio padrão amostral) como estimativa de . Mas, observar o tamanho de amostra: Grandes amostras (n > 30): distribuição normal, usar Zcrítico. Pequenas amostras: distribuição t, usar tn-1, crítico. * * 2 desconhecida, grandes amostras Fixar 1 - , obter Zcrítico, calcular e0, obter os limites e interpretar o resultado. * * 2 desconhecida, pequenas amostras Fixar 1 - , obter tn-1crítico, calcular e0, obter os limites e interpretar o resultado. * * Exemplo 1 Ver 1o exemplo da Unidade 9. Retirou-se uma amostra aleatória de 4 elementos de uma produção de cortes bovinos no intuito de estimar a média do peso do corte. Obteve-se média de 8,2 kg e desvio padrão de 0,4 kg. Supondo população normal.Determinar um intervalo de confiança para a média populacional com 1% de significância. * * 1- = 0,99 s = 0,4 n = 4 2 desconhecida, n < 30 => usar t n-1,crítico t3;0,005 = 5,84 * * Há 99% de probabilidade de que a verdadeira média populacional do peso de corte esteja entre 7,032 e 9,368 kg. * * Intervalo de confiança para proporção Possível aproximar distribuição de p por uma normal se: n × p ≥ 5 E n × (1-p) ≥ 5 * * Intervalo de confiança para proporção Fixar 1 - , obter Zcrítico, calcular e0, obter os limites e interpretar o resultado. * * Exemplo 2 Ver 2o exemplo Unidade 9. Retirou-se uma amostra aleatória de 1000 peças de um lote. Verificou-se que 35 eram defeituosas. Determinar um intervalo de confiança de 95% para a proporção peças defeituosas no lote. * * 1- = 0,95 n = 1000 p = 0,035 1- p = 0,965 n × p = 35 n × (1-p) = 965 => Usar Zcrítico Zcrítico = 1,96 * * Há 95% de probabilidade de que a verdadeira proporção populacional de defeituosos esteja entre 2,36% e 4,64%. * * Correção de e0 Se n/N > 0,05, necessário corrigir e0 com o tamanho da população. N = tamanho da população * * Tamanho mínimo de amostra para Estimação por intervalo e0 depende de n. Dilema para o mesmo valor de n: ↑ 1- => ↑ e0 => ↓ precisão. ↓ e0 => ↑ precisão => ↓ 1- . Solução: obter n que satisfaça: Nível de confiança 1- E a precisão e0. * * Tamanho de amostra para média 2 conhecida 2 desconhecida Usar amostra piloto, n* * * Tamanho de amostra para proporção Com amostra piloto: Sem amostra piloto, estimativa exagerada, p = 1- p = 0,5: * * Decisão e correção Se n ≤ n*, amostra piloto suficiente. Se n > n*, amostra piloto INSUFICIENTE, coletar mais elementos. Correção de n com tamanho da população: * * Exemplo 3 Ver 3o exemplo da Unidade 9. De acordo com os dados do Exemplo 1. Para estimar a média, com 1% de significância e precisão de 0,2 kg, esta amostra é suficiente * * 1- = 0,99 s = 0,4 n = 4 2 desconhecida, n < 30 => usar t n-1,crítico t3;0,005 = 5,84 e0 = 0,2 kg * * Exemplo 3 Amostra piloto de 4 elementos é INSUFICIENTE para a confiança e precisão exigidas. Devemos coletar mais 133 elementos. * * Exemplo 4 Ver 4o exemplo da Unidade 9. Para o caso do Exemplo 2. Supondo 99% de confiança e precisão de 1%, esta amostra é suficiente para estimar a proporção populacional * * 1- = 0,99 n = 1000 p = 0,035 1- p = 0,965 n × p = 35 n × (1-p) = 965 => Usar Zcrítico Zcrítico = 2,58 e0 = 0,01 (1%) * * Exemplo 4 Amostra piloto de 1000 elementos é INSUFICIENTE para a confiança e precisão exigidas. Devemos coletar mais 1249 elementos. * * Empate técnico * * Para saber mais Sobre propriedades e características desejáveis de um estimador: BARBETTA, P.A., REIS, M.M., BORNIA, A.C. Estatística para Cursos de Engenharia e Informática. São Paulo: Atlas, 2004, capítulo 7. * * Para saber mais Sobre estimadores e intervalos de confiança para variância: TRIOLA, M. Introdução à Estatística, Rio de Janeiro: LTC, 1999, capítulo 6. Para entender melhor o conceito de distribuição amostral, e sua relação com estimação de parâmetros, veja o arquivo Estima.xls,no ambiente virtual. * * Para saber mais Sobre a utilização do Microsoft Excel para realizar estimação por intervalo, veja LEVINE, D. M., STEPHAN, D., KREHBIEL, T. C., BERENSON, M. L. Estatística: Teoria e Aplicações - Usando Microsoft Excel em Português. 5ª ed. – Rio de Janeiro: LTC, 200, capítulo 6. * * Próxima aula Testes de hipóteses Lógica dos testes de hipóteses. Tipos de hipóteses Testes de 1 média e de 1 proporção. Teste de associação do quiquadrado.
Compartilhar