Baixe o app para aproveitar ainda mais
Prévia do material em texto
Estimação de Parâmetros APRESENTAÇÃO Quando trabalhamos com investigações estatísticas podemos lidar com dados populacionais ou amostrais, surgindo neste contexto, os conceitos de parâmetros e estimativas. Os parâmetros são medidas numéricas calculadas com base nos dados de uma população. No entanto, nem sempre calcular os parâmetros é uma tarefa simples, então, nesses casos, coletamos dados relativos a amostras extraídas da população de interesse. Quando calculamos as medidas numéricas de uma amostra, temos estimativas para os parâmetros populacionais, que também podem ser conhecidas como estatísticas. Nesta Unidade de Aprendizagem, vamos identificar parâmetros e estimadores, reconhecendo quando um estimador é eficiente e vamos diferenciar estimativas tendenciosas das não tendenciosas. Bons estudos. Ao final desta Unidade de Aprendizagem, você deve apresentar os seguintes aprendizados: Expressar parâmetros populacionais.• Diferenciar estimativas tendenciosas de não tendenciosas.• Identificar as consequências dos estimadores.• DESAFIO Sabemos que os parâmetros nem sempre são fáceis de serem calculados, o que nos leva muitas vezes, a optar por coletar dados relativos às amostras derivadas de uma população de interesse. Quando calculamos as medidas numéricas de uma amostra, teremos estimativas para os parâmetros populacionais, onde cada estimativa será o valor particular daquela amostra para estimar o verdadeiro valor do parâmetro. É importante destacar que se coletarmos amostras diferentes de uma mesma população, os valores do estimador poderão mudar aleatoriamente a cada amostra coletada, gerando a distribuição de probabilidades amostral, onde teremos todos os resultados prováveis da estimativa da média em um intervalo de valores que a estimativa ocorre e onde estará o verdadeiro parâmetro populacional. Ao trabalharmos com estimativas, é muito importante saber identificar quando ela á tendenciosa e quando ela não é tendenciosa e calcular corretamente o tamanho da amostra necessária para estimar uma média ou uma proporção. Acompanhe a seguinte situação: Desta forma, responda: a) Explique, com suas palavras, o que torna uma estimativa tendenciosa e o que a torna não tendenciosa. b) Uma das variáveis investigada em sua pesquisa são as despesas médicas anuais das famílias dos das pessoas com diabetes atendidas nessa unidade básica de saúde. A secretaria de saúde deseja ter 95% de confiança de que a média da amostra está no máximo com uma margem de erro de 50 reais da média real das despesas médicas familiares. Um estudo-piloto indicou que o desvio-padrão pode ser calculado como sendo igual a 400 reais. Qual o tamanho de amostra necessário? INFOGRÁFICO Quando estamos trabalhando com toda a população, as medidas numéricas são denominadas parâmetros. Todavia, as medidas numéricas de uma amostra são denominadas estimativas para os parâmetros populacionais. Nesse contexto, cada estimativa apresenta o valor particular daquela amostra para estimar o verdadeiro valor do parâmetro. Ou seja, a partir das estimativas realizadas na amostra, podemos tirar conclusões a respeito dos parâmetros populacionais, processo que denominamos de inferência. Para que possamos realizar inferências, é importante reconhecer se uma estimativa é tendenciosa ou não e se estamos diante de uma estimativa eficiente ou não eficiente. Este Infográfico poderá auxiliar você a reconhecer essas situações. driller.vmi Text Box a) Estatística não tendenciosa é quando o parâmetro da distribuição amostral é igual (ou muito próximo) ao parâmetro populacional correspondente (média ser igual à média, mediana ser igual à mediana etc.) e, quando é diferente, é considerado tendencioso. Por exemplo, se a média da distribuição amostral das médias for igual à média da população, a média da amostra é um parâmetro não tendencioso da média da população. b) Temos que: driller.vmi Stamp CONTEÚDO DO LIVRO Acompanhe o capítulo Estimação de Parâmetros do livro Estatística, que é a base teórica para esta Unidade de Aprendizagem. Boa leitura. ESTATÍSTICA Juliane Silveira Freire da Silva Estimação de parâmetros Objetivos de aprendizagem Ao final deste texto, você deve apresentar os seguintes aprendizados: � Expressar parâmetros populacionais. � Diferenciar estimativas tendenciosas de não tendenciosas. � Identificar as consequências dos estimadores. Introdução Neste capítulo, você identificará o que são parâmetros e estimadores. Além disso, aprenderá a identificar o que são estimadores tendenciosos e estimadores eficientes. Também, desenvolverá estratégias para identificar quais deles utilizar. Como aplicação da teoria de probabilidade aos estimadores, você aprenderá a calcular intervalos de confiança para a média e a proporção que possibilitam estimar um intervalo de valores em que esteja contido o verdadeiro parâmetro populacional, com base em uma amostra. Parâmetros populacionais Parâmetros são medidas numéricas calculadas com base nos dados de uma população. Podemos calcular alguns parâmetros, como a média populacional (μ), o desvio-padrão populacional (𝜎) e a proporção populacional (π). Observe que os parâmetros são representados por letras gregas. μ = ∑ Xi N média populacional onde: Xi: cada um dos N elementos da população; N: tamanho da população. σ = ∑(Xi – μ) 2 N desvio-padrão populacional onde: Xi: cada um dos N elementos da população; μ: média populacional; N: tamanho da população. Parâmetros nem sempre são fáceis de serem calculados — seja porque nem sempre temos acesso a todos os elementos de uma população, seja porque pode ser muito oneroso coletar dados de uma população inteira, ou, ainda, porque não temos tempo para investigar todos os dados de uma população. Por esses e outros motivos, acabamos, muitas vezes, optando por coletar dados relativos às amostras derivadas de uma população de interesse. Quando calculamos as medidas numéricas de uma amostra, teremos estimativas, também chamadas de estatísticas, para os parâmetros populacionais. Na Figura 1, a seguir, há uma representação desses estimadores amostrais de parâmetros populacionais. Figura 1. Estimadores amostrais de parâmetros populacionais. Fonte: Doane e Seward (2014, p. 293). Amostra Inferência Parâmetros populacionais μ σ π Estimadores amostrais x– s p Estimação de parâmetros2 Cada estimativa será o valor particular daquela amostra para estimar o verdadeiro valor do parâmetro. Se coletarmos amostras diferentes de uma mesma população, os valores do estimador poderão mudar aleatoriamente a cada amostra coletada. Então, a distribuição dessa variável (estimador amostral) é o que chamamos de distribuição de probabilidades amostral. O valor da estimativa da média, por exemplo, será específico para cada amostra, mas a distribuição de probabilidade que descreve essa aleatoriedade com os resultados das diferentes amostras é a distribuição amostral da média da amostra. Nessa distribuição, teremos todos os resultados prováveis da estimativa da média em um intervalo de valores que a estimativa ocorre e onde estará o verdadeiro parâmetro populacional. A distribuição amostral seguirá a mesma distribuição dos dados populacionais. Se estes seguem uma distribuição normal, consequentemente, os dados amostrais provenientes dessa população também seguirão uma distribuição de probabilidades normais. A partir dessa distribuição de probabilidades amostrais (podendo ser diferente para cada um dos parâmetros) é que podermos tomar decisões sobre os parâmetros populacionais com base em estimativas amostrais. Segundo Doane e Seward (2014), um estimador é uma estatística derivada de uma amostra para inferir o valor de um parâmetro populacional. Já uma estimativa é o valor do estimador em uma amostra particular. Quando calculamos o valor de apenas uma amostra e estimamos os valores dos parâmetros por essa medida amostral, teremos uma estimativapor ponto. Claramente, nem sempre o valor calculado para a média dessa determi- nada amostra (ou qualquer outro estimador) acertará no alvo o valor real da população. Sendo assim, para estimativas de parâmetros, podemos calcular intervalos com alta probabilidade de conter o verdadeiro valor do parâmetro populacional. Podemos, também, calcular o erro cometido com esse estimador e, ainda, o tamanho mínimo para a amostra dessa estimativa. Vale lembrar que o erro e a confiança fixados no cálculo para o tamanho de amostra só serão válidos se a amostra for probabilística. Qualquer amostra só poderá resultar em um bom estimador caso ela seja coletada de forma aleatória. Jamais podemos fazer uso de amostras não probabilísticas e ten- denciosas para estimarmos parâmetros. 3Estimação de parâmetros Estimativas tendenciosas e não tendenciosas Mas o que é uma estimativa tendenciosa? Chamamos uma estimativa de ten- denciosa, ou estimador viciado e estimador enviesado, quando esta subestimar ou superestimar o valor do parâmetro. Vício é a diferença entre a média da estatística (estimador) e o verdadeiro valor do parâmetro populacional. A Figura 2 ilustra a diferença entre um estimador tendencioso e não tendencioso. Figura 2. Ilustração de estimadores tendenciosos e não tendenciosos. Estimador não tendencioso Estimador tendencioso Segundo Doane e Seward (2014), a média amostral (x–) e a proporção amostral (p) são estimadores não viciados da μ e da π, respectivamente. Mas podemos encontrar estimadores viciados quando consideramos o desvio-padrão amostral e o desvio-padrão populacional. μ = ∑Xi N média populacional x– = ∑xi n média amostral � = XN proporção populacional p = xn proporção amostral Estimação de parâmetros4 σ = ∑(Xi – μ) 2 N desvio-padrão populacional s = ∑(xi – x –)2 n – 1 desvio-padrão amostral Estimativas eficientes Um estimador é dito eficiente frente aos demais possíveis dentre as amostras oriundas da mesma população. Será aquele que tiver a menor variabilidade. Ou seja, se dois estimadores tiverem a mesma média, o estimador mais efi- ciente será aquele com a maior variância. O outro estimador será considerado ineficiente, conforme ilustrado na Figura 3. Figura 3. Ilustração de estimadores eficientes e não eficientes, ambos não viciados. Estimador e�ciente Estimador não e�ciente Como existe essa variabilidade, podemos, então, estimar o erro que estamos cometendo com essa estimativa. Quando estamos estimando a média popula- cional (μ) pela média amostral (x–), cometemos o erro amostral: a probabilidade é de 1 – α de que a estimativa vá diferir para mais ou para menos do valor populacional por, no máximo, um erro de: E = zα/2 ∙ σ √n 5Estimação de parâmetros onde: E: erro máximo de estimativa; 𝜎: desvio-padrão populacional; n: tamanho da amostra; zα/2: valor da tabela normal padrão. Na Figura 4, pode ser visualizada a distribuição amostral da média. Figura 4. Distribuição amostral da média. Fonte: Freund (2006, p. 272). 1 – α α/2 α/2 x– μ zα/2 ∙ σ √n No Quadro 1, a seguir, apresentamos os valores para os principais níveis de significância. 1 – α α/2 zα/2 1 – 0,1 = 0,90 = 90% 0,05 1,645 1 – 0,05 = 0,95 = 95% 0,025 1,960 1 – 0,01 = 0,99 = 99% 0,005 2,575 Quadro 1. Valores da tabela normal para os principais níveis de significância Estimação de parâmetros6 Uma financeira coletou uma amostra aleatória de 100 pessoas para estimar o valor médio de endividamento de seus clientes. Com base em pesquisas anteriores, sabe-se que o desvio-padrão populacional é de R$ 630,00 (σ = 630,00). Com uma probabilidade de 95%, qual seria o erro máximo para a estimativa? E = 1,960 · = 123,48630 √100 Com uma confiança de 95%, podemos afirmar que o erro máximo dessa estimativa é de 123,48. Precisamos observar que nem sempre sabemos o verdadeiro valor do desvio-padrão populacional. Aliás, muito raramente teremos esse valor, pois, se tivéssemos facilmente o desvio-padrão populacional, já saberíamos o valor da média populacional. Assim sendo, é admissível utilizarmos o desvio-padrão amostral como estimativa do desvio-padrão populacional, sempre que tivermos um tamanho da amostra igual ou superior a 30. Consequências dos estimadores Como consequências das propriedades dos estimadores, quando temos uma distribuição de probabilidades para os possíveis resultados de amostras alea- tórias, podemos calcular intervalos de confiança que contenham o verdadeiro valor do parâmetro populacional e uma confiança associada a esse intervalo. Podemos, também, calcular tamanhos mínimos de amostras para que os dados amostrais sejam representativos de toda uma população. A distribuição de probabilidades associada aos dados da nossa população é que nos dará a confiança necessária tanto para os intervalos de confiança quanto para o tamanho mínimo de amostras. Leva-se em consideração o teorema do limite central. Intervalos de confiança Podemos calcular um intervalo de variação para a média amostral, que terá uma probabilidade definida de conter o verdadeiro valor do parâmetro populacional. Isso é possível porque temos uma distribuição associada aos dados po- pulacionais e amostrais. Utilizaremos a distribuição normal para esses in- tervalos e teremos uma confiança fixada de acordo com essa distribuição de probabilidades. 7Estimação de parâmetros Existem valores que são mais comuns para o cálculo dos intervalos de confiança: 90%, 95% e 99%. Os valores das probabilidades associadas a esses níveis de confiança são os seguintes: 90% de confiança → z0,05 = 1,645 95% de confiança → z0,025 = 1,960 99% de confiança → z0,005 = 2,575 O intervalo de confiança para estimar uma média é descrito a seguir: x– ± zα/2 ∙ σ √n com o desvio-padrão populacional conhecido x– ± tα/2; n – 1 ∙ s √n com o desvio-padrão populacional desconhecido Observe que, ao invés de utilizarmos a distribuição normal para o intervalo de confiança com o desvio-padrão desconhecido, tomamos a distribuição t-stu- dent, observando o α/2 e n–1 graus de liberdade. Vale ressaltar que, para n ≥ 30, os valores da distribuição t e da distribuição normal igualam-se. Observe a Figura 5, a seguir. Figura 5. Comparação distribuição t e distribuição normal. Fonte: Doane e Seward (2014, p. 306). A distribuição t tem o mesmo formato da distribuição normal, mas, para n menor do que 30, existe uma pequena diferença no formato, ocasionada pelo tamanho da amostra. Veja a tabela da Figura 6. Estimação de parâmetros8 Figura 6. Distribuição t-student. Para encontrar o valor tabelado, cruzamos a coluna de alfa escolhido com a linha dos graus de liberdade. Nesse caso do número de graus de liberdade, precisamos fazer n–1. 9Estimação de parâmetros Suponha que a financeira coletou uma amostra de 100 clientes e questionou sobre o valor de endividamento deles, obtendo como resultado uma média amostral de R$ 2.350,00 e um desvio-padrão amostral de R$ 590,00. Obtenha o intervalo de confiança de 95% para a média. x– = 2350,00 s = 590,00 n = 100 t0,025;99 = 1,960 x– ± tα/2 ;n – 1 · = 2350 ± 1,960 · 2350 ± 115,64 [2234,36; 2465,64] s √n 590 √100 Com 95% de confiança, a verdadeira média populacional para o valor médio de endividamento estará entre R$ 2.234,36 e R$ 2.465,64. De acordo com o intervalo, podemos calcular o tamanho mínimo de amostra para quando queremos estimar a média populacional, isolando o n na equação do erro máximo amostral. Esse valor nos fornecerá um tamanho de amostra mínimo para que a amostra seja representativa da população, caso coletada de forma aleatória. n = zα/2 ∙ σ E( ) 2 Por exemplo, qual seria o tamanho mínimo de amostra com uma confiança de 95%, no caso de uma pesquisa com consumidores para investigar o valor gasto com presentes no dia dos namorados. Sabe-se que o desvio-padrão populacional da pesquisa no ano anterior foi de R$ 65,00. Os pesquisadores querem errar, no máximo, em R$ 10,00. Estimação de parâmetros10z0,025 = 1,96 σ = 65,00 E = 10,00 n = zα/2 ∙ σ E( ) ( ) 2 2 = = 162,3 = 1631,96 · 6510 Vale ressaltar que, no caso do tamanho mínimo de amostra, sempre se arredonda para cima, independentemente de regras de arredondamento. Podemos calcular, também, um intervalo de variação para a proporção amostral. A teoria é semelhante à empregada no intervalo de confiança para a média. Os cálculos são realizados de acordo com a equação a seguir. p ± zα/2 · p ∙ (1 – p) n onde: p: proporção amostral n: tamanho da amostra Zα/2 : valor tabela normal padrão Assim como podemos calcular o tamanho mínimo de amostra para estimar uma média, também podemos calcular o tamanho mínimo de amostra para estimar uma proporção. A fórmula do tamanho mínimo de amostra também é derivada da fórmula do erro máximo amostral para a proporção. Ainda temos o intervalo de variação para o desvio-padrão de uma amostra retirada de uma população que segue uma distribuição normal. n = zα/2 2 ∙ p(1 – p) E2 Quando não conhecemos o verdadeiro valor da proporção populacional, utilizamos o p = 0,5. Assim, podemos superestimar o tamanho da amostra, já que a proporção não é conhecida. 11Estimação de parâmetros Suponha que você deseja estimar a proporção de clientes satisfeitos com determinado produto da sua empresa. Deseja-se cometer um erro máximo de estimação de 3%, com uma confiança de 90%. Qual seria o tamanho mínimo de amostra para estimar essa proporção? zα /2 = 1,645 p = 0,5 pois o p é desconhecido E = 0,03 precisamos tirar do percentual n = zα/2 2 · p(1 – p) E2 = 1,6452 · 0,5 · (1 – 0,5) 0,032 = 752 DOANE, D. P.; SEWARD, L. E. Estatística aplicada à administração e economia. 4. ed. Porto Alegre: AMGH; Bookman, 2014. 840 p. FREUND, J. E. Estatística aplicada: economia, administração e contabilidade. 11. ed. Porto Alegre: Bookman, 2006. 536 p. Leitura recomendada SPIEGEL, M. R.; STEPHENS, L. J. Estatística. 4. ed. Porto Alegre: Bookman, 2009. 600 p. (Coleção Schaum). Estimação de parâmetros12 Conteúdo: DICA DO PROFESSOR Na estatística, parâmetros são medidas numéricas calculadas com base nos dados de uma população. No entanto, nem sempre é possível trabalhar com dados populacionais, de modo que necessitamos lidar com dados amostrais. Nessas situações, realizamos estimativas para os parâmetros populacionais, conhecidas como estimadores ou estatísticas, mas muito importante reconhecer quando uma estimativa é tendenciosa ou não tendenciosa, assunto que abordaremos neste vídeo. Conteúdo interativo disponível na plataforma de ensino! EXERCÍCIOS 1) Em uma pesquisa, foram entrevistadas 100 famílias de um determinado bairro na tentativa de descobrir a média do gasto mensal com alimentação. Sabe-se que o desvio padrão da população em estudo é 0,5. Qual a probabilidade de que o erro relativo NÃO seja maior que 5%? A) 5%. B) 0,5%. C) 68% D) 6,8% E) Como o número de famílias é superior a 30, não é possível estimar, com exatidão, a probabilidade do erro relativo. Um instituto de pesquisa precisa descobrir qual o erro relativo de uma pesquisa em 2) driller.vmi Highlight driller.vmi Stamp que foram entrevistadas 100 famílias de um determinado bairro na tentativa de descobrir a média do gasto mensal com alimentação. Sabe-se que o desvio padrão da população em estudo é 0,5 e o nível de significância é de 90%. Marque a alternativa correta que representa o erro relativo. A) A probabilidade de 90% é obtida com um erro relativo de 90%. B) Como o número total de famílias não mudou, o valor continua sendo 68%. C) A probabilidade de 90% é obtida com um erro relativo de 8,2%. D) A probabilidade de 90% é obtida com um erro relativo de 82%. E) Como o número de famílias é superior a 30, não é possível estimar, com exatidão, a probabilidade do erro relativo. 3) Deseja-se fazer uma pesquisa para investigar o gasto mensal das famílias com alimentação. Marque a alternativa que representa o número de famílias que devemos entrevistar nessa pesquisa em que se tem desvio padrão 0,5, nível de significância de 90% e o erro relativo não deve ser maior que 5%. A) 26,9 famílias. B) O número total de famílias não precisa mudar; ele continua sendo 100. C) 27 famílias. D) 269 famílias. E) 2.685 famílias. driller.vmi Highlight driller.vmi Stamp driller.vmi Highlight driller.vmi Stamp 4) Um centro de controle de qualidade recebeu cinco peças de determinada empresa, com os seguintes pesos (em gramas) 65; 64; 66; 63 e 64. Para emitir o laudo de conformidade, quais devem ser as estimativas não tendenciosas e eficientes da média e da variância? A) Média: 64,3 e variância: 1,30. B) Média: 64,6 e variância: 1,30. C) Média: 64,4 e variância: 1,23. D) Média: 64,3 e variância: 1,23. E) Média: 64,4 e variância: 1,30. 5) Um teste de seleção para astronautas precisa selecionar aqueles que reagem mais rapidamente aos sinais de emergência. Ao medir o tempo de reação, encontrou-se um desvio-padrão de 0,05 s. Quantos candidatos o teste precisará avaliar para que o erro da estimativa não ultrapasse 0,01 s, com uma probabilidade de 95%? A) Mais de 1.000 candidatos. B) Mais de 100 candidatos. C) 96 candidatos. D) 97 candidatos. E) 99 candidatos. driller.vmi Highlight driller.vmi Stamp driller.vmi Highlight driller.vmi Stamp NA PRÁTICA Qualquer amostra só poderá resultar em um bom estimador caso ela seja coletada de forma aleatória. Se desejarmos fazer inferências, jamais poderemos utilizar amostras não probabilísticas e tendenciosas para estimarmos parâmetros. Veja o exemplo a seguir: Neste exemplo, é importante reconhecer: População: quantidade de peças fabricadas pela população. Amostra: peças que serão utilizadas para fazer os testes. Parâmetros: medidas numéricas calculadas com base nos dados de todas as peças fabricadas, que neste caso não é viável para a empresa. Estimativas: medidas numéricas calculadas com base em uma amostra. Lembre-se que qualquer amostra só poderá resultar em um bom estimador caso ela seja coletada de forma aleatória. Não podemos fazer uso de amostras não probabilísticas e tendenciosas para estimarmos parâmetros. SAIBA + Para ampliar o seu conhecimento a respeito desse assunto, veja abaixo as sugestões do professor: Estimação de Parâmetros Esse texto discute dois ramos do procedimento de estimação de parâmetros: estimação pontual e estimação intervalar, ressaltando como você pode identificar um modelo razoável, e estimar um parâmetro associado com esse modelo. Conteúdo interativo disponível na plataforma de ensino! Impactos socioeconômicos do setor sucroenergético são apontados em estudo Esse artigo apresenta uma pesquisa realizada no setor sucroenergético, que se utilizou de estimativas. Nesse estudo, foram levantados cerca de 1.300 trabalhos e artigos e selecionada uma amostra de 46 estudos para leitura integral e analítica. Conteúdo interativo disponível na plataforma de ensino! População e Amostra - Estatística Básica - Estimativa, estimador e parâmetros Esse vídeo define população e amostra, destacando a diferença entre parâmetro e estimador a partir de exemplos. Conteúdo interativo disponível na plataforma de ensino! ESTIMATIVA E ESTIMADOR. VAMOS EXTRAPOLAR? Conteúdo interativo disponível na plataforma de ensino!
Compartilhar