Baixe o app para aproveitar ainda mais
Prévia do material em texto
Universidade Federal do Rio Grande do Norte Centro de Tecnologia - CT Departamento de Engenharia de Produção ESTATÍSTICA PARA ENGENHARIA DE PRODUÇÃO Prof. Luciano Queiroz Natal/RN 10/03/14 Sumário Inferência estatística Teoria da Estimação Introdução Vimos que as estatísticas e portanto os estimadores são variáveis aleatórias. A distribuição de probabilidades de uma estatística é conhecida como distribuição amostral e seu desvio-padrão é referido como erro padrão. Uma forma de obter a distribuição amostral de um estimador é pensarmos em todas as amostras possíveis de tamanho n que podem ser retiradas da população, usando por exemplo, amostragem aleatória simples com reposição. Introdução Inicialmente lidaremos com métodos que assumem que o valro do desvio padrão da população é uma quantidade conhecida. Raramente, esse pressuposto é percebido nos problemas da vida real, mas ele tornará nosso primeiro contato com as técnicas de inferências mais simples. Estimativa As estimativas ocorrem de duas formas: estimativa pontual e estimativa de intervalo. A estimativa pontual de um parâmetro é um número concebido para estimar um parâmetro quantitativo de uma população, geralmente, o valor da amostra estatística correspondente. Exemplo: medição da resistência de cisalhamento de rebite utilizado na construção de aeronaves. Os engenheiros devem monitorar a produção para certificar que a resistência ao cisalhamento dos rebite atende às especificações exigidas. Estimativa Pontual É selecionada uma amostra aleatória de 36 rebites, sendo cada rebite testado quanto à sua resistência ao cisalhamento. A media amostral resultante é x = 924,23 kg. Com base nesse exemplo, afirmamos: “Acreditamos que a resistência media ao cisalhamento para todos os rebites é de 924,23 kg”. Ou seja, a média da amostra, xbarra, é a estimativa pontual (valor de numero único) para a media μ da população amostrada. Para o exemplo dos rebites, 924,23 é a estimativa pontual para μ, resistência de cisalhamento média para todos os rebites. Para continuar a explicação das inferências estatísticas, assumiremos σ = 18 para os rebites específicos descritos no exemplo. Estimativa Pontual A qualidade dessa estimativa pontual deve ser questionada. A estimativa e ́ exata? A probabilidade e ́ que a estimativa seja alta ou baixa? Outra amostra produziria o mesmo resultado? Outra amostra produziria uma estimativa com aproximadamente o mesmo valor ou com um valor muito diferente? O quanto seria “aproximadamente o mesmo” ou “muito diferente”? A qualidade de um procedimento (ou método) de estimativa melhora muito se a estatística da amostra for menos variável e imparcial. A variabilidade de uma estatística é medida pelo erro padrão de sua distribuição amostral. É possível tornar a media amostral menos variável, reduzindo-se seu erro padrão, σ/√ n . Isso requer o uso de uma amostra maior, pois, conforme n aumenta, o erro padrão diminui. Estimativa Pontual A média amostral, x, e ́ uma estatística imparcial, pois o valor médio da distribuição amostral das médias amostrais, μ xbarra, e ́ igual a ̀ média populacional, μ. A estatística amostral xbarra = 943,23 é uma estatística pontual imparcial para a resistência média de todos os rebites fabricados em nosso exemplo. Estatística imparcial Estatística amostral cuja distribuição amostral apresenta um valor médio igual ao valor do parâmetro populacional que esta ́ sendo estimado. Uma estatística que não é ́ imparcial é uma estatística tendenciosa. Estimativa de intervalo As médias amostrais variam em valor e formam uma distribuição amostral, na qual nem todas as amostras resultam em valores de x iguais à média da população. Portanto, não devemos esperar que essa amostra de 36 rebites produza uma estimativa pontual (média amostral) exatamente igual a ̀ média μ da população amostrada. Devemos, no entanto, esperar que a estimativa pontual seja relativamente próxima do valor da média populacional. A distribuição amostral de médias amostrais e o teorema do limite central (TLC) fornecem as informações necessárias para descrever o quão próximo se espera que a estimativa pontual, xbarrra, esteja da media populacional, μ. Estimativa de intervalo Lembre-se de que aproximadamente 95% de uma distribuição normal está dentro de dois desvios padrão da média, e que o TLC descreve a distribuição amostral de medias amostrais como sendo aproximadamente normal quando as amostras são grandes o suficiente. As amostras de tamanho 36 de populações de variáveis como a resistência dos rebites são, geralmente, consideradas suficientemente grandes. Portanto, devemos antecipar que aproximadamente 95% de todas as amostras aleatórias selecionadas de uma população com média μ desconhecida e desvio padrão σ = 18 apresentarão médias x entre Estimativa de intervalo Isso sugere que 95% de todas as amostras aleatórias de tamanho 36 selecionadas de uma populaça ̃o de rebites devem apresentar uma média entre μ – 6 e μ + 6. Os valores que limitam esse espaço são estatísticas calculadas de acordo com a amostra que esta ́ sendo usada como base para a estimativa. As estimativas de intervalo envolvem certo nível de confiança (1 – α) que é a proporça ̃o de todas as estimativas de intervalo que incluem o parâmetro a ser estimado. Estimativa de intervalo A combinac ̧ão de um intervalo de confiança com um ni ́vel especi ́fico de confiança fornece um intervalo de confiança. Podemos extrair todas as informações juntas do exemplo do rebite na forma de um intervalo de confiança. Para construir o intervalo de confiança, usaremos a estimativa pontual x como o valor central de um intervalo de forma muito semelhante ao modo como utilizamos a me ́dia μ como o valor central para definir o intervalo que captura os 95% centrais da distribuic ̧ão de x na Figura 8.2. Estimativa de intervalo Para o exemplo dos rebites, podemos determinar os limites para um intervalo centralizado em x: x-2(σx_) a x+2(σx_) 924,23-6 a 924,23+6 O intervalo resultante é de 918,23 a 930,23. Estimativa da média O intervalo de confiança 1 − para a estimativa da media μ é encontrado utilizando a formula Se a amostra for representativa da população, ela tende a gerar um valor próximo do parâmetro populacional, mas não igual. Como a estimativa e baseada em uma única amostra, o quão próximo o valor encontrado nessa amostra esta do verdadeiro parâmetro populacional? Não ha como saber se a amostra coletada foi extraída da cauda superior ou inferior da distribuição. Estimativa da média Logo, para se ter confiança de estimar o verdadeiro parâmetro populacional, gera-se um intervalo de possíveis valores para o parâmetro populacional, a partir do valor encontrado da amostra. Quanto maior a amplitude do intervalo, maior a confiança (probabilidade) de estimar corretamente o verdadeiro parâmetro populacional. Estimativa da média O intervalo de confiança 1 − α para a estimativa da me ́dia μ é encontrado utilizando a fórmula: Estimativa da média 1. xbarra é a estimativa pontual e o ponto central do intervalo de confianc ̧a. 2. z( /2) é o coeficiente de confiança. É o número de múltiplos do erro padra ̃o necessa ́rio para formular uma estimativa de intervalo com a extensa ̃o correta para obter um ni ́vel de confianc ̧a de 1 – α. Estimativa da média Estimativa da média 3. é o erro padra ̃o da me ́dia, ou o desvio padra ̃o da distribuição amostral das médias amostrais. 4. e ́ uma vez e meia a extensa ̃o do intervalo de confiança (o produto entre o coeficiente de confiança e o erro padra ̃o) ee ́ denominado erro ma ́ximo de estimativa, E. 5. é denominado limite inferior de confianc ̧a (LIC), e denominado limite superior de confiança (LSC) para o intervalo de confiança. O procedimento de estimativa é organizado em um processo de cinco etapas que levará em conta todas as informações citadas anteriormente e produzirá a estimativa pontual e o intervalo de confianc ̧a. Construc ̧ão de um intervalo de confianc ̧a BASICAMENTE, O INTERVALO DE CONFIANÇA E ́ “ESTIMATIVA PONTUAL ± ERRO MÁXIMO”. O departamento de atividades estudantis pretende obter uma resposta para a pergunta: qual é a distância do trajeto (só de ida) percorrido por um aluno médio de faculdade comunitária para ir a ̀ faculdade todos os dias? (Normalmente, a “distância média do trajeto percorrido pelo aluno” representa a “distância média” percorrida por todos os alunos que se deslocam até a faculdade.) Foi selecionada uma amostra aleato ́ria de 100 estudantes que se deslocam diariamente até a faculdade e obtida a dista ̂ncia de ida percorrida. Construc ̧ão de um intervalo de confianc ̧a A distância me ́dia da amostra resultante foi 10,22 milhas (16,45 km). Para estimar a distância média de ida percorrida para todos os estudantes que se deslocam diariamente, vamos usar: (a) uma estimativa pontual; e (b) um intervalo de confiança de 95%. (Usemos σ = 6 milhas.) Nossa estimativa pontual (a) para a distância média de ida é 10,22 milhas (me ́dia amostral). Em seguida, usamos o procedimento de cinco passos para determinar o intervalo de confiança de 95% (b). Construc ̧ão de um intervalo de confianc ̧a Construc ̧ão de um intervalo de confianc ̧a Passo 1: Descrever o parâmetro populacional de interesse. A média μ das distâncias de ida percorridas por todos os estudantes de faculdades comunita ́rias que se deslocam diariamente e ́ o parâmetro de interesse. Passo 2: Verificar os pressupostos. a. σ é conhecido. A variável “dista ̂ncia percorrida” muito provavelmente tem uma distribuição assimétrica porque a maioria dos alunos percorre entre 0 e 25 milhas (40,2 km), com pouco deslocamento superior a 25 milhas (40,2 km). Uma amostra de tamanho 100 deve ser grande o suficiente para TLC, para satisfazer o pressuposto. A distribuição amostral x e ́ aproximadamente normal. b. Identificar a distribuição de probabilidade e a fórmula a ser utilizada. A distribuição normal padrão, z, será utilizada para determinar o coeficiente de confiança, e a fórmula será utilizada com σ = 6. c. Estabelecer o nível de confiança, 1 – . O problema pede uma confiança de 95%, ou 1 – α = 0,95. Construc ̧ão de um intervalo de confianc ̧a Passo 3: Coletar as informações da amostra. As informac ̧ões da amostra sa ̃o fornecidas no enunciado do problema: n = 100, x = 10,22. Passo 4: Intervalo De Confiança: a. Determinar o coeficiente de confianc ̧a. O coeficiente de confiança é encontrado utilizando- -se a Tabela Construc ̧ão de um intervalo de confianc ̧a Passo 4: Intervalo De Confiança: b. Determinar o erro ma ́ximo da estimativa. Utilizar o componente de erro ma ́ximo c. Determinar os limites de confiança inferior e superior. Utilizando a estimativa pontual, x, do Passo 3 e o erro máximo, E, do Passo 4b, determinamos os limites do intervalo de confianc ̧a: Construc ̧ão de um intervalo de confianc ̧a Passo 5: Definir o intervalo de confianc ̧a. 9,04 a 11,40 é o intervalo de confianc ̧a de 95% para μ. Ou seja, com uma confianc ̧a de 95%, podemos afirmar que: “A distância me ́dia de ida esta ́ entre 9,04 e 11,40 milhas (14,55 e 18,35 km).” Vejamos novamente o conceito de “ni ́vel de confiança”. Ele foi definido como a probabilidade de que a amostra a ser selecionada produzira ́ os limites do intervalo que conte ̂m o para ̂metro. Tamanho da amostra O intervalo de confianc ̧a tem duas caracteri ́sticas ba ́sicas que determinam a sua qualidade: o seu ni ́vel de confianc ̧a e sua extensa ̃o. É preferi ́vel para o intervalo ter um alto ni ́vel de confianc ̧a e ser preciso (estreito) ao mesmo tempo. Quanto maior o ni ́vel de confianc ̧a, maior a probabilidade de o intervalo conter o para ̂metro, e quanto mais estreito o intervalo, mais precisa e ́ a estimativa. No entanto, essas duas propriedades parecem se contradizer, pois, aparentemente, um intervalo mais estreito tenderia a apresentar uma probabilidade menor e um intervalo mais amplo seria menos preciso. O componente de erro máximo da fo ́rmula do intervalo de confiança especifica a relac ̧a ̃o envolvida. Tamanho da amostra Essa fórmula possui quatro componentes: (1) o erro ma ́ximo E, metade da extensa ̃o do intervalo de confiança; (2) o coeficiente de confiança, z(α/2), o qual é determinado pelo ni ́vel de confiança; (3) o tamanho da amostra, n; e (4) o desvio padra ̃o, σ. O desvio padra ̃o σ na ̃o e um fator importante para esta discussa ̃o por ser uma constante (o valor do desvio padra ̃o de uma populaça ̃o na ̃o se altera). Assim, restam tre ̂s fatores. A análise da fórmula indica o seguinte: o aumento do intervalo de confiança tornara ́ o coeficiente de confianc ̧a maior e, dessa forma, exigirá que o erro máximo aumente ou que o tamanho da amostra aumente; a diminuiça ̃o do erro ma ́ximo exigira ́ que o ni ́vel de confiança diminua ou que o tamanho da amostra aumente; e a diminuiça ̃o no tamanho da amostra forc ̧ara ́ o aumento do erro ma ́ximo ou a diminuic ̧a ̃o do ni ́vel de confiança. O aumento ou a diminuiça ̃o de qualquer um dos tre ̂s componentes tem efeito sobre um dos dois outros fatores ou sobre ambos. O trabalho do estati ́stico e ́ “equilibrar” o ni ́vel de confiança, o tamanho da amostra e o erro ma ́ximo de forma que resulte em um intervalo acessi ́vel.
Compartilhar