AULA 12 - Teoria da Estimação

•

UFRN

Jardel Rocha

04/08/2014

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Estatística para Engenharia de Produção

73 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Universidade Federal do Rio Grande do Norte 
Centro de Tecnologia - CT 
Departamento de Engenharia de Produção 
ESTATÍSTICA PARA ENGENHARIA 
DE PRODUÇÃO
Prof. Luciano Queiroz
Natal/RN 10/03/14
Sumário
 Inferência estatística
 Teoria da Estimação
Introdução
 Vimos que as estatísticas e portanto os estimadores são variáveis
aleatórias. A distribuição de probabilidades de uma estatística é
conhecida como distribuição amostral e seu desvio-padrão é
referido como erro padrão.
 Uma forma de obter a distribuição amostral de um estimador é
pensarmos em todas as amostras possíveis de tamanho n que
podem ser retiradas da população, usando por exemplo,
amostragem aleatória simples com reposição.
Introdução
 Inicialmente lidaremos com métodos que assumem que o valro do
desvio padrão da população é uma quantidade conhecida.
Raramente, esse pressuposto é percebido nos problemas da vida
real, mas ele tornará nosso primeiro contato com as técnicas de
inferências mais simples.
Estimativa
 As estimativas ocorrem de duas formas: estimativa pontual e
estimativa de intervalo.
 A estimativa pontual de um parâmetro é um número concebido
para estimar um parâmetro quantitativo de uma população,
geralmente, o valor da amostra estatística correspondente.
 Exemplo: medição da resistência de cisalhamento de rebite
utilizado na construção de aeronaves. Os engenheiros devem
monitorar a produção para certificar que a resistência ao
cisalhamento dos rebite atende às especificações exigidas.
Estimativa Pontual
 É selecionada uma amostra aleatória de 36 rebites, sendo cada
rebite testado quanto à sua resistência ao cisalhamento. A media
amostral resultante é x = 924,23 kg. Com base nesse exemplo,
afirmamos: “Acreditamos que a resistência media ao cisalhamento
para todos os rebites é de 924,23 kg”. Ou seja, a média da amostra,
xbarra, é a estimativa pontual (valor de numero único) para a
media μ da população amostrada. Para o exemplo dos rebites,
924,23 é a estimativa pontual para μ, resistência de cisalhamento
média para todos os rebites.
 Para continuar a explicação das inferências estatísticas,
assumiremos σ = 18 para os rebites específicos descritos no
exemplo.
Estimativa Pontual
 A qualidade dessa estimativa pontual deve ser questionada. A estimativa e ́
exata? A probabilidade e ́ que a estimativa seja alta ou baixa? Outra amostra
produziria o mesmo resultado? Outra amostra produziria uma estimativa com
aproximadamente o mesmo valor ou com um valor muito diferente? O quanto
seria “aproximadamente o mesmo” ou “muito diferente”?
 A qualidade de um procedimento (ou método) de estimativa melhora muito
se a estatística da amostra for menos variável e imparcial. A variabilidade de
uma estatística é medida pelo erro padrão de sua distribuição amostral.
 É possível tornar a media amostral menos variável, reduzindo-se seu erro
padrão, σ/√ n . Isso requer o uso de uma amostra maior, pois, conforme n
aumenta, o erro padrão diminui.
Estimativa Pontual
 A média amostral, x, e ́ uma estatística imparcial, pois o valor médio da
distribuição amostral das médias amostrais, μ xbarra, e ́ igual a ̀ média
populacional, μ.
 A estatística amostral xbarra = 943,23 é uma estatística pontual imparcial
para a resistência média de todos os rebites fabricados em nosso
exemplo.
 Estatística imparcial
 Estatística amostral cuja distribuição amostral apresenta um valor
médio igual ao valor do parâmetro populacional que esta ́ sendo
estimado. Uma estatística que não é ́ imparcial é uma estatística
tendenciosa.
Estimativa de intervalo
 As médias amostrais variam em valor e formam uma distribuição amostral,
na qual nem todas as amostras resultam em valores de x iguais à média
da população. Portanto, não devemos esperar que essa amostra de 36
rebites produza uma estimativa pontual (média amostral) exatamente
igual a ̀ média μ da população amostrada.
 Devemos, no entanto, esperar que a estimativa pontual seja relativamente
próxima do valor da média populacional. A distribuição amostral de
médias amostrais e o teorema do limite central (TLC) fornecem as
informações necessárias para descrever o quão próximo se espera que a
estimativa pontual, xbarrra, esteja da media populacional, μ.
Estimativa de intervalo
 Lembre-se de que aproximadamente 95% de uma distribuição normal
está dentro de dois desvios padrão da média, e que o TLC descreve a
distribuição amostral de medias amostrais como sendo
aproximadamente normal quando as amostras são grandes o suficiente.
As amostras de tamanho 36 de populações de variáveis como a
resistência dos rebites são, geralmente, consideradas suficientemente
grandes. Portanto, devemos antecipar que aproximadamente 95% de
todas as amostras aleatórias selecionadas de uma população com
média μ desconhecida e desvio padrão σ = 18 apresentarão médias x
entre
Estimativa de intervalo
Isso sugere que 95% de todas as
amostras aleatórias de tamanho
36 selecionadas de uma
populaça ̃o de rebites devem
apresentar uma média entre μ – 6
e μ + 6.
Os valores que limitam esse espaço são estatísticas calculadas de acordo
com a amostra que esta ́ sendo usada como base para a estimativa. As
estimativas de intervalo envolvem certo nível de confiança (1 – α) que é a
proporça ̃o de todas as estimativas de intervalo que incluem o parâmetro a
ser estimado.
Estimativa de intervalo
 A combinac ̧ão de um intervalo de confiança com um ni ́vel especi ́fico
de confiança fornece um intervalo de confiança. Podemos extrair todas
as informações juntas do exemplo do rebite na forma de um intervalo de
confiança. Para construir o intervalo de confiança, usaremos a
estimativa pontual x como o valor central de um intervalo de forma
muito semelhante ao modo como utilizamos a me ́dia μ como o valor
central para definir o intervalo que captura os 95% centrais da
distribuic ̧ão de x na Figura 8.2.
Estimativa de intervalo
 Para o exemplo dos rebites, podemos determinar os limites para um
intervalo centralizado em x:
 x-2(σx_) a x+2(σx_)
 924,23-6 a 924,23+6
 O intervalo resultante é de 918,23 a 930,23.
Estimativa da média
 O intervalo de confiança 1 − para a estimativa da media μ é
encontrado utilizando a formula
 Se a amostra for representativa da população, ela tende a gerar um 
valor próximo do parâmetro populacional, mas não igual. Como a 
estimativa e baseada em uma única amostra, o quão próximo o valor 
encontrado nessa amostra esta do verdadeiro parâmetro populacional? 
Não ha como saber se a amostra coletada foi extraída da cauda 
superior ou inferior da distribuição.
Estimativa da média
 Logo, para se ter confiança de estimar o verdadeiro parâmetro
populacional, gera-se um intervalo de possíveis valores para o
parâmetro populacional, a partir do valor encontrado da amostra.
Quanto maior a amplitude do intervalo, maior a confiança
(probabilidade) de estimar corretamente o verdadeiro parâmetro
populacional.
Estimativa da média
 O intervalo de confiança 1 − α para a estimativa da me ́dia μ é
encontrado utilizando a fórmula:
Estimativa da média
 1. xbarra é a estimativa pontual e o ponto central do intervalo de
confianc ̧a.
 2. z( /2) é o coeficiente de confiança. É o número de múltiplos do erro
padra ̃o necessa ́rio para formular uma estimativa de intervalo com a
extensa ̃o correta para obter um ni ́vel de confianc ̧a de 1 – α.
Estimativa da média
Estimativa da média
 3. é o erro padra ̃o da me ́dia, ou o desvio padra ̃o da distribuição
amostral das médias amostrais.
 4. e ́ uma vez e meia a extensa ̃o do intervalo de confiança (o
produto entre o coeficiente de confiança e o erro padra ̃o) ee ́
denominado erro ma ́ximo de estimativa, E.
 5. é denominado limite inferior de confianc ̧a (LIC), e
denominado limite superior de confiança (LSC) para o
intervalo de confiança.
 O procedimento de estimativa é organizado em um processo de cinco
etapas que levará em conta todas as informações citadas
anteriormente e produzirá a estimativa pontual e o intervalo de
confianc ̧a.
Construc ̧ão de um intervalo de 
confianc ̧a
 BASICAMENTE, O INTERVALO DE CONFIANÇA E ́ “ESTIMATIVA PONTUAL ±
ERRO MÁXIMO”.
 O departamento de atividades estudantis pretende obter uma resposta
para a pergunta: qual é a distância do trajeto (só de ida) percorrido por
um aluno médio de faculdade comunitária para ir a ̀ faculdade todos os
dias? (Normalmente, a “distância média do trajeto percorrido pelo
aluno” representa a “distância média” percorrida por todos os alunos
que se deslocam até a faculdade.) Foi selecionada uma amostra
aleato ́ria de 100 estudantes que se deslocam diariamente até a
faculdade e obtida a dista ̂ncia de ida percorrida.
Construc ̧ão de um intervalo de 
confianc ̧a
 A distância me ́dia da amostra resultante foi 10,22 milhas (16,45 km). Para
estimar a distância média de ida percorrida para todos os estudantes
que se deslocam diariamente, vamos usar: (a) uma estimativa pontual; e
(b) um intervalo de confiança de 95%. (Usemos σ = 6 milhas.) Nossa
estimativa pontual (a) para a distância média de ida é 10,22 milhas
(me ́dia amostral). Em seguida, usamos o procedimento de cinco passos
para determinar o intervalo de confiança de 95% (b).
Construc ̧ão de um intervalo de 
confianc ̧a
Construc ̧ão de um intervalo de 
confianc ̧a
 Passo 1: Descrever o parâmetro populacional de interesse.
 A média μ das distâncias de ida percorridas por todos os estudantes de faculdades
comunita ́rias que se deslocam diariamente e ́ o parâmetro de interesse.
 Passo 2: Verificar os pressupostos.
 a. σ é conhecido. A variável “dista ̂ncia percorrida” muito provavelmente tem uma
distribuição assimétrica porque a maioria dos alunos percorre entre 0 e 25 milhas (40,2
km), com pouco deslocamento superior a 25 milhas (40,2 km). Uma amostra de
tamanho 100 deve ser grande o suficiente para TLC, para satisfazer o pressuposto. A
distribuição amostral x e ́ aproximadamente normal.
 b. Identificar a distribuição de probabilidade e a fórmula a ser utilizada. A distribuição
normal padrão, z, será utilizada para determinar o coeficiente de confiança, e a
fórmula será utilizada com σ = 6.
 c. Estabelecer o nível de confiança, 1 – . O problema pede uma confiança de 95%,
ou 1 – α = 0,95.
Construc ̧ão de um intervalo de 
confianc ̧a
 Passo 3: Coletar as informações da amostra.
 As informac ̧ões da amostra sa ̃o fornecidas no enunciado do problema:
n = 100, x = 10,22.
 Passo 4: Intervalo De Confiança:
 a. Determinar o coeficiente de confianc ̧a.
 O coeficiente de confiança é encontrado utilizando- -se a Tabela
Construc ̧ão de um intervalo de 
confianc ̧a
 Passo 4: Intervalo De Confiança:
 b. Determinar o erro ma ́ximo da estimativa.
 Utilizar o componente de erro ma ́ximo
 c. Determinar os limites de confiança inferior e superior.
 Utilizando a estimativa pontual, x, do Passo 3 e o erro máximo, E, do
Passo 4b, determinamos os limites do intervalo de confianc ̧a:
Construc ̧ão de um intervalo de 
confianc ̧a
 Passo 5: Definir o intervalo de confianc ̧a.
 9,04 a 11,40 é o intervalo de confianc ̧a de 95% para μ. Ou seja, com uma
confianc ̧a de 95%, podemos afirmar que: “A distância me ́dia de ida esta ́ entre
9,04 e 11,40 milhas (14,55 e 18,35 km).”
 Vejamos novamente o conceito de “ni ́vel de confiança”. Ele foi definido como
a probabilidade de que a amostra a ser selecionada produzira ́ os limites do
intervalo que conte ̂m o para ̂metro.
Tamanho da amostra
 O intervalo de confianc ̧a tem duas caracteri ́sticas ba ́sicas que determinam a
sua qualidade: o seu ni ́vel de confianc ̧a e sua extensa ̃o.
 É preferi ́vel para o intervalo ter um alto ni ́vel de confianc ̧a e ser preciso
(estreito) ao mesmo tempo.
 Quanto maior o ni ́vel de confianc ̧a, maior a probabilidade de o intervalo
conter o para ̂metro, e quanto mais estreito o intervalo, mais precisa e ́ a
estimativa.
 No entanto, essas duas propriedades parecem se contradizer, pois,
aparentemente, um intervalo mais estreito tenderia a apresentar uma
probabilidade menor e um intervalo mais amplo seria menos preciso.
 O componente de erro máximo da fo ́rmula do intervalo de confiança
especifica a relac ̧a ̃o envolvida.
Tamanho da amostra
 Essa fórmula possui quatro componentes: (1) o erro ma ́ximo E, metade da extensa ̃o do
intervalo de confiança; (2) o coeficiente de confiança, z(α/2), o qual é determinado pelo
ni ́vel de confiança; (3) o tamanho da amostra, n; e (4) o desvio padra ̃o, σ.
 O desvio padra ̃o σ na ̃o e um fator importante para esta discussa ̃o por ser uma constante (o
valor do desvio padra ̃o de uma populaça ̃o na ̃o se altera). Assim, restam tre ̂s fatores.
 A análise da fórmula indica o seguinte: o aumento do intervalo de confiança tornara ́ o
coeficiente de confianc ̧a maior e, dessa forma, exigirá que o erro máximo aumente ou que
o tamanho da amostra aumente; a diminuiça ̃o do erro ma ́ximo exigira ́ que o ni ́vel de
confiança diminua ou que o tamanho da amostra aumente; e a diminuiça ̃o no tamanho
da amostra forc ̧ara ́ o aumento do erro ma ́ximo ou a diminuic ̧a ̃o do ni ́vel de confiança.
 O aumento ou a diminuiça ̃o de qualquer um dos tre ̂s componentes tem efeito sobre um dos
dois outros fatores ou sobre ambos. O trabalho do estati ́stico e ́ “equilibrar” o ni ́vel de
confiança, o tamanho da amostra e o erro ma ́ximo de forma que resulte em um intervalo
acessi ́vel.