Buscar

AULA Teoria da Estimação 1

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 32 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 32 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 32 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Teoria da Estimação - I
(Estimação pontual e intervalos de confiança para a média 
populacional)
Duas fases da análise estatística
• Estatística Descritiva: Descrever e estudar uma população ou amostra
• Estatística inferencial (indutiva): A partir de uma amostra, utiliza-se
estimadores e a teoria de probabilidade para inferir sobre as características
de uma população.
• A inferência pode ser feita por estimação ou teste de hipótese.
Recordando: Parâmetro e estimador e 
estimativa
• Parâmetro - Característica relacionada à população. (Ex. Média
populacional, variância populacional, proporção populacional, etc.)
• Estatística ou Estimador - É uma fórmula de cálculo utilizada para
determinar uma característica relacionada à amostra. (Ex. Média
amostral, variância amostral, proporção amostral, etc.)
• Estimativa: Resultado da aplicação de um estimador em uma amostra.
(Ex. Valor obtido da média amostral, etc.)
Estimação de parâmetros
PopulaçãoAmostra

P
S2
X

?
Estimação é o nome técnico para o processo que
consiste em se utilizarem estimativas obtidas a
partir dos dados de uma amostra para avaliar
(estimar) parâmetros populacionais desconhecidos
Estimação
• Pontual Estima-se apenas um valor
para o parâmetro.
• Intervalar Estima-se um intervalo de valores
onde deve-se encontrar o parâmetro (intervalo de
confiança) com uma determinada probabilidade.


Estimativa pontual para a média
Obter uma estimativa da 
média amostral usando o 
estimador da média 
aritmética simples
Média populacional 
Como foi visto na aula anterior, pelo Teorema Central do Limite, a
média amostral apresenta uma probabilidade alta de estar próxima da
média populacional.
Como podemos estimar o verdadeiro valor da média da população se
temos disponível apenas uma amostra aleatória com n indivíduos?
Intervalo de confiança para a 
média populacional
O intervalo de confiança é uma faixa de possíveis valores em torno da
média amostral e indica a probabilidade de que esta faixa realmente
contenha o verdadeiro valor da média da população.
O intervalo de confiança terá uma certa probabilidade chamada de nível
de confiança (simbolizada por 1 – ) de conter a média da população.
 O intervalo de confiança terá uma certa probabilidade chamada de nível
de significância (simbolizada por ) de não conter a média da população.
x
1 – α
/2 /2
Intervalo de confiança
1 – α = nível de confiança
α = nível de significância
Há uma probabilidade de 1 –  da 
média populacional estar contida no 
intervalo definido 
Há uma probabilidade  de a média
populacional estar fora do intervalo definido
(área achurada)
z2z1
intervalo
errox  errox 
(μ)
  1)( exexP
α /2 α/2
Distribuição das médias amostrais
x
1 – α
Deve-se observar que a média populacional é igual a média
amostral mais um erro amostral, ou seja, ex 
Assim, o intervalo de confiança deverá ser construído de tal forma
que
• Na aula passada (Aula09) foi visto que se o desvio-padrão da
população é conhecido, a distribuição amostral da média amostral
é normal com média μ e erro padrão .
• Se o desvio-padrão da população é conhecido, o erro amostral pode
ser obtido multiplicando o quantil da distribuição amostral da
média (valor tabelado) pelo erro-padrão da distribuição
amostral da média .
• Assim, o intervalo de confiança para a média populacional com
desvio–padrão populacional conhecido pode ser obtido a partir da
fórmula:
n

n

Interpretação formal do intervalo de confiança da média (ou 
qualquer outro parâmetro) 
X50403020 807060Amostra
1
2
3
...
45
46
47
...
98
99
100 =50
Se em um estudo, forem
retiradas várias amostras
aleatórias de tamanho n da
população e que, para cada
amostra, seja construído um
intervalo de (1-) de confiança
para a o parâmetro desejado
(ex. média populacional).
Os intervalos obtidos serão
diferentes, mas (1-)%
destes intervalos conterão
entre os seus intervalos o
valor real do parâmetro (ex.
média populacional).
Ao nível de 99% de confiança espera-se que em 100 intervalos de confiança,
obtidos a partir de 100 amostras, 99 deles contenham a média populacional μ.
Exemplo
Foi retirada uma amostra de água em 64 pontos de
uma represa e feitas medições de um poluente em
partículas por milhão (ppm). A média encontrada na
amostra foi de 300 ppm. Uma pesquisa anterior
mostrou que a medição do poluente apresenta
distribuição normal com desvio padrão igual a 100
ppm. Não existem razões para supor que a
variabilidade do poluente tenha se alterado.
Construir um intervalo com 90% de confiança para a
média do poluente na represa.
• 
• 
0Z0,05
5%
O intervalo de confiança para a média populacional pode ser
obtido a partir da fórmula:
• X  n
•  
+-Lim = 300 1,64 64
100
Linf = 279,5 ppm
Lsup = 320,5 ppm
20,5

Interpretação do intervalo de Confiança
- Formal: A probabilidade de que o verdadeiro valor da média do
poluente na represa encontra-se entre 279,5 ppm e 320,5 ppm é
de 0,90.
- Usual: Com 90% de confiança podemos afirmar que o verdadeiro
valor da média do poluente na represa está entre 279,5 ppm e
320,5 ppm.
- Artigo científico: O poluente na represa apresenta média igual a
300±20,5 ppm, com 90% de confiança. É comum encontrar,
erroneamente, o desvio-padrão no lugar do erro amostral nesta
notação.
- TV e jornais: A média do poluente encontrada na represa foi de
300 ppm, com um erro de 20,5 ppm, para mais ou para menos,
com 90% de confiança.
Intervalo de confiança para a média 
( desconhecido)
• Na prática, em muitas situações, não se
conhece o desvio-padrão da população cuja
média se deseja estimar.
• Então, utiliza-se um estimador pontual para o
desvio-padrão populacional, ou seja, o desvio
padrão amostral dado por
Assim, o intervalo de confiança para a média
populacional com desvio-padrão desconhecido e
tamanho de amostra grande (n ≥ 25) é obtido da mesma
forma do caso anterior, apenas substituindo o desvio
padrão populacional pelo desvio padrão amostral.
Portanto,
• Caso o desvio-padrão for desconhecido e o tamanho da
amostra for pequeno (n < 25), a distribuição normal não
pode ser utilizada.
• Nesta situação, foi visto anteriormente (Aula09) que a
distribuição correta a ser utilizada é a distribuição “t” de
Student, com (n-1) graus de liberdade. (supondo que a
população tenha distribuição normal).
• Assim, o intervalo de confiança para a média
populacional de uma variável aleatória com
distribuição normal com desvio-padrão
desconhecido e tamanho de amostra pequeno
(n < 25) é construído da seguinte forma
Distribuição t de Student
Distribuição t de Student com 3 
graus de liberdade
Distribuição t de Student com 12 
graus e liberdade
Distribuição normal padronizada
Observe que quanto o maior o tamanho da amostra e, consequentemente , dos graus
de liberdade, mais a distribuição t de Student se aproxima da distribuição normal.
Os valores de t (valores correspondentes à área sob a curva nas caudas) são tabelados
e dependem de dois fatores: Graus de liberdade (em gera, n-1) e nível de
significância desejado (α).
Exemplo
Na construção de um tubo de ensaio, o diâmetro
é de grande importância. Em um processo de
produção de tubos, sob controle, espera-se que o
diâmetro dos mesmos tenha distribuição,
aproximadamente, normal. Em uma pesquisa
feita com uma amostra de 20 tubos em um dia de
produção de uma fábrica, obteve-se um diâmetro
médio de 82 mm e um desvio-padrão de 0,1 mm.
Qual o diâmetro médio dos tubos produzidos
pela fábrica em um dia de produção com 95% de
confiança?
Temos que:
• n = 20 (19 graus de liberdade)
• s = 0,1 mm
• X = 82 mm
• = 5% - da tabela: t19, 0.025 = 2,093
Exemplo
• IC :
• LS = 82,05 mm
• LI = 81,95 mm
• 81,95 <  < 82,05 com 95% de confiança
n
s
tc+-
_
X 2,093 20
0,1+-82
0,05

Interpretação
- Formal: A probabilidade do valor médio dos diâmetros dos
tubos produzidospela fábrica estar entre 81,95 mm e 82,05
mm é 0,95.
- Usual: Com 95% de confiança podemos afirmar que o
verdadeiro valor da média dos diâmetros dos tubos
produzidos pela fábrica está entre 81,95 mm e 82,05 mm.
- Artigo científico: A média dos diâmetros dos tubos produzidos
pela fábrica é de 82±0,05 mm, com 95% de confiança.
- TV e jornais: O diâmetro médio dos tubos produzidos pela
fábrica é de 82 mm com um erro de 0,05 mm, para mais ou
para menos, com 95% de confiança.
Escolha a distribuição amostral adequada
Início
n > 25?
população tem 
distr. normal?
 população
é conhecido
Usar distribuição t
usar métodos não-paramétricos ou de 
reamostragem
sim
sim
sim
não
não
não
Pelo teorema do limite central podemos 
usar a distrib. normal (use s se  não for 
conhecido)
n
ze

 2/
usar a distribuição normal
n
ze

 2/
n
s
te n 2/,1
Cálculo do tamanho da amostra 
para estimar a média 
populacional
Cálculo do tamanho da amostra
• O conceito de nível de confiança e erro amostral (margem de erro)
pode ser utilizado para obter o tamanho da amostra que é
necessário para fazer inferências confiáveis. Assim, dado um erro
amostral pré-estabelecido, pode-se obter o tamanho da amostra
• Caso o desvio-padrão populacional for conhecido basta utiliza-lo
na fórmula no lugar do desvio-padrão amostral (s).
• Na verdade, ao utilizar o desvio-padrão amostral (s) também
deveria ser utilizada a distribuição t de Student e um processo
iterativo para obter o tamanho da amostra correto (não abordado
neste curso).
2
2/ .







e
sZ
n 
n
s
Ze .
2

• Na prática o desvio-padrão amostral (s) pode ser obtido a partir
de uma amostra piloto.
Exercício:
Estudos anteriores mostraram que os alunos da UFLA apresentam
idade com desvio-padrão igual a 0,3 anos. Para um novo estudo, qual
deve ser o tamanho da amostra para que tenhamos 95% de confiança
para que a estimativa da idade média de todos os alunos da UFLA
não ultrapasse um erro de 0,05 anos?
Exercício:
Estudos anteriores mostraram que os alunos da UFLA apresentam
idade com desvio-padrão igual a 0,3 anos. Para um novo estudo, qual
deve ser o tamanho da amostra para que tenhamos 95% de confiança
para que a estimativa da idade média de todos os alunos da UFLA
não ultrapasse um erro de 0,05 anos?
2
2/ .







e
sZ
n 
alunos
e
sZ
n 139
05,0
)3,0).(96,1(.
22
2/ 











 
Dados:
e = 0,05
s = 0,3
 =0,05
Relação entre o tamanho da amostra e o
erro de amostragem
• Se o erro amostral for grande, a amostra empregada será muito
pequena, o que impossibilita (ou inviabiliza) a tomada de decisão.
• Por outro lado, o erro amostral for pequeno, a amostra será
muito grande o que poderá implicar em gastos desnecessários.
O tamanho da amostra para estimar a média de uma população 
pode ser obtido a partir da fórmula:
2
2/ .







e
sZ
n 
500 1000 1500 2000 2500 3000
Tamanho da amostra
M
a
rg
em
 d
e 
er
ro
 (
E
)
0,5
1,0
1,5
3,0
2,0
2,5
mantendo fixos (s=10 e 95% de confiança)
• Os ganhos em precisão conseguidos com aumentos fixos dos
tamanhos das amostras não são constantes;
•Amostras com mais de 5.000 elementos podem ser um perda de
tempo e dinheiro porque elas fornecem pouca precisão adicional;
“... cada um de vocês pode fazer no dia, na
semana, ou no mês o exercício de criar um
pensamento. Uma vez criado deverá cuidá-
lo, segui-lo e atende-lo afim de que este
pensamento sirva para algo, já que perderia
tempo se criasse um pensamento
inservível. Criarei, pois, pensamentos úteis
e os cuidareis.”
(Da Sabedoria Logosófica)

Continue navegando