intervalo_confiança

•

FTECBRASIL

0

Alexandre Lima

04/07/2014

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Probabilidade e Estatística

29.955 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Intervalo de Confiança
Tamanho da amostra
Estimativa pontual para a média
ESTIMAR A MÉDIA DA 
POPULAÇÃO
Média amostral 
(média das médias)
Como foi visto anteriormente a média da população é igual 
à média das médias
Como podemos estimar o verdadeiro valor da média da 
população se temos em mãos a média de uma amostra?
Intervalo de Confiança
É uma faixa de possíveis valores em torno da média amostral, e a 
probabilidade de que esta faixa realmente contenha o valor real da média 
da população
O Intervalo de confiança terá uma certa probabilidade chamada de nível 
de confiança (simbolizada por 1 – ) de conter a média da população.
x
1 – α
/2 /2
Intervalo de confiança
1 – α = nível de confiança
α = nível de significância (probabilidade de erro)
Há uma probabilidade de 1 –  da 
média estar contida no intervalo 
definido 
Há uma probabilidade  de a média 
amostral estar fora do intervalo definido 
(área hachurada)
Se usarmos um desvio padrão em 
torno da média (Z = 1), a chance de 
erro ao estimar a média será de 
31,74%. Mas, se usarmos dois (Z = 
2), a chance de erro será de 4,56%.
Intervalo de Confiança
Não é possível exibir esta imagem no momento.
z2z1
Erro = z . Desvio padrão amostral
n
z.e s=intervalo
errox  errox 
(μ)
 = 1)( exexP
α /2 α /2
 = desvio padrão da população
1 - α = grau de confiança
Distribuição das médias amostrais
x
1 – α
Intervalo de Confiança
Se o desvio padrão da população é conhecido:
A estimativa intervalar da média populacional se baseia na hipótese de que
a distribuição amostral das médias amostrais é normal. Para grandes
amostras isto não apresenta dificuldade especial, pois se aplica o teorema
do limite central.
Todavia, para amostras de 30 ou menos observações, é importante saber se
a população tem distribuição normal ou aproximada.
nzX /.: s  n
z.e s=
Intervalo de Confiança
Se o desvio padrão da população é desconhecido:
Quando o desvio padrão da população não é conhecido (o que é o caso,
geralmente), usa-se o desvio padrão da amostra como estimativa, substituindo-se
x por Sx nas equações. Isto não acarreta maiores dificuldades, pois o desvio
padrão amostral dá uma aproximação bastante razoável do verdadeiro valor, na
maioria dos casos.
Além disso, pelo teorema do limite central, sabemos que, quando a amostra é
maior que 30, a distribuição das médias é aproximadamente normal.
Para amostras menores que 30, a aproximação normal não é adequada. Devemos
então usar a distribuição t. A forma da distribuição t é bem parecida com a
normal.
nzX /.: s 
Intervalo de Confiança
exouexex = 
Quando tem n > 30 e 
 é conhecido
Quando tem n > 30 e 
σ é desconhecido
Substitui o desvio padrão da
população  pelo desvio
padrão da amostra s
Região 
Crítica
Região 
Crítica
Z/2 Z/2
Zcrítico Zcrítico
1 - α
x
nX
s
s =
XzX s .: 
n
ze s.=
n
Sze X.=
n
SzX X.=
Intervalo de Confiança
X50403020 807060Amostra
1
2
3
...
45
46
47
...
98
99
100 =50
Se em um estudo, forem
retiradas várias amostras
aleatórias de tamanho n da
população e que, para cada
amostra, seja construído
um intervalo de (1-) de
confiança para a variável
desejada.
Os intervalos obtidos
serão diferentes, mas
(1-)% destes intervalos
conterão entre os seus
intervalos o valor real do
parâmetro.
Ao nível de 95% de confiança espera-se que em 100 
intervalos para as amostras, 95 deles contenham a média μ
Interpretação:
Intervalo de Confiança
E quando o tamanho da amostra é menor que 30 
(n < 30) e o desvio padrão da população () é 
desconhecido?
 Neste caso não podemos usar a distribuição normal (a 
distribuição das médias não é normal). 
 Devemos usar a distribuição t (t de student).
A distribuição t é similar à distribuição normal, mas tem 
maior variação nas caudas (nas pontas da curva).
Distribuição t de Student
Distribuição t de 
student com n = 3
Distribuição t de 
student com n = 12
Distribuição normal 
padronizada
A curva t nos dá a probabilidade de ocorrer um evento a t desvios padrão da média (para 
mais ou para menos)
 os valores de t (valores correspondentes à área sob a curva nas caudas) são tabelados e dependem 
de dois fatores:
 n-1 = graus de liberdade
 grau de confiança desejado (1- α)
Intervalo de Confiança
exouexex = 
n
ste n 1,2/ = 
n
ste ncrítico 1, =n
ste =
Quando tem n < 30 e σ é desconhecido
Substitui o desvio padrão da população  pelo desvio padrão da amostra s
ouou
Intervalo de Confiança
Imagine que tivéssemos uma amostra de tamanho tão 
grande que tendesse ao infinito. O que ocorreria?
O erro seria próximo de zero (desconsiderável) e a média da 
amostra seria igual a média da população, sem a necessidade 
de estimar um intervalo.
Exercícios
Resolução:

0,01 2,58
0,10 1,65
0,08 1,75
0,06 1,88
Grau de Confiança
(1 – α)
Valor Crítico
(Z α/2)
99%
94%
92%
90%
Exercícios
Um dos principais produtos de uma indústria siderúrgica é a
folha de flandres. Havia uma preocupação com a
possibilidade de haver um número de folhas fora da faixa de
especificação de dureza (LIE = 58,0 HR e LSE = 64,0 HR). A
partir desta informação a empresa decidiu estimar a dureza
média das folhas de flandres () coletando uma amostra
aleatória de 49 folhas.
61,0 60,2 60,3 60,3 60,0 61,0 60,3
60,0 60,0 60,9 61,0 61,2 59,2 60,9
60,0 60,5 59,8 59,3 61,0 59,6 59,8
59,6 60,1 58,0 59,8 58,9 57,6 58,0
60,5 60,1 61,6 61,1 59,7 58,3 61,6
59,5 59,0 60,3 58,7 59,6 54,2 60,3
61,0 59,7 59,9 59,9 60,0 58,6 59,9
Medidas de dureza (HR) das folhas-de-flandres fabricadas pela 
siderúrgica
61,0
21,60
=
=
s
X
Para um grau de confiança de 95%, determine a margem de erro (E) e o
intervalo de confiança para média populacional ().
Exercícios
49
61,0
21,60
=
=
=
n
s
X
n
sZe
2
=
Margem de erro:
17,01708,0
49
61,0.96,1 ===e
Dados:
Grau de confiança de 95% implica em: 1 –  = 95%, 
logo α = 5% = 0,05 e α/2 = 0,025. Z α/2 = Z0,025 = 1,96
-Z/2 Z/2
1 - α
0
/2 /2
Exercícios
exex  
Intervalo de confiança:
17,021,6017,021,60  
[60,04 ; 60,38]HR 
Interpretação:
Se fôssemos selecionar muitas amostras de 49 elementos da
produção de folhas e construíssemos um intervalo de 95% de
confiança para cada amostra, 95% desses intervalos conteriam a
média populacional .
38,6004,60  
Exercícios
Uma máquina automática de suco industrial é regulada de modo que a quantidade
suprida de cada vez, tenha distribuição aproximadamente normal com desvio-
padrão de 35ml. Determine um intervalo de 96% de confiança para a quantidade
média de toda produção, sabendo que uma amostra de 30 embalagens teve um
conteúdo médio de 290 ml.
mls
mlX
35
290
=
=
n = 30
n
sZe .
2
=
10,13
30
35.05,2 ==e
Grau de confiança de 96% 
implica em:
1 -  = 96%
 = 4% = 0,04
05,202,0
2
== ZZ
exex  
10,1329010,13290  
[276,90 ; 303,10] ml
Dados:
-Z/2 Z/2
1 - α
0
/2 /2
10,30390,276  
Cálculo do Tamanho da Amostra
• O conceito de nível de confiança pode ser utilizado para o cálculo do
tamanho da amostra, necessário para fazermos inferências confiáveis.
• Se a amostra empregada for muito pequena, a margem de erro será
grande, o que impossibilita ou inviabiliza a tomada de decisão.
• Por outro lado, se a amostra for muito grande, o intervalo obtido
pode ser mais estreito do que o necessário (gastos desnecessários);
Como o tamanho da amostra afeta o erro de amostragem?
2
2/ . 




=
e
sZn n
sZe .
2
=
Cálculo do Tamanho da Amostra500 1000 1500 2000 2500 3000
Tamanho da amostra
M
ar
ge
m
 d
e 
er
ro
 (E
)
0,5
1,0
1,5
3,0
2,0
2,5
Tamanho de amostra e margens de erro
mantendo fixos (s=10 e 95% de confiança)
• Os ganhos em precisão conseguidos com aumentos fixos dos tamanhos das
amostras não são constantes;
• Tamanho de amostra 5.000 podem ser um perda de tempo e dinheiro porque
elas fornecem pouca precisão adicional;
Exercícios
Em um estudo para a determinação do perfil dos alunos da Faculdade
Pitágoras, a característica de maior interesse tem s = 0,3. Qual deve ser o
tamanho da amostra para que tenhamos 95% de confiança em que o erro
da estimativa da  correspondente a esta característica não supere 0,05?
2
2/ . 




=
e
sZn 
139
05,0
)3,0).(96,1(. 222/ =





=




=
e
sZn 
Dados:
e = 0,05
s = 0,3
 =0,05
Refaça o cálculo supondo que se deseja ter 98% de 
confiança.
Conclusões
• Intervalos de confiança são muito mais informativos do que
as estimativas pontuais;
• Toda estimativa intervalar está associada a um grau de
confiança;
• Quando se tem n < 30 ou não se conhece o desvio-padrão
da população usamos a distribuição t.
Referência Bibliográfica
Triola – Introdução a Estatística, p.144-158;
Stevenson - Estatística aplicada à Administração
Slack – Estatística para Administração; p. 262-277.
Soares et al.; - Introdução a Estatística; p.132 –155
Cálculo de Amostra para 
Populações Finitas
Quando a população pesquisada não supera 100.000 elementos, a 
fórmula para o cálculo do tamanho da amostra é a seguinte:
e2 (N-1) + 2 p.q
2. p . q . N
n =
onde:
n =Tamanho da amostra.
2 = Nível de confiança escolhido, expresso em número de
desvios-padrão.
p = Percentagem com a qual o fenômeno se verifica.
q = Percentagem complementar (100-p).
N = Tamanho da população.
e2 = Erro máximo permitido.
Cálculo de Amostra para 
Populações Finitas
Exemplo: Uma pesquisa que tenha por objetivo verificar quantos dos 10.000
empregados de uma fábrica são sindicalizados. Presume-se que esse número
não seja superior a 30% do total, deseja-se um nível de confiança de 95,44%
(dois desvios) e tolera-se um erro de até 3%.
e2 (N-1) + 2 p.q
2. p . q . N
n = NC=95,44 DP=2
853
98.391
84.000.000 
4.30.70 9.(9.999)
.0004.30.70.10n ==

=
Cálculo de Amostra para 
Populações Infinitas
A fórmula básica para o cálculo do tamanho de amostras para populações
infinitas passa a ser a seguinte:
onde:
n = Tamanho da amostra
 = Nível de confiança escolhido, expresso em número de desvios- padrão
p = Percentagem com a qual o fenômeno se verifica
q = Percentagem complementar (100 - p)
e2 = Erro máximo permitido
e2
2. p. q
n =
Cálculo de Amostra para 
Populações Infinitas
Exemplo: Verificar o número de protestantes residentes em determinada cidade
com uma população superior a 100.000 habitantes. A percentagem com que o
fenômeno se verifica é de 10%. O nível de confiança bastante alto (superior a
99,74%), aplica-se à fórmula 3 desvios e o erro máximo tolerado de 2%.
e2
2. p. q
n = NC=99,74 DP=3
2.025
4
8.100 
4
9.10.90n ===
calculoamostra.xls