Microsoft_PowerPoint_-_aula2inferencia_[Modo_de_Compatibilidade]
12 pág.

Microsoft_PowerPoint_-_aula2inferencia_[Modo_de_Compatibilidade]


DisciplinaEstatística Aplicada10.135 materiais86.007 seguidores
Pré-visualização4 páginas
1
Inferência EstatísticaInferência Estatística
20122012
2
Problemas de inferência
Inferir significa fazer afirmações sobre algo 
desconhecido.
A inferência estatística tem como objetivo fazer 
afirmações sobre uma característica de uma 
população a partir do conhecimento de dados de 
uma parte desta população (isto é, uma amostra de 
n observações).
A população é representada por uma distribuição 
de probabilidade com parâmetro(s) cujo(s) valor(es) 
é (são) desconhecido(s).
Fazemos inferências sobre o(s) parâmetro(s).
3
Problemas de inferência
Se \u3b8 é o parâmetro da distribuição de uma v. a. X e 
X1,...,Xn é uma amostra desta distribuição, temos três 
problemas típicos:
1. Estimação pontual
Apresentar um valor para \u3b8, que é uma função 
da amostra X1,...,Xn (\u201ccálculo\u201d de \u3b8), chamada de 
estimador de \u3b8.
Espera-se que o estimador tenha boas 
propriedades: (i) em média esteja próximo de \u3b8, (ii) 
o estimador se aproxima de \u3b8 quando n aumenta.
4
Propriedades dos estimadores
Não \u2013viciado
Um estimador =H(X1,...,Xn) é um estimador não viciado de \u3b8 se:\u3b8\u2c6
( ) \u398\u2208\u2200= \u3b8\u3b8\u3b8 ;\u2c6E
Exemplo 1: Se X1,..., Xn é uma amostra aleatória de tamanho n de
X~N(µ;4). Mostrar que a média amostral é um estimador não-viciado
de µ.
Consistência
Um estimador =H(X1,...,Xn) é um estimador consistente de \u3b8 se,
para todo \u3b5 >0.
n\u3b8\u2c6
( ) 0|\u2c6|lim =>\u2212
\u221e\u2192
\u3b5\u3b8\u3b8P
n
5
( )
( ) 0\u2c6lim)(
\u2c6lim)(
=
=
\u221e\u2192
\u221e\u2192
n
n
n
n
Varii
Ei
\u3b8
\u3b8\u3b8
É equivalente
Exemplo 2: Considere o exemplo 1, mostre que a média amostral é um
estimador consistente de µ.
Eficiência 
Dois estimadores 1\u2c6\u3b8 e 2\u2c6\u3b8 , não viciados de \u3b8. Dizemos 
que 1\u2c6\u3b8 é mais eficiente que 2\u2c6\u3b8 se: 
 
)\u2c6()\u2c6( 21 \u3b8\u3b8 VarVar <
6
Exemplo 3: Considere o exemplo 1. Sejam X=1\u2c6\u3b8
12
\u2c6 X=\u3b8 , dois estimadores não viciados de
Demonstrar que 1\u2c6\u3b8 é mais eficiente que 2\u2c6\u3b8 . 
 
 
4)\u2c6(
4)\u2c6(
2
1
=
=
\u3b8
\u3b8
Var
n
Var
1),\u2c6()\u2c6( 21 >\u2200< nVarVar \u3b8\u3b8
2
7
Problemas de inferência
2. Estimação intervalar
Apresentar um intervalo de possíveis valores para \u3b8, 
chamado de intervalo de confiança. Os limites do 
intervalo são funções da amostra X1,...,Xn (são 
aleatórios).
A probabilidade de que o intervalo contenha \u3b8 deve 
ser alta.
A amplitude do intervalo deve ser tão pequena
quanto possível (intervalo mais preciso).
8
Definição[Intervalo de Confiança] Seja X1,...,Xn uma amostra 
aleatória de uma população com a característica X~f(x,\u3b8). Seja 
T1=L(X1,...,Xn) e T2=U(X1,...,Xn) duas estatísticas tais que T1< T2 e que 
.1)( 21 \u3b1\u3b8 \u2212=<< TTP 
O intervalo (T1, T2) é chamado de intervalo de 100(1-\u3b1)% de 
confiança para \u3b8. 
 
Notação: IC(\u3b8,1-\u3b1)= (T1, T2), onde T1 e T2 são os limite inferior 
superior respectivamente e 1-\u3b1 é o coeficiente (ou nível) de 
confiança 
9
2. Intervalo de confiança para uma média populacional
Suponha que nXX L,1 é uma amostra aleatória de tamanho n, de uma 
população normal com média µ (desconhecida) e variância \u3c32
(conhecida). Vimos que a média amostral X , tem distribuição normal 
com média µ e variância \u3c32/n. Isto é 
 
)1,0(~ N
n
XZ
\u3c3
µ\u2212
=
Logo, fixando um nível de confiança (1-\u3b1\u3b1\u3b1\u3b1), pode-se determinar
z\u3b1\u3b1\u3b1\u3b1/2 de tal forma:.
\u3b1\u3b1\u3b1 \u2212=\u2264\u2264\u2212 1)(
22
zZzP
Ou que é equivalente
\u3b1
\u3c3
µ
\u3b1\u3b1 \u2212=\u2264
\u2212\u2264\u2212 1)
/
(
22
z
n
X
zP
10
876876 EE
n
zX
n
zXz
n
X
z
\u3c3µ\u3c3
\u3c3
µ
\u3b1\u3b1\u3b1\u3b1
2222 /
+\u2264\u2264\u2212\u21d4\u2264\u2212\u2264\u2212
( )EXEX
n
zX
n
zXIC +\u2212=\uf8f7\uf8f7
\uf8f8
\uf8f6
\uf8ec
\uf8ec
\uf8ed
\uf8eb
×+×\u2212=\u2212 ;;)1,(
22
\u3c3\u3c3
\u3b1µ \u3b1\u3b1
Logo,O intervalo de 100 (1-\u3b1\u3b1\u3b1\u3b1)% de confiança para µµµµ é dado por:.
\u3b1
\u3c3µ\u3c3 \u3b1\u3b1 \u2212=\uf8f7\uf8f7
\uf8f8
\uf8f6
\uf8ec
\uf8ec
\uf8ed
\uf8eb
×+\u2264\u2264×\u2212 1
22 n
zX
n
zXP
11
Exemplo 1: Em uma industria de cerveja, a quantidade de cerveja
inserida em latas tem-se comportado como uma distribuição
normal com média 350 ml e desvio padrão 3 ml. Após alguns
problemas na linha de produção, suspeita-se que houve alteração
na média. Uma amostra de 20 latas acusou uma média 346 ml.
Obtenha um intervalo de 95% para a quantidade média µ de
cerveja inserida em latas, supondo que não tenha ocorrido
alteração na variabilidade.
Seja X: quantidade de cerveja inserida em latas após alguns problemas
)9,(~)9,(~
n
NXNX µµ \u21d2
.95,0-1346;,20 === \u3b1xn
Do problema temos:
12
Já que 1-\u3b1=0,95, temos da tabela normal padrão z0,025.=1,96.
\uf8f7\uf8f7
\uf8f8
\uf8f6
\uf8ec\uf8ec
\uf8ed
\uf8eb
×+×\u2212=
n
X
n
XIC \u3c3\u3c3µ 96,1;96,1)95,0,(
( )
( )31,347;69,344
31,1346;31,1346
20
396,1346;
20
396,1346)95,0,(
=
+\u2212=\uf8f7\uf8f7
\uf8f8
\uf8f6
\uf8ec\uf8ec
\uf8ed
\uf8eb
×+×\u2212=µIC
3
13
3. Intervalo de confiança para uma média populacional
para amostras grandes
Suponha que nXX L,1 é uma amostra aleatória de tamanho n, de uma 
população com média µ (desconhecida) e variância \u3c32 (conhecida). 
Vimos que a média amostral X , tem distribuição aproximadamente 
normal com média µ e variância \u3c32/n, quando n é suficientemente 
grande. Isto é 
 
.),1,0(~
/ .
\u221e\u2192
\u2212
= nN
n
XZ
aprox\u3c3
µ
Um intervalo de 100 (1-\u3b1\u3b1\u3b1\u3b1)% de confiança para µµµµ é dado por:.
\uf8f7
\uf8f7
\uf8f8
\uf8f6
\uf8ec
\uf8ec
\uf8ed
\uf8eb
×+×\u2212=\u2212
n
zX
n
zXIC \u3c3\u3c3\u3b1µ \u3b1\u3b1
22
;)1,(
14
Exemplo 3: A associação dos proprietários de indústrias
metalúrgicas está muito preocupado com o tempo perdido com
acidentes de trabalho, cuja média, nos últimos tempos, tem
sido de ordem de 60 horas/homem por ano e desvio padrão de
20 horas/homem. Testou-se um programa de prevenção de
acidentes, após o qual foi tomada uma amostra de 30
industrias e medido o número de horas/homem perdidas por
acidente, que foi de 50 horas em média. Obtenha um intervalo
de 95% de confiança para o tempo médio perdido em acidentes
de trabalho após o novo programa de prevenção, supondo que
não houve mudança na variabilidade.
Do problema temos:
.95,0-1;20;05;30 ==== \u3b1\u3c3xn
Seja X: tempo perdido em acidentes de trabalho após o novo programa
de prevenção
15
Um intervalo de 95% de confiança para µµµµ é dado por:.
\uf8f7\uf8f7
\uf8f8
\uf8f6
\uf8ec\uf8ec
\uf8ed
\uf8eb
×+×\u2212=
n
zX
n
zXIC \u3c3\u3c3µ \u3b1\u3b1
22
;)95,0,(
Já que 1-\u3b1=0,95, temos da tabela normal padrão z0,025.=1,96.
\uf8f7\uf8f7
\uf8f8
\uf8f6
\uf8ec\uf8ec
\uf8ed
\uf8eb
×+×\u2212=
n
X
n
XIC \u3c3\u3c3µ 96,1;96,1)95,0,(
( )
( )27,53;46,73
27,350;3,2750
36
1096,150;
36
1096,150)95,0,(
=
+\u2212=\uf8f7
\uf8f8
\uf8f6
\uf8ec
\uf8ed
\uf8eb
×+×\u2212=µIC
16
4. Intervalo de confiança para uma média populacional quando \u3c3\u3c3\u3c3\u3c3 é 
desconhecido
A distribuição t-Student
Supondo que a característica de interesse da população é
normal, a variável aleatória
)1(
n
S
XT µ\u2212=
tem distribuição de probabilidade conhecida com distribuição t
de Student com n-1 graus de liberdade.
( )
1
;
1
2
1
1 \u2212
\u2212
==
\u2211
\u2211 =
=
n
XX
SX
n
XOnde
n
i
in
i
i
17
Notação; T~t(k), indica que v.a tem distribuição t-Student com k
graus de liberdade.
Propriedades: se T~t(k)
)1,0(~)(
2,
2
)(;0)()(
NTkii
k
k
kTVarTEi
\u21d2\u221e\u2192
>
\u2212
==
Uso Da Tabela Distribuição t-Student
\u3b1\u3b1 =\u2265 )( , ktTP
18
Considerando a variável dada em (1), pode-se mostrar que um
intervalo de 100(1-\u3b1\u3b1\u3b1\u3b1)% de confiança para µµµµ é dado por:
( )EXEX
n
S
tX
n
S
tXIC
E
n
E
n +\u2212=
\uf8f7\uf8f7
\uf8f7
\uf8f7
\uf8f8
\uf8f6
\uf8ec\uf8ec
\uf8ec
\uf8ec
\uf8ed
\uf8eb
×+×\u2212=\u2212
\u2212\u2212
;;)1,( 1,2/1,2/
4342143421
\u3b1\u3b1\u3b1µ
Exemplo 4: Um administrador de uma cadeia de supermercados
deseja estimar as vendas médias semanais (µ) da cadeia de
supermercado, para isto selecionou uma amostra aleatória de 10
supermercados entre todos que formam a cadeia, que produziu
os seguintes resultados, em milhares de dólares:
36,4 35,7 37,2 36,5 34,9 35,2 36,3 35,8 36,6 36,9 
Construir um intervalo de confiança para µ, com nível de confiança
de 95%, assumindo que as vendas tem distribuição normal
4
19
( )
2325,0;7352,0
1
;5,36
10
1
210
1
10
1
==
\u2212
\u2211 \u2212
==\u2211= =
= n
S
n
XX
SXX i
i
i
i
Já que, n=10 (1-\u3b1\u3b1\u3b1\u3b1)=0,95,\u2192\u2192\u2192\u2192 \u3b1\u3b1\u3b1\u3b1=0,05, temos: t0,025, 9=2,262
53,0)2325,0)(262,2( ==E
( ) ( )03,37;97,3553,05,36;53,05,36)95,0,( =+\u2212==µIC
( )EXEXIC +\u2212== ;)95,0,(µ
( )EXEX
n
S
tX
n
S
tXIC
E
n
E
n +\u2212=
\uf8f7\uf8f7
\uf8f7
\uf8f7
\uf8f8
\uf8f6
\uf8ec\uf8ec
\uf8ec
\uf8ec
\uf8ed
\uf8eb
×+×\u2212=
\u2212\u2212
;;)95,0,( 1,2/1,2/
4342143421
\u3b1\u3b1µ
20
Foram coletados dados de viscosidade de um líquido produzido em
batelada. Resultados de 40 amostras encontram-se abaixo.
Apresente um IC de 95% para a viscosidade média.
Exemplo (p. 28 em Montgomery et al., 2004)
Dados: 13,3 14,5 15,3 15,3 14,3 14,8 15,2 14,5 14,6 14,1 
14,3 16,1 13,1 15,5 12,6 14,6 14,3 15,4 15,2 16,8 14,9 13,7 
15,2 14,5 15,3 15,6 15,8 13,3 14,1 15,4 15,2 15,2 15,9 16,5 
14,8