Microsoft_PowerPoint_-_aula2inferencia_[Modo_de_Compatibilidade]
12 pág.

Microsoft_PowerPoint_-_aula2inferencia_[Modo_de_Compatibilidade]

Disciplina:Estatística Aplicada7.429 materiais64.132 seguidores
Pré-visualização4 páginas
1
Inferência EstatísticaInferência Estatística

20122012

2

Problemas de inferência

Inferir significa fazer afirmações sobre algo
desconhecido.

A inferência estatística tem como objetivo fazer
afirmações sobre uma característica de uma
população a partir do conhecimento de dados de
uma parte desta população (isto é, uma amostra de
n observações).
A população é representada por uma distribuição
de probabilidade com parâmetro(s) cujo(s) valor(es)
é (são) desconhecido(s).
Fazemos inferências sobre o(s) parâmetro(s).

3

Problemas de inferência

Se θ é o parâmetro da distribuição de uma v. a. X e
X1,...,Xn é uma amostra desta distribuição, temos três
problemas típicos:

1. Estimação pontual
Apresentar um valor para θ, que é uma função
da amostra X1,...,Xn (“cálculo” de θ), chamada de
estimador de θ.

Espera-se que o estimador tenha boas
propriedades: (i) em média esteja próximo de θ, (ii)
o estimador se aproxima de θ quando n aumenta.

4

Propriedades dos estimadores

Não –viciado

Um estimador =H(X1,...,Xn) é um estimador não viciado de θ se:θˆ

( ) Θ∈∀= θθθ ;ˆE

Exemplo 1: Se X1,..., Xn é uma amostra aleatória de tamanho n de
X~N(µ;4). Mostrar que a média amostral é um estimador não-viciado
de µ.
Consistência

Um estimador =H(X1,...,Xn) é um estimador consistente de θ se,
para todo ε >0.

nθˆ

( ) 0|ˆ|lim =>−
∞→

εθθP
n

5

( )
( ) 0ˆlim)(

ˆlim)(
=

=

∞→

∞→

n
n

n
n

Varii

Ei

θ

θθ

É equivalente

Exemplo 2: Considere o exemplo 1, mostre que a média amostral é um
estimador consistente de µ.

Eficiência

Dois estimadores 1ˆθ e 2ˆθ , não viciados de θ. Dizemos
que 1ˆθ é mais eficiente que 2ˆθ se:

)ˆ()ˆ( 21 θθ VarVar <

6

Exemplo 3: Considere o exemplo 1. Sejam X=1ˆθ

12
ˆ X=θ , dois estimadores não viciados de
Demonstrar que 1ˆθ é mais eficiente que 2ˆθ .

4)ˆ(

4)ˆ(

2

1

=

=

θ

θ

Var
n

Var

1),ˆ()ˆ( 21 >∀< nVarVar θθ

2
7

Problemas de inferência

2. Estimação intervalar
Apresentar um intervalo de possíveis valores para θ,
chamado de intervalo de confiança. Os limites do
intervalo são funções da amostra X1,...,Xn (são
aleatórios).

A probabilidade de que o intervalo contenha θ deve
ser alta.

A amplitude do intervalo deve ser tão pequena
quanto possível (intervalo mais preciso).

8

Definição[Intervalo de Confiança] Seja X1,...,Xn uma amostra
aleatória de uma população com a característica X~f(x,θ). Seja
T1=L(X1,...,Xn) e T2=U(X1,...,Xn) duas estatísticas tais que T1< T2 e que

.1)( 21 αθ −=<< TTP
O intervalo (T1, T2) é chamado de intervalo de 100(1-α)% de
confiança para θ.
Notação: IC(θ,1-α)= (T1, T2), onde T1 e T2 são os limite inferior
superior respectivamente e 1-α é o coeficiente (ou nível) de
confiança

9

2. Intervalo de confiança para uma média populacional

Suponha que nXX L,1 é uma amostra aleatória de tamanho n, de uma
população normal com média µ (desconhecida) e variância σ2

(conhecida). Vimos que a média amostral X , tem distribuição normal
com média µ e variância σ2/n. Isto é

)1,0(~ N

n

XZ
σ

µ−
=

Logo, fixando um nível de confiança (1-αααα), pode-se determinar
zαααα/2 de tal forma:.

ααα −=≤≤− 1)(
22

zZzP

Ou que é equivalente

α
σ

µ
αα −=≤

−≤− 1)
/

(
22

z
n

X
zP

10

876876 EE

n
zX

n
zXz

n

X
z

σµσ
σ

µ
αααα

2222 /
+≤≤−⇔≤−≤−

( )EXEX
n

zX
n

zXIC +−=








×+×−=− ;;)1,(

22

σσ
αµ αα

Logo,O intervalo de 100 (1-αααα)% de confiança para µµµµ é dado por:.

α
σµσ αα −=









×+≤≤×− 1

22 n
zX

n
zXP

11

Exemplo 1: Em uma industria de cerveja, a quantidade de cerveja
inserida em latas tem-se comportado como uma distribuição
normal com média 350 ml e desvio padrão 3 ml. Após alguns
problemas na linha de produção, suspeita-se que houve alteração
na média. Uma amostra de 20 latas acusou uma média 346 ml.
Obtenha um intervalo de 95% para a quantidade média µ de
cerveja inserida em latas, supondo que não tenha ocorrido
alteração na variabilidade.

Seja X: quantidade de cerveja inserida em latas após alguns problemas

)9,(~)9,(~
n

NXNX µµ ⇒

.95,0-1346;,20 === αxn

Do problema temos:

12

Já que 1-α=0,95, temos da tabela normal padrão z0,025.=1,96.









×+×−=

n
X

n
XIC σσµ 96,1;96,1)95,0,(

( )
( )31,347;69,344

31,1346;31,1346
20
396,1346;

20
396,1346)95,0,(

=

+−=







×+×−=µIC

3
13

3. Intervalo de confiança para uma média populacional
para amostras grandes

Suponha que nXX L,1 é uma amostra aleatória de tamanho n, de uma
população com média µ (desconhecida) e variância σ2 (conhecida).
Vimos que a média amostral X , tem distribuição aproximadamente
normal com média µ e variância σ2/n, quando n é suficientemente
grande. Isto é

.),1,0(~
/ .

∞→
−

= nN
n

XZ
aproxσ

µ

Um intervalo de 100 (1-αααα)% de confiança para µµµµ é dado por:.











×+×−=−

n
zX

n
zXIC σσαµ αα

22

;)1,(

14

Exemplo 3: A associação dos proprietários de indústrias
metalúrgicas está muito preocupado com o tempo perdido com
acidentes de trabalho, cuja média, nos últimos tempos, tem
sido de ordem de 60 horas/homem por ano e desvio padrão de
20 horas/homem. Testou-se um programa de prevenção de
acidentes, após o qual foi tomada uma amostra de 30
industrias e medido o número de horas/homem perdidas por
acidente, que foi de 50 horas em média. Obtenha um intervalo
de 95% de confiança para o tempo médio perdido em acidentes
de trabalho após o novo programa de prevenção, supondo que
não houve mudança na variabilidade.

Do problema temos:

.95,0-1;20;05;30 ==== ασxn

Seja X: tempo perdido em acidentes de trabalho após o novo programa
de prevenção

15

Um intervalo de 95% de confiança para µµµµ é dado por:.









×+×−=

n
zX

n
zXIC σσµ αα

22

;)95,0,(

Já que 1-α=0,95, temos da tabela normal padrão z0,025.=1,96.









×+×−=

n
X

n
XIC σσµ 96,1;96,1)95,0,(

( )
( )27,53;46,73

27,350;3,2750
36

1096,150;
36

1096,150)95,0,(

=

+−=







×+×−=µIC

16

4. Intervalo de confiança para uma média populacional quando σσσσ é
desconhecido

A distribuição t-Student

Supondo que a característica de interesse da população é
normal, a variável aleatória

)1(
n

S
XT µ−=

tem distribuição de probabilidade conhecida com distribuição t
de Student com n-1 graus de liberdade.

( )
1

;
1

2

1

1 −

−

==

∑
∑ =

=
n

XX
SX

n
XOnde

n

i
in

i
i

17

Notação; T~t(k), indica que v.a tem distribuição t-Student com k
graus de liberdade.

Propriedades: se T~t(k)

)1,0(~)(
2,

2
)(;0)()(

NTkii

k
k

kTVarTEi

⇒∞→

>
−

==

Uso Da Tabela Distribuição t-Student

αα =≥ )( , ktTP

18

Considerando a variável dada em (1), pode-se mostrar que um
intervalo de 100(1-αααα)% de confiança para µµµµ é dado por:

( )EXEX
n

S
tX

n

S
tXIC

E

n

E

n +−=

















×+×−=−
−−

;;)1,( 1,2/1,2/
4342143421

αααµ

Exemplo 4: Um administrador de uma cadeia de supermercados
deseja estimar as vendas médias semanais (µ) da cadeia de
supermercado, para isto selecionou uma amostra aleatória de 10
supermercados entre todos que formam a cadeia, que produziu
os seguintes resultados, em milhares de dólares:

36,4 35,7 37,2 36,5 34,9 35,2 36,3 35,8 36,6 36,9

Construir um intervalo de confiança para µ, com nível de confiança
de 95%, assumindo que as vendas tem distribuição normal

4
19

( )
2325,0;7352,0

1
;5,36

10
1

210

1
10

1
==

−

∑ −
==∑= =

= n

S
n

XX
SXX i

i

i
i

Já que, n=10 (1-αααα)=0,95,→→→→ αααα=0,05, temos: t0,025, 9=2,262

53,0)2325,0)(262,2( ==E

( ) ( )03,37;97,3553,05,36;53,05,36)95,0,( =+−==µIC

( )EXEXIC +−== ;)95,0,(µ

( )EXEX
n

S
tX

n

S
tXIC

E

n

E

n +−=

















×+×−=
−−

;;)95,0,( 1,2/1,2/
4342143421

ααµ

20

Foram coletados dados de viscosidade de um líquido produzido em
batelada. Resultados de 40 amostras encontram-se abaixo.
Apresente um IC de 95% para a viscosidade média.

Exemplo (p. 28 em Montgomery et al., 2004)

Dados: 13,3 14,5 15,3 15,3 14,3 14,8 15,2 14,5 14,6 14,1
14,3 16,1 13,1 15,5 12,6 14,6 14,3 15,4 15,2 16,8 14,9 13,7
15,2 14,5 15,3 15,6 15,8 13,3 14,1 15,4 15,2 15,2 15,9 16,5
14,8