Inferência
10 pág.

Inferência


DisciplinaBioestatística I4.715 materiais35.069 seguidores
Pré-visualização2 páginas
Curso de Estatística \u2013 Professora Aurélia 1
Curso de Estatística - 2011
Professora Aurélia
ESTIMAÇÃO: Estimação pontual e estimação intervalar
A estimação de uma parâmetro populacional comporta dois tipos: estimação pontual e estimação 
intervalar. 
1. Estimação pontual
Quando estamos interessados em determinado parâmetro de uma população, lançamos mão de 
uma amostra extraída dessa população, estudamos seus elementos e procuramos, através dessa 
amostra, estimar o parâmetro populacional.
Ex: proporção de eleitores que pretendem votar no candidato A (n = 100 amostras). 
 média de idades dos moradores de uma cidades ( n = 200 amostras)
\uf0b7 A estimação pontual procura fixar um valor numérico único que esteja satisfatoriamente 
próximo do verdadeiro valor do parâmetro. Ex. : p = 0,1
Parâmetro populacional Estimador pontual
Média \uf06d
n
X
X
n
i
i\uf0e5
\uf03d\uf0ba 1
Variância 2\uf073 2
2 1
( )
1
n
i
i
X X
s
n
\uf03d
\uf02d
\uf03d
\uf02d
\uf0e5
Proporção p
p\u2c6 = 
n
X
Generalizando \uf071 \uf071\u2c6
1.1. Propriedades dos estimadores
1. Não-tendenciosidade
2. Consistência
3. Eficiência
1. Não-tendenciosidade
Seja \uf071\u2c6 um estimador de \uf071 .
Se E(\uf071\u2c6 ) = \uf071 , então \uf071\u2c6 é um estimador não tendencioso para \uf071 .
Ex. E ( X ) = \uf06d
2. Consistência
Um estimador \uf071\u2c6 um estimador consistente para o parâmetro \uf071 se
i) \uf071\uf071 \uf03d
\uf0a5\uf0ae
)\u2c6(limE
n
 ii) 0)\u2c6(lim \uf03d
\uf0a5\uf0ae
\uf071Var
n
Ex: E ( X ) = \uf06d , para todo n Seja
n
XVar
2
)(
\uf073\uf03d , Então 0)(
2
limlim \uf03d\uf03d
\uf0a5\uf0ae\uf0a5\uf0ae n
XVar
nn
\uf073
Curso de Estatística \u2013 Professora Aurélia 2
3. Eficiência
Se 1\uf071 e 2\uf071 são dois estimadores não tendenciosos de \uf071 , então 1\uf071 é mais eficiente do que 2\uf071 se 
Var( 1\uf071 ) < Var( 2\uf071 ).
Exemplo 1:. Sejam 321 ,, xxx uma amostra aleatória da variável X com E(X) = \uf071 e Var (X) = 1. 
Considere dois estimadores 1\u2c6\uf071 ( média aritmética) e 2\uf071\u2c6 (média ponderada) tal que
3
\u2c6 321
1
xxx
X
\uf02b\uf02b\uf03d\uf03d\uf071 e 2\uf071\u2c6 321 4
1
4
1
2
1
xxxX p \uf02b\uf02b\uf03d\uf03d . Verifique que a média aritmética ( 1\u2c6\uf071 ) é 
mais eficiente do que a média ponderada ( 2\uf071\u2c6 ).
1.2.Distribuição amostral da média
a) amostragem com reposição
Exemplo: Seja X uma v.a. cujos valores são obtidos da população com N = 3 elementos
X: notas em estatística, ou seja, X={8, 9, 10}. Então: \uf06d = e 2\uf073 = 
Para a extração de dois elementos dessa população, teremos N n =32 = 9 possibilidades.
Amostra Valores Média ( X )
1 8 e 8 8
2 8 e 9 8,5
3 8 e 10 9
4 9 e 8 8,5
5 9 e 9 9
6 9 e 10 9,5
7 10 e 8 9
8 10 e 9 9,5
9 10 e 10 10
Logo: Média de X : \uf028 \uf029XE = 9 =
 Variância de X : \uf028 \uf029XVar = 1/3 =
Generalização: Seja X uma população de média \uf06d e variância 2\uf073 . Seja (x1, x2, ..., xn) uma amostra 
aleatória de n elementos de X e 
n
x
x i\uf0e5\uf0ba . Então: \uf028 \uf029XE = \uf06d e 
n
XVar
2
)(
\uf073\uf03d
A distribuição amostral de X será: 
x 8 8,5 9 9,5 10
P( X = x ) 1/9
Curso de Estatística \u2013 Professora Aurélia 3
0
1/9
2/9
1/3
4/9
8,0 8,5 9,0 9,5 10,0
IMPORTANTE: quando N for suficientemente grande, assume-se que a distribuição de X será aproximadamente 
Normal, qualquer que seja a verdadeira distribuição de X.
Portanto: X ~ N (\uf06d , 2\uf073 /n).
b) amostragem sem reposição
Exemplo: Seja X uma v.a. cujos valores são obtidos da população X={8, 9, 10}. 
Para a extração de dois elementos dessa população, teremos AN,n=
)!(
!
nN
N
\uf02d
= = 6 possibilidades
Amostra Valores Média ( X )
1 8 e 9 8,5
2 8 e 10 9
3 9 e 8 8,5
4 9 e 10 9,5
5 10 e 8 9
6 10 e 9 9,5
Logo: Média de X : \uf028 \uf029XE = 9 
 Variância de X : \uf028 \uf029XVar = 1/6
\uf028 \uf029XE = \uf06d e \uf0f7
\uf0f8
\uf0f6\uf0e7
\uf0e8
\uf0e6
\uf02d
\uf02d\uf03d
1
)(
2
N
nN
n
XVar
\uf073 . 
Portanto: X ~ N (\uf06d , \uf0f7
\uf0f8
\uf0f6\uf0e7
\uf0e8
\uf0e6
\uf02d
\uf02d
1
2
N
nN
n
\uf073 ).
Se for muito grande (n/N \u2264 0,05) , 1
1
\uf0ae\uf0f7
\uf0f8
\uf0f6\uf0e7
\uf0e8
\uf0e6
\uf02d
\uf02d
N
nN
.
Curso de Estatística \u2013 Professora Aurélia 4
1.3.O Teorema Central do Limite (TCL)
Se nxx ,...,1 for uma amostra aleatória de tamanho n, retirada de uma população com média \uf06d e 
variância 2\uf073 , e se X for a média da amostra, então: 
n
X
/\uf073
\uf06d\uf02d
~ N (0, 1)
quando \uf0a5\uf0aen . 
N (0, 1) é distribuição Normal padrão.
Este resultado é muito útil em estimação intervalar.
EXERCÍCIOS:
1) Suponha que a média de uma população muito grande seja \uf03d\uf06d 50 e desvio padrão 12\uf03d\uf073 .
a) Determine a média e a variância da distribuição amostra da média para amostras de tamanho 
n = 36.
b) Determine o erro padrão dessa distribuição amostral.
2) Um auditor toma uma amostra aleatória de tamanho n = 16 de um conjunto de N = 100 contas a 
receber. Sabe-se que o desvio padrão populacional é 57. Determine o erro padrão da distribuição 
amostral da média.
3) Uma população muito grande tem média 20 e desvio padrão 1,4. Extrai-se uma amostra de 49 
observações.
a) Qual é a média da distribuição amostral?
b) Qual é o desvio padrão (ou erro padrão) da distribuição amostral?
c) Qual é a porcentagem de possíveis médias amostrais que se encontram entre 19,8 e 20,2?
2. Estimação intervalar
A estimação intervalar procura determinar intervalos com limites aleatórios, que abranjam o 
valor do parâmetro populacional, com uma margem de segurança prefixada. Ex. 0,08 \u2264 p \u2264 0,12
2.1. Estimação intervalar ( ou Intervalos de confiança) para população normal
Eis uma outra maneira de calcularmos uma estimativa de um parâmetro desconhecido. Vamos 
construir um intervalo de confiança para o parâmetro desconhecido com uma probabilidade de (1 -
\uf061) \u2013 chamado de nível de confiança- de que o intervalo contenha o verdadeiro parâmetro. 
Observem que (1 - \uf061) pode ser igual a 99%, 90%, etc. 
2.2.Intervalo de confiança para a média , quando \uf073 2 conhecida
Seja nxx ,...,1 for uma amostra aleatória de tamanho n da variável aleatória X~ N ( \uf06d , 2\uf073 ). Seja 
n
X
X
n
i
i\uf0e5
\uf03d\uf0ba 1 o estimador para \uf06d .
Sabe-se que 
n
X
z
/\uf073
\uf06d\uf02d\uf03d ~ N (0, 1) (TCL).
Então, podemos construir: 
 \uf028 \uf029
22
1P z z z
\uf061\uf061 \uf061\uf02d \uf0a3 \uf0a3 \uf03d \uf02d
Curso de Estatística \u2013 Professora Aurélia 5
\uf028 \uf029
22
_________ 1P z z
\uf061\uf061 \uf061\uf02d \uf0a3 \uf0a3 \uf03d \uf02d
Desenvolvendo teremos:
2 2
1P X z X z
n n
\uf061 \uf061
\uf073 \uf073\uf06d \uf061\uf0e6 \uf0f6\uf02d \uf0a3 \uf0a3 \uf02b \uf03d \uf02d\uf0e7 \uf0f7\uf0e8 \uf0f8
Portanto,
n
zXIC
\uf073\uf06d \uf061\uf061
2
1)( \uf0b1\uf03d\uf02d
Logo, podemos dizer que \uf0fa
\uf0fb
\uf0f9
\uf0ea
\uf0eb
\uf0e9 \uf02b\uf02d\uf0ce
n
zX
n
zX
\uf073\uf073\uf06d \uf061\uf061
22
; com \uf028 \uf0291 \uf061\uf02d 100% de confiança.
CUIDADO: é ERRADO dizer que \uf0fa
\uf0fb
\uf0f9
\uf0ea
\uf0eb
\uf0e9 \uf02b\uf02d\uf0ce
n
zX
n
zX
\uf073\uf073\uf06d \uf061\uf061
22
; com probabilidade \uf028 \uf0291 \uf061\uf02d 100%.
Exemplo 3: Uma máquina enche pacotes de café com uma variância igual a 100g2. Uma amostra de 
25 pacotes apresentou uma média igual a 450 g.
a) Determine o intervalo de confiança para \uf06d . \uf061 = 0,05.
b) Determine o intervalo de confiança para \uf06d . \uf061 = 0,10.
2.3.Intervalo de confiança para a média , quando \uf073 2 desconhecida e n <30
Na prática é comum não ser conhecido o valor de \uf073 . Nesse caso, o intervalo de confiança é 
calculado utilizando-se uma outra estatística
ns
X
T
/
\uf06d\uf02d\uf03d ~ 1, \uf02dnt\uf061
onde 
s é o estimador do desvio padrão e
1, \uf02dnt\uf061 refere-se à distribuição t de Student com \uf06a = (n \u2013 1) graus de liberdade (g.l) , 
n é o tamanho da amostra.
A forma da distribuição t de Student é parecida com a da normal. È simétrica em relação a 0, 
mas apresenta caudas mais 'grossas', ou seja, maior variância do que a normal. Aumentando-se n, a 
distribuição t de Student tende para a normal. 
Veja a figura abaixo:
Curso de Estatística \u2013 Professora Aurélia 6
Então, podemos construir: 
 \uf028 \uf029
22
1P t T t
\uf061\uf061 \uf061\uf02d \uf0a3 \uf0a3 \uf03d \uf02d . Logo, \uf028 \uf029
22
_________ 1P t t
\uf061\uf061 \uf061\uf02d \uf0a3 \uf0a3 \uf03d \uf02d
Desenvolvendo teremos:
2 2
1
s s
P X t X t
n n
\uf061 \uf061\uf06d \uf061
\uf0e6 \uf0f6\uf02d \uf0a3 \uf0a3 \uf02b \uf03d \uf02d\uf0e7 \uf0f7\uf0e8 \uf0f8
.
Portanto, 
n
s
tXIC
2
1)( \uf061\uf061\uf06d \uf0b1\uf03d\uf02d e \uf06a = (n \u2013 1) g. l.
Logo, podemos dizer que 
2 2
;
s s
X t X t
n n
\uf061 \uf061\uf06d
\uf0e9 \uf0f9\uf0ce \uf02d \uf02b\uf0ea \uf0fa\uf0eb \uf0fb
com \uf028 \uf0291 \uf061\uf02d 100% de confiança.
Exemplo 4: Uma máquina enche pacotes de café com uma variância desconhecida. . Uma amostra 
de 25 pacotes apresentou uma média igual a 450 g e variância 121g2.
a) Determine o intervalo de confiança para \uf06d . \uf061 = 0,05.
b) Determine o intervalo de confiança para \uf06d . \uf061 = 0,10.
2.4. Intervalo de confiança para a média , quando \uf073 2 desconhecida e n \u226530
Quando n\uf0ae \uf0a5, a distribuição t de student se aproxima da distribuição Normal. Logo \uf0732 = s2.
\uf028 \uf029 /21IC x z n\uf061\uf061
\uf073\uf06d \uf02d
\uf0e6 \uf0f6\uf03d \uf0b1 \uf0e7 \uf0f7\uf0e8 \uf0f8
Exemplo 5: Uma amostra de 80 motoristas de determinado estado indica