cap3
13 pág.

cap3


DisciplinaInferência Bayesiana27 materiais237 seguidores
Pré-visualização4 páginas
que as interpretac¸o\u2dces dos intervalos diferem
radicalmente.
3.4.3 O Caso de duas Amostras
Nesta sec¸a\u2dco vamos assumir que X11, . . . , X1n1 e X21, . . . , X2n2 sa\u2dco amostras
aleato´rias das distribuic¸o\u2dces N(\u3b81, \u3c3
2
1) e N(\u3b82, \u3c3
2
2) respectivamente e que as
amostras sa\u2dco independentes.
Para comec¸ar vamos assumir que as varia\u2c6ncias \u3c321 e \u3c3
2
2 sa\u2dco conhecidas. Neste
caso, a func¸a\u2dco de verossimilhanc¸a e´ dada por
p(x1,x2|\u3b81, \u3b82) = p(x1|\u3b81)p(x2|\u3b82)
\u221d exp
{
\u2212 n1
2\u3c321
(\u3b81 \u2212 x1)2
}
exp
{
\u2212 n2
2\u3c322
(\u3b82 \u2212 x2)2
}
isto e´, o produto de verossimilhanc¸as relativas a \u3b81 e \u3b82. Assim, se assumirmos
que \u3b81 e \u3b82 sa\u2dco independentes a priori enta\u2dco eles tambe´m sera\u2dco independentes a
3.4. ESTIMAC¸A\u2dcO NO MODELO NORMAL 43
posteriori ja´ que
p(\u3b81, \u3b82|x1,x2) = p(x1|\u3b81)p(\u3b81)
p(x1)
× p(x2|\u3b82)p(\u3b82)
p(x2)
.
Se usarmos a classe de prioris conjugadas \u3b8i \u223c N(µi, \u3c4 2i ) enta\u2dco as posterioris
independentes sera\u2dco \u3b8i|xi \u223c N(µ\u2217i , \u3c4 \u22172i ) onde
µ\u2217i =
\u3c4\u22122i µi + ni\u3c3
\u22122
i xi
\u3c4\u22122i + ni\u3c3
\u22122
i
e \u3c4 \u2217
2
i = 1/(\u3c4
\u22122
i + ni\u3c3
\u22122
i ), i = 1, 2.
Em geral estaremos interessados em comparar as me´dias populacionais, i.e
queremos estimar \u3b2 = \u3b81 \u2212 \u3b82 (por exemplo, testar se \u3b81 = \u3b82). Neste caso, a
posteriori de \u3b2 e´ facilmente obtida, devido a` independe\u2c6ncia, como
\u3b2|x1,x2 \u223c N(µ\u22171 \u2212 µ\u22172, \u3c4 \u2217
2
1 + \u3c4
\u22172
2 )
e podemos usar µ\u22171 \u2212 µ\u22172 como estimativa pontual para a diferenc¸a e tambe´m
construir um intervalo de credibilidade MDP para esta diferenc¸a.
(µ\u22171 \u2212 µ\u22172)± z\u3b1/2
\u221a
\u3c4 \u221721 + \u3c4
\u22172
2 .
Note que se usarmos priori na\u2dco informativa, i.e. fazendo \u3c4 2i \u2192\u221e, i = 1, 2 enta\u2dco
a posteriori fica
\u3b2|x1,x2 \u223c N
(
x1 \u2212 x2, \u3c3
2
1
n1
+
\u3c322
n2
)
e o intervalo obtido coincidira´ mais uma vez com o intervalo de confianc¸a cla´ssico.
No caso de varia\u2c6ncias populacionais desconhecidas pore´m iguais, temos que
\u3c6 = \u3c3\u221221 = \u3c3
\u22122
2 = \u3c3
\u22122. A priori conjugada pode ser constru´\u131da em duas etapas.
No primeiro esta´gio, assumimos que, dado \u3c6, \u3b81 e \u3b82 sa\u2dco a priori condicionalmente
independentes, e especificamos
\u3b8i|\u3c6 \u223c N(µi, (ci\u3c6)\u22121), i = 1, 2.
e no segundo esta´gio, especificamos a priori conjugada natural para \u3c6, i.e.
\u3c6 \u223c Gama
(
n0
2
,
n0\u3c3
2
0
2
)
.
Combinando as prioris acima na\u2dco e´ dif´\u131cil verificar que a priori conjunta de
44 CAPI´TULO 3. ESTIMAC¸A\u2dcO
(\u3b81, \u3b82, \u3c6) e´
p(\u3b81, \u3b82, \u3c6) = p(\u3b81|\u3c6)p(\u3b82|\u3c6)p(\u3c6)
\u221d \u3c6n0/2 exp
{
\u2212\u3c6
2
[
n0\u3c3
2
0 + c1(\u3b81 \u2212 µ1)2 + c2(\u3b82 \u2212 µ2)2
]}
.
Ale´m disso, tambe´m na\u2dco e´ dif´\u131cil obter a priori condicional de \u3b2 = \u3b81 \u2212 \u3b82, dado
\u3c6, como
\u3b2|\u3c6 \u223c N(µ1 \u2212 µ2, \u3c6\u22121(c\u221211 + c\u221212 ))
e portanto, usando os resultados da Sec¸a\u2dco 2.3.5 segue que a distribuic¸a\u2dco a priori
marginal da diferenc¸a e´
\u3b2 \u223c tn0(µ1 \u2212 µ2, \u3c320(c\u221211 + c\u221212 )).
Podemos mais uma vez obter a posteriori conjunta em duas etapas ja´ que \u3b81 e
\u3b82 tambe´m sera\u2dco condicionalmente independentes a posteriori, dado \u3c6. Assim, no
primeiro esta´gio usando os resultados obtidos anteriormente para uma amostra
segue que
\u3b8i|\u3c6,x \u223c N(µ\u2217i , (c\u2217i\u3c6)\u22121), i = 1, 2
onde
µ\u2217i =
ciµi + nixi
ci + ni
e c\u2217i = ci + ni.
Na segunda etapa temos que combinar a verossimilhanc¸a com a priori de
(\u3b81, \u3b82, \u3c6). Definindo a varia\u2c6ncia amostral combinada
s2p =
(n1 \u2212 1)S21 + (n2 \u2212 1)S22
n1 + n2 \u2212 2
e denotando \u3bd = n1 + n2 \u2212 2, a func¸a\u2dco de verossimilhanc¸a pode ser escrita como
p(x1,x2|\u3b81, \u3b82, \u3c6) = \u3c6(n1+n2)/2 exp
{
\u2212\u3c6
2
[
\u3bds2 + n1(\u3b81 \u2212 x1)2 + n2(\u3b82 \u2212 x2)2
]}
e apo´s algum algebrismo obtemos que a posteriori e´ proporcional a
\u3c6(n0+n1+n2)/2 exp
{
\u2212\u3c6
2
[
n0\u3c3
2
0 + \u3bds
2 +
2\u2211
i=1
cini
c\u2217i
(µi \u2212 xi)2 + c\u2217i (\u3b8i \u2212 µ\u2217i )2
]}
.
Como esta posteriori tem o mesmo formato da priori segue por analogia que
\u3c6|x \u223c Gama
(
n\u22170
2
,
n\u22170\u3c3
\u22172
0
2
)
3.4. ESTIMAC¸A\u2dcO NO MODELO NORMAL 45
onde n\u22170 = n0+n1+n2 e n
\u2217
0\u3c3
\u22172
0 = n0\u3c3
2
0 + \u3bds
2+
\u22112
i=1 cini(µi\u2212xi)2/c\u2217i . Ainda por
analogia com o caso de uma amostra, a posteriori marginal da diferenc¸a e´ dada
por
\u3b2|x \u223c tn\u22170(µ\u22171 \u2212 µ\u22172, \u3c3\u2217
2
0 (c
\u2217\u22121
1 + c
\u2217\u22121
2 )).
Assim, me´dia, moda e mediana a posteriori de \u3b2 coincidem e a estimativa
pontual e´ µ\u22171\u2212µ\u22172. Tambe´m intervalos de credibilidade de MDP podem ser obtidos
usando os percentis da distribuic¸a\u2dco t de Student. Para a varia\u2c6ncia populacional
a estimativa pontual usual e´ \u3c3\u2217
2
0 e intervalos podem ser constru´\u131dos usando os
percentis da distribuic¸a\u2dco qui-quadrado ja´ que n\u22170\u3c3
\u22172
0 \u3c6 | x \u223c \u3c72n\u22170
Vejamos agora como fica a ana´lise usando priori na\u2dco informativa. Neste caso,
p(\u3b81, \u3b82, \u3c6) \u221d \u3c6\u22121 e isto equivale a um caso particular (degenerado) da priori
conjugada com ci = 0, \u3c3
2
0 = 0 e n0 = \u22122. Assim, temos que c\u2217i = ni, µ\u2217i = xi,
n\u22170 = \u3bd e n
\u2217
0\u3c3
\u22172
0 = \u3bds
2 e a estimativa pontual concide com a estimativa de ma´xima
verossimilhanc¸a \u3b2\u2c6 = x1 \u2212 x2. O intervalo de 100(1 \u2212 \u3b1)% de MDP para \u3b2 tem
limites
x1 \u2212 x2 ± t\u3b1
2
,\u3bd sp
\u221a
1
n1
+
1
n2
que coincide numericamente com o intervalo de confianc¸a cla´ssico.
O intervalo de 100(1 \u2212 \u3b1)% para \u3c32 e´ obtido de maneira ana´loga ao caso de
uma amostra usando a distribuic¸a\u2dco qui-quadrado, agora com \u3bd graus de liberdade,
i.e. (
\u3bds2p
\u3c72\u3b1
2
,\u3bd
,
\u3bds2p
\u3c72\u3b1
2
,\u3bd
)
.
3.4.4 Varia\u2c6ncias desiguais
Ate´ agora assumimos que as varia\u2c6ncias populacionais desconhecidas eram iguais
(ou pelo menos aproximadamente iguais). Na infere\u2c6ncia cla´ssica a violac¸a\u2dco desta
suposic¸a\u2dco leva a problemas teo´ricos e pra´ticos uma vez que na\u2dco e´ trivial encontrar
uma quantidade pivotal para \u3b2 com distribuic¸a\u2dco conhecida ou tabelada. Na
verdade, se existem grandes diferenc¸as de variabilidade entre as duas populac¸o\u2dces
pode ser mais apropriado analisar conjuntamente as conseque\u2c6ncias das diferenc¸as
entre as me´dias e as varia\u2c6ncias. Assim, caso o pesquisador tenha interesse no
para\u2c6metro \u3b2 deve levar em conta os problemas de ordem teo´rica introduzidos por
uma diferenc¸a substancial entre \u3c321 e \u3c3
2
2.
Do ponto de vista Bayesiano o que precisamos fazer e´ combinar informac¸a\u2dco a
priori com a verossimilhanc¸a e basear a estimac¸a\u2dco na distribuic¸a\u2dco a posteriori. A
func¸a\u2dco de verossimilhanc¸a agora pode ser fatorada como
p(x1,x2|\u3b81, \u3b82, \u3c321, \u3c322) = p(x1|\u3b81, \u3c321)p(x2|\u3b82, \u3c322)
46 CAPI´TULO 3. ESTIMAC¸A\u2dcO
e vamos adotar prioris conjugadas normal-gama independentes com para\u2c6metros
(µi, ci, \u3bdi, \u3c3
2
0i) para cada uma das amostras. Fazendo as operac¸o\u2dces usuais para
cada amostra, e usando a conjugac¸a\u2dco da normal-gama, obtemos as seguintes
distribuic¸o\u2dces a posteriori independentes
\u3b8i|x \u223c tn\u22170i(µ\u2217i , \u3c3\u2217
2
0i /c
\u2217
i ) e \u3c6i|x \u223c Gama
(
n\u22170i
2
,
n\u22170i\u3c3
\u22172
0i
2
)
, i = 1, 2.
Pode-se mostrar que \u3b2 tem uma distribuic¸a\u2dco a posteriori chamada Behrens-
Fisher, que e´ semelhante a` t de Student e e´ tabelada. Assim, intervalos de
credibilidade podem ser constru´\u131dos usando-se estes valores tabelados.
Outra situac¸a\u2dco de interesse e´ a comparac¸a\u2dco das duas varia\u2c6ncias populacionais.
Neste caso, faz mais sentido utilizar a raza\u2dco de varia\u2c6ncias ao inve´s da diferenc¸a
ja´ que elas medem a escala de uma distribuic¸a\u2dco e sa\u2dco sempre positivas. Neste
caso temos que obter a distribuic¸a\u2dco a posteriori de \u3c322/\u3c3
2
1 = \u3c61/\u3c62. Usando a
independe\u2c6ncia a posteriori de \u3c61 e \u3c62 e apo´s algum algebrismo pode-se mostrar
que
\u3c3\u2217
2
01
\u3c3\u2217202
\u3c61
\u3c62
\u223c F (n\u221701, n\u221702).
Embora sua func¸a\u2dco de distribuic¸a\u2dco na\u2dco possa ser obtida analiticamente os val-
ores esta\u2dco tabelados em muitos livros de estat´\u131stica e tambe´m podem ser obtidos
na maioria dos pacotes computacionais. Os percentis podem enta\u2dco ser utilizados
na construc¸a\u2dco de intervalos de credibilidade para a raza\u2dco de varia\u2c6ncias.
Uma propriedade bastante u´til para calcular probabilidade com a distribuic¸a\u2dco
F vem