Kaplan Meier EMV proof

•

UNB

0

vitor macedo

08/07/2021

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 4 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Análise de Sobrevivência

50 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Universidade de Braśılia
Departamento de estat́ıstica
Aluno:Vitor Macedo Rocha
Estimador KM com EMV
1 Estimador de Kaplan-Meier
Definição 1. O estimador de Kaplna-Meier para a função de sobrevivência é dado por:
Ŝ(t) =
∏
j:tj<t
(
1− dj
nj
)
(1)
Demostração
A função de verossimilhança é dado pelo produto das probabilidades de falha e de falha
após censura, expresso por
m0∏
i=1
S(t0i)·
· [S(t1 − 0)− S(t1)]d1
m1∏
i=1
S(t1i)·
· · ·
· [S(tk − 0)− S(tk)]dk
mk∏
i=1
S(tki)
Para maximizar a expressão acima, devemos fazer S(tj−0) e S(tji) o maior posśıvel e S(tj) o me-
nor posśıvel, logo fazemos S(tj) = S(tji) = ST (tj+1−0).Sabendo que a função de sobrevivência
é monótona decrescente e que tj ≤ tji ≤ tj+1, temos que fazer então S(tj) = S(tji) = S(tj+1−0)
e S(tj − 0) = S(tj−1). Seja
• pj = P (T ≥ tj|T ≥ tj−1) = S(tj)/S(tj−1) a probabilidade de que a unidade observacional
não falhe até tj dado que não falhou até o instante tj−1.
• qj = 1− pj = P (T < tj|T ≥ tj−1)
Pela definição da função de sobrevivência, temos que S(tj) =
∏j
i=1 pi, e que S(tj−1)− S(tj) =∏j−1
i=1 piqj. Podemos reescrever a verossimilhança como
=
k∏
j=1
{
[S(tj − 0)− S(tj)]dj
mj∏
i=1
S(tji)
}
=
k∏
j=1
[S(tj−1)− S(tj))]dj S(tj)mj
=
k∏
j=1

[
j−1∏
i=1
piqj
]dj [ j∏
i=1
pi
]mj
=
k∏
j=1
qdjj pmjj
[
j−1∏
i=1
pi
]dj+mj
O próximo passo é fazer uma análise mais profunda desse último produtório obtido acima.
1
• j = k
=
qdkk pmkk
[
k−1∏
i=1
pi
]dk+mk
temos que nk = dk + mk, logo podemos reescrever a expressão acima como.
=
{
qdkk p
nk−dk
k
[
k−1∏
i=1
pi
]nk}
• j = k − 1
=
qdk−1k−1 pmk−1k−1
[
k−2∏
i=1
pi
]dk−1+mk−1
=
qdk−1k−1 pmk−1k−1
[
k−2∏
i=1
pi
]dk−1+mk−1
[∏k−2
i=1 pi∏k−2
i=1 pi
]nk
=
qdk−1k−1 pmk−1k−1
[
k−2∏
i=1
pi
]dk−1+mk−1+nk
[
1∏k−2
i=1 pi
]nk
temos nk−1 = dk−1 + mk−1 + nk, logo podemos reescrever a expressão acima como.
=
{
q
dk−1
k−1 p
mk−1
k−1
[
k−2∏
i=1
pi
]nk−1}[
1∏k−2
i=1 pi
]nk
• j = k − 2
=
qdk−2k−2 pmk−2k−2
[
k−3∏
i=1
pi
]dk−2+mk−2
=
qdk−2k−2 pmk−2k−2
[
k−3∏
i=1
pi
]dk−2+mk−2
[∏k−3
i=1 pi∏k−3
i=1 pi
]nk−1
=
qdk−2k−2 pmk−2k−2
[
k−3∏
i=1
pi
]dk−2+mk−2+nk−1
[
1∏k−3
i=1 pi
]nk−1
temos nk−2 = dk−2 + mk−2 + nk−1, logo podemos reescrever a expressão acima como.
=
{
q
dk−2
k−2 p
mk−2
k−2
[
k−3∏
i=1
pi
]nk−2}[
1∏k−3
i=1 pi
]nk−1
...
• j = 1
=
{
qd11 p
m1
1
[
0∏
i=1
pi
]n1}[
1∏0
i=1 pi
]n2
= qd11 p
m1
1
2
Fazendo o produto do termo quando j = k e j = k − 1
=
{
qdkk p
nk−dk
k
[
k−1∏
i=1
pi
]nk}{
q
dk−1
k−1 p
mk−1
k−1
[
k−2∏
i=1
pi
]nk−1}[
1∏k−2
i=1 pi
]nk
=
{
qdkk p
nk−dk
k
}{
q
dk−1
k−1 p
mk−1
k−1
[∏k−1
i=1 pi∏k−2
i=1 pi
]nk}[k−2∏
i=1
pi
]nk−1
=
{
qdkk p
nk−dk
k
}{
q
dk−1
k−1 p
mk−1
k−1 p
nk
k−1
}[k−2∏
i=1
pi
]nk−1
=
{
qdkk p
nk−dk
k
}{
q
dk−1
k−1 p
mk−1+nk
k−1
}[k−2∏
i=1
pi
]nk−1
Como temos que nk−1 − dk−1 = mk−1 + nk, obtemos.
=
{
qdkk p
nk−dk
k
}{
q
dk−1
k−1 p
nk−1−dk−1
k−1
}[k−2∏
i=1
pi
]nk−1
Agora pegando esse resultado e multiplicando pro termo quando j = k − 2
=
{
q
dk−2
k−2 p
mk−2
k−2
[
k−3∏
i=1
pi
]nk−2}[
1∏k−3
i=1 pi
]nk−1 {
qdkk p
nk−dk
k
}{
q
dk−1
k−1 p
nk−1−dk−1
k−1
}[k−2∏
i=1
pi
]nk−1
=
{
qdkk p
nk−dk
k
}{
q
dk−1
k−1 p
nk−1−dk−1
k−1
}{
q
dk−2
k−2 p
mk−2
k−2
[∏k−2
i=1 pi∏k−3
i=1 pi
]nk−1}[k−3∏
i=1
pi
]nk−2
=
{
qdkk p
nk−dk
k
}{
q
dk−1
k−1 p
nk−1−dk−1
k−1
}{
q
dk−2
k−2 p
mk−2
k−2 p
nk−1
k−2
}[k−3∏
i=1
pi
]nk−2
=
{
qdkk p
nk−dk
k
}{
q
dk−1
k−1 p
nk−1−dk−1
k−1
}{
q
dk−2
k−2 p
mk−2+nk−1
k−2
}[k−3∏
i=1
pi
]nk−2
Como temos que nk−2 − dk−2 = mk−2 + nk−1, obtemos.
=
{
qdkk p
nk−dk
k
}{
q
dk−1
k−1 p
nk−1−dk−1
k−1
}{
q
dk−2
k−2 p
nk−2−dk−2
k−2
}[k−3∏
i=1
pi
]nk−2
=
{
k∏
j=k−2
q
dj
j p
nj−dj
j
}[
k−3∏
i=1
pi
]nk−2
Logo, fazendo isso até j = 1, obtemos
= qd11 p
m1
1
{
k∏
j=2
q
dj
j p
nj−dj
j
}[
1∏
i=1
pi
]n2
= qd11 p
m1
1
{
k∏
j=2
q
dj
j p
nj−dj
j
}
pn21
= qd11 p
m1+n2
1
{
k∏
j=2
q
dj
j p
nj−dj
j
}
=
k∏
j=1
q
dj
j p
nj−dj
j
3
Essa ultima expressão é a verossimilhança da amostra observada, Maximizando a log-verossimilhança
em relação pj, obtemos.
=
∂
∂pj
{
k∑
j=1
[dj log (1− pj) + (nj − dj) log (pj)]
}
=
(
−dj
1− pj
)
+
(
nj − dj
pj
)
Igualando a zero e isolando pj, obtemos
p̂j = 1−
dj
nj
Pelo teste da segunda derivada, vemos que p̂j é ponto de máximo. Portanto pela propriedade
da invariância dos estimadores de máxima verossimilhança, e pela definição da função de so-
brevivência, temos que a estimativa de máxima verossimilhança da função de sobrevivência é
dado por
Ŝ(t) =
∏
j:tj<t
(
1− dj
nj
)
(2)
4
	Estimador de Kaplan-Meier