Baixe o app para aproveitar ainda mais
Prévia do material em texto
Universidade de Braśılia Departamento de estat́ıstica Aluno:Vitor Macedo Rocha Estimador KM com EMV 1 Estimador de Kaplan-Meier Definição 1. O estimador de Kaplna-Meier para a função de sobrevivência é dado por: Ŝ(t) = ∏ j:tj<t ( 1− dj nj ) (1) Demostração A função de verossimilhança é dado pelo produto das probabilidades de falha e de falha após censura, expresso por m0∏ i=1 S(t0i)· · [S(t1 − 0)− S(t1)]d1 m1∏ i=1 S(t1i)· · · · · [S(tk − 0)− S(tk)]dk mk∏ i=1 S(tki) Para maximizar a expressão acima, devemos fazer S(tj−0) e S(tji) o maior posśıvel e S(tj) o me- nor posśıvel, logo fazemos S(tj) = S(tji) = ST (tj+1−0).Sabendo que a função de sobrevivência é monótona decrescente e que tj ≤ tji ≤ tj+1, temos que fazer então S(tj) = S(tji) = S(tj+1−0) e S(tj − 0) = S(tj−1). Seja • pj = P (T ≥ tj|T ≥ tj−1) = S(tj)/S(tj−1) a probabilidade de que a unidade observacional não falhe até tj dado que não falhou até o instante tj−1. • qj = 1− pj = P (T < tj|T ≥ tj−1) Pela definição da função de sobrevivência, temos que S(tj) = ∏j i=1 pi, e que S(tj−1)− S(tj) =∏j−1 i=1 piqj. Podemos reescrever a verossimilhança como = k∏ j=1 { [S(tj − 0)− S(tj)]dj mj∏ i=1 S(tji) } = k∏ j=1 [S(tj−1)− S(tj))]dj S(tj)mj = k∏ j=1 [ j−1∏ i=1 piqj ]dj [ j∏ i=1 pi ]mj = k∏ j=1 qdjj pmjj [ j−1∏ i=1 pi ]dj+mj O próximo passo é fazer uma análise mais profunda desse último produtório obtido acima. 1 • j = k = qdkk pmkk [ k−1∏ i=1 pi ]dk+mk temos que nk = dk + mk, logo podemos reescrever a expressão acima como. = { qdkk p nk−dk k [ k−1∏ i=1 pi ]nk} • j = k − 1 = qdk−1k−1 pmk−1k−1 [ k−2∏ i=1 pi ]dk−1+mk−1 = qdk−1k−1 pmk−1k−1 [ k−2∏ i=1 pi ]dk−1+mk−1 [∏k−2 i=1 pi∏k−2 i=1 pi ]nk = qdk−1k−1 pmk−1k−1 [ k−2∏ i=1 pi ]dk−1+mk−1+nk [ 1∏k−2 i=1 pi ]nk temos nk−1 = dk−1 + mk−1 + nk, logo podemos reescrever a expressão acima como. = { q dk−1 k−1 p mk−1 k−1 [ k−2∏ i=1 pi ]nk−1}[ 1∏k−2 i=1 pi ]nk • j = k − 2 = qdk−2k−2 pmk−2k−2 [ k−3∏ i=1 pi ]dk−2+mk−2 = qdk−2k−2 pmk−2k−2 [ k−3∏ i=1 pi ]dk−2+mk−2 [∏k−3 i=1 pi∏k−3 i=1 pi ]nk−1 = qdk−2k−2 pmk−2k−2 [ k−3∏ i=1 pi ]dk−2+mk−2+nk−1 [ 1∏k−3 i=1 pi ]nk−1 temos nk−2 = dk−2 + mk−2 + nk−1, logo podemos reescrever a expressão acima como. = { q dk−2 k−2 p mk−2 k−2 [ k−3∏ i=1 pi ]nk−2}[ 1∏k−3 i=1 pi ]nk−1 ... • j = 1 = { qd11 p m1 1 [ 0∏ i=1 pi ]n1}[ 1∏0 i=1 pi ]n2 = qd11 p m1 1 2 Fazendo o produto do termo quando j = k e j = k − 1 = { qdkk p nk−dk k [ k−1∏ i=1 pi ]nk}{ q dk−1 k−1 p mk−1 k−1 [ k−2∏ i=1 pi ]nk−1}[ 1∏k−2 i=1 pi ]nk = { qdkk p nk−dk k }{ q dk−1 k−1 p mk−1 k−1 [∏k−1 i=1 pi∏k−2 i=1 pi ]nk}[k−2∏ i=1 pi ]nk−1 = { qdkk p nk−dk k }{ q dk−1 k−1 p mk−1 k−1 p nk k−1 }[k−2∏ i=1 pi ]nk−1 = { qdkk p nk−dk k }{ q dk−1 k−1 p mk−1+nk k−1 }[k−2∏ i=1 pi ]nk−1 Como temos que nk−1 − dk−1 = mk−1 + nk, obtemos. = { qdkk p nk−dk k }{ q dk−1 k−1 p nk−1−dk−1 k−1 }[k−2∏ i=1 pi ]nk−1 Agora pegando esse resultado e multiplicando pro termo quando j = k − 2 = { q dk−2 k−2 p mk−2 k−2 [ k−3∏ i=1 pi ]nk−2}[ 1∏k−3 i=1 pi ]nk−1 { qdkk p nk−dk k }{ q dk−1 k−1 p nk−1−dk−1 k−1 }[k−2∏ i=1 pi ]nk−1 = { qdkk p nk−dk k }{ q dk−1 k−1 p nk−1−dk−1 k−1 }{ q dk−2 k−2 p mk−2 k−2 [∏k−2 i=1 pi∏k−3 i=1 pi ]nk−1}[k−3∏ i=1 pi ]nk−2 = { qdkk p nk−dk k }{ q dk−1 k−1 p nk−1−dk−1 k−1 }{ q dk−2 k−2 p mk−2 k−2 p nk−1 k−2 }[k−3∏ i=1 pi ]nk−2 = { qdkk p nk−dk k }{ q dk−1 k−1 p nk−1−dk−1 k−1 }{ q dk−2 k−2 p mk−2+nk−1 k−2 }[k−3∏ i=1 pi ]nk−2 Como temos que nk−2 − dk−2 = mk−2 + nk−1, obtemos. = { qdkk p nk−dk k }{ q dk−1 k−1 p nk−1−dk−1 k−1 }{ q dk−2 k−2 p nk−2−dk−2 k−2 }[k−3∏ i=1 pi ]nk−2 = { k∏ j=k−2 q dj j p nj−dj j }[ k−3∏ i=1 pi ]nk−2 Logo, fazendo isso até j = 1, obtemos = qd11 p m1 1 { k∏ j=2 q dj j p nj−dj j }[ 1∏ i=1 pi ]n2 = qd11 p m1 1 { k∏ j=2 q dj j p nj−dj j } pn21 = qd11 p m1+n2 1 { k∏ j=2 q dj j p nj−dj j } = k∏ j=1 q dj j p nj−dj j 3 Essa ultima expressão é a verossimilhança da amostra observada, Maximizando a log-verossimilhança em relação pj, obtemos. = ∂ ∂pj { k∑ j=1 [dj log (1− pj) + (nj − dj) log (pj)] } = ( −dj 1− pj ) + ( nj − dj pj ) Igualando a zero e isolando pj, obtemos p̂j = 1− dj nj Pelo teste da segunda derivada, vemos que p̂j é ponto de máximo. Portanto pela propriedade da invariância dos estimadores de máxima verossimilhança, e pela definição da função de so- brevivência, temos que a estimativa de máxima verossimilhança da função de sobrevivência é dado por Ŝ(t) = ∏ j:tj<t ( 1− dj nj ) (2) 4 Estimador de Kaplan-Meier
Compartilhar