Baixe o app para aproveitar ainda mais
Prévia do material em texto
Regressão de dados binários. Ricardo Peixoto - alencarpeixoto@live.com 13 de março de 2018 Sumário 1 Descrição 1 2 Modelo logístico 1 1 Descrição Cinquenta e quatro indivíduos considerados idosos são submetidos a um exame psiquiátrico para avaliar a ocorrência ou não de sintoma de caduquice. Acredita-se que o escore obtido num exame psicológico feito previamente esteja associado com a ocorrência ou não do sintoma. Os dados são apresen- tados abaixo (score: escala no exame psicológico e resp: ocorrência (resp=1) ou não ocorrência (resp=0) do sintoma). Esses dados estão descritos no arquivo caduquice.dat. 2 Modelo logístico Vamos supor que cada resposta seja Bernoulli com log { µi 1 − µi } = β1 + β2x 1 em que µi denota a probabilidade do i-ésimo individuo idoso apresentar o sintoma de caduquice. As estimativas para o modelo são: β̂1 = 2.4040, β̂2 = −0.3235, assumindo um nível de signi�cância α = 0.05, ambas variáveis são signi�cativas. O desvio do modelo foi de D(y; µ̂) = 51.017 para 52 graus de liberdade, o que leva a um nível descritivo de P = 0.5125379, indicando um ajuste bom. O modelo ajustado é dado por: log { µ̂ 1 − µ̂ } = 2.4040 − 0.3235x, portanto veri�camos o exame psicológico feito de maneira previa ajuda a diminuir os casos de caduquice, temos que o mesmo tem efeito prognostico efetivo. A razão de chances entre um individuo idoso (x + 1) e um individuo idoso (x) é de�nida por: ψ = µ(x+1) 1−µ(x+1) µ(x) 1−µ(x) Assim a razão de chances ajusta �ca: ψ̂(x) = exp(−0.3235) = 0.7236 expor individuos considerados idosos ao exame psiquiatrico diminui em cerca de 28% a chance de ocorrencia dos sintomas de caduquice. 2 Figura 1: Grá�co normal de probabilidades referente ao modelo logístico ajustado aos dados para o exame psicológico para indivíduos idosos. O grá�co de envelope nos mostra o bom ajuste que havíamos antecipado, onde o mesmo consegue adequar todos os pontos. Figura 2: Diagnóstico do exame psicológico para indivíduos idosos. Ao veri�car o grá�co de diagnostico, temos uma indicação de que há pontos 3 in�uentes nas observações. Que identi�camos se tratar da observação 52. Iremos realizar a retirada para ver se o mesmo muda ou não a inferência. As estimativas para o modelo, com a retirada da observação 52, são: β̂1 = 3.2207, β̂2 = −0.3951, assumindo um nível de signi�cância α = 0.05, ambas variáveis são signi�cativas. Veri�camos que ocorre mudança nas estimativas, porém não afeta a inferência. O desvio do modelo foi de D(y; µ̂) = 47.838 para 51 graus de liberdade, o que leva a um nível descritivo de P = 0.6000164, indicando um ajuste bom. O impacto dessa retirada correspondente é -33.97187 para β1 e -22.10807 para β2. Como dito, não há mudança inferencial na ausência da observação 52. Dando continuidade, também apresentamos o calculo da estatística de Hos- mer e Lemeshow, a mesma é utilizada para avaliar a qualidade do ajuste. Essa estatística é de�nida comparando o número observado com o número esperado de sucessos de g grupos formados. É dada pela seguinte expressão Ĉ = g∑ i=1 (Oi − n ′ iπ̄2) 2 n ′ iπ̄2(1 − π̄2) Hosmer e Lemeshow veri�caram através de simulações que a distribuição nula assintótica de Ĉ pode ser bem aproximada por uma distribuição qui- quadrado com (g − 2) graus de liberdade. O valor para a estatística de Hosmer e Lemeshow é P = 0, 605 para 6 graus de liberdade, com isso temos um bom ajuste, e o mesmo é adequado. 4
Compartilhar