Baixe o app para aproveitar ainda mais
Prévia do material em texto
FACULDADE DE MEDICINA APOSTILA DO CURSO – VERSÃO 1.2018 ANÁLISE DE DADOS COM EPI INFO 7 Prof. Dr. Hugo D. Hoffmann Santos E-mail: hugo.epidemio@gmail.com (65) 99271-6851 mailto:hugo.epidemio@gmail.com 2 Sumário EMENTA................................................................................................................................... 3 CARGA HORÁRIA .................................................................................................................... 3 OBJETIVOS .............................................................................................................................. 3 O EPI INFO ............................................................................................................................... 4 SUAS FERRAMENTAS ............................................................................................................ 5 CREATE FORMS ...................................................................................................................... 6 INICIANDO UM NOVO PROJETO .......................................................................................... 6 CRIANDO UM FORMULÁRIO ............................................................................................... 7 UTILIZANDO O CHECK CODE .............................................................................................. 8 EXERCÍCIOS DE FIXAÇÃO n.º 1 .......................................................................................... 10 VISUAL DASHBOARD ........................................................................................................... 11 IMPORTANDO BANCO DE DADOS EM EXCEL ................................................................... 11 REALIZANDO ESTATÍSTICA DESCRITIVA ......................................................................... 13 SUMARIZAÇÃO DE VARIÁVEIS CATEGÓRICAS................................................................ 14 SUMARIZAÇÃO DE VARIÁVEIS CONTÍNUAS/DISCRETAS ............................................... 15 ANÁLISE ESTATÍSTICA DE VARIÁVEIS CATEGÓRICAS ................................................... 16 ANÁLISE ESTATÍSTICA DE VARIÁVEIS CONTÍNUAS/DISCRETAS .................................. 19 USANDO FILTROS ............................................................................................................. 20 EXERCÍCIOS DE FIXAÇÃO n.º 2.......................................................................................... 22 ANALYZE DATA CLASSIC ..................................................................................................... 24 IMPORTANDO BANCO DE DADOS EM EXCEL ................................................................... 24 REGRESSÃO LOGÍSTICA ................................................................................................... 25 REGRESSÃO DE COX......................................................................................................... 27 3 EMENTA Apresentação das ferramentas disponíveis no Epi Info 7. Criação de formulário para entrada de dados através do Create Forms. Campos para entrada de dados: tipos e propriedades. Interação entre campos através de comandos digitados no Check Code. Entrada e armazenamento de dados pelo Enter Data. Análise de dados pelo Visual Dashboard: importação de banco de dados, tabelas de frequência simples e estratificada, cálculo de médias, gráficos, filtros geral e específico, teste de hipóteses para variáveis (qui-quadrado simples e estratificado) categóricas e contínuas (test t e ANOVA). Interpretação do p-valor e das medidas de associação odds ratio e risco relativo e do intervalo de confiança a 95%. Análise de dados com o Analyze Data Classic: leitura de um banco de dados, estatística descritiva e inferencial, regressão logística, regressão de Cox e curva de Kaplan-Meier. CARGA HORÁRIA ATIVIDADE CARGA HORÁRIA Aula presencial 10,5 horas Exercícios extraclasse 4,5 horas Total 15,0 horas OBJETIVOS 1. Apresentar o software Epi Info 7, suas ferramentas e principais funções; 2. Criar um questionário para receber e armazenar dados de pesquisas; 3. Importar banco de dados e realizar sua estatística descritiva; 4. Realizar teste de hipóteses e a interpretação dos resultados; 5. Ajustar variáveis em um modelo de análise multivariada. 4 O EPI INFO É um pacote composto de uma série de ferramentas gratuitas criado especificamente para o uso de profissionais de saúde pública como um auxílio na condução de investigações de surtos e epidemias, gerenciamento de banco de dados de vigilância em saúde e análises estatística s de dados em saúde. Figura 1. Tela inicial do Epi Info 7 Este programa permite que médicos, epidemiologistas e outros profissionais de saúde possam construir rapidamente um questionário, personalizar os dados que serão digitados, inserir informações individuais dos pacientes e analisar estatisticamente esses dados. O Epi Info 7 está disponível para download gratuito no site do Centers for Disease Control and Prevention (CDC) neste link: http://www.cdc.gov/epiinfo. http://www.cdc.gov/epiinfo 5 SUAS FERRAMENTAS Conforme visto na figura 1, o Epi Info 7 possui 6 ferramentas, são elas: create forms, enter data, create maps, statcalc, analyze data classic e visual dashboard. Vejamos abaixo a função de cada uma: Ferramenta Função Esta opção abrirá uma nova janela onde você poderá criar um formulário para armazenar as informações da sua pesquisa. Existem várias opções de campos de entrada de dados para cada tipo de variável requerida. Deve ser utilizada após você ter criado um formulário e já houverem dados disponíveis para digitação. Aqui você pode também consultar todos os registros já salvos e fazer qualquer modificação. Permite visualizar em um mapa dados de coordenadas geográficas (latitude e longitude), bastante utilizado quando os dados foram coletados em locais diferentes e se deseja avaliar um padrão na distribuição geográfica dos casos de uma doença. Trata-se de uma calculadora epidemiológica que pode ser utilizada a qualquer momento. É onde você pode fazer o cálculo do tamanho de amostra de um estudo ou descobrir o p-valor dos dados de uma tabela 2x2. Esta é a ferramenta de análise estatística de dados mais completa, onde você pode gerar tabelas e gráficos, calcular médias e realizar os modelos de regressão linear, logística e Cox, incluindo a curva de Kaplan-Meier. Possui um visual mais intuitivo para análise de dados que a ferramenta “classic” e, portanto, ótimo para os que estão iniciando o uso do Epi Info 7, mas não gera a curva de Kaplan- Meier e a regressão de Cox. Na tela inicial do Epi Info 7 (figura 1) existe este ícone localizado no canto superior direito. Ao clicar ali você encontrará outras informações sobre o aplicativo e também o item options onde você pode mudar o idioma para português e fazer outros ajustes. O CDC disponibiliza em inglês um manual completo do Epi Info 7 com 369 páginas detalhando todas as suas funcionalidades. Ele pode ser encontrado neste link: https://www.cdc.gov/epiinfo/support/userguide.html https://www.cdc.gov/epiinfo/support/userguide.html 6 CREATE FORMS INICIANDO UM NOVO PROJETO Acesse: Epi Info 7 → Create Forms → New Project Figura 2. Criando um novo formulário 1) Coloque o nome do formulário sem espaço e caracteres especiais. 2) Clique em Browse e selecione o local onde você deseja que o banco de dados seja salvo. 3) Campo destinado a adicionar alguma descrição da pesquisa incluindo informações que seriam pertinentes de serem lembradas quando o banco for utilizado por outra pessoa. 4) Utilize o mesmo nome do campo 1. O Epi Info7 criará no destino determinado no campo 2 uma pasta com dois arquivos, um de extensão PRJ (formulário) e outro MDB (banco de dados) que devem permanecer sempre na mesma pasta. 1 2 3 4 7 CRIANDO UM FORMULÁRIO Crie o formulário abaixo com os mesmos campos utilizados: Figura 3. Modelo de formulário no Create Forms A digitação de dados neste formulário, realizada posteriormente no Enter Data, seguirá a ordem de criação dos campos, independentemente de sua organização na tela. Por isso, é importante que se planeje de forma lógica a sequência dos campos, pois isso otimizará o tempo gasto na entrada de dados. 8 UTILIZANDO O CHECK CODE Essa opção permite personalizar interações entre os campos inseridos. Figura 4. Barra de ferramentas do Create Forms. Abrirá a tela abaixo do Check Code: Figura 5. Tela do Check Code. COMANDO 1: Calcular tempo de internação (em dias) com base na data da saída e data da internação: 1. Na área 1. Choose Field Block of Action clique no + à frente de [Page 1]. 2. Clique no + à frente de DatadaSaida e clique duas vezes sobre after. 3. Irá aparecer automaticamente os comandos que estão na tela da figura 5. 9 4. Onde está //add code here iremos digitar: TempodeInternacao=DatadaSaida-DatadaInternacao. 5. Dê um enter e escreva GOTO Diabetes para pular o campo que será preenchido automaticamente pelo cálculo do passo 4. Este comando deve estar dessa forma ao final: Figura 6. Comando para calcular intervalo de tempo. Caso queira que o intervalo de tempo calculado seja mostrado em anos, a fórmula deverá ser acrescida de /365.25, ou seja: TempodeInternacao=(DatadaSaida- DatadaInternacao)/365.25. COMANDO 2: Condicionar a interpretação da gasometria com base no valor do pH. Figura 7. Comando para condicionar a resposta de uma variável de acordo com a resposta de outra variável. Se a fórmula for digitada com algum erro isso será mostrado no campo Messages ao se clicar em Validate Check Code. Não se esqueça de salvar antes de sair. 10 EXERCÍCIOS DE FIXAÇÃO n.º 1 1) Qual é o módulo mais completo de análise de dados do Epi Info 7, ou seja, aquele que possui maiores recursos para uma análise estatística? a) Create Forms b) Statcalc c) Classic d) Visual Dashboard 2) Quais são as extensões dos arquivos de banco de dados e o formulário criado no Epi Info 7, respectivamente? a) XLS e MDB b) MDB e PRJ c) PRJ e XLS d) PDF e PPT 3) Qual das opções de campo podemos utilizar para a variável sexo. a) Yes/No b) Text c) Checkbox d) Legal Values 4) Em seu banco de dados há duas variáveis: uma contínua denominada “IMC” e outra categórica denominada “Resultado”. Você deseja que apareça automaticamente em “Resultado” a resposta “Obesidade Grau III” após digitar em “IMC” valores > 40. Qual comando deveria ser digitado no Check Code? a) IF IMC > 40 THEN RESULTADO=”OBESIDADE GRAU III” b) IF RESULTADO > 40 THEN IMC=”OBESIDADE GRAU III” c) IF RESULTADO =”OBESIDADE GRAU III” THEN IMC>40 d) IF IMC > 40 THEN RESULTADO=”OBESIDADE GRAU II” GABARITO 11 VISUAL DASHBOARD IMPORTANDO BANCO DE DADOS EM EXCEL Para realizar as próximas atividades baixe o arquivo SDE.xls clicando neste link: https://www.dropbox.com/s/30xskf0y6713fp3/SDE.xls?dl=0 Figura 8. Banco de dados SDE.xls Este banco contém parte dos dados de um estudo transversal (pesquisa de iniciação científica) realizado com 1132 estudantes universitários da área da saúde matriculados no UNIVAG Centro Universitário que avaliou a prevalência de sonolência diurna excessiva (SDE) entre agosto de 2016 e julho de 2017. A tabela abaixo apresenta o dicionário das variáveis utilizadas: VARIÁVEL DESCRIÇÃO TIPO RESPOSTA medicina Curso Categórica 1 = Medicina 0 = Outros cursos da saúde idade Idade Contínua Numérica periodo Horário do Curso Categórica 0 = Integral 1 = Matutino 2 = Norturno sexo Sexo Categórica 0 = Feminino 1 = Masculino exercicio Número de Atividade Física Semanal Discreta Numérica celular Utiliza celular momento antes de dormir Categórica 0 = Não 1 = Sim madrugada Estuda de madrugada Categórica 0 = Não 1 = Sim estimulant Faz uso de estimulantes para estudar a noite Categórica 0 = Não 1 = Sim scoremeq Escore obtido da aplicação do instrumento diagnóstico Discreta Numérica https://www.dropbox.com/s/30xskf0y6713fp3/SDE.xls?dl=0 12 Morningness–eveningness Questionnaire (MEQ) que avalia o cronótipo cronotipo Interpretação da variável “scoremeq” Categórica 1 = Matutino 2 = Intermediário 3 = Vespertino scoreep Escore obtido da aplicação daEscala de Sonolência de Epworth (ESE) que avalia SDE Discreta Numérica sde Interpretação da variável “scoreep” Categórica 0 = Não 1 = Sim Acesse: Epi Info 7 → Visual Dashboard → Set a data source now (figura 9) Figura 9. Tela de importação do Visual Dashboard. Escolha o formato .xls em Database Type (outras extensões de arquivos também podem ser utilizadas) e depois clique em Browse para selecionar o arquivo onde está salvo (figura 10). Figura 10. Tela de seleção do arquivo a ser importado para o Epi Info 7. 13 Deixe a caixa de seleção marcada em First row contains header information caso em sua planilha a primeira linha contenha o nome das variáveis do seu banco de dados. A mensagem Processing Finished aponta para uma importação realizada com sucesso (figura 11). O número de pacientes aparecerá no canto direito superior da tela como Records. Figura 11. Tela inicial do Visual Dashboard após importação de banco de dados. REALIZANDO ESTATÍSTICA DESCRITIVA Clique com o botão direito na parte em branco do Visual Dashboard e as opções da figura 12 irão aparecer em sua tela. A tabela abaixo apresenta as opções utilizadas de acordo com a natureza da variável do banco de dados: VARIÁVEL ESTATÍSTICA DESCRITIVA Categórica Frequência Absoluta (n) e Relativa (%) Contínua/Discreta Médias, Medianas, Desvio Padrão, Moda 14 Figura 12. Tela de opções de análise de dados no Visual Dashboard do Epi Info 7. SUMARIZAÇÃO DE VARIÁVEIS CATEGÓRICAS A tabela de frequência da variável desfecho sde (figura 13) nos informa que a prevalência de sonolência diurna excessiva foi igual a 56,27% e esteve presente em 637 estudantes. O Epi Info 7 lista suas variáveis por ordem alfabética, por isso muito provavelmente elas não estarão na mesma ordem que foram dispostas na planilha do Excel. Figura 13. Opção "frequency" da variável SDE no Visual Dashboard. A informação da coluna Cum. Percent (percentual cumulativo) é útil quando a variável possui três ou mais categorias. As colunas Wilson 95% LCL e UCL 15 informam, respectivamente, os valores inferiores e superiores do intervalo de confiança a 95% (IC95%) do percentual da mesma linha. Uma estratégia para refinar a estatística descritiva de variáveis categóricas é produzir uma tabela de frequência estratificada (figura 14). 1. Gere uma tabela de frequência seguindo os passos da figura 12; 2. Em frequency of selecione a variável sde; 3. Clique na aba esquerda Grouping and Sorting e em Stratify by selecione medicina; 4. Clique em Ok. Figura 14. Tabela de frequência estratificada. Dessa forma, a tabela de frequência produzida foi estratificada pela variável medicina. Isso é bastante útil quando queremos ter uma ideia inicial se a prevalência de SDE apresentou percentuais parecidos em grupos diferentes. SUMARIZAÇÃO DE VARIÁVEIS CONTÍNUAS/DISCRETAS 1. Da lista de opções presentes na figura 12 clique em means; 2. Em means of selecione a variável numérica scoreep; 3. Clique em Ok. 16 Figura 15. Cálculo de medidas de tendência central e dispersão. Desta forma, observamos que o escore médio da Escala de Sonolência de Epworth (ESE) foi igual a 11,05, com desviopadrão igual a 3,9, mediana igual a 11 e moda igual a 13. Podemos também estratificar esses dados (figura 16). Figura 16. Estatística descritiva estratificada de variável contínua. Observamos que o escore médio da ESE foi maior entre os alunos de medicina do que entre os alunos de outros cursos da área da saúde, embora, ainda não saibamos se essa diferença é estatisticamente significante ou não porque fizemos apenas a estatística descritiva desses dados. ANÁLISE ESTATÍSTICA DE VARIÁVEIS CATEGÓRICAS 1. Da lista de opções presentes na figura 12 clique em M x N / 2 x 2 table; 2. Em Exposure selecione a variável categórica explicativa medicina; 3. Em Outcome selecione a variável categórica desfecho sde; 4. Clique em Ok. Detalhe importante: o desfecho sempre deve aparecer na coluna e a variável de exposição na linha da tabela e a presença do desfecho e a presença da exposição 17 (respostas = 1) devem sempre estar posicionadas na coluna à esquerda e na primeira linha, respectivamente (figura 17). Figura 17. Análise estatística de variáveis categóricas Dica: A figura 19 apresenta um algoritmo para interpretação dos resultados da análise estatística de tabelas 2x2 no Visual Dashboard do Epi Info 7. Os dados da figura 17 nos informam que a prevalência de SDE foi estatisticamente semelhante entre estudantes do curso de medicina e estudantes de outros cursos da área da saúde por causa do p-valor > 0,05. Figura 18. Análise estatística de variável categórica com diferença estatística entre os grupos. Observamos agora que houve diferença estatística na prevalência de SDE entre os estudantes que disseram usar o celular momentos antes de dormir e os estudantes que disseram não fazer uso do celular momentos antes de dormir (p=0,003). O “Risk Ratio” foi igual a 1,33 com IC95%=1,07-1,65, o que significa que a prevalência de SDE foi 33% maior entre os estudantes que utilizaram celular momentos antes de dormir quando comparado com aqueles estudantes que não tem esse hábito. A captação do brilho da tela do smartphone inibe a secreção de melatonina pela glândula pineal, causando sonolência diurna excessiva. Figura 19. Algoritmo para interpretação de análise estatística de variáveis categóricas no Visual Dashboard do Epi Info 7. ANÁLISE ESTATÍSTICA DE VARIÁVEIS CONTÍNUAS/DISCRETAS Detalhe importante: antes de escolher o teste para avaliar variáveis numéricas é necessário verificar se a sua distribuição é normal (paramétrica) ou não (não paramétrica). O teste estatístico adequado é escolhido com base nessa distribuição (tabela abaixo), mas o Epi Info 7 não realiza o teste de normalidade. NECESSIDADE TESTE PARAMÉTRICO TESTE NÃO PARAMÉTRICO Comparar 2 médias não pareadas de uma variável com 2 grupos Teste t para duas médias independentes Teste U de Mann-Whitney Comparar 2 médias pareadas de uma variável com 2 grupos Teste t para duas médias dependentes Teste de Wilcoxon para amostras dependentes Comparar 2 médias não pareadas de uma variável com 3 ou mais grupos ANOVA um fator Teste de Kruskal-Wallis 1. Da lista de opções presentes na figura 12 clique em means; 2. Em means of selecione a variável contínua scoreep; 3. Em Cross-tabulate by selecione a variável categórica medicina; 4. Clique em Ok. Figura 20. Comparação de duas médias pelo test t no Visual Dashboard do Epi Info 7. 20 Na figura 20 comparamos os escores médios da ESE entre os estudantes de medicina e de outros cursos da área da saúde por meio de um test t para amostras independentes. Já havíamos visto essas médias na figura 16, mas agora realizamos um teste de hipóteses, cujo p-valor = 0,03 nos permite rejeitar a hipótese nula que afirma “as médias são semelhantes estatisticamente”. Concluímos, então, que os alunos do curso de medicina (Média=11,34; DP=3,82) apresentaram escore médio da Escala de Sonolência de Epworth estatisticamente maior que os alunos dos outros cursos da área da saúde (Média=10,84; DP=3,95). USANDO FILTROS Quando se tem bancos de dados com grande quantidade de registros é possível que se produza artigos ou resumos para apresentação em congressos com a análise estatística apenas de uma parte desses dados. Nestes casos, o Epi Info 7 apresenta dois recursos interessantes: o filtro geral e o filtro específico. Acesse: Epi Info 7 → Visual Dashboard → (figura 21) Figura 21. Tela de filtro geral do Epi Info 7. 1. Para analisarmos os dados apenas dos estudantes do curso de medicina selecione em Field Name a variável medicina; 2. Em Operator selecione is equal to; 21 3. Em Value digite o número 1; 4. Clique em Add Filter. Caso o filtro tenha ocorrido com sucesso em Records aparecerá apenas os registros referentes ao grupo selecionado e a mensagem abaixo aparecerá na parte superior da tela do Visual Dashboard (figura 22). Figura 22. Mensagem confirmando a aplicação do filtro geral. Agora, quando fizer a estatística descritiva e os testes de hipóteses os resultados serão apenas relativos ao grupo selecionado. Ou seja, qualquer análise adicionada na tela do Visual Dashboard respeitará o filtro geral informado. Para remover o filtro geral, clique novamente no ícone do filtro, no campo Data Filters clique em cima de The value of [medicina] is equal to 1 e depois clique em Remove Selected. Sem nenhum filtro geral, gere uma tabela de frequência da variável cronotipo. Lembre-se que 1 significa o cronótipo matutino, 2 intermediário e 3 vespertino. Siga os passos abaixo para utilizar a opção de filtro específico: 1. Clique no ícone dessa tabela; 2. Clique em Data Filters; 3. Em The value of Field Name selecione a variável celular; 4. Em Operator selecione a opção is equal to; 5. Em Value digite 1; 6. Clique em Add Condition; 7. Clique em Ok. A tabela agora nos mostra que entre os estudantes de medicina e dos demais cursos da área da saúde o cronótipo mais prevalente (57,90%; n=590) foi o intermediário. É possível que esses estudantes estejam migrando de um cronótipo 22 matutino (pessoas que dormem mais cedo) para um cronótipo vespertino (pessoas que dormem mais tarde), mas apenas um estudo de coorte poderia observar essa mudança ao longo do tempo. EXERCÍCIOS DE FIXAÇÃO n.º 2 1) A tabela 2x2 abaixo avaliou a seguinte hipótese nula: “utilizar celular momentos antes de dormir não interfere na prevalência do cronótipo vespertino [resposta = 3] entre estudantes de cursos da área da saúde”. Essa hipótese foi avaliada pelo teste Qui-quadrado de Mantel-Haenszel e pela razão de prevalência (risk ratio). Marque a opção com a interpretação correta: a) Com o p-valor igual a 39,99 não rejeitamos a hipótese nula e concluimos que a prevalência do cronótipo vespertino foi estatisticamente semelhante entre alunos que fizeram ou não uso de celular antes de dormir. b) A prevalência do cronótipo vespertino foi 314% maior entre os estudantes que fizeram uso de celular antes de dormir do que entre os estudantes que não fizeram uso de celular antes de dormir. c) O cronótipo vespertino foi 41 vezes maior entre os que fizeram uso de celular antes de dormir do que entre os estudantes que não fizeram uso de celular antes de dormir. d) O intervalo de confiança a 95% não nos permite inferir se o valor de p foi < 0,05 e a hipótese nula pode ser rejeitada. P.S.: De acordo com o Morningness–Eveningness Questionnaire (MEQ) o início do sono em pessoas com cronótipo vespertino ocorre entre 00:45h e 03:00h e, por isso, seu despertar seria entre 08:30h e 11:30h. 23 2) O teste Qui-quadrado de Mantel-Haenszel é utilizado para avaliar a associação entre: a) duas variáveis categóricas. b) duas variáveis contínuas. c) uma variável contínua e uma categórica. d) uma variável categórica e uma contínua. 3) Após clicar em means of e selecionar a variávelcontínua para realizar o test t no Visual Dashboard, em qual das opções abaixo devo colocar a variável categórica que desejo comparar as médias? a) Exposure b) Weight c) Stratify by d) Cross-tabulate by 4) Analise o resultado do teste t abaixo e marque a interpretação correta da estatística encontrada. Masculino = 1; Feminino = 0. a) O sexo feminino apresentou escore médio estatisticamente maior que o sexo masculino. b) O sexo masculino apresentou escore médio estatisticamente maior que o sexo feminino. c) O sexo masculino apresentou escore médio estatisticamente semelhante ao sexo feminino. d) O p-valor não nos permite rejeitar nem a hipótese nula e nem a hipótese alternativa. GABARITO 24 ANALYZE DATA CLASSIC IMPORTANDO BANCO DE DADOS EM EXCEL Acesse: Epi Info 7 → Classic → Read → Recent Data Sources → SDE [sde.xls] Figura 23. Tela inicial do Analyze Data Classic do Epi Info 7. 1) Lista de comandos disponíveis. 2) Tela onde aparecerão os resultados das análises. 3) Espaço para digitar comandos manuais e programar uma rotina. 4) Mensagem confirmando a importação do banco de dados. O grupo de comandos Statistics apresenta todas as opções que encontramos no Visual Dashboard. Neste momento, utilizaremos algumas das mais importantes opções de análise multivariada presentes no grupo Advanced Statistics. 1 2 3 4 25 REGRESSÃO LOGÍSTICA O objetivo de uma análise multivariada é, como o próprio nome sugere, avaliar em conjunto o efeito de múltiplas variáveis sobre um mesmo desfecho. Esse método é útil para controlar o viés de confundimento de um estudo. Acesse: Epi Info 7 → Classic → Advanced Statistics → Logistic Regression (figura 24) 1. Em Outcome Variable selecione sde; 2. Em Other Variables selecione celular; 3. Em Other Variables selecione sexo; 4. Em Other Variables selecione madrugada; 5. Em Other Variables selecione medicina; 6. Em Other Variables selecione cronotipo; 7. Clique em Ok. Figura 24. Tela de seleção das variáveis para ajuste de análise multivariada através de regressão logística. Dica: As variáveis (desfecho e explicativas) devem ser dicotômicas (sim/não) e as variáveis com três ou mais categorias devem ser transformadas em dummy variable, basta clicar sobre a variável e clicar em make dummy (aparecerá entre parêntesis). O Epi Info 7 apresenta sublinhada aquelas variáveis que incluímos no modelo multivariado e tiveram p-valor < 0,05 (figura 25), como o uso de celular antes de dormir e o sexo feminino. 26 Figura 25. Output do Analyze Data Classic de um modelo de regressão logística. Ao observamos a Odds Ratio da variável celular, concluímos que a prevalência de sonolência diurna excessiva (sde) em estudantes de cursos da área da saúde foi 64,5% maior (1,645-1x100) entre os que fizeram uso de celular momentos antes de dormir quando comparado com os estudantes de cursos da área da saúde que não fizeram uso de celular momentos antes de dormir. Detalhe importante: A medida de associação de uma análise bivariada é denominada bruta e a mesma medida de associação proveniente de uma análise multivariada é denominada ajustada, justamente por ter recebido a influência da ação de outras variáveis associadas ou não com o desfecho. Ao consultarmos o dicionário das variáveis deste banco de dados (p. 11) vamos perceber que sexo = 1 é masculino e sexo = 0 é feminino. Logo, a prevalência de sde foi 29% menor (1-0,71x100) entre os homens do que entre as mulheres. 27 REGRESSÃO DE COX O modelo de riscos proporcionais de Cox é uma regressão multivariada aplicada na análise de sobrevida, inferindo risco relativo de várias exposições e um desfecho sendo o intervalo de tempo até a ocorrência de um evento. Para realizar as próximas atividades baixe o arquivo Candidemia.xls clicando neste link: https://www.dropbox.com/s/tvpaw06xqr61ce4/Candidemia.xls?dl=0 Este banco de dados (figura 26) foi construído para avaliar a sobrevida em 90 dias de pacientes internados em UTI adulto e neonatal de um hospital de Cuiabá entre os anos 2014-2016 e fatores preditores para o óbito. Figura 26. Banco de dados "sobrevida.xls" VARIÁVEL DESCRIÇÃO TIPO RESPOSTA sexo Sexo Categórica 1 = Masculino 0 = Feminino uti UTI de origem Categórica 1 = UTI Adulto 0 = UTI Neonatal dtinter Data de Internação dtsaida Data da Saída tempo Tempo entre internação e saída Discreta obito Óbito Categórica 1 = Sim 0 = Não idade Idade Contínua candidemia Infecção de corrente sanguínea por leveduras do gênero Candida Categórica 1 = Sim 0 = Não carbap Antibioticoterapia com carbapenêmicos (imipenem, meropenem) Categórica 1 = Sim 0 = Não glicop Antibioticoterapia com glicopeptídeos (vancomicina) Categórica 1 = Sim 0 = Não vm Ventilação Mecânica Categórica 1 = Sim 0 = Não np Nutrição Parenteral Categórica 1 = Sim 0 = Não cvc Cateter Venoso Central Categórica 1 = Sim 0 = Não https://www.dropbox.com/s/tvpaw06xqr61ce4/Candidemia.xls?dl=0 28 Acesse: Epi Info 7 → Classic → Advanced Statistics → Cox Proportional Hazards (figura 27) Figura 27. Ajuste de análise multivariada por meio da regressão de Cox. Após ajustar a regressão de Cox conforme ilustrado acima, teremos o seguinte output com o resultado da análise de dados (figura 28): Figura 28. Resultado da regressão de Cox. Internação em UTI adulto (p=0,0002) e uso de ventilação mecânica (p=0,0001) foram fatores preditores independentes para o óbito nesta população. Pacientes 29 internados em UTI adulto tiveram risco de óbito 149% maior (2,49-1x100) do que os pacientes de UTI neonatal. Uso de suporte ventilatório aumentou o risco de óbito em 222% (3,22-1x100). CURVA DE KAPLAN-MEIER Acesse: Epi Info 7 → Classic → Advanced Statistics → Kaplan-Meier Survival (figura 29) Figura 29. Tela de configuração para estimar as funções de sobrevida pelo método de Kaplan-Meier. Figura 30. Curva de Kaplan-Meier com resultado do teste de log-rank. 30 O gráfico (figura 30) apresenta a curva de Kaplan-Meier, que estima a probabilidade de sobreviver ao longo do tempo de seguimento deste grupo de pacientes. Por exemplo, a linha laranja nos informa que após 20 dias de internação a probabilidade de sobrevida entre pacientes da UTI neonatal foi > 90%, enquanto que na UTI adulto < 75%. Para termos evidência mais concreta que a sobrevida entre os grupos seja estatisticamente diferente, o Epi Info 7 realiza o teste de Log-rank, cujo valor de p<0,05 nos permite rejeitar a hipótese nula de que “as funções de sobrevida são semelhantes entre os grupos”. Sendo assim, podemos afirmar que pacientes de UTI adulto apresentaram sobrevida mais baixa que pacientes de UTI neonatal. EXERCÍCIOS DE FIXAÇÃO n.º 3 1) Quando quisermos realizar uma regressão logística no Analyze Data Classic devemos procurar essa opção de análise de dados em: a) Data b) Variables c) Statistics d) Advanced Statistics 2) Para uma regressão logística a variável desfecho deve ser do tipo: a) Contínua b) Dicotômica c) Dummy d) Discreta 3) No ajuste de uma análise multivariada, em qual opção devemos clicar quando uma variável explicativa possuir três ou mais categorias? a) Make Dummy b) Other Variables c) Outcome Variables d) Confidence Limits 31 4) Você realizou uma pesquisa para avaliar os fatores associados ao óbito em pacientes internados em uma UTI e analisou os dados por meio de uma regressão logística. Marque a alternativa que apresenta a interpretação correta dos dados abaixo: a) O óbito foi 22,8% maior entre pacientes do sexo masculino. b) A ventilação mecânica [vm] aumentou o risco de óbito em 724%. c) Nutrição parenteral [np] reduziu o risco de óbito em 57,9%. d) O óbito foi 62,4% maior entre aqueles que fizeram uso de cateter [cvc].GABARITO 32 AVALIAÇÃO FINAL 1) Baixe o banco de dados Avaliacao.xls → https://www.dropbox.com/s/mwb6ve3o4mup32t/Avaliacao.xls?dl=0 2) Acesse este formulário: https://goo.gl/forms/SjkhT4SqY90E5AI03 3) Analise os dados para responder às perguntas. Regras: I. O rendimento mínimo necessário para obtenção do certificado de conclusão do curso é de 60%. II. O formulário estará aberto para recebimento de respostas por até 7 dias após o término do curso e será permitido apenas 1 envio por aluno. III. O aluno que não enviar as respostas dentro do prazo estabelecido será considerado como desistente do curso. Dicionário de Variáveis [Avaliacao.xls] Fonte: Sistema de Internação Hospitalar (SIH): Mato Grosso – Abril/2018 VARIÁVEL DESCRIÇÃO TIPO RESPOSTA sexo Sexo Categórica 1 = Masculino 0 = Feminino tempo Tempo entre internação e saída Discreta diagnostico CID-10 do motivo da internação Categórica Código CID insufcardiaca Insuficiência Cardíaca (CID-10 I500, I501 e I509) Categórica 1 = Sim 0 = Não idade Idade Discreta fxetaria Faixa Etária Categórica 1 = 18 a 30 anos 2 = 31 a 40 anos 3 = 41 a 59 anos 4 = 60 ou mais obito Óbito Categórica 1 = Sim 0 = Não raca Raça/cor Categórica 1 = Branco 2 = Negro 3 = Pardo 4 = Outras https://www.dropbox.com/s/mwb6ve3o4mup32t/Avaliacao.xls?dl=0 https://goo.gl/forms/SjkhT4SqY90E5AI03
Compartilhar