Prévia do material em texto
BIOESTATÍSTICA AULA 6 Prof. Michael Pereira da Silva 2 CONVERSA INICIAL Nesta aula, discutiremos possibilidades de análises estatísticas utilizando dados categóricos (qualitativos). É importante relembrar que esses dados podem ser nominais ou ordinais e estão muito presentes na coleta de dados em diversas áreas do conhecimento. Por outro lado, muitas vezes transformamos dados contínuos em categóricos, com o intuito de responder a perguntas de pesquisas específicas. Como exemplo, sabemos que a medida de pressão arterial apresenta resultados contínuos; no entanto, se quisermos saber se os indivíduos apresentam ou não hipertensão arterial, precisamos categorizá-los de acordo com um valor de referência. Para isso, transformamos uma variável contínua em categórica. TEMA 1 – ANALISANDO DADOS CATEGÓRICOS Existem diferentes tipos de variáveis categóricas, e em geral um participante ou um caso só podem estar em apenas uma categoria do estudo. Os dados categóricos compreendem as variáveis do tipo nominal (sexo, tipo sanguíneo, etnia, estado civil etc.) e ordinal (classe social, faixa etária etc.) (Barros et al., 2012). Cabe ressaltar que elas podem também ser obtidas por meio da categorização variáveis intervalar e de razão, por exemplo, (i) temperatura e conhecimento são variáveis intervalares, mas podemos categorizá-las em abaixo ou acima de 15 °C para a temperatura e notas abaixo ou acima de 70 pontos para o conhecimento; (ii) estatura, uma variável de razão, que pode ser categorizada como acima ou abaixo de 1,60. Note que nos exemplos citados optamos por criar apenas duas categorias com base em variáveis contínuas, porém, é possível categorizar em mais categorias, de acordo com o tipo de análise que será utilizada, pontos de corte estabelecidos pela literatura etc. As variáveis categóricas nos possibilitam verificar o relacionamento entre estas, além de prever algum desfecho a partir de uma determinada exposição. Dessa forma, é possível responder a perguntas, por exemplo, (i) a prevalência de Zika vírus é maior no verão? Ou, ainda, (ii) existe associação entre dias de internamento em UTI e infecção hospitalar? 3 TEMA 2 – TESTE DE QUI-QUADRADO O teste de qui-quadrado nos permite observar o relacionamento entre duas variáveis categóricas, possibilitando comparar frequências observadas em uma categoria com as frequências que você espera conseguir nessas categorias por acaso (Field, 2011). O teste de qui-quadrado não tem como pré-requisito a distribuição dos dados (paramétrica ou não paramétrica). Isso se deve ao fato de lidar com dados categóricos, os quais não podem ser normalmente distribuídos por não serem contínuos (Field, 2011). Entretanto, o teste de qui-quadrado apresenta outras duas importantes hipóteses: i) cada participante do banco de dados só pode estar presente em uma categoria a ser analisada, ou seja, o teste não pode ser usado para analisar medidas repetidas, por exemplo. De maneira simplificada, imagine que esteja comparando frequências de tipos sanguíneos de diferentes pacientes. Cada paciente só pode ter um tipo sanguíneo, então, o teste de qui-quadrado pode ser aplicado; ii) as frequências esperadas em cada célula devem ser maiores do que 5, para que não se perder poder estatístico. Embora um banco de dados possa apresentar frequências inferiores a 5, tenha em mente que embora o resultado de sua análise seja aceitável, mas que o poder de análise é muito limitado. 2.1 Passo a passo do teste de qui-quadrado Vamos tomar como exemplo a seguinte situação: suponhamos que você queira comparar as frequências de homens e mulheres com ou sem excesso de peso. 4 Tabela 1 – Comparação entre homens e mulheres – excesso de peso Sexo Excesso de peso Masculino Feminino Não 500 650 Sim 500 350 Obviamente, apenas olhando a distribuição das frequências, podemos concluir que os valores são diferentes entre homens e mulheres em relação a presença ou ausência do excesso de peso. No entanto, não podemos afirmar se esta diferença é ou não estatisticamente significativa. Para respondermos a esta questão, utilizaremos o teste de qui-quadrado, descrito nas três figuras a seguir. Figura 1 – Selecionado o teste estatístico1 1 Para download da ferramenta utilizada nesta aula, acesse: <https://www.mamiraua.org.br/downloads/programas/>. Acesso em: 16 set. 2021. 5 Figura 2 – Selecionando as variáveis Figura 3 – Resultado Para interpretar esse resultado (apresentado na Figura 3), basta nos atentarmos ao valor de p destacado em vermelho. O resultado indica que p foi menor do que 0,0001, ou seja, podemos observar um resultado significativo na relação testada (vale lembrar que, comumente consideramos como significativo, valores menores do que 0,05). Sendo assim, neste exemplo, podemos concluir que as frequências entre homens e mulheres, quanto a presença ou não do excesso de peso, são estatisticamente diferentes. 6 TEMA 3 – TESTE DE MCNEMAR Quando falamos sobre o teste de qui-quadrado, observamos que um de seus pressupostos é que os participantes analisados não podem estar em duas ou mais categorias. Assim, amostras pareadas, quando o mesmo participante está em mais de uma categoria, podem ser analisadas pelo teste de McNemar. 3.1 Passo a passo do teste de McNemar Imagine que você precisa comparar as frequências de participantes com sobrepeso antes de iniciar um tratamento e após o tratamento para a redução do peso. Como os mesmos participantes estão em mais de uma categoria (pré e pós teste), não podemos utilizar o teste de qui-quadrado, então o teste de McNemar entra como a melhor opção para comparar dados categóricos pareados (Favero; Belfiore, 2017). O teste de McNemar também não segue o pressuposto da distribuição paramétrica ou não paramétrica, também por lidar com dados categóricos (Field, 2011). Tabela 2 – Comparação entre homens e mulheres – excesso de peso Excesso de peso – pós-tratamento Excesso de peso – pré- tratamento Sim Não Sim 300 (A) 200 (C) Não 100 (B) 400 (D) 7 Figura 4 – Selecionando o teste estatístico Figura 5 – Inserção dos dados e resultados Podemos interpretar o resultado (apresentado na Figura 5) como as frequências de excesso de peso são diferentes entre o pré e o pós-tratamento. TEMA 4 – CORRELAÇÕES ENTRE DADOS CATEGÓRICOS Quando precisamos analisar a relação de dados categóricos, não podemos utilizar a média ou outra estatística similar, por que não temos a medida de modo contínuo. Assim, não faz sentido, por exemplo, calcular a média entre uma amostra de homens e mulheres, afinal os participantes só podem ser de um ou de outro sexo. 8 Sendo assim, ao analisarmos dados categóricos, nós consideramos as frequências, ou seja, quantos participantes se encaixam em cada categoria. Para verificar a relação entre dados categóricos, podemos, por exemplo, utilizar a regressão logística binária. TEMA 5 – REGRESSÃO LOGÍSTICA BINÁRIA A regressão logística binária nos permite prever uma variável de saída categórica, a partir da exposição a outra variável. De maneira simples, é possível prever a qual categoria uma pessoa está mais propensa a pertencer, dando algumas informações prévias (Field, 2011). É importante que você tenha em mente um conceito muito abordado pela literatura científica ao apresentar os resultados da regressão logística binária, o conceito da razão de chances (odds ratio), a qual expressa a razão entre a exposição entre os que têm o desfecho e os que não tem o desfecho (Oliveira Filho, 2015). 5.1 Passo a passo para a regressão logística binária Vamos imaginar que você está interessado em prever a chance de adultos que não fazem atividades físicas apresentarem excessode peso. Nesta situação, temos a variável de exposição atividade física e a variável de desfecho excesso de peso. Vamos, então, fazer o uso da regressão logística binária, a qual tem sido amplamente utilizada na determinação de medidas de associação. Outra vantagem deste procedimento é que ele permite verificar a associação com base em vários fatores de exposição, utilizando, então, ajustes e verificando interações (Barros et al., 2012). No exemplo, seria como se, ao invés de verificarmos apenas a associação da atividade física com o excesso de peso, colocássemos mais varáveis nessa análise, como consumo de frutas (sim/não), tabagismo (sim/não), dormir 8 horas por dia (sim/não). No entanto, no próximo exemplo, estamos interessados em verificar apenas a relação entre a atividade física e o peso. 9 Figura 6 – Relação entre atividade física e peso Figura 7 – Seleção do teste estatístico Figura 8 – Inserção das variáveis ATIVIDADE FÍSICA 0= ATIVO 1= INSUFICIENTE PESO 0= PESO NORMAL 1= SOBREPESO/OBESO 10 Figura 9 – Resultados Podemos interpretar esse resultado assumindo que indivíduos que não praticam atividades físicas tiveram 2,78 (odds ratio) vezes mais chances de estarem no grupo com excesso de peso, em relação aos indivíduos que praticam atividades físicas. NA PRÁTICA Como saber a probabilidade de ocorrência de um desfecho mediante conhecimento prévio de uma exposição? Por exemplo, se o indivíduo é insuficientemente ativo, qual a probabilidade de que ele também venha a ter hipertensão arterial? O tabagismo pode estar associado ao câncer de pulmão? Para essas perguntas, a regressão logística binária pode nos auxiliar e verificar se existem associações significativas entre as variáveis citadas. Vamos retomar o exemplo da utilização da regressão logística binária visto acima. Nesse exemplo, os indivíduos que não praticavam atividades físicas tiveram 2,78 vezes mais chances de também estarem no grupo com excesso de peso, em relação aos indivíduos que praticam atividades físicas. Com auxílio do software Biostat, existe a possibilidade de, mediante equação matemática, identificar a probabilidade da ocorrência do desfecho excesso de peso a partir da ocorrência de uma exposição, nesse caso a inatividade física. Vamos entender esse processo. Marcamos essa opção 11 Figura 10 – Iniciamos do resultado da regressão logística binária e marcamos a opção Estimação de Y Figura 12 – Inserimos o valor que corresponde à exposição. Na regressão logística, o valor que indica a exposição é o valor “1”. No nosso exemplo 1, é o código para ocorrência de inatividade física Após clicarmos em Estimar Y, temos o resultado de 62,5%. Diante disso, podemos interpretar que a probabilidade de um indivíduo que não praticava atividade física de também ter excesso de peso era de 62,5%. 12 FINALIZANDO Nesta aula, na qual aprendemos a análise de dados categóricos, abordamos diversos procedimentos estatísticos voltados ao teste de hipóteses sobre variáveis qualitativas. Vimos que dados categóricos são muito comuns em pesquisas na área de educação física e que podemos testar diferenças de frequências de ocorrência de um evento entre grupos, correlacionar duas variáveis categóricas e até mesmo identificar as chances de ocorrência de um evento (desfecho) se soubermos da ocorrência de outro evento (exposição). Interessante, não? 13 REFERÊNCIAS BARROS, M. V. G. et al. Análise de dados em saúde. Londrina: Midiograf, 2012. FÁVERO, L. P.; BELFIORE, P. Manual de análise de dados: estatística e modelagem multivariada com Excel®, SPSS® e Stata®. Elsevier Brasil, 2017. FIELD, A. Descobrindo a estatística usando o SPSS. Porto Alegre: Artmed, 2011. OLIVEIRA FILHO, P. F. Epidemiologia e bioestatística: fundamentos para a leitura crítica. Rio de Janeiro: Rubio, 2015.