Baixe o app para aproveitar ainda mais
Prévia do material em texto
ANÁLISE INFERENCIAL - HG | Luíza Moura e Vitória Neves ANÁLISE INFERENCIAL O QUE É? Fornece uma informação para a população a partir de uma amostra. É uma análise estatística; Usam a matemática para fazer as estimativas (sabe se algo funciona ou não). Exemplo: estudo fase 3 das vacinas da COVID-19. Mostra a taxa de mortalidade, eficácia etc. Teste de hipóteses = teste estatístico que dá o “poder” de extrapolar os dados para a população O QUE PRECISA SABER? Tipo de variável: categórica ou numérica? Objetivo do estudo; O que pretende ser analisado; Distribuição da amostra: paramétrica ou não paramétrica; Pareado ou Não Pareado? TIPO DE VARIÁVEL: CATEGÓRICA OU NUMÉRICA? Precisa ter 2 variáveis para obter a análise inferencial e isso precisa estar casado com o objetivo do estudo. Por exemplo: quer avaliar a qualidade do sono dos alunos de medicina no ensino PBL e no tradicional. Nesse cenário tem 2 variáveis (escore do sono e a metodologia de ensino). A!! Se tiver só 1 variável, configura-se como análise descritiva. Isso porque não testa nada, apenas avalia a qualidade do sono. VOCÊ DEVE SE PERGUNTA: Se eu tenho as variáveis, de que tipo elas são? Categórica ou numérica? Exemplo: a metodologia de ensino representa a variável categórica; e o escore do sono é numérica; Então eu sei o objetivo do estudo: comparar o escore do sono de acordo à metodologia de ensino; E sei também o que pretende ser analisado. ANÁLISE INFERENCIAL - HG | Luíza Moura e Vitória Neves RELEMBRANDO AS VARIÁVEIS DISTRIBUIÇÃO DA AMOSTRA: PARAMÉTRICA OU NÃO PARAMÉTRICA Se eu tenho uma variável numérica na minha análise, preciso avaliar a normalidade desse escore para definir se vai representar por média e por mediana; E mais, se vai usar teste paramétrico (sinônimo de normalidade) ou não paramétrico (sinônimo de não normal). Então se tem o escore de sono e ela se comportou normal, usa os testes paramétricos. COMO AVALIAR A NORMALIDADE? ESTATÍSTICA DESCRITIVA: Observar histograma: análise gráfica que mostra a distribuição da variável numérica e se ela se assemelha a curva de Gauss; Observar tamanho do desvio-padrão: avaliar se o desvio está até 50% da média; Observar diferença entre média e mediana: quanto mais próxima a média da mediana, melhor; Skewness: avalia simetria da curva – entre – entre -5 e +5; Kurtosis: determina curva achatada e curva apiculada – entre -5 e +5; TESTES ESTATÍSTICOS PARA A AVALIAR A NORMALIDADE: Kolmogorov-smirnov: amostras >50 pessoas; Shapiro-wilk: amostra <50 pessoas. Nula: não há variabilidade – Amostra normal (p>0,05); Alternativa: há variabilidade – Amostra não normal (p<0,05). PAREADO OU NÃO PAREADO? Pareado: quando o mesmo indivíduo é avaliado aquela variável em 2 momentos diferentes - antes e depois. Exemplo: quero testar se há redução da PA em pacientes submetidos a determinado exercício físico – então tem a varíavel PA antes do exercício e PA depois do exercício. Não pareado: indivíduos avaliados em um único momento; grupo distintos. Exemplo: comparar o escore de sono da galera da UNIME no PBL e galera da UFBA no tradicional. ANÁLISE INFERENCIAL - HG | Luíza Moura e Vitória Neves PARA NÃO ERRAR A ANÁLISE DO TESTE ESTATÍSTO: Precisa saber o tipo de variável, a distribuição da amostra em normal e não normal e conceito de pareado ou não pareado. VARIÁVEL CATEGÓRICA-CATEGÓRICA QUI-QUADRADO Teste estatístico que compara variáveis categóricas; Tem como objetivo determinar a associação; Tem a mesma interpretação que o valor de p. EXEMPLO: Aí tem 2 variáveis categóricas: diabetes e sexo Se faz essa comparação e encontra p<0,05, significa que existe diferença entre a taxa de diabético entre homem e mulher; Se p>0,05, indica que é igual – não existe diferença entre a taxa de diabético entre homem e mulher. P>0,05, então indica que não existe diferença entre a taxa de diabético entre homem e mulher. ANÁLISE INFERENCIAL - HG | Luíza Moura e Vitória Neves EXEMPLO: Variáveis categóricas: climatério (sim ou não) e grupo que pertence (radiofrequência ou controle); Não pareado. Então utilizou o qui-quadrado. Como valor de p>0,05, revela que não há diferença na proporção de mulheres que estão no climatério no grupo radio comparado ao grupo controle. EXEMPLO: 2 variáveis categóricas: complicação pulmonar (sim ou não) e grupo que pertence (G1: fez fisio; G2: não fez fisio) Não pareado: porque não avaliou com a mesma variável (G1 e G2) P<0,05: implica que há diferença na taxa de complicação entre o grupo que fez fisioterapia e o outro que não fez fisio Ou seja, quem fez fisio teve menos complicação que o grupo que não fez fisio nesse artigo. ANÁLISE INFERENCIAL - HG | Luíza Moura e Vitória Neves MAC-NEMAR Precisa que ter 2 variáveis categóricas dicotômicas de forma pareada. EXEMPLO: Legenda: letra e: conta o número de crianças que teve resfriado aos 12 anos e continua tendo com 14; letra h: mostra quem não teve resfriado com 12 ano e não teve; letra f: quem teve resfriado antes e melhorou; letra g: crianças que não tinha resfriado com 12 anos e passou a ter com 14 anos. Variáveis: resfriado com 12 anos e resfriado com 14 anos. Ou seja, é a mesma variável mensurada em 2 momentos diferentes. Pareada: comparou depois de 2 anos se o mesmo grupo apresentava resfriado – ia aumentando ou diminuindo? P<0,05: indica que mais pessoas pioraram do que melhoraram do resfriado. Houve sim um aumento significante da prevalência de resfriado nessa problemática. A!! É um teste não muito usado, porque os testes de medicina usam variáveis numéricas. ANÁLISE INFERENCIAL - HG | Luíza Moura e Vitória Neves VARIÁVEL CATEGÓRICA-NUMÉRICA Se tem variável numérica, tem que avaliar a normalidade (olha lá em cima) TESTE T INDEPENDENTE OU NÃO PAREADO Aplica o teste quando desejar comparar a média em 2 grupos independentes. Ou seja, 1 variável categórica que tem 2 categorias; Só que para isso, a variável numérica precisa ser representada por média, porque precisa ter amostra normal. Amostra paramétrica: variável numérica; Desfecho é numérico. Exemplo: comparar a média de idade das participantes de 2 grupos diferentes. Usa esse teste, caso a variável idade tenha distribuição normal. Legenda: variável categórica (remédio e placebo); variável numérica (PAS) – tendo essa VARIÁVEL NORMAL, aplica o teste. ANÁLISE INFERENCIAL - HG | Luíza Moura e Vitória Neves EXEMPLO: Usa o teste T independente, porque o autor usou a variável numérica idade (com média e desvio padrão calculado, confiamos que é normal) e a variável categórica “grupo que pertence” (radiofrequência ou controle); P>0,05: permanece a hipótese nula, dizendo que a idade entre os grupos não é diferente (permanece igual) OBSERVAÇÃO: Como fazer a análise crítica da análise estatística? Toda tabela de artigo diz cada teste que utilizou; Se por algum acaso, nesse exemplo, tivesse outro teste na variável idade e não fosse o teste T independente, ele cometeu algum equívoco. Qual o problema disso? Principalmente para desfecho numérico, porque temos 2 opções (teste paramétrico ou não paramétrico), o autor pode trocar o teste para tentar omitir uma significância estatística ou possuir a significância estatística. Então a cascata de avaliação do artigo é: O autor representou por média e desvio padrão (estou atribuindo que é normal), logo ele precisa usar os testes paramétricos; Se o autor representou por média de desvio padrão, mas usa os testes NÃO paramétricos, está errado. ↑ AQUI TRAZEMOS A AVALIAÇÃO CRÍTICA Se o autor apresentar mediana e intervalo interquartil e usar teste paramétricos. Não pode acontecer, porque quem estuda as fórmulas dos testesestatísticos sabem que se aplica um teste de maneira equivocada quanto à distribuição numérica, pode conseguir uma significância ou não através desse equívoco. ↑ AQUI TAMBÉM TRAZEMOS A AVALIAÇÃO CRÍTICA ANÁLISE INFERENCIAL - HG | Luíza Moura e Vitória Neves TESTE MANN-WHITNEY O desfecho numérico deve apresentar uma distribuição assimétrica (não normal) – por isso expressa os dados em mediana e intervalo interquartil Dois grupos independentes Deve ser expresso por mediana e intervalo interquartil EXEMPLO: Usa o mann-whitney, porque a variável é expressa em mediana e intervalo interquartil e tem a variável categoria em 2 grupos (GC e GT) TESTE T PAREADO VS. MANN-WHITNEY Teste T pareado: variável numérico com distribuição NORMAL - média e desvio padrão Mann-Whitney: variável numérico com distribuição NÃO NORMAL - mediana e intervalo interquartil AMBOS: tem variável categórica de 2 grupos e uma variável numérica. NO ARTIGO: Analisa como foi representado e qual teste utilizou. A!! Se não estiver coerente, critica que utilizou os dados de uma forma equivocada. Acende uma luz vermelha, porque levanta uma suspeita que os resultados não seja o que realmente foi encontrado. ANÁLISE INFERENCIAL - HG | Luíza Moura e Vitória Neves TESTE T PAREADO Amostra paramétrica Dois momentos no mesmo indivíduo: antes e depois; Objetivo: comparar a média A!! Mesma coisa do Mac-Nemar, mas agora com uma variável numérica Exemplo: avaliar se há uma modificação na PA após protocolo de exercício. Variável PA inicial, faz o protocolo de exercício e depois avalia a PA final. A!! Se as duas variáveis têm distribuição normal, usa o teste T pareado; mas se uma das variáveis não for normal, usa o Wilcoxon sign-rank. EXEMPLO: Nesse artigo, fala que o paciente com SCA vai avaliar a FC, depois vai fazer um teste de caminhada por 6 minutos e ao final do teste avalia a FC novamente. Análise pareada: porque há FC no momento antes do teste e FC depois do teste. Aí tem que avaliar a normalidade das variáveis e fazer o teste correspondente. ANÁLISE INFERENCIAL - HG | Luíza Moura e Vitória Neves Qual teste ele utilizou? Ele representou na tabela de todas as formas e disse no artigo que ele usou o teste T pareado ou o teste Wilcoxon sign-rank. Ou seja, ele não definiu para cada um. Não está errado, mas precisa definir qual o teste estatístico para cada variável – depende de uma revista criteriosa. Precisa ter um olhar mais crítico. Mas então: Se for média, usa o teste T pareado; Se for mediana, usa o teste Wilcoxon sign-rank. E a interpretação vai ser a mesma: Se p<0,05 (estatisticamente significante): a FC foi diferente entre os dois momentos – houve aumento da FC; ANÁLISE INFERENCIAL - HG | Luíza Moura e Vitória Neves TESTE WILCOXON SIGN-RANK Corresponde ao teste T pareado, mas utiliza variáveis numéricas não paramétricas; Representado por mediana, se for gráfico através do box-splot; Dois momentos com o mesmo indivíduo. EXEMPLO: REPRESENTAÇÃO GRÁFICA BOX-SPLOT O autor avalia o escore de QV no momento da admissão nos pacientes que teve IAM. Normalmente através de um questionário com 5 perguntas bem rápidas. Trouxe a mediana de 33,3 com intervalo interquartil entre 25-50; Passou 6 meses após o evento e eles mensuraram novamente a qualidade de vida. Tem a variável numérica (antes e depois, porque foi avaliado em 2 momentos) e foi representada por mediana. Logo, o teste dessa comparação é o Wilcoxon, porque deixa claro a mediana e intervalo interquartil. ANÁLISE INFERENCIAL - HG | Luíza Moura e Vitória Neves ANOVA Quando tem mais de 2 grupos independentes; O desfecho numérico com DISTRIBUIÇÃO NORMAL; Caso o ANOVA dê um p<0,05 (significante), realiza um test post hoc (Turkey e Bonferroni: mais utilizado na bioestatística); O post hoc tem como objetivo identificar quais grupos apresentam médias diferentes. EXEMPLO: Variável classificação do IMC (normal, sobrepeso e obesidade); Ou seja, a variável categórica tem +2 grupos. E o autor quer comparar se a função sexual avaliada por um escore (através de um questionário) – se existe diferença na função sexual entre esses 3 grupos. Legenda: FSFI representa todos os domínios (dor, orgasmo...) A tabela representa em média e desvio padrão, logo é uma variável numérica com distribuição paramétrica (normal) e tem uma variável categórica com 3 grupos. Assim, usa o ANOVA. O que ele faz? Compara a média dos 3 grupos e diz se é diferente ou não; Se p<0,05: existe diferença entre os grupos; Mas o ANOVA não diz onde está essa diferença – o primeiro do segundo? Segundo do terceiro? Etc. ANÁLISE INFERENCIAL - HG | Luíza Moura e Vitória Neves Então precisa de outro teste que diga essa diferença, aí entra o post hoc. O post hoc deixa específico quem é diferente de quem. EXEMPLO: Representou por média e desvio padrão, logo é paramétrica-normal. Utilizou o ANOVA conforme os critérios já descritos, mas não fez o post hoc. Mas afirmou que há diferença nos períodos da gestação e que o 3º trimestre representa o escore menor da função sexual – está mais comprometida. Significa que está errado? Não, depende muito do que o autor se predispõe a fazer. Então não é obrigatório fazer o post hoc, na verdade é indicado. ↑ AQUI TRAZEMOS A AVALIAÇÃO CRÍTICA O autor poderia ter feito, mas não fez. Mas nesse exemplo é óbvio. TESTE T NÃO PAREADO VS. ANOVA O ANOVA precisa ter >2 grupos; Teste T pareado: teste pareado (antes e depois), então difere das duas. ANÁLISE INFERENCIAL - HG | Luíza Moura e Vitória Neves KRUSKAL-WALLIS É semelhante ao ANOVA, mas o desfecho é numérico com distribuição NÃO PARAMÉTRICA – NÃO NORMAL – tem representação com mediana e intervalo interquartil ou representação gráfica de BOX- SPLOT Quando tem + de 2 independentes. EXEMPLO: O estudo quis avaliar 100 atletas que tem alto impacto no assoalho pélvico e queriam saber se o volume de treino, o nível de ranking das atletas nas competições mundiais estava associado com a perda urinária. Representado em BOX-SPLOT: mediana e intervalo interquartil; Há 3 grupos divididos quanto ao volume de treino. ANÁLISE INFERENCIAL - HG | Luíza Moura e Vitória Neves VARIÁVEL NUMÉRICA-NUMÉRICA CORRELAÇÃO PEARSON 2 variações numéricas; As 2 precisam apresentar uma distribuição normal. A ideia é dizer que 2 variáveis estão correlacionadas. EXEMPLO: A correlação acontece quando as 2 variáveis (X e Y) tem alguma relação entre si. Essa correlação utiliza: 1. Valor de p; 2. Coeficientes de correlação: é a inclinação da reta. Se tem 2 variáveis e quanto mais próximas do ângulo de 45º (mostrando que quando aumenta uma variável aumenta a outra na mesma proporção). Isso seria a correlação de 1, a correlação perfeita, porque a cada aumento da variável X, aumenta na mesma proporção a variável Y; Pode ser positiva ou negativa, porque pode ter gráfico “subindo” – aumenta X e Y OU negativa, quando diminui X e diminui Y. Quanto mais perto de -1 e +1, mais forte a correlação entre essas 2 variáveis. Só que para dizer que uma variável é correlacionada com a outra, precisa olhar o valor de p. p<0,05: significa que existe correlação; p>0,05: não olha o valor de coeficiente, porque é estatisticamente insignificante. Aí DEPOIS DE OLHAR O VALOR DE P, olha o valor do coeficiente: ANÁLISE INFERENCIAL - HG | Luíza Moura e Vitória Neves Quanto mais próximo de -1, ou de 1, mais forte é. Legenda: ângulo de 45º EXEMPLO: Legenda: R: coeficiente de correlação. Quanto mais próxima de 1, mais perfeita a correlação ANÁLISE INFERENCIAL - HG | Luíza Moura e Vitória Neves EXEMPLO:O estudo correlaciona o IMC com a circunferência da cintura em homens e mulheres com p<0,05. Tem 2 variáveis numéricas: IMC e circunferência da cintura Então o estudo revela que os funcionários têm uma correlação de quanto maior a circunferência da cintura, maior o IMC. EXEMPLO: 2 variáveis numéricas: Número de prêmios nobel em comparação com o consumo de chocolate/kg/país Para correlacionar que quanto maior o consumo de chocolate, maior o número de prêmios nobel. P<0,05; R = 0.791: comparação moderada. ANÁLISE INFERENCIAL - HG | Luíza Moura e Vitória Neves CORRELAÇÃO SPEARMAN 2 variáveis numéricas: Pelo menos 1 necessita apresentar uma distribuição não paramétrica. Não muda nada com relação a interpretação dos dados (valor de p, r), em comparação à Correlação Pearson. EXEMPLO: Comparou o escore da perda urinária e a hora do tempo de treino por semana: 2 variáveis numéricas; Tem p<0,05: estatisticamente significante; R: fraco. EXEMPLO: Comparou a perda urinária com o ranking nas competições: 2 variáveis numéricas; Tem p<0,05: estatisticamente significante; R: moderada.
Compartilhar