Buscar

Resumo - Análise inferencial

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 3, do total de 18 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 6, do total de 18 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 9, do total de 18 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Prévia do material em texto

ANÁLISE INFERENCIAL - HG | Luíza Moura e Vitória Neves 
ANÁLISE INFERENCIAL 
O QUE É? 
Fornece uma informação para a população a partir de uma amostra. 
 É uma análise estatística; 
 Usam a matemática para fazer as estimativas (sabe se algo funciona ou não). 
Exemplo: estudo fase 3 das vacinas da COVID-19. 
 Mostra a taxa de mortalidade, eficácia etc. 
 
Teste de hipóteses = teste estatístico que dá o “poder” de extrapolar os dados para a população 
O QUE PRECISA SABER? 
 Tipo de variável: categórica ou numérica? 
 Objetivo do estudo; 
 O que pretende ser analisado; 
 Distribuição da amostra: paramétrica ou não paramétrica; 
 Pareado ou Não Pareado? 
TIPO DE VARIÁVEL: CATEGÓRICA OU NUMÉRICA? 
Precisa ter 2 variáveis para obter a análise inferencial e isso precisa estar casado com o objetivo do estudo. 
 Por exemplo: quer avaliar a qualidade do sono dos alunos de medicina no ensino PBL e no tradicional. 
Nesse cenário tem 2 variáveis (escore do sono e a metodologia de ensino). 
A!! Se tiver só 1 variável, configura-se como análise descritiva. 
 Isso porque não testa nada, apenas avalia a qualidade do sono. 
VOCÊ DEVE SE PERGUNTA: 
Se eu tenho as variáveis, de que tipo elas são? Categórica ou numérica? 
 Exemplo: a metodologia de ensino representa a variável categórica; e o escore do sono é numérica; 
 Então eu sei o objetivo do estudo: comparar o escore do sono de acordo à metodologia de 
ensino; 
 E sei também o que pretende ser analisado. 
 
 
 
ANÁLISE INFERENCIAL - HG | Luíza Moura e Vitória Neves 
RELEMBRANDO AS VARIÁVEIS 
 
DISTRIBUIÇÃO DA AMOSTRA: PARAMÉTRICA OU NÃO PARAMÉTRICA 
Se eu tenho uma variável numérica na minha análise, preciso avaliar a normalidade desse escore para 
definir se vai representar por média e por mediana; 
E mais, se vai usar teste paramétrico (sinônimo de normalidade) ou não paramétrico (sinônimo de não 
normal). 
 Então se tem o escore de sono e ela se comportou normal, usa os testes paramétricos. 
COMO AVALIAR A NORMALIDADE? 
ESTATÍSTICA DESCRITIVA: 
 Observar histograma: análise gráfica que mostra a distribuição da variável numérica e se ela se 
assemelha a curva de Gauss; 
 Observar tamanho do desvio-padrão: avaliar se o desvio está até 50% da média; 
 Observar diferença entre média e mediana: quanto mais próxima a média da mediana, melhor; 
 Skewness: avalia simetria da curva – entre – entre -5 e +5; 
 Kurtosis: determina curva achatada e curva apiculada – entre -5 e +5; 
TESTES ESTATÍSTICOS PARA A AVALIAR A NORMALIDADE: 
 Kolmogorov-smirnov: amostras >50 pessoas; 
 Shapiro-wilk: amostra <50 pessoas. 
Nula: não há variabilidade – Amostra normal (p>0,05); 
Alternativa: há variabilidade – Amostra não normal (p<0,05). 
PAREADO OU NÃO PAREADO? 
Pareado: quando o mesmo indivíduo é avaliado aquela variável em 2 momentos diferentes - antes e 
depois. 
 Exemplo: quero testar se há redução da PA em pacientes submetidos a determinado exercício físico – 
então tem a varíavel PA antes do exercício e PA depois do exercício. 
Não pareado: indivíduos avaliados em um único momento; grupo distintos. 
 Exemplo: comparar o escore de sono da galera da UNIME no PBL e galera da UFBA no tradicional. 
 
ANÁLISE INFERENCIAL - HG | Luíza Moura e Vitória Neves 
 
PARA NÃO ERRAR A ANÁLISE DO TESTE ESTATÍSTO: 
 Precisa saber o tipo de variável, a distribuição da amostra em normal e não normal e conceito de 
pareado ou não pareado. 
VARIÁVEL CATEGÓRICA-CATEGÓRICA 
 
QUI-QUADRADO 
 Teste estatístico que compara variáveis categóricas; 
 Tem como objetivo determinar a associação; 
 Tem a mesma interpretação que o valor de p. 
EXEMPLO: 
 
Aí tem 2 variáveis categóricas: diabetes e sexo 
 Se faz essa comparação e encontra p<0,05, significa que existe diferença entre a taxa de diabético 
entre homem e mulher; 
 Se p>0,05, indica que é igual – não existe diferença entre a taxa de diabético entre homem e mulher. 
 
P>0,05, então indica que não existe diferença entre a taxa de diabético entre homem e mulher. 
 
ANÁLISE INFERENCIAL - HG | Luíza Moura e Vitória Neves 
EXEMPLO: 
 
 Variáveis categóricas: climatério (sim ou não) e grupo que pertence (radiofrequência ou controle); 
 Não pareado. 
Então utilizou o qui-quadrado. 
 Como valor de p>0,05, revela que não há diferença na proporção de mulheres que estão no 
climatério no grupo radio comparado ao grupo controle. 
 EXEMPLO: 
 
2 variáveis categóricas: complicação pulmonar (sim ou não) e grupo que pertence (G1: fez fisio; G2: não fez 
fisio) 
Não pareado: porque não avaliou com a mesma variável (G1 e G2) 
P<0,05: implica que há diferença na taxa de complicação entre o grupo que fez fisioterapia e o outro que 
não fez fisio 
 Ou seja, quem fez fisio teve menos complicação que o grupo que não fez fisio nesse artigo. 
 
ANÁLISE INFERENCIAL - HG | Luíza Moura e Vitória Neves 
MAC-NEMAR 
Precisa que ter 2 variáveis categóricas dicotômicas de forma pareada. 
 
EXEMPLO: 
 
Legenda: letra e: conta o número de crianças que teve resfriado aos 12 anos e continua tendo com 14; letra 
h: mostra quem não teve resfriado com 12 ano e não teve; letra f: quem teve resfriado antes e melhorou; 
letra g: crianças que não tinha resfriado com 12 anos e passou a ter com 14 anos. 
Variáveis: resfriado com 12 anos e resfriado com 14 anos. 
 Ou seja, é a mesma variável mensurada em 2 momentos diferentes. 
Pareada: comparou depois de 2 anos se o mesmo grupo apresentava resfriado – ia aumentando ou 
diminuindo? 
P<0,05: indica que mais pessoas pioraram do que melhoraram do resfriado. 
 Houve sim um aumento significante da prevalência de resfriado nessa problemática. 
A!! É um teste não muito usado, porque os testes de medicina usam variáveis numéricas. 
 
 
ANÁLISE INFERENCIAL - HG | Luíza Moura e Vitória Neves 
 
VARIÁVEL CATEGÓRICA-NUMÉRICA 
Se tem variável numérica, tem que avaliar a normalidade (olha lá em cima) 
 
TESTE T INDEPENDENTE OU NÃO PAREADO 
Aplica o teste quando desejar comparar a média em 2 grupos independentes. 
 Ou seja, 1 variável categórica que tem 2 categorias; 
Só que para isso, a variável numérica precisa ser representada por média, porque precisa ter amostra 
normal. 
 Amostra paramétrica: variável numérica; 
Desfecho é numérico. 
 Exemplo: comparar a média de idade das participantes de 2 grupos diferentes. 
 Usa esse teste, caso a variável idade tenha distribuição normal. 
 
Legenda: variável categórica (remédio e placebo); variável numérica (PAS) – tendo essa VARIÁVEL 
NORMAL, aplica o teste. 
 
 
 
 
 
 
 
ANÁLISE INFERENCIAL - HG | Luíza Moura e Vitória Neves 
EXEMPLO: 
 
Usa o teste T independente, porque o autor usou a variável numérica idade (com média e desvio padrão 
calculado, confiamos que é normal) e a variável categórica “grupo que pertence” (radiofrequência ou 
controle); 
P>0,05: permanece a hipótese nula, dizendo que a idade entre os grupos não é diferente (permanece igual) 
OBSERVAÇÃO: 
Como fazer a análise crítica da análise estatística? 
Toda tabela de artigo diz cada teste que utilizou; 
 Se por algum acaso, nesse exemplo, tivesse outro teste na variável idade e não fosse o teste T 
independente, ele cometeu algum equívoco. 
Qual o problema disso? 
Principalmente para desfecho numérico, porque temos 2 opções (teste paramétrico ou não paramétrico), o 
autor pode trocar o teste para tentar omitir uma significância estatística ou possuir a significância 
estatística. 
 
Então a cascata de avaliação do artigo é: 
 O autor representou por média e desvio padrão (estou atribuindo que é normal), logo ele precisa usar 
os testes paramétricos; 
 Se o autor representou por média de desvio padrão, mas usa os testes NÃO paramétricos, está errado. 
↑ AQUI TRAZEMOS A AVALIAÇÃO CRÍTICA 
Se o autor apresentar mediana e intervalo interquartil e usar teste paramétricos. 
 Não pode acontecer, porque quem estuda as fórmulas dos testesestatísticos sabem que se aplica um 
teste de maneira equivocada quanto à distribuição numérica, pode conseguir uma significância ou não 
através desse equívoco. 
↑ AQUI TAMBÉM TRAZEMOS A AVALIAÇÃO CRÍTICA 
 
ANÁLISE INFERENCIAL - HG | Luíza Moura e Vitória Neves 
TESTE MANN-WHITNEY 
O desfecho numérico deve apresentar uma distribuição assimétrica (não normal) – por isso expressa os 
dados em mediana e intervalo interquartil 
Dois grupos independentes 
Deve ser expresso por mediana e intervalo interquartil 
EXEMPLO: 
 
 
Usa o mann-whitney, porque a variável é expressa em mediana e intervalo interquartil e tem a variável 
categoria em 2 grupos (GC e GT) 
 
TESTE T PAREADO VS. MANN-WHITNEY 
Teste T pareado: variável numérico com distribuição NORMAL - média e desvio padrão 
Mann-Whitney: variável numérico com distribuição NÃO NORMAL - mediana e intervalo interquartil 
AMBOS: tem variável categórica de 2 grupos e uma variável numérica. 
NO ARTIGO: 
 Analisa como foi representado e qual teste utilizou. 
A!! Se não estiver coerente, critica que utilizou os dados de uma forma equivocada. 
 Acende uma luz vermelha, porque levanta uma suspeita que os resultados não seja o que realmente 
foi encontrado. 
 
ANÁLISE INFERENCIAL - HG | Luíza Moura e Vitória Neves 
 TESTE T PAREADO 
Amostra paramétrica 
Dois momentos no mesmo indivíduo: antes e depois; 
Objetivo: comparar a média 
A!! Mesma coisa do Mac-Nemar, mas agora com uma variável numérica 
Exemplo: avaliar se há uma modificação na PA após protocolo de exercício. 
 Variável PA inicial, faz o protocolo de exercício e depois avalia a PA final. 
A!! Se as duas variáveis têm distribuição normal, usa o teste T pareado; mas se uma das variáveis não 
for normal, usa o Wilcoxon sign-rank. 
EXEMPLO: 
 
Nesse artigo, fala que o paciente com SCA vai avaliar a FC, depois vai fazer um teste de caminhada por 6 
minutos e ao final do teste avalia a FC novamente. 
Análise pareada: porque há FC no momento antes do teste e FC depois do teste. 
 Aí tem que avaliar a normalidade das variáveis e fazer o teste correspondente. 
 
ANÁLISE INFERENCIAL - HG | Luíza Moura e Vitória Neves 
 
Qual teste ele utilizou? 
Ele representou na tabela de todas as formas e disse no artigo que ele usou o teste T pareado ou o teste 
Wilcoxon sign-rank. 
 Ou seja, ele não definiu para cada um. 
Não está errado, mas precisa definir qual o teste estatístico para cada variável – depende de uma revista 
criteriosa. 
 Precisa ter um olhar mais crítico. 
Mas então: 
 Se for média, usa o teste T pareado; 
 Se for mediana, usa o teste Wilcoxon sign-rank. 
E a interpretação vai ser a mesma: 
 Se p<0,05 (estatisticamente significante): a FC foi diferente entre os dois momentos – houve aumento 
da FC; 
 
 
 
 
 
 
 
ANÁLISE INFERENCIAL - HG | Luíza Moura e Vitória Neves 
TESTE WILCOXON SIGN-RANK 
Corresponde ao teste T pareado, mas utiliza variáveis numéricas não paramétricas; 
 Representado por mediana, se for gráfico através do box-splot; 
Dois momentos com o mesmo indivíduo. 
EXEMPLO: REPRESENTAÇÃO GRÁFICA BOX-SPLOT 
 
O autor avalia o escore de QV no momento da admissão nos pacientes que teve IAM. 
 Normalmente através de um questionário com 5 perguntas bem rápidas. 
Trouxe a mediana de 33,3 com intervalo interquartil entre 25-50; 
Passou 6 meses após o evento e eles mensuraram novamente a qualidade de vida. 
Tem a variável numérica (antes e depois, porque foi avaliado em 2 momentos) e foi representada por 
mediana. 
 Logo, o teste dessa comparação é o Wilcoxon, porque deixa claro a mediana e intervalo 
interquartil. 
 
 
 
 
 
 
 
 
 
ANÁLISE INFERENCIAL - HG | Luíza Moura e Vitória Neves 
ANOVA 
Quando tem mais de 2 grupos independentes; 
O desfecho numérico com DISTRIBUIÇÃO NORMAL; 
Caso o ANOVA dê um p<0,05 (significante), realiza um test post hoc (Turkey e Bonferroni: mais utilizado 
na bioestatística); 
 O post hoc tem como objetivo identificar quais grupos apresentam médias diferentes. 
EXEMPLO: 
 
Variável classificação do IMC (normal, sobrepeso e obesidade); 
 Ou seja, a variável categórica tem +2 grupos. 
E o autor quer comparar se a função sexual avaliada por um escore (através de um questionário) – se existe 
diferença na função sexual entre esses 3 grupos. 
 
Legenda: FSFI representa todos os domínios (dor, orgasmo...) 
A tabela representa em média e desvio padrão, logo é uma variável numérica com distribuição 
paramétrica (normal) e tem uma variável categórica com 3 grupos. 
Assim, usa o ANOVA. 
 O que ele faz? Compara a média dos 3 grupos e diz se é diferente ou não; 
 Se p<0,05: existe diferença entre os grupos; 
 Mas o ANOVA não diz onde está essa diferença – o primeiro do segundo? Segundo do terceiro? 
Etc. 
 
ANÁLISE INFERENCIAL - HG | Luíza Moura e Vitória Neves 
Então precisa de outro teste que diga essa diferença, aí entra o post hoc. 
 O post hoc deixa específico quem é diferente de quem. 
EXEMPLO: 
 
Representou por média e desvio padrão, logo é paramétrica-normal. 
Utilizou o ANOVA conforme os critérios já descritos, mas não fez o post hoc. 
 Mas afirmou que há diferença nos períodos da gestação e que o 3º trimestre representa o escore menor 
da função sexual – está mais comprometida. 
Significa que está errado? Não, depende muito do que o autor se predispõe a fazer. 
Então não é obrigatório fazer o post hoc, na verdade é indicado. 
↑ AQUI TRAZEMOS A AVALIAÇÃO CRÍTICA 
 O autor poderia ter feito, mas não fez. Mas nesse exemplo é óbvio. 
 
TESTE T NÃO PAREADO VS. ANOVA 
O ANOVA precisa ter >2 grupos; 
Teste T pareado: teste pareado (antes e depois), então difere das duas. 
 
 
 
 
 
ANÁLISE INFERENCIAL - HG | Luíza Moura e Vitória Neves 
KRUSKAL-WALLIS 
É semelhante ao ANOVA, mas o desfecho é numérico com distribuição NÃO PARAMÉTRICA – NÃO 
NORMAL – tem representação com mediana e intervalo interquartil ou representação gráfica de BOX-
SPLOT 
Quando tem + de 2 independentes. 
EXEMPLO: 
 
O estudo quis avaliar 100 atletas que tem alto impacto no assoalho pélvico e queriam saber se o volume 
de treino, o nível de ranking das atletas nas competições mundiais estava associado com a perda urinária. 
 
Representado em BOX-SPLOT: mediana e intervalo interquartil; 
Há 3 grupos divididos quanto ao volume de treino. 
 
 
 
 
 
 
 
 
ANÁLISE INFERENCIAL - HG | Luíza Moura e Vitória Neves 
VARIÁVEL NUMÉRICA-NUMÉRICA 
 
 
CORRELAÇÃO PEARSON 
2 variações numéricas; 
 As 2 precisam apresentar uma distribuição normal. 
A ideia é dizer que 2 variáveis estão correlacionadas. 
EXEMPLO: 
 
 
A correlação acontece quando as 2 variáveis (X e Y) tem alguma relação entre si. 
Essa correlação utiliza: 
1. Valor de p; 
2. Coeficientes de correlação: é a inclinação da reta. 
 Se tem 2 variáveis e quanto mais próximas do ângulo de 45º (mostrando que quando aumenta uma 
variável aumenta a outra na mesma proporção). 
 Isso seria a correlação de 1, a correlação perfeita, porque a cada aumento da variável X, aumenta 
na mesma proporção a variável Y; 
 Pode ser positiva ou negativa, porque pode ter gráfico “subindo” – aumenta X e Y OU negativa, 
quando diminui X e diminui Y. 
 Quanto mais perto de -1 e +1, mais forte a correlação entre essas 2 variáveis. 
Só que para dizer que uma variável é correlacionada com a outra, precisa olhar o valor de p. 
 p<0,05: significa que existe correlação; 
 p>0,05: não olha o valor de coeficiente, porque é estatisticamente insignificante. 
Aí DEPOIS DE OLHAR O VALOR DE P, olha o valor do coeficiente: 
 
ANÁLISE INFERENCIAL - HG | Luíza Moura e Vitória Neves 
 Quanto mais próximo de -1, ou de 1, mais forte é. 
 
 
 
Legenda: ângulo de 45º 
EXEMPLO: 
 
Legenda: R: coeficiente de correlação. Quanto mais próxima de 1, mais perfeita a correlação 
 
 
 
 
 
 
 
 
ANÁLISE INFERENCIAL - HG | Luíza Moura e Vitória Neves 
EXEMPLO:O estudo correlaciona o IMC com a circunferência da cintura em homens e mulheres com p<0,05. 
 Tem 2 variáveis numéricas: IMC e circunferência da cintura 
Então o estudo revela que os funcionários têm uma correlação de quanto maior a circunferência da cintura, 
maior o IMC. 
EXEMPLO: 
 
2 variáveis numéricas: 
 Número de prêmios nobel em comparação com o consumo de chocolate/kg/país 
Para correlacionar que quanto maior o consumo de chocolate, maior o número de prêmios nobel. 
 P<0,05; 
 R = 0.791: comparação moderada. 
 
ANÁLISE INFERENCIAL - HG | Luíza Moura e Vitória Neves 
CORRELAÇÃO SPEARMAN 
2 variáveis numéricas: 
 Pelo menos 1 necessita apresentar uma distribuição não paramétrica. 
Não muda nada com relação a interpretação dos dados (valor de p, r), em comparação à Correlação Pearson. 
EXEMPLO: 
 
Comparou o escore da perda urinária e a hora do tempo de treino por semana: 
 2 variáveis numéricas; 
 Tem p<0,05: estatisticamente significante; 
 R: fraco. 
EXEMPLO: 
 
 
 
Comparou a perda urinária com o ranking nas competições: 
 2 variáveis numéricas; 
 Tem p<0,05: estatisticamente significante; 
 R: moderada.

Outros materiais