Resumo - Análise inferencial

•

UNIME

13

0

13

0

Dupla Med

03.11.2021

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 3, do total de 18 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 6, do total de 18 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 9, do total de 18 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Análise Estatística

10.026 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

ANÁLISE INFERENCIAL - HG | Luíza Moura e Vitória Neves
ANÁLISE INFERENCIAL
O QUE É?
Fornece uma informação para a população a partir de uma amostra.
 É uma análise estatística;
 Usam a matemática para fazer as estimativas (sabe se algo funciona ou não).
Exemplo: estudo fase 3 das vacinas da COVID-19.
 Mostra a taxa de mortalidade, eficácia etc.

Teste de hipóteses = teste estatístico que dá o “poder” de extrapolar os dados para a população
O QUE PRECISA SABER?
 Tipo de variável: categórica ou numérica?
 Objetivo do estudo;
 O que pretende ser analisado;
 Distribuição da amostra: paramétrica ou não paramétrica;
 Pareado ou Não Pareado?
TIPO DE VARIÁVEL: CATEGÓRICA OU NUMÉRICA?
Precisa ter 2 variáveis para obter a análise inferencial e isso precisa estar casado com o objetivo do estudo.
 Por exemplo: quer avaliar a qualidade do sono dos alunos de medicina no ensino PBL e no tradicional.
Nesse cenário tem 2 variáveis (escore do sono e a metodologia de ensino).
A!! Se tiver só 1 variável, configura-se como análise descritiva.
 Isso porque não testa nada, apenas avalia a qualidade do sono.
VOCÊ DEVE SE PERGUNTA:
Se eu tenho as variáveis, de que tipo elas são? Categórica ou numérica?
 Exemplo: a metodologia de ensino representa a variável categórica; e o escore do sono é numérica;
 Então eu sei o objetivo do estudo: comparar o escore do sono de acordo à metodologia de
ensino;
 E sei também o que pretende ser analisado.

ANÁLISE INFERENCIAL - HG | Luíza Moura e Vitória Neves
RELEMBRANDO AS VARIÁVEIS

DISTRIBUIÇÃO DA AMOSTRA: PARAMÉTRICA OU NÃO PARAMÉTRICA
Se eu tenho uma variável numérica na minha análise, preciso avaliar a normalidade desse escore para
definir se vai representar por média e por mediana;
E mais, se vai usar teste paramétrico (sinônimo de normalidade) ou não paramétrico (sinônimo de não
normal).
 Então se tem o escore de sono e ela se comportou normal, usa os testes paramétricos.
COMO AVALIAR A NORMALIDADE?
ESTATÍSTICA DESCRITIVA:
 Observar histograma: análise gráfica que mostra a distribuição da variável numérica e se ela se
assemelha a curva de Gauss;
 Observar tamanho do desvio-padrão: avaliar se o desvio está até 50% da média;
 Observar diferença entre média e mediana: quanto mais próxima a média da mediana, melhor;
 Skewness: avalia simetria da curva – entre – entre -5 e +5;
 Kurtosis: determina curva achatada e curva apiculada – entre -5 e +5;
TESTES ESTATÍSTICOS PARA A AVALIAR A NORMALIDADE:
 Kolmogorov-smirnov: amostras >50 pessoas;
 Shapiro-wilk: amostra <50 pessoas.
Nula: não há variabilidade – Amostra normal (p>0,05);
Alternativa: há variabilidade – Amostra não normal (p<0,05).
PAREADO OU NÃO PAREADO?
Pareado: quando o mesmo indivíduo é avaliado aquela variável em 2 momentos diferentes - antes e
depois.
 Exemplo: quero testar se há redução da PA em pacientes submetidos a determinado exercício físico –
então tem a varíavel PA antes do exercício e PA depois do exercício.
Não pareado: indivíduos avaliados em um único momento; grupo distintos.
 Exemplo: comparar o escore de sono da galera da UNIME no PBL e galera da UFBA no tradicional.

ANÁLISE INFERENCIAL - HG | Luíza Moura e Vitória Neves

PARA NÃO ERRAR A ANÁLISE DO TESTE ESTATÍSTO:
 Precisa saber o tipo de variável, a distribuição da amostra em normal e não normal e conceito de
pareado ou não pareado.
VARIÁVEL CATEGÓRICA-CATEGÓRICA

QUI-QUADRADO
 Teste estatístico que compara variáveis categóricas;
 Tem como objetivo determinar a associação;
 Tem a mesma interpretação que o valor de p.
EXEMPLO:

Aí tem 2 variáveis categóricas: diabetes e sexo
 Se faz essa comparação e encontra p<0,05, significa que existe diferença entre a taxa de diabético
entre homem e mulher;
 Se p>0,05, indica que é igual – não existe diferença entre a taxa de diabético entre homem e mulher.

P>0,05, então indica que não existe diferença entre a taxa de diabético entre homem e mulher.

ANÁLISE INFERENCIAL - HG | Luíza Moura e Vitória Neves
EXEMPLO:

 Variáveis categóricas: climatério (sim ou não) e grupo que pertence (radiofrequência ou controle);
 Não pareado.
Então utilizou o qui-quadrado.
 Como valor de p>0,05, revela que não há diferença na proporção de mulheres que estão no
climatério no grupo radio comparado ao grupo controle.
EXEMPLO:

2 variáveis categóricas: complicação pulmonar (sim ou não) e grupo que pertence (G1: fez fisio; G2: não fez
fisio)
Não pareado: porque não avaliou com a mesma variável (G1 e G2)
P<0,05: implica que há diferença na taxa de complicação entre o grupo que fez fisioterapia e o outro que
não fez fisio
 Ou seja, quem fez fisio teve menos complicação que o grupo que não fez fisio nesse artigo.

ANÁLISE INFERENCIAL - HG | Luíza Moura e Vitória Neves
MAC-NEMAR
Precisa que ter 2 variáveis categóricas dicotômicas de forma pareada.

EXEMPLO:

Legenda: letra e: conta o número de crianças que teve resfriado aos 12 anos e continua tendo com 14; letra
h: mostra quem não teve resfriado com 12 ano e não teve; letra f: quem teve resfriado antes e melhorou;
letra g: crianças que não tinha resfriado com 12 anos e passou a ter com 14 anos.
Variáveis: resfriado com 12 anos e resfriado com 14 anos.
 Ou seja, é a mesma variável mensurada em 2 momentos diferentes.
Pareada: comparou depois de 2 anos se o mesmo grupo apresentava resfriado – ia aumentando ou
diminuindo?
P<0,05: indica que mais pessoas pioraram do que melhoraram do resfriado.
 Houve sim um aumento significante da prevalência de resfriado nessa problemática.
A!! É um teste não muito usado, porque os testes de medicina usam variáveis numéricas.

ANÁLISE INFERENCIAL - HG | Luíza Moura e Vitória Neves

VARIÁVEL CATEGÓRICA-NUMÉRICA
Se tem variável numérica, tem que avaliar a normalidade (olha lá em cima)

TESTE T INDEPENDENTE OU NÃO PAREADO
Aplica o teste quando desejar comparar a média em 2 grupos independentes.
 Ou seja, 1 variável categórica que tem 2 categorias;
Só que para isso, a variável numérica precisa ser representada por média, porque precisa ter amostra
normal.
 Amostra paramétrica: variável numérica;
Desfecho é numérico.
 Exemplo: comparar a média de idade das participantes de 2 grupos diferentes.
 Usa esse teste, caso a variável idade tenha distribuição normal.

Legenda: variável categórica (remédio e placebo); variável numérica (PAS) – tendo essa VARIÁVEL
NORMAL, aplica o teste.

ANÁLISE INFERENCIAL - HG | Luíza Moura e Vitória Neves
EXEMPLO:

Usa o teste T independente, porque o autor usou a variável numérica idade (com média e desvio padrão
calculado, confiamos que é normal) e a variável categórica “grupo que pertence” (radiofrequência ou
controle);
P>0,05: permanece a hipótese nula, dizendo que a idade entre os grupos não é diferente (permanece igual)
OBSERVAÇÃO:
Como fazer a análise crítica da análise estatística?
Toda tabela de artigo diz cada teste que utilizou;
 Se por algum acaso, nesse exemplo, tivesse outro teste na variável idade e não fosse o teste T
independente, ele cometeu algum equívoco.
Qual o problema disso?
Principalmente para desfecho numérico, porque temos 2 opções (teste paramétrico ou não paramétrico), o
autor pode trocar o teste para tentar omitir uma significância estatística ou possuir a significância
estatística.

Então a cascata de avaliação do artigo é:
 O autor representou por média e desvio padrão (estou atribuindo que é normal), logo ele precisa usar
os testes paramétricos;
 Se o autor representou por média de desvio padrão, mas usa os testes NÃO paramétricos, está errado.
↑ AQUI TRAZEMOS A AVALIAÇÃO CRÍTICA
Se o autor apresentar mediana e intervalo interquartil e usar teste paramétricos.
 Não pode acontecer, porque quem estuda as fórmulas dos testesestatísticos sabem que se aplica um
teste de maneira equivocada quanto à distribuição numérica, pode conseguir uma significância ou não
através desse equívoco.
↑ AQUI TAMBÉM TRAZEMOS A AVALIAÇÃO CRÍTICA

ANÁLISE INFERENCIAL - HG | Luíza Moura e Vitória Neves
TESTE MANN-WHITNEY
O desfecho numérico deve apresentar uma distribuição assimétrica (não normal) – por isso expressa os
dados em mediana e intervalo interquartil
Dois grupos independentes
Deve ser expresso por mediana e intervalo interquartil
EXEMPLO:

Usa o mann-whitney, porque a variável é expressa em mediana e intervalo interquartil e tem a variável
categoria em 2 grupos (GC e GT)

TESTE T PAREADO VS. MANN-WHITNEY
Teste T pareado: variável numérico com distribuição NORMAL - média e desvio padrão
Mann-Whitney: variável numérico com distribuição NÃO NORMAL - mediana e intervalo interquartil
AMBOS: tem variável categórica de 2 grupos e uma variável numérica.
NO ARTIGO:
 Analisa como foi representado e qual teste utilizou.
A!! Se não estiver coerente, critica que utilizou os dados de uma forma equivocada.
 Acende uma luz vermelha, porque levanta uma suspeita que os resultados não seja o que realmente
foi encontrado.

ANÁLISE INFERENCIAL - HG | Luíza Moura e Vitória Neves
TESTE T PAREADO
Amostra paramétrica
Dois momentos no mesmo indivíduo: antes e depois;
Objetivo: comparar a média
A!! Mesma coisa do Mac-Nemar, mas agora com uma variável numérica
Exemplo: avaliar se há uma modificação na PA após protocolo de exercício.
 Variável PA inicial, faz o protocolo de exercício e depois avalia a PA final.
A!! Se as duas variáveis têm distribuição normal, usa o teste T pareado; mas se uma das variáveis não
for normal, usa o Wilcoxon sign-rank.
EXEMPLO:

Nesse artigo, fala que o paciente com SCA vai avaliar a FC, depois vai fazer um teste de caminhada por 6
minutos e ao final do teste avalia a FC novamente.
Análise pareada: porque há FC no momento antes do teste e FC depois do teste.
 Aí tem que avaliar a normalidade das variáveis e fazer o teste correspondente.

ANÁLISE INFERENCIAL - HG | Luíza Moura e Vitória Neves

Qual teste ele utilizou?
Ele representou na tabela de todas as formas e disse no artigo que ele usou o teste T pareado ou o teste
Wilcoxon sign-rank.
 Ou seja, ele não definiu para cada um.
Não está errado, mas precisa definir qual o teste estatístico para cada variável – depende de uma revista
criteriosa.
 Precisa ter um olhar mais crítico.
Mas então:
 Se for média, usa o teste T pareado;
 Se for mediana, usa o teste Wilcoxon sign-rank.
E a interpretação vai ser a mesma:
 Se p<0,05 (estatisticamente significante): a FC foi diferente entre os dois momentos – houve aumento
da FC;

ANÁLISE INFERENCIAL - HG | Luíza Moura e Vitória Neves
TESTE WILCOXON SIGN-RANK
Corresponde ao teste T pareado, mas utiliza variáveis numéricas não paramétricas;
 Representado por mediana, se for gráfico através do box-splot;
Dois momentos com o mesmo indivíduo.
EXEMPLO: REPRESENTAÇÃO GRÁFICA BOX-SPLOT

O autor avalia o escore de QV no momento da admissão nos pacientes que teve IAM.
 Normalmente através de um questionário com 5 perguntas bem rápidas.
Trouxe a mediana de 33,3 com intervalo interquartil entre 25-50;
Passou 6 meses após o evento e eles mensuraram novamente a qualidade de vida.
Tem a variável numérica (antes e depois, porque foi avaliado em 2 momentos) e foi representada por
mediana.
 Logo, o teste dessa comparação é o Wilcoxon, porque deixa claro a mediana e intervalo
interquartil.

ANÁLISE INFERENCIAL - HG | Luíza Moura e Vitória Neves
ANOVA
Quando tem mais de 2 grupos independentes;
O desfecho numérico com DISTRIBUIÇÃO NORMAL;
Caso o ANOVA dê um p<0,05 (significante), realiza um test post hoc (Turkey e Bonferroni: mais utilizado
na bioestatística);
 O post hoc tem como objetivo identificar quais grupos apresentam médias diferentes.
EXEMPLO:

Variável classificação do IMC (normal, sobrepeso e obesidade);
 Ou seja, a variável categórica tem +2 grupos.
E o autor quer comparar se a função sexual avaliada por um escore (através de um questionário) – se existe
diferença na função sexual entre esses 3 grupos.

Legenda: FSFI representa todos os domínios (dor, orgasmo...)
A tabela representa em média e desvio padrão, logo é uma variável numérica com distribuição
paramétrica (normal) e tem uma variável categórica com 3 grupos.
Assim, usa o ANOVA.
 O que ele faz? Compara a média dos 3 grupos e diz se é diferente ou não;
 Se p<0,05: existe diferença entre os grupos;
 Mas o ANOVA não diz onde está essa diferença – o primeiro do segundo? Segundo do terceiro?
Etc.

ANÁLISE INFERENCIAL - HG | Luíza Moura e Vitória Neves
Então precisa de outro teste que diga essa diferença, aí entra o post hoc.
 O post hoc deixa específico quem é diferente de quem.
EXEMPLO:

Representou por média e desvio padrão, logo é paramétrica-normal.
Utilizou o ANOVA conforme os critérios já descritos, mas não fez o post hoc.
 Mas afirmou que há diferença nos períodos da gestação e que o 3º trimestre representa o escore menor
da função sexual – está mais comprometida.
Significa que está errado? Não, depende muito do que o autor se predispõe a fazer.
Então não é obrigatório fazer o post hoc, na verdade é indicado.
↑ AQUI TRAZEMOS A AVALIAÇÃO CRÍTICA
 O autor poderia ter feito, mas não fez. Mas nesse exemplo é óbvio.

TESTE T NÃO PAREADO VS. ANOVA
O ANOVA precisa ter >2 grupos;
Teste T pareado: teste pareado (antes e depois), então difere das duas.

ANÁLISE INFERENCIAL - HG | Luíza Moura e Vitória Neves
KRUSKAL-WALLIS
É semelhante ao ANOVA, mas o desfecho é numérico com distribuição NÃO PARAMÉTRICA – NÃO
NORMAL – tem representação com mediana e intervalo interquartil ou representação gráfica de BOX-
SPLOT
Quando tem + de 2 independentes.
EXEMPLO:

O estudo quis avaliar 100 atletas que tem alto impacto no assoalho pélvico e queriam saber se o volume
de treino, o nível de ranking das atletas nas competições mundiais estava associado com a perda urinária.

Representado em BOX-SPLOT: mediana e intervalo interquartil;
Há 3 grupos divididos quanto ao volume de treino.

ANÁLISE INFERENCIAL - HG | Luíza Moura e Vitória Neves
VARIÁVEL NUMÉRICA-NUMÉRICA

CORRELAÇÃO PEARSON
2 variações numéricas;
 As 2 precisam apresentar uma distribuição normal.
A ideia é dizer que 2 variáveis estão correlacionadas.
EXEMPLO:

A correlação acontece quando as 2 variáveis (X e Y) tem alguma relação entre si.
Essa correlação utiliza:
1. Valor de p;
2. Coeficientes de correlação: é a inclinação da reta.
 Se tem 2 variáveis e quanto mais próximas do ângulo de 45º (mostrando que quando aumenta uma
variável aumenta a outra na mesma proporção).
 Isso seria a correlação de 1, a correlação perfeita, porque a cada aumento da variável X, aumenta
na mesma proporção a variável Y;
 Pode ser positiva ou negativa, porque pode ter gráfico “subindo” – aumenta X e Y OU negativa,
quando diminui X e diminui Y.
 Quanto mais perto de -1 e +1, mais forte a correlação entre essas 2 variáveis.
Só que para dizer que uma variável é correlacionada com a outra, precisa olhar o valor de p.
 p<0,05: significa que existe correlação;
 p>0,05: não olha o valor de coeficiente, porque é estatisticamente insignificante.
Aí DEPOIS DE OLHAR O VALOR DE P, olha o valor do coeficiente:

ANÁLISE INFERENCIAL - HG | Luíza Moura e Vitória Neves
 Quanto mais próximo de -1, ou de 1, mais forte é.

Legenda: ângulo de 45º
EXEMPLO:

Legenda: R: coeficiente de correlação. Quanto mais próxima de 1, mais perfeita a correlação

ANÁLISE INFERENCIAL - HG | Luíza Moura e Vitória Neves
EXEMPLO:O estudo correlaciona o IMC com a circunferência da cintura em homens e mulheres com p<0,05.
 Tem 2 variáveis numéricas: IMC e circunferência da cintura
Então o estudo revela que os funcionários têm uma correlação de quanto maior a circunferência da cintura,
maior o IMC.
EXEMPLO:

2 variáveis numéricas:
 Número de prêmios nobel em comparação com o consumo de chocolate/kg/país
Para correlacionar que quanto maior o consumo de chocolate, maior o número de prêmios nobel.
 P<0,05;
 R = 0.791: comparação moderada.

ANÁLISE INFERENCIAL - HG | Luíza Moura e Vitória Neves
CORRELAÇÃO SPEARMAN
2 variáveis numéricas:
 Pelo menos 1 necessita apresentar uma distribuição não paramétrica.
Não muda nada com relação a interpretação dos dados (valor de p, r), em comparação à Correlação Pearson.
EXEMPLO:

Comparou o escore da perda urinária e a hora do tempo de treino por semana:
 2 variáveis numéricas;
 Tem p<0,05: estatisticamente significante;
 R: fraco.
EXEMPLO:

Comparou a perda urinária com o ranking nas competições:
 2 variáveis numéricas;
 Tem p<0,05: estatisticamente significante;
 R: moderada.