Tabela de Variáveis Epidemiológicas e Estatística Médica

•

UFES

0

Lucas Brumatti Setubal

12/09/2022

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Epidemiologia

28.564 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Variáveis quantitativas Variáveis categóricas/ Qualitativas
O que são/ tipos - Discretas
- resultado de contagens
- números inteiros
- Contínuas
- resultado de medidas
- números reais
- Nominal
- ordem não importa
- Ordinal
- ordem importa
Gráficos
utilizados
Histograma: gráfico de barras justapostas em que a
linha vertical é a frequência e a linha horizontal é a
variável contínua divida em suas respectivas classes.
Polígono de frequências: a partir do histograma,
une-se por meio de segmentos de reta o ponto médio
de cada classe.
Ogiva: na horizontal estão os intervalos de classe e
no vertical estão as porcentagens acumuladas. é uma
poligonal ascendente de frequências acumuladas.
Função: determinar rapidamente um valor de medida
de posição central (ex. mediana).
Diagrama de barras: o tamanho de cada barra é proporcional ao
número de indivíduos da categoria.
Boxplot: Serve para ver a distribuição dos valores,
onde tem mais ou onde tem menos variabilidade.
Tem-se 25% do número de indivíduos em cada
segmento do gráfico. O tamanho pode variar pois em
um grupo de indivíduos os valores variam mais que
em outros. Quando há dois valores centrais, tira-se a
média entre eles. LEMBRAR QUE ALÉM DE DEIXAR
25% ABAIXO DE Q1 TEMOS QUE DEIXAR 75%
ACIMA.
Síntese
numérica
Sintetizar em apenas um valor que geralmente marca
a posição central dessa posição e a variabilidade ao
entorno dela
- Medidas de posição ou tendência central
- Centro da distribuição → quando se trata de
um intervalo, deve-se usar o valor
intermediário das classes na média e o
proporcional na mediana. A moda se vê pelo
intervalo de maior frequência → ponderação
para estimar o valor → Mo= limite inferior +
amplitude * (frequência da classe sup (f da
classe sup + fa da classe inf))
- Assimetria entre os dados = mediana é
melhor que a média aritmética. A média tem
mais precisão
- Medidas de variabilidade ou dispersão
- Medidas de assimetria
- Medidas de achatamento (marcam o formato
da curva de distribuição)
Medidas de
variabilidade
Coeficiente de variação de Pearson (V)
V= DESVIO PADRÃO/MÉDIA
Escore padronizado Z → curva de Gauss
Z = valor da variável - média/ desvio padrão
Assim contamos quantos desvios padrão esse valor
está distante da média.
Caracterização
estatística
Variáveis contínuas:
- Distribuição de Gauss (teoria dos erros
aleatórios) → SIMÉTRICO
- Maior distribuição de valores
concentrados em torno da média
- Cada intervalo é estabelecido por 1
desvio padrão → a partir da média
- 50% dos valores estão abaixo e 50%
acima da média
- Os valores extremos nunca chegam a
100% pois sempre temos um resíduo
de probabilidade
- Padronização: faz com que o 0 seja a
média e cada desvio padrão comece a
valer 1.
- Associa-se a distribuição real a uma
curva Z → tabela de distribuição
probabilística → o Z é a quantidade de
desvios padrões em relação a média →
fazer regra de 3
- Valores acima da média: +
- Valores abaixo da média: -
- Aumentando a amostra é possível
ampliar a base da curva
OBS: para variáveis que não seguem a distribuição de
Gauss, devemos encontrar o percentil correspondente
Variáveis ordinais:pouco usado na medicina
Variáveis categóricas: Distribuição binomial de probabilidades
→ Probabilidade de eventos independentes acontecerem em série
de observações
→ NÃO É DISTRIBUIÇÃO DE GAUSS POIS CHEGA AO 0,
GAUSS NÃO CHEGA
- Distribuição de Poisson
Testes Variáveis contínuas:
→ Teste T de student →avalia a diferença entre duas
médias em variáveis contínuas que seguem a
distribuição de gauss
- Usado para comparar médias de amostras
independentes
- Quando for usado para amostras
pareadas deve ser ajustado
- T fica associado a um valor de probabilidade
que me mostra se a diferença é ou não
significativa → se o valor na tabela for maior
que 0,05 digo que a diferença não é
significativa
- Calcular os graus de liberdade para olhar a
tabela → (n1-1) + (n2-1)
- Os graus de liberdade correspondem a
um fator de correção
- PARA AMOSTRAS MENORES QUE 30
→ TESTE Z → para amostras maiores que 30
- usado para comparar
- pode ser usado para comparar médias e
proporções
→ Teste de Pearson (Qui-quadrado) → com base na distribuição
binomial
- Avalia quanto o acaso foi responsável pela diferença
observada
- O valor de P me mostra essa probabilidade de ter
acontecido ao acaso → aí eu vou jogar na tabela
- Fo → frequência observada
- Fe → frequência esperada (é a hipótese nula)
- Aqui, quanto maior grau de liberdade, mais resíduos
- Vamos usar sempre 1
→ Regressão logística multivariada → avalia diversas variáveis
que eu suponho que sejam fatores de risco para o desfecho
- Vai descartar variáveis de confusão
- duas amostras
→ Testes não paramétricos → para variáveis
contínuas que não seguem a distribuição de Gauss
- Teste de Mann-whitney
- Vai verificar a dispersão dos valores em
torno da mediana
- Teste de Wilcoxom
Risco relativo e
razão de
chances
Razão de incidência → RISCO RELATIVO
- incidência nos expostos dividido pela incidência nos não
expostos
Razão das chances → ODDS RATIO
- Usado em estudos retrospectivos
Notação
estatística
Estudos Observacionais → pesquisador não
participa do que acontece
Estudos experimentais → pesquisador
interfere e propõe uma intervenção. Possuem
grupo controle
Relato de casos
- Base individual
- 1 ou grupo pequeno de pacientes
- Faz descrição inicial de novas doenças
Ensaio clínico
- Base individual
- Compara duas intervenções:
experimental e de controle
Testes de significância estatística →
avaliação do efeito de novos tratamentos e
medicamentos
Série de casos
- Base individual
Transversal
- Base individual
- Tem elementos comuns aos analíticos,
mas não é analítico pois não há uma
cronologia de fatos, assim não dá pra
estabelecer uma relação de causalidade
- Doença e exposição: medidas
simultaneamente ou em curto período de
tempo
- População inteira ou amostra da
população
- Bom para prevalência → usado em
planejamento em saúde
Ensaio de comunidade
- Base agregada → usa comunidades
inteiras
- Intervenções a nível de comunidade no
grupo de intervenção
-
Ecológico
- Estudo agregado
- Informação sobre doença e exposição
em grupos populacionais
- Grupos comparando exposição e
doença
- Pode ser longitudinal ou colhido em um
único momento
- Só avalia níveis médios de exposição
Testes de significância estatística →
investigação de associação entre fatores de
risco e desfechos
Coorte
- O que define a disposição dos grupos é a
exposição → compara um grupo de
expostos com um grupo de não expostos
- Retrospectivo ou prospectivo
- Parte da exposição buscando o desfecho
- Investigar prognóstico
Caso-controle
- O que define a disposição dos grupos é o
desfecho → presente= caso e ausente=
controle
- Sempre retrospectivo
- Parte do desfecho para a exposição
- Viés associado → viés de seleção
Descritivos: não tem grupo controle. Descrevem situações e elaboram hipóteses.
Analíticos: testam e comprovam hipóteses. Devem ter grupo controle.
Avaliação de testes diagnósticos
→ Olhar para a doença e perguntar pelo teste (É SOBRE A DOENÇA)
→ São intrínsecas ao teste, se as condições não mudam elas ficam iguais
→ Maior rigor na definição de positivo no que tange ao ponto de corte → perde-se
sensibilidade e ganha especificidade
→ Melhor balanço sensibilidade/especificidade → joelho da curva de ROC
Sensibilidade Especificidade
Nos casos com doença presente, em quantos o
teste mostra a presença da doença de forma
correta
Nos casos em que não tem a doença, em
quantos o teste mostra a doença ausente de
forma correta
S = T+ / D+ (a / a+c) S = T- / D- (b / b+d)
Verdadeiros positivos Verdadeiros negativos
É capaz de excluir a doença É capaz de confirmar a doença
Diminui à medida que o número de falsos
negativos aumentam
Aumenta à medida que o número de falsos
positivos aumenta
Aumentada por testes em paralelo Aumentada em testes em série
Valores preditivos
→ Olhar para o teste e perguntar pela doença (É SOBRE O TESTE)
→ Dependem da prevalência
- Quandoder a prevalência, deve-se fazer uma nova tabela com o raciocínio de “regra
de 3” onde a porcentagem da prevalência é analisada como doença positiva (a+c)
em relação ao todo
Valor preditivo positivo (VPP) Valor preditivo negativo (VPN)
Em todos os que tem teste positivo qual a
probabilidade do indivíduo estar doente de fato?
Em todos os que têm o teste negativo, qual a
probabilidade do indivíduo não estar doente de
fato?
VPP = D+ / T+ VPN = D- / T-
VPP = com doença e teste acerta (a =
verdadeiros positivos)/ teste positivo (a+b)
VPN = sem doença e teste acerta (d =
verdadeiros negativos) /teste negativo (c+d)
Quanto o teste prediz a doença Quanto o teste prediz a ausência da doença
Maior quanto maior for a prevalência Menor quanto menor for a prevalência
Conceitos importantes
- Precisão → não há erros aleatórios
- Amostras grandes evitam esse erro
- Boa quando o intervalo de confiança é mais curto
- Viés → erros sistêmicos
- Viés de seleção
- Critérios que influenciam na escolha de indivíduos
- Viés de informação
- Coleta de dados
- Variáveis de confusão
- Acurácia → contrário de viés
- Intervalo de confiança → margem de erro
- Odds Ratio (razão das chances)
- razão dos produtos cruzados
- Evento de baixa probabilidade → acaso
- Poder do teste = 1-b → indica o quanto eu sou capaz de evitar o erro do tipo II
- Aceitável é acima de 80%
- Erro padrão → é uma estimativa da variabilidade da população tendo por base o
valor da amostra
- Medida do efeito → medida da distância da diferença observada, a quantidade de
diferença que existe entre duas observações