Baixe o app para aproveitar ainda mais
Prévia do material em texto
Variáveis quantitativas Variáveis categóricas/ Qualitativas O que são/ tipos - Discretas - resultado de contagens - números inteiros - Contínuas - resultado de medidas - números reais - Nominal - ordem não importa - Ordinal - ordem importa Gráficos utilizados Histograma: gráfico de barras justapostas em que a linha vertical é a frequência e a linha horizontal é a variável contínua divida em suas respectivas classes. Polígono de frequências: a partir do histograma, une-se por meio de segmentos de reta o ponto médio de cada classe. Ogiva: na horizontal estão os intervalos de classe e no vertical estão as porcentagens acumuladas. é uma poligonal ascendente de frequências acumuladas. Função: determinar rapidamente um valor de medida de posição central (ex. mediana). Diagrama de barras: o tamanho de cada barra é proporcional ao número de indivíduos da categoria. Boxplot: Serve para ver a distribuição dos valores, onde tem mais ou onde tem menos variabilidade. Tem-se 25% do número de indivíduos em cada segmento do gráfico. O tamanho pode variar pois em um grupo de indivíduos os valores variam mais que em outros. Quando há dois valores centrais, tira-se a média entre eles. LEMBRAR QUE ALÉM DE DEIXAR 25% ABAIXO DE Q1 TEMOS QUE DEIXAR 75% ACIMA. Síntese numérica Sintetizar em apenas um valor que geralmente marca a posição central dessa posição e a variabilidade ao entorno dela - Medidas de posição ou tendência central - Centro da distribuição → quando se trata de um intervalo, deve-se usar o valor intermediário das classes na média e o proporcional na mediana. A moda se vê pelo intervalo de maior frequência → ponderação para estimar o valor → Mo= limite inferior + amplitude * (frequência da classe sup (f da classe sup + fa da classe inf)) - Assimetria entre os dados = mediana é melhor que a média aritmética. A média tem mais precisão - Medidas de variabilidade ou dispersão - Medidas de assimetria - Medidas de achatamento (marcam o formato da curva de distribuição) Medidas de variabilidade Coeficiente de variação de Pearson (V) V= DESVIO PADRÃO/MÉDIA Escore padronizado Z → curva de Gauss Z = valor da variável - média/ desvio padrão Assim contamos quantos desvios padrão esse valor está distante da média. Caracterização estatística Variáveis contínuas: - Distribuição de Gauss (teoria dos erros aleatórios) → SIMÉTRICO - Maior distribuição de valores concentrados em torno da média - Cada intervalo é estabelecido por 1 desvio padrão → a partir da média - 50% dos valores estão abaixo e 50% acima da média - Os valores extremos nunca chegam a 100% pois sempre temos um resíduo de probabilidade - Padronização: faz com que o 0 seja a média e cada desvio padrão comece a valer 1. - Associa-se a distribuição real a uma curva Z → tabela de distribuição probabilística → o Z é a quantidade de desvios padrões em relação a média → fazer regra de 3 - Valores acima da média: + - Valores abaixo da média: - - Aumentando a amostra é possível ampliar a base da curva OBS: para variáveis que não seguem a distribuição de Gauss, devemos encontrar o percentil correspondente Variáveis ordinais:pouco usado na medicina Variáveis categóricas: Distribuição binomial de probabilidades → Probabilidade de eventos independentes acontecerem em série de observações → NÃO É DISTRIBUIÇÃO DE GAUSS POIS CHEGA AO 0, GAUSS NÃO CHEGA - Distribuição de Poisson Testes Variáveis contínuas: → Teste T de student →avalia a diferença entre duas médias em variáveis contínuas que seguem a distribuição de gauss - Usado para comparar médias de amostras independentes - Quando for usado para amostras pareadas deve ser ajustado - T fica associado a um valor de probabilidade que me mostra se a diferença é ou não significativa → se o valor na tabela for maior que 0,05 digo que a diferença não é significativa - Calcular os graus de liberdade para olhar a tabela → (n1-1) + (n2-1) - Os graus de liberdade correspondem a um fator de correção - PARA AMOSTRAS MENORES QUE 30 → TESTE Z → para amostras maiores que 30 - usado para comparar - pode ser usado para comparar médias e proporções → Teste de Pearson (Qui-quadrado) → com base na distribuição binomial - Avalia quanto o acaso foi responsável pela diferença observada - O valor de P me mostra essa probabilidade de ter acontecido ao acaso → aí eu vou jogar na tabela - Fo → frequência observada - Fe → frequência esperada (é a hipótese nula) - Aqui, quanto maior grau de liberdade, mais resíduos - Vamos usar sempre 1 → Regressão logística multivariada → avalia diversas variáveis que eu suponho que sejam fatores de risco para o desfecho - Vai descartar variáveis de confusão - duas amostras → Testes não paramétricos → para variáveis contínuas que não seguem a distribuição de Gauss - Teste de Mann-whitney - Vai verificar a dispersão dos valores em torno da mediana - Teste de Wilcoxom Risco relativo e razão de chances Razão de incidência → RISCO RELATIVO - incidência nos expostos dividido pela incidência nos não expostos Razão das chances → ODDS RATIO - Usado em estudos retrospectivos Notação estatística Estudos Observacionais → pesquisador não participa do que acontece Estudos experimentais → pesquisador interfere e propõe uma intervenção. Possuem grupo controle Relato de casos - Base individual - 1 ou grupo pequeno de pacientes - Faz descrição inicial de novas doenças Ensaio clínico - Base individual - Compara duas intervenções: experimental e de controle Testes de significância estatística → avaliação do efeito de novos tratamentos e medicamentos Série de casos - Base individual Transversal - Base individual - Tem elementos comuns aos analíticos, mas não é analítico pois não há uma cronologia de fatos, assim não dá pra estabelecer uma relação de causalidade - Doença e exposição: medidas simultaneamente ou em curto período de tempo - População inteira ou amostra da população - Bom para prevalência → usado em planejamento em saúde Ensaio de comunidade - Base agregada → usa comunidades inteiras - Intervenções a nível de comunidade no grupo de intervenção - Ecológico - Estudo agregado - Informação sobre doença e exposição em grupos populacionais - Grupos comparando exposição e doença - Pode ser longitudinal ou colhido em um único momento - Só avalia níveis médios de exposição Testes de significância estatística → investigação de associação entre fatores de risco e desfechos Coorte - O que define a disposição dos grupos é a exposição → compara um grupo de expostos com um grupo de não expostos - Retrospectivo ou prospectivo - Parte da exposição buscando o desfecho - Investigar prognóstico Caso-controle - O que define a disposição dos grupos é o desfecho → presente= caso e ausente= controle - Sempre retrospectivo - Parte do desfecho para a exposição - Viés associado → viés de seleção Descritivos: não tem grupo controle. Descrevem situações e elaboram hipóteses. Analíticos: testam e comprovam hipóteses. Devem ter grupo controle. Avaliação de testes diagnósticos → Olhar para a doença e perguntar pelo teste (É SOBRE A DOENÇA) → São intrínsecas ao teste, se as condições não mudam elas ficam iguais → Maior rigor na definição de positivo no que tange ao ponto de corte → perde-se sensibilidade e ganha especificidade → Melhor balanço sensibilidade/especificidade → joelho da curva de ROC Sensibilidade Especificidade Nos casos com doença presente, em quantos o teste mostra a presença da doença de forma correta Nos casos em que não tem a doença, em quantos o teste mostra a doença ausente de forma correta S = T+ / D+ (a / a+c) S = T- / D- (b / b+d) Verdadeiros positivos Verdadeiros negativos É capaz de excluir a doença É capaz de confirmar a doença Diminui à medida que o número de falsos negativos aumentam Aumenta à medida que o número de falsos positivos aumenta Aumentada por testes em paralelo Aumentada em testes em série Valores preditivos → Olhar para o teste e perguntar pela doença (É SOBRE O TESTE) → Dependem da prevalência - Quandoder a prevalência, deve-se fazer uma nova tabela com o raciocínio de “regra de 3” onde a porcentagem da prevalência é analisada como doença positiva (a+c) em relação ao todo Valor preditivo positivo (VPP) Valor preditivo negativo (VPN) Em todos os que tem teste positivo qual a probabilidade do indivíduo estar doente de fato? Em todos os que têm o teste negativo, qual a probabilidade do indivíduo não estar doente de fato? VPP = D+ / T+ VPN = D- / T- VPP = com doença e teste acerta (a = verdadeiros positivos)/ teste positivo (a+b) VPN = sem doença e teste acerta (d = verdadeiros negativos) /teste negativo (c+d) Quanto o teste prediz a doença Quanto o teste prediz a ausência da doença Maior quanto maior for a prevalência Menor quanto menor for a prevalência Conceitos importantes - Precisão → não há erros aleatórios - Amostras grandes evitam esse erro - Boa quando o intervalo de confiança é mais curto - Viés → erros sistêmicos - Viés de seleção - Critérios que influenciam na escolha de indivíduos - Viés de informação - Coleta de dados - Variáveis de confusão - Acurácia → contrário de viés - Intervalo de confiança → margem de erro - Odds Ratio (razão das chances) - razão dos produtos cruzados - Evento de baixa probabilidade → acaso - Poder do teste = 1-b → indica o quanto eu sou capaz de evitar o erro do tipo II - Aceitável é acima de 80% - Erro padrão → é uma estimativa da variabilidade da população tendo por base o valor da amostra - Medida do efeito → medida da distância da diferença observada, a quantidade de diferença que existe entre duas observações
Compartilhar