Baixe o app para aproveitar ainda mais
Prévia do material em texto
Mariana Macabú – MedUfes 103 Página 1 de 19 RESUMO DE EPIDEMIOLOGIA II – 2020/01 CONCEITOS BÁSICOS • Variância → A variância de uma amostra {x1,...,xn} de n elementos é definida como a soma ao quadrado dos desvios dos elementos em relação à sua média dividido por (n-1) 1. Calcular a média 2. Subtrair a média de cada valor e elevar o resultado ao quadrado 3. Somar esses novos valores 4. Dividir pelo número total subtraído 1. • Desvio-padrão → O desvio padrão indica em média qual será o "erro" (desvio) cometido ao tentar substituir cada observação pela medida resumo do conjunto de dados (no caso, a média). Desvios padrão muito grandes, próximos ao valor da média, indicam grande variabilidade, e, por extensão, tamanho insuficiente das amostras. O desvio padrão amostral de um conjunto de dados é igual à raiz quadrada da variância amostral. Desta forma, o desvio padrão amostral é dado por • Graus de liberdade → quantidade de informação que os dados de uma pesquisa fornecem e que o pesquisador pode ‘’gastar’’ para estimar os valores de parâmetros populacionais desconhecidos e para calcular a variabilidade dessas estimativas. Esse valor é determinado pelo número de observações em sua amostra e pelo número de parâmetros em seu modelo. o Aumentar o tamanho amostral fornece mais informações sobre a população e, assim, aumenta os graus de liberdade em seus dados. o Adicionar parâmetros ao modelo ‘’gasta’’ informações dos dados e, assim, reduz os graus de liberdade disponíveis para estimar a variabilidade das estimativas de parâmetro. o Exemplo: o teste t para 1 amostra estima apenas um parâmetro: a média populacional. O tamanho amostral de n constitui n informações para a estimativa da média populacional e sua variabilidade. Um grau de liberdade é gasto estimando-se a média, e os n-1 graus de liberdade restantes estimam a variabilidade. Mariana Macabú – MedUfes 103 Página 2 de 19 • Erros-padrão → estimativa do valor do desvio-padrão da população a partir do desvio- padrão da amostra. Por exemplo, na minha amostra o desvio padrão deu 6. Qual é o verdadeiro desvio-padrão na população? o Para descobrir a resposta, é preciso dividir 6 pela raiz quadrada do tamanho da amostra. O resultado mostra o provável desvio-padrão na população (o erro- padrão). Ep = Sp√ 1 N1 + 1 N2 ou , o primeiro é para amostra independente e o segundo é para amostra pareada!!! Atenção! o Para calcular o EP tem que ter o valor da média ponderada dos desvios-padrão (Sp) das amostras. ▪ Para calcular o desvio-padrão ponderado numa amostra de 2 grupos: ▪ Sp2 = (N1−1)⋅S1 2+(N2−1)⋅S2 2 N1+N2−2 GRÁFICOS DIAGRAMA DE BARRAS • Bom para representar variáveis categóricas. • O tamanho de cada barra é proporcional ao número de indivíduos na categoria. HISTOGRAMA • Bom para representar variáveis numéricas contínuas • Gráfico de barras justapostas, no qual, no eixo horizontal, encontra-se a variável de interesse. No eixo vertical, constrói-se um a barra para cada classe com altura igual à frequência absoluta ou relativa correspondente. Mariana Macabú – MedUfes 103 Página 3 de 19 • As barras são centradas em seus respectivos pontos médios, referentes à classe. • Para construir um histograma, é necessário ordenar os dados e escolher uma escala apropriada para sua descrição. POLÍGONO DE FREQUÊNCIA • Bom para representar variáveis numéricas contínuas. • É feito a partir do histograma, ao unir, através de seguimentos de reta, as ordenadas que correspondem aos pontos médios de cada classe. OGIVA • Bom para representar variáveis numéricas contínuas. • É um gráfico de frequências acumuladas. (usualmente relativas). • Trata-se de uma poligonal ascendente. • Para construir uma ogiva, coloca-se no eixo horizontal os intervalos de classe nos quais a variável em estudo foi dividida. Para cada limite de intervalo é assinalado no eixo vertical sua porcentagem acumulada. Em seguida, os pontos marcados são ligados por segmentos de reta. Mariana Macabú – MedUfes 103 Página 4 de 19 • Através desse gráfico, pode-se estimar percentis da distribuição, ou seja, o valor que é precedido por certa porcentagem de interesse pré-estabelecida. Por exemplo, estimar o valor da variável abaixo do qual se tem 50% dos indivíduos. GRÁFICO DE LINHAS • Bom para representar dados temporais. • Coloca-se a escala temporal (ano, mês, dia etc.) no eixo horizontal. • No eixo vertical, coloca-se a variável a ser estudada (frequência, taxa, medida tomada etc.) • Através desses gráficos, é possível constatar algum tipo de tendência e identificar alguns eventos inusitados, como por exemplo, o surto de determinada doença. BOXPLOT • Bom para descrição de dados, visualização de sua variabilidade, comparação entre diferentes grupos. • Também fornece informações importantes sobre o comportamento do conjunto de dados, como simetria e variabilidade. Mariana Macabú – MedUfes 103 Página 5 de 19 o Se a amplitude for muito maior que a DQ e se Q2 estiver mais próxima de Q1 do que Q3, há fortes indicações de assimetria positiva e de grande dispersão das observações. • Para construir esse gráfico é preciso obter as seguintes estatísticas: o 1° quartil (Q1) o A mediana (Q2) o 3° quartil (Q3 o Distância interquartílica (DQ) = Q3 – Q1 • Passo a passo para a construção do boxplot: 1. Numa reta, são marcados Q1, Q2 e Q3. 2. Acima dessa reta, é construído um retângulo com limites iguais às posições de Q1 e Q3, cortado por um segmento de reta na posição relativa à mediana. 3. A partir dos limites do retângulo, traçam-se linhas até encontrar um extremo (valor máximo ou mínimo) OU um valor correspondente a 1,5DQ, se o extremo estiver a mais de 1,5DQ do quartil respectivo • Outliers (observações atípicas): Valores muito grandes ou muito pequenos em relação aos demais. Alteram enormemente as médias e a variabilidade dos grupos a que pertencem e podem até mesmo distorcer as conclusões obtidas. o Causas do aparecimento de outliers: Leitura, anotação ou transcrição incorreta dos dados; erro na execução do experimento ou na tomada da medida; mudanças não controláveis nas condições experimentais ou dos pacientes; característica inerente à variável estudada (por exemplo, grande instabilidade do que está sendo medido). o Ponto externo → distância entre 1,5QD e 3DQ o Ponto solto → distância 𝑚𝑎𝑖𝑜𝑟 𝑞𝑢𝑒 3𝐷𝑄. Possivelmente tem algo errado que fez esse valor ser tão diferente dos outros, vale a pena investigar. o Medidas a serem tomadas: abandoná-lo ou justificá-lo. Mariana Macabú – MedUfes 103 Página 6 de 19 QUALIDADE DE TESTES DIAGNÓSTICOS SENSIBILIDADE • Exclui a doença → probabilidade de o teste ser positivo sabendo-se que o paciente que está sendo testado está, de fato, doente. • S = verdadeiros positivos/verdadeiros positivos + falsos negativos, ou seja, acusou a doença/todos os doentes 𝑠 = 𝑣𝑝 𝑉𝑝+𝐹𝑁 ESPECIFICIDADE • Confirma a doença → probabilidade de o teste ser negativo, sabendo-se que o paciente que está sendo testado é saudável. • E = verdadeiros negativos/verdadeiros negativos + falsos positivos, ou seja, não acusou a doença/todos os saudáveis. E = vN vN+Fp VALORES PREDITIVOS • Variam com a prevalência (P): quanto maior a P., maior o VPP e menor o VPN • VP Positivo → Probabilidade de o paciente estar realmente doente quando o teste é positivo. Melhor quanto maior for a especificidade. o diagnóstico positivo verdadeiro/todos os positivos, ou seja, todos que acusaram a doença e realmente têm a doença/todos que acursaram a doença. VPP = Pv Pt • VP Negativo → Probabilidade de o paciente não estar doente quando o resultado do teste é negativo. Melhor quanto maior for a sensibilidade. o diagnóstico negativoverdadeiro/todos os negativos, ou seja, todos que são saudáveis e não acusaram doença/todos que não acusaram a doença. VPN = Nv Nt • Cálculo da frequência de falso negativo e falso positivo: FFP = Fp/não-doentes FFN = Fn/doentes. VARIÁVEIS | PRECISÃO E ACURÁCIA | VALIDADE, VARIABILIDADE E VIÉS VARIÁVEIS • Numéricas (quantitativas) o Contínuas: pode ter número com vírgula. Ex.: peso, altura. o Discretas: somente números inteiros. Ex.: números de filhos. Mariana Macabú – MedUfes 103 Página 7 de 19 • Categóricas (qualitativas) o Nominais: não-ordenadas. Ex.: sexo (F ou M). ▪ Dicotômicos o Ordinais: ordenadas. Ex.: grau de escolaridade. PRECISÃO E ACURÁCIA • Precisão → Reprodutibilidade de aferições repetidas, ou seja, grau em que uma variável tem valores semelhantes quando medida várias vezes. Ocorrem comparações entre várias medidas. Uma medida de alta precisão é aquela na qual os valores são semelhantes em cada aferição. o É afetada pelo erro aleatório. Quanto maior o erro, menor é a precisão de aferição: ▪ Variabilidade individual: pode ocorrer devido a alterações biológicas em um indivíduo ao longo do tempo. • Frequência cardíaca, temperatura corporal, peso, altura. ▪ Variabilidade do observador: é causada pelo observador e inclui aspectos como a escolha de palavras em uma entrevista e a habilidade de manuseio de um instrumento. ▪ Variabilidade do instrumento: é causada pelo instrumento e inclui mudanças em fatores ambientais (temperatura, por exemplo), desgaste de componentes mecânicos, diferenças entre os lotes dos reagentes etc. ▪ Variabilidade do sujeito: deve-se à variabilidade biológica intrínseca aos sujeitos da pesquisa e não está relacionada às variáveis em estudo. • Dia em que é feito o estudo, tempo decorrido desde a última refeição, medicação. • Acurácia → É a capacidade da variável de representar o valor verdadeiro. Comparada a um padrão-ouro. o É afetada por um erro sistemático: ▪ Viés do observador: é uma distorção, consciente ou inconsciente, na percepção ou no relato da medida pelo observador. • Erros no manuseio do instrumento, uso de perguntas que induzem o entrevistado. ▪ Viés do instrumento: pode resultar de um defeito em um instrumento. • Balança que não foi calibrada, por exemplo. ▪ Viés do sujeito: é uma distorção na aferição originada pelo sujeito do estudo, ao relatar um evento, por exemplo. • Validade → se assemelha à acurácia, mas adiciona uma dimensão qualitativa à avaliação. o Por exemplo: um exame de creatinina e cistatina C séricas, como medida da função renal, ambos podem ter resultados acurados, mas a cistatina C pode ter maior validade nesse caso, já que os níveis de creatinina de são também afetados pela quantidade de massa muscular. Mariana Macabú – MedUfes 103 Página 8 de 19 o Validade interna: nela, os resultados de uma investigação refletem acuradamente a real situação da população em estudo. Um estudo é internamente válido se fornecer uma estimativa real do efeito, dado os limites da população pesquisada. o Validade externa: nela, o resultado de um estudo é aplicável a outras populações. VIÉS • É um erro sistemático de um estudo que leva a uma distorção dos resultados. • Pode ser dividido em 3 categorias: o Viés de seleção: o fato de o indivíduo se voluntariar (podem ser de condições econômicas, níveis educacionais etc. semelhantes; podem ser mais saudáveis). Além disso, há o ´´efeito do trabalhador saudável´´, pois indivíduos empregados normalmente são mais saudáveis do que os desempregados. ▪ Viés de perda de acompanhamento: inclui desistências e mortes por causas que não são o evento de interesse. ▪ Viés de Berkson: principalmente em indivíduos hospitalizados, pode-se encontrar uma relação entre duas doenças, por exemplo. o Viés de informação (de aferição): pode ocorrer quando há um erro aleatório ou sistemático na mensuração. ▪ Viés do observador (do entrevistador): já comentado acima. ▪ Viés da recordação: Indivíduos não lembram da informação corretamente. ▪ Viés do sujeito: já comentado acima. Diferente do de recordação, o sujeito não dá a informação correta pois não quer ou não sabe. o Viés de confusão: refere-se à mistura do efeito de uma variável estranha com os efeitos da exposição e a doença de interesse. Por exemplo, um estudo sobre elevado colesterol sérico e sua associação com o infarto do miocárdio. Entretanto, o nível elevado de colesterol sérico é associado com a obesidade, assim como o risco de infarto do miocárdio (é associado à obesidade). Suponha que um estudo é feito em 60 pacientes com infarto do miocárdio (obesos e não-obesos) e 60 controles. Dos com IM, 60% tinham colesterol elevado e do controle, 40%. Ao repetir o mesmo estudo separadamente em pessoas obesas e não obesas, dos 40 obesos com IM, 85% tinham colesterol elevado e dos obesos sem IM, 95%. Dos não-obesos com IM, 10% tinha colesterol elevado e dos não-obesos sem IM, 15%. Nesse caso, a obesidade é a variável estranha, que causa a confusão. ▪ Para uma variável ser considerada um agente potencial de confusão ela deve cumprir duas condições: • Associação com a doença de interessa na ausência de exposição. • Associação com a exposição, mas não como resultado de estar exposto. ▪ Ela difere dos vieses de seleção e informação, pois pode ser avaliada. Mariana Macabú – MedUfes 103 Página 9 de 19 ▪ Como lidar com a confusão: • 1. Considerá-la no delineamento do estudo combinando os agentes de confusão potencial • 2. Restringindo a amostra a níveis limitados de agentes de confusão. • 3. Avaliar a confusão por análise de estratificação. TESTE DE HIPÓTESES INTRODUÇÃO • Suponha uma questão de pesquisa sobre pessoas que jogam palavras cruzadas têm menor probabilidade de desenvolver demência. A hipótese de pesquisa resume elementos principais do estudo (amostra, variáveis preditora e de desfecho), a HP especifica esses elementos: o Amostra: por exemplo, pessoas que moram em lar de idosos e que têm função cognitiva normal. o Variável preditora: jogar palavras cruzadas pelo menos uma vez por semana, em média. o Variável de desfecho: escore anormal em um teste padronizado sobre função cognitiva após dois anos de seguimento. UMA BOA HIPÓTESE DE PESQUISA • Hipótese simples → uma variável preditora e uma variável de desfecho. o Em pacientes com DM2, um estilo de vida sedentário está associado com maior risco de desenvolver proteinúria → amostra = pacientes com DM2; VP = estilo de vida sedentário; VD = proteinúria. • Hipótese complexa → mais de uma variável preditora ou mais de uma variável de desfecho. o Em pacientes com DM2, um estilo de vida sedentário e o consumo de álcool estão associados a um risco maior de desenvolver proteinúria → VPs = vida sedentária e consumo de álcool. o Em pacientes com DM2, o consumo de álcool está associado com o risco de desenvolver proteinúria e neuropatia → VDs = proteinúria e neuropatia. o OBS: Uma alternativa seria usar uma VP ou um VD combinada, como por exemplo, complicação microvascular, que engloba proteinúria, neuropatia ou retinopatia. • Hipótese específica → não deixa ambiguidade sobre os sujeitos e as variáveis ou sobre como o teste de significância estatística será aplicado. Mariana Macabú – MedUfes 103 Página 10 de 19 HIPÓTESES NULA E ALTERNATIVA • Hipótese nula (H0) → G1 = G1, por exemplo, vacina = placebo. Não há associação entre as variáveis preditora e de desfecho na população. • Hipótese alternativa (H1) → G1 ≠ G2. Há associação entre a VP e a VD. Não pode ser testada diretamente, o procedimento padrão é aceitá-la se o teste de significância rejeitar a H0. o H1 unilateral: especifica a direção da associação entre VP e VD. Por exemplo, tomar água da torneira aumenta o risco de úlcera péptica, em comparação com a águanormal. o H1 bilateral: declara apenas que há associação, sem especificar em que direção. Por exemplo, tomar água de torneira está associado com um risco diferente (aumentado ou diminuindo, não se diz) de desenvolver úlcera péptica, em comparação com água normal. • OBS: A Hipótese de Pesquisa é geralmente unilateral e a hipótese alternativa, usada no planejamento do tamanho da amostra, é quase sempre bilateral. Por exemplo, uma questão de pesquisa sobre se o uso recorrente de antibióticos na infância aumenta o risco de doença inflamatória intestinal. A hipótese antecipa a direção do efeito, que é aumentar o risco, logo é unilateral. Por que usar uma hipótese alternativa bilateral no planejamento do tamanho da amostra? Porque, na maioria das vezes, ambos os lados da H1 (aumentar ou diminuir o risco, por exemplo) são interessantes para serem publicados. MAGNITUDE DE EFEITO (IMPORTANTE PARA O CLUBE DE REVISTA) • É o valor de magnitude de associação (entre VP e VD) que o investigador define, baseando- se no que deseja encontrar na amostra. • Para Odds Ratio, Risco Relativo e Hazard Ratio (verificar no tópico ‘’qui quadrado’’) o Fator de proteção: ▪ entre 0,5 e 1 → magnitude de efeito pequena ▪ menor que 0,5 → magnitude de efeito grande o Sem fator de proteção, quando avalia o risco propriamente dito: ▪ Menor que 2 → magnitude de efeito pequena ▪ Entre 2 e 3 → magnitude de efeito média ▪ Maior que 3 → magnitude de efeito grande ERROS TIPO I E TIPO II ,α, β, E PODER ESTATÍSTICO • Erros do Tipo I e Tipo II: Ocorrem devido à variação ao acaso, também conhecido como erro aleatório. É possível reduzir a probabilidade de sua ocorrência ao aumentar a Mariana Macabú – MedUfes 103 Página 11 de 19 amostra. Antes de realizar o estudo, o investigador determina a probabilidade máxima tolerada para erros do tipo I e tipo II. o Erro Tipo I → falso-positvo. Ocorre quando H0 é rejeitado, mas é verdadeiro. o Erro Tipo II → falso-negativo. Ocorre quando H0 é aceito, mas é falso. • Nível de significância estatística (α): Probabilidade máxima de um erro tipo I é o α. É o padrão para testes nos quais o investigador começa pressupondo H0 como verdadeiro. Com base nos dados coletado na amostra, ele usa testes estatísticos para determinar se há evidências suficientes para rejeitar H0 em benefício de H1. o Muitos estudos estabelecem como 0,05. o Deve-se usar um α baixo quando a questão de pesquisa torna importante evitar falsos-positivos, como ao testar a eficácia de um medicamento que apresenta riscos. • β: Probabilidade máxima de um erro tipo II. Muitos estudos estabelecem como 0,20. o Deve-se usar um β baixo (e uma magnitude de efeito pequena) quando for importante evitar falso-negativo. • Poder estatístico: valor de [1-β]. Representa a probabilidade de se rejeitar corretamente H0 na amostra, quando o efeito real na população atender à magnitude de efeito. Muitos estudos estabelecem como 0,80 (visto que β é 0,20). Quanto maior o poder estatístico, menos a probabilidade de erro do tipo II. o Clube de revista: se a variável for dicotômica (normalmente é) o intervalo de confiança contemplar o valor 1, diz-se que não teve poder estatístico o suficiente para determinar a significância da associação. Isso quer dizer que não houve poder estatístico para determinar se, por exemplo, o cigarro causar câncer de pulmão ou não foi estatisticamente significante. (ver tópico abaixo). O mesmo vale para variáveis contínuas, mas em vez de 1, é o ZERO. Ver no final do resumo em ‘’ INTERVENÇÃO OU EXPOSIÇÃO EM RESPOSTAS CONTÍNUAS E DICOTÔMICAS - intervalo de confiança’’. VALOR P (SIGNIFICÂNCIA ESTATÍSTICA) • O α é o nível de significância estatística, ou seja, sendo o alfa 0,05, o P tem que ser menor ou igual a esse valor para ser estatisticamente relevante. o Analogia: a média das notas é 7, para o aluno passar ele tem que tirar igual ou maior a 7. A média 7 é o nível de significância estatística e a nota é a significância estatística, se ela for maior ou igual a 7 ela vai ser estatisticamente relevante (não confundir que no caso do P é menor ou igual). • É a probabilidade de se encontrar, apenas pelo acaso, um efeito igual ou mais forte do que o que seria encontrado no estudo se H0 fosse realmente verdadeiro. Por exemplo, o estudo não mostra associação entre beber água da torneira e desenvolver úlcera péptica (H0 verdadeiro), mas na amostra, 30% passou a desenvolver úlcera péptica. A única forma que o Mariana Macabú – MedUfes 103 Página 12 de 19 estudo poderia ter encontrado uma diferença na amostra seria pelo acaso, já que não há associação real! • Se essa possibilidade de acaso for pequena (p < α), então H0 pode ser rejeitado em benefício de H1. Não tem como afirmar que H0 é verdadeiro ou falso antes da realização do estudo de fato, mas se for verdadeiro, significa que o estudo ‘’não vai dar em nada’’. E se, por acaso, a amostra expressar algo? Não temos que nos preocupar com isso se a possibilidade de acaso for pequena! Então rejeitamos H0 se a probabilidade de acaso for pequena, pois se cometemos um erro tipo 1 (rejeitando-a sendo verdadeira) não vai dar em nada, porque a probabilidade de acaso de algo ocorrer mesmo sem associação é pequena! Se rejeitamos ela e ela é falsa, perfeito! • Probabilidade de acaso pequena → P menor que α o A probabilidade de encontrar algo por acaso, é menor do que o limite estabelecido para a ocorrência de erro do tipo I. • Um resultado em que P é maior que α, não quer dizer que não há associação na população, significa apenas que o resultado na amostra é algo pequena se comparado ao que poderia ser encontrado simplesmente por acaso. • P baixo → Rejeita H0 • P alto → Aceita H0 MODELO DE GAUSS CURVA DE GAUSS • Curva sempre positiva e simétrica. Engloba uma área total de 100%. A média divide a curva exatamente no meio. Engloba o desvio-padrão. DISTRIBUIÇÃO GAUSSIANA PADRÃO • Média = 0 e desvio-padrão = 1. • Desvios-padrão o Média +- 1 DP = 68,3% da área do gráfico o Média +- 2 DP = 95,4% da área do gráfico o Média +-3 DP = 99,7% da área do gráfico • Se a curva se aproxima de uma distribuição Gaussiana, H0 é verdadeiro. Mariana Macabú – MedUfes 103 Página 13 de 19 ESCORE PADRONIZADO TESTES ESTATISTICOS PARA AMOSTRAS NÚMERICAS CONTÍNUAS TESTE T DE STUDENT – CONTÍNUA INDEPENDENTE COM DISTRIBUIÇÃO GAUSSIANA EM CADA GRUPO • Usado para determinar se o valor médio de uma variável numérica contínua independente em um grupo difere significativamente de um outro grupo. Diferença entre as médias, calculada em erros-padrão. Por exemplo, t = 3, significa que tem 3 erros-padrão de diferença entre as médias. • Por exemplo, o teste t seria apropriado para comparar as médias dos escores de depressão em pacientes tratados com dois antidepressivos diferentes, ou as médias do índice de massa corporal em pessoas com e sem diabetes. • Pressupõe que a distribuição da variável em cada grupo se aproxima de uma distribuição Gaussiana! No entanto, pode ser usado em uma distribuição não-gaussiana, mas perde um pouco da precisão. • Quando mais aumenta a distância em números de erros-padrão (quanto mais difere uma média da outra), menor é a probabilidade de acaso, pensa-se que deve ser realmente uma diferença de desempenho, não de acaso → REJEITA H0 • O valor onde os dois grupos são quase iguais divide o gráfico no meio. Para a esquerda dessa divisão G1 > G2, para a direita, G1 < G2. • Lembrando que 2DP para cada um dos lados contempla 95% dos valores do gráfico. • Passo a passo: • Formular H0 e decidir se H1 é uni ou bilateral • Estimar a magnitude de efeito (E) a partir da diferença no valor médio da variável contínua entre os grupos de estudo. • Estimar a variabilidade como o desvio-padrão da variável • Calcular a magnitudepadronizada de efeito = E/DP. • Estabelecer α, β Mariana Macabú – MedUfes 103 Página 14 de 19 • Passo a passo para calcular: 1. Desvio padrão médio ponderado: 𝑠𝑝2=[𝑁1−1]⋅𝑆1 2+[𝑁2−1]⋅𝑆2 2 𝑁1+𝑁2−2 2. Calcular t: 𝐱𝟏̅̅ ̅−�̅�𝟐 𝐬𝐩√ 𝟏 𝐍𝟏 + 𝟏 𝐍𝟐 isso que está no denominador é o erro padrão de amostra independente (sp é a raiz quadrada do sp2, que é o desvio padrão) 3. Calcular p/saber se é estatisticamente significante ou não: considerando o alfa = 0,05, temos que ver na curva de Gauss, quantos desvio-padrão de afastamento para cada lado englobam 95% da curva, aproximadamente, o que seria 1,96 desvios-padrão. Supondo que o t dê 13, a amostra é significante estatisticamente, pois 13 é maior que 1.96. • Se o t ou z > 1,96 é estatisticamente significante. P < 0,05 TESTE Z PARA AMOSTRAS – CONTÍNUA INDEPENDENTE COM DISTRIBUIÇÃO GAUSSIANA, COM GRUPOS MAIORES DE 30 (CADA UM) 𝒛 = �̅�𝟏 − �̅�𝟐 √𝑺 𝟏 𝑵𝟏 𝟐 + 𝒔𝟐 𝟐 𝑵𝟐 TESTE T DE STUDENT PAREADO – CONTÍNUA PAREADA COM DISTRIBUIÇÃO GAUSSIANA EM CADA GRUPO • Para variáveis contínuas pareadas: igual o t de student, porém o erro-padrão é 𝑆𝑝/√𝑛 TESTE DE MANN- WHITNEY – CONTÍNUA INDEPENDENTE SEM DISTRIBUIÇÃO GAUSSIANA TESTE DE WILCOXON – CONTÍNUA PAREADA SEM DISTRIBUIÇÃO GAUSSIANA Mariana Macabú – MedUfes 103 Página 15 de 19 TESTES ESTATÍSTICOS PARA AMOSTRAS CATEGÓRICAS NOMINAIS DICOTÔMICAS TESTE DO QUI-QUADRADO (X2) – CATEGÓRICA DICOTÔMICA INDEPENDENTE COM RESULTADOS ESPERADOS > 5 • Usado em Variável categórica nominal dicotômica independente. Medido em variância. O = observado/ E= esperado Para calcular o E = total da linha x total da coluna/total de tudo → tem que ser nessa forma de montar o quadro, a variável nas colunas e as amostras nas linhas!!! LEMBRAR DISSO Nesse caso cada E seria: 204 x 49/760 ; 204 x 711/760; 556 x 49/760; 556 x 711/760 Os O seria respectivamente, 18, 186, 31 e 525. Deve-se fazer cada O menos cada E, elevar ao quadrado e dividir pelo E, no final, somar tudo. Como mostra a fórmula acima. • Se o valor de x2 > 3,84 é estatisticamente significante! P < 0,05 • Uma tabela 2x2 → 1 grau de liberdade • É usado para comparar a proporção de sujeitos em cada um de dois grupos que apresentam um desfecho dicotômico. É sempre bilateral, um teste equivalente para hipóteses unilaterais é o teste Z unilateral. → A probabilidade de o grupo exposto desenvolver o desfecho comparada a probabilidade do grupo não exposto de desenvolver o desfecho. • Por exemplo, a proporção de homens que desenvolvem doença arterial coronariana (DAC) quando tratados com ácido fólico pode ser comparada com a proporção de homens que desenvolvem DAC quando recebem placebo. • Por exemplo, a proporção de diabéticos depressivos que tiveram complicações da diabetes pode ser comparada com a proporção de diabéticos não depressivos que tiveram complicações de diabetes. • Em um ensaio clínico ou estudo de coorte, a magnitude de efeito é especificada pela diferença entre P1 (proporção esperada de sujeitos que apresentam o desfecho em um grupo, ou seja, o risco de desenvolver o desfecho) e P2 (proporção esperada no outro grupo). • Por exemplo, P1 seria os diabéticos depressivos que desenvolvem complicações e P2 seria a proporção de diabéticos não depressivos que desenvolvem complicações. • No entanto, P1 e P2 têm outras definições no cálculo do tamanho de amostra para um estudo caso-controle. o P1 e P2 se referem às proporções esperadas de casos e controles com um determinado valor de uma variável preditora dicotômica. Mariana Macabú – MedUfes 103 Página 16 de 19 o Por exemplo, a proporção de casos de doença renal terminal que eram homens. o Assim, em um estudo de caso-controle, P1 representa a proporção esperada para um determinado valor de uma variável dicotômica entre os casos, ou seja, a frequência desse valor entre os casos. P2 representa a proporção esperada para esse valor entre os controles. • A magnitude de efeito pode ser especificada em termos de RISCO RELATIVO, em um estudo coorte. RR = P1/P2, lembrando que RR = incidência em expostos/incidência em não expostos. • Para um estudo de caso controle, deve-se utilizar o ODDS RATIO , lembrando que (OR) ou RC (Razão de Chances) = probabilidade de expostos com doença/probabilidade de exposto sem doença. 𝑂𝑅 = 𝑎⋅𝑑 𝑏⋅𝑐 • Se RR ou OR derem menor que 1 (0,53, por exemplo) há 47% de proteção, 47% menos chances de que tal coisa ocorra, maior incidência entre não expostos (uma incidência 47% menor no grupo exposto). Se der maior que 1 (1,34, por exemplo) é 34% mais chances de que tal coisa ocorra no grupo exposto, maior incidência nos expostos (34% a mais de incidência entre os expostos). o Exemplo: a hipótese do estudo é que pacientes que não comem carne tem menos chances de infartar. Seria um estudo coorte, pois utilzia pacientes já expostos (não comem carne) ou não (comem carne) e buscam o desfecho (não infartar). O RR = 0,60. Ou seja, o fato de não comer carne dá um fator de proteção de 40%. Relembrando a questão de magnitude de efeito, o valor está entre 0,5 e 1, logo tem magnitude de efeito pequena. o Exemplo: a hipótese de estudo é que o cigarro aumenta os riscos para câncer de pulmão. Foi feito um caso-controle, partindo do desfecho, ou seja, pacientes que já têm câncer e vai ser investigado se eles foram expostos (fumaram) ou não (não fumaram). O OR = 1,60. O fato de fumar aumenta em 60% os riscos de desenvolver câncer de pulmão. Relembrando a questão de magnitude de efeito, é menor que 2, logo é magnitude de efeito pequena. TESTE Z PARA COMPARAÇÃO DE PROPORÇÕES – CATEGÓRICA DICOTÔMICA INDEPENDENTE COM RESULTADOS ESPERADOS < 5 TESTE EXATO DE FISHER – CATEGÓRICA DICOTÔMICA INDEPENDENTE COM RESULTADOS ESPERADOS < 5 Mariana Macabú – MedUfes 103 Página 17 de 19 TESTE DE MCNEMAR – CATEGÓRICA DICOTÔMICA PAREADA INTERVENÇÃO OU EXPOSIÇÃO EM RESPOSTAS CONTÍNUAS E DICOTÔMICAS | NOÇÃO ESTATÍSTICA DO TESTE DE HIPÓTESES RESPOSTA CONTÍNUA - AMOSTRAS PAREADAS | AMOSTRAS INDEPENDENTES • Amostras pareadas: para resposta contínua, são representadas por pares de observações tomadas dos mesmos indivíduos antes ou depois de determinada intervenção ou exposição. o Subtrai-se o valor da observação sem a intervenção daquela após a intervenção, para cada par, há uma distribuição de diferenças. o A média dessas diferenças quantifica o efeito da intervenção da amostra (E), visto em seguida no resumo. o A determinação do efeito da intervenção na população é obtida pelo intervalo de confiança de 95%. o Erro padrão: Sp / raiz de n • Amostras independentes: a quantificação do efeito na amostra é dada pela diferença entre as médias e a determinação desse efeito na população será obtida pelo intervalo de confiança 95% centrado no efeito da amostra. o Erro padrão: Sp . raiz 1/n1 +1/n2 RESPOSTA CONTÍNUAS (INDEPENDENTES E PAREADAS) - EFEITO NA POPULAÇÃO (INTERVALO DE CONFIANÇA) | EFEITO NA AMOSTRA | VALOR P (SIGNIFICÂNCIA) • Intervalo de confiança: faixa de valores possíveis para a magnitude (risco relativo) real do efeito. Efeito do método na população!!! Normalmente é 95%. Em termos de precisão, quanto mais estreito for o intervalo de confiança, maior será a precisão dos resultados. Quanto maior a amostra, maior é a precisão do intervalo de confiança 𝐼𝐶 = 𝐸− +𝑁𝐸𝑝 ⋅ 𝐸𝜌 (Efeito na amostra +- número de erros-padrão multiplicado pelo erro-padrão.) Vai dar um valor negativo e um valor positivo. • O número de erros padrão é achado na tabela, de acordo com o valor p = 0,05 e o grau de liberdade da amostra. • A fórmula para calcular o erro padrão varia se é amostra independente ou pareada, não esquecer! • 𝑬 = 𝒙𝟏̅̅ ̅ − 𝒙𝟐̅̅ ̅ → Efeitodo método na amostra. • Valor p: se o 0 (efeitos iguais do grupo de intervenção e do controle) estiver presente no intervalo de confiança, p é superior ou igual a 0,05, logo diferença não-significativa. Se o 0 não estiver dentro do intervalo de confiança, ou seja, entre os limites inferior e superior, então o valor p será inferior a 0,05, logo diferença significativa. Mariana Macabú – MedUfes 103 Página 18 de 19 • Intervalo de confiança muito largos → suspeitar de tamanho de amostra insuficiente • Resumo (decorar isso!): o Incluiu 0 no IC → p > 0,05 → diferença não significativa/ausência de significância o Não inclui 0 no IC → p < 0,05 → diferença significativa. RESPOSTAS DICOTÔMICAS (INDEPENDENTES E PAREADAS) – EFEITO NA AMOSTRA | EFEITO NA POPULAÇÃO| VALOR P • Efeito na população (Intervalo de confiança): o Crispim não ensinou, disse que é muito complexo. • Cálculo do efeito na amostra para resposta dicotômica: Risco Relativo e Odds Ratio (rever em ‘’teste qui-quadrado’’). o Resultado < 1 indica maior incidência entre os não expostos. o Resultado > 1 indica maior incidência entre os expostos. • Significância: o Inclui 1 no IC → p > 0,05 →diferença não significativa/ausência de significância o Não inclui 1 no IC → p < 0,05 → diferença significativa. NOÇÃO ESTATÍSTICA DO TESTE DE HIPÓTESES • Resposta dicotômica independente: os resultados são a proporção de pares de sucesso/fracasso e a proporção de pares fracasso/sucesso. O teste de hipóteses para resposta dicotômica avalia igualdade ou diferença entre proporções. o H0: p1 = p2. o H1: p1 p2 o P1 e P2 foram descritos em ‘’qui quadrado’’ • Resposta dicotômica pareada: r e s são, respectivamente, a proporção de pares sucesso/fracasso e a proporção de pares fracasso/sucesso. Cada elemento incluído em um grupo tem seu par com as mesmas características no outro grupo, logo, a comparação é feita par a par. o H0: r = s o H1: r s • Resposta contínua independente: a notação estatística deve considerar a relação entre as médias das populações de onde vieram os dois grupos. µ1 e µ2 são, respectivamente, a média da população de onde veio o primeiro e o segundo grupo. o H0: µ1 = µ2 o H1: µ1 µ2 Mariana Macabú – MedUfes 103 Página 19 de 19 • Resposta contínua pareada: d é a média das diferenças entre as observações tomadas antes e depois do evento para cada indivíduo. O mesmo grupo é avaliado em dois momentos diferentes.
Compartilhar