Buscar

Resumo Epidemiologia Clínica e Estatística Médica

Prévia do material em texto

Mariana Macabú – MedUfes 103 
 
 
Página 1 de 19 
 
RESUMO DE EPIDEMIOLOGIA II – 2020/01 
 
CONCEITOS BÁSICOS 
 
• Variância → A variância de uma amostra {x1,...,xn} de n elementos é definida como a soma 
ao quadrado dos desvios dos elementos em relação à sua média dividido por (n-1) 
 
1. Calcular a média 
2. Subtrair a média de cada valor e elevar o resultado ao quadrado 
3. Somar esses novos valores 
4. Dividir pelo número total subtraído 1. 
 
• Desvio-padrão → O desvio padrão indica em média qual será o "erro" (desvio) cometido ao 
tentar substituir cada observação pela medida resumo do conjunto de dados (no caso, a 
média). Desvios padrão muito grandes, próximos ao valor da média, indicam grande 
variabilidade, e, por extensão, tamanho insuficiente das amostras. O desvio padrão 
amostral de um conjunto de dados é igual à raiz quadrada da variância amostral. Desta 
forma, o desvio padrão amostral é dado por 
 
• Graus de liberdade → quantidade de informação que os dados de uma pesquisa fornecem 
e que o pesquisador pode ‘’gastar’’ para estimar os valores de parâmetros populacionais 
desconhecidos e para calcular a variabilidade dessas estimativas. Esse valor é determinado 
pelo número de observações em sua amostra e pelo número de parâmetros em seu 
modelo. 
o Aumentar o tamanho amostral fornece mais informações sobre a população e, 
assim, aumenta os graus de liberdade em seus dados. 
o Adicionar parâmetros ao modelo ‘’gasta’’ informações dos dados e, assim, reduz os 
graus de liberdade disponíveis para estimar a variabilidade das estimativas de 
parâmetro. 
o Exemplo: o teste t para 1 amostra estima apenas um parâmetro: a média 
populacional. O tamanho amostral de n constitui n informações para a estimativa da 
média populacional e sua variabilidade. Um grau de liberdade é gasto estimando-se 
a média, e os n-1 graus de liberdade restantes estimam a variabilidade. 
 
Mariana Macabú – MedUfes 103 
 
 
Página 2 de 19 
 
• Erros-padrão → estimativa do valor do desvio-padrão da população a partir do desvio-
padrão da amostra. Por exemplo, na minha amostra o desvio padrão deu 6. Qual é o 
verdadeiro desvio-padrão na população? 
o Para descobrir a resposta, é preciso dividir 6 pela raiz quadrada do tamanho da 
amostra. O resultado mostra o provável desvio-padrão na população (o erro-
padrão). 
Ep = Sp√
1
N1
+
1
N2
 ou , o primeiro é para amostra independente 
e o segundo é para amostra pareada!!! Atenção! 
o Para calcular o EP tem que ter o valor da média ponderada dos desvios-padrão (Sp) 
das amostras. 
▪ Para calcular o desvio-padrão ponderado numa amostra de 2 grupos: 
▪ Sp2 =
(N1−1)⋅S1
2+(N2−1)⋅S2
2
N1+N2−2
 
 
GRÁFICOS 
 
DIAGRAMA DE BARRAS 
• Bom para representar variáveis categóricas. 
• O tamanho de cada barra é proporcional ao número de indivíduos na categoria. 
 
HISTOGRAMA 
• Bom para representar variáveis numéricas contínuas 
• Gráfico de barras justapostas, no qual, no eixo horizontal, encontra-se a variável de 
interesse. No eixo vertical, constrói-se um a barra para cada classe com altura igual à 
frequência absoluta ou relativa correspondente. 
Mariana Macabú – MedUfes 103 
 
 
Página 3 de 19 
 
• As barras são centradas em seus respectivos pontos médios, referentes à classe. 
• Para construir um histograma, é necessário ordenar os dados e escolher uma escala 
apropriada para sua descrição. 
 
 
 
POLÍGONO DE FREQUÊNCIA 
• Bom para representar variáveis numéricas contínuas. 
• É feito a partir do histograma, ao unir, através de seguimentos de reta, as ordenadas que 
correspondem aos pontos médios de cada classe. 
 
 
OGIVA 
• Bom para representar variáveis numéricas contínuas. 
• É um gráfico de frequências acumuladas. (usualmente relativas). 
• Trata-se de uma poligonal ascendente. 
• Para construir uma ogiva, coloca-se no eixo horizontal os intervalos de classe nos quais a 
variável em estudo foi dividida. Para cada limite de intervalo é assinalado no eixo vertical 
sua porcentagem acumulada. Em seguida, os pontos marcados são ligados por segmentos 
de reta. 
Mariana Macabú – MedUfes 103 
 
 
Página 4 de 19 
 
• Através desse gráfico, pode-se estimar percentis da distribuição, ou seja, o valor que é 
precedido por certa porcentagem de interesse pré-estabelecida. Por exemplo, estimar o 
valor da variável abaixo do qual se tem 50% dos indivíduos. 
 
 
GRÁFICO DE LINHAS 
• Bom para representar dados temporais. 
• Coloca-se a escala temporal (ano, mês, dia etc.) no eixo horizontal. 
• No eixo vertical, coloca-se a variável a ser estudada (frequência, taxa, medida tomada etc.) 
• Através desses gráficos, é possível constatar algum tipo de tendência e identificar alguns 
eventos inusitados, como por exemplo, o surto de determinada doença. 
 
 
BOXPLOT 
• Bom para descrição de dados, visualização de sua variabilidade, comparação entre 
diferentes grupos. 
• Também fornece informações importantes sobre o comportamento do conjunto de dados, 
como simetria e variabilidade. 
Mariana Macabú – MedUfes 103 
 
 
Página 5 de 19 
 
o Se a amplitude for muito maior que a DQ e se Q2 estiver mais próxima de Q1 do que 
Q3, há fortes indicações de assimetria positiva e de grande dispersão das 
observações. 
• Para construir esse gráfico é preciso obter as seguintes estatísticas: 
o 1° quartil (Q1) 
o A mediana (Q2) 
o 3° quartil (Q3 
o Distância interquartílica (DQ) = Q3 – Q1 
• Passo a passo para a construção do boxplot: 
 
1. Numa reta, são marcados Q1, Q2 e Q3. 
2. Acima dessa reta, é construído um retângulo com limites iguais às posições de Q1 e Q3, 
cortado por um segmento de reta na posição relativa à mediana. 
3. A partir dos limites do retângulo, traçam-se linhas até encontrar um extremo (valor 
máximo ou mínimo) OU um valor correspondente a 1,5DQ, se o extremo estiver a mais 
de 1,5DQ do quartil respectivo 
 
• Outliers (observações atípicas): Valores muito grandes ou muito pequenos em relação aos 
demais. Alteram enormemente as médias e a variabilidade dos grupos a que pertencem e 
podem até mesmo distorcer as conclusões obtidas. 
o Causas do aparecimento de outliers: Leitura, anotação ou transcrição incorreta dos 
dados; erro na execução do experimento ou na tomada da medida; mudanças não 
controláveis nas condições experimentais ou dos pacientes; característica inerente à 
variável estudada (por exemplo, grande instabilidade do que está sendo medido). 
o Ponto externo → distância entre 1,5QD e 3DQ 
o Ponto solto → distância 𝑚𝑎𝑖𝑜𝑟 𝑞𝑢𝑒 3𝐷𝑄. Possivelmente tem algo errado que fez 
esse valor ser tão diferente dos outros, vale a pena investigar. 
o Medidas a serem tomadas: abandoná-lo ou justificá-lo. 
 
 
Mariana Macabú – MedUfes 103 
 
 
Página 6 de 19 
 
QUALIDADE DE TESTES DIAGNÓSTICOS 
 
SENSIBILIDADE 
• Exclui a doença → probabilidade de o teste ser positivo sabendo-se que o paciente que está 
sendo testado está, de fato, doente. 
• S = verdadeiros positivos/verdadeiros positivos + falsos negativos, ou seja, acusou a 
doença/todos os doentes 𝑠 =
𝑣𝑝
𝑉𝑝+𝐹𝑁
 
ESPECIFICIDADE 
• Confirma a doença → probabilidade de o teste ser negativo, sabendo-se que o paciente que 
está sendo testado é saudável. 
• E = verdadeiros negativos/verdadeiros negativos + falsos positivos, ou seja, não acusou a 
doença/todos os saudáveis. E =
vN
vN+Fp
 
VALORES PREDITIVOS 
• Variam com a prevalência (P): quanto maior a P., maior o VPP e menor o VPN 
• VP Positivo → Probabilidade de o paciente estar realmente doente quando o teste é 
positivo. Melhor quanto maior for a especificidade. 
o diagnóstico positivo verdadeiro/todos os positivos, ou seja, todos que acusaram a 
doença e realmente têm a doença/todos que acursaram a doença. VPP =
Pv
Pt
 
• VP Negativo → Probabilidade de o paciente não estar doente quando o resultado do teste é 
negativo. Melhor quanto maior for a sensibilidade. 
o diagnóstico negativoverdadeiro/todos os negativos, ou seja, todos que são 
saudáveis e não acusaram doença/todos que não acusaram a doença. VPN =
Nv
Nt
 
• Cálculo da frequência de falso negativo e falso positivo: FFP = Fp/não-doentes 
FFN = Fn/doentes. 
 
VARIÁVEIS | PRECISÃO E ACURÁCIA | VALIDADE, VARIABILIDADE E VIÉS 
 
VARIÁVEIS 
• Numéricas (quantitativas) 
o Contínuas: pode ter número com vírgula. Ex.: peso, altura. 
o Discretas: somente números inteiros. Ex.: números de filhos. 
Mariana Macabú – MedUfes 103 
 
 
Página 7 de 19 
 
• Categóricas (qualitativas) 
o Nominais: não-ordenadas. Ex.: sexo (F ou M). 
▪ Dicotômicos 
o Ordinais: ordenadas. Ex.: grau de escolaridade. 
PRECISÃO E ACURÁCIA 
• Precisão → Reprodutibilidade de aferições repetidas, ou seja, grau em que uma variável 
tem valores semelhantes quando medida várias vezes. Ocorrem comparações entre várias 
medidas. Uma medida de alta precisão é aquela na qual os valores são semelhantes em 
cada aferição. 
o É afetada pelo erro aleatório. Quanto maior o erro, menor é a precisão de aferição: 
▪ Variabilidade individual: pode ocorrer devido a alterações biológicas em um 
indivíduo ao longo do tempo. 
• Frequência cardíaca, temperatura corporal, peso, altura. 
▪ Variabilidade do observador: é causada pelo observador e inclui aspectos 
como a escolha de palavras em uma entrevista e a habilidade de manuseio de 
um instrumento. 
▪ Variabilidade do instrumento: é causada pelo instrumento e inclui mudanças 
em fatores ambientais (temperatura, por exemplo), desgaste de 
componentes mecânicos, diferenças entre os lotes dos reagentes etc. 
▪ Variabilidade do sujeito: deve-se à variabilidade biológica intrínseca aos 
sujeitos da pesquisa e não está relacionada às variáveis em estudo. 
• Dia em que é feito o estudo, tempo decorrido desde a última refeição, 
medicação. 
• Acurácia → É a capacidade da variável de representar o valor verdadeiro. Comparada a um 
padrão-ouro. 
o É afetada por um erro sistemático: 
▪ Viés do observador: é uma distorção, consciente ou inconsciente, na 
percepção ou no relato da medida pelo observador. 
• Erros no manuseio do instrumento, uso de perguntas que induzem o 
entrevistado. 
▪ Viés do instrumento: pode resultar de um defeito em um instrumento. 
• Balança que não foi calibrada, por exemplo. 
▪ Viés do sujeito: é uma distorção na aferição originada pelo sujeito do estudo, 
ao relatar um evento, por exemplo. 
• Validade → se assemelha à acurácia, mas adiciona uma dimensão qualitativa à avaliação. 
o Por exemplo: um exame de creatinina e cistatina C séricas, como medida da função 
renal, ambos podem ter resultados acurados, mas a cistatina C pode ter maior 
validade nesse caso, já que os níveis de creatinina de são também afetados pela 
quantidade de massa muscular. 
Mariana Macabú – MedUfes 103 
 
 
Página 8 de 19 
 
o Validade interna: nela, os resultados de uma investigação refletem acuradamente a 
real situação da população em estudo. Um estudo é internamente válido se fornecer 
uma estimativa real do efeito, dado os limites da população pesquisada. 
o Validade externa: nela, o resultado de um estudo é aplicável a outras populações. 
 
VIÉS 
• É um erro sistemático de um estudo que leva a uma distorção dos resultados. 
• Pode ser dividido em 3 categorias: 
o Viés de seleção: o fato de o indivíduo se voluntariar (podem ser de condições 
econômicas, níveis educacionais etc. semelhantes; podem ser mais saudáveis). Além 
disso, há o ´´efeito do trabalhador saudável´´, pois indivíduos empregados 
normalmente são mais saudáveis do que os desempregados. 
▪ Viés de perda de acompanhamento: inclui desistências e mortes por causas 
que não são o evento de interesse. 
▪ Viés de Berkson: principalmente em indivíduos hospitalizados, pode-se 
encontrar uma relação entre duas doenças, por exemplo. 
o Viés de informação (de aferição): pode ocorrer quando há um erro aleatório ou 
sistemático na mensuração. 
▪ Viés do observador (do entrevistador): já comentado acima. 
▪ Viés da recordação: Indivíduos não lembram da informação corretamente. 
▪ Viés do sujeito: já comentado acima. Diferente do de recordação, o sujeito 
não dá a informação correta pois não quer ou não sabe. 
o Viés de confusão: refere-se à mistura do efeito de uma variável estranha com os 
efeitos da exposição e a doença de interesse. Por exemplo, um estudo sobre elevado 
colesterol sérico e sua associação com o infarto do miocárdio. Entretanto, o nível 
elevado de colesterol sérico é associado com a obesidade, assim como o risco de 
infarto do miocárdio (é associado à obesidade). Suponha que um estudo é feito em 
60 pacientes com infarto do miocárdio (obesos e não-obesos) e 60 controles. Dos 
com IM, 60% tinham colesterol elevado e do controle, 40%. Ao repetir o mesmo 
estudo separadamente em pessoas obesas e não obesas, dos 40 obesos com IM, 
85% tinham colesterol elevado e dos obesos sem IM, 95%. Dos não-obesos com IM, 
10% tinha colesterol elevado e dos não-obesos sem IM, 15%. Nesse caso, a 
obesidade é a variável estranha, que causa a confusão. 
▪ Para uma variável ser considerada um agente potencial de confusão ela deve 
cumprir duas condições: 
• Associação com a doença de interessa na ausência de exposição. 
• Associação com a exposição, mas não como resultado de estar 
exposto. 
▪ Ela difere dos vieses de seleção e informação, pois pode ser avaliada. 
Mariana Macabú – MedUfes 103 
 
 
Página 9 de 19 
 
▪ Como lidar com a confusão: 
• 1. Considerá-la no delineamento do estudo combinando os agentes 
de confusão potencial 
• 2. Restringindo a amostra a níveis limitados de agentes de confusão. 
• 3. Avaliar a confusão por análise de estratificação. 
 
TESTE DE HIPÓTESES 
 
INTRODUÇÃO 
• Suponha uma questão de pesquisa sobre pessoas que jogam palavras cruzadas têm menor 
probabilidade de desenvolver demência. A hipótese de pesquisa resume elementos 
principais do estudo (amostra, variáveis preditora e de desfecho), a HP especifica esses 
elementos: 
o Amostra: por exemplo, pessoas que moram em lar de idosos e que têm função 
cognitiva normal. 
o Variável preditora: jogar palavras cruzadas pelo menos uma vez por semana, em 
média. 
o Variável de desfecho: escore anormal em um teste padronizado sobre função 
cognitiva após dois anos de seguimento. 
 
UMA BOA HIPÓTESE DE PESQUISA 
• Hipótese simples → uma variável preditora e uma variável de desfecho. 
o Em pacientes com DM2, um estilo de vida sedentário está associado com maior risco 
de desenvolver proteinúria → amostra = pacientes com DM2; VP = estilo de vida 
sedentário; VD = proteinúria. 
• Hipótese complexa → mais de uma variável preditora ou mais de uma variável de desfecho. 
o Em pacientes com DM2, um estilo de vida sedentário e o consumo de álcool estão 
associados a um risco maior de desenvolver proteinúria → VPs = vida sedentária e 
consumo de álcool. 
o Em pacientes com DM2, o consumo de álcool está associado com o risco de 
desenvolver proteinúria e neuropatia → VDs = proteinúria e neuropatia. 
o OBS: Uma alternativa seria usar uma VP ou um VD combinada, como por exemplo, 
complicação microvascular, que engloba proteinúria, neuropatia ou retinopatia. 
• Hipótese específica → não deixa ambiguidade sobre os sujeitos e as variáveis ou sobre 
como o teste de significância estatística será aplicado. 
 
Mariana Macabú – MedUfes 103 
 
 
Página 10 de 19 
 
HIPÓTESES NULA E ALTERNATIVA 
• Hipótese nula (H0) → G1 = G1, por exemplo, vacina = placebo. Não há associação entre 
as variáveis preditora e de desfecho na população. 
• Hipótese alternativa (H1) → G1 ≠ G2. Há associação entre a VP e a VD. Não pode ser 
testada diretamente, o procedimento padrão é aceitá-la se o teste de significância 
rejeitar a H0. 
o H1 unilateral: especifica a direção da associação entre VP e VD. Por exemplo, 
tomar água da torneira aumenta o risco de úlcera péptica, em comparação com 
a águanormal. 
o H1 bilateral: declara apenas que há associação, sem especificar em que direção. 
Por exemplo, tomar água de torneira está associado com um risco diferente 
(aumentado ou diminuindo, não se diz) de desenvolver úlcera péptica, em 
comparação com água normal. 
• OBS: A Hipótese de Pesquisa é geralmente unilateral e a hipótese alternativa, usada no 
planejamento do tamanho da amostra, é quase sempre bilateral. Por exemplo, uma 
questão de pesquisa sobre se o uso recorrente de antibióticos na infância aumenta o 
risco de doença inflamatória intestinal. A hipótese antecipa a direção do efeito, que é 
aumentar o risco, logo é unilateral. Por que usar uma hipótese alternativa bilateral no 
planejamento do tamanho da amostra? Porque, na maioria das vezes, ambos os lados 
da H1 (aumentar ou diminuir o risco, por exemplo) são interessantes para serem 
publicados. 
 
MAGNITUDE DE EFEITO (IMPORTANTE PARA O CLUBE DE REVISTA) 
• É o valor de magnitude de associação (entre VP e VD) que o investigador define, baseando-
se no que deseja encontrar na amostra. 
• Para Odds Ratio, Risco Relativo e Hazard Ratio (verificar no tópico ‘’qui quadrado’’) 
o Fator de proteção: 
▪ entre 0,5 e 1 → magnitude de efeito pequena 
▪ menor que 0,5 → magnitude de efeito grande 
o Sem fator de proteção, quando avalia o risco propriamente dito: 
▪ Menor que 2 → magnitude de efeito pequena 
▪ Entre 2 e 3 → magnitude de efeito média 
▪ Maior que 3 → magnitude de efeito grande 
 
ERROS TIPO I E TIPO II ,α, β, E PODER ESTATÍSTICO 
• Erros do Tipo I e Tipo II: Ocorrem devido à variação ao acaso, também conhecido como 
erro aleatório. É possível reduzir a probabilidade de sua ocorrência ao aumentar a 
Mariana Macabú – MedUfes 103 
 
 
Página 11 de 19 
 
amostra. Antes de realizar o estudo, o investigador determina a probabilidade máxima 
tolerada para erros do tipo I e tipo II. 
o Erro Tipo I → falso-positvo. Ocorre quando H0 é rejeitado, mas é verdadeiro. 
o Erro Tipo II → falso-negativo. Ocorre quando H0 é aceito, mas é falso. 
• Nível de significância estatística (α): Probabilidade máxima de um erro tipo I é o α. É o 
padrão para testes nos quais o investigador começa pressupondo H0 como verdadeiro. 
Com base nos dados coletado na amostra, ele usa testes estatísticos para determinar se 
há evidências suficientes para rejeitar H0 em benefício de H1. 
o Muitos estudos estabelecem como 0,05. 
o Deve-se usar um α baixo quando a questão de pesquisa torna importante evitar 
falsos-positivos, como ao testar a eficácia de um medicamento que apresenta 
riscos. 
• β: Probabilidade máxima de um erro tipo II. Muitos estudos estabelecem como 0,20. 
o Deve-se usar um β baixo (e uma magnitude de efeito pequena) quando for 
importante evitar falso-negativo. 
• Poder estatístico: valor de [1-β]. Representa a probabilidade de se rejeitar corretamente 
H0 na amostra, quando o efeito real na população atender à magnitude de efeito. 
Muitos estudos estabelecem como 0,80 (visto que β é 0,20). Quanto maior o poder 
estatístico, menos a probabilidade de erro do tipo II. 
o Clube de revista: se a variável for dicotômica (normalmente é) o intervalo de 
confiança contemplar o valor 1, diz-se que não teve poder estatístico o suficiente 
para determinar a significância da associação. Isso quer dizer que não houve 
poder estatístico para determinar se, por exemplo, o cigarro causar câncer de 
pulmão ou não foi estatisticamente significante. (ver tópico abaixo). O mesmo 
vale para variáveis contínuas, mas em vez de 1, é o ZERO. Ver no final do resumo 
em ‘’ INTERVENÇÃO OU EXPOSIÇÃO EM RESPOSTAS CONTÍNUAS E DICOTÔMICAS -
intervalo de confiança’’. 
 
VALOR P (SIGNIFICÂNCIA ESTATÍSTICA) 
• O α é o nível de significância estatística, ou seja, sendo o alfa 0,05, o P tem que ser menor 
ou igual a esse valor para ser estatisticamente relevante. 
o Analogia: a média das notas é 7, para o aluno passar ele tem que tirar igual ou maior 
a 7. A média 7 é o nível de significância estatística e a nota é a significância 
estatística, se ela for maior ou igual a 7 ela vai ser estatisticamente relevante (não 
confundir que no caso do P é menor ou igual). 
• É a probabilidade de se encontrar, apenas pelo acaso, um efeito igual ou mais forte do que 
o que seria encontrado no estudo se H0 fosse realmente verdadeiro. Por exemplo, o estudo 
não mostra associação entre beber água da torneira e desenvolver úlcera péptica (H0 
verdadeiro), mas na amostra, 30% passou a desenvolver úlcera péptica. A única forma que o 
Mariana Macabú – MedUfes 103 
 
 
Página 12 de 19 
 
estudo poderia ter encontrado uma diferença na amostra seria pelo acaso, já que não há 
associação real! 
• Se essa possibilidade de acaso for pequena (p < α), então H0 pode ser rejeitado em 
benefício de H1. Não tem como afirmar que H0 é verdadeiro ou falso antes da realização do 
estudo de fato, mas se for verdadeiro, significa que o estudo ‘’não vai dar em nada’’. E se, 
por acaso, a amostra expressar algo? Não temos que nos preocupar com isso se a 
possibilidade de acaso for pequena! Então rejeitamos H0 se a probabilidade de acaso for 
pequena, pois se cometemos um erro tipo 1 (rejeitando-a sendo verdadeira) não vai dar em 
nada, porque a probabilidade de acaso de algo ocorrer mesmo sem associação é pequena! 
Se rejeitamos ela e ela é falsa, perfeito! 
• Probabilidade de acaso pequena → P menor que α 
o A probabilidade de encontrar algo por acaso, é menor do que o limite estabelecido 
para a ocorrência de erro do tipo I. 
• Um resultado em que P é maior que α, não quer dizer que não há associação na população, 
significa apenas que o resultado na amostra é algo pequena se comparado ao que poderia 
ser encontrado simplesmente por acaso. 
 
• P baixo → Rejeita H0 
• P alto → Aceita H0 
 
MODELO DE GAUSS 
 
CURVA DE GAUSS 
• Curva sempre positiva e simétrica. Engloba uma área total de 100%. A média divide a curva 
exatamente no meio. Engloba o desvio-padrão. 
 
DISTRIBUIÇÃO GAUSSIANA PADRÃO 
• Média = 0 e desvio-padrão = 1. 
• Desvios-padrão 
o Média +- 1 DP = 68,3% da área do gráfico 
o Média +- 2 DP = 95,4% da área do gráfico 
o Média +-3 DP = 99,7% da área do gráfico 
• Se a curva se aproxima de uma distribuição Gaussiana, H0 é verdadeiro. 
 
 
 
Mariana Macabú – MedUfes 103 
 
 
Página 13 de 19 
 
 
ESCORE PADRONIZADO 
 
 
 
TESTES ESTATISTICOS PARA AMOSTRAS NÚMERICAS CONTÍNUAS 
 
TESTE T DE STUDENT – CONTÍNUA INDEPENDENTE COM DISTRIBUIÇÃO GAUSSIANA EM CADA GRUPO 
• Usado para determinar se o valor médio de uma variável numérica contínua independente 
em um grupo difere significativamente de um outro grupo. Diferença entre as médias, 
calculada em erros-padrão. Por exemplo, t = 3, significa que tem 3 erros-padrão de 
diferença entre as médias. 
• Por exemplo, o teste t seria apropriado para comparar as médias dos escores de depressão 
em pacientes tratados com dois antidepressivos diferentes, ou as médias do índice de 
massa corporal em pessoas com e sem diabetes. 
• Pressupõe que a distribuição da variável em cada grupo se aproxima de uma distribuição 
Gaussiana! No entanto, pode ser usado em uma distribuição não-gaussiana, mas perde um 
pouco da precisão. 
• Quando mais aumenta a distância em números de erros-padrão (quanto mais difere uma 
média da outra), menor é a probabilidade de acaso, pensa-se que deve ser realmente uma 
diferença de desempenho, não de acaso → REJEITA H0 
• O valor onde os dois grupos são quase iguais divide o gráfico no meio. Para a esquerda 
dessa divisão G1 > G2, para a direita, G1 < G2. 
• Lembrando que 2DP para cada um dos lados contempla 95% dos valores do gráfico. 
• Passo a passo: 
• Formular H0 e decidir se H1 é uni ou bilateral 
• Estimar a magnitude de efeito (E) a partir da diferença no valor médio da variável contínua 
entre os grupos de estudo. 
• Estimar a variabilidade como o desvio-padrão da variável 
• Calcular a magnitudepadronizada de efeito = E/DP. 
• Estabelecer α, β 
Mariana Macabú – MedUfes 103 
 
 
Página 14 de 19 
 
 
• Passo a passo para calcular: 
1. Desvio padrão médio ponderado: 
𝑠𝑝2=[𝑁1−1]⋅𝑆1
2+[𝑁2−1]⋅𝑆2
2
𝑁1+𝑁2−2
 
2. Calcular t: 
𝐱𝟏̅̅ ̅−�̅�𝟐
𝐬𝐩√
𝟏
𝐍𝟏
+
𝟏
𝐍𝟐
 isso que está no denominador é o erro padrão de amostra independente (sp 
é a raiz quadrada do sp2, que é o desvio padrão) 
3. Calcular p/saber se é estatisticamente significante ou não: considerando o alfa = 0,05, temos 
que ver na curva de Gauss, quantos desvio-padrão de afastamento para cada lado englobam 
95% da curva, aproximadamente, o que seria 1,96 desvios-padrão. Supondo que o t dê 13, a 
amostra é significante estatisticamente, pois 13 é maior que 1.96. 
 
• Se o t ou z > 1,96 é estatisticamente significante. P < 0,05 
 
 
TESTE Z PARA AMOSTRAS – CONTÍNUA INDEPENDENTE COM DISTRIBUIÇÃO GAUSSIANA, COM GRUPOS 
MAIORES DE 30 (CADA UM) 
 
𝒛 =
�̅�𝟏 − �̅�𝟐
√𝑺 𝟏
𝑵𝟏
𝟐 +
𝒔𝟐
𝟐
𝑵𝟐
 
 
TESTE T DE STUDENT PAREADO – CONTÍNUA PAREADA COM DISTRIBUIÇÃO GAUSSIANA EM CADA GRUPO 
 
• Para variáveis contínuas pareadas: igual o t de student, porém o erro-padrão é 𝑆𝑝/√𝑛 
 
TESTE DE MANN- WHITNEY – CONTÍNUA INDEPENDENTE SEM DISTRIBUIÇÃO GAUSSIANA 
 
TESTE DE WILCOXON – CONTÍNUA PAREADA SEM DISTRIBUIÇÃO GAUSSIANA 
 
 
 
 
Mariana Macabú – MedUfes 103 
 
 
Página 15 de 19 
 
TESTES ESTATÍSTICOS PARA AMOSTRAS CATEGÓRICAS NOMINAIS DICOTÔMICAS 
 
TESTE DO QUI-QUADRADO (X2) – CATEGÓRICA DICOTÔMICA INDEPENDENTE COM RESULTADOS 
ESPERADOS > 5 
• Usado em Variável categórica nominal dicotômica independente. Medido em variância. 
 
O = observado/ E= esperado 
 
 
 
 
Para calcular o E = total da linha x total da coluna/total de tudo → tem que ser nessa forma de 
montar o quadro, a variável nas colunas e as amostras nas linhas!!! LEMBRAR DISSO 
 Nesse caso cada E seria: 204 x 49/760 ; 204 x 711/760; 556 x 49/760; 556 x 711/760 
 Os O seria respectivamente, 18, 186, 31 e 525. 
 Deve-se fazer cada O menos cada E, elevar ao quadrado e dividir pelo E, no final, somar tudo. 
Como mostra a fórmula acima. 
• Se o valor de x2 > 3,84 é estatisticamente significante! P < 0,05 
• Uma tabela 2x2 → 1 grau de liberdade 
• É usado para comparar a proporção de sujeitos em cada um de dois grupos que apresentam 
um desfecho dicotômico. É sempre bilateral, um teste equivalente para hipóteses 
unilaterais é o teste Z unilateral. → A probabilidade de o grupo exposto desenvolver o 
desfecho comparada a probabilidade do grupo não exposto de desenvolver o desfecho. 
• Por exemplo, a proporção de homens que desenvolvem doença arterial coronariana (DAC) 
quando tratados com ácido fólico pode ser comparada com a proporção de homens que 
desenvolvem DAC quando recebem placebo. 
• Por exemplo, a proporção de diabéticos depressivos que tiveram complicações da diabetes 
pode ser comparada com a proporção de diabéticos não depressivos que tiveram 
complicações de diabetes. 
• Em um ensaio clínico ou estudo de coorte, a magnitude de efeito é especificada pela 
diferença entre P1 (proporção esperada de sujeitos que apresentam o desfecho em um 
grupo, ou seja, o risco de desenvolver o desfecho) e P2 (proporção esperada no outro 
grupo). 
• Por exemplo, P1 seria os diabéticos depressivos que desenvolvem complicações e P2 seria a 
proporção de diabéticos não depressivos que desenvolvem complicações. 
• No entanto, P1 e P2 têm outras definições no cálculo do tamanho de amostra para um 
estudo caso-controle. 
o P1 e P2 se referem às proporções esperadas de casos e controles com um 
determinado valor de uma variável preditora dicotômica. 
Mariana Macabú – MedUfes 103 
 
 
Página 16 de 19 
 
o Por exemplo, a proporção de casos de doença renal terminal que eram homens. 
o Assim, em um estudo de caso-controle, P1 representa a proporção esperada para 
um determinado valor de uma variável dicotômica entre os casos, ou seja, a 
frequência desse valor entre os casos. P2 representa a proporção esperada para esse 
valor entre os controles. 
 
• A magnitude de efeito pode ser especificada em termos de RISCO RELATIVO, em um 
estudo coorte. RR = P1/P2, lembrando que RR = incidência em expostos/incidência 
em não expostos. 
• Para um estudo de caso controle, deve-se utilizar o ODDS RATIO , lembrando que 
(OR) ou RC (Razão de Chances) = probabilidade de expostos com 
doença/probabilidade de exposto sem doença. 𝑂𝑅 =
𝑎⋅𝑑
𝑏⋅𝑐
 
• Se RR ou OR derem menor que 1 (0,53, por exemplo) há 47% de proteção, 47% 
menos chances de que tal coisa ocorra, maior incidência entre não expostos (uma 
incidência 47% menor no grupo exposto). Se der maior que 1 (1,34, por exemplo) é 
34% mais chances de que tal coisa ocorra no grupo exposto, maior incidência nos 
expostos (34% a mais de incidência entre os expostos). 
o Exemplo: a hipótese do estudo é que pacientes que não comem carne tem 
menos chances de infartar. Seria um estudo coorte, pois utilzia pacientes já 
expostos (não comem carne) ou não (comem carne) e buscam o desfecho 
(não infartar). O RR = 0,60. Ou seja, o fato de não comer carne dá um fator de 
proteção de 40%. Relembrando a questão de magnitude de efeito, o valor 
está entre 0,5 e 1, logo tem magnitude de efeito pequena. 
o Exemplo: a hipótese de estudo é que o cigarro aumenta os riscos para câncer 
de pulmão. Foi feito um caso-controle, partindo do desfecho, ou seja, 
pacientes que já têm câncer e vai ser investigado se eles foram expostos 
(fumaram) ou não (não fumaram). O OR = 1,60. O fato de fumar aumenta em 
60% os riscos de desenvolver câncer de pulmão. Relembrando a questão de 
magnitude de efeito, é menor que 2, logo é magnitude de efeito pequena. 
 
 
TESTE Z PARA COMPARAÇÃO DE PROPORÇÕES – CATEGÓRICA DICOTÔMICA INDEPENDENTE COM 
RESULTADOS ESPERADOS < 5 
 
TESTE EXATO DE FISHER – CATEGÓRICA DICOTÔMICA INDEPENDENTE COM RESULTADOS ESPERADOS < 5 
 
Mariana Macabú – MedUfes 103 
 
 
Página 17 de 19 
 
TESTE DE MCNEMAR – CATEGÓRICA DICOTÔMICA PAREADA 
 
INTERVENÇÃO OU EXPOSIÇÃO EM RESPOSTAS CONTÍNUAS E DICOTÔMICAS | NOÇÃO 
ESTATÍSTICA DO TESTE DE HIPÓTESES 
 
RESPOSTA CONTÍNUA - AMOSTRAS PAREADAS | AMOSTRAS INDEPENDENTES 
• Amostras pareadas: para resposta contínua, são representadas por pares de observações 
tomadas dos mesmos indivíduos antes ou depois de determinada intervenção ou exposição. 
o Subtrai-se o valor da observação sem a intervenção daquela após a intervenção, 
para cada par, há uma distribuição de diferenças. 
o A média dessas diferenças quantifica o efeito da intervenção da amostra (E), visto 
em seguida no resumo. 
o A determinação do efeito da intervenção na população é obtida pelo intervalo de 
confiança de 95%. 
o Erro padrão: Sp / raiz de n 
• Amostras independentes: a quantificação do efeito na amostra é dada pela diferença entre 
as médias e a determinação desse efeito na população será obtida pelo intervalo de 
confiança 95% centrado no efeito da amostra. 
o Erro padrão: Sp . raiz 1/n1 +1/n2 
 
RESPOSTA CONTÍNUAS (INDEPENDENTES E PAREADAS) - EFEITO NA POPULAÇÃO (INTERVALO DE 
CONFIANÇA) | EFEITO NA AMOSTRA | VALOR P (SIGNIFICÂNCIA) 
• Intervalo de confiança: faixa de valores possíveis para a magnitude (risco relativo) real do 
efeito. Efeito do método na população!!! Normalmente é 95%. Em termos de precisão, 
quanto mais estreito for o intervalo de confiança, maior será a precisão dos resultados. 
Quanto maior a amostra, maior é a precisão do intervalo de confiança 𝐼𝐶 = 𝐸−
+𝑁𝐸𝑝 ⋅ 𝐸𝜌 
(Efeito na amostra +- número de erros-padrão multiplicado pelo erro-padrão.) Vai dar um 
valor negativo e um valor positivo. 
• O número de erros padrão é achado na tabela, de acordo com o valor p = 0,05 e o grau de 
liberdade da amostra. 
• A fórmula para calcular o erro padrão varia se é amostra independente ou pareada, não 
esquecer! 
• 𝑬 = 𝒙𝟏̅̅ ̅ − 𝒙𝟐̅̅ ̅ → Efeitodo método na amostra. 
• Valor p: se o 0 (efeitos iguais do grupo de intervenção e do controle) estiver presente no 
intervalo de confiança, p é superior ou igual a 0,05, logo diferença não-significativa. Se o 0 
não estiver dentro do intervalo de confiança, ou seja, entre os limites inferior e superior, 
então o valor p será inferior a 0,05, logo diferença significativa. 
Mariana Macabú – MedUfes 103 
 
 
Página 18 de 19 
 
• Intervalo de confiança muito largos → suspeitar de tamanho de amostra insuficiente 
• Resumo (decorar isso!): 
o Incluiu 0 no IC → p > 0,05 → diferença não significativa/ausência de significância 
o Não inclui 0 no IC → p < 0,05 → diferença significativa. 
 
RESPOSTAS DICOTÔMICAS (INDEPENDENTES E PAREADAS) – EFEITO NA AMOSTRA | EFEITO NA 
POPULAÇÃO| VALOR P 
• Efeito na população (Intervalo de confiança): o Crispim não ensinou, disse que é muito 
complexo. 
• Cálculo do efeito na amostra para resposta dicotômica: Risco Relativo e Odds Ratio (rever 
em ‘’teste qui-quadrado’’). 
o Resultado < 1 indica maior incidência entre os não expostos. 
o Resultado > 1 indica maior incidência entre os expostos. 
• Significância: 
o Inclui 1 no IC → p > 0,05 →diferença não significativa/ausência de significância 
o Não inclui 1 no IC → p < 0,05 → diferença significativa. 
 
NOÇÃO ESTATÍSTICA DO TESTE DE HIPÓTESES 
• Resposta dicotômica independente: os resultados são a proporção de pares de 
sucesso/fracasso e a proporção de pares fracasso/sucesso. O teste de hipóteses para 
resposta dicotômica avalia igualdade ou diferença entre proporções. 
o H0: p1 = p2. 
o H1: p1  p2 
o P1 e P2 foram descritos em ‘’qui quadrado’’ 
• Resposta dicotômica pareada: r e s são, respectivamente, a proporção de pares 
sucesso/fracasso e a proporção de pares fracasso/sucesso. Cada elemento incluído em um 
grupo tem seu par com as mesmas características no outro grupo, logo, a comparação é 
feita par a par. 
o H0: r = s 
o H1: r  s 
• Resposta contínua independente: a notação estatística deve considerar a relação entre as 
médias das populações de onde vieram os dois grupos. µ1 e µ2 são, respectivamente, a média 
da população de onde veio o primeiro e o segundo grupo. 
o H0: µ1 = µ2 
o H1: µ1  µ2 
Mariana Macabú – MedUfes 103 
 
 
Página 19 de 19 
 
• Resposta contínua pareada: d é a média das diferenças entre as observações tomadas antes 
e depois do evento para cada indivíduo. O mesmo grupo é avaliado em dois momentos 
diferentes.

Continue navegando