Aula 08 - Bioestatística aplicada à análise de estudos epidemiológicos

•

Unidep

14

0

14

0

19

Aryane dos Reis

23/06/2022

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Saúde Coletiva

48.896 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

BIOESTATÍSTICA 
Aplicada à análise de estudos epidemiológicos 
Aula 8 – Internato APS – Profª Denise Motta 26/05/22 
 
Os estudos epidemiológicos buscam estimativas acuradas (matematicamente acuradas). 
 
ACURÁCIA 
 
É a probabilidade do teste fornecer resultados corretos, ou seja, ser positivo nos doentes e negativo nos não doentes. É 
a habilidade do teste em separar os indivíduos doentes daqueles saudáveis 
 
A acurácia tem 2 componentes: 
I. Precisão (capacidade de, com as ferramentas de mensuração, medirmos sempre o mesmo fenômeno para que 
não haja erros de mensuração do fenômeno) 
II. Validade (capacidade da medida representar o que de fato queremos) 
 
Pode ser intrincado o entendimento, mas as ferramentas usadas para avaliar PRECISÃO e VALIDADE são o contrário de 
tais conceitos 
 
AVALIANDO PRECISÃO E VALIDADE 
 
 Em vez de medir a precisão, vamos medir a imprecisão (erro aleatório ou erro amostral) 
 Sempre trabalhamos em epidemiologia com amostras, e se tivermos um erro proveniente da amostra não 
estaremos sendo precisos e o nosso objetivo é diminuir o máximo possível o erro amostral 
 A validade é o oposto do viés (erro): quanto menos viés tiver um estudo, mais validade ele terá 
 
"Você já deve ter deparado várias vezes com a seguinte frase: “fumar causa câncer de pulmão”. Embora a sentença tenha 
forte impacto, sabe-se que, do ponto de vista epidemiológico, essa afirmação categórica não é 100% verdadeira, uma vez 
que existem pessoas que fumam e nunca desenvolverão câncer de pulmão ou qualquer outra doença associada a esse 
hábito. É essa justamente a diferença entre significância clínica e significância estatística" 
 
 O pressuposto primordial para entender a discussão que será iniciada é: a doença não surge ao acaso 
(aleatoriamente) 
 Ou seja, existem fatores associados à maior ou menor frequência (prevalência ou incidência), alguns que 
contribuem para o seu surgimento (fatores de risco) e outros cujo caráter protege o indivíduo (fatores de proteção) 
 
 Para os procedimentos de análise de estudos científicos, a epidemiologia é servida por uma disciplina chamada 
bioestatística, à qual diferentes ciências empíricas recorrem para conhecer melhor os assuntos de seu interesse 
 O prefixo “bio” busca apenas dar-lhe o sentido de aplicação às ciências biológicas e da saúde, não havendo nada 
conceitualmente diferente 
 Os assuntos nos quais se busca maior entendimento são as relações que as variáveis do indivíduo, do tempo e do 
espaço podem estabelecer com determinados desfechos, que, muitas vezes, são as doenças de interesse do 
pesquisador, ficando explícito que o ponto central da avaliação está alocado na investigação da associação e do 
efeito de variáveis independentes (fatores ou variáveis de exposição) sobre uma variável dependente (variável 
desfecho) 
 
 A associação indica que uma variável possa estar no “caminho da causalidade” de determinado desfecho, contudo 
essa relação pode existir pelo simples acaso ou por alguma distorção, como o efeito de confusão ou algum erro 
sistemático 
 Existem, na atualidade, tratamentos adequados que possibilitam ao pesquisador fazer essas considerações, embora 
outras questões também sejam importantes para abordar em inferência causal 
 
Existem 2 funções primordiais da estatística: 
 1ª: avaliar a magnitude da associação entre variáveis (atributos que mudam de pessoa para pessoa: cor dos olhos, 
ser tabagista/não tabagista, níveis de colesterol) e a magnitude da associação, ou seja, o quanto uma variável 
impacta outra, exemplo: ter história familiar de dependência química (variável = história familiar) aumenta em 7 
vezes o risco (magnitude da associação) de ser dependente químico (variável = ser dependente químico) 
 2ª: é avaliar o grau de erro amostral dos resultados obtidos, ou seja, o quanto esses resultados são decorrentes da 
aleatoriedade de não se trabalhar com uma população inteira teoricamente infinita. O 1º passo para obter esses 
dados é a realização de testes estatísticos adequados para cada situação 
 
AMOSTRAGEM 
 
 Uma amostra deve ser coletada de forma que reproduza as características da população a qual foi obtida 
 Uma forma de garantir a representatividade de uma amostra é seleciona-la de forma aleatória 
 A impossibilidade de observar todos os indivíduos de uma população justifica o estudo de técnicas de amostragem 
 
 As amostras precisam ser o mais representativas possível, por quê? Porque se for uma amostra parecida com a 
população eu posso pegar as conclusões e tentar provocar uma inferência 
 
 Tipos de amostragem: 
o Probabilística/aleatória 
o Não probabilística (por conveniência, intencional) 
 Sistemática, estratificada (dentistas, nutricionistas) (outro exemplo: classes por renda) 
 Por conglomerados (clusters) que precisam ser parecidos entre si 
 Bola de neve (um participante chama outro) 
 Cotas (seleção de proporções) 
 
 As amostras permitem a possibilidade de resultado dentro de um universo de resultados possíveis 
 Exemplo: jogar um dado de 6 lados aleatoriamente. A probabilidade esperada de cada valor é de ⅙, mas se a 
frequência de observações de um número aparecer estiver aumentada isso pode sugerir que o dado é viciado, 
tendendo a cair mais vezes um determinado número, OU o resultado foi por acaso/erro aleatório/erro de 
amostragem. 
 
VALOR P 
 
 Quando o valor p é < 0,05 (5%) a probabilidade de acaso é baixa e poderemos confiar nos resultados porque eles 
são precisos e não ocorreram por erros amostrais 
 Caso o valor p > 0,05, ou maior que 5%, a probabilidade de acaso é alta e não podemos confiar nos resultados, 
essa medida não é precisa e pode ter sido devida a erros amostrais 
 O valor p só nos diz se o dado é preciso ou não é preciso, e se a probabilidade de acaso é baixa ou alta 
 
O acaso existe na medicina? 
Sim. Então se partimos do acaso um estudo que nos leva a encontrar um fator associado a doença: será que esse resultado 
é uma verdade absoluta ou só encontramos tal associação por acaso? Para que possamos confiar em um estudo 
precisamos repeti-lo 100 vezes e em 95% das vezes precisamos encontrar a mesma associação, podemos errar, mas o 
erro não pode ser maior que 5%; Estudos estatisticamente significativos tem p < 0,05 (5%); O Intervalo de Confiança (IC) 
é encontrar a associação 95%. 
 
PLANO DE AMOSTRAGEM 
 
 Quem pesquisar (unidade de amostra) 
 Como selecionar (o procedimento de amostragem) 
 Representatividade da amostra 
 Erros de amostragem 
 Viés do experimentador: efeito de primazia (lembrar do início) e recenticidade (lembrar ao final) – tendência ao 
centro 
 
 
 
 
Conjunto de técnicas para coleta de dados em uma pesquisa 
 
Probabilística - todos tem a mesma chance de participar, podendo ser: 
 Aleatória 
 Estratificada (a população é dividida em estratos homogêneos – grupos com elementos de características comuns 
e é selecionada uma amostra aleatória de cada estrato) 
 Por conglomerados (população extensa é dividida em miniaturas da população – não homogêneas – e seleciona-
se uma amostra aleatória desses conglomerados) 
 
Não probabilística, podendo ser: 
 Acidental (aqueles que vão aparecendo, não podemos generalizar os resultados) 
 Intencional (pesquisador usa seu julgamento para selecionar os membros da população que são boas fontes de 
informação precisa) 
 Por cotas (cota de pessoas que devem ser entrevistadas com certa característica – essa cota depende da 
representação dessas pessoas na população) 
 
Descrição da amostra 
 
Análise descritivas 
 
 Vamos resumir os dados que obtivemos da amostra em medidas que possam traduzir esse dado; a isso chamamos 
de análise descritiva 
 Quando a variável é qualitativa (sexo, grau de queimadura, classe social): descreveremos em proporção (lembre-
se que matematicamente é possível usar desvio-padrão da proporção) 
 Variável contínua. Por ser continua, é possível descrevê-lade várias maneiras. Que maneiras são essas? As 
medidas de tendência central 
 No dado altura: que altura representa a altura central da amostra, o meio da população? Podemos descrever em: 
o Média, somando as alturas e dividindo pelo número de observação (número de pacientes) 
o Mediana que é calculada pelo ordenamento crescente dos dados para que possamos encontrar o número 
do meio (possível nos casos em que o número de observações foi ímpar, mas se o número de observações 
for par precisa-se somar os dois números do meio e fazer uma média) 
o Moda que é aquilo que mais aparece 
 
Medidas de tendência central 
 
Média 
Mediana 
Moda 
 
 
 
 
 
 
 
 
 
 
 
 
 
Como decidir entre média, mediana ou moda? 
 
Depende da distribuição das variáveis. A distribuição será avaliada através de um gráfico no qual atribuirmos no eixo y a 
frequência e no eixo x a variável contínua de nosso interesse. O "normal" de acontecer é uma curva "normal" com alturas 
intermediárias mais frequentes. À medida que nos afastamos do intermediário as frequências dos extremos vão 
diminuindo (gráfico em formato de sino). Na distribuição normal a média, a mediana e a moda estão centradas e são 
iguais. Quando a distribuição não é normal a média está desviada, então a média não poderá ser utilizada e usaremos a 
mediana, que será uma estimativa mais central de tal distribuição. Se a distribuição for normal: média e a mediana nesse 
de mesmo valor. 
 
Ferramentas: variáveis 
 
Variáveis: características que variam de pessoa a pessoa 
Classificadas em quantitativas (numéricas) ou qualitativas (categóricas): 
 Quantitativas/numéricas podem ser contínuas (CONTINUAM, por isso aceitam números fracionários, por 
exemplo: temperatura) ou discretas (por exemplo: número de filhos). Podem ser descritas em termos de média, 
mediana e dispersão (desvio padrão) 
 Qualitativas podem ser ordinais ou nominais. São referidas em termos de porcentagem (ex.: não existe média de 
mortalidade), e quando as variáveis estão sendo referidas nestes termos teremos uma variável 
qualitativa/categórica (percentual de homens, de mulheres, percentual de mortalidade) 
 
 Variáveis: características que variam entre os indivíduos estudados 
 “Qualquer evento, situação ou comportamento que tem pelo menos dois valores” 
 “Uma quantidade ou qualidade que varia entre pessoas ou situações” 
 
Classificação das variáveis 
 
1. quanto à natureza 
2. quanto à continuidade entre seus possíveis valores 
3. quanto ao número de categorias 
4. quanto ao seu grau de expressão quantitativa 
5. quanto à posição no quadro de hipóteses 
 
Quanto à natureza 
 Quantitativa (contínua): idade, peso, altura, glicemia, escore em um teste, desempenho em tarefa cognitiva 
 Qualitativa (categórica): sexo, estado civil, gênero, estatura 
 
Quanto à continuidade entre seus possíveis valores 
 Discreta: sexo, estado civil, número de filhos 
 Contínua: idade, peso, altura, glicemia 
 
 
 
 
 
Quando ao número de categorias 
 Dicotômica (respostas sim e não, verdadeiro ou falso): hábito de fumar, desejabilidade social 
 Policotômica: religião, estado civil, grau e instrução, escala Likert (escala de resposta psicométrica usada 
habitualmente em questionários; é a escala mais usada em pesquisas de opinião) 
 
Quanto ao grau de expressão quantitativa 
 Nominal: sexo, raça 
 Ordinal: grau de instrução 
 Intervalar: temperatura 
 De razão: idade, peso, número de filhos 
 
Quanto à posição no quadro de hipóteses 
 Variável independente (VI) ou variável dependente (VD) 
 Em um experimento, temos uma variável que estamos mensurando (o estado do sódio – variável do experimento) 
e queremos descobrir que efeito sofrerá a outra variável manipulada pelo investigador (por exemplo, ao que o 
sódio está exposto). A variável manipulada pelo observador é denominada de VI, o seu valor não é dependente 
das outras variáveis. A outra variável do experimento é denominada de VD porque se assume que ela dependa 
dos valores da VI 
 
 
 
 
 
 
Mensuração 
 
 É a atribuição de escores a indivíduos de forma que esses escores representem alguma característica do indivíduo 
 Exemplos: pesar-se em uma balança, medir a capacidade da memória de trabalho de uma pessoa, quantificar o 
quão intenso são os sintomas de depressão 
 Para mensurar corretamente é indispensável que haja: validade e precisão 
 Validade é a capacidade do instrumento medir aquilo que pretende, e pode ser: 
o Interna (capacidade de tirar conclusões sobre relações de causa e efeito dentro dos resultados 
observados) 
o Externa (resultados que podem ser generalizados) 
 Precisão é a estabilidade de uma medida ou comportamento e pode ser: 
o Interna (medida consistente consigo) 
o Externa (como a medida varia de uma aplicação para outra) 
 
Questão de pesquisa e hipótese 
 
 Questões de pesquisa adequadas iniciam a formulação de hipóteses testáveis 
 Diferença entre a questão de pesquisa e a hipótese. Por exemplo: existe ligação entre a personalidade e a 
capacidade de parar de fumar? Uma hipótese de pesquisa deve ser mais precisa, devemos identificar o aspecto 
da personalidade que pode estar relacionado à parar de fumar. É importante ser o mais preciso possível com a 
hipótese em investigações quantitativas, pois essa determina o delineamento e as técnicas estatísticas 
apropriadas para a análise dos dados - e para analisar os dados, a hipótese deve ser testada 
Testes estatísticos 
 Identificam se as medidas estatísticas que estamos usando são precisas ou não; então se calcularmos o valor p 
iremos entender se os dados são precisos ou com baixas probabilidades de acaso 
 Antes de escolher o teste estatístico é preciso saber o que se quer, pois a escolha do teste adequado depende 
desse aspecto 
 
Escolhendo o teste estatístico na comparação de grupos 
 
Desfecho pode ser contínuo (quem tomou remédio melhorou mais da depressão, melhorou na escala aplicada) ou 
categórico (homens têm mais ou menos infarto) 
 A distribuição é normal: teste que compara média e DP é o teste t se até 2 grupos e o ANOVA/análise de variância 
se > 3 grupos, mas se os dois grupos forem um antes e depois. Por exemplo: em um estudo com a proposta de 
medir a depressão antes e depois do paciente tomar determinado remédio com a finalidade de avaliar a mesma 
pessoa em momentos diferentes, devemos usar o teste t pareado ou análise de variância se forem 3 momentos 
distintos, mas é o uso da ANOVA pareada 
 Distribuição não normal: quando é utilizado um equivalente não paramétrico 
Quando o desfecho é categórico (%) usamos o qui quadrado (não importa o número de grupos) com apenas uma exceção, 
a saber: quando a proporção tem menos de 5 sujeitos usamos o teste de Fisher. 
 
Correlacionar uma variável a um desfecho 
 
 O remédio influencia na mortalidade? O remédio altera o IMC? O desfecho é contínuo ou categórico? 
 DESFECHO CONTÍNUO (avaliar a correlação de normalidade): a distribuição é normal ou não? Exemplo: quero 
saber se níveis maiores de hipertensão estão em pacientes de maior peso; para tal posso utilizar a correlação de 
Pearson se a distribuição for normal ou a regressão linear. Se a distribuição não for normal vamos usar a 
correlação de Spearman (equivalente não paramétrico de correlação de Pearson) 
 DESFECHO CATEGÓRICO: quero saber se hipertensão vai influenciar na mortalidade e, para tal, usamos a 
regressão logística 
 
Statistical Package For The Social Sciences (SPSS) 
 
 Um dos softwares mais utilizados no mundo para análise estatística 
 Podemos construir alguns bancos de dados nele 
 Precisamos sempre informar as variáveis que desejamos trabalhar, informando a classificação (idade é uma 
variável escalar/numeral/contínua, ao passo que altura é também uma variável escalar/numeral/continua, sexo 
é uma variável nominal/categórica) 
 
Testes estatísticos possíveis de serem realizados no SPSS 
 Comparação de médias: se tiver uma curvade distribuição normal vou usar o teste t, comparando uma variável 
categórica com uma variável contínua. Como sei se existe uma curva de distribuição normal? Analisando a 
distribuição das variáveis idade e altura, por exemplo, e ao avaliar o histograma e o conceito da normalidade - 
segue a distribuição de Gauss, e se estiver com distribuição normal, podemos usar o teste t independente (não 
estamos comparando em dois momentos, lembrar que se fosse antes e depois o teste deveria ser pareado). Como 
vamos saber o valor p (se as diferenças entre os dois grupos foram ao acaso ou não)? O software calcula o valor 
e nós interpretamos 
 Comparação de proporções: comparar 2 variáveis categóricas (sexo, nacionalidade), usando o teste que compara 
proporções, que é o teste do quiquadrado. Se forem menos de 5 sujeitos, o teste de qui-quadrado é adaptado e 
se chama teste de Fisher 
 Correlação: comparar duas variáveis contínuas (idade e IMC), o que vai gerar uma comparação - pode ser o teste 
de Pearson se tiver distribuição normal