Baixe o app para aproveitar ainda mais
Prévia do material em texto
BIOESTATÍSTICA Aplicada à análise de estudos epidemiológicos Aula 8 – Internato APS – Profª Denise Motta 26/05/22 Os estudos epidemiológicos buscam estimativas acuradas (matematicamente acuradas). ACURÁCIA É a probabilidade do teste fornecer resultados corretos, ou seja, ser positivo nos doentes e negativo nos não doentes. É a habilidade do teste em separar os indivíduos doentes daqueles saudáveis A acurácia tem 2 componentes: I. Precisão (capacidade de, com as ferramentas de mensuração, medirmos sempre o mesmo fenômeno para que não haja erros de mensuração do fenômeno) II. Validade (capacidade da medida representar o que de fato queremos) Pode ser intrincado o entendimento, mas as ferramentas usadas para avaliar PRECISÃO e VALIDADE são o contrário de tais conceitos AVALIANDO PRECISÃO E VALIDADE Em vez de medir a precisão, vamos medir a imprecisão (erro aleatório ou erro amostral) Sempre trabalhamos em epidemiologia com amostras, e se tivermos um erro proveniente da amostra não estaremos sendo precisos e o nosso objetivo é diminuir o máximo possível o erro amostral A validade é o oposto do viés (erro): quanto menos viés tiver um estudo, mais validade ele terá "Você já deve ter deparado várias vezes com a seguinte frase: “fumar causa câncer de pulmão”. Embora a sentença tenha forte impacto, sabe-se que, do ponto de vista epidemiológico, essa afirmação categórica não é 100% verdadeira, uma vez que existem pessoas que fumam e nunca desenvolverão câncer de pulmão ou qualquer outra doença associada a esse hábito. É essa justamente a diferença entre significância clínica e significância estatística" O pressuposto primordial para entender a discussão que será iniciada é: a doença não surge ao acaso (aleatoriamente) Ou seja, existem fatores associados à maior ou menor frequência (prevalência ou incidência), alguns que contribuem para o seu surgimento (fatores de risco) e outros cujo caráter protege o indivíduo (fatores de proteção) Para os procedimentos de análise de estudos científicos, a epidemiologia é servida por uma disciplina chamada bioestatística, à qual diferentes ciências empíricas recorrem para conhecer melhor os assuntos de seu interesse O prefixo “bio” busca apenas dar-lhe o sentido de aplicação às ciências biológicas e da saúde, não havendo nada conceitualmente diferente Os assuntos nos quais se busca maior entendimento são as relações que as variáveis do indivíduo, do tempo e do espaço podem estabelecer com determinados desfechos, que, muitas vezes, são as doenças de interesse do pesquisador, ficando explícito que o ponto central da avaliação está alocado na investigação da associação e do efeito de variáveis independentes (fatores ou variáveis de exposição) sobre uma variável dependente (variável desfecho) A associação indica que uma variável possa estar no “caminho da causalidade” de determinado desfecho, contudo essa relação pode existir pelo simples acaso ou por alguma distorção, como o efeito de confusão ou algum erro sistemático Existem, na atualidade, tratamentos adequados que possibilitam ao pesquisador fazer essas considerações, embora outras questões também sejam importantes para abordar em inferência causal Existem 2 funções primordiais da estatística: 1ª: avaliar a magnitude da associação entre variáveis (atributos que mudam de pessoa para pessoa: cor dos olhos, ser tabagista/não tabagista, níveis de colesterol) e a magnitude da associação, ou seja, o quanto uma variável impacta outra, exemplo: ter história familiar de dependência química (variável = história familiar) aumenta em 7 vezes o risco (magnitude da associação) de ser dependente químico (variável = ser dependente químico) 2ª: é avaliar o grau de erro amostral dos resultados obtidos, ou seja, o quanto esses resultados são decorrentes da aleatoriedade de não se trabalhar com uma população inteira teoricamente infinita. O 1º passo para obter esses dados é a realização de testes estatísticos adequados para cada situação AMOSTRAGEM Uma amostra deve ser coletada de forma que reproduza as características da população a qual foi obtida Uma forma de garantir a representatividade de uma amostra é seleciona-la de forma aleatória A impossibilidade de observar todos os indivíduos de uma população justifica o estudo de técnicas de amostragem As amostras precisam ser o mais representativas possível, por quê? Porque se for uma amostra parecida com a população eu posso pegar as conclusões e tentar provocar uma inferência Tipos de amostragem: o Probabilística/aleatória o Não probabilística (por conveniência, intencional) Sistemática, estratificada (dentistas, nutricionistas) (outro exemplo: classes por renda) Por conglomerados (clusters) que precisam ser parecidos entre si Bola de neve (um participante chama outro) Cotas (seleção de proporções) As amostras permitem a possibilidade de resultado dentro de um universo de resultados possíveis Exemplo: jogar um dado de 6 lados aleatoriamente. A probabilidade esperada de cada valor é de ⅙, mas se a frequência de observações de um número aparecer estiver aumentada isso pode sugerir que o dado é viciado, tendendo a cair mais vezes um determinado número, OU o resultado foi por acaso/erro aleatório/erro de amostragem. VALOR P Quando o valor p é < 0,05 (5%) a probabilidade de acaso é baixa e poderemos confiar nos resultados porque eles são precisos e não ocorreram por erros amostrais Caso o valor p > 0,05, ou maior que 5%, a probabilidade de acaso é alta e não podemos confiar nos resultados, essa medida não é precisa e pode ter sido devida a erros amostrais O valor p só nos diz se o dado é preciso ou não é preciso, e se a probabilidade de acaso é baixa ou alta O acaso existe na medicina? Sim. Então se partimos do acaso um estudo que nos leva a encontrar um fator associado a doença: será que esse resultado é uma verdade absoluta ou só encontramos tal associação por acaso? Para que possamos confiar em um estudo precisamos repeti-lo 100 vezes e em 95% das vezes precisamos encontrar a mesma associação, podemos errar, mas o erro não pode ser maior que 5%; Estudos estatisticamente significativos tem p < 0,05 (5%); O Intervalo de Confiança (IC) é encontrar a associação 95%. PLANO DE AMOSTRAGEM Quem pesquisar (unidade de amostra) Como selecionar (o procedimento de amostragem) Representatividade da amostra Erros de amostragem Viés do experimentador: efeito de primazia (lembrar do início) e recenticidade (lembrar ao final) – tendência ao centro Conjunto de técnicas para coleta de dados em uma pesquisa Probabilística - todos tem a mesma chance de participar, podendo ser: Aleatória Estratificada (a população é dividida em estratos homogêneos – grupos com elementos de características comuns e é selecionada uma amostra aleatória de cada estrato) Por conglomerados (população extensa é dividida em miniaturas da população – não homogêneas – e seleciona- se uma amostra aleatória desses conglomerados) Não probabilística, podendo ser: Acidental (aqueles que vão aparecendo, não podemos generalizar os resultados) Intencional (pesquisador usa seu julgamento para selecionar os membros da população que são boas fontes de informação precisa) Por cotas (cota de pessoas que devem ser entrevistadas com certa característica – essa cota depende da representação dessas pessoas na população) Descrição da amostra Análise descritivas Vamos resumir os dados que obtivemos da amostra em medidas que possam traduzir esse dado; a isso chamamos de análise descritiva Quando a variável é qualitativa (sexo, grau de queimadura, classe social): descreveremos em proporção (lembre- se que matematicamente é possível usar desvio-padrão da proporção) Variável contínua. Por ser continua, é possível descrevê-lade várias maneiras. Que maneiras são essas? As medidas de tendência central No dado altura: que altura representa a altura central da amostra, o meio da população? Podemos descrever em: o Média, somando as alturas e dividindo pelo número de observação (número de pacientes) o Mediana que é calculada pelo ordenamento crescente dos dados para que possamos encontrar o número do meio (possível nos casos em que o número de observações foi ímpar, mas se o número de observações for par precisa-se somar os dois números do meio e fazer uma média) o Moda que é aquilo que mais aparece Medidas de tendência central Média Mediana Moda Como decidir entre média, mediana ou moda? Depende da distribuição das variáveis. A distribuição será avaliada através de um gráfico no qual atribuirmos no eixo y a frequência e no eixo x a variável contínua de nosso interesse. O "normal" de acontecer é uma curva "normal" com alturas intermediárias mais frequentes. À medida que nos afastamos do intermediário as frequências dos extremos vão diminuindo (gráfico em formato de sino). Na distribuição normal a média, a mediana e a moda estão centradas e são iguais. Quando a distribuição não é normal a média está desviada, então a média não poderá ser utilizada e usaremos a mediana, que será uma estimativa mais central de tal distribuição. Se a distribuição for normal: média e a mediana nesse de mesmo valor. Ferramentas: variáveis Variáveis: características que variam de pessoa a pessoa Classificadas em quantitativas (numéricas) ou qualitativas (categóricas): Quantitativas/numéricas podem ser contínuas (CONTINUAM, por isso aceitam números fracionários, por exemplo: temperatura) ou discretas (por exemplo: número de filhos). Podem ser descritas em termos de média, mediana e dispersão (desvio padrão) Qualitativas podem ser ordinais ou nominais. São referidas em termos de porcentagem (ex.: não existe média de mortalidade), e quando as variáveis estão sendo referidas nestes termos teremos uma variável qualitativa/categórica (percentual de homens, de mulheres, percentual de mortalidade) Variáveis: características que variam entre os indivíduos estudados “Qualquer evento, situação ou comportamento que tem pelo menos dois valores” “Uma quantidade ou qualidade que varia entre pessoas ou situações” Classificação das variáveis 1. quanto à natureza 2. quanto à continuidade entre seus possíveis valores 3. quanto ao número de categorias 4. quanto ao seu grau de expressão quantitativa 5. quanto à posição no quadro de hipóteses Quanto à natureza Quantitativa (contínua): idade, peso, altura, glicemia, escore em um teste, desempenho em tarefa cognitiva Qualitativa (categórica): sexo, estado civil, gênero, estatura Quanto à continuidade entre seus possíveis valores Discreta: sexo, estado civil, número de filhos Contínua: idade, peso, altura, glicemia Quando ao número de categorias Dicotômica (respostas sim e não, verdadeiro ou falso): hábito de fumar, desejabilidade social Policotômica: religião, estado civil, grau e instrução, escala Likert (escala de resposta psicométrica usada habitualmente em questionários; é a escala mais usada em pesquisas de opinião) Quanto ao grau de expressão quantitativa Nominal: sexo, raça Ordinal: grau de instrução Intervalar: temperatura De razão: idade, peso, número de filhos Quanto à posição no quadro de hipóteses Variável independente (VI) ou variável dependente (VD) Em um experimento, temos uma variável que estamos mensurando (o estado do sódio – variável do experimento) e queremos descobrir que efeito sofrerá a outra variável manipulada pelo investigador (por exemplo, ao que o sódio está exposto). A variável manipulada pelo observador é denominada de VI, o seu valor não é dependente das outras variáveis. A outra variável do experimento é denominada de VD porque se assume que ela dependa dos valores da VI Mensuração É a atribuição de escores a indivíduos de forma que esses escores representem alguma característica do indivíduo Exemplos: pesar-se em uma balança, medir a capacidade da memória de trabalho de uma pessoa, quantificar o quão intenso são os sintomas de depressão Para mensurar corretamente é indispensável que haja: validade e precisão Validade é a capacidade do instrumento medir aquilo que pretende, e pode ser: o Interna (capacidade de tirar conclusões sobre relações de causa e efeito dentro dos resultados observados) o Externa (resultados que podem ser generalizados) Precisão é a estabilidade de uma medida ou comportamento e pode ser: o Interna (medida consistente consigo) o Externa (como a medida varia de uma aplicação para outra) Questão de pesquisa e hipótese Questões de pesquisa adequadas iniciam a formulação de hipóteses testáveis Diferença entre a questão de pesquisa e a hipótese. Por exemplo: existe ligação entre a personalidade e a capacidade de parar de fumar? Uma hipótese de pesquisa deve ser mais precisa, devemos identificar o aspecto da personalidade que pode estar relacionado à parar de fumar. É importante ser o mais preciso possível com a hipótese em investigações quantitativas, pois essa determina o delineamento e as técnicas estatísticas apropriadas para a análise dos dados - e para analisar os dados, a hipótese deve ser testada Testes estatísticos Identificam se as medidas estatísticas que estamos usando são precisas ou não; então se calcularmos o valor p iremos entender se os dados são precisos ou com baixas probabilidades de acaso Antes de escolher o teste estatístico é preciso saber o que se quer, pois a escolha do teste adequado depende desse aspecto Escolhendo o teste estatístico na comparação de grupos Desfecho pode ser contínuo (quem tomou remédio melhorou mais da depressão, melhorou na escala aplicada) ou categórico (homens têm mais ou menos infarto) A distribuição é normal: teste que compara média e DP é o teste t se até 2 grupos e o ANOVA/análise de variância se > 3 grupos, mas se os dois grupos forem um antes e depois. Por exemplo: em um estudo com a proposta de medir a depressão antes e depois do paciente tomar determinado remédio com a finalidade de avaliar a mesma pessoa em momentos diferentes, devemos usar o teste t pareado ou análise de variância se forem 3 momentos distintos, mas é o uso da ANOVA pareada Distribuição não normal: quando é utilizado um equivalente não paramétrico Quando o desfecho é categórico (%) usamos o qui quadrado (não importa o número de grupos) com apenas uma exceção, a saber: quando a proporção tem menos de 5 sujeitos usamos o teste de Fisher. Correlacionar uma variável a um desfecho O remédio influencia na mortalidade? O remédio altera o IMC? O desfecho é contínuo ou categórico? DESFECHO CONTÍNUO (avaliar a correlação de normalidade): a distribuição é normal ou não? Exemplo: quero saber se níveis maiores de hipertensão estão em pacientes de maior peso; para tal posso utilizar a correlação de Pearson se a distribuição for normal ou a regressão linear. Se a distribuição não for normal vamos usar a correlação de Spearman (equivalente não paramétrico de correlação de Pearson) DESFECHO CATEGÓRICO: quero saber se hipertensão vai influenciar na mortalidade e, para tal, usamos a regressão logística Statistical Package For The Social Sciences (SPSS) Um dos softwares mais utilizados no mundo para análise estatística Podemos construir alguns bancos de dados nele Precisamos sempre informar as variáveis que desejamos trabalhar, informando a classificação (idade é uma variável escalar/numeral/contínua, ao passo que altura é também uma variável escalar/numeral/continua, sexo é uma variável nominal/categórica) Testes estatísticos possíveis de serem realizados no SPSS Comparação de médias: se tiver uma curvade distribuição normal vou usar o teste t, comparando uma variável categórica com uma variável contínua. Como sei se existe uma curva de distribuição normal? Analisando a distribuição das variáveis idade e altura, por exemplo, e ao avaliar o histograma e o conceito da normalidade - segue a distribuição de Gauss, e se estiver com distribuição normal, podemos usar o teste t independente (não estamos comparando em dois momentos, lembrar que se fosse antes e depois o teste deveria ser pareado). Como vamos saber o valor p (se as diferenças entre os dois grupos foram ao acaso ou não)? O software calcula o valor e nós interpretamos Comparação de proporções: comparar 2 variáveis categóricas (sexo, nacionalidade), usando o teste que compara proporções, que é o teste do quiquadrado. Se forem menos de 5 sujeitos, o teste de qui-quadrado é adaptado e se chama teste de Fisher Correlação: comparar duas variáveis contínuas (idade e IMC), o que vai gerar uma comparação - pode ser o teste de Pearson se tiver distribuição normal
Compartilhar