Baixe o app para aproveitar ainda mais
Prévia do material em texto
GABRIELA MEDEIROS – MEDICINA 1 Bioestatística Aplicada à Estudos na Área de Saúde O que seria bioestatística? o É um conjunto de métodos para a obtenção, organização e análise de dados, bem como para tirar conclusões e fazer predições com base nesses dados. o Uma vez coletados os dados, não é conveniente apresenta-los para análise na forma como chegaram. Conceitos Básicos: 1) POPULAÇÃO x AMOSTRA População: conjuntos de TODAS as unidades que se deseja estudar; Amostra: subconjunto da população, unidades a serem estudadas. Indivíduo: cada elemento afetado por uma medida ou enumerado por um índice. 2) VARIÁVEIS Características de interesse na população que, por algum motivo, nos interessa estudar. Variáveis Qualitativas (categóricas): Apresentam como possível realização um atributo (ou qualidade): o NOMINAL não tem ordem ⤷ Sexo ⤷ Estado civil ⤷ Cor dos olhos ⤷ Profissão o ORDINAL tem ordem ⤷ Nível de instrução ⤷ Classe social ⤷ Nível de renda ⤷ Grau de evolução de uma doença; Variáveis Quantitativas: Apresentam como possível realização números: o DISCRETA contagem (conjunto finito ou enumerável) ⤷ Número de filhos VARIÁVEIS Qualitativas Nominais Ordinais Quantitativas Discretas Contínuas GABRIELA MEDEIROS – MEDICINA 2 ⤷ Número de gestações ⤷ Episódio de enxaqueca o CONTÍNUA mensuração aproximada (em um intervalo de números reais) ⤷ Peso ⤷ Altura ⤷ Pressão arterial ⤷ Qualquer fator sérico (glicose, triglicerídeos) Obs.: O mais importante é saber diferenciar uma variável qualitativa de uma quantitativa, porque ao saber com o tipo de variável que estamos lidando, pode-se escolher o teste estatístico mais adequado, para análise dos dados. Exemplo – Quando da amostra queremos estudar 2 variáveis com as características abaixo: CATEGÓRICA QUANTITATIVA CATEGÓRICA Chi-quadrado Teste t de Student QUANTITATIVA Teste t de Student Regressão linear ou correlação 3) BIOESTATÍSTICA DESCRITIVA x BIOESTATÍSTICA ANALÍTICA Uma vez coletados os dados, não é conveniente apresenta-los para análise na forma como chegaram (dados crus). Bioestatística Descritiva: Objetivo geral: Caracterização dos indivíduos estudados. TÉCNICAS MAIS UTILIZADAS NA ESTATÍSTICA DESCRITIVA Cálculo de frequências simples, simples acumulada, relativa e relativa acumulada. Cálculo de medidas de tendência central (moda, média, aritmética, média ponderada, mediana) Cálculo de medidas de dispersão (amplitude, desvio médio, variância, desvio padrão, coeficiente de variação) Cálculo de medidas de posição (porcentis) Elaboração de tabelas univariáveis Elaboração de gráficos Avaliação da forma como as frequências de uma variável se distribuem Estatística Descritiva • Método quantitativo utilizado apenas para descrever os dados, mostrando seus subtipos, sua distribuição, frequência, média, etc. Estatística Analítica • Método quantitativo utilizado para comparar grupos e fazer generalizações, a partir de resultados obtidos. GABRIELA MEDEIROS – MEDICINA 3 o Medidas de Tendência Central: ⤷ MÉDIA soma dos dados dividido pela quantidade deles. ⤷ MODA valor mais frequente. ⤷ MEDIANA dado central. A escolha do método estatístico para análise de dados, depende, em parte, dos valores que se obtém quando temos uma variável quantitativa. Quando temos valores de média, moda e mediana muito próximo de si Curva de Gauss (“curva em forma de sino”) ou Distribuição normal – ideal aplicar testes paramétricos (métodos de análise); o Para análise das medidas de tendência central, podemos usar a ferramenta EXCEL. Como calcular? MÉDIA “MÉDIA” MODA “MODO” (versões mais antigas do programa) “MODO.ÚNICO” (uma moda que mais se repete) e “MODO.MULT” (mais de uma moda que se repete) – versões mais recentes. MEDIANA “MED” o Para análise de medidas de dispersão, no EXCEL: VARIÂNCIA “VAR.A” (versões recentes) “VAR” (versões mais antigas) DESVIO PADRÃO “DESVPAD.A” (versões mais recentes) “DESVPAD” (versões mais antigas) COEFICIENTE DE VARIAÇÃO =desvpad/média AMPLITUDE =máximo-mínimo Bioestatística Analítica: Objetivo geral: Pode-se fazer uma análise mais elaborada dos dados (ex.: fazer associações dentro dos dados coletados). TÉCNICAS MAIS UTILIZADAS NA ESTATÍSTICA ANALÍTICA Elaboração de diagramas considerando mais de uma variável (ex.: diagramas de dispersão) Elaboração de tabelas de contingência bivariáveis ou multivariáveis Cálculo de medidas de associação entre variáveis (razão ou diferença entre prevalências, entre incidências ou risco relativo ou atribuível, entre chances, coeficientes de correlação, coeficientes de regressão) Análise estratificada Análise multivariável GABRIELA MEDEIROS – MEDICINA 4 Bioestatística Inferencial: Objetivo geral: Pode-se fazer inferências a respeito dos dados (fazer correlação e generalizar para a amostra, e assim, a população). TÉCNICAS MAIS UTILIZADAS NA ESTATÍSTICA INFERENCIAL Teste Z para 1 ou 2 médias Teste F para 2 variâncias Teste t para 1 ou 2 médias Análise de variância (teste F) Teste t para amostras emparelhadas Análise de correlação intraclasse (teste F) Teste Z para 1 ou 2 proporções Análise de correlação de Pearson (teste t) Teste X2 para 2 ou + proporções Cálculo do alfa de Cronbach (teste F) Teste X2 de Mantel e Haenszel Cálculo do índice capa (teste Z) Teste para 1 variância Análise de regressão linear (testes F ou Z) Teste exato de Fisher Análise de correlação de Spearman Teste do sinal Teste de McNemar Teste de Wilcoxon Elaboração do diagrama de barra de erro Teste da mediana Teste de Kruskal-Wallis Teste de Mann-Whitney Teste de Friedman BIOESTATÍSTICA ANALÍTICA Conceitos gerais: 1) TESTES PARAMÉTRICOS E NÃO-PARAMÉTRICOS Os testes estatísticos usuais são divididos em dois conjuntos principais: o Paramétricos o Não-paramétricos Os testes paramétricos (mais conhecidos) exigem a suposição de uma distribuição normal para a população testada. Já os testes não-paramétricos exigem pouca ou nenhuma suposição sobre a distribuição populacional dos dados. 2) AMOSTRAS INDEPENDENTES E DEPENDENTES Alguns testes possuem “versões” para dois tipos de organização dos grupos incluídos na estatística: Amostra independente O indivíduo participa somente de um grupo dentro da comparação. Exemplo: doentes e sadios; homens e mulheres. Amostra dependente (relacionadas ou emparelhadas) Um mesmo indivíduo participa de dois grupos ao mesmo tempo, só que não simultaneamente. Exemplo: antes e depois de um tratamento; GABRIELA MEDEIROS – MEDICINA 5 3) P-VALOR O valor de P (p-valor) pode ser definido como a probabilidade de que determinada inferência estatística tenha ocorrido devido ao acaso. Como toda probabilidade, o valor de P irá variar entre 0 e 1. Na maioria dos estudos, admite-se um valor crítico de p < 0,05 (margem de segurança de 5% de erro, ou 95% de chances de acerto). Exemplo: Considere um experimento no qual 10 indivíduos recebem um placebo e outros 10 recebem um diurético experimental. Após 8h, a média do débito urinário no grupo placebo é de 769 mL versus 814 mL no grupo diurético (diferença de 45 mL). Como sabemos se essa diferença significa que a droga funciona e não é simplesmente resultado do acaso? o P-valor seria definido como a probabilidade de a diferença observada entre as médias ser devido ao acaso. o O valor de corte para rejeitar a hipótese nula é de 0,05. o Teve-se: Estatística t de 2,34 Valor-p = 0,031 O que “p-valor = 0,031” significa? o Significa que a chance dessa diferença entre as médias ter ocorrido devido ao acaso (e não um efeito dos tratamentos) é de 3,1%. o Por ser uma possibilidademuito pequena, assume-se que há diferença estatisticamente significativa entre os conjuntos de dados. Bioestatística Analítica – Objetivos gerais: Comparar grupos – avaliar diferentes tratamentos; Verificar associação entre as variáveis – influência de uma característica sobre a outra; Medir a variabilidade na obtenção dos dados (distribuição) – fatores externos influenciam na obtenção dos dados; Técnicas para comparação de grupos: GABRIELA MEDEIROS – MEDICINA 6 A depender do programa estatístico utilizado, como o programa SPSS e SigmaPlot, ele já pode indicar especificamente a técnica para a análise. Exemplo: Quer-se comparar a duração de dois modelos de pilhas para manter um relógio ligado. Dez pilhas do modelo tipo A (amarelo) durou em média 337 minutos. Dez pilhas do modelo tipo B (roxo) manteve o relógio ligado por 348 minutos – diferença de 11min. Como sabemos se essa diferença significa que a pilha B de fato dura mais ou não é simplesmente resultado do acaso? Nessas situações, emprega-se técnicas para comparação de grupo: o São dois grupos independentes (modelo A e B); o Se o conjunto de valores para a duração das 10 pilhas tenham uma distribuição simétrica Teste t de Student o Se o conjunto de valores para a duração das 10 pilhas tenham distribuição assimétrica Teste Mann-Whitney Obs.: Via de regra, quando se tem uma quantidade de amostra significativamente alta, de pelo menos 30, se consegue empregar o Teste t de Student (Teorema Central do limite quando o tamanho da amostra aumenta, a distribuição amostral da média aproxima-se cada vez mais de uma distribuição normal.) GABRIELA MEDEIROS – MEDICINA 7 # Teste t de Student Mais conhecido, utilizado para avaliar se há diferença significativa entre as médias de duas amostras: As duas amostras devem ter distribuição normal – pode-se verificar observando o desvio padrão amostral das duas amostras ou utilizando um teste F de igualdade de variâncias (TESTE.F no Excel). As duas amostras devem ser independentes – depende de como o experimento foi delineado. Note que apenas calcular a correlação entre as duas amostras pode não ser suficiente. É preciso saber como os dados foram coletados. Associação de variáveis: Quando temos 2 variáveis qualitativas, também podemos usar o teste Chi-quadrado: CATEGÓRICA QUANTITATIVA CATEGÓRICA Qui-quadrado Teste t de Student QUANTITATIVA Teste t de Student Regressão linear ou correlação # Qui-quadrado Princípio básico é comparar proporções, possíveis divergências entre as frequências observadas e esperadas para um certo evento. É um teste de hipóteses que se destina a encontrar um valor da dispersão para duas variáveis categóricas nominais e avaliar a associação existente entre variáveis qualitativas. GABRIELA MEDEIROS – MEDICINA 8 Para fazer comparação de proporções, é necessário montar uma tabela com os valores de cada variável (tabela de contingência). Exemplo: verificar a associação entre gênero e alguma comorbidade (DM2) ⤷ Sendo p-valor = 0,0031, há 99,7% de probabilidade de que exista uma associação entre as variáveis gênero e DM2. # Teste de coeficiente de correlação Os coeficientes de correlação são métodos estatísticos para se medir as relações entre variáveis e o que elas representam. Buscar entender como uma variável se comporta em um cenário onde outra está variando, visando identificar se existe alguma relação entre a variabilidade de ambas. Correlação Negativa tendência a uma curva descendente (relação linear negativa) Ausência de Correlação linha horizontal (não há relação) Correlação Positiva tendência de curva ascendente (relação linear positiva). Exprimem o grau de correlação através de valores que variam de (-1 a 1). GABRIELA MEDEIROS – MEDICINA 9 Tipos de coeficientes de correlação: Coeficiente de correlação de Pearson Coeficiente de correlação de Spearman (rho) Coeficiente de correlação de Kendall (tau) Exemplo: Deseja-se verificar se há correlação entre horas de estudo com a nota obtida em provas de alunos. Para isso, utiliza-se o coeficiente de correlação de Pearson. o Monta-se um diagrama de dispersão, obtendo-se: ⤷ Correlação positiva pois há uma curva ascendente. O valor do coeficiente = 0,903, corrobora o gráfico. ⤷ Ou seja, quanto mais horas de estudo, maior a nota da prova. EXERCÍCIO DE FIXAÇÃO Fazer a estatística descritiva dos dados da tabela no Excel; o Extrair frequências; o Fazer cálculos de tendência central; o Fazer cálculos de dispersão central; Propor ao menos dois métodos de estatística analítica que poderiam ser empregados para fazer inferências a respeito dos dados da tabela.
Compartilhar