Baixe o app para aproveitar ainda mais
Prévia do material em texto
RESUMO BIOESTATÍSTICA (está dentro da metodologia) População: todo público que você quer estudar Amostra: parte da população – deve ser representativa e proporcional (tamanho ideal), para isso é feita a inferência estatística INFERÊNCIA ESTATÍSTICA: tem duas formas de fazer 1) Teste de hipóteses (valor de p) 2) Intervalo de confiança - Teste de hipóteses: 1) Hipótese nula: premissa básica – quando não se tem diferença entre as variáveis (igualdade/neutralidade) OBS: não importa seu conhecimento ou o que tem na literatura, você vai na neutralidade 2) Hipótese alternativa: aquilo que eu acho que pode funcionar – quando tem diferença entre as variáveis EXEMPLO: ensaio clínico de comparação do uso de vitamina c e zinco X placebo na prevenção de covid 19 Hipótese nula: não existe diferença entre usar placebo e vitamina c na prevenção do covid Hipótese alternativa: existe diferença entre usar vitamina c e o zinco no lugar do placebo como prevenção pra covid OBS: não necessariamente a diferença é positiva (funcionar), pode ser negativa – mas tem que ter diferença - Tipos de erros: I ou alfa) Quando você rejeita a hipótese nula, mas ela é verdadeira, OU SEJA: quando você toma a hipótese nula como falsa (você acredita que tenha sim diferença entre as variáveis), mas nos resultados prova que é verdadeira (que não existe diferença) OBS: considerado erro mais grave, porque é quando você tenta mudar um tratamento padrão, mas na verdade aquilo não é benéfico OBS: probabilidade de 5% de cometer o erro tipo 1 II ou beta) Quando você aceita a hipótese nula, mas ela é falsa, OU SEJA: quando você toma a hipótese nula como verdadeira (você quer provar que não tem diferença entre as variáveis), mas nos resultados prova que é falsa (que existe sim diferença) OBS: geralmente associado com amostra pequena, e é mais comum (probabilidade de 20%), portanto poder do estudo = 1 – beta (80%) - Nível de significância com base no teste das hipóteses: 1) Estatisticamente insignificante: aceita a nula e rejeita a alternativa (ou seja, manteve como estava) 2) Estatisticamente significante: rejeita a nula e aceita a alternativa (ou seja, propôs algo novo e acreditou nisso – teve mudança) Valor p: é o nível de significância (já vem na tabela) Consiste na probabilidade de aceitar ou rejeitar a hipótese nula p > 0,05 = é estatisticamente insignificante (aceitou nula e rejeitou alternativa) p < 0,05 = é estatisticamente significante (rejeitou a nula e aceitou alternativa) OBS: quanto menor o nível de p, mais rigoroso é o estudo OBS: um estudo estatisticamente significante não significa necessariamente que ele é clinicamente relevante também OBS: cada característica da tabela tem um valor de p, se ele for > 0,05 (insignificante), significa que não teve diferença estatística para aquela característica/variável, porque aceita a nula (ex: idade, características clínicas e demográficas..) – e vice versa (se teve diferença estatística) OBS: analisando o artigo como um todo, você vai focar nas características/variáveis que foram mais significantes - Intervalo de confiança: é uma medida de variabilidade e tem a mesma informação que a significância estatística IC/CI 95%: é a probabilidade de 95% de chance do intervalo incluir a verdadeira magnitude, ou seja, se o estudo for repetido 100 vezes, em 95 vão achar o mesmo resultado – isso dentro do intervalo escolhido Exemplo: Intervalo de (0.72 – 0.95), tem 95% de chance dos valores estarem dentro desse intervalo OBS: informa a precisão estatística, então quanto menor for o intervalo, maior a precisão. E o que determina o intervalo é o tamanho amostral, portanto quanto maior a amostra, menor o intervalo. - Rate Ratio/risco relativo: 1) Acima de 1 = fator de risco/não teve benefício – equivale a um p insignificante (> 0,05) 2) Abaixo de 1 = fator protetor/teve benefício - equivale a um p significante (< 0,05) 3) 1 = não fez diferença OBS: você deve analisar IC junto com risco relativo, então se dentro do intervalo de confiança tiver o valor 1, está relacionado com risco relativo acima de 1 (fator de risco/não teve benefício e insignificante). Exemplo: IC (0.91 – 1.55) – ele oscila de menor que 1 para maior que 1 (oscila entre fator protetor e fator de risco), portanto tem baixa precisão. _______________________________________________________________ TIPOS DE VARIÁVEIS: 1) Quantitativas/numérica: - Discreta: expressa em valores inteiros (Ex: número de filhos) - Contínua: quando o valor possui intervalo, pode ser quebrado (Ex: salário, IMC, valor de PA, idade, peso..) OBS: expressas na tabela por medidas de tendência central ou dispersão 2) Qualitativa/categórica: - Nominal: quando não existe ordem (Ex: tipo sanguíneo: A, B, AB, O) OBS: pode ser nominal dicotômica – quando tiver apenas duas respostas (Ex: sim ou não; doente ou não doente) - Ordinal: quando existe ordem (Ex: classe social: baixa, média e alta) OBS: expressas na tabela através de números absolutos e percentuais, e pode usar o IC pra estimar a precisão dos resultados de cada característica _______________________________________________________________ ESTATÍSTICA DESCRITIVA – descreve as características de certo grupo sem fazer inferências (detalha os dados coletados). Através de: 1) Escolha de uma medida de tendência central 2) Escolha de uma medida de dispersão 3) Escolher a melhor representação gráfica - Medidas de tendência central/posição: identifica o valor central dentro do conjunto 1) Média: Soma tudo e divide pelo número de itens Vantagens: - Reflete todos os valores da amostra - Possui propriedades matemáticas definidas Limitações: - É influenciada pelos valores extremos Tipo de variável aplicável: Contínua e discreta 2) Mediana: Organiza de forma crescente e: Se for par: soma os dois itens do meio e divide por 2 Se for ímpar: pega o valor do meio Vantagens: - Menos sensível a valores extremos Limitações: - Difícil de ser determinada - Não engloba todos os valores da amostra Tipo de variável aplicável: Contínua e discreta 3) Moda: É o item/valor que mais aparece na amostra OBS: pode ser: amodal (1), bimodal (2), multimodal (3 ou mais) – de acordo com o número de modas Vantagens: - Representa um valor mais frequente Limitações: - Não possui representatividade - Não é utilizada na bioestatística Tipo de variável aplicável: Contínua, discreta, categórica e ordinal - Medidas de dispersão: determina a variabilidade/dispersão do conjunto 1) Amplitude = X máximo – X mínimo Ex: (3,5,6,7,9) – Amplitude = 9 – 3 = 6 OBS: não mede bem a variabilidade porque só leva em conta os extremos – é limitada, da apenas ideia geral 2) Intervalo interquartil: você divide o conjunto em 4 partes iguais, e os quartis são os 3 pontos dos intervalos dentro da divisão 1° quartil: delimita 25% da amostra 2° quartil: mediana do conjunto (exatamente o meio) 3º quartil: delimita 75% da amostra Intervalo interquartil: Q3 – Q1 3) Desvio padrão: primeiro é preciso calcular a variância (depende dela), que é influenciada pela média. (não precisa saber o cálculo) - Formas de apresentação dessas medidas nas tabelas: 1) Número +/- outro número: é a média +/- o desvio padrão. Ex: 26,4 +/- 1,0 OBS: usado em distribuição normal 2) O número e um intervalo em parênteses: é a mediana e o intervalo interquartil. Ex: 7 (5-8) OBS: usado em distribuição não normal - Tipos de representações gráficas: 1) Gráfico simétrico (distribuição Gaussiana/curva de Gauss): quando as medidas de tendência central estão no centro (muito próximas) = distribuição normal/paramétrica OBS: Nesse caso usa a média 2) Gráfico não simétrico: ocorre um desvio das medidas de tendência central para algum dos extremos = distribuição não normal/ não paramétrica _______________________________________________________________ANÁLISE DE NORMALIDADE – através dos itens: 1) Histograma 2) Tamanho do desvio padrão 3) Diferença entre média e mediana 4) Skewness 5) Kurtosis 1) Análise do histograma: - paramétrico: gráfico simétrico, com as medidas de tendência central muito próximas no centro, e pouca frequência de valores extremos - não paramétrico: gráfico não simétrico, existe desvio em um dos extremos 2) Desvio-padrão (std deviation) - vem na tabela - - paramétrico: quando o desvio-padrão for até 50% da média (mean) Exemplo: se a média for 10, o desvio-padrão aceitável é até 5. - não paramétrico: quando o desvio-padrão for maior que 50% da média 3) Proximidade da média (mean) e da mediana (median): - paramétrico: quando o valor da média e da mediana forem próximos - não paramétrico: quando o valor da média e da mediana forem distantes 4) SKEWNESS: analisa através do formato do gráfico - positivo: cauda (parte menor) pra direita – indica mediana > média - negativo: cauda (parte menor) pra esquerda – indica média > mediana - paramétrico: quando o valor estiver dentro da faixa de normalidade (entre -5 e +5) – esse valor vem na tabela - não paramétrico: quando o valor estiver fora da faixa de normalidade (maior ou menor) 5) KURTOSIS: analisa através da altura do gráfico (valor de y) - Valor 1: altura ideal - Kurtosis > 1 – apiculamento - Kurtosis < 1 – achatamento - paramétrico: quando o valor estiver dentro da faixa de normalidade (entre -5 e +5). - não paramétrico: quando o valor estiver fora da faixa de normalidade (maior ou menor). OBS: na questão para dizer se é normal ou não normal você analisa TUDO (os 5 itens + teste estatístico de normalidade), o que tiver em maior quantidade você vai, porque nem sempre todos os itens vão indicar normalidade. _______________________________________________________________ TESTES ESTATÍSTICOS DE NORMALIDADE 1) Olhar o tamanho da amostra (n) Se a amostra for: - MAIOR QUE 50 = analisamos Kolmogorov-Smirnov. - MENOR QUE 50 = analisamos Shapiro-Wilk. 2) A partir da escolha entre Kolmogorov-Smirnov e Shapiro-Wilk Hipótese nula: não existe variabilidade, amostra normal (p > 0,05) Hipótese alternativa: existe variabilidade, amostra não normal (p < 0.05) Você vai analisar o valor de p/significância (sig) do escolhido: a) Se p for menor que 0,05 – a hipótese nula foi rejeitada e por isso não se encontra nos parâmetros de normalidade (não paramétrico) OBS: se usa mediana e intervalo quartil b) Se p for maior que 0,05 – a hipótese nula foi aceita e por isso encontra-se nos parâmetros de normalidade (paramétrico) OBS: se usa média e desvio padrão CUIDADO: É O CONTRÁRIO DA ANÁLISE DE SIGNIFICÂNCIA ESTATÍSTICA ESCOLHA DO GRÁFICO 1) Pizza: mostra proporções entre as categorias/itens 2) Barra: usada para variáveis categóricas (onde a altura representa a altura da variável) 3) Boxplot: ideal para não paramétricas 4) Histograma: NELE QUE VAI ANALISAR TUDO - Distribuição de frequências, permite analisar a forma, ponto central e variação da distribuição - Análise de dados quantitativos
Compartilhar