Baixe o app para aproveitar ainda mais
Prévia do material em texto
Bioestatística - P1 24/09/2019 Introdução à bioestatística tipos de variáveis, gráficos, histograma e amostra Bioestatística: - “Ciência que fornece os princípios e os métodos para coleta, organização, resumo, análise e interpretação de dados nas ciências da vida.”. Ela avalia e interpreta com seguridade e confiabilidade os dados médicos e biológicos coletados em uma pesquisa, pois permite uma análise correta desses dados. - A bioestatística é utilizada nas áreas da: epidemiologia, ecologia, psicologia social e na medicina (e toda área da saúde médica). Possui importância na prática clínica/ médica baseada em evidência. 1- tipos de variáveis Em bioestatística, há 6 variáveis: variável qualitativa (ordinal ou nominal), quantitativa (discreta ou contínua), preditora e desfecho Variável: é a informação de uma condição ou característica da amostra que pode variar V. Qualitativa: Quando os dados são distribuídos em categorias mutuamente exclusivas. Descrevem características dos elementos da população. Além disso, é representada por palavras (valores não numéricos). A variável qualitativa é dividida em qualitativa nominal e ordinal. A nominal é quando os dados são distribuídos em categorias mutuamente exclusivas, ou seja, sem ordem, como por exemplo: cor dos cabelos, tipo de sangue ou gênero. Já a qualitativa ordinal, é quando os dados são distribuídos em categorias mutuamente exclusivas com ordenação natural, como por exemplo: escolaridade (1º grau, 2º grau), classe social, gravidade de uma doença (leve, moderada, severa). V. Quantitativa: Quando é expressa por números. A variável quantitativa é dividida em quantitativa discreta e quantitativa contínua. A discreta é caracterizada por assumir valores em um dado intervalo, como por ex: número de filhos, quantidade de moedas, números de pessoas em uma sala (ou seja, normalmente utiliza números inteiros). Já a variável quantitativa contínua assume qualquer valor num dado intervalo, sendo de números inteiros ou não, como: peso, tempo de espera,etc. Variáveis preditora e desfecho: Preditora: afeta a resposta, podendo ser definida ou medida pelo experimentador Desfecho: medidas ou observadas durante um estudo para documentar o impacto que uma dada intervenção ou exposição tem na saúde de uma dada população. Verde: quantitativa contínua Rosa: quantitativa discreta Amarelo: qualitativa ordinal Azul: qualitativa nominal 2- Análise descritiva dos dados a) Medida de tendência central: valor central ou valor típico para uma distribuição de probabilidade. É chamada ocasionalmente como média ou apenas centro da distribuição. As medidas de tendência central mais comuns são a média aritmética, a mediana e moda. Média: soma de todos os elementos dividido pelo número total de elementos Mediana: é o elemento que ocupa a posição central de uma série de dados. Para encontrá-la os dados devem estar dispostos em ordem crescente ou decrescente. Em uma série em que seja número ímpar de dados, o valor ocupando o meio da série será a mediana, caso contrário, (haja número par de dados), deve-se extrair a média aritmética dos dois valores centrais, assim, o valor encontrado será correspondente a mediana. Moda: é o valor que ocorre com maior frequência em uma série de dados. Quando a série possuir dois valores com a mesma frequência máxima, cada um deles é uma moda, o conjunto diz-se bimodal.Se mais de dois valores ocorrerem com a mesma frequência máxima, o conjunto é multimodal, e quando nenhum valor é repetido,o conjunto não tem moda. B) medida de dispersão e tipo de gráfico Desvio- padrão: determina a variabilidade ou dispersão dos dados relativamente à medida de localização do centro da amostra (medida de tendência central) *Em uma distribuição normal, 95,44% dos dados estão distribuídos no intervalo de ± 2 desvios-padrão. Gráfico de coluna com barra de erro: Quartil: O intervalo interquartil é calculado com base no cálculo de quartis. Primeiro quartil (Q1- 25%), Quartil intermediário (mediana– Q2 – 50%), terceiro quartil (Q3 –75% .) A diferença entre o primeiro quartil e o terceiro quartil determina o intervalo interquartílico (medida de dispersão que demonstra a variabilidade em relação à mediana). O segundo quartil (Q2) representa a mediana, uma vez que esse significa 50% do total. Boxplot: Gráfico gerado a partir da mediana e intervalo interquartílico → ele é representado quando não tem distribuição normal!! (é assimétrico) “Um conjunto de dados que tem uma distribuição simétrica, terá a linha da mediana no centro do retângulo. Quando a linha da mediana está próxima ao primeiro quartil, os dados são assimétricos positivos e quando a posição da linha da mediana é próxima ao terceiro quartil, os dados são assimétricos negativos. Vale ressaltar que a mediana é a medida de tendência central mais indicada quando os dados possuem distribuição assimétrica, uma vez que a média aritmética é influenciada pelos valores extremos.” Tipo de Distribuição X Descrição de dados GRÁFICO DE COLUNAS BOXPLOT E BARRA DE ERRO *Curva de Gauss: quando a maioria dos dados se encontram na região média da curva: Histograma: É um Gráfico de distribuição de frequências utilizado para avaliar a normalidade dos dados. *Se essa distribuição de frequência é simétrica (gerando uma curva), posso afirmar que esses dados estão em uma distribuição normal (2º gráfico), diferente de uma curva gerada assimetricamente (1º e 3º gráfico). quando é simétrico, ou seja, é uma distribuição normal, as medidas que melhor representam esse gráfico é a média e o desvio-padrão. Testes estatísticos para normalidade Antes de realizar um teste estatístico é necessário o reconhecimento sobre as hipóteses estatísticas: * Hipótese nula (H0): os dados têm distribuição normal. A hipótese nula afirma que um parâmetro da população (como a média, o desvio padrão, e assim por diante) é igual a um valor hipotético. A hipótese nula é, muitas vezes, uma alegação inicial baseado em análises anteriores ou conhecimentos especializados. → teste de kolmogorov-smirnov → p:0,15 * Hipótese Alternativa (H1): dados não têm dist. normal. A hipótese alternativa afirma que um parâmetro da população é menor, maior ou diferente do valor hipotético na hipótese nula. A hipótese alternativa é aquela que você acredita que pode ser verdadeira ou espera provar ser verdadeira. Tipos de distribuição de dados: Simétrico - normal - paramétrico - p>0,5 - média → desvio-padrão → utilização de gráfico de colunas e barra de erro. Assimétrico - anormal - não paramétrico- p<0,5 -mediana → intervalo interquartílico → BOXPLOT 3- amostra (Definição e tipos - critérios de inclusão e exclusão) População: grupo de habitantes que convivem em um determinado contexto. Amostra: parcela da população que irá representá-la. Tipos de amostra: Amostra casual simples: também chamada de aleatória simples, é caracterizada pela obtenção de números escolhidos a partir de um gerador de números aleatório (manual ou computacional) ou programas estatísticos específicos. Esse tipo de amostra tira o poder do investigador definir quem fará parte da amostra, o que evita a seleção. Amostra de conveniência: também chamada de não probabilística, é constituída por um número de elementos (pessoas) reunidas em uma amostra simplesmente porque o pesquisador tem fácil acesso à elas, por exemplo: pacientes internados em um hospital, alunos de um curso, pacientes hipertensos de uma unidade básica de saúde. Com esse tipo de amostra, não é possível determinaros reais critérios da seleção das pessoas, o que torna suspeita a presença de viés. Além disso, há critérios de seleção da amostra: critérios de inclusão e critérios de exclusão → isso faz com que a amostra se torne homogênea e com redução de viés. Os critérios de inclusão são as regras sobre as características específicas que uma pessoa deve ter para ser incluída no estudo. Estes critérios podem incluir características pessoais, tais como idade e sexo, características da doença, como uma mutação específica ou sintomas específicos, ou características do tratamento anterior ao qual esta pessoa foi submetida. Os critérios de exclusão são as regras que impedem as pessoas de participar de um estudo, mesmo que preencham todos os critérios de inclusão. Os critérios de exclusão identificam características específicas, tais como outras condições clínicas ou características pessoais, que podem afetar a condição da pessoa de uma forma que torna a participação mais perigosa, ou que diminua a chance do indivíduo completar o estudo com sucesso. Tamanho amostral: O cálculo amostral é fundamental, prediz a validade do estudo, e é necessário ser realizado com programas estatísticos. CURVA: SIMÉTRICA CURVA: ASSIMÉTRICA DISTRIBUIÇÃO: NORMAL DISTRIBUIÇÃO: ANORMAL DADO: PARAMÉTRICA DADO: NÃO PARAMÉTRICA PORCENTAGEM DE ERRO: P > 0,05 PORCENTAGEM DE ERRO: P < 0,05 MEDIDA: MÉDIA → DESVIO PADRÃO MEDIDA: MEDIANA → INTERVALO INTERQUARTÍLICO GRÁFICO DE COLUNAS E BARRA DE ERRO BOXPLOT
Compartilhar