Prévia do material em texto
Bioestatística Análise de Dados Análise de Dados A análise de dados desempenha um papel fundamental na bioestatística, fornecendo ideias valiosas sobre os fenômenos biológicos e permitindo a tomada de decisões fundamentadas. A análise de dados começa com a coleta de informações relevantes para a pesquisa em questão. Isso pode envolver a coleta de dados brutos de amostras, experimentos controlados ou registros observacionais. É importante garantir que os dados coletados sejam confiáveis, consistentes e representativos da população em estudo. Medidas de Tendência Central A média e a mediana são medidas de tendência central que podem ser usadas para resumir e descrever um conjunto de dados. Embora ambas sejam usadas para representar um valor central dos dados, elas têm propósitos diferentes e são adequadas para diferentes situações. a média é geralmente usada quando se deseja obter uma estimativa do valor central dos dados, considerando todos os valores, a mediana é especialmente útil quando os dados são assimétricos e possuem valores discrepantes, ela fornece uma estimativa mais representativa da "tendência central" em casos onde a média pode ser distorcida. Média aritmética É a soma de todos os valores, dividida pelo número total desses valores Em um conjunto com vários dados (x1, x2, x3, x4...), M = (x1 + x2 + x3 + x4 +...) / n ou ∑x / n Onde “n” é o número total de dados. Ex.: 10; 2; 9; 6; 8 M = (10 + 2 = 9 + 6 + 8) /5 = 7. Significado: corresponde a um "ponto de equilíbrio" (valor em torno do qual os dados se distribuem). Só se deve arredondar a média quando ela representar variáveis quantitativas discretas, como por exemplo idade, número de filhos etc., as quais não podem ser expressas com números fracionados. Médiana É o valor que ocupa a posição central dos dados, após estes serem “organizados” em ordem crescente ou decrescente (ROL). A mediana divide a amostra “exatamente no meio”, no caso da amostra possuir um número “ímpar” de dados. Ex: 71; 82; 57; 68; 78; 75; 64; 61; 85 (n = 9) ROL: 57; 61; 64; 68; 71 ; 75; 78; 82; 85. A mediana é 71. Obs.: metade dos dados são menores ou iguais à mediana (71) e a outra metade, maior. Se o número total de dados for ímpar, a mediana será a média aritmética dos pontos centrais, ou seja, pega-se os 2 valores que estão nas posições centrais e divide-os por 2. Medidas de Dispersão As medidas de dispersão são utilizadas para indicar o grau de variação dos elementos de um conjunto numérico em relação à sua média. Como exemplo, temos: amplitude total, variância e desvio padrão. A escolha entre Amplitude Total, Variância e Desvio Padrão depende dos objetivos da análise e das características dos dados. A Amplitude Total é uma medida rápida e simples de calcular, sendo útil quando se deseja ter uma noção geral da variação dos dados. No entanto, ela pode ser sensível a valores extremos. A Variância e o Desvio Padrão são mais adequados para medir a dispersão de forma mais precisa e levando em conta a distribuição dos valores. Eles são amplamente utilizados em análises estatísticas, sendo especialmente úteis para dados aproximadamente simétricos. Amplitude Total A amplitude total é a diferença entre o maior e o menor valor da série ou da distribuição. Representa a dispersão máxima. Ela raramente é usada como única medida de variabilidade porque é calculada apenas com os valores extremos. Exemplo: Nota de 20 alunos: Notas: 1, 1, 2, 2, 2, 3, 3, 3, 5, 5, 5, 5, 5, 6, 6, 6, 9 At = 9 – 1 = 8 Variância A variância mede o quão distantes os valores de um conjunto de dados estão da média. Ela é calculada como a média dos quadrados das diferenças entre cada valor e a média. Uma variância alta indica que os dados estão mais espalhados e afastados da média, enquanto uma variância baixa indica que os dados estão mais próximos da média. Exemplo: considere o conjunto de dados: 2, 4, 6, 8, 10. Para calcular a variância, primeiro calculamos a média: (2 + 4 + 6 + 8 + 10) / 5 = 6. Em seguida, subtraímos a média de cada valor e elevamos ao quadrado: (2-6)² + (4-6)² + (6-6)² + (8-6)² + (10-6)² = 20. Por fim, dividimos o resultado pelo número de observações (5): 20 / 5 = 4. Portanto, a variância desse conjunto de dados é 4. Desvio padrão é a raiz quadrada da variância e fornece uma medida da dispersão dos dados em relação à média. Ele indica o quanto os valores do conjunto de dados se afastam, em média, da média. Um desvio padrão alto indica uma maior dispersão dos dados, enquanto um desvio padrão baixo indica uma menor dispersão. Exemplo: No exemplo anterior, a variância foi calculada como 4. Para obter o desvio padrão, basta calcular a raiz quadrada da variância: √4 = 2. Portanto, o desvio padrão desse conjunto de dados é 2. Amplitude Total A amplitude total é a diferença entre o maior e o menor valor da série ou da distribuição. Representa a dispersão máxima. Ela raramente é usada como única medida de variabilidade porque é calculada apenas com os valores extremos. Exemplo: Nota de 20 alunos: Notas: 1, 1, 2, 2, 2, 3, 3, 3, 5, 5, 5, 5, 5, 6, 6, 6, 9 At = 9 – 1 = 8 Margem de erro A margem de erro é uma medida estatística usada para expressar a incerteza associada a uma estimativa ou resultado de uma pesquisa. Ela indica a variação esperada em torno dessa estimativa. A margem de erro é comumente usada em pesquisas de opinião, estudos estatísticos e projeções de dados. Para calcular a margem de erro, é necessário considerar dois fatores principais: o desvio padrão dos dados e o tamanho da amostra. Aqui está a fórmula geral para calcular a margem de erro: Margem de erro = (Valor crítico) * (Desvio padrão / √n) Margem de erro Onde: Valor crítico: é um valor estatístico que depende do nível de confiança desejado. Geralmente, é obtido a partir de tabelas estatísticas, como a tabela Z para distribuição normal padrão. Desvio padrão: é a medida da dispersão dos dados em relação à média. n: é o tamanho da amostra. Margem de erro = (Valor crítico) * (Desvio padrão / √n) A margem de erro é geralmente expressa como um valor positivo, representando a variação em torno da estimativa. Para obter o intervalo de confiança, você pode adicionar e subtrair a margem de erro à estimativa original. Margem de erro https://pt.surveymonkey.com/mp/margin-of-error-calculator/ image1.jpeg image2.png image3.png