Baixe o app para aproveitar ainda mais
Prévia do material em texto
-Medidas de dispersão- As medidas de dispersão são usadas para avaliar o grau de variação ou dispersão dos dados de um conjunto de observações. Algumas das medidas de dispersão mais comuns em bioestatística incluem: Amplitude total: é a diferença entre o maior e o menor valor em um conjunto de dados. Variância: é a média dos quadrados das diferenças entre cada valor e a média. A variância é uma medida de dispersão que indica o quão afastados os valores de um conjunto de dados estão em relação à média. Desvio padrão: é a raiz quadrada da variância. O desvio padrão é uma medida de dispersão que indica a distância média dos valores em relação à média. Coeficiente de variação: é uma medida de dispersão relativa que é calculada dividindo o desvio padrão pela média e multiplicando por 100%. O coeficiente de variação é útil para comparar a variabilidade entre diferentes conjuntos de dados que tenham médias diferentes. Quartis e desvio interquartil: os quartis são os valores que dividem um conjunto de dados ordenados em quatro partes iguais. O desvio interquartil é a diferença entre o terceiro e o primeiro quartis. Essas medidas são úteis para avaliar a variabilidade de conjuntos de dados que possuem valores extremos ou assimetria. Cada medida de dispersão tem suas próprias vantagens e desvantagens e é escolhida com base nos objetivos da análise e nas características do conjunto de dados em questão. -Amplitude Total- A amplitude total é uma medida simples de dispersão que corresponde à diferença entre o maior e o menor valor de um conjunto de dados. Por exemplo, considere o conjunto de dados a seguir, que representa o número de ovos por ninhada de um determinado animal em cinco anos consecutivos: 10, 12, 9, 15, 13 A amplitude total desse conjunto de dados é calculada subtraindo-se o menor valor (9) do maior valor (15): Amplitude total = 15-9 = 6 Isso significa que a variação no número de ovos por ninhada observada nesses cinco anos foi de 6 ovos, o que é relativamente baixo. A amplitude total é uma medida de dispersão simples, mas pode ser influenciada por valores extremos (outliers), que podem ser muito distantes dos demais valores do conjunto de dados e, portanto, não representativos da variação geral. Por esse motivo, é importante utilizar outras medidas de dispersão, como a variância e o desvio padrão, para complementar a análise da amplitude total. -Variância- A variância é uma medida de dispersão que indica o quão afastados os valores de um conjunto de dados estão em relação à média. Ela é calculada pela média dos quadrados das diferenças entre cada valor e a média. Por exemplo, considere o conjunto de dados a seguir, que representa a altura (em centímetros) de cinco pessoas: 160, 165, 170, 172, 175 Para calcular a variância desse conjunto de dados, primeiro é necessário calcular a média, que é a soma dos valores dividida pelo número de observações: Média = (160 + 165+ 170 +172 + 175) / 5 = 168,4 cm Em seguida, calculamos as diferenças entre cada valor e a média: (160-168,4) = -8,4 (165-168,4) = -3,4 (170-168,4) = 1,6 (172-168,4) = 3,6 (175-168,4) = 6,6 Depois, elevamos cada diferença ao quadrado: (-8,4)^2 = 70,56 (-3,4)^2 = 11,56 (1,6)^2 = 2,56 (3,6)^2 = 12,96 (6,6)^2 = 43,56 A variância é a média dos quadrados das diferenças entre cada valor e a média: Variância = (70,56 + 11,56 +2,56 + 12,96 + 43,56) / 5 = 28,24 Portanto, a variância desse conjunto de dados é de 28,24 cm^2. A variância é uma medida útil para quantificar a dispersão dos dados, mas ela é expressa em unidades ao quadrado, o que pode dificultar a interpretação dos resultados. Por esse motivo, é comum utilizar o desvio padrão, que é a raiz quadrada da variância e tem a mesma unidade de medida dos dados originais. -Desvio Padrão- O desvio padrão é uma medida de dispersão que indica a variabilidade dos valores de um conjunto de dados em relação à média. Um exemplo de como calcular e interpretar o desvio padrão é o seguinte: Suponha que você tenha uma amostra de idades de 5 pessoas: 20, 22, 25, 27 e 30 anos. Para calcular o desvio padrão, você deve seguir estes passos: Calcule a média: somando todos os valores e dividindo pelo número de observações: Média = (20 + 22 + 25 +27 + 30) / 5 = 24,8 Calcule as diferenças entre cada valor e a média: 20-24,8 = -4,8 22-24,8 = -2,8 25-24,8 = 0,2 27-24,8 = 2,2 30-24,8 = 5,2 Eleve cada diferença ao quadrado: (-4,8)^2 = 23,04 (-2,8)^2 = 7,84 (0,2)^2 = 0,04 (2,2)^2 = 4,84 (5,2)^2 = 27,04 Calcule a média dos quadrados das diferenças: Variância = (23,04 +7,84 + 0,04 + 4,84 + 27,04) / 5 = 12,4 Calcule a raiz quadrada da variância para obter o desvio padrão: Desvio padrão = raiz quadrada de 12,4 = 3,52 Interpretando o resultado, podemos dizer que a média de idade da amostra é 24,8 anos e que o desvio padrão é de 3,52 anos. Isso significa que, em média, as idades dos cinco indivíduos estão a 3,52 anos de distância da média de 24,8 anos. Quanto maior o desvio padrão, mais dispersos os valores estão em relação à média. -coeficiente de variação- O coeficiente de variação é uma medida de dispersão relativa, que é calculada dividindo o desvio padrão pela média e multiplicando o resultado por 100%. Ele é útil para comparar a variabilidade de diferentes conjuntos de dados que tenham médias diferentes. Quanto maior for o coeficiente de variação, maior será a variabilidade relativa dos dados em relação à média. Por exemplo, suponha que você está estudando o peso de amostras de um determinado tecido em duas espécies diferentes de animais. Você mediu o peso de dez amostras em cada espécie e obteve os seguintes resultados: Espécie A: média de peso = 12,5g, desvio padrão = 1,5g Espécie B: média de peso = 10g, desvio padrão = 2,5g Para calcular o coeficiente de variação, basta dividir o desvio padrão pela média e multiplicar por 100%. Assim, temos: Coeficiente de variação para a espécie A: (1,5/12,5) x 100% = 12% Coeficiente de variação para a espécie B: (2,5/10) x 100% = 25% Isso significa que a espécie B apresenta uma maior variabilidade relativa em relação à média do que a espécie A. O coeficiente de variação é útil porque permite comparar a variabilidade de diferentes conjuntos de dados, mesmo que as unidades de medida sejam diferentes. -Quartis- Quartis são medidas que dividem um conjunto de dados em quatro partes iguais, cada uma contendo 25% dos dados. O primeiro quartil (Q1) é o valor que separa os 25% menores valores dos demais, o segundo quartil (Q2) é a mediana (valor que separa os 50% menores dos demais) e o terceiro quartil (Q3) é o valor que separa os 25% maiores valores dos demais. Por exemplo, considere o conjunto de dados a seguir, que representa o tempo (em segundos) que um grupo de pessoas levou para resolver um determinado problema: 23, 18, 26, 21, 30, 17, 19, 25, 27, 22 Para calcular os quartis desse conjunto de dados, primeiro é preciso ordená-lo em ordem crescente: 17, 18, 19, 21, 22, 23, 25, 26, 27, 30 Em seguida, encontra-se o segundo quartil, que é a mediana do conjunto de dados, ou seja, o valor que separa os 50% menores dos demais. Como o conjunto tem um número par de valores, a mediana é a média aritmética dos dois valores centrais: Mediana = (22+23)/2 = 22,5 O primeiro quartil é o valor que separa os 25% menores valores dos demais. Para encontrá-lo, basta calcular a mediana dos valores menores que a mediana: Q1 = mediana do subconjunto (17, 18, 19, 21, 22) = (18 +19)/2 = 18,5 O terceiro quartil é o valor que separa os 25% maiores valores dos demais. Para encontrá-lo, basta calcular a mediana dos valores maiores que a mediana: Q3 = mediana do subconjunto (23, 25, 26, 27,30) = (25+ 26) / 2 = 25,5 Portanto, os quartis desse conjunto de dados são: Q1 = 18,5, Q2 = 22,5 e Q3 = 25,5. Os quartis são úteis para identificar a distribuição dos dados e para detectar valores extremos (outliers) que possam estar presentes no conjunto de dados.-distância interquartílica- A distância interquartílica (DIQ) é uma medida de dispersão que representa a diferença entre o terceiro quartil (Q3) e o primeiro quartil (Q1) de um conjunto de dados. Ela indica a amplitude do intervalo em que se encontra a metade central dos dados, ou seja, os valores que estão entre Q1 e Q3. Por exemplo, considere o conjunto de dados a seguir, que representa as idades (em anos) de um grupo de pessoas: 18, 25, 32, 21, 38, 29, 27, 19, 22, 24, 20, 26 Para calcular a distância interquartílica desse conjunto de dados, primeiro é preciso encontrar os quartis, que são: Q1 = 20,25, Q2 (mediana) = 25,5 e Q3 = 29,75. Em seguida, basta calcular a diferença entre Q3 e Q1: DIQ = Q3 - Q1 = 29,75 - 20,25 = 9,5 Portanto, a distância interquartílica desse conjunto de dados é de 9,5 anos. Essa medida é útil para avaliar a dispersão dos dados em torno da mediana e para identificar a presença de valores extremos (outliers) que possam estar fora do intervalo entre Q1 e Q3. -exercícios- 1) Calcule o desvio padrão dos pesos (em kg) de um grupo de dez pessoas: 70, 72, 65, 68, 75, 78, 63, 70, 73, 69. 2) Calcule a variância dos níveis de colesterol (em mg/dL) de um grupo de 20 pacientes: 160, 175, 152, 180, 170, 145, 150, 165, 168, 155, 182, 178, 190, 185, 163, 168, 172, 155, 148, 162. 3) Calcule o coeficiente de variação dos tempos (em minutos) de realização de um teste por dez estudantes: 15, 20, 12, 18, 22, 14, 19, 21, 16, 13. 4) Calcule a amplitude total dos valores de glicemia (em mg/dL) de um grupo de 15 pacientes: 110, 125, 98, 143, 132, 150, 136, 90, 135, 120, 105, 142, 128, 130, 140. 5) Calcule os quartis e a distância interquartílica das alturas (em cm) de um grupo de 12 pessoas: 170, 175, 180, 160, 168, 172, 173, 165, 169, 182, 176, 178. 6) Calcule o desvio padrão dos volumes (em mL) de urina produzidos por 15 pacientes em um dia: 800, 900, 700, 750, 600, 950, 1100, 1200, 1300, 750, 900, 800, 1000, 850, 700. 7) Um pesquisador mediu a concentração de um determinado composto em amostras de água coletadas em cinco pontos diferentes de um rio. Os resultados obtidos foram: 2,4; 2,1; 2,3; 2,5; 2,2 (em mg/L). Qual é o desvio padrão da concentração desse composto no rio? 8) Em um estudo sobre a eficácia de um novo medicamento, os pesquisadores mediram a pressão arterial de 20 pacientes antes e após o tratamento. Os valores da pressão arterial antes do tratamento foram: 120, 130, 135, 125, 128, 126, 129, 132, 127, 130, 125, 130, 129, 131, 125, 130, 128, 127, 131, 129 (em mmHg). Calcule a variância da pressão arterial antes do tratamento. 9) Em um estudo sobre o ganho de peso de crianças no primeiro ano de vida, foram pesadas 20 crianças ao nascer e aos 12 meses de idade. Os resultados (em kg) foram: 3,2; 2,8; 3,5; 3,0; 3,8; 3,1; 3,7; 3,6; 3,3; 3,5; 3,2; 3,9; 3,3; 3,2; 3,1; 3,6; 3,0; 3,4; 3,1; 3,7. Calcule a variância do ganho de peso dessas crianças. 10) Um estudo investigou a variação na pressão arterial de um grupo de idosos ao longo de um dia. A pressão arterial (em mmHg) foi medida a cada 2 horas em um período de 24 horas. Os resultados foram: 120, 130, 135, 125, 128, 126, 129, 132, 127, 130, 125, 130, 129, 131, 125, 130, 128, 127, 131, 129, 126, 129, 128, 130, 127, 126, 129, 131, 128, 130, 129, 127, 132, 130, 133, 130, 128, 129, 131, 130, 133, 130, 131, 129, 132, 130, 131. Calcule a amplitude total da variação da pressão arterial nesse período. -Respostas- 1) Desvio padrão = 4,28 kg. 2) Variância = 203.15 (mg/dL)^2. 3) Coeficiente de variação = 25,92%. 4) Amplitude total = 60 mg/dL. 5) Q1 = 167, Q2 = 172.5, Q3 = 177, DIQ = 10. 6) Desvio padrão = 203,14 mL. 7) Desvio padrão = 0,14 mg/L. 8) Variância = 10,27 (mmHg)^2. 9) Variância = 0,092 (kg)^2. 10) Amplitude total = 13 mmHg.
Compartilhar