Baixe o app para aproveitar ainda mais
Prévia do material em texto
Bioestatística - Material de apoio – Unidade 4 Medidas de dispersão ou de variabilidade Na maioria das vezes, a média não expressa bem o comportamento de uma variável, ou seja, não é suficiente para explicar os dados. Na verdade a média só é representativa quando a variabilidade dos dados é pequena. Variabilidade quer dizer variação, então a variabilidade dos dados é uma forma de medir o quanto os dados se distanciam da média, ou ainda, o quão dispersos estão os dados em torno da média. Veja estes dois exemplos, de gastos com energia elétrica em duas casas, em reais, ao longo de 6 meses: Casa 1: 35,25 36,10 36,60 40,85 35,14 37,20 Casa 2: 33,40 45,10 23,56 35,40 66,30 24,10 Veja bem: a média de gasto com energia na casa 1 é de 36,86 reais, e na casa 2 é de 37,97 reais. Comparando o gasto médio, diríamos que o consumo de energia nas duas casas é praticamente igual... mas isso é verdade? Observe como o gasto com energia na casa 1 é praticamente constante, os valores são bem próximos, ou seja, ela gasta quase a mesma quantidade de energia todo mês. Mas olhe na casa 2: num mês se gasta pouca energia, no outro se gasta muita. Os gastos em cada mês nunca são próximos. Daí, podemos dizer que a variabilidade do gasto com energia elétrica na casa 2 é maior do que na casa 1, e seria mais fácil prever quanto de pagará na conta de energia do mês seguinte na casa 1 do que na casa 2! Dessa forma, podemos perceber que a média explica e representa bem o que acontece com as contas de luz da casa 1, mas não exprime bem o que acontece com as contas de luz da casa 2. Então precisaremos de uma medida que nos informe não só a respeito da tendência central dos gastos (média), mas também da dispersão ou da variabilidade dos gastos. A medida usada mais comumente para expressar a variabilidade dos dados é a variância (denotada por S 2 ): ∑ ( ̅) Complicado? Mas vamos traduzir o que esta fórmula está nos dizendo: 1) Calcule a média dos dados (calcule ̅ ) 2) Subtraia a média de cada um dos dados ( ̅ ). Você estará calculando os desvios de cada dado com relação à média, ou seja, a distância de cada dado com relação à média. 3) Agora eleve ao quadrado os resultados ( ̅) . Você estará calculando os quadrados de todos os desvios. 4) Some este quadrados dos desvios que você calculou (∑ ( ̅) ) 5) Divida o resultado desta soma pelo número de dados que você tem. Veja como fica tudo isso no caso das contas telefônicas: Casa 1: Mês Gasto Gasto-Média (Gasto-Média)2 1 35,25 reais -1,61 reais 2,59 reais2 2 36,10 reais -0,76 reais 0,58 reais2 3 36,60 reais -0,26 reais 0,07 reais2 4 40,85 reais 3,99 reais 15,92 reais2 5 35,14 reais -1,72 reais 2,96 reais2 6 37,20 reais 0,34 reais 0,12 reais2 Soma 1 = 221,14 reais Soma 2 = 22,24 reais2 ̅ Agora, faremos o mesmo para a casa 2: Mês Gasto Gasto - Média (Gasto - Média)2 1 33,40 reais -4,57 reais 20,88 reais2 2 45,10 reais 7,13 reais 50,84 reais2 3 23,56 reais -14,41 reais 207,65 reais2 4 35,40 reais -2,57 reais 6,60 reais2 5 66,30 reais 28,33 reais 802,59 reais2 6 24,10 reais -13,87 reais 192,38 reais2 Soma 1 = 227,86 reais Soma 2 = 1280,94 reais2 ̅ Repare como a variância mostra que a variabilidade do gasto com energia elétrica na casa 2 é MUITO maior do que na casa 1, embora em média, os gastos das duas casas sejam bem próximos (diferença de praticamente 1 real somente). Mas... reais ao quadrado...? Que quer dizer isso? Seria bem melhor para o entendimento e bem mais útil ter uma medida de variabilidade em reais (na mesma unidade de medida dos dados), e não em reais ao quadrado, certo? Para resolver este problema temos o Desvio-padrão (S). O que fazemos quando temos um dado em unidades ao quadrado (reais ao quadrado, metros quadrados, litros ao quadrado...) e queremos ter uma informação na MESMA UNIDADE DE MEDIDA DOS DADOS QUE ESTAMOS ESTUDANDO (reais, metros, litros...)? Basta calcular a raiz quadrada! Então, se queremos uma medida de variabilidade na mesma unidade de medida dos dados, basta tirar a raiz quadrada da variância. Isto é o desvio-padrão: √ Vamos calcular do desvio-padrão do gasto com energia elétrica nas duas casas: Casa 1: S = 2,11 reais Casa 2: S = 16,03 reais Agora sim temos medidas de variabilidade em reais, ou seja, na mesma unidade de medida dos dados. Você sentiria mais segurança ao estimar o gasto com energia do mês que vem na casa 1 ou na casa 2? Coeficiente de variação (CV) O coeficiente de variação é uma estatística ou medida de dispersão que ajuda a diagnosticar a variabilidade (ou dispersão) dos dados, podendo dizer se ela é alta, média, baixa, etc. O coeficiente de variação é calculado de maneira bastante simples: ̅ Observe que o coeficiente de variação não tem unidade de medida. A interpretação do valor do coeficiente de variação pode ser feita com base nos valores referenciais a seguir, mas é importante verificar, caso a caso, a variabilidade dos dados que você está estudando na literatura. Se CV < 10%, então a variabilidade dos dados é considerada baixa Se 10% CV < 20%, então a variabilidade é considerada média Se 20% CV 30%, então a variabilidade é considerada alta Se CV > 30%, então a variabilidade dos dados é considerada muito alta O exemplo das contas de luz: Casa 1 ̅ = Portanto, a variabilidade do gasto com energia elétrica na casa 1 é baixa. Casa 2 ̅ = Portanto, a variabilidade do gasto com energia elétrica na casa 2 é muito alta. Os desvios-padrão somente nos permitiam saber que a variabilidade do gasto com energia elétrica na casa 2 é maior do que o gasto com energia elétrica na casa 1. Porém, o coeficiente de variação é que permite dizer que a variabilidade do gasto com energia elétrica da casa 1 é muito baixa e que a variabilidade do gasto com energia elétrica da casa 2 é muito alta. Na calculadora científica: A calculadora deve estar da função SD: clique em MODE _ 2 1) Limpe a memória de sua calculadora: SHIFT _ MODE _ 1_ = 2) Clique em AC 3) Coloque os valores (dados) na memória da calculadora: Valor1 _ M+ _ valor2 _ M+ _ valor3 _ M+ .... _ valor n _ M+ 4) Clique em AC 5) Para calcular a média, faça: SHIFT _ 2 _ 1 _ = 7) Para calcular o desvio-padrão, faça: SHIFT _ 2 _ 3 _ = PS: estes passos valem para as calculadoras CASIO fx-82MS e similares. Para as calculadoras diferentes, os passos podem ser diferentes. Procure o manual de sua calculadora para verificar como utilizá-la. Amplitude (R ou H) A amplitude dos dados é obtida subtraindo-se o valor mínimo da amostra do valor máximo. Casa 1: R = 40,85 – 35,14 = 5,71 reais Casa 2: R = 66,30 – 23,56 = 42,74 reais
Compartilhar