Baixe o app para aproveitar ainda mais
Prévia do material em texto
� PAGE \* MERGEFORMAT �4� MEDIDAS DE DISPERSÃO A média, a mediana e a moda não bastam para descrever um conjunto de dados: elas informam a tendência central, mas nada dizem sobre a variabilidade. As medidas de tendência central são tanto mais descritivas de um conjunto de dados quanto menor for a variabilidade (dispersão). Quando se faz o cálculo de medidas de tendência central deve-se também fornecer o cálculo de uma medida de variabilidade ou dispersão. São medidas de dispersão: amplitude, variância e desvio padrão. As medidas de dispersão indicam se os valores estão relativamente próximos uns dos outros, ou separados. Para entender o que é dispersão, imagine que quatro alunos obtiveram, em cinco provas, as notas apresentadas na Tabela 5.1. TABELA 5.1 : Notas de quatro alunos em cinco provas Alunos Notas Média Antonio 5 5 5 5 5 5 João 6 4 5 4 6 5 José 10 5 5 5 0 5 Pedro 10 10 5 0 0 5 Todos os alunos obtiveram média igual a 5, mas a dispersão das notas em torno da média não é a mesma para todos os alunos. A Tabela 5.1 mostra claramente que: As notas de Antônio não variaram (a dispersão é nula) As notas de João variaram menos do que as notas de José ( a dispersão das notas de João é menor do que a dispersão das notas de José). As notas de Pedro variaram mais do que as notas de todos os outros (a dispersão das notas de Pedro é a maior). AMPLITUDE Por definição, a amplitude é a diferença entre o maior e o menor dado observado. De acordo com a Tabela 5.1 temos: As notas de Antônio têm amplitude: a = 5 – 5 = 0 As notas de João têm amplitude: a = 6 – 4 = 2 As notas de José têm amplitude: a = 10 – 0 = 10 As notas de Pedro têm amplitude: a = 10 – 0 = 10 A amplitude nem sempre capta certas diferenças. No caso das notas dos alunos, a amplitude mostra, acertadamente, que as notas de Antônio não variaram (a = 0) e que as notas de João variaram menos do que as notas de José (a = 2, no primeiro, e a = 10, no segundo caso). Entretanto a amplitude não mostra que as notas de Pedro variaram mais do que as notas de José (a = 10, nos dois casos). A amplitude não mede bem a dispersão dos dados porque, em seu cálculo, usam-se apenas os valores extremos e não todos os dados. VARIÂNCIA Quando a média é usada como medida de tendência central, ou seja, quando a média indica o centro, podemos calcular o desvio de cada observação em relação à média como segue: Se os desvios forem pequenos, os dados estão aglomerados em torno da média; logo, a variabilidade é pequena. Por outro lado, desvios grandes significam observações dispersas em torno da média e, portanto, variabilidade grande. Veja o exemplo abaixo sobre como calcular desvios em relação à média. Exemplo: Dadas as idades de cinco crianças de 3,6,5,7 e 9 anos, calcule os desvios em relação à média, sabendo que a média desta distribuição é 6. Como visto no exemplo da Tabela 5.2 a soma dos desvios é sempre 0, por existir desvios negativos e positivos. Aliás, é este o motivo de a média ser uma boa medida de tendência central: o “peso” dos desvios negativos é igual ao “peso” dos desvios positivos. Para obter uma medida de variabilidade usando os desvios em relação a média, é preciso eliminar os sinais, antes de somar. Uma maneira de se fazer isto é elevar ao quadrado. A soma assim obtida é chamada soma dos quadrados dos desvios. A partir dessa soma, obtêm-se a variância de amostra, que se indica por s2. Variância da amostra é a soma dos quadrados dos desvios de cada observação em relação à média, dividida por (n – 1). Assim temos: (1) Para calcular a variância: Calcule os desvios, de cada observação em relação à média; Eleve cada desvio ao quadrado; Some os quadrados; Divida o resultado por n -1 (n é o número de observações). O cálculo da variância para os dados da Tabela 5.2 está apresentado na Tabela 5.3. A variância é : Se um conjunto de números constitui uma população, ou se a finalidade de somar os dados é apenas descrevê-los, e não fazer inferências sobre uma população, então deve-se usar n em lugar de (n-1) no denominador. Exemplos Calcule a variância da amostra: 2, 4, 6, 8, 10. Aplicando a fórmula teríamos = Se os valores representassem toda uma população, a variância seria Fórmula Prática para calcular a variância A fórmula dada pela equação 1 para o cálculo da variância da amostra pode ser desenvolvida algebricamente. Obtém-se, então, uma segunda fórmula, dada por: x2 (2) A Tabela 5.4 apresenta um exemplo de cálculo da variância. Logo, a variância é : Desvio Padrão Para obtermos uma medida de variabilidade, na mesma unidade de medida dos dados, extraímos a raiz quadrada da variância. A medida assim obtida chama-se Desvio Padrão. Desvio Padrão é raiz quadrada da variância, com sinal positivo. O desvio padrão é uma medida de variabilidade muito usada porque mede a dispersão dos dados e apresenta o resultado na mesma medida dos dados. Assim: Como anteriormente, a substituição de (n-1) por n produz as fórmulas do desvio padrão da população. O desvio padrão goza de algumas propriedades, dentre as quais destacamos: Somando-se (ou subtraindo) uma constante a (de) todos os valores de uma variável, o desvio padrão não se altera Multiplicando-se todos os valores de uma variável por uma constante (diferente de zero), o desvio padrão fica multiplicado por uma constante. Coeficiente de Variação O coeficiente de variação é a razão entre o desvio padrão e a média. O resultado é multiplicado por 100, para que o coeficiente de variação seja dado em porcentagem. Assim: Para entender como se interpreta o coeficiente de variação, imagine dois grupos de pessoas: no primeiro grupo, as pessoas têm idades 3,1 e 5 anos e a média é, evidentemente, 3 anos; no segundo grupo, as pessoas têm idades de 55, 57 e 53 anos, com média de 55 anos. Observe que, nos dois grupos, a dispersão dos dados é a mesma: ambos têm variância s2 = 4. Mas as diferenças de 2 anos são muito mais importantes no primeiro grupo, que tem média 3, do que no segundo grupo, que tem média 55. Os coeficientes de variação são: Um coeficiente de variação de 66,67% indica que a dispersão dos dados em relação à média é muito grande, ou seja, a dispersão relativa é alta. Um coeficiente de variação de 3,64% indica que a dispersão dos dados em relação à média é pequena. Em outras palavras, diferenças de 2 anos são relativamente mais importantes no primeiro grupo, que tem média 3 (CV1=66,67%), do que no segundo grupo, que tem média 55 (CV2=3,64%). Por ser adimensional, o coeficiente de variação é útil para comparar a dispersão relativa de variáveis medidas em diferentes unidades. Como exemplo veja o exercício abaixo. Calcular a média, o desvio padrão e o coeficiente de variação dos dados apresentados na Tabela 5.5. Comente os resultados. Para o peso: a média é 20,3 kg e o desvio padrão é 3,74 kg. O CV é 18,42%. Para o comprimento: a média é 102,3 cm e o desvio padrão é 4,85 cm. O CV é 4,74%. Os desvios padrões do peso e do comprimento não podem ser comparados, pois as unidades de medidas são diferentes. No entanto, os CV podem ser comparados porque são adimensionais. O CV do peso (18,42%) é maior do que o CV do comprimento (4,74%). Isto significa que os dados do comprimento variam menos em relação à média do que os dados do peso. _1327324080.unknown _1327494577.unknown _1349090332.unknown _1349090441.unknown _1327495085.unknown _1327495132.unknown _1327324962.unknown _1327327379.unknown _1327324540.unknown _1327147913.unknown _1327157814.unknown _1327147103.unknown
Compartilhar