Baixe o app para aproveitar ainda mais
Prévia do material em texto
MEDIDAS DE DISPERSÃO (SEGUNDA PARTE) VARIÂNCIA E DESVIO PADRÃO Após o estudo do desvio médio simples (DMS), observamos que a dificuldade em se operar com o DMS se deve à presença de módulo, para que as diferenças possam ser interpretadas como distâncias. Por este motivo, outra forma de se conseguir que as diferenças se tornem sempre positivas ou nulas é considerar o quadrado destas diferenças, ou seja, . Se substituirmos nas fórmulas do DMS a expressão por , obteremos uma nova medida de dispersão conhecida como Variância. Portanto, a variância é uma média aritmética calculada a partir dos quadrados dos desvios obtidos entre os elementos da série e sua respectiva média. O Desvio Padrão é a raiz quadrada positiva da variância. Em particular, para estas medidas levaremos em consideração o fato da sequência de dados representar toda uma população. É importante informar que estas medidas podem ser aplicadas também para uma amostra de uma população, mas não será o caso deste estudo. Quando a sequência de dados representa uma população, a variância será denotada por σ2(x) e o desvio padrão correspondente por σ(x). Cálculos da Variância e Desvio Padrão: 1º Caso – Dados Brutos ou Rol Se a sequência representa uma população, a variância será calculada aplicando a seguinte fórmula: Exemplo: Calcular a variância e o desvio padrão da seguinte sequência de valores: X: 4, 5, 8, 5. Resolução: A sequência contém elementos e tem por média: Os quadrados das diferenças valem: Somando-se estes valores obtém-se: . Substituindo esses valores na fórmula da variância, temos: Como o desvio padrão é a raiz quadrada positiva da variância, temos: Observação: a interpretação será comentada no final deste texto. 2º Caso – Variável Discreta Da mesma forma que no DMS, a variância é definida para variáveis discreta e contínua como sendo uma média aritmética ponderada. Entretanto, o que difere do caso anterior, é que é uma média aritmética ponderada dos quadrados dos desvios dos elementos da série para a média da série. Exemplo: Calcular a variância e o desvio padrão para a série abaixo, representativa de uma população: xi fi 2 3 3 5 4 8 5 4 Resolução: O número de elementos da série é . A média desta série é: xi fi xifi 2 3 6 3 5 15 4 8 32 5 4 20 =20 =73 Portanto, a média desta série é: Para este caso a variância é dada por: Construindo uma nova coluna para estes cálculos, obtém-se: xi fi xifi 2 3 6 8,1675 3 5 15 2,1125 4 8 32 0,9800 5 4 20 7,2900 =20 =73 =18,55 Desse modo, a variância é: Como o desvio padrão é a raiz quadrada positiva da variância, temos: 3º Caso – Variável Contínua Novamente, por desconhecer os valores individuais dos elementos componentes da série, substituiremos os valores Xi, pelos pontos médios de cada intervalo de classe. A fórmula para o cálculo da Variância neste caso é: Onde Xi é o ponto médio da classe i. Exemplo: Calcular a variância e o desvio padrão para a série abaixo, representativa de uma população: Classe Intervalo de classe fi 1 4 ׀ 0 1 3 8 ׀ 4 2 5 12 ׀ 8 3 1 16 ׀ 12 4 Resolução: O número de elementos da série é A média da série é onde Xi são os pontos médios de classe. Classe Intervalo de classe fi xi xifi 2 2 1 4 ׀ 0 1 18 6 3 8 ׀ 4 2 50 10 5 12 ׀ 8 3 14 14 1 16 ׀ 12 4 =10 =84 Portanto, a média desta série é: Como neste caso a variável contínua é representativa de uma população, então a variância é dada por: Construindo uma nova coluna para estes cálculos, obtém-se: Classe Intervalo de classe fi xi xifi 10,50 2 2 1 4 ׀ 0 1 1,00 18 6 3 8 ׀ 4 2 7,60 50 10 5 12 ׀ 8 3 3,90 14 14 1 16 ׀ 12 4 =10 =84 =102,4 A variância é, portanto: E o desvio padrão é: COMENTÁRIO IMPORTANTE No cálculo da variância, quando elevamos ao quadrado a diferença , a unidade de medida da série fica também elevada ao quadrado. A variância sempre será representada no quadrado da unidade de medida da série. Se os dados são expressos em metros (m), a variância é expressa em metros quadrados (m2). Em determinadas situações, a unidade de medida da variância não possui sentido. É o caso, por exemplo, em que os valores da série são expressos em litros, pois a variância será expressa em litros quadrados. Portanto, o valor da variância não pode ser comparado diretamente com os valores da série. Por este motivo a variância não tem interpretação. A medida de dispersão chamada de desvio padrão existe exatamente para suprir esta deficiência interpretativa da variância. Como o desvio padrão é a raiz quadrada da variância, o mesmo terá sempre a mesma unidade de medida dos elementos da série e, portanto, admite interpretação. Interpretação do Desvio Padrão O desvio padrão é considerado pelos especialistas da área como sendo a mais importante das medidas de dispersão. É fundamental e muito importante que o estudante de estatística consiga relacionar e interpretar o valor obtido de desvio padrão com os valores pertencentes da série de estudo. Quando uma curva de frequência representativa da série é perfeitamente simétrica (como a curva representada abaixo), podemos afirmar que o intervalo contém aproximadamente 68% dos valores da série. O intervalo contém aproximadamente 95% dos valores da série e o intervalo contém aproximadamente 99% dos valores existentes na série de estudo. Estes percentuais (68%, 95% e 99%) que foram apresentados acima poderão ser comprovados (caso tenha interesse), com maior precisão, no estudo da distribuição normal de probabilidades. Para uma compreensão inicial do desvio padrão, estas noções são suficientes. Quando a distribuição dos valores da série não são perfeitamente simétricos, estes percentuais apresentam pequenas variações para mais ou para menos. De uma forma mais clara e conceitual quando se afirma que uma série apresenta uma média e desvio padrão , podemos interpretar da seguinte forma: Os valores da série estão concentrados em torno de 100. O intervalo contém aproximadamente 68% dos valores da série. O intervalo contém aproximadamente 95% dos valores da série. O intervalo contém aproximadamente 99% dos valores da série. É importante que se tenha percebido que, ao aumentar o tamanho do intervalo, aumenta-se o percentual de elementos contidos neste intervalo.
Compartilhar