Buscar

Memoria_aula_11_estatistica_variancia_e_desvio_padrao

Prévia do material em texto

MEDIDAS DE DISPERSÃO (SEGUNDA PARTE) 
VARIÂNCIA E DESVIO PADRÃO 
 
Após o estudo do desvio médio simples (DMS), observamos que a dificuldade 
em se operar com o DMS se deve à presença de módulo, para que as 
diferenças possam ser interpretadas como distâncias. 
 
Por este motivo, outra forma de se conseguir que as diferenças se 
tornem sempre positivas ou nulas é considerar o quadrado destas diferenças, 
ou seja, . 
 
Se substituirmos nas fórmulas do DMS a expressão por , 
obteremos uma nova medida de dispersão conhecida como Variância. 
Portanto, a variância é uma média aritmética calculada a partir dos 
quadrados dos desvios obtidos entre os elementos da série e sua 
respectiva média. O Desvio Padrão é a raiz quadrada positiva da variância. 
 
Em particular, para estas medidas levaremos em consideração o fato da 
sequência de dados representar toda uma população. É importante 
informar que estas medidas podem ser aplicadas também para uma 
amostra de uma população, mas não será o caso deste estudo. 
 
Quando a sequência de dados representa uma população, a variância será 
denotada por σ2(x) e o desvio padrão correspondente por σ(x). 
 
Cálculos da Variância e Desvio Padrão: 
 
1º Caso – Dados Brutos ou Rol 
 
Se a sequência representa uma população, a variância será calculada 
aplicando a seguinte fórmula: 
 
 
 
 
Exemplo: 
 
Calcular a variância e o desvio padrão da seguinte sequência de valores: 
X: 4, 5, 8, 5. 
 
Resolução: 
 
A sequência contém elementos e tem por média: 
 
 
 
Os quadrados das diferenças valem: 
 
 
 
 
 
 
Somando-se estes valores obtém-se: . 
Substituindo esses valores na fórmula da variância, temos: 
 
 
 
Como o desvio padrão é a raiz quadrada positiva da variância, temos: 
 
 
 
Observação: a interpretação será comentada no final deste texto. 
 
2º Caso – Variável Discreta 
 
Da mesma forma que no DMS, a variância é definida para variáveis discreta e 
contínua como sendo uma média aritmética ponderada. Entretanto, o que 
difere do caso anterior, é que é uma média aritmética ponderada dos 
quadrados dos desvios dos elementos da série para a média da série. 
 
Exemplo: 
 
Calcular a variância e o desvio padrão para a série abaixo, representativa de 
uma população: 
 
xi fi 
2 3 
3 5 
4 8 
5 4 
 
Resolução: 
 
O número de elementos da série é . 
 
A média desta série é: 
 
xi fi xifi 
2 3 6 
3 5 15 
4 8 32 
5 4 20 
 =20 =73 
 
Portanto, a média desta série é: 
 
Para este caso a variância é dada por: 
 
Construindo uma nova coluna para estes cálculos, obtém-se: 
 
xi fi xifi 
 
2 3 6 8,1675 
3 5 15 2,1125 
4 8 32 0,9800 
5 4 20 7,2900 
 =20 =73 =18,55 
 
Desse modo, a variância é: 
 
 
 
Como o desvio padrão é a raiz quadrada positiva da variância, temos: 
 
 
 
 
3º Caso – Variável Contínua 
 
Novamente, por desconhecer os valores individuais dos elementos 
componentes da série, substituiremos os valores Xi, pelos pontos médios de 
cada intervalo de classe. 
 
A fórmula para o cálculo da Variância neste caso é: 
 
 
 
Onde Xi é o ponto médio da classe i. 
 
 
 
 
Exemplo: 
 
Calcular a variância e o desvio padrão para a série abaixo, representativa de 
uma população: 
 
Classe Intervalo de classe fi 
 1 4 ׀ 0 1
 3 8 ׀ 4 2
 5 12 ׀ 8 3
 1 16 ׀ 12 4
 
 
Resolução: 
 
O número de elementos da série é 
 
A média da série é onde Xi são os pontos médios de classe. 
 
Classe Intervalo de classe fi xi xifi 
 2 2 1 4 ׀ 0 1
 18 6 3 8 ׀ 4 2
 50 10 5 12 ׀ 8 3
 14 14 1 16 ׀ 12 4
 =10 =84 
 
Portanto, a média desta série é: 
 
Como neste caso a variável contínua é representativa de uma população, 
então a variância é dada por: 
 
 
 
Construindo uma nova coluna para estes cálculos, obtém-se: 
 
 
Classe Intervalo de classe fi xi xifi 
 
 10,50 2 2 1 4 ׀ 0 1
 1,00 18 6 3 8 ׀ 4 2
 7,60 50 10 5 12 ׀ 8 3
 3,90 14 14 1 16 ׀ 12 4
 =10 =84 =102,4 
 
A variância é, portanto: 
 
 
 
E o desvio padrão é: 
 
 
 
COMENTÁRIO IMPORTANTE 
 
No cálculo da variância, quando elevamos ao quadrado a diferença , a 
unidade de medida da série fica também elevada ao quadrado. A variância 
sempre será representada no quadrado da unidade de medida da série. Se os 
dados são expressos em metros (m), a variância é expressa em metros 
quadrados (m2). Em determinadas situações, a unidade de medida da variância 
não possui sentido. É o caso, por exemplo, em que os valores da série são 
expressos em litros, pois a variância será expressa em litros quadrados. 
Portanto, o valor da variância não pode ser comparado diretamente com os 
valores da série. Por este motivo a variância não tem interpretação. 
 
A medida de dispersão chamada de desvio padrão existe exatamente para 
suprir esta deficiência interpretativa da variância. Como o desvio padrão é a 
raiz quadrada da variância, o mesmo terá sempre a mesma unidade de 
medida dos elementos da série e, portanto, admite interpretação. 
 
 
 
Interpretação do Desvio Padrão 
 
O desvio padrão é considerado pelos especialistas da área como sendo a mais 
importante das medidas de dispersão. É fundamental e muito importante que o 
estudante de estatística consiga relacionar e interpretar o valor obtido de 
desvio padrão com os valores pertencentes da série de estudo. 
 
Quando uma curva de frequência representativa da série é perfeitamente 
simétrica (como a curva representada abaixo), podemos afirmar que o intervalo 
 contém aproximadamente 68% dos valores da série. 
 
 
 
O intervalo contém aproximadamente 95% dos valores da 
série e o intervalo contém aproximadamente 99% dos valores 
existentes na série de estudo. 
 
 
 
 
 
 
 
 
Estes percentuais (68%, 95% e 99%) que foram apresentados acima poderão 
ser comprovados (caso tenha interesse), com maior precisão, no estudo da 
distribuição normal de probabilidades. Para uma compreensão inicial do 
desvio padrão, estas noções são suficientes. 
 
Quando a distribuição dos valores da série não são perfeitamente simétricos, 
estes percentuais apresentam pequenas variações para mais ou para menos. 
De uma forma mais clara e conceitual quando se afirma que uma série 
apresenta uma média e desvio padrão , podemos interpretar 
da seguinte forma: 
 
 Os valores da série estão concentrados em torno de 100. 
 O intervalo contém aproximadamente 68% dos valores da 
série. O intervalo contém aproximadamente 95% dos valores 
da série. O intervalo contém aproximadamente 99% dos 
valores da série. 
 
É importante que se tenha percebido que, ao aumentar o tamanho do 
intervalo, aumenta-se o percentual de elementos contidos neste intervalo.

Continue navegando