A maior rede de estudos do Brasil

Dúvidas sobre variância e desvio padrão?

Gostaria de uma boa explicação e exemplos...

Estatística IUNIFORMG

18 resposta(s) - Contém resposta de Especialista

User badge image

Euziana

Há mais de um mês

ula 5

Medidas de dispersão: Desvio Médio, Variância, Desvio Padrão, Coeficiente de Variação e outras medidas de dispersão

Medidas de dispersão

Além do conhecimento de um valor central do conjunto de dados é importante conhecer a dispersão dos valores do conjunto em relação ao valor central. As medidas de dispersão dão uma idéia de homogeneidade, ou seja, do grau de concentração dos valores em torno do valor central. Algumas destas medidas, bastante utilizadas, são: amplitude total, desvio médio, variância, desvio padrão e coeficiente de variação.

Amplitude total (AT): é a diferença entre o maior e o menor valor de um conjunto de dados. AT = maior valor observado – menor valor observado

Desvio (d): é a diferença entre cada um dos valores do conjunto de dados e a média desse conjunto. Desvio médio (dm): é a média aritmética dos valores absolutos dos desvios:

Variância: é a soma dos quadrados dos desvios de cada elemento da distribuição dividida pelo número total de elementos. Podemos considerar duas formas de calculo para a variância: variância populacional e variância amostral.

Amostras com pequeno número de observações são menos representativas da população do que amostras com maiores observações. Matematicamente o uso do denominador n - 1 no lugar de n corrige esse viés. Normalmente, em amostras maiores do que 30, não faz muita diferença, o uso de qualquer uma das equações apresentadas, no entanto esta regra é sempre observada para qualquer que seja o valor de n.

2 Apontamentos de Aula - Probabilidade e Estatística - Prof. Rubens A Requena

Desvio Padrão: A variância consiste na média dos quadrados dos desvios e, portanto a unidade fica elevada ao quadrado (ex.: cm2), isto pode causar erros de interpretação devido a dimensão deste valor. Costuma-se então, usar o desvio padrão, como a raiz quadrada da variância.

Desvio Padrão Populacional -

Desvio Padrão Amostral -

Propriedades do desvio padrão 1. Somando-se ou subtraindo-se uma constante k a todos os valores do conjunto de dados o desvio padrão não se altera. 2. Multiplicando-se uma constante k a todos os valores do conjunto de dados, o desvio padrão não se altera.

Coeficiente de Variação (CV) Essa medida corresponde a dispersão relativa da variabilidade dos dados em relação à sua média

Exemplo 1: Com o objetivo de melhorar o rendimento de seus empregados, uma empresa ofereceu curso de aperfeiçoamento. Os resultados, após a aplicação de um teste a 10 empregados, são dados abaixo:

Analise os desvios de cada uma das disciplinas. Para calcular os desvios precisamos da média aritmética. Para ambos os casos temos =7,0

Desvio médio xxn d n i

Economia 0 10

=⇒md

3 Apontamentos de Aula - Probabilidade e Estatística - Prof. Rubens A Requena

Estatística 8,0

=⇒md

Redação

Note que em Economia não há variação das notas em torno da média, portanto, o desvio médio calculado foi zero. Algumas notas de Estatística se distanciam um pouco da média e, portando, o desvio médio foi um pouco superior. No caso das notas de redação, temos alguns valores bastante distantes da media e, portanto um desvio ainda maior. Desta forma podemos perceber que as medidas de dispersão dão uma idéia da homogeneidade dos dados.

Variância Populacional xxn n

Estatística

=mdσ

Redação

6610 6,6 Desvio Padrão Populacional

Economia

4 Apontamentos de Aula - Probabilidade e Estatística - Prof. Rubens A Requena Coeficiente de Variação

Economia

Quadro de resumo das notas Disciplina Desvio médio Variância Desvio padrão C. Variação Economia 0,0 0,0 0,0 0% Estatística 0,8 1,2 1,095 15,64% Redação 2,2 6,6 2,569 36,70%

Exemplo 2: Para o estudo do consumo de energia de elétrica em residências de famílias de classe media, foram selecionadas 200 amostras. Os valores do consumo são apontados na tabela de freqüência abaixo:

Vamos calcular o desvio médio, variância, desvio padrão e coeficiente de variação Solução:

Desvio médio

Consumo (kwh)

C ni

0 50 3
50 100 8
100 150 28
150 200 57
200 250 90
250 300 14

Ponto médio

Pi Pi · ni

5 Apontamentos de Aula - Probabilidade e Estatística - Prof. Rubens A Requena

Variância Populacional

Coeficiente de Variação

Exercícios Resolvidos

1) Determine o desvio médio, variância, desvio padrão e coeficiente de variação dos conjuntos de dados a) 1 24 12 9 19 16 14 15 14 16 b) 115 103 93 116 104 105 102 98 91

Solução

Desvio médio

Variância

√18  4,24

Coeficiente de Variação

User badge image

Euziana

Há mais de um mês

Média, mediana e moda são medidas de tendência central, cujo propósito é sintetizar em um único número o que é típico (ou médio) em um conjunto de dados. Porém, estas medidas normalmente irão fornecer apenas um quadro incompleto dos dados. Para exemplificar a o que acabamos de afirmar, considere a tabela CAMPEONATO, mostrada na Figura 1. Esta tabela mostra as infrações cometidas por diversos jogadores que foram expulsos em um campeonato de futebol. As colunas JUIZ_A e JUIZ_B mostram as punições que foram atribuídas por dois juízes do “tribunal de esporte” para cada infração (cada punição é dada em número de jogos).

Tabela Campeonato

Figura 1: Tabela “Campeonato”

Podemos calcular a média de jogos atribuída nas penas de ambos os juízes com o uso da função AVG, como mostra a Listagem 1. Observe que a média é de 3 jogos tanto para o juiz A como para o juiz B.

Listagem 1: Obtenção da MÉDIA das penas atribuídas pelos Juízes A e B com a função AVG

SELECT AVG(juiz_a), AVG(juiz_b) FROM campeonato

AVG(juiz_a)     AVG(juiz_b)	
3                      3  

Será eque podemos concluir que os juízes tem “comportamento igual”, ou seja, que eles utilizam critérios parecidos? Ou será que, de fato, o uso da medida da média isoladamente não foi capaz de apresentar um quadro real da situação?

Para respondermos a essas perguntas, precisaremos fazer uso de outras medidas estatísticas. Precisaremos usar medidas de variabilidade, pois elas são capazes de fornecer um índice da dispersão dos escores em torno da média. As próximas seções apresentam essas medidas e a sua forma de utilização no SGBD Oracle.

2. Amplitude

Amplitude é uma medida rápida da variabilidade. Ela consiste na diferença entre o mais alto e o mais baixo valor de um determinado conjunto de dados (ou seja, de um determinado campo numérico da tabela Oracle). Na linguagem SQL, podemos calcular a amplitude com o uso das funções MAX e MIN, como mostra a Listagem 2.

Listagem 2: Obtenção da AMPLITUDE com as funções MAX e MIN

SELECT 
  (MAX(juiz_a) - MIN(juiz_a)) as Amplitude_A, 
  (MAX(juiz_b) - MIN(juiz_b)) as Amplitude_B 
FROM campeonato 

Amplitude_A    Amplitude_B	
3                      6

A amplitude do Juiz A é igual a 3, pois a sua maior pena foi de 4 jogos e a menor de 1 jogo (4 – 1 = 3). Já a amplitude do Juiz B é igual a 6, pois a sua maior pena foi de 7 jogos e a menor de 1 jogo (7 – 1 = 6). Com isto, já podemos perceber que a distribuição das penas do Juiz B apresenta uma maior variabilidade do que a do Juiz A.

No entanto, na prática a amplitude não é uma medida muito boa. Ela tem a vantagem de ser simples e rápida de calcular. Porém tem a desvantagem de depender apenas de dois valores de toda a distribuição (o menor valor e o maior valor). Com isso, ela pode ser claramente influenciada por um único valor. Precisamos então de medidas que levem em conta todos os valores da distribuição. Essas medidas são a Variância e o Desvio Padrão.

3. Variância e Desvio Padrão

Para entendermos a variância, inicialmente precisamos apresentar o conceito de desvio que consiste na distância de um valor arbitrário ao valor médio da variável. O desvio é normalmente representado com a notação mostrada na Figura 2.

Fórmula do Desvio

Figura 2: Fórmula do Desvio

Nesta fórmula, o X que contém o traço em cima representa o valor da média da variável. O X sem o traço é um valor qualquer. Retornando aos dados da Figura 1, podemos os desvios para cada escore das variáveis Juiz_A e Juiz_B (pena atribuída pelos juízes A e B) podem ser calculados da forma mostrada a seguir:

Juiz_A

  • Desvio Pena 1: (4-3) = 1
  • Desvio Pena 2: (1-3) = -2
  • Desvio Pena 3: (3-3) = 0
  • Desvio Pena 4: (2-3) = -1
  • Desvio Pena 5: (4-3) = 1
  • Desvio Pena 6: (4-3) = 1
  • Desvio Pena 7: (3-3) = 0

Juiz_B

  • Desvio Pena 1: (2-3) = -1
  • Desvio Pena 2: (1-3) = -2
  • Desvio Pena 3: (4-3) = 1
  • Desvio Pena 4: (1-3) = -2
  • Desvio Pena 5: (1-3) = -2
  • Desvio Pena 6: (5-3) = 2
  • Desvio Pena 7: (7-3) = 4

Observe que a soma dos desvios é sempre igual a zero. Outra coisa que pode ser facilmente observada é que, em geral, os desvios associados aos escores do Juiz B são maiores do que os do Juiz A. A medida da variância utiliza todos esses escores para que possamos obter um valor de variabilidade. A fórmula da variância é mostrada na Figura 3.

Fórmula da Variância

Figura 3: Fórmula da Variância

A fórmula pode parecer um pouco “difícil”, mas não se preocupe, pois você conseguirá entendê-la. Para começar, na equação, s2 é simplesmente o símbolo usado para a variância. O que a medida faz é simplesmente elevar ao quadrado o valor de cada desvio em relação à média e depois somar todos os resultados (numerador da fórmula). Por fim, o valor da soma é dividido por N-1, que corresponde ao número total de escores menos 1 (em nosso exemplo, são N = 7, que representa o número total de registros de nossa tabela. Logo N – 1 = 6). A ideia de elevar ao quadrado é usada simplesmente para eliminar os sinais negativos de alguns desvios.

Veja o exemplo do cálculo da variância para as variáveis Juiz_A e Juiz_B.

Cálculo da Variância - Juiz A

  • (4-3)^2 = 1^2 = 1
  • (1-3)^2 = -2^2 = 4
  • (3-3)^2 = 0^2 = 0
  • (2-3)^2 = -1^2 = 1
  • (4-3)^2 = 1^2 = 1
  • (4-3)^2 = 1^2 = 1
  • (3-3)^2 = 0^2 = 0
  • SOMA = 8

VAR(Juiz_A) = 8 / 6 = 1,333

Cálculo da Variância - Juiz B

  • (2-3)^2 = -1^2 = 1
  • (1-3)^2 = -2^2 = 4
  • (4-3)^2 = 1^2 = 1
  • (1-3)^2 = -2^2 = 4
  • (1-3)^2 = -2^2 = 4
  • (5-3)^2 = 2^2 = 4
  • (7-3)^2 = 4^2 = 16
  • SOMA = 34

VAR(Juiz_B) = 34 / 6 = 5,667

Felizmente, o Oracle já possui uma função pronta para o cálculo da variânci



Leia mais em: Calculando Amplitude, Variância e Desvio Padrão no Oracle http://www.devmedia.com.br/calculando-amplitude-variancia-e-desvio-padrao-no-oracle/25703#ixzz2h40LKoMq

User badge image

Euziana

Há mais de um mês

Observe as notas de três competidores em uma prova de manobras radicais com skates. 

Competidor A: 7,0 – 5,0 – 3,0 

Competidor B: 5,0 – 4,0 – 6,0 

Competidor C: 4,0 – 4,0 – 7,0 

Ao calcular a média das notas dos três competidores iremos obter média cinco para todos, impossibilitando a nossa análise sobre a regularidade dos competidores. 
Partindo dessa ideia, precisamos adotar uma medida que apresente a variação dessas notas no intuito de não comprometer a análise. 

Variância e Desvio Padrão 

A variância é calculada subtraindo o valor observado do valor médio. Essa diferença é quanto um valor observado se distância do valor médio. Observe os cálculos: 

Competidor A 



Competidor B 



Competidor C 




Desvio Padrão

É calculado extraindo a raiz quadrada da variância. 

Competidor A 
√2,667 = 1,633 

Competidor B 
√ 0,667 = 0,817 

Competidor C 
√2 = 1,414 

Podemos notar que o competidor B possui uma melhor regularidade nas notas

Essa pergunta já foi respondida por um dos nossos especialistas