Baixe o app para aproveitar ainda mais
Prévia do material em texto
MEDIDAS DE DISPERSÃO Prof. Dr. Alex Junior Souza de Souza Belém – PA, 2018 INTRODUÇÃO • Medidas de tendência central: Média, mediana e moda; Não informam sobre a variabilidade e/ou a dos dados; Descrição ideal: medidas de tendência central + medidas de dispersão INTRODUÇÃO • Ex: Amostras de mesmo tamanho (n= 63), média, mediana e moda iguais; mesmos valores para as amostras; mesma amplitude INTRODUÇÃO • Ex: Amostras de mesmo tamanho (n= 63), média, mediana e moda iguais; mesmos valores para as amostras; mesma amplitude O que faz os gráficos serem tão diferentes? R: Grande variação entre os dados existentes em cada um deles! Esta variação pode ser mensurada por medidas de dispersão ou variabilidade INTRODUÇÃO • Por que calcular as medidas de dispersão de um conjunto de dados??? Avaliar a variabilidade dos dados. Um pequeno valor para uma medida de variabilidade significa que os dados do conjunto estão muito próximos uns dos outros, em volta da média aritimética, ou seja, a amostra é homogênea. De modo inverso, se esse valor de variabilidade for grande, significa que a média não é uma medida confiável para representação do conjunto de dados Após estudar a variabilidade de um conjunto de dados de uma distribuição, é possível compará-la a outras, para verificar se são estatisticamente iguais ou diferentes INTRODUÇÃO • Por que calcular as medidas de dispersão de um conjunto de dados??? Avaliar a variabilidade dos dados. Um pequeno valor para uma medida de variabilidade significa que os dados do conjunto estão muito próximos uns dos outros, em volta da média aritimética, ou seja, a amostra é homogênea. De modo inverso, se esse valor de variabilidade for grande, significa que a média não é uma medida confiável para representação do conjunto de dados Após estudar a variabilidade de um conjunto de dados de uma distribuição, é possível compará-la a outras, para verificar se são estatisticamente iguais ou diferentes AMPLITUDE TOTAL (AT) • Em um conjunto de dados, corresponde à diferença entre o maior e o menor valor observado para a variável em estudo; • Fácil de ser calculada e compreendida; • Menos sensível; • Dois conjuntos de dados podem apresentar amplitudes iguais e grandes diferenças de variações. DESVIO MÉDIO ABSOLUTO (DM) • Corresponde à média aritmética dos valores absolutos dos desvios, de cada um dos valores da distribuição, calculados em relação à média aritmética do conjunto de dados. • Mede a quantidade média de variação pela qual os valores em uma população, ou amostra, variam em relação à sua própria média aritmética. DESVIO MÉDIO ABSOLUTO (DM) DESVIO MÉDIO ABSOLUTO (DM) VARIÂNCIA (s²) • Medida de dispersão que considera os desvios em relação à média de todos os valores observados, porém, ao invés de usar os valores absolutos, a variância utiliza o quadrado dos desvios, sendo definida, portanto, como a soma dos quadrados dos desvios (SQ) em relação à média, dividida pelo número de observações menos 1 (n – 1). VARIÂNCIA (s²) VARIÂNCIA (s²) VARIÂNCIA (s²) VARIÂNCIA (s²) VARIÂNCIA (s²) • Não é a medida de dispersão mais utilizada – Desvio padrão; • A soma total dos quadrados, que representa o total de variação existente num conjunto de dados; • Variância é um valor único para cada conjunto de dados, sendo o seu valor imutável, a não ser que se modifique o número de elementos do conjunto ou o valor de um dos seus elementos. • Quando, na média, os valores de um estimador refletem o verdadeiro valor do parâmetro para a população, dizemos que ele é um estimador não-viciado. Isto posto, quando o denominador da equação é n – 1, a variância de uma amostra aleatória é um estimador não-viciado da variância da população de onde a amostra foi retirada DESVIO PADRÃO (s) • É a medida de dispersão mais utilizada em estatística descritiva, sendo definida, para um conjunto de dados, como a raiz quadrada da variância desse conjunto DESVIO PADRÃO (s) • Tabela de grupamento simples DESVIO PADRÃO (s) DESVIO PADRÃO (s) • Dados agrupados em classes DESVIO PADRÃO (s) • Se o desvio padrão de um conjunto de dados é pequeno, os valores estarão concentrados muito próximos à média; se o desvio padrão é grande, os valores dos dados estarão largamente espalhados em relação à média. • Se o desvio padrão apresentar um valor maior que a média, isso é uma indicação que a distribuição apresenta um alto grau de assimetria. DESVIO PADRÃO (s) • O entendimento de como o desvio padrão pode descrever a quantidade de dispersão em um conjunto de dados é fundamental para a compreensão dos fundamentos dos testes de hipótese para dados quantitativos contínuos. Frequentemente, precisamos saber, em um conjunto de dados, o quanto, em termos de desvio padrão, cada observação dista da média, ou, quantas observações estão localizadas no intervalo entre um ou dois desvios padrão em relação à média. DESVIO PADRÃO (s) COEFICIENTE DE VARIAÇÃO (CV) • O coeficiente de variação é uma medida relativa da dispersão, ou da variabilidade, que indica a relação percentual entre o desvio padrão e a média dos dados. COEFICIENTE DE VARIAÇÃO (CV) • O coeficiente de variação é uma medida relativa da dispersão, ou da variabilidade, que indica a relação percentual entre o desvio padrão e a média dos dados. COEFICIENTE DE VARIAÇÃO (CV) • Exemplo: Uma empresa agropecuária deseja conhecer qual de suas espécies de galinha poedeira apresenta maior variabilidade nas medidas do comprimento e do peso dos ovos. Esta característica é fundamental para o planejamento das embalagens do produto. O Quadro 8.5 mostra a média e o desvio padrão dos comprimentos e dos pesos de ovos das duas espécies. Qual espécie apresenta maior variação em relação às medidas? COEFICIENTE DE VARIAÇÃO (CV) ? EXERCÍCIO • Utilize os dois conjuntos de dados abaixo e calcule a Variância, o Desvio padrão e o Coeficiente de variação B: 9; 1; 5; 5; 1; 9 EXERCÍCIO • Variância s² = 64/5 s² = 12,8 EXERCÍCIO • Desvio padrão s = √12,8 s = 3,577 EXERCÍCIO • Coeficiente de variação CV = 3,577/5 CV = 0,7154 ou 71,54% obrigado!
Compartilhar