Prévia do material em texto
Estatística Aplicada à Economia Medidas de Dispersão Carlos Alberto Gonçalves Junior Amplitude, Variância e Desvio Padrão Consideremos os seguintes conjuntos: A média aritmética dos elementos do conjunto C é 15, e para todos os demais conjuntos a média aritmética dos seus elementos é 5. Amplitude, Variância e Desvio Padrão Com base no simples exame desses conjuntos, podemos fazer as seguintes afirmativas, relativas à dispersão dos valores dos elementos de cada conjunto: No conjunto A a dispersão é nula; Os conjuntos B e C apresentam a mesma dispersão, só diferindo quanto a média; A dispersão de D é maior do que a dispersão de B, ainda, como para o conjunto D a diferença entre dois valores consecutivos é sempre igual a 2 e B igual a 1, parece lícito afirmar que a dispersão de D é o dobro da dispersão em B; A dispersão de E é maior que a dispersão de A e menor que a dispersão de B; O conjunto F apresente dispersão igual à de B, pois esses conjuntos só diferem quanto ao número de elementos (F é a duplicação de B). Amplitude, Variância e Desvio Padrão Uma medida de dispersão é a “Amplitude Total”, que é a diferença entre o maior e o menor valor observado. A Amplitude Total é zero para o conjunto A, 4 para os conjuntos B, C, E e F, e 8 para o conjunto D. Nota-se que os valores da amplitude não obedecem à quarta afirmativa, pois eles indicam, erroneamente, que os conjuntos B e E apresentam o mesmo grau de dispersão. Isso acontece porque a amplitude só leva em consideração os valores extremos! Uma boa medida de dispersão deve levar em consideração todos os dados, não apenas o maior e o menor valor observado. Amplitude, Variância e Desvio Padrão Os valores dos desvios em relação à média mostram o grau de dispersão dos dados. No entanto, não podemos utilizar a soma dos desvios em relação à média como medida de dispersão, pois essa soma será sempre zero. Para resolver esse problema, podemos utilizar a soma dos desvios independente do sinal, o que pode ser obtido elevando os desvios ao quadrado. Porém, apenas a soma dos quadrados dos desvios pode não ser uma boa medida, pois a dispersão aumentará conforme aumenta o número de observações do conjunto de dados. Amplitude, Variância e Desvio Padrão Dividindo-se a soma de quadrados dos desvios pelo número de observações, obtemos a variância dos dados: Veremos adiante que, se X1, X2,..., Xn são os valores observados em uma amostra, é o “estimador de máxima verossimilhança” da variância de X. Veremos também que o “estimador não-tendencioso da variância de X” é: Graus de Liberdade Pode-se considerar que (n-1) é o número de graus de liberdade das observações em uma amostra de tamanho n. Graus de liberdade são, em estatística, o número de observações independentes (dimensão da amostra) menos o número de parâmetros a serem estimados. i Xi Xi - 1 9 9 – 8 = 1 2 4 4 – 8 = -4 3 x i Xi Xi - 1 9 9 – 5 = 4 2 4 4 – 5 = -1 3 2 2-5 = -3 Imagine 3 observações independentes de uma população com média Como são 3 observações independentes e é conhecido a terceira observação pode assumir qualquer valor. Imagine agora uma situação em que são tirados 3 elementos da população e não se conhece , então utiliza-se para estimar, sabe-se que =5 Como sabemos a soma dos desvios é zero, a última observação obrigatoriamente tem que ser 2. Isso indica que com 3 observações na amostra temos apenas 2 graus de liberdade, pois uma das observações tem valor definido Perdemos um grau de liberdade quando calculamos e utilizamos como estimador de Amplitude, Variância e Desvio Padrão A variância, como medida de dispersão, tem o inconveniente de apresentar unidade de medida igual ao quadrado da unidade de medida dos dados. Assim, por exemplo, se X é medido em kg, a variância é medida em kg2. O desvio padrão é, por definição, a raiz quadrada, com sinal positivo, da variância. A unidade de medida do desvio padrão é igual à unidade de medida dos dados. A seguinte igualdade, cuja demonstração deixamos para o leitor, pode ser bastante útil no cálculo da soma dos quadrados dos desvios: Amplitude, Variância e Desvio Padrão No caso de os dados estarem agrupados em uma distribuição de frequências, cada valor distinto ou valor central da classe (Xj, com j = 1, 2, ..., k) deve ser ponderado pela respectiva frequência (fj), e as expressões ficam: O desvio médio e a diferença média Por definição, o desvio (absoluto) médio de um conjunto de dados (X1, X2,..., Xn ) é a media aritmética dos valores absolutos dos desvios em relação a . Por definição, a diferença (absoluta) média de um conjunto de dados (X1, X2,..., Xn ) é: O desvio médio e a diferença média Admitindo que os dados estão em ordem crescente, podemos escrever os valores de |Xi – Xj| com i = 1,..., n e j = 1,..., n com segue: O desvio médio e a diferença média Com algumas transformações algébricas, também pode-se chegar a seguinte equação para calcular a diferença média: Calcular o desvio médio e a diferença média das duas formas como exemplo, utilizando o conjunto de dados: B = {3, 4, 5, 6, 7} O desvio médio e a diferença média Os resultados desse exemplo e outros exemplos podem ser obtidos na tabela: Desvio-padrão x Desvio médio A variância, o desvio-padrão e o desvio médio são todas boas medidas de dispersão, mas não há dúvida que a variância e o desvio-padrão são os mais usuais. Cabe lembrar que a média é a medida de tendência central que minimiza a soma dos quadrados dos desvios, utilizada no cálculo da variância. Uma razão para a preferência pela variância na teoria estatística é a relativa dificuldade de obter derivadas de expressões envolvendo módulo, como ocorre na diferença média e no desvio-médio. Outra vantagem são algumas características matemáticas da variância que não se aplicam para o desvio-médio e a diferença média como: Var(X+Y) = Var(X) + Var(Y) (isso pode facilitar muito alguns cálculos) EXERCÍCIOS 5.1 a 5.11 (menos 5.6 e 5.8) image1.png image2.png image3.jpeg image4.emf image5.png image5.emf image6.emf image7.png image8.png image9.png image10.png image11.png image12.png image7.emf image8.emf image100.png image9.emf image10.emf image11.emf image12.emf image13.emf image14.emf image15.emf image16.emf image17.emf image18.emf image19.emf image20.emf image21.emf image22.emf