Baixe o app para aproveitar ainda mais
Prévia do material em texto
Universidade de Pernambuco - UPE Curso: Administração Disciplina: Estatística Estatística – Aula 3 Prof. Pablo Aurélio L. de A. Pinto pabloaurelioap@hotmail.com MEDIDAS DE DISPERSÃO MEDIDAS DE DISPERÇÃO As medidas de tendência central (média, mediana e moda) não são as únicas medidas necessárias para caracterizar uma amostra (ou população). O resumo de um conjunto de dados por uma única medida representativa de posição central esconde toda a informação sobre a variabilidade do conjunto de observações. Portanto, medidas de tendência central fornecem um resumo parcial das informações de um conjunto de dados. MEDIDAS DE DISPERÇÃO Exemplo.: Grupo A (variável X) = 3, 4, 5, 6, 7. Média = 5 Grupo B (variável Y) = 1, 3, 5, 7, 9. Média = 5 Grupo C (variável Z) = 5, 5, 5, 5, 5. Média = 5 Grupo D (variável W) =3, 5, 5, 7. Média = 5 Grupo E (variável V) = 3, 5, 5, 6, 5. Média = 5 Todas as séries apresentam média igual a 5, portanto identificação de cada uma destas séries por sua média nada informa sobre suas diferentes variabilidades. MEDIDAS DE DISPERÇÃO Portanto, é conveniente a criação de medidas que sumarizem a variabilidade de um conjunto de observações e que nos permita comparar conjuntos diferentes de valores, segundo algum critério padronizados. A necessidade de uma medida de variação é fundamental, para que nos permita, por exemplo, comparar conjuntos diferentes de valores. Portanto, um critério frequentemente utilizado são medidas de dispersão dos dados em torno de sua média, pois precisamos, também, saber o quanto as observações estão dispersas (“espalhadas”). MEDIDAS DE DISPERÇÃO Exemplo.: - Amostragem A: 8, 8, 9, 10, 11, 12, 12 Média 10; Mediana 10 e Bimodal (8, 12) - Amostragem B: 5, 6, 8, 10, 12, 14, 15 Média 10; Mediana 10 e sem Moda - Amostragem C: 1, 2, 5, 10, 15, 18, 19 Média 10; Mediana 10 e sem Moda As medidas de tendência central pouco ou nada informam a respeito da dispersão dos dados. MEDIDAS DE DISPERÇÃO Nos informa o grau de dispersão dos dados em torno de um dado valor médio, isto é, o quanto os dados encontram-se “espalhados” em torno da média. Servem para verificar a representatividade das medidas de posição. O critério geralmente utilizado é aquele que mede a concentração dos dados em torno da média, e algumas medidas são as mais usadas: Amplitude Total Desvio Médio Variância Desvio Padrão Coeficiente de Variação. MEDIDAS DE DISPERSÃO AMPLITUDE TOTAL É a diferença entre o maior e o menor dos valores da série. Indicamos por: Exemplo: Para a série 10, 12, 20, 22 25, 33, 38. OBS.: A utilização da amplitude total como medida de dispersão é muito limitada, pois, sendo uma medida que depende apenas dos valores externos, é instável, “não sendo afetada pela dispersão dos valores internos”. MEDIDAS DE DISPERSÃO DESVIO MÉDIO Considerando nosso propósito de medir a dispersão ou o grau de concentração dos valores em torno da média, devemos considerar o comportamento dos desvios de cada valor em relação à média, isto é: Na determinação de cada desvio, estaremos medindo a dispersão entre cada 𝑥𝑖 e a média. Porém, temos o seguinte problema: Queremos calcular o desvio médio, porém sua soma é nula. Como resolver esta questão? MEDIDAS DE DISPERSÃO DESVIO MÉDIO Exemplo: - 3, 4, 5, 6, 7 (média 5), os desvios 𝑑𝑖 = (𝑥𝑖 − 𝑥), são: -2, -1, 0, 1 ,2. - 1, 3, 5, 7, 9 (média 5), os desvios 𝑑𝑖 = (𝑥𝑖 − 𝑥), são: -4, -2, 0, 2, 4. É fácil observar que a soma dos desvios é igual a zero, o que torna inviável esta medida. As opções são: a) Considerar o total dos desvios em valor absoluto (módulo) ou, b) Considerar o total dos quadrados dos desvios. Assim teríamos: MEDIDAS DE DISPERSÃO DESVIO MÉDIO DESVIO MÉDIO: Considerando-se o módulo de cada desvio (𝑥𝑖 − 𝑥), evita-se com isso que a soma dos desvios seja zero. Trata-se da média aritmética dos desvios considerados em módulos (valor absoluto). Assim o desvio médio é dado por: Onde, 𝑥𝑖 = valores amostrais; 𝑥 = média amostral; 𝐹𝑖 = frequência absoluta; 𝑛 = tamanho da amostra. MEDIDAS DE DISPERSÃO DESVIO MÉDIO Exemplo: considere as seguintes amostras, A = (3, 4, 5, 6, 7) e B = (1, 3, 5, 7, 9) . Calcule o desvio médio amostral. Calcula-se a média: O desvio médio é dado por: MEDIDAS DE DISPERSÃO VARIÂNCIA Considera o quadrado de cada desvio, evitando com isso 𝑑𝑖= 0. Trata-se da média aritmética dos quadrados dos desvios. A variância é representada por dois símbolos: σ2 (letra grega sigma) para população e 𝑠2 para uma amostra. As fórmulas para a variância da população e da amostra são apresentadas abaixo. Para a População, temos: MEDIDAS DE DISPERSÃO VARIÂNCIA Onde, 𝑥𝑖 = valores amostrais; 𝑥 = média amostral; 𝐹𝑖 = frequência absoluta; e, 𝑛 = tamanho da amostra. Para Amostras, temos: MEDIDAS DE DISPERSÃO VARIÂNCIA Como é possível notar, as diferenças entre as fórmulas são: para caso da variância populacional (σ2), utiliza-se a média populacional tendo como denominador o tamanho da população (𝑛). Para o cálculo da variância amostral (𝑠2), utiliza-se a média amostral, tendo como denominador o tamanho da amostra menos a unidade (𝑛 − 1). MEDIDAS DE DISPERSÃO VARIÂNCIA Exemplo.: Para as amostras A = (3, 4, 5, 6, 7) e B = (1, 3, 5, 7, 9) Pode-se verificar que a amostra “A” é mais homogênea. MEDIDAS DE DISPERSÃO DESVIO PADRÃO Sendo a variância uma medida que expressa um desvio quadrático médio, esta pode causar alguns problemas de interpretação. Para evitar isto, costuma-se usar o desvio padrão, que é definido como a raiz quadrada da variância. Desta forma, tem-se uma medida de variabilidade expressa na mesma unidade dos valores do conjunto de dados. O desvio padrão (σ, para população e 𝑠 para amostras). MEDIDAS DE DISPERSÃO DESVIO PADRÃO Pode ser calculado através das seguintes fórmulas: MEDIDAS DE DISPERSÃO DESVIO PADRÃO Exemplo.: Para as amostras A = (3, 4, 5, 6, 7) e B = (1, 3, 5, 7, 9) Pode-se verificar que a amostra “A” é mais homogênea. MEDIDAS DE DISPERSÃO Exemplo: Considere a seguinte distribuição amostral. Com base nestas informações calcular: - O desvio médio; - A variância; - O desvio-padrão. MEDIDAS DE DISPERSÃO 1º Passo: Calcular a média. MEDIDAS DE DISPERSÃO 2º Passo: Calcular o desvio médio. MEDIDAS DE DISPERSÃO 3º Passo: Calcular da variância amostral. MEDIDAS DE DISPERSÃO 3º Passo: Calcular da variância amostral (Método Alternativo). MEDIDAS DE DISPERSÃO 4º Passo: Calculo do desvio padrão amostral. Resumo: A distribuição possui média 8,06. Isto é, seus valores estão em torno de 8,06 e seu grau de concentração é de 1,2, medido pelo Desvio Médio, e de 1,69, medido pelo Desvio-Padrão. MEDIDAS DE DISPERSÃO Exemplo: Considere a seguinte distribuição amostral. Com base nestas informações calcular: - O desvio médio; - A variância; - O desvio-padrão. MEDIDAS DE DISPERSÃO COEFICIENTE DE VARIAÇÃO Trata-se de uma medida relativa de dispersão, útil para a comparação em termos relativos do grau de concentração em torno da média de séries distintas. É dado por: Onde: CV = Coeficiente de Variação; σ = desvio padrão populacional; S = desvio padrão amostral; 𝑥 = média. MEDIDAS DE DISPERSÃO COEFICIENTE DE VARIAÇÃO Exemplo:Em uma empresa, o salário médio dos homens é de R$ 4.000,00, com desvio padrão de R$ 1.500,00, e o das mulheres é em média de R$ 3.000,00, com desvio padrão de R$ 1.200,00. Então: Assim, podemos concluir que os salários das mulheres apresentam maior dispersão relativa que os salários dos homens. MEDIDAS DE DISPERSÃO COEFICIENTE DE VARIAÇÃO Para obtermos o resultado do CV em porcentagens, basta multiplicarmos o resultado por 100. No caso: CV = 37,5% para homens; CV = 40% para mulheres. Para efeitos práticos, costuma-se considerar que CV superior a 50% indica alto grau de dispersão e, consequentemente, pequena representatividade da média. Enquanto para valores inferiores a 50%, a média será tanto mais representativa do fato quanto menor for o valor de seu CV. MEDIDAS DE DISPERSÃO Exercício: Dada a tabela abaixo, calcule: - Desvio médio; - Variância; - Desvio padrão; - Coeficiente de Variação. MEDIDAS DE ASSIMETRIA E CURTOSE MEDIDAS DE ASSIMETRIA E CURTOSE As medidas de assimetria e curtose são as que restam para completarmos o quadro das estatísticas descritivas, que proporcionam, juntamente com as medidas de posição e dispersão, a descrição e compreensão completas da distribuição de frequências estudadas. As distribuições de frequências não diferem apenas quanto ao valor médio e a variabilidade, como também quanto a sua forma. As medidas de assimetria estão relacionadas ao formato da curva de uma distribuição de frequências, mais especificamente, ao formato do polígono de frequência ou do histograma. ASSIMETRIA Simetria: uma distribuição de frequência é simétrica quando a média, mediana e moda são iguais, ou seja, apresentam um mesmo valor, ou ainda, coincidem num mesmo ponto. Assimetria: quando a média, mediana e a moda recaem em pontos diferentes da distribuição de frequência, isto é, apresentam valores distintos. O deslocamento desses pontos podem ser para a direita ou para a esquerda. Sendo assim, quanto ao grau de deformação, as curvas de frequência podem ser: Assimétrica à Direita ou Positiva Assimétrica à esquerda ou Negativa CURVA DE DISTRIBUIÇÃO DE FREQUÊNCIA SIMÉTRICA Neste caso, conforme citado anteriormente, a média aritmética será igual à mediana, e esta, por sua vez, igual à moda. Assim: CURVA DE DISTRIBUIÇÃO DE FREQUÊNCIA SIMÉTRICA Exemplo: CURVA DE DISTRIBUIÇÃO DE FREQUÊNCIA SIMÉTRICA Exemplo: CURVA DE DISTRIBUIÇÃO DE FREQUÊNCIA ASIMÉTRICA POSITIVA Neste caso, a média aritmética apresentará um valor maior do que a mediana, e esta, por sua vez, apresentará um valor maior do que a moda. Assim: CURVA DE DISTRIBUIÇÃO DE FREQUÊNCIA ASIMÉTRICA POSITIVA Exemplo: CURVA DE DISTRIBUIÇÃO DE FREQUÊNCIA ASIMÉTRICA POSITIVA Exemplo: A cauda é mais alongada à direita da ordenada máxima (ordenada correspondente à moda). Nas distribuições assimétricas à direita, há uma predominância de valores superiores a moda. CURVA DE DISTRIBUIÇÃO DE FREQUÊNCIA ASIMÉTRICANEGATIVA Neste caso a média aritmética será menor do que a mediana, e esta, por sua vez, é menor do que a moda. Assim: CURVA DE DISTRIBUIÇÃO DE FREQUÊNCIA ASIMÉTRICANEGATIVA Exemplo: CURVA DE DISTRIBUIÇÃO DE FREQUÊNCIA ASIMÉTRICA NEGATIVA Exemplo: A cauda é mais alongada à esquerda da ordenada máxima. Nas distribuições assimétricas negativas, predominam valores inferiores à moda. PRINCIPAIS MEDIDAS DE ASSIMETRIA Método de Comparação entre Medidas de Tendência Central: Trata-se do método mais rudimentar, o qual não permite estabelecer até que ponto a curva analisada se desvia da simetria. A comparação é bem simples, baseada nas relações entre a média e a moda, podemos empregá-la para determinar o tipo de assimetria calculando o valor da diferença entre estas duas medidas: PRINCIPAIS MEDIDAS DE ASSIMETRIA Assim, temos: PRINCIPAIS MEDIDAS DE ASSIMETRIA Critério de Pearson: Quando uma distribuição deixa de ser simétrica, a Mo, a Md e a média aritmética vão se afastando, aumentando cada vez mais a diferença entre a 𝑥 e a Mo (𝑥 – Mo). Podemos usá-la para medir assimetria. a) Primeiro Coeficiente de Assimetria de Pearson: Onde: As = Coeficiente de Assimetria; 𝑥 = média aritmética; Mo = Moda; σ = desvio-padrão populacional; s = desvio-padrão amostral. PRINCIPAIS MEDIDAS DE ASSIMETRIA Assim, temos: As = 0 distribuição simétrica; As > 0 distribuição assimétrica positiva; As < 0 distribuição assimétrica negativa. OBS: este coeficiente de Assimetria de Pearson tem o inconveniente de requerer a determinação prévia da moda. PRINCIPAIS MEDIDAS DE ASSIMETRIA a) Primeiro Coeficiente de Assimetria de Pearson: Quando a distribuição for quase simétrica ou moderadamente assimétrica, pode-se calcular mais facilmente seu grau de assimetria substituindo na fórmula a moda pelo seu valor em função da média aritmética e da mediana, segundo a relação empírica proposta por Pearson: Como essas relações são aproximadas e não exatas, somente quando a distribuição for simétrica elas se equivalerão. PRINCIPAIS MEDIDAS DE ASSIMETRIA OBS: quando as distribuições não se apresentarem com forte assimetria, deve-se dar preferência ao segundo método. PRINCIPAIS MEDIDAS DE ASSIMETRIA a) Segundo Coeficiente de Assimetria de Pearson: É determinado como segue: Onde: – Q1 = primeiro quartil; – Q3 = terceiro quartil; – Md = mediana. Assim, temos: – As = 0 distribuição simétrica; – As > 0 distribuição assimétrica positiva; – As < 0 distribuição assimétrica negativa. PRINCIPAIS MEDIDAS DE ASSIMETRIA c) Coeficiente de Assimetria de Fisher: A forma de cálculo é dada por: Onde s é o desvio padrão amostral. Assim, temos que: – As = 0 → distribuição simétrica; – As > 0 → distribuição assimétrica positiva; – As < 0 → distribuição assimétrica negativa. CURTOSE Entende-se por curtose o grau de achatamento de uma distribuição. A Curtose ou excesso indica até que ponto a curva de frequências de uma distribuição se apresenta mais afilada ou mais achatada do que uma curva padrão, denominada curva normal. De acordo com o grau de curtose, podemos ter três tipos de curvas de frequência: Curva ou Distribuição de Frequências Mesocúrtica: Curva ou Distribuição de Frequências Platicúrtica: Curva ou Distribuição de Frequências Leptocúrtica: CURTOSE Curva ou Distribuição de Frequências Mesocúrtica: ocorre quando a curva de frequências apresenta um grau de achatamento equivalente ao da curva normal.Nem muito achatada, nem muito alongada. CURTOSE Curva ou Distribuição de Frequências Platicúrtica: ocorre quando uma curva de frequências apresenta um alto grau de achatamento, superior ao da normal. CURTOSE Curva ou Distribuição de Frequências Leptocúrtica: quando uma curva de frequências apresenta um alto grau de afilamento (alongamento), superior ao da normal. CURTOSE Em síntese, temos: MEDIDA DE CURTOSE (ACHATAMENTO) As medidas de achatamento (ou Kurtose) permitem avaliar o grau de achatamento de uma distribuição, isto é, a forma como os valores se concentram em torno da sua média. Existem diversos índices que permitem quantificar o achatamento de uma curva. O coeficiente de achatamento que iremos utilizar é dado por: MEDIDA DE CURTOSE O coeficiente de curtose indica o quanto as “caudas” de uma distribuição são “pesadas”. Em geral, se a curtose é positiva, a distribuição dos dados tem um “pico”, e se é negativa, a distribuição dos dados é achatada. MEDIDA DE CURTOSE Se o coeficiente de achatamento ou Curtose tiver um valor negativo, significa que os valores estão pouco concentrados em torno da média (e, consequentemente, a variação será elevada); Se o coeficiente for positivo, existe uma forte concentração dos valores em torno da média (e, consequentemente, a variação será pouco elevada); Se o coeficiente for nulo ou muito próximo de zero, achatamento da curva (isto é, a altura do “pico” da curva) corresponde a uma distribuição normal padrão. COEFICIENTE DE CURTOSE Estes coeficientes de achatamento podem ser interpretados, em termos gráficos, da seguinte forma: Muitos autores consideram que quando γ é negativo a distribuição é platicúrtica, quando γ é nulo a distribuição é mesocúrtica e quando este coeficiente é positivo a distribuição diz-se leptocúrtica. MEDIDA DE CURTOSE (ACHATAMENTO) Também é possível usar a seguinte metodologia para o cálculo da curtose: Onde: – 𝑄1 = primeiro quartil; – 𝑄3 = terceiro quartil; – 𝑃90 = 90º percentil; – 𝑃10 = 10º percentil. MEDIDA DE CURTOSE (ACHATAMENTO) Assim temos que: – Se K = 0,263, diremos que a curva correspondente à distribuição de frequência é mesocúrtica. – Se K > 0,263, diremos que a curva correspondente à distribuição de frequência é platicúrtica. – Se K < 0,263, diremos que a curva correspondente à distribuição de frequência é leptocúrtica. MEDIDAS DE DISPERSÃO Exemplo: Considere a seguinte distribuição amostral. Calcule o coeficiente K. MEDIDAS DE DISPERSÃO Passo 1: Necessitamos calcular 𝑸𝟏, 𝑸𝟑, 𝑷𝟏𝟎 e 𝑷𝟗𝟎. MEDIDAS DE DISPERSÃO Passo 2: Necessitamos calcular 𝑸𝟏, 𝑸𝟑, 𝑷𝟏𝟎 e 𝑷𝟗𝟎. MEDIDAS DE DISPERSÃO Passo 3: Calcula−se o valor de K. Calcula−se o Portanto, K > 0,263, logo a curva correspondente é suavemente platicúrtica.
Compartilhar