Buscar

Análise Estatística Aula 03 Online


Prévia do material em texto

Aula 03 – Revisão das Medidas de Dispersão
Introdução
Na aula 2, você compreendeu as formas de calcular as medidas de posição central e suas relações, bem como as medidas de ordenamento.
Nesta aula, você verá como encontrar as medidas de dispersão, complementando a informação contida nas medidas de tendência central. Com a ideia de amplitude total e interquartil, desvio médio, variância e desvio padrão, bem como o coeficiente de variação, sendo possível ver o quanto os dados estão afastados da média. Essa visão da dispersão permite ter um melhor entendimento do comportamento dos dados obtidos. Será visto nesta aula como calcular as medidas de dispersão em Excel.
Na interpretação e análise dos dados estatísticos, é necessário conhecer como os dados se comportam e se distribuem ao longo da relação em estudo.
Medidas de Dispersão
Em uma dada distribuição amostral é possível fazer várias observações no intuito de entender o comportamento dos seus valores. Normalmente as medidas de posição não são suficientes para dar o comportamento de uma distribuição de dados, sendo necessárias informações adicionais que permitam uma melhor análise do fenômeno a ser estudado. É importante levar um ponto em consideração durante a análise dos dados, a dispersão ou variabilidade. A dispersão ou variabilidade indica a maior ou menor diferença entre os valores de uma variável, dado da distribuição, e sua medida de posição, normalmente a média.
Estudaremos as seguintes medidas de dispersão:
- Amplitude total e interquartil
- Desvio médio
- Variância e desvio padrão
- Coeficiente de variação
Amplitude
Amplitude Total
Numa amostra de n valores ordenados, onde n é a quantidade total de dados, definimos como amplitude total (R) a diferença entre os valores máximo (H) e mínimo (L) da relação.
Sabendo-se que a quantidade de garrafas de refrigerantes vendidas no mercado, durante uma semana, foi de 10, 12 13, 14, 15, 16 e 18 garrafas, temos para a amplitude total
Amplitude Interquadril
Com o objetivo de determinar onde se situam os 50% valores centrais, pode calcular a Amplitude Interquartil (IQR):
Desvio Médio Absoluto
O desvio (di) mede a diferença entre cada valor e a média aritmética. O desvio médio absoluto (MAD) é obtido dividindo o somatório dos módulos de cada desvio pela quantidade de dados (n para amostra e N para população).
Variância e Desvio Padrão
A amplitude total, pela influência dos valores extremos, que muitas vezes podem não representar o comportamento da distribuição dos dados, são considerados instáveis.
A variância é uma medida estatística que não recebe essa influência, pois Leva em consideração todos os valores no seu cálculo. Ela é a média aritmética dos quadrados dos desvios:
A fim de simplificar os cálculos e evitar os arredondamentos causados pelo fato da média ser normalmente fracionário, pode-se usar a igualdade:
Dados Agrupados Sem Intervalos de Classe
Para os dados agrupados numa tabela de distribuição de frequência a variância é calculada da seguinte forma:
OU
Dados Agrupados com Intervalos de Classe
Para os dados agrupados numa tabela de distribuição por classes as fórmulas são as mesmas,
O fato de a variância ser calculada a partir dos quadrados dos desvios gera um número com a unidade quadrada em relação a variável em estudo, que é um inconveniente. Esse inconveniente criou a necessidade de uma nova variável denominada desvio padrão definida como a raiz quadrada da variância e representada por s (amostra) e (população), com mais utilidade e interpretação prática.
Coeficiente de Variação
O coeficiente de variação mede a homogeneidade dos dados, ou seja, mostra a magnitude do desvio padrão em relação à média dos dados como porcentagem. Permitindo caracterizar a dispersão dos dados em função do valor médio. Quanto maior o valor do coeficiente de variação, menos homogêneo será o conjunto.
Quando é necessário comparar duas amostras com média e desvio padrão diferentes, podemos comparar os coeficientes de variação. Quanto maior o valor, menor será a homogeneidade da distribuição, ou seja, apresenta o maior grau de dispersão.
Exemplo:
Tomemos os resultados das medidas de altura e pesos de um mesmo grupo de pessoas tiradas de uma sala de aula.
A fim de comparar a dispersão das duas relações de medidas, utilizaremos o coeficiente de dispersão.
Podemos observar que neste grupo de pessoas, a relação de distribuição das alturas apresenta um menor grau de dispersão do que os pesos.
Usando o Excel
Seja uma distribuição amostral composta de sete números (n), representando o tempo (em minutos) de execução de uma prova. X = (85, 86, 88, 88, 91, 94, 104).
Usando as fórmulas prontas do Microsoft Excel para determinar a variância e o desvio padrão da amostra e da população, teremos:
O comando VARP(NUM1;NUM2...) calcula a variância da população, bastando marcar as células que contêm os dados.
Com o comando VARA(NUM1;NUM2;...) calcula a variância da amostra, bastando marcar as células que contêm os dados com o mouse, ou indicar o intervalo na função como mostrado no exemplo.
Da mesma forma temos o desvio padrão da população e amostra:

Continue navegando