Baixe o app para aproveitar ainda mais
Prévia do material em texto
Análise Estatística Aula 03: Revisão das medidas de dispersão Introdução Na aula 2, você compreendeu as formas de calcular as medidas de posição central e suas relações, bem como as medidas de ordenamento. Nesta aula, você verá como encontrar as medidas de dispersão, complementando a informação contida nas medidas de tendência central. Com a ideia de amplitude total e interquartil, desvio médio, variância e desvio padrão, bem como o coeficiente de variação, sendo possível ver o quanto os dados estão afastados da média. Essa visão da dispersão permite ter um melhor entendimento do comportamento dos dados obtidos. Será visto nesta aula como calcular as medidas de dispersão em Excel. Na interpretação e análise dos dados estatísticos, é necessário conhecer como os dados se comportam e se distribuem ao longo da relação em estudo. Medidas de Dispersão Em uma dada distribuição amostral é possível fazer várias observações no intuito de entender o comportamento dos seus valores. Normalmente as medidas de posição não são suficientes para dar o comportamento de uma distribuição de dados, sendo necessárias informações adicionais que permitam uma melhor análise do fenômeno a ser estudado. É importante levar um ponto em consideração durante a análise dos dados, a dispersão ou variabilidade. A dispersão ou variabilidade indica a maior ou menor diferença entre os valores de uma variável, dado da distribuição, e sua medida de posição, normalmente a média. Estudaremos as seguintes medidas de dispersão: Amplitude total e interquartil Desvio médio Variância e desvio padrão Coeficiente de variação Amplitude AMPLITUDE TOTAL Numa amostra de n valores ordenados, onde n é a quantidade total de dados, definimos como amplitude total (R) a diferença entre os valores máximo (H) e mínimo (L) da relação. AMPLITUDE INTERQUADRIL Com o objetivo de determinar onde se situam os 50% valores centrais, pode calcular a Amplitude Interquartil (IQR): Desvio Médio Absoluto O desvio (di) mede a diferença entre cada valor e a média aritmética. O desvio médio absoluto (MAD) é obtido dividindo o somatório dos módulos de cada desvio pela quantidade de dados (n para amostra e N para população). A soma de todos os desvios é igual à zero: Dados Agrupados Sem Intervalos de Classe Para os dados agrupados numa tabela de distribuição de frequência a variância é calculada da seguinte forma: OU Dados Agrupados Com Intervalos de Classe Para os dados agrupados numa tabela de distribuição por classes as fórmulas são as mesmas, O fato de a variância ser calculada a partir dos quadrados dos desvios gera um número com a unidade quadrada em relação a variável em estudo, que é um inconveniente. Esse inconveniente criou a necessidade de uma nova variável denominada desvio padrão definida como a raiz quadrada da variância e representada por s (amostra) e (população), com mais utilidade e interpretação prática. Coeficiente de Variação O coeficiente de variação mede a homogeneidade dos dados, ou seja, mostra a magnitude do desvio padrão em relação à média dos dados como porcentagem. Permitindo caracterizar a dispersão dos dados em função do valor médio. Quanto maior o valor do coeficiente de variação, menos homogêneo será o conjunto. Quando é necessário comparar duas amostras com média e desvio padrão diferentes, podemos comparar os coeficientes de variação. Quanto maior o valor, menor será a homogeneidade da distribuição, ou seja, apresenta o maior grau de dispersão. Exemplo: Tomemos os resultados das medidas de altura e pesos de um mesmo grupo de pessoas tiradas de uma sala de aula. A fim de comparar a dispersão das duas relações de medidas, utilizaremos o coeficiente de dispersão. Podemos observar que neste grupo de pessoas, a relação de distribuição das alturas apresenta um menor grau de dispersão do que os pesos. Usando o Excel Seja uma distribuição amostral composta de sete números (n), representando o tempo (em minutos) de execução de uma prova. X = (85, 86, 88, 88, 91, 94, 104). Usando as fórmulas prontas do Microsft Excel para determinar a variância e o desvio padrão da amostra e da população, teremos: O comando VARP(NUM1;NUM2...) calcula a variância da população, bastando marcar as células que contêm os dados. Com o comando VARA(NUM1;NUM2;...) calcula a variância da amostra, bastando marcar as células que contêm os dados com o mouse, ou indicar o intervalo na função como mostrado no exemplo. Da mesma forma temos o desvio padrão da população e amostra: População: DESVPADP(NUM1;NUM2;...) Amostra: DESVPAD(NUM1;NUM2;...)
Compartilhar