Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 ESTATÍSTICA APLICADA ESTATÍSTICA APLICADA Graduação ESTATÍSTICA APLICADA 49 U N ID A D E 4 MEDIDAS DE DISPERSÃO Estudaremos aqui as medidas de dispersão. Elas permitem calcular a dispersão (como os dados estão espalhados) existente entre os dados observados, estejam eles agrupados ou não, em relação à média aritmética. OBJETIVOS DA UNIDADE: Compreender as medidas de dispersão, calcular essas medidas, para dados não agrupados e dados agrupados em classes de freqüências. PLANO DA UNIDADE: • Amplitude total. • Variância. • Desvio padrão. • Coeficiente de variação. Bons estudos! UNIDADE 4 - MEDIDAS DE DISPERSÃO 50 A média aritmética, a moda e a mediana são valores representativos do todo, portanto a obtenção desses valores se faz fundamental no estudo de um conjunto de valores. Porém, para analisarmos um fenômeno estatístico, não basta obtermos apenas medidas de posição ou gráficos estatísticos. Para uma análise mais profunda, devemos saber como esses dados estão distribuídos no todo. As medidas de variabilidade ou dispersão nos dão exatamente isso. Elas fazem uma descrição de como os dados estão espalhados no todo. Existem diversas medidas de dispersão, porém, em nossa disciplina, estudaremos quatro delas, que são: · Amplitude total; · Variância; · Desvio padrão; · Coeficiente de variação; Ex.: Observe os seguintes conjuntos de valores referentes à mesma variável: X = {20, 20, 20, 20, 20} Y = {05, 15, 20, 30 ,30} Z = {01, 01, 03, 05, 90} Os três conjuntos apresentam a mesma média aritmética , porém é fácil notar que o primeiro conjunto de valores é mais homogêneo que os outros dois, pois todos os valores são iguais. Já o segundo é mais homogêneo que o terceiro, pois este é o mais disperso de todos. Portanto não adianta dois ou mais conjuntos de valores terem a mesma média aritmética, algumas outras análises se fazem necessárias. AMPLITUDE TOTAL (AT) Amplitude Total (AT) é a diferença entre o limite superior da última classe e o limite inferior da primeira classe, ou seja, é a diferença entre os valores extremos de um conjunto de dados . Trata-se da única medida de dispersão que não tem a média como ponto de referência. A amplitude total é instável, pois só leva em consideração os valores extremos dos conjuntos de dados, descuidando do conjunto de valores intermediários, por isso é pouco utilizada. Uma de suas utilizações é na hora de decidirmos por uma distribuição de freqüência com ou sem intervalos de classes. Fazemos uso da amplitude total quando queremos determinar a amplitude da temperatura em um dia, por exemplo, medida de cálculo rápido sem muita exatidão. EXEMPLIFICANDO ESTATÍSTICA APLICADA 51 Ex.: Dada a série 2, 3, 5, 6, 7, 7, 8, 8, 8, 9, 9, 9, 10, 10, 21, 22, 23, 23, 23, 24, 25, 25, 27, 27, 48, 60 e 70 a amplitude amostral será: Agrupando os dados sem intervalos de classe: Com intervalos de classe: VARIÂNCIA (S2) A variância mede o grau de variabilidade em torno da média. É a média aritmética dos quadrados dos desvios (cada valor menos a média). Diferente da amplitude total que se deixa influenciar pelos extremos, a variância leva em consideração todos os valores da variável em estudo. Ela baseia-se nos desvios em torno da média. EXEMPLIFICANDO UNIDADE 4 - MEDIDAS DE DISPERSÃO 52 Variância Amostral · Para dados isolados: = cada valor observado. = média dos valores observados. n = tamanho da amostra. · Para dados agrupados: IMPORTANTE No denominador da fórmula da variância trabalhamos sempre com n-1 graus de liberdade para diminuir o erro do cálculo da variância com agrupamento da distribuição. Em que: = cada valor observado, no caso de dados agrupados com intervalos de classe, é o ponto médio do intervalo de classe. = média dos valores observados. = somatório das freqüências (n). fi = freqüência de cada classe. Ex.: Ao analisarmos as idades dos pacientes atendidos num dia em duas clínicas de saúde A e B, temos: Clínica A EXEMPLIFICANDO i ESTATÍSTICA APLICADA 53 Clínica B Podemos observar que a variância da Clínica A é bem menor do que a variância da Clínica B, apesar de as médias aritméticas serem iguais. Isso significa que os dados referentes às idades dos pacientes atendidos na primeira clínica são mais homogêneos, ou seja, mais concentrados em torno da média que os da segunda clínica, que são mais dispersos. DESVIO PADRÃO O desvio padrão é a medida de dispersão mais empregada, pois leva em consideração a totalidade dos valores da variável em estudo e o seu resultado está na mesma unidade de medida da variável, diferente da variância, que é uma medida quadrática. Quanto maior o desvio padrão mais heterogêneos são os dados. O desvio é um indicador de variabilidade bastante estável. Ele baseia-se nos desvios em torno da média aritmética. É a média quadrática dos desvios, isto é, a raiz quadrada da variância. No nosso exemplo temos: Propriedades do desvio padrão · 1ª = Somando-se (ou subtraindo-se) uma constante a todos os valores de uma variável, o desvio padrão não se altera; · 2ª = Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante (diferente de zero), o desvio padrão fica multiplicado (ou dividido) por essa constante. EXEMPLIFICANDO UNIDADE 4 - MEDIDAS DE DISPERSÃO 54 COEFICIENTE DE VARIAÇÃO DE PEARSON - CVP O desvio padrão tem algumas limitações. Um desvio padrão de 5 unidades, por exemplo, pode ser considerado pequeno para uma série de valores cujo valor médio é 500, porém, se a média for igual a 15, essa relação muda completamente. IMPORTANTE Outra questão a ser considerada é que o fato de o desvio padrão ser expresso na mesma unidade dos dados, o que não nos permite comparar duas ou mais séries de valores expressas em unidades diferentes. Para contornar essas dificuldades e limitações, utilizamos o coeficiente de variação CV. O coeficiente de variação é uma medida de dispersão relativa, ou seja, é admensional, é a relação entre o desvio padrão e uma medida de tendência central. Portanto, existem diversos tipos de coeficientes de variação. Aqui, estudaremos apenas um: o coeficiente de variação de Pearson. OBS.: O CV pode ser expresso em decimal ou em porcentagem. Ex.: Consideremos os pesos e as alturas de um grupo de jovens atletas de uma escola de ensino fundamental da baixada fluminense: qual das medidas (Estatura ou Peso) possui maior homogeneidade? Apenas através do desvio padrão não podemos dizer nada, pois este só pode ser comparado no caso de dados com a mesma unidade de medida. Teremos, então, que calcular o CVP da Estatura e o CVP do Peso. O menor resultado será o de menor dispersão ou variabilidade, ou seja, o de maior homogeneidade. Comparando os CVP, concluímos que as estaturas apresentam maior homogeneidade que os pesos. Se levarmos em consideração o coeficiente de variação das duas variáveis, podemos afirmar que a média dos dados é EXEMPLIFICANDO ESTATÍSTICA APLICADA 55 representativa, pois o CV é bem pequeno, tanto para estaturas quanto para os pesos. Estudamos nesta unidade as medidas de dispersão. O cálculo do desvio padrão é de grande importância no estudo da Estatística. Por ser um valor que se encontra na mesma unidade da variável, fica fácil seu entendimento. Ele mostra, em valores, o afastamento das observações em relação à média aritmética. Quando precisamos trabalhar variáveis diferentes, podemos compará-las através do coeficiente de variação. O estudo da dispersão ou afastamento dos dados é muito importante na nossa disciplina. É HORA DE SE AVALIAR! Não esqueçade realizar as atividades desta unidade de estudo, presentes no caderno de exercício! Elas irão ajudá- lo a fixar o conteúdo, além de proporcionar sua autonomia no processo de ensino-aprendizagem. Caso prefira, redija as respostas no caderno e depois as envie através do nosso ambiente virtual de aprendizagem (AVA). Interaja conosco! Veremos, na próxima unidade, como calcular uma amostra.
Compartilhar