Baixe o app para aproveitar ainda mais
Prévia do material em texto
41 Seção 4 MEDIDAS DE DISPERSÃO OU VARIABILIDADE Objetivos de aprendizagem Entender como as medidas de dispersão influenciam na forma da Distribuição dos dados; Calcular e interpretar as medidas de dispersão em geral. Utilizar variância, desvio padrão e coeficiente de variação para comparação de séries de dados; Entender as propriedades resultantes da relação entre média e desvio padrão. Subseções de estudo 4.1 Amplitude total 4.2 Desvio. 4.2.1 Desvio em relação à média 4.2.2 Desvio Médio Absoluto 4.3 Variância 4.4 Desvio Padrão 4.5 Coeficiente de Variação 4.6 Média e Desvio Padrão com Calculadora científica fx-82 MS Neste capítulo veremos que a estatística recorre às medidas de dispersão (ou de variabilidade) quando deseja qualificar os valores de uma variável, ressaltando a maior ou menor dispersão entre esses valores e a sua medida de posição, possibilitando assim que séries de dados sejam comparados com relação a sua homogeneidade. 42 Correspondem a medidas realizadas sobre a variação ou a dispersão dos dados em relação a medida de localização do centro da amostra. Servem para medir o grau de dispersão dos valores individuais em torno da média, ou ainda, para verificar o grau de representatividade da média. As medidas de dispersão que nos interessam são: - a Amplitude Total; - Desvio Médio - a Variância; - o Desvio-padrão; - Coeficiente de Variação. 4.1 Amplitude total (AT) A Amplitude Amostral é uma medida que é definida como sendo a diferença entre os menores e os maiores valores da coleção de dados que dispomos. Devido a isso essa medida tem a desvantagem de ser muito sensível à existência, na coleção de dados, da presença de um número muito grande ou muito pequeno, ou seja, essa medida depende apenas de valores extremos no conjunto de dados, o que quer dizer que podemos ter um conjunto com 2 (dois) elementos com a mesma amplitude de um que tem 100 (cem) elementos. MÍNMÁX xxAT OBS Fazer o Rol ajuda a identificar os valores da expressão. Exemplos: (Ambos com mesma amplitude total, mas número de dados diferentes como no enunciado) A:{ 40, 45, 48, 52, 54, 62, 70} AT = 70 - 40 = 30 AT=32-2=30 43 Quanto maior a amplitude total, maior será a dispersão dos valores da variável em torno da média. 4.2 DESVIO 4.2.1 Desvio em relação à média Chama-se DESVIO de cada valor apresentado a diferença entre esse valor e a média aritmética desses valores. Considere a distribuição 1, 6, 4, 10, 9, em que a média aritmética é 6. Teremos: desvio do valor 1 1 - 6 = -5 desvio do valor 6 6 - 6 = 0 desvio do valor 4 4 - 6 = -2 desvio do valor 10 10 - 6 = 4 desvio do valor 9 9 - 6 = 3 Os desvios, em relação à média, são: -5, 0, -2, 4 e 3. 4.2.2 Desvio Médio Absoluto (DM) Chama-se desvio médio (DM) de uma distribuição a média aritmética dos módulos dos desvios. No exemplo anterior, os desvios são -5, 0 -2, 4 e 3, logo o desvio médio será: DM = ( -5 + 0 + -2 + 4 + 3 )/5 DM = (5 + 0 + 2 + 4 + 3)/5 DM = 14/5 DM = 2,8 Note que: O módulo garante que o valor seja positivo. EXs.: a) +3 = 3 b) -3 = 3 44 4.3 Variância (s2) É uma medida mais estáveis que a amplitude total, não sofre tanto a interferência de valores extremos. Para determinar a variância calculamos a diferença (desvio) de cada elemento da amostra em relação à média aritmética. A seguir, estas diferenças (desvios) são elevadas ao quadrado e, finalmente, calculamos a sua média. Mas por que não somar todas as diferenças e pronto, por que a soma dos quadrados? Em grande parte das vezes, a soma de todas as diferenças pode ter um resultado nulo, como na distribuição normal, para evitar isso poderíamos apenas somar o módulo das diferenças, mas convencionou-se usar o quadrado das diferenças. Os cálculos de variância devem considerar a seguinte situação: Os dados representam uma população ou uma amostra? dados. Este fato pode ser observado matematicamente no denominador da expressão. Sempre antes dos cálculos é necessário observar se estamos trabalhando com População ou Amostra. A variância é a média aritmética dos quadrados dos desvios: (População) *Costuma-se utilizar símbolos diferentes para a representação. A variância é um número em unidade quadrada em relação à média, por isso, definiu-se o desvio padrão como a raiz quadrada da variância. 45 4.4 Desvio Padrão Matematicamente, o desvio padrão é a raiz quadrada da média aritmética dos quadrados dos desvios (raiz da variância). Aqui considera-se os casos de população e amostra, visto que o desvio padrão tem por origem a variância. Desvio padrão é uma medida de dispersão muito útil em estimativas de risco, por exemplo, em aplicações financeiras, já que desvio padrão representa quanto, em média, cada dado está distante da média. O cálculo dessa medida é a raiz quadrada da variância, ou seja, quanto mais próximas da média, menor será o desvio padrão, quanto mais distante maior ele será, por isso quando todas as observações têm o mesmo valor, o desvio padrão será igual a zero. Mas devemos observar: Para comparações de regularidade ou homogeneidade de duas ou mais séries de dados pelo desvio padrão, é necessário que ambas possuam a mesma média. Caso isso não seja observado, podemos ser levados a um falso resultado. Para evitar o acúmulo de erro por arredondamento, simplifica-se o cálculo do desvio padrão com a seguinte expressão: Que resulta em: 46 Propriedades: 1a: Somando-se (ou subtraindo-se) uma constante a (de) todos os valores de uma variável, o desvio padrão não se altera. 2a.: Multiplicando-se todos os valores de uma variável por uma constante (diferente de zero), o desvio padrão fica multiplicado por essa constante. A partir daqui, nos exemplos que aparecerem distribuição de frequência (tabelas), iremos considera-los como . Exemplos: I) Calcule o desvio padrão da seguinte série: i xi xi2 1 8 64 2 10 100 3 11 121 4 15 225 5 16 256 6 18 324 Total 78 1090 II) Calcule o desvio padrão para a distribuição abaixo: 47 OBS* Para dados agrupados sem intervalos de classe: deve-se levar em conta as frequências. i Qtde de filhos que se deseja ter (xi) fi fi . xi fi . xi2 1 0 2 0 0 2 1 6 6 6 3 2 12 24 48 4 3 7 21 63 5 4 3 12 48 Total 30 63 165 Revisando... Faça você agora: Exercício: Determine o desvio padrão. i Qtde de cursos realizados por ano (xi) pelos alunos do 1o ano técnico em Adm fi fi . xi fi . xi2 1 1 2 2 2 5 3 3 8 4 4 6 5 5 3 6 6 1 Total 25 48 III) Calcule o desvio padrão para a distribuição contínua abaixo: OBS* Para dados agrupados com intervalos de classe: também se leva em conta as frequências e xi é o ponto médio do intervalo de classe. Exemplo: i Alturas(cm) xi fi fixi fixi2 1 150 |- 154 152 4 608 92416 2 154 |- 158 156 9 1404 219024 3 158 |- 162 160 11 1760 281600 4 162 |- 166 164 8 1312 215168 5 166 |- 170 168 5 840 141120 6 170 |- 174 172 3 516 88752 Total 40 6440 1038080 Revisando... Faça você mesmo: Calcule o desvio padrão das distribuições abaixo, pelo processo breve. i Salário Mensal dos alunos do 3o Mat [R$] xi fi fixi fixi2 1 450 |- 550 8 2 550 |- 650 10 3 650 |- 750 11 4 750 |- 850 16 5 850 |- 950 13 6 950 |- 1050 5 7 1050 |- 1150 1 Total 64 49 i Peso kg xi fi fixi fixi2 1 30 |- 50 2 2 50 |- 70 8 3 70 |- 90 12 4 90 |- 110 10 5 110 |- 130 5 Total 37 4.5 Coeficiente de Variação (CV) O efeito da variação ou dispersão em relação à média pode ser medido pela dispersãorelativa, definida por: Dispersão Relativa = Dispersão Absoluta / Média. Se a dispersão absoluta for o desvio padrão, a dispersão relativa é denominada coeficiente de variação CV: . Costuma-se multiplicar este coeficiente por 100% para facilitar a análise de dispersão. Este coeficiente é útil para comparação de série de dados com médias diferentes (recorde que o desvio padrão só é efetivo para séries de médias iguais). Logo pode ser utilizado para definir qual série é mais regular ou mais homogênea, independente de as séries possuir ou não médias iguais. O coeficiente de variação deixa de ser útil quando a média é próxima de zero. Por exemplo: desvio se torna insignificante diante da grandeza da média. Porém, se a média da a necessidade de conhecer esta razão chamada coeficiente de variação. Exemplo: 50 Para o exemplo dos capítulos anteriores, das alturas, tem-se média de 161 cm e desvio padrão de 5,57 cm Observação: Quanto maior o CV maior será a dispersão Quanto menor o CV menor será a dispersão Revisando... Faça você mesmo: Resolva: Calcule o CV dos dois últimos exercícios de cálculo de desvio padrão pelo processo breve (tabela de salários mensal e pesos). Exercício de Revisão Geral: Os dados abaixo referem-se à idade das pessoas que compraram um determinado produto novo durante um dia. Determine: i Idade xi fi Fi fixi fixi2 1 0 |- 10 10 2 10 |- 20 26 3 20 |- 30 15 4 30 |- 40 8 5 40 |- 50 4 6 50 |- 60 3 7 60 |- 70 2 Total 51 a) Media; b) Desvio Padrão; c) Mediana d) Primeiro Quartil e) Terceiro Quartil f) P40 g) Coeficiente de variação 4.6 Média e Desvio Padrão com Calculadora científica fx-82 MS Vamos utilizar para exemplificar a aplicação desses recursos um conjunto genérico A. A = { 2, 5, 11, 14, 21, 35 } Antes de mais nada, vamos limpar a memória de nossa calculadora. 1º Pressione SHIFT + MODE 2º Digite 3 para selecionar ALL 3º Por fim digite =, para resetar a memória. Para caminhar o cálculo siga os seguintes passos: 1º Pressione MOD 2º Digite 2 para selecionar SD 3º Digite os números pertencentes ao grupo, da seguinte forma: * Valor1 + M+; Valor2 + M+; Valor3 + M+ ... Valor6 + M+ 4º Pressione SHIFT +2 (S-VAR) 5º Digite 1 para a Média (x) / Digite 2 para o Desvio Padrão Populacional / Digite 3 para o Desvio Padrão Amostral (sx) 6º Por fim digite =, para visualizar os resultados. = 14,667 = 10,965 (Caso o conjunto seja uma população) sx = 12,011 (Caso o conjunto seja uma parte da população, amostra) sequência anterior, trocando o passo 4 para: 4º Pressione SHIFT +1 (S-VAR) Revisando...Faça você mesmo!!! 2, , x , sx para os seguintes dados: 55, 54, 51, 55, 53, 53, 54, 52,55,56.
Compartilhar