Prévia do material em texto
Curso: ENGENHARIA Apostila 6 – Medidas de Dispersão Turno: MATUTINO/ NOTURNO PROFESSORA: Viviane de Souza Garrido 5. Dispersão ou Variabilidade Vimos que a moda a mediana e a média podiam ser usadas para resumir, num único número, aquilo que é “médio” ou “típico” de um conjunto de dados. Mas, a informação contida fornecida pelas medidas de posição necessita em geral ser complementada pelas medidas de dispersão. Estas servem para indicar o quanto os dados se apresentam dispersos em torno da região central. Caracterizam, portanto, o grau de variação existente no conjunto de valores. As medidas de dispersão que nos interessam são: a amplitude total; o desvio-padrão; a variância; e o coeficiente de variação. As medidas de tendência central como a média, ainda que considerada como um número que tem a faculdade de representar uma série de números, não pode por si mesma destacar o grau de homogeneidade ou heterogeneidade que existe entre os valores que compõem o conjunto. Observe os seguintes conjuntos de valores das variáveis X, Y e Z: X: 5, 5, 5, 5, 5. Y: 3, 4, 5, 6, 7. Z: 5, 0, 10, 8, 2. Calculando a média aritmética de cada um desses conjuntos, obtem-se: 5 . Chamando de dispersão ou variabilidade a maior ou menor diversificação dos valores de uma variável em torno do valor da média, pode-se dizer que o conjunto Xi apresenta dispersão ou variabilidade nula e que o conjunto yi apresenta uma dispersão ou variabilidade menor que o conjunto zi. OBS: Quanto maior as medidas de dispersão, mais heterogêneos são os dados, e ao contrário, quanto menor essas medidas, mais homogêneo o conjunto. Para qualificar os valores de uma dada variável, ressaltando a maior ou menor dispersão ou variabilidade entre esses valores e a sua média, é necessário recorre às medidas de dispersão. 5.1 Amplitude total (H): a amplitude total é a diferença entre o maior e o menor valor observado: H = OBS: A amplitude só leva em conta dois valores de todo o conjunto de dados e, assim, seria mais conveniente considerarmos uma medida que utilizasse todas as observações. Uma ideia inicial é considerar o desvio de cada observação em relação a média aritmética do conjunto de dados. Daí surgem as outras medidas de variabilidade. A amplitude total e o desvio médio também são medidas de variação, no entanto a variância e o desvio padrão levam em consideração a totalidade dos valores da variável em estudo sem utilizar a ideia de módulo, o que faz delas índices de variabilidade bastante estáveis e os mais empregados. Definição de Desvio: o desvio é definido como sendo a distância entre qualquer valor do conjunto de dados em relação a média aritmética do conjunto de dados. Existem várias medidas de dispersão que envolvem os desvios, são elas: o desvio-padrão, a variância e o coeficiente de variação. 5.2 Desvio-Padrão (S): o desvio-padrão é a medida mais usada na comparação de diferenças entre grupos, por ser mais precisa e estar na mesma medida do conjunto de dados. Ele determina a dispersão dos valores em relação a média. Sua formulação é dada pela raiz quadrada da média aritmética dos quadrados dos desvios, ou seja: =( amostral ) onde, é cada uma das observações do conjunto de dados, é a média do conjunto de dados e n é o número total de observações do conjunto de dados. (populacional ) 5.3 – Variância ( ² ou s² ) Sendo a variância calculada a partir dos quadrados dos desvios, ela é um número em unidade quadrada em relação à variável em questão, o que, sob o ponto de vista prático, é um inconveniente. A variância nada mais é do que o valor do desvio-padrão elevado ao quadrado, ou seja,: - Dados não agrupados: ( amostras) - Dados agrupados: ( população ) ( amostra ) Tanto o desvio padrão como a variância são usados como medidas de dispersão ou variabilidade. O uso de uma ou de outra dependerá da finalidade que se tenha em vista. A variância é uma medida que tem pouca utilidade na estatística descritiva, porém, é extremamente importante na inferência estatística e em combinações de amostras. OBS: A variância não é uma medida conveniente de ser usada pois expressa o seu resultado numa medida ao quadrado. Portanto, não vamos trabalhar com esta medida constantemente. EXEMPLOS: Exemplo 1 : Considere o conjunto de valores da variável populacional x: 40, 45, 48, 52, 54, 62, 70 1º ) Calcula-se a média = = = 53 2º) Calcula-se os desvios 3º) Calcula-se o quadrado dos desvios e , em seguida, soma. 4º ) Divide pela quantidade de elementos menos 1 5º ) Extrai a raiz quadrada = = = xi xi ( xi )2 40 13 169 45 8 64 48 5 25 52 1 1 54 1 1 62 9 81 70 17 289 total 0 630 Exemplo 2: Calcule o desvio padrão, dados os valores da população: 8, 10, 11, 15, 16, 18 R: = 3,56 Dados Agrupados – Sem intervalo de classe Exemplo3: Calcule o desvio padrão da seguinte distribuição amostral: Xi fi Xi fi 0 2 0 1 6 6 2 12 24 3 7 21 4 3 12 30 63 R: s = 1,06 – Com intervalos de classe Exemplo: Calcule o desvio padrão da tabela abaixo. SALÁRIOS SEMANAIS EM REAIS DE UMA AMOSTRA DOS FUNCIONÁRIOS DA EMPRESA Z Salários semanais (R$) Freqüências 150 |--- 154 4 154 |--- 158 9 158 |--- 162 11 162 |--- 166 8 166 |--- 170 5 170 |--- 174 3 Total 40 FONTE: PESQUISA DO SETOR DE PESSOAL R: s = R$ 5,64 As fórmulas apresentadas abaixo, para o cálculo do desvio padrão, só não são o método usualmente mais prático, como também mais preciso. Quando a média não é exata e tem de ser arredondada, cada desvio fica afetado ligeiramente do erro, devido a esse arredondamento. O mesmo acontece com os quadrados, podendo os resultados do cálculo ser menos exatos. 5.1.1 - Propriedades 1º) Somando-se (ou subtraindo-se) uma constante ( c ) a (de) todos os valores de uma variável, o desvio padrão não se altera: 2º) Multiplicando-se todos os valores de uma variável por uma constante (diferente de zero), o desvio padrão fica multiplicado por essa constante: ou 3º) Em se tratando de uma distribuição normal, observa-se que entre os limites proporcionados por: , estão contidas cerca de 68% das informações; 2, estão contidas cerca de 95% das informações; 3, estão contidas cerca de 99% das informações. 5.4 – Coeficiente de Variação ou CV ( para população ou g para amostras ) É definido como o quociente entre o desvio-padrão e a média. É freqüentemente expresso em porcentagem. (Ele mede o “grau” de variabilidade do conjunto de dados). x 100 Vamos exemplificar o cálculo da amplitude, do desvio-padrão, da variância e do coeficiente de variação utilizando os mesmos exemplos anteriores (aqueles utilizados para exemplificar as medidas de posição). - Dados não-agrupados Exemplo: Sabendo-se que a produção leiteira diária da vaca A, durante uma semana, foi de: 10, 14, 13, 15, 16, 18 e 12 litros, pede-se calcular a amplitude, o desvio-padrão (S), a variância () e o coeficiente de variação (cv). Solução: Amplitude: R= 18 – 10 = 8 litros de leite ou seja, a maior variação do número de litros de leite produzidos por dia pela vaquinha A é de 8 litros. OBS: Sabemos que a média para estes dados é: = 14 litros de leite por dia Desvio-padrão: == Variância: Coeficiente de variação: ou seja, existe uma variabilidade de 18,93% dos dados em relação a média. Dados agrupados Exemplo 1: Consideremos a distribuição relativa a 34 famílias de quatro filhos,tomando para variável o número de filhos do sexo masculino: Nº de meninos () 0 2 (0-2,3)=-2,3 (-2,3)=5,29 2(5,29)=10,58 1 6 (1-2,3)=-1,3 (-1,3)=1,69 6(1,69)=10,14 2 10 (2-2,3)=-0,3 (-0,3)=0,09 10(0,09)=0,9 3 12 (3-2,3)=0,7 (0,7)=0,49 12(0,49)=5,88 4 4 (4-2,3)=1,7 (1,7)=2,89 4(2,89)=11,56 34 =39,06 Calcule a amplitude, o desvio-padrão (S), a variância () e o coeficiente de variação (cv). Solução: Amplitude: R= 4 – 0 = 4 meninos, ou seja, a maior variação encontrada neste conjunto de dados é de 4 meninos. OBS: Sabemos que a média para este conjunto de dados é =2,3 filhos Desvio-padrão: == O número médio de filhos homens por família de 4 filhos é de 2,3 com uma variabilidade de aproximadamente 1 filho, ou seja, a maior parte das famílias com 4 filhos têm entre: 2,3 1 = (1,3 e 3,3) (1 e 3) filhos homens. Variância: Coeficiente de variação: ou seja, existe uma variabilidade de 47,30% dos dados em relação a média. (variabilidade alta). Exercício: Calcule o coeficiente de variação entre altura e peso: Tomemos os resultados das medidas das estaturas e dos pesos de um mesmo grupo de indivíduos: s Estaturas 175 cm 5,0 cm Pesos 68 kg 2,0 kg Resp: g1 = 2,86% < g2 = 2,94% 7 FACULDADE ÁREA1 | WYDEN Av. Luis Viana Filho, 3172 – Paralela Salvador | Bahia CEP 41730-101 | Telefone: (71) 2106 3959 CNPJ: 03.681.572/0007-67 wyden.com.br/area1