Baixe o app para aproveitar ainda mais
Prévia do material em texto
27 6. MEDIDAS DE DISPERSÃO Em várias situações, é importante conhecer a variabilidade dos dados. Para isso, é preciso calcular e interpretar medidas de dispersão. Estudaremos as seguintes medidas de dispersão: amplitude, desvio médio, variância e desvio-padrão. Amplitude A amplitude é a medida de dispersão mais fácil de ser calculada e – por conta disso – a mais utilizada. Para calcular a amplitude, você procura o maior e o menor valor do conjunto de dados, ou seja, o máximo e o mínimo. A amplitude é a diferença entre o máximo e o mínimo. A amplitude pode ser representada pela letra a, ou pela letra R, pois em inglês amplitude é range. Desvio Médio Sem Intervalo de Classe: Para um conjunto numérico x1, x2, x3, . . ., xn de média aritmética _x , definimos Desvio Médio ( Dm ) pela fórmula : Dm = n xx n i i i f 1 _ n : nº de elementos Exemplo : ̅ Portanto Dm = n xx n i i i f 1 _ = 20 40,16 Dm = 0,82 Com Intervalo de Classe : i Int. Classe Fi mi Fi.mi 1 20 ├─ 40 15 30 450 2 40 ├─ 60 25 50 1250 3 60 ├─ 80 30 70 2100 4 80├─┤ 100 10 90 900 80 4700 Com base na distribuição de freqüências acima temos : Dm = n i i n i ii F xmF 1 _ . . Então _ x = 75,58 80 4700. _ x F mF i ii Para melhor visualização, vamos criar mais duas colunas na tabela ... i xi Fi xi . fi | ̅| | ̅| 1 2 3 6 1,65 4,95 2 3 5 15 0,65 3,25 3 4 8 32 0,35 2,80 4 5 4 20 1,35 5,40 = 20 73 --- 16,40 28 Daí, Dm = 80 1300 . 1 _ n i i n i ii F xmF Dm = 16,25 . Variância A variância é indicada por s 2 (quando trabalhamos com amostras) ou (sigma ao quadrado – quando trabalhamos com a população), e representam a variabilidade em torno da média da variável, ou seja, consideram-se as diferenças ( ̅) e calcula-se a média dos quadrados dessas diferenças: ∑ ( ̅) ou ∑ ( ̅) ∑ ( ∑ ) Se os dados representarem uma amostra (e não toda a população), a expressão acima deve ser usada colocando-se ( ) no denominador, ou seja: ∑ ( ̅) ∑ (∑ ) ou ∑ ( ̅) ∑ (∑ ) Como geralmente os dados analisados são de amostra, esta segunda expressão é a mais usada. Observação: Desvio-Padrão A unidade e a magnitude da variância não correspondem à unidade e a magnitude dos dados. Por exemplo, um professor registrou o tempo em que três alunos fizeram uma prova: 40, 45 e 50 minutos. A média e a variância são: | mi - _x | Fi . | mi - _x | 28,75 431,25 8,75 218,75 11,25 337,50 31,25 312,50 = 1300 29 Com esses resultados, podemos afirmar que os alunos levam em média 45 minutos para fazerem a prova, com variância de 25 minutos ao quadrado. O que significa esse ao quadrado? Por definição, desvio-padrão é a raiz quadrada, com sinal positivo, da variância. O desvio- padrão da população é representado por (letra grega, sigma) o desvio da amostra é representado por s. No nosso exemplo, o desvio padrão é: √ . Assim, os alunos levam, em média, 45 minutos para fazerem a prova, e a diferença entre o tempo de duração da prova e a média foi de 5 minutos. Quando os dados estão em tabelas de classes de freqüências, ou seja, não dispomos mais dos dados originais, os valores das medidas de posição e dispersão podem ser obtidos por meio de um valor aproximado, se considerarmos que cada classe de freqüências pode ser representada pelo valor central. Fazendo como o valor central da classe i e sabendo-se que temos k classes de freqüências, podemos calcular a média dos dados por: ̅ ∑ , onde é a freqüência da classe i. Para o desvio padrão, no caso de tabelas de freqüências, a fórmula ficaria: √∑ (∑ ) Exemplos: Sem Intervalo de Classe: Seja a distribuição abaixo. . . S 2 = ? e s = ? Com Intervalo de Classe: Seja a distribuição. . . Custo Fi mi Fi.mi Fi.(mi) 2 50 ├─ 60 3 55 165 9075 60 ├─ 70 5 65 325 21125 70 ├─ 80 8 75 600 45000 80 ├─┤ 90 4 85 340 28900 = 20 = 1430 = 104100 S 2 = e s = Coeficiente de Variação É indicado por CV. Uma pequena dispersão absoluta dos dados pode ser considerável quando comparada à ordem de grandeza dos valores da variável. Para perceber o tamanho real da dispersão dos dados defini-se, então, o coeficiente de variação: ̅ . Ou seja, CV é uma medida adimensional, geralmente expressa em porcentagem, isto é, 100.CV indica que porcentagem o desvio padrão representa em relação à média. i xi Fi 1 2 3 2 3 5 3 4 8 4 5 4 = 20 ( ̅) ( ̅) 6 15 32 20 Σ = 73 Criaremos mais duas Colunas. . . ou três... 30 CV = 100. )( x xs Exemplo : Sejam as séries : %5 %20 100. 100 5 )( 100. 10 2 )( 5)( 100 2)( 10 _ _ xCV xCV y yY x xX Exercícios: 1) Entre os anos de 1988 e 1996, a arrecadação líquida (bilhões de R$) da Previdência Social foi: Ano 1988 1989 1990 1991 1992 1993 1994 1995 1996 Arrecadação 33 33,5 36 34 33,5 36 33,5 38 43 Fonte: Ministério da Previdência e Assistência Social Calcule a variância, desvio padrão e coeficiente de variação. Arrecadação Líquida da Previdência Social i Arrecadação 1 33 1 2 33,5 3 3 34 1 4 36 2 5 38 1 6 43 1 Σ 9 Fonte: Ministério da Previdência e Assistência Social 2) O desempenho dos participantes de uma pesquisa1 sobre o rendimento escolar foi classificado em três categorias: inferior (I), médio (M) e superior (S). As categorias de 27 participantes, alunos da 2ª série do ensino fundamental, estão apresentadas a seguir: I; I; S; I; M; I; I; I; M; M; M; S; M; M; I; M; I; M; M; M; M; M; M; S; S; M; I. Calcule a variância, desvio padrão e coeficiente de variação. Desempenho dos alunos da 2ª série do Ensino Fundamental i Desempenho fi 1 Inferior (I) 9 2 Médio (M) 14 3 Superior (S) 4 Σ 27 Fonte: Passeri/Unicamp 3) Lendo uma monografia preparada por um aluno, um professor seleciona ao acaso 30 páginas da mesma e anotou o número de erros de digitação encontrados por páginas. Com os dados abaixo, 1 PASSERI, S. M. R. R. O autoconhecimento e as dificuldades de aprendizagem no regime de progressão continuada. 2003. Tese (Doutorado) – Faculdade de Educação, Unicamp, Campinas. 31 calcule a variância, desvio padrão e coeficiente de variação, baseando-se na distribuição de frequências. 1 2 2 3 4 0 0 0 4 0 2 1 1 1 0 0 1 2 3 1 0 0 0 0 1 1 2 2 3 2 Erros encontrados por página de uma monografia i Erros/página Páginas1 0 10 2 1 8 3 2 7 4 3 3 5 4 2 Σ 30 Fonte: Desconhecida 4) Sejam as alturas (em centímetros) de 30 alunos de uma classe: 150 159 157 151 152 150 156 153 163 159 175 163 162 162 164 158 159 166 164 168 166 160 162 170 170 169 174 165 167 157 Baseando-se na distribuição de frequências calcule a variância, desvio padrão e coeficiente de variação. Alturas dos alunos da 7ª série do Colégio Analfa i Alturas (cm) Fi 1 150 |-- 155 5 2 155 |-- 160 7 3 160 |-- 165 8 4 165 |-- 170 6 5 170 |--| 175 4 Σ 30 Fonte: Colégio Analfa 5) Os dados abaixo apresentam os valores (em kg) das massas de 74 alunos de um curso de engenharia. 70 82 65 85 70 77 59 96 129 90 100 70 70 71 64 58 74 65 60 70 50 58 68 103 54 90 85 64 72 74 66 74 67 57 74 55 67 58 90 79 70 60 65 80 96 111 85 105 63 61 90 88 72 80 67 79 63 90 70 92 81 70 90 75 72 72 68 70 75 55 57 80 75 80 Baseando-se na distribuição de frequências feita, calcule a variância, desvio padrão e coeficiente de variação. 32 Massa dos alunos de um curso de Engenharia i Massa (kg) fi 1 50 |-- 60 10 2 60 |-- 70 16 3 70 |-- 80 24 4 80 |-- 90 10 5 90 |-- 100 9 6 100 |-- 110 3 7 110 |-- 120 1 8 120 |-- 130 1 Σ 74 Fonte: Desconhecida ANÁLISE DESCRITIVA: Rol, amplitude; Tabela de frequências; Gráfico; Medidas de tendência central (média, mediana e moda); Medidas separatrizes (Q1, Q2, Q3, P10 e P90); Medidas de dispersão (variância, desvio padrão e coeficiente de variação). 6) Os dados abaixo representam os salários (em número de salários mínimos), de 40 funcionários do setor administrativo de uma empresa. Faça a análise descritiva dos dados e discuta seus resultados. 7) Construa a tabela de freqüências, o gráfico e faça a análise descritiva, para discutir seus resultados, do consumo (em kWh) de energia elétrica de uma residência. Mês abril maio junho julho agosto setembro outubro kWh 278 283 296 233 334 313 251
Compartilhar