Baixe o app para aproveitar ainda mais
Prévia do material em texto
ESTATÍSTICA-MÓDULO-04 MANUEL 1 MÓDULO- 04 - MEDIDAS DE DISPERSÃO As medidas de posição (média, mediana e moda) não são suficientes para caracterizar perfeitamente um conjunto de dados. Duas distribuições (dois conjuntos de dados) podem ter a mesma média, mediana e moda mas serem diferentes. Em uma delas, os valores podem se concentrar fortemente em torno da média, na outra, podem se espalhar nos dois lados desse valor médio. Os conjuntos X e Y a seguir exemplificam este fato. X = 11; 9; 8; 12; 7; 10; 10; 13 Y = 2; 18; 1; 5; 19; 5; 0; 30 Calculando as médias dos conjuntos X e Y obtemos: 8 80 8 1310107128911 n x x i x 10 y y n i 2 18 1 5 19 5 0 30 8 80 8 y 10 Apesar dos dois conjuntos de dados terem a mesma média, é fácil notar que o conjunto X é mais homogêneo que o conjunto Y. Ou seja, os valores do conjunto X, “variam menos” que os valores do conjunto Y. Dispersão (variabilidade) - é a maior ou menor diversificação dos valores de uma variável, em torno de um valor de tendência central tomado como referência (média ou mediana). As medidas de dispersão mais usadas são: amplitude total, desvio médio, desvio-quartil, variância, desvio padrão e coeficiente de variação. Amplitude Total - é a diferença entre o maior e o menor valor observado. Se os dados forem distribuídos em intervalos de classe, será a diferença entre o limite superior da última classe e o limite inferior da primeira classe. Em relação a amplitude total pode-se fazer as seguintes observações: 1. É afetada por valores extremos. 2. Depende do tamanho da amostra. 3. Apresenta muita variação de uma amostra para outra. Desvio Médio - é a média aritmética dos desvios absolutos (módulos) em relação a média aritmética ou a mediana. Dados não Agrupados Dm x x n i Dados Agrupados i ii f fxx Dm ESTATÍSTICA-MÓDULO-04 MANUEL 2 Exemplo-1: Determinar a amplitude total e o desvio médio do seguinte conjunto de dados: X = 4; 10; 2; 6; 8 Amplitude total: Ampl = 10 - 2 = 8 Média aritmética: x x n i 4 10 2 6 8 5 30 5 = 6 Como os dados são não agrupados vem: 4,2 5 12 5 68666261064 Dm Variância - é a média aritmética dos quadrados dos desvios em relação à média. Dados não Agrupados S x x n i2 2 ( ) , onde n = número de observações Desenvolvendo-se a expressão acima, obtém-se uma fórmula mais simples para a variância: S x n x n i i2 2 2 ou seja: S x n x i2 2 2 Dados Agrupados Sem Intervalo de Classe 22 2 i ii i ii f xf f xf S Como x f xf i ii , vem: 2 2 2 x f xf S i ii Com Intervalo de Classe 22 2 i ii i ii f xf f xf S ou 2 2 2 x f xf S i ii Obs: A única diferença para o anterior (sem intervalo de classe) é que neste caso, os valores de xi correspondem aos pontos médios de cada intervalo de classe. Através da fórmula simplificada acima, pode-se então definir a variância como sendo: “a média dos quadrados, menos o quadrado da média” Como a variância é calculada a partir dos quadrados dos desvios, ela possui uma dimensão diferente da dos dados originais. Objetivando eliminar este inconveniente, usa-se outra medida de dispersão chamada desvio-padrão. ESTATÍSTICA-MÓDULO-04 MANUEL 3 Desvio Padrão - é a raiz quadrada da variância. Temos: S = 2S ou i ii f fxx S 2)( Exemplo-2: Calcular a variância e o desvio-padrão do seguinte conjunto de dados X = 2; 4; 3; 6; 10 (Dados não agrupados) Temos, média aritmética: x 25 5 x = 5 Como os dados são não agrupados a variância é dada por: S x x n i2 2 ( ) Substituindo os valores vem: 8 5 40 5 )510()56()53()54()52( 222222 S O desvio-padrão é dado por: S = 8 2 82 , Exemplo-3: Achar a variância e o desvio-padrão da seguinte distribuição de freqüência: Classe i Estatura (cm) fi 1 150 ├ 154 4 2 154 ├ 158 9 3 158 ├ 162 11 4 162 ├ 166 8 5 166 ├ 170 5 6 170 ├ 174 3 40 Precisamos abrir na tabela novas colunas para xi (ponto médio), fi xxi e fi x xi 2 Classe ì Estatura (cm) fi xi fi xxi fi xxi 2 1 150 ├ 154 4 152 608 92416 2 154 ├ 158 9 156 1404 219024 3 158 ├ 162 11 160 1760 281600 4 162 ├ 166 8 164 1312 215168 5 166 ├ 170 5 168 840 141120 6 170 ├ 174 3 172 516 88752 40 6440 1.038.080 Como os dados estão distribuídos em intervalos devemos usar a fórmula: 22 2 i ii i ii f xf f xf S , onde os xi são os pontos médios de cada intervalo. Substituindo os valores da tabela obtém-se: S 2 2 1038080 40 6440 40 = 25952 - 25921 = 31 cm2 O desvio-padrão é a raiz quadrada da variância. Assim, S = 31 5 57 , cm ESTATÍSTICA-MÓDULO-04 MANUEL 4 Correção da Fórmula da Variância para o caso de Amostra Quando se trabalha com uma amostra deve-se usar a seguinte fórmula para o cálculo da variância: A razão para este procedimento reside no fato de que, utilizando-se (n-1) obtém-se uma melhor estimativa do parâmetro da população. Para amostras grandes (n>30) não há grandes diferenças nos resultados proporcionados pela utilização de n ou (n-1) no denominador. Este fator de correção é conhecido como fator de correção de Bessel: n n 1 Obs: Tanto o desvio-padrão como a variância são usados como medidas de dispersão ou variabilidade. O uso de uma ou de outra dependerá da finalidade que se tenha em vista. A variância é uma medida que tem pouca utilidade como estatística descritiva, porém é extremamente importante na inferência estatística e no uso de amostras. Propriedades da Variância 1. Somando-se ou subtraindo-se uma constante a todos os elementos de um conjunto de dados, a variância deste conjunto não de altera. 2. Multiplicando-se ou dividindo-se todos os elementos de um conjunto de dados por uma constante (diferente de zero), a variância deste conjunto fica multiplicada ou dividida pelo quadrado desta constante. Propriedades do Desvio Padrão 1. Somando-se ou subtraindo-se uma constante a todos os valores de um conjunto de dados, o desvio padrão não se altera. 2. Multiplicando-se ou dividindo-se todos os valores de um conjunto de dados por uma constante (diferente de zero), o desvio padrão ficará multiplicado ou dividido por essa constante. 3. O desvio-padrão não tem interpretação física como ocorre com a média, à mediana e a moda. 4. Em uma distribuição normal tem-se entre: [ x - S , x + S ] - 68,25% das observações [ x - 2S , x + 2S ] - 95,46% das observações [ x - 3S , x + 3S ] - 99,73% das observações 1 1 2 2 n xx S n i i ESTATÍSTICA-MÓDULO-04 MANUEL 5 Coeficiente de Variação - algumas medidas estatísticas quando observadas isoladamente não trazem muita informação. Dessa forma, um desvio padrão de 5 unidades pode ser considerado pequeno para um conjunto de valores cuja média é 500, no entanto, se a média for igual a 50 o mesmo não pode ser dito. Por outro lado, por ser o desvio padrão expresso na mesma unidade que os dados originais, é complicado o seu uso para efeito de comparação da dispersão entre dois conjuntos de dados expressos em unidades diferentes. Objetivando-se contornar essas dificuldades e limitações, criou-se uma nova medida chamada Coeficiente de Variação (CV) assim definida: (Desvio Padrão dividido pela Média Aritmética) (Coeficiente de Variação de Pearson) Exemplo-8: Para um conjunto de dados relativos a estaturas têm-se:x =161 cm e S=5,57 cm. Achar o CV desteconjunto de dados. Temos: x S CV CV = 5 57 161 , CV = 0,0345 ou 3,45% Exemplo-4: Consideremos os resultados das medidas de altura e peso de um mesmo grupo de indivíduos exibidos na tabela abaixo: Medidas x S Estatura 175 cm 5,0 cm Peso 68 Kg 2,0 Kg Qual apresenta maior grau de dispersão ? Temos: CVe = 5 175 = 0,0285 (estaturas) CVp = 2 68 = 0,0294 (pesos) Logo, os pesos (2,94%) apresentam maior grau de dispersão relativa que as alturas (2,85%), embora a dispersão absoluta (desvio padrão) seja maior para as alturas. Propriedades do Coeficiente de Variação 1. Somando-se uma constante positiva a todos os elementos de um conjunto de dados o coeficiente de variação diminui. No entanto, não é possível determinar o novo valor a partir apenas do valor original. 2. Subtraindo-se uma constante positiva de todos os elementos de um conjunto de dados o coeficiente de variação aumenta. No entanto, não é possível determinar o novo valor a partir apenas do valor original. 3. Multiplicando-se ou dividindo-se todos os elementos de um conjunto de dados por uma constante positiva, o coeficiente de variação não se altera. x S CV
Compartilhar