Buscar

ESTATISTICA_BASICA_III

Prévia do material em texto

*
*
*
MEDIDAS DE DISPERSÃO
Medidas de tendência central fornecem um resumo parcial das informações de um conjunto de dados. A necessidade de uma medida de variação é aparente, para que nos permita, por exemplo, comparar conjuntos diferentes de valores. Algumas característica desta medida devem ser atendidos como veremos a seguir.
*
*
*
MEDIDAS DE DISPERSÃO
Amostragem A: 8, 8, 9, 10, 11, 12, 12
Média 10; Mediana 10 e Bimodal (8, 12)
Amostragem B: 5, 6, 8, 10, 12, 14, 15
Média 10; Mediana 10 e sem Moda
Amostragem C: 1, 2, 5, 10, 15, 18, 19
Média 10; Mediana 10 e sem Moda
As medidas de tendência central pouco ou nada informam a respeito da dispersão dos dados
O conceito de medida de dispersão é relativamente difícil. O quanto informativo é dizer que as três amostragens possuem dispersão 4, 10 e 18 (Y7-Y1)?
*
*
*
MEDIDAS DE DISPERSÃO
Amostragem D: 8, 9, 10, 10, 10, 11, 12
Média 10; Mediana 10 e Modal 10
Amostragem E: 5, 7, 9, 10, 11, 13, 15
Média 10; Mediana 10 e sem Moda
Amostragem F:1, 5, 8, 10, 12, 15, 19
Média 9; Mediana 10 e sem Moda
Estes três conjuntos de dados também possuem dispersão máxima igual a 4, 10 e 18, respectivamente. As amostras A, B e C apresentam um maior número de observações mais distantes da média, enquanto nas amostras D, E e F ocorre um maior número de observações concentradas em torno da média. Torna-se interessante que haja uma definição a qual use todas as observações e que seja um pequeno valor quando as observações se aproximam da média e grande quando estas são espaçadas.
*
*
*
MEDIDAS DE DISPERSÃO
Por fim considere os dados destas duas amostras:
Amostra A: 5, 6, 8, 10, 12, 14, 15
Amostra B: 105, 106, 108, 110, 112, 114, 115
A dispersão (Y7-Y1) é igual nas duas amostra e, portanto, independe do tamanho dos números.
*
*
*
MEDIDAS DE DISPERÇÃO
O critério geralmente utilizado é aquele que mede a concentração dos dados em torno da média, e algumas medidas são as mais usadas: desvio médio, variância, desvio padrão e Coeficiente de Variação.
Ex: 3, 4, 5, 6, 7 (média 5), os desvios xi-x, são: -2, -1, 0, 1 ,2.
 1, 3, 5, 7, 9 (média 5), os desvios xi-x, são: -4, -2, 0, 2, 4.
É fácil observar que a soma dos desvios é igual a zero, o que torna inviável esta medida. As opções são:
Considerar o total dos desvios em valor absoluto (módulo) ou,
Considerar o total dos quadrados dos desvios. Assim teríamos:
Para a amostra: 3, 4, 5, 6, 7
	 = 2 + 1 + 0 + 1 + 2 = 6 (a)
 
	 2 = 4 + 1 + 0 + 1 + 4 = 10 (b)
*
*
*
DESVIO MÉDIO
O desvio médio (DM) refere-se à média dos desvio em valor absoluto, como na fórmula a seguir, aplicada a amostra 3, 4, 5, 6, 7.
DM(x) = /n , usando o exemplo anterior DM(x) = 6/5 = 1,2
Para a amostra 1, 3, 5, 7, 9 teríamos:
DM(x) = /n , DM(x) = 12/5 = 2.4
Baseado nos dados, pode-se dizer que a primeira amostra é mais homogênea.
*
*
*
VARIÂNCIA
A medida que contempla os aspectos apresentados e que é mais utilizada é a Variância. A variância é representada por dois símbolos: 2 (letra grega sigma) para população e s2 para uma amostra. As fórmulas para a variância da população e da amostra são apresentadas abaixo.
População: 2= 2/n
Amostra: s2= 2/n-1, 
 O denominador n-1 tem o propósito de tornar a variância da amostra a estimativa da variância da população. N-1 é conhecido como grau de liberdade e refere-se ao número de somas independentes lineares numa soma de quadrados.
A variância é uma medida que expressa um desvio quadrático médio. A unidade da variância é portanto o quadrado dos dados originais. Ex: para dados expressos em centímetros a variância será expressa em centímetros quadrados.
*
*
*
VARIÂNCIA
Para as amostras 3, 4, 5, 6, 7 e 
	 1, 3, 5, 7, 9
As variâncias seriam:
S12 = (3-5)2+ (4-5)2 + (5-5)2+ (6-5)2+ (7-5)2/4 	S12 =2,5
S22 = (1-5)2+ (3-5)2+ (5-5)2+ (7-5)2+ (9-5)2/4		S22 =10
A amostra 3, 4, 5, 6, 7 é mais homogênea.
*
*
*
VARIÂNCIA
Média = (0*4)+(1*5)+(2*7)+(3*3)+(5*1))/20=1,65
DM(x) = 4*(0-1,65) + 5* (1-1,65) + 7* (2-1,65) + 3* (3-1,65) + 1* (5-1,65)/20 = 0,98
Variância S2 = 4*(-1,65)2 + 5* (-0,65)2 + 7* (0,35)2 + 3* (1,35)2 + 1* (3,35)2/19 = 1,6
*
*
*
DESVIO PADRÃO
Sendo a variância uma medida que expressa um desvio quadrático médio, esta pode causar alguns problemas de interpretação. Para evitar isto, costuma-se usar o desvio padrão, que é definido como a raiz quadrada positiva da variância. Desta forma, tem-se uma medida de variabilidade expressa na mesma unidade dos valores do conjunto de dados. O desvio padrão (, para população e s para amostras) pode ser calculado através das seguintes fórmulas:
= e s = 
O DESVIO PADRÃO DAS AMOSTRAS 3, 4, 5, 6, 7 e 1, 3, 5, 7, 9 seria:
S1= =1,58
S2= =3,16
*
*
*
COEFICIENTE DE VARIAÇÃO
A variação ou dispersão real, determinada a partir do desvio padrão, ou qualquer outra medida de dispersão, é denominada dispersão absoluta. Entretanto, uma variação ou dispersão de 10 cm, na medida de uma distância de 1.000 m, é inteiramente diferente, quanto ao efeito, da mesma variação em uma distância de 20 cm. A medida desse efeito é proporcionada pela dispersão relativa, definida por:
Dispersão relativa = Dispersão absoluta/média
Se a dispersão absoluta é o desvio padrão s e a média é a aritmética, a dispersão relativa é denominada Coeficiente de Variação ou de Dispersão.
 CV= 
*
*
*
COEFICIENTE DE VARIAÇÃO
O coeficiente de variação é geralmente expresso em percentagem. O C.V. é independente das unidades adotadas. Por essa razão, é vantajosa para a comparação de distribuições cujas unidades podem ser diferentes. Uma desvantagem do C.V. é que ele deixa de ser útil quando a média esta próximo de zero.
Baixa dispersão: CV  15%
Média dispersão: CV 15-30%
Alta dispersão: CV  30%
*
*
*
ERRO PADRÃO DA MÉDIA
(Sx)
Quando se obtém uma amostra aleatória de tamanho n, estima-se a média populacional. É bastante intuitivo supor que se uma nova amostra aleatória for realizada a estimativa obtida será diferente daquela primeira. Desta forma, reconhece-se que as médias amostrais estão sujeitas à variação e formam populações de médias amostrais, quando todas as possíveis amostras são retiradas de uma população. 
O erro padrão analisa a variabilidade de uma média
*
*
*
Erro padrão
Fornece um mecanismo de medir a precisão com que a média populacional foi estimada
*
*
*
Exercícios
Dada a tabela abaixo, calcule:
Desvio médio, Variância, Desvio padrão, Coeficiente de variação e erro padrão da média

Continue navegando