Buscar

medidas de tendencia central dispersão

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 20 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 20 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 20 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

MEDIDAS DE TENDÊNCIA CENTRAL
São assim denominadas porque tendem a ocupar o centro de um conjunto de dados ordenados. Também são denominadas medidas de posição. A sua aplicação está na descrição dos dados tratados. Quando usadas como medidas descritiva de uma população são chamadas parâmetros populacionais, quando usadas para dados amostrais recebem o nome de estatísticas amostrais.
		
As medidas de tendência central mais conhecidas são: a média aritmética, a média geométrica, a mediana e a moda.
As outras medidas de posição são as separatrizes: a própria mediana, os quartis, os decis e os percentis.
MÉDIA ARITMÉTICA
Média Aritmética para dados simples
É definida como a razão entre a soma dos valores do conjunto e o número de elementos do mesmo.
__		 __		
X = ( xi ou X = ( xi 
 n ( fi
Exemplo; Calcular a média aritmética dos elementos do conjunto (2, 4, 5, 5, 8 )
		__
		X = 2 + 4 + 5 + 5 + 8 = 4,8
 5
PROPRIEDADES DA MÉDIA ARITMÉTICA
Se uma constante k é somada a todos os elementos do conjunto, então a média aritmética do mesmo também será somada a k.
Exemplo: no conjunto ( 2, 4, 5, 5, 8 ) a média aritmética é 4,8.
Tomando k = 3, o conjunto fica (5, 7, 8, 8, 11). A média aritmética fica 7,8.
Se todos os elementos do conjunto são multiplicados por uma constante k, então a média aritmética do mesmo é multiplicada pela mesma constante.
Exemplo: Multiplicando-se k = 2, o conjunto do exemplo anterior fica ( 4, 8,10,10,16). A média aritmética fica 9,6. 
A soma dos desvios dos valores de um conjunto em relação à sua média aritmética é nula.
Exemplo: Tomando o mesmo conjunto, ( 2, 4, 5, 5, 8 ), cuja média é 4,8, a soma dos desvios é 2 - 4,8 = -2,8
 4 - 4,8 = -0,8
			 5 – 4,8 = 0,2
			 5 - 4,8 = 0,2
			 8 – 4,8 = 3,2
			 	 ____
				 0
Média Aritmética para dados agrupados
Considerando a distribuição relativa a 34 famílias de quatro filhos, tomando por variável o número de filhos do sexo masculino.
	Número de meninos
	fi
	0
	2
	1
	6
	2
	10
	3
	12
	4
	4
	 
	 ( = 34
Neste caso, como as freqüências são números indicadores da intensidade de cada valor da variável, elas funcionam como fatores de ponderação, calculando-se a média aritmética ponderada pela fórmula;
_ 
X = ( xifi
 (fi 
	Número de meninos
	fi
	xifi
	0
	2
	0
	1
	6
	6
	2
	10
	20
	3
	12
	36
	4
	4
	16
	 
	 ( = 34
	( = 78
 Temos, então:
 ( xifi = 78 e (fi = 34
 Logo:_
 X = (xifi = 78 = 2,3
 (fi	 34
Onde: a média aritmética é 2,3 meninos.como a variável menino é discreta, entende-se que o maior número de famílias tem 2 meninos e 2 meninas, porém com uma tendência geral de uma leve superioridade numérica em relação ao número de meninos.
Para dados agrupados com intervalos de classe, temos, segundo o exemplo: 
	i
	Estatura (cm)
	fi
	1
	150 | --- 154
	4
	2
	154 | --- 158
	9
	3
	158 | --- 162
	11
	4
	162 | --- 166
	8
	5
	166 | --- 170
	5
	6
	170 | --- 174
	3
	
	
	( = 40
Pela mesma razão do caso anterior, vamos, inicialmente, abrir uma coluna para os pontos médios e outra para os produtos xifi:
	i
	Estatura (cm)
	fi
	xi
	xifi
	1
	150 | --- 154
	4
	152
	608
	2
	154 | --- 158
	9
	156
	1.404
	3
	158 | --- 162
	11
	160
	1.760
	4
	162 | --- 166
	8
	164
	1.312
	5
	166 | --- 170
	5
	168
	840
	6
	170 | --- 174
	3
	172
	516
	
	
	( = 40
	
	( =6.440
 ( xifi = 6.440, (fi = 40 e (xifi / (fi temos X = 6.440 / 40 = 161 cm
Processo Breve
Com o intuito de eliminarmos o grande número de cálculos e às vezes grandes algarismos gerados por algumas variáveis, empregamos o que denominamos processo breve baseado em uma mudança da variável x por outra y, tal que: yi = xi – xo
 h
onde xo é uma variável arbitrária escolhida convenientemente dentre os pontos médios da distribuição – de preferência o de maior freqüência. Fazendo essa mudança de variável, de acordo com as propriedades relativas à média, resulta da fórmula modificada:
 __
 X = xo + ((yifi) x h
 (fi
Para o cálculo da média do exemplo da distribuição anterior pelo processo breve completamos a tabela dada com as colunas correspondentes aos pontos médios (xi), aos valores da nova variável (yi) e aos produtos yifi.
	I
	Estatura (cm)
	fi
	xi
	yi
	yifi
	 
	1
	150 |--- 154
	4
	152
	-2
	-8
	
	2
	154 |--- 158
	9
	156
	-1
	-9
	-17
	3
	158 |--- 162
	11
	160
	0
	0
	
	4
	162 |--- 166
	8
	164
	1
	8
	
	5
	166 |--- 170
	5
	168
	2
	10
	27
	6
	170 |--- 174
	3
	172
	3
	9
	
	 
	 
	 ( = 40
	 
	 
	 ( = 10
	 
Temos, então, xo = 160, (yifi = 10, (fi =40 e h= 4
Substituindo esses valores na fórmula:
 __
 X = 160 + 10 x 4 = 160 + 1 = 161 cm
 40
Resumindo:
Abrimos uma coluna para os valores de xi.
Escolhemos um dos pontos médios (o de maior freqüência) para o valor de xo
Abrimos uma coluna para os valores de yi e escrevemos zero na linha correspondente à classe onde se encontra o valor de xo; a seqüência -1, - 2, -3,... logo acima do zero e a seqüência 1, 2, 3,... logo abaixo.
Abrimos uma coluna para os valores do produto yifi, conservando os sinais + ou -, e, em seguida, somamos algebricamente esses produtos.
Aplicamos a fórmula.
 
MODA (Mo)
Denominamos moda o valor que ocorre com maior freqüência em uma série de valores.
Dados não-agrupados
Quando lidamos com valores não agrupados, a moda é facilmente reconhecida; basta procurar o valor que mais se repete após a ordenação dos mesmos.
Exemplo 1) Para o conjunto (7,8,9,10,10,10,11,12,13,13,15) a moda é igual a 10.
Exemplo 2) Para o conjunto ( 1,5,6,7,9,10,11,12) a moda não existe.
Exemplo 3) Para o conjunto ( 3,4,4,4,5,6,7,7,7,8,9) há duas modas; Mo1=4 e Mo2=7 (bimodal)
OBS: A moda é o elemento com maior freqüência simples, e não o número de ocorrências deste elemento.
Dados agrupados
Sem intervalos de classe
Uma vez agrupados os dados, é possível determinar imediatamente a moda bastando fixar o valor da variável de maior freqüência.	
Dado a seguinte distribuição:
	Número de meninos
	 fi
	 0
	 2
	 1
	 6
	 2
	 10
	 3
	 12
	 4
	 4
	 
	 ( = 34
Neste caso a freqüência máxima (12) corresponde o valor 3 da variável. Logo: Mo = 3 meninos
Com intervalos de classe
A classe que apresenta a maior freqüência é denominada classe modal. Pela definição, podemos afirmar que a moda, neste caso é o valor dominante que está compreendido entre os limites da classe modal.
O método mais simples para o cálculo da moda consiste em tomar o ponto médio da classe modal. Damos a esse valor a denominação de moda bruta. 
Mo = l + L onde: l é o limite inferior da classe modal
 L é o limite superior da classe modal
Dado a distribuição:
 
	i
	Estatura (cm)
	fi
	1
	150 | --- 154
	4
	 2
	154 | --- 158
	9
	3
	158 | --- 162
	11
	4
	162 | --- 166
	8
	5
	166 | --- 170
	5
	6
	170 | --- 174
	3
	
	
	( = 40
Temos que a classe modal i = 3, l = 158 e L = 162
Mo = 158 + 162 = 320 = 160 logoMo = 160 cm ou seja o ponto médio da 
 2 2
classe modal.
Há para o cálculo da moda outros métodos mais elaborados, como, por exemplo, o que faz uso da fórmula de Czuber:
Mo = l + D1 x h 
 D1 + D2 
 
onde: D1 = f – f(ant) sendo: l é limite inferior da classe modal 
 h é a amplitude da classe modal
 D2 = f – f(pos) f a freqüência simples da classe modal
 f(ant) a freqüência simples da classe anterior a classe modal 
 f(post) a freqüência simples da classe posterior à classe modal
 
Assim para a distribuição anterior temos:
D1 = 11 – 9 = 2 e D2 = 11 – 8 = 3
Aplicando a fórmula de Czuber: 
Mo=158+ 2 x 4 = 158 + 2 x 4 =158 + 8 =158 + 1,6 = 159,6 logo Mo = 159,6cm
 2 + 3 5 5
 
MEDIANA (Md) 
A mediana é definida como o número que se encontra no centro de uma série de números, estando estes dispostos segundo uma ordem, separando o conjunto em dois subconjuntos de mesmo número de elementos.
Dados não-agrupados
Dada uma série de valores, como por exemplo:
Ex 1)	5, 13, 10, 2, 18, 15, 6, 16, 9;
o primeiro passo a ser dado é ordenar os valores em ordem crescente:
	2, 5, 6, 9, 10, 13, 15, 16, 18
em seguida, toma-se por valor central o que apresenta o mesmo número de elementos à direita e à esquerda, 10, apresentando este quatro elementos acima dele e quatro abaixo.
Temos então Md = 10 
Se porém, a série dada tiver um número par de elementos, a mediana será qualquer dos números compreendidos entre os dois valores centrais da série, convencionando-se utilizar o ponto médio.
Assim a série de valores;
	Ex2) 2, 6, 7, 10, 12, 13, 18, 21
tem para mediana a média aritmética entre 10 e 12 
	Md = 10 + 12 = 22 = 11 donde Md = 11
 2 2
Verificamos que, estando ordenados os valores de uma série e sendo n o número de elementos da série, o valor mediano será:
 -o termo de ordem n+1, se n for ímpar;
 2
 -a média aritmética dos termos de ordem n e n + 1, se n for par.
 2 2
Podemos comprovar tal fato nas séries dadas:
 -para n=9, exemplo 1), temos 9+1 = 5. Logo, a mediana é o quinto termo da série, 
 2
isto é: Md = 10
 
 -para n=8, exemplo 2), temos 8 = 4 e 8 + 1 = 5. Logo, a mediana é a média 
 2 2 
 aritmética do quarto e quinto termos da série, isto é: Md = 10+12 = 22 = 11 
 2 2
 logo: Md = 11
Obs.:
- O valor da mediana pode coincidir ou não com um elemento da série, como vimos. Quando o número de elementos da série é ímpar, há coincidência. O mesmo não acontece, porém, quando esse número é par.
- A mediana e a média aritmética não têm, necessariamente, o mesmo valor. Na primeira série apresentada, por exemplo, temos:
 __
 X = 10,4 e Md = 10
- A mediana, como vimos, depende da posição e não dos valores dos elementos na série ordenada. Essa é uma das diferenças marcantes entre a mediana e a média (que se deixa influenciar, e muito, pelos valores extremos). Esta propriedade da mediana pode ser constatada através dos exemplos a seguir: 
 _
 5, 7, 10, 13, 15 => X = 10 e Md = 10 
 __
 5, 7, 10, 13, 65 => X = 20 e Md = 10 
isto é, a média do segundo conjunto de valores é maior do que a do primeiro, por influência dos valores extremos, ao passo que a mediana permanece a mesma. 
Dados agrupados
Se os dados se agrupam em uma distribuição de freqüência, o cálculo da mediana se processa de modo muito semelhante dos dados não agrupados, implicando, porém, a determinação prévia das freqüências acumuladas. Tem-se que determinar um valor tal que divida a distribuição em dois grupos que contenham o mesmo número de elementos; usando-se ( fi / 2 
Dados agrupados sem intervalos de classe
Neste caso, é o bastante identificar a freqüência acumulada imediatamente superior à metade da soma das freqüências. A mediana será aquele valor da variável que corresponde a tal freqüência acumulada.
	Número de meninos
	fi
	Fi
	0
	2
	2
	1
	6
	8
	2
	10
	18
	3
	12
	30
	4
	4
	34
	 
	 ( = 34
	
Sendo (fi = 34 = 17 a menor freqüência acumulada que supera esse 
 2 2 
valor é 18, que corresponde ao valor 2 da variável, sendo este o valor mediano. Logo, Md = 2 meninos.
No caso de existir uma freqüência acumulada (Fi), tal que: Fi = ( fi / 2 a mediana será dada por 
	Md = (xi +( xi+1))/ 2, isto é, a mediana será a média aritmética entre o valor da variável correspondente a essa freqüência acumulada e o seguinte.
Com intervalos de classe
Neste caso, o problema consiste em determinar o ponto do intervalo em que está compreendida a mediana. Devemos para isso determinar inicialmente a classe na qual se acha a mediana – classe mediana. Tal classe será aquela correspondente à freqüência acumulada imediatamente superior a (fi / 2 . Feito isto, um problema de interpolação resolve a questão, admitindo-se, agora, que os valores se distribuam uniformemente em todo o intervalo de classe.
Tomando por exemplo a distribuição 
 
	i
	Estatura (cm)
	fi
	Fi
	1
	150 |--- 154
	4
	4
	2
	154 |--- 158
	9
	13
	3
	158 |--- 162
	11
	24
	 4
	162 |--- 166
	8
	32
	5
	166 |--- 170
	5
	38
	6
	170 |--- 174
	3
	40
	 
	 
	  ( = 40
	 
 Temos: (fi = 40 = 20
 2 2
Como há 24 valores incluídos nas três primeiras classes da distribuição e como pretendemos determinar o valor que ocupa o 20 lugar, a partir do início da série, vemos que este deve estar localizado na terceira classe ( i= 3), supondo que as freqüências dessa classe estejam uniformemente distribuídas. Como há 11 elementos nessa classe e o intervalo de classe é igual a 4, devemos tomar, a partir do limite inferior, a distância: 
 20 – 13 x 4 = 7 x 4
 11 11
e a mediana será dada por:
 Md = 158 + 7 x 4 = 158 + 28 = 158 + 2,54 = 160, 5411 11
Logo: Md = 160, 54 cm
Na prática, executamos os seguintes passos;
Determinamos as freqüências acumuladas
Calculamos : (fi / 2 
Marcamos a classe correspondente à freqüência acumulada imediatamente superior à (fi / 2 - classe mediana - e em seguida, empregamos a fórmula: 
 Md = l + (((fi / 2) – F(ant)) h
 F
Na qual: l é o limite da classe mediana
 F(ant) é a freqüência acumulada da classe anterior à classe mediana
 f é a freqüência simples da classe mediana
 h é a amplitude do intervalo da classe mediana
	Tomando por exemplo a distribuição anterior, temos:
 (fi = 40 = 20
2
Logo, a classe mediana é a de ordem 3. Então:
I = 158, F(ant) = 13, f = 11 e h = 4
Substituindo estes valores na fórmula, temos:
Md = 158 + (20 – 13) 4 = 158 + 28 = 158 + 2,54 = 160,54 cm
 11
OBS No caso de existir uma freqüência acumulada igual a (fi / 2, a mediana será o limite superior da classe correspondente, ou seja estará na classe seguinte sendo o seu limite inferior o resultado.
UTILIZAÇÃO DAS MEDIDAS DE TENDÊNCIA CENTRAL
Média Artimética
É a medida de tendência central mais utilizada pela simplicidade e rapidez de seu cálculo. É empregada:
quando se deseja obter um valor médio estável e significativo que inclue no seu cálculo todos os valores. É de grande utilidade pela sua significância, como parâmetro, nas teorias da amostragem e da estimação estatística,
é usada na construção de índices de grande importância estatística como o desvio padrão, o coeficiente de variação e o escore reduzido z,
quando uma distribuição estatística apresenta assimetria e se deseja o seu centro de gravidade, que será representado pela média aritmética,
quando se deseja maior precisão na determinação de uma medida, realizam-se várias medições e toma-se como resultado a média aritmética de uma delas. Em razão da primeira propriedade da média aritmética, os erros para mais e para menos se anulam e a média aritmética será o valor mais próximo da medida real,
a média aritmética pode ser calculada a partir dos valores brutos, sem recorrer a qualquer agrupamento ou ordenação.
Moda
É a menos usada, sendo empregada principalmente:
quando se deseja conhecer apenas o valor mais freqüente,
quando se deseja ter uma noção imediata e aproximada de qual será o valor da tendência central.
em distribuições de freqüência onde ocorram classes com limites indefinidos ( “menos de .... “ou “ mais de...”). em casos como este, o valor da média aritmética não pode ser determinado com exatidão.
Mediana
É usada quando:
quando se deseja encontrar o valor exato que divide a distribuição em duas metades,
quando os valores extremos são tais que podem afetar sensivelmente o valor da média aritmética,
em distribuições onde ocorram limites superiores ou inferiores aberto (“menos de ... “ ou “mais de ... “).
SEPARATRIZES
	Assim, como a mediana, que divide uma distribuição em duas partes iguais, existem medidas estatísticas que dividem a mesma distribuição em quatro, dez, ou cem partes iguais. O cálculo de tais medidas é semelhante, operacionalmente, ao cálculo da mediana.
	QUARTIS
	Denominamos quartis os valores de uma série que a dividem em quatro partes iguais.
	Por analogia à fórmula da mediana para determinar os quartis usamos a mesma técnica do cálculo da mediana, bastando substituir, na fórmula da mediana,
 (fi / 2 por:	K(fi / 4 onde k é o número de ordem do quartil.	
	Assim, temos:
	Q1 = Ii + ((fi / 4 - F(ant)) h
 f
 	Q3 = Ii+ (3(fi / 4 - F(ant)) h
 f
 
Dada a seguinte distribuição de freqüência
	I
	Estatura (cm)
	fi
	Fi
	1
	150 |--- 154
	4
	4
	2
	154 |--- 158
	9
	13
	3
	158 |--- 162
	11
	24
	 4
	162 |--- 166
	8
	32
	5
	166 |--- 170
	5
	38
	6
	170 |--- 174
	3
	40
	 
	 
	  ( = 40
	 
Primeiro quartil Terceiro quartil
((fi / 4 = 40 / 4 = 10 ( i = 2 3(fi / 4 = (3 . 40) /4 = 30 ( i = 4
 
Q1 = 154 + ( 10 – 4 ) . 4 = 154 + 24 Q3 = 162 + (30 – 24) . 4 = 162 + 24
 9 9 8 8
Q1 = 154 + 2,66 = 156,7 cm Q3 = 162 + 3 = 165,0 cm
DECIS
	Denominamos decis os 9 valores que separam uma série em 10 partes iguais.
	Por analogia à fórmula da mediana para determinar os decis usamos a mesma técnica do cálculo da mediana, bastando substituir, na fórmula da mediana,
 (fi / 2 por:	K(fi / 10 onde k é o número de ordem do decil.	
Assim, temos no exemplo acima :
Primeiro decil Quarto decil
((fi / 10 = 40 / 10 = 4 ( i = 2 4(fi / 10 = (4 . 40) /10 = 16 ( i = 3 
 
D1 = 154 + ( 4 – 4 ) . 4 = 154 +0 D4 = 158 + (16 – 13) . 4 = 158 + 12 
 9 11 11
D1 = 154 cm D4 = 158 + 1,1 = 159,1 cm
Por analogia resolvem-se os outros decis
PERCENTIS
Denominamos percentis os 99 valores que separam uma série em 100 partes iguais.
Por analogia à fórmula da mediana para determinar os percentis usamos a mesma técnica do cálculo da mediana, bastando substituir, na fórmula da mediana,
 (fi / 2 por:	K(fi / 100 onde k é o número de ordem do percentil.	
Assim, temos no exemplo acima :
Primeiro percentil Vigésimo percentil
((fi / 100 = 40 / 100 =0,4 ( i = 1 20(fi / 100 = (20 . 40) /100 = 8 ( i = 2
 
P1 = 150 + ( 0,4 – 0 ) . 4 = 150 + 0,4 P20 = 154 + (8 – 4) . 4 = 154 + 16
 4 9 9
P1 = 150,4 cm P20= 154 + 1,8 = 155,8 cm
Por analogia resolvem-se os outros percentis.
EQUIVALÊNCIAS
As seguintes equivalências são válidas: 
		P50 = D5 = Q2 = Md
		P25 = Q1
		P75 = Q3
		P10 = D1
		P20 = D2
	 	 ...
		P90 = D9
Assim, para qualquer das medidas relacionadas acima, basta calcular o equivalente percentil.
Na prática, ao se estudar um conjunto de dados é comum considerar apenas os valores compreendidos entre o décimo percentil e o nonagésimo percentil. Este procedimento visa excluir dos estudos os valores extremos, garantindo desta forma maior precisão para a descrição dos dados.
MEDIDAS DE DISPERSÃO OU DE VARIABILIDADE
A dispersão de um conjunto de dados pode ser entendida como a variação dos mesmos em torno de um valor central. Na Estatística este valor central é a Média Aritmética. Em situações que exigem o emprego de ferramentas estatísticas a dispersão é utilizada para avaliar a homogeneidade de um conjunto de dados de observação. 
Supondo que se deseja comparar a performance de dois grupos, com base em um teste de matemática básica.
	Grupo A: 70, 71, 69, 70, 70
	Grupo B: 60, 80, 70, 62, 83 
Calculando a média aritmética para cada grupo, vamos obter:
_ __
Xa = 70 Xb = 71
Baseado nestes resultados, diríamos que a performance do grupo B é um pouco melhor que a do grupo A. Mas, observando mais detalhadamente os dados, notamos que as notas do grupo A variam apenas de 69 a 71, ao passo que as do grupo B variam de 60 a 83,o que revela que a performance de A é bem mais uniforme do que a de B.
Para avaliar quantitativamente o grau de variabilidade ou dispersão dos valores de um conjunto de números em torno de valor médio, lançaremos mão das estatísticas denominadas de medidas de dispersão. As principais são: a amplitude total, a variância, o desvio padrão e o coeficiente de variação.
AMPLITUDE TOTAL
A amplitude é a diferença entre o maior e o menor valor observado.
	Para os exemplos acima teremos:
	Grupo A: A = 71 – 69 = 2
	Grupo B: A = 83 – 60 = 23
Suponhamos outro grupo ( C ): 63, 40, 50, 50,60 onde A = 63 – 40 = 23
Notamos que os grupos B e C representam a mesma amplitude, apesar dos conjuntos de valores serem bem diferentes. Dessa forma, verificamos que a amplitude total tem o grave inconveniente de ser influenciada apenas pelos valores extremos do conjunto, desprezando os valores intermediários. Assim, a amplitude não fornece uma idéia precisa quanto à dispersão do conjunto como um todo. 
VARIÂNCIA (S2, (2)
A variância de um conjunto de n valores: x1, x2, ...., xn é a média aritmética dos quadrados dos desvios desses valores em relação à sua média. 
	 _ 2 _ 2
(2 = ( (xi –x) ou (2 = ( (xi –x) 
 (fi n 
Esta fórmula deve ser utilizada para calcular a variância de uma população, no caso de amostras devemos substituir o denominador n por n-1 .
Sendo a variância calculada a partir dos quadrados dos desvios, ela é um número em unidade quadrada em relação a unidade em questão; para contornar o problema da unidade define-se o desvio padrão.
DESVIO PADRÃO (()
O desvio padrão é definido como a raiz quadrada positiva da variância.
 _______​​​​___________
( = ( ((xi2 ) / n – (( xi / n )2
Para o desvio padrão são válidas as seguintes propriedades: 
	1)- somando-se (ou subtraindo-se) uma constante a todos os valores de uma variável, o desvio padrão não se altera.
		Yi = xi + c ( (y = (x
	2)- multiplicando-se todos os valores de uma variável por uma constante (diferente de zero), o desvio padrão fica multiplicado por essa constante.
		Yi = c X xi ( (y = c X (x
	
3)- para uma distribuição normal tem- se que:
 _ _
 a)- 68,27% dos valores pertencem ao intervalo ( X -( ; X + ()
 _ _
 b)- 95,45% dos valores pertencem ao intervalo ( X - 2( ; X + 2()
 _ _
 c)- 99,73% dos valores pertencem ao intervalo ( X - 3( ; X + 3()
Dados não agrupados
Tomemos por exemplo, o conjunto de valores da variável x:
40, 45, 48, 52, 54, 62, 70
 O método mais prático para se obter o desvio padrão é formar uma tabela com duas colunas: uma para xi e outra para xi2:
	xi
	xi2
	40
	1.600
	45
	2.025
	48
	2.304
	52
	2.704
	54
	2.916
	62
	3.844
	70
	4.900
	(= 371
	(= 20.293
Como n = 7, temos: 
 ____________​________ ____________
( = ( (20.293 / 7) – ( 371 / 7 )2 = ( 2.899 – (53)2 =
 ____________ ___
 ( 2.899 – 2.809 = ( 90 = 9,486
logo ( = 9,49
 
Comparemos os dados relativos aos grupos A, B, e C 
Grupo A A= 69, 70, 70, 70, 71
	Xi
	xi2
	69
	4.761
	70
	4.900
	70
	4.900
	70
	4.900
	71
	5.041
	(=350
	(= 24.502
	
	
	
	
 ____________​________ ____________
( = ( (24.502 / 5) – ( 350 / 5 )2 = ( 4.900,4 – (70)2 =
 _____________ ___
 ( 4.900,4 – 4.900 = ( 0,4 = 0,63
logo ( = 0,63
	
Grupo B B= 60, 62, 70, 80, 83
	Xi
	xi2
	60
	3.600
	62
	3.844
	70
	4.900
	80
	6.400
	83
	6.889
	(=355
	(= 25.633
	
	
	
	
 ____________​________ ____________
( = ( (25.633 / 5) – ( 355 / 5 )2 = ( 5.126,6 – (71)2 =
 _____________ ____
 ( 5.126,6 – 5.041 = ( 85.6 = 9,25
logo ( = 9,25
Grupo C C= 40, 50, 50, 60, 63
	Xi
	xi2
	40
	1.600
	50
	2.500
	50
	2.500
	60
	3.600
	63
	3.969
	(=263
	(= 14.169
	
	
	
	
 ____________​________ ______________
( = ( (14.169 / 5) – ( 263 / 5 )2 = ( 2.833,8 – (52,6)2 =
 _______________ _____
 ( 2.833,8 – 2.766,8 = ( 67,04 = 8,19
logo ( = 8,19
Com os cálculos dos desvios padrão podemos comparar os três grupos de dados, onde apesar de médias aritméticas próximas os grupos A e B possuem performance bem distintas com desvios padrão 0,63 e 9,25 resultando em uma maior dispersão dos resultados no grupo B. Os grupos B e C apesar de amplitudes iguais possuem média aritméticas distintas e desvios padrão distintos.
Dados agrupados
Sem intervalos de classe
	
	Neste caso, temos a presença de freqüências, devemos levá-las em consideração, resultando na fórmula:
 _________________
	( = ( ((fixi2)/n – ((fixi /n)2
	Considerando o exemplo a seguir, formando colunas para xifi e xi2fi, temos: 
	xi
	fi
	xifi
	xi2fi
	0
	2
	0
	0
	1
	6
	6
	6
	2
	12
	24
	48
	3
	7
	21
	63
	4
	3
	12
	48
	TOTAL
	( = 30
	( = 63
	( = 165
Logo: _______________ _________ ____
	( = ( 165/30 – (63 /30)2 = ( 5,5 –4,41 = ( 1,09 = 1,044
Daí ( = 1,04
	Dados agrupados com intervalos de classes 
	
	i
	Estatura (cm)
	fi
	xi
	fixi
	fixi2
	 
	1
	150 |--- 154
	4
	152
	608
	92.416
	
	2
	154 |--- 158
	9
	156
	1.404
	219.024
	
	3
	158 |--- 162
	11
	160
	1.760
	281.600
	
	4
	162 |--- 166
	8
	164
	1.312
	215.168
	
	5
	166 |--- 170
	5
	168
	840
	141.120
	
	6
	170 |--- 174
	3
	172
	516
	88.752
	
	 
	 
	 ( = 40
	 
	 ( = 6.440
	 ( = 1.038.080
	 
Logo _______________________ _____________ ___
	( = ( (1.038.080)/40 – (6.440/40)2 = ( 25.952 –25.921 = ( 31 = 5,567
		Daí ( = 5,57 cm
Dependendo da variável estudada os valores estudados podem ser numericamente extensos, podemos daí usar o método breve para o cálculo do desvio padrão.
 
Processo Breve
Baseado na mudança da variável x por outra y, tal que:
	Yi = xi – x0
	 h
e pelas mesmas razões expostas para o cálculo da média, podemos obter um processo breve de cálculo, com a aplicação da seguinte fórmula:
 _________________
	( = h ( ((fiyi2)/n – ((fiyi /n)2
Aplicando no exemplo:
	i
	Estatura (cm)
	fi
	Yi
	fiyi
	fiyi2
	1
	150 |--- 154
	4
	- 2
	- 8
	16
	2
	154 |--- 158
	9
	- 1
	- 9
	9
	3
	158 |--- 162
	11
	0
	0
	0
	4
	162 |--- 166
	8
	1
	8
	8
	5
	166 |--- 170
	5
	2
	10
	20
	6
	170 |--- 174
	3
	3
	9
	27
	 
	 
	 ( = 40
	 
	 ( = 10
	 ( = 80
Logo:
 ________________ _________​_ ______ 
( = 4 ( (80)/40 – (10 /40)2 = 4 ( 2 – 0,0625 = 4 ( 1,9375 = 4x 1,3919 = 5,5676
Daí : ( = 5,57 cm confirmando o método anterior.
ZONA DE NORMALIDADE
É a região compreendida entre 
_ _
X - ( e X + (
Onde no exemplo anterior temos
_
X - ( = 161 – 5,57 = 155,43
_
X + ( = 161 + 5,57 = 166,57
COEFICIENTE DE VARIAÇÃO
O coeficiente de variação é utilizado para comparação entre duas ou mais séries de valores, relativamente à sua dispersão ou variabilidade.
É caracterizado pela razão entre o desvio padrão e a média aritmética com o resultado multiplicado por 100 para termos a resposta em porcentagem.
 _
	CV =(( / X ) x 100
		
Para o exemplo estudado com desvio padrão ( = 5,57 e média aritmética = 161, temos:
	CV = 5,57 x 100 = 0,03459 x 100 = 3,459 CV = 3,5 %
	 161
Exemplo:
Tomemos os resultados das medidas das estaturas e dos pesos de um mesmo grupo de indivíduos:
	
	
	 _ 
 X
	( 
	Estaturas
	175 cm
	5,0 cm
	 Pesos
	68 kg
	2,0 kg
Temos:
	CVe = 5 x 100 = 0,0285 x 100 = 2,85%
 175
	CVp = 2 x 100 = 0,0294 x 100 = 2,94%
 68
Logo, nesse grupo de indivíduos, os pesos apresentam maior grau de dispersão que as estaturas.
MEDIDAS DE ASSIMETRIA
MEDIDAS DE CURTOSE
A natureza da assimetria já foi estudada na representação gráfica de uma distribuição de freqüência.
Numa distribuição simétrica, temos a coincidência dos valores da média e moda; numa distribuição assimétrica à esquerda ou negativa, a média é menor que a moda; na distribuição assimétrica à direita ou positiva, a média é maior que a moda.
Temos daí as seguintes relações:
	_
	X – Mo = 0 ( assimetria nula ou distribuição simétrica
	_
	X – Mo ( 0 assimetria negativa ou à esquerda
	_
	X – Mo ( 0 assimetria positiva ou à direita
Exemplos:
DISTRIBUIÇÃO 1		
	 Fi
	 
	
	
	
	
	
	
	
	
	 
	
	
	
	
	
	
	
	24
	 
	
	
	 
	
	
	
	
	
	 
	
	
	 
	
	
	
	
	
	 
	
	
	 
	
	
	
	
	18
	 
	
	
	 
	
	
	
	
	
	 
	
	
	 
	
	
	
	
	
	 
	
	
	 
	
	
	
	
	12
	 
	
	 
	
	 
	
	
	
	
	 
	
	 
	
	 
	
	
	
	
	 
	
	 
	
	 
	
	
	
	6
	 
	 
	
	
	
	 
	
	
	
	 
	 
	
	
	
	 
	
	
	0
	 
	 
	 
	 
	 
	 
	 
	
	
	
	
	
	
	
	
	
	
	0
	2
	6
	10
	14
	18
	22
	
	Peso
											
	PESOS (kg)
	Fi
	 2|--- 6
	6
	 6|--- 10
	12
	10|--- 14
	24
	14|--- 18
	12
	18|--- 22
	6
	 
	(=60
Temos:_
	X = 12 kg 
	Md = 12 kg 12 – 12 = 0 distribuição simétrica
	Mo = 12 kg
	( = 4,42 kg
DISTRIBUIÇÃO 2
	fi
	
	
	
	
	
	
	
	
	
	 
	
	
	
	
	
	
	
	
	 
	
	
	
	
	
	
	
	30
	 
	
	
	
	 
	
	
	
	 
	 
	
	
	
	 
	
	
	
	
	 
	
	
	
	 
	
	
	
	 24
	 
	
	
	 
	 
	
	
	
	 
	 
	
	
	 
	 
	
	
	
	 
	 
	
	
	 
	 
	
	
	
	 18
	 
	
	
	 
	 
	
	
	
	PESOS
	fi
	
	 
	
	
	 
	 
	
	
	
	 2|--- 6
	6
	
	 
	
	
	 
	 
	
	
	
	 6|--- 10
	12
	12
	 
	
	 
	
	 
	
	
	
	10|--- 14
	24
	
	 
	
	 
	
	 
	
	
	
	14|--- 18
	30
	
	 
	
	 
	
	 
	
	
	
	18|--- 22
	6
	6
	 
	 
	
	
	
	 
	
	
	 
	 (=78
	
	 
	 
	
	
	
	 
	
	
	0
	 
	 
	 
	 
	 
	 
	 
	
	
	
	
	
	
	
	
	
	
	0
	2
	6
	10
	14
	18
	22
	
	Peso
_
	X = 12,9 kg 	Md = 13,5 kg Mo = 16,0 kg 	( = 4,20 kg
12,9 – 16,0 = - 3,1 kg distribuição assimétrica negativa
	
	
DISTRIBUIÇÃO 3
	 fi
	 
	
	
	
	
	
	
	
	30
	 
	
	 
	
	
	
	
	
	 
	 
	
	 
	
	
	
	
	
	 24
	 
	
	 
	 
	
	
	
	
	PESOS
	fi
	
	 
	
	 
	 
	
	
	
	
	 2|--- 6
	6
	18
	 
	
	 
	 
	
	
	
	
	 6|--- 10
	30
	
	 
	
	 
	 
	
	
	
	
	10|--- 14
	24
	12
	 
	
	 
	
	 
	
	
	
	14|--- 18
	12
	
	 
	
	 
	
	 
	
	
	
	18|--- 22
	6
	6
	 
	 
	
	
	
	 
	
	
	 
	 (=78
	0
	 
	 
	 
	 
	 
	 
	 
	
	
	
	
	
	
	
	
	
	
	0
	2
	6
	10
	14
	18
	22
	
	Peso
	_
X = 11,10 kg
	Md = 10,50 kg 11,10 – 8,00 = 3,1 kg distribuição assimétrica positiva
	Mo = 8,00 kg ( = 4,20 kg
COEFICIENTE DE ASSIMETRIA
Também chamado de coeficiente de assimetria de Pearson e dado por:
	 _
	As = 3 ( X – Md )
 (
Onde : 
 0,15 ( | As | ( 1, assimetria moderada
 	| As | ( 1, assimetria forte
Exemplo;
	Considerando as distribuições anteriores 1, 2, 3, temos:
	As1 = 3 ( 12 – 12) = 0 simetria
	As2 = 3 ( 12,9 – 13,5) = - 0,429 ( assimetria negativa
	As3 = 3 ( 11,1 – 10,5) = 0, 429 ( assimetria positiva
CURTOSE
Denomina-se curtose o grau de achatamento de uma distribuição em relação a uma distribuição padrão, denominada curva normal.
Quando a distribuição apresenta uma curva de freqüência mais fechada que a normal , ela recebe o nome de leptocúrtiva.
 Quando a distribuição apresenta uma curva de freqüência mais aberta que a normal , ela recebe o nome de platicúrtica.
A curva normal recebe o nome de mesocúrtica.
A fórmula para a medida da curtose é: 
C = Q3 – Q1
 2( P90 – P10) também conhecida como coeficiente percentílico de curtose
Relativamente à curva normal temos:
C = 0,263
Se:
C = 0,264 ( curva mesocúrtica
C ( 0,263 ( curva leptocúrtica
C ( 0,263 ( curva platicúrtica
Exemplo:
Sabendo que uma distribuição apresenta as seguintes medidas:
Q1 = 24,4 cm, Q3 = 41,2 cm, P10 = 20,2 cm, P90 = 49,5 cm
Temos:
C = 41,2 – 24,4__ = 16, 8 = 0,287 C( 0,263 curva platicúrtica
 2( 49,5 – 20,2) 58,6

Continue navegando