Buscar

Medidas de Tendência Central

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Medidas de Tendência Central
Segundo a teoria de variáveis aleatórias, cada valor que medimos é apenas uma das 
possíveis realizações desta variável, assim se ficarmos medindo pH da água durante uma hora 
(a cada segundo), apesar da tendência à estabilização, podemos ter ao final 3600 valores 
diferentes de pH, já que qualquer fenômeno que ocorra acima do local medido pode alterar a 
variável em questão. Contudo, os valores medidos de pH tendem a ser próximos após a 
estabilização dos valores, assim é possível encontrar um valor que descreva de forma 
relativamente precisa o pH aproximado deste local.
Entre as medidas utilizadas para descrever este valor encontram-se a média, a mediana 
e a moda, sendo que a diferença entre elas é apresentada a seguir:
1) Média Amostral:
É a medida de tendência central mais utilizada, diferencia-se da média populacional 
pelo fato da soma das obsevações ser dividida por n-1 e não por n.
Média Amostral
1
)( 21
−
++
=
∑
n
xxx
x i
Média Populacional
n
xxx i∑ ++
=
)( 21µ
2) Mediana:
Valor Central quando as observações são ordenadas em ordem crescente, 
considerando que n seja ímpar, quando n for par utiliza-se a média dos valores centrais.
Seu princípio é muito utilizado em testes não paramétricos, além de conjuntos de 
dados em que não se conhece a real forma de distribuição dos dados.
Mais interessante que a média em algumas situações, uma vez que é menos sensível a 
valores extremos.
3) Moda:
Valor que mais se repete em um conjunto de dados (amostra), sendo inexistente 
quando não ocorrem valores repetidos.
Quando os dados se ajustam perfeitamente à distribuição normal os valores de média, 
mediana e moda são coincidentes (Fig. 1).
Medidas de desvio em torno da média
Existem três estimadores mais utilizados para descrever o desvio em torno da média 
(Variância, Desvio Padrão e Erro Padrão)
Todas se iniciam através da variância que é obtida da soma dos quadrados dos desvios 
em relação à média, dividida pelo número de observações da amostra menos um (n - 1)
Notas do Manoel Desvio Quadrado
4,0 -3,0 9
7,0 0 0
10,0 3,0 9
Média = 7,0 Valores se anulam Soma=18
Média = Mediana = ModaMédia = Mediana = Moda
Fig. 1. Localização do valor médio, da mediana e da moda em um conjunto de dados com 
distribuição normal.
Dividindo-se o valor encontrado por n-1 temos a variância da amostra (s2=9).
A partir daí podemos obter com muita facilidade o desvio padrão da amostra através 
do cálculo da raiz quadrada da variância (s=3).
Notem que a variância é descrita como o quadrado da escala da variável utilizada (s2), 
isso dificulta a sua interpretação, desta forma, a utilização do desvio padrão é mais comum, já 
que a sua escala é a mesma da variável em questão.
O erro padrão é obtido encontrando-se o quociente do desvio padrão e a raiz do 
tamanho da amostra.
Desta forma (raiz de 3=1,7320) levando à conclusão que 3/raiz(3) = 1,7320 (erro 
padrão).
Outra medida de desvio em torno da média é o coeficiente de variação amostral, que é 
definido como: 
100% ⋅=
X
sCV
Onde s é o desvio padrão amostral e X é a média amostral. A definição do coeficiente 
de variação para a população é análoga, substituindo-se σ por s e X por µ.
A utilização do coeficiente de variação é muito importante quando comparamos 
variáveis que possuam escalas diferentes (ex: que medida varia mais, a cabeça de uma 
formiga ou a cabeça de um elefante?).
	Medidas de desvio em torno da média

Outros materiais