Baixe o app para aproveitar ainda mais
Prévia do material em texto
Medidas de Tendência Central Segundo a teoria de variáveis aleatórias, cada valor que medimos é apenas uma das possíveis realizações desta variável, assim se ficarmos medindo pH da água durante uma hora (a cada segundo), apesar da tendência à estabilização, podemos ter ao final 3600 valores diferentes de pH, já que qualquer fenômeno que ocorra acima do local medido pode alterar a variável em questão. Contudo, os valores medidos de pH tendem a ser próximos após a estabilização dos valores, assim é possível encontrar um valor que descreva de forma relativamente precisa o pH aproximado deste local. Entre as medidas utilizadas para descrever este valor encontram-se a média, a mediana e a moda, sendo que a diferença entre elas é apresentada a seguir: 1) Média Amostral: É a medida de tendência central mais utilizada, diferencia-se da média populacional pelo fato da soma das obsevações ser dividida por n-1 e não por n. Média Amostral 1 )( 21 − ++ = ∑ n xxx x i Média Populacional n xxx i∑ ++ = )( 21µ 2) Mediana: Valor Central quando as observações são ordenadas em ordem crescente, considerando que n seja ímpar, quando n for par utiliza-se a média dos valores centrais. Seu princípio é muito utilizado em testes não paramétricos, além de conjuntos de dados em que não se conhece a real forma de distribuição dos dados. Mais interessante que a média em algumas situações, uma vez que é menos sensível a valores extremos. 3) Moda: Valor que mais se repete em um conjunto de dados (amostra), sendo inexistente quando não ocorrem valores repetidos. Quando os dados se ajustam perfeitamente à distribuição normal os valores de média, mediana e moda são coincidentes (Fig. 1). Medidas de desvio em torno da média Existem três estimadores mais utilizados para descrever o desvio em torno da média (Variância, Desvio Padrão e Erro Padrão) Todas se iniciam através da variância que é obtida da soma dos quadrados dos desvios em relação à média, dividida pelo número de observações da amostra menos um (n - 1) Notas do Manoel Desvio Quadrado 4,0 -3,0 9 7,0 0 0 10,0 3,0 9 Média = 7,0 Valores se anulam Soma=18 Média = Mediana = ModaMédia = Mediana = Moda Fig. 1. Localização do valor médio, da mediana e da moda em um conjunto de dados com distribuição normal. Dividindo-se o valor encontrado por n-1 temos a variância da amostra (s2=9). A partir daí podemos obter com muita facilidade o desvio padrão da amostra através do cálculo da raiz quadrada da variância (s=3). Notem que a variância é descrita como o quadrado da escala da variável utilizada (s2), isso dificulta a sua interpretação, desta forma, a utilização do desvio padrão é mais comum, já que a sua escala é a mesma da variável em questão. O erro padrão é obtido encontrando-se o quociente do desvio padrão e a raiz do tamanho da amostra. Desta forma (raiz de 3=1,7320) levando à conclusão que 3/raiz(3) = 1,7320 (erro padrão). Outra medida de desvio em torno da média é o coeficiente de variação amostral, que é definido como: 100% ⋅= X sCV Onde s é o desvio padrão amostral e X é a média amostral. A definição do coeficiente de variação para a população é análoga, substituindo-se σ por s e X por µ. A utilização do coeficiente de variação é muito importante quando comparamos variáveis que possuam escalas diferentes (ex: que medida varia mais, a cabeça de uma formiga ou a cabeça de um elefante?). Medidas de desvio em torno da média
Compartilhar