Baixe o app para aproveitar ainda mais
Prévia do material em texto
UFV – Universidade Federal de Viçosa Matéria: NUT 362 - Bioestatística – Medidas de Variabilidade - Permitem comparar amostras de diferentes tamanhos e determinar se uma amostra é mais variável (ou heterogênea) que a outra. - Medidas pequenas: se os dados forem próximos. - Medidas grandes: se os dados forem muito “espalhados” Variância - É a medida de variabilidade dos dados em torno da média; - Diferença (desvio) de cada observação em relação à média - Quanto maiores os desvios, maior a variabilidade presente nos dados - É preciso resumir todos os desvios em relação à média numa única medida de variabilidade. - Para obter uma medida de variabilidade usando os desvios em relação à média é preciso eliminar os sinais antes de somar. Para isso, uma das estratégias é elevar os valores ao quadrado, e a soma obtida é chamada “soma dos quadrados dos desvios”. - A variância é a soma dos quadrados dos desvios de cada observação em relação à média, dividida por (n-1). - Como calcular: → Calcule os desvios de cada observação em relação à média. → Eleve cada desvio ao quadrado → Some os quadrados → Divida o resultado por (n-1) Desvio padrão - Para obter uma medida de variabilidade na mesma unidade de medida dos dados, extrai-se a raiz quadrada da variância. - Mede a dispersão (afastamento) dos valores em relação à média. - Interpretando o Desvio Padrão: → É uma medida de quão bem a média representa os dados. → Valor de DP pequeno: Indica que os dados tendem a estarem próximos da média. Uma desvantagem da variância é que ela não é expressa na unidade de medida do dado original. O desvio padrão geralmente acompanha a média para descrever a dispersão dos dados. UFV – Universidade Federal de Viçosa Matéria: NUT 362 - Bioestatística → Valor de DP grande: Indica que há dados distantes da média (isto é, a média não é uma representação precisa dos dados). Variância e Desvio Padrão - Quanto maior a variância e o desvio-padrão de um conjunto de dados, maior a dispersão. - Quando não houver variabilidade, a variância é zero. - O valor do desvio-padrão pode ser maior que a média. - Influência da ordem de grandeza da variável: um DP=100 pode ser pequeno se a observação típica for 10.000, mas poderá ser bastante alto se a observação típica for 100. Coeficiente de Variação - O coeficiente de variação é a razão entre o desvio padrão e a média. - O resultado é multiplicado por 100, para que o coeficiente de variação seja dado em porcentagem, adimensional. - Quanto menor o coeficiente de variação (CV), menor a variabilidade e mais homogêneos são os dados. - Possibilita comparação de variáveis com unidades de medida diferentes. Separatrizes - São valores que separam os dados em três (tercis), quatro (quartis), cinco (quintis), dez (decis) ou em cem (percentis) partes iguais. - Para a sua correta aplicação, exige-se que os dados estejam organizados de forma ordenada. - Tercis: valores da variável que dividem um conjunto em 3 partes iguais. - Quartis: dividem um conjunto de dados em quatro partes iguais. - Decil: valores da variável que dividem um conjunto de dados em dez partes iguais. - Percentil: valores de uma distribuição que dividem um conjunto de dados em cem partes iguais. - É um ponto abaixo do qual a porcentagem especificada de observações ocorre. Ex: percentil 20 = ponto abaixo do qual estão 20% das observações e, acima dele, 80% das observações. - Calcula-se a partir de: (percentil/100) x (n+1) - Intervalo interquartil: diferença entre o terceiro e o primeiro quartil (Q3 – Q1), onde situa-se os 50% centrais dos valores amostrais. - Quanto maior o intervalo, maior é a dispersão dos dados; - Vantagem: essa medida não é influenciada por valores extremos, quando comparada a amplitude amostral total. O intervalo interquartil geralmente acompanha a mediana para descrever a dispersão dos dados.
Compartilhar