Buscar

Medidas de tendência central e de variabilidade Parte 2

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

UFV – Universidade Federal de Viçosa 
Matéria: NUT 362 - Bioestatística 
 
 
 
–
 
Medidas de Variabilidade 
- Permitem comparar amostras de diferentes tamanhos e determinar se uma amostra é mais variável 
(ou heterogênea) que a outra. 
- Medidas pequenas: se os dados forem próximos. 
- Medidas grandes: se os dados forem muito “espalhados” 
Variância 
- É a medida de variabilidade dos dados em torno da média; 
- Diferença (desvio) de cada observação em relação à média 
- Quanto maiores os desvios, maior a variabilidade presente nos dados 
- É preciso resumir todos os desvios em relação à média numa única 
medida de variabilidade. 
- Para obter uma medida de variabilidade usando os desvios em 
relação à média é preciso eliminar os sinais antes de somar. Para isso, uma das estratégias é elevar 
os valores ao quadrado, e a soma obtida é chamada “soma dos quadrados dos desvios”. 
- A variância é a soma dos quadrados dos desvios de cada observação em relação à média, 
dividida por (n-1). 
- Como calcular: 
→ Calcule os desvios de cada 
observação em relação à média. 
→ Eleve cada desvio ao quadrado 
→ Some os quadrados 
→ Divida o resultado por (n-1) 
Desvio padrão 
- Para obter uma medida de 
variabilidade na mesma 
unidade de medida dos dados, 
extrai-se a raiz quadrada da variância. 
- Mede a dispersão (afastamento) dos valores em relação à média. 
- Interpretando o Desvio Padrão: 
→ É uma medida de quão bem a média representa os dados. 
→ Valor de DP pequeno: Indica que os dados tendem a estarem 
próximos da média. 
Uma desvantagem da 
variância é que ela não é 
expressa na unidade de 
medida do dado original. 
O desvio padrão 
geralmente acompanha 
a média para descrever 
a dispersão dos dados. 
UFV – Universidade Federal de Viçosa 
Matéria: NUT 362 - Bioestatística 
 
 
 
→ Valor de DP grande: Indica que há dados distantes da média (isto é, a média não é uma 
representação precisa dos dados). 
Variância e Desvio Padrão 
- Quanto maior a variância e o desvio-padrão de um conjunto de dados, maior a dispersão. 
- Quando não houver variabilidade, a variância é zero. 
- O valor do desvio-padrão pode ser maior que a média. 
- Influência da ordem de grandeza da variável: um DP=100 pode ser pequeno se a observação 
típica for 10.000, mas poderá ser bastante alto se a observação típica for 100. 
Coeficiente de Variação 
- O coeficiente de variação é a razão entre o desvio padrão 
e a média. 
- O resultado é multiplicado por 100, para que o coeficiente 
de variação seja dado em porcentagem, adimensional. 
- Quanto menor o coeficiente de variação (CV), menor a 
variabilidade e mais homogêneos são os dados. 
- Possibilita comparação de variáveis com unidades de medida diferentes. 
Separatrizes 
- São valores que separam os dados em três (tercis), quatro (quartis), cinco (quintis), dez (decis) ou 
em cem (percentis) partes iguais. 
- Para a sua correta aplicação, exige-se que os dados estejam organizados de forma ordenada. 
- Tercis: valores da variável que dividem um conjunto em 3 partes iguais. 
- Quartis: dividem um conjunto de dados em quatro partes iguais. 
- Decil: valores da variável que dividem um conjunto de dados em dez partes iguais. 
- Percentil: valores de uma distribuição que dividem um conjunto de dados em cem partes iguais. 
- É um ponto abaixo do qual a porcentagem especificada de observações ocorre. 
Ex: percentil 20 = ponto abaixo do qual estão 20% das observações e, acima dele, 80% das 
observações. 
- Calcula-se a partir de: (percentil/100) x (n+1) 
- Intervalo interquartil: diferença entre o terceiro e o primeiro quartil (Q3 – Q1), onde situa-se os 
50% centrais dos valores amostrais. 
- Quanto maior o intervalo, maior é a dispersão dos dados; 
- Vantagem: essa medida não é influenciada por valores extremos, 
quando comparada a amplitude amostral total. 
O intervalo interquartil 
geralmente acompanha a 
mediana para descrever 
a dispersão dos dados.

Outros materiais