Buscar

Material de apoio - unidade 4

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 3 páginas

Prévia do material em texto

Bioestatística - Material de apoio – Unidade 4 
Medidas de dispersão ou de variabilidade 
Na maioria das vezes, a média não expressa bem o comportamento de uma variável, ou seja, não é suficiente para explicar 
os dados. Na verdade a média só é representativa quando a variabilidade dos dados é pequena. Variabilidade quer dizer 
variação, então a variabilidade dos dados é uma forma de medir o quanto os dados se distanciam da média, ou ainda, o 
quão dispersos estão os dados em torno da média. 
Veja estes dois exemplos, de gastos com energia elétrica em duas casas, em reais, ao longo de 6 meses: 
 
Casa 1: 35,25 36,10 36,60 40,85 35,14 37,20 
Casa 2: 33,40 45,10 23,56 35,40 66,30 24,10 
 
Veja bem: a média de gasto com energia na casa 1 é de 36,86 reais, e na casa 2 é de 37,97 reais. Comparando o gasto 
médio, diríamos que o consumo de energia nas duas casas é praticamente igual... mas isso é verdade? 
Observe como o gasto com energia na casa 1 é praticamente constante, os valores são bem próximos, ou seja, ela gasta 
quase a mesma quantidade de energia todo mês. Mas olhe na casa 2: num mês se gasta pouca energia, no outro se gasta 
muita. Os gastos em cada mês nunca são próximos. Daí, podemos dizer que a variabilidade do gasto com energia elétrica 
na casa 2 é maior do que na casa 1, e seria mais fácil prever quanto de pagará na conta de energia do mês seguinte na casa 
1 do que na casa 2! 
Dessa forma, podemos perceber que a média explica e representa bem o que acontece com as contas de luz da casa 1, mas 
não exprime bem o que acontece com as contas de luz da casa 2. 
Então precisaremos de uma medida que nos informe não só a respeito da tendência central dos gastos (média), mas 
também da dispersão ou da variabilidade dos gastos. 
 
A medida usada mais comumente para expressar a variabilidade dos dados é a variância (denotada por S
2
): 
 
 
∑ ( ̅)
 
 
 
 
 
Complicado? Mas vamos traduzir o que esta fórmula está nos dizendo: 
 
1) Calcule a média dos dados (calcule ̅ ) 
2) Subtraia a média de cada um dos dados ( ̅ ). Você estará calculando os desvios de cada dado com relação à média, 
ou seja, a distância de cada dado com relação à média. 
3) Agora eleve ao quadrado os resultados ( ̅)
 . Você estará calculando os quadrados de todos os desvios. 
4) Some este quadrados dos desvios que você calculou (∑ ( ̅)
 
 ) 
5) Divida o resultado desta soma pelo número de dados que você tem. 
 
Veja como fica tudo isso no caso das contas telefônicas: 
Casa 1: 
Mês Gasto Gasto-Média (Gasto-Média)2 
1 35,25 reais -1,61 reais 2,59 reais2 
2 36,10 reais -0,76 reais 0,58 reais2 
3 36,60 reais -0,26 reais 0,07 reais2 
4 40,85 reais 3,99 reais 15,92 reais2 
5 35,14 reais -1,72 reais 2,96 reais2 
6 37,20 reais 0,34 reais 0,12 reais2 
 Soma 1 = 221,14 reais Soma 2 = 22,24 reais2 
 
 ̅ 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Agora, faremos o mesmo para a casa 2: 
Mês Gasto Gasto - Média (Gasto - Média)2 
1 33,40 reais -4,57 reais 20,88 reais2 
2 45,10 reais 7,13 reais 50,84 reais2 
3 23,56 reais -14,41 reais 207,65 reais2 
4 35,40 reais -2,57 reais 6,60 reais2 
5 66,30 reais 28,33 reais 802,59 reais2 
6 24,10 reais -13,87 reais 192,38 reais2 
 Soma 1 = 227,86 reais Soma 2 = 1280,94 reais2 
 
 ̅ 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Repare como a variância mostra que a variabilidade do gasto com energia elétrica na casa 2 é MUITO maior do que na casa 
1, embora em média, os gastos das duas casas sejam bem próximos (diferença de praticamente 1 real somente). 
Mas... reais ao quadrado...? Que quer dizer isso? Seria bem melhor para o entendimento e bem mais útil ter uma medida 
de variabilidade em reais (na mesma unidade de medida dos dados), e não em reais ao quadrado, certo? 
 
Para resolver este problema temos o Desvio-padrão (S). 
 
O que fazemos quando temos um dado em unidades ao quadrado (reais ao quadrado, metros quadrados, litros ao 
quadrado...) e queremos ter uma informação na MESMA UNIDADE DE MEDIDA DOS DADOS QUE ESTAMOS ESTUDANDO 
(reais, metros, litros...)? Basta calcular a raiz quadrada! 
Então, se queremos uma medida de variabilidade na mesma unidade de medida dos dados, basta tirar a raiz quadrada da 
variância. Isto é o desvio-padrão: 
 
 √ 
 
Vamos calcular do desvio-padrão do gasto com energia elétrica nas duas casas: 
Casa 1: S = 2,11 reais 
Casa 2: S = 16,03 reais 
Agora sim temos medidas de variabilidade em reais, ou seja, na mesma unidade de medida dos dados. 
 
Você sentiria mais segurança ao estimar o gasto com energia do mês que vem 
na casa 1 ou na casa 2? 
 
Coeficiente de variação (CV) 
O coeficiente de variação é uma estatística ou medida de dispersão que ajuda a diagnosticar a variabilidade (ou dispersão) 
dos dados, podendo dizer se ela é alta, média, baixa, etc. O coeficiente de variação é calculado de maneira bastante 
simples: 
 
 
 
 ̅
 
 
Observe que o coeficiente de variação não tem unidade de medida. 
A interpretação do valor do coeficiente de variação pode ser feita com base nos valores referenciais a seguir, mas é 
importante verificar, caso a caso, a variabilidade dos dados que você está estudando na literatura. 
 
Se CV < 10%, então a variabilidade dos dados é considerada baixa 
Se 10% CV < 20%, então a variabilidade é considerada média 
Se 20% CV 30%, então a variabilidade é considerada alta 
Se CV > 30%, então a variabilidade dos dados é considerada muito alta 
 
O exemplo das contas de luz: 
 
Casa 1 
 
 
 
 ̅
 = 
 
 
 
 
Portanto, a variabilidade do gasto com energia elétrica na casa 1 é baixa. 
 
Casa 2 
 
 
 
 ̅
 = 
 
 
 
 
Portanto, a variabilidade do gasto com energia elétrica na casa 2 é muito alta. 
 
Os desvios-padrão somente nos permitiam saber que a variabilidade do gasto com energia elétrica na casa 2 é maior do 
que o gasto com energia elétrica na casa 1. Porém, o coeficiente de variação é que permite dizer que a variabilidade do 
gasto com energia elétrica da casa 1 é muito baixa e que a variabilidade do gasto com energia elétrica da casa 2 é muito 
alta. 
 
Na calculadora científica: 
 
A calculadora deve estar da função SD: clique em MODE _ 2 
1) Limpe a memória de sua calculadora: SHIFT _ MODE _ 1_ = 
2) Clique em AC 
3) Coloque os valores (dados) na memória da calculadora: 
Valor1 _ M+ _ valor2 _ M+ _ valor3 _ M+ .... _ valor n _ M+ 
4) Clique em AC 
5) Para calcular a média, faça: SHIFT _ 2 _ 1 _ = 
7) Para calcular o desvio-padrão, faça: SHIFT _ 2 _ 3 _ = 
PS: estes passos valem para as calculadoras CASIO fx-82MS e similares. 
Para as calculadoras diferentes, os passos podem ser diferentes. Procure o manual de sua calculadora para verificar como 
utilizá-la. 
 
Amplitude (R ou H) 
 
A amplitude dos dados é obtida subtraindo-se o valor mínimo da amostra do valor máximo. 
Casa 1: R = 40,85 – 35,14 = 5,71 reais 
Casa 2: R = 66,30 – 23,56 = 42,74 reais

Outros materiais