Buscar

S5 Medidas de dispersão e variabilidade-2

Prévia do material em texto

Podemos também calcular a variância quando temos uma tabela de dis-
tribuição de frequências. Nesse caso, precisamos multiplicar cada uma das 
distâncias pelo número de vezes que se repete.
Com base na Tabela 1, em que temos as notas de 30 alunos do curso de 
Bioestatística. Qual seria a variância para esses dados?
Primeiramente, calculamos a média:
x = 
∑ ƒ · x
∑ ƒ
=
246
30
= 8,2
Nota F Fr f.x
7 8 26,7 (7 – 8,2)2 · 8 = 11,52
8 12 40 (8 – 8,2)2 · 12 = 0,48
9 6 20 (9 – 8,2)2 · 6 = 3,84
10 4 13,3 (10 – 8,2)2 · 4 = 12,96
30 100 28,8
Tabela 1. Notas de 30 alunos do curso de Bioestatística.
2 =
∑ ( ― )2 ∙
― 1
=
28,8
29
= 0,9931
Desvio padrão
Como você pode observar, a variância calcula a soma dos quadrados das 
distâncias em relação à média. Como elevamos todos os termos ao quadrado, 
a nossa unidade de medida também fica alterada. Se estivermos calculando a 
variância da altura de atletas do vôlei, por exemplo, a unidade de medida está 
em cm e, como o cálculo da variância de todos os elementos está elevada ao 
quadrado, então a unidade de medida passa a estar em cm2.
Não podemos comparar a variância diretamente com a média ou com 
outras medidas, pois precisamos tirar a raiz da variância, e isso chamamos 
desvio padrão.
Medidas de dispersão e variabilidade4
Sendo assim, o desvio padrão é a raiz quadrada da variância. A fórmula para 
calcularmos o desvio padrão de uma amostra com dados em rol é a seguinte:
s =√∑ (xi – x)2
n – 1
Onde:
s = desvio padrão amostral
xi = cada um dos i elementos da amostra
x = média da amostra
n = número de elementos da amostra
Levando em consideração as 4 notas de avaliações realizadas no semestre 
(7,0; 8,0; 6,0; 9,0), o desvio padrão é dado por:
A média para esses dados é igual a x = 7,5.
Então, o cálculo do desvio padrão para esses dados fica:
s = √ √√∑ (xi – x)2
n – 1
=
(7,0 – 7,5)2 + (8,0 – 7,5)2 + (6,0 – 7,5)2 + (9,0 – 7,5)2
4 – 1 = 5
3
= √0,67 = 1,29
A variabilidade da nota dos alunos em torno da média é de 1,29.
Assim como a variância, podemos também calcular o desvio padrão quando 
temos uma tabela de distribuição de frequências. Continuamos a fazer o 
somatório das distâncias quadradas de acordo com a frequência de cada um 
dos resultados da variável.
Com base nos dados da Tabela 1, em que constam as notas de 30 alunos do 
curso de Bioestatística. Qual seria o desvio padrão para esses dados?
Sabemos que a média previamente calculada é igual a x = 8,2.
=
∑ ( ― )2 ∙
― 1
=
28,8
29
= 0,9931 = 0,9965
5Medidas de dispersão e variabilidade
No link ou código a seguir, você terá acesso a um vídeo que 
lhe ensinará a fazer os cálculos das medidas de tendência 
central e as medidas de variabilidade. 
https://goo.gl/TR3JcK
Coeficiente de variação
Quando quisermos comparar a variabilidade de duas ou mais amostras ou po-
pulações, podemos fazer essa comparação apenas com o uso do desvio padrão, 
caso as diferentes amostras sejam da mesma variável e tenham médias iguais.
Se estivermos comparando variáveis diferentes de um mesmo indivíduo, 
como, por exemplo, peso e altura de gestantes em uma amostra de 30 pessoas, 
e quisermos verificar se a menor variabilidade é para o peso ou para a altura, 
não podemos considerar apenas o desvio padrão, pois ele seguirá a escala de 
medida e a grandeza de cada uma das variáveis estudadas. Para essa verifi-
cação, precisamos fazer uso do coeficiente de variação, que divide o desvio 
padrão pela média e multiplica por 100 para transformarmos em percentual.
Além de utilizarmos o coeficiente de variação quando temos variáveis 
com unidade de medidas diferentes, também faremos uso dessa medida de 
variabilidade quando tivermos médias diferentes, mesmo que sendo a mesma 
variável, como verificar o aumento de peso de crianças em dois estados di-
ferentes, cujas médias provavelmente não serão iguais. Então, para verificar 
a variabilidade dessas duas realidades, precisamos calcular o coeficiente de 
variação.
CV = ∙ 100
s
x 
Onde:
CV = coeficiente de variação
s = desvio padrão amostral
x = média amostral
Medidas de dispersão e variabilidade6
De acordo com as 4 notas das avaliações realizadas no semestre (7; 8; 
6; 9), já calculamos a média x = 7,5 e s = 1,29. O cálculo do coeficiente de 
variação seria:
CV = 
s
x · 100 = 
1,29
7,5
· 100 = 17,2%
Também podemos calcular o coeficiente de variação para os dados da tabela 1, 
que já calculamos previamente a média x = 8,2 e s = 0,9965. 
CV =
s
x · 100 =
0,9965
8,2
· 100 = 12,15%
Utilizando o coeficiente de variação, sempre que quisermos descobrir qual grupo 
de dados é mais homogêneo, ou seja, o que possui a menor variabilidade em torno 
da média, devemos optar pelo grupo de dados que tiver o menor percentual do 
coeficiente de variação.
Caso o coeficiente de variação seja muito elevado, a média não será a melhor medida 
para representarmos os dados devido à alta variabilidade em torno dela.
Amplitude interquartílica
Essa medida é útil quando temos uma distribuição assimétrica. Os quartis 
são valores que dividem uma amostra de dados ordenados em quatro partes. 
As quatro partes são iguais a 25%. No primeiro quartil, denominado de 
Q1, temos 25% dos valores menores ou iguais a ele. No segundo quartil, deno-
minado mediana, temos 50% dos valores menores ou iguais a ele. No terceiro 
quartil, denominado de Q3, temos 75% dos valores menores ou iguais a ele.
A amplitude ou desvio interquartílico é dada pela diferença entre o primeiro 
e o terceiro quartil (Q1 – Q3).
7Medidas de dispersão e variabilidade

Continue navegando