Buscar

medidas de dispersao e variabilidade

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 12 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 12 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 12 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

BIOESTATÍSTICA
Juliane Silveira Freire da Silva
Medidas de dispersão e variabilidade
Objetivos de aprendizagem
Ao final deste texto, você deve apresentar os seguintes aprendizados:
· Definir as medidas de dispersão e variabilidade.
· Diferenciar as medidas de amplitude de variação, variância, desvio padrão, coeficiente de variação e amplitude entre quartis.
· Analisar as medidas de dispersão e variabilidade.
Introdução
Neste capítulo, você vai estudar as medidas de dispersão e variabilidade de um conjunto de dados, as quais acompanham as medidas de tendência central, representando e descrevendo o conjunto de dados. Com as medidas de dispersão e variabilidade, é possível entender a homogeneidade ou a heterogeneidade dos dados.
O que são medidas de variabilidade?
As medidas de variabilidade são analisadas em conjunto com as medidas de tendência central. Com as medidas de variabilidade, podemos verificar como os dados estão se comportando em torno da média, da moda e da mediana.
Mesmo que dois conjuntos de dados tenham a mesma média, eles podem não ter o mesmo comportamento e a mesma variabilidade (Figura 1).
Figura 1. 
Exemplo de diferentes distribuições, sendo 3 com médias iguais e 
variabilidades diferentes.
Fonte:
 Professor Guru (2017).
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
5
-5
 -4 -3 -2 -1 0 1 2 3 4 
μ = 0. σ
2
 = 0,2
μ = 0. σ
2
 = 1,0
μ = 0. σ
2
 = 5,0
μ = 0. σ
2
 = 0,5
Não podemos interpretar as medidas de tendência central isoladamente. Para verificar 
se as medidas de variabilidade representam bem os dados, precisamos calcular e 
analisar as medidas de variabilidade.
Diferenciação das medidas
Amplitude
A amplitude necessita do valor máximo e do valor mínimo do conjunto de dados, medindo, assim, a distância entre o maior e o menor valor. A amplitude só leva em consideração os extremos, não chega a comparar os valores da distribuição com a média desses dados.
a = valor máximo – valor mínimo = xmax – xmin
Variância
Diferente da amplitude, a variância leva em consideração todos os valores da distribuição e compara cada um deles com a média.
A variância mede a distância de cada um dos valores em relação à média. Por uma questão matemática, precisamos elevar ao quadrado cada uma dessas distâncias para podermos eliminar o sinal. Depois disso, fazemos a média dos quadrados dessas diferenças. A fórmula para calcularmos a variância de uma amostra com dados em rol é a seguinte:
∑ x
x = n
Sendo:
s2 = variância amostral
xi = cada um dos i elementos da amostra
x = média da amostra
n = número de elementos da amostra
Caso a variância esteja sendo calculada para os dados de uma população, representaremos esse valor pela letra grega sigma ao quadrado σ2. Em vez de dividirmos por n-1, dividimos o somatório por N, sendo que n é o número de elementos da amostra e N é o número de elementos da população.
Supondo que há 4 notas de avaliações realizadas no semestre (7; 8; 6; 9). 
Nessa situação, a variância é dada por:
Primeiramente, precisamos calcular a média:
∑ xi =	7 + 8 + 6 + 4	9 = 304 7,5 x =	n
Então, o cálculo da variância para esses dados fica:
S2 = ∑ (nx-1i-x)2 = (7 - 7,5)2 + (8-7,5)24 + (6 - 7,5) - 1	2 + (9 - 7,5)2 = 54 = 1,25 Podemos também calcular a variância quando temos uma tabela de distribuição de frequências. Nesse caso, precisamos multiplicar cada uma das distâncias pelo número de vezes que se repete.
Com base na Tabela 1, em que temos as notas de 30 alunos do curso de Bioestatística. Qual seria a variância para esses dados?
Primeiramente, calculamos a média:
Nota
F
Fr
f.x
7
8
26
,
7
(7-8,2)
2
 . 8 = 11,52
8
12
40
(8-8,2)
2
 . 12 = 0,48
9
6
20
(9-8,2)
2
 . 6 = 3,84
10
4
13
,
3
(10-8,2)
2
 . 4 = 12,96
30
100
28
,
8
Tabela 1. 
Notas de 30 alunos do curso de Bioestatística.
s2 = ∑ (xi-x)2 = 2829,8 = 0,9931 n-1
Desvio padrão
Como você pode observar, a variância calcula a soma dos quadrados das distâncias em relação à média. Como elevamos todos os termos ao quadrado, a nossa unidade de medida também fica alterada. Se estivermos calculando a variância da altura de atletas do vôlei, por exemplo, a unidade de medida está em cm e, como o cálculo da variância de todos os elementos está elevada ao quadrado, então a unidade de medida passa a estar em cm2.
Não podemos comparar a variância diretamente com a média ou com outras medidas, pois precisamos tirar a raiz da variância, e isso chamamos desvio padrão.
Sendo assim, o desvio padrão é a raiz quadrada da variância. A fórmula para calcularmos o desvio padrão de uma amostra com dados em rol é a seguinte:
s =√ ∑ (nx - 1i - x)2
Onde:
s = desvio padrão amostral xi = cada um dos i elementos da amostra
x = média da amostra
n = número de elementos da amostra
Levando em consideração as 4 notas de avaliações realizadas no semestre (7,0; 8,0; 6,0; 9,0), o desvio padrão é dado por:
A média para esses dados é igual a x = 7,5. Então, o cálculo do desvio padrão para esses dados fica:
s 	 + (8,0 - 7,5) + (6,0 - 7,5)2 + (9,0 - 7,5)=
√
√
√
∑ (
x
i
-
x
)
2
n 
-1
=
(70 -
5)
 7,
2
2
2
4
-1
 
=
5
4
 √1,25 = 1,
=
12
A variabilidade da nota dos alunos em torno da média é de 1,12.
Assim como a variância, podemos também calcular o desvio padrão quando temos uma tabela de distribuição de frequências. Continuamos a fazer o somatório das distâncias quadradas de acordo com a frequência de cada um dos resultados da variável.
Com base nos dados da Tabela 1, em que constam as notas de 30 alunos do curso de Bioestatística. Qual seria o desvio padrão para esses dados?
Sabemos que a média previamente calculada é igual a x = 8,2.
s 
Coeficiente de variação
Quando quisermos comparar a variabilidade de duas ou mais amostras ou populações, podemos fazer essa comparação apenas com o uso do desvio padrão, caso as diferentes amostras sejam da mesma variável e tenham médias iguais.
Se estivermos comparando variáveis diferentes de um mesmo indivíduo, como, por exemplo, peso e altura de gestantes em uma amostra de 30 pessoas, e quisermos verificar se a menor variabilidade é para o peso ou para a altura, não podemos considerar apenas o desvio padrão, pois ele seguirá a escala de medida e a grandeza de cada uma das variáveis estudadas. Para essa verificação, precisamos fazer uso do coeficiente de variação, que divide o desvio padrão pela média e multiplica por 100 para transformarmos em percentual.
Além de utilizarmos o coeficiente de variação quando temos variáveis com unidade de medidas diferentes, também faremos uso dessa medida de variabilidade quando tivermos médias diferentes, mesmo que sendo a mesma variável, como verificar o aumento de peso de crianças em dois estados diferentes, cujas médias provavelmente não serão iguais. Então, para verificar a variabilidade dessas duas realidades, precisamos calcular o coeficiente de variação.
CV = sx ∙ 100
Onde:
CV = coeficiente de variação s = desvio padrão amostral
x = média amostral
De acordo com as 4 notas das avaliações realizadas no semestre (7; 8; 6; 9), já calculamos a média x = 7,5 e s = 1,12. O cálculo do coeficiente de variação seria:
CV = sx · 100 = 17,12,5 · 100 = 14,93%
Também podemos calcular o coeficiente de variação para os dados da tabela 1, que já calculamos previamente a média x = 8,2 e s = 0,9965. 
	CV = sx · 100 = 0,99658,2	· 100 = 12,15%
Utilizando o coeficiente de variação, sempre que quisermos descobrir qual grupo de dados é mais homogêneo, ou seja, o que possui a menor variabilidade em torno da média, devemos optar pelo grupo de dados que tiver o menor percentual do coeficiente de variação.
Caso o coeficiente de variação seja muito elevado, a média não será a melhor medida para representarmos os dados devido à alta variabilidade em torno dela.
Amplitude interquartílica
Essa medida é útil quando temos uma distribuição assimétrica. Os quartis são valores que dividem uma amostra de dados ordenados em quatro partes. 
As quatro partes são iguais a 25%. No primeiro quartil, denominado de Q1, temos 25% dos valores menores ou iguais a ele. Nosegundo quartil, denominado mediana, temos 50% dos valores menores ou iguais a ele. No terceiro quartil, denominado de Q3, temos 75% dos valores menores ou iguais a ele.
A amplitude ou desvio interquartílico é dada pela diferença entre o primeiro e o terceiro quartil (Q1 – Q3).
Maternidade Bahia:
CV
 =
S
x
. 100 =
0
,
15
2
,
55
. 100 = 5,88
%
Maternidade Santa Catarina:
CV
 =
S
x
. 100 =
0
,
16
3
,
55
. 100 = 4,51
%
A maternidade que possui os pesos de recém-nascidos mais homogêneos é a 
maternidade de Santa Catarina, pois possui o menor coeficiente de variação.
Observe que os dados poderiam enganar, pois, se olhássemos apenas para o desvio 
padrão, teríamos tirado a conclusão errada. 
Referência
PROFESSOR GURU. Distribuição normal: modelos contínuos de distribuição de probabilidades. 2017. Disponível em: <http://professorguru.com.br/estatistica/distribuicoes-de- probabilidade/distribuicao-normal-de-probabilidades.html>. Acesso em: 26 out. 2017.
Leituras recomendadas
CALLEGARI-JACQUES, S. M. Bioestatística: princípios e aplicações. Porto Alegre: Artmed, 2007.
FLETCHER, R. H.; FLETCHER, S. W.; FLETCHER, G. S. Epidemiologia clínica: elementos essenciais. 5. ed. Porto Alegre: Artmed, 2014.
GLANTZ, S. A. Princípios de bioestatística. 7. ed. Porto Alegre: AMGH, 2014.
JEKEL, J. F.; KATZ, D. L.; ELMORE, J. G. Epidemiologia, bioestatística e medicina preventiva. 2. ed. Porto Alegre: Artmed, 2005. 
Medidas de dispersão e variabilidade
126
127
Medidas de dispersão e variabilidade

Outros materiais