Buscar

Nota de aula 05 - Medidas de dispersão

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 11 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 11 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 11 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

1 
 
 
 
 
Universidade Federal de Campina Grande 
Centro de Educação e Saúde – CES 
 
Disciplina: Bioestatística 
Prof. Alecxandro Alves Vieira, Dr 
 
 
 
 
Nota de Aula - 05 
 
Medidas de Dispersão 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
OUTUBRO - 2020 
2 
 
MEDIDAS DE DISPERSÃO 
 
 
1. Introdução 
 
Quando realizamos uma análise descritiva de dados quantitativos, além da 
organização e descrição dos dados por meio de tabelas e gráficos, procuramos conhecer 
dois aspectos importantes sobre a distribuição dos dados: 
 
i. Onde a maior parte dos dados se concentra? 
Este aspecto pode ser conhecido a partir das medidas de tendência central (média, moda 
e mediana) que fornecem, de acordo com as suas particularidades, um valor típico em torno 
do qual os dados observados se concentram. Este valor é utilizado para representar a todos. 
 
ii. Os dados estão "próximos" ou "afastados" uns dos outros? 
Embora consiga resumir em um único número, o valor que é “típico” no conjunto de dados. 
as medidas de tendência central não são suficientes para se caracterizar todo o conjunto; 
pelo contrário, a capacidade que lhes são atribuídas de resumir a informação contida nos 
dados depende do modo como estes se concentram ou dispersam em torno delas. 
 
Vejamos um exemplo: Duas linhas de produção fabricam as mesmas peças cujo 
comprimento deve ser de 75 cm. Fazendo medições periódicas de amostras de peças, 
verifica-se, conforme diagrama de pontos abaixo, que as linhas estão produzindo peças com 
médias próximas desse valor. As peças produzidas por ambas as linhas estão adequadas? 
 
 
 
 
 
 
 
 
Embora ambas as linhas produzirem peças com a mesma média de comprimento, está 
evidente que as peças produzidas pela 1a linha de produção são melhores que a 2a linha 
pois a dispersão das medidas em torno da média é menor. Essas ideias são utilizadas no 
controle do processo de produção das indústrias, onde já se espera alguma variação entre 
as unidades produzidas. Porém, essa variação deve estar sob controle1. 
 
Numa indústria farmacêutica, por exemplo, espera-se que os comprimidos de uma 
certa droga sejam produzidos com uma certa variação em sua composição (maior ou menor 
quantidade do princípio ativo), devido à própria maneira como os comprimidos são 
produzidos (máquinas, pessoas, etc.). No entanto, esta variação deve ser pequena, para 
que não sejam produzidos comprimidos inócuos (com pouco do princípio ativo) ou com extra 
dosagem do princípio ativo, o que, em ambos os casos, pode causar sérias complicações à 
saúde do paciente. 
 
1 O chamado Controle Estatístico de Processos é um conjunto de ferramentas estatísticas (gráficos, medidas de centro e 
de variabilidade) bastante usado no Controle da Qualidade Total em uma grande parte das indústrias nacionais e 
internacionais. 
3 
 
Percebe-se, portanto, que dois conjuntos de dados podem ter a mesma medida de 
centro (valor típico), porém com uma dispersão diferente em torno desse valor, e à medida 
que esta dispersão aumenta, menos representativo será o valor típico. 
 
Desse modo, além de uma medida que nos diga qual é o valor “típico” do conjunto de 
dados, precisamos de uma medida do grau de dispersão (variabilidade) dos dados em 
torno do valor típico, normalmente em relação à média, verificando, por conseguinte, seu 
grau de representatividade. 
 
2. Medidas de Dispersão 
 
 
O resumo de um conjunto de dados exclusivamente por uma medida de tendência 
central, esconde toda a informação sobre a variabilidade do conjunto de observações. 
Portanto, para melhor caracterizarmos a distribuição de um conjunto de dados, temos de 
considerar, além das medidas de tendência central, outras medidas que exprimam o grau 
de dispersão ou de variabilidade dos dados. Para tanto, se faz uso das denominadas 
medidas de dispersão. 
As medidas de dispersão são medidas estatísticas que caracterizam o quanto um 
conjunto de dados está disperso em torno de sua tendência central. As medidas de 
dispersão mais importantes, são: amplitude total, variância, desvio-padrão e coeficiente de 
variação. 
 
2.1 Amplitude total 
 
 
A amplitude total é a diferença entre o maior e o menor valor de um conjunto de observações. 
 
 
Embora a amplitude total sozinha não seja uma boa medida de variabilidade, pois depende 
somente de dois valores do conjunto de dados (máximo e mínimo), não captando o que 
ocorre com os outros valores, pode ser usada como uma medida auxiliar na análise da 
dispersão de um conjunto de dados. Vejamos e exemplo a seguir. 
 
Exemplo 01: A Figura a seguir mostra o diagrama de pontos para os conjuntos de dados I 
e II: 
Dados I: {2, 6, 7, 7, 10, 12, 13, 100}, AT1 = 100 – 2 = 98 
Dados II: {2, 6, 10, 20, 35, 50, 80, 100}, AT2 = 100 – 2 = 98 
 
 
 
 
 
 
Conclusão: As variabilidades desses dois conjuntos de dados são claramente diferentes. 
No entanto, apenas usando a amplitude total para medi-las, concluiríamos que os dois 
conjuntos de dados são igualmente dispersos. Isto porque esta medida não leva em conta 
o comportamento dos dados intermediários. 
 
AT = xmáx-xmin 
 
4 
 
2.2 Variância 
 
 
Uma boa medida de dispersão deve considerar todos os valores do conjunto de dados e 
resumir o grau de dispersão desses valores em torno do valor típico. Neste sentido, 
considerando a média como um valor típico de referência, podemos utilizar para medir a 
dispersão dos dados, os desvios de cada observação xi do conjunto de dados em relação 
à sua média X̅, representado por (xi − X̅). Como temos um desvio para cada elemento, 
poderíamos pensar em resumi-los em um desvio típico, a exemplo do que fizemos com a 
média. 
Porém, a soma de todos os desvios em relação a média é igual a zero, isto é: 
∑ (xi − Χ) = 0
n
i=1 . Isto ocorre com qualquer conjunto de dados, pois os desvios negativos 
sempre compensam com os positivos. Por outro lado, os sinais dos desvios não são 
importantes para nossa medida de dispersão, já que estamos interessados na quantidade 
de dispersão e não na direção dela. Uma das maneiras de contornarmos este problema com 
os sinais, é elevar os desvios ao quadrado. Este é o procedimento utilizado pela medida de 
dispersão denominada variância. Vejamos a seguir sua definição. 
 
Sejam x1, x2 , ... , xn os valores assumidos por determinada variável quantitativa X 
em uma amostra de n observações. Neste caso, a variância amostral — indicada por S2 
— é definida como a soma dos quadrados dos desvios dos dados em relação à média, 
dividida pelo total de participantes menos 1. Ou seja: 
 
 
 
 
 
A variância seria nossa medida de variabilidade ideal, se não fosse o fato de que ela está 
expressa em uma unidade diferente da unidade dos dados, pois, ao elevarmos os desvios 
ao quadrado, elevamos também as unidades de medida em que eles estão expressos. Por 
exemplo, se os dados dizem respeito a idade em anos, a variância será dada em “ anos2 ”, 
algo que não faz nenhum sentido. 
 
Para eliminar esse problema, extraímos a raiz quadrada da variância e, finalmente, temos a 
nossa medida de variabilidade, que chamaremos desvio-padrão. 
 
2.3 Desvio padrão 
 
O desvio padrão, indicado por S (ou DP), é igual a raiz quadrada da variância, ou seja: 
 
 
O desvio-padrão, como o nome já diz, representa o desvio típico dos dados em relação à 
média. Em outras palavras, O desvio padrão nos informa a distância média em que os 
valores de determinado conjunto de dados estão em relação à média. 
 
Observação: Como as informações sobre a tendência central dos dados e sua dispersão 
são informações complementares dos dados, normalmente, se expressa a média 
informando o desvio padrão associado, da seguinte maneira: 𝐗 ̅ ± 𝐒 . 
S2 =
(x1 − 𝚾)
2 + (x2 − 𝚾)
2 + ... + (xn − 𝚾)
2
n − 1
=
∑ (xi − 𝚾)
2n
i=1
n − 1
 
S = √S2 
Quando o interesse se 
restringe apenas na 
descrição dos dados (e 
não em fazer inferências), 
alguns autores utilizam n 
em lugar de n-1 no 
denominador. 
5Exemplo 02: Os agentes de fiscalização de certo município realizam, periodicamente, uma 
vistoria nos bares e restaurantes para apurar possíveis irregularidades na venda de seus 
produtos. A seguir, são apresentados dados de uma vistoria sobre os pesos (em gramas) 
de uma amostra de 10 bifes, constantes de um cardápio de um restaurante como “bife de 
200 gramas”. 
170 175 180 185 190 195 200 200 200 205 
 
Como podemos notar, nem todos os “bifes de 200 gramas” pesam realmente 200 gramas. 
Esta variação é natural e é devida ao processo de produção dos bifes. No entanto, esses 
bifes deveriam pesar cerca de 200 gramas e com pouca variação em torno desse valor. 
 
Para ilustrar melhor os cálculos envolvidos na obtenção da média, variância e do desvio 
padrão, construímos a tabela a seguir, onde temos na coluna 2 os 10 valores observados, 
na coluna 3 mostra os desvios de cada um em relação à média e na coluna 3 os quadrados 
dos desvios. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
A variância dos dados será dada por: 
 
Neste caso, o desvio padrão, S, será dado por S = √144 = 12 gramas. 
 
Análise: Os bifes desse restaurante pesam, em média, 190 gramas, com um desvio-padrão 
de 12 gramas, ou seja, 190 ± 12 g. Em outras palavras, os pesos dos “bifes de 200 gramas” 
variam tipicamente entre 178 e 202 gramas. Analisando esses valores, concluímos que esse 
restaurante pode estar lesando a maior parte de seus clientes. Para casos como esse, os 
agentes fiscalizadores podem estabelecer parâmetros (valores) para saber até quanto a 
média pode se desviar do valor correto e o quanto de variação eles podem permitir numa 
amostra para concluir que o processo de produção de bifes não possui problemas. 
 
∑ (xi − Χ) = 0
n
i=1 . 
S2 =
(x1 − 𝚾)
2 + (x2 − 𝚾)
2 + … + (xn − 𝚾)
2
n − 1
=
1300
9
= 144 g2 
 
∑ xi = 1900
n
i=1 → Χ =
1900
10
= 190 g 
6 
 
Observação: O desvio-padrão nos permite distinguir numericamente conjuntos de dados 
de mesmo tamanho, mesma média, mas que são visivelmente diferentes. Vejamos o 
exemplo a seguir. 
 
Exemplo 03: Uma pessoa é encarregada de organizar atividades de lazer para um grupo 
de 6 pessoas e recebe a informação de que a média de idade do grupo é 20 anos. Neste 
caso, apenas a informação da média não é suficiente para planejar as atividades, pois 
podemos ter grupos com média de idade 20 anos e características totalmente diferentes. 
Observemos alguns grupos possíveis: 
 
 
 
Note que a média X̅A = X̅B = X̅C = 20 anos, contudo, as distribuições das idades dos grupos 
são muito diferentes. Com efeito, enquanto no grupo A as idades não apresentam desvios 
em relação à média (SA=0), na distribuição B todos os valores estão próximos de 20 (SB=2,1 
anos) e no grupo C temos uma variabilidade mais acentuada do os demais (SC=24,8 anos). 
 
Importante: Quando os conjuntos de dados a serem comparados possuem médias 
diferentes, a comparação da variabilidade desses conjuntos deve levar em conta essa 
diferença. Por esta e outras razões, definiremos uma quarta medida de variabilidade, o 
coeficiente de variação. 
 
2.4 Coeficiente de variação 
 
Ao analisarmos o grau de dispersão de um conjunto de dados, poderemos nos 
deparar com uma questão do tipo: um desvio-padrão de 10 unidades é pequeno ou grande? 
Vejamos: 
o Se estivermos trabalhando com um conjunto de dados cuja média é 10.000, um 
desvio típico de 10 unidades em torno dessa média significa pouca dispersão; 
o Mas, se a média for igual a 100, um desvio típico de 10 unidades em torno dessa 
média significa muita dispersão. 
 
Assim, antes de responder se um desvio-padrão de 10 unidades é grande ou pequeno, 
devemos avaliar sua magnitude em relação à média: 
 
· No primeiro caso, o desvio-padrão corresponde a 0,1% da média: 
10
1000
= 0,001 ou 0,1% 
· No segundo caso, o desvio-padrão corresponde a 10% da média: 
10
100
= 0,1 ou 10% 
 
Essa razão entre o desvio-padrão e a média é denominada de coeficiente de variação. O 
coeficiente de variação (CV) é uma medida de dispersão relativa, utilizada para medir o grau 
de dispersão dos dados em relação à média (medido em %). É representada por: 
 
 
 
 
CV= 
S
X̅
 × 𝟏𝟎𝟎% 
 
Dados iguais 
(variância zero) 
 
7 
 
Quanto menor for o coeficiente de variação (CV), mais os dados estão concentrados 
em torno da média, pois o desvio padrão é pequeno em relação à média. Como 
consequência teremos uma distribuição mais homogênea e uma média mais representativa. 
 
De uma forma geral, se o CV: 
 
• CV ≤ 15% → baixa dispersão: dados homogêneos 
• 15% < CV < 30% → média dispersão 
• CV ≥ 30% → alta dispersão: dados heterogêneos. 
 
Exemplo 04: Em um exame de colesterol, o nível médio de um grupo “A” de 150 pessoas 
foi de 214 mg/dl e um desvio-padrão de 22 mg/dl. Em um outro grupo “B”, entretanto, nível 
médio de 150 pessoas foi de 201 mg/dl e um desvio-padrão de 31 mg/dl. Em que grupo foi 
maior a dispersão? 
 
Neste caso, temos: CVA =
22
214
× 100% = 10,3% e CVB =
31
201
× 100% = 15,4%. Conclui-se, 
que o grupo B são mais dispersos quanto ao nível de colesterol. 
 
Importante: O coeficiente de variação (CV) é uma medida adimensional, isto é, não 
depende da unidade de medida. Essa característica nos permite usá-lo para comparar a 
variabilidade de conjuntos de dados medidos em unidades diferentes, o que seria impossível 
usando o desvio-padrão. Vejamos a situação exemplo a seguir. 
 
Exemplo 05: Altura (em m) e Peso (em kg) de uma amostra de alunos. 
 
 
 
Como os dados de peso e a altura são medidos em escalas diferentes, só podemos 
comparar o desvio-padrão com através do CV. Neste caso, 
 
 
 
Conclui-se, portanto, que os alunos são, aproximadamente, quatro vezes mais dispersos 
quanto ao peso do que quanto à altura. 
 
 
2.5 Cálculo das medidas de dispersão para dados agrupados em tabelas de 
frequências
 
 
Quando se tem os dados resumidos e organizados por meio de tabelas de 
frequências, para o cálculo das medidas de dispersão deve-se levar em conta as frequências 
absolutas (fi) de cada classe da tabela, assim como é feito no cálculo da média. 
8 
 
Caso 01 (Tabela de frequências pontual) - Se tivermos n observações da variável X, das 
quais f1 são iguais a x1, f2 são iguais a x2, . . ., fk são iguais a xk, então a média e a variância 
serão dadas, respectivamente por: 
 
 
 
 
e 
 
 
Exemplo 06: Consideremos a distribuição de 27 funcionários de uma empresa, tomando 
para variável o número de acidentes de trabalho sofridos. 
 
 
 
 
 
 
 
 
 
Qual o número médio de acidentes e o desvio padrão? Qual o coeficiente de variação? 
Como você avalia a representatividade da média? 
 
1º passo) calcular a média: 
 
 
 
 
2º passo) calcular a variância: 
 
3º passo) calcular o desvio padrão: 
 
Análise: Verifica-se uma variação de 1,2 acidentes em torno da média observada que é de 
2,3 acidentes. Pode-se concluir, portanto, que o número médio de acidentes por empregado 
é de 2,3 ± 1,2 acidentes. 
4º passo) calcular o CV: 
 
Nº de 
acidentes (xi) fi 
0 2 
1 4 
2 10 
3 6 
4 5 
Total (n) 27 
Χ =
x1f1 + x2 f2 + ... + xkfk
f1 + f2 + ... + fk
=
∑ xifi
k
i=1
n
 
Χ =
0x2 + 1x4 + 2x10 + 3x6 + 4x5
2+4+10+6+5
=
62
27
= 𝟐, 𝟑 acidentes por funcionário 
S2 =
(x1 − 𝚾)
2f1 + (x2 − 𝚾)
2f2 + ... + (xk − 𝚾)
2fk
n − 1
=
∑ (xi − 𝚾)
2fi
k
i=1
n − 1
 
S2 =
(0 − 2,3)2x2 + (1 − 2,3)2x4 + (2 − 2,3)2x10 + (3 − 2,3)2x6 + (4 − 2,3)2x5
27 − 1
=
35,6
26
= 1,4 
S = √S2 = √1,4 = 𝟏, 𝟐 acidentes 
CV =
1,2
2,3
× 100% = 52% 
O CV=52% informa que o desvio 
padrão corresponde a 52% da 
média, ou seja, uma alta 
dispersão (dados heterogêneos). 
Neste caso, a média tem baixa 
representatividade. 
 
9 
 
Caso 02 (Tabela de frequências intervalar) - A determinação das medidas de posição e 
de dispersão para uma variável quantitativa, através de uma distribuição de frequências 
intervalar, exige aproximações, já que perde a informação dos valores observados. No caso,da média e da variância, o cálculo é realizado utilizando os pontos médios (PMi) como 
representantes das observações pertencentes aos respectivos intervalos. Assim, teremos: 
 
e 
 
Exemplo 7: A tabela abaixo mostra a distribuição de frequências das alturas de 40 
moradores de uma localidade. Qual a altura média dos moradores, o desvio padrão e o 
coeficiente de variação? 
 Média: 
 
Ou seja, a média das alturas, nessa amostra, é de 
173 cm. 
 
Variância: 
 
Desvio padrão: 
 
 
Análise: Verifica-se uma variação de 9,6 cm em torno da altura média observada que é de 
173 cm. Pode-se concluir, portanto, que a altura média dos moradores é de 173 ± 9,6 cm. 
CV: 
 
 
 
Altura (cm) PMi fi fr (%) 
151 |⎯ 159 155 2 5,0% 
159 |⎯ 167 163 9 22,5% 
167 |⎯ 175 171 14 35,0% 
175 |⎯ 183 179 8 20,0% 
183 |⎯ 191 187 6 15,0% 
191 |⎯ 199 195 1 2,5% 
 Total (n) --- 40 100% 
Χ =
PM1f1 + PM2 f2 + ... + PMkfk
f1 + f2 + ... + fk
=
∑ PMifi
k
i=1
n
 
S2 =
(PM1 − 𝚾)
2f1 + (PM2 − 𝚾)
2f2 + ... + (PMk − 𝚾)
2fk
n − 1
=
∑ (xi − 𝚾)
2fi
k
i=1
n − 1
 
S2=
 (155 - 173)2 .2 + (163 - 173)2.9+ (171 - 173)2.14+ (179 - 173)2.8+ (187- 173)2.6+ (195 - 173)2.1
40-1
 
 
S2=
3552
39
=91 cm 
Χ=
155x2 + 163x9+171x14+179x8+187x6+195x1
2+9+14+8+6+1
 
 
Χ=
6920
40
=173 cm 
CV =
9,6
173
× 100% = 6% 
O CV=6% informa que o desvio 
padrão corresponde a 6% da 
média, correspondendo a uma 
baixa dispersão (dados 
homogêneos). Neste caso, a 
média é representativa. 
 
S = √91 = 𝟗, 𝟔 cm 
10 
 
3. Coeficiente de assimetria 
 
Para verificar o tipo e o grau da assimetria da distribuição utiliza-se a medida estatística 
adimensional, baseada na média, na mediana e desvio padrão. denominada de Coeficiente 
de Assimetria de Pearson, definido como: 
𝐀𝐬 =
𝟑. (𝐗 ̅ − 𝐌𝐝)
𝐒
 
Uma distribuição de frequências é considerada simétrica se o valor de As estiver próximo 
de zero. Valores negativos de As indicam assimetria com cauda à esquerda, e positivos, 
assimetria com cauda à direita. Se 0,15 < |As| < 1, a assimetria é considerada moderada; 
se |As|>1, a assimetria é considerada forte (distribuição significativamente assimétrica). 
 
 
 
 
 
Exemplo 8: Uma distribuição de frequência apresenta as seguintes medidas: �̅� = 48,1, Md 
= 47,9 e s = 2, 12. Calcule o coeficiente de assimetria e classifique o tipo de assimetria. 
Resposta: As=0,28, assimetria moderada à direita. 
 
Exercício: Dada a seguinte tabela de distribuição de frequências da variável X = Quantidade 
de creatinina na urina em mg/ml de 36 pacientes de uma clínica X. 
Faixa 
de creatinina 
Ponto 
médio (PMi) 
Nº de 
pacientes (fi) 
Freq. Rel. 
(fi) % 
Freq. Abs. 
Acum. (Fi) 
1,08 ├ 1,36 10 28% 
1,36 ├ 1,64 12 33% 
1,64 ├ 1,92 8 22% 
1,92 ├ 2,20 5 14% 
2,20 ├ 2,48 1 3% 
Total (n) ---- 36 100% ---- 
 
a) Qual a média, a variância, o desvio padrão e o coeficiente de variação das 
quantidades de creatinina? O que se pode dizer sobre a dispersão dos dados? 
b) Com base nos valores das medidas obtidos no item a), classifique o tipo de assimetria 
e calcule o coeficiente de assimetria. 
Sugestão de exercícios para aprendizagem acerca das medidas de dispersão: Livro 
Estatística Fácil (capítulo 07, página 115) e Livro Introdução à Bioestatística (capítulo 05, 
páginas 104 e 105): Questões: 5.6.3; 5.6.4; 5.6.5; 5.6.7; 5.6.12. 
simétrica Assimétrica à direita Assimétrica à esquerda 
https://drive.google.com/file/d/1mRF-ubpzLyNogeH9YCrMCMViwBsUkuvc/view?usp=sharing
https://drive.google.com/file/d/1c7JQ9UHMh5oTVa0OAVZ6whxsG_Q8SHZ3/view?usp=sharing
11 
 
4. Curiosidade 
 
Faixas de referência (Intervalos simétricos em torno da média) 
 
Quando a distribuição dos dados é simétrica, existe uma regra que nos permite determinar 
a frequência de dados contidos em certos intervalos construídos a partir do conhecimento 
da média e do desvio-padrão. Os intervalos mais comuns são aqueles simétricos em torno 
da média e que se afastam dela por um, dois ou três desvios-padrão, para a direita e para 
a esquerda. A regra para dados de distribuição simétrica nos fornece as seguintes faixas de 
referência: 
• [X̅ − S; X̅ + S] com 68,3% das observações; 
• [X̅ − 2S; X̅ + 2S] com 95,4% das observações; 
• [X̅ − 3S; X̅ + 3S] com 99,7% das observações. 
 
Veja a seguir a representação da distribuição de frequências simétrica (Curva Normal) e 
seus intervalos de referência, adotando-se por µ o valor da média da distribuição e por σ 
seu desvio padrão 
 
Exemplo: Numa certa população, os recém-nascidos de gravidez considerada normal têm peso médio de 
3000g e um desvio-padrão de 250g, sendo a distribuição dos pesos simétrica em torno dessa média. Assim, 
podemos concluir que 68,3% dos recém-nascidos pesam entre 2750g e 3250g, 95,4% deles pesam de 2500g 
a 3500g e 99,7% desses bebês pesam de 2250g a 3750g. 
 
Tais intervalos podem servir como faixas de referência para o peso de bebês nascidos de gravidez normal. 
Uma faixa de referência para uma determinada característica é um intervalo de valores considerados típicos 
para certa porcentagem da população considerada “sadia”. O intervalo de 2500g a 3500g pode ser visto como 
uma faixa de referência de 95,4% para o peso de bebês vindos de gravidez normal, pois 95,4% desses bebês 
nascem com pesos nesse intervalo. Se um bebê tem peso fora desse intervalo, pode ser considerado extremo 
por essa regra e merecer uma atenção especial. 
 
Exames clínicos 
Outros exemplos de faixas de referência podem ser encontrados em resultados de exames clínicos, onde é 
apresentada, juntamente com o resultado do indivíduo, a faixa de referência (ou normalidade) para a 
característica em exame. Um indivíduo com resultado fora da faixa de referência deve ser investigado.

Continue navegando