Buscar

Levine Cap 3 Pag 84-101

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 18 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 18 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 18 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

MEDIDAS NUMÉRICAS DESCRITIVAS 85 
UTILIZANDO A ESTATÍSTICA@ Choice ls Yours (A Escolha É Sua) Parte li 
As tabelas e os gráficos que você preparou para a amosu-a de 838 fundos mútuos 
demonstraram ser úteis para os cJ ientes do serviço Choice Is Yours. No entanto, os 
clientes podem ter se sentido frustrados ao tentar avaliar o desempenho de fundos 
mútuos. Embora saibam como estão distribuídas as 838 taxas de retorno de três 
anos. eles não têm nenhuma idéia sobre qual seria uma taxa de retorno típica de 
três anos para uma determinada categoria de fu ndo mútuo, como, por exemplo, 
fundos de baixo risco, nem tampouco sabem como esse valor típico se compara 
aos valores típicos de ouu-as categorias. Eles também não têm nenhuma idéia sobre 
a extensão da variabilidade na taxa de retorno de três anos. Todos os valores são 
relativamente similares. ou estão incluídos valores muito baixos e valores muito 
elevados? Existe uma grande quantidade de valores baixos e apenas alguns poucos 
valores elevados. ou vice-versa, ou existe um número semelhante de valores baixos 
e valores elevados? 
De que modo você poderia ajudar os clientes a obterem respostas para essas 
perguntas, de tal modo que eles possam melhor avaliar os fundos mútuos? 
Os clientes no cenário Utilizando a Estatística estão fazendo perguntas relacionadas a variáveis numéricas. Ao resumir e descrever variáveis numéricas, você precisa se preparar no sentido 
de fazer mais do que simplesmente elaborar as tabelas e os gráficos discutidos no Capítulo 2. Você 
precisa considerar a tendência central. a variação e o formato de cada variável numérica. 
TENDÊNCIA CENTRAL 
Tendência central corresponde à extensão na qual todos os valores de dados se agrupam em torno de um 
valor central típico. 
VARIAÇÃO 
Variação corresponde ao montante de dispersão, ou spread. de valores em relação a um valor central. 
FORMATO 
Formato corresponde ao padrão da distribuição de valores do valor mais baixo para o mais alto. 
Este capítulo discorre sobre as maneiras pelas quais você pode mensurar a tendência central, a 
variação e o formato de uma variável. Você aprenderá, também, sobre a covariãncia e o coeficiente 
de correlação. os quais ajudam a mensurar a força da associação entre duas variáveis numéricag. O 
uso dessas medidas dará aos clientes dos serviços Choice Is Yours as respostas que eles buscam. 
3.1 MEDIDAS DE TENDÊNCIA CENTRAl 
A maior parte dos conjuntos de dados mostra uma tendência distinta para um grupo em tomo de um 
ponto central. Quando as pessoas conversam sobre um "valor médio" ou "valor do meio" ou "valor 
mais freqüente", elas estão falando informalmente sobre a média aritmética, a mediana e a moda 
- três medidas de tendência central. 
A Média Aritmética 
A média aritmética (geralmente conhecida como média) é a medida de tendência central mais 
comum. A méclia aritmética é a única medida comum na qual todos os valores desempenham igual 
papel. A méclia aritmética serve como um "ponto de equilíbrio" em um conjunto de dados (como 
o ponto de apoio de uma gangorra). Você calcula a média aritmética por meio da soma de todos os 
valores numéricos observados para uma variável em um conjunto de dados, seguida pela cli\'isão 
desse total pelo número de valores no conjunto de dados. 
O símbolo X, conhecido como X-barra, é utilizado para representar a média arirrnética de u.ra:a 
amostra. Para uma amostra contendo n valores. a equação para a média aritmética de .:ma~ 
é escrita sob a forma 
3 .1 
Medidas Numéricas Descri til as 
UTILIZANDO A ESTATÍSTICA @ Choice Is Yours (A Escolha É Sua) Parte 11 
MEDIDAS DE TENDÊNCIA CENTRAL 
A Média Aritmética 
A Mediana 
A Moda 
Quartis 
A Média Geométrica 
3.4 ANALISE EXPLORATÓRIA DE DADOS 
O Resumo de Cinco Números 
O Box-Plot 
3.5 A COVARIANCIA E O COEFICIENTE DE 
CORRELAÇÃO 
3.2 VARIAÇÃO E FORMATO 
A Amplitude 
A Covariância 
O Coeficiente de Correlação 
3.3 
A Amplitude lnterquartil 
A Variãncia e o Desvio-Padrão 
O Coeficiente de Variação 
Escores Z 
Formaro 
Explorações Visuais: Explorando a Estatística 
Descritiva 
Resultados da Estatística Descritiva do Microsoft Excel 
MEDIDAS NUMÉRICAS DESCRITIVAS PARA 
UMA POPULAÇÃO 
A Média Aritmética da População 
A Variância da População e o Desvio-Padrão da 
Popu lação 
A Regra Empírica 
A Regra de Chebyshev 
3.6 ARMADILHAS EM MEDIDAS DESCRITIVAS 
NUMÉRICAS E QUESTÕES ÉTICAS 
Questões Éticas 
SUPLEMENTO DO EXCEL PARA O CAPÍTULO 3 
E3.1 Calculando Medidas de Tendência Central, 
Variação e Formato 
E3.2 Criando Diagramas de Escala de Pontos 
E3.3 Calculando Medidas para uma População 
E3.4 Criando Box-Piots 
E3.5 Calculando a Covariãncia 
E3.6 Calculando o Coeficiente de Correlação 
=- OBJETIVOS DO:AI?R.ENDIZADO 
• ' L 
Este capítulo ajudará você a aprender: 
A descrever as propriedades de tendência central, variação e formato, em dados numéricos 
A calcular medidas descritivas resumidas para uma população 
A construir e interpretar um box-pJot 
A descrever a covariância e o coeficiente de correlação 
86 CAP(TULO TRÊS 
Soma dos valores x = -------------
Número de valores 
Utilizando a série X1, X2, ••• ,X, para representar 9 conjunto de n valores e n para representar a quan-
tidade de valores, a equação passa a ser 
- X 1 +X2 + ··· +X X = 11 
/1. 
Ao utilizar a notação de somatório (discuüdaexaustivamentenoApêndice B), você substitui o nume-
11 
rador X1 + X2 + ... +X" pelo termo I, X;, que significa o somatório de todos os valores X;, desde 
i=l 
o primeiro valor de X, X1, até o último valor de X, X11, para fonnar a Equação (3.1), uma definição 
formal da média aritmética da amostra. 
MÉDIA ARITMÉTICA DA AMOSTRA 
A média aritmética da amostra corresponde à soma dos valores, djvidida pelo número de valores. 
em que 
11 
11 
I,x; 
X = i=L 
n 
X = média aritmética da amostra 
n = número de valores ou tamanho da amostra 
X; = i-ésimo valor da variável X 
I, X; = somatório de todos os valores X; na amosh·a 
i=l 
(3.1) 
Como todos os valores desempenham igual papel, uma média aritmética é f01temente afetada por 
qualquer valor que seja extremamente diferente dos outros no conjunto de dados. Ao se deparar com 
tais valores extremos, você deve evitar o uso da média aritmética. 
A média aritmética pode sugerir um valor típico, ou central, para um determinado conjunto de 
dados. Por exemplo, se você conhecesse o tempo típico necessário para se aprontar na parte da 
manhã, você seria capaz de planejar melhor a sua manhã e minimizar atrasos excessivos (ou chegadas 
com demasiada antecedência) em seu destino. Suponha que você defina o tempo necessário para se 
aprontar como o tempo (arredondado para o minuto mais próximo) desde o momento em que você 
levanta da cama até sair de casa. Você coleta os tempos mostrados a seguir, para 10 dias de trabalho 
consecutivos (armazenados no arquivo de dados tempns:xls,): 
Dia: 1 
Tempo (minutos): 39 
2 
29 
3 
43 
4 
52 
5 
39 
6 
44 
7 
40 
8 
31 
A média aritmética do tempo é 39,6 minutos, calculada do seguinte modo: 
X= Soma dos valores 
Número de valores 
11 
I,x; 
X =i=)_ 
n 
39 + 29 + 43 + 52 + 39 + 44 + 40 + 31 + 44 + 35 
X =---------------------------------
10 
x =396 = 39 6 
10 ' 
9 
44 
10 
35 
<iAnnotate iPad User>
Pencil
MEDIDAS NUMÉRICAS DESCRITIVAS 87 
Embora nenhum dia na amostra tenha efetivamente apresentado o valorconespondente a 39,6 minutos, 
calcular aproximadamente 40 minutos para ficar pronto seria uma boa regra para planejar suas manhãs. 
A média ari tmética é uma boa medida de tendência centxal nesse caso, uma vez que o conjunto de 
dados não contém quaisquer valores excepcionalmente pequenos ou grandes. 
Considere um caso em que o valor no Dia 4 cotTesponda a 102 minutos, em vez de 52 minutos. 
Esse valor extremo faz com que a média aritmética suba para 44,6 minutos, como se segue: 
X 
Soma dos valores 
Número de valores 
11 
L, x; 
X=l=.L__ 
n 
X =
446 
= 446 
10 ' 
O único valor extremo fez crescer a média aritméticaem mais de 10%, de 39,6 para 44,6 minutos. 
Em contraposição à média aritmética original, que estava no "meio" (ou seja, maior do que 5 dos 
tempos para ficar pronto e menor do que os outros 5 tempos), a nova média aritmética é maior do 
que 9 entre os 1 O tempos para ficar pronto. Em decorrência do valor extremo, a média aritmética é, 
agora, uma medida precária de tendência central. 
IJ:Jj{,liiJiaWI. A MÉDIA ARITMÉTICA DO RETORNO ANUAL DE TRÊS ANOS DE FUNDOS MÚTUOS DE 
BAIXO CAPITAL, COM OBJETIVO DE CRESCIMENTO E COM BAIXO RISCO 
Os 838 fundos mútuos (.tuna:uSM!ltu~s) que fazem parte do cenário Utilizando a Estatística (veja o início 
do capítulo) estão classificados de acordo com a categoria (baixo capital, médio capital e g rande volume de 
capital); com o tipo (de crescimento ou de valorização); e com o nível de risco dos fu ndos mtítuos (baixo. médio 
e al to). Você está particularmente interessado em pequenas empresas com um grande potencial de crescimento. 
Além disso, você deseja investigar somente aqueles fundos com baixo risco. Assim, você classifica os dados 
sobre fundos múntos e aloca esses fundos que estão classificados como especializados em empresas com baixo 
volume de capital, de crescimento e que são consideradas de baixo risco. As sete empresas a seguir atendem a 
todos esses critérios: 
Retorno de 
Fundo Categoria Objetivo Risco Três Anos 
Baron Growth Baixo Capital Crescimento Baixo 20,8 
Columbia Acorn Z Baixo Capital Crescimento Baixo 26.0 
FBR Small Cap Baixo Capital Crescimento Baixo 24.9 
Perritt Micro Cap Opportunities Baixo Capital Crescimento Baixo 29,9 
Schroder Capital US Opportun.ities In v Baixo Capital Crescimento Baixo 22,3 
Value Line Emerging Opportunities Baixo Capital Crescimento Baixo 19.0 
Wells Fargo Advtg Small Cap Opp Adm Baixo Capital Crescimento Baixo 22,4 
Calcule a média aritmética do retorno anual de três anos, de fundos mútuos de baixo capital, com objetivo de 
c rescimento e baixo risco. 
SOLUÇÃO A média aritmética do retorno anual de três anos de fu ndos mútuos de baixo capi tal, com objetivo 
de crescimento e baixo risco é igual a 23,61 , calculada do seguinte modo: 
Soma dos valores 
Número de valores 
= 165•3 = 23 6143 
7 ' 
88 CAPiTULO TRÊS 
A disposição ordenada para os sete fundos de crescimento para empresas com baixo capital é: 
19.0 20,8 22,3 22.4 24,9 26,0 29,9 
Quatro desses retornos estão abaixo da média aritmética de 23,6 1, e três deles estão acima da média aritmética. 
A Mediana 
A mediana é o valor do meio em um conjunto de dados que tenha sido ordenado do maior para o 
maior. Metade dos valores é menor ou igual à mediana, e metade dos valores é maior ou igual ao 
valor da mediana. A meruana não é afetada por valores extremos, de tal modo que você pode utilizar 
a mediana quando estão presentes valores extremos. 
Para calcular a mediana para um conjunto de dados você inicialmente ordena os valores do menor 
para o maior e, depois. utiliza a Equação (3.2) para calcular a classificação do valor que corresponde 
à respectiva mediana. 
MEDIANA 
Mediana = n + L valoJ· na ordem de classificação 
2 
Você calcula o valor da mediana seguindo uma de duas regras: 
(3.2) 
• Regra I Se existir uma quantidade ímpar de valores no conjunto de dados, a mediana corresponde 
ao valor que está no meio na ordem de classificação. 
Regra 2 Se existi r uma quantidade par de valores no conjunto de dados, a mediana corresponde 
à média entre os dois valores que estão no meio na ordem de classificação. 
Para calcular a mediana para a mostra de 10 tempos para ficar pronto na parte da manhã, você clas-
sifica os tempos da seguinte maneira: 
Valores na ordem de classificação: 
29 31 35 39 39 40 43 44 44 52 
Classificação: 
2 3 4 5 6 7 8 9 lO 
t 
Mediana= 39,5 
Uma vez que o resulta do da divisão de n = l por 2 é (1 O + l )/2 = 5,5 para essa amostra de 1 O valores, 
você deve utilizar a regra 2 e extJ·air a média entre o quinto valor e o sexto valor na ordem de classi-
ficação, 39 e 40. Por conseguinte, a mediana é 39.5. A mediana de 39,5 significa que para a metade 
dos dias o tempo para ficar pronto é menor ou igual a 39,5 minutos. Nesse caso, a mediana de 39,5, 
correspondente ao tempo para ficar pronto, está muito próxima da média aritmética de 39,6 minutos, 
relativa ao tempo para ficar pronto. 
if!tjl1hljtM#. CALCULANDO A MEDIANA A PARTIR DE UMA AMOSTRA 
COM NÚMERO ÍMPAR DE VALORES 
Os 838 fundos mútuos (fundos Mútuos.xls) que fazem parte do cenário Utilizando a Estatística (veja o início 
do capítulo) estão classificados de acordo com a categoria (baixo capital, médio capital e grande volume de 
capital); com o tipo (de crescimento ou de valorização): e com o nível de risco dos fu ndos mútuos (baixo, médio 
e alto). Calcule o retorno anual de três anos para os fundos de baixo capital, com objetivo de crescimento e 
baixo risco. 
~ - ---=----------- - - - -~--
- -------------------------~ 
MEDIDAS N UMÉRIC AS DESCRITIVAS 89 
SOLUÇÃO Tendo em vis ta que o resultado da divisão de n + I por 2 é (7 + 1)/2 = 4, para essa amostra de 
tamanho 7. utilizando a Regra 1. a mediana con·esponde ao quano valor na ordem de classificação. Os retornos 
anuais de três anos para os sete fundos de baixo capital, do tipo crescimento e baixo risco (veja a tabela no 
Exemplo 3.1) estão ordenados do menor para o maior: 
Valores na ordem de classificação: 
19.0 20.8 22.3 22.4 24.9 26.0 29.9 
Classificação: 
2 3 4 5 6 7 
t 
Mediana= 39,5 
A mediana do retorno anual de três anos é 22.4. Metade dos retornos anuais de três anos é menor ou igual a 
22,4, enquanto a outra metade é igual ou maior do que 22,4. 
A Moda 
A moda é o valor que aparece com mais freqüência em um conjunto de dados. Do mesmo modo 
que a mediana, e diferentemente da média aritmética, valores extremos não afetam a moda. De um 
modo geral, não existe uma moda, ou existem várias modas em um conjunto de dados. Por exemplo, 
considere os dados sobre tempos para ficar pronto, mostrados a seguir: 
29 31 35 39 39 40 43 44 44 52 
Existem duas modas, 39 minutos e 44 minutos, pelo fato de cada um desses valores oconer duas vezes. 
ififjMiJI•WW. CALCULANDO A MODA 
Um gerente de sistemas encanegado da rede de uma empresa controla a quantidade de falhas no servidor que 
ocorrem em um dia. Calcule a moda para os dados a seguir, que representam a quantidade de falhas do servidor. 
ao longo de um dia, para as últimas duas semanas: 
3 o 3 26 2 7 4 o 2 3 3 6 3 
SOLUÇÃO A disposição ordenada para esses dados é 
o o 2 2 3 3 3 3 3 4 6 7 26 
Tendo em vista que o valor 3 aparece cinco vezes, um número de vezes maior do que qualquer outro valor. a 
moda é 3. Por conseguinte, o gerente de sistemas consegue afirmar que a ocorrência mais comum é ha~er três 
falhas no servidor ao longo de um dia. Para esse conjunto de dados. a mediana também é igual a 3-. e a média 
aritmética é igual a 4.5. O valor extremo. 26, é um outlier. Para esses dados, a mediana e a moda medem a 
tendência central com mais eficácia do que a média aritmética. 
Um conjunto de dados não possui moda no caso em que nenhum dos valores seja "mais tipico". O 
Exemplo 3.4 apresenta um conjunto de dados sem uma moda. 
ilf3JM:J!•*H• DADOS SEM UMA MODA 
Calcule a moda para o retorno anual de três anos para os fundos de baixo capital, do tipo CTescimento 
(Fundos Mútuos.xls) e baixo risco (veja a tabela no Exemplo 3.1). 
SOLUÇÃO A disposição ordenada para esses dados é 
19,0 20,8 22.3 22,4 24,9 26,0 29,9 
Esses dados não possuem uma moda. Nenhum dos valores é mais típico porque cada valor aparece apenas uma 
única vez. 
........... ____________________ _ 
90 C APÍTULO TRÊS 
1 Q,, a mediana e Q3 são, também, 
o 2SJ, o 5(Jl e o 7SJ percentis, 
respectivamente. As Equações 
(3.2), (3.3) e (3.4) podem ser 
expressas. de um modo geral, em 
termos do cálculo dos percentis: 
(p x 1 O(Jl percentil = 
p x (n + T) valor na ordem de 
classificação. 
Quartis 
Quartis dividem um conjunto de dados em quatro partes iguais - o primeiroquartil, Q1, divide 
os valores que correspondem aos 25 ,0% mais baixos, dos 75,0% que são maiores do que eles. O 
segundo quartil, Q2, é a mediana - 50% dos valores são menores do que a mediana e 50% são 
maiores. O terceiro quartil, Q3 , divide a parcela correspondente a 75,0% dos valores mais baixos 
dos 25,0% que são maiores do que eles. As Equações (3.3) e (3.4) definem o primeiro quartil e o 
terceiro quartil.1 
PRIMEIRO QUARTIL, Q, 
25.0% dos valores são menores ou iguais a Q., o primeiro quartil , e 75,0% são maiores ou iguais ao primeiro 
quartil, Q1• 
TERCEIRO QUARTIL, Q3 
Q1 = n + 
1 
valor na ordem de classificação 
4 
(3.3) 
75.0% dos valores são menores Oll iguais ao terceiro quartil, {1. e 25.0% são maiores ou iguais ao terceiro 
quartil. Q3• 
3(n + 1) . Q3 = ---valor na ordem de classificação 
4 
Utilize as seguintes regras para calcular os quartis: 
(3.4) 
Regra 1 Se o resultado corresponder a um número inteiro, então o quartil é igual ao valor na ordem 
de classificação. Se, por exemplo, o tamanho da amostra for n = 7, o primeiro quartil, Q,, é igual 
a (7 + 1 )/4. = segundo valor na ordem de classificação. 
• Regra 2 Se o resultado for uma metade fracionada (2,5; 4,5 etc.), então o quartil é igual à média 
entre os valores correspondentes na ordem de classificação. Se, por exemplo, o tamanho da amostra 
n = 9, o primeiro quartil, Q1, é igual a (9 + 1)/4 = 2,5 valor na ordem de classificação, na metade 
do caminho entre o segundo valor e o terceiro valor na ordem de classificação. 
• Regra 3 Se o resultado não for um número inteiro ou uma metade fracionada, você arredonda o 
resultado até o número inteiro mais próximo e seleciona o valor na ordem de classificação corres-
pondente . Por exemplo, se o tamanho da amostra n = 10, o primeiro quartil, Q1, é igual a (10 + 
1)/4 = 2,75 valor na ordem de classificação. Arredonde 2,75 para 3 e utilize o terceiro valor na 
ordem de classificação. 
Para ilustrar o cálculo dos quartis para os dados sobre o tempo para ficar pronto, ordene os dados 
a seguir partindo do menor para o maior: 
Valores na ordem de classificação: 
29 31 35 39 39 40 43 44 44 52 
Classificação: 
2 3 4 5 6 7 8 9 10 
O primeiro quartil corresponde ao (n + 1)/4 = (10 + 1)/4 = 2,75 valor na ordem de classificação. 
Utilizando a Regra 3, você arredonda para cima até o terceiro valor na ordem de classificação. O 
terceiro valor na ordem de classificação para os dados sobre o tempo para ficar pronto corresponde 
a 35 minutos. Você interpreta o primeiro quartil igual a 35 como significando que em 25% dos dias 
o tempo para ficar pronto é menor ou igual a 35 minutos, enquanto em t3% dos dias o tempo para 
ficar pronto é maior ou igual a 35 minutos. • 
O terceiro quarti l corresponde ao 3(n + 1)/4 = 3(10 + I )/4 = 8,25 valor na ordem de classifi-
cação. Utilizando a Regra 3, para quruíis, você arredonda esse valor para baixo, até o oitavo valor 
na ordem de classificação. O oitavo valor COITesponde a 44 minutos. Por conseguinte, em 75% dos 
dias o tempo para ficar pronto é menor ou igual a 44 minutos, enquanto em 'tS% dos dias o tempo 
para ficar pronto é maior ou igual a 44 minutos. 2 
MEDIDAS NUMÉRICAS DESCRITIVAS 91 
CALCULANDO OS QUARTIS 
Os 838 fundos mútuos CFuru:lo.s Mútuos~s) que fazem parte do cenário Utilizando a Estatística (veja o início do 
capitulo) estão classificados de acordo com a categoria (baixo capital. médio capital e grande volume de capital); 
com o tipo (de crescimento ou de valorização): e com o nível de risco dos fundos múruos (baixo. médio e alto). 
Calcule o primeiro quartil (Q1) e o terceiro quaJtil (Q3) correspondentes ao retorno anual de três anos para os 
fu ndos de baixo capital com objetivo de crescimento e com baixo risco. 
SOLUÇÃO Ordenados do menor para o maior, os retornos anuais de três anos para os sete fundos de baixo 
capital do tipo crescimento e com baixo risco (veja a tabela no Exemplo 3.1) são: 
Valores na ordem de classificação: 
19,0 20,8 22.3 22,4 24.9 
Classificação: 
2 3 4 
Para esses dados: 
Q1 = (n + l) valor na ordem de classificação 4 
5 
26,0 29,9 
6 7 
= 7 + 1 valor na ordem de classificação= 2~ valor na ordem de classificação 
4 
Portanto, utilizando a Regra 1. Q1 corresponde ao segundo valor na ordem de classificação. Como o segundo 
valor na ordem de classificação é 20,8, o primeiro quanil, Q, , é 20,8. 
Para encontrar o terceiro quartil, Q"": 
;} 
Q 
3(n + I) I d d I .fi -3 = --
4
- v a o r na or em e c ass1 tcaçao 
= 3<7 + I) valor na ordem de classificação= 6~ valor na ordem de classificação 
4 
Portanto, utilizando a Regra 1, Q3 con·esponde ao sexto valor na ordem de classificação. Como o sexto valor na 
ordem de classificação é 26,0, o terceiro qmrtil, Q3, é 26. 
O primeiro qua1til coJTespondendo a 20,8 indica que 25% dos retornos são menores ou iguais a 20,8, e 75% 
são maiores ou iguais a 20,8. O terceiro quartil cotTespondendo a 26,0 indica que 75% dos retornos são menores 
ou iguais a 26,0. e 25% são maiores ou iguais a 26.0. 
A Média Geométrica 
A média geométrica mede a taxa de variação de uma variável ao longo do tempo. A Equação (3.5) 
define a média geoméu·ica. 
MÉDIA GEOMÉTRICA 
A média geométrica corresponde à n-ésima raiz do produto de n valores. 
x0 = (X1 x x2 x .. ·x X11 ) 11" (3.5) 
A média geométrica da taxa de retorno mede o percentual médio de retorno de um investimento 
ao longo do tempo. A Equação (3.6) define a média geométrica da taxa de retomo. 
MÉDIA GEOMÉTRICA DA TAXA DE RETORNO 
(3.6) 
em que 
R, corresponde à taxa de retorno no período i 
92 CAPÍTULO TRÊS 
IJ3JMI:JI•Pi. 
Para ilustrar essas medidas, considere um investimento de $100.000 que foi reduzido para um valor 
de $50.000 ao final do Ano 1 e depois disso retornou a seu valor original de $100.000 ao final do 
Ano 2. A taxa de retorno desse investimento para o período de 2 anos corresponde a O (zero), uma 
vez que o valor inicial e o valor final do investimento permaneceram inalterados. Entretanto, a média 
aritmética das taxas anuais de retorno corresponde a: 
x = (-0.50)+ (l.OO) = 0,25. ou 25% 
2 
uma vez que a taxa de retorno para o Ano 1 é 
R = ( 50.000 - 100.000) = _ O 50 ou _ 50% 
I 100.000 ' ' 
e a taxa de retorno para o Ano 2 é 
R = ( 100.000- 50.000) = I OO ou IOO% 
2 50.000 ' , 
Utilizando a Equação (3 .6), a média geométrica da taxa de retorno para os 2 anos é: 
~ =[(I+ RI) X (1 + R2)J11" -1 
=[(J + (-0,50)) X (I+ (1,0))]112 -1 
= [(0,50) X (2,0))112 - I 
= [1.0]112 -I 
=1-1=0 
Portanto, a média geométrica reflete, de maneira mais precisa do que a média aritmética, a variação 
(zero) no valor do investimento para o período de 2 anos. 
CALCULANDO A MÉDIA GEOMÉTRICA DA TAXA DE RETORNO 
A variação percentual no Índice Russell 2000 de preços de ações de 2.000 pequenas empresas correspondeu a 
+ 18,33% em 2004 e +4.55 em 2005. Calcule a taxa geométiica de retorno. 
SOLUÇÃO Utilizando a Equação (3.6). a média geométrica da taxa de retorno para o Índice Russell 2000. 
em relação aos dois anos, corresponde a 
Rc =[(I+ R1)x(l + Rú]
11
" -1 
= f(l + (0, 1833)) X (I + (0,0455))]112 - I 
=[(I ,1833) X (1 .0455)]112 -I 
=[1,23714]112 -I 
= 1,1123- I= 0,1123 
A média geométrica ela taxa de retomo para o Índice Russell 2000 em relação aos dois anos con·esponcle a 
11,23%. 
3.2 VARIAÇÃO E FORMATO 
Além da tendência central, todo conjunto de dados pode ser caracterizado por sua variação e seu 
formato. A variação mede o spread, ou dispersão, dos valores em um conjunto de dados. Uma medida 
simples de variação corresponde à amplitude, a diferença entre o maior valor e o menor valor. As 
medidas mais utilizadas na estatística são o desvio-padrão e a variância, duas medidas explicadas 
posteriom1ente nesta seção. O formato de um conjunto de dados representa um padrão para todos 
os valores, desde o menor valor até o maior valor. Confmme você aprenderá posteriormente nesta 
M EDIDAS NUM~RICAS DESCRITIVAS 93 
seção, muitos conjuntos de dados apresentam um padrãoque se assemelha aproximadamente a um 
sino, com um pico de valores em algum lugar em seu centro. 
A Amplitude 
A amplitude é a medida descritiva numérica mais simples para a variação em um conjunto de dados. 
AMPLITUDE 
A amplitude é igual ao maior valor menos o menor valor. 
Ampl itnde = Xmmr - X,..,,o, (3.7) 
Para determinar a amplitude dos tempos necessários para ficar pronto na parte da manhã, você ordena 
os dados partindo do menor para o maior: 
29 31 35 39 39 40 43 44 44 52 
Utilizando a Equação (3.7), a amplitude é igual a 52 - 29 = 23 minutos. A amplitude de 23 minutos 
indica que a maior diferença entre quaisquer dois dias no tempo para ficar pronto na parte da manhã 
corresponde a 23 minutos. 
CALCULANDO A AMPLITUDE NOS RETORNOS ANUAIS DE TRÊS ANOS DE FUNDOS 
MÚTUOS DE BAIXO CAPITAL. DO TIPO CRESCIMENTO E BAIXO RISCO 
Os 838 fundos mtítuos ( Funaos Mútuos,((Js ) que fazem parte do cenário Utilizando a Estatística (veja o início 
do capítulo) estão classificados de acordo com a categoria (baixo capital , médio capital e grande volume de 
capital); com o tipo (de crescimento ou de valorização); e com o nível de risco dos fundos mútuos (baixo, médio 
e alto). Calcule a amplitude dos retornos anuais de três anos para os fundos de baixo capital com objetivo de 
crescimento e baixo risco (veja a tabela do Exemplo 3.1). 
SOLUÇÃO Ordenados do menor para o maior, os retornos anuais de três anos para os sete fundos de baixo 
capital de tipo crescimento e com baixo risco são: 
19,0 20,8 22,3 22,4 24,9 26,0 29,9 
Portanto, utilizando a Equação (3.7), a amplitude 29,9 - 19,0 = 10,9. 
A maior diferença entre quaisquer dois retornos corresponde a 10,9. 
A amplitude mede a dispersão total no conjunto de dados. Embora a amplitude seja uma medida 
simples da variação total nos dados, ela não leva em consideração o modo conw os dados estão distli-
buídos entre o menor valor e o maior valor. Em outras palavras, a amplitude não indica se os valores 
estão distribuídos de maneira uniforme ao longo de todo o conjunto de dados se estão concentrados 
perto da parte central, ou se estão concentrados perto de um dos extremos ou de ambos os extremos. 
Por conseguinte, a utilização da amplitude como uma medida de variação pode induzir a erros quando 
pelo menos um valor corresponde a um valor extremo. 
A Amplitude lnterquartil 
A amplitude interquartil (também chamada de d ispersão média) conesponde à dife rença entre o 
terceiro quartil e o primeiro quartil em um conjunto de dados. 
AMPLITUDE INTERQUARTIL 
A amplitude interquartil corresponde à diferença entre o terceiro quartil e o primeiro quartil. 
Amplitude interquartil = Q~- Q, (3.8) 
A amplitude interquartil mede a dispexsão nos dados que estão entre as 50% observações centrais. 
Portanto, não é influenciada por valores extremos. Para determinar a amplitude interquartil corres-
pondente aos tempos para ficar pronto 
94 CAPÍTULO ThÊS 
29 31 35 39 39 40 43 44 44 52 
você utiliza a Equação (3.8) e os resultados anteriores ilustrados após a apresentação das regras para 
o cálculo de quartis, Q1 = 35 e Q3 = 44: 
Amplitude interguartil = 44 - 35 = 9 minutos 
Portanto, a amplitude interguartil para os tempos para ficar pronto corresponde a 9 minutos. A ampli-
tude desde 35 até 44 é geralmente conhecida como cinqüenta do meio. 
ij3j lf11Qie4i:· · CALCULANDO A AMPLITUDE INTERQUARTIL DOS RETORNOS ANUAIS DE TRÊS ANOS 
PARA FUNDOS MÚTUOS DE BAIXO CAPITAL DO TIPO CRESCIMENTO E COM BAIXO RISCO 
Os 838 fundos mútuos (:W0::®S:.M[Wo.s::J<lsj) que fazem parte do cenário Uti lizando a Estatística (veja o início do 
capítulo) estão classificados de acordo com a categoria (baixo capital, médio capital e grande volume de capital); 
com o tipo (de crescimento ou de valorização): e com o nível de risco dos fu ndos mútuos (baixo, médio e alto). 
Calcule a amplitude interquartil dos retornos anuais de três anos para os fundos de baixo capital com objetivo 
de crescimento e com baixo risco (veja a tabela do Exemplo 3.1). 
SOLUÇÃO Ordenados do menor para o maior, os retOrnos anuais de três anos para os sete fundos de baixo 
capital do tipo crescimento e com baixo risco são: 
19,0 20,8 22,3 22,4 24,9 26,0 29,9 
Utilizando a Equação (3.8) e os resultados anteriores apresentados do Exemplo 3.5, Q, = 20,8 e Q3 = 26,0: 
Amplitude interquartil = 26,0-20,8 = 5,2 
Portanto. a amplitude interquartil do retorno anual de três anos é igual a 5,2. 
Uma vez que a amplitude interquarti l não leva em consideração nenhum valor irúerior a Q1 ou 
superior a Q3, ela não pode ser afetada por valores extremos. Medidas resumidas tais como a mediana, 
Q1 e Q3 e a amplitude interquarti l, que não podem ser afetadas por valores extremos, são chamadas 
de medidas resistentes. 
A Variância e o Desvio-Padrão 
Embora a amplitude e a amplitude interquartil sejam medidas de variação, elas não levam em consi-
deração o modo como os valores se distribuem ou se concentram entre os extremos. Duas medidas 
de variação habitualmente utilizadas que levam em consideração o modo como todos os valores nos 
dados estão distribuídos são a variância e o desvio-padrão. Essas estatísticas medem a dispersão 
"média" em torno da média aritmética - o modo como os valores mais altos flutuam acima dela e 
o modo como os dados mais baixos se distribuem abaixo dela. 
Uma medida de variação simples em torno da média aritmética poderia tomar a diferença entre 
cada um dos valores e a média aritmética e, depois, somar essas diferenças. No entanto, se você 
fizesse isso, descobriria que, uma vez que a média aritmética é o ponto de equilíbrio em um conjunto 
de dados, para todo conjunto de dados, essas diferenças somariam zero. Uma medida de variação 
que difere de conjunto de dados para conjunto de dados eleva ao quadrado a diferença entre cada 
valor e a média aritmética e, depois, soma essas diferenças elevadas ao quadrado. Na estatística, 
essa medida é chamada de soma dos quadrados (ou SQ). Essa soma é então dividida pelo número 
de valores menos l (para dados de amostras) no sentido de obter a variância da amostra (S2). A raiz 
quadrada da variância da amostra é o desvio-padrão da amostra (S). 
Como a soma dos quadrados corresponde à soma das diferenças elevadas ao quadrado que, com 
base nas regras da aritmética, será sempre um valor não-negativo, nem a variância nem o desvio-
padrão podem, jamais, ser negativos. Para praticamente todos os conjuntos de dados, a variância 
e o desvio-padrão serão valores positivos, embora essas duas variáveis venham a ser iguais a zero 
caso não exista nenhuma variação, em absoluto, em um conjunto de dados e cada um dos valores na 
amostra for igual aos demais. 
Para uma amostra contendo n valores X1,X2, X3, •. • , X, a variância da amostra (dada pelo símbolo 
S2) é: 
<iAnnotate iPad User>
Pencil
<iAnnotate iPad User>
Pencil
<iAnnotate iPad User>
Pencil
<iAnnotate iPad User>
Pencil
MEDIDAS N UMÉRICAS DESCRITIVAS 95 
A Equação (3.9) expressa a variância da amostra utilizando a notação de somatório, enquanto a 
Equação (3.1 O) expressa o desvio-padrão da amostra. 
VARIÂNCIA DA AMOSTRA 
A variância da amostra é a soma das diferenças em tomo da média aritmética elevad~s ao quadrado, di vi· 
dida pelo tamanho da amostra menos l . 
s2 = -";=::..!'----
n- I 
(3.9) 
em que 
X = média aritmética 
n = tamanho da amostra 
X; = i-ésimo valor da variável X 
" L (X; - X)2 = somatório de rodas as diferenças elevadas ao quadrado. entre os valores X, e X 
i=l 
DESVIO-PADRÃO DA AMOSTRA 
O desvio-padrão da amostra é a raiz quadrada da soma das diferenças em torno da média aritmética elevadas 
ao quadrado. dividida pelo tamanho da amostra menos um. 
ll 
I <x, - X)2 
s = -fii = ..ci~,J ___ _ 
n - l 
(3.10) 
Se o denominador fosse nem vez de n- l , a Equação (3.9) [e o termo contido na Equação (3.10)] 
calcularia a média das diferenças em torno da média aritmética elevadas ao quadrado. No entanto. 
n - l é utilizado em virtude de certas propriedades matemáticas desejáveis,possuídas pela esta-
tística SZ, que fazem com que ela seja apropriada para a inferência estatística (o que é discutido no 
Capítulo 7). À medida que cresce o tamanho da amostra, a diferença entre a divisão por n ou por 
n - 1 vai se tornando cada vez menor. 
É mais prOvéível que você venha a utilizar o desvio-padrão como sua medida de variação [definida 
pela Equação (3.1 0)]. Diferentemente da variância da amostra, que conesponde a um valor elevado 
ao quadrado, o desvio-padrão é sempre um valor que está na mesma unidade dos dados originais da 
amostra. O desvio-padrão ajuda você a conhecer o modo como um conjunto de dados se concentra 
ou se distribui em torno de sua média aritmética. Para quase todos os conjuntos de dados, a maioria 
dos valores observados está contida dentro do intervalo que tem como limites mais um desvio-padrão 
e menos um desvio-padrão, para cima e para baixo da média ruitmética. Por conseguinte. o fato de 
conhecer a média aritmética e o desvio-padrão geralmente ajuda a definir o local onde pelo menos 
a maioria dos valores de dados está se concentrando. 
Para calcular, manualmente, a variância da amostra, S\ e o desvio-padrão da amostra, S: 
Etapa 1. Calcule a diferença entre cada valor e a média aritmética.' 
Etapa 2. Eleve ao quadrado cada diferença. 
Etapa 3. Some as diferenças elevadas ao quadrado. 
Etapa 4. Divida esse total por n - L para obter a variância da amostra. 
Etapa 5. Calcule a raiz quadrada da variância da amostra para obter o desvio-padrão da amostra. 
A Tabela 3.1 mostra as quatro primeiras etapas para calcular a variância e o desvio-padrão para 
os dados sobre o tempo para ficar pronto na prute da manhã, com uma média aritmética (X) igual a 
39,6. (Veja o inicio da Seção 3.1 , para o cálculo da média aritmética.) A segunda coluna da Tabela 3. L 
Claudio
Highlight
96 CAPfTULO TRÊS 
TABELA 3.1 
Calculando a Variância 
para os Tempos para 
Ficar Pronto 
X= 39,6 
Tempo Etapa_!. : Etapa2: 
(X) (X;-X) (X;-XY 
39 -0,60 0,36 
29 - 10,60 112,36 
43 3,40 11,56 
52 12.40 153,76 
39 -0,60 0,36 
44 4,40 19,36 
40 0,40 0,16 
31 -8,60 73,96 
44 4,40 19.36 
35 -4,60 21.16 
Etapa 3: Etapa4: 
Soma: Dividir por (n - 1): 
412.40 45,82 
mostra a etapa I. A terceira coluna da Tabela 3. 1 mostra a etapa 2. A soma das diferenças elevadas 
ao quadrado (etapa 3) é mostrada na parte inferior da Tabela 3. 1. Esse total é então dividido por 
10 - 1 = 9 para calcular a variãncia (etapa 4). 
Você pode também calcular a variãncia substituindo por valores os termos da Equação (3.9): 
11 
"' -2 .L. (X;-X) 
s2 = .!;Í=:::>l ___ _ 
n.-1 
(39 - 39.6)2 + (29 - 39,6)2 + ... + (35- 39,6i 
= ~----~--~----~------~--~~ 
10-1 
412,4 =---
9 
= 45,82 
Uma vez que a variância é expressa em unidades elevadas ao quadrado (em minutos elevados ao 
quadrado, para esses dados), para calcular o desvio-padrão você calcula a raiz quadrada da variãncia. 
Utilizando a Equação (3.10), o desvio-padrão da amostra, S, é 
11 
L (X;- X)2 
i = l = ,)45,82 = 6,77 
n - l 
lsso indica que os tempos para ficar pronto, nessa amostra, estão concentrados dentro dos limites de 
6,77 minutos em torno da média aritmética que c01-responde a 39,6 minutos (ou seja, se concentrando 
entre X- IS,= 32,83 e X+ IS,= 46,37). De fato, 7 entre 10 tempos para ficar pronto se posicionam 
dentro dos limites desse intervalo. 
Utilizando a segunda coluna da Tabela 3.1, você pode calcular também a soma das diferenças 
entre cada valor e a média aritmética como sendo igual a zero. Para qualquer conjunto de dados, essa 
soma será sempre igual a zero: 
11 L (X; - X) =O para todos os conjuntos de dados 
i=! 
Essa propriedade é uma das razões pelas quais a média aritmética é utilizada como a medida mais 
comum de tendência central. 
TABELA 3.2 
Calculando a Variância 
dos Retornos An ua is 
de Três Anos para os 
Fundos Mútuos de Baixo 
Capital, com Objetivo 
de Crescimento e Baixo 
Risco 
MEDIDAS N UMÉRICAS D ESCRITIVAS 97 
CALCULANDO A VARIÂNCIA E O DESVIO-PADRÃO PARA OS RETORNOS ANUAIS DE TRÊS 
ANOS PARA FUNDOS MÚTUOS DE BAIXO CAPITAL, DO TIPO CRESCIMENTO E 
COM BAIXO RISCO 
Os 838 fundos mútuos ( FundosMútuos,xfs~ que fazem parte do cenário Utilizando a Estatística (veja o início 
do capítulo) estão classificados de acordo com a categoria (baixo capital, médio capital e grande volume de 
capital): com o tipo (de crescimento ou de valorização); e com o nível de risco dos fundos mútuos (baixo, médio 
e alto). Calcule a variância e o desvio-padrão dos retornos anuais de três anos para os fundos de baixo capital. 
com objetivo de crescimento, e com baixo risco (veja a tabela do Exemplo 3, I). 
SOLUÇÃO A Tabela 3.2 ilustra o cálculo da variância e do desvio-padrão para os retornos anuais de três anos 
dos fundos de baixo capital do tipo crescimento e com baixo risco, 
x = 23,6143 
Retorno Anual 
de Três Anos 
Utilizando a Equação (3.9): 
11 
20,8 
26,0 
24.9 
29.9 
22,3 
19.0 
22,4 
L (X;- X )2 
52 = -"i-=.,1 ___ _ 
11 - 1 
Etapa_!. : 
(X;- X) 
- 2,8143 
- 2,3857 
1.2857 
6.2857 
- 1,3143 
- 4.6143 
- 1,2143 
Etapa3: 
Soma: 
79.2686 
Etapa 2: 
(X, - X)l 
7,9202 
5,6916 
1,6531 
39,5102 
1,7273 
21,2916 
1,4745 
Etapa4: 
Dividir por (n - 1): 
13,2114 
= (20,8 - 23,6143)2 + (26,0 - 23,6143)2 + ... + (22,4 - 23,6143)2 
7 -1 
79,2686 
6 
= 13,2114 
Util izando a Equação (3.10), o desvio-padrão da amostra, S, é igual a: 
11 
"' -2 .L)X; - X ) 
_:.;i=='---- = .Jl3,2J 14 = 3,635 
n - 1 
O desvio-padrão de 3.635 indica que os retornos estão concentrados deJ_!!ro dos limites de }..635 em tomo da 
média aritmética que corresponde a 23,6 1 (ou seja, concentrando-se entre X - JS = 19,975 e X + JS = 27,245). 
De fato, 71.4% (5 entre 7) dos retornos anuais de três anos estão contidos dentro dos limites desse intervalo. 
Os itens a seguir sintetizam as características da amplitude, da amplitude interquartil, da variância 
e do desvio-padrão: · 
Quanto mais espalhados ou dispersos forem os dados, maiores a amplitude, a amplitude inter-
quartil, a variância e o desvio-padrão. 
• Quanto mais concentrados ou homogêneos forem os dados, menores a amplitude, a amplitude 
interqurutil, a vru·iância e o desvio-padrão. 
98 CAPÍTULO TRÊS 
• Se os valores forem todos iguais (de modo· tal que não exista nenhuma variação nos dados), a 
amplitude, a amplitude interquartil, a variância e o desvio-padrão serão todos iguais a zero. 
• Nenhwna das medidas de variação (a amplitude, a amplitude interquartil, o desvio-padrão e a 
variância) pode jamais ser negativa. 
O Coeficiente de Variação 
Diferentemente das medidas de variação anterio1mente apresentadas, o coeficiente de variação é 
uma medida relativa de variação que é sempre expressa sob a forma de percentagem, e não em termos 
das unidades dos dados específicos. O coeficiente de variação, representado pelo símbolo CV, mede 
a dispersão dos dados em relação à média aritmética. 
O COEFICIENTE DE VARIAÇÃO 
O coeficiente de variação é igual ao desvio-padrão dividido pela média aritmética, multiplicado por 
100%. 
em que 
cv = (~ }oo% 
S = desvio-padrão da amostra 
X= média aritmética da amostra 
(3.11) 
Para a amostra de 10 tempos para ficar pronto, uma vez que X = 39,6 e S = 6,77, o coeficiente de 
variação é 
( s) (6,77) cv = -= 100% = - - 100% = 17,10% X 39,6 
Para os tempos para ficar pronto, o desvio-padrão corresponde a 17,1% do tamanho da média arit-
mética. 
O coeficiente de variação é bastante útil quando se comparam dois ou mais conjuntos de dados 
que são mensurados em unidades diferentes, como ilustra o Exemplo 3.10. 
i l ;tii'AijiSI''''' COMPARANDO DOIS COEFICIENTES DE VARIAÇÃO QUANDO DUAS VARIÁVEIS 
APRESENTAM DI FERENTES UNIDADES DE MEDIDA 
O gerente de operações de um serviço de entregas de encomendas está avaliando a compra de uma nova frota 
de caminhões. Quando as encomendas são cruTegadas nos caminhões, no preparo para a entrega. você precisa 
considerar dois importantes parâmetros - o peso (em quilos) e o volume (em metroscúbicos) para cada um 
dos itens. 
O gerente de operações extrai uma amostra de 200 pacotes e descobre que a média aritmética do peso é de 
26,0 quilos, com um desvio-padrâo de 3.9 quilos, e a média aritmética do volume é de 8,8 metros cúbicos. com 
um desvio-padrão de 2.2 metros cúbicos. De que modo podem ser comparadas a variação do peso e a variação 
do volume? 
SOLUÇÃO Como as unidades de medida diferem para os parâmeu·os peso e volume, o gerente de operações 
deve comparru· a variabilidade relativa nos dois tipos de mensuração. 
Para peso, o coeficiente de variação é 
CVw = ( 3·9 )wo% = 15,0% 
26,0 
Para volume, o coeficiente de variação é 
C\fí, = (2•2 )wo% = 25,0% 
8,8 
Por conseguinte, em relação à média aritmética. o volume de encomendas é muito mais variável do que o peso 
das encomendas. 
<iAnnotate iPad User>
Pencil
---- - - - . 
TABELA 3.3 
Escores Z para os 1 O 
Tempos para Ficar Pronto 
M EDIDAS N UMÉRICAS D ESCRITIVAS 99 
Escores Z 
Um valor extremo, ou outlier, é um valor localizado bem distante da média aritmética. Escores Z 
são úteis no sentido de identificar valores extremos. Quanto maior o escore Z, maior a distância do 
valor em relação à média aritmética. O escore Z corresponde à diferença entre o valor e a média 
aritmética, dividida pelo desvio-padrão. 
ESCORESZ 
X-X 
Z=--
S 
(3.12) 
Para os dados relacionados ao tempo para ficar pronto, a média aTitrnética é 39,6 minutos, e o desvio-
padrão é 6 ,77 minutos. O tempo para ficar pronto no primeiro dia corresponde a 39.0 minutos. Você 
calcula o escore Z para o Dia 1 utilizando a Equação (3.12): 
x-x 
Z=--
S 
39,0-39,6 
6,77 
= -0,09 
A Tabela 3.3 mostra os escores 2 para todos os 10 dias. O maior escore Zé 1,83 para o Dia 4, no 
qual o tempo para ficar pronto correspondeu a 52 minutos. O menor escore Z foi - 1,57 para o Dia 
2, no qual o tempo para ficar pronto correspondeu a 29 minutos. Como uma regra geral, o escore Z 
é considerado um valor extremo caso ele seja menor do que -3,0 ou maior do que + 3,0. Nenhum 
dos tempos atendeu a esse critério para ser considerado um valor extremo. 
Tempo (X) Escores Z 
39 - 0,09 
29 - 1,57 
43 0,50 
52 1,83 
39 - 0,09 
44 0,65 
40 0,06 
31 -1,27 
44 0,65 
35 -0,68 
Média Aritmética 39.6 
Desvio-padrão 6,77 
CALCULANDO OS ESCORES Z DOS RETORNOS ANUAIS DE TRÊS ANOS PARA FUNDOS 
MÚTUOS DE BAIXO CAPITAL. DO TIPO CRESCIMENTO E COM BAIXO RISCO 
Os 838 fundos mútuos (l&Jndoa.Mútuos.J4s) que fazem parte do cenário Utilizando a Estatística (veja o início do 
capítulo) estão classificados de acordo com a categoria (baixo capital, médio capital e grande volume de capital): 
com o tipo (de crescimento ou de valorização); e com o nível de risco dos fundos mútuos (baixo, médio e alto). 
Calcule os escores Z em relação aos retornos anuais de três anos para os fundos de baixo capital com objetivo 
de crescimento e com baixo risco (veja a tabela apresentada no Exemplo 3. 1 ). 
SOLUÇÃO A Tabela 3.4 ilustra os escores Z em relação aos retornos anuais de três anos para os fundos de 
baixo capitaL do tipo crescimento e com baixo risco. O maior escore Zé 1,73, para um retorno anual de 29,9. 
O menor escore Zé - 1.27, para um retorno anual de 19.0. Não existem quaisquer valores extremos aparentes 
nesses dados, uma vez que nenhum dos escores Zé menor do que - 3 ou maior do que +3. 
<iAnnotate iPad User>
Pencil
100 CAPiTULO TRÊS 
TABELA 3 .4 
Escores Z para os 
Retornos Anuais de 
Três Anos, para os 
Fundos Mútuos de Baixo 
Capital, com Objetivo 
de Crescimento e Baixo 
Risco 
FIG URA 3 . 1 
Uma comparação entre 
três conjuntos de dados 
que diferem em termos 
de formato 
Retorno ~nual 
de Três Anos Escores Z 
20.8 -0.77 
26.0 0,66 
24,9 0,35 
29,9 1,73 
22,3 - 0.36 
19,0 -1,27 
22,4 -0,33 
Média Aritmética 23,61 
Desvio-padrão 3.63 
.,r Formato 
Fonnato é o padrão da distribuição dos valores de dados ao longo do intervalo inteiro qne 
a totalidade de valores. Uma distribuição pode ser simétrica ou assimétrica. Em uma di,..--'-''-----
simétr ica, os valores abaixo da média aritmética estão distribuídos exatamente do mesmo 
os valores acima da média aritmética. Nesse caso, os valores baixos e os valores altos se e.:; __ ....._ 
Em uma distribuição assimétrica, os valores não são simétricos em tomo de média aritm:...xli... 
assimetria resulta em um desequilíbrio dos valores baixos ou dos valores altos. 
O f01mato int1uencia a relação da média aritmética com a mediana dos seguintes mü<ks: 
• Média aritmética< mediana: negativa, ou assimétrica à esquerda 
• Média aritmética = mediana: simétrica, ou zero de assimetria 
Média aritmética> mediana: positiva, ou assimétrica à direita 
A Figura 3.1 ilustra três conjuntos de dados, cada um deles com um formato difereme 
Painel A 
Negativos. ou assimétricos à esquerda 
Painel B 
Simétricos 
Painel C 
Positivos, ou assimétrtcos a 
Os dados no Painel A são negativos, ou assimétricos à esquerda. Nesse painel, a maior~ 
valores está na parcela superior da distribuição. Uma longa cauda e uma distorção para a esq 
causadas por alguns valores extremamente pequenos. Esses valores extremamente pequec 
a média aritmética para baixo, de modo tal que a média aritmética é menor do que a meth.:!::::t. 
Os dados no Painel B são simétricos. Cada uma das metades da curva é um espellr ....., 
metade da curva. Os valores baixos e os valores altos na escala se equi libram, e a média...__....___ 
é igual à mediana. 
Os dados no Painel C são positivos. ou assimétr icos à direita. Nesse painel, a maior~ 
valores está na parcela inferior da distribuição. Uma longa cauda e uma djstorção para ~ 
são causadas por alguns valores extremamente grandes. Esses valores extremamente =-
puxam a média aritmética para cima, de modo tal que a média aritmética passa a ser ma:. c 
a mediana. 
-- - -- - - -
MEDIDAS N UMÉRICAS D ESCRITIVAS 101 
EXPLORAÇÕES VISUAIS Explorando a Estatíst ica Descritiva 
Utilize o procedimento Descriptive Statistics (Estatística Descritiva), 
de Visual Explorations (Explorações Visuais). para observar o 
efeito de valores de dados que se •nodificam sobre as medidas 
de tendência, variação e formato. Abra a pasta de trabalho suple-
mento explorações visuais.xla (veja o Apêndice D) e selecione 
VisuaiExplorations -? Descriptive Statistics (E:~..'Plorações Visuais 
-? Estatís tica Descri tiva) (Excel 97-2003) ou Suplem en tos -? 
Visual Explorations (Explorações Visuais) ~ Descriptive 
Statistics (Estatística D escritiva) (Excel 2007) da barra do menu 
do Microsoft Excel. Lera as instfllyões na caixa do tipo pop-up (veja 
a ilustração a seguir) e clique em OK para examinar o diagrama de 
escala de pGntos, para a amostra de lO tempos para ficar pronto, 
utilizada ao longo deste capítulo. 
Faça urna experiência inserindo um valor extremo, tal co1no 10 
minutos, em uma das células com preenchimento da coluna A. Quais 
medidas são afetadas por essa mudança? Quais não são?Você pode 
alterna1· entre diagramas do tipo "antes" e "depois" pressionando 
repetidamente Ctrl + Z (desfazer), seguido por Ctrl + Y (refazer) 
para ajudar a verificar as modificações que o valor extremo causou 
no diagrama. 
"" !;113 ' t:f 
('omlat«-fet"f~ Qodos f.f1Sto< ,!anela ~"""' A \Ida - (J X CMngethe val.Ms nlhe ti"«d c-e/1 
~.;.:, . ./ ·I'. ~ 1: · ' I kl lU~ 100'4 rtnQeA2:(4t t .!t'ldob'hVOthc -~.~ "'-'lothe 6ot ~~ .... 
I li ~~'••..ií "'j'l.ooo:O:~ ~~ ~-& · A·l! -
li JJo.l>_ I ~ D E F G H I J K L " 
2 29 I 
3 31 Dot Scale 
4 35 
5 39 
6 39 
7 <:() 
a 43 
9 44 . . 
10 • 44 .. . .... . . V atues 
11 52 
ti[ 
i ' --Mean 
~ o 20 60 80 Med~an 
~ --1SIOuat1i!e 
~-~~ 
~ ... lJ .l --3rd Ouartile 1-)g - +f. I Std Oev ,.g ~ +f. 2 Std Dt!'i' 
~ ~ 
I= +f. 3 Std Dev ~ 
~-~ . 
~ t 
~ T ~~~ 
~ _:c. " -~·.c.' 'it v 
t-;=', , "· Pii;, }.DotScaler I ~ > I 
"'"'*" IÚI -
Resultados da Estatística Descritiva do Microsoft Excel 
O procedimento Estatística Descritiva do suplemento Ferramentas de Análise (veja a Seção E3.1) 
calcula a média aritmética, a mediana, amoda, o desvio-padrão, a variância, o intervalo (amplitude), 
o mínimo, o máximo, a soma e a contagem (tamanho da amostra), e exibe essas estatísticas em uma 
nova planilha. Além disso, o procedimento calcula e exibe o erro-padrão, a curtose e a assimetria, 
três estatísticas não discutidas anteriormente nesta seção. O erro-padrão, discutido no Capítulo 7, 
é o desvio-padrão di vi di do pela raiz quadrada do tamanho da amostra. A assimetria mede a falta de 
simetria nos dados. Um valor de assimetria correspondente a zero indica uma distribuição simétrica. 
Um valor positivo de assimetria indica uma assimetria à direita, enquanto um valor negativo de 
assimetria indica uma assimetria à esquerda. A curtose mede a concentração relativa de valores no 
centro da distribuição em comparação com as caudas. Um valor de cmtose igual a zero indica uma 
distribuição em formato de sino. Um valor negativo indica uma distribuição que tem um formato mais 
aplainado do que uma distribuição em formato de sino. Um valor positivo illdica um~ distribuição 
com um pico mais acentuado do que uma distribuição em formato de sino. 
A Figura 3.2 mostra os resultados da utilização do procedimento Estatística Descritiva para calcular 
resultados separados para fundos mútuos de baixo risco, de médio risco e de alto risco. (O proce-
dimento foi utilizado três vezes, e os resultados que apareceram em três planilhas separadas foram 
consolidados em uma única planilha.)

Continue navegando