Buscar

Levine Cap 3 Pag 102-113

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 12 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 12 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 12 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

102 CAPiTULO TRÊS 
FIGURA 3.2 A 
Estatística descritiva, Estatística Descritiva ara o Retorno de Três Anos 
obtida do Microsoft Baixo Médio Alto Risco 
Excel, dos retornos Média Aritmética 18,4101 16,9~1 17,9549 
anuais de três anos, com 
Erro-Padrão 0,3158 0,3161 0,2621 base no nível de risco 
17,5 16J_ 17,6 
____.1!,1 15,5 - 16,4 ~ Desvio-Padrão 4,9636 4,94]8 4,8762 Variância da Amostra 24,6376 24,4804 23,7774 
Veja a Seção E3. 7 para criar Curtose 0,2838 1,9893 1,1686 
esca cabe/a. 
0,5069 0,8118 0,7069 
28 35,6 33,2 
6,7 6,7 7,3 
Máximo 34l 42,3 40,5 
Soma 4547,3 4156,7 6212,4 
Contagem 247 245 346 
Maior(1) 34,7 42,3 40,~ 
Menor1 6,7 6,7 7,3 
Ao examinar os resultados, parecem existir ligeiras diferenças nos retornos anuais de três anos 
para os três níveis de risco. Fundos de baixo risco e de alto risco apresentaram média aritmética e 
mediana ligeiramente mais altas do que os fundos de médio risco. Houve muito pouca diferença nos 
desvios-padrão dos três grupos. Cada um dos níveis de risco mostrou alguma evidência de assime-
tria à direita. 
SEÇÕES 3.1 E 3.2 
Aprendendo o Básico 
3.1 A seguir, apresentamos um conjunto de dados a partir de uma 
amostra de tamanho n = 5: 
7 4 9 8 2 
a. Calcule a média aritmética. a mediana e a moda. 
b. Calcule a amplitude, a amplitude interquartil, a variância. o desvio-
padrão e o coeficiente de variação. 
c. Calcule os escores Z. Existe algum valor extremo (outlier)? 
d. Descreva o fo1mato do conjunto de dados. 
3.2 A seguir, apresentamos um conjunto de dados, a partir de uma 
amostra de tamanho n = 6: 
7 4 9 7 3 12 
a. Calcule a média aritmética, a mediana e a moda. 
b. Calcule a amplitude, a amplitude interquartil , a variância, o desvio-
padrão e o coeficiente de variação. 
c. Calcule os escores Z. Existe algum valor extremo (outlier)? 
d. Descreva o formato do conjunto de dados. 
3.3 A seguir, apresentamos um conjunto de dados, a partir de uma 
amostra de tamanho n = 7: 
12 7 4 9 o 7 3 
a. Calcule a média aritmética, a mediana e a moda. 
b. Calcule a amplitude, a amplitude interquartil. a variância. o desvio-
padrão e o coeficiente de variação. 
c. Calcule os escores Z. Existe algum valor extremo (outlier)? 
d. Descreva o formato do conjunto de dados. 
3.4 A seguir, apresentamos um conjunto ele dados, a partir de uma 
amostra de tamanho n = 5: 
7 -5 -8 7 9 
a. Calcule a média aritmética, a mediana e a moda. 
b. Calcule a amplitude. a amplitude interquartil. a variância, o desvio-
padrão e o coeficiente de variação. 
c. Calcule os escores Z. Existe algum valor extremo (outlier)? 
d. Descreva o formato do conjunto de dados. 
3.5 Suponha que as taxas de retorno de uma determinada ação durante 
os dois últimos anos tenham sido 10% e 30%. Calcule a média geomé-
u-ica da taxa de retorno. 
(Observação: Uma taxa de retorno de 10% é registrada como 0,10, e 
uma taxa de retorno de 30% é registrada como 0,30.) 
Aplicando os Conceitos 
3.6 O gerente de operações de uma indústria que fabrica pneus deseja 
comparar o diâmetro interno real de dois tipos de pneus. que deve ser. 
para os dois, igual a 575 milímetros. Uma amostra de cinco pneus de cada 
tipo foi selecionada, e os resultados, representando os diâmetros internos 
desses pneus, ordenados do menor para o maior, são os seguintes: 
Tipo X TipoY 
568 570 5.75 578 584 573 574 575 577 578 
a. Para cada um dos tipos de pneus, calcule a média aritmética, a 
mediana e o desvio-padrão. 
b. Qual tipo de pneu está proporcionando melhor qualidade? 
Explique. 
c. Qual seria o efeito em relação a suas respostas em (a) e (b) se o tíltimo 
valor para o tipo Y fosse 588 em vez de 578? Explique. 
3.7 Os dados no arquivo preçoscin.ema..&s contêm o preço de dois 
ingressos, incluindo tarifas de serviços online, um balde grande de 
pipocas e dois refrigerantes médios, em uma amostra de seis cadeias 
de cinema: 
$36,15 $31,00 $35,05 $40,25 $33,75 $43,00 
Fonte: Extraído de K. Kelly. "The Multiplex Under Siege." The Wall Street 
Journal, 24-25 de de=:.embro de 2005, pp. P 1, P5. 
a. Calcule a média aritmética. a mediana, o primeiro quartil e o terceiro 
quartil. 
b. Calcule a variância. o desvio-padrão. a amplitude. a amplitude inter-
quartil e o coeficiente de variação. 
c. Os dados são assimétricos? Em caso afirmativo, que tipo de assime-
tria? 
d. Com base nos resultados para (a) a (c), a que conclusões você 
consegue chegar quanto ao custo de ir ao cinema? 
3.8 Um total de 92.000 novas res idências unifam iliares foi vendido 
nos Estados Unidos ao longo de fevereiro de 2006. A mediana do preço 
das res idências foi $230.400. um decréscimo de 2,9% em relação a 
fevereiro de 2005 (U.S. Census Bureau, www.census.gov). Por que 
você acredita que o Census Bureau se refere à mediana do preço. e não 
à média aritmética do preço? _ _,_,__.,._...... 
3.9 Os dados no arquivo cu_sto._l5a ~ contêm os valores relativos a 
tarifas cobradas. em dólares, por cheques devolvidos, em uma amostra 
de 23 bancos, para cl ientes de contas conentes, que mamêm um saldo 
bancário equivalente a $100: 
26 28 20 20 21 22 25 25 
18 20 25 25 22 30 30 30 
18 25 15 20 
15 20 29 
Fome: Extraída de "The New Face of Banking. "junho de 2000. Copyrisht © 
2000 by Consumers Union ofU.S., Inc., Yonkers, NY 10703-1057. 
a. Calcule a média ari tmética, a mediana. o primeiro quartil e o terceiro 
quartil. 
b. Calcule a variância, o desvio-padrão, a amplirude, a amplitude inter-
quartil, o coeficiente de variação e os escores z. 
c. Os dados são assimétricos? Em caso afinnativo, que tipo de assime-
tria? 
d. Com base nos resultados de (a) a (c), a que conclusões você consegue 
chegar quanto às tarifas cobradas por cheques devolvidos? I ~ .. ~.;. ,- 3.1 O Os dados no arquivo btabid.asoaf.é.xJ.s representam 
VF.1 as calorias e a gordura (em gramas) em 16 onças de 
bebidas geladas à base de café na Dunkin · Donuts e na 
Starbucks: 
Produto Calorias Gordura 
Iced Mocha Swirl Latte (leite 
in tegral). da Dunkin' Donuts 240 8.0 
Coffee Frappuccino blended, da 
Starbucks 260 3,5 
Coffee Coolatta (creme). da 
Dunkin' Donuts 350 22.0 
Mocha Expresso Café Gelado (leite 
integral e creme chantilly), da 
Starbucks 350 20,0 
MEDIDAS NUMÉRICAS DESCRITIVAS 103 
Produto Calorias Gordura 
Mocha Frappuccino blended coffee 
(creme chantilly), da Starbucks 420 16.0 
Chocolate Brownie Frappuccjno 
blended coffee (creme cbantilly). 
da Starbucks 510 22,0 
Chocolate Frappuccino Blended 
Creme (cremechantilly). da 
Starbucks 530 19,0 
Fonte: Exrrafda de "Co.ffee as Candy at Dunkin' Dmwts and Starbucks." 
Consumer Repo11s.junho de 2004, p.9. 
a. Para cada uma das variáveis (calorias e gordura), calcule a média 
aritmética, a mediana, o primeiro quartil e o terceiro quartil. 
b. Para cada uma das variáveis (calorias e gordura), calcule a variãncia. 
o desvio-padrão, a ampJjrude, a amplitude interquartil, o coeficiente 
de variação e os escores Z. Existem valores extremos (outliers)? 
Explique. 
c. Os dados são assimétricos? Em caso afirmativo, que tipo de assime-
tria? 
d . Com base nos resultados de (a) a (c), a que conclusões você consegue 
chegar quanto ao teor de calorias e gordura nas bebidas geladas à 
base de café na Dunkin' Donuts e na Starbucks? 
3.11 Os dados no arquivo Jrango~l~Js contêm o total de gordura. em 
gramas por porção, de uma amostra de 20 sanduíches de frango, de 
cadeias de lanchonetes. Os dados são os seguintes: 
7 8 4 5 16 20 20 24 19 30 
23 30 25 19 29 29 30 30 40 56 
Fonte: Exrraída de "Fast Food: Adding Healrh ror !te Menu'·. Consumer Reports, 
setembro de 2004, pp. 28-31. 
a. Calcule a média aritmética, a mediana, o primeiro quartil e o terceiro 
quartil. 
b. Calcule a variância, o desvio-padrão, a amplitude, a amplitude inter-
q uartil, o coeficiente de variação e os escores Z. Existem valores 
extremos (outliers)? Explique. 
c. Os dados são assimétricos? Em caso afirmativo, que tipo de assime-
tria? 
d. Com base nos resultados de (a) a (c), a que conclusões você consegue 
chegar quantoao total de gordura em sanduíches de frango? 
3.12 Os dados no arquivo vi a ~leria.xls representam a vida útil de 
baterias (em termos do número de fotografias) de câmeras digitais de 
três megapixels. 
300 
260 
180 
35 
85 
380 
170 
120 
380 
J lO 
460 
240 
Fonte: Exrraída de "Cameras: More Features in the Mix". Consumer Reports, 
julho de 2005, pp. 14-18. 
a. Calcule a média aritmética, a mediana. o primeiro quartil e o terceiro 
quartil. 
b. Calcule a variância, o desvio-padrão, a amplitude, a ampl itude inter-
quartil, o coeficiente de variação e os escores Z. Existem valores 
extremos (outliers)? Explique. 
c. Os dados são assimétricos? Em caso afirmativo. que tipo de assime-
tria? 
d. Com base nos resultados de (a) a (c), a que conclusões você consegue 
chegar quanto à vida út il de baterias (em termos do número de foto-
grafias). em câmeras digitais de três megapixels? 
3.13 Existe alguma diferença enn·e os bancos na variação dos rendi-
mentos de diferentes tipos de investimento? Os dados no arquivo 
rendiiiuilltotianG.'XIS representam os maiores rendimentos, em âmbito 
<iAnnotate iPad User>
Pencil
104 CAPÍTULO TR6 
nacional, para contas no mercado monetário e para certificados de depó-
sito (CD) de um ano em 24 de janeiro de 2006: 
Contas do Mercado 
Monetário CD de um Ano 
4,55 4,50 4,40 4,38 4,38 4,94 4.90 4,85 4,85 4.85 
Fonte: Extraída de Bankrate.com. 24 de janeiro de 2006. 
a. Para contas no mercado monetário e para celtificados de depósito 
(CD) de um ano, calcule, separadamente, a variância, o desvio-padrão, 
a amplitude, a amplitude interquartil e o coeficiente de variação. 
b. Com base nos resultados de (a), as contas no mercado monetário 
ou os certificados de depósito (CD) de um ano apresentam maior 
variação nos maiores rendimentos ofe1tados? Explique. 
3.14 Os dados no arquivo parqu~temático.x.ls contêm o preço do 
ingresso inicial (em$), para passes de 1 dia, de 10 parques temáticos 
nos Estados Unidos. 
58 63 41 42 29 50 62 43 40 40 
' Fome: Extraída de C. Jackson andE. Gamerman, "Rethinking the Thri/1 Fact01;" 
The Wall Street Joumal, 15-16 de abril de 2006. pp. P I. P4. 
a. Calcule a média aritmética, a mediana, o primeiro quartil e o terceiro 
quartil. 
b. Calcule a amplitude, a variância e o desvio-padrão. 
c. Com base nos resultados de (a) e (b), a que conclusões você consegue 
chegar quanto ao preço do ingresso inicial (em$) de passes de um 
dia? 
d. Suponha que o primeiro valor fosse 98, em vez de 58. Repita (a) 
até (c). utilizando esse valor. Comente sobre a d iferença nos resul-
tados. 
3.15 Uma agência bancária, localizada no bairro comercial de uma 
cidade, desenvolveu um processo melhorado de atendimento aos clientes 
no horário de pico do almoço, das 12h às J 3h. Foi registrado o tempo 
de espera, em minutos (definido como o intervalo entre o momento em 
que o cliente entra na fila até o momento em que é atendido), de uma 
amostra de 15 clientes, durante esse intervalo de uma hora , ao longo 
do período de uma semana. Os resultados estão contidos no arquivo de 
dados bancol.xls e são apresentados a seguir: 
4,21 5,55 3,02 
4,50 6,10 0,38 
5,13 4,77 
5,12 6,46 
2,34 
6, 19 
3,54 
3,79 
3,20 
a. Calcule a média aritmética, a mediana. o primeiro quartil e o terceiro 
quartil. 
b. Calcule a variância, o desvio-padrão, a amplitude, a amplitude inter-
quartil , o coeficiente de variação e os escores Z. Existe algum valor 
extremo (outlier)? Explique. 
c. Os dados são assimétricos? Em caso afirmativo, que tipo de assime-
tria? 
d. Assim que uma cliente entra na agência durante o período do almoço, 
ela pergunta ao gerente quanto tempo deve esperar até ser atendida. 
O gerente responde: "Quase certamente não mais de cinco minutos." 
Com base nos resultados de (a) a (c), avalie a exatidão dessa afinna-
tiva. 
3.16 Suponha que urna outra agência bancária, localizada em uma 
área residencial, também esteja preocupada com o horário de pico do 
almoço, das 12h às l3h. Foi registrado o tempo de espera, em minutos 
(definido como o intervalo entre o momento em que o cliente entra na 
fi la até o momento em que é atendido), de uma amostra de 15 clientes, 
durante esse horário, ao longo do período de uma semana. Os resul-
tados estão contidos no arquivo de dados banco2.xls e são apresen-
tados a seguir: 
9,66 5,90 
10,49 6,68 
8,02 5,79 8,73 
5,64 4.08 6,17 
3,82 
9.91 
8,01 
5,47 
8,35 
a. Calcule a média aritmética, a mediana, o primeiro quartil e o terceiro 
quattil. 
b. Calcule a variância, o desvio-padrão, a amplitude, a amplitude inter-
quartil, o coeficiente de variação e os escores Z. Existe algum valor 
extremo (outlier)? Explique. 
c. Os dados são assimétricos? Em caso afirmativo, que tipo de assime-
tria? 
d. Assim que um cliente entra na agência, durante o horário de almoço, 
ele pergunta ao gerente da agência quanto tempo deve esperar até 
ser atendido. O gerente responde: "Quase certamente não mais de 
5 minutos." Com base nos resultados de (a) a (c), avalie a exatidão 
dessa afirmativa. 
3.17 A General Electric (GE) é uma das maiores empresas do mundo; 
desenvolve, fab rica e comercial iza uma ampla gama de produtos, 
incluindo aparelhos de imagem para diagnóstico médico, motores de 
aeronaves. produtos para iluminação e produtos quím.icos. Por meio de 
sua afitiada, a NBC Universal, aGE produz e distribui redes de televisão 
e filmes cinematográficos. Em 2004, o preço das ações da GE subiu 
20,6%, e em2005 o preço caiu 1,4%. 
Fonte: Extraído de finance@yaboo.coru. 17 de abril de 2006. 
a. Calcule a média geométrica da taxa de crescimento para o período 
de 2 anos, 2004-2005. (Dica: Represente um crescimento de 20,6% 
como R1 = 0,206.) 
b. Caso você tivesse adquirido $ 1.000 em ações da GE no início de 
2004, qual seria o valor dessas ações ao fi nal de 2005? 
c. Compare o resultado de (b) com o resultado para o Problema 
3.18(b). 
3.18 A TASER International, Inc., desenvolve, fabrica e vende 
dispositivos não-letais de defesa pessoal, conhecidos como tasers. 
Comercializando principalmente para forças policiais, instituições peni-
tenciárias e para o setor militar, a popularidade da TASER é como um 
passeio em uma montanha-russa. O preço das ações em 2004 cresceu 
361 ,4%, mas em 2005 o preço caiu 78,0%. 
Fonte: Extraído de finance@yahoo.com. 17 de abril de 2006. 
a. Calcule a média geométrica da taxa de crescimento para o período 
de 2 anos, 2004-2005 (Dica: Represente um crescimento de 361,4% 
comoR1 = 3,614.) 
b. Caso você tivesse adquirido $1.000 em ações da TASER no início 
de 2004, qual seria o valor dessas ações ao final de 2005? 
c. Compare o resultado de (b) com o resultado do Problema 3. J 7(b). 
3.19 Em 2002, todos os mais importantes índices do mercado de ações 
caíram drasticamente, depois de os ataques terroristas de 11 de setembro 
terem feito os preços das ações entrarem em uma espiral descendente. As 
ações logo se recuperaram. mas que tipo de média aritmética de retorno 
os investidores tiveram ao longo do período de 4 anos, de 2002 a 2005? 
Os dados na tabela a seguir (contidos no arquivo de dados Jndices,xlsl) 
representam a taxa total de retorno (em percentuais) de Média Industrial 
Dow f ones (DJIA), do Standard & Poor's 500 (S&P 500) e do Índice 
Nasdaq Composto. de empresas de alta tecnologia. 
Ano DJIA S&PSOO NASDAQ 
2005 -0,6 2,9 1,4 
2004 3,4 9,1 8,6 
2003 30,0 26,4 50,0 
2002 -16.8 -24,2 - 31,5 
Fonte: Extraída de finance.yahoo.com, /4 de abril de 2006. 
MEDIDAS N UMÉRICAS D ESCRIT IVAS 105 
a. Calcule a média geométrica da taxa de retorno dos índices DJIA, 
S&P 500 e Nasdaq. 
b. A que conclusões você consegue chegar quanto à média geométrica 
das taxas de retorno para esses três índ.ices de mercado? 
c. Compare o resultado de (b) com os resultados do Problema 
3.20(b). 
Ano 
2005 
2004 
2003 
2002 
Platina Ouro 
12.3 17,8 
5.7 4,6 
36,0 19,9 
24.6 25.6 
3.20 Em 2002-2005. os metais preciosos sofreram mudanças rápidas. 
em termos de valor.Os dados na tabela ao lado (contidos no arquivo de 
dados metais.xLS...) representam a taxa total de retorno (em percentuais) 
para plat ina, ouro e prata. 
Fome: Exrmída de www.kitco.com, /4 de abril de 2006. 
a. Calcule a média geométrica da taxa de retorno para platina. ouro e 
prata. 
b. A que conclusões você consegue chegar quanto à média geométrica 
das taxas de retorno para esses três metais preciosos? 
c. Compare o resultado de (b) com os resultados do Problema 3.19(b). 
3.3 MEDIDAS NUMÉRICAS DESCRITIVAS PARA UMA POPULAÇÃO 
Prata 
29,5 
14,2 
27,8 
3,3 
As Seções 3.1 e 3.2 apresentam várias estatísticas que descrevem as propriedades de tendência central 
e variação para uma amostra. Caso seu conjunto de dados represente medidas numéricas para toda 
uma população, você precisa calcular e interpretar parâmetros, medidas resumidas para uma popu-
lação. Nesta seção. você aprenderá sobre esses três parâmetros descritivos para populações: a média 
aritmética da população, a variância da população e o desvio-padrão da população. 
TABELA 3.5 
Retorno de Um Ano para 
a População que Consiste 
nos Cinco Maiores 
Fundos de Títulos 
Para ajudar a ilustrar esses parâmetros, faça, inicialmente, um exame na Tabela 3.5, que contém o 
retorno de um ano para os cinco maiores fundos de títulos (em termos do total de ativos), conforme 
posição em 31 de janeiro de 2006. (Os dados estão contidos no arquivo maiores títulos,xls .) 
Fundo de Títulos 
Pimco: Total Rtn;Tnst 
Vanguard Tot Bd;lnv 
American Funds Bond;A 
Vanguard GNMA;Inv 
Franklin CA TFlnc;A 
Retorno de Um Ano 
2,74 
1,62 
2,25 
2,88 
3,66 
Fome: Extraída de The Wall Street Journal. 6 de fevereiro de 2006, p. R6. 
A Média Aritmética da População 
A média aritmética da população é representada pelo símbolo f.L, a letra grega minúscula mu. A 
Equação (3.13) define a média aritmética. 
MÉDIA ARITMÉTICA DA POPULAÇÃO 
A média aritmética da população é a soma dos valores na população, dividida pelo tamanho da população. N. 
em que 
N 
N 
L X; 
J.L =média arjtmética da população 
X1 = i-és imo valor da variável X 
L X1 =somatório de todos os valores X1 na população 
/:J 
(3.13) 
Para caJcular a média aritmética do retorno de um ano para a população de fundos de títulos apre-
sentada na Tabela 3.53, utilize a Equação (3.13): 
<iAnnotate iPad User>
Pencil
<iAnnotate iPad User>
Pencil
<iAnnotate iPad User>
Pencil
106 C APfTULO ThÊS 
N 
L,x; 
11 = i.::.L__ = 2,74 + 1,62 + 2,25 + 2,88 + 3,66 = 13,15 = 2 63 
r-- N 5 5 ' 
Por conseguinte, a média aritmética da percentagem de retorno para esses fundos de títulos é 2,63. 
A Variância da População e o Desvio-Padrão da População 
A variâocia da população e o desvio-padrão da população medem a variação dentro de uma popu-
lação. Em analogia à estatística relacionada à amostra, o desvio-padrão da população é a raiz quadrada 
da variância da população. O súnbolo o-2, a letra grega minúscula sigma elevada ao quadrado, representa 
a variâncía da população, e o símbolo a, a letra grega minúscula sigma, representa o desvio-padrão da 
população. A Equações (3.14) e (3.15) definem esses parâmetros. Os denominadores para os termos ao 
lado d ireito dessas equações utilizam o tetmo N, e não o termo (n - 1), que é utilizado nas equações 
para a variância da amostra e para o desvio-padrão da amostra [veja as Equações (3.9) e (3.10)]. 
VARIÂNCIA DA POPULAÇÃO 
A variância da população corresponde à soma das diferenças em tomo da média aritmética da população 
elevadas ao quadrado dividida pelo tamanho da população, N. 
em que 
N 
N 
L(X;- )!)~ 
0
2 = .!..:ie::.cl ___ _ 
N 
IL = média aritmética da população 
X, = i-ésimo valor da variável X 
(3.14) 
L (X; - 1.1)2 = somatório de todas as diferenças entre os valores X, e IL elevadas ao quadrado 
DESVIO-PADRÃO DA POPULAÇÃO 
O desvio-padrão da população é a raiz quadrada da variância da população: 
o= 
N 
(3.15) 
Para calcular a variância da população para os dados da Tabela 3.5. você utiliza a Equação (3.14 ). 
N r ( X; -).t) 2 
()2 = .!..:i -=.!_1 ___ _ 
N 
(2,74- 2,63)2 + (1,62- 2,63)2 + (2,25- 2,63)2 + (2,88 - 2,63)2 + (3,66 - 2,63)2 
5 
0,0121 + 1,0201 + 0,1444 + 0,0625 + 1,0609 
= ~----~----~----~------~--
5 
= 2,30 = o 46 
5 ' 
Por conseguinte, a variância dos retornos de um ano conesponde ao retorno percentual de 0,46 
elevado ao quadrado. As unidades elevadas ao quadrado tomam a variância difícil de ser interpre-
tada. Você deve utilizar o desvio-padrão, que é expresso nas unidades originais dos dados (retorno 
percentual). Com base na Equação (3.15), 
cr=~ = .;.:i =:.!...1 --- = .JoA6 = o,68 
N 
<iAnnotate iPad User>
Pencil
----~- ---------- . 
MEDIDAS N UMÉRICAS DESCRITIVAS 107 
Portanto, o retorno percentual típico difere da média aritmética de 2,63 em aproximadamente 0,68. 
Esse pequeno montante de variação sugere que esses grandes fundos de títulos produzem resultados 
que não diferem muito entre si. 
A Regra Empírica 
Na maioria dos conjuntos de dados, uma grande parte dos valores tende a se concentrar relativa-
mente perto da mediana. Em conjuntos de dados assimétricos à direita, essa concentração ocorre 
à esquerda da mediana- ou seja, em um valor menor do que a mediana. Em conjuntos de dados 
assimétricos à esquerda, as observações tendem a se concentrar à direita da mediana - ou seja, em 
um valor maior do que a mediana. Em conjuntos de dados simétricos, nos quais a mediana e a média 
aritmética são iguais, os valores geralmente tendem a se distribuir em torno da mediana e da média 
aritmética, produzindo uma distribuição em formato de sino. Você pode utilizar a regra empírica 
para examinar a variabilidade em distribuições com fOJmato de sino: 
• Aproximadamente 68% dos valores estão contidos dentro de uma distância de ±1 desvio-padrão 
em relação à média aritmética. 
• Aproximadamente 95% dos valores estão contidos dentro de uma distância de ±2 desvios-padrão 
em relação à média aritmética. 
• Aproximadamente 99,7% dos valores estão contidos dentro de uma distância de ±3 desvios-padrão 
em relação à média aritmética. 
A regra empírica ajuda a mensmar o modo como os valores se distribuem acima e abaixo da média 
aritmética e pode ajudar a identificar valores extremos (outüers). A regra empírica implica que, para 
dishibuições em formato de sino, apenas aproximadamente 1 em cada 20 valores estará além de dois 
desvios-padrão de distância da média aritmética, em qualquer uma das direções. Como uma regra 
geral, você pode considerar valores não posicionados no intervalo fJ. ± 2<T como potenciais valores 
extremos. A regra implica também que somente algo em torno de 3 em 1.000 estarão além de três 
desvios-padrão de distância da média aritmética. Po1tanto, valores não posicionados no intervalo 
fJ. X 3a são, quase sempre, considerados valores extremos. Para conjuntos de dados com forte assi-
metria, ou para aqueles que não aparentam ter um formato de sino por qualquer outra razão, a regra 
de Chebyshev, discutida a seguir, deve ser apljcada em lugar da regra empírica. 
if:t!&liflleMHfi UTILIZANDO A REGRA EMPÍRICA 
Sabe-se que uma população de latas com 12 onças de refrigerante do tipo cola apresenta uma média aritmética 
de peso de abastecimento de 12,06 onças e um desvio-padrão de 0,02. Sabe-se que a população apresenta um 
formato de sino. Descreva a djsrribuição de pesos de abastecimento. Seria bastante provável que uma lata viesse 
a conter menos do que 12 onças de refrigerante? 
SOLUÇÃO 
fJ. ±a= 12,06 ± 0,02 = (12,04; 12,08) 
fJ. ± 2a = 12,06 ± 2(0,02) = (12,02; 12,10) 
fJ. ± 3a = 12,06 ± 3(0,02) = (12,00; 12,12) 
Utilizando a regra empírica, aproximadamente 68% das latas conterão entre 12,04 e 12,8 onças; aproximada-
mente 95% conterão entre 12,02 e 12,10 onças; e aproximadamente 99,7% conterão entre 12,00 e 12.12 onças. 
Portanto. é altamente improvável que uma lata venha a conter menos do que 12 onças. 
A Regra de Chebyshev 
A regra de Chebyshev (referência I) enuncia que para qualquerconjunto de dados, independente-
mente de seu formato, a percentagem de valores que estão contidos dentro de distâncias correspon-
dentes a k desvios-padrão em relação à média aritmética deve ser pelo menos 
(I - 1/P) X 100% 
Você pode utilizar essa regra para qualquer valor de k maior do que 1. Considere k = 2. A regra de 
Chebyshev declara que pelo menos [I - (1/2)2] X 100% = 75% dos valores devem estar contidos 
dentro de uma distância de 2 desvios~padrão em relação à média aritmética. 
<iAnnotate iPad User>
Pencil
<iAnnotate iPad User>
Pencil
108 CAPÍTULO TRÊS 
TABELA 3.6 
Como os Dados Variam 
em Torno da Média 
Aritmética 
A regra de Chebyshev é bastante geral e se aplica a qualquer tipo de distribuição. A regra indica 
pelo menos qual percentagem dos valores se posiciona dentro de uma determinada distância em 
relação à média aritmética. No entanto, se o conjunto de dados apresentar um formato aproximado 
de um sino, a regra empírica refletirá de modo mais preciso a maior concentração de dados próximos 
à média aritmética. A Tabela 3.6 compara a regra de Chebyshev e a regra empírica. 
Intervalo 
(fJ. - cr, fJ. + cr) 
(fJ. - 2cr, fJ. + 2cr) 
(fJ. - 3cr, fJ. + 3cr) 
% de Valores Encontrados nos Intervalos 
em Torno da Média Aritmética 
Chebyshev 
(qualquer distribuição) 
Pelo menos 0% 
Pelo menos 75% 
Pelo menos 88.89% 
Regra Empírica 
(distribuição em formato de sino) 
Aproximadamente 68% 
Aproximadamente 95% 
Aproximadamente 99,7% 
iJ3~J~~IiJieWifi UTILIZANDO A REGRA DE CHEBYSH EV 
Aprendendo o Básico 
Como no Exemplo 3.12, uma população de latas de 12 onças de refrigerante do tipo cola apresenta uma média 
aritmética de peso de abastecimento correspondente a 12.06 onças e um desvio-padrão de 0,02. No entanto, 
não se conhece o formato da população. e você não pode pressupor que ela tenha um formato de sino. Descreva 
a distribuição dos pesos de abastecimento. Seria bastante provável que uma lata viesse a conter menos do que 
12 onças de refrigerante? 
SOLUÇÃO 
I..L ± (J = 12,06 ± 0,02 = (12,04; 12,08) 
I..L ± 2cr = 12,06 ± 2(0,02) = (12,02; 12,10) 
I..L ± 30' = 12,06 ± 3(0,02) = (12,00; 12,12) 
Como a distribuição pode ser assimétrica, você não pode utilizar a regra emp.írica. Utilizando a regra de 
Chebyshev. você não consegue afirmar nada sobre a percentagem de latas que contêm entre 12,04 e 12,08 
onças. Você consegue afinnar que pelo menos 75% das latas conterão entre 12.02 e 12, I O onças, e pelo menos 
88,89% conterão entre 12.00 e 12.12 onças. Por conseguinte, entre O e 11.11% das latas conterão menos do 
que 12 onças. 
Você pode utilizar essas duas regras para compreender o modo como os dados estão distribuídos 
em torno de média aritmética quando você tem e~ mãos dados origináJios de amostras. Em cada um 
dos casos, você utiliza o valor que calculou para X, no lugar de I..L· e o valor que calculou paraS, no 
lugar de a. Os resultados que você calcula utilizando estatísticas de amostras são aproximações, uma 
vez que você utilizou estatísticas de amostras (.X, S), e não parâmetros da população (I..L. a). 
SEÇÃO 3.3 
a. Calcule a média aritmética da população. 
b. Calcule o desvio-padrão da população. 
3.21 É apresentado, a seguir. um conjunto de dados para uma popu-
lação com N = lO: Aplicando os Conceitos 
7 5 ]J 8 3 6 2 9 8 
a. Calcule a média aritmética da população. 
b. Calcule o desvio-padrão da população. 
3.22 É apresentado, a seguir. um conjunto de dados para uma popu-
lação com N = lO: 
7 5 6 6 6 4 8 6 9 3 
3.23 Os dados no arquivo taxa.xls a seguir representam os recibos de 
recolhimento de impostos sobre vendas no trimestre (em milhares de 
dólares) apresentados ao fiscal de Vil! age of F a ir Lake. para o período 
encerrado em março de 2006, de todos os 50 estabelecimentos comer-
ciais dessa localidade: 
<iAnnotate iPad User>
Pencil
<iAnnotate iPad User>
Pencil
-~-------- ----------------~ 
10.3 11.1 9.6 9.0 14.5 
13,0 6,7 11.0 8,4 10,3 
13,0 11,2 7.3 5,3 12,5 
8,0 11,8 8.7 10.6 9.5 
11,1 10,2 11.1 9,9 9.8 
11,6 15,1 12,5 6,5 7,5 
10,0 12,9 9.2 10.0 12.8 
12,5 9,3 10,4 12,7 10,5 
9,3 11,5 10,7 11 ,6 7,8 
10,5 7.6 10.1 8.9 8.6 
a. Calcule a média aritmética, a variância e o desvio-padrão para essa 
população. 
b. Que proporção desses estabelecimentos comerciais possui recibos 
de recolhimento de impostos sobre vendas no trimestre com valores 
entre ± 1 desvio-padrão em relação à média aritmética? 
c. Compare e contraponha suas descobertas com aquilo que seria espe-
rado com base na regra empírica. Você está surpreso com os resul-
tados em (b)? 
3.24 Considere uma população de 1.024 fundos mútuos que investiu 
principalmente em empresas de grande porte. Você determinou que fJ., 
a média aritmética de retorno percentual total para 1 ano, alcançada 
por todos os fundos, é igual a 8,20, e que c:r, o desvio-padrão. é igual a 
2.75. Além disso, suponha que você tenha determinado que a amplitude 
nos retornos totais para 1 ano se estenda desde - 2,0 até 17, I, e que os 
quanis sejam 5,5 (Q1) e 10.5 (Q3) . De acordo com a regra empírica. que 
percentual desses fundos se espera que esteja 
a. contido entre ± 1 desvio-padrão de distância em relação à média 
aritmética? 
b. contido entre ±2 desvios-padrão de distância em relação à média 
aritmética? 
c. De acordo com a regra de Chebyshev, que percentual desses fundos 
se espera que esteja contido entre ± 1, ±2 e ±3 desvios-padrão em 
relação à média aritmética? 
d De acordo com a regra de Chebyshev, espera-se que pelo menos 
93.75% desses fundos apresentem retornos totais para 1 ano entre 
quais dois valores? 
3..25 Os dados no arquivo ativos)@ representam os ativos, em bilhões 
de dólares, dos cinco maiores fundos de ações. 
3.4 ANÁLISE EXPLORATÓRIA DE DADOS 
M EDIDAS NUM~RICAS DESCRITIVAS 109 
Fundo 
American Fu11ds Gro; A 
Vanguard 500 Index; lnv 
American Funds ICA: A 
American Funds Wsh; A 
Fidelity Contrafund 
Ativos 
73,6 
69,4 
67,0 
62.4 
60,1 
a. Calcule a média aritmética para essa população dos 5 maiores fundos 
de ações. Interprete esse parâmetro. 
b. Calcule a variância e o desvio-padrão para essa população. Interprete 
esses parâmetros. 
c. Existe uma grande parcela de variabilidade nos ativos desses fu ndos 
de ações? Explique. 
3~26 Os dados no arquivo ..eo.ergia.xls_ contêm o consumo de energia, 
per capita, e m quilowatts/hora, para cada um dos 50 estados e o Distrito 
de Columbia, durante um ano recente. 
a. Calcule a média aritmética, a variãncia e o desvio-padrão para essa 
população. 
b. Que proporção desses estados apresenta uma média de consumo 
de energia, per capita. entre ± 1 desvio-padrão em relação à média 
aritmética, entre ± 2 desvios-padrão em relação à média aritmética 
e entre ±3 desvios-padrão em relação à média aritmética? 
c. Compare e contraponha suas descobertas com aquilo que seria espe-
rado com base na regra empírica. Você está surpreso com os resul-
tados em (b)? 
d. Repita os procedimentos de (a) a (c), excluindo o Distrito de 
Columbia. De que modo os resultados se alteraram? 
3..27 Trinta empresas compõem a DTIA (Dow Jones Industrial Average 
- Média Industrial Dow Jones). Qual o porte dessas empresas? Um 
método habitual de mensurar o porte de uma empresa COJTesponde a 
utilizar a capitalização de mercado. que é calculada tomando-se o número 
de quotas de ações multiplicado pelo preço de uma quota de ações. Em 4 
de ab1il de 2006, a capitalização de mercado para essas empresas variou 
de 3,55 bilhões de dólares para a Hewlett-Packard até 376,64 bilhões de 
dólares para a Exxon-Mobil. A população inteira de valores para capita-
lização de mercado está registrada no arquivo dowmc..xls... 
Fonte: Exrraído de mouey.cnn.com, 4 de abril de 2006. 
a. Calcule a média aritmética e o desvio-padrão da capitalização de 
mercado para essa população de 30 empresas. 
b. Interprete os parâmetros calculados em (a). 
As Seções 3.1 -3.3 tratam de medidas de tendência central, variação e formato . Um outro método para 
descreverdados numéricos se dá por meio da análise exploratória de dados, que inclui o resumo de 
cinco números e o box-plot (referências 3 e 4). 
O Resumo de Cinco Números 
Um resumo de cinco números, que consiste em: 
Xmeoor Ql Mediana Q, Xmaior 
proporciona um método para determinar o formato de uma distribuição. A Tabela 3.7 explica o modo como 
as relações entre os "cinco números" permite que você reconheça o formato de um conjunto de dados. 
Para a amostra que corresponde aos 1 O tempos para ficar pronto, o menor valor é 29 minutos, e 
o maior valor é 52 núnutos (veja os dados apresentados na seção sobre mediana). Os cálculos reali-
zados na Seção 3.1 mostram que a mediana = 39,5, Q1 = 35 e Q3 = 44. Por conseguinte, o resumo 
de cinco números é 
<iAnnotate iPad User>
Pencil
<iAnnotate iPad User>
Pencil
11 o CAPÍTULO ThÊS 
TABELA 3.7 
Relações entre o Resumo de Cinco Números e o Tipo de Distribuição 
Comparação 
A distância de Xmell(lf até a 
mediana versus a distância 
da mediana até x.,.;.,. 
A distância de X,,.00, até Q1 
versus a distância de Q~ 
até x, .. ;.,.. 
A distância de Q1 até a 
mediana versus a distância 
da mediana até Q3• 
--~··-~-----
Tipo de Distribuição 
Assimétrica à Esquerda Simétrica 
A distância de Xm<""' até a Ambas as distâncias 
mediana é maior do que a distância são iguais. 
da mediana até X,"-';0~ 
A distância de Xm • ..,. até Q1 é Ambas as distâncias 
maior do que a distância de são iguais. 
Q, até x maior 
A distância de Q1 até a mediana Ambas as distâncias 
é maior do que a distância da são iguais. 
mediana até Q3• 
29 35 39,5 44 52 
Assimétrica à Direita 
A distância de Xmenor até a 
mediana é menor do que a 
distância da mediana até X maior 
A distância de Xmcno< até Q1 é 
menor do que a distância de 
Q, até Xm•ior· 
A distância de Q1 até a 
mediana é menor do que a 
distância da mediana até Q3• 
A distância desde Xmenor até a mediana (39,5- 29 = 10,5) é ligeiramente menor do que a distância 
da mediana até Xmaior (52- 39,5 = 12,5). A distância de Xmenor até Q, (35- 29 = 6) é ligeiramente 
menor do que a distância de Q3 até X maior (52 - 44 = 8). Por conseguinte, os tempos para ficar pronto 
são ligeiramente assimétricos à direita. 
CALCULANDO O RESUMO DE CINCO NÚMEROS DOS RETORNOS ANUAIS DE TRÊS ANOS 
PARA FUNDOS MÚTUOS DE BAIXO CAPITAL, DO TIPO CRESCIMENTO E COM BAIXO RISCO 
Os 838 fu.ndos mútuos ( ~útuos.m) que fazem parte do cenário Utilizando a Estatística (veja o início do 
capítulo) estão classificados de acordo com a categoria (baixo capital, médio capital e grande volume de capital); 
com o tipo (de crescimento ou de valorização); e com o nível de risco dos fundos mútuos (baixo, médio e alto). 
Calcule o resumo de cinco números relativo aos retornos anuais de tTês anos para os fu ndos de crescimento de 
baixo capital e baixo risco (veja a tabela do Exemplo 3.1). 
SOLUÇÃO Com base em cálculos anteriores para os retornos anuais de três anos para os fundos de baixo 
capital com objetivo de crescimento e com baixo risco (veja os cálculos realizados para mediana e quartis no 
início deste capítulo), mediana = 22,4, Q1 = 20,8 e Q3 = 26.0. Além disso, o menor valor no conjunto de dados 
é 19,0, e o maior valor é 29,9. Por conseguinte, o resumo de cinco números é 
19,0 20,8 22,4 26,0 29,9 
As três comparações apresentadas na Tabela 3.7 são utilizadas para avaliar a assimetria. A distância de Xm•uoc 
até a mediana (22,4 - 19,0 = 3,4) é menor do que a distância (29,9- 22,4 7,5) a mediana até X...;or A distância 
de Xmcoor até Q1 (20,8 - 19,0 = 1,8) é menor do que a distância de Q3 até X., • .,, (29,9 - 26,0 = 3,9). A distância 
de Q1 até a mediana (22,4 - 20,8 = 1,6) é menor do que a distância da mediana até Q3 (26,0 - 22,4 = 3,6). 
Todas as três comparações indicam uma distribuição com assimetria à dire ita. 
O Box-Piot 
Um box-plot proporciona uma representação gráfica dos dados com base no resumo de cinco números. 
A Figtu-a 3.3 ilustra o box-plot relativo aos te mpos para ficar pronto. 
A linha vertical desenhada dentro da caixa (box, em .inglês) representa a mediana. A linha vertical 
ao lado esquerdo da caixa representa a localização de Q1, enquanto a linha vertical ao lado direito 
da caixa representa a localização de Q3• Por conseguinte, a caixa contém os 50% valores centrais. 
Os dados que correspondem aos 25% inferiores estão representados por uma linha (o bigode, ou 
whiskel; em inglês) que liga o lado esquerdo da caixa à localização do menOJ valor, x menor De modo 
semelhante, os dados que correspondem aos 25% superiores estão representados por uma liJ1ha (o 
bigode, ou whisker), que liga o lado direito da caixa a Xm,ior 
O box-plot dos tempos para ficar pronto, na Figura 3.3, indica uma assimetria muito sutil, uma 
vez que a distância entre a mediana e o valor mais a lto é ligeiramente maior do que a distância entre 
<iAnnotate iPad User>
Pencil
I ~ - - -------
FIGURA 3.3 
Box-plot relativo aos 
tempos para ficar pronto 
X_.. 
20 25 30 
MEDlDAS N UMÉRICAS DESCRITIVAS 111 
I I I 
O, Mediana 0 3 
35 40 
Tempo {minutos) 
45 50 
I 
I 
! 
x;,_ 
55 
o valor mais baixo e a mediana. Do mesmo modo, o bigode (whisker) à direita é Ligeiramente mais 
longo do que o bigode (whisker) à esquerda. 
IJ:ij&liflleMH .. .j OS BOX-PLOTS DOS RETORNOS ANUAIS DE TRES ANOS PARA FUNDOS MÚTUOS DE 
BAIXO CAPITAL, DO TIPO CRESCIMENTO E COM BAIXO RISCO 
fiGURA 3.4 
3cx-plots, elaborados 
'Jelo Microsoft Excel, 
~1ivos aos retornos 
s.-Jais de três anos de 
= _ 1dos de baixo risco, 
;éó'o risco e alto risco 
--=.: Seção E3. 4 para criar 
~Jei:v. 
Os 838 fundos mútuos ( Euodo_s..Mútu.Qs.x!~) que fazem parte do cenário Utilizando a Estatística (veja o início do 
capítulo) estão classificados de acordo com a categoria (baixo capital, médio capital e grande volume de capital): 
com o tipo (de crescimento ou de valorização); e com o nível de risco dos fundos mútuos (baixo, médio e alto). 
Construa o box-plot para os retornos anuais de 3 anos de fundos de baixo risco, médio risco e alto risco. 
SOLUÇÃO A Figura 3.4 é um box-plot. elaborado pelo Microsoft Excel, para o retorno anual de três anos de 
fundos com baixo risco, médio risco e alto risco. A mediana do retorno e os quartis são ligeiramente mais altos 
para os fw1dos de baixo risco e alto J·isco do que para os fundos de médio risco. Todos os três tipos de fundos 
são assimétricos à direita, em decorrência do longo bigode (whisker) superior. 
Retorno Anual de Três Anos, por Tipo de Risco 
Médio 
I I I 
; Alto 
I I I 
; Baixo 
I I I 
o 5 10 15 20 25 30 35 40 45 
A Figura 3.5 demonstra a relação entre o box-plot e o polígono pru·a quatro diferentes tipos de 
distribuição. (Observação: A área abaixo de cada polígono está dividida em quartis, correspondendo 
ao resumo de cinco números para o box-plot.) 
Os painéis A e D da Figura 3.5 são simétricos. Nessas distribuições, a média aritmética e a mediana 
são iguais. Além disso, o comprimento do bigode (whisker) esquerdo é igual ao comprimento do bigode 
(whisker) direito, e a linha mediana divide a caixa pela metade. 
O Painel B da Figura 3.5 é assimétrico à esquerda. Os poucos valores baixos distorcem a média 
aritmética em direção à cauda esquerda. Para essa distribuição assimétrica à esquerda, a assimetria 
indica que existe wna forte concentração de valores no ponto mais alto da escala (ou seja, o lado 
direito); 75% de todos os valores se encontram entre a extremidade direita da caixa (Q1) e o final do 
bigode (whisker) direito. Por conseguinte, o longo bigode (whisker) à esquerda contém somente os 
25% valores mais baixos, demonstrando a distorção da simetria nesse conjunto de dados. 
<iAnnotate iPad User>
Highlight
112 CAPÍTULO TREs 
FIGURA 3.5 
Box-plots e polígonos 
correspondentes para 
quatro distribuições 
r-----~-----1 r-------~--1 
Painel A 
Distribuição em formato de sino 
Painel B 
Distribuição assimétrica à esquerda 
r--~-------1 r--- i.____.____.t----i 
Painel C 
Distribuição assimétrica à direitaPainel D 
Distribuição retangular 
O Painel C da Figura 3.5 é assimétrico à direita. A concentração de valores está na extremidade 
inferior da escala (ou seja, no lado esquerdo do box-plot). Nesse caso, 75% de todos os valores de 
dados são encontrados e ntre o inicio do bigode (whisker) esquerdo (X01.,.,,) e a extremidade direita 
da caixa, Q3, enquanto os 25% de observações restantes estão dispersos ao longo do extenso bigode 
(whisker ) à direita, na extremidade superior da escala. 
SEÇÃO 3.4 
Aprendendo o Básico 
3.28 É apresentado, a segui r, um conjunto de dados, a pmtir de uma 
amostra de tamanho 11 = 6: 
7 4 9 7 3 12 
a. Faça a lista do resumo de cinco mímeros. 
b. Construa um box-plot e descreva o formato. 
c. Compare sua resposta em (b) com a resposta do P roblema 3.2(d). 
Discuta. 
3.29 É apresentado. a seguir. um conjunto de dados. a partir de uma 
amostra de tamanho 11 = 7: 
12 7 4 9 o 7 3 
a. Faça a lista do resumo de cinco números. 
b. Construa um box-plot e descreva o formato. 
c. Compare sua resposta e m (b) com a resposta do Problema 3.3(d). 
D iscuta. 
3.30 É apresentado, a seguir. um conjunto de dados, a partir de uma 
amostra de tamanho n = 5: 
7 -5 -8 7 9 
a. Faça a lista do resumo de cinco números. 
b. Constma um box-plot e descreva o formato. 
c. Compare sua resposta em (b) com a resposta do Problema 3.4(d). 
Discuta. 
Aplicando os Conceitos 
3.31 O arquivo de dados frango.xls contém o total de gordura, e m 
gramas por porção. de uma amostra de 20 sanduíches de frango de 
~~deias de lanchonetes. Os dados são os seguintes: 
7 8 4 
23 30 25 
5 
19 
16 
29 
20 
29 
20 
30 
24 
30 
19 
40 
30 
56 
Fonte: Extraída de ''Fast Food: Adding Health to the Menu". Consumer Reports, 
setembro de 2004. pp. 28-31. 
a . Faça a lista do resumo de cinco números. 
b. Construa um box-plot e descreva o formato. 
3.32 Os dados no arquivo vidabateria.XIs representam a vida úti l de 
baterias (em número de fotos tiradas) de máquin;1s fotográficas digitais 
de três megapixeJs: 
300 
260 
180 
35 
85 
380 
170 
120 
380 
110 
460 
240 
Fome: Exn·aída de ''Cameras: More Feawres inthe Mix", Consumer Reports, 
julho de 2005, pp. 14-18. 
a. Faça a lista do resumo de cinco números. 
b. Construa um box-plot e descreva o formato. 
3.33 O arquivo de dados parqu.etemático,xts contém dados sobre o 
preço do ingresso inicial (em$), para passes de um d ia em 10 parques 
temáticos nos Estados Unidos. 
58 63 41 42 29 50 62 43 40 40 
Fome: Extraída de C. Jackson e E. Gamerman. "Rethinking the Thrill Fac10r" . 
The Wall Street JOlu·naJ, 1 5· 16 de abril de 2006, pp. P 1 -P4. 
a. Faça a lista do resumo de c inco números. 
b. Construa um box-plot e descreva o formato dos dados. 
r/Airtõl 3.34 Os dados no arquivo bebidascafé.xls representam as 
~ calorias e a gordura (em gramas) de 16 onças de bebidas 
geladas de café. na Dunkin · Donuts e na Starbucks: 
' -- - - --- -
Produto Calorias Gordura 
I.:ed Mocha Swjrl Latte (leite 
integral), da Dunkin' Donuts 240 8,0 
C •ffee Frappuccino blended, da 
Sla!bucks 260 3,5 
C.. ffee Coolatta (creme). da 
Dunkin · Donms 350 22,0 
~tocha Expresso Café Gelado (leite 
auegral e creme·chantilly), da 
Starbucks 350 20,0 
' '"~Cha Frappuccino blended coffee 
... -reme chantilly), da Starbucks 420 16,0 
C'-ocolate Brownie Frappuccino 
.,lended coffee(creme chantilly), 
Ja Starbucks 510 22,0 
C~;x:olare Frappuccjno bJended 
Creme (creme chantilly). da 
S:.:lrbucks 530 19,0 
Focu: E.trraída de "Coffee as Ccmdy at Du11kill ' Domas and Starbucks," 
Cons:mner Repons,junho de 2004, p.9. 
a. Para cada uma das variáveis (calorias e gordura), faça a lista com o 
:esumo de cinco números. 
Construa um box-plot para calorias e para gordw·a. 
c. Que semelhanças e diferenças existem nas distribuições para calorias 
e para !!Ordura? 
3.35 Os-dados no arquivo (pQ'üpança.xls correspondem aos rendi-
._~ para uma conta no mercado monetário: um certificado de depó-
CDJ correspondente a l ano e um CD de 5 anos de 40 bancos no 
...3 Aórida. em 20 de dezembro de 2005 (extraído de Bankrate.com., 
:::e dezembro de 2005). 
a. ~ooa a li. ta com o resumo de cinco números para o rendimento de 
t:m:! conta no mercado monetário; um certificado de depósito (CD) 
de ..m ano e um CD de cinco anos. 
M EDIDAS N UMÉRICAS D ESCRITIVAS 113 
b. Construa um box-plot para o rendimento de uma conta no mercado 
monetário; um certificado de depósito (CD) de um ano e um CD de 
c inco anos. 
c. Que semel.hanças e que diferenças existem entre as distribuições para 
o rendimento de uma conta no mercado monetário; um certificado 
de depósito de um ano (CD); e um CD de 5 anos? 
3.36 Uma agência bancária localizada em um bairro comercial de 
uma cidade desenvolveu um processo de melhoria para o atendimento 
aos clientes no horário de pico do almoço, das 12h às 13h. O tempo de 
espera, em minutos (definido operacionalmente como o tempo decor-
rido entre o momento em que o cliente entra na fila até o seu atendi-
mento), correspondente a uma amostra de 15 clientes, durante esse 
intervalo de tempo, foi registrado ao longo do período de uma semana. 
Os resultados estão contidos no arquivo de dados Q_anco l.xls , e são 
apresentados a seguir: 
4,21 5,55 
4,50 6, 10 
3,02 5,13 4 ,77 
0.38 5,12 6,46 
2,34 
6,19 
3,54 3.20 
3,79 
Uma outra agência bancária, localizada em uma <Írea residencial, 
também está preocupada com o horário de pico do almoço, das 12h às 
13h. O tempo de espera, em minutos (definido operacionalmente como 
o tempo decorrido entre o momento em que o cliente entra na fila até 
o momento em que é atendido), correspondente a uma amostra de 15 
clientes, durante esse intervalo de tempo, foi registrado ao longo do 
período de uma semana. Os resultados estão contidos no arquivo de 
dados ban_co2.&s , e são apresentados a seguir: 
9,66 5,90 8,02 5,79 8,73 3,82 8,01 8,35 
10,49 6,68 5,64 4,08 6,17 9,91 5.47 
a. Faça a lista do resumo de cinco números. para os tempos de espera 
nas duas agências bancárias. 
b. Construa um box-plot e descreva o formato da distribuição, para cada 
uma das duas agências bancárias. 
c. Que semelhanças e que diferenças existem nas distribuições de tempo 
de espera nas duas agências bancárias? 
3.5 A COVARIÂNCIA E O COEFICIENTE DE CORRELAÇÃO 
Na Seção 2.5, você utilizou diagramas de dispersão para examinar visualmente a relação entre duas 
variáveis numéricas. Esta seção apresenta duas medidas numéricas que examinam a relação entre 
duas variáveis numéricas: a covariância e o coeficiente de CO!Telação. 
A Covariância 
A covariância mede a força ele uma relação linear entre duas variáveis numéricas (X e Y). A Equação 
(3. 1 6) define a covariância da amostra, e o Exemplo 3.16 ilustra o seu uso. 
A COVARIÂNCIA DA AMOSTRA 
J1 
L (X; - X)(Y; - f) 
cov('%. Y) = ""i=::.l _____ _ 
n-l 
(3.16) 
A covariância possui uma importante deficiência como medida da relação linear entre duas vaiiáveis 
numéricas. Uma vez que a covaríâncla pode assumiJ· qualquer valor, você não consegue determinar 
a força relativa da relação. Em outras palavras, você não consegue afirmar se o valor 6,83777 é uma 
indicação de uma relação forte ou de uma relação fraca. Para melhor determinar a força relativa da 
relação, você precisa calcular o coeficiente de correlação. 
<iAnnotate iPad User>
Pencil
<iAnnotate iPad User>
Pencil

Continue navegando