Baixe o app para aproveitar ainda mais
Prévia do material em texto
MEDIDAS NUMÉRICAS DESCRITIVAS 85 UTILIZANDO A ESTATÍSTICA@ Choice ls Yours (A Escolha É Sua) Parte li As tabelas e os gráficos que você preparou para a amosu-a de 838 fundos mútuos demonstraram ser úteis para os cJ ientes do serviço Choice Is Yours. No entanto, os clientes podem ter se sentido frustrados ao tentar avaliar o desempenho de fundos mútuos. Embora saibam como estão distribuídas as 838 taxas de retorno de três anos. eles não têm nenhuma idéia sobre qual seria uma taxa de retorno típica de três anos para uma determinada categoria de fu ndo mútuo, como, por exemplo, fundos de baixo risco, nem tampouco sabem como esse valor típico se compara aos valores típicos de ouu-as categorias. Eles também não têm nenhuma idéia sobre a extensão da variabilidade na taxa de retorno de três anos. Todos os valores são relativamente similares. ou estão incluídos valores muito baixos e valores muito elevados? Existe uma grande quantidade de valores baixos e apenas alguns poucos valores elevados. ou vice-versa, ou existe um número semelhante de valores baixos e valores elevados? De que modo você poderia ajudar os clientes a obterem respostas para essas perguntas, de tal modo que eles possam melhor avaliar os fundos mútuos? Os clientes no cenário Utilizando a Estatística estão fazendo perguntas relacionadas a variáveis numéricas. Ao resumir e descrever variáveis numéricas, você precisa se preparar no sentido de fazer mais do que simplesmente elaborar as tabelas e os gráficos discutidos no Capítulo 2. Você precisa considerar a tendência central. a variação e o formato de cada variável numérica. TENDÊNCIA CENTRAL Tendência central corresponde à extensão na qual todos os valores de dados se agrupam em torno de um valor central típico. VARIAÇÃO Variação corresponde ao montante de dispersão, ou spread. de valores em relação a um valor central. FORMATO Formato corresponde ao padrão da distribuição de valores do valor mais baixo para o mais alto. Este capítulo discorre sobre as maneiras pelas quais você pode mensurar a tendência central, a variação e o formato de uma variável. Você aprenderá, também, sobre a covariãncia e o coeficiente de correlação. os quais ajudam a mensurar a força da associação entre duas variáveis numéricag. O uso dessas medidas dará aos clientes dos serviços Choice Is Yours as respostas que eles buscam. 3.1 MEDIDAS DE TENDÊNCIA CENTRAl A maior parte dos conjuntos de dados mostra uma tendência distinta para um grupo em tomo de um ponto central. Quando as pessoas conversam sobre um "valor médio" ou "valor do meio" ou "valor mais freqüente", elas estão falando informalmente sobre a média aritmética, a mediana e a moda - três medidas de tendência central. A Média Aritmética A média aritmética (geralmente conhecida como média) é a medida de tendência central mais comum. A méclia aritmética é a única medida comum na qual todos os valores desempenham igual papel. A méclia aritmética serve como um "ponto de equilíbrio" em um conjunto de dados (como o ponto de apoio de uma gangorra). Você calcula a média aritmética por meio da soma de todos os valores numéricos observados para uma variável em um conjunto de dados, seguida pela cli\'isão desse total pelo número de valores no conjunto de dados. O símbolo X, conhecido como X-barra, é utilizado para representar a média arirrnética de u.ra:a amostra. Para uma amostra contendo n valores. a equação para a média aritmética de .:ma~ é escrita sob a forma 3 .1 Medidas Numéricas Descri til as UTILIZANDO A ESTATÍSTICA @ Choice Is Yours (A Escolha É Sua) Parte 11 MEDIDAS DE TENDÊNCIA CENTRAL A Média Aritmética A Mediana A Moda Quartis A Média Geométrica 3.4 ANALISE EXPLORATÓRIA DE DADOS O Resumo de Cinco Números O Box-Plot 3.5 A COVARIANCIA E O COEFICIENTE DE CORRELAÇÃO 3.2 VARIAÇÃO E FORMATO A Amplitude A Covariância O Coeficiente de Correlação 3.3 A Amplitude lnterquartil A Variãncia e o Desvio-Padrão O Coeficiente de Variação Escores Z Formaro Explorações Visuais: Explorando a Estatística Descritiva Resultados da Estatística Descritiva do Microsoft Excel MEDIDAS NUMÉRICAS DESCRITIVAS PARA UMA POPULAÇÃO A Média Aritmética da População A Variância da População e o Desvio-Padrão da Popu lação A Regra Empírica A Regra de Chebyshev 3.6 ARMADILHAS EM MEDIDAS DESCRITIVAS NUMÉRICAS E QUESTÕES ÉTICAS Questões Éticas SUPLEMENTO DO EXCEL PARA O CAPÍTULO 3 E3.1 Calculando Medidas de Tendência Central, Variação e Formato E3.2 Criando Diagramas de Escala de Pontos E3.3 Calculando Medidas para uma População E3.4 Criando Box-Piots E3.5 Calculando a Covariãncia E3.6 Calculando o Coeficiente de Correlação =- OBJETIVOS DO:AI?R.ENDIZADO • ' L Este capítulo ajudará você a aprender: A descrever as propriedades de tendência central, variação e formato, em dados numéricos A calcular medidas descritivas resumidas para uma população A construir e interpretar um box-pJot A descrever a covariância e o coeficiente de correlação 86 CAP(TULO TRÊS Soma dos valores x = ------------- Número de valores Utilizando a série X1, X2, ••• ,X, para representar 9 conjunto de n valores e n para representar a quan- tidade de valores, a equação passa a ser - X 1 +X2 + ··· +X X = 11 /1. Ao utilizar a notação de somatório (discuüdaexaustivamentenoApêndice B), você substitui o nume- 11 rador X1 + X2 + ... +X" pelo termo I, X;, que significa o somatório de todos os valores X;, desde i=l o primeiro valor de X, X1, até o último valor de X, X11, para fonnar a Equação (3.1), uma definição formal da média aritmética da amostra. MÉDIA ARITMÉTICA DA AMOSTRA A média aritmética da amostra corresponde à soma dos valores, djvidida pelo número de valores. em que 11 11 I,x; X = i=L n X = média aritmética da amostra n = número de valores ou tamanho da amostra X; = i-ésimo valor da variável X I, X; = somatório de todos os valores X; na amosh·a i=l (3.1) Como todos os valores desempenham igual papel, uma média aritmética é f01temente afetada por qualquer valor que seja extremamente diferente dos outros no conjunto de dados. Ao se deparar com tais valores extremos, você deve evitar o uso da média aritmética. A média aritmética pode sugerir um valor típico, ou central, para um determinado conjunto de dados. Por exemplo, se você conhecesse o tempo típico necessário para se aprontar na parte da manhã, você seria capaz de planejar melhor a sua manhã e minimizar atrasos excessivos (ou chegadas com demasiada antecedência) em seu destino. Suponha que você defina o tempo necessário para se aprontar como o tempo (arredondado para o minuto mais próximo) desde o momento em que você levanta da cama até sair de casa. Você coleta os tempos mostrados a seguir, para 10 dias de trabalho consecutivos (armazenados no arquivo de dados tempns:xls,): Dia: 1 Tempo (minutos): 39 2 29 3 43 4 52 5 39 6 44 7 40 8 31 A média aritmética do tempo é 39,6 minutos, calculada do seguinte modo: X= Soma dos valores Número de valores 11 I,x; X =i=)_ n 39 + 29 + 43 + 52 + 39 + 44 + 40 + 31 + 44 + 35 X =--------------------------------- 10 x =396 = 39 6 10 ' 9 44 10 35 <iAnnotate iPad User> Pencil MEDIDAS NUMÉRICAS DESCRITIVAS 87 Embora nenhum dia na amostra tenha efetivamente apresentado o valorconespondente a 39,6 minutos, calcular aproximadamente 40 minutos para ficar pronto seria uma boa regra para planejar suas manhãs. A média ari tmética é uma boa medida de tendência centxal nesse caso, uma vez que o conjunto de dados não contém quaisquer valores excepcionalmente pequenos ou grandes. Considere um caso em que o valor no Dia 4 cotTesponda a 102 minutos, em vez de 52 minutos. Esse valor extremo faz com que a média aritmética suba para 44,6 minutos, como se segue: X Soma dos valores Número de valores 11 L, x; X=l=.L__ n X = 446 = 446 10 ' O único valor extremo fez crescer a média aritméticaem mais de 10%, de 39,6 para 44,6 minutos. Em contraposição à média aritmética original, que estava no "meio" (ou seja, maior do que 5 dos tempos para ficar pronto e menor do que os outros 5 tempos), a nova média aritmética é maior do que 9 entre os 1 O tempos para ficar pronto. Em decorrência do valor extremo, a média aritmética é, agora, uma medida precária de tendência central. IJ:Jj{,liiJiaWI. A MÉDIA ARITMÉTICA DO RETORNO ANUAL DE TRÊS ANOS DE FUNDOS MÚTUOS DE BAIXO CAPITAL, COM OBJETIVO DE CRESCIMENTO E COM BAIXO RISCO Os 838 fundos mútuos (.tuna:uSM!ltu~s) que fazem parte do cenário Utilizando a Estatística (veja o início do capítulo) estão classificados de acordo com a categoria (baixo capital, médio capital e g rande volume de capital); com o tipo (de crescimento ou de valorização); e com o nível de risco dos fu ndos mtítuos (baixo. médio e al to). Você está particularmente interessado em pequenas empresas com um grande potencial de crescimento. Além disso, você deseja investigar somente aqueles fundos com baixo risco. Assim, você classifica os dados sobre fundos múntos e aloca esses fundos que estão classificados como especializados em empresas com baixo volume de capital, de crescimento e que são consideradas de baixo risco. As sete empresas a seguir atendem a todos esses critérios: Retorno de Fundo Categoria Objetivo Risco Três Anos Baron Growth Baixo Capital Crescimento Baixo 20,8 Columbia Acorn Z Baixo Capital Crescimento Baixo 26.0 FBR Small Cap Baixo Capital Crescimento Baixo 24.9 Perritt Micro Cap Opportunities Baixo Capital Crescimento Baixo 29,9 Schroder Capital US Opportun.ities In v Baixo Capital Crescimento Baixo 22,3 Value Line Emerging Opportunities Baixo Capital Crescimento Baixo 19.0 Wells Fargo Advtg Small Cap Opp Adm Baixo Capital Crescimento Baixo 22,4 Calcule a média aritmética do retorno anual de três anos, de fundos mútuos de baixo capital, com objetivo de c rescimento e baixo risco. SOLUÇÃO A média aritmética do retorno anual de três anos de fu ndos mútuos de baixo capi tal, com objetivo de crescimento e baixo risco é igual a 23,61 , calculada do seguinte modo: Soma dos valores Número de valores = 165•3 = 23 6143 7 ' 88 CAPiTULO TRÊS A disposição ordenada para os sete fundos de crescimento para empresas com baixo capital é: 19.0 20,8 22,3 22.4 24,9 26,0 29,9 Quatro desses retornos estão abaixo da média aritmética de 23,6 1, e três deles estão acima da média aritmética. A Mediana A mediana é o valor do meio em um conjunto de dados que tenha sido ordenado do maior para o maior. Metade dos valores é menor ou igual à mediana, e metade dos valores é maior ou igual ao valor da mediana. A meruana não é afetada por valores extremos, de tal modo que você pode utilizar a mediana quando estão presentes valores extremos. Para calcular a mediana para um conjunto de dados você inicialmente ordena os valores do menor para o maior e, depois. utiliza a Equação (3.2) para calcular a classificação do valor que corresponde à respectiva mediana. MEDIANA Mediana = n + L valoJ· na ordem de classificação 2 Você calcula o valor da mediana seguindo uma de duas regras: (3.2) • Regra I Se existir uma quantidade ímpar de valores no conjunto de dados, a mediana corresponde ao valor que está no meio na ordem de classificação. Regra 2 Se existi r uma quantidade par de valores no conjunto de dados, a mediana corresponde à média entre os dois valores que estão no meio na ordem de classificação. Para calcular a mediana para a mostra de 10 tempos para ficar pronto na parte da manhã, você clas- sifica os tempos da seguinte maneira: Valores na ordem de classificação: 29 31 35 39 39 40 43 44 44 52 Classificação: 2 3 4 5 6 7 8 9 lO t Mediana= 39,5 Uma vez que o resulta do da divisão de n = l por 2 é (1 O + l )/2 = 5,5 para essa amostra de 1 O valores, você deve utilizar a regra 2 e extJ·air a média entre o quinto valor e o sexto valor na ordem de classi- ficação, 39 e 40. Por conseguinte, a mediana é 39.5. A mediana de 39,5 significa que para a metade dos dias o tempo para ficar pronto é menor ou igual a 39,5 minutos. Nesse caso, a mediana de 39,5, correspondente ao tempo para ficar pronto, está muito próxima da média aritmética de 39,6 minutos, relativa ao tempo para ficar pronto. if!tjl1hljtM#. CALCULANDO A MEDIANA A PARTIR DE UMA AMOSTRA COM NÚMERO ÍMPAR DE VALORES Os 838 fundos mútuos (fundos Mútuos.xls) que fazem parte do cenário Utilizando a Estatística (veja o início do capítulo) estão classificados de acordo com a categoria (baixo capital, médio capital e grande volume de capital); com o tipo (de crescimento ou de valorização): e com o nível de risco dos fu ndos mútuos (baixo, médio e alto). Calcule o retorno anual de três anos para os fundos de baixo capital, com objetivo de crescimento e baixo risco. ~ - ---=----------- - - - -~-- - -------------------------~ MEDIDAS N UMÉRIC AS DESCRITIVAS 89 SOLUÇÃO Tendo em vis ta que o resultado da divisão de n + I por 2 é (7 + 1)/2 = 4, para essa amostra de tamanho 7. utilizando a Regra 1. a mediana con·esponde ao quano valor na ordem de classificação. Os retornos anuais de três anos para os sete fundos de baixo capital, do tipo crescimento e baixo risco (veja a tabela no Exemplo 3.1) estão ordenados do menor para o maior: Valores na ordem de classificação: 19.0 20.8 22.3 22.4 24.9 26.0 29.9 Classificação: 2 3 4 5 6 7 t Mediana= 39,5 A mediana do retorno anual de três anos é 22.4. Metade dos retornos anuais de três anos é menor ou igual a 22,4, enquanto a outra metade é igual ou maior do que 22,4. A Moda A moda é o valor que aparece com mais freqüência em um conjunto de dados. Do mesmo modo que a mediana, e diferentemente da média aritmética, valores extremos não afetam a moda. De um modo geral, não existe uma moda, ou existem várias modas em um conjunto de dados. Por exemplo, considere os dados sobre tempos para ficar pronto, mostrados a seguir: 29 31 35 39 39 40 43 44 44 52 Existem duas modas, 39 minutos e 44 minutos, pelo fato de cada um desses valores oconer duas vezes. ififjMiJI•WW. CALCULANDO A MODA Um gerente de sistemas encanegado da rede de uma empresa controla a quantidade de falhas no servidor que ocorrem em um dia. Calcule a moda para os dados a seguir, que representam a quantidade de falhas do servidor. ao longo de um dia, para as últimas duas semanas: 3 o 3 26 2 7 4 o 2 3 3 6 3 SOLUÇÃO A disposição ordenada para esses dados é o o 2 2 3 3 3 3 3 4 6 7 26 Tendo em vista que o valor 3 aparece cinco vezes, um número de vezes maior do que qualquer outro valor. a moda é 3. Por conseguinte, o gerente de sistemas consegue afirmar que a ocorrência mais comum é ha~er três falhas no servidor ao longo de um dia. Para esse conjunto de dados. a mediana também é igual a 3-. e a média aritmética é igual a 4.5. O valor extremo. 26, é um outlier. Para esses dados, a mediana e a moda medem a tendência central com mais eficácia do que a média aritmética. Um conjunto de dados não possui moda no caso em que nenhum dos valores seja "mais tipico". O Exemplo 3.4 apresenta um conjunto de dados sem uma moda. ilf3JM:J!•*H• DADOS SEM UMA MODA Calcule a moda para o retorno anual de três anos para os fundos de baixo capital, do tipo CTescimento (Fundos Mútuos.xls) e baixo risco (veja a tabela no Exemplo 3.1). SOLUÇÃO A disposição ordenada para esses dados é 19,0 20,8 22.3 22,4 24,9 26,0 29,9 Esses dados não possuem uma moda. Nenhum dos valores é mais típico porque cada valor aparece apenas uma única vez. ........... ____________________ _ 90 C APÍTULO TRÊS 1 Q,, a mediana e Q3 são, também, o 2SJ, o 5(Jl e o 7SJ percentis, respectivamente. As Equações (3.2), (3.3) e (3.4) podem ser expressas. de um modo geral, em termos do cálculo dos percentis: (p x 1 O(Jl percentil = p x (n + T) valor na ordem de classificação. Quartis Quartis dividem um conjunto de dados em quatro partes iguais - o primeiroquartil, Q1, divide os valores que correspondem aos 25 ,0% mais baixos, dos 75,0% que são maiores do que eles. O segundo quartil, Q2, é a mediana - 50% dos valores são menores do que a mediana e 50% são maiores. O terceiro quartil, Q3 , divide a parcela correspondente a 75,0% dos valores mais baixos dos 25,0% que são maiores do que eles. As Equações (3.3) e (3.4) definem o primeiro quartil e o terceiro quartil.1 PRIMEIRO QUARTIL, Q, 25.0% dos valores são menores ou iguais a Q., o primeiro quartil , e 75,0% são maiores ou iguais ao primeiro quartil, Q1• TERCEIRO QUARTIL, Q3 Q1 = n + 1 valor na ordem de classificação 4 (3.3) 75.0% dos valores são menores Oll iguais ao terceiro quartil, {1. e 25.0% são maiores ou iguais ao terceiro quartil. Q3• 3(n + 1) . Q3 = ---valor na ordem de classificação 4 Utilize as seguintes regras para calcular os quartis: (3.4) Regra 1 Se o resultado corresponder a um número inteiro, então o quartil é igual ao valor na ordem de classificação. Se, por exemplo, o tamanho da amostra for n = 7, o primeiro quartil, Q,, é igual a (7 + 1 )/4. = segundo valor na ordem de classificação. • Regra 2 Se o resultado for uma metade fracionada (2,5; 4,5 etc.), então o quartil é igual à média entre os valores correspondentes na ordem de classificação. Se, por exemplo, o tamanho da amostra n = 9, o primeiro quartil, Q1, é igual a (9 + 1)/4 = 2,5 valor na ordem de classificação, na metade do caminho entre o segundo valor e o terceiro valor na ordem de classificação. • Regra 3 Se o resultado não for um número inteiro ou uma metade fracionada, você arredonda o resultado até o número inteiro mais próximo e seleciona o valor na ordem de classificação corres- pondente . Por exemplo, se o tamanho da amostra n = 10, o primeiro quartil, Q1, é igual a (10 + 1)/4 = 2,75 valor na ordem de classificação. Arredonde 2,75 para 3 e utilize o terceiro valor na ordem de classificação. Para ilustrar o cálculo dos quartis para os dados sobre o tempo para ficar pronto, ordene os dados a seguir partindo do menor para o maior: Valores na ordem de classificação: 29 31 35 39 39 40 43 44 44 52 Classificação: 2 3 4 5 6 7 8 9 10 O primeiro quartil corresponde ao (n + 1)/4 = (10 + 1)/4 = 2,75 valor na ordem de classificação. Utilizando a Regra 3, você arredonda para cima até o terceiro valor na ordem de classificação. O terceiro valor na ordem de classificação para os dados sobre o tempo para ficar pronto corresponde a 35 minutos. Você interpreta o primeiro quartil igual a 35 como significando que em 25% dos dias o tempo para ficar pronto é menor ou igual a 35 minutos, enquanto em t3% dos dias o tempo para ficar pronto é maior ou igual a 35 minutos. • O terceiro quarti l corresponde ao 3(n + 1)/4 = 3(10 + I )/4 = 8,25 valor na ordem de classifi- cação. Utilizando a Regra 3, para quruíis, você arredonda esse valor para baixo, até o oitavo valor na ordem de classificação. O oitavo valor COITesponde a 44 minutos. Por conseguinte, em 75% dos dias o tempo para ficar pronto é menor ou igual a 44 minutos, enquanto em 'tS% dos dias o tempo para ficar pronto é maior ou igual a 44 minutos. 2 MEDIDAS NUMÉRICAS DESCRITIVAS 91 CALCULANDO OS QUARTIS Os 838 fundos mútuos CFuru:lo.s Mútuos~s) que fazem parte do cenário Utilizando a Estatística (veja o início do capitulo) estão classificados de acordo com a categoria (baixo capital. médio capital e grande volume de capital); com o tipo (de crescimento ou de valorização): e com o nível de risco dos fundos múruos (baixo. médio e alto). Calcule o primeiro quartil (Q1) e o terceiro quaJtil (Q3) correspondentes ao retorno anual de três anos para os fu ndos de baixo capital com objetivo de crescimento e com baixo risco. SOLUÇÃO Ordenados do menor para o maior, os retornos anuais de três anos para os sete fundos de baixo capital do tipo crescimento e com baixo risco (veja a tabela no Exemplo 3.1) são: Valores na ordem de classificação: 19,0 20,8 22.3 22,4 24.9 Classificação: 2 3 4 Para esses dados: Q1 = (n + l) valor na ordem de classificação 4 5 26,0 29,9 6 7 = 7 + 1 valor na ordem de classificação= 2~ valor na ordem de classificação 4 Portanto, utilizando a Regra 1. Q1 corresponde ao segundo valor na ordem de classificação. Como o segundo valor na ordem de classificação é 20,8, o primeiro quanil, Q, , é 20,8. Para encontrar o terceiro quartil, Q"": ;} Q 3(n + I) I d d I .fi -3 = -- 4 - v a o r na or em e c ass1 tcaçao = 3<7 + I) valor na ordem de classificação= 6~ valor na ordem de classificação 4 Portanto, utilizando a Regra 1, Q3 con·esponde ao sexto valor na ordem de classificação. Como o sexto valor na ordem de classificação é 26,0, o terceiro qmrtil, Q3, é 26. O primeiro qua1til coJTespondendo a 20,8 indica que 25% dos retornos são menores ou iguais a 20,8, e 75% são maiores ou iguais a 20,8. O terceiro quartil cotTespondendo a 26,0 indica que 75% dos retornos são menores ou iguais a 26,0. e 25% são maiores ou iguais a 26.0. A Média Geométrica A média geométrica mede a taxa de variação de uma variável ao longo do tempo. A Equação (3.5) define a média geoméu·ica. MÉDIA GEOMÉTRICA A média geométrica corresponde à n-ésima raiz do produto de n valores. x0 = (X1 x x2 x .. ·x X11 ) 11" (3.5) A média geométrica da taxa de retorno mede o percentual médio de retorno de um investimento ao longo do tempo. A Equação (3.6) define a média geométrica da taxa de retomo. MÉDIA GEOMÉTRICA DA TAXA DE RETORNO (3.6) em que R, corresponde à taxa de retorno no período i 92 CAPÍTULO TRÊS IJ3JMI:JI•Pi. Para ilustrar essas medidas, considere um investimento de $100.000 que foi reduzido para um valor de $50.000 ao final do Ano 1 e depois disso retornou a seu valor original de $100.000 ao final do Ano 2. A taxa de retorno desse investimento para o período de 2 anos corresponde a O (zero), uma vez que o valor inicial e o valor final do investimento permaneceram inalterados. Entretanto, a média aritmética das taxas anuais de retorno corresponde a: x = (-0.50)+ (l.OO) = 0,25. ou 25% 2 uma vez que a taxa de retorno para o Ano 1 é R = ( 50.000 - 100.000) = _ O 50 ou _ 50% I 100.000 ' ' e a taxa de retorno para o Ano 2 é R = ( 100.000- 50.000) = I OO ou IOO% 2 50.000 ' , Utilizando a Equação (3 .6), a média geométrica da taxa de retorno para os 2 anos é: ~ =[(I+ RI) X (1 + R2)J11" -1 =[(J + (-0,50)) X (I+ (1,0))]112 -1 = [(0,50) X (2,0))112 - I = [1.0]112 -I =1-1=0 Portanto, a média geométrica reflete, de maneira mais precisa do que a média aritmética, a variação (zero) no valor do investimento para o período de 2 anos. CALCULANDO A MÉDIA GEOMÉTRICA DA TAXA DE RETORNO A variação percentual no Índice Russell 2000 de preços de ações de 2.000 pequenas empresas correspondeu a + 18,33% em 2004 e +4.55 em 2005. Calcule a taxa geométiica de retorno. SOLUÇÃO Utilizando a Equação (3.6). a média geométrica da taxa de retorno para o Índice Russell 2000. em relação aos dois anos, corresponde a Rc =[(I+ R1)x(l + Rú] 11 " -1 = f(l + (0, 1833)) X (I + (0,0455))]112 - I =[(I ,1833) X (1 .0455)]112 -I =[1,23714]112 -I = 1,1123- I= 0,1123 A média geométrica ela taxa de retomo para o Índice Russell 2000 em relação aos dois anos con·esponcle a 11,23%. 3.2 VARIAÇÃO E FORMATO Além da tendência central, todo conjunto de dados pode ser caracterizado por sua variação e seu formato. A variação mede o spread, ou dispersão, dos valores em um conjunto de dados. Uma medida simples de variação corresponde à amplitude, a diferença entre o maior valor e o menor valor. As medidas mais utilizadas na estatística são o desvio-padrão e a variância, duas medidas explicadas posteriom1ente nesta seção. O formato de um conjunto de dados representa um padrão para todos os valores, desde o menor valor até o maior valor. Confmme você aprenderá posteriormente nesta M EDIDAS NUM~RICAS DESCRITIVAS 93 seção, muitos conjuntos de dados apresentam um padrãoque se assemelha aproximadamente a um sino, com um pico de valores em algum lugar em seu centro. A Amplitude A amplitude é a medida descritiva numérica mais simples para a variação em um conjunto de dados. AMPLITUDE A amplitude é igual ao maior valor menos o menor valor. Ampl itnde = Xmmr - X,..,,o, (3.7) Para determinar a amplitude dos tempos necessários para ficar pronto na parte da manhã, você ordena os dados partindo do menor para o maior: 29 31 35 39 39 40 43 44 44 52 Utilizando a Equação (3.7), a amplitude é igual a 52 - 29 = 23 minutos. A amplitude de 23 minutos indica que a maior diferença entre quaisquer dois dias no tempo para ficar pronto na parte da manhã corresponde a 23 minutos. CALCULANDO A AMPLITUDE NOS RETORNOS ANUAIS DE TRÊS ANOS DE FUNDOS MÚTUOS DE BAIXO CAPITAL. DO TIPO CRESCIMENTO E BAIXO RISCO Os 838 fundos mtítuos ( Funaos Mútuos,((Js ) que fazem parte do cenário Utilizando a Estatística (veja o início do capítulo) estão classificados de acordo com a categoria (baixo capital , médio capital e grande volume de capital); com o tipo (de crescimento ou de valorização); e com o nível de risco dos fundos mútuos (baixo, médio e alto). Calcule a amplitude dos retornos anuais de três anos para os fundos de baixo capital com objetivo de crescimento e baixo risco (veja a tabela do Exemplo 3.1). SOLUÇÃO Ordenados do menor para o maior, os retornos anuais de três anos para os sete fundos de baixo capital de tipo crescimento e com baixo risco são: 19,0 20,8 22,3 22,4 24,9 26,0 29,9 Portanto, utilizando a Equação (3.7), a amplitude 29,9 - 19,0 = 10,9. A maior diferença entre quaisquer dois retornos corresponde a 10,9. A amplitude mede a dispersão total no conjunto de dados. Embora a amplitude seja uma medida simples da variação total nos dados, ela não leva em consideração o modo conw os dados estão distli- buídos entre o menor valor e o maior valor. Em outras palavras, a amplitude não indica se os valores estão distribuídos de maneira uniforme ao longo de todo o conjunto de dados se estão concentrados perto da parte central, ou se estão concentrados perto de um dos extremos ou de ambos os extremos. Por conseguinte, a utilização da amplitude como uma medida de variação pode induzir a erros quando pelo menos um valor corresponde a um valor extremo. A Amplitude lnterquartil A amplitude interquartil (também chamada de d ispersão média) conesponde à dife rença entre o terceiro quartil e o primeiro quartil em um conjunto de dados. AMPLITUDE INTERQUARTIL A amplitude interquartil corresponde à diferença entre o terceiro quartil e o primeiro quartil. Amplitude interquartil = Q~- Q, (3.8) A amplitude interquartil mede a dispexsão nos dados que estão entre as 50% observações centrais. Portanto, não é influenciada por valores extremos. Para determinar a amplitude interquartil corres- pondente aos tempos para ficar pronto 94 CAPÍTULO ThÊS 29 31 35 39 39 40 43 44 44 52 você utiliza a Equação (3.8) e os resultados anteriores ilustrados após a apresentação das regras para o cálculo de quartis, Q1 = 35 e Q3 = 44: Amplitude interguartil = 44 - 35 = 9 minutos Portanto, a amplitude interguartil para os tempos para ficar pronto corresponde a 9 minutos. A ampli- tude desde 35 até 44 é geralmente conhecida como cinqüenta do meio. ij3j lf11Qie4i:· · CALCULANDO A AMPLITUDE INTERQUARTIL DOS RETORNOS ANUAIS DE TRÊS ANOS PARA FUNDOS MÚTUOS DE BAIXO CAPITAL DO TIPO CRESCIMENTO E COM BAIXO RISCO Os 838 fundos mútuos (:W0::®S:.M[Wo.s::J<lsj) que fazem parte do cenário Uti lizando a Estatística (veja o início do capítulo) estão classificados de acordo com a categoria (baixo capital, médio capital e grande volume de capital); com o tipo (de crescimento ou de valorização): e com o nível de risco dos fu ndos mútuos (baixo, médio e alto). Calcule a amplitude interquartil dos retornos anuais de três anos para os fundos de baixo capital com objetivo de crescimento e com baixo risco (veja a tabela do Exemplo 3.1). SOLUÇÃO Ordenados do menor para o maior, os retOrnos anuais de três anos para os sete fundos de baixo capital do tipo crescimento e com baixo risco são: 19,0 20,8 22,3 22,4 24,9 26,0 29,9 Utilizando a Equação (3.8) e os resultados anteriores apresentados do Exemplo 3.5, Q, = 20,8 e Q3 = 26,0: Amplitude interquartil = 26,0-20,8 = 5,2 Portanto. a amplitude interquartil do retorno anual de três anos é igual a 5,2. Uma vez que a amplitude interquarti l não leva em consideração nenhum valor irúerior a Q1 ou superior a Q3, ela não pode ser afetada por valores extremos. Medidas resumidas tais como a mediana, Q1 e Q3 e a amplitude interquarti l, que não podem ser afetadas por valores extremos, são chamadas de medidas resistentes. A Variância e o Desvio-Padrão Embora a amplitude e a amplitude interquartil sejam medidas de variação, elas não levam em consi- deração o modo como os valores se distribuem ou se concentram entre os extremos. Duas medidas de variação habitualmente utilizadas que levam em consideração o modo como todos os valores nos dados estão distribuídos são a variância e o desvio-padrão. Essas estatísticas medem a dispersão "média" em torno da média aritmética - o modo como os valores mais altos flutuam acima dela e o modo como os dados mais baixos se distribuem abaixo dela. Uma medida de variação simples em torno da média aritmética poderia tomar a diferença entre cada um dos valores e a média aritmética e, depois, somar essas diferenças. No entanto, se você fizesse isso, descobriria que, uma vez que a média aritmética é o ponto de equilíbrio em um conjunto de dados, para todo conjunto de dados, essas diferenças somariam zero. Uma medida de variação que difere de conjunto de dados para conjunto de dados eleva ao quadrado a diferença entre cada valor e a média aritmética e, depois, soma essas diferenças elevadas ao quadrado. Na estatística, essa medida é chamada de soma dos quadrados (ou SQ). Essa soma é então dividida pelo número de valores menos l (para dados de amostras) no sentido de obter a variância da amostra (S2). A raiz quadrada da variância da amostra é o desvio-padrão da amostra (S). Como a soma dos quadrados corresponde à soma das diferenças elevadas ao quadrado que, com base nas regras da aritmética, será sempre um valor não-negativo, nem a variância nem o desvio- padrão podem, jamais, ser negativos. Para praticamente todos os conjuntos de dados, a variância e o desvio-padrão serão valores positivos, embora essas duas variáveis venham a ser iguais a zero caso não exista nenhuma variação, em absoluto, em um conjunto de dados e cada um dos valores na amostra for igual aos demais. Para uma amostra contendo n valores X1,X2, X3, •. • , X, a variância da amostra (dada pelo símbolo S2) é: <iAnnotate iPad User> Pencil <iAnnotate iPad User> Pencil <iAnnotate iPad User> Pencil <iAnnotate iPad User> Pencil MEDIDAS N UMÉRICAS DESCRITIVAS 95 A Equação (3.9) expressa a variância da amostra utilizando a notação de somatório, enquanto a Equação (3.1 O) expressa o desvio-padrão da amostra. VARIÂNCIA DA AMOSTRA A variância da amostra é a soma das diferenças em tomo da média aritmética elevad~s ao quadrado, di vi· dida pelo tamanho da amostra menos l . s2 = -";=::..!'---- n- I (3.9) em que X = média aritmética n = tamanho da amostra X; = i-ésimo valor da variável X " L (X; - X)2 = somatório de rodas as diferenças elevadas ao quadrado. entre os valores X, e X i=l DESVIO-PADRÃO DA AMOSTRA O desvio-padrão da amostra é a raiz quadrada da soma das diferenças em torno da média aritmética elevadas ao quadrado. dividida pelo tamanho da amostra menos um. ll I <x, - X)2 s = -fii = ..ci~,J ___ _ n - l (3.10) Se o denominador fosse nem vez de n- l , a Equação (3.9) [e o termo contido na Equação (3.10)] calcularia a média das diferenças em torno da média aritmética elevadas ao quadrado. No entanto. n - l é utilizado em virtude de certas propriedades matemáticas desejáveis,possuídas pela esta- tística SZ, que fazem com que ela seja apropriada para a inferência estatística (o que é discutido no Capítulo 7). À medida que cresce o tamanho da amostra, a diferença entre a divisão por n ou por n - 1 vai se tornando cada vez menor. É mais prOvéível que você venha a utilizar o desvio-padrão como sua medida de variação [definida pela Equação (3.1 0)]. Diferentemente da variância da amostra, que conesponde a um valor elevado ao quadrado, o desvio-padrão é sempre um valor que está na mesma unidade dos dados originais da amostra. O desvio-padrão ajuda você a conhecer o modo como um conjunto de dados se concentra ou se distribui em torno de sua média aritmética. Para quase todos os conjuntos de dados, a maioria dos valores observados está contida dentro do intervalo que tem como limites mais um desvio-padrão e menos um desvio-padrão, para cima e para baixo da média ruitmética. Por conseguinte. o fato de conhecer a média aritmética e o desvio-padrão geralmente ajuda a definir o local onde pelo menos a maioria dos valores de dados está se concentrando. Para calcular, manualmente, a variância da amostra, S\ e o desvio-padrão da amostra, S: Etapa 1. Calcule a diferença entre cada valor e a média aritmética.' Etapa 2. Eleve ao quadrado cada diferença. Etapa 3. Some as diferenças elevadas ao quadrado. Etapa 4. Divida esse total por n - L para obter a variância da amostra. Etapa 5. Calcule a raiz quadrada da variância da amostra para obter o desvio-padrão da amostra. A Tabela 3.1 mostra as quatro primeiras etapas para calcular a variância e o desvio-padrão para os dados sobre o tempo para ficar pronto na prute da manhã, com uma média aritmética (X) igual a 39,6. (Veja o inicio da Seção 3.1 , para o cálculo da média aritmética.) A segunda coluna da Tabela 3. L Claudio Highlight 96 CAPfTULO TRÊS TABELA 3.1 Calculando a Variância para os Tempos para Ficar Pronto X= 39,6 Tempo Etapa_!. : Etapa2: (X) (X;-X) (X;-XY 39 -0,60 0,36 29 - 10,60 112,36 43 3,40 11,56 52 12.40 153,76 39 -0,60 0,36 44 4,40 19,36 40 0,40 0,16 31 -8,60 73,96 44 4,40 19.36 35 -4,60 21.16 Etapa 3: Etapa4: Soma: Dividir por (n - 1): 412.40 45,82 mostra a etapa I. A terceira coluna da Tabela 3. 1 mostra a etapa 2. A soma das diferenças elevadas ao quadrado (etapa 3) é mostrada na parte inferior da Tabela 3. 1. Esse total é então dividido por 10 - 1 = 9 para calcular a variãncia (etapa 4). Você pode também calcular a variãncia substituindo por valores os termos da Equação (3.9): 11 "' -2 .L. (X;-X) s2 = .!;Í=:::>l ___ _ n.-1 (39 - 39.6)2 + (29 - 39,6)2 + ... + (35- 39,6i = ~----~--~----~------~--~~ 10-1 412,4 =--- 9 = 45,82 Uma vez que a variância é expressa em unidades elevadas ao quadrado (em minutos elevados ao quadrado, para esses dados), para calcular o desvio-padrão você calcula a raiz quadrada da variãncia. Utilizando a Equação (3.10), o desvio-padrão da amostra, S, é 11 L (X;- X)2 i = l = ,)45,82 = 6,77 n - l lsso indica que os tempos para ficar pronto, nessa amostra, estão concentrados dentro dos limites de 6,77 minutos em torno da média aritmética que c01-responde a 39,6 minutos (ou seja, se concentrando entre X- IS,= 32,83 e X+ IS,= 46,37). De fato, 7 entre 10 tempos para ficar pronto se posicionam dentro dos limites desse intervalo. Utilizando a segunda coluna da Tabela 3.1, você pode calcular também a soma das diferenças entre cada valor e a média aritmética como sendo igual a zero. Para qualquer conjunto de dados, essa soma será sempre igual a zero: 11 L (X; - X) =O para todos os conjuntos de dados i=! Essa propriedade é uma das razões pelas quais a média aritmética é utilizada como a medida mais comum de tendência central. TABELA 3.2 Calculando a Variância dos Retornos An ua is de Três Anos para os Fundos Mútuos de Baixo Capital, com Objetivo de Crescimento e Baixo Risco MEDIDAS N UMÉRICAS D ESCRITIVAS 97 CALCULANDO A VARIÂNCIA E O DESVIO-PADRÃO PARA OS RETORNOS ANUAIS DE TRÊS ANOS PARA FUNDOS MÚTUOS DE BAIXO CAPITAL, DO TIPO CRESCIMENTO E COM BAIXO RISCO Os 838 fundos mútuos ( FundosMútuos,xfs~ que fazem parte do cenário Utilizando a Estatística (veja o início do capítulo) estão classificados de acordo com a categoria (baixo capital, médio capital e grande volume de capital): com o tipo (de crescimento ou de valorização); e com o nível de risco dos fundos mútuos (baixo, médio e alto). Calcule a variância e o desvio-padrão dos retornos anuais de três anos para os fundos de baixo capital. com objetivo de crescimento, e com baixo risco (veja a tabela do Exemplo 3, I). SOLUÇÃO A Tabela 3.2 ilustra o cálculo da variância e do desvio-padrão para os retornos anuais de três anos dos fundos de baixo capital do tipo crescimento e com baixo risco, x = 23,6143 Retorno Anual de Três Anos Utilizando a Equação (3.9): 11 20,8 26,0 24.9 29.9 22,3 19.0 22,4 L (X;- X )2 52 = -"i-=.,1 ___ _ 11 - 1 Etapa_!. : (X;- X) - 2,8143 - 2,3857 1.2857 6.2857 - 1,3143 - 4.6143 - 1,2143 Etapa3: Soma: 79.2686 Etapa 2: (X, - X)l 7,9202 5,6916 1,6531 39,5102 1,7273 21,2916 1,4745 Etapa4: Dividir por (n - 1): 13,2114 = (20,8 - 23,6143)2 + (26,0 - 23,6143)2 + ... + (22,4 - 23,6143)2 7 -1 79,2686 6 = 13,2114 Util izando a Equação (3.10), o desvio-padrão da amostra, S, é igual a: 11 "' -2 .L)X; - X ) _:.;i=='---- = .Jl3,2J 14 = 3,635 n - 1 O desvio-padrão de 3.635 indica que os retornos estão concentrados deJ_!!ro dos limites de }..635 em tomo da média aritmética que corresponde a 23,6 1 (ou seja, concentrando-se entre X - JS = 19,975 e X + JS = 27,245). De fato, 71.4% (5 entre 7) dos retornos anuais de três anos estão contidos dentro dos limites desse intervalo. Os itens a seguir sintetizam as características da amplitude, da amplitude interquartil, da variância e do desvio-padrão: · Quanto mais espalhados ou dispersos forem os dados, maiores a amplitude, a amplitude inter- quartil, a variância e o desvio-padrão. • Quanto mais concentrados ou homogêneos forem os dados, menores a amplitude, a amplitude interqurutil, a vru·iância e o desvio-padrão. 98 CAPÍTULO TRÊS • Se os valores forem todos iguais (de modo· tal que não exista nenhuma variação nos dados), a amplitude, a amplitude interquartil, a variância e o desvio-padrão serão todos iguais a zero. • Nenhwna das medidas de variação (a amplitude, a amplitude interquartil, o desvio-padrão e a variância) pode jamais ser negativa. O Coeficiente de Variação Diferentemente das medidas de variação anterio1mente apresentadas, o coeficiente de variação é uma medida relativa de variação que é sempre expressa sob a forma de percentagem, e não em termos das unidades dos dados específicos. O coeficiente de variação, representado pelo símbolo CV, mede a dispersão dos dados em relação à média aritmética. O COEFICIENTE DE VARIAÇÃO O coeficiente de variação é igual ao desvio-padrão dividido pela média aritmética, multiplicado por 100%. em que cv = (~ }oo% S = desvio-padrão da amostra X= média aritmética da amostra (3.11) Para a amostra de 10 tempos para ficar pronto, uma vez que X = 39,6 e S = 6,77, o coeficiente de variação é ( s) (6,77) cv = -= 100% = - - 100% = 17,10% X 39,6 Para os tempos para ficar pronto, o desvio-padrão corresponde a 17,1% do tamanho da média arit- mética. O coeficiente de variação é bastante útil quando se comparam dois ou mais conjuntos de dados que são mensurados em unidades diferentes, como ilustra o Exemplo 3.10. i l ;tii'AijiSI''''' COMPARANDO DOIS COEFICIENTES DE VARIAÇÃO QUANDO DUAS VARIÁVEIS APRESENTAM DI FERENTES UNIDADES DE MEDIDA O gerente de operações de um serviço de entregas de encomendas está avaliando a compra de uma nova frota de caminhões. Quando as encomendas são cruTegadas nos caminhões, no preparo para a entrega. você precisa considerar dois importantes parâmetros - o peso (em quilos) e o volume (em metroscúbicos) para cada um dos itens. O gerente de operações extrai uma amostra de 200 pacotes e descobre que a média aritmética do peso é de 26,0 quilos, com um desvio-padrâo de 3.9 quilos, e a média aritmética do volume é de 8,8 metros cúbicos. com um desvio-padrão de 2.2 metros cúbicos. De que modo podem ser comparadas a variação do peso e a variação do volume? SOLUÇÃO Como as unidades de medida diferem para os parâmeu·os peso e volume, o gerente de operações deve comparru· a variabilidade relativa nos dois tipos de mensuração. Para peso, o coeficiente de variação é CVw = ( 3·9 )wo% = 15,0% 26,0 Para volume, o coeficiente de variação é C\fí, = (2•2 )wo% = 25,0% 8,8 Por conseguinte, em relação à média aritmética. o volume de encomendas é muito mais variável do que o peso das encomendas. <iAnnotate iPad User> Pencil ---- - - - . TABELA 3.3 Escores Z para os 1 O Tempos para Ficar Pronto M EDIDAS N UMÉRICAS D ESCRITIVAS 99 Escores Z Um valor extremo, ou outlier, é um valor localizado bem distante da média aritmética. Escores Z são úteis no sentido de identificar valores extremos. Quanto maior o escore Z, maior a distância do valor em relação à média aritmética. O escore Z corresponde à diferença entre o valor e a média aritmética, dividida pelo desvio-padrão. ESCORESZ X-X Z=-- S (3.12) Para os dados relacionados ao tempo para ficar pronto, a média aTitrnética é 39,6 minutos, e o desvio- padrão é 6 ,77 minutos. O tempo para ficar pronto no primeiro dia corresponde a 39.0 minutos. Você calcula o escore Z para o Dia 1 utilizando a Equação (3.12): x-x Z=-- S 39,0-39,6 6,77 = -0,09 A Tabela 3.3 mostra os escores 2 para todos os 10 dias. O maior escore Zé 1,83 para o Dia 4, no qual o tempo para ficar pronto correspondeu a 52 minutos. O menor escore Z foi - 1,57 para o Dia 2, no qual o tempo para ficar pronto correspondeu a 29 minutos. Como uma regra geral, o escore Z é considerado um valor extremo caso ele seja menor do que -3,0 ou maior do que + 3,0. Nenhum dos tempos atendeu a esse critério para ser considerado um valor extremo. Tempo (X) Escores Z 39 - 0,09 29 - 1,57 43 0,50 52 1,83 39 - 0,09 44 0,65 40 0,06 31 -1,27 44 0,65 35 -0,68 Média Aritmética 39.6 Desvio-padrão 6,77 CALCULANDO OS ESCORES Z DOS RETORNOS ANUAIS DE TRÊS ANOS PARA FUNDOS MÚTUOS DE BAIXO CAPITAL. DO TIPO CRESCIMENTO E COM BAIXO RISCO Os 838 fundos mútuos (l&Jndoa.Mútuos.J4s) que fazem parte do cenário Utilizando a Estatística (veja o início do capítulo) estão classificados de acordo com a categoria (baixo capital, médio capital e grande volume de capital): com o tipo (de crescimento ou de valorização); e com o nível de risco dos fundos mútuos (baixo, médio e alto). Calcule os escores Z em relação aos retornos anuais de três anos para os fundos de baixo capital com objetivo de crescimento e com baixo risco (veja a tabela apresentada no Exemplo 3. 1 ). SOLUÇÃO A Tabela 3.4 ilustra os escores Z em relação aos retornos anuais de três anos para os fundos de baixo capitaL do tipo crescimento e com baixo risco. O maior escore Zé 1,73, para um retorno anual de 29,9. O menor escore Zé - 1.27, para um retorno anual de 19.0. Não existem quaisquer valores extremos aparentes nesses dados, uma vez que nenhum dos escores Zé menor do que - 3 ou maior do que +3. <iAnnotate iPad User> Pencil 100 CAPiTULO TRÊS TABELA 3 .4 Escores Z para os Retornos Anuais de Três Anos, para os Fundos Mútuos de Baixo Capital, com Objetivo de Crescimento e Baixo Risco FIG URA 3 . 1 Uma comparação entre três conjuntos de dados que diferem em termos de formato Retorno ~nual de Três Anos Escores Z 20.8 -0.77 26.0 0,66 24,9 0,35 29,9 1,73 22,3 - 0.36 19,0 -1,27 22,4 -0,33 Média Aritmética 23,61 Desvio-padrão 3.63 .,r Formato Fonnato é o padrão da distribuição dos valores de dados ao longo do intervalo inteiro qne a totalidade de valores. Uma distribuição pode ser simétrica ou assimétrica. Em uma di,..--'-''----- simétr ica, os valores abaixo da média aritmética estão distribuídos exatamente do mesmo os valores acima da média aritmética. Nesse caso, os valores baixos e os valores altos se e.:; __ ....._ Em uma distribuição assimétrica, os valores não são simétricos em tomo de média aritm:...xli... assimetria resulta em um desequilíbrio dos valores baixos ou dos valores altos. O f01mato int1uencia a relação da média aritmética com a mediana dos seguintes mü<ks: • Média aritmética< mediana: negativa, ou assimétrica à esquerda • Média aritmética = mediana: simétrica, ou zero de assimetria Média aritmética> mediana: positiva, ou assimétrica à direita A Figura 3.1 ilustra três conjuntos de dados, cada um deles com um formato difereme Painel A Negativos. ou assimétricos à esquerda Painel B Simétricos Painel C Positivos, ou assimétrtcos a Os dados no Painel A são negativos, ou assimétricos à esquerda. Nesse painel, a maior~ valores está na parcela superior da distribuição. Uma longa cauda e uma distorção para a esq causadas por alguns valores extremamente pequenos. Esses valores extremamente pequec a média aritmética para baixo, de modo tal que a média aritmética é menor do que a meth.:!::::t. Os dados no Painel B são simétricos. Cada uma das metades da curva é um espellr ....., metade da curva. Os valores baixos e os valores altos na escala se equi libram, e a média...__....___ é igual à mediana. Os dados no Painel C são positivos. ou assimétr icos à direita. Nesse painel, a maior~ valores está na parcela inferior da distribuição. Uma longa cauda e uma djstorção para ~ são causadas por alguns valores extremamente grandes. Esses valores extremamente =- puxam a média aritmética para cima, de modo tal que a média aritmética passa a ser ma:. c a mediana. -- - -- - - - MEDIDAS N UMÉRICAS D ESCRITIVAS 101 EXPLORAÇÕES VISUAIS Explorando a Estatíst ica Descritiva Utilize o procedimento Descriptive Statistics (Estatística Descritiva), de Visual Explorations (Explorações Visuais). para observar o efeito de valores de dados que se •nodificam sobre as medidas de tendência, variação e formato. Abra a pasta de trabalho suple- mento explorações visuais.xla (veja o Apêndice D) e selecione VisuaiExplorations -? Descriptive Statistics (E:~..'Plorações Visuais -? Estatís tica Descri tiva) (Excel 97-2003) ou Suplem en tos -? Visual Explorations (Explorações Visuais) ~ Descriptive Statistics (Estatística D escritiva) (Excel 2007) da barra do menu do Microsoft Excel. Lera as instfllyões na caixa do tipo pop-up (veja a ilustração a seguir) e clique em OK para examinar o diagrama de escala de pGntos, para a amostra de lO tempos para ficar pronto, utilizada ao longo deste capítulo. Faça urna experiência inserindo um valor extremo, tal co1no 10 minutos, em uma das células com preenchimento da coluna A. Quais medidas são afetadas por essa mudança? Quais não são?Você pode alterna1· entre diagramas do tipo "antes" e "depois" pressionando repetidamente Ctrl + Z (desfazer), seguido por Ctrl + Y (refazer) para ajudar a verificar as modificações que o valor extremo causou no diagrama. "" !;113 ' t:f ('omlat«-fet"f~ Qodos f.f1Sto< ,!anela ~"""' A \Ida - (J X CMngethe val.Ms nlhe ti"«d c-e/1 ~.;.:, . ./ ·I'. ~ 1: · ' I kl lU~ 100'4 rtnQeA2:(4t t .!t'ldob'hVOthc -~.~ "'-'lothe 6ot ~~ .... I li ~~'••..ií "'j'l.ooo:O:~ ~~ ~-& · A·l! - li JJo.l>_ I ~ D E F G H I J K L " 2 29 I 3 31 Dot Scale 4 35 5 39 6 39 7 <:() a 43 9 44 . . 10 • 44 .. . .... . . V atues 11 52 ti[ i ' --Mean ~ o 20 60 80 Med~an ~ --1SIOuat1i!e ~-~~ ~ ... lJ .l --3rd Ouartile 1-)g - +f. I Std Oev ,.g ~ +f. 2 Std Dt!'i' ~ ~ I= +f. 3 Std Dev ~ ~-~ . ~ t ~ T ~~~ ~ _:c. " -~·.c.' 'it v t-;=', , "· Pii;, }.DotScaler I ~ > I "'"'*" IÚI - Resultados da Estatística Descritiva do Microsoft Excel O procedimento Estatística Descritiva do suplemento Ferramentas de Análise (veja a Seção E3.1) calcula a média aritmética, a mediana, amoda, o desvio-padrão, a variância, o intervalo (amplitude), o mínimo, o máximo, a soma e a contagem (tamanho da amostra), e exibe essas estatísticas em uma nova planilha. Além disso, o procedimento calcula e exibe o erro-padrão, a curtose e a assimetria, três estatísticas não discutidas anteriormente nesta seção. O erro-padrão, discutido no Capítulo 7, é o desvio-padrão di vi di do pela raiz quadrada do tamanho da amostra. A assimetria mede a falta de simetria nos dados. Um valor de assimetria correspondente a zero indica uma distribuição simétrica. Um valor positivo de assimetria indica uma assimetria à direita, enquanto um valor negativo de assimetria indica uma assimetria à esquerda. A curtose mede a concentração relativa de valores no centro da distribuição em comparação com as caudas. Um valor de cmtose igual a zero indica uma distribuição em formato de sino. Um valor negativo indica uma distribuição que tem um formato mais aplainado do que uma distribuição em formato de sino. Um valor positivo illdica um~ distribuição com um pico mais acentuado do que uma distribuição em formato de sino. A Figura 3.2 mostra os resultados da utilização do procedimento Estatística Descritiva para calcular resultados separados para fundos mútuos de baixo risco, de médio risco e de alto risco. (O proce- dimento foi utilizado três vezes, e os resultados que apareceram em três planilhas separadas foram consolidados em uma única planilha.)
Compartilhar