Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Probabilidade e EstatProbabilidade e Estatíísticastica Aula 1 Aula 1 –– Parte IIParte II 2 EstatEstatíística descritivastica descritiva � Objetivo: Resumir as caraterísticas de uma amostra através de Gráficos e Medidas Numéricas. � Gráficos ("A picture is worth one thousand words") � Histograma � Diagramas de Pareto � Gráficos de dispersão, gráficos da variável ao longo do tempo, gráficos de barras, etc... � Medidas Numéricas � Média amostral � Mediana amostral � Desvio padrão amostral � Variância amostral � Assimetria e Curtose amostrais � Percentis � Covariância, Correlação amostrais 3 PercentisPercentis � O Percentil p é calculado a partir da ordem de cada dado da amostra (Estatísticas de ordem) como segue: Onde: � p = percentil � ordem = ordem de um determinado dado da amostra ordenada de forma crescente. � n= tamanho da amostra %100. 1 1 − − = n ordemp total de elementos amostra 15 18 19 24 27 31 32 38 39 42 43 11 ordem 1 2 3 4 5 6 7 8 9 10 11 percentil 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% 4 PercentisPercentis -- ExemplosExemplos � O PERCENTIL x% É O PONTO TAL QUE, A PROBABILIDADE DE ESTAR ABAIXO DELE É x%. � Exemplo No. 1: O percentil do dado 32 é 60%. Qual o significado desse valor ? � Significa que o dado ordenado 32 é maior do que os primeiros 60% dos dados ordenados de forma crescente da amostra e ao mesmo tempo é menor que 40% dos dados da amostra. amostra 15 18 19 24 27 31 32 38 39 42 43 ordem 1 2 3 4 5 6 7 8 9 10 11 percentil 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% 5 PercentisPercentis � O percentil 50% é a MEDIANA de um conjunto de dados. � Qualquer percentil entre 0 e 100% pode ser encontrado através da função PERCENTIL do Excel. 6 QuartisQuartis � Dividindo os valores ordenados da variável (amostra ordenada) em quatro partes iguais, obtém-se um quartil para cada quarto definido como: � Primeiro Quartil: Q1 – é o percentil 25%, ou seja, 25% das observações estão abaixo de Q1 � Segundo Quartil: Q2 - é o percentil 50%, é também a mediana � Terceiro Quartil: Q3 – é o percentil 75% 7 QuartisQuartis � Fórmula Percentil: � Q1 = 25% ���� � Q2 = 50% ���� � Q3 = 75% ���� � Qualquer quartil pode ser encontrado através da função QUARTIL do Excel. 1 100 )1( +−= pnordem 4 31 4 1)1(1 100 25)1( +=+−=+−= nnnordem 2 11 2 1)1(1 100 50)1( +=+−=+−= nnnordem 4 131 4 3)1(1 100 75)1( +=+−=+−= nnnordem 8 Exemplo:Exemplo: Retorno diRetorno diáário do prerio do preçço do o do petrpetróóleo WTI leo WTI –– 01/1991 a 08/2006:01/1991 a 08/2006: HistogramaHistograma Histograma - Log Retornos Petróleo WTI - 1991 a 2006 0 100 200 300 400 500 600 700 800 - 1 3 . 1 % - 1 2 . 2 % - 1 1 . 3 % - 1 0 . 4 % - 9 . 5 % - 8 . 6 % - 7 . 7 % - 6 . 8 % - 6 . 0 % - 5 . 1 % - 4 . 2 % - 3 . 3 % - 2 . 4 % - 1 . 5 % - 0 . 6 % 0 . 3 % 1 . 2 % 2 . 0 % 2 . 9 % 3 . 8 % 4 . 7 % 5 . 6 % 6 . 5 % 7 . 4 % 8 . 3 % 9 . 2 % 1 0 . 0 % 1 0 . 9 % 1 1 . 8 % 1 2 . 7 % 1 3 . 6 % 1 4 . 5 % M o r e Bin F r e q u e n c y A grande maioria dos retornos diários (variações diárias) nesta faixa, mas também variações extremas 9 Exemplo: EstatExemplo: Estatíísticas Descritivassticas Descritivas –– Retorno do PetrRetorno do Petróóleo WTI leo WTI –– 01/1991 01/1991 a 08/2006a 08/2006 Estatísticas Descritivas - Retorno WTI - 1991 a agosto 2006 Média 0.017% Mediana 0.071% Moda 0.000% Desvio Padrão 2.38% Variância 0.001 Curtose 26.338 Assimetria -1.57 Amplitude 0.56 Mínimo -40.64% Máximo 15.38% Número de Obs. 3,836 10 Exemplo: Exemplo: PercentisPercentis –– Retorno do Retorno do PetrPetróóleo WTI leo WTI –– 01/1991 a 08/200601/1991 a 08/2006 5% -3.53% 10% -2.53% 25% -1.17% 50% 0.07% 75% 1.28% 90% 2.51% 95% 3.45% Percentis 5% dos retornos 5% dos retornos abaixo de abaixo de --3.53%3.53% 90% dos retornos 90% dos retornos abaixo de +2.51%abaixo de +2.51% 11 AnAnáálise dos Retornos do lise dos Retornos do IBOVESPAIBOVESPA � Considere agora os retornos diários do IBOVESPA no período entre 04 de julho de 1994 e 06/08/2004. � Defina o retorno diário entre os dias t e t + 1 como: � Onde log denota o logaritmo natural (base e) e Pt e Pt+1 são, respectivamente, os preços nos dias t e t + 1. � O retorno definido acima é chamado de retorno retorno geomgeoméétrico.trico. = + + t t t P PR 11 log 12 Exemplo: AnExemplo: Anáálise dos Retornos lise dos Retornos do IBOVESPAdo IBOVESPA -- HistogramaHistograma Histograma dos retornos diários do IBOVESPA 0 50 100 150 200 250 300 350 400 450 500 -7 .00% -6 .50% -6 .00% -5 .50% -5 .00% -4 .50% -4 .00% -3 .50% -3 .00% -2 .50% -2 .00% -1 .50% -1 .00% -0 .50% 0 .00% 0 .50% 1 .00% 1 .50% 2 .00% 2 .50% 3 .00% 3 .50% 4 .00% 4 .50% 5 .00% 5 .50% 6 .00% 6 .50% 7 .00% M ais Bloco F r e q ü ê n c i a no período entre 04 de julho de 1994 e 06/08/2004. 13 Exemplo: AnExemplo: Anáálise dos Retornos do lise dos Retornos do IBOVESPAIBOVESPA -- PercentisPercentis dos Retornosdos Retornos Percentil Retorno Correspondente 1.0% -6.75% 5.0% -3.90% 10.0% -2.74% 25.0% -1.24% 50.0% 0.13% 75.0% 1.48% 90.0% 2.69% 95.0% 3.66% 99.0% 6.63% 5% dos retornos 5% dos retornos abaixo de abaixo de --3.90%3.90% 90% dos retornos 90% dos retornos abaixo de +2.69%abaixo de +2.69% 14 AnAnáálise dos Retornos do lise dos Retornos do IBOVESPA IBOVESPA –– FunFunçção Freqão Freqüüência Excelência Excel �� USO DA FUNUSO DA FUNÇÇÃO ÃO ““FREQFREQÜÜÊNCIAÊNCIA””:: � Produz a freqüência (número de ocorrências num determinado intervalo). � Exemplo: dentre 2501 retornos diários do IBOVESPA, a referência: � FREQÜÊNCIA(E$3:E$2503;G7) significa: � Olhe para todos os dados em E$3 a E$2503 (são os retornos diários) e conte QUANTOS estão ABAIXO do valor em G7. � O gráfico destas frequências é mostrado na próxima página. 15 Exemplo: AnExemplo: Anáálise dos Retornos do lise dos Retornos do IBOVESPA IBOVESPA –– GrGrááfico Freqfico Freqüüências Acumuladasências Acumuladas Frequüências Acumuladas - Retornos Diários - 500 1,000 1,500 2,000 2,500 3,000 - 1 5 . 0 0 % - 7 . 0 0 % - 6 . 5 0 % - 6 . 0 0 % - 5 . 5 0 % - 5 . 0 0 % - 4 . 5 0 % - 4 . 0 0 % - 3 . 5 0 % - 3 . 0 0 % - 2 . 5 0 % - 2 . 0 0 % - 1 . 5 0 % - 1 . 0 0 % - 0 . 5 0 % 0 . 0 0 % 0 . 5 0 % 1 . 0 0 % 1 . 5 0 % 2 . 0 0 % 2 . 5 0 % 3 . 0 0 % 3 . 5 0 % 4 . 0 0 % 4 . 5 0 % 5 . 0 0 % 5 . 5 0 % 6 . 0 0 % 6 . 5 0 % 7 . 0 0 % 2 0 % 3 0 % 16 Exemplo: AnExemplo: Anáálise dos Retornos do lise dos Retornos do IBOVESPA IBOVESPA –– GrGrááfico Freqfico Freqüüências ências Relativas AcumuladasRelativas Acumuladas Frequüências Relativas Acumuladas - Retornos Diários 0% 5% 10% 15% 20% 25% 30% 35% 40% 45% 50% 55% 60% 65% 70% 75% 80% 85% 90% 95% 100% - 1 5 . 0 0 % - 7 . 0 0 % - 6 . 5 0 % - 6 . 0 0 % - 5 . 5 0 % - 5 . 0 0 % - 4 . 5 0 % - 4 . 0 0 % - 3 . 5 0 % - 3 . 0 0 % - 2 . 5 0 % - 2 . 0 0 % - 1 . 5 0 % - 1 . 0 0 % - 0 . 5 0 % 0 . 0 0 % 0 . 5 0 % 1 . 0 0 % 1 . 5 0 % 2 . 0 0 % 2 . 5 0 % 3 . 0 0 % 3 . 5 0 % 4 . 0 0 % 4 . 5 0 % 5 . 0 0 % 5 . 5 0 % 6 . 0 0 % 6 . 5 0 % 7 . 0 0 % 2 0 % 3 0 % � Se dividirmos cada uma destas freqüências acumuladas por 2501 (tamanho da amostra) obtemos as freqüências relativas acumuladas – veremos mais tarde que isso é uma aproximação para a função de distribuição acumulada. 17 Medidas de Assimetria e Curtose SIMETRIA E ASSIMETRIA: � As distribuições de freqüência diferem não apenas quanto ao valor médio mas também na forma � Pode-se assumir 3 formas diferentes de contorno de uma distribuição de freqüência de uma amostra. 3γ 18 Simetria e Assimetria � Na distribuição simétrica de freqüências, os valores de média e mediana coincidem. Md = Mediana X = Média 19 Simetria e Assimetria� Na distribuição não simétrica de freqüências, as medidas de tendência central têm posições relativas entre si. � Na figura (a) a distribuição tem inclinação para a direita, ou positiva. � Na figura (b) a distribuição tem inclinação para a esquerda, ou negativa. Md = Mediana X = Média 20 Assimetria Assimetria –– Coeficiente de Coeficiente de Assimetria Assimetria AmostralAmostral � O coeficiente de assimetria amostral é definido como: ( ) ( ) ( ) ( ) 2/3 1 2 1 3 2/3 1 2 1 3 3 1 1 − − = − − = ∑ ∑ ∑ ∑ = = = = n i i n i i n i i n i i XX XXn XX n XX n γ �� Se o coeficiente Se o coeficiente éé zero zero =>=> seus dados são simseus dados são siméétricos em torno da mtricos em torno da méédiadia �� Se o coeficiente Se o coeficiente éé positivo (assimetria positiva) positivo (assimetria positiva) =>=> existem valores existem valores ““grandesgrandes”” maiores que a mmaiores que a méédia dia =>=> existe uma cauda comprida para a direita.existe uma cauda comprida para a direita. 3γ 21 Assimetria Assimetria -- ResumoResumo � Na curva A acima a assimetria é positiva, a curva B é simétrica e a curva C tem assimetria negativa. � Em geral, se a assimetria é positiva, a média é MAIOR que a mediana. (curva A) � O oposto ocorre se a assimetria é negativa (em geral média MENOR que a mediana). (curva C) 22 Assimetria Assimetria -- ExemplosExemplos Distribution for PLD/B10 0.000 0.010 0.020 0.030 0.040 0.050 0.060 0.070 0.080 Mean=28.82446 0 35 70 105 1400 35 70 105 140 5% 90% 5% 18.8795 49.7419 Mean=28.82446 Dados com assimetria positiva Distribution for DEM REAL/B7 V alu e s in 10 ^ -6 Values in Millions 0 1 2 3 4 5 6 7 8 9 Mean=919999.9 0.75 0.8375 0.925 1.0125 1.10.75 0.8375 0.925 1.0125 1.1 5% 90% 5% .8459 .994 Mean=919999.9 Dados simDados siméétricostricos 23 CurtoseCurtose � É uma medida do “achatamento” de uma distribuição de probabilidade. � A fórmula do coeficiente de excesso de curtose k4 é definida como: � Como a distribuição Normal tem curtose igual a 3, usualmente define-se o “excesso de curtose”, ou seja, o quanto uma distribuição de probabilidade tem mais curtose que a Normal. ( ) ( ) 4 1 4 2 2 1 3 n i i n i i n X X X X κ = = − = − − ∑ ∑ 24 Curtose Curtose -- ExemplosExemplos � Note que, se os seus dados são Normais, esta medida é próxima de zero. � Distribuições de retornos de ativos financeiros geralmente tem a “cara” de uma Normal, mas com excesso de curtose! � Na Figura ao lado, � curva B é a Normal padrão � curva A tem excesso de curtose. 25 CurtoseCurtose � De acordo com o grau de curtose, podemos ter três tipos de curvas de freqüência: � Curva ou Distribuição de Freqüências Mesocúrtica; � Curva ou Distribuição de Freqüências Platicúrtica; � Curva ou Distribuição de Freqüências Leptocúrtica 26 CurtoseCurtose � Curva ou Distribuição de Freqüências Mesocurtica: quando a curva de freqüências apresenta um grau de achatamento equivalente ao da curva normal. Nem muito achatada, nem muito alongada. (k4 nulo) � Curva ou Distribuição de Freqüências Platicúrtica: quando uma curva de freqüências apresenta um alto grau de achatamento, superior ao da normal. (k4 negativo) � Curva ou Distribuição de Freqüências Leptocúrtica: quando uma curva de freqüências apresenta um alto grau de afilamento (alongamento), superior ao da normal. (k4positivo) 27 Curtose Curtose -- ResumoResumo K4 < 0 K4 = 0 K4 > 0 28 CurtoseCurtose � Esta medida de curtose (k4) permitem avaliar o grau de achatamento de uma distribuição, isto e, a forma como os valores se concentram em torno da sua media. � Se o coeficiente tiver um valor negativo, significa que os valores estão pouco concentrados em torno da média (e, consequentemente, a variação será elevada); � Se o coeficiente for positivo, existe uma forte concentração dos valores torno da média (e, consequentemente, a variação será pouco elevada); � Se o coeficiente for nulo ou muito próximo de zero, o achatamento da curva (isto é, a altura do “pico” da curva) corresponde a uma distribuição normal padrão.
Compartilhar