Buscar

Aula 1 - parte 2

Prévia do material em texto

1
Probabilidade e EstatProbabilidade e Estatíísticastica
Aula 1 Aula 1 –– Parte IIParte II
2
EstatEstatíística descritivastica descritiva
� Objetivo: Resumir as caraterísticas de uma amostra 
através de Gráficos e Medidas Numéricas.
� Gráficos ("A picture is worth one thousand words")
� Histograma
� Diagramas de Pareto
� Gráficos de dispersão, gráficos da variável ao longo do 
tempo, gráficos de barras, etc...
� Medidas Numéricas 
� Média amostral
� Mediana amostral
� Desvio padrão amostral
� Variância amostral
� Assimetria e Curtose amostrais
� Percentis
� Covariância, Correlação amostrais
3
PercentisPercentis
� O Percentil p é calculado a partir da ordem de 
cada dado da amostra (Estatísticas de ordem)
como segue:
Onde: 
� p = percentil
� ordem = ordem de um determinado dado da amostra 
ordenada de forma crescente. 
� n= tamanho da amostra
%100.
1
1
−
−
=
n
ordemp
total de 
elementos
amostra 15 18 19 24 27 31 32 38 39 42 43 11
ordem 1 2 3 4 5 6 7 8 9 10 11
percentil 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
4
PercentisPercentis -- ExemplosExemplos
� O PERCENTIL x% É O PONTO TAL QUE, A 
PROBABILIDADE DE ESTAR ABAIXO DELE É x%.
� Exemplo No. 1: O percentil do dado 32 é 60%. Qual o 
significado desse valor ?
� Significa que o dado ordenado 32 é maior do que os 
primeiros 60% dos dados ordenados de forma 
crescente da amostra e ao mesmo tempo é menor que 
40% dos dados da amostra.
amostra 15 18 19 24 27 31 32 38 39 42 43
ordem 1 2 3 4 5 6 7 8 9 10 11
percentil 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
5
PercentisPercentis
� O percentil 50% é a MEDIANA de um conjunto de 
dados. 
� Qualquer percentil entre 0 e 100% pode ser 
encontrado através da função PERCENTIL do 
Excel.
6
QuartisQuartis
� Dividindo os valores ordenados da variável
(amostra ordenada) em quatro partes iguais, 
obtém-se um quartil para cada quarto definido
como:
� Primeiro Quartil: Q1 – é o percentil 25%, ou 
seja, 25% das observações estão abaixo de Q1
� Segundo Quartil: Q2 - é o percentil 50%, é
também a mediana 
� Terceiro Quartil: Q3 – é o percentil 75%
7
QuartisQuartis
� Fórmula Percentil:
� Q1 = 25% ����
� Q2 = 50% ����
� Q3 = 75% ����
� Qualquer quartil pode ser encontrado através da 
função QUARTIL do Excel.
1
100
)1( +−= pnordem
4
31
4
1)1(1
100
25)1( +=+−=+−= nnnordem
2
11
2
1)1(1
100
50)1( +=+−=+−= nnnordem
4
131
4
3)1(1
100
75)1( +=+−=+−= nnnordem
8
Exemplo:Exemplo: Retorno diRetorno diáário do prerio do preçço do o do 
petrpetróóleo WTI leo WTI –– 01/1991 a 08/2006:01/1991 a 08/2006:
HistogramaHistograma
Histograma - Log Retornos Petróleo WTI - 1991 a 2006 
0
100
200
300
400
500
600
700
800
-
1 3
.
1 %
-
1 2
.
2 %
-
1 1
.
3 %
-
1 0
.
4 %
-
9 . 5
%
-
8 . 6
%
-
7 . 7
%
-
6 . 8
%
-
6 . 0
%
-
5 . 1
%
-
4 . 2
%
-
3 . 3
%
-
2 . 4
%
-
1 . 5
%
-
0 . 6
%
0 . 3
%
1 . 2
%
2 . 0
%
2 . 9
%
3 . 8
%
4 . 7
%
5 . 6
%
6 . 5
%
7 . 4
%
8 . 3
%
9 . 2
%
1 0
.
0 %
1 0
.
9 %
1 1
.
8 %
1 2
.
7 %
1 3
.
6 %
1 4
.
5 % M o
r e
Bin
F
r
e
q
u
e
n
c
y
A grande maioria dos 
retornos diários 
(variações diárias) 
nesta faixa, mas 
também variações 
extremas
9
Exemplo: EstatExemplo: Estatíísticas Descritivassticas Descritivas ––
Retorno do PetrRetorno do Petróóleo WTI leo WTI –– 01/1991 01/1991 
a 08/2006a 08/2006
Estatísticas Descritivas - Retorno WTI - 1991 a agosto 2006
Média 0.017%
Mediana 0.071%
Moda 0.000%
Desvio Padrão 2.38%
Variância 0.001
Curtose 26.338
Assimetria -1.57
Amplitude 0.56 
Mínimo -40.64%
Máximo 15.38%
Número de Obs. 3,836 
10
Exemplo: Exemplo: PercentisPercentis –– Retorno do Retorno do 
PetrPetróóleo WTI leo WTI –– 01/1991 a 08/200601/1991 a 08/2006
5% -3.53%
10% -2.53%
25% -1.17%
50% 0.07%
75% 1.28%
90% 2.51%
95% 3.45%
Percentis
5% dos retornos 5% dos retornos 
abaixo de abaixo de --3.53%3.53%
90% dos retornos 90% dos retornos 
abaixo de +2.51%abaixo de +2.51%
11
AnAnáálise dos Retornos do lise dos Retornos do 
IBOVESPAIBOVESPA
� Considere agora os retornos diários do 
IBOVESPA no período entre 04 de julho de 1994 e 
06/08/2004.
� Defina o retorno diário entre os dias t e t + 1 
como:
� Onde log denota o logaritmo natural (base e) e Pt
e Pt+1 são, respectivamente, os preços nos dias t e 
t + 1.
� O retorno definido acima é chamado de retorno retorno 
geomgeoméétrico.trico.






=
+
+
t
t
t P
PR 11 log
12
Exemplo: AnExemplo: Anáálise dos Retornos lise dos Retornos 
do IBOVESPAdo IBOVESPA -- HistogramaHistograma
Histograma dos retornos diários do IBOVESPA
0
50
100
150
200
250
300
350
400
450
500
-7
.00%
-6
.50%
-6
.00%
-5
.50%
-5
.00%
-4
.50%
-4
.00%
-3
.50%
-3
.00%
-2
.50%
-2
.00%
-1
.50%
-1
.00%
-0
.50%
0
.00%
0
.50%
1
.00%
1
.50%
2
.00%
2
.50%
3
.00%
3
.50%
4
.00%
4
.50%
5
.00%
5
.50%
6
.00%
6
.50%
7
.00%
M
ais
Bloco
F
r
e
q
ü
ê
n
c
i
a
no período entre 04 de julho de 1994 e 06/08/2004.
13
Exemplo: AnExemplo: Anáálise dos Retornos do lise dos Retornos do 
IBOVESPAIBOVESPA -- PercentisPercentis dos Retornosdos Retornos
Percentil Retorno Correspondente
1.0% -6.75%
5.0% -3.90%
10.0% -2.74%
25.0% -1.24%
50.0% 0.13%
75.0% 1.48%
90.0% 2.69%
95.0% 3.66%
99.0% 6.63%
5% dos retornos 5% dos retornos 
abaixo de abaixo de --3.90%3.90%
90% dos retornos 90% dos retornos 
abaixo de +2.69%abaixo de +2.69%
14
AnAnáálise dos Retornos do lise dos Retornos do 
IBOVESPA IBOVESPA –– FunFunçção Freqão Freqüüência Excelência Excel
�� USO DA FUNUSO DA FUNÇÇÃO ÃO ““FREQFREQÜÜÊNCIAÊNCIA””::
� Produz a freqüência (número de ocorrências num 
determinado intervalo).
� Exemplo: dentre 2501 retornos diários do IBOVESPA, 
a referência:
� FREQÜÊNCIA(E$3:E$2503;G7) significa:
� Olhe para todos os dados em E$3 a E$2503 (são 
os retornos diários) e conte QUANTOS estão 
ABAIXO do valor em G7.
� O gráfico destas frequências é mostrado na 
próxima página.
15
Exemplo: AnExemplo: Anáálise dos Retornos do lise dos Retornos do 
IBOVESPA IBOVESPA –– GrGrááfico Freqfico Freqüüências Acumuladasências Acumuladas
Frequüências Acumuladas - Retornos Diários
-
500
1,000
1,500
2,000
2,500
3,000
-
1 5
.
0 0
%
-
7 . 0
0 %
-
6 . 5
0 %
-
6 . 0
0 %
-
5 . 5
0 %
-
5 . 0
0 %
-
4 . 5
0 %
-
4 . 0
0 %
-
3 . 5
0 %
-
3 . 0
0 %
-
2 . 5
0 %
-
2 . 0
0 %
-
1 . 5
0 %
-
1 . 0
0 %
-
0 . 5
0 %
0 . 0
0 %
0 . 5
0 %
1 . 0
0 %
1 . 5
0 %
2 . 0
0 %
2 . 5
0 %
3 . 0
0 %
3 . 5
0 %
4 . 0
0 %
4 . 5
0 %
5 . 0
0 %
5 . 5
0 %
6 . 0
0 %
6 . 5
0 %
7 . 0
0 % 2 0
%
3 0
%
16
Exemplo: AnExemplo: Anáálise dos Retornos do lise dos Retornos do 
IBOVESPA IBOVESPA –– GrGrááfico Freqfico Freqüüências ências 
Relativas AcumuladasRelativas Acumuladas
Frequüências Relativas Acumuladas - Retornos Diários
0%
5%
10%
15%
20%
25%
30%
35%
40%
45%
50%
55%
60%
65%
70%
75%
80%
85%
90%
95%
100%
-
1 5
.
0 0
%
-
7 . 0
0 %
-
6 . 5
0 %
-
6 . 0
0 %
-
5 . 5
0 %
-
5 . 0
0 %
-
4 . 5
0 %
-
4 . 0
0 %
-
3 . 5
0 %
-
3 . 0
0 %
-
2 . 5
0 %
-
2 . 0
0 %
-
1 . 5
0 %
-
1 . 0
0 %
-
0 . 5
0 %
0 . 0
0 %
0 . 5
0 %
1 . 0
0 %
1 . 5
0 %
2 . 0
0 %
2 . 5
0 %
3 . 0
0 %
3 . 5
0 %
4 . 0
0 %
4 . 5
0 %
5 . 0
0 %
5 . 5
0 %
6 . 0
0 %
6 . 5
0 %
7 . 0
0 % 2 0
%
3 0
%
� Se dividirmos cada uma destas freqüências acumuladas por 2501 
(tamanho da amostra) obtemos as freqüências relativas acumuladas –
veremos mais tarde que isso é uma aproximação para a função de 
distribuição acumulada.
17
Medidas de Assimetria e Curtose
SIMETRIA E ASSIMETRIA:
� As distribuições de freqüência diferem não 
apenas quanto ao valor médio mas também na 
forma
� Pode-se assumir 3 formas diferentes de contorno 
de uma distribuição de freqüência de uma 
amostra.
3γ
18
Simetria e Assimetria
� Na distribuição simétrica de freqüências, os 
valores de média e mediana coincidem.
Md = Mediana
X = Média
19
Simetria e Assimetria� Na distribuição não simétrica de freqüências, as 
medidas de tendência central têm posições relativas 
entre si.
� Na figura (a) a distribuição tem 
inclinação para a direita, ou 
positiva.
� Na figura (b) a distribuição 
tem inclinação para a 
esquerda, ou negativa.
Md = Mediana
X = Média
20
Assimetria Assimetria –– Coeficiente de Coeficiente de 
Assimetria Assimetria AmostralAmostral
� O coeficiente de assimetria amostral é definido 
como:
( )
( )
( )
( )
2/3
1
2
1
3
2/3
1
2
1
3
3
1
1








−








−
=








−








−
=
∑
∑
∑
∑
=
=
=
=
n
i
i
n
i
i
n
i
i
n
i
i
XX
XXn
XX
n
XX
n
γ
�� Se o coeficiente Se o coeficiente éé zero zero 
=>=> seus dados são simseus dados são siméétricos em torno da mtricos em torno da méédiadia
�� Se o coeficiente Se o coeficiente éé positivo (assimetria positiva) positivo (assimetria positiva) 
=>=> existem valores existem valores ““grandesgrandes”” maiores que a mmaiores que a méédia dia 
=>=> existe uma cauda comprida para a direita.existe uma cauda comprida para a direita.
3γ
21
Assimetria Assimetria -- ResumoResumo
� Na curva A acima a 
assimetria é positiva, 
a curva B é simétrica 
e a curva C tem 
assimetria negativa.
� Em geral, se a 
assimetria é positiva, 
a média é MAIOR que 
a mediana. (curva A)
� O oposto ocorre se a 
assimetria é negativa 
(em geral média 
MENOR que a 
mediana). (curva C)
22
Assimetria Assimetria -- ExemplosExemplos
 Distribution for PLD/B10
 
0.000
0.010
0.020
0.030
0.040
0.050
0.060
0.070
0.080
 
 Mean=28.82446 
0 35 70 105 1400 35 70 105 140
 5% 90% 5%
 18.8795 49.7419 
 Mean=28.82446 
Dados com assimetria 
positiva
 Distribution for DEM REAL/B7
 
V
alu
e
s
 in
 10
^
 
-6
Values in Millions
0
1
2
3
4
5
6
7
8
9
 
 Mean=919999.9 
0.75 0.8375 0.925 1.0125 1.10.75 0.8375 0.925 1.0125 1.1
 5% 90% 5%
 .8459 .994 
 Mean=919999.9 
Dados simDados siméétricostricos
23
CurtoseCurtose
� É uma medida do “achatamento” de uma distribuição 
de probabilidade.
� A fórmula do coeficiente de excesso de curtose k4 é
definida como:
� Como a distribuição Normal tem curtose igual a 3, 
usualmente define-se o “excesso de curtose”, ou seja, 
o quanto uma distribuição de probabilidade tem mais 
curtose que a Normal.
( )
( )
4
1
4 2
2
1
3
n
i
i
n
i
i
n X X
X X
κ =
=
−
= −
 
− 
 
∑
∑
24
Curtose Curtose -- ExemplosExemplos
� Note que, se os seus dados são Normais, esta 
medida é próxima de zero.
� Distribuições de retornos de ativos financeiros 
geralmente tem a “cara” de uma Normal, mas 
com excesso de curtose!
� Na Figura ao lado, 
� curva B é a Normal 
padrão 
� curva A tem 
excesso de curtose.
25
CurtoseCurtose
� De acordo com o grau de curtose, podemos ter 
três tipos de curvas de freqüência:
� Curva ou Distribuição de Freqüências 
Mesocúrtica;
� Curva ou Distribuição de Freqüências 
Platicúrtica; 
� Curva ou Distribuição de Freqüências 
Leptocúrtica
26
CurtoseCurtose
� Curva ou Distribuição de 
Freqüências Mesocurtica: quando 
a curva de freqüências apresenta 
um grau de achatamento 
equivalente ao da curva normal. 
Nem muito achatada, nem muito 
alongada. (k4 nulo)
� Curva ou Distribuição de 
Freqüências Platicúrtica: quando 
uma curva de freqüências 
apresenta um alto grau de 
achatamento, superior ao da 
normal. (k4 negativo)
� Curva ou Distribuição de 
Freqüências Leptocúrtica: 
quando uma curva de freqüências 
apresenta um alto grau de 
afilamento (alongamento), 
superior ao da normal. (k4positivo)
27
Curtose Curtose -- ResumoResumo
K4 < 0 K4 = 0 K4 > 0
28
CurtoseCurtose
� Esta medida de curtose (k4) permitem avaliar o grau de 
achatamento de uma distribuição, isto e, a forma como os 
valores se concentram em torno da sua media. 
� Se o coeficiente tiver um valor negativo, significa que os 
valores estão pouco concentrados em torno da média (e, 
consequentemente, a variação será elevada); 
� Se o coeficiente for positivo, existe uma forte concentração 
dos valores torno da média (e, consequentemente, a 
variação será pouco elevada);
� Se o coeficiente for nulo ou muito próximo de zero, o 
achatamento da curva (isto é, a altura do “pico” da curva) 
corresponde a uma distribuição normal padrão.

Outros materiais

Materiais relacionados

Perguntas relacionadas

Materiais recentes

Perguntas Recentes