Buscar

Aula 01 - 02 - Estatistica

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 26 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 26 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 26 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

PPáágina gina -- 11/26/26PUCPUC--Rio Rio –– MarMarçço 2010o 2010
Banco de Dados: Data Banco de Dados: Data WarehousingWarehousing, , 
Data Data MiningMining e e 
Gestão do Conhecimento nas Gestão do Conhecimento nas 
EmpresasEmpresas
Prof. Hugo Azevedo
(hugo.azevedo@terra.com.br)
Prof. Sérgio Côrtes
(scortes@inf.puc-rio.br)
Resumir e DescreverResumir e Descrever
Dados NuméricosDados Numéricos
PPáágina gina -- 22/26/26PUCPUC--Rio Rio –– MarMarçço 2010o 2010
03.2 – Análise Estatística - 3/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes 
Resumir e Descrever
Dados Numéricos 
ƒƒ Objetivos Objetivos 
Explicar propriedades dos dados Explicar propriedades dos dados 
numéricosnuméricos
Descrever medidas de resumoDescrever medidas de resumo
Tendência CentralTendência Central
VariaçãoVariação
FormaForma
Analisar dados numéricos usando Analisar dados numéricos usando 
medidas de resumomedidas de resumo
03.2 – Análise Estatística - 4/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes 
Para Pensar
$400,000
$70,000
$50,000
$30,000
$20,000
... empregados alegam baixo 
pagamento -- a maioria dos 
trabalhadores ganha apenas 
$20.000 por ano.
... Presidente afirma que salário 
médio é $70.000 por ano!
PPáágina gina -- 33/26/26PUCPUC--Rio Rio –– MarMarçço 2010o 2010
03.2 – Análise Estatística - 5/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes 
Notação Padrão
Medida Amostra População
Média ⎯X μ
Desvio Padrão S σ
Variância S2 σ2
Tamanho n N
03.2 – Análise Estatística - 6/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes 
Propriedades dos Dados Numéricos
Tendência Central 
(Localização)
Variação 
(Dispersão)
Formato (forma)
PPáágina gina -- 44/26/26PUCPUC--Rio Rio –– MarMarçço 2010o 2010
03.2 – Análise Estatística - 7/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes 
Dados Numéricos 
Propriedades e Medidas
Propriedades
Média
Mediana
Moda
Média do Intervalo
Média das Juntas
Assimetria
Kurtose
Tendência Central Variação Formato
Amplitude
Variância
Desvio Padrão
Coeficiente de variação
Amplitude
Interquartil
Média Geométrica
03.2 – Análise Estatística - 8/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes 
Dados Numéricos 
Propriedades e Medidas
Central Tendency
Propriedades
Mean
Median
Mode
Midrange
Midhinge
Range
Variance
Standard Deviation
Coeff. of variation
Skew
Kurtosis
Variation Shape
Interquartile
Range
Geometric Mean
PPáágina gina -- 55/26/26PUCPUC--Rio Rio –– MarMarçço 2010o 2010
03.2 – Análise Estatística - 9/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes 
Dados Numéricos 
Propriedades e Medidas
Variação
Propriedades
Média
Mediana
Moda
Média do Intervalo
Média das Juntas
Assimetria
Kurtose
Tendência Central Formato
Amplitude
Variancia
Desvio Padrão
Coeficiente de variação
Amplitude
Interquartil
Média Geométrica
03.2 – Análise Estatística - 10/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes 
Tendência Central 
Média
ƒƒ Média aritmética dos valores dos dadosMédia aritmética dos valores dos dados
Média da amostraMédia da amostra
Média do UniversoMédia do Universo
1 1 2
n
i
i n
X
X X XX
n n
= + + += =
∑ L
1 1 2
N
i
i N
X
X X X
N N
μ = + + += =
∑ L
Tamanho da amostra
Tamanho da população
PPáágina gina -- 66/26/26PUCPUC--Rio Rio –– MarMarçço 2010o 2010
03.2 – Análise Estatística - 11/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes 
Tendência Central 
Média
ƒƒ Medida mais comum de Tendência Central Medida mais comum de Tendência Central 
ƒƒ Atua como ‘ponto de equilíbrio’Atua como ‘ponto de equilíbrio’
ƒƒ Afetada por valores extremos Afetada por valores extremos (“(“outliersoutliers”)”)
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14 
Média = 5 Média = 6
03.2 – Análise Estatística - 12/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes 
Tendência Central 
Exemplo de Média
ƒƒ Dados brutosDados brutos: 10.3 4.9 8.9 11.7 6.3 7.7: 10.3 4.9 8.9 11.7 6.3 7.7
X
X
n
X X X X X Xii
n
= = + + + + +
= + + + + +
=
=
∑
1 1 2 3 4 5 6
6
10 3 4 9 8 9 117 6 3 7 7
6
8 30
. . . . . .
.
PPáágina gina -- 77/26/26PUCPUC--Rio Rio –– MarMarçço 2010o 2010
03.2 – Análise Estatística - 13/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes 
Tendência Central 
Mediana
ƒƒ Robusta medida de tendência centralRobusta medida de tendência central
ƒƒ Valor do meio na seqüência ordenadaValor do meio na seqüência ordenada
Se n é ímpar, valor do meio da seqüênciaSe n é ímpar, valor do meio da seqüência
Se n é par, média dos valores do meioSe n é par, média dos valores do meio
ƒƒ Não é afetada por valores extremosNão é afetada por valores extremos
ƒƒ Posição da mediana na seqüênciaPosição da mediana na seqüência
2
1entoPosicionam de Ponto += n
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14 
Mediana = 5 Mediana = 5
03.2 – Análise Estatística - 14/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes 
Tendência Central 
Exemplo de Mediana 
Amostra de tamanho ímpar
ƒƒ Dados brutos : 24.1Dados brutos : 24.1 22.6 21.522.6 21.5 23.7 23.7 22.622.6
ƒƒ Ordenado: 21.5 22.6 Ordenado: 21.5 22.6 22.622.6 23.7 24.123.7 24.1
ƒƒ Posição:Posição: 1 2 1 2 33 4 54 5
6.22Mediana
0.3
2
15
2
1Ponto do Posição
=
=+=+= n
PPáágina gina -- 88/26/26PUCPUC--Rio Rio –– MarMarçço 2010o 2010
03.2 – Análise Estatística - 15/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes 
Tendência Central 
Exemplo de Mediana 
Amostra de tamanho par
ƒƒ Dados Brutos : 10.3Dados Brutos : 10.3 4.9 8.9 11.7 6.3 7.74.9 8.9 11.7 6.3 7.7
ƒƒ Ordenados: 4.9 6.3Ordenados: 4.9 6.3 7.77.7 8.98.9 10.3 11.710.3 11.7
ƒƒ Posição: 1 2Posição: 1 2 33 44 55 66
30.8
2
9.87.7Mediana
5.3
2
16
2
1Ponto do Posição
=+=
=+=+= n
03.2 – Análise Estatística - 16/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes 
Tendência Central 
Moda
ƒƒ Valor que ocorre mais freqüentementeValor que ocorre mais freqüentemente
ƒƒ Não é afetada por valores extremosNão é afetada por valores extremos
ƒƒ Pode não haver nenhuma ou haver váriasPode não haver nenhuma ou haver várias
ƒƒ Pode ser usada para dados numéricos e Pode ser usada para dados numéricos e 
categóricoscategóricos
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 
Mode = 9 No Mode
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 
Moda = 9 Sem moda
PPáágina gina -- 99/26/26PUCPUC--Rio Rio –– MarMarçço 2010o 2010
03.2 – Análise Estatística - 17/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes 
Tendência Central 
Exemplo de Moda
ƒƒ Nenhuma ModaNenhuma Moda
Dados brutos: 10.3 4.9 8.9 11.7 6.3 7.7Dados brutos: 10.3 4.9 8.9 11.7 6.3 7.7
ƒƒ Uma ModaUma Moda
Dados brutos: 6.3 Dados brutos: 6.3 4.94.9 8.9 6.3 8.9 6.3 4.9 4.94.9 4.9
ƒƒ Mais de 1 ModaMais de 1 Moda
Dados brutos: 21 Dados brutos: 21 28 2828 28 41 41 43 4343 43
03.2 – Análise Estatística - 18/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes 
Tendência Central 
Semi-amplitude 
(Média de Intervalo)
ƒƒ Meio da menor e maior observaçãoMeio da menor e maior observação
ƒƒ Afetada por valores extremosAfetada por valores extremos
2
Intervalo de Média máximomínimo XX +=
PPáágina gina -- 1010/26/26PUCPUC--Rio Rio –– MarMarçço 2010o 2010
03.2 – Análise Estatística - 19/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes 
Tendência Central 
Exemplo de Semi-amplitude
ƒƒ Dados BrutosDados Brutos: 10.3 4.9 8.9 11.7 6.3 7.7: 10.3 4.9 8.9 11.7 6.3 7.7
ƒƒ OrdenadosOrdenados: : 4.94.9 6.3 7.76.3 7.7 8.9 10.3 8.9 10.3 11.711.7
30.8
2
7.119.4
2
Int.deMédia=
+=
+= máximoXmínimoX
03.2 – Análise Estatística - 20/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes 
Tendência Central 
Média Geométrica
ƒƒ Útil na medida da taxa de mudança de uma Útil na medida da taxa de mudança de uma 
variável ao longo do tempovariável ao longo do tempo
ƒƒ Taxa de retorno média geométrica Taxa de retorno média geométrica 
Mede a situação de um investimento sobre o Mede a situação de um investimento sobre o 
tempo tempo 
( )1/1 2 nG nX X X X= × × ×L
( ) ( ) ( ) 1/1 21 1 1 1nG nR R R R= + × + × × + −⎡ ⎤⎣ ⎦L
PPáágina gina -- 1111/26/26PUCPUC--Rio Rio –– MarMarçço 2010o 2010
03.2 – Análise Estatística - 21/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes 
Tendência Central 
Média Geométrica - exemplo
Taxa média de retorno: 
Taxa geométrica de 
retorno: 
Um investimento de R$ 100.000 desceu a R$ 50.000 no fim de 
ano um e subiu a R$ 100.000 no fim de ano dois:
1 2 3$100,000 $50,000 $100,000X X X= = =
( 50%) (100%) 25%
2
X − += =
( )( ) ( )( )
( ) ( )
1/ 2
1/ 2 1/ 2
1 50% 1 100% 1
 0.50 2 1 1 1 0%
GR ⎡ ⎤= + − × + −⎣ ⎦
= × − = − =⎡ ⎤⎣ ⎦
03.2 – Análise Estatística - 22/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes 
Tendência Não-Central 
Quartis
ƒƒ Medida de tendência Medida de tendência nãonão--centralcentral
ƒƒ Parte (divide) os dados ordenados em Parte (divide) os dados ordenados em 
4 quartos4 quartos
25%25% 25%25% 25%25% 25%25%
QQ11 QQ22 QQ33
PPáágina gina -- 1212/26/26PUCPUC--Rio Rio –– MarMarçço 2010o 2010
03.2 – Análise Estatística - 23/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes 
Tendência Não-Central 
Quartís
ƒƒ Medida de tendência nãoMedida de tendência não--centralcentral
ƒƒ Parte dados ordenados em 4 quartos Parte dados ordenados em 4 quartos 
ƒƒ Posição do Posição do ii--ésimoésimo quartilquartil
( )
4
1 de Posição +⋅= niQ
i
25% 25% 25% 25%
Q1 Q2 Q3
03.2 – Análise Estatística - 24/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes 
Tendência Não-Central 
Exemplo de Quartil (Q1)
ƒƒ Dados brutosDados brutos: 10.3 4.9 8.9 11.7 6.3 7.7: 10.3 4.9 8.9 11.7 6.3 7.7
ƒƒ OrdenadosOrdenados: 4.9 : 4.9 6.36.3 7.7 8.9 10.3 11.77.7 8.9 10.3 11.7
ƒƒ PosiçãoPosição:: 1 1 22 33 44 5 65 6
( ) ( )
3.6Q
275.1
4
161
4
11Q de Posição
1
 1
=
≅=+⋅=+⋅= n
PPáágina gina -- 1313/26/26PUCPUC--Rio Rio –– MarMarçço 2010o 2010
03.2 – Análise Estatística - 25/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes 
Tendência Não-Central 
Exemplo de Quartil (Q2)
Dados brutosDados brutos:: 10.310.3 4.94.9 8.98.9 11.711.76.3 7.76.3 7.7
OrdenadosOrdenados:: 4.94.9 6.36.3 7.77.7 8.98.9 10.310.3 11.711.7
PosiçãoPosição :: 11 22 33 44 55 66
3.8
2
9.87.7Q
5.3
2
43Q de Posição
2
 2
=+=
=+=
03.2 – Análise Estatística - 26/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes 
Tendência Não-Central 
Exemplo de Quartil (Q3)
Dados brutosDados brutos: 10.3 4.9 8.9 11.7 6.3 7.7: 10.3 4.9 8.9 11.7 6.3 7.7
OrdenadosOrdenados:: 4.94.9 6.36.3 7.77.7 8.98.9 10.310.3 11.711.7
PosiçãoPosição :: 11 22 33 44 55 66
( ) ( )
3.10Q
525.5
4
163
4
13Q de Posição
3
 3
=
≅=+⋅=+⋅= n
PPáágina gina -- 1414/26/26PUCPUC--Rio Rio –– MarMarçço 2010o 2010
03.2 – Análise Estatística - 27/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes 
Tendência Central 
Média das Juntas (Midhinge)
ƒƒ Meio do 1Meio do 1oo e 3e 3oo quartísquartís
ƒƒ Não é afetado por valores extremosNão é afetado por valores extremos
2
juntasdasMédia 31 QQ
+=
03.2 – Análise Estatística - 28/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes 
Tendência Central 
Média das Juntas (Midhinge) : Exemplo
ƒƒ Dados brutos:Dados brutos: 10.3 4.9 8.9 11.7 6.3 7.710.3 4.9 8.9 11.7 6.3 7.7
ƒƒ Ordenados: 4.9 Ordenados: 4.9 6.36.3 7.7 8.9 7.7 8.9 10.310.3 11.711.7
ƒƒ Posição:Posição: 1 1 22 33 44 55 66
3.8
2
3.103.6
2
juntasdasMédia 31 =+=+= QQ
PPáágina gina -- 1515/26/26PUCPUC--Rio Rio –– MarMarçço 2010o 2010
03.2 – Análise Estatística - 29/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes 
Exercício
ƒƒ Você é um analista financeiro do Você é um analista financeiro do 
Banco XBanco X. Você coletou os seguintes . Você coletou os seguintes 
preços no fechamento de novos preços no fechamento de novos 
lançamentos de ações: lançamentos de ações: 17, 16, 21, 18, 17, 16, 21, 18, 
13, 16, 12, 11. 13, 16, 12, 11. 
ƒƒ Descreva os preços dos estoquesDescreva os preços dos estoques
em termos da em termos da tendência centraltendência central..
03.2 – Análise Estatística - 30/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes 
Resumo de Tendência Central
M easure Equation Description
M ean Σ X i / n Balance point
M edian (n+1) Position
 2
M iddle value when
ordered
M ode none M ost frequent
M idrange X Xsmallest l est+ arg
2
M iddle of sm allest
& largest
M idhinge Q Q1 3
2
+ M iddle of 1st &
3rd quartile where
Q i = i (n+1)/4
PPáágina gina -- 1616/26/26PUCPUC--Rio Rio –– MarMarçço 2010o 2010
03.2 – Análise Estatística - 31/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes 
Dados Numéricos 
Propriedades e Medidas
FormatoTendência Central
Propriedades
Média
Mediana
Moda
Média do Intervalo
Média das Juntas
Assimetria
Kurtose
Variação
Amplitude
Variância
Desvio Padrão
Coeficiente de variação
Amplitude
Interquartil
03.2 – Análise Estatística - 32/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes 
Medida de Variação 
Amplitude
ƒƒ Diferença entre a maior a menor Diferença entre a maior a menor 
observaçãoobservação
ƒƒ Ignora como os dados são distribuídosIgnora como os dados são distribuídos
Amplitude = Xmaior – Xmenor
7 8 9 10 11 12
Intervalo= 12 - 7 = 5
7 8 9 10 11 12
Intervalo = 12 - 7 = 5
7 8 9 10 11 12
Intervalo= 12 - 7 = 5
7 8 9 10 11 12
Intervalo = 12 - 7 = 5
PPáágina gina -- 1717/26/26PUCPUC--Rio Rio –– MarMarçço 2010o 2010
03.2 – Análise Estatística - 33/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes 
Medida de Variação 
Amplitude Interquartílica
ƒƒ Também chamada afastamento do meioTambém chamada afastamento do meio
ƒƒ Afastamento nos 50% do meio %Afastamento nos 50% do meio %
ƒƒ Não é afetado por valores extremosNão é afetado por valores extremos
ƒƒ Fórmula: Diferença entre o primeiro e o Fórmula: Diferença entre o primeiro e o 
terceiro quartilterceiro quartil
Dados Ordenados: 11 12 13 16 16 17 17 18 21
Amplitude Interquartílica = 3 1 17.5 12.5 5Q Q= − = − =
03.2 – Análise Estatística - 34/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes 
Medida de Variação 
Variância
ƒƒ Importante medida de variaçãoImportante medida de variação
ƒƒ Considera como os dados são distribuídosConsidera como os dados são distribuídos
ƒƒ Mostra a variação em torno da média (X ou Mostra a variação em torno da média (X ou μμ))
Variância da amostraVariância da amostra
Variância da PopulaçãoVariância da População ( )2
2 1
N
i
i
X
N
μ
σ =
−
=
∑
( )2
2 1
1
n
i
i
X X
S
n
=
−
= −
∑
PPáágina gina -- 1818/26/26PUCPUC--Rio Rio –– MarMarçço 2010o 2010
03.2 – Análise Estatística - 35/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes 
Medida de Variação 
Variância - exemplo
ƒƒ Dados brutosDados brutos:: 10.310.3 4.9 8.9 11.7 6.3 7.74.9 8.9 11.7 6.3 7.7
( )
( ) ( ) ( )
S
X X
n
X
X
n
S
i
i
n
i
i
n
2
2
1 1
2
2 2 2
1
8 3
10 3 8 3 4 9 8 3 7 7 8 3
6 1
6 368
=
−∑
− =
∑
=
= − + − + ⋅ ⋅ ⋅ + −−=
= =where .
. . . . . .
.
03.2 – Análise Estatística - 36/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes 
Medida de Variação 
Desvio Padrão
ƒƒ Importante medida de variaçãoImportantemedida de variação
ƒƒ Considera como os dados são distribuídosConsidera como os dados são distribuídos
ƒƒ Mostra a variação em torno da média (X ou Mostra a variação em torno da média (X ou μμ))
• Tem as mesmas unidades que os dados 
originais 
Desvio Padrão da amostraDesvio Padrão da amostra
Desvio Padrão da PopulaçãoDesvio Padrão da População
( )2
1
1
n
i
i
X X
S
n
=
−
= −
∑
( )2
1
N
i
i
X
N
μ
σ =
−
=
∑
PPáágina gina -- 1919/26/26PUCPUC--Rio Rio –– MarMarçço 2010o 2010
03.2 – Análise Estatística - 37/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes 
Medida de Variação 
Desvio Padrão - comparação
Média = 15.5
s = 3.338
11 12 13 14 15 16 17 18 19 20 21
11 12 13 14 15 16 17 18 19 20 21
Dados B
Dados A
Média = 15.5
s = .9258
11 12 13 14 15 16 17 18 19 20 21
Média = 15.5
s = 4.57
Dados C
03.2 – Análise Estatística - 38/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes 
Medida de Variação 
Coeficiente de Variação
ƒƒ Medida de dispersão relativaMedida de dispersão relativa
ƒƒ Sempre em percentual %Sempre em percentual %
ƒƒ Mostra variação relativa à médiaMostra variação relativa à média
ƒƒ É usado comparar dois ou mais grupos de É usado comparar dois ou mais grupos de 
dados medidos em unidades diferentes dados medidos em unidades diferentes 
ƒƒ Fórmula (amostra):Fórmula (amostra):
CV S
X
= ⎛⎝⎜
⎞
⎠⎟ ⋅100%
PPáágina gina -- 2020/26/26PUCPUC--Rio Rio –– MarMarçço 2010o 2010
03.2 – Análise Estatística - 39/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes 
Medida de Variação 
Coeficiente de Variação - Exemplo
ƒƒ Grupo 1 dadosGrupo 1 dados:: 11 22 33
ƒƒ Grupo 2 dadosGrupo 2 dados:: 100100 200200 300300
Group 1 
Group 2 
CV S
X
CV S
X
= ⎛⎝⎜
⎞
⎠⎟ ⋅ = ⋅ =
= ⎛⎝⎜
⎞
⎠⎟ ⋅ = ⋅ =
100% 1
2
100% 50%
100% 100
200
100% 50%
03.2 – Análise Estatística - 40/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes 
Medida de Variação 
Coeficiente de Variação - Exemplo
ƒƒ Estoque AEstoque A
Média de preço do último ano = R$ 50,00Média de preço do último ano = R$ 50,00
Desvio Padrão = R$ 5,00Desvio Padrão = R$ 5,00
ƒƒ Estoque BEstoque B
Média de preço do último ano = R$ 100,00Média de preço do último ano = R$ 100,00
Desvio Padrão = R$ 5,00Desvio Padrão = R$ 5,00
ƒƒ Coeficiente de Variação:Coeficiente de Variação:
Estoque AEstoque A
Estoque BEstoque B
$5100% 100% 10%
$50
SCV
X
⎛ ⎞ ⎛ ⎞= = =⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠
$5100% 100% 5%
$100
SCV
X
⎛ ⎞ ⎛ ⎞= = =⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠
PPáágina gina -- 2121/26/26PUCPUC--Rio Rio –– MarMarçço 2010o 2010
03.2 – Análise Estatística - 41/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes 
Medida de Variação 
Exercício
ƒƒ Você é um analista financeiro da Você é um analista financeiro da 
Banco XBanco X. Você coletou os seguintes . Você coletou os seguintes 
preços no fechamento de novos preços no fechamento de novos 
lançamentos de açõeslançamentos de ações: 17, 16, 21, 18, : 17, 16, 21, 18, 
13, 16, 1213, 16, 12..
ƒƒ Descreva a Descreva a volatilidadevolatilidade dos preços dos preços 
das ações.das ações.
03.2 – Análise Estatística - 42/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes 
Medida de Variação 
Resumo
Measure Equation Description
Range Xlargest - Xsmallest Total spread
Interquartile range Q3 - Q1 Spread of middle 50%
Standard deviation
(Sample)
X X
n
i −
−
( )∑ 2
1
Dispersion about
sample mean
Standard deviation
(Population)
X
N
i −( )∑ μ 2 Dispersion aboutpopulation mean
Variance
(Sample)
Σ(Xi -⎯X)2
n - 1
Squared dispersion
about sample mean
Coeff. of variation (S /⎯X)100% Relative variation
PPáágina gina -- 2222/26/26PUCPUC--Rio Rio –– MarMarçço 2010o 2010
03.2 – Análise Estatística - 43/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes 
Dados Numéricos 
Propriedades e Medidas
Variação FormatoTendência Central
Propriedades
Média
Mediana
Moda
Média do Intervalo
Média das Juntas
Assimetria
Kurtose
Amplitude
Variância
Desvio Padrão
Coeficiente de variação
Amplitude
Interquartil
03.2 – Análise Estatística - 44/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes 
Formato 
Forma da Distribuição
Média = Mediana =ModaMédia < Mediana < Moda Moda < Mediana < Média
Assimetria a DireitaAssimetria a Esquerda Simetria
ƒƒ Descreve como os dados são distribuídosDescreve como os dados são distribuídos
ƒƒ Medidas de formato (forma)Medidas de formato (forma)
Simetria ou AssimetriaSimetria ou Assimetria
PPáágina gina -- 2323/26/26PUCPUC--Rio Rio –– MarMarçço 2010o 2010
03.2 – Análise Estatística - 45/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes 
Análise Exploratória de Dados
ƒƒ Diagrama de Diagrama de BoxBox--andand--WhiskerWhisker
ƒƒ Disposição Gráfica dos dados usandoDisposição Gráfica dos dados usando
resumo de 5 númerosresumo de 5 números
Mediana( )
4 6 8 10 12
XmaiorXmenor 1Q 3Q
2Q
03.2 – Análise Estatística - 46/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes 
Formato da Distribuição e 
Diagrama de Box-and-Whisker
Assimetria a DireitaAssimetria a Esquerda Simetria
1Q 1Q 1Q2Q 2Q 2Q3Q 3Q3Q
PPáágina gina -- 2424/26/26PUCPUC--Rio Rio –– MarMarçço 2010o 2010
03.2 – Análise Estatística - 47/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes 
Coeficiente de Correlação
• Mede a força do relacionamento linear 
entre duas variáveis quantitativas
( )( )
( ) ( )
1
2 2
1 1
n
i i
i
n n
i i
i i
X X Y Y
r
X X Y Y
=
= =
− −
=
− −
∑
∑ ∑
03.2 – Análise Estatística - 48/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes 
Características do 
Coeficiente de Correlação
ƒ Um grau de liberdade
ƒ Varia entre –1 e 1
ƒ Mais perto de –1, mais forte o relacionamento 
linear negativo 
ƒ Mais perto de 1, mais forte o relacionamento 
linear positivo 
ƒ Mais perto de 0, não existe (é fraco) o 
relacionamento linear
PPáágina gina -- 2525/26/26PUCPUC--Rio Rio –– MarMarçço 2010o 2010
03.2 – Análise Estatística - 49/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes 
Gráfico de Dispersão com Vários 
Coeficientes de Correlação
Y
X
Y
X
Y
X
Y
X
Y
X
r = -1 r = -.6 r = 0
r = .6 r = 1
Y
X
Y
X
Y
X
Y
X
Y
X
r = -1 r = -.6 r = 0
r = .6 r = 1
03.2 – Análise Estatística - 50/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes 
Armadilhas nas das
Medidas Descritivas Numéricas 
ƒ A análise de dados é objetiva 
Precisa informar às medidas de resumo 
que melhor reunem as suposições sobre o 
conjunto de dados
ƒ A interpretação dos dados é subjetiva
Deve ser feita de maneira justa, neutra 
e clara 
PPáágina gina -- 2626/26/26PUCPUC--Rio Rio –– MarMarçço 2010o 2010
03.2 – Análise Estatística - 51/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes 
Considerações éticas
ƒ Medidas descritivas numéricas 
Deve documentar resultados bons e 
maus
Deve ser apresentada de uma maneira 
justa, objetiva e neutra 
Não deve usar medidas sumárias 
impróprias para distorcer os fatos

Outros materiais

Materiais relacionados

Perguntas relacionadas

Perguntas Recentes