Buscar

Aula Descritiva

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 78 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 78 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 78 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

GL301 – Estatística I
Leonardo T. Duarte
Primeiro Semestre de 2013
Estatística Descritiva
 
O que é estatística?
● Panorama geral da estatística
● Estatística descritiva: descrição numérica e/ou visual 
das amostras. 
População
Modelo probabilístico Amostras
 
Tipos de dados
● Dados correspondem ao objeto de estudo da 
estatística
 
Tipos de dados
● Dados correspondem ao objeto de estudo da 
estatística
● Como classificá-los?
 
Tipos de dados
● Dados correspondem ao objeto de estudo da 
estatística
● Como classificá-los?
● Dados qualitativos
– Dados categóricos - “sim” ou “não”
– Dados ordinais - “ruim”, “regular”, “bom”, “ótimo”
● Dados quantitativos
– Dados discretos – número de alunos na sala “43” 
conjuntos enumeráveis (e.g. naturais)
– Dados contínuos – largura de um produto “2,65 mm” 
conjuntos enumeráveis (e.g. reais)
 
Estatística descritiva
● Como organizar, resumir, e apresentar dados?
● Estatística descritiva
 
Estatística descritiva
● Como organizar, resumir, e apresentar dados?
● Estatística descritiva
● métodos numéricos
– Medidas de tendência central (média, mediana, moda)
– Medidas de dispersão (variância, intervalo)
 
Estatística descritiva
● Como organizar, resumir, e apresentar dados?
● Estatística descritiva
● métodos numéricos
– Medidas de tendência central (média, mediana, moda)
– Medidas de dispersão (variância, intervalo)
● métodos visuais
– Tabelas
– Gráficos
 
Estatística descritiva
● Como organizar, resumir, e apresentar dados?
● Estatística descritiva
● métodos numéricos
– Medidas de tendência central (média, mediana, moda)
– Medidas de dispersão (variância, amplitude)
● métodos visuais
– Tabelas
– Gráficos
 
Linearidade da média
● Seja X = {x1, x2,...,xN} um conjunto de dados
● A média de X é dada por:
 
 
Linearidade da média
● Seja X = {x1, x2,...,xN} um conjunto de dados
● A média de X é dada por:
 
● Média é um operador linear (satisfaz o princípio da 
superposição)
● Dados os conjuntos X = {x1, x2,...,xN} e Y = {y1, 
y2,...,yN}, então
maX+bY = amX + bmY
● Prova: linearidade do operador somatório
 
Significado físico da média aritmética
● Se cada amostra representa um corpo massa unitária 
disposto no eixo x, então a média corresponde ao 
centro de massa
 
● mX=13
Retirado de Montgomerry et al 2003
 
Significado matemático da média aritmética
● Seja um dado xi do conjunto X. É possível calcular a 
distância de xi a um ponto arbitrário A.
 
Significado matemático da média aritmética
● Seja um dado xi do conjunto X. É possível calcular a 
distância de xi a um ponto arbitrário A.
● Exemplo: di = (xi-A)2
 
Significado matemático da média aritmética
● Seja um dado xi do conjunto X. É possível calcular a 
distância de xi a um ponto arbitrário A.
● Exemplo: di = (xi-A)2
● Calculemos a média das distâncias dos pontos do 
conjunto X = {x1, x2,...,xN} ao ponto A, ou seja, a média 
do conjunto D = {(x1-A)2,(x2-A)2,...,(xN-A)2}
● Qual valor de A que minimiza mD?
 
Significado matemático da média aritmética
● Seja um dado xi do conjunto X. É possível calcular a 
distância de xi a um ponto arbitrário A.
● Exemplo: di = (xi-A)2
● Calculemos a média das distâncias dos pontos do 
conjunto X = {x1, x2,...,xN} ao ponto A, ou seja, a média 
do conjunto D = {(x1-A)2,(x2-A)2,...,(xN-A)2}
● Qual valor de A que minimiza mD?
RESPOSTA → A = mX
 
Peculiaridades da média
● Considere o conjunto de dados X = {1 , 2, 2, 2, 
1, 5, 5, 6, 7, 6}
A média deste conjunto é mX= 3.7
Não há nenhum dado “próximo” da média.
 
Peculiaridades da média
● Considere o conjunto de dados X = {1 , 2, 2, 2, 
1, 5, 5, 6, 7, 6}
A média deste conjunto é mX= 3.7
Não há nenhum dado “próximo” da média.
● Além disso, a média de um conjunto de dados 
discretos pode ser um número real.
 
Peculiaridades da média
● Considere o conjunto de dados X = {1 , 2, 2, 2, 
1, 5, 5, 6, 7, 6}
A média deste conjunto é mX= 3.7
Não há nenhum dado “próximo” da média.
● Além disso, a média de um conjunto de dados 
discretos pode ser um número real.
● Sensível a outliers 
X = {1 , 2, 2, 2, 1, 5, 5, 6, 7, 6,100}
mX= 12.45
 
Mediana
● Valor que separa metade das amostras de um 
lado e a outra metade de outro
● Exemplo: X = {12,13,10,15,8,7,11,12}
 
Mediana
● Valor que separa metade das amostras de um 
lado e a outra metade de outro
● Exemplo: X = {12,13,10,15,8,7,11,12}
● Ordenando este conjunto
7, 8, 10, 11, 12 ,12, 13, 15
Mediana
7, 8, 10, 11, 11.5, 12 ,12, 13, 15
 
Mediana
● Valor que separa metade das amostras de um 
lado e a outra metade de outro
● Exemplo: X = {12,13,10,15,8,7,11,12}
● Ordenando este conjunto
7, 8, 10, 11, 12 ,12, 13, 15
Mediana
7, 8, 10, 11, 11.5, 12 ,12, 13, 15
● Exemplo: X = {12,13,10,15,8,7,11,12,100}
Mediana
7, 8, 10, 11, 12 ,12, 13, 15, 100
 
Significado matemático da mediana
● Seja um dado xi do conjunto X. É possível calcular a 
distância de xi a um ponto arbitrário A.
● Exemplo: di = |xi-A|
● Calculemos a média das distâncias dos pontos do 
conjunto X = {x1, x2,...,xN} ao ponto A, ou seja, a média 
do conjunto D = {|x1-A|,|x2-A|,...,|xN-A|}
● Qual valor de A que minimiza mD?
RESPOSTA → A = medianax
 
Moda
● Para dados discretos, a moda é o valor (ou 
valores) mais frequente(s) 
● Considere o conjunto de dados X = {1 , 2, 2, 2, 
1, 5, 5, 6, 7, 6}
 
Moda
● Para dados discretos, a moda é o valor (ou 
valores) mais frequente(s) 
● Considere o conjunto de dados X = {1 , 2, 2, 2, 
1, 5, 5, 6, 7, 6}
A moda do conjunto é moda= 2
 
Moda
● Para dados discretos, a moda é o valor (ou 
valores) mais frequente(s) 
● Considere o conjunto de dados X = {1 , 2, 2, 2, 
1, 5, 5, 6, 7, 6}
A moda do conjunto é moda= 2
● A moda pode ser um conjunto
● Exemplo: X = {1 , 2, 2, 2, 1, 5, 5, 5, 6, 7, 6}
Moda = {2,5} 
 
Estatística descritiva
● Como organizar, resumir, e apresentar dados?
● Estatística descritiva
● métodos numéricos
– Medidas de tendência central (média, mediana, moda)
– Medidas de dispersão (variância, amplitude)
● métodos visuais
– Tabelas
– Gráficos
 
Amplitude dos dados
● Seja X um conjunto de N observações 
representados por X = {x1, x2,...,xN}.
● A amplitude das observações X é dada por
Amplitude de X = max(X) – min(X)
 
Amplitude dos dados
● Seja X um conjunto de N observações 
representados por X = {x1, x2,...,xN}.
● A amplitude das observações X é dada por
Amplitude de X = max(X) – min(X)
● Exemplo: X = {1 -2 3 2 0 2 4 -4 3 4 1}
Amplitude de X = 8
 
Amplitude dos dados
● Seja X um conjunto de N observações 
representados por X = {x1, x2,...,xN}.
● A amplitude das observações X é dada por
Amplitude de X = max(X) – min(X)
● Exemplo: X = {1 -2 3 2 0 2 4 -4 3 4 1}
Amplitude de X = 8
● Exemplo: X = {1 -2 3 2 0 2 4 -104 3 4 1}
Amplitude de X = 108
● Extremamente sensível a outliers
 
Variância
● A amplitude não leva em conta (explicitamente) os 
valores de cada uma das amostras.
● A variância, por outro lado, considera o valor numérico 
de cada amostra na busca por uma quantificação da 
dispersão.
● Na sequência, será mostrado como a variância é 
construída.
 
 
 
Variância
Tabela 1. Altura de 10 pessoas
Indivíduo
1 1,65
2 1,76
3 1,59
4 1,98
5 1,76
6 1,56
7 1,61
8 1,72
9 1,81
10 1,62
Total 17,06
Média 1,71
xi (metros)
● Considere os dados brutos dispostos na tabela abaixo
 
Variância
Tabela 1. Altura de 10 pessoas
Indivíduo
1 1,65 -0,056
2 1,76 0,054
3 1,59 -0,116
4 1,98 0,274
5 1,76 0,0546 1,56 -0,146
7 1,61 -0,096
8 1,72 0,014
9 1,81 0,104
10 1,62 -0,086
Total 17,06 0,00
Média 1,71 0,00
xi (metros) xi (m) – mX (metros)
● Considere os dados brutos dispostos na tabela abaixo
● Primeira ideia para calcular dispersão: média das 
diferenças entre xi e mX. 
 
Variância
● Considere os dados brutos dispostos na tabela abaixo
● Primeira ideia para calcular dispersão: média das 
diferenças entre xi e mX. Problema: é sempre zero!
● Segunda ideia: média das diferenças ao quadrado
Tabela 1. Altura de 10 pessoas
Indivíduo
1 1,65 -0,056 0,003136
2 1,76 0,054 0,002916
3 1,59 -0,116 0,013456
4 1,98 0,274 0,075076
5 1,76 0,054 0,002916
6 1,56 -0,146 0,021316
7 1,61 -0,096 0,009216
8 1,72 0,014 0,000196
9 1,81 0,104 0,010816
10 1,62 -0,086 0,007396
Total 17,06 0,00 0,14644
Média 1,71 0,00 0,014644
xi (metros) xi (m) – mX (metros) (xi – mX)2 (metros2)
 
Variância
● Considere os dados brutos dispostos na tabela abaixo
● Primeira ideia para calcular dispersão: média das 
diferenças entre xi e mX. Problema: é sempre zero!
● Segunda ideia: média das diferenças ao quadrado 
(definição de variância)
Tabela 1. Altura de 10 pessoas
Indivíduo
1 1,65 -0,056 0,003136
2 1,76 0,054 0,002916
3 1,59 -0,116 0,013456
4 1,98 0,274 0,075076
5 1,76 0,054 0,002916
6 1,56 -0,146 0,021316
7 1,61 -0,096 0,009216
8 1,72 0,014 0,000196
9 1,81 0,104 0,010816
10 1,62 -0,086 0,007396
Total 17,06 0,00 0,14644
Média 1,71 0,00 0,014644
xi (metros) xi (m) – mX (metros) (xi – mX)2 (metros2)
Variância
 
Variância e desvio padrão
● Seja X um conjunto de N observações 
representados por X = {x1, x2,...,xN} e mX a 
média amostral deste conjunto;
● A variância (amostral) de X é dada por
● O desvio padrão corresponde a raiz quadrada 
positiva da variância. 
 
 
Propriedades da Variância
● Variância dos dados X deslocados por uma 
constante a, i.e., yi = xi + a:
 
Propriedades da Variância
● Variância dos dados X deslocados por uma 
constante a, i.e., yi = xi + a:
● Variância dos dados X escalonados por uma 
constante a, i.e., yi = axi:
 
 
Propriedades da Variância
● Variância dos dados X deslocados por uma 
constante a, i.e., yi = xi + a:
● Variância dos dados X escalonados por uma 
constante a, i.e., yi = axi:
● Variância dos dados X em função de “médias”:
 
 
Exemplo em séries temporais
● Séries temporais (sinais) de média zero, porém 
de variâncias diferentes (1 e 0.01) 
● Em processamento de sinais, a variância está 
diretamente ligada à potência de um sinal
0 1 0 0 2 0 0 3 0 0 4 0 0 5 0 0 6 0 0 7 0 0 8 0 0 9 0 0 1 0 0 0
- 4
- 3
- 2
- 1
0
1
2
3
4
T e m p o
Am
pl
itu
de
 
do
 
si
na
l (V
)
0 1 0 0 2 0 0 3 0 0 4 0 0 5 0 0 6 0 0 7 0 0 8 0 0 9 0 0 1 0 0 0
- 4
- 3
- 2
- 1
0
1
2
3
4
T e m p o
Am
pl
itu
de
 
do
 
si
na
l (V
)
 
Generalizando a Variância
● É possível generalizar a variância considerando 
outras medidas de tendência central e outras 
distâncias
 
Generalizando a Variância
● É possível generalizar a variância considerando 
outras medidas de tendência central e outras 
distâncias
● No caso da variância, temos
● MC (Medida de tendência central) → média
● d(·,·) (distância) → distância quadrática; 
 
Média dos desvios dos valores absolutos
● Definição
● Neste caso, temos
● MC (Medida de tendência central) → média
● d(·,·) (distância) → valor absoluto da diferença; 
● Mais robusta à outiliers se comparada à 
variância. 
 
Mediana dos desvios dos valores absolutos
● Definição
● Neste caso, temos
● MC (Medida de tendência central) → mediana
● d(·,·) (distância) → valor absoluto da diferença; 
● Mais robusta à outiliers se comparada à 
variância. 
 
Intervalo Inter-quartil
● Mediana: “divide” o conjunto de dados pela metade. 
Exemplo: X={12,13,10, 9,15,8,7,11,12,16,6,7}
Mediana = 10,5
6, 7, 7, 8, 9, 10, 11, 12 ,12, 13, 15, 16
 
Intervalo Inter-quartil
● Mediana: “divide” o conjunto de dados pela metade. 
Exemplo: X={12,13,10, 9,15,8,7,11,12,16,6,7}
Mediana = 10,5
6, 7, 7, 8, 9, 10, 11, 12 ,12, 13, 15, 16
● Quartil: divide o conjunto de dados em quatro partes 
iguais
 
Intervalo Inter-quartil
● Mediana: “divide” o conjunto de dados pela metade. 
Exemplo: X={12,13,10, 9,15,8,7,11,12,16,6,7}
Mediana = 10,5
6, 7, 7, 8, 9, 10, 11, 12 ,12, 13, 15, 16
● Quartil: divide o conjunto de dados em quatro partes 
iguais
● Exemplo
Primeiro quartil – Q1: 7,5
 
Intervalo Inter-quartil
● Mediana: “divide” o conjunto de dados pela metade. 
Exemplo: X={12,13,10, 9,15,8,7,11,12,16,6,7}
Mediana = 10,5
6, 7, 7, 8, 9, 10, 11, 12 ,12, 13, 15, 16
● Quartil: divide o conjunto de dados em quatro partes 
iguais
● Exemplo
Primeiro quartil – Q1: 7,5
Segundo quartil – Q2: mediana
 
Intervalo Inter-quartil
● Mediana: “divide” o conjunto de dados pela metade. 
Exemplo: X={12,13,10, 9,15,8,7,11,12,16,6,7}
Mediana = 10,5
6, 7, 7, 8, 9, 10, 11, 12 ,12, 13, 15, 16
● Quartil: divide o conjunto de dados em quatro partes 
iguais
● Exemplo
Primeiro quartil – Q1: 7,5
Segundo quartil – Q2: mediana
Terceiro quartil – Q3: 12,5
 
Intervalo Inter-quartil
● Mediana: “divide” o conjunto de dados pela metade. 
Exemplo: X={12,13,10, 9,15,8,7,11,12,16,6,7}
Mediana = 10,5
6, 7, 7, 8, 9, 10, 11, 12 ,12, 13, 15, 16
● Quartil: divide o conjunto de dados em quatro partes 
iguais
● Exemplo
Primeiro quartil – Q1: 7,5
Segundo quartil – Q2: mediana
Terceiro quartil – Q3: 12,5
6, 7, 7 | 8, 9, 10 | 11, 12 ,12 | 13, 15, 16
Q1 Q2 Q3
 
Intervalo Inter-quartil
● Definição
IIQ = Q3 – Q1
● Exemplo: X={12,13,10, 9,15,8,7,11,12,16,6,7}
IIQ = 5
 
 
Intervalo Inter-quartil
● Definição
IIQ = Q3 – Q1
● Exemplo: X={12,13,10, 9,15,8,7,11,12,16,6,7}
IIQ = 5
● Interpretação
A variação máxima entre os 50% de dados mais 
próximos a mediana é de 5.
 
Intervalo Inter-quartil
● Definição
IIQ = Q3 – Q1
● Exemplo: X={12,13,10, 9,15,8,7,11,12,16,6,7}
IIQ = 5
● Interpretação
A variação máxima entre os 50% de dados mais 
próximos a mediana é de 5.
● O IIQ é uma medida muito mais robusta do que a 
amplitude dos dados.
 
 
Estatística descritiva
● Como organizar, resumir, e apresentar dados?
● Estatística descritiva
● métodos numéricos
– Medidas de tendência central (média, mediana, moda)
– Medidas de dispersão (variância, amplitude)
● métodos visuais
– Tabelas
– Gráficos
 
Tabelas de distribuição de frequência
● Utilizada para qualquer tipo de dados
● Exemplo (dados categóricos): avaliação de um 
determinado produto pelo cliente
Tabela 1. Avaliação de um produto
Avaliação Número de pessoas Frequência relativa
Ruim 132 0,1503416856
Regular 432 0,4920273349
Bom 234 0,2665148064
Ótimo 80 0,0911161731
Total 878 1
 
Tabelas de distribuição de frequência
● Gráficos de barra e de setores (pizza)
Tabela 1. Avaliação de um produto
Avaliação Número de pessoas Frequência relativa
Ruim 132 0,1503416856
Regular 432 0,4920273349
Bom 234 0,2665148064
Ótimo 80 0,0911161731
Total 878 1
 
Tabelas de distribuição de frequência
● Gráficos de barra e de setores (pizza)
Tabela 1. Avaliação de um produto
Avaliação Número de pessoas Frequência relativa
Ruim 132 0,1503416856
Regular 432 0,4920273349
Bom 234 0,2665148064
Ótimo 80 0,0911161731
Total 878 1
Ruim Regular Bom Ótimo
0
100
200
300
400
500
Avaliação de um Produto
Avaliação
N
úm
er
o 
de
 p
es
so
as
 
Tabelas de distribuição de frequência
● Gráficos de barra e de setores (pizza)
Tabela 1. Avaliação de um produtoAvaliação Número de pessoas Frequência relativa
Ruim 132 0,1503416856
Regular 432 0,4920273349
Bom 234 0,2665148064
Ótimo 80 0,0911161731
Total 878 1
Ruim Regular Bom Ótimo
0
100
200
300
400
500
Avaliação de um Produto
Avaliação
N
úm
er
o 
de
 p
es
so
as Gráfico de setores
Ruim
Regular
Bom
Ótimo
 
Tabelas de distribuição de frequência
● No caso de dados discretos ou contínuos, para 
construir uma tabela de distribuição, é necessário 
agrupar os dados em intervalos não sobrepostos 
(bins); 
 
Tabelas de distribuição de frequência
● No caso de dados discretos ou contínuos, para 
construir uma tabela de distribuição, é necessário 
agrupar os dados em intervalos não sobrepostos 
(bins); 
● Exemplo (Montgomery et al. 2003): esforço de 
compressão de uma liga alumínio-lítio (psi)
 
Tabelas de distribuição de frequência
● Exemplo (Montgomery et al. 2003): esforço de 
compressão de uma liga alumínio-lítio (psi)
 
Tabelas de distribuição de frequência
● Exemplo (Montgomery et al. 2003): histograma
 
Tabelas de distribuição de frequência
● Escolha do número de bins do histograma: diversos 
métodos
● Mais utilizado: número de bins = N0.5
 
Exercício: exemplos de histograma
● Exemplos de histograma: traçar os histogramas referentes às 
seguintes tabelas de distribuição de frequências
Tabela 2. Distribuição do tempo de vida de uma lâmpada 
Tempo de vida de uma lâmpada (meses) Número de pessoas
0-10 30
11-20 27
21-30 20
31-40 16
41-50 12
51-60 8
61-70 7
71-80 6
81-90 6
91-100 4
101-110 2
Total 138
● Calcular a média, a mediana e a 
moda para cada histograma.
● Indicar no histograma estes valores
● Que conclusões podemos tirar?
Tabela 1. Distribuição do tempo de vida de uma lâmpada 
Tempo de vida de uma lâmpada (meses) Número de pessoas
0-10 2
11-20 5
21-30 12
31-40 15
41-50 20
51-60 30
61-70 20
71-80 15
81-90 12
91-100 5
101-110 2
Total 138
Tabela 3. Distribuição do tempo de vida de uma lâmpada 
Tempo de vida de uma lâmpada (meses) Número de pessoas
0-10 15
11-20 30
21-30 15
31-40 4
41-50 3
51-60 4
61-70 3
71-80 4
81-90 15
91-100 30
101-110 15
Total 138
 
Tabelas de Frequência Acumulada
 
Histograma de Frequência Acumulada
 
Diagrama de caule-e-folhas
● Forma de apresentação dos dados na qual não há 
perda de informação
● Exemplo
Dados brutos
 
Diagrama de caule-e-folhas
● Forma de apresentação dos dados na qual não há 
perda de informação
● Exemplo
Dados brutos
Diagrama de caule e folhas
 
Diagrama de caule-e-folhas
● Exemplo 2 (Montgomery et al. 2003)
 
Gráfico de dispersão unidimensional
● Exemplo: taxas brutas de mortalidade (Le, 
2003)
● Cada traço representa uma amostra
 
Gráfico de dispersão bidimensional
● Utilizado para visualizar a 
relação entre duas variáveis 
contínuas
● Exemplo: análise de duas 
variáveis representadas por 
A e B.
Variável A Variável B
0,78 0,78
0,39 0,38
0,24 0,25
0,40 0,39
0,10 0,10
0,13 0,12
0,94 0,94
0,96 0,96
0,58 0,59
0,06 0,05
0,23 0,25
0,35 0,36
0,82 0,82
0,02 0,01
0,04 0,04
0,17 0,17
0,65 0,65
0,73 0,73
0,65 0,66
0,45 0,47
 
Gráfico de dispersão bidimensional
● Relação entre variáveis
0 0 . 1 0 . 2 0 . 3 0 . 4 0 . 5 0 . 6 0 . 7 0 . 8 0 . 9 1
0
0 . 1
0 . 2
0 . 3
0 . 4
0 . 5
0 . 6
0 . 7
0 . 8
0 . 9
1
V a r i á v e l A
Va
riá
ve
l B
 
Gráfico de dispersão bidimensional
● Relação entre variáveis: fortemente correlacionadas
0 0 . 1 0 . 2 0 . 3 0 . 4 0 . 5 0 . 6 0 . 7 0 . 8 0 . 9 1
0
0 . 1
0 . 2
0 . 3
0 . 4
0 . 5
0 . 6
0 . 7
0 . 8
0 . 9
1
V a r i á v e l A
Va
riá
ve
l B
 
Gráfico de dispersão bidimensional
● Exemplo 2: análise de duas 
variáveis representadas por 
A e B.
0 . 1 0 . 2 0 . 3 0 . 4 0 . 5 0 . 6 0 . 7 0 . 8 0 . 9 1
0 . 1
0 . 2
0 . 3
0 . 4
0 . 5
0 . 6
0 . 7
0 . 8
0 . 9
1
V a r i á v e l A
Va
riá
ve
l B
Variável 
A
Variável 
B
0,64 0,31
0,38 0,92
0,81 0,43
0,53 0,18
0,35 0,90
0,94 0,98
0,88 0,44
0,55 0,11
0,62 0,26
0,59 0,41
0,21 0,59
0,30 0,26
0,47 0,60
0,23 0,71
0,84 0,22
0,19 0,12
0,23 0,30
0,17 0,32
0,23 0,42
0,44 0,51
 
Gráfico de dispersão bidimensional
● Exemplo 3: análise de duas 
variáveis representadas por 
A e B.
0 0 . 1 0 . 2 0 . 3 0 . 4 0 . 5 0 . 6 0 . 7 0 . 8 0 . 9 1
2
2 . 5
3
3 . 5
V a r i á v e l A
Va
riá
ve
l B
Variável A Variável B
0,03 2,98
0,74 2,32
0,50 2,50
0,48 2,53
0,90 2,15
0,61 2,40
0,62 2,46
0,86 2,22
0,81 2,27
0,58 2,44
0,18 2,88
0,24 2,81
0,89 2,21
0,03 3,04
0,49 2,59
0,17 2,88
0,98 2,06
0,71 2,37
0,50 2,51
0,47 2,54
 
Gráficos de linha (séries temporais)
● Semelhantes aos gráficos de dispersão 2D, porém, neste caso, 
cada ponto no eixo x tem apenas uma única medida no eixo y;
● Além disso, os pontos são conectados por linhas;
● Usualmente, são utilizados para apresentar séries temporais.
● Exemplo 
5 1 0 1 5 2 0 2 5 3 0
1 . 7
1 . 7 5
1 . 8
1 . 8 5
1 . 9
1 . 9 5
2
2 . 0 5
D i a d o m ê s 
Pr
eç
o 
do
 
lit
ro
 
de
 
Et
an
ol
 
(R
ea
is
)
P r e ç o d o E t a n o l n o E s t a d o d e S P e m J a n e i r o
 
Box Plots
● Contém tanto informação visual quanto numérica.
● Exemplo: boxplot de um dado conjunto A
1
2
3
4
5
6
7
1
A M e d i a n aQ 3
Q 1
Q 3 + 1 . 5 I I Q
Q 1 - 1 . 5 I I Q
 
Exercício: box-plot
● Traçar os box-plots para as tabelas seguintes
● É preciso calcular
● Mediana
● Q1 e Q3
Tabela 2. Distribuição do tempo de vida de uma lâmpada 
Tempo de vida de uma lâmpada (meses) Número de pessoas
0-10 30
11-20 27
21-30 20
31-40 16
41-50 12
51-60 8
61-70 7
71-80 6
81-90 6
91-100 4
101-110 2
Total 138
Tabela 1. Distribuição do tempo de vida de uma lâmpada 
Tempo de vida de uma lâmpada (meses) Número de pessoas
0-10 2
11-20 5
21-30 12
31-40 15
41-50 20
51-60 30
61-70 20
71-80 15
81-90 12
91-100 5
101-110 2
Total 138
	Slide 1
	Slide 2
	Slide 3
	Slide 4
	Slide 5
	Slide 6
	Slide 7
	Slide 8
	Slide 9
	Slide 10
	Slide 11
	Slide 12
	Slide 13
	Slide 14
	Slide 15
	Slide 16
	Slide 17
	Slide 18
	Slide 19
	Slide 20
	Slide 21
	Slide 22
	Slide 23
	Slide 24
	Slide 25
	Slide 26
	Slide 27
	Slide 28
	Slide 29
	Slide 30
	Slide 31
	Slide 32
	Slide 33
	Slide 34
	Slide 35
	Slide 36
	Slide 37
	Slide 38
	Slide 39
	Slide 40
	Slide 41
	Slide 42
	Slide 43
	Slide 44
	Slide 45
	Slide 46
	Slide 47
	Slide 48
	Slide 49
	Slide 50
	Slide 51
	Slide 52
	Slide 53
	Slide 54
	Slide 55
	Slide 56
	Slide 57
	Slide 58
	Slide 59
	Slide 60
	Slide 61
	Slide 62
	Slide 63
	Slide 64
	Slide 65
	Slide 66
	Slide 67
	Slide 68
	Slide 69
	Slide 70
	Slide 71
	Slide 72
	Slide 73
	Slide 74
	Slide 75
	Slide 76
	Slide 77
	Slide 78

Outros materiais