Buscar

aula-12-2

Prévia do material em texto

Rosa – 2018
Estatística e Modelos 
Probabilísticos - COE241
Aula de hoje
Análise da dados através de gráficos
 
Rosa – 2018
Análise de Dados através de 
Gráficos - Histograma
 Frequência das amostras
 
Rosa – 2018
Análise de Dados através de 
Gráficos - Histograma
 Escolha do tamanho do intervalo
 Considere n amostras divididas em m intervalos
 
Rosa – 2018
Análise de Dados através de 
Gráficos - Histograma
 Escolha do tamanho do intervalo
 Pode ser feita plotando-se vários gráficos com 
tamanhos de intervalo diferentes
 Seja b=tamanho do intervalo, n=número de 
amostras, m=número de intervalos, s=desvio 
padrão
m=1+3.3 log10(n)
b=3.49σn−1 /3
 
Rosa – 2018
Análise de Dados através de 
Gráficos – Função Distribuição
 Computa P[X<x]
 
Rosa – 2018
Análise de Dados através de 
Gráficos – Scatterplot
 Relação entre duas variáveis
(x,y) → X=% de votação do candidato, Y=IDH do município
 
Rosa – 2018
Análise de Dados através de 
Gráficos – BoxPlot
Mediana: divide o conjunto de amostras em duas 
partes
 Exemplo: 41 41 42 42 43 44 45 45 50
 Mediana=43
 50% das amostras estão abaixo da mediana
 50% das amostras estão acima da mediana
 
Rosa – 2018
Análise de Dados através de 
Gráficos – BoxPlot
 p quantil ou percentil: p% das amostras estão abaixo 
do valor
 Suponha , um conjunto com n amostras 
ordenadas em ordem crescente
 O p-ésimo quantil pode ser calculado a partir de:
 
qn( p)=x(k)+α(x(k+1)−x(k)), 0< p<1
k=⌊ p∗(n+1)⌋ , α=p∗(n+1)−k
x(1) , x(2) , ... , x(n)
 
Rosa – 2018
Análise de Dados através de 
Gráficos – BoxPlot
 
Rosa – 2018
Análise de Dados através de 
Gráficos – BoxPlot
 Lower quartile: é o 25th percentil
 Upper quartile: é o 75th percentil
 IQR: Interquartile range 
qn(0.25)
qn(0.75)
IQR=qn(0.75)−qn(0.25)
 
Rosa – 2018
Análise de Dados através de 
Gráficos – BoxPlot
 Exemplo: Temperaturas medidas 
41 41 41 41 41 42 43 43 43 58 58 
Mediana=42
Lower quartile: 
Upper quartile: 
 IQR=43-41=2 
qn(0.55)=? k=⌊0.55∗12⌋=⌊6.6⌋=6 α=0.6
qn(0.55)=x(6)+0.6(x(7)−x(6))=42+0.6(43−42)=42.6
qn(0.75)=43
qn(0.25)=41
 
Rosa – 2018
Análise de Dados através de 
Gráficos – BoxPlot
Cálculo de outliers: acima de upper_quartile+1.5*IQR ou abaixo 
de lower_quartile-1.5*IQR
Maior valor menor ou igual
a upper quartile + 1.5*IQR 
outliers
Menor valor maior ou igual
a lower quartile - 1.5*IQR 
 
Rosa – 2018
Análise de Dados através de 
Gráficos – BoxPlot
 Exemplo: Temperaturas medidas 
41 41 41 41 41 42 43 43 43 58 58 
Lower quartile: 
Upper quartile: 
 IQR=43-41=2
Cálculo de outliers: acima de 43+3=46 e abaixo 
de 41-3=38
Máximo=58, Mínimo=41
Lower whisker=41, Upper whisker=43
qn(0.75)=43
qn(0.25)=41
 
Rosa – 2018
Análise de Dados através de 
Gráficos – QQPlot
 The quantile-quantile (q-q) plot is a graphical 
technique for determining if two data sets come 
from populations with a common distribution.
A q-q plot is a plot of the quantiles of the first data 
set against the quantiles of the second data set. 
By a quantile, we mean the fraction (or percent) of 
points below the given value. That is, the 0.3 (or 
30%) quantile is the point at which 30% percent of 
the data fall below and 70% fall above that value. 
 
Rosa – 2018
Análise de Dados através de 
Gráficos – QQPlot
 
Rosa – 2018
Análise de Dados através de 
Gráficos – QQPlot
 A 45-degree reference line is also plotted. If the 
two sets come from a population with the same 
distribution, the points should fall approximately 
along this reference line. 
 The 2 batches do not appear to have come from 
populations with a common distribution.
 The batch 1 values are significantly higher than 
the corresponding batch 2 values.
 The differences are increasing from values 525 to 
625. Then the values for the 2 batches get closer 
again. 
 
Rosa – 2018
Análise de Dados através de 
Gráficos – QQPlot
 The q-q plot is used to answer the following 
questions:
 Do two data sets come from populations with a 
common distribution?
 Do two data sets have common location and 
scale?
 Do two data sets have similar distributional 
shapes?
 Do two data sets have similar tail behavior? 
	Slide 1
	Slide 2
	Slide 3
	Slide 4
	Slide 5
	Slide 6
	Slide 7
	Slide 8
	Slide 9
	Slide 10
	Slide 11
	Slide 12
	Slide 13
	Slide 14
	Slide 15
	Slide 16
	Slide 17

Continue navegando