Baixe o app para aproveitar ainda mais
Prévia do material em texto
Rosa – 2018 Estatística e Modelos Probabilísticos - COE241 Aula de hoje Análise da dados através de gráficos Rosa – 2018 Análise de Dados através de Gráficos - Histograma Frequência das amostras Rosa – 2018 Análise de Dados através de Gráficos - Histograma Escolha do tamanho do intervalo Considere n amostras divididas em m intervalos Rosa – 2018 Análise de Dados através de Gráficos - Histograma Escolha do tamanho do intervalo Pode ser feita plotando-se vários gráficos com tamanhos de intervalo diferentes Seja b=tamanho do intervalo, n=número de amostras, m=número de intervalos, s=desvio padrão m=1+3.3 log10(n) b=3.49σn−1 /3 Rosa – 2018 Análise de Dados através de Gráficos – Função Distribuição Computa P[X<x] Rosa – 2018 Análise de Dados através de Gráficos – Scatterplot Relação entre duas variáveis (x,y) → X=% de votação do candidato, Y=IDH do município Rosa – 2018 Análise de Dados através de Gráficos – BoxPlot Mediana: divide o conjunto de amostras em duas partes Exemplo: 41 41 42 42 43 44 45 45 50 Mediana=43 50% das amostras estão abaixo da mediana 50% das amostras estão acima da mediana Rosa – 2018 Análise de Dados através de Gráficos – BoxPlot p quantil ou percentil: p% das amostras estão abaixo do valor Suponha , um conjunto com n amostras ordenadas em ordem crescente O p-ésimo quantil pode ser calculado a partir de: qn( p)=x(k)+α(x(k+1)−x(k)), 0< p<1 k=⌊ p∗(n+1)⌋ , α=p∗(n+1)−k x(1) , x(2) , ... , x(n) Rosa – 2018 Análise de Dados através de Gráficos – BoxPlot Rosa – 2018 Análise de Dados através de Gráficos – BoxPlot Lower quartile: é o 25th percentil Upper quartile: é o 75th percentil IQR: Interquartile range qn(0.25) qn(0.75) IQR=qn(0.75)−qn(0.25) Rosa – 2018 Análise de Dados através de Gráficos – BoxPlot Exemplo: Temperaturas medidas 41 41 41 41 41 42 43 43 43 58 58 Mediana=42 Lower quartile: Upper quartile: IQR=43-41=2 qn(0.55)=? k=⌊0.55∗12⌋=⌊6.6⌋=6 α=0.6 qn(0.55)=x(6)+0.6(x(7)−x(6))=42+0.6(43−42)=42.6 qn(0.75)=43 qn(0.25)=41 Rosa – 2018 Análise de Dados através de Gráficos – BoxPlot Cálculo de outliers: acima de upper_quartile+1.5*IQR ou abaixo de lower_quartile-1.5*IQR Maior valor menor ou igual a upper quartile + 1.5*IQR outliers Menor valor maior ou igual a lower quartile - 1.5*IQR Rosa – 2018 Análise de Dados através de Gráficos – BoxPlot Exemplo: Temperaturas medidas 41 41 41 41 41 42 43 43 43 58 58 Lower quartile: Upper quartile: IQR=43-41=2 Cálculo de outliers: acima de 43+3=46 e abaixo de 41-3=38 Máximo=58, Mínimo=41 Lower whisker=41, Upper whisker=43 qn(0.75)=43 qn(0.25)=41 Rosa – 2018 Análise de Dados através de Gráficos – QQPlot The quantile-quantile (q-q) plot is a graphical technique for determining if two data sets come from populations with a common distribution. A q-q plot is a plot of the quantiles of the first data set against the quantiles of the second data set. By a quantile, we mean the fraction (or percent) of points below the given value. That is, the 0.3 (or 30%) quantile is the point at which 30% percent of the data fall below and 70% fall above that value. Rosa – 2018 Análise de Dados através de Gráficos – QQPlot Rosa – 2018 Análise de Dados através de Gráficos – QQPlot A 45-degree reference line is also plotted. If the two sets come from a population with the same distribution, the points should fall approximately along this reference line. The 2 batches do not appear to have come from populations with a common distribution. The batch 1 values are significantly higher than the corresponding batch 2 values. The differences are increasing from values 525 to 625. Then the values for the 2 batches get closer again. Rosa – 2018 Análise de Dados através de Gráficos – QQPlot The q-q plot is used to answer the following questions: Do two data sets come from populations with a common distribution? Do two data sets have common location and scale? Do two data sets have similar distributional shapes? Do two data sets have similar tail behavior? Slide 1 Slide 2 Slide 3 Slide 4 Slide 5 Slide 6 Slide 7 Slide 8 Slide 9 Slide 10 Slide 11 Slide 12 Slide 13 Slide 14 Slide 15 Slide 16 Slide 17
Compartilhar