Baixe o app para aproveitar ainda mais
Prévia do material em texto
PPáágina gina -- 11/26/26PUCPUC--Rio Rio –– MarMarçço 2010o 2010 Banco de Dados: Data Banco de Dados: Data WarehousingWarehousing, , Data Data MiningMining e e Gestão do Conhecimento nas Gestão do Conhecimento nas EmpresasEmpresas Prof. Hugo Azevedo (hugo.azevedo@terra.com.br) Prof. Sérgio Côrtes (scortes@inf.puc-rio.br) Resumir e DescreverResumir e Descrever Dados NuméricosDados Numéricos PPáágina gina -- 22/26/26PUCPUC--Rio Rio –– MarMarçço 2010o 2010 03.2 – Análise Estatística - 3/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes Resumir e Descrever Dados Numéricos Objetivos Objetivos Explicar propriedades dos dados Explicar propriedades dos dados numéricosnuméricos Descrever medidas de resumoDescrever medidas de resumo Tendência CentralTendência Central VariaçãoVariação FormaForma Analisar dados numéricos usando Analisar dados numéricos usando medidas de resumomedidas de resumo 03.2 – Análise Estatística - 4/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes Para Pensar $400,000 $70,000 $50,000 $30,000 $20,000 ... empregados alegam baixo pagamento -- a maioria dos trabalhadores ganha apenas $20.000 por ano. ... Presidente afirma que salário médio é $70.000 por ano! PPáágina gina -- 33/26/26PUCPUC--Rio Rio –– MarMarçço 2010o 2010 03.2 – Análise Estatística - 5/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes Notação Padrão Medida Amostra População Média ⎯X μ Desvio Padrão S σ Variância S2 σ2 Tamanho n N 03.2 – Análise Estatística - 6/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes Propriedades dos Dados Numéricos Tendência Central (Localização) Variação (Dispersão) Formato (forma) PPáágina gina -- 44/26/26PUCPUC--Rio Rio –– MarMarçço 2010o 2010 03.2 – Análise Estatística - 7/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes Dados Numéricos Propriedades e Medidas Propriedades Média Mediana Moda Média do Intervalo Média das Juntas Assimetria Kurtose Tendência Central Variação Formato Amplitude Variância Desvio Padrão Coeficiente de variação Amplitude Interquartil Média Geométrica 03.2 – Análise Estatística - 8/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes Dados Numéricos Propriedades e Medidas Central Tendency Propriedades Mean Median Mode Midrange Midhinge Range Variance Standard Deviation Coeff. of variation Skew Kurtosis Variation Shape Interquartile Range Geometric Mean PPáágina gina -- 55/26/26PUCPUC--Rio Rio –– MarMarçço 2010o 2010 03.2 – Análise Estatística - 9/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes Dados Numéricos Propriedades e Medidas Variação Propriedades Média Mediana Moda Média do Intervalo Média das Juntas Assimetria Kurtose Tendência Central Formato Amplitude Variancia Desvio Padrão Coeficiente de variação Amplitude Interquartil Média Geométrica 03.2 – Análise Estatística - 10/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes Tendência Central Média Média aritmética dos valores dos dadosMédia aritmética dos valores dos dados Média da amostraMédia da amostra Média do UniversoMédia do Universo 1 1 2 n i i n X X X XX n n = + + += = ∑ L 1 1 2 N i i N X X X X N N μ = + + += = ∑ L Tamanho da amostra Tamanho da população PPáágina gina -- 66/26/26PUCPUC--Rio Rio –– MarMarçço 2010o 2010 03.2 – Análise Estatística - 11/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes Tendência Central Média Medida mais comum de Tendência Central Medida mais comum de Tendência Central Atua como ‘ponto de equilíbrio’Atua como ‘ponto de equilíbrio’ Afetada por valores extremos Afetada por valores extremos (“(“outliersoutliers”)”) 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14 Média = 5 Média = 6 03.2 – Análise Estatística - 12/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes Tendência Central Exemplo de Média Dados brutosDados brutos: 10.3 4.9 8.9 11.7 6.3 7.7: 10.3 4.9 8.9 11.7 6.3 7.7 X X n X X X X X Xii n = = + + + + + = + + + + + = = ∑ 1 1 2 3 4 5 6 6 10 3 4 9 8 9 117 6 3 7 7 6 8 30 . . . . . . . PPáágina gina -- 77/26/26PUCPUC--Rio Rio –– MarMarçço 2010o 2010 03.2 – Análise Estatística - 13/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes Tendência Central Mediana Robusta medida de tendência centralRobusta medida de tendência central Valor do meio na seqüência ordenadaValor do meio na seqüência ordenada Se n é ímpar, valor do meio da seqüênciaSe n é ímpar, valor do meio da seqüência Se n é par, média dos valores do meioSe n é par, média dos valores do meio Não é afetada por valores extremosNão é afetada por valores extremos Posição da mediana na seqüênciaPosição da mediana na seqüência 2 1entoPosicionam de Ponto += n 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14 Mediana = 5 Mediana = 5 03.2 – Análise Estatística - 14/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes Tendência Central Exemplo de Mediana Amostra de tamanho ímpar Dados brutos : 24.1Dados brutos : 24.1 22.6 21.522.6 21.5 23.7 23.7 22.622.6 Ordenado: 21.5 22.6 Ordenado: 21.5 22.6 22.622.6 23.7 24.123.7 24.1 Posição:Posição: 1 2 1 2 33 4 54 5 6.22Mediana 0.3 2 15 2 1Ponto do Posição = =+=+= n PPáágina gina -- 88/26/26PUCPUC--Rio Rio –– MarMarçço 2010o 2010 03.2 – Análise Estatística - 15/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes Tendência Central Exemplo de Mediana Amostra de tamanho par Dados Brutos : 10.3Dados Brutos : 10.3 4.9 8.9 11.7 6.3 7.74.9 8.9 11.7 6.3 7.7 Ordenados: 4.9 6.3Ordenados: 4.9 6.3 7.77.7 8.98.9 10.3 11.710.3 11.7 Posição: 1 2Posição: 1 2 33 44 55 66 30.8 2 9.87.7Mediana 5.3 2 16 2 1Ponto do Posição =+= =+=+= n 03.2 – Análise Estatística - 16/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes Tendência Central Moda Valor que ocorre mais freqüentementeValor que ocorre mais freqüentemente Não é afetada por valores extremosNão é afetada por valores extremos Pode não haver nenhuma ou haver váriasPode não haver nenhuma ou haver várias Pode ser usada para dados numéricos e Pode ser usada para dados numéricos e categóricoscategóricos 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Mode = 9 No Mode 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Moda = 9 Sem moda PPáágina gina -- 99/26/26PUCPUC--Rio Rio –– MarMarçço 2010o 2010 03.2 – Análise Estatística - 17/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes Tendência Central Exemplo de Moda Nenhuma ModaNenhuma Moda Dados brutos: 10.3 4.9 8.9 11.7 6.3 7.7Dados brutos: 10.3 4.9 8.9 11.7 6.3 7.7 Uma ModaUma Moda Dados brutos: 6.3 Dados brutos: 6.3 4.94.9 8.9 6.3 8.9 6.3 4.9 4.94.9 4.9 Mais de 1 ModaMais de 1 Moda Dados brutos: 21 Dados brutos: 21 28 2828 28 41 41 43 4343 43 03.2 – Análise Estatística - 18/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes Tendência Central Semi-amplitude (Média de Intervalo) Meio da menor e maior observaçãoMeio da menor e maior observação Afetada por valores extremosAfetada por valores extremos 2 Intervalo de Média máximomínimo XX += PPáágina gina -- 1010/26/26PUCPUC--Rio Rio –– MarMarçço 2010o 2010 03.2 – Análise Estatística - 19/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes Tendência Central Exemplo de Semi-amplitude Dados BrutosDados Brutos: 10.3 4.9 8.9 11.7 6.3 7.7: 10.3 4.9 8.9 11.7 6.3 7.7 OrdenadosOrdenados: : 4.94.9 6.3 7.76.3 7.7 8.9 10.3 8.9 10.3 11.711.7 30.8 2 7.119.4 2 Int.deMédia= += += máximoXmínimoX 03.2 – Análise Estatística - 20/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes Tendência Central Média Geométrica Útil na medida da taxa de mudança de uma Útil na medida da taxa de mudança de uma variável ao longo do tempovariável ao longo do tempo Taxa de retorno média geométrica Taxa de retorno média geométrica Mede a situação de um investimento sobre o Mede a situação de um investimento sobre o tempo tempo ( )1/1 2 nG nX X X X= × × ×L ( ) ( ) ( ) 1/1 21 1 1 1nG nR R R R= + × + × × + −⎡ ⎤⎣ ⎦L PPáágina gina -- 1111/26/26PUCPUC--Rio Rio –– MarMarçço 2010o 2010 03.2 – Análise Estatística - 21/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes Tendência Central Média Geométrica - exemplo Taxa média de retorno: Taxa geométrica de retorno: Um investimento de R$ 100.000 desceu a R$ 50.000 no fim de ano um e subiu a R$ 100.000 no fim de ano dois: 1 2 3$100,000 $50,000 $100,000X X X= = = ( 50%) (100%) 25% 2 X − += = ( )( ) ( )( ) ( ) ( ) 1/ 2 1/ 2 1/ 2 1 50% 1 100% 1 0.50 2 1 1 1 0% GR ⎡ ⎤= + − × + −⎣ ⎦ = × − = − =⎡ ⎤⎣ ⎦ 03.2 – Análise Estatística - 22/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes Tendência Não-Central Quartis Medida de tendência Medida de tendência nãonão--centralcentral Parte (divide) os dados ordenados em Parte (divide) os dados ordenados em 4 quartos4 quartos 25%25% 25%25% 25%25% 25%25% QQ11 QQ22 QQ33 PPáágina gina -- 1212/26/26PUCPUC--Rio Rio –– MarMarçço 2010o 2010 03.2 – Análise Estatística - 23/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes Tendência Não-Central Quartís Medida de tendência nãoMedida de tendência não--centralcentral Parte dados ordenados em 4 quartos Parte dados ordenados em 4 quartos Posição do Posição do ii--ésimoésimo quartilquartil ( ) 4 1 de Posição +⋅= niQ i 25% 25% 25% 25% Q1 Q2 Q3 03.2 – Análise Estatística - 24/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes Tendência Não-Central Exemplo de Quartil (Q1) Dados brutosDados brutos: 10.3 4.9 8.9 11.7 6.3 7.7: 10.3 4.9 8.9 11.7 6.3 7.7 OrdenadosOrdenados: 4.9 : 4.9 6.36.3 7.7 8.9 10.3 11.77.7 8.9 10.3 11.7 PosiçãoPosição:: 1 1 22 33 44 5 65 6 ( ) ( ) 3.6Q 275.1 4 161 4 11Q de Posição 1 1 = ≅=+⋅=+⋅= n PPáágina gina -- 1313/26/26PUCPUC--Rio Rio –– MarMarçço 2010o 2010 03.2 – Análise Estatística - 25/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes Tendência Não-Central Exemplo de Quartil (Q2) Dados brutosDados brutos:: 10.310.3 4.94.9 8.98.9 11.711.76.3 7.76.3 7.7 OrdenadosOrdenados:: 4.94.9 6.36.3 7.77.7 8.98.9 10.310.3 11.711.7 PosiçãoPosição :: 11 22 33 44 55 66 3.8 2 9.87.7Q 5.3 2 43Q de Posição 2 2 =+= =+= 03.2 – Análise Estatística - 26/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes Tendência Não-Central Exemplo de Quartil (Q3) Dados brutosDados brutos: 10.3 4.9 8.9 11.7 6.3 7.7: 10.3 4.9 8.9 11.7 6.3 7.7 OrdenadosOrdenados:: 4.94.9 6.36.3 7.77.7 8.98.9 10.310.3 11.711.7 PosiçãoPosição :: 11 22 33 44 55 66 ( ) ( ) 3.10Q 525.5 4 163 4 13Q de Posição 3 3 = ≅=+⋅=+⋅= n PPáágina gina -- 1414/26/26PUCPUC--Rio Rio –– MarMarçço 2010o 2010 03.2 – Análise Estatística - 27/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes Tendência Central Média das Juntas (Midhinge) Meio do 1Meio do 1oo e 3e 3oo quartísquartís Não é afetado por valores extremosNão é afetado por valores extremos 2 juntasdasMédia 31 QQ += 03.2 – Análise Estatística - 28/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes Tendência Central Média das Juntas (Midhinge) : Exemplo Dados brutos:Dados brutos: 10.3 4.9 8.9 11.7 6.3 7.710.3 4.9 8.9 11.7 6.3 7.7 Ordenados: 4.9 Ordenados: 4.9 6.36.3 7.7 8.9 7.7 8.9 10.310.3 11.711.7 Posição:Posição: 1 1 22 33 44 55 66 3.8 2 3.103.6 2 juntasdasMédia 31 =+=+= QQ PPáágina gina -- 1515/26/26PUCPUC--Rio Rio –– MarMarçço 2010o 2010 03.2 – Análise Estatística - 29/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes Exercício Você é um analista financeiro do Você é um analista financeiro do Banco XBanco X. Você coletou os seguintes . Você coletou os seguintes preços no fechamento de novos preços no fechamento de novos lançamentos de ações: lançamentos de ações: 17, 16, 21, 18, 17, 16, 21, 18, 13, 16, 12, 11. 13, 16, 12, 11. Descreva os preços dos estoquesDescreva os preços dos estoques em termos da em termos da tendência centraltendência central.. 03.2 – Análise Estatística - 30/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes Resumo de Tendência Central M easure Equation Description M ean Σ X i / n Balance point M edian (n+1) Position 2 M iddle value when ordered M ode none M ost frequent M idrange X Xsmallest l est+ arg 2 M iddle of sm allest & largest M idhinge Q Q1 3 2 + M iddle of 1st & 3rd quartile where Q i = i (n+1)/4 PPáágina gina -- 1616/26/26PUCPUC--Rio Rio –– MarMarçço 2010o 2010 03.2 – Análise Estatística - 31/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes Dados Numéricos Propriedades e Medidas FormatoTendência Central Propriedades Média Mediana Moda Média do Intervalo Média das Juntas Assimetria Kurtose Variação Amplitude Variância Desvio Padrão Coeficiente de variação Amplitude Interquartil 03.2 – Análise Estatística - 32/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes Medida de Variação Amplitude Diferença entre a maior a menor Diferença entre a maior a menor observaçãoobservação Ignora como os dados são distribuídosIgnora como os dados são distribuídos Amplitude = Xmaior – Xmenor 7 8 9 10 11 12 Intervalo= 12 - 7 = 5 7 8 9 10 11 12 Intervalo = 12 - 7 = 5 7 8 9 10 11 12 Intervalo= 12 - 7 = 5 7 8 9 10 11 12 Intervalo = 12 - 7 = 5 PPáágina gina -- 1717/26/26PUCPUC--Rio Rio –– MarMarçço 2010o 2010 03.2 – Análise Estatística - 33/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes Medida de Variação Amplitude Interquartílica Também chamada afastamento do meioTambém chamada afastamento do meio Afastamento nos 50% do meio %Afastamento nos 50% do meio % Não é afetado por valores extremosNão é afetado por valores extremos Fórmula: Diferença entre o primeiro e o Fórmula: Diferença entre o primeiro e o terceiro quartilterceiro quartil Dados Ordenados: 11 12 13 16 16 17 17 18 21 Amplitude Interquartílica = 3 1 17.5 12.5 5Q Q= − = − = 03.2 – Análise Estatística - 34/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes Medida de Variação Variância Importante medida de variaçãoImportante medida de variação Considera como os dados são distribuídosConsidera como os dados são distribuídos Mostra a variação em torno da média (X ou Mostra a variação em torno da média (X ou μμ)) Variância da amostraVariância da amostra Variância da PopulaçãoVariância da População ( )2 2 1 N i i X N μ σ = − = ∑ ( )2 2 1 1 n i i X X S n = − = − ∑ PPáágina gina -- 1818/26/26PUCPUC--Rio Rio –– MarMarçço 2010o 2010 03.2 – Análise Estatística - 35/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes Medida de Variação Variância - exemplo Dados brutosDados brutos:: 10.310.3 4.9 8.9 11.7 6.3 7.74.9 8.9 11.7 6.3 7.7 ( ) ( ) ( ) ( ) S X X n X X n S i i n i i n 2 2 1 1 2 2 2 2 1 8 3 10 3 8 3 4 9 8 3 7 7 8 3 6 1 6 368 = −∑ − = ∑ = = − + − + ⋅ ⋅ ⋅ + −−= = =where . . . . . . . . 03.2 – Análise Estatística - 36/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes Medida de Variação Desvio Padrão Importante medida de variaçãoImportantemedida de variação Considera como os dados são distribuídosConsidera como os dados são distribuídos Mostra a variação em torno da média (X ou Mostra a variação em torno da média (X ou μμ)) • Tem as mesmas unidades que os dados originais Desvio Padrão da amostraDesvio Padrão da amostra Desvio Padrão da PopulaçãoDesvio Padrão da População ( )2 1 1 n i i X X S n = − = − ∑ ( )2 1 N i i X N μ σ = − = ∑ PPáágina gina -- 1919/26/26PUCPUC--Rio Rio –– MarMarçço 2010o 2010 03.2 – Análise Estatística - 37/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes Medida de Variação Desvio Padrão - comparação Média = 15.5 s = 3.338 11 12 13 14 15 16 17 18 19 20 21 11 12 13 14 15 16 17 18 19 20 21 Dados B Dados A Média = 15.5 s = .9258 11 12 13 14 15 16 17 18 19 20 21 Média = 15.5 s = 4.57 Dados C 03.2 – Análise Estatística - 38/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes Medida de Variação Coeficiente de Variação Medida de dispersão relativaMedida de dispersão relativa Sempre em percentual %Sempre em percentual % Mostra variação relativa à médiaMostra variação relativa à média É usado comparar dois ou mais grupos de É usado comparar dois ou mais grupos de dados medidos em unidades diferentes dados medidos em unidades diferentes Fórmula (amostra):Fórmula (amostra): CV S X = ⎛⎝⎜ ⎞ ⎠⎟ ⋅100% PPáágina gina -- 2020/26/26PUCPUC--Rio Rio –– MarMarçço 2010o 2010 03.2 – Análise Estatística - 39/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes Medida de Variação Coeficiente de Variação - Exemplo Grupo 1 dadosGrupo 1 dados:: 11 22 33 Grupo 2 dadosGrupo 2 dados:: 100100 200200 300300 Group 1 Group 2 CV S X CV S X = ⎛⎝⎜ ⎞ ⎠⎟ ⋅ = ⋅ = = ⎛⎝⎜ ⎞ ⎠⎟ ⋅ = ⋅ = 100% 1 2 100% 50% 100% 100 200 100% 50% 03.2 – Análise Estatística - 40/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes Medida de Variação Coeficiente de Variação - Exemplo Estoque AEstoque A Média de preço do último ano = R$ 50,00Média de preço do último ano = R$ 50,00 Desvio Padrão = R$ 5,00Desvio Padrão = R$ 5,00 Estoque BEstoque B Média de preço do último ano = R$ 100,00Média de preço do último ano = R$ 100,00 Desvio Padrão = R$ 5,00Desvio Padrão = R$ 5,00 Coeficiente de Variação:Coeficiente de Variação: Estoque AEstoque A Estoque BEstoque B $5100% 100% 10% $50 SCV X ⎛ ⎞ ⎛ ⎞= = =⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠ $5100% 100% 5% $100 SCV X ⎛ ⎞ ⎛ ⎞= = =⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠ PPáágina gina -- 2121/26/26PUCPUC--Rio Rio –– MarMarçço 2010o 2010 03.2 – Análise Estatística - 41/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes Medida de Variação Exercício Você é um analista financeiro da Você é um analista financeiro da Banco XBanco X. Você coletou os seguintes . Você coletou os seguintes preços no fechamento de novos preços no fechamento de novos lançamentos de açõeslançamentos de ações: 17, 16, 21, 18, : 17, 16, 21, 18, 13, 16, 1213, 16, 12.. Descreva a Descreva a volatilidadevolatilidade dos preços dos preços das ações.das ações. 03.2 – Análise Estatística - 42/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes Medida de Variação Resumo Measure Equation Description Range Xlargest - Xsmallest Total spread Interquartile range Q3 - Q1 Spread of middle 50% Standard deviation (Sample) X X n i − − ( )∑ 2 1 Dispersion about sample mean Standard deviation (Population) X N i −( )∑ μ 2 Dispersion aboutpopulation mean Variance (Sample) Σ(Xi -⎯X)2 n - 1 Squared dispersion about sample mean Coeff. of variation (S /⎯X)100% Relative variation PPáágina gina -- 2222/26/26PUCPUC--Rio Rio –– MarMarçço 2010o 2010 03.2 – Análise Estatística - 43/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes Dados Numéricos Propriedades e Medidas Variação FormatoTendência Central Propriedades Média Mediana Moda Média do Intervalo Média das Juntas Assimetria Kurtose Amplitude Variância Desvio Padrão Coeficiente de variação Amplitude Interquartil 03.2 – Análise Estatística - 44/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes Formato Forma da Distribuição Média = Mediana =ModaMédia < Mediana < Moda Moda < Mediana < Média Assimetria a DireitaAssimetria a Esquerda Simetria Descreve como os dados são distribuídosDescreve como os dados são distribuídos Medidas de formato (forma)Medidas de formato (forma) Simetria ou AssimetriaSimetria ou Assimetria PPáágina gina -- 2323/26/26PUCPUC--Rio Rio –– MarMarçço 2010o 2010 03.2 – Análise Estatística - 45/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes Análise Exploratória de Dados Diagrama de Diagrama de BoxBox--andand--WhiskerWhisker Disposição Gráfica dos dados usandoDisposição Gráfica dos dados usando resumo de 5 númerosresumo de 5 números Mediana( ) 4 6 8 10 12 XmaiorXmenor 1Q 3Q 2Q 03.2 – Análise Estatística - 46/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes Formato da Distribuição e Diagrama de Box-and-Whisker Assimetria a DireitaAssimetria a Esquerda Simetria 1Q 1Q 1Q2Q 2Q 2Q3Q 3Q3Q PPáágina gina -- 2424/26/26PUCPUC--Rio Rio –– MarMarçço 2010o 2010 03.2 – Análise Estatística - 47/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes Coeficiente de Correlação • Mede a força do relacionamento linear entre duas variáveis quantitativas ( )( ) ( ) ( ) 1 2 2 1 1 n i i i n n i i i i X X Y Y r X X Y Y = = = − − = − − ∑ ∑ ∑ 03.2 – Análise Estatística - 48/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes Características do Coeficiente de Correlação Um grau de liberdade Varia entre –1 e 1 Mais perto de –1, mais forte o relacionamento linear negativo Mais perto de 1, mais forte o relacionamento linear positivo Mais perto de 0, não existe (é fraco) o relacionamento linear PPáágina gina -- 2525/26/26PUCPUC--Rio Rio –– MarMarçço 2010o 2010 03.2 – Análise Estatística - 49/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes Gráfico de Dispersão com Vários Coeficientes de Correlação Y X Y X Y X Y X Y X r = -1 r = -.6 r = 0 r = .6 r = 1 Y X Y X Y X Y X Y X r = -1 r = -.6 r = 0 r = .6 r = 1 03.2 – Análise Estatística - 50/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes Armadilhas nas das Medidas Descritivas Numéricas A análise de dados é objetiva Precisa informar às medidas de resumo que melhor reunem as suposições sobre o conjunto de dados A interpretação dos dados é subjetiva Deve ser feita de maneira justa, neutra e clara PPáágina gina -- 2626/26/26PUCPUC--Rio Rio –– MarMarçço 2010o 2010 03.2 – Análise Estatística - 51/52Agosto 2009 – Hugo Azevedo & Sérgio Côrtes Considerações éticas Medidas descritivas numéricas Deve documentar resultados bons e maus Deve ser apresentada de uma maneira justa, objetiva e neutra Não deve usar medidas sumárias impróprias para distorcer os fatos
Compartilhar