Baixe o app para aproveitar ainda mais
Prévia do material em texto
ANÁLISE DESCRITIVAANÁLISE DESCRITIVA FORMATAÇÃO & DESIGN Cléber da Costa Figueiredo figuecl@usp.br Thiago Rodrigo Alves Carneiro thiagorodrigo@ime.usp.br Texto da aula Profª Carmen Diva Saldiva de André Prof. Gilberto Alvarenga Paula Classificação das variáveisClassificação das variáveis Variável Qualquer característica associada a uma população Classificação Classificação Qualitativa QuantitativaQualitativa Quantitativa nominal contínua nominal contínua ordinal discreta ordinal discreta ExemploExemplo Arquivo Arquivo PulsePulse do Minitab do Minitab Refere-se a um experimento feito por alunos. Cada aluno registrou sua altura, peso, sexo, hábito de fumar, nível de atividade física usual e pulsação em repouso. Então todos eles jogaram moedas e aqueles que tiraram cara fizeram corrida estacionária por um minuto. Depois disso todos os alunos mediram novamente sua pulsação. Informações do arquivo Informações do arquivo PulsePulse Information of the worksheetInformation of the worksheet Column Count Column Count Name Name C1 92 Pulse1C1 92 Pulse1 C2 92 Pulse2C2 92 Pulse2 C3 92 Ran (1:correu, 2:não correu)C3 92 Ran (1:correu, 2:não correu) C4 92 Smokes (1:fumante, 2:não fumante)C4 92 Smokes (1:fumante, 2:não fumante) C5 92 Sex (1:masculino, 2:feminino)C5 92 Sex (1:masculino, 2:feminino) C6 92 HeightC6 92 Height C7 92 WeightC7 92 Weight C8 92 Activity (1:leve, 2:moderada, 3:forte)C8 92 Activity (1:leve, 2:moderada, 3:forte) (Pulsação antes de correr)(Pulsação antes de correr) (Pulsação depois de correr)(Pulsação depois de correr) MTB > INFOMTB > INFO Pulse1 Pulse2 Ran Smokes Sex Height Weight ActivityPulse1 Pulse2 Ran Smokes Sex Height Weight Activity 64 88 1 2 1 66.00 140 264 88 1 2 1 66.00 140 2 58 70 1 2 1 72.00 145 258 70 1 2 1 72.00 145 2 62 76 1 1 1 73.50 160 362 76 1 1 1 73.50 160 3 66 78 1 1 1 73.00 190 166 78 1 1 1 73.00 190 1 64 80 1 2 1 69.00 155 264 80 1 2 1 69.00 155 2 74 84 1 2 1 73.00 165 174 84 1 2 1 73.00 165 1 84 84 1 2 1 72.00 150 384 84 1 2 1 72.00 150 3 68 72 1 2 1 74.00 190 268 72 1 2 1 74.00 190 2 62 75 1 2 1 72.00 195 262 75 1 2 1 72.00 195 2 ............ Informações do arquivo PulseInformações do arquivo Pulse Média Mediana Moda Quartis Máximo Mínimo Variáveis QuantitativasVariáveis Quantitativas Medidas de posição Amplitude Variância Desvio padrão Intervalo interquartil Coeficiente de Variação Variáveis QuantitativasVariáveis Quantitativas Medidas de dispersão MTB > DESCRIBE C1 C2 C6 C7MTB > DESCRIBE C1 C2 C6 C7 Descriptive StatisticsDescriptive Statistics Variable N Mean Median Tr Mean StDev SEMeanVariable N Mean Median Tr Mean StDev SEMean Pulse1 92 72.87 71.00 72.61 11.01 1.15Pulse1 92 72.87 71.00 72.61 11.01 1.15 Pulse2 92 80.00 76.00 78.85 17.09 1.78Pulse2 92 80.00 76.00 78.85 17.09 1.78 Height 92 68.72 Height 92 68.72 69.00 68.78 3.66 0.38 69.00 68.78 3.66 0.38 Weight 92 145.15 Weight 92 145.15 145.00 144.52 23.74 145.00 144.52 23.74 2.48 2.48 Variáveis quantitativas no arquivo Variáveis quantitativas no arquivo PulsePulse MTB > DESCRIBE C1 C2 C6 C7MTB > DESCRIBE C1 C2 C6 C7 Descriptive StatisticsDescriptive Statistics Variable Min Max Q1 Q3Variable Min Max Q1 Q3 Pulse1 48.00 100.00 64.00 80.00Pulse1 48.00 100.00 64.00 80.00 Pulse2 50.00 140.00 68.00 87.00Pulse2 50.00 140.00 68.00 87.00 Height 61.00 75.00 66.00 72.00Height 61.00 75.00 66.00 72.00 Weight 95.00 215.00 125.00 156.50Weight 95.00 215.00 125.00 156.50 Variáveis quantitativas no arquivo Variáveis quantitativas no arquivo PulsePulse MTB > DESCRIBE C1;MTB > DESCRIBE C1; SUBC > BY C5.SUBC > BY C5. Descriptive StatisticsDescriptive Statistics Variable Sex N Mean Median Tr Mean StDev SEMeanVariable Sex N Mean Median Tr Mean StDev SEMean Pulse1 1 57 70.42 70.00 70.27 9.95 1.32Pulse1 1 57 70.42 70.00 70.27 9.95 1.32 2 35 76.86 78.00 76.65 11.62 1.96 2 35 76.86 78.00 76.65 11.62 1.96 Descrever a pulsação em repouso Descrever a pulsação em repouso segundo o sexosegundo o sexo MTB > DESCRIBE C1;MTB > DESCRIBE C1; SUBC > BY C5.SUBC > BY C5. Descriptive StatisticsDescriptive Statistics Variable Sex Min Max Q1 Q3Variable Sex Min Max Q1 Q3 Pulse1 1 48.00 92.00 63.00 75.00Pulse1 1 48.00 92.00 63.00 75.00 2 58.00 100.00 66.00 86.00 2 58.00 100.00 66.00 86.00 Calcular o intervalo-interquartil para cada sexoCalcular o intervalo-interquartil para cada sexo Descrever a pulsação em repouso Descrever a pulsação em repouso segundo o sexosegundo o sexo Variáveis QualitativasVariáveis Qualitativas Para dados qualitativos podemos construir tabelas que os quantificam por categoria de classificação Variáveis qualitativas no arquivo PulseVariáveis qualitativas no arquivo Pulse Ran Smokes Sex Activity MTB > TALLY C3 C4 C5 C8MTB > TALLY C3 C4 C5 C8 Summary Statistics for Discrete Variables Ran Count Smokes Count Sex Count Activity CountRan Count Smokes Count Sex Count Activity Count 1 35 1 28 1 57 0 1 1 35 1 28 1 57 0 1 2 57 2 64 2 35 1 9 2 57 2 64 2 35 1 9 N= 92 N= 92 N= 92 2 61 N= 92 N= 92 N= 92 2 61 3 21 3 21 N= 92N= 92 Variáveis qualitativas no arquivo PulseVariáveis qualitativas no arquivo Pulse Rows: Sex Columns: SmokesRows: Sex Columns: Smokes 1 2 All 1 2 All 1 1 20 37 5720 37 57 35.09 64.91 100.0035.09 64.91 100.00 22 8 27 358 27 35 22.86 77.14 100.00 22.86 77.14 100.00 All All 28 64 9228 64 92 30.43 69.57 100.0030.43 69.57 100.00 MTB > Table 'Sex' 'Smokes'; SUBC > Counts; SUBC > RowPercents. Há indícios de associação entre sexo e Há indícios de associação entre sexo e hábito de fumar?hábito de fumar? Dentre as mulheres, qual a Dentre as mulheres, qual a porcentagem das que correram?porcentagem das que correram? Rows: Ran Columns: SexRows: Ran Columns: Sex 1 2 All 1 2 All 1 1 24 11 3524 11 35 42.10 31.43 38.0442.10 31.43 38.04 2 2 33 24 5733 24 57 57.90 68.57 61.9657.90 68.57 61.96 All All 57 35 9257 35 92 100.00 100.00 100.00100.00 100.00 100.00 MTB > Table 'Ran' 'Sex'; SUBC> Counts; SUBC> ColPercents. GráficosGráficos para variáveis quantitativaspara variáveis quantitativas HistogramaHistograma O histograma para uma variável contínua é obtido agrupando-se os valores dessa variável em classes. Características do HistogramaCaracterísticas do Histograma - - Bases iguaisBases iguais Construir um retângulo para cada classe, Construir um retângulo para cada classe, com base igual ao tamanho da classe e com base igual ao tamanho da classe e altura proporcional à frequência da classe.altura proporcional à frequência da classe. Exemplo 1Exemplo 1 Faixa Etária Frequência Proporção 20 30 10 0,25 30 40 20 0,50 40 50 10 0,25 40 Histograma de frequência (proporção)Histograma de frequência (proporção) ff 0,6 -0,6 - 0,5 -0,5 - 0,4 -0,4 - 0,3 -0,3 - 0,2 -0,2 - 0,1 -0,1 - 0,0 -0,0 - 20 30 40 50 idade20 30 40 50 idade Histograma de densidadeHistograma de densidade hh 0,06 -0,06 - 0,05 -0,05 - 0,04 -0,04 - 0,03 -0,03 - 0,02 -0,02 - 0,01 -0,01 - 0,00 -0,00 - 20 30 40 50 idade20 30 40 50 idade Área (frequência) = base Área (frequência) = base xx altura (densidade) altura (densidade) ff = 10 = 10 xx h h ⇒⇒ h h = (f / 10)= (f / 10) Bases diferentes Bases diferentes Exemplo 1 modificadoExemplo 1 modificado Construir um retângulo para cada classe, Construir um retângulo para cada classe, com base igual ao tamanho da classe e com base igual ao tamanho da classe e área do retângulo igual à frequência da área do retângulo igual à frequência da classe. A altura será dada por:classe. A altura será dada por: h = f/base f: frequência relativah = f/base f: frequência relativa Faixa Etária Frequência Proporção 20 30 10 0,250 30 35 15 0,375 35 50 15 0,375 h 0,025 0,075 0,025 Histograma de frequênciaHistograma de frequência ff 0,6 -0,6 - 0,5 -0,5 - 0,4 -0,4 - 0,3 -0,3 - 0,2 -0,2 - 0,1 -0,1 - 0,0 -0,0 - 20 30 35 50 idade20 30 35 50 idade Faz sentido?Faz sentido? Histograma de densidadeHistograma de densidade hh 0,07 -0,07 - 0,06 -0,06 - 0,05 -0,05 - 0,04 -0,04 - 0,03 -0,03 - 0,02 -0,02 - 0,01 -0,01 - 0,00 -0,00 - 20 30 35 50 idade20 30 35 50 idade 74,573,071,570,068,567,065,564,062,561,0 20 10 0 Height Fr eq ue nc y Distribuição de frequênciaDistribuição de frequência para alturapara altura (arquivo PULSE)(arquivo PULSE) Classe de altura f frClasse de altura f fr 60,25-61,75 61,75-63,25 63,25-64,75 64,75-66,25 66,25-67,75 67,75-69,25 69,25-70,75 70,75-72,25 72,25-73,75 73,75-75,25 Total 1 10 2 13 7 20 7 15 9 8 92 0,011 0,109 0,022 0,141 0,076 0,217 0,076 0,163 0,098 0,087 1 MTB > HIST C6MTB > HIST C6 Arquivo PULSE – Histograma da altura Arquivo PULSE – Histograma da altura (Height)(Height) Arquivo Arquivo PulsePulse – Diagrama de pontos – Diagrama de pontos (Dotplot) da pulsação em repouso(Dotplot) da pulsação em repouso MTB > DOTPLOT C1MTB > DOTPLOT C1 . . . : . : : : : : : . : : : . . . : . : : : . . . . : : : : : : : : : : . . : . : . : : : : : : : : : : . . : . : . : : :.: : : : : : : : : : : : .. : : : . : . . : : :.: : : : : : : : : : : : .. : : : . : . ---+---------+---------+---------+---------+---------+- ---+---------+---------+---------+---------+---------+- 50 60 50 60 70 80 90 100 70 80 90 100 Pulse1 Pulse1 Arquivo Arquivo PulsePulse – Dotplot da pulsação – Dotplot da pulsação em repouso segundo Sexoem repouso segundo Sexo MTB > DotPlot 'Pulse1';MTB > DotPlot 'Pulse1'; SUBC> Same;SUBC> Same; SUBC> By 'Sex'.SUBC> By 'Sex'. :: SexSex 1 : 1 : : : . : : . . : . : . . . : : : :. : : : : . . . . . : : : : : : : : : : : . . . : . : : . : : : : : : : : : : : . . . : . : : --+---------+---------+---------+---------+---------+- --+---------+---------+---------+---------+---------+- SexSex 2 . . 2 . . :: . . . . : . : : : : : : : : ..: . . : . . : . : : : : : : : : ..: . . : . . --+---------+---------+---------+---------+---------+- --+---------+---------+---------+---------+---------+- 50 60 70 80 90 100 50 60 70 80 90 100 Pulse1 Pulse1 Diagrama de caixa (Boxplot)Diagrama de caixa (Boxplot) Representa os dados através de um retângulo construído com os quartis e fornece informações sobre valores extremos _Q3 _Q1 _md linha auxiliar ⇓ _Q3 _Q1 _md _Q1-1,5d _Q3+1,5d** ** ** ** ** ** _Q3 _Q1 _md _Q1-1,5d _Q3+1,5d altura _Q3 _Q1 d Q1 = 1º quartil md = mediana Q3 = 3º quartil d = diferença interquartilQ1 = 1º quartil md = mediana Q3 = 3º quartil d = diferença interquartil Construção do BoxplotConstrução do Boxplot Arquivo Arquivo PulsePulse – Boxplot da pulsação – Boxplot da pulsação em repousoem repouso MTB > BOXPLOT C1MTB > BOXPLOT C1 Arquivo Arquivo PulsePulse – Boxplot da pulsação – Boxplot da pulsação em repousoem repouso MTB > BOXPLOT C1*C5MTB > BOXPLOT C1*C5 Arquivo Arquivo CholestCholest – Boxplot do nível de – Boxplot do nível de colesterol segundo o número de dias colesterol segundo o número de dias após o enfartoapós o enfarto Diagrama de dispersãoDiagrama de dispersão Avalia o comportamento conjunto de duas variáveis quantitativas MTB > PLOT C6*C7MTB > PLOT C6*C7 Arquivo Pulse – Relação entre o peso Arquivo Pulse – Relação entre o peso a altura dos alunosa altura dos alunos Slide 1 Slide 2 Slide 3 Slide 4 Slide 5 Slide 6 Slide 7 Slide 8 Slide 9 Slide 10 Slide 11 Slide 12 Slide 13 Slide 14 Slide 15 Slide 16 Slide 17 Slide 18 Slide 19 Slide 20 Slide 21 Slide 22 Slide 23 Slide 24 Slide 25 Slide 26 Slide 27 Slide 28 Slide 29 Slide 30 Slide 31 Slide 32 Slide 33 Slide 34
Compartilhar