Baixe o app para aproveitar ainda mais
Prévia do material em texto
Estatística DescritivaEstatística Descritiva (II) (II) 2 Experimento envolvendo alunos. Cada um tem altura, peso, sexo, hábito de fumar e nível de atividade física anotados. Todos jogam moedas: se “CARA”, é realizada uma corrida corrida estacionáriaestacionária por 1 minuto.por 1 minuto. As pulsações antes e após a corrida são registradas. Os demais registram a pulsação em dois instantes (intervalo de 1 minuto), sem a corrida estacionária. Arquivo PULSEPULSE do Minitab 3 Informações do arquivo PULSEPULSE MTB > INFOMTB > INFO Information of the worksheet Column Count Name C1 92 Pulse1 C2 92 Pulse2 C3 92 Ran 1- fez corrida 2- não fez corrida C4 92 Smokes 1- fuma 2- não fuma C5 92 Sex 1- masculino 2- feminino C6 92 Height C7 92 Weight C8 92 Activity 0- não tem 1- leve 2- moderada 3- intensa 4 Row Pulse1 Pulse2 Ran Smokes Sex Height Weight Activity 1 64 88 1 2 1 66,00 140 2 2 58 70 1 2 1 72,00 145 2 3 62 76 1 1 1 73,50 160 3 4 66 78 1 1 1 73,00 190 1 5 64 80 1 2 1 69,00 155 2 6 74 84 1 2 1 73,00 165 1 7 84 84 1 2 1 72,00 150 3 8 68 72 1 2 1 74,00 190 2 • • • PlanilhaPlanilha (parcial) 5 Variáveis qualitativasVariáveis qualitativas Variáveis quantitativasVariáveis quantitativas Pulse 1 Pulse 2 Height Weight DiscretaDiscreta ContínuaContínua Ran Smokes Sex Activity NominalNominal OrdinalOrdinal 6 Variáveis QuantitativasVariáveis Quantitativas Variância (s2) Desvio padrão (s) Intervalo-interquartil (Q3 – Q1) Coeficiente de variação (CV) -Média (x) Mediana (md) Quartis (Q1, Q3) Máximo (máx) Mínimo (min) Medidas de posiçãoMedidas de posição Medidas de dispersãoMedidas de dispersão 7 Descriptive StatisticsDescriptive Statistics Variable Variable NN Mean Median StDev Mean Median StDev Pulse1Pulse1 92 72,87 71 11,01 HeightHeight 92 68,72 69 3,66 WeightWeight 92 145,15 145 23,74 Variable Min Max Variable Min Max QQ1 1 QQ33 Pulse1Pulse1 48 100 64 80 Height Height 61 75 66 72 Weight Weight 95 215 125 156,5 MTB > describe c1 c6 c7MTB > describe c1 c6 c7 CVCV 11,01/72,87=0,15 3,66/68,72=0,05 23,74/145,15=0,16 8 • 50% dos indivíduos tem pulsação menor ou igual a 71 batimentos por minuto; • 25% dos indivíduos tem altura igual ou menor a 66 pés; • 75% dos indivíduos tem peso igual ou menor a 156,5 libras; • A variável com menor dispersão em relação à média é a altura; • Pulsação e peso apresentam dispersão em relação à média praticamente iguais e o triplo da dispersão da altura. Alguns comentários:Alguns comentários: 9 MTB > describe c1;MTB > describe c1; SUBC > by c3.SUBC > by c3. Variable Ran Variable Ran N N Mean Median StDev Mean Median StDev Pulse1Pulse1 1 1 35 73,60 70 11,44 22 57 72,42 72 10,82 Variable Ran Min Max Variable Ran Min Max QQ1 1 QQ3 CV3 CV Pulse1Pulse1 1 1 58 100 64 80 15,54 22 48 94 64 81 14,94 MTB > describe c2;MTB > describe c2; SUBC > by c3.SUBC > by c3. Variable Ran Variable Ran NN Mean Median StDev Mean Median StDev Pulse2Pulse2 1 1 35 92,51 88 18,94 22 57 72,32 70 9,95 Variable Ran Min Max Variable Ran Min Max QQ1 1 QQ3 CV3 CV Pulse2 1Pulse2 1 58 140 76 106 20,48 2 2 50 94 66 79 13,76 10 • Com relação às medidas de posição e de dispersão, os dois grupos têm praticamente os mesmos valores de Pulse1 (pulsação antes de correr ). O mesmo ocorre para a dispersão relativamente à média (CV). • Quanto ao Pulse2, o grupo que correu (Ran=1) tem média e mediana maiores que as do grupo que não correu (Ran=2). Com relação à dispersão dessa variável, o grupo que correu apresenta desvio padrão aproximadamente igual ao dobro do valor do grupo que não correu e, relativamente à média (CV), a dispersão dos que correram é cerca de 50% maior do que a dos que não correram. Alguns comentários: 11 Descrevendo a pulsação em repouso segundo o sexo MTB > describe C1;MTB > describe C1; SUBC> by C5.SUBC> by C5. Variable Variable SexSex N N Mean Median StDev Mean Median StDev Pulse1 1 57 70,42 70 9,95 2 35 76,86 78 11,62 Variable Variable SexSex Min Max Q1 Q3 CV Min Max Q1 Q3 CV Pulse1 1 48 92 63 75 14,13 2 58 100 66 86 15,11 12 Os dados também podem ser resumidos construindo-se uma tabela de distribuição de frequências . Distribuição de frequênciasDistribuição de frequências de uma variável é uma lista dos valores individuais ou dos intervalos de valores que a variável pode assumir, com as respectivas frequências de ocorrência. 13 Não há perda de informação MTB > tally c1 No arquivo PULSEPULSE Summary Statistics for Discrete Variables Pulse1 Count Percent 48 1 1,09 54 2 2,17 58 3 3,26 60 4 4,35 61 1 1,09 62 9 9,78 64 4 4,35 66 5 5,43 68 11 11,96 70 6 6,52 72 6 6,52 74 5 5,43 76 5 5,43 78 5 5,43 80 3 3,26 82 3 3,26 84 4 4,35 86 1 1,09 87 1 1,09 88 3 3,26 90 4 4,35 92 2 2,17 94 1 1,09 96 2 2,17 100 1 1,09 N= 92 14 Alternativa: construir intervalos de classe Classe de pulsação frequência 48 |- 54 54 |- 60 60 |- 66 66 |- 72 72 |- 78 78 |- 84 84 |- 90 90 |- 96 96 |- 102 1 5 18 22 16 11 9 7 3 Informações mais resumidas Perda de informação 15 Exemplo 2:Exemplo 2: Variável: altura ( height) contínua Construir intervalos de classe Classes de altura f fr 60,25 |- 61,75 61,75 |- 63,25 63,25 |- 64,75 64,75 |- 66,25 66,25 |- 67,75 67,75 |- 69,25 69,25 |- 70,75 70,75 |- 72,25 72,25 |- 73,75 73,75 |- 75,25 Total 1 10 2 13 7 20 7 159 8 92 0,011 0,109 0,022 0,141 0,076 0,217 0,076 0,163 0,098 0,087 1 Distribuição de frequência para altura ( arquivo PULSE) 16 Variáveis QuantitativasVariáveis Quantitativas GráficosGráficos • “Dotplot” • “Boxplot” • Histograma 17 DOTPLOTDOTPLOT Arquivo PULSEPULSE – Dotplot da pulsação em repouso (PULSE1) MTB > DOTPLOT C1MTB > DOTPLOT C1 . . : : : : . : : : . . . . : : : : : : : : : : . . : . : . : : :.: : : : : : : : : : : : ..: : : . : . ---+---------+---------+---------+---------+---------+- 50 60 70 80 90 100 Pulse1 18 Arquivo PULSEPULSE – Dotplot da pulsação em repouso (PULSE1) segundo Sexo (SEX) MTB > Dotplot 'Pulse1' * 'Sex' Notar que os Dotplots são construídos na mesma escala. : Sex 1 : : : . . : . . : : : : . . . : : : : : : : : : : : . . . : . : : --+---------+---------+---------+---------+---------+- Sex 2 . . : . ..: . : : : : : : : : ..: . . : . --+---------+---------+---------+---------+---------+- 50 60 70 80 90 100 Pulse1 19 BoxplotBoxplot Representa os dados através de um retângulo construído com os quartisquartis e fornece informações sobre os valores valores extremos.extremos. 20 “Máximo” Q3 Mediana Q1 “Mínimo” 25% 50% 75% Construção LS=Q3+1,5(Q3-Q1) LI=Q1-1,5(Q3-Q1) “Máximo” é o maior valor menor que LS; “Mínimo” é o menor valor maior que LI. 21 ExemplExempl o:o: md = 41,5 Q1 = 30,25 Q3 = 49,5 * * 120 100 80 60 40 20 Dados ordenados (n=36) 18 21 21 23 23 25 27 29 30 31 32 32 32 34 35 36 38 41 42 42 43 44 45 46 46 47 48 50 54 56 57 58 60 61 98 116 LI = Q1 - 1,5(Q3 - Q1) =1,38 LS = Q3 + 1,5(Q3 - Q1) =78,38 Observações discrepantes? Tempo de sobrevivência (dias) após cirurgia 22 Arquivo PULSEPULSE –Boxplot da pulsação em repouso (PULSE1) MTB > BOXPLOT C1MTB > BOXPLOT C1 Alguns Comentários:Alguns Comentários: • não há observações discrepantes; • a distribuição dos valores é aproximadamente simétrica. 23 Arquivo PULSEPULSE – Boxplots da pulsação em repouso (PULSE1PULSE1) por sexo (SEXSEX) MTB > BOXPLOT C1*C5 Alguns Comentários:Alguns Comentários: • não há observações discrepantes; • medidas de posição tendem a ser maiores para as mulheres; • não há fortes evidências de assimetria nos dois grupos. 24 Histograma Bases iguais Construir um retângulo para cada classe, com base igual ao tamanho da classe e altura proporcional à frequência da classe (f). Agrupar os dados em intervalos de classes (distribuição de frequências) Bases diferentes Construir um retângulo para cada classe, com base igual ao tamanho da classe e área do retângulo igual a frequência relativa da classe(fr). A altura será dada por h = fr/base (densidade de frequência). 25 Arquivo PULSEPULSE – Histograma da alturaHistograma da altura (Height) 74,573,071,570,068,567,065,564,062,561,0 20 10 0 Height Fr eq ue nc y ⇐ MTB > HIST C6 Distribuição de frequências para altura (arquivo PULSE) Classe de altura f fr 60,25 ⊢ 61,75 61,75 ⊢ 63,25 63,25 ⊢ 64,75 64,75 ⊢ 66,25 66,25 ⊢ 67,75 67,75 ⊢ 69,25 69,25 ⊢ 70,75 70,75 ⊢ 72,25 72,25 ⊢ 73,75 73,75 ⊢ 75,25 Total 1 10 2 13 7 20 7 15 9 8 92 0,011 0,109 0,022 0,141 0,076 0,217 0,076 0,163 0,098 0,087 1 ExemploExemplo: Classes desiguais 0 3 12 24 60 f Classes (meses) f fr h 0 |- 3 140 0,28 0,093 3 |- 12 100 0,20 0,022 12 |-24 80 0,16 0,013 24 |-60 180 0,36 0,010 Total 500 1,00 Distribuição das idades (em meses) de uma amostra de 500 crianças vacinadas 0 3 12 24 60 h 0,10 0,02 0,04 0,06 0,08 ⇐ 26 27 Forma da Distribuição 28 Variáveis Variáveis QualitativasQualitativasOs dados podem ser resumidos construindo- se uma tabela de distribuição de frequências, que quantifica a frequência das distintas categorias. Variáveis qualitativas no arquivo PULSEPULSE Ran Smokes Sex Activity 29 Variáveis qualitativas no arquivo PULSEPULSE MTB > Tally 'Sex' 'Smokes' 'Activity'; SUBC> Counts; SUBC> Percents. Summary Statistics for Discrete Variables Sex Count Percent Smokes Count Percent 1 57 61,96 1 28 30,43 2 35 38,04 2 64 69,57 N= 92 N= 92 Activity Count Percent 0 1 1,09 1 9 9,78 2 61 66,30 3 21 22,83 N= 92 30 Variáveis QualitativasVariáveis Qualitativas • Gráfico de setores • Gráfico de barras GráficoGráfico ss 31 Gráfico de setoresGráfico de setores Um círculo é dividido em tantos setores quantas forem as categorias da variável. A área de cada setor é proporcional à frequência da categoria 32 Arquivo PULSEPULSE — Gráfico de setores para a variável Ran 1 (35; 38,0%) 2 (57; 62,0%) Pie Chart of Ran MTB > Piechart c3. 33 Arquivo PULSEPULSE — Gráfico de setores para a variável Activity 34 Gráfico de barrasGráfico de barras Sobre um eixo, são representados retângulos, um para cada categoria da variável. A altura do retângulo é proporcional à frequência da categoria 35 21 60 50 40 30 20 10 0 Ran C ou nt o f R an Arquivo PULSEPULSE — Gráfico de barras para a variável RAN MTB > Chart C3MTB > Chart C3 36 Arquivo PULSEPULSE - Gráfico de barras para a variável Activity MTB > Chart C8; SUBC > Percent. 3210 70 60 50 40 30 20 10 0 Activity Pe rc en t Chart of Activity Percent within all data. Slide 1 Slide 2 Slide 3 Slide 4 Slide 5 Slide 6 Slide 7 Slide 8 Slide 9 Slide 10 Slide 11 Slide 12 Slide 13 Slide 14 Slide 15 Slide 16 Slide 17 Slide 18 Slide 19 Slide 20 Slide 21 Slide 22 Slide 23 Slide 24 Slide 25 Slide 26 Slide 27 Slide 28 Slide 29 Slide 30 Slide 31 Slide 32 Slide 33 Slide 34 Slide 35 Slide 36
Compartilhar