Buscar

b 2010 aula 02 descritiva2

Prévia do material em texto

Estatística DescritivaEstatística Descritiva
 (II) (II)
2
Experimento envolvendo alunos. Cada 
um tem altura, peso, sexo, hábito de 
fumar e nível de atividade física 
anotados. Todos jogam moedas: se 
“CARA”, é realizada uma corrida corrida 
estacionáriaestacionária por 1 minuto.por 1 minuto. As pulsações 
antes e após a corrida são registradas. Os 
demais registram a pulsação em dois 
instantes (intervalo de 1 minuto), sem a 
corrida estacionária. 
 Arquivo PULSEPULSE do Minitab
3
Informações do arquivo PULSEPULSE 
MTB > INFOMTB > INFO
Information of the worksheet
Column Count Name
C1 92 Pulse1
C2 92 Pulse2 
C3 92 Ran 1- fez corrida 2- não fez corrida
C4 92 Smokes 1- fuma 2- não fuma
C5 92 Sex 1- masculino 2- feminino
C6 92 Height
C7 92 Weight
C8 92 Activity 0- não tem 1- leve 
 2- moderada 3- intensa
4
 Row Pulse1 Pulse2 Ran Smokes Sex Height Weight Activity
 1 64 88 1 2 1 66,00 140 2
 2 58 70 1 2 1 72,00 145 2
 3 62 76 1 1 1 73,50 160 3
 4 66 78 1 1 1 73,00 190 1
 5 64 80 1 2 1 69,00 155 2
 6 74 84 1 2 1 73,00 165 1
 7 84 84 1 2 1 72,00 150 3
 8 68 72 1 2 1 74,00 190 2
 •
 •
 •
PlanilhaPlanilha (parcial) 
5
Variáveis qualitativasVariáveis qualitativas
Variáveis quantitativasVariáveis quantitativas
Pulse 1
Pulse 2
Height
Weight
DiscretaDiscreta
ContínuaContínua
Ran
Smokes
Sex
Activity
NominalNominal
OrdinalOrdinal
6
Variáveis QuantitativasVariáveis Quantitativas
Variância (s2)
Desvio padrão (s)
Intervalo-interquartil (Q3 – Q1)
Coeficiente de variação (CV)
 -Média (x)
Mediana (md) 
Quartis (Q1, Q3)
Máximo (máx)
Mínimo (min)
Medidas de posiçãoMedidas de posição
Medidas de dispersãoMedidas de dispersão
7
Descriptive StatisticsDescriptive Statistics
Variable Variable NN Mean Median StDev Mean Median StDev 
 Pulse1Pulse1 92 72,87 71 11,01 
 HeightHeight 92 68,72 69 3,66 
 WeightWeight 92 145,15 145 23,74 
Variable Min Max Variable Min Max QQ1 1 QQ33 
 Pulse1Pulse1 48 100 64 80
 Height Height 61 75 66 72
 Weight Weight 95 215 125 156,5 
MTB > describe c1 c6 c7MTB > describe c1 c6 c7
CVCV
 11,01/72,87=0,15
 3,66/68,72=0,05
 23,74/145,15=0,16
8
• 50% dos indivíduos tem pulsação menor ou igual a 71 
batimentos por minuto;
• 25% dos indivíduos tem altura igual ou menor a 66 
pés;
• 75% dos indivíduos tem peso igual ou menor a 156,5 
libras;
• A variável com menor dispersão em relação à média é 
a altura;
• Pulsação e peso apresentam dispersão em relação à 
média praticamente iguais e o triplo da dispersão da 
altura.
Alguns comentários:Alguns comentários:
9
MTB > describe c1;MTB > describe c1;
SUBC > by c3.SUBC > by c3.
Variable Ran Variable Ran N N Mean Median StDev Mean Median StDev
 Pulse1Pulse1 1 1 35 73,60 70 11,44
 22 57 72,42 72 10,82
Variable Ran Min Max Variable Ran Min Max QQ1 1 QQ3 CV3 CV
 Pulse1Pulse1 1 1 58 100 64 80 15,54
 22 48 94 64 81 14,94
MTB > describe c2;MTB > describe c2;
SUBC > by c3.SUBC > by c3.
Variable Ran Variable Ran NN Mean Median StDev Mean Median StDev
Pulse2Pulse2 1 1 35 92,51 88 18,94
 22 57 72,32 70 9,95
Variable Ran Min Max Variable Ran Min Max QQ1 1 QQ3 CV3 CV
Pulse2 1Pulse2 1 58 140 76 106 20,48
 2 2 50 94 66 79 13,76
10
• Com relação às medidas de posição e de dispersão, os 
dois grupos têm praticamente os mesmos valores de 
Pulse1 (pulsação antes de correr ). O mesmo ocorre para a 
dispersão relativamente à média (CV).
• Quanto ao Pulse2, o grupo que correu (Ran=1) tem 
média e mediana maiores que as do grupo que não 
correu (Ran=2). Com relação à dispersão dessa 
variável, o grupo que correu apresenta desvio padrão 
aproximadamente igual ao dobro do valor do grupo que 
não correu e, relativamente à média (CV), a dispersão dos 
que correram é cerca de 50% maior do que a dos que não 
correram.
Alguns comentários: 
11
Descrevendo a pulsação em repouso segundo o sexo
MTB > describe C1;MTB > describe C1;
SUBC> by C5.SUBC> by C5.
Variable Variable SexSex N N Mean Median StDev Mean Median StDev 
Pulse1 1 57 70,42 70 9,95 
 2 35 76,86 78 11,62 
Variable Variable SexSex Min Max Q1 Q3 CV Min Max Q1 Q3 CV
Pulse1 1 48 92 63 75 14,13
 2 58 100 66 86 15,11
 
12
Os dados também podem ser resumidos 
construindo-se uma tabela de distribuição 
de frequências .
Distribuição de frequênciasDistribuição de frequências de uma variável 
é uma lista dos valores individuais ou dos 
intervalos de valores que a variável pode 
assumir, com as respectivas frequências de 
ocorrência.
13
Não há perda
de informação
MTB > tally c1
 No arquivo PULSEPULSE Summary Statistics for Discrete Variables Pulse1 Count Percent
 48 1 1,09
 54 2 2,17
 58 3 3,26
 60 4 4,35
 61 1 1,09
 62 9 9,78
 64 4 4,35
 66 5 5,43
 68 11 11,96
 70 6 6,52
 72 6 6,52
 74 5 5,43
 76 5 5,43
 78 5 5,43
 80 3 3,26
 82 3 3,26
 84 4 4,35
 86 1 1,09
 87 1 1,09
 88 3 3,26
 90 4 4,35
 92 2 2,17
 94 1 1,09
 96 2 2,17
 100 1 1,09
 N= 92
14
Alternativa: construir intervalos de classe
Classe de pulsação frequência 
48 |- 54
54 |- 60
60 |- 66
66 |- 72
72 |- 78
78 |- 84
84 |- 90
90 |- 96
96 |- 102
1
5
18
22
16
11
9
7
3
Informações mais 
resumidas 
Perda de informação
15
Exemplo 2:Exemplo 2:
Variável: altura ( height) contínua Construir intervalos 
de classe
Classes de altura f fr
60,25 |- 61,75
61,75 |- 63,25
63,25 |- 64,75
64,75 |- 66,25
66,25 |- 67,75
67,75 |- 69,25
69,25 |- 70,75
70,75 |- 72,25
72,25 |- 73,75
73,75 |- 75,25
 Total
1
10
2
13
7
20
7
159
8
92
0,011
0,109
0,022
0,141
0,076
0,217
0,076
0,163
0,098
0,087
1
Distribuição de frequência para altura 
( arquivo PULSE)
16
Variáveis QuantitativasVariáveis Quantitativas
GráficosGráficos
• “Dotplot”
• “Boxplot”
• Histograma
17
DOTPLOTDOTPLOT
Arquivo PULSEPULSE – Dotplot da pulsação em 
repouso (PULSE1)
MTB > DOTPLOT C1MTB > DOTPLOT C1
 .
 . :
 : :
 : . : : : . . .
 . : : : : : : : : : : . . : . :
 . : : :.: : : : : : : : : : : : ..: : : . : .
---+---------+---------+---------+---------+---------+-
 50 60 70 80 90 100
 Pulse1
18
Arquivo PULSEPULSE – Dotplot da pulsação em 
repouso (PULSE1) segundo Sexo (SEX)
MTB > Dotplot 'Pulse1' * 'Sex'
Notar que os Dotplots são construídos na 
mesma escala. 
 :
Sex 1 : : : .
 . : . . : : : : . .
 . : : : : : : : : : : : . . . : . : :
--+---------+---------+---------+---------+---------+-
Sex 2 . . :
 . ..: . : : : : : : : : ..: . . : .
--+---------+---------+---------+---------+---------+- 
 50 60 70 80 90 100
 Pulse1
19
BoxplotBoxplot
Representa os dados através de um 
retângulo construído com os quartisquartis e 
fornece informações sobre os valores valores 
extremos.extremos.
20
“Máximo”
Q3
Mediana
Q1
“Mínimo”
25%
50%
75%
Construção
LS=Q3+1,5(Q3-Q1)
LI=Q1-1,5(Q3-Q1)
“Máximo” é o maior valor menor que LS;
“Mínimo” é o menor valor maior que LI.
21
ExemplExempl
o:o:
md = 41,5 Q1 = 30,25 Q3 = 49,5 
*
*
120
100
80
60
40
20
Dados ordenados (n=36) 
 18 21 21 23 23 
25
 27 29 30 31 32 
32
 32 34 35 36 38 
41
 42 42 43 44 45 
46
 46 47 48 50 54 
56 
 57 58 60 61 98 
116 
 
 LI = Q1 - 1,5(Q3 - Q1) =1,38 
 LS = Q3 + 1,5(Q3 - Q1) =78,38 
 
Observações discrepantes?
 Tempo de sobrevivência (dias) após cirurgia
 
22
Arquivo PULSEPULSE –Boxplot da pulsação em 
repouso (PULSE1)
MTB > BOXPLOT C1MTB > BOXPLOT C1
Alguns Comentários:Alguns Comentários:
• não há observações discrepantes;
• a distribuição dos valores é aproximadamente simétrica.
23
Arquivo PULSEPULSE – Boxplots da pulsação em 
repouso (PULSE1PULSE1) por sexo (SEXSEX)
MTB > BOXPLOT C1*C5
Alguns Comentários:Alguns Comentários:
• não há observações discrepantes;
• medidas de posição tendem a ser maiores para as mulheres;
• não há fortes evidências de assimetria nos dois grupos.
24
Histograma
Bases iguais
Construir um retângulo para cada classe, com base 
igual ao tamanho da classe e 
altura proporcional à frequência da classe (f).
Agrupar os dados em intervalos de classes 
(distribuição de frequências)
Bases diferentes
Construir um retângulo para cada classe, com base igual 
ao tamanho da classe e 
área do retângulo igual a frequência relativa da classe(fr).
 A altura será dada por 
h = fr/base (densidade de frequência).
25
 Arquivo PULSEPULSE – Histograma da alturaHistograma da altura 
(Height)
74,573,071,570,068,567,065,564,062,561,0
20
10
0
Height
Fr
eq
ue
nc
y
⇐
MTB > HIST C6 
 
Distribuição de frequências para
 altura (arquivo PULSE)
Classe de altura f fr
60,25 ⊢ 61,75
61,75 ⊢ 63,25
63,25 ⊢ 64,75
64,75 ⊢ 66,25
66,25 ⊢ 67,75
67,75 ⊢ 69,25
69,25 ⊢ 70,75
70,75 ⊢ 72,25
72,25 ⊢ 73,75
73,75 ⊢ 75,25
 Total
1
10
2
13
7
20
7
15
9
8
92
0,011
0,109
0,022
0,141
0,076
0,217
0,076
0,163
0,098
0,087
 1
ExemploExemplo: Classes desiguais
0 3 12 24 60
f
Classes (meses) f fr h
 0 |- 3 140 0,28 0,093
 3 |- 12 100 0,20 0,022
12 |-24 80 0,16 0,013
24 |-60 180 0,36 0,010
Total 500 1,00
Distribuição das idades (em meses) de 
uma amostra de 500 crianças vacinadas
0 3 12 24 60
h
0,10
0,02
0,04
0,06
0,08
⇐
26
27
Forma da Distribuição
28
Variáveis Variáveis 
QualitativasQualitativasOs dados podem ser resumidos construindo-
se uma tabela de distribuição de frequências, 
que quantifica a frequência das distintas 
categorias.
Variáveis qualitativas no arquivo 
PULSEPULSE
Ran
Smokes
Sex
Activity
29
Variáveis qualitativas no arquivo PULSEPULSE
MTB > Tally 'Sex' 'Smokes' 'Activity';
SUBC> Counts;
SUBC> Percents.
Summary Statistics for Discrete Variables
 Sex Count Percent Smokes Count Percent
 1 57 61,96 1 28 30,43
 2 35 38,04 2 64 69,57 
 N= 92 N= 92
 
 Activity Count Percent
 0 1 1,09
 1 9 9,78
 2 61 66,30
 3 21 22,83
 N= 92
30
Variáveis QualitativasVariáveis Qualitativas
• Gráfico de setores
• Gráfico de barras
GráficoGráfico
ss
31
Gráfico de setoresGráfico de setores
Um círculo é dividido em tantos setores 
quantas forem as categorias da variável. 
A área de cada setor é proporcional à 
frequência da categoria
32
Arquivo PULSEPULSE — Gráfico de setores 
para a variável Ran
1 (35; 38,0%)
2 (57; 62,0%)
Pie Chart of Ran
MTB > Piechart c3.
33
Arquivo PULSEPULSE — Gráfico de setores 
para a variável Activity
34
Gráfico de barrasGráfico de barras
Sobre um eixo, são representados 
retângulos, um para cada categoria da 
variável. A altura do retângulo é 
proporcional à frequência da categoria
35
21
60
50
40
30
20
10
0
Ran
C
ou
nt
 o
f R
an
Arquivo PULSEPULSE — Gráfico de barras para a 
variável RAN 
MTB > Chart C3MTB > Chart C3
36
Arquivo PULSEPULSE - Gráfico de barras para a 
variável Activity 
MTB > Chart C8;
SUBC > Percent.
3210
70
60
50
40
30
20
10
0
Activity
Pe
rc
en
t
Chart of Activity
Percent within all data.
	Slide 1
	Slide 2
	Slide 3
	Slide 4
	Slide 5
	Slide 6
	Slide 7
	Slide 8
	Slide 9
	Slide 10
	Slide 11
	Slide 12
	Slide 13
	Slide 14
	Slide 15
	Slide 16
	Slide 17
	Slide 18
	Slide 19
	Slide 20
	Slide 21
	Slide 22
	Slide 23
	Slide 24
	Slide 25
	Slide 26
	Slide 27
	Slide 28
	Slide 29
	Slide 30
	Slide 31
	Slide 32
	Slide 33
	Slide 34
	Slide 35
	Slide 36

Continue navegando