Buscar

Aula 2 Descritiva II

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 36 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 36 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 36 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Estatística Descritiva 
 (II) 
2 
Experimento envolvendo alunos. Cada 
um tem altura, peso, sexo, hábito de 
fumar e nível de atividade física 
anotados. Todos jogam moedas: se 
“CARA”, é realizada uma corrida 
estacionária por 1 minuto. As pulsações 
antes e após a corrida são registradas. Os 
demais registram a pulsação em dois 
instantes (intervalo de 1 minuto), sem a 
corrida estacionária. 
 Arquivo PULSE do Minitab 
3 
Informações do arquivo PULSE 
 
MTB > INFO 
Information of the worksheet 
 
Column Count Name 
C1 92 Pulse1 
C2 92 Pulse2 
C3 92 Ran 1- fez corrida 2- não fez corrida 
C4 92 Smokes 1- fuma 2- não fuma 
C5 92 Sex 1- masculino 2- feminino 
C6 92 Height 
C7 92 Weight 
C8 92 Activity 0- não tem 1- leve 
 2- moderada 3- intensa 
4 
 Row Pulse1 Pulse2 Ran Smokes Sex Height Weight Activity 
 
 1 64 88 1 2 1 66,00 140 2 
 2 58 70 1 2 1 72,00 145 2 
 3 62 76 1 1 1 73,50 160 3 
 4 66 78 1 1 1 73,00 190 1 
 5 64 80 1 2 1 69,00 155 2 
 6 74 84 1 2 1 73,00 165 1 
 7 84 84 1 2 1 72,00 150 3 
 8 68 72 1 2 1 74,00 190 2 
 • 
 • 
 • 
Planilha (parcial) 
5 
Variáveis qualitativas 
Variáveis quantitativas 
Pulse 1 
Pulse 2 
Height 
Weight 
Discreta 
Contínua 
Ran 
Smokes 
Sex 
Activity 
Nominal 
Ordinal 
6 
Variáveis Quantitativas 
Variância (s2) 
Desvio padrão (s) 
Intervalo-interquartil (Q3 – Q1) 
Coeficiente de variação (CV) 
 - Média (x) 
Mediana (md) 
Quartis (Q1, Q3) 
Máximo (máx) 
Mínimo (min) 
Medidas de posição 
Medidas de dispersão 
7 
Descriptive Statistics 
 
Variable N Mean Median StDev 
 Pulse1 92 72,87 71 11,01 
 Height 92 68,72 69 3,66 
 Weight 92 145,15 145 23,74 
 
Variable Min Max Q1 Q3 
 Pulse1 48 100 64 80 
 Height 61 75 66 72 
 Weight 95 215 125 156,5 
MTB > describe c1 c6 c7 
CV 
 11,01/72,87=0,15 
 3,66/68,72=0,05 
 23,74/145,15=0,16 
8 
• 50% dos indivíduos tem pulsação menor ou igual a 71 
batimentos por minuto; 
• 25% dos indivíduos tem altura igual ou menor a 66 
pés; 
• 75% dos indivíduos tem peso igual ou menor a 156,5 
libras; 
• A variável com menor dispersão em relação à média é 
a altura; 
• Pulsação e peso apresentam dispersão em relação à 
média praticamente iguais e o triplo da dispersão da 
altura. 
Alguns comentários: 
9 
MTB > describe c1; 
SUBC > by c3. 
 
Variable Ran N Mean Median StDev 
 Pulse1 1 35 73,60 70 11,44 
 2 57 72,42 72 10,82 
 
Variable Ran Min Max Q1 Q3 CV 
 Pulse1 1 58 100 64 80 15,54 
 2 48 94 64 81 14,94 
MTB > describe c2; 
SUBC > by c3. 
 
Variable Ran N Mean Median StDev 
Pulse2 1 35 92,51 88 18,94 
 2 57 72,32 70 9,95 
 
Variable Ran Min Max Q1 Q3 CV 
Pulse2 1 58 140 76 106 20,48 
 2 50 94 66 79 13,76 
10 
• Com relação às medidas de posição e de dispersão, os 
dois grupos têm praticamente os mesmos valores de 
Pulse1 (pulsação antes de correr ). O mesmo ocorre para a 
dispersão relativamente à média (CV). 
• Quanto ao Pulse2, o grupo que correu (Ran=1) tem 
média e mediana maiores que as do grupo que não 
correu (Ran=2). Com relação à dispersão dessa 
variável, o grupo que correu apresenta desvio padrão 
aproximadamente igual ao dobro do valor do grupo que 
não correu e, relativamente à média (CV), a dispersão dos 
que correram é cerca de 50% maior do que a dos que não 
correram. 
Alguns comentários: 
11 
Descrevendo a pulsação em repouso segundo o sexo 
 
MTB > describe C1; 
SUBC> by C5. 
Variable Sex N Mean Median StDev 
Pulse1 1 57 70,42 70 9,95 
 2 35 76,86 78 11,62 
 
Variable Sex Min Max Q1 Q3 CV 
Pulse1 1 48 92 63 75 14,13 
 2 58 100 66 86 15,11 
 
 
12 
Os dados também podem ser resumidos 
construindo-se uma tabela de distribuição 
de frequências . 
Distribuição de frequências de uma variável 
é uma lista dos valores individuais ou dos 
intervalos de valores que a variável pode 
assumir, com as respectivas frequências de 
ocorrência. 
13 
Não há perda 
de informação 
MTB > tally c1 
 No arquivo PULSE Summary Statistics for Discrete Variables 
 Pulse1 Count Percent 
 48 1 1,09 
 54 2 2,17 
 58 3 3,26 
 60 4 4,35 
 61 1 1,09 
 62 9 9,78 
 64 4 4,35 
 66 5 5,43 
 68 11 11,96 
 70 6 6,52 
 72 6 6,52 
 74 5 5,43 
 76 5 5,43 
 78 5 5,43 
 80 3 3,26 
 82 3 3,26 
 84 4 4,35 
 86 1 1,09 
 87 1 1,09 
 88 3 3,26 
 90 4 4,35 
 92 2 2,17 
 94 1 1,09 
 96 2 2,17 
 100 1 1,09 
 N= 92 
14 
Alternativa: construir intervalos de classe 
Classe de pulsação frequência 
48 |- 54 
54 |- 60 
60 |- 66 
66 |- 72 
72 |- 78 
78 |- 84 
84 |- 90 
90 |- 96 
96 |- 102 
1 
5 
18 
22 
16 
11 
9 
7 
3 
Informações mais 
resumidas 
Perda de informação 
15 
Exemplo 2: 
Variável: altura ( height) contínua 
Construir 
intervalos 
de classe 
Classes de altura f fr 
60,25 |- 61,75 
61,75 |- 63,25 
63,25 |- 64,75 
64,75 |- 66,25 
66,25 |- 67,75 
67,75 |- 69,25 
69,25 |- 70,75 
70,75 |- 72,25 
72,25 |- 73,75 
73,75 |- 75,25 
 Total 
1 
10 
2 
13 
7 
20 
7 
15 
9 
8 
92 
0,011 
0,109 
0,022 
0,141 
0,076 
0,217 
0,076 
0,163 
0,098 
0,087 
1 
Distribuição de frequência para altura 
( arquivo PULSE) 
16 
Variáveis Quantitativas 
Gráficos 
• “Dotplot” 
• “Boxplot” 
• Histograma 
17 
DOTPLOT 
Arquivo PULSE – Dotplot da pulsação em 
repouso (PULSE1) 
 
MTB > DOTPLOT C1 
 
 . 
 . : 
 : : 
 : . : : : . . . 
 . : : : : : : : : : : . . :. : 
 . : : :.: : : : : : : : : : : : ..: : : . : . 
---+---------+---------+---------+---------+---------+- 
 50 60 70 80 90 100 
 Pulse1 
18 
Arquivo PULSE – Dotplot da pulsação em repouso 
(PULSE1) segundo Sexo (SEX) 
 
MTB > Dotplot 'Pulse1' * 'Sex' 
 
Notar que os Dotplots são construídos na mesma 
escala. 
 : 
Sex 1 : : : . 
 . : . . : : : : . . 
 . : : : : : : : : : : : . . . : . : : 
--+---------+---------+---------+---------+---------+- 
 
Sex 2 . . : 
 . ..: . : : : : : : : : ..: . . : . 
--+---------+---------+---------+---------+---------+- 
 50 60 70 80 90 100 
 Pulse1 
19 
Boxplot 
Representa os dados através de um 
retângulo construído com os quartis e 
fornece informações sobre os valores 
extremos. 
20 
“Máximo” 
Q3 
Mediana 
Q1 
“Mínimo” 
25% 
50% 
75% 
Construção 
LS=Q3+1,5(Q3-Q1) 
LI=Q1-1,5(Q3-Q1) 
“Máximo” é o maior valor menor que LS; 
“Mínimo” é o menor valor maior que LI. 
21 
Exemplo: 
md = 41,5 Q1 = 30,25 Q3 = 49,5 
* 
* 
120 
100 
80 
60 
40 
20 
Dados ordenados (n=36) 
 18 21 21 23 23 25 
 27 29 30 31 32 32 
 32 34 35 36 38 41 
 42 42 43 44 45 46 
 46 47 48 50 54 56 
 57 58 60 61 98 116 
 
 LI = Q1 - 1,5(Q3 - Q1) =1,38 
 LS = Q3 + 1,5(Q3 - Q1) =78,38 
Observações discrepantes? 
 Tempo de sobrevivência (dias) após cirurgia 
 
 
22 
Arquivo PULSE –Boxplot da pulsação em repouso 
(PULSE1) 
 
MTB > BOXPLOT C1 
Alguns Comentários: 
• não há observações discrepantes; 
• a distribuição dos valores é aproximadamente simétrica. 
23 
Arquivo PULSE – Boxplots da pulsação em repouso 
(PULSE1) por sexo (SEX) 
 
MTB > BOXPLOT C1*C5 
Alguns Comentários: 
• não há observações discrepantes; 
• medidas de posição tendem a ser maiores para as mulheres; 
• não há fortes evidências de assimetria nos dois grupos. 
24 
Histograma 
Bases iguais 
Construir um retângulo para cada classe, com base 
igual ao tamanho da classe e altura proporcional à 
frequência da classe (f). 
Agrupar os dados em intervalos de classes 
(distribuição de frequências) 
Bases diferentes 
Construir um retângulo para cada classe, com base igual 
ao tamanho da classe e área do retângulo igual a 
frequência relativa da classe(fr). A altura será dada por 
h = fr/base (densidade de frequência). 
25 
 Arquivo PULSE – Histograma da altura (Height) 
74,573,071,570,068,567,065,564,062,561,0
20
10
0
Height
F
re
q
u
e
n
cy
 
MTB > HIST C6 Distribuição de frequências para 
 altura (arquivo PULSE) 
Classe de altura f fr 
60,25 ⊢ 61,75 
61,75 ⊢ 63,25 
63,25 ⊢ 64,75 
64,75 ⊢ 66,25 
66,25 ⊢ 67,75 
67,75 ⊢ 69,25 
69,25 ⊢ 70,75 
70,75 ⊢ 72,25 
72,25 ⊢ 73,75 
73,75 ⊢ 75,25 
 Total 
1 
10 
2 
13 
7 
20 
7 
15 
9 
8 
92 
0,011 
0,109 
0,022 
0,141 
0,076 
0,217 
0,076 
0,163 
0,098 
0,087 
 1 
Exemplo: Classes desiguais 
0 3 12 24 60 
f 
Classes (meses) f fr h 
 0 |- 3 140 0,28 0,093 
 3 |- 12 100 0,20 0,022 
12 |-24 80 0,16 0,013 
24 |-60 180 0,36 0,010 
Total 500 1,00 
Distribuição das idades (em meses) de 
uma amostra de 500 crianças vacinadas 
0 3 12 24 60 
h 
0,10 
0,02 
0,04 
0,06 
0,08 
 
26 
27 
Forma da Distribuição 
28 
Variáveis Qualitativas 
Os dados podem ser resumidos construindo-
se uma tabela de distribuição de frequências, 
que quantifica a frequência das distintas 
categorias. 
Variáveis qualitativas no arquivo PULSE 
Ran 
Smokes 
Sex 
Activity 
29 
Variáveis qualitativas no arquivo PULSE 
 
MTB > Tally 'Sex' 'Smokes' 'Activity'; 
SUBC> Counts; 
SUBC> Percents. 
Summary Statistics for Discrete Variables 
 
 Sex Count Percent Smokes Count Percent 
 1 57 61,96 1 28 30,43 
 2 35 38,04 2 64 69,57 
 N= 92 N= 92 
 
 
 Activity Count Percent 
 0 1 1,09 
 1 9 9,78 
 2 61 66,30 
 3 21 22,83 
 N= 92 
30 
Variáveis Qualitativas 
• Gráfico de setores 
• Gráfico de barras 
Gráficos 
31 
Gráfico de setores 
Um círculo é dividido em tantos setores 
quantas forem as categorias da variável. 
A área de cada setor é proporcional à 
frequência da categoria 
32 
Arquivo PULSE — Gráfico de setores para 
a variável Ran 
1 (35; 38,0%)
2 (57; 62,0%)
Pie Chart of Ran
MTB > Piechart c3. 
33 
Arquivo PULSE — Gráfico de setores para 
a variável Activity 
34 
Gráfico de barras 
Sobre um eixo, são representados 
retângulos, um para cada categoria da 
variável. A altura do retângulo é 
proporcional à frequência da categoria 
35 
21
60
50
40
30
20
10
0
Ran
Co
un
t o
f R
an
Arquivo PULSE — Gráfico de barras para a 
variável RAN 
MTB > Chart C3 
36 
Arquivo PULSE - Gráfico de barras para a 
variável Activity 
MTB > Chart C8; 
SUBC > Percent. 
3210
70
60
50
40
30
20
10
0
Activity
Pe
rc
en
t
Chart of Activity
Percent within all data.

Continue navegando