Buscar

Aula2D22011-Descritiva

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 3, do total de 34 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 6, do total de 34 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 9, do total de 34 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Prévia do material em texto

ANÁLISE DESCRITIVAANÁLISE DESCRITIVA
FORMATAÇÃO & DESIGN
Cléber da Costa Figueiredo
figuecl@usp.br
Thiago Rodrigo Alves Carneiro
thiagorodrigo@ime.usp.br
Texto da aula
Profª Carmen Diva Saldiva de André
Prof. Gilberto Alvarenga Paula
Classificação das variáveisClassificação das variáveis
Variável
Qualquer característica associada a uma população
 Classificação Classificação
 Qualitativa QuantitativaQualitativa Quantitativa
 nominal contínua nominal contínua
 ordinal discreta ordinal discreta
ExemploExemplo
Arquivo Arquivo PulsePulse do Minitab do Minitab
Refere-se a um experimento feito por alunos.
Cada aluno registrou sua altura, peso, sexo, 
hábito de fumar, nível de atividade física 
usual e pulsação em repouso.
Então todos eles jogaram moedas e aqueles 
que tiraram cara fizeram corrida estacionária 
por um minuto.
Depois disso todos os alunos mediram 
novamente sua pulsação.
Informações do arquivo Informações do arquivo PulsePulse
Information of the worksheetInformation of the worksheet
Column Count Column Count Name Name
C1 92 Pulse1C1 92 Pulse1
C2 92 Pulse2C2 92 Pulse2
C3 92 Ran (1:correu, 2:não correu)C3 92 Ran (1:correu, 2:não correu)
C4 92 Smokes (1:fumante, 2:não fumante)C4 92 Smokes (1:fumante, 2:não fumante)
C5 92 Sex (1:masculino, 2:feminino)C5 92 Sex (1:masculino, 2:feminino)
C6 92 HeightC6 92 Height
C7 92 WeightC7 92 Weight
C8 92 Activity (1:leve, 2:moderada, 3:forte)C8 92 Activity (1:leve, 2:moderada, 3:forte)
(Pulsação antes de correr)(Pulsação antes de correr)
(Pulsação depois de correr)(Pulsação depois de correr)
MTB > INFOMTB > INFO
 Pulse1 Pulse2 Ran Smokes Sex Height Weight ActivityPulse1 Pulse2 Ran Smokes Sex Height Weight Activity
64 88 1 2 1 66.00 140 264 88 1 2 1 66.00 140 2
58 70 1 2 1 72.00 145 258 70 1 2 1 72.00 145 2
62 76 1 1 1 73.50 160 362 76 1 1 1 73.50 160 3
66 78 1 1 1 73.00 190 166 78 1 1 1 73.00 190 1
64 80 1 2 1 69.00 155 264 80 1 2 1 69.00 155 2
74 84 1 2 1 73.00 165 174 84 1 2 1 73.00 165 1
84 84 1 2 1 72.00 150 384 84 1 2 1 72.00 150 3
68 72 1 2 1 74.00 190 268 72 1 2 1 74.00 190 2
62 75 1 2 1 72.00 195 262 75 1 2 1 72.00 195 2
............
Informações do arquivo PulseInformações do arquivo Pulse
Média
Mediana
Moda
Quartis
Máximo
Mínimo
Variáveis QuantitativasVariáveis Quantitativas
Medidas de posição
Amplitude
Variância
Desvio padrão
Intervalo interquartil 
Coeficiente de Variação
Variáveis QuantitativasVariáveis Quantitativas
Medidas de dispersão
MTB > DESCRIBE C1 C2 C6 C7MTB > DESCRIBE C1 C2 C6 C7
Descriptive StatisticsDescriptive Statistics
Variable N Mean Median Tr Mean StDev SEMeanVariable N Mean Median Tr Mean StDev SEMean
Pulse1 92 72.87 71.00 72.61 11.01 1.15Pulse1 92 72.87 71.00 72.61 11.01 1.15
Pulse2 92 80.00 76.00 78.85 17.09 1.78Pulse2 92 80.00 76.00 78.85 17.09 1.78
Height 92 68.72 Height 92 68.72 69.00 68.78 3.66 0.38 69.00 68.78 3.66 0.38
Weight 92 145.15 Weight 92 145.15 145.00 144.52 23.74 145.00 144.52 23.74 2.48 2.48
Variáveis quantitativas no arquivo Variáveis quantitativas no arquivo 
PulsePulse
MTB > DESCRIBE C1 C2 C6 C7MTB > DESCRIBE C1 C2 C6 C7
Descriptive StatisticsDescriptive Statistics
Variable Min Max Q1 Q3Variable Min Max Q1 Q3
Pulse1 48.00 100.00 64.00 80.00Pulse1 48.00 100.00 64.00 80.00
Pulse2 50.00 140.00 68.00 87.00Pulse2 50.00 140.00 68.00 87.00
Height 61.00 75.00 66.00 72.00Height 61.00 75.00 66.00 72.00
Weight 95.00 215.00 125.00 156.50Weight 95.00 215.00 125.00 156.50
Variáveis quantitativas no arquivo Variáveis quantitativas no arquivo 
PulsePulse
MTB > DESCRIBE C1;MTB > DESCRIBE C1;
SUBC > BY C5.SUBC > BY C5.
Descriptive StatisticsDescriptive Statistics
Variable Sex N Mean Median Tr Mean StDev SEMeanVariable Sex N Mean Median Tr Mean StDev SEMean
Pulse1 1 57 70.42 70.00 70.27 9.95 1.32Pulse1 1 57 70.42 70.00 70.27 9.95 1.32
 2 35 76.86 78.00 76.65 11.62 1.96 2 35 76.86 78.00 76.65 11.62 1.96
Descrever a pulsação em repouso Descrever a pulsação em repouso 
segundo o sexosegundo o sexo
MTB > DESCRIBE C1;MTB > DESCRIBE C1;
SUBC > BY C5.SUBC > BY C5.
Descriptive StatisticsDescriptive Statistics
Variable Sex Min Max Q1 Q3Variable Sex Min Max Q1 Q3
Pulse1 1 48.00 92.00 63.00 75.00Pulse1 1 48.00 92.00 63.00 75.00
 2 58.00 100.00 66.00 86.00 2 58.00 100.00 66.00 86.00
Calcular o intervalo-interquartil para cada sexoCalcular o intervalo-interquartil para cada sexo
Descrever a pulsação em repouso Descrever a pulsação em repouso 
segundo o sexosegundo o sexo
Variáveis QualitativasVariáveis Qualitativas
Para dados qualitativos podemos 
construir tabelas que os quantificam 
por categoria de classificação
Variáveis qualitativas no arquivo PulseVariáveis qualitativas no arquivo Pulse
Ran
Smokes
Sex
Activity
MTB > TALLY C3 C4 C5 C8MTB > TALLY C3 C4 C5 C8
Summary Statistics for Discrete Variables
Ran Count Smokes Count Sex Count Activity CountRan Count Smokes Count Sex Count Activity Count
 1 35 1 28 1 57 0 1 1 35 1 28 1 57 0 1 
 2 57 2 64 2 35 1 9 2 57 2 64 2 35 1 9 
 N= 92 N= 92 N= 92 2 61 N= 92 N= 92 N= 92 2 61 
 3 21 3 21 
 N= 92N= 92
Variáveis qualitativas no arquivo PulseVariáveis qualitativas no arquivo Pulse
Rows: Sex Columns: SmokesRows: Sex Columns: Smokes
 1 2 All 1 2 All
 1 1 20 37 5720 37 57
 35.09 64.91 100.0035.09 64.91 100.00
 22 8 27 358 27 35
 22.86 77.14 100.00 22.86 77.14 100.00
 All All 28 64 9228 64 92
 30.43 69.57 100.0030.43 69.57 100.00
MTB > Table 'Sex' 'Smokes';
SUBC > Counts;
SUBC > RowPercents.
Há indícios de associação entre sexo e Há indícios de associação entre sexo e 
hábito de fumar?hábito de fumar?
Dentre as mulheres, qual a Dentre as mulheres, qual a 
porcentagem das que correram?porcentagem das que correram?
Rows: Ran Columns: SexRows: Ran Columns: Sex
 1 2 All 1 2 All
 1 1 24 11 3524 11 35
 42.10 31.43 38.0442.10 31.43 38.04
 2 2 33 24 5733 24 57
 57.90 68.57 61.9657.90 68.57 61.96
 All All 57 35 9257 35 92
 100.00 100.00 100.00100.00 100.00 100.00
MTB > Table 'Ran' 'Sex';
SUBC> Counts;
SUBC> ColPercents.
GráficosGráficos
para variáveis quantitativaspara variáveis quantitativas
HistogramaHistograma
O histograma para uma variável 
contínua é obtido agrupando-se os 
valores dessa variável em classes.
Características do HistogramaCaracterísticas do Histograma
- - Bases iguaisBases iguais
Construir um retângulo para cada classe, Construir um retângulo para cada classe, 
com base igual ao tamanho da classe e com base igual ao tamanho da classe e 
altura proporcional à frequência da classe.altura proporcional à frequência da classe.
Exemplo 1Exemplo 1
Faixa Etária Frequência Proporção
20 30 10 0,25
30 40 20 0,50
40 50 10 0,25
40
Histograma de frequência (proporção)Histograma de frequência (proporção)
ff
0,6 -0,6 -
0,5 -0,5 -
0,4 -0,4 -
0,3 -0,3 -
0,2 -0,2 -
0,1 -0,1 -
0,0 -0,0 -
20 30 40 50 idade20 30 40 50 idade
Histograma de densidadeHistograma de densidade
hh
0,06 -0,06 -
0,05 -0,05 -
0,04 -0,04 -
0,03 -0,03 -
0,02 -0,02 -
0,01 -0,01 -
0,00 -0,00 -
20 30 40 50 idade20 30 40 50 idade
Área (frequência) = base Área (frequência) = base xx altura (densidade) altura (densidade)
 ff = 10 = 10 xx h h
 ⇒⇒ h h = (f / 10)= (f / 10)
Bases diferentes Bases diferentes 
Exemplo 1 modificadoExemplo 1 modificado
Construir um retângulo para cada classe, Construir um retângulo para cada classe, 
com base igual ao tamanho da classe e com base igual ao tamanho da classe e 
área do retângulo igual à frequência da área do retângulo igual à frequência da 
classe. A altura será dada por:classe. A altura será dada por: 
h = f/base f: frequência relativah = f/base f: frequência relativa 
Faixa Etária Frequência Proporção
20 30 10 0,250
30 35 15 0,375
35 50 15 0,375
h
0,025
0,075
0,025
Histograma de frequênciaHistograma de frequência
ff
0,6 -0,6 -
0,5 -0,5 -
0,4 -0,4 -
0,3 -0,3 -
0,2 -0,2 -
0,1 -0,1 -
0,0 -0,0 -
20 30 35 50 idade20 30 35 50 idade
Faz sentido?Faz sentido?
Histograma de densidadeHistograma de densidade
hh
0,07 -0,07 -
0,06 -0,06 -
0,05 -0,05 -
0,04 -0,04 -
0,03 -0,03 -
0,02 -0,02 -
0,01 -0,01 -
0,00 -0,00 -
20 30 35 50 idade20 30 35 50 idade
74,573,071,570,068,567,065,564,062,561,0
20
10
0
Height
Fr
eq
ue
nc
y
Distribuição de frequênciaDistribuição de frequência
para alturapara altura (arquivo PULSE)(arquivo PULSE)
Classe de altura f frClasse de altura f fr
60,25-61,75
61,75-63,25
63,25-64,75
64,75-66,25
66,25-67,75
67,75-69,25
69,25-70,75
70,75-72,25
72,25-73,75
73,75-75,25
 Total
1
10
2
13
7
20
7
15
9
8
92
0,011
0,109
0,022
0,141
0,076
0,217
0,076
0,163
0,098
0,087
1
MTB > HIST C6MTB > HIST C6 
 
Arquivo PULSE – Histograma da altura Arquivo PULSE – Histograma da altura 
(Height)(Height)
Arquivo Arquivo PulsePulse – Diagrama de pontos – Diagrama de pontos 
(Dotplot) da pulsação em repouso(Dotplot) da pulsação em repouso
MTB > DOTPLOT C1MTB > DOTPLOT C1
 . .
 . : . :
 : : : :
 : . : : : . . . : . : : : . . .
 . : : : : : : : : : : . . : . : . : : : : : : : : : : . . : . :
 . : : :.: : : : : : : : : : : : .. : : : . : . . : : :.: : : : : : : : : : : : .. : : : . : .
 ---+---------+---------+---------+---------+---------+- ---+---------+---------+---------+---------+---------+-
 50 60 50 60 70 80 90 100 70 80 90 100
 Pulse1 Pulse1
Arquivo Arquivo PulsePulse – Dotplot da pulsação – Dotplot da pulsação 
em repouso segundo Sexoem repouso segundo Sexo
MTB > DotPlot 'Pulse1';MTB > DotPlot 'Pulse1';
SUBC> Same;SUBC> Same;
SUBC> By 'Sex'.SUBC> By 'Sex'.
 ::
 SexSex 1 : 1 : : : . : : .
 . : . : . . . : : : :. : : : : . . . .
 . : : : : : : : : : : : . . . : . : : . : : : : : : : : : : : . . . : . : :
 --+---------+---------+---------+---------+---------+- --+---------+---------+---------+---------+---------+-
 SexSex 2 . . 2 . . ::
 . . . . : . : : : : : : : : ..: . . : . . : . : : : : : : : : ..: . . : . .
 --+---------+---------+---------+---------+---------+- --+---------+---------+---------+---------+---------+-
 50 60 70 80 90 100 50 60 70 80 90 100
 Pulse1 Pulse1
Diagrama de caixa (Boxplot)Diagrama de caixa (Boxplot)
Representa os dados através de um 
retângulo construído com os quartis e 
fornece informações sobre valores 
extremos
_Q3
_Q1
_md
linha
auxiliar
⇓
_Q3
_Q1
_md
_Q1-1,5d
_Q3+1,5d**
**
**
**
**
**
_Q3
_Q1
_md
_Q1-1,5d
_Q3+1,5d
altura _Q3
_Q1
d
Q1 = 1º quartil md = mediana Q3 = 3º quartil d = diferença interquartilQ1 = 1º quartil md = mediana Q3 = 3º quartil d = diferença interquartil
Construção do BoxplotConstrução do Boxplot
Arquivo Arquivo PulsePulse – Boxplot da pulsação – Boxplot da pulsação 
em repousoem repouso
MTB > BOXPLOT C1MTB > BOXPLOT C1
Arquivo Arquivo PulsePulse – Boxplot da pulsação – Boxplot da pulsação 
em repousoem repouso
MTB > BOXPLOT C1*C5MTB > BOXPLOT C1*C5
Arquivo Arquivo CholestCholest – Boxplot do nível de – Boxplot do nível de 
colesterol segundo o número de dias colesterol segundo o número de dias 
após o enfartoapós o enfarto
Diagrama de dispersãoDiagrama de dispersão
Avalia o comportamento conjunto de 
duas variáveis quantitativas
MTB > PLOT C6*C7MTB > PLOT C6*C7
Arquivo Pulse – Relação entre o peso Arquivo Pulse – Relação entre o peso 
a altura dos alunosa altura dos alunos
	Slide 1
	Slide 2
	Slide 3
	Slide 4
	Slide 5
	Slide 6
	Slide 7
	Slide 8
	Slide 9
	Slide 10
	Slide 11
	Slide 12
	Slide 13
	Slide 14
	Slide 15
	Slide 16
	Slide 17
	Slide 18
	Slide 19
	Slide 20
	Slide 21
	Slide 22
	Slide 23
	Slide 24
	Slide 25
	Slide 26
	Slide 27
	Slide 28
	Slide 29
	Slide 30
	Slide 31
	Slide 32
	Slide 33
	Slide 34

Outros materiais