Livro Noções de Probabilidade e Estatística - Magalhães parte 1
91 pág.

Livro Noções de Probabilidade e Estatística - Magalhães parte 1


DisciplinaProbabilidade e Estatística12.947 materiais121.769 seguidores
Pré-visualização37 páginas
na TV:
(R) ruim, (M) média, (B) boa e (N) não sabe
O conjunto de informações disponíveis, após a tabulação do questionário
ou pesquisa de campo, é denominado de tabela de dados brutos e contém os
daclos da maneira que foram coletados inicialmente. Os valores obtidos para cada
uma dessas informações estão apresentados na Tabela 1.1. Cada uma das
Características perguntadas aos alunos, tais como o peso, a idade e a altura, entre
outras, é denominada de variável. Assim, a variável Altura assume os valores
(em metros) 1,60; 1,58;... e a variável Turma assume os valores Á ou B.
Claramente tais variáveis têm naturezas diferentes no que tange aos possíveis
valores que podem assumir. Tal fato deve ser levado em conta nas análises e, para
fixar idéias, vamos considerar dois grandes tipos de'variáveis: numéricas e não
numéricas. As numéricas serão denominadas quantitativas, ao passo que as não
numéricas, qualitativ as.
A variável é qualitativa quando os possíveis valores que assume
representam atributos e/ou qualidades. Se tais variáveis têm uma ordenação
natural, indicando intensidades crescentes de realizaçáo, então elas serão
ctassificadas como qualitativas ordinais. Caso contrário, quando não é possível
estabelecer uma ordem natural entre seus valores, elas são classificadas como
qualitativas nominais. Variáveis tais como Turma (A ou B), Sexo (feminino ou
masculino) e Fuma (sim ou não) são variáveis qualitativas nominais. Por outro
lndo, variáveis como Tamanho (pequeno, médio ou grande), Classe Social (baixa,
rnódia ou alta) são variáveis qualitativas ordinais.
Variáveis quantitativas, isto é, variáveis de natureza numérica, podem ser
subdivididas em discretas e contínuas. A grosso modo, variáveis quantitativas
discretas podem ser vistas como resultantes de contagens, assumindo assim, em
geral, valores inteiros. De uma maneira mais formal, o conjunto dos valores
assumidos é finito ou enumerâvel. Jâ as variáveis quantitativas contínuas
assumem valores em intervalos dos números reais e, geralmente, são provenientes
de uma mensuração. Por exemplo, Número de Irmãos (0, I,2, ...) e Número de
Def'eitos (0, 1,2,.,.) são discretas, enquanto que Peso e Altura são quantitativas
contÍnufls.
. 
-Edl
71.2 Organização de Dados
Tabela 1,1: Informações de questiondrio estudantil - dados brutos,
.[d Turma Sexo Idade AIt Peso Filh Fuma Toler Exer Cine Opcine TV OpTV
1.AF2AF3AM4AM
5AF6AM
7\FBAF9ÀF
IOAF11 À F12 A F13 A F
T4AM15AF
16AFLTAF1g À M
19 A F30 A F
11 A F22ÀF33 À F24AF
25 A FB6 A F.3'/ B F3E B F
39 B F30 E F31 B F
3ã E Mã3 B F34 ll F
1E li M
16 t! Ir1't 11 MãË t1 M19 11 1,'4r.) B M
41 t] F
4ã Fr F'41 HM44DF4F F F4\u20ac E TI
478Iil4E H FéS H Mh0 11 M
L,60 60 ,5 2
1,69 55,0 1
L,85 12,8 2
l-, 85 80, 9 2
1", s8 55, 0 l-
1_,76 60,0 3
1,60 58.0 1
L,64 41,0 3-
L,62 57,8 3
t,64 58,0 2
r,72 70,0 L
L,66 54,0 3
L,70 58,0 2
1, 78 68, 5 l-
1,65 63,5 l-
7,63 47 ,4 3
1.,82 66 ,0 r
1-,80 85,2 2
1,,60 54,5 t
L,68 52,5 3
1.,70 60,0 2
1,65 58,5 1
1,57 49 ,2 1
L,55 48,0 1
1.,69 57,6 2
L,54 51,0 2
L,62 63 ,0 2
L,62 52,0 1
L,57 49,0 2
t,65 59,0 4
t,6L 52,0 1-
L,71. 73 ,0 Lt,65 56,0 3
r,67 58,0 L
1",73 87,0 r
r,60 47,0 t
1,70 95,0 1
L,85 84,0 1
1,70 60,0 1
1,73 '73 ,0 1
1,70 55,0 1
1,45 44,0 2
I,76 75,0 2
1,68 55,0 1
1,55 49,0 1
1,70 50,0 7
1,5s 54,5 2
r., 60 50, 0 I
L,8o 71,o 1
1,83 86,0 L
NAO P
NAO M
NAO P
NAO P
NAO M
NAO M
NAO P
SIM I
NAO M
NAO M
SIM I
NAO M
NAO M
SIM I
NAO I
NAO P
NAO P
NAO P
NAO P
NAO M
NAO P
NAO M
SfM I
SIM T
NAO P
NAO I
NAO M
NAO P
NAO P
NAO M
NAO P
NAO P
NAO M
NAO M
NAO M
NAO P
NAO P
SIM T
NAO P
NAO M
NAO f
NAO M
NAO I
NAO P
NAO M
NAO M
NAO M
NAO P
NAO P
NAO P
81.6R
B7R
M1.5R
B20R
B5R
13 Z .b{
B7R
MlOR
M1-2R
MlOR
B8N
BOR
M 30 R
M2N
BlOR
B18R
BlON
BlOR
B5R
B14M
B5R
B5R
BlOR
M 28 R
M4N
B5R
M5R
MlOR
BL2R
M2R
M6N
B 20 R
BL4R
BlOR
B25B
M14R
M12N
B],OR
BT2R
B2R
BlOB
B 25 R
M1.4N
B8R
MlOR
B8R
B3R
B5R
M1.4R
M 20 B
1,7
18
1,8
19
19
20
l-8
t_8
T7
l-8
18
a1
I9
18
t-9
L7
1"8
20
l_8
2L
18
L8
20)^
L9
z3
18
18
25
18
17
T7
L7
J.õ
18
77
2L
10
1A
L7
23
24
L8
18
L9
19
18
t7
1B
01-01
52
52
a1
3l-
22102026t5l_41-013134
11
1)
8203
5401
62821"13L12
221L
2142
7L
51
1-0 26452
4L54))
70
510101
432L
"t0
70
Capítulo I: Introdução à Anólise Exploraúrta de Dados
Resumimos a classificação das variáveis no esquema apresentado na
Figura I.2 (atítulo de exercício, tente classificar todas as variáveis da Tabela 1.1).
Nominal
-a"Qualitativa 
' -.ordinal
Variável 
\ 
--""-Discreta'Quantitativ u 1 
.-,contínua
liSura 
1.2: Classificação de varidveis.
Vale ressaltar que, em muitas situações práticas, a classificação depende
de certas particularidades. Por exemplo, a variável ldade, medida em número de
anOS, pode ser vista como discreta, entretanto, Se levarmos em conta os dias, não é
absurdo falar que a idade ê 2,5 ou 2,85 anos, dando assim respaldo para classificá-
la como contínua. Por outro lado, dependendo da precisão do instrumento
utilizado para se obter medidas em um objeto, podemos ter limitações no número
cle casas decimais e uma variável de mensuração pode se "tornar" discreta. E
importante salientar que a classificação apresentada acima se refere à natureza da
variável e, em geral, devemos utilizar o bom senso na hora de decidir qual
procedimento adotar para caracterizar uma variável. Para salientar tal fato,
menciOnamos que podemos, inclusive, discretizar uma variável contínua para
obter uma melhor representação da ocorrência de seus valores no conjunto de
dirclos.
Outro ponto que pode trazer confusão é que, muitas vezes, na utilização
Cle programas computacionais, associamos códigos numéricos a uma variável
qqalitativa. Por exemplo na Tabela 1.1, pode-se associar ao sexo feminino o valor
I e ao masculino 2. Apesar da variável ser representada por valores numéricos,
issO não a torna uma variável quantitativa. Novamente, vemos que a natureza da
vnriável deve sempre ser levada em conta na hora de se interpretar resultados
obtidos na análise descritiva.
I1.2 Organízação de Dados
Apesar de conter muita informaçáo, a tabela de dados brutos pode nãO Sef
prática pu.u r"rpondermos às questões de interesse. Por exemplo, da Tabela 1'1
rriro é imediato dizer se os alunos se incomodam muito ou pouco com Os
l'umantes. Porlanto, a partir da tabela de dados brutos, vamos construir UmO nOvtl
t1$ela com as informações resumidas, para cada variável. Essa tabela Sefd
clenominada de tabela de freqüência e, como o nome indica, conterá os valOfeg dA
virriável e suas respectivas contagens, as quais são denominadas freqüênelAEq
ttbsolutas ou simplesmente, freqüências. No caso de variáveis qualitativas OU
tprantitativas discretas, a tabela de freqüência consiste em listar os valorog
possíveis da variável, numéricos ou não e fazer a contagem na tabela de dadOg
lrrutos do número de suas ocorrências. Representaremos por n; a freqüência dq
vulor i e por ?? a freqüência total. Para efeito de comparação com outros grupOS
ou conjunìos de dadoi, será conveniente acrescentarmos uma coluna na tabela de
lì.oqüência contendo o cálculo da freqüência relativa, definida por fi = U/t\:,
Convém notar que, quando estivermos comparando dois grupos com relaçãO àS
freqiiências de ocorrência dos valores de uma dada variável, grupos cgm Um
número total de dados maior tendem a ter maiores freqüências de ocorrência dos
vtlores da variável. Desta forma, o uso da freqüência relativa vem resolver èBte
problema.
A Tabela 1.2 apresenta as freqüências para a variável Sexo, obtida a p0rtir
cln Tubela I .1.
Tabela 1.2: Tabela de freqüêncía para a variúvel Sexo.
Sexo n,i
.ït
F t t'7dí 0,74
M 13 0,26
total n:50 1
Note que, para variáveis cujos valores possuem ordenação n0tufel
(eluglitltivas ordinais