Estatística aplicada

•
UNINTER

Noeli Glese
30.05.2016
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 63 páginas
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 63 páginas
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 63 páginas
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
E aí, curtiu este material?
Ajude a incentivar outros estudantes a melhorar o conteúdo
Gostou desse material? Compartilhe! 🧡
Contabilidade / Ciências Contábeis

221.525 Materiais compartilhados
Baixe o app para aproveitar ainda mais
Leia os materiais offline, sem usar a internet. Além de vários outros recursos!
Prévia do material em texto
52
Unidade II
Re
vi
sã
o:
 A
nd
ré
ia
 G
om
es
 -
 D
ia
gr
am
aç
ão
: L
éo
 -
 0
1/
08
/2
01
2
Unidade II
5 DISTRIBUIÇÃO DE FREQUÊNCIAS
Ao longo de nosso estudo, observamos que, para extrair dos dados estatísticos de que dispomos a 
correta análise e interpretação, o primeiro passo deverá ser a correta organização e sumarização desses 
dados; caso contrário, esses números não farão qualquer sentido.
Além disso, dependendo do tamanho do nosso conjunto de dados, podemos organizá-los em um 
rol de dados simples, ou seja, por ordem de grandeza (crescente ou decrescente), ou em rol (novamente 
ordenando o conjunto de dados) e, posteriormente, tabelando sua distribuição de frequências.
A distribuição de frequências é o modo de tratamento de dados utilizado quando é grande a 
quantidade de dados brutos, e passamos a agrupar os dados estatísticos em subconjuntos com 
características semelhantes – as classes ou categorias.
A distribuição de frequência é a organização de dados em classes ou intervalos, para determinar o número 
de observações ou a percentagem de observações de cada classe, chamada de frequência de classes.
Para apresentar esses dados, podemos utilizar gráﬁcos e tabelas, bem como as medidas de posição 
e variabilidade para interpretá-los, mas não sem organizá-los previamente em uma distribuição, sem a 
qual ﬁcaria impossível o cálculo de algumas das medidas necessárias, como média, variância etc.
Tabela 6
Tabela 4.1
Idade de 100 estudantes formandos do curso de 
Gestão de uma Universidade em dez/2006
Idade Número de estudantes (fi)
20 a 22 8
22 a 24 10
24 a 26 12
26 a 28 20
28 a 30 17
30 a 32 15
32 a 34 9
34 a 36 5
36 a 38 3
38 a 40 1
Total = 100
53
Re
vi
sã
o:
 A
nd
ré
ia
 G
om
es
 -
 D
ia
gr
am
aç
ão
: L
éo
 -
 0
1/
08
/2
01
2
EstatístIca aplIcada
A tabela anterior é uma distribuição de frequências das idades dos estudantes que estão se formando 
no curso de Gestão de determinada universidade ﬁctícia. A primeira classe corresponderia ao grupo de 
formandos em Gestão no ano de 2006 e que têm entre 20 e 22 anos, e é indicada pelo símbolo 20 |— 22. 
A frequência dessa classe corresponde a 8, porque existem 8 estudantes cuja idade faz parte dessa classe.
Representação dos intervalos reais:
Intervalo fechado nas duas extremidades
a b
Que será [a,b], ou ainda {x ∈ ℝ | a ≤ x ≤ b}.
Intervalo aberto nas duas extremidades
a b
Que será ]a,b[, ou ainda {x ∈ ℝ | a < x < b}.
Intervalo fechado à esquerda e aberto à direita
a b
Que será [a,b[, ou ainda [a,b) = {x ∈ ℝ | a ≤ x < b}.
Intervalo aberto à esquerda e fechado à direita
a b
Que será (a,b], ou ainda ]a,b] = {x ∈ ℝ | a < x ≤ b}.
 Saiba mais
Para mais informações a respeito da Teoria dos Conjuntos, ler o material 
“Elementos de Lógica Matemática e Teoria dos Conjuntos”. Disponível em: 
<http://www.ciul.ul.pt/~amfern/am1/documents/logTeoConj.pdf>. Acesso em: 
24 jul. 2012.
5.1 A construção de uma distribuição de frequências para dados contínuos
Para se construir determinada distribuição de frequências, é preciso, em primeiro lugar, deﬁnir o tipo 
de variável em questão, para depois deﬁnir os passos que devem ser seguidos para a construção dessa 
54
Unidade II
Re
vi
sã
o:
 A
nd
ré
ia
 G
om
es
 -
 D
ia
gr
am
aç
ão
: L
éo
 -
 0
1/
08
/2
01
2
distribuição. Vamos supor o conjunto de dados a seguir, referente às idades de uma amostra de 100 
alunos formandos em Gestão de uma universidade:
Tabela 7
Tabela 4.2
Dados das idades dos estudantes formandos de Gestão da Universidade
20 20,4 20,5 21 21 22 22 22 22,1 22,2
22,3 22,5 22,6 22,7 22,8 22,9 23 24 24,1 24,2
24,3 24,4 24,5 25 25 25,3 25,5 25,7 26 26
26,2 26,3 26,4 26,5 26,6 26,7 26,8 26,9 27 27
27,1 27,2 27,3 27,4 28 28 28 28 28 28
28,2 28,3 28,5 29 29 29 29 29,1 29,1 29,2
29,3 29,4 29,5 29,5 30 30 30 31 31 31
31 31,1 31,2 31,3 31,4 31,5 31,6 31,6 32 32
32 32 32,3 33 33 33 34 34 34 34
34 34,5 35 35 36 36 37 37,5 38 40
Como podemos observar, os dados já estão dispostos em ordem crescente de grandeza, em um rol, 
muito embora se trate de um conjunto de números superior a trinta observações. Essa amostra diz 
respeito às idades dos alunos de determinada universidade ﬁctícia que estão se formando no curso de 
Gestão. Estamos considerando, portanto, uma variável quantitativa contínua.
Uma variável quantitativa contínua é aquela que pode assumir qualquer valor num intervalo 
contínuo, ou seja, um valor numérico que pertence ao conjunto dos números reais (ℝ).
Como vimos, tratar um conjunto de dados sob a forma de uma distribuição de frequências signiﬁca 
organizá-los em intervalos de classes. Precisamos, então, deﬁnir o número de classes, o tamanho dessas 
classes, para então enquadrar os dados nas classes pela simples contagem desses dados amostrais.
A primeira coisa que devemos fazer ao nos depararmos com um conjunto de dados como esse 
apresentado na tabela 7 é procurar calcular a amplitude total (ou intervalo). Nesse caso, será muito mais 
fácil, já que os números estão dispostos em um rol. Conforme vimos, a amplitude total (ou intervalo) 
poderá ser calculada da seguinte forma:
Atotal = Vmáximo – Vmínimo
Atotal = 40 - 20 = 20
No caso do nosso exemplo, a amplitude total será igual a 20. O valor da amplitude total será 
importante porque, juntamente com o número de classes, deﬁnirá a chamada “amplitude de classes”.
Mas como, então, estabelecer o número de classes? A teoria estatística tem se desenvolvido ao 
longo dos anos e chegou ao consenso de que é aconselhável estabelecer o número de classes entre um 
55
Re
vi
sã
o:
 A
nd
ré
ia
 G
om
es
 -
 D
ia
gr
am
aç
ão
: L
éo
 -
 0
1/
08
/2
01
2
EstatístIca aplIcada
mínimo de cinco e um máximo de vinte classes. Uma distribuição de frequências que possua mais de 
vinte classes torna a apresentação dos dados muito confusa e de difícil avaliação. Se estabelecermos um 
número de classes inferior a cinco, podemos correr o risco de ocultar informações importantes sobre os 
dados disponíveis.
Quando se quer determinar o número de classes em função do conjunto de dados disponíveis, basta 
tirarmos a raiz quadrada de n, em que n corresponderia ao total de observações (seja da população ou 
da amostra). Sendo assim, temos:
Númeroclasses = n
No caso do exemplo apresentado anteriormente, temos um total de observações n = 100; portanto, 
o número de classes será igual a 10. Vejamos:
N n
N
classe
classe
=
= =100 10
 Observação
Regra da raiz: dar prioridade ao seu uso quando os dados não superam 
os 60 elementos.
Númeroclasse = n
Regra de Sturges
Númeroclasse = 1 + 3,3.logn
Uma vez estabelecido o número de classes, é preciso pensar qual será o tamanho de cada classe, ou, 
dito de outra forma, faz-se necessário determinar a amplitude de classe dessa distribuição de frequências. 
Para isso, calculamos a amplitude total dessa distribuição, a qual corresponde a uma medida absoluta 
de variabilidade.
A amplitude de classes será calculada, então, tomando-se o valor da amplitude total e dividindo-se 
pelo número de classes.
Assim, temos:
 AmplitudetotalAmplitudeclasses = ------------------------------- Númeroclasses
56
Unidade II
Re
vi
sã
o:
 A
nd
ré
ia
 G
om
es
 -
 D
ia
gr
am
aç
ão
: L
éo
 -
 0
1/
08
/2
01
2
Seguindo o exemplo em que estamos trabalhando, já ﬁzemos o cálculo da amplitude total e do 
número de classes; podemos, então, passar para o cálculo da amplitude de classes do exemplo. Temos:
A
A
N
A
classes
total
classes
classes=
= =
20
10
2
A amplitude das classes da distribuição de frequências que estamos procurando construir em nosso 
exemplo será igual a dois. Isso representa o intervalo ou o tamanho de cada classe no qual iremos 
dispor nossos dados. É importante ressaltar que uma distribuição de frequência não obrigatoriamente 
apresenta uma única amplitude de classes, posto que mantenha a composição estrutural da distribuição.
Temos agora o número de classes, a amplitude de classes, e podemos então calcular o intervalo de 
classes. O intervalo de classes é composto por um limite inferior (número menor) e por um limite 
superior (número maior). Os limites inferiores e superiores podem ou não estar incluídos no intervalo 
de classes, existindo uma simbologia própria dentro da estatística para se expressar isso. Então, vejamos 
exemplos a partir da tabela 6:
A) 20 |—| 22: diz-se que é um intervalo fechado à esquerda e à direita, pois tanto o 20 quanto o 22 
participam do intervalo;
B) 22 —| 24: diz-se que esse é um intervalo aberto à esquerda e fechado à direita, já que o limite 
inferior, 22, não participa do intervalo, ao passo que o limite superior participa;
C) 20 |— 22: caso o exemplo se apresentasse assim, teríamos um intervalo de classe fechado à 
esquerda e aberto à direita, já que o limite inferior participa do intervalo, mas o limite superior 
não;
D) 20 — 22: aqui, teríamos um intervalo de classe aberto à esquerda e à direita, em que nem o limite 
inferior nem o limite superior participam do intervalo.
Após o cálculo do número e da amplitude de classes, devemos deﬁnir o limite inferior e o limite 
superior de cada classe, começando com o menor valor. Em nosso exemplo, podemos calcular as classes 
da seguinte forma:
Para a primeira classe:
•	 limite inferior: 20;
•	 limite superior: 20 + amplitude de classe = 20 + 2 = 22.
Para a segunda classe:
•	 limite inferior: limite superior da classe anterior = 22;
•	 limite superior: limite inferior da segunda classe + amplitude de classes = 22 + 2 = 24.
57
Re
vi
sã
o:
 A
nd
ré
ia
 G
om
es
 -
 D
ia
gr
am
aç
ão
: L
éo
 -
 0
1/
08
/2
01
2
EstatístIca aplIcada
E assim sucessivamente até a classe de número 10, em nosso exemplo, que terá como limite inferior 
38 e como limite superior 40. É importante frisar que determinado valor não pode pertencer a mais de 
uma classe, mas, por outro lado, para cada valor deve haver uma classe, não permitindo a existência de 
lacunas na ﬁxação dessas mesmas classes.
Uma vez deﬁnido o número e a amplitude total de classes, a partir delas podemos estabelecer 
a amplitude de classes e também deﬁnir os limites superior e inferior de cada classe. Resta agora 
confrontar nossas classes com as observações de que dispomos na tabela 7.
Mediante contagem, devemos construir nossa distribuição de frequência ﬁxando cada observação 
numa classe determinada. Quando indicamos o número de observações existentes em dado intervalo, 
temos a chamada frequência absoluta simples (ﬁ).
A frequência absoluta é o número de vezes que o dado aparece naquele determinado conjunto de 
números, ou seja, em uma amostra ou população da pesquisa a ser estudada.
É importante destacar que nenhuma classe poderá apresentar frequência absoluta igual a zero. 
Assim, uma primeira construção que podemos fazer para nos levar à tabela 6 é estabelecer os intervalos 
de frequência em cada classe, só que agora colocando a notação estatística em cada intervalo de classe. 
Então, temos:
Tabela 8
Tabela 4.3
Distribuição de frequência das idades
Classes Frequência absoluta simples
20 |- 22 5
22 |- 24 12
24 |- 26 11
26 |- 28 16
28 |- 30 20
30 |- 32 14
32 |- 34 8
34 |- 36 8
36 |- 38 4
38 |- 40 2
∑ 100
É importante ressaltar que, na construção da distribuição de frequências anterior, devemos respeitar 
os valores estabelecidos para cada intervalo de classe, ou seja, para o primeiro intervalo de classe, há 
o valor do limite inferior e do limite superior, que serão indicados pelo intervalo fechado à esquerda e 
pelo intervalo aberto à direita, ou seja, tem que colocar a quantidade de frequência compreendida entre 
20 (limite inferior) e menor que 22 (limite superior); existem cinco valores compreendidos no primeiro 
intervalo de classe.
58
Unidade II
Re
vi
sã
o:
 A
nd
ré
ia
 G
om
es
 -
 D
ia
gr
am
aç
ão
: L
éo
 -
 0
1/
08
/2
01
2
No segundo intervalo de classe, que tem 22 como limite inferior e 24 como limite superior, será 
colocada a quantidade de frequência compreendida entre 22 e menor que 24; existem doze valores, 
e assim se vai determinando a quantidade de frequência para cada classe, até chegar à última classe, 
conforme a tabela 8.
A seguir, devemos calcular as frequências absolutas simples acumuladas (ﬁ, A).
Frequência absoluta simples acumulada indica o número de observações acumuladas até o limite 
superior de uma classe. Por exemplo, na terceira classe, teríamos trinta alunos com idade entre 20 e 
26 anos formando-se em Gestão. Vejamos como ﬁcaria a nova tabela, incluindo a nova notação da 
frequência acumulada:
Tabela 9
Classes Frequência absoluta simples (fi)
Frequência absoluta 
simples acumulada (fi, A)
20 |- 22 5 5
22 |- 24 12 17
24 |- 26 11 28
26 |- 28 16 44
28 |- 30 20 64
30 |- 32 14 78
32 |- 34 8 86
34 |- 36 8 94
36 |- 38 4 98
38 |- 40 2 100
∑∑ 100
Outro dado importante que podemos extrair da construção de uma distribuição de frequências é a 
frequência relativa simples (fi, R), que nos mostra a participação relativa do número de observações em 
uma dada classe, e deverá ser calculada da seguinte forma:
f R
f
i
i
i
, = ∑ , geralmente expresso em percentual.
A soma das frequências relativas de todas as classes será igual a 1, se expressa em forma fracionária, 
ou a 100%, se expressa em percentual. No caso da distribuição de frequências que estamos construindo, 
temos agora a seguinte tabela:
59
Re
vi
sã
o:
 A
nd
ré
ia
 G
om
es
 -
 D
ia
gr
am
aç
ão
: L
éo
 -
 0
1/
08
/2
01
2
EstatístIca aplIcada
Tabela 10
Classes fi fi, A fi, R
20 |- 22 5 5 0,05
22 |- 24 12 17 0,12
24 |- 26 11 28 0,11
26 |- 28 16 44 0,16
28 |- 30 20 64 0,20
30 |- 32 14 78 0,14
32 |- 34 8 86 0,08
34 |- 36 8 94 0,08
36 |- 38 4 98 0,04
38 |- 40 2 100 0,02
∑ 100 1
O cálculo da frequência relativa de cada intervalo de classe 
da tabela acima que será expressa na unidade de percentagem 
será:
f
f
f
f
R
i
i
R
=
= =
∑
5
100
0 05,
Para expressar esse valor na unidade de porcentagem, 
basta multiplicá-lo por 100%:
fR = 0,5 x 100%
fR = 5%
5.2 A construção de uma distribuição de frequências para dados discretos
Na construção de frequência para dados discretos, basta criar uma coluna representando a posição 
de cada frequência e na frente estabelecer a quantidade de vezes em que a frequência aparece dentro 
da amostra ou da população de uma série de estudo ordenadamente. Por exemplo:
X: {0, 2, 0, 1, 1, 0, 0, 0, 3, 2, 1, 0, 1, 2, 0, 1, 3, 2, 2, 0}
Fazendo o rol da pesquisa, temos:
X: {0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 3, 3}
60
Unidade II
Re
vi
sã
o:
 A
nd
ré
ia
 G
om
es
 -
 D
ia
gr
am
aç
ão
: L
éo
 -
 0
1/
08
/2
01
2
Tabela 11
xi fi
0 8
1 5
2 5
3 2
Pode-se dizer, então, que distribuição de frequências é uma maneira de representar uma coleção 
de dados classiﬁcando-os de modo a mostrar o quanto cada dado se repete. É importante considerar, 
na distribuição de frequência, a possibilidade de apresentar as chamadas distribuições especiais. 
Como exemplo, pode-se citar a distribuição de frequências de probabilidadese de frequências de 
amostragens.
5.3 Representações gráficas de dados agrupados
Como mencionado anteriormente, a confecção de gráﬁcos permite melhor visualização dos dados, 
mostrando mais claramente as diferenças existentes. Os gráﬁcos mais comuns são o gráﬁco de setor, 
de coluna ou de barra e o gráﬁco de curva. O tipo de gráﬁco a ser utilizado depende do que se deseja 
enfatizar.
Assim, o gráfico de coluna ou de barra mostra diferenças entre os valores absolutos; o gráfico 
de curva é utilizado quando se deseja mostrar variações ao longo do tempo, e o gráfico de setor, 
também conhecido como “gráfico de pizza”, é utilizado quando se deseja ressaltar diferenças entre 
proporções. Esses gráﬁcos podem ser facilmente feitos em planilhas eletrônicas, por exemplo, no 
Excel.
No caso de dados agrupados, ou de distribuições de frequência, a representação gráﬁca utilizada é 
o histograma ou, ainda, o polígono de frequência.
 Lembrete
Histograma: é a representação gráﬁca de uma distribuição de 
frequência por meio de retângulos justapostos, em que a base colocada no 
eixo horizontal corresponde à amplitude dos intervalos de classe e a altura 
é proporcional à frequência das classes.
Polígono de frequências: é a representação gráﬁca de uma distribuição 
de frequência por meio de um polígono. Cada vértice do polígono tem como 
abscissa o ponto médio de classe e ordenada proporcional à frequência 
dessa classe.
61
Re
vi
sã
o:
 A
nd
ré
ia
 G
om
es
 -
 D
ia
gr
am
aç
ão
: L
éo
 -
 0
1/
08
/2
01
2
EstatístIca aplIcada
Exemplo: salários de funcionários de determinada empresa:
Tabela 12
Intervalos Salários fi (fi Ac.)
15750 |-- 29000 29000 238 238
29000 |-- 42250 42250 144 382
42250 |-- 55500 55500 35 417
55500 |-- 68750 68750 29 446
68750 |-- 82000 82000 16 462
82000 |-- 95250 95250 6 468
92250 |-- 10850 108500 4 472
108500 |-- 121750 121750 1 473
121750 |-- 135000 135000 0 473
A) Histograma
15.750 29.000 42.250 55.500 68.750 82.000 95.250 108.500 121.750 135.000
250
225
200
175
150
125
100
75
50
25
0
238
144
35 29
16 6 4 1 1
Figura 19
 Observação
A área de um histograma é proporcional à soma das frequências.
62
Unidade II
Re
vi
sã
o:
 A
nd
ré
ia
 G
om
es
 -
 D
ia
gr
am
aç
ão
: L
éo
 -
 0
1/
08
/2
01
2
B) Polígono de frequência
15.750 29.000 42.250 55.500 68.750 82.000 95.250 108.500 121.750 135.000
250
225
200
175
150
125
100
75
50
25
0
238
144
35 29
16 6 4 1 1
Figura 20
 Lembrete
Estatística descritiva é o nome dado ao conjunto de técnicas analíticas 
utilizadas para resumir o conjunto de todos os dados coletados numa dada 
investigação a relativamente poucos números e gráﬁcos.
A estatística descritiva envolve basicamente:
Distribuição de frequência: é o conjunto das frequências relativas observadas para um dado 
fenômeno estudado, sendo sua representação gráﬁca o histograma (diagrama em que o eixo horizontal 
representa faixas de valores da variável aleatória e o eixo vertical representa a frequência relativa). 
Por uma consequência da Lei dos Grandes Números, quanto maior o tamanho da amostra, mais a 
distribuição de frequência tende para a distribuição de probabilidade.
Fr
eq
uê
nc
ia
 re
la
tiv
a 
(%
)
Faixas da variável aleatória
A B C E F
50
40
30
20
10
0
Figura 21 – Histograma
Medidas da tendência central: são indicadores que permitem que se tenha uma primeira ideia, um 
resumo de como se distribuem os dados de um experimento, informando o valor (ou faixa de valores) da 
variável aleatória que ocorre mais tipicamente. Ao todo, são três os parâmetros:
63
Re
vi
sã
o:
 A
nd
ré
ia
 G
om
es
 -
 D
ia
gr
am
aç
ão
: L
éo
 -
 0
1/
08
/2
01
2
EstatístIca aplIcada
•	média: é a soma de todos os resultados dividida pelo número total de casos, podendo ser 
considerada como um resumo da distribuição como um todo;
•	moda: é o evento ou a categoria de eventos que ocorreu com maior frequência, indicando o valor 
ou a categoria mais provável;
•	mediana: é o valor da variável aleatória a partir do qual metade dos casos se encontra acima dele 
e metade, abaixo.
Fr
eq
uê
nc
ia
 re
la
tiv
a 
(%
)
Faixas da variável aleatória
A B C E F
50
40
30
20
10
0
Tendência
central
Figura 22 – Histograma
Medidas de dispersão: são medidas da variação de um conjunto de dados em torno da média, ou 
seja, da maior ou menor variabilidade dos resultados obtidos. Elas permitem identiﬁcar até que ponto os 
resultados se concentram ou não ao redor da tendência central de um conjunto de observações. Incluem 
a amplitude, o desvio médio, a variância, o desvio padrão, o erro padrão e o coeﬁciente de variação, cada 
um expressando diferentes formas de quantiﬁcar a tendência que os resultados de um experimento 
aleatório têm de se concentrarem ou não em determinados valores (quanto maior a dispersão, menor a 
concentração e vice-versa).
Fr
eq
uê
nc
ia
 re
la
tiv
a 
(%
)
Faixas da variável aleatória
A B C E F
50
40
30
20
10
0
Dispersão
Figura 23 – Histograma
A ideia básica é a de se estabelecer uma descrição dos dados relativos a cada uma das variáveis, 
dados esses levantados por meio de uma amostra.
Façamos alguns exemplos para tornar as deﬁnições e suas aplicações técnicas mais claras:
Exemplo 1
A empresa JCC fez levantamento entre 30 funcionários para descobrir o número de ﬁlhos dos seus 
funcionários. Foram encontrados os seguintes valores:
64
Unidade II
Re
vi
sã
o:
 A
nd
ré
ia
 G
om
es
 -
 D
ia
gr
am
aç
ão
: L
éo
 -
 0
1/
08
/2
01
2
1 4 2 5 3 2 0 3 2 1
5 4 2 5 0 3 2 4 2 3
2 3 2 1 4 2 1 3 4 2
Responda às questões a seguir, para x = 2 e x = 4.
Obs.: X é o número de funcionários, então vamos responder:
A) Quantos empregados têm dois ﬁlhos?
B) Quantos empregados têm menos de dois ﬁlhos?
C) Quantos empregados têm mais de dois ﬁlhos?
D) Quantos empregados têm quatro ﬁlhos?
E) Quantos empregados têm menos de quatro ﬁlhos?
F) Quantos empregados têm mais de quatro ﬁlhos?
Solução
Rol (dados em ordem crescente):
0 0 1 1 1 1 2 2 2 2
2 2 2 2 2 2 3 3 3 3
3 3 4 4 4 4 4 5 5 5
Tabela 13 – Distribuição de frequências
X F fr f % F ↓ F ↑ F% ↓ F% ↑
0 2 0,067 6,7 2 30 6,7 100
1 4 0,133 13,3 6 28 20 93,3
2 10 0,333 33,3 16 24 53,3 80
3 6 0,2 20 22 14 73,3 46,7
4 5 0,167 16,7 27 8 90 26,7
5 3 0,1 10 30 3 100 10
Total 30 1 100 - - - -
Como analisar a situação:
A questão “A” – quantos empregados têm dois ﬁlhos – pode ser observada pela frequência absoluta 
simples “F”. Observe a segunda coluna, 10 funcionários apontaram ter 2 ﬁlhos.
A questão “B” – quantos empregados têm menos de dois ﬁlhos – pode ser observada na coluna F ↓ 
(frequência absoluta acumulada “abaixo de”, a qual aponta que 6 funcionários têm menos de dois ﬁlhos 
(2 têm zero ﬁlho e 4 têm um ﬁlho).
65
Re
vi
sã
o:
 A
nd
ré
ia
 G
om
es
 -
 D
ia
gr
am
aç
ão
: L
éo
 -
 0
1/
08
/2
01
2
EstatístIca aplIcada
Obs. Se a pergunta fosse quantos funcionários têm de 2 ﬁlhos para baixo, a resposta seria 16.
A questão “C” – quantos empregados têm mais de dois ﬁlhos – pode ser observada na colunade F ↑ 
(frequência absoluta acumulada “acima de”). Ou seja, funcionários com 3, 4 ou 5 ﬁlhos são 14 no total. 
Se a pergunta fosse de dois para cima, a resposta seria 24, pois incluiria os funcionários com 2 ﬁlhos.
Seguindo o mesmo processo, o aluno agora pode responder, para quatro ﬁlhos, às questões D, E e F.
____________________________________________________________________________
____________________________________________________________________________
____________________________________________________________________________
____________________________________________________________________________
_____________________________________________________________________________
Resposta:
D = 5
E = 22
F = 3
Exemplo 2
Determinado laboratório realizou exames de urina em um grupo de pacientes com o objetivo de 
encontrar a quantidade de creatina (em miligramas por 100 mililitros) em pacientes com apresentação 
de problemas renais. Os dados encontrados foram:
1,51 1,65 1,58 1,54 1,65 1,40 1,61 1,08 1,81 1,38 1,56 1,83
1,69 1,22 1,22 1,68 1,47 1,68 1,49 1,80 1,33 1,83 1,50 1,46
1,67 1,60 1,23 1,54 1,73 1,43 2,18 1,46 1,53 1,60 1,59 1,49
1,46 1,72 1,56 1,43 1,69 1,15 1,89 1,47 2,00 1,58 1,37 1,40
1,76 1,62 1,96 1,66 1,51 1,31 2,29 1,58 2,34 1,66 1,71 1,44
1,66 1,36 1,43 1,26 1,47 1,52 1,57 1,33 1,86 1,75 1,57 1,83
1,52 1,66 1,90 1,59 1,47 1,86 1,73 1,55 1,52 1,40 1,86 2,02
Solução
Rol (dados em ordem crescente)
1,08 1,15 1,22 1,22 1,23 1,26 1,31 1,33 1,33 1,36 1,37 1,38
1,40 1,40 1,40 1,43 1,43 1,43 1,44 1,46 1,46 1,46 1,47 1,47
1,47 1,47 1,49 1,49 1,50 1,51 1,51 1,52 1,52 1,52 1,53 1,54
1,54 1,55 1,56 1,56 1,57 1,57 1,58 1,58 1,58 1,59 1,59 1,60
1,60 1,61 1,62 1,65 1,65 1,66 1,66 1,66 1,66 1,67 1,68 1,68
1,69 1,69 1,71 1,72 1,73 1,73 1,75 1,76 1,80 1,81 1,86 1,86
1,86 1,86 1,86 1,86 1,89 1,90 1,96 2,00 2,02 2,18 2,29 2,34
66
Unidade II
Re
vi
sã
o:
 A
nd
ré
ia
 G
om
es
 -
 D
ia
gr
am
aç
ão
: L
éo
 -
 0
1/
08
/2
01
2
Amplitude total (dá uma ideia do campo de variação dos dados)
A = LS - LI = (2,34) - (1,08) = 1,26
Fazendo uma análise dos resultados da quantidade de creatinina encontrada na urina dos 84 
pacientes, veriﬁcou-se que ocorreu uma variação de 1,26 no seu campo (de 1,08 a 2,34).
Estabelecer o número de classes (c):
c = 1+3,3.log n
c = 1+3,3.log(84)
c ≅ 7,414
c = 7
Estabelecer o intervalo de classe (i): i = A/c = (1,26)/7 = 0,14
Construção da tabela:
Tabela 14
Classes fi Pm fr f % F% ↓ F% ↑ F ↓ F ↑
1,08 |— 1,26 5 1,17 0,059 5,9 5,9 100 5 84
1,26 |— 1,44 13 1,35 0,155 15,5 21,4 94,1 18 79
1,44 |— 1,62 32 1,53 0,381 38,1 59,5 78,6 50 66
1,62 |— 1,80 18 1,71 0,214 21,4 80,9 40,5 68 34
1,80 |— 1,98 11 1,89 0,131 13,1 94,0 19,1 79 16
1,98 |— 2,16 2 2,07 0,024 2,4 96,4 6,0 81 5
2,16 |— 2,34 3 2,25 0,036 3,6 100 3,6 84 3
Total 84 - 1 100 - - - -
Observações:
1. A representação de cada classe deve ser feita pelo ponto médio (Pm), o qual se obtém pela fórmula:
 Pm = (Lt +Ls ) / 2
Obs. Como teste, solicita-se ao aluno que calcule cada um dos Pm na tabela, faça uma espécie de 
conferência.
2. ﬁ: representa o número de elementos de cada classe. Ou, em outras palavras, é a quantidade de 
vezes que cada classe apareceu na análise;
67
Re
vi
sã
o:
 A
nd
ré
ia
 G
om
es
 -
 D
ia
gr
am
aç
ão
: L
éo
 -
 0
1/
08
/2
01
2
EstatístIca aplIcada
fr: mede a representatividade relativa de cada valor encontrado em ﬁ, ou o quanto cada valor 
signiﬁca em relação à unidade;
f%: representa o peso percentual de cada item em relação ao todo.
3. 1,08 |— 1,26 na leitura de intervalo, signiﬁca que é um intervalo fechado à esquerda (pertencem 
à classe valores iguais ao extremo inferior – ou seja, inclui 1,08 no intervalo) e aberto à direita (não 
pertencem à classe valores iguais ao extremo superior – o limite superior não faz parte do intervalo, é 
abaixo dele).
4. Não necessariamente o último número será o limite superior da última classe, mas obrigatoriamente 
as classes devem conter todos os elementos.
Algumas considerações ou conclusões
a) Considerando os valores anteriores, quantos pacientes apontaram resultados no intervalo entre 
[1,44; 1,62[?
R.: (Frequência absoluta simples) 32 pacientes.
b) Para ampliar a análise, aponte a quantidade de pacientes com creatinina inferior ao intervalo 
[1,80; 1,98[
Observe a tabela: (Frequência absoluta acumulada)
Tabela 15
Classes fi Pm fr f % F% ↓ F% ↑ F ↓ F ↑
1,08 |— 1,26 5 1,17 0,059 5,9 5,9 100 5 84
1,26 |— 1,44 13 1,35 0,155 15,5 21,4 94,1 18 79
1,44 |— 1,62 32 1,53 0,381 38,1 59,5 78,6 50 66
1,62 |— 1,80 18 1,71 0,214 21,4 80,9 40,5 68 34
1,80 |— 1,98 11 1,89 0,131 13,1 94,0 19,1 79 16
1,98 |— 2,16 2 2,07 0,024 2,4 96,4 6,0 81 5
2,16 |— 2,34 3 2,25 0,036 3,6 100 3,6 84 3
Total 84 - 1 100 - - - -
R.: 68 pacientes.
Atenção: para dados agrupados ou distribuição de frequências.
Elementos principais:
a) Classe: é cada um dos intervalos em que os dados são agrupados.
68
Unidade II
Re
vi
sã
o:
 A
nd
ré
ia
 G
om
es
 -
 D
ia
gr
am
aç
ão
: L
éo
 -
 0
1/
08
/2
01
2
b) Limites de classes: são os valores extremos de cada classe.
li = limite inferior de uma classe;
Li = limite superior de uma classe.
c) Amplitude: é a diferença entre o maior valor e o menor valor de certo conjunto de dados. Pode 
ser referida ao total de dados ou a uma das classes em particular.
•	 Amplitude total (At ): é calculada pela seguinte expressão:
At = Max. (rol) – Min. (rol).
•	 Amplitude das classes (h): é a relação entre a amplitude total e o número de classes, conforme 
mostra a expressão a seguir:
 Max (rol)-Min(rol)
h = -------------------------------------------------------------------------------------- 
 n
em que n é o número de intervalos de classe.
d) Ponto médio de classe (xi): é calculado pela seguinte expressão:
 Li + lixi = --------------------------------- 2
e) Frequência absoluta (fi): frequência absoluta de uma classe de ordem i é o número de dados 
que pertencem a essa classe.
f) Frequência relativa (fri): frequência relativa de uma classe de ordem i é o quociente da frequência 
absoluta dessa classe (ﬁ) pelo total, ou seja,
 fifri = ------------------------------ Total
 Observação
A soma de todas as frequências absolutas é igual ao total.
g) Frequência acumulada (fi): frequência acumulada de uma classe de ordem i é a soma das 
frequências até a classe de ordem i.
h) Frequência relativa acumulada (fri): frequência relativa acumulada de uma classe de ordem i 
é a soma das frequências relativas até a classe de ordem i.
69
Re
vi
sã
o:
 A
nd
ré
ia
 G
om
es
 -
 D
ia
gr
am
aç
ão
: L
éo
 -
 0
1/
08
/2
01
2
EstatístIca aplIcada
6 AS MEDIDAS DE POSIÇÃO E VARIABILIDADE NUMA DISTRIBUIÇÃO DE 
FREQUÊNCIA
Vamos agora usar os conhecimentos obtidos no item 4 para aprender a calcular as medidas de posição 
e variabilidade em uma distribuição de frequência. Para isso, continuaremos utilizando o exemplo que 
trabalhamos no item 4 – da distribuição de frequência das idades dos alunos formandos em Gestão de 
uma universidade ﬁctícia.
Tabela 16
Idade de 100 estudantes formandos do curso de 
Gestão de uma Universidade em dez/2006
Idade Número de estudantes
20 a 22 8
22 a 24 10
24 a 26 12
26a 28 20
28 a 30 17
30 a 32 15
32 a 34 9
34 a 36 5
36 a 38 3
38 a 40 1
Total = 100
Podemos, também, aproveitar uma série de informações que construímos a partir dos dados brutos 
que tínhamos no item 4, tal como disposto na tabela a seguir, e, partindo dessas informações, construir 
as medidas de posição e variabilidade para uma distribuição de frequência.
Tabela 17
Classes fi fi, A fi, RA
20 |- 22 5 5 0,05
22 |- 24 12 17 0,12
24 |- 26 11 28 0,11
26 |- 28 16 44 0,16
28 |- 30 20 64 0,20
30 |- 32 14 78 0,14
32 |- 34 8 86 0,08
34 |- 36 8 94 0,08
36 |- 38 4 98 0,04
38 |- 40 2 100 0,02
∑ 100 1
70
Unidade II
Re
vi
sã
o:
 A
nd
ré
ia
 G
om
es
 -
 D
ia
gr
am
aç
ão
: L
éo
 -
 0
1/
08
/2
01
2
6.1 As medidas de posição
6.1.1 A média
No item 2, como trabalhávamos com um conjunto de dados pequeno para calcular a média desse 
grupo de números, era necessário organizá-los em um rol, identiﬁcar os valores de xi, fazer o somatório 
e então calcular a média a partir da fórmula apresentada.
No entanto, quando se tem uma distribuição de frequências, nem sempre dispomos dos valores de 
todas as observações ou a amostra é por vezes tão grande que não é viável fazer o cálculo da mesma 
maneira que fazemos quando os dados estão dispostos em um rol. Geralmente, quando estamos diante 
de uma distribuição de frequência, o que dispomos é do número de observações em cada classe, mas não 
dos valores em si de xi. Portanto, as observações em dada distribuição de frequência serão representadas 
pelo ponto médio de cada classe. A fórmula para o cálculo do ponto médio será:
Pmédio = X
Limite Limite
i
erior erior
=
+inf sup
2
Para o cálculo da média aritmética, usa-se uma fórmula que deriva da fórmula de cálculo da média 
ponderada para determinar a média de uma distribuição de frequência; substituem-se os pesos pelas 
frequências de classes e xi pelo ponto médio, representado por xi.
Assim, temos que a média numa distribuição de frequências é:
x
fX
n
i i
=
∑
, onde
x : Média aritmética da distribuição de 
frequência;
fi : Frequência absoluta simples;
xi : Ponto médio de cada classe;
n : Número de observações.
Em nosso exemplo de distribuição de frequência das idades, podemos calcular a média a partir da 
construção de uma nova tabela.
Tabela 18
Classes fi fi, A fi, A Xi fi, Xi
20 |- 22 5 5 0,05 21 105
22 |- 24 12 17 0,12 23 276
24 |- 26 11 28 0,11 25 275
26 |- 28 16 44 0,16 27 432
28 |- 30 20 64 0,20 29 580
30 |- 32 14 78 0,14 31 434
32 |- 34 8 86 0,08 33 264
34 |- 36 8 94 0,08 35 280
36 |- 38 4 98 0,04 37 148
38 |- 40 2 100 0,02 39 78
∑ 100 1 2872
71
Re
vi
sã
o:
 A
nd
ré
ia
 G
om
es
 -
 D
ia
gr
am
aç
ão
: L
éo
 -
 0
1/
08
/2
01
2
EstatístIca aplIcada
Calculando a média aritmética para o exemplo, em que n = 100, temos, então:
x
fX
n
x
i i
=
=
+ + + + + +
∑
( . ) ( . ) ( . ) ( . ) ( . ) ( . ) (5 21 12 23 11 25 16 27 20 29 14 31 88 33 8 35 4 37 2 39
100
105 276 275 432 580 434 26
. ) ( . ) ( . ) .+ + + ( )
=
+ + + + + +
x
44 280 148 78
100
2872
100
28 72
+ + +
=
=x ,
A idade média dos estudantes de Gestão da universidade AB que se formaram no ano de 2006 seria 
de 28,72 anos, de acordo com a distribuição de frequência aqui construída.
6.1.2 A mediana
Como vimos também no item 2, a mediana é o elemento que ocupa a posição central num 
determinado conjunto de dados ordenados.
Em uma distribuição de frequências de uma variável contínua, devem-se seguir alguns passos para 
calcular a mediana. Da mesma forma que, nos dados organizados em um rol, precisamos primeiro 
identiﬁcar a posição da mediana.
O primeiro passo é calcular a ordem 
n
2
, e parte-se para a frequência acumulada para 
identificar a classe que contém a mediana. Feito isso, utiliza-se a seguinte fórmula para o cálculo 
da mediana:
x
n
f h
FMD MD
~ ( ).
= +
− ∑

2 , onde
MD : Limite inferior da classe da mediana;
n : tamanho da amostra;
Σƒ: Soma das frequências acumuladas anteriores à da 
mediana;
h : Amplitude da classe da mediana;
FMD: Frequência da classe da mediana.
Para a distribuição de frequência, temos de seguir os passos citados anteriormente para calcular 
a mediana. Pelo exemplo anterior, primeiro, calculamos n
2
100
2
50= = , conforme indicado na tabela 
a seguir:
72
Unidade II
Re
vi
sã
o:
 A
nd
ré
ia
 G
om
es
 -
 D
ia
gr
am
aç
ão
: L
éo
 -
 0
1/
08
/2
01
2
Tabela 19
Classes fi fi, A fi, R Xi fi, Xi
20 |- 22 5 5 0,05 21 105
22 |- 24 12 17 0,12 23 276
24 |- 26 11 28 0,11 25 275
26 |- 28 16 44 0,16 27 432
28 |- 30 20 64 0,20 29 580
30 |- 32 14 78 0,14 31 434
32 |- 34 8 86 0,08 33 264
34 |- 36 8 94 0,08 35 280
36 |- 38 4 98 0,04 37 148
38 |- 40 2 100 0,02 39 78
∑ 100 1 2872
a) Identiﬁcar a classe da mediana a partir da frequência acumulada, procurando descobrir onde a 
observação de número 50 está alocada. Em nosso exemplo, ela estará na quinta classe, que possui 
limite inferior de 28 e limite superior de 30.
b) Calcular a mediana por meio de:
x
n
f h
FMD MD
~ ( ).
= +
− ∑

2 , onde MD = 28 ; n = 100; f∑ = 44; FMD = 20; h = 2
x
x
x
~
~
~
,
,
= +
−( ) ×
= +
=
28
50 44 2
20
28 0 6
28 6
A mediana de nossa distribuição de frequência será 28,6 anos, ou seja, 50% dos alunos que se 
formaram em Gestão nessa universidade têm, no máximo, 28,6 anos.
6.1.3 A moda
Para calcular a moda, é preciso identiﬁcar o intervalo de classes de maior frequência, pois é nele que 
ela se encontra.
Depois disso, aplica-se a chamada fórmula de Czuber, descrita a seguir, para o cálculo da moda, que 
nos dirá qual a observação mais frequente daquela distribuição. O cálculo da moda será:
73
Re
vi
sã
o:
 A
nd
ré
ia
 G
om
es
 -
 D
ia
gr
am
aç
ão
: L
éo
 -
 0
1/
08
/2
01
2
EstatístIca aplIcada
M L
D
D D
hod = +
+
1
1
1 2
( ). , onde
Mod: Valor da moda;
L1: Limite inferior da classe modal;
D1:Diferença entre a frequência 
da classe modal e a frequência da 
classe anterior;
D2:Diferença entre a frequência 
da classe modal e a frequência da 
classe posterior;
h: Amplitude de classe.
Calculemos, então, a moda para a nossa distribuição de frequência das idades dos alunos de Gestão 
da universidade AB que se formaram em 2006. A classe modal será a quarta classe, pois é aquela que 
apresenta a maior frequência. Temos, então:
M
M
od
od
= +
−( )
−( ) + −( )




= +
+



 =
28
20 16
20 16 20 14
2
28
4
4 6
2 2
.
. 88
4
5
28 8+ = ,
A moda seria, portanto, de 28,8 anos, o que signiﬁca que a maior quantidade de alunos formando-se 
no curso de Gestão dessa universidade ﬁctícia teria 28,8 anos.
6.2 As medidas de dispersão numa distribuição de frequência
6.2.1 O desvio médio
Recapitulando o item 3, o desvio médio indica a diferença entre cada observação e a média aritmética 
de determinado conjunto de dados.
No caso de uma distribuição de frequência, essa diferença será calculada da seguinte forma:
Dmédio = 
X x f
n
i i−∑ . , onde
Dmédio: Desvio médio absoluto;
Xi: Ponto médio de cada classe;
x : Média da distribuição de 
frequência;
fi : Frequência absoluta;
n: Total de observações.
Em nosso exemplo, temos, então:
74
Unidade II
Re
vi
sã
o:
 A
nd
ré
ia
 G
om
es
 -
 D
ia
gr
am
aç
ão
: L
éo
 -
 0
1/
08
/2
01
2
Tabela 20
Classes fi fi, A fi, R Xi fi, Xi Xi - x |Xi - x|.fi
20 |- 22 5 5 0,05 21 105 -7,72 38,6
22 |- 24 12 17 0,12 23 276 -5,7268,64
24 |- 26 11 28 0,11 25 275 -3,72 40,92
26 |- 28 16 44 0,16 27 432 -1,72 27,52
28 |- 30 20 64 0,20 29 580 0,28 5,6
30 |- 32 14 78 0,14 31 434 2,28 31,92
32 |- 34 8 86 0,08 33 264 4,28 34,24
34 |- 36 8 94 0,08 35 280 6,28 50,24
36 |- 38 4 98 0,04 37 148 8,28 33,12
38 |- 40 2 100 0,02 39 78 10,28 20,56
∑ 100 1 2872 12,8 351,36
Dmédio = 
X x f
n
i i−∑ .
Dmédio = 
35136
100
3 5136
,
,=
Dmédio = 3,51
Logo, o desvio médio de nossa distribuição de frequência será de 3,51. A média, a diferença da idade 
de cada formando em relação à média aritmética da distribuição das idades, será de 3,51.
6.2.2 Variância
Como vimos no item 3, a variância também é uma medida de dispersão que tem a média como 
ponto de referência.
A variância nos indica o grau de variabilidade de determinada distribuição de frequência com relação 
à sua média aritmética.
Quando se trata de uma distribuição de frequência de dados populacionais, temos:
σ
µ2
2
=
−∑ ( )X f
n
i i , onde
σ2: Variância populacional;
Xi: Ponto médio de cada classe;
µ: Média populacional;
fi: Frequência absoluta simples;
n: Tamanho da população.
75
Re
vi
sã
o:
 A
nd
ré
ia
 G
om
es
 -
 D
ia
gr
am
aç
ão
: L
éo
 -
 0
1/
08
/2
01
2
EstatístIca aplIcada
Para o caso da variância de valores amostrais, devemos usar:
s
X x f
n
i i2
2
1
=
−
−
∑ ( ) , onde
s2: Variância amostral;
Xi: Ponto médio de cada classe;
x : Média aritmética amostral;
fi: Frequência absoluta simples;
n: Total de observações da amostra.
No caso da distribuição de frequência das idades, é preciso acrescentar mais duas colunas à tabela 
para calcular, em nosso exemplo, a variância amostral:
s
X x f
n
i i2
2
1
=
−
−
∑ ( )
Tabela 21
Classes fi fi, A fi, R Xi fi, Xi Xi - x |Xi - x|.fi (Xi - x)
2 (Xi - x)
2fi
20 |- 22 5 5 0,05 21 105 -7,18 -7,72 59,5984 297,992
22 |- 24 12 17 0,12 23 276 -5,18 -5,72 32,7184 392,6208
24 |- 26 11 28 0,11 25 275 -3,18 -3,72 13,8384 152,2224
26 |- 28 16 44 0,16 27 432 -1,18 -1,72 2,9584 47,3344
28 |- 30 20 64 0,20 29 580 0,82 0,28 0,0784 1,568
30 |- 32 14 78 0,14 31 434 2,82 2,28 5,1984 72,7776
32 |- 34 8 86 0,08 33 264 4,82 4,28 18,3184 146,5472
34 |- 36 8 94 0,08 35 280 6,82 6,28 39,4384 315,5072
36 |- 38 4 98 0,04 37 148 8,82 8,28 68,5584 274,2336
38 |- 40 2 100 0,02 39 78 10,82 10,28 105,6784 211,3568
∑ 100 1 2872 12,8 1912,16
Assim, temos:
s2
1912 16
100 1
19 315=
−
=
,
,
Logo, a variância amostral de nosso exemplo é 19,315.
6.2.3 Desvio padrão
Para calcular o desvio padrão, basta extrair a raiz quadrada do valor da variância, seja ela populacional 
ou amostral.
σ σ= 2
76
Unidade II
Re
vi
sã
o:
 A
nd
ré
ia
 G
om
es
 -
 D
ia
gr
am
aç
ão
: L
éo
 -
 0
1/
08
/2
01
2
Já o desvio padrão amostral será dado como segue:
s s= 2
No exemplo acima, o nosso desvio padrão seria então:
s = =19 315 4 395, ,
Lembrando que: em estatística, um histograma é uma representação gráﬁca da distribuição de 
frequências de um conjunto de medições, normalmente um gráﬁco de barras verticais.
O histograma é um gráﬁco composto por retângulos justapostos em que a base de cada um deles 
corresponde ao intervalo de classe, e a sua altura, à respectiva frequência. Quando o número de dados 
aumenta indeﬁnidamente e o intervalo de classe tende a zero, a distribuição de frequência passa para 
uma distribuição de densidade de probabilidades.
A construção de histogramas tem caráter preliminar em qualquer estudo e é um importante indicador 
da distribuição de dados. Tanto podem indicar se uma distribuição aproxima-se de uma função normal 
como de uma mistura de populações, quando se apresentam bimodais.
Informações técnicas sobre como elaborar um histograma, bem como sua interpretação, são 
encontradas em literaturas clássicas de estatística.
Exemplo 1
Uma análise em 34 famílias que tenham quatro ﬁlhos, considerando a variável a quantidade de 
ﬁlhos do sexo masculino, temos a seguinte distribuição:
Tabela 22
Nº de meninos (xi) fi (xi-x) (xi-x)
2 fi(xi-x)
2
0 2 (0 - 2,3) = - 2,3 (- 2,3)2 = 5,29 2(5,29) = 10,58
1 6 (1 - 2,3) = - 1,3 (- 1,3)2 = 1,69 6(1,69) = 10,14
2 10 (2 - 2,3) = - 0,3 (- 0,3)2 = 0,09 10(0,09) = 0,9
3 12 (3 - 2,3) = 0,7 (0,7)2 = 0,49 12(0,49) = 5,88
4 4 (4 - 2,3) = 1,7 (1,7)2 = 2,89 4(2,89) = 11,56
fi∑ = 34 f x xi i∑ = −( ) =2 39 06,
Para reflexão:
Pede-se para calcular a amplitude, o desvio padrão (S), a variância (S2) e o coeﬁciente de variação 
(cv).
77
Re
vi
sã
o:
 A
nd
ré
ia
 G
om
es
 -
 D
ia
gr
am
aç
ão
: L
éo
 -
 0
1/
08
/2
01
2
EstatístIca aplIcada
Solução
Amplitude:
R= 4 – 0 = 4 meninos
Ou seja, podemos dizer que a maior variação encontrada nesse conjunto de dados seria de quatro meninos.
Obs. Sabemos que a média para esse conjunto de dados é x = 2,3 ﬁlhos. Mas como chegamos a essa média?
Quantos ﬁlhos homens estão presentes na distribuição?
1 x 6 + 2 x 10 + 3 x 12 + 4 x 4---------------------------------------------------------------------------------------------------------------------------------- = 2,3
 34
Desvio padrão:
s
f x x
n
f x x f x x f x x
n
i i
i
n
n n
=
−( )
−
=
−( ) + −( ) + + −( )
−
=
=
∑ 2
1 1 1
2
2 2
2 2
1 1
...
2 0 2 3 6 1 2 3 10 2 2 3 12 3 2 3 4 4 2 3
34 1
2 2 2 2 2
−( ) + −( ) + −( ) + −( ) + −( ) +
−
=
, , , , ,
2 2 3 6 13 10 0 3 12 0 7 4 17
33
2 2 2 2 2
−( ) + −( ) + −( ) + ( ) + ( ) +
=
, , , , ,
2 5 29 6 169 10 0 09 12 0 49 4 2 89
33
, , , , ,( ) + ( ) + ( ) + ( ) + ( )
=
10 58 10 14 0 9 5 88 1156
33
39 06
33
, , , , , ,+ + + +
= =
= ≅ ≅11836 1088 1, , filho
Como interpretar essa situação?
Podemos dizer que o número médio de ﬁlhos homens por família de quatro ﬁlhos é de 2,3, com uma 
margem de erro de aproximadamente um ﬁlho. Signiﬁcando que a maior parte das famílias com quatro 
ﬁlhos apresentam:
78
Unidade II
Re
vi
sã
o:
 A
nd
ré
ia
 G
om
es
 -
 D
ia
gr
am
aç
ão
: L
éo
 -
 0
1/
08
/2
01
2
2,3 oscilando 1 para mais ou 1 para menos.
Ou seja:
pode ir de 1,3 a 3,3,
que pode ser traduzido da seguinte maneira:
As famílias com quatro ﬁlhos apresentam aproximadamente entre 1 e 3 ﬁlhos homens.
Variância:
S2 = (S)2 = (1,088)2 ≅ 1,1837 (ﬁlhos homens)2
Coeﬁciente de variação:
cv
S
x
= = ≅
1088
2 3
0 4730
,
,
,
O que isso signiﬁca?
Signiﬁca que existe uma variabilidade nos dados de 47,30% em relação à média, podendo ser 
considerada uma alta variabilidade.
Exemplo 2
A JCC – fábrica de peças e rolamentos – apresenta a seguinte distribuição de frequência referente 
aos salários dos seus funcionários:
Tabela 23
Custos R$
Classes de fr. Pm (Xi) fi (xi - x) (xi - x)
2 fi(xi - x)
2
450 |— 550 500 8 (500-754,68) = - 254,68 (-254,68)2 = 64861,90 8(64861,90) = 518895,2
550 |— 650 600 10 (600-754,68) = - 154,68 (-154,68)2 = 23925,90 10(23925,90) = 239259,0
650 |— 750 700 11 (700-754,68) = - 54,68 (-54,68)2 = 2989,90 11(2989,90) = 32888,9
750 |— 850 800 16 (800-754,68) = 45,32 (45,32)2 = 2053,90 16(2053,90) = 32862,4
850 |— 950 900 13 (900-754,68) = 145,32 (145,32)2 = 21117,90 13(21117,90) = 274532,7
950 |— 1050 1000 5 (1000-754,68) = 245,32 (245,32)2 = 60181,90 5(60181,90) = 300909,5
1050 |— 1150 1100 1 (1100-754,68) = 345,32 (345,32)2 = 119245,90 1(119245,90) = 119245,9
Total 64 f x xi i −( )∑ 2 =1518593,6
79
Re
vi
sã
o:
 A
nd
ré
ia
 G
om
es
 -
 D
ia
gr
am
aç
ão
: L
éo
 -
 0
1/
08
/2
01
2
EstatístIca aplIcadaPara reflexão:
•	 calcule a amplitude;
•	 o desvio padrão (S);
•	 a variância (S2);
•	 e o coeﬁciente de variação (cv).
Solução
Amplitude:
R= 1150 – 450 = 700
Como analisar:
Observe que a maior diferença existente entre os salários dos operários dessa fábrica é de R$ 700,00, 
conforme calculamos.
Observação: como se chegou à média x = 754,69
500 * 8 + 600 * 10 + 700 * 11 + 800 * 16 + 900*13 + 1.000*5 + 1100 * 1/64
4.00 + 6.000 + 7.700 + 12.800 + 11.700 + 5.000 + 1100/64
48.330/64 = 754,68.
Desvio padrão:
s
f x x
n
f x x f x x f x x
n
i i
i
n
n n
=
−( )
−
=
−( ) + −( ) + + −( )
−
=
=
∑ 2
1 1 1
2
2 2
2 2
1 1
...
=
−( ) + −( ) + −( ) + −8 500 754 68 10 600 754 68 11 700 754 68 16 800 7542 2 2, , , ,668 13 900 754 68 5 1000 754 68 1 1100 754 68
64 1
2 2 2 2( ) + −( ) + −( ) + −( )
−
, , ,
==
=
−( ) + −( ) + −( ) + ( ) + (8 254 68 10 154 68 11 54 68 16 45 32 13 145 322 2 2 2, , , , , )) + ( ) + ( )
=
2 2 25 245 32 1 345 32
63
, ,
=
( ) + ( ) + ( ) + ( ) +8 6486190 10 23925 90 11 2989 90 16 2053 90 13 21227, , , , ,990 5 6018190 1 119245 90
63
( ) + ( ) + ( )
=
, ,
80
Unidade II
Re
vi
sã
o:
 A
nd
ré
ia
 G
om
es
 -
 D
ia
gr
am
aç
ão
: L
éo
 -
 0
1/
08
/2
01
2
=
+ + + + + +518895 2 239259 0 32888 90 32862 40 274532 70 300909 5 11, , , , , , 99245 90
63
1518593 60
63
24104 66 155 26
, ,
, , ( )≅ ≅ ≅ reais
Como analisar?
A média de salários da fábrica é R$ 754,68, podendo variar aproximadamente R$ 155,26, ou seja, a 
maior parte dos operários recebe entre R$ 599,42 e R$ 909,94.
(754,68 – 155,26 = 599,42)
(754,68 + 155,26 = 909,94)
Variância:
S2 = (S)2 = (155,26)2 ≅ 24104,66 (reais)2
Coeﬁciente de variação:
cv
S
x
= = ≅
155 26
754 68
0 2057
,
,
,
Isso signiﬁca que há uma variabilidade de 20,57% dos salários em relação à média.
 Saiba mais
Os artigos “Caracterização de perdas comerciais – uma ferramenta 
de gestão de recuperação de receitas” e “Gerenciando incertezas no 
planejamento logístico: o papel do estoque de segurança” fazem uma 
abordagem detalhada da aplicação das medidas de dispersão. Eles estão 
disponíveis, no formato PDF, nos endereços: <ftp://labattmot.ele.ita.br/ele/
jrsantos/Leitura/Fraude_Energia_Eletrica/CITENEL2005_72.pdf> e <http://
tfscomunicacao.com.br/imgs/sala_estudo/273_arquivo.pdf>.
7 INTRODUÇÃO À PROBABILIDADE
Quando estudamos algum fenômeno pelo método estatístico, na maioria das vezes é preciso 
estabelecer uma distinção entre o modelo matemático que construímos para tentar explicar tal 
fenômeno e o fenômeno em si.
A maioria dos fatos estudados pela estatística apresenta resultados de difícil previsibilidade, dados 
que variam de uma observação para outra, mesmo em condições normais de experimentação. Para 
analisar, interpretar e explicar tais fenômenos é preciso utilizar a probabilidade.
81
Re
vi
sã
o:
 A
nd
ré
ia
 G
om
es
 -
 D
ia
gr
am
aç
ão
: L
éo
 -
 0
1/
08
/2
01
2
EstatístIca aplIcada
A palavra “probabilidade” deriva do latim probare (provar ou testar). Informalmente, “provável” é 
uma das muitas palavras utilizadas para eventos incertos ou conhecidos, sendo também substituída por 
algumas palavras como “sorte”, “risco”, “azar”, “incerteza”, “duvidoso”, dependendo do contexto.
Tal como ocorre com a teoria da mecânica, que atribui deﬁnições precisas a termos de uso diário, 
como “trabalho” e “força”, também a teoria das probabilidades tenta quantiﬁcar a noção de provável.
A probabilidade é uma técnica estatística utilizada para expressar a chance de ocorrência de 
determinado evento. O evento é o resultado que se espera de determinado experimento. Ele pode ser 
cara (no caso do lançamento de uma moeda), um número compreendido de 1 a 6 (no caso do lançamento 
de um dado), chuva (no caso da observação do tempo) etc.
A probabilidade de ocorrer determinado evento será sempre um número entre 0 e 1, indicando 
aproximadamente a chance de ocorrência desse mesmo evento. Quanto mais próxima de 1, maior é a 
probabilidade de ocorrer esse evento; quanto mais próxima de zero, menor a chance de o evento ocorrer. 
Quando a probabilidade de determinado evento é zero, diz-se que esse é um evento impossível. Sendo 
assim, temos:
0 ≤ P (A) ≤ 1
7.1 Teorias dos conjuntos, espaço amostral e eventos
Um conjunto é deﬁnido como um grupo de objetos ou itens que apresentam características comuns. 
São exemplos de conjuntos os habitantes de São Paulo, os estudantes de Gestão da UNIP, o número de 
consoantes do alfabeto, o número de vogais do alfabeto etc.
 Saiba mais
A teoria de conjuntos pode ser estudada em detalhes em livros 
básicos de matemática, como em MENEZES, P. B. Matemática discreta 
para computação e informática. Porto Alegre: Instituto de Informática da 
UFRGS: Sagra Luzzato, 2004. (Série Livros Didáticos – nº 16).
Podemos descrever os elementos de um conjunto de três formas: enumerando cada um deles entre 
chaves, indicando suas características comuns, também entre chaves.
Conjunto A = {a, e, i, o, u} ou
Conjunto A = {conjunto das vogais do alfabeto};
Conjunto B = {todos os números inteiros maiores que 23}.
82
Unidade II
Re
vi
sã
o:
 A
nd
ré
ia
 G
om
es
 -
 D
ia
gr
am
aç
ão
: L
éo
 -
 0
1/
08
/2
01
2
Em um conjunto ﬁnito, podemos identiﬁcar todos os seus subconjuntos. O número de subconjuntos 
de um conjunto ﬁnito será obtido por meio da seguinte fórmula:
Nsubconjuntos = 2
n, em que n = número de elementos do conjunto.
Por exemplo, num conjunto como o dado a seguir, calcule a quantidade de subconjuntos e faça a 
sua apresentação:
A = {2, 4, 6, 8}
A quantidade de subconjuntos de A será:
Nsubconjuntos = 2
n = 24 = 16
Os subconjuntos do conjunto A serão, portanto:
A = {{2}, {4}, {6}, {8}, {2,4}, {2,6}, {2,8}, {4,6}, {4,8}, {6,8}, {2,4,6}, {2,6,8}, {2,4,8}, {4,6,8}, {2,4,6,8}}
Ora, se trazemos esses conceitos para a probabilidade, podemos deﬁnir então o que seria espaço 
amostral e evento. Na teoria das probabilidades, temos o chamado experimento, uma experiência que 
poderá ser repetida sob as mesmas condições indeﬁnidamente.
Para cada experimento, existe um conjunto S formado por todos os possíveis resultados desse 
experimento. Esse conjunto é denominado de espaço amostral.
Por exemplo, ao lançar um dado e observar o número da face que ﬁca para cima, teríamos o seguinte 
conjunto de resultados possíveis desse experimento e, portanto, o seguinte espaço amostral:
S = Ω = {1, 2, 3, 4, 5, 6}, em que Ω é o espaço amostral.
O espaço amostral poderá ser representado pela letra ômega. Sendo o espaço amostral o conjunto 
de todos os resultados possíveis de uma dada experiência, a probabilidade do espaço amostral deverá 
ser igual a 1 ou 100%, pois ao menos um dos resultados deve ocorrer.
P (evento qualquer espaço amostral Ω) = 1,00
Os eventos são os resultados de um experimento. No caso do exemplo, de lançar um dado, seriam 
exemplos de eventos:
A: ocorrer face igual a 6;
B: ocorrer face igual a 5.
83
Re
vi
sã
o:
 A
nd
ré
ia
 G
om
es
 -
 D
ia
gr
am
aç
ão
: L
éo
 -
 0
1/
08
/2
01
2
EstatístIca aplIcada
O evento é geralmente simbolizado por meio de uma letra maiúscula.
Poderíamos simbolizar graﬁcamente o espaço amostral e o evento por meio do diagrama de Venn, 
para que possamos visualizar melhor a diferença entre esses dois importantes conceitos da Teoria das 
Probabilidades.
Evento
Espaço amostral
Figura 24
O que signiﬁca, então, a ﬁgura anterior? Para entendermos melhor, vamos relembrar algumas 
relações que se estabelecem entre dois ou mais conjuntos e que tipo de classiﬁcaçãodidática isso gera, 
para entender as implicações que podem ocorrer para a teoria das probabilidades.
Dois ou mais conjuntos que não possuam elementos em comum são chamados conjuntos disjuntos. 
Por exemplo, sejam os conjuntos a seguir:
A = {3, 5, 7} e B = {9, 11} são dois conjuntos que claramente não apresentam nenhum elemento 
em comum e podem ser representados pelo diagrama de Venn, como segue:
A
3
7
5 9 11
B
Figura 25
Como A e B não possuem elementos em comum, o resultado da união desses conjuntos irá gerar um 
novo conjunto cujo número de elementos será dado pela soma dos elementos de A e dos elementos de 
B. Temos, então:
n(A ∪ B) = n(A) + n(B)
n(A ∪ B) = 5
Se dois ou mais conjuntos apresentam elementos em comum, teremos o caso de conjuntos não 
disjuntos. Nesse caso, o número de elementos da união dos dois conjuntos será dado pela soma dos 
elementos de cada conjunto, subtraindo-se os elementos que estes possuem em comum.
A = {2, 4, 6, 8, 10} e B = {8, 10, 12}
n(A ∪ B) = n(A) + n(B) - n(A ∩ B);
n(A ∪ B) = 5 + 3 – 2 = 6
Podemos veriﬁcar esse resultado comparando-o ao diagrama de Venn, que irá apresentar claramente 
os elementos da união dos dois conjuntos A e B.
84
Unidade II
Re
vi
sã
o:
 A
nd
ré
ia
 G
om
es
 -
 D
ia
gr
am
aç
ão
: L
éo
 -
 0
1/
08
/2
01
2
A
2
4
6
8
10
B
12
Figura 26
Esses conceitos de conjuntos são importantes porque nos permitem, por exemplo, deﬁnir novos 
eventos utilizando essas operações de união e interseção. Assim:
a) (A ∪ B) → quando A ocorre, ou B ocorre, ou ambos ocorrem, temos este evento;
b) (A ∩ B) → evento só ocorre se A e B ocorrerem simultaneamente.
A → evento quando A não ocorre.
A partir disso, podemos deﬁnir os eventos como complementares, mutuamente exclusivos, não 
mutuamente exclusivos e coletivamente exaustivos.
Diz-se que dois eventos são complementares quando completam determinado espaço amostral. 
É importante ressaltar que os eventos complementares não devem apresentar elementos em comum. 
A soma das probabilidades de eventos complementares é sempre igual a 1. Podemos representar dois 
eventos complementares com o diagrama que segue:
A
A’
Figura 27
Por exemplo: podemos considerar como eventos complementares ocorrer cara ou coroa no 
lançamento de uma moeda; atender ou não à porta. O espaço amostral dos dois experimentos, 
respectivamente, será:
Ω = {cara, coroa}
Em que:
A: ocorrer cara;
B: ocorrer coroa.
Ω2 = {atender, não atender}
85
Re
vi
sã
o:
 A
nd
ré
ia
 G
om
es
 -
 D
ia
gr
am
aç
ão
: L
éo
 -
 0
1/
08
/2
01
2
EstatístIca aplIcada
Em que:
C: atender à porta;
D: não atender à porta.
Em ambos os experimentos, podemos observar que a soma das probabilidades será igual a 1, porque 
os eventos completam o espaço amostral. Assim, no caso dos dois exemplos anteriores, teremos:
P A( ) =
1
2
P B P A P B( ) ( ) ( )= ⇒ + =
1
2
1
P C( ) =
1
2
P D P C P D( ) ( ) ( )= ⇒ + =
1
2
1
Dois ou mais eventos que não possuem elementos comuns, ou que não podem ocorrer simultaneamente, 
são ditos eventos mutuamente excludentes. Diferentemente dos eventos complementares, eles não 
necessariamente completam o espaço amostral. Sendo assim, podemos dizer que todos os eventos 
complementares são mutuamente exclusivos, mas nem todos os eventos mutuamente exclusivos são 
complementares. Também é importante ressaltar que, na teoria dos conjuntos, os eventos mutuamente 
exclusivos são os chamados conjuntos disjuntos.
Isso signiﬁca que:
(A ∩ B) = ø
Para ilustrar graﬁcamente dois eventos mutuamente exclusivos, podemos mais uma vez nos valer 
de um diagrama de Venn.
Ω: Espaço amostral
A B
Figura 28
Por exemplo: no lançamento de um dado, ocorrer as faces 1, 2, 3, 4, 5, 6. São seis eventos mutuamente 
excludentes, já que dois não podem ocorrer simultaneamente, então a ocorrência de um exclui a 
ocorrência do outro. Se restringirmos esse experimento a apenas duas faces, teremos:
86
Unidade II
Re
vi
sã
o:
 A
nd
ré
ia
 G
om
es
 -
 D
ia
gr
am
aç
ão
: L
éo
 -
 0
1/
08
/2
01
2
Experimento: lançamento de um dado
Ω = {1, 2, 3, 4, 5, 6}; (espaço amostral)
A: ocorrer a face 2;
B: ocorrer a face 4.
Temos aqui dois eventos mutuamente exclusivos e que não são complementares.
Quando dois eventos apresentam elementos em comum ou podem ocorrer simultaneamente, diz-se 
que eles são eventos não mutuamente excludentes. Esses eventos podem ser representados por meio de 
um diagrama de Venn, como segue:
Ω : Espaço amostral
A B
Figura 29
Podemos nos valer da distribuição de frequências do item 4 para dar exemplo de dois eventos que 
sejam não mutuamente excludentes. Vejamos, então, a distribuição de frequência das idades dos alunos 
formandos do curso de Gestão de uma Universidade AB:
Tabela 24 – Distribuição de frequência das idades
Classes Frequência absoluta simples
20 |- 22 5
22 |- 24 12
24 |- 26 11
26 |- 28 16
28 |- 30 20
30 |- 32 14
32 |- 34 8
34 |- 36 8
36 |- 38 4
38 |- 40 2
∑ 100
Tomando-se a distribuição de frequência acima, podemos dar exemplo de dois eventos não 
mutuamente exclusivos:
87
Re
vi
sã
o:
 A
nd
ré
ia
 G
om
es
 -
 D
ia
gr
am
aç
ão
: L
éo
 -
 0
1/
08
/2
01
2
EstatístIca aplIcada
A: apresentar idade entre 20 e 26 anos no momento da formatura;
B: apresentar idade entre 22 e 30 anos no momento da formatura.
Como entre esses dois eventos existem elementos em comum, ou seja, os intervalos de 22 a 26 
anos, eles não são mutuamente excludentes. É importante ressaltar que os eventos não mutuamente 
exclusivos, na teoria dos conjuntos, são os conjuntos não disjuntos.
Os eventos podem ser ainda coletivamente exaustivos. Isso ocorre quando os eventos em questão 
ocuparem todo o espaço amostral, tornando impossível qualquer outro resultado além daqueles eventos 
dados. São considerados eventos coletivamente exaustivos os eventos complementares, mas nem sempre 
os eventos coletivamente exaustivos serão complementares. Além disso, os eventos coletivamente 
exaustivos serão, em alguns casos, mutuamente excludentes.
Podemos, então, representar graﬁcamente eventos coletivamente exaustivos com o diagrama a seguir:
Ω: Espaço amostral
A B C
Assim, são exemplos de eventos coletivamente exaustivos, no caso de um experimento de lançar 
uma moeda:
A: ocorrer cara;
B: ocorrer coroa.
Outro exemplo seria ao se fazer a experiência de retirar cartas de um baralho, deﬁnir como eventos:
A: carta de copas;
B: carta de paus;
C: carta de ouros;
D: carta de espadas.
Temos anteriormente dois exemplos de eventos coletivamente exaustivos.
Mayer (2000) diz que, em teoria das probabilidades, o espaço amostral ou espaço amostral universal, 
geralmente denotado S, Ω ou U (de “universo”), de um experimento ou teste aleatório é o conjunto 
de todos os resultados possíveis. Por exemplo, se o experimento é lançar uma moeda e veriﬁcar a face 
voltada para cima, o espaço amostral é o conjunto {cara, coroa}. Para o lançamento de um dado de seis 
faces, o espaço amostral é {1, 2, 3, 4, 5, 6}. Qualquer subconjunto de um espaço amostral é comumente 
chamado um evento, enquanto o subconjunto de um espaço amostral contendo apenas um único 
elemento é chamado eventos elementares.
88
Unidade II
Re
vi
sã
o:
 A
nd
ré
ia
 G
om
es
 -
 D
ia
gr
am
aç
ão
: L
éo
 -
 0
1/
08
/2
01
2
Para alguns tipos de experimentos, podem existir dois ou mais espaços amostrais possíveis plausíveis. 
Por exemplo, quando retirada uma carta de um baralho de 52 cartas, uma possibilidade poderia ser o 
valor dela(Ás até o Rei), enquanto outra poderia ser o naipe (copa, ouro, espada ou paus). Uma descrição 
completa dos resultados, entretanto, especiﬁca ambas: denominação e naipe, e um espaço amostral 
descrevendo cada carta individualmente pode ser construído por meio do produto cartesiano dos dois 
espaços amostrais citados.
Espaços amostrais aparecem naturalmente em uma introdução elementar à probabilidade, mas são 
também importantes em espaços de probabilidade. Um espaço de probabilidade (Ω, F, P) incorpora um 
espaço amostral de resultados, Ω, mas deﬁne um conjunto de eventos de interesse, o - álgebra F, para o 
qual a medida de probabilidade P é deﬁnida.
Vamos a alguns exemplos:
Exemplo 1
Vamos imaginar um grupo de 100 pessoas. Dessas, 70 apresentam sangue RH positivo e 45, 
tipo O. Escolhendo-se, ao acaso, uma pessoa desse grupo, qual é a probabilidade de o sangue dessa 
pessoa escolhida ser de tipo diferente de O?
Solução
Total do grupo: 100 pessoas
RH positivo: 70 pessoas
Tipo O = 45 pessoas
Vamos considerar x o número de pessoas que têm sangue RH positivo e também sangue tipo O. 
Representando os conjuntos por meios de diagramas de Euler-Venn, temos:
70 - x + x + 45 - x = 100.
RH+
70 - x 45 - xx
0
Figura 30
Assim, temos:
70 + 45 - x = 100.
Então, x = 115 - 100 = 15.
89
Re
vi
sã
o:
 A
nd
ré
ia
 G
om
es
 -
 D
ia
gr
am
aç
ão
: L
éo
 -
 0
1/
08
/2
01
2
EstatístIca aplIcada
Então, o número de pessoas que têm sangue do tipo diferente de O será:
70 - 15 = 55.
Podemos dizer que, num total de 100 pessoas, temos 55 possibilidades (chances) de escolha.
Então, podemos dizer que a probabilidade de o sangue dessa pessoa ser de tipo diferente de O é 
55/100 = 55%.
De outra maneira, mais rápida: como 45 têm sangue tipo O; então, o número de pessoas que têm 
sangue do tipo diferente de O é:
100 - 45 = 55.
Exemplo 2
Maria vai sair com suas amigas e, para escolher a roupa que usará, separou duas saias e quatro 
blusas. De quantas maneiras ela pode se arrumar?
Solução
O chamado Princípio Fundamental da Contagem (PFC) diz: “se alguma escolha pode ser feita de M 
diferentes maneiras e alguma escolha subsequente pode ser feita de N diferentes maneiras, há MxN 
diferentes maneiras pelas quais essas escolhas podem ser feitas sucessivamente”. Observe a tabela a 
seguir:
Tabela 25
Blusa 1 Blusa 2 Blusa 3 Blusa 4
Saia 1 Saia 1 e blusa 1 Saia 1 e blusa 2 Saia 1 e blusa 3 Saia 1 e blusa 4
Saia 2 Saia 2 e blusa 1 Saia 2 e blusa 2 Saia 2 e blusa 3 Saia 2 e blusa 4
Contando as possibilidades, vemos que Maria pode se arrumar de oito maneiras distintas. De fato, 
a ação é constituída de duas etapas sucessivas. A primeira (vestir a saia) pode ser realizada de duas 
maneiras distintas. Para cada uma dessas possibilidades, a segunda (vestir a blusa) pode ser realizada de 
quatro maneiras distintas. Assim, pelo Princípio Fundamental da Contagem, o número de efetuar a ação 
completa é 2 × 4 = 8.
Exemplo 3
Há quatro estradas ligando as cidades A e B, e três estradas ligando as cidades B e C. De quantas 
formas distintas pode-se ir de A a C, passando por B?
90
Unidade II
Re
vi
sã
o:
 A
nd
ré
ia
 G
om
es
 -
 D
ia
gr
am
aç
ão
: L
éo
 -
 0
1/
08
/2
01
2
Solução
A ação é realizada em duas etapas sucessivas. A primeira (ir de A até B) pode ser realizada de três 
maneiras. Para cada uma dessas possibilidades, a segunda (ir de B até C) pode ser realizada de quatro 
maneiras. Então, pelo PFC, o número de maneiras de ir de A até C é: 3 × 4 = 12.
Exemplo 4
Uma prova de Estatística tem dez questões do tipo C ou E. Caso todas as questões sejam respondidas 
ao acaso, qual o número de formas de preencher o cartão de resposta?
Solução
O PFC é também conhecido como princípio multiplicativo e pode ser generalizado para ações 
constituídas de mais de duas etapas sucessivas.
 Observação
Para determinar o nº total de elementos do espaço amostral, usamos o 
raciocínio:
K x K x K x K x K x K…K; portanto, podemos resumir assim:
R vezes _______________________ n(S) = kn
K à número de possibilidades de ocorrência do experimento.
R à número de vezes que se repete o experimento.
Como as probabilidades de ocorrência do experimento são duas, certo ou errado, basta elevarmos 
ao número de vezes que o experimento se repete. Assim, o resultado procurado é: 2 × 2 × 2 × 2 × 2 × 
2 × 2 × 2 × 2 × 2 = 210 = 1024.
Exemplo 5
De quantas maneiras podemos arrumar cinco pessoas em ﬁla indiana?
Solução
Ao selecionarmos uma das pessoas para ocupar a primeira posição na ﬁla, temos cinco possibilidades; 
para o segundo lugar, temos quatro escolhas; para o terceiro lugar, sobram três pessoas a serem 
selecionadas; para o quarto lugar, duas; e, para o último lugar na ﬁla, sobra apenas uma pessoa ainda 
não escolhida.
91
Re
vi
sã
o:
 A
nd
ré
ia
 G
om
es
 -
 D
ia
gr
am
aç
ão
: L
éo
 -
 0
1/
08
/2
01
2
EstatístIca aplIcada
Então, pelo Princípio Fundamental da Contagem, temos: 5 × 4 × 3 × 2 × 1 = 120. Assim, obtemos o 
número de formas de ordenar (“embaralhar”) cinco elementos distintos. Ou, ainda, podemos calcular o 
número de permutações simples de cinco elementos, ou seja, P5 = 120.
Exemplo 6
Ao lançarmos dois dados, a probabilidade de obtermos resultados cuja soma é sete é:
Tabela 26
1+1 1+2 1+3 1+4 1+5 1+6
2+1 2+2 2+3 2+4 2+5 2+6
3+1 3+2 3+3 3+4 3+5 3+6
4+1 4+2 4+3 4+4 4+5 4+6
5+1 5+2 5+3 5+4 5+5 5+6
6+1 6+2 6+3 6+4 6+5 6+6
Solução
Para cada dado lançado ao acaso, temos seis possibilidades de resultado. Então, pelo PFC, o número 
de elementos do meu espaço amostral é 6 × 6 = 36. Como pode ser observado na tabela 25, o nº de casos 
favoráveis é o nº de elementos dos conjuntos de pares ordenados {(1,6), (2,5), (3,4), (4,3), (5,2), (6,1)}, ou 
seja, é seis. Assim, a probabilidade é P = 6/36 = 1/6.
8 PROBABILIDADE: ORIGEM, MÉTODOS E PRINCIPAIS TEOREMAS
Como vimos, a probabilidade é uma técnica estatística utilizada para expressar a chance de ocorrência 
de determinado evento.
A forma clássica de calcular a probabilidade é por meio da relação entre o número de casos favoráveis 
e o número de casos possíveis. Os casos favoráveis são aqueles resultados que se espera que aconteçam; 
já os casos possíveis são todos os elementos que compõem o espaço amostral.
Logo, em determinado espaço amostral Ω, a probabilidade de um dado evento A, P(A), será uma 
função deﬁnida em Ω, em que cada evento estará associado a um número real, e assim irá satisfazer 
aos axiomas a seguir.
 Observação
I) 0 ≤ P ≤ 1 à A probabilidade está sempre no intervalo fechado 0 e 1 
ou 0% ou 100%.
92
Unidade II
Re
vi
sã
o:
 A
nd
ré
ia
 G
om
es
 -
 D
ia
gr
am
aç
ão
: L
éo
 -
 0
1/
08
/2
01
2
II) P(Ω) = 1 à Para todo evento certo, temos P(Ω) = 1 ou 100%.
III) Se A e B forem eventos mutuamente exclusivos, (A ∩ B) = ø, então 
P(A ∪ B) = P(A) + P(B).
8.1 Origens da probabilidade
Na realidade, existem três modos diferentes de calcular ou estimar as probabilidades. São eles os 
métodos clássico, empírico e subjetivo, sendo que os métodos clássicos e empíricos são considerados 
métodos objetivos.
8.1.1 Métodos objetivos
•	 Método clássico
Quando estamos diante de experimentos que têm resultados igualmente prováveis, aplica-se o 
chamado método clássico. Nesse caso, a probabilidade de ocorrer cada evento (resultado) é uma função 
do número de resultados possíveis.
 1Pevento = ------------------------------------------------------------------ Número de resultados possíveis
Por exemplo, no experimento em que lançamos um dado ocorrer qualquer das faces nesselançamento 
é igualmente provável. Então, qual seria a probabilidade de ocorrer qualquer dessas faces?
 1Pqualquer face = ------------------------------------- Número de faces
 1Pqualquer face = ---- 6
Aplicando-se o método clássico a experimentos que envolvam dois ou mais resultados associados, 
com igual probabilidade de ocorrência desses resultados, terão a deﬁnição clássica de probabilidade que 
demos no início deste item, em que a probabilidade será:
 Resultados favoráveisP = ----------------------------------------------- 
 Resultados possíveis
Veriﬁque e compreenda: favoráveis/possíveis!
Por exemplo, a probabilidade de obter quatro ases num baralho de 52 cartas. Nesse caso, temos de 
identiﬁcar o número de resultados favoráveis, ou seja, aqueles resultados esperados. No caso, são quatro 
resultados favoráveis, dentro de quatro resultados possíveis; então, temos:
93
Re
vi
sã
o:
 A
nd
ré
ia
 G
om
es
 -
 D
ia
gr
am
aç
ão
: L
éo
 -
 0
1/
08
/2
01
2
EstatístIca aplIcada
 4P = -------- = 0,0769 = 7,6%
 52
Isso signiﬁca que, se houver uma repetição signiﬁcativa desse experimento, ou seja, de se retirar 
quatro ases de um baralho de 52 cartas, um evento como esse tem probabilidade de ocorrer 7,6% das 
vezes.
Chance
Existe uma maneira diferente de se exprimirem as probabilidades: em vez de se comparar o número 
de casos favoráveis ao número de casos possíveis, compara-se o número de resultados favoráveis ao 
número de casos desfavoráveis. Isso pode ser expresso das duas formas a seguir:
 Número de resultados favoráveisChance = ------------------------------------------------------------------------- ou
 Número de resultados desfavoráveis
Chance = número de resultados favoráveis está para número de resultados desfavoráveis.
Por exemplo, numa sala de aula, temos um total de 50 alunos, 22 homens e 28 mulheres. Quais 
seriam, então, a probabilidade e a chance a favor de se selecionar, aleatoriamente, dessa sala uma 
mulher?
Probabilidade:
ε: Retirar pessoas de uma sala de aula
Ω: 22 homens e 28 mulheres
Evento A: selecionar uma mulher
P A P A( ) =
+
= ⇒ ( ) = =28
22 28
28
50
0 56 56, %
A probabilidade de se retirar uma mulher é, portanto, de 56%.
Chance
Evento A: selecionar uma mulher
 Nº de casos favoráveis 28 14Chance = ------------------------------------------------- = -------------- = -------------- ou 40/11
 Casos desfavoráveis 22 11
As chances de retirar uma mulher da sala são, portanto, de 14 para 11.
94
Unidade II
Re
vi
sã
o:
 A
nd
ré
ia
 G
om
es
 -
 D
ia
gr
am
aç
ão
: L
éo
 -
 0
1/
08
/2
01
2
•	 Método empírico ou frequencial
Quando tratamos de situações em que os resultados não são igualmente prováveis, podemos tentar 
estimar as probabilidades, obtendo alguns dados empíricos. Uma estimativa das probabilidades baseada 
justamente nesses dados empíricos é que será obtida por meio de experimentos aleatórios ou por meio 
de dados históricos. É importante ressaltar que, neste caso, a probabilidade será uma estimativa do 
verdadeiro valor.
Por exemplo, se tivermos um experimento em que lançamos um dado 100 vezes, se dessas 100 
vezes obtivermos a face quatro 40 vezes, num próximo lançamento do dado seria razoável supor que a 
probabilidade estimada futura da face quatro como sendo P 4
40
100
40( ) = = % , se esse experimento se 
der a condições idênticas.
Da mesma maneira, quando é testada uma vacina em um grupo de 1000 pessoas, por exemplo, e 
esta apresenta sucesso em 700 delas, se o teste é repetido, devemos esperar uma probabilidade estimada 
de sucesso futuro da vacina P s( ) = = =700
1000
7
10
70% , sob condições idênticas para a ocorrência desse 
resultado. Sendo assim, podemos calcular a estimativa da probabilidade de um evento futuro baseado 
no método empírico por meio da seguinte fórmula:
 Número de ocorrências de AP(A) = ------------------------------------------------------------ 
 Número total de observações
Se, por outro lado, em vez da possibilidade de obter os dados amostrais por meio da realização de um 
experimento, dispusermos de dados históricos em uma distribuição de frequência, ou na forma de dados 
publicados, ou como resultado de testes prévios, ou como informações que foram acumuladas em algum 
arquivo importante, podemos também calcular a probabilidade estimada pelo método frequencial. Mas, 
para isso, é preciso que partamos da premissa de que o passado é representativo do futuro.
Por exemplo, suponhamos que uma distribuidora de chocolates acompanha suas vendas durante 
noventa dias. O objetivo dessa distribuidora seria projetar as vendas para o futuro, a ﬁm de planejar seus 
estoques. Desse acompanhamento, resultou a distribuição de frequência a seguir:
Tabela 27
Número de chocolates vendidos, em Kg.
Período de 90 dias
Quilos vendidos Número de dias
20 10
30 20
40 20
50 30
60 10
Total 90
95
Re
vi
sã
o:
 A
nd
ré
ia
 G
om
es
 -
 D
ia
gr
am
aç
ão
: L
éo
 -
 0
1/
08
/2
01
2
EstatístIca aplIcada
Nesse caso, também podemos adotar o método empírico, procurando determinar qual o percentual 
de vezes em que ocorreu tal evento. Por exemplo, em vinte dias, o distribuidor de chocolates vendeu 40 
quilos de chocolate, dos 90 dias totais de nossa observação. Então, a estimativa de probabilidade dessa 
ocorrência é P 40
20
90
2
9
( ) = = .
A probabilidade é, portanto, a partir do método empírico, uma proporção da ocorrência de 
um evento ou a frequência relativa do evento. Assim, para as demais classes, as probabilidades 
serão dadas como na tabela a seguir, da distribuição de frequências, utilizando agora a seguinte 
fórmula:
P A
f
f
A
A
( ) = ∑ , onde
P (A): Probabilidade de ocorrer o evento A;
fA: Frequência absoluta do evento A;
∑fA: Total de observações.
Tabela 28
Quilos vendidos Número de dias(ƒA)
Probabilidade
f
f
A
A∑
20 10 1 9
30 20 2 9
40 20 2 9
50 30 1 3
50 10 1 9
Total 90
É importante ressaltarmos algumas observações quando utilizamos o método empírico para calcular 
a probabilidade.
I. Quando se calcula a probabilidade a partir do método empírico, obtemos apenas uma 
estimativa do verdadeiro valor da probabilidade. Não temos dados suficientes para determinar seu 
valor exato.
II. O tamanho da amostra é fundamental para determinar a estimativa da probabilidade. Quanto 
maior o número de observações e, portanto, a amostra, melhor a estimativa da probabilidade.
III. A probabilidade só é válida para um conjunto de condições idênticas àquelas geradoras dos dados 
amostrais.
96
Unidade II
Re
vi
sã
o:
 A
nd
ré
ia
 G
om
es
 -
 D
ia
gr
am
aç
ão
: L
éo
 -
 0
1/
08
/2
01
2
8.1.2 Método subjetivo
Nos itens anteriores, propusemo-nos a calcular probabilidades que se originavam de fatos, fosse 
por meio do método clássico ou do empírico. No entanto, ao longo do estudo da estatística, surgiram 
diversas situações em que os eventos não eram nem passíveis de um estudo objetivo e muito menos 
igualmente prováveis. Nesse caso, então, faz-se necessário atribuir-se subjetivamente uma probabilidade. 
Por exemplo:
à Você encontrará o amor da sua vida amanhã?
à Quando os operários do metrô farão nova greve?
à Uma mulher com câncer de mama se recuperará completamente?
Nesses casos, mesmo que não seja possível efetuar o experimento, pode-se imaginar um grande 
número de situações idênticas