Buscar

probabilidade_2o_sem_-_parte_1

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 76 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 76 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 76 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

1 
 
 2 
1. Modelos Discretos de Distribuições de Probabilidades 
 
1.1. Lei binomial da probabilidade - Ensaios de Bernoulli 
 
Consideremos um experimento que consiste em uma seqüência de ensaios ou 
tentativas independentes, isto é, ensaios nos quais a probabilidade de um 
resultado em cada ensaio não depende dos resultados ocorridos nos ensaios 
anteriores, nem dos resultados nos ensaios posteriores. Em cada ensaio, podem 
ocorrer apenas dois resultados, um deles que chamaremos de sucesso (S) e 
outro que chamaremos de fracasso (F). À probabilidade de ocorrer sucesso em 
cada ensaio chamaremos de p; a probabilidade de fracasso chamaremos de q, 
de tal modo que q=1–p . Tal tipo de experimento recebe o nome de ensaio de 
Bernoulli . 
 
Exemplos de ensaio de Bernoulli 
 
1) Uma moeda é lançada 5 vezes. Cada lançamento é um ensaio, em que dois 
resultados podem ocorrer: cara ou coroa. Chamemos de sucesso o evento sair 
uma cara e de fracasso o evento sair uma coroa . Em cada ensaio, p=0,5 e 
q=0,5. 
 
2) Uma urna contém 4 bolas vermelhas e 6 brancas. Uma bola é extraída, 
observada sua cor e reposta na urna; este procedimento é repetido 8 vezes. Cada 
extração é um ensaio, em que dois resultados podem ocorrer: bola vermelha ou 
bola branca. Chamemos de sucesso o evento sair bola vermelha . 
Conseqüentemente, fracasso corresponde ao evento sair bola branca . Neste 
caso, 
10
4
p = e 
10
6
q = . 
 
1.2. Distribuição Binomial 
 
Antes de apresentarmos a fórmula e suposições da distribuição Binomial de 
probabilidades, vamos analisar um exemplo e deduzir a fórmula a partir dele. 
 
Exemplo 1: uma prova consta de 10 testes com 5 alternativas cada um, sendo 
apenas uma delas correta. Um aluno que nada sabe a respeito da matéria 
avaliada, “chuta” uma resposta para cada teste. Qual é a probabilidade dele 
acertar exatamente 6 testes? 
 
A probabilidade de acertar um teste aleatoriamente é 2,0
5
1 = . Logo, a de errar 
esse teste é de 8,0
5
4
5
1
1 ==− . 
 
 3 
Vamos considerar uma situação bastante específica: o aluno acerta os testes de 1 
à 6 e erra os testes de 7 à 10. A probabilidade de isso acontecer é obtida 
utilizando–se o Princípio Fundamental da Contagem: 
 
0,2 . 0,2 . 0,2 . 0,2 . 0,2 . 0,2 . 0,8 . 0,8 . 0,8 . 0,8 = 
= (0,2)6 . (0,8)4 ≅ 0,000026 ou 0,0026%. 
 
Porém, essa é apenas uma situação de acertos / erros possível. O número total de 
maneiras que esse aluno pode acertar 6 testes de um total de 10 testes é 
calculada utilizando–se combinação (visto que a ordem dos acertos NÃO importa): 
 
210
)!610!.(6
!10
C 6,10 =−
= maneiras. 
 
Para cada uma dessas 210 formas, temos uma probabilidade de acerto igual a 
calculada anteriormente. Logo, a probabilidade de esse aluno acertar 6 testes 
qualquer é: 
 
210 . (0,2)6 . (0,8)4 ≅ 0,0055 ou 0,55%. 
 
Vamos definir a variável aleatória X que representa sucesso como sendo: 
 
X: número de testes que o aluno acerta (sucesso). 
 
Associada a X, temos a probabilidade de sucesso p=0,2 e, conseqüentemente, a 
probabilidade de fracasso q=1–0,2=0,8 (probabilidade de errar o teste). 
 
Lembrando que 





=
6 
10
C 6,10 , podemos escrever que a probabilidade do aluno 
acertar 6 testes é: 
 
P(X=6) = 





6 
10
. (0,2)6 . (0,8)4 
 
Generalizando, se em cada uma das n repetições de Ensaios de Bernoulli a 
probabilidade de ocorrer um evento definido como sucesso é sempre p, a 
probabilidade de que esse evento ocorra em apenas k das n repetições é dada 
por: 
 
knk )p1.(p.
k
n
)kX(P −−





== 
 
 
 
 4 
Resumindo: um experimento binomial deve satisfazer os seguintes critérios: 
 
1) O experimento é repetido n vezes , onde cada tentativa é independente das 
demais. 
2) Há apenas dois resultados possíveis em cada tentativa: um de interesse, 
associado à variável X, chamado de sucesso e o seu complementar que é o 
fracasso . 
3) A probabilidade de sucesso será denotada por p e é a mesma em cada 
tentativa (entenda Ensaio de Bernoulli). Logo, a probabilidade de fracasso será 
denotada por q = 1 – p. 
 
Observações importantes: é comum àqueles que estão iniciando os estudos da 
distribuição Binomial acharem que a variável definida como sucesso precisa ser 
algo “bom”. Porém, isso não está correto. A variável X, ou seja, o sucesso, deverá 
ser algo que nos interesse. Por exemplo, poderíamos definir como sucesso: 
 
– alunos reprovados em determinado ano; 
– número de óbitos em uma UTI; 
– número de fumantes presentes em uma reunião; 
– acertar um alvo num torneio de tiro; 
– entrevistados serem do sexo masculino; 
– sair cara no lançamento de uma moeda; 
– sair face 5 ou 6 no lançamento de um dado. 
 
Ou seja, a variável sucesso pode ser ou pode não ser algo bo m! Às vezes, 
pode ser algo imparcial, como face de uma moeda ou dado, ou sexo de uma 
pessoa. 
 
Exemplo 2: para entender melhor a fórmula, vamos recapitular o cálculo de 
probabilidades com base em um exemplo. Responda rapidamente a pergunta: um 
casal deseja ter 4 filhos, 2 homens e 2 mulheres. Supondo que a probabilidade de 
nascimento de um homem (H) ou uma mulher (M) seja a mesma, qual a 
probabilidade de tal fato acontecer? 
 
Muitas pessoas respondem 50%. Se você foi uma delas, a pergunta seguinte 
possivelmente será “por quê? Não é???”. A resposta é não! O que mostra que 
muitas vezes a intuição nos engana, enfatizando a importância da probabilidade 
(veja, por exemplo, o caso de um médico obstetra ou um laboratório que muitas 
vezes precisa conhecer cálculos de probabilidades como este). 
 
Faremos, inicialmente, um método mais trabalhoso, mas que certamente 
convencerá o leitor de que tal probabilidade não é 50%. Depois, faremos o cálculo 
utilizando um modelo probabilístico. 
 
Listemos todas as possibilidades de nascimentos: 
 
 
 5 
HHHH 
HHHM 
HHMH 
HMHH 
MHHH 
HHMM 
HMHM 
MHHM 
HMMH 
MHMH 
MMHH 
HMMM 
MHMM 
MMHM 
MMMH 
MMMM 
 
Das 16 possibilidades listadas, note que em 6 delas ocorrem o nascimento de 2 
homens e 2 mulheres. Logo, a probabilidade disso ocorrer é: 
 
37,5% ou 375,0
16
6
P == . 
 
Ou seja, a probabilidade é inferior a 50%, mais precisamente, vale 37,5%, o que 
contradiz a intuição da maioria das pessoas. 
 
Uma outra forma de resolver esse mesmo problema é utilizando a Binomial. 
 
Agora, para resolvermos essa situação apresentada através da Binomial, vamos 
determinar que nosso interesse seja o número de homens que nascem. Essa 
ocorrência será chamada de sucesso. Assim: 
 
X: número de homens que nascem (sucesso) 
 
Logo, nascer mulher indicaria fracasso. Não é nenhum tipo de preconceito, mas 
sim, uma questão Estatística. Poderíamos, sem problemas, ter trocado homem por 
mulher e vice-versa. 
 
A probabilidade de sucesso é a probabilidade de em um nascimento qualquer 
ocorrer um homem, ou seja, 
 
5,0
2
1
p == . 
 
Temos interesse que, em 4 nascimentos, 2 sejam homens e 2 sejam mulheres. 
Como chamamos de sucesso nascer homem, temos interesse no nascimento de 2 
 6 
homens ou, em linguagem matemática, X=2. Logo, o valor de k é 2 (basta 
comparar a fórmula X=k com o que acabamos de escrever X=2). 
 
Obtemos, portanto: 
 
375,0
8
3
4
1
.
4
1
.6
2
1
1.
2
1
.
2
4
)2X(P
242
===




 −











==
−
, 
 
que é o mesmo valor obtido utilizando o método anterior. 
 
Cabe ressaltar que a fórmula apresentada não tem caráter místico algum. É 
possível fazer a sua dedução e, para isso, basta utilizarmos a lógica desenvolvida 
no método anterior. Vejamos: 
 
Suponhamos 4 caixas numeradas, e que iremos colocar em cada uma delas um 
cartão que possui uma letra H ou um cartão que possui uma letra M. Suponhamos 
que temos um par de cartões “mestre” que serão utilizados na escolha de uma das 
letras e que tenhamos uma outra pilha de cartões que serão colocados nas caixas. 
 
Inicialmente, escolheremos duas delas para colocarmos um cartão que possui a 
letra H. O número de maneiras que podemos fazer tal escolha não depende da 
ordem,ou seja, escolher a caixa 1 e 3 é indiferente de escolher a 3 e 1, visto que 
colocaremos cartas iguais dentro de cada uma delas. Utilizamos a combinação: 
 
 
 
 
 
 
 
 
6
2
4
C 2,4 =





= 
 
Logo, há 6 maneiras de se fazer tal escolha. 
 
Fixemos uma das escolhas, como por exemplo, H nas caixas 1 e 3. Nas caixas 2 e 
4 colocaremos cartas com a letra M. A probabilidade de tal fato ocorrer pode ser 
expressa através do princípio multiplicativo. A probabilidade de ocorrer cada H é 
de 0,5 (pois sorteamos as letras a partir dos cartões-mestre) e de ocorrer M 
também é 0,5. 
 
Assim, a probabilidade de sortearmos H na primeira vez, M na segunda, H na 
terceira e M na quarta é dada por 
 
1 2 3 4 
H H 
M 
H 
Cartões mestre 
 7 
0,5.0,5.0,5.0,5 = (0,5)4 = 0,0625. 
 
Como tal fato (2 H e 2 M) pode ocorrer de 6 maneiras diferentes temos que a 
probabilidade final fica 
 
P = 6 . 0,0625 = 0,375. 
 
Note que 0,5 = 1 – 0,5 = 1 – p. O raciocínio aqui desenvolvido é o mesmo que se 
faz para deduzir a fórmula da Distribuição Binomial. 
 
 
Exemplo 3: uma urna tem 4 bolas vermelhas (V) e 6 brancas (B). Uma bola é 
extraída, observada sua cor e reposta na urna. O experimento é repetido 5 vezes. 
Qual a probabilidade de observarmos exatamente 3 vezes bola vermelha? 
 
Inicialmente, vamos definir a variável aleatória de interesse: 
 
X: número de bolas vermelhas observadas (sucesso ). 
 
Logo, a probabilidade de sucesso será p=4/10=0,4. Utilizando a fórmula 
apresentada, em que n=5 (número de retiradas) e k=3 (número de bolas 
vermelhas que temos interesse em observar), temos: 
 
2304,06,0.4,0.
3
5
)4,01.(4,0.
3
5
)3X(P 23353 =





=−





== − ou 23,04%. 
 
Exemplo 4: numa cidade, 10% das pessoas possuem carro de marca A. Se 30 
pessoas são selecionadas ao acaso, com reposição, qual a probabilidade de 
exatamente 5 pessoas possuírem carro de marca A? 
 
Definindo X: número de pessoas que possuem o carro da marca A (sucesso), 
temos associada uma probabilidade de sucesso p=0,10. Sendo n=30 e k=5, 
temos: 
 
1023,09,0.1,0.
5 
30
)1,01.(1,0.
5 
30
)5X(P 2555305 ≅





=−





== − ou 10,23%. 
 
 
Exemplo 5: admite–se que uma válvula eletrônica, instalada em determinado 
circuito, tenha probabilidade 0,3 de funcionar mais de 600 horas. Analisando–se 
10 válvulas, qual será a probabilidade de que, entre elas, pelo menos 3 continuem 
funcionando após 600 horas? 
 
 8 
Seja X: número de válvulas que permanecem funcionando após 600 horas. Temos 
que a probabilidade de sucesso é p=0,3. Perceba que estamos realizando 10 
Ensaios de Bernoulli (n=10). Logo, queremos calcular: 
 
P(X≥3) = P(X=3) + P(X=4) + P(X=5) + ... + P(X=9) + P(X=10). 
 
Note que teríamos que calcular cada uma das probabilidades envolvidas nessa 
soma utilizando a fórmula apresentada, ou seja, teríamos que aplicar a fórmula 8 
vezes para, em seguida, somar todos os resultados. Neste caso, vamos utilizar 
uma propriedade, já vista, de eventos complementares: 
 
P(X≥3) = 1 – P(X<3) = 
 
= 1 – [ P(X=0) + P(X=1) + P(X=2)] = 
 
= 





−





+−





+−





− −−− 210211010100 )3,01.(3,0.
2 
10
)3,01.(3,0.
1 
10
)3,01.(3,0.
0 
10
1 = 
= 











+





+





− 8291100 7,0.3,0.
2 
10
7,0.3,0.
1 
10
7,0.3,0.
0 
10
1 = 
= 1 – 0,3828 = 0,6172 ou 61,72%. 
 
Exemplo 6: em uma grande pesquisa com 6000 respondentes, determinou–se 
que 1500 dos entrevistados assistiam determinado programa de TV. Se 20 
pessoas são escolhidas ao acaso, qual a probabilidade de que ao menos 19 
assistam a esse programa? 
 
Definindo a variável aleatória que indica sucesso: 
 
X: número de pessoas que assistem ao programa. 
 
Perceba que a probabilidade de sucesso (p) pode ser calculada a partir do 
enunciado: 
 
25,0
6000
1500
p == . 
 
Logo, queremos calcular: 
 
P(X≥19) = P(X=19) + P(X=20) = 
= 020119 75,0.25,0.
20
20
75,0.25,0.
19
20






+





= 
≅ 5,5.10–11, ou seja, a probabilidade de 19 ou 20 pessoas assistirem ao programa 
é muito pequena, quase zero, visto que vale 0,0000000055%. 
 
 9 
Exemplo 7: vamos supor o lançamento de uma moeda honesta (ou seja, 
P(cara)=P(coroa)=0,5). Suponhamos que você faça uma aposta com um amigo 
seu: ganha aquele que obtiver mais caras (no seu caso) ou coroas (no caso dele) 
em 7 lançamentos. 
 
A probabilidade de você ganhar ocorre quando saírem 4 ou 5 ou 6 ou 7 caras. 
Utilizando o modelo Binomial onde: 
 
X: número de caras (sucesso) 
n = 7 lançamentos 
k = 4,5,6,7 
p = 0,5 
 
temos: 
 
P(ganhar) = P(X=4) + P(X=5) + P(X=6) + P(X=7) = 
5,0
2
1
.1
2
1
.7
2
1
.21
2
1
.35
2
1
1
2
1
7
7
2
1
1
2
1
6
7
2
1
1
2
1
5
7
2
1
1
2
1
4
7
7777
777676575474
=




+




+




+




=
=




 −











+




 −











+




 −











+




 −











=
−−−−
 
Resultado interessante, não? Ou seja, ao invés de fazer essa aposta, poderiam ter 
feito a tradicional aposta de cara x coroa. 
 
Exemplo 8: Suponhamos a mesma situação do exemplo anterior, mas agora, 
você pega, sem seu amigo perceber, uma moeda viciada em que a probabilidade 
de ocorrer uma cara é de 0,75 ou 
4
3
. Neste caso, p=0,75 e a probabilidade de 
você ganhar é: 
 
P(ganhar) = P(X=4) + P(X=5) + P(X=6) + P(X=7) = 
 
9294,0
4
3
1
4
3
7
7
4
3
1
4
3
6
7
4
3
1
4
3
5
7
4
3
1
4
3
4
7 777676575474
≅




 −











+




 −











+




 −











+




 −











=
−−−−
 
ou 92,94%. 
 
Logo, é muito provável que você ganhe a aposta usando essa moeda viciada. 
 
Exemplo 9: Overbooking é prática realizada na aviação do mundo todo. Consiste 
na empresa aérea vender mais bilhetes do que o disponível no vôo com base na 
média de desistência dos vôos anteriores. Uma empresa aérea possui um avião 
com capacidade para 100 lugares. Se para um certo vôo essa empresa vendeu 
103 passagens e, admitindo que a probabilidade de um passageiro não 
 10 
comparecer para embarque é de 1%, qual a probabilidade de algum passageiro 
não conseguir embarcar? 
 
Este é um problema clássico resolvido utilizando a Binomial. Aqui, é muito comum 
haver uma certa confusão na elaboração do que é o sucesso bem como do que se 
deseja calcular. Assim, vamos definir: 
 
X: número de passageiros que comparecem ao embarque (sucesso). 
 
Neste caso, p=0,99. Temos, ainda, que n=103, visto que cada um dos 103 
passageiros pode comparecer ao embarque (sucesso) ou não comparecer 
(fracasso). Queremos calcular a probabilidade de que algum passageiro não 
consiga embarcar, ou seja, de que compareçam ao embarque mais de 100 
passageiros: 
 
P(X>100) = P(X=101) + P(X=102) + P(X=103) = 
= 010311022101 01,0.99,0.
103
103
01,0.99,0.
102
103
01,0.99,0.
101
103






+





+





= 
= 010311022101 01,0.99,0.101,0.99,0.10301,0.99,0.5253 ++ = 
= 0,9150 ou 91,50%. 
 
Espantoso? Pois é, a probabilidade de haver problemas devido ao excesso de 
passageiros para esse vôo é bastante elevada e igual a 91,5%. 
 
 
1.3. Exercícios 
 
1) Uma moeda é lançada 6 vezes. Qual a probabilidade de observarmos 
exatamente duas caras? 
 
2) Um dado é lançado 5 vezes. Qual a probabilidade de que o “4” apareça 
exatamente 3 vezes? 
 
3) Uma pessoa tem probabilidade 0,2 de acertar num alvo toda vez que atira. 
Supondo que as vezes que ela atira são ensaios independentes, qual a 
probabilidade de ela acertar no alvo exatamente 4 vezes, se ela dá 8 tiros? 
 
4) A probabilidade de que um homem de 45 anos sobreviva mais 20 anos é 0,6. 
De um grupo de 5 homens com 45 anos, qual a probabilidade de que exatamente 
4 cheguem aos 65 anos? 
 
5) Uma moeda é lançada 6 vezes. Qual a probabilidade deobservarmos ao 
menos uma cara? 
 
6) Um time de futebol tem probabilidade p = 0,6 de vencer todas as vezes que 
joga. Se disputar 5 partidas, qual a probabilidade de que vença ao menos uma? 
 11 
 
7) Uma prova consta de 5 testes com 4 alternativas casa um, sendo apenas uma 
delas correta. Um aluno que nada sabe a respeito da matéria da prova, “chuta” 
uma resposta para cada teste. Qual é a probabilidade desse aluno: 
 a) acertar os 5 testes? 
 b) acertar apenas 4 testes? 
 c) acertar apenas 3 testes? 
 d) acertar apenas 2 testes? 
 e) acertar apenas 1 teste? 
 f) errar todos os testes propostos? 
 g) qual o resultado mais provável obtido pelo aluno? 
 
8) Foi realizada uma pesquisa com 500 pessoas para verificar se assistiam 
determinado programa de televisão. Duzentas pessoas afirmaram assistir. Se, a 
partir da população, retirarmos 8 indivíduos, qual é a probabilidade de que no 
máximo 6 assistam o programa? 
 
9) Um aluno tem o domínio de 70% do conteúdo que será cobrado em uma prova. 
Sabendo–se que essa prova é composta por 10 questões, qual a probabilidade de 
ele acertar, ao menos, 7 questões para ser aprovado? 
 
10) Em uma UTI, em média 5% dos bebês que nascem prematuros não 
sobrevivem. Se, atualmente, há 40 bebês prematuros, qual a probabilidade de que 
no máximo 5% dos bebês não sobrevivam? 
 
11) Em 320 famílias com quatro crianças cada uma, quantas famílias seria 
esperado que tivessem: 
a) nenhuma menina? 
b) três meninos? 
c) quatro meninos? 
 
12) Um time X tem 
3
2
 de probabilidade de vitória sempre que joga. Se X jogar 
cinco partidas, calcule a probabilidade de: 
a) X vencer exatamente três partidas; 
b) X vencer ao menos uma partida; 
c) X vencer mais da metade das partidas. 
 
13) A probabilidade de um atirador acertar o alvo é 
3
1
. Se ele atirar seis vezes, 
qual a probabilidade de: 
a) acertar exatamente dois tiros? 
b) não acertar o alvo? 
 
14) Se 5% das lâmpadas de certa marca são defeituosas, ache a probabilidade de 
que, numa amostra de 100 lâmpadas, escolhidas ao acaso, tenhamos: 
 12 
a) nenhuma defeituosa; 
b) três defeituosas; 
c) mais do que uma boa. 
 
 
 
Respostas 
1) 0,2344 
2) 0,03215 
3) 0,4588 
4) 0,2592 
5) 0,98439 
6) 0,9898 
7) a) 1/1024 b) 15/1024 c) 90/1024 d) 470/1024 e) 405/1024 f) 243/1024 
 g) O resultado mais provável é que o aluno acerte apenas 1 teste. 
8) 0,9915 
9) 0,6496 
10) 0,6767 
11) a) 20 b) 80 c) 20 
12) a) 80/243 b) 242/243 c) 64/81 
13) a) 80/243 b) 64/729 
14) a) (0,95)100 
b) 





3
100
 (0,05)3.(0,95)97 
c) 1–(0,05)100 – 100.(0,95).(0,05)99 
 
 13 
1.4. Distribuição Geométrica 
 
Muitas situações reais podem ser repetidas até atingir–se o sucesso. Um 
candidato pode prestar uma prova de vestibular até ser aprovado, ou você pode 
digitar um número de telefone várias vezes até conseguir completar a ligação. 
Situações como essas podem ser representadas por uma distribuição Geométrica. 
 
Uma distribuição pode ser considerada Geométrica se satisfizer as seguintes 
condições: 
1) Uma tentativa (correspondente a um Ensaio de Bernoulli) é repetida até que o 
sucesso ocorra, ou seja, ocorrem k–1 fracassos até que ocorra o primeiro sucesso 
na k–ésima tentativa. 
2) As tentativas são independentes umas das outras. 
3) A probabilidade de sucesso p é constante em todos os Ensaios de Bernoulli. 
 
Logo, a probabilidade de que ocorra sucesso na tentativa k é: 
 
P(X=k) = p.(1–p)k–1 
 
com k=1,2,3,4... 
 
Ou seja, ocorrem k–1 fracassos com probabilidade 1–p até que ocorra um 
sucesso na tentativa k com probabilidade p . 
 
 
Exemplo 1: uma linha de produção está sendo analisada para efeito de controle 
da qualidade das peças produzidas. Tendo em vista o alto padrão requerido, a 
produção é interrompida para regulagem toda vez que uma peça defeituosa é 
observada. Se 0,01 é a probabilidade da peça ser defeituosa, determine a 
probabilidade de ocorrer uma peça defeituosa na 1ª peça produzida, na 2ª, na 5ª, 
na 10ª, na 20ª e na 40ª. 
 
Vamos admitir que cada peça tem a mesma probabilidade de ser defeituosa, 
independentemente da qualidade das demais. Sendo a ocorrência de peça 
defeituosa um sucesso, podemos aplicar o modelo Geométrico. Definindo a 
variável aleatória com distribuição geométrica X: número total de peças 
observadas até que ocorra a primeira defeituosa, podemos escrever nosso 
modelo: 
 
P(X=k) = 0,01 . 0,99k–1 
 
Assim, podemos aplicar nosso modelo para calcular as probabilidades pedidas: 
 
P(X=1) = 0,01 . 0,990 = 0,01 
P(X=2) = 0,01 . 0,991 = 0,0099 
P(X=5) = 0,01 . 0,994 = 0,0096 
 14 
P(X=10) = 0,01 . 0,999 = 0,0091 
P(X=20) = 0,01 . 0,9919 = 0,0083 
P(X=40) = 0,01 . 0,9939 = 0,0068 
 
 
Exemplo 2: por experiência, você sabe que a probabilidade de que você fará uma 
venda em qualquer telefone dado é 0,23. Encontre a probabilidade de que sua 
primeira venda ocorra na quarta ou na quinta ligação. 
 
X: número da primeira ligação em que ocorre a venda (sucesso). 
 
P(X=4) = 0,23 . 0,773 ≅ 0,105003 
P(X=5) = 0,23 . 0,774 ≅ 0,080852 
 
Logo, a probabilidade desejada é: 
 
P(venda na 4ª ou 5ª ligação) = P(X=4) + P(X=5) = 0,105003 + 0,080852 ≅ 0,186. 
 
Embora um sucesso possa, teoricamente, nunca ocorrer, a distribuição geométrica 
é uma distribuição de probabilidade discreta porque os valores de x podem ser 
listados – 1,2,3.... Perceba que conforme x se torna maior, P(X=x) se aproxima de 
zero. Por exemplo: 
 
P(X=50) = 0,23 . 0,7749 ≅ 0,0000006306. 
 
 
 
Observação: o desvio padrão é calculado como sendo a raiz quadrada da 
variância, assim como já estudamos anteriormente. 
 
1.5. Exercícios 
 
1) Considere uma variável aleatória X com distribuição Geométrica com parâmetro 
p=0,4. Calcule: 
a) P(X = 4). 
b) P(3 ≤ X < 5). 
c) P(X ≥ 2). 
 
2) Uma moeda equilibrada é lançada sucessivamente, de modo independente, até 
que ocorra a primeira cara. Seja X a variável aleatória que conta o número de 
lançamentos anteriores à ocorrência de cara. Determine: 
a) P(X ≤ 2). 
b) P(X > 1). 
c) P(3 < X ≤ 5). 
 
 15 
3) Suponha que a probabilidade de que você faça uma venda durante qualquer 
um dos telefonemas feitos é 0,19. Encontre a probabilidade de que você: 
a) faça sua primeira venda durante a quinta ligação; 
b) faça sua primeira venda durante a primeira, segunda ou terceira ligação; 
c) não faça uma venda durante as três primeiras ligações. 
 
4) Um produtor de vidro descobre que 1 em cada 500 itens de vidro está torcido. 
Encontre a probabilidade de: 
a) o primeiro item de vidro torcido ser o décimo item produzido; 
b) o primeiro item de vidro torcido ser o segundo ou terceiro item produzido; 
c) nenhum dos dez primeiros itens de vidro estar imperfeito. 
 
 
 
 
Respostas 
1) a) 0,0864 b) 0,2304 c) 0,6000 
2) a) 0,875 b) 0,250 c) 0,047 
3) a) 0,082 b) 0,469 c) 0,531 
4) a) 0,002 b) 0,006 c) 0,980 
 
 
 16 
2. Introdução à Estatística 
 
1. O que é Estatística? 
 
Toda pesquisa ou trabalho científico, nas mais variadas áreas, como sociologia, saúde, 
psicologia, etc., de um modo bem geral, em alguma fase de seu desenvolvimento, se 
depara com situações que envolvem uma grande quantidade de dados relevantes ao 
objeto de estudo. Esses dados têm que ser trabalhados e transformados em informações, 
para que possam ser comparados com outros resultados, ou ainda para julgar sua 
adequação a alguma teoria. Para isto se recorre a técnicas desenvolvidas com a 
finalidade de auxiliar a análise dessas informações. 
 
A utilização dessas técnicas, destinadas à análise de situações complexas ou não, tem 
aumentado e faz parte do nosso cotidiano. Jornais, revistas técnicas artigos, etc., 
publicam freqüentemente tabelas, gráficos, porcentagens e outros dispositivos destinados 
a complementar a apresentação de um fato ou justificar um argumento. 
 
A ciência que se dedica a esse trabalho é a Estatística . 
Estatística : é o conjunto de técnicas que permite,de forma sistemática, coletar, 
organizar, descrever, analisar e interpretar dados oriundos de estudos ou experimentos, 
realizados em qualquer área do conhecimento. 
No passado, tratar uma grande massa de números era tarefa custosa e cansativa, que 
exigia horas de trabalho. Recentemente, no entanto, grande quantidade de informações 
pode ser analisada rapidamente com um computador pessoal e programas adequados. 
Desta forma, o computador contribui, positivamente, na difusão e uso de métodos 
estatísticos. Por outro lado, o computador possibilita uma automação que pode levar um 
indivíduo sem preparo específico a utilizar técnicas inadequadas para resolver um dado 
problema. Assim, é necessário a compreensão dos conceitos básicos da Estatística, bem 
como as suposições necessárias para o seu uso de forma criteriosa. 
Quando se aborda uma problemática envolvendo métodos estatísticos, deve-se planejar a 
experiência que nos vai permitir recolher os dados, de modo que, posteriormente, se 
possa extrair o máximo de informações relevantes para o problema em estudo, ou seja, 
para a população de onde os dados provêm. Quando de posse dos dados, procura-se 
agrupá-los e reduzi-los sob forma de amostra. 
Seguidamente o objetivo do estudo estatístico pode ser o de estimar uma quantidade ou 
testar uma hipótese. Utilizamos então técnicas estatísticas convenientes que vão permitir 
tirar conclusões acerca da população, baseando-se numa pequena amostra, dando-nos 
ainda uma medida do erro cometido. 
 
2. Estatística Descritiva e Estatística Indutiva 
Numa análise estatística distinguem-se essencialmente duas fases: 
1ª Fase - Estatística Descritiva - Procura-se descrever e resumir dados, afim de que se 
possam tirar conclusões a respeito das características de interesse. 
 17 
Exemplos de características de interesse: idade, sexo, peso. 
Exemplos de técnicas descritivas: gráficos, tabelas, de freqüência, parâmetros associados 
às freqüências. 
2ª Fase - Estatística Indutiva (Inferência) - Conhecidas certas propriedades (obtidas a 
partir de uma análise descritiva de uma amostra), expressas por meio de proposições, 
imaginam-se proposições mais gerais (extrapolação), que exprimam conclusões para toda 
a população. 
No entanto, ao contrário das proposições deduzidas, não podemos dizer se são falsas ou 
verdadeiras, já que foram verificadas sobre um conjunto restrito de indivíduos, e, portanto 
não são falsas, mas não foram verificadas para todos os indivíduos da População, pelo 
que também não podemos afirmar que são verdadeiras. Existe, assim, certo grau de 
incerteza. 
Para que a inferência seja válida, é necessária uma boa amostragem, livre de erros, tais 
como falta de determinação correta da população, falta de aleatoriedade e erro no 
dimensionamento da amostra. 
Para se estudar essa incerteza, oriunda das proposições mais gerais, recorremos à teoria 
matemática das Probabilidades . 
 
 
3. Parâmetros x Estatísticas 
 
• Parâmetros : são medidas populacionais quando se investiga a população em sua 
totalidade, neste caso é impossível fazer inferências, pois toda a população foi 
investigada. 
 
 18 
• Estatísticas ou Estimadores : são medidas obtidas da amostra, torna-se possível neste 
caso utilizarmos inferências para que possamos fazer conclusões sobre a população. 
 
 
4. Planejamento de Experimentos 
Os estudos que utilizam métodos estatísticos vão desde os que são concebidos e 
executados, dando resultados confiáveis, aos que são concebidos deficientemente e mal 
executados, levando a conclusões enganosas e sem qualquer valor real. Eis alguns 
pontos importantes para o planejamento de um estudo capaz de produzir resultados 
válidos: 
1. Identificar com precisão a questão a ser respondida e definir com clareza a 
população de interesse. 
2. Estabelecer um plano para coleta de dados. Esse plano deve descrever 
detalhadamente a realização de um estudo observacional ou de experimento e deve ser 
elaborado cuidadosamente, de modo que os dados coletados representem efetivamente a 
população em questão. 
3. Coletar os dados. Devemos ser extremamente cautelosos, para minimizar os erros 
que podem resultar de uma coleta tendenciosa de dados. 
4. Analisar os dados e tirar conclusões. Identificar também possíveis fontes de erros. 
 
Os estudos que requerem métodos estatísticos decorrem tipicamente de duas fontes 
comuns: estudos observacionais e experimentais. 
Estudo observacional – verificamos e medimos características específicas, mas não 
tentamos manipular ou modificar os elementos a serem estudados. Ex: plebiscito sobre 
porte de arma de fogo. 
Estudo experimental – aplicamos determinado tratamento e passamos então a observar 
seus efeitos sobre os elementos as serem pesquisados. Ex: tratamento médico a um 
determinado grupo de pacientes a fim de determinar sua eficiência na cura. 
 
5. População e Amostra 
Qualquer estudo científico enfrenta o dilema de estudo da população ou da amostra. 
Obviamente tería-se uma precisão muito superior se fosse analisado o grupo inteiro, a 
população, do que uma pequena parcela representativa, denominada amostra. Observa-
se que é impraticável na grande maioria dos casos, estudar a população em virtude de 
distâncias, custo, tempo, logística, entre outros motivos. A alternativa praticada nestes 
casos é o trabalho com uma amostra confiável. 
População (N ): Conjunto de todos os elementos relativos a um determinado fenômeno 
que possuem pelo menos uma característica em comum, a população é o conjunto 
Universo. 
 
 19 
Amostra (n) : É um subconjunto da população. A amostra deve ser selecionada seguindo 
certas regras e deve ser representativa, de modo que ela represente todas as 
características da população como se fosse uma fotografia desta. 
 
6. Pesquisa Estatística 
É qualquer informação retirada de uma população ou amostra, podendo ser através de 
Censo ou Amostragem. 
6.1 – Recenseamento (Censo) : é a contagem oficial e periódica dos indivíduos de um 
País, ou parte de um País. Ele abrange, no entanto, um leque mais vasto de situações. 
Assim, pode-se definir recenseamento do seguinte modo: 
“estudo científico de um universo de pessoas, instituições ou objetos físicos com o 
propósito de adquirir conhecimentos, observando todos os seus elementos, e fazer juízos 
quantitativos acerca de características importantes desse universo”. 
Amostragem : é o processo que procura extrair da população elementos que através de 
cálculos probabilísticos ou não, consigam prover dados inferências da população-alvo. 
Este processo deve seguir um método criterioso e adequado. 
Tipos de amostragem 
Não Probabilística 
Acidental ou conveniência 
Intencional 
Quotas ou proporcional 
Desproporcional 
Probabilística 
Aleatória Simples 
Aleatória Estratificada 
Tipos de Amostragem 
Conglomerado 
 
6.2 - Não Probabilística 
A escolha de um método não probabilístico, via de regra, sempre encontrará 
desvantagem frente ao método probabilístico. No entanto, em alguns casos, se faz 
necessário a opção por este método. Fonseca (1996), alerta que não há formas de se 
generalizar os resultados obtidos na amostra para o todo da população quando se opta 
por este método de amostragem. Isto porque os elementos da amostra não têm a mesma 
probabilidade de serem escolhidos e, por isso, não é possível fazer inferências sobre a 
população. 
 
 
 20 
- Acidental ou conveniência 
Indicada para estudos exploratórios. Freqüentemente utilizados em supermercados para 
testar produtos. 
- Intencional 
O entrevistador dirige-se a um grupo em específico para saber sua opinião. Por exemplo, 
quando, de um estudo sobre automóveis, o pesquisador procura apenas oficinas. 
- Quotas ou proporcional 
Na realidade, trata-se de uma variação da amostragem intencional. Necessita-se ter um 
prévio conhecimento da população e sua proporcionalidade. Por exemplo, deseja-se 
entrevistarapenas indivíduos da classe A, que representa 12% da população. Esta será a 
quota para o trabalho. 
- Desproporcional 
Muito utilizada quando a escolha da amostra for desproporcional à população. Atribui-se 
pesos para os dados, e assim obtêm-se resultados ponderados representativos para o 
estudo. 
Exemplo: Em um mercado de telefones celulares, considerando uma fatia de mercado 
meramente ilustrativa, obtiveram-se os resultados conforme descritos a seguir: 
 
Elementos da Amostra 
Marcas Participação no mercado 
n % 
Nokia 60% 50 25% 
Ericson 20% 50 25% 
Gradiente 15% 50 25% 
Philips 5% 50 25% 
Total 100% 200 100% 
Objetivando obtermos os pesos a serem atribuídos a cada marca de telefone celular, para 
uma análise conjunta de todas as marcas no exemplo acima, obtemos os seguintes 
coeficientes: 
Marcas Pesos 
Nokia 2,4 
Ericson 0,8 
Gradiente 0,6 
Philips 0,2 
Total 4,0 
 
 21 
6.3 - Probabilística 
 Para que se possam realizar inferências sobre a população, é necessário que se trabalhe 
com amostragem probabilística. É o método que garante segurança quando se investiga 
alguma hipótese. Normalmente os indivíduos investigados possuem a mesma 
probabilidade de ser selecionado na amostra. 
 
- Aleatória Simples ou Casual Simples 
É o mais utilizado processo de amostragem. Prático e eficaz confere precisão ao 
processo de amostragem. Normalmente utiliza-se uma tabela de números aleatórios e 
nomeiam-se os indivíduos, sorteando-se um por um até completar a amostra calculada. 
Exemplo: Queremos escolher 10 alunos de 90 alunos de uma sala. Escrevemos números 
de 1 a 90 em um papel e sorteamos 10 números. 
Uma maneira de substituir os papéis é utilizar uma tabela de números aleatórios, que 
podem ser encontradas em livros de Estatística. 
 
- Sistemática 
Em um grande número de exemplos, o pesquisador depara-se com a população 
ordenada. 
Exemplos: 
1. No caso de uma linha de produção, podemos, a cada dez itens produzidos, retirar um 
para pertencer a uma amostra de produção diária. Neste caso estaríamos fixando o valor 
da amostra em 10% da população (amostragem probabilística aleatória simples) 
2. Quando se trabalha com sorteio de quadras de casas, por exemplo, há uma regra 
crescente para os números das casas. Em casos como este, divide-se a população pela 
amostra e obtém-se um coeficiente (y). A primeira casa será a de número um x escolhido 
aleatoriamente, a segunda será a de número x + y; a terceira será a de número x + 2y, a 
quarta será x + 3y e assim sucessivamente (amostragem probabilística aleatória 
sistemática). 
Observe, se a rua contém 900 casas e desejamos obter uma amostra de 50 casas: 
• dividimos 900 por 50 obtendo o coeficiente y = 18 (900 : 50 = 18); 
• em seguida escolhemos por sorteio casual um número de 1 a 18 (inclusive), para 
indicar o número da primeira casa (x), 
• o segundo número será x + 18; o terceiro será x + 2.18; o quarto será x + 3.18, e 
assim sucessivamente. Se o número sorteado (x) for o número 4 (par), tomaríamos, pelo 
lado direito da rua o 4º prédio, o 22º, o 40º etc., até voltarmos ao início da rua, pelo lado 
esquerdo. 
3. Uma clínica possui 200 pacientes (cada um cadastrado com valores de 1 a 200). Desej-
ase sortear uma amostra de tamanho 10. 
 22 
Inicialmente, calculamos o tamanho do “passo” a ser dado na hora de coletar a amostra: 
200 : 10 = 20 (é o nosso “passo”) 
Agora, sorteamos um número entre 1 e o nosso “passo”, no caso, 20. Suponhamos ter 
sorteado o número 5. A partir desse valor, somamos o “passo” obtendo os números dos 
elementos de nossa amostra: 
5, 25, 45, 65, 85, 105, 125, 145, 165, 185. 
 
– Aleatória Estratificada 
Quando se deseja guardar uma proporcionalidade na população heterogênea, estratifica-
se cada subpopulação por intermédio de critérios como classe social, renda, idade, sexo, 
entre outros. 
Esse tipo de amostragem é útil quando pode-se construir um sistema de referências, mas 
sabe-se de antemão que existe uma grande variabilidade entre os grupos e uma pequena 
variabilidade dentro de cada grupo. Com o objetivo de eliminar a variabilidade entre os 
grupos, convém utilizar este sistema de amostragem. A cada grupo damos o nome de 
estrato. Depois, retiramos de cada estrato uma amostra casual simples. 
Exemplo: Suponha que dos 90 alunos de uma sala, 54 são homens e 36 sejam mulheres. 
Vamos obter 10% da população para a amostra proporcional estratificada. Então vamos 
dividir nossa população em dois estratos: homens e mulheres. Destes dois estratos 
vamos obter 10% de cada um. Assim temos: 
Sexo População 10% Amostra 
M 54 5,4 5 
F 36 3,6 4 
Total 90 9 9 
 
 
– Conglomerado 
Muitas vezes a construção do sistema de referência é impossível. Nesta modalidade de 
amostragem, divide-se a área da população em seções (ou conglomerados): em seguida 
sorteia-se algumas dessas seções e, finalmente são estudados todos os elementos das 
seções escolhidas. 
Exemplo: queremos estudar a população que habita uma favela, mas não temos meios de 
conseguir uma relação completa dos habitantes. Porém, temos a relação completa dos 
barracos que compõem a favela. Barraco é uma unidade de amostragem maior, que 
engloba um certo número de indivíduos. Logo, podemos escolher uma amostra casual 
simples de barracos e estudarmos todos os indivíduos que moram nos barracos 
sorteados. Ao conjunto de indivíduos que moram em um barraco damos o nome de 
conglomerado. 
 
 23 
7. Dado x Variável 
 
Dados estatísticos : é qualquer característica que possa ser observada ou medida de 
alguma maneira. As matérias-primas da estatística são os dados observáveis. 
 
Variável : é o que se deseja observar para se tirar algum tipo de conclusão. Geralmente 
as variáveis para estudo são selecionadas por processos de amostragem. Os símbolos 
utilizados para representá-las são letras maiúsculas do alfabeto, tais como X, Y, Z,... que 
podem assumir qualquer valor de um conjunto de dados. 
 
Para podermos decidir como organizar os dados é preciso saber com que tipo de 
variáveis estamos trabalhando. Os tipos de variáveis são: 
 
- quantitativas que podem ser discretas ou contínuas; 
- qualitativas que podem ser ordinais ou nominais. 
 
 
 
 
 
 
 
 
 
 
 
 
 
As variáveis quantitativas discretas assumem valores pontuais. Por exemplo, a idade das 
pessoas em anos. Neste caso, a idade representa valores bem definidos como 20, 21, 22, 
23 anos. 
 
As variáreis quantitativas contínuas assumem valores dentro de um intervalo. Por 
exemplo, podemos considerar a massa das pessoas em gramas. É claro que uma pessoa 
pode ter 60 235 gramas ou 60 236 gramas. Caberia a pergunta: não seria uma variável 
discreta? Neste caso, temos um conjunto muito grande de valores que essa variável pode 
assumir tornando-a contínua. 
 
As variáveis qualitativas ordinais são aquelas que atribuem qualidades de modo que 
possam ser ordenadas de maneira hierárquica. Por exemplo, o grau de escolaridade: 
analfabeto, 1° grau incompleto, 1° grau completo, 2 ° grau incompleto e assim por diante. 
 
Por fim, as variáveis qualitativas nominais são aquelas que atribuem qualidade mas que 
não é possível fazer uma ordenação. Por exemplo, matéria do colégio que mais gostava: 
Matemática, Física, Biologia, História... 
 
É importante ressaltar que não existem regras fixas para se dizer que uma variável é 
discreta ou contínua. Muitas vezes, podemos dar tanto um tratamento contínuo à variável 
idade quanto um tratamento discreto. Tal decisão depende do que se quer analisar e da 
quantidade de dados envolvida. Por exemplo: se estivermos fazendo uma pesquisa numa 
variáveis 
quantitativas 
qualitativas 
discretas 
contínuas 
ordinais 
nominais 
 24 
festa e encontramos jovens de 18 a 25 anos, podemos considerar a variável idade como 
discreta, ou seja, podemos contar exatamente quantas pessoas há com 18, 19, 20, 21, 
22, 23, 24 e 25 anos. Porém, imaginemos que numa outra festa, com 1000 convidados, 
encontrássemos pessoas de 3 à80 anos. É claro que poderíamos contar o número de 
indivíduos com 3,4,5,6,..., 79 e 80 anos. Porém, muitas vezes, nosso interesse está em 
analisar algumas faixas etárias. Por exemplo: 
 
de 3 a 18 anos 
de 18 a 25 anos 
de 25 a 35 anos 
de 35 a 50 anos 
de 50 a 80 anos 
 
Nesse caso, a variável idade passa a receber um tratamento contínuo. Assim, é preciso 
tomarmos muito cuidado com o fato de que algumas pessoas defendem que a variável 
IDADE é discreta. Dependendo do tratamento dado a ela, podemos transformá-la de 
discreta para contínua. 
 
Vejamos um outro caso: suponhamos um fabricante de tintas, que produz tintas coloridas 
fazendo o uso da tinta branca+pigmentos. Suponhamos, ainda, que ele trabalhe com as 
seguintes cores: branco, amarelo, vermelho, azul e preto. Aparentemente, a variável COR 
é qualitativa nominal. Porém, esse fabricante afirma que o pigmento amarelo é mais 
barato que o vermelho e que para se produzir tinta azul se usa muito corante (e mais 
corante ainda para tinta preta). Isso faz com que os custo sejam elevados para a tinta 
preta e reduzidos para a branca. Neste caso, podemos estabelecer uma ordem crescente 
para os custos: 
 
1°) branco 
2°) amarelo 
3°) vermelho 
4°) azul 
5°) preto 
 
Percebemos que foi estabelecida uma ordem. Assim, a variável COR é, agora, qualitativa 
ordinal. 
 
Questionário 
Para efeitos de análise, foi passado um questionário para uma amostra de 30 ouvintes de 
uma determinada palestra. Pediu-se para que respondessem com a maior exatidão 
possível. Um modelo do questionário é mostrado a seguir. 
 
 
 
 
 
 
 
 
 
 
 
 25 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
É importante destacar alguns pontos importantes a respeito do questionário: 
 
� Deve-se ter muito cuidado na elaboração das questões para que não gerem 
ambigüidades quanto à interpretação nem problemas de respostas diferentes que não 
possibilitem uma análise posterior. 
� O resultado de um questionário nem sempre corresponde à realidade, visto que a 
pessoa pode não saber ao certo sua altura ou fazer muito tempo que não se pesa. 
� Alguns cuidados especiais devem ser tomados na elaboração de questões “abertas”, 
ou seja, que não são do tipo teste, para que as respostas sejam padronizadas. Por 
exemplo, se não for especificado, uma pessoa pode responder que a sua altura é de 
172 cm e outra de 1,72 m. Ou ainda, o que seria muito pior pois alteraria o resultado 
da pesquisa, é no caso de perguntar o número de irmãos: uma pessoa pode ter 4 
irmãos vivos e 1 que faleceu. Qual valor ela deveria colocar no questionário: 4 ou 5? 
Daí a necessidade da especificação. 
� Vale a pena, também, ficar atento a perguntas do tipo: “você gosta de carros brancos? 
( ) sim ( ) não”. Aparentemente não há nenhum problema nessa pergunta, porém, 
uma análise mais cuidadosa faria perceber que o entrevistado poderia responder “não, 
não gosto de carros brancos, prefiro os vermelhos” como poderia responder “não, não 
gosto de carros, prefiro motos”. Porém, essa diferença de respostas não seria 
detectada com a pergunta (ambígua) acima. Neste caso, devemos reformular tal 
pergunta ou fazer outras confirmatórias. Embora isso não seja tratado neste texto, 
alertamos quanto ao fato na hora de elaborar e responder um questionário. 
 
 
Questionário 
 
Procure responder às questões com a maior exatidão possível. 
Não deixe questões em branco! 
 
1) Sexo: ( ) masculino ( ) feminino 
 
2) Idade (em anos): _____ 
 
3) Altura (em metros): ________ m 
 
4) Peso (em quilos): ______ kg 
 
5) Número de irmãos (vivos): _____ 
 
6) Fuma atualmente? ( ) SIM ( ) NÃO 
 
7) Qual a sua tolerância quanto à fumaça do cigarro? 
 ( ) Muito tolerante ( ) Pouco tolerante ( ) Indiferente 
 
8) Número de horas médias por semana que pratica exercícios e atividades físicas (academia, andar, 
correr, alongamento, esportes, etc): ______ horas 
 
9) Qualidade da programação atual da Rede Globo: 
 ( ) Boa ( ) Regular ( ) Péssima ( ) Não sabe 
 26 
O resultado de tal questionário em uma amostra de tamanho 30 é mostrado na tabela a 
seguir. As variáveis em questão são: 
 
Sexo – masculino (M) ou feminino (F) 
Idade – em anos 
Altura – em metros 
Peso – em quilos 
Irmãos – número de irmãos vivos 
Fuma – é fumante (SIM) ou não é fumante (NÃO) 
Tolerância – nível de tolerância à fumaça do cigarro: muito tolerante (M), pouco tolerante 
(P) ou indiferente (I) 
Exercícios – número médio de horas que pratica atividades físicas por semana 
Qualidade – qualidade da programação atual da Rede Globo: boa (B), regular (R), 
péssima (P) ou não sabe (N) 
 
A partir da tabela a seguir, onde estão representados os dados brutos (ou seja, aqueles 
obtidos a partir do questionário), percebemos que há uma certa dificuldade de, por 
exemplo, dizer se a maioria das pessoas é muito ou pouco tolerante ao fumo, ou quanto 
ao número médio de horas que as pessoas praticam atividades físicas. Tal dificuldade já 
se apresenta com um pequeno conjunto de dados (apenas 30 entrevistados). Para 
conjuntos maiores, diria que é praticamente impossível tirar alguma conclusão apenas 
observando os dados brutos. 
 
Daí a necessidade de reorganizarmos os dados em tabelas e gráficos. A organização em 
tabelas deve ser a mais simples possível, evitando-se utilizar tabelas muito incrementadas 
ou coloridas. A forma como esses dados serão organizados também pode variar, de 
acordo com os interesses e do que se quer analisar. Assim, daremos aqui, alguns 
exemplos de organização e tipos de gráficos. 
 
Aliás, quanto aos gráficos, nem sempre há um gráfico correto e outro errado. Para 
representar um conjunto de dados, muitas vezes é possível usar mais de um tipo de 
gráfico. O melhor é aquele que mais enfatiza o resultado que você deseja apresentar, ou 
seja, que dá maior destaque às informações que você julga importantes. 
 
 
 
Observação Sexo Idade Altura Peso Irmãos Fuma Tolerância Exercícios Qualidade 
1 F 17 1,60 60 0 SIM I 0 B 
2 F 18 1,69 55 2 SIM I 0 R 
3 M 18 1,85 73 1 NÃO M 5 R 
4 M 23 1,85 80 0 NÃO M 4 P 
5 F 19 1,55 50 0 SIM I 2 B 
6 M 19 1,76 60 2 NÃO M 2 P 
7 F 20 1,64 47 1 NÃO P 3 B 
8 F 18 1,62 58 1 SIM I 2 N 
9 F 18 1,64 58 3 NÃO P 10 R 
10 F 17 1,72 70 0 NÃO M 8 B 
11 F 18 1,66 54 2 NÃO P 5 B 
12 F 18 1,70 58 0 NÃO I 2 R 
13 F 21 1,65 63 1 SIM P 1 R 
14 M 18 1,90 85 2 NÃO P 0 B 
 27 
15 M 18 1,65 70 2 NÃO P 0 R 
16 M 19 1,70 70 1 NÃO I 3 P 
17 M 20 1,75 68 3 SIM I 2 N 
18 M 22 1,78 65 4 NÃO P 3 R 
19 M 24 1,79 72 1 NÃO M 5 B 
20 M 23 1,84 81 5 NÃO P 5 B 
21 F 18 1,64 54 2 NÃO I 10 B 
22 F 19 1,70 59 1 NÃO P 6 B 
23 F 21 1,78 60 0 NÃO M 2 R 
24 F 24 1,69 62 1 NÃO I 1 R 
25 F 21 1,72 70 2 NÃO P 7 P 
26 F 19 1,74 65 4 NÃO P 7 B 
27 M 18 1,75 70 1 NÃO P 6 P 
28 F 20 1,67 54 1 NÃO M 5 R 
29 M 20 1,81 76 3 NÃO P 7 B 
30 M 24 1,79 65 0 NÃO P 12 B 
 
Baseado na classificação de variáveis que apresentamos, podemos dizer que são: 
 
SEXO – nominal 
IDADE – discreta 
ALTURA – contínua (pois assume uma grande variedade de valores, embora possamos 
considerá-la discreta) 
PESO – discreta 
IRMÃOS – discreta 
FUMA – nominal 
TOLERÂNCIA – nominal 
EXERCÍCIOS – discreta 
QUALIDADE – ordinal 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 28 
 
RESUMO 
 
As variáveis podem ser classificadas dos seguintes modos: 
 
1) Qualitativas (ou atributos): São características de uma população que não podem ser 
medidas, sendo classificadas em nominais ou ordinais. 
 
 - Nominal : são utilizados símbolos, ou números, para representar determinado tipo de 
dados, mostrando, assim, a qual grupo ou categoria eles pertencem, como sexo, 
nacionalidade, etc. 
 
 - Ordinal : quando uma classificação for dividida em categorias ordenadas em graus 
convencionados, havendo uma relação entre as categorias do tipo “maior do que”, “menor 
do que”, “igual a”, primeiro, segundo, terceiro e, assim, sucessivamente. 
 
2) Quantitativas: São características populacionais que podem ser quantificadas,sendo 
classificadas em discretas e contínuas. 
 
 - Discretas : são aquelas variáveis que podem assumir somente valores inteiros num 
conjunto de valores. É gerada pelo processo de contagem, como o número de veículos 
que passa em um posto de gasolina, o número de estudantes nesta sala de aula. 
 
 - Contínuas : são aquelas variáveis que podem assumir um valor dentro de um 
intervalo de valores. É gerada pelo processo de medição. Neste caso serve como 
exemplo o volume de água em um reservatório ou o peso de um pacote de cereal. 
 
 
 
 
8. Arredondamento de números 
 
Uma questão importante a ser compreendida por todos os estudantes de Estatística é 
quanto ao arredondamento. Raramente um cálculo realizado será exato. O mais comum é 
que os resultados obtidos tenham várias casas decimais. 
 
O primeiro ponto a ser discutido é: “quantas casas decimais eu devo utilizar?” Não há 
uma regra deficinida para isto. O que vale, aqui, é utilizar a coerência e o bom senso . 
Por exemplo, suponhamos que estamos trabalhando o cálculo de valores monetários, em 
reais. O que faz mais sentido neste caso é trabalharmos com 2 casas após a vírgula, visto 
que a terceira casa após a vírgula não faz sentido, ou seja, R$ 3,451 impossibilita, na 
prática, o pagamento de R$ 0,001. Neste caso, o melhor é utilizarmos R$ 3,45. Um outro 
exemplo: se estivermos trabalhando com medidas efetuadas com a régua, podemos 
utilizar até 2 casas após a vírgula, ou seja, faz sentido apresentarmos um resultado do 
tipo 5,43 cm, visto que estaríamos dizendo que a medida obtida tem 5 centímetros, 4 
milímetros e 3 décimos de milímetro (este valor indicaria a incerteza da medida). Porém, 
não vamos discutir nesta apostila incertezas e erros quando utilizamos instrumentos de 
precisão. 
 
 29 
Um segundo ponto a ser notado é a respeito de qual regra de arredondamento devemos 
utilizar. Existem várias maneiras de fazermos o arredondamento de um número, porém, 
vamos utilizar o método tradicional de arredondamento que nos diz: quando a casa 
decimal seguinte àquela que vamos arredondar for 0, 1, 2, 3 ou 4, esta casa decimal 
permanece como está. Se a casa decimal seguinte for 5, 6, 7, 8 ou 9, somamos 1 à casa 
decimal a ser arredondada. Vejamos alguns exemplos. 
 
1) Arredondar 23,4581 para 3 casas decimais. Note que a quarta casa é 1 (menor que 5) . 
Logo, a casa a ser arredondada, que é o número 8, permanece igual. Assim, após o 
arredondamento, temos o número 23,458. 
 
2) Arredondar 3,276 para duas casas decimais. Verificamos que a terceira casa é 6 (maior 
ou igual a 5). Logo, devemos somar 1 à segunda casa decimal. Após o arredondamento o 
número fica 3,28. 
 
3) Arredondar 12,49999 para 1 casa decimal. Como o número da segunda casa decimal é 
maior ou igual a 5, adicionamos 1 unidade ao valor a ser arredondado, ou seja, 4+1=5. 
Logo, o número após o arredondamento fica 12,5. 
 
4) Arredondar para 2 casas decimais o número 35,89076. Como na terceira casa temos o 
zero, mantemos o valor da segunda casa, ou seja, o número após arredondamento fica 
35,89. 
 
5) Arredondar para 2 casas decimais o número 0,39601. Como na terceira casa decimal 
temos um valor superior a 5, devemos somar 1 unidade ao valor da segunda casa. Note, 
porém, que na segunda casa decimal temos o número 9. Pensemos, então, no número 39 
(1ª + 2ª decimais). Somando 1 a esse número, teremos 40. Logo, o número arredondado 
fica 0,40. 
 
 
9. Exercícios 
 
1) Classifique em verdadeiro ou falso as seguintes informações: 
a) Estatística é um conjunto de técnicas destinadas a organizar um conjunto de dados. 
b) Sempre que estivermos trabalhando com números, deveremos utilizar a Inferência 
Estatística. 
c) A Estatística Descritiva fornece uma maneira adequada de tratar um conjunto de 
valores, numéricos ou não, com a finalidade de conhecermos o fenômeno de interesse. 
d) Qualquer amostra representa, de forma adequada, uma população. 
e) As técnicas estatísticas não são adequadas para casos que envolvem experimentos 
destrutivos como, por exemplo, queima de equipamentos, destruição de corpos de 
provas, etc. 
 
2) Um pesquisador está interessado em fazer um levantamento sobre alguns aspectos 
socioeconômicos dos empregados da Companhia MK. Escolha 4 variáveis a serem 
pesquisadas identificando se são qualitativas ou quantitativas. 
 
3) Classifique as variáveis em qualitativas (nominais/ordinais) ou quantitativas (discretas/ 
contínuas). 
a) cor dos cabelos dos alunos de uma escola. 
 30 
b) número de filhos de casais residentes em uma determinada rua. 
c) o ponto obtido em cada jogada de um dado. 
d) naturalidade das pessoas que vivem na cidade de São Paulo. 
e) escolaridade dos funcionários de uma empresa. 
 
4) Diga quais das variáveis são discretas e quais são contínuas: salários, sexo dos filhos, 
número de peças defeituosas produzidas por uma máquina, altura de pessoas, grau de 
instrução, número de filhos, peso. 
 
5) Uma marca de vinho branco importada é vendida na maior parte dos supermercados 
do país. Desejando saber o preço médio de venda, o distribuidor deseja usar uma 
amostragem aleatória com 45 pontos de venda. Especifique um plano de amostragem 
que pode ser utilizado. 
 
6) Suponha que se tenha uma tabela com a relação das 400 maiores empresas do país, 
no ano de 2005, por volume de vendas, listadas em ordem alfabética. Desejando uma 
amostra aleatória de 40 elementos. Qual o tipo de amostragem que pode-se utilizar? 
 
7) Classifique o tipo de amostragem utilizada em cada caso: 
a) Em uma sala de aula composta por 60 alunos arrumados em 6 fileiras de 10 alunos 
cada, toma-se uma amostra de 10 alunos jogando-se um dado e escolhendo os alunos da 
fileira correspondente ao resultado da jogada. 
b) Em uma sala de aula composta por 60 alunos, toma-se uma amostra de 10 alunos 
escolhendo-se um valor qualquer na lista de chamada e selecionando os 10 alunos a 
partir daquele número. Se chegar ao fim da lista antes de completar 10 alunos, volta-se 
ao início da lista, até completar 10 alunos. 
 
8) Complete a tabela a seguir arredondando os números dados para a quantidade de 
casas decimais indicadas: 
 
Número Arred. Para 1 casa Arred. Para 2 
casas 
Arred. Para 3 
casas 
0,215664 
23,45977 
15,0246 
22,4502 
3,1195 
2,951009 
5,6987 
2,10243 
8,145501 
0,00924 
 
 
9) O diretor de uma escola, na qual estão matriculados 280 meninos e 320 meninas, 
desejoso de conhecer as condições de vida extra-escolar de seus alunos e não dispondo 
de tempo para entrevistar todas as famílias, resolve fazer um levantamento por 
amostragem, em 10% dessa clientela. Obtenha, para esse diretor, os elementos 
componentes da amostra. 
 
 31 
10) Em uma escola existem 250 alunos, distribuídos conforme quadro. Obtenha uma 
amostra proporcional estratificada de 40 alunos. 
 
Séries Número de 
alunos 
AMOSTRA 
1a 35 
2a 32 
3a 30 
4a 28 
5a 35 
6a 32 
7a 31 
8a 27 
Total 250 40 
 
11) Uma cidade X apresenta o seguinte quadro relativo às suas escolas de Ensino 
Fundamental. Obtenha uma amostra proporcional estratificada de 120 estudantes. 
 
 Número de 
estudantes 
 AMOSTRA 
Escolas Masculino Feminino Masc. Fem. 
A 80 95 
B 102 120 
C 110 92 
D 134 228 
E 150 130 
F 300 290 
Total 876 955 
 
 
 
12) Classifique as variáveis em qualitativas (nominal ou ordinal) ou quantitativas (discreta 
ou contínua): 
a) número de ações negociadas na bolsa; 
b) número de filhos de um certo casal; 
c) comprimento dos pregos produzidos por uma máquina; 
d) número de volumes na biblioteca da UNIBAN; 
e) salário dos funcionários de uma empresa; 
f) cor predominante da parede externa de sua casa; 
g) grau de escolaridade; 
h) número de horas dormidas na última noite; 
i) tipo de comida preferido; 
j) cargo dos funcionários de uma empresa. 
 
 
 
 
 
 32 
13) Em um local de exame da FUVEST existem 150 funcionários, distribuídos segundo 
seus cargos conforme tabela. Obtenha uma amostraproporcional estratificada de 30 
funcionários. 
 
Cargo Número de 
funcionários 
Amostra 
Coordenadores 4 
Fiscais da coordenação 15 
Fiscais de sala 96 
Auxiliares de Fiscais 24 
Apoio 11 
Total 
 
14) Uma escola apresenta a seguinte distribuição de alunos para o ensino fundamental 
(EF) e ensino médio (EM): 
 
 Número de 
estudantes 
 AMOSTRA 
Série Masculino Feminino Masc. Fem. 
EF – 5ª 65 50 
EF – 6ª 58 48 
EF – 7ª 86 78 
EF – 8ª 95 78 
EM – 1º 150 100 
EM – 2º 140 90 
EM – 3º 106 56 
Total 
 
Obtenha uma amostra proporcional estratificada de 130 estudantes. 
 
15) Uma população encontra-se em três estratos, com tamanhos, respectivamente, n1 = 
40, n2 = 100 e n3 = 60. Sabendo que, ao ser realizada uma amostragem estratificada 
proporcional, nove elementos da amostra foram retirados do 3o estrato, determine o 
número total de elementos da amostra. 
 
16) A tabela abaixo mostra a performance de 6 montadoras de automóveis em um 
determinado mês do ano de 2005. Sabendo-se que foram retiradas amostras 
estratificadas proporcionais, complete a tabela: 
 
Montadora de 
automóveis 
Quantidade de veículos 
produzidos 
Amostra Estratificada 
Proporcional 
A 7200 
B 238 
C 5100 
D 
E 6900 483 
F 182 
TOTAL 2065 
 
 
 33 
17) Um fabricante de computadores produz 8700 máquinas por mês. O departamento de 
qualidade necessita de uma amostra sistemática de 30 peças para teste. Sabendo que a 
1ª máquina selecionada foi a nº 12, então as próximas 4 máquinas foram 
respectivamente: (considere que todas as máquinas estão numeradas de 0001 a 
8700) (Justifique a resposta). 
 
a) 24, 36, 48, 60 
b) 42, 72, 102, 132 
c) 302, 592, 882, 1172 
d) 290, 580, 870, 1160 
 
 
18) A produção diária de uma indústria é de 450 peças. Uma amostra sistemática de 
tamanho 30 será extraída de uma produção, começando pela peça de número 10. 
Assinale a alternativa correspondente aos números das cinco primeiros peças: (justifique 
a resposta) 
 
a) 10 – 25 – 40 – 55 – 70 
b) 10 – 15 – 20 – 25 – 30 
c) 10 – 12 – 14 – 16 – 18 
d) 10 – 20 – 30 – 40 – 50 
 
 
Respostas 
 
1) a) V b) F c) V d) F e) F 
2) resposta pessoal 
3) a) nominal 
b) discreta 
c) discreta 
d) nominal 
e) ordinal 
4) continua, nominal, discreta, contínua, ordinal, discreta, contínua. 
5) Proporcional 
6) Sistemática 
7) a) conglomerado 
b) sistemática 
8) 
Número Arred. Para 1 casa Arred. Para 2 casas Arred . Para 3 casas 
0,215664 0,2 0,22 0,216 
23,45977 23,5 23,46 23,460 
15,0246 15,0 15,02 15,025 
22,4502 22,5 22,45 22,450 
3,1195 3,1 3,12 3,120 
2,951009 3,0 2,95 2,951 
5,6987 5,7 5,70 5,699 
2,10243 2,1 2,10 2,102 
8,145501 8,1 8,15 8,146 
0,00924 0,0 0,01 0,009 
9) 28 homens e 32 mulheres 
10) 
Séries Número de alunos AMOSTRA 
1a 35 6 
2a 32 5 
3a 30 5 
4a 28 4 
5a 35 6 
6a 32 5 
7a 31 5 
8a 27 4 
Total 250 40 
 
 
 
 34 
11) 
 Número de estudantes AMOSTRA 
Escolas Masculino Feminino Masc. Fem. 
A 80 95 5 6 
B 102 120 7 8 
C 110 92 7 6 
D 134 228 9 15 
E 150 130 10 9 
F 300 290 19 19 
Total 876 955 57 63 
 
12) a) discreta b) discreta c) contínua d) discreta e) contínua f) nominal g) ordinal h) discreta i) nominal j) ordinal 
13) 
Cargo Número de funcionários Amostra 
 Coordenadores 4 1 
Fiscais da coordenação 15 3 
Fiscais de sala 96 19 
Auxiliares de Fiscais 24 5 
Apoio 11 2 
Total 150 30 
 
14) 
 Número de estudantes AMOSTRA 
Série Masculino Feminino Masc. Fem. 
EF – 5ª 65 50 7 5 
EF – 6ª 58 48 6 5 
EF – 7ª 86 78 9 8 
EF – 8ª 95 78 10 8 
EM – 1º 150 100 17 12 
EM – 2º 140 90 15 10 
EM – 3º 106 56 12 6 
Total 700 500 76 54 
15) 6+15+9 = 30 
16) 
Montadora de 
automóveis 
Quantidade de veículos 
produzidos 
Amostra Estratificada 
Proporcional 
A 7200 504 
B 3400 238 
C 5100 357 
D 4300 301 
E 6900 483 
F 2600 182 
TOTAL 29500 2065 
 
17) C 
18) A 
 
 35 
3. Organização de Dados 
 
Dado um conjunto de dados, como “tratar” os valores, numéricos ou não, a fim de extrair 
informações a respeito de uma ou mais características de interesse? Basicamente, faz-se 
uso de tabelas de freqüências e gráficos, notando que tais procedimentos devem levar em 
conta a natureza dos dados, pois para cada tipo de variável existem técnicas apropriadas 
para resumir essas informações. 
 
Veremos alguns procedimentos que podem ser utilizados para organizar e descrever um 
conjunto de dados seja em uma população ou uma amostra. 
 
 
1. Representação tabular 
Consiste em dispor os dados em linhas e colunas distribuídas de modo ordenado. A 
elaboração de tabelas obedece à Resolução no 886, de 26 de outubro de 1966, do 
Conselho Nacional de Estatística. As normas de apresentação são editadas pela Fundação 
Brasileira de Geografia e Estatística (IBGE). 
1.1 Representação esquemática 
� Título 
� Cabeçalho 
� Corpo 
� Rodapé 
 
1.2 Elementos de uma tabela 
� Título: O título deve responder as seguintes questões: 
 - O que? (Assunto a ser representado (Fato)); 
 - Onde? (O lugar onde ocorreu o fenômeno (local)); 
 - Quando? (A época em que se verificou o fenômeno (tempo)). 
� Cabeçalho: parte da tabela na qual é designada a natureza do conteúdo de cada 
coluna. 
� Corpo: parte da tabela composta por linhas e colunas. 
� Linhas: parte do corpo que contém uma seqüência horizontal de informações. 
� Colunas: parte do corpo que contém uma seqüência vertical de informações. 
� Coluna Indicadora: coluna que contém as discriminações correspondentes aos 
valores distribuídos pelas colunas numéricas. 
� Casa ou célula: parte da tabela formada pelo cruzamento de uma linha com uma 
coluna. 
 36 
� Rodapé: É o espaço aproveitado em seguida ao fecho da tabela, onde são 
colocadas as notas de natureza informativa (fonte, notas e chamadas). 
� Fonte: refere-se à entidade que organizou ou forneceu os dados expostos. 
� Notas e Chamadas: são esclarecimentos contidos na tabela (nota -conceituação 
geral; chamada -esclarecer minúcias em relação a uma célula). 
 
2. Tabela Primitiva – Rol – Classes 
 
2.1 Tabela primitiva : conjunto de informações disponíveis dos dados da maneira que 
foram coletados inicialmente. 
 
Exemplo: Em uma amostra de latas de óleo de cozinha, foram constatados os seguintes 
volumes em mililitros: 980, 990, 1.000, 970, 980, 1.000, 1.010, 950, 970, 940, 1.020, 1.010, 
920, 990, 950, 900, 1.000, 950, 970 e 1.010. 
 
A seqüência 980, 990, 1.000, 970, 980, 1.000, 1.010, 950, 970, 940, 1.020, 1.010, 920, 990, 
950, 900, 1.000, 950, 970 e 1.010, apresentada desta forma está na forma primitiva . 
 
2.2 Rol : tabela obtida após a organização dos dados. 
No exemplo, apresentando os dados em rol temos: 900, 920, 940, 950, 950, 950, 970, 970, 
970, 980, 980, 990, 990, 1.000, 1.000, 1.000, 1.010, 1.010, 1.010 e 1.020. 
 
2.3 Classe : é um intervalo de variação da variável. 
 
No exemplo anterior podemos separar os elementos da amostra em róis disjuntos (sem 
elementos comuns). 
I. 900, 920 
II. 940 
III. 950, 950, 950 
IV. 970, 970, 970, 980, 980 
V. 990, 990, 1.000, 1.000, 1.000 
VI. 1.010, 1.010, 1.010, 1.020 
 
Podemos formar as seguintes classes com os elementos dessa amostra: 
o intervalo [900, 940[ , que contém o rol I 
o intervalo [940, 950[ , que contém o rol II 
o intervalo [950, 970[ , que contém o rol III 
o intervalo [970, 990[ , que contém o rol IV 
o intervalo [990, 1.010[ , que contém o rol V 
o intervalo [1.010, 1.020] , que contém o rol VI 
 
 
2.4 Amplitude da classe : é a diferença entre o maior e o menor extremo de uma classe, 
nessa ordem. 
 
Por exemplo, a amplitude da classe [900, 940[ é dada por 940 – 900, ou seja, é 40. 
 
 37 
2.5 Notas 
 
1. Os extremos de cada classe não precisam ser, necessariamente, elementos da 
amostra; mas, se forem, deve-se tomar cuidado de não permitir que um mesmo 
elemento pertença a duas classes simultaneamente. Por isso, no exemplo anterior, com 
exceçãodo último intervalo, consideramos os demais abertos à direita. 
 
2. É conveniente que, ao considerar duas classes consecutivas, o extremo à direita 
(aberto) da primeira coincida com o extremo à esquerda (fechado) da segunda. 
 
 
3. Freqüências 
 
3.1 Freqüências simples ou absolutas (f i) - é o número de vezes que a variável 
estatística se repete. São valores que realmente representam o número de dados de 
cada classe. 
 
 ∑ = nfi � nº de elementos da amostra 
 
 
3.2 Freqüências relativas (fr i) – São os valores das razões (quociente) entre as 
freqüências simples e a freqüência total multiplicada por 100 para que os dados sejam 
apresentados em porcentagem: 
 
 100.
∑
=
fi
fi
fri 
 
 
3.3 Freqüência Acumulada Simples (F i) – valores obtidos adicionando a cada 
freqüência absoluta os valores das freqüências anteriores. 
 
Fi = f1 + f2 + …+fk 
ou 
Fi = ∑ fi (i = 1, 2,…, k) 
 
 
3.4 Freqüência Acumulada Relativa (Fr i) – É a freqüência acumulada da classe, dividida 
pela freqüência total da distribuição: 
 
Fri = 
∑ fi
Fi
 
 
 
 
 
 
 38 
Exemplos 
 
a. Consideremos o quadro seguinte que mostra as notas de Estatística dos alunos de 
uma classe. 
 
 
Número 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 
Nota 5,0 4,0 6,0 8,0 3,0 5,0 7,0 6,0 8,0 4,0 6,0 9,0 7,0 5,0 7,0 5,0 6,0 8,0 7,0 9,0 4,0 6,0 6,0 8,0 7,0 
 
•••• população estatística: grupo dos 25 alunos 
•••• unidade estatística: cada aluno desse classe 
•••• variável estatística: notas da prova de Estatística 
 
Os dados apresentados na tabela acima estão na forma primitiva. Colocando-os em rol 
temos: 
 
 3, 4, 4, 4, 5, 5, 5, 5, 6, 6, 6, 6, 6, 6, 7, 7, 7, 7, 7, 8, 8, 8, 8, 9, 9. 
 
A partir desses conhecimentos, elaboramos a seguinte tabela: 
 
i Notas(x i) Nº de alunos(f i) Fi fr i Fr i 
1 3,0 1 1 4% 4% 
2 4,0 3 4 12% 16% 
3 5,0 4 8 16% 32% 
4 6,0 6 14 24% 56% 
5 7,0 5 19 20% 76% 
6 8,0 4 23 16% 92% 
7 9,0 2 25 8% 100% 
 
 
Observando a tabela podemos fazer algumas observações, tais como: 
���� 8 alunos não tiveram nota superior a 5,0. 
���� 84% dos alunos obtiveram nota igual ou superior a 5,0. 
 
 
b. A tabela de distribuição de freqüências abaixo representa a altura de 40 jovens. 
 
i classes f i fr i Fi Fr i 
1 150 l─ 154 4 10,00% 4 10% 
2 154 l─ 158 9 22,50% 13 32,50% 
3 158 l─ 162 11 27,50% 24 60% 
4 162 l─ 166 8 20,00% 32 80% 
5 166 l─ 170 5 12,50% 37 92,50% 
6 170 l─ 174 3 7,50% 40 100% 
 
 
O conhecimento dos vários tipos de freqüências ajuda-nos a responder a muitas questões, 
tais como: 
� Quantos alunos têm estatura entre 154cm e 158cm? 
 39 
� Qual a porcentagem de alunos cujas estaturas são inferiores a 154 cm? 
� Quantos alunos têm estatura abaixo de 162 cm? 
� Qual a freqüência relativa da 5ª classe? 
� Qual a porcentagem de alunos com estatura inferior a 170cm? 
 
 
4. Distribuição de Freqüência 
 
A tabela de dados brutos pode não ser prática para responder às questões de interesse, 
portanto, a partir da tabela de dados brutos, podemos construir uma nova tabela com as 
informações resumidas, para cada variável. Essa tabela é denominada de tabela de 
freqüência (ou distribuição de freqüência) e, como o nome indica, conterá os valores de 
variável e suas respectivas contagens. 
Uma distribuição de freqüência pode ser classificada em discreta e intervalar. 
4.1 Distribuição de Freqüência Discreta : utilizada no caso de variáveis qualitativas ou 
quantitativas discretas na qual o número de observações está relacionado com um ponto 
real (um valor numérico correspondente à quantidade de ocorrências). 
Exemplo : Tabela de freqüência, para a variável Idade, de um grupo de 50 pessoas. 
Idade fi fri 
17 9 0,18 
18 22 0,44 
19 7 0,14 
20 4 0,08 
21 3 0,06 
22 0 0 
23 2 0,04 
24 1 0,02 
25 2 0,04 
total 50 1 
 
4.2 Distribuição de Freqüências Intervalar: utilizada no caso de variáveis quantitativas 
contínuas. 
Já no caso das variáveis contínuas, seus valores podem ser qualquer número real num 
certo intervalo. Esses valores podem apresentar uma variação grande no intervalo em que 
foram medidos, principalmente se trabalharmos com casas decimais. O procedimento mais 
comum nestes casos é construir classes ou faixas de valores e contar o número de 
ocorrências em cada faixa. 
 
Exemplo : Tabela de freqüência, para a variável Peso, de um grupo de 50 pessoas. 
 
 
 40 
Peso fi fri 
40,0 l─ 50,0 8 0,16 
50,0 l─ 60,0 22 0,44 
60,0 l─ 70,0 8 0,16 
70,0 l─ 80,0 6 0,12 
80,0 l─ 90,0 5 0,10 
90,0 l─ 100,0 1 0,02 
total 50 1 
 
Nota : convém notar que, quando estivermos trabalhando com variáveis quantitativas 
discretas mas o conjunto de possíveis valores é muito grande, o caminho adequado é tratar 
a variável como se fosse contínua e criar faixas para representar seus valores. 
 
Regras para elaboração de uma distribuição de freqü ência intervalar: 
1. Determina-se o menor número (limite inferior da primeira classe - Li ) e o maior número 
(limite superior da última classe - Ls ) das observações. 
2. Determina-se a amplitude total (H) fazendo a diferença entre o limite superior e o limite 
inferior (H = Ls – Li) 
3. Definir o número de classes (K), que será calculado utilizando a regra de Sturges 
K = 1 + 3,3 . log n (nº total de dados). 
4. Conhecido o número de classes define-se a amplitude do intervalo de cada classe (h), 
dividindo-se a amplitude total (H) pelo número de classes (k): 
 h = 
k
H
 
���� A amplitude do intervalo de classe deve ser constante em toda distribuição de freqüências 
intervalar. 
5. Com o conhecimento da amplitude de cada classe, definem-se os limites para cada 
classe (inferior e superior) 
Notas : 
1. Na distribuição de freqüência, os intervalos parciais deverão ser apresentados de 
maneira a evitar dúvidas quanto à classe a que permanece determinado elemento. 
2. O tipo de intervalo mais usado é do tipo fechado a esquerda e aberto a direita, 
representado pelo símbolo: |––. 
 
Exemplo : Altura em centímetros de 160 alunos do Curso de Administração da UFSM – 
1990: 
 
 41 
Altura (cm) Xi fi 
150 |--158 18 
158 |--166 25 
166 |--174 20 
174 |--182 52 
182 |--190 30 
190 |--198 15 
Total 160 
Fonte: Departamento de Estatística (1990) 
Exemplo : 
 
5,1 5,3 5,3 5,6 5,8 5,9 6 6,1 6,2 6,2 
6,3 6,3 6,3 6,4 6,4 6,4 6,5 6,5 6,6 6,7 
6,7 6,8 6,8 6,9 6,9 7 7,1 7,1 7,2 7,2 
7,3 7,4 7,5 7,5 7,6 7,6 7,6 7,7 7,7 7,8 
7,8 7,9 7,9 8 8 8,1 8,2 8,3 8,4 8,5 
8,5 8,6 8,7 8,8 8,9 8,9 9 9,1 9,2 9,4 
9,4 9,5 9,5 9,6 9,8 9 9 10 10,2 10,2 
10,4 10,6 10,8 10,9 11,2 11,5 11,8 12,3 12,7 14,9 
 
Utilizando as regras para elaboração de uma distribuição de freqüências, temos: 
1. Valor mínimo ⇒ Li = 5,1 e Valor máximo ⇒ Ls = 14,9 
2. Amplitude total ⇒ H = Ls – Li ⇒ H = 14,9 – 5,1 = 9,8 
3. Número de classes ⇒ k = 1 + 3,3 . log n ⇒ k = 1 + 3,3 . log 80 ⇒ k = 7,28 
4. Amplitude do intervalo de cada classe ⇒ h = 
28,7
8,9
= 1,34 4,1≅ 
5.Com o conhecimento da amplitude de cada classe, define-se os limites para cada classe 
(inferior e superior) 
Intervalo de Classe Freqüência Absoluta Freqüência Acumulada Freqüência Relativa Absoluta 
5,1 |-- 6,5 16 16 20,00% 
6,5 |-- 7,9 25 41 31,25% 
7,9 |-- 9,3 18 59 22,50% 
9,3 |-- 10,7 13 72 16,25% 
10,7 |-- 12,1 5 77 6,25% 
12,1 |-- 13,5 2 79 2,50% 
13,5 |--| 14,9 1 80 1,25% 
 80 ----- 100% 
 42 
5. Exercícios 
 
1. A massa (em quilogramas) de 20 trabalhadores de uma empresa com 100 funcionários 
está registrada a seguir: 52 73 80 65 50 70 80 65 70 77 82 91 52 68 86 70 80. 
 
Com base nos dados obtidos, responda: 
a) Qual a população e a unidade estatística dessa pesquisa?b) Qual é a sua amostra? 
c) Qual é a variável nessa pesquisa? Ela é discreta ou contínua? 
d) Que freqüências absolutas têm os valores 65 kg, 75 kg, 80 kg e 90 kg? 
 
2. Em uma escola, o conceito de cada bimestre é representado por letras: A, B, C, D e E. 
Em um determinado bimestre, os conceitos, em Ciências, dos alunos de uma determinada 
série foram os seguintes: 
 
 CIÊNCIAS 
Número 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 
Conceito B A C C D C D A A C E D D C B C B C C B 
 
 
Nessas condições, elabore um quadro de distribuição de freqüências absolutas e 
freqüências absolutas acumuladas. 
 
3. A cantina de uma escola selecionou 50 alunos ao acaso e verificou o número de vezes 
por semana que eles compravam lanche., obtendo os seguintes resultados: 0; 2; 2; 4; 3; 2; 
2; 1; 1; 2; 1; 1; 0; 1; 1 ; 1; 1; 1; 1; 2; 2; 2; 3; 2; 2; 2; 0; 2; 2; 1; 1; 0; 2; 0; 2; 2; 2; 2; 2; 2; 2; 2; 
2; 2; 2; 2; 1; 2; 5; 4. 
 
a) Construa uma tabela de distribuição de freqüências absolutas e freqüências absolutas 
acumuladas com esses dados. 
b) Quantos alunos compram pelo menos 2 lanches por semana? 
 
4. Numa pesquisa de opinião pública com 800 telespectadores sobre o programa de 
televisão de sua preferência, obteve-se a seguinte tabela de freqüências absolutas: 
 
PROGRAMA NÚMERO DE 
DE TV TELESPECTADORES 
Novelas 360 
Esportes 128 
Filmes 80 
Noticiários 32 
Shows 200 
 
Construa um quadro com distribuição de freqüências relativas. 
 
5. Um dado foi jogado 20 vezes. Em cada jogada foram obtidos os seguintes pontos: 1, 5, 
6, 5, 2, 2, 2, 4, 6, 5, 2, 3, 3, 1, 6, 6, 5, 5, 4, 2. 
 
 43 
a) Elabore um quadro com distribuição de freqüências absolutas, freqüências absolutas 
acumuladas, freqüências relativas e freqüências relativas acumuladas. 
b) Quantas vezes o número 3 foi obtido no dado? 
c) Quantas vezes o número obtido no dado foi menor que 5? 
d) Qual o índice, em porcentagem, em que o número 6 foi obtido no dado? 
e) Qual o índice, em porcentagem, em que números maiores que 4 foram obtidos? 
 
 
6. Veja os principais motivos alegados por 30 000 devedores, pesquisados em uma região 
metropolitana, ao justificar atrasos do crediário ou cheques sem fundo. 
 
 
Quais as freqüências absolutas para cada tipo devedor? 
 
 
7. A tabela abaixo apresenta as vendas de determinado aparelho elétrico, durante um 
mês, por uma firma comercial. Apresente os resultados numa distribuição de freqüência 
discreta. 
 
 14 12 11 13 14 13 
 12 14 13 14 11 12 
 12 14 10 13 15 11 
 15 13 16 17 14 14 
8. Considerando as notas de um teste de inteligência aplicado a 100 alunos, apresentar 
os resultados numa distribuição de freqüência absoluta e relativa. 
 
 64 78 66 82 74 103 78 86 103 87 
 73 95 82 89 73 92 85 80 81 90 
 78 86 78 101 85 98 75 73 90 86 
 86 84 86 76 76 83 103 86 84 85 
 76 80 92 102 73 87 70 85 79 93 
 82 90 83 81 85 72 81 96 81 85 
 68 96 86 70 72 74 84 99 81 89 
 71 73 63 105 74 98 78 78 83 96 
 95 94 88 62 91 83 98 93 83 76 
 94 75 67 95 108 98 71 92 72 73 
 
 
 44 
9. Os salários de 20 funcionários de uma certa empresa estão listados no rol: 525, 579, 
580, 599, 606, 613, 700, 780, 890, 900, 1100, 1150, 1200, 1300, 1300, 1330, 1450 ,1500, 
1500, 1500. 
a) Complete a tabela: 
 
R$ Freq. 
absoluta 
Freq. 
acumulada 
Freq. Relativa 
absoluta 
Ponto médio 
500 l─ 700 
700 l─ 900 
900 l─ 1100 
1100 l─ 1300 
1300 l─l 1500 
total 
 
 Baseado na tabela, responda: 
b) Qual a amplitude total? 
c) Qual a amplitude de classe? 
d) Qual o limite inferior da segunda classe? 
e) Qual o limite superior da terceira classe? 
f) Quantos funcionários ganham pelo menos R$ 1100,00? 
g) Qual a porcentagem de funcionários que ganha no máximo R$ 900,00? 
 
10. A tabela abaixo apresenta uma distribuição de freqüência das áreas de 400 lotes: 
 
1. ÁREAS(m²) 2. Nº de LOTES 
3. 300 l─ 400 4. 14 
5. 400 l─ 500 6. 46 
7. 500 l─ 600 8. 58 
9. 600 l─ 700 10. 76 
11. 700 l─ 800 12. 68 
13. 800 l─ 900 14. 62 
15. 900 l─ 1000 16. 48 
17. 1000 l─ 1100 18. 22 
19. 1100 l─ 1200 20. 6 
 
 
Com referência a essa tabela, determine: 
a) A amplitude total. 
b) O limite superior da quinta classe. 
c) O limite inferior da oitava classe. 
d) O ponto médio da sétima classe (xi). 
e) A amplitude do intervalo da segunda classe. 
f) A freqüência da quarta classe. 
g) A freqüência relativa da sexta classe. 
h) A freqüência acumulada da quinta classe. 
i) O número de lotes cuja área não atinge 700m². 
j) O número de lotes cuja área atinge e ultrapassa 800m². 
k) A porcentagem dos lotes cuja área não atinge 600m². 
l) A classe do 72º lote. 
m) Até que classe estão incluídos 60% dos lotes. 
 45 
n) A porcentagem dos lotes cuja área é de 500 m2, no mínimo, mas inferior a 1000 m2. 
o) A porcentagem dos lotes cuja área seja maior ou igual a 900 m2. 
 
11. Complete a tabela de freqüência abaixo. 
 
i Estaturas(cm ) f i x i fr i Fi Fr i 
1 1150 | 154 4 
152
2
154150 =+ %10100.1,0
40
4 == 
4 10% 
2 1154 | 158 9 13 32,5% 
3 1158 | 162 11 
4 1162 | 166 8 
5 1166 | 170 5 
6 1170 | 174 3 
 ∑= 40 ∑= %100 
 
 
12. Foi realizada uma entrevista com 30 pessoas a respeito do número de irmãos que 
elas possuíam. Os resultados são apresentados no ROL: 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 
1, 1, 1, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 4, 4, 4, 5. 
a) Construa uma tabela com as freqüências absolutas, freqüências absolutas 
acumuladas e freqüências relativas. 
b) Quantas pessoas possuem pelo menos 2 irmãos? 
c) Qual a porcentagem de pessoas que possui no máximo 1 irmão? 
d) Quantas pessoas tem menos que 3 irmãos? 
 
 
13. Os pesos de 40 alunos de uma classe estão descritos abaixo: 
 
 69 57 72 54 93 68 72 58 64 62 
 65 76 60 49 74 59 66 83 70 45 
 60 81 71 67 63 64 53 73 81 50 
 67 68 53 75 65 58 80 60 63 53 
 
Pede-se: 
a) Dispor os dados em um rol; 
b) Construir uma distribuição de freqüência do tipo contínua utilizando a fórmula de 
Sturges. Dado log 40 = 1,60. 
 
14. No quadro a seguir estão registradas as massas, em quilograma, de 50 pessoas que 
freqüentam uma academia de ginástica. 
 
 
72 81 57 64 87 90 74 69 77 73 
80 96 55 58 88 92 47 60 68 80 
77 76 59 57 83 81 90 68 65 74 
91 97 86 82 73 64 69 71 88 94 
77 72 81 91 49 75 52 50 63 70 
 
 46 
Faça uma tabela de distribuição de freqüências contendo: freqüências absolutas, os 
pontos médios dos intervalos e as freqüências relativas. 
 
 
15. Conhecidas as notas de 50 alunos, obtenha uma distribuição de freqüência com 
intervalos de classes iguais a 10 considerando o limite inferior da tabela igual a 30. 
 
84 68 33 52 47 73 68 61 73 77 
74 71 81 91 65 55 57 35 85 88 
59 80 41 50 53 65 76 85 73 60 
67 41 78 56 94 35 45 55 64 74 
65 94 66 48 39 69 89 98 42 54 
 
Determine: 
a) a freqüência relativa 
b) a freqüência acumulada 
c) a freqüência acumulada relativa 
d) o intervalo de maior freqüência 
e) o limite inferior da 5a classe 
f) a amplitude total da distribuição 
g) quantas classes contém pelo menos 15% das observações? 
h) quantos alunos obtiveram nota menor que 50? 
i) quanto alunos obtiveram nota maior ou igual a 70? 
j) qual a porcentagem de alunos que obtiveram nota maior ou igual a 40 e menor que 60?

Outros materiais