Logo Passei Direto
Buscar

metodos_quantitativos_aplicados_a_negocios-1

Ferramentas de estudo

Material
páginas com resultados encontrados.
páginas com resultados encontrados.
left-side-bubbles-backgroundright-side-bubbles-background

Experimente o Premium!star struck emoji

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

left-side-bubbles-backgroundright-side-bubbles-background

Experimente o Premium!star struck emoji

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

left-side-bubbles-backgroundright-side-bubbles-background

Experimente o Premium!star struck emoji

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

left-side-bubbles-backgroundright-side-bubbles-background

Experimente o Premium!star struck emoji

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

left-side-bubbles-backgroundright-side-bubbles-background

Experimente o Premium!star struck emoji

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

left-side-bubbles-backgroundright-side-bubbles-background

Experimente o Premium!star struck emoji

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

left-side-bubbles-backgroundright-side-bubbles-background

Experimente o Premium!star struck emoji

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

left-side-bubbles-backgroundright-side-bubbles-background

Experimente o Premium!star struck emoji

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

left-side-bubbles-backgroundright-side-bubbles-background

Experimente o Premium!star struck emoji

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

left-side-bubbles-backgroundright-side-bubbles-background

Experimente o Premium!star struck emoji

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

Prévia do material em texto

MÉTODOS QUANTITATIVOS
APLICADOS A NEGÓCIOS
MÉTODOS QUANTITATIVOS
APLICADOS A NEGÓCIOS
Fundação Biblioteca Nacional
ISBN 978-85-387-3091-0
Paulo Afonso Bracarense
Ubiratan Vieira Guimarães
M
ét
od
os
 Q
ua
nt
ita
tiv
os
 A
pl
ic
ad
os
 a
 N
eg
óc
io
s
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Métodos Quantitativos Aplicados a Negócios
Paulo Afonso Bracarense
Ubiratan Vieira Guimarães
IESDE Brasil S.A.
Curitiba
2012
Edição revisada
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
© 2008 – IESDE Brasil S.A. É proibida a reprodução, mesmo parcial, por qualquer processo, sem autorização por 
escrito dos autores e do detentor dos direitos autorais.
Capa: IESDE Brasil S.A.
Imagem da capa: Shutterstock
IESDE Brasil S.A.
Al. Dr. Carlos de Carvalho, 1.482. CEP: 80730-200 
Batel – Curitiba – PR 
0800 708 88 88 – www.iesde.com.br
Todos os direitos reservados.
CIP-BRASIL. CATALOGAÇÃO-NA-FONTE
SINDICATO NACIONAL DOS EDITORES DE LIVROS, RJ 
________________________________________________________________________________
B788m
 
Bracarense, Paulo Afonso, 1957-
 Métodos quantitativos aplicados a negócios / Paulo Afonso Bracarense, Ubiratan Vieira 
Guimarães. - 1.ed., rev. - Curitiba, PR : IESDE Brasil, 2012. 
 320p. : 24 cm
 
 Inclui bibliografia
 ISBN 978-85-387-3091-0
 
 1. Negócios 2. Investimentos 3. Investimentos - Análises. I. Guimarães, Ubiratan 
Vieira. I. Título. 
12-6746. CDD: 332.6
 CDU: 336.76
17.09.12 02.10.12 039220 
________________________________________________________________________________
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Paulo Afonso Bracarense
Doutor em Engenharia de Produção com con-
centração em Inteligência Artificial pela Univer-
sidade Federal de Santa Catarina (UFSC). Mestre 
em Estatística e Experimentação Agrícola pela 
Escola Superior de Agricultura Luiz de Queiroz 
(ESALQ-USP). Bacharel em Estatística pela Uni-
versidade Federal do Paraná (UFPR). Professor 
da UFPR. Diretor Superintendente da Fundação 
da Universidade Federal do Paraná (Funpar).
Ubiratan Vieira Guimarães
Mestre em Administração com concentração em 
Sistemas de Informação para Tomada de Deci-
são pela Universidade Federal do Rio Grande do 
Sul (UFRGS). Especialista em Estatística Aplicada 
e Qualidade e Produtividade pelo Instituto Bra-
sileiro de Qualidade Nuclear (IBQN). Bacharel em 
Estatística pela Universidade Federal do Paraná 
(UFPR). Foi diretor executivo do Ibmec Educacio-
nal em Curitiba e Coordenador Acadêmico dos 
Programas Executivos – MBA e CBA do Ibmec MG. 
Atuou na consultoria de grandes empresas e insti-
tuições, tais como: Electrolux S/A, Grupo Positivo, 
Renault, Volvo, Spaipa, Banco Mundial, BID, V&M, 
entre outras. 
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
su
m
ár
io
su
m
ár
io
su
m
ár
io
su
m
ár
io
Introdução – conceitos e aplicações 
9
9 | Público-alvo
10 | Linguagem matemática
11 | Modelagem matemática dos fenômenos reais
12 | Os papéis da teoria de probabilidades e da análise de dados amostrais
13 | Organização dos capítulos do livro
Análise de dados 
19
19 | Problema
23 | Conceitos fundamentais
26 | Variáveis categorizadas
29 | Variáveis quantitativas
36 | Medidas estatísticas
Probabilidades e distribuições de probabilidades 
61
61 | Problema
63 | Conceitos fundamentais
67 | Axiomas e regras de probabilidades
70 | Probabilidades conjunta, marginal, condicional e independência
73 | Teorema de Bayes
75 | Distribuições de probabilidades discretas
80 | Variáveis aleatórias discretas
Amostragem 
95
95 | Problema
96 | Conceitos fundamentais
99 | Tipos de amostragem
103 | Tabela de números aleatórios
105 | Principais técnicas de amostragem
111 | Tamanho da amostra
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Estimação 
129
129 | Problema
130 | Conceitos fundamentais
133 | A distribuição normal
143 | Distribuição amostral das médias
146 | Distribuição amostral das proporções
148 | Estimação por ponto
151 | Intervalo de confiança
156 | Testes de hipóteses
156 | Hipótese nula versus hipótese alternativa
Análise de regressão e de correlação 
173
173 | Problema
174 | Conceitos fundamentais
179 | Construindo a reta de regressão
188 | Verificação da bondade do modelo
201 | Predição e intervalos de predição
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
su
m
ár
io
su
m
ár
io
su
m
ár
io
su
m
ár
io
Teoria da decisão 
213
213 | Problema
214 | Conceitos fundamentais
216 | Critérios de escolha utilizando distribuição a priori
221 | Representação através de diagrama de decisão
223 | Estabelecimento de distribuições de probabilidades
229 | Tomada de decisões baseada na utilidade esperada
230 | Tomada de decisão com probabilidades a posteriori
Análise de séries temporais 
249
249 | Problema
250 | Conceitos fundamentais
254 | Método dos mínimos quadrados ordinários
260 | Modelo de médias móveis
273 | Outros métodos de previsão
Anexos 
289
Referências 
319
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Apresentação M
étodos Q
uantitativos 
A
plicados a N
egócios
Este livro foi escrito com o objetivo de fornecer 
elementos teóricos e técnicos para profissionais 
que necessitam tomar decisões tendo como 
material essencial conjuntos de dados que pre-
cisam ser analisados.
Um conjunto de dados, por si só, não passa de um 
conjunto de dados. É necessário dominar uma 
série de técnicas para que esses dados possam 
gerar alguma informação. O patamar superior 
da análise de dados é a aquisição do conheci-
mento. E ela só estará disponível se ao domínio 
teórico do campo de atuação, à experiência pro-
fissional e de vida e à intuição do tomador de 
decisões forem trabalhadas as técnicas quanti-
tativas necessárias para agregar a esses atribu-
tos informações provenientes de dados correta-
mente adquiridos.
O livro foi organizado de forma a cobrir toda a 
base que compõe o campo de conhecimento da 
Estatística. Começando por técnicas de estatísti-
ca descritiva e de análise exploratória de dados, 
passando pela medição da incerteza através da 
teoria de probabilidades e pela compreensão 
das possibilidades indutivas da teoria clássica 
da Estatística no trato com amostras.
Três técnicas úteis e bastante utilizadas na área 
de negócios foram apresentadas em detalhes 
balanceando-se a complexidade com a explora-
ção da intuição. O trato conceitual foi priorizado 
em relação ao trabalho matemático extensivo. 
Optamos por trabalhar com toda a conceituação 
básica até o quinto capítulo, buscando ajudar o 
leitor a desenvolver sua sensibilidade com re-
lação aos conceitos abordados. Tratamos cada 
técnica com exemplos específicos e ilustrativos 
na área de Negócios.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
A ciência busca compreender os fenômenos 
reais através de modelos, muitas vezes de 
modelos matemáticos muito próprios para 
estudos realizados em ambiente de incer-
teza. A teoria de probabilidades e a teoria 
estatística clássica são ferramentas muito 
úteis para ajudar o tomador de decisões em 
sua opção por diferentes ações diante de 
cenários postos. 
Esperamos que o conteúdo do livro, acom-
panhado das aulas, possa ser de grande valia 
para os leitores. Estamos certos, no entanto, 
que navegar por essas águas fará com que 
cada um se sinta mais confortável em viver 
e trabalhar em um mundo cercado de incer-tezas e que vale mais a pena compreender 
o mundo dessa forma do que viver seguro, 
acorrentado e míope na ilusão das coisas 
certas e absolutas.
M
étodos Q
uantitativos 
A
plicados a N
egócios
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Introdução – conceitos 
e aplicações
Por que escrever mais um livro de Estatística? De fato a literatura já forne-
ce incontáveis livros desse ramo da matemática. Alguns mais teóricos, outros 
mais práticos. Há tentativas inclusive de se escrever livros de estatística sem 
matemática. Há outros que se utilizam fartamente de um referencial comple-
xo na matemática para a discussão dos conceitos e das técnicas estatísticas. 
A grande preocupação dos autores foi oferecer à comunidade estatística e 
principalmente à não estatística elementos que as auxiliassem na tarefa da 
tomada de decisões.
Público-alvo
Os livros de estatística são bem diferentes, pois tratam a mesma questão 
com abordagens diversas. O que leva um autor a escolher o tipo de abordagem, 
a profundidade das discussões e o quanto de ferramental matemático utilizará 
depende fundamentalmente de seu público-alvo. Esta é a chave da questão.
Muito bem, dessa forma devemos então localizar nosso livro em razão do 
nosso público-alvo. Este livro foi escrito para profissionais das mais diferen-
tes áreas do mundo dos negócios: economistas, contadores, engenheiros de 
produção, administradores ou qualquer outro profissional chamado a tomar 
decisões e que esteja no nível de gerência ou pretenda alcançá-lo. E mais, es-
peramos que o nosso público esteja realmente disposto a utilizar as técnicas 
oferecidas no livro em seu dia a dia.
O livro foi composto para um curso esbelto, no sentido de que pretende 
fornecer os elementos mínimos necessários para a utilização de seu conteúdo 
em poucas horas. Por isso, a seleção dos assuntos oferecidos, que são somen-
te uma amostra do vastíssimo campo da Estatística, foi feita rigorosamente, 
com as técnicas mais utilizadas na ação gerencial. Mas há de ficar muito claro 
que não se trata de um manual de aplicações simplificado e essencialmente 
prático. O grande destaque é o rigor conceitual na aplicação das técnicas que 
foram apresentadas sempre através de aplicações em problemas corriquei-
ros da administração.
9Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
10
Introdução – conceitos e aplicações
Esse último destaque norteou toda a redação do livro e é fundamental 
para que o tomador de decisões consiga empregar as técnicas expostas no 
seu trabalho com a segurança necessária para que os resultados obtidos 
possam efetivar mudanças de conduta ou aprofundamento de condutas já 
empregadas. Para que a compreensão conceitual seja de fato um facilitador 
da compreensão das técnicas, ousamos acreditar que seja possível aproxi-
mar do sentimento do leitor o conteúdo técnico da intuição. Por isso, além das 
técnicas, “abusamos” das analogias e não economizamos nas explicações.
Evitamos o uso extensivo da matemática. Ou, de outra forma, utilizamos 
a mínima matemática necessária para a apresentação dos conceitos e para 
a solução dos problemas. Sempre que possível mantivemos o nível de exi-
gência matemática em patamares mais rudimentares possível. Lembrando, 
no entanto, que o livro é dirigido para profissionais que buscam um nível 
de especialização superior ao dos cursos de terceiro grau e, portanto, certas 
resistências ao uso da matemática precisarão ser ultrapassadas. Mas preten-
demos tornar essa tarefa quase indolor.
Linguagem matemática
Toda ciência tem sua linguagem própria, assim, a Estatística tem a sua e a 
Matemática também. Navegaremos por esses mares nem sempre sem turbu-
lências. Duas questões devem ser colocadas a respeito dessas linguagens. 
A primeira é o reconhecimento de que o emaranhado de notações, no-
tadamente na Estatística, muitas vezes conduzem a confusões. Procuramos 
amenizar um pouco essa dificuldade apresentando uma notação única para 
todas as técnicas, expondo o significado de cada uma delas e mantendo-as 
sempre mais próximas do que é o mais usual, de forma que estudos comple-
mentares nas bibliografias sugeridas não se tornem mais um entrave para o 
aprofundamento do conhecimento dos assuntos tratados.
A segunda questão de linguagem, e isso agora diz mais respeito à mate-
mática, é que procuramos evitar a retirada de conclusões através de concei-
tos puramente matemáticos. O caminho de usar a própria matemática para 
induzir ou deduzir conclusões é sim muito fértil para quem tem o domínio 
dessa linguagem. O que você enxerga quando olha a expressão a2 = b2 + 
c2? Se isso quer dizer mais ou menos a mesma coisa do que esta sequência 
de símbolos Д Й Ж, você não deve se preocupar muito. Essas letras não são 
do alfabeto grego nem são runas, são letras do alfabeto cirílico. Um mate-
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Introdução – conceitos e aplicações
11
mático ou uma pessoa habituada com a linguagem matemática enxergará 
prontamente na expressão a2 = b2 + c2 um triângulo retângulo. Mas esse 
nível de exigência não será cobrado neste livro.
Naturalmente, esse conhecimento pode facilitar em certos momentos 
a leitura do texto que estamos apresentando, mas o que o diferenciará da 
maioria dos textos estatísticos possivelmente já encontrados pelo leitor é 
que neste livro não será necessário o domínio dessa linguagem. O que seria 
bastante, não se pode deixar de dizer, mais confortável para quem escreve. 
Mas esse desafio foi extremamente estimulante na redação do texto.
Modelagem matemática dos fenômenos reais
Os fenômenos que estudaremos estão no contexto do mundo da admi-
nistração e dos negócios. Não só eles, mas praticamente todos os fenômenos 
naturais ou não naturais estão eivados de incerteza. Segundo o estatístico 
alemão Schumacher, quando Deus fez o mundo e desejou colocar nele um 
ser inteligente ele pensou em duas situações. A primeira, de fazer o mundo 
completamente determinístico. Depois de muito refletir, concluiu que neste 
mundo não haveria espaço para o homem porque tudo já estaria pré-deter-
minado e a inteligência não seria de nenhuma utilidade. Pensou então em um 
mundo completamente aleatório. Verificou também que não havia porque 
colocar o homem inteligente neste mundo em que nada pode ser determina-
do, em que tudo ocorre devido ao acaso. Concluiu então por um mundo que 
tivesse os dois componentes: um determinístico e outro aleatório. O papel 
da Estatística é o de ajudar a compreender este mundo, particularmente no 
comportamento aleatório dos fenômenos.
A ciência tem procurado compreender os fenômenos da natureza através 
de modelos que possam ajudar o pesquisador a construir uma certa raciona-
lidade para a sua compreensão e muitas vezes para a sua intervenção nos 
fenômenos em foco. Boa parte deles é construída sob pilares matemáticos, 
notadamente quando se utilizam de técnicas estatísticas. Todo modelo cons-
truído dessa forma implica fazer algumas restrições ao comportamento do 
fenômeno. O que se faz então são simplificações para que se possa domar a 
complexidade do mundo real. Isso tem que ficar absolutamente claro. Quanto 
mais complexo for o fenômeno em estudo, mais complexo será o instrumen-
tal racional para compreendê-lo.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
12
Introdução – conceitos e aplicações
Esse limite tem que ser compreendido para não correr o risco de pensar 
que o modelo possa substituir a realidade. E mais, a grande maioria dos com-
pêndios estatísticos alerta para o fato de que ela, a Ciência Estatística, é um 
servidor leal quando usada com prudência e sem arrogância. Ela compõe o 
espectro das peças de evidência na solução de problemas que devem auxi-
liar o tomador de decisões aliada ao conhecimento teórico da matériaem 
estudo, da experiência extraestatística e mesmo da intuição de quem deseja 
administrar bem ou praticar a boa ciência. Como peça de evidência, ela serve 
mais para dar suporte do que fazer descobertas. Na fábula descrita pelo es-
critor escocês Andrew Lang, ele recomenda usar a Estatística como o bêbado 
usa o poste, mais para apoio do que para iluminação.
A forma básica dos modelos construídos para os fenômenos que compor-
tam incerteza e são tratados através de modelagem matemática é: Y = f(x) + ε. 
Nesse modelo, f(x) é a componente determinística e ε, a componente aleatória. 
A tarefa do tomador de decisões é verificar, com base em alguma teoria que 
envolva o assunto pesquisado, quais podem ser as alternativas para f(x) que 
expliquem variações de Y, e fazer suposições sobre o comportamento de ε que 
o auxiliem no entendimento das variações devidas ao acaso.
Os papéis da teoria de probabilidades 
e da análise de dados amostrais
A componente aleatória, ε, é chamada de erro estatístico ou resíduo. Nela 
estão todas as variáveis menos importantes que podem explicar as variações 
de Y e também aquela parte genuinamente devida a oscilações ocorridas ao 
mero acaso. 
Quando se fala de incerteza, de acaso, fala-se tradicionalmente de proba-
bilidade. Mais recentemente, outras formas de se medir incerteza têm sido 
propostas, como a lógica “fuzzy”, por exemplo, que ultrapassa os limites da 
lógica clássica por admitir outros resultados, que não somente o dicotômi-
co sim ou não, base aristotélica de toda a lógica clássica a partir da qual foi 
construída a teoria de probabilidades. Mas para efeito do estudo das técni-
cas apresentadas neste livro, construiremos toda a metodologia baseando- 
-nos na probabilidade como medida de incerteza.
Dessa forma, a probabilidade pode ser definida como uma medida racional 
de crença. Ela é definida como um número entre 0 e 1 e busca medir o grau 
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Introdução – conceitos e aplicações
13
de incerteza associada a um fenômeno que no geral pode ser compreendi-
do como alguma espécie de jogo em que fazemos apostas. As decisões são 
então tomadas com base em quanto estamos dispostos a pagar no caso de 
perdermos a aposta realizada. Naturalmente, se as consequências de nossa 
decisão errada forem muito graves, optaremos por apostar menos ou so-
mente apostar com um certo grau mínimo de incerteza.
As técnicas estatísticas utilizam-se fartamente de levantamento de dados 
para a compreensão do fenômeno em estudo. Esses dados podem ser relati-
vos a toda uma população ou a uma parte dela chamada de amostra. Deseja-
mos, obviamente, que a amostra represente a população como um todo. Fa-
remos observações na amostra e a partir delas desejaremos fazer inferências 
para a população. Veremos fartamente como isso pode ser feito, com rigor 
científico, de forma a nos assegurarmos de que podemos compreender um 
comportamento da população a partir do comportamento da amostra.
Organização dos capítulos do livro
Convém, no entanto, antes de buscarmos fazer ilações sobre a popula-
ção com base na amostra, explorar ao máximo as informações que os dados 
podem fornecer. Esta tarefa pode ser facilitada com o emprego de técnicas 
de estatística descritiva e de análise exploratória de dados. Esses assuntos 
serão tratados no capítulo 2 deste livro. Estudaremos as melhores formas de 
tabular dados, de apresentá-los em gráficos adequados e de construir medi-
das que sintetizem as informações necessárias para compreensão do fenô-
meno. Construir essas medidas tem por objetivo verificar o comportamen-
to dos dados, que valores podem representar o comportamento geral dos 
dados e como eles estão distribuídos em torno de valores centrais e assim 
por diante.
Quando falamos em amostragem, estamos de antemão reconhecendo 
que um grau de incerteza está associado às medidas realizadas na amos-
tra como candidatas a facilitadoras da compreensão do comportamento da 
população. Essa incerteza, como já especificado, será tratada tendo como 
base a teoria de probabilidades, que será o tema do capítulo 3. Este capítulo 
é, entre todos, o que necessitará de maior trabalho matemático. Entretanto, 
essa talvez não seja a maior dificuldade do conteúdo do capítulo, mas sim a 
compreensão dos limites dos cálculos que faremos. 
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
14
Introdução – conceitos e aplicações
No lance de uma moeda honesta, a probabilidade de sair cara em um 
lance pode ser ½ ou um outro valor qualquer dependendo do que estamos 
medindo. Se atirarmos a moeda cinco vezes, a probabilidade de sair cara exa-
tamente no quinto lance é sempre ½? Depende de como olhamos o proble-
ma. Se olharmos somente para o quinto lance como um lance isolado, não 
há dúvidas do valor ½ para a probabilidade de sair cara. Mas se por outro 
lado estivermos interessados em calcular qual a probabilidade de sair cara 
no quinto lance, após quatro coroas, a probabilidade de sair cara não será 
mais igual a ½, com certeza será um valor muito menor, conforme veremos 
quando estudarmos o capítulo de probabilidades. Esse fato não é intuitiva-
mente tão fácil de ser percebido. E mostrar isso intuitivamente é mais difícil 
do que o simples cálculo dessa probabilidade. Aqui, a linguagem matemá-
tica facilitaria enormemente a compreensão do que está ocorrendo. Vamos 
tentar compor essas duas formas de encarar o problema. 
Tendo então a noção da probabilidade, poderemos voltar ao trabalho 
de destrinchar o comportamento dos dados através do estudo da forma de 
produzi-los. Uma vez que nos deteremos fundamentalmente em retirar de 
uma população uma amostra de seus indivíduos para quando estivermos 
estudando-os, compreenderemos o comportamento da população. Tere-
mos que verificar quais são as melhores formas de se retirar esses dados e 
de que tamanho deverá ser essa parte da população para que tenhamos 
alguma segurança, medida através de probabilidades, em fazer afirmações 
sobre a população. 
Na matéria que será tratada no capítulo 4, estudaremos técnicas simples 
mas eficientes de buscarmos amostras representativas da população. Não 
temos dúvidas que após esse estudo o leitor aceitará o fato de que as pes-
quisas podem representar bem a opinião de eleitores ou de consumidores 
quando falarmos de pesquisa de mercado. No momento pode ainda parecer 
intuitivamente incorreto que uma amostra de tamanho 400 possa represen-
tar os eleitores de um município, mas que talvez uma amostra de 1 000 não 
represente bem os eleitores de um bairro da cidade.
A nossa pretensão de falar da população com base em elementos da 
amostra passa pela compreensão de que descreveremos tanto a população 
como a amostra através de medidas estatísticas e da forma de comportamen-
to dos dados que serão descritos através de distribuições de probabilidades. 
Rigorosamente, essas medidas estatísticas serão medidas da própria distri-
buição dos dados. 
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Introdução – conceitos e aplicações
15
Essa parte da estatística é chamada de inferência estatística ou de esta-
tística indutiva. Ela será tratada no capítulo 5, sobre estimação, em que três 
procedimentos serão estudados. O primeiro deles é a chamada estimação 
por pontos, na qual calculamos um valor na amostra, por exemplo, a média 
de uma variável, que deverá servir como uma estimativa da média da po-
pulação. O segundo procedimento, chamado de estimação por intervalos 
ou construção de intervalos de confiança, consiste em criar em torno do 
valor do estimador pontual um intervalo em que esse valor possa estar 
contido; associaremos esse intervalo a um certo nível de confiança, rela-
cionado com uma medida de probabilidade. E o terceiro procedimento é 
o de se fazer alguma afirmação sobre o valor de uma medida na popula-
ção atravésdo estabelecimento de uma hipótese e então realizar um teste 
sobre essa declaração associado a uma certa probabilidade de estar-se er-
rando na decisão. Esse procedimento é conhecido como teste de hipóteses 
estatísticas.
O conteúdo até esse ponto do livro é o mínimo obrigatório a qualquer 
livro que pretenda apresentar o principal da teoria que envolve a enormi-
dade de procedimentos estatísticos que podem servir de auxílio na tomada 
de decisões. É a partir desse ponto que os autores de livros de estatística 
devem decidir, de acordo com as necessidades do público que querem atin-
gir, quais são as técnicas úteis para cumprir o seu objetivo. Optamos por tra-
balhar com três técnicas que podem ser amplamente utilizadas no auxílio à 
tomada de decisões gerenciais para profissionais interessados nos chama-
dos “negócios”. 
Não pretendemos com essa opção sugerir que essas técnicas sejam su-
ficientes. Muito pelo contrário, gostaríamos de poder estimular os leitores a 
buscarem um maior aperfeiçoamento com a pesquisa na literatura de outras 
técnicas também úteis. Contamos que esse marco introdutório, disponível 
até o capítulo 5, forneça instrumentos ao leitor para novas aventuras. No en-
tanto, a nossa prática no trabalho de aplicação de métodos estatísticos aplica-
dos a negócios nos leva a apresentar essas técnicas neste livro por compreen-
dermos que cobrem bem uma possível lacuna no gerenciamento.
Elas são apresentadas nos capítulos de 6 a 8. No capítulo 6 discutiremos 
Análise de Regressão e Correlação, no capítulo 7 a Teoria de Decisão Estatís-
tica e no capítulo 8 a Análise de Séries Temporais e Modelos para Previsão de 
Demanda.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
16
Introdução – conceitos e aplicações
Outras técnicas estatísticas são bastante úteis dependendo do ramo de 
atuação de cada leitor. Técnicas como: Controle Estatístico de Qualidade; 
Análise de Confiabilidade e de Sobrevivência; Análise de Credit Score; Plane-
jamento de Experimentos; Análise de Dados Categorizados; Análise de Dados 
Longitudinais; Números Índices; Matemática Atuarial; Processos Estocásticos 
e Teoria de Filas; Análise Multivariada; Análise de Variância; Testes Não Para-
métricos; Geoestatística; Estatística Espacial; Processos Estocásticos; e mais 
uma infinidade de técnicas estatísticas estão disponíveis para aplicações. 
Para cada um desses tópicos há uma enormidade de livros específicos, 
da mesma forma que há uma enormidade de outros livros para cada um 
dos capítulos que estamos apresentando. A abordagem de cada um desses 
livros, o grau de complexidade dos conceitos e da matemática envolvidos é 
que fazem de cada obra uma obra única.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Análise de dados
Problema
O departamento de Recursos Humanos da empresa ABC deseja reade-
quar os salários de seus funcionários a partir de uma nova política de cargos e 
salários. A primeira providência do coordenador do departamento foi verifi-
car o perfil dos funcionários da empresa. 
Solicitou para um estudo preliminar a relação dos funcionários em que 
deveria constar algumas variáveis para esse primeiro estudo: ordem de con-
tratação, sexo, idade, salário e setor.
Um auxiliar administrativo apresentou o seguinte quadro como resultado:
Número de 
ordem Nome Sexo Idade
Salário 
(R$) Setor
1 A. L. Ferraz M 49 1.714,00 Oper.
2 R. Abreu M 48 1.701,00 Oper.
3 R. S. Reis M 64 1.589,00 Oper.
4 N. Farias F 37 1.418,00 Oper.
5 J. L. Jansen F 42 1.000,00 Aux. Adm.
6 U. S. Machado M 40 3.732,00 Téc.
7 F. Nogueira F 21 1.330,00 Oper.
8 M. Pinheiro F 33 1.307,00 Oper.
9 M. A. da Silva M 39 1.282,00 Oper.
10 P. A. B. Costa F 42 1.260,00 Oper.
11 H. F. Minho F 39 975,00 Aux. Adm.
12 N. M. de Lima M 32 1.256,00 Oper.
13 C. F. Loureiro M 22 1.185,00 Oper.
19Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
20
Análise de dados
Número de 
ordem Nome Sexo Idade
Salário 
(R$) Setor
14 M. E. M. Ferreira M 21 3.535,00 Téc.
15 J. A. Isaias F 37 2.956,00 Téc.
16 J. Martins F 24 1.179,00 Oper.
17 A. P. Ribeiro M 28 966,00 Aux. Adm.
18 L. C. Batista M 32 3.204,00 Adm.
19 A. F. dos Santos M 31 881,00 Aux. Adm.
20 C. A. Brandão F 38 3.080,00 Adm.
21 D. J. Feltrin M 23 2.872,00 Téc.
22 L. S. Prestes M 22 826,00 Aux. Adm.
23 J. L. Campos M 46 1.010,00 Oper.
24 S. I. Magalhães F 34 708,00 Aux. Adm.
25 P. R. Gonçalves M 47 2.960,00 Adm.
26 M. I. Machado M 42 2.797,00 Téc.
27 M. Paraná F 32 1.001,00 Oper.
28 U. V. Guimarães F 29 2.315,00 Adm.
29 E. M. Moreira M 41 5.572,00 Ger.
30 A. P. de Andrade M 30 2.372,00 Téc.
31 L. R. de Souza F 51 4.829,00 Ger.
32 R. T. Moraes F 23 1.826,00 Adm.
33 J. Pilloto M 20 540,00 Oper.
34 F. C. Lopes F 27 489,00 Oper.
35 C. A. Meier F 33 479,00 Oper.
36 H. O. Silveira F 22 1.904,00 Téc.
37 K. D. Almeida M 41 659,00 Aux. Adm.
38 M. J. D. Colares F 34 1.827,00 Téc.
39 R. F. L. Silvério M 24 472,00 Oper.
40 M. N. Messias F 20 640,00 Aux. Adm.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Análise de dados
21
Os dados apresentados foram organizados de forma a oferecer ao coorde-
nador do departamento de Recursos Humanos as informações que revelassem 
a distribuição dos salários segundo as variáveis: (I) número de ordem, no sen-
tido que o mais antigo na casa recebeu o número 1 e o mais novo o número 
40, não importando muito o tempo de contratação, uma vez que a empresa 
foi constituída há pouco tempo, (II) o sexo, (III) a idade, (IV) o salário e (V) 
o setor, dividindo os funcionários segundo as funções: operacional (Oper.), 
auxiliar administrativo (Aux. Adm.), técnico (Téc.), administrativo (Adm.) e ge-
rência (Ger.), sendo uma gerência técnica e outra administrativa.
O coordenador analisou a tabela e verificou imediatamente que os funcio-
nários mais antigos eram na sua maioria do setor operacional, exceto dois auxi-
liares administrativos. Observou também que poucos funcionários ganhavam 
menos do que R$1.000,00 e que havia uma pequena predominância de funcio-
nários do sexo masculino. Viu que o Reis de fato era o funcionário mais velho, 
com 64 anos, e que a empresa não tinha nenhum funcionário com menos de 20 
anos. Verificou também que ele próprio era o décimo oitavo contratado como 
também que entre os administradores era o mais antigo e que o seu salário 
era o maior comparado com seus pares, R$3.204,00. Concluiu, finalmente, que 
da forma como os dados foram apresentados estava com dificuldade de tirar 
maiores informações sobre a distribuição de cargos e salários.
Chamou um dos administradores e pediu que ele organizasse um pouco 
melhor os dados e que em termos gerais não importava o nome das pessoas. 
Foi prontamente atendido e recebeu o seguinte novo quadro:
Sexo Idade Setor Número de ordem
Salário
(R$)
Média salarial
M 41 Ger. 29 5.572,00
F 51 Ger. 31 4.829,00 5.200,50
M 40 Téc. 6 3.732,00
M 21 Téc. 14 3.535,00
F 37 Téc. 15 2.956,00
M 23 Téc. 21 2.872,00
M 42 Téc. 26 2.797,00
M 30 Téc. 30 2.372,00
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
22
Análise de dados
Sexo Idade Setor Número de ordem
Salário
(R$)
Média salarial
F 22 Téc. 36 1.904,00
F 34 Téc. 38 1.827,00 2.749,38
M 32 Adm. 18 3.204,00
F 38 Adm. 20 3.080,00
M 47 Adm. 25 2.960,00
F 29 Adm. 28 2.315,00
F 23 Adm. 32 1.826,00 2.677,00
M 49 Oper. 1 1.714,00
M 48 Oper. 2 1.701,00
M 64 Oper. 3 1.589,00
F 37 Oper. 4 1.418,00
F 21 Oper. 7 1.330,00
F 33 Oper. 8 1.307,00
M 39 Oper. 9 1.282,00
F 42 Oper. 10 1.260,00
M 32 Oper. 12 1.256,00
M 22 Oper. 13 1.185,00
F 24 Oper. 16 1.179,00M 46 Oper. 23 1.010,00
F 32 Oper. 27 1.001,00
M 20 Oper. 33 540,00
F 27 Oper. 34 489,00
F 33 Oper. 35 479,00
M 24 Oper. 39 472,00 1.130,12
F 42 Aux. Adm. 5 1.000,00
F 39 Aux. Adm. 11 975,00
M 28 Aux. Adm. 17 966,00
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Análise de dados
23
Sexo Idade Setor Número de ordem
Salário
(R$)
Média salarial
M 31 Aux. Adm. 19 881,00
M 22 Aux. Adm. 22 826,00
F 34 Aux. Adm. 24 708,00
M 41 Aux. Adm. 37 659,00
F 20 Aux. Adm. 40 640,00 831,88
Com o novo quadro pôde verificar uma série de novas informações, tais 
como média salarial e número de funcionários por categoria, e também que 
havia uma certa coerência dentro de cada categoria com relação ao tempo 
de serviço e salário, ou seja, funcionários mais antigos da mesma categoria 
recebiam salários maiores. Mas sobre sexo e idade e as suas relações com as 
demais informações ainda havia muita dificuldade em tirar conclusões.
Esse tipo de problema é colocado no dia a dia do tomador de decisões. 
Os dados individuais, por mais bem organizados que estejam, trazem poucas 
informações. É necessário que sejam sintetizados através de tabelas, gráficos 
e medidas que possam resumir a informação de uma forma agregada.
Conceitos fundamentais
A Estatística Descritiva, que mais modernamente, com a incorporação de 
novas técnicas, é chamada de Análise Exploratória de Dados, pode suprir a 
necessidade de uma primeira organização dos dados de forma a transfor-
má-los verdadeiramente em informação.
As técnicas utilizadas na exploração dos dados tiveram uma evolução 
muito grande com o advento da computação e particularmente de progra-
mas que facilitam essas tarefas. Para o senso comum, a Estatística resume-se 
a esse trabalho. Veremos nos capítulos seguintes que esse é somente um 
primeiro importante passo na organização das informações para aquisição 
do conhecimento de modo a auxiliar a tomada de decisões.
Fundamentalmente, a análise de dados compreende três frentes: orga-
nização de tabelas, construção de gráficos e síntese dos dados através do 
cálculo de medidas estatísticas.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
24
Análise de dados
Variáveis quantitativas e categorizadas
Associadas a cada indivíduo, temos medidas e atributos que o definem. 
As medidas são características de variáveis quantitativas e os atributos são 
características de variáveis categorizadas ou qualitativas.
As variáveis quantitativas podem ser contínuas ou discretas. Elas são contí-
nuas quando entre dois quaisquer valores possam estar novos valores. As va-
riáveis quantitativas contínuas são frutos de medidas que podem ser expres-
sas pelos números reais. O salário dos empregados de uma empresa pode 
ser considerado uma variável contínua. As variáveis são discretas quando são 
fruto de contagem e podem ser expressas através de números inteiros, como 
a idade dos funcionários. Uma outra característica importante das variáveis 
quantitativas é que podemos fazer operações matemáticas com seus valores, 
como soma, subtração, multiplicação e divisão.
As variáveis categorizadas ou qualitativas são expressas em escalas ordinais, 
como é o caso da ordem em que os funcionários foram contratados, ou expres-
sas em categorias ou escalas nominais, como o sexo do funcionário ou o setor 
em que ele trabalha. Não se pode, nesse caso, fazer operações matemáticas.
Valor discrepante ou outlier
Um valor discrepante ou outlier é um valor que destoa do conjunto prin-
cipal dos dados.
Tabelas e quadros estatísticos
Existe uma pequena diferença entre quadro estatístico e tabela estatística. 
A tabela estatística é o resultado de alguma forma de resumo dos dados. 
As linhas à esquerda e à direita de uma tabela estatística nunca devem ser 
fechadas segundo as normas da ABNT. Elas são utilizadas para apresentação 
de resultados estatísticos e também como ferramenta de desenvolvimento 
de operações. Uma tabela bastante importante utilizada em estatística é a 
distribuição de frequências. 
Já o quadro serve para apresentação de dados, como os do exemplo, ou para 
apresentação de resultados-resumo, como um quadro de médias, por exemplo. 
O quadro pode ter seus limites à esquerda e à direita fechados por linhas.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Análise de dados
25
Apresentação gráfica
Os dados de uma tabela estatística podem ser apresentados através 
de gráficos estatísticos, devendo o tipo de gráfico ser compatível com a 
natureza dos dados. Os principais gráficos são: o gráfico de colunas ou de 
barras, o gráfico de setores ou pizza, o gráfico de bastões, o gráfico de linhas 
e o histograma. 
Existem, na análise exploratória de dados, algumas apresentações grá-
ficas que auxiliam a compreensão do comportamento dos dados, como 
o ramo e folhas, o esquema de cinco números e o diagrama de caixas ou 
Box-plot.
O detalhamento da utilização de cada tipo de gráfico será ainda assunto 
deste capítulo.
Medidas estatísticas
A utilização de medidas estatísticas serve para resumir os dados através de 
valores representativos. Existem quatro tipos de medidas utilizadas: medidas 
de posição, de dispersão, de assimetria e as de achatamento ou de curtose. 
As medidas de posição objetivam verificar pontos que representem o con-
junto de dados. Elas podem ser medidas de tendência central, como a média, 
por exemplo, que mostra em torno de que ponto os dados se concentram 
ou as separatrizes, que informam o valor em que os dados se dividem em 
quatro, dez ou cem partes.
As medidas de dispersão mostram a intensidade de concentração dos 
dados em torno de medidas de tendência central. As principais medidas de 
dispersão são a variância, o desvio-padrão e o coeficiente de variação.
As medidas de assimetria são utilizadas para verificar se os dados são simé-
tricos em relação a um valor central, e as de curtose para verificar se o gráfico 
de dados concentra-se em valores próximos ao eixo X ou se distanciam dele. 
Essas últimas medidas de achatamento são de menor interesse na análise de 
dados, e não serão tratadas neste livro.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
26
Análise de dados
Variáveis categorizadas
As variáveis categorizadas são medidas de atributos, como sexo, grau de 
instrução, setor de trabalho, categoria profissional, preferência eleitoral etc. 
Os indivíduos estão relacionados a alguma categoria dentro de cada variá-
vel, como sexo e categoria dos empregados da empresa ABC.
Distribuição por sexo
A tabela e os gráficos abaixo apresentam a distribuição por sexo dos indi-
víduos da empresa ABC.
Tabela 1 – Sexo dos empregados da empresa ABC
Sexo Número Perc.
Fem. 19 47,5%
Masc. 21 52,5%
Total 40 100,0%
Um gráfico estatístico objetiva dar a impressão visual da representação 
dos dados. Os gráficos adequados para a representação dessa tabela são os 
de colunas ou de barras e o gráfico de setores.
Gráfico de colunas
Fem. Masc.
20
15
10
5
0
Sexo
Distribuição por sexo
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Análise de dados
27
Gráfico de barras
Fem.
Masc.
20151050
Sexo
Distribuição por sexo
Número
Gráfico de setores
Distribuição por sexo
48%
Fem.
Masc.
52%
O gráfico de setores é útil quando queremos observar o valor relativo da 
participação de cada categoria no total.
Distribuição por categoria profissional
A tabela e os gráficos apresentam a distribuição dos indivíduos por cate-
goria profissional na empresa:
Tabela 2 – Categoria dos empregados da empresa ABC
Categoria Número Perc.
Gerência 2 5,0%
Adm. 5 12,5%
Téc. 8 20,0%
Aux. Adm. 8 20,0%
Oper. 17 42,5%
Total 40 100,0%
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
28
Análise de dados
Gráficode colunas
8
6
4
2
0
Gerência
Categoria dos empregados da Empresa ABC
14
12
10
16
18
Adm. Téc. Aux. Adm. Oper.
N
úm
er
os
Gráfico de setores
Categoria dos empregados da Empresa ABC
20%
Gerência
Adm.42%
Téc.
Aux. Adm.
Oper.
5%
13%
20%
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Análise de dados
29
Variáveis quantitativas
As variáveis quantitativas, sejam elas discretas ou contínuas, são apre-
sentadas através da chamada distribuição de frequências. Nos dois casos po-
demos construir distribuições de frequências, que, como o próprio nome 
indica, informam, através de tabelas, quais são os valores da variável e qual a 
frequência de ocorrência de dados para cada um desses valores.
No caso de variável contínua, ou mesmo de variável discreta com um 
grande número de possibilidades, é comum a construção de classes em que 
mais de um valor é contemplado.
Distribuição de frequências
Vamos estudar inicialmente o caso de uma variável discreta através da 
verificação da distribuição de frequências das idades dos funcionários. Pode 
ser de interesse saber qual é a distribuição de idade dos funcionários com 
menos de trinta anos. A tabela da distribuição de frequências corresponden-
te a esses dados será:
Distribuição de frequências dos 
funcionários com menos de 30 anos
Idade Freq.
20 2
21 2
22 3
23 2
24 2
25 0
26 0
27 0
28 1
29 1
Total 13
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
30
Análise de dados
O gráfico correspondente à distribuição de frequências dessas idades é o 
gráfico de bastões:
2
1,5
1
0,5
0
3,5
3
2,5
1 2 3 4 5 6 7 8 9 10
Diagrama ramo e folhas
Uma outra forma de representação gráfica utilizando as próprias idades é 
o chamado diagrama ramo e folhas, em que o ramo representa os algarismos 
relativos às dezenas e as folhas os algarismos relativos à unidade.
Ramo e folhas das idades dos 40 funcionários:
2 00112223344789
3 01222334477899
4 0112226789
5 1
6 4
Observe o aspecto da informação gráfica do diagrama ramo e folhas em 
analogia ao histograma apresentado na sequência. A vantagem de sua uti-
lização é que ele mostra o desenho da distribuição sem perder a informação 
detalhada.
Poderíamos, eventualmente, considerar a idade como uma variável ale-
atória contínua cuja representação está aproximada para os valores inteiros 
das idades. A rigor, a variável idade é mesmo contínua, porque podería-
mos medir o tempo de vida em anos, dias e mesmo segundos. Nesse caso, 
poderíamos construir classes entre certas idades de tal forma que elas repre-
sentassem um contínuo. 
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Análise de dados
31
Histograma
A representação gráfica da tabela da distribuição de frequências, quando 
organizada em classes, recebe o nome de histograma. É um gráfico de colu-
nas adjacentes representando um contínuo.
Distribuição de frequência das idades
Idade Freq. Perc.
20 a 29 14 35,0%
30 a 39 14 35,0%
40 a 49 10 25,0%
50 a 59 1 2,5%
60 ou + 1 2,5%
Total 40 100,0%
Histograma
Idade
Distribuição de frequência das idades
20 a 29 anos
8
6
4
2
0
14
12
10
16
Fr
eq
.
30 a 39 anos
40 a 49 anos
50 a 59 anos
60 anos ou mais
1
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
32
Análise de dados
Distribuição dos salários
Salário (R$) Freq. Freq. rel.
Até 1.000,00 11 0,27
De 1.000,00 a 1.999,00 17 0,43
De 2.000,00 a 2.999,00 6 0,15
De 3.000,00 a 3.999,00 4 0,10
Acima de 4.000,00 2 0,05
Total 40 1,00
Histograma
Distribuição salarial
Até 100
8
6
4
2
0
14
12
10
16
Fr
eq
.
De 1.000 a 1.999
De 2.000 a 2.999
De 3.000 a 3.999
Acima de 4.000
Salários (R$)
1
18
Elementos de uma distribuição de frequências
A distribuição de frequências, como apresentada, é útil não só para apre-
sentação de dados, mas para análises um pouco mais aprofundadas. Vamos 
reapresentar a distribuição de frequências dos salários de uma maneira mais 
matematicamente formal.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Análise de dados
33
Salário (R$) Freq. Freq. rel.
X < 1.000,00 11 0,27
1.000,00 ≤ X < 2.000,00 17 0,43
2.000,00 ≤ X < 3.000,00 6 0,15
3.000,00 ≤ X < 4.000,00 4 0,10
X ≥ 4.000,00 2 0,05
Total 40 1,00
Observe agora que a distribuição é apresentada como um contínuo. Não 
há descontinuidade entre R$1.999,00 e R$2.000,00, podemos, assim, ter a 
representação de qualquer valor como R$1.999,85, por exemplo.
Definimos cinco classes. O número de classes de uma distribuição de fre-
quências não deve ser muito grande. Em torno de cinco a oito classes é um 
número bastante razoável e elas devem ter igual amplitude. No nosso caso, 
como temos poucos valores acima de R$4.000,00 agregaremos todos esses 
valores na última classe. Cada uma delas tem um limite inferior de classe e um 
limite superior. A diferença entre o limite superior e o limite inferior chama-
mos de amplitude do intervalo de classe. 
Podemos ainda definir o ponto médio de cada classe. Esse valor será 
útil para a determinação das medidas estatísticas quando não tivermos os 
dados brutos. O ponto médio representará todos os valores da classe. Entre 
R$1.000,00 e R$2.000,00 temos 17 valores. Todos eles serão considerados 
como R$1.500,00. Perdemos um pouco em informação, mas ganhamos em 
poder de síntese.
A frequência relativa será uma aproximação de probabilidades. A proba-
bilidade de sortearmos um dos 40 funcionários e que esse sorteado per-
ceba um salário entre R$3.000,00 e R$4.000,00 será de 4/40 ou de 0,10. 
Formalmente, temos que P(3.000 ≤ X < 4.000) = 0,10. Podemos dizer, sem 
perder muito o rigor, que essa probabilidade é de 10%. A probabilidade de 
sortearmos um funcionário que ganhe menos do que R$2.000,00 pode ser 
definida como P(X < 2.000) = 28/40 = 0,70. Também P(X ≥ 2.000) = 12/40 = 
0,30. Observe que P(X < 2.000) + P(X ≥ 2.000) = 1, sempre que isso ocorre; 
dizemos que essas probabilidades são complementares.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
34
Análise de dados
Se considerarmos a amplitude do intervalo de classe como a unidade, a 
probabilidade pode ser calculada como a área de cada retângulo, que terá 
como base o valor 1 e como altura a frequência relativa. Esse cálculo de pro-
babilidades através de áreas será fundamental quando tratarmos da inferên-
cia estatística.
Outro elemento importante em uma distribuição de frequências é a cha-
mada frequência acumulada. Até R$2.000,00, temos 28 elementos, como 
acabamos de ver. Até R$3.000,00, temos 34 elementos e assim por diante. 
Abaixo apresentamos a tabela completa da distribuição de frequências:
Salário (R$) Freq. Freq. rel. Ponto médio Freq. acumulada
X < 1.000,00 11 0,27 500 11
1.000,00 ≤ X < 2.000,00 17 0,43 1.500 28
2.000,00 ≤ X < 3.000,00 6 0,15 2.500 34
3.000,00 ≤ X < 4.000,00 4 0,10 3.500 38
X ≥ 4.000,00 2 0,05 4.500 40
Total 40 1,00
Uma outra aproximação que podemos fazer é suavizar a apresentação 
do histograma, construindo um novo gráfico que una os pontos médios das 
classes. Esse novo gráfico é chamado de polígono de frequências e estará pos-
sivelmente mais próximo dos dados reais. Veja que com esse polígono de 
frequências podemos determinar através do cálculo de áreas as probabili-
dades de qualquer intervalo, como, por exemplo, P(1.022,34 ≤ X < 3.087,53).
O polígono de frequências é apresentado na figura a seguir. Observe que 
a área abaixo do polígono é também igual à unidade e toda área que é re-
tirada do histograma é recolocada. Podemos verificar isso através de seme-
lhança de triângulos:
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Análise de dados
35
Distribuição salarial
Até 100
8
6
4
2
0
14
12
10
16Fr
eq
.
De 1.000 a 1.999
De 2.000 a 2.999
De 3.000 a 3.999
Acima de 4.000
Salários (R$)
18
Série temporal
Muitas variáveis são medidas a intervalos de tempo. O gráfico de linhas 
é a maneira mais adequada de apresentar a evolução de uma variável no 
tempo. O eixo X sempre será correspondente a uma escala de tempo.
Quando não há um número demasiadamente grande de pontos, a liga-
ção entre os pontos por segmentos de retas ajuda a visualizar o padrão de 
variação ao longo do tempo.
Suponha que no exemplo da empresa ABC os dados tivessem sido apre-
sentados pelo tempo de casa de cada funcionário. Uma possível organiza-
ção dos dados seria verificar quantos funcionários a empresa tinha em cada 
um de seus quatro anos de existência, conforme a tabela abaixo:
Número de funcionários por ano
Anos Funcionários
Ano 1 15
Ano 2 20
Ano 3 32
Ano 4 40
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
36
Análise de dados
Gráfico de linhas
Número de empregados por ano
20
15
10
5
0
35
30
25
40
Ano 1
45
Ano 2 Ano 3 Ano 4
.
Medidas estatísticas
O objetivo de sintetização das informações tem sido realizado até aqui atra-
vés de apresentação tabular e gráfica dos dados originais ou brutos. A forma 
de completar essa tarefa se dá através do cálculo das medidas estatísticas.
Trataremos de três tipos de medidas: (I) as de posição, (II) as de dispersão e 
(III) as de assimetria.
Medidas de posição
Trabalharemos aqui com dois tipos de medidas, as de tendência central e 
as separatrizes. 
As medidas de tendência central resumem os dados no centro da distri-
buição. São medidas de tendência central a média aritmética, a mediana e a 
moda. 
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Análise de dados
37
A média aritmética
A média aritmética ou simplesmente média é uma das medidas mais im-
portantes da Estatística. Além de resumir os dados, ela servirá enormemente 
para os propósitos de estimação de características da amostra para a popu-
lação, pois possui as melhores propriedades de um estimador.
Ela é a soma dos dados dividida pelo número de observações, e sua ex-
pressão matemática é:
1 2
i=1
1 + + ... +
 = =å
n
n
i
x x x
x x
n n
Quando não houver conflito com outras expressões, apresentaremos 
=1
å
n
i
i
x simplesmente como Σ X.
A média aritmética representa o centro de gravidade dos dados. Alguns cuida-
dos, no entanto, devem ser tomados quando desejamos resumir os dados pelo 
valor de sua média. Ela é muito sensível a valores extremos. Um único valor muito 
grande ou muito pequeno pode mudar substancialmente o valor da média, po-
dendo ela perder sua representatividade. Esses valores extremos são chamados 
de valores discrepantes ou outliers e quando eles aparecem em um conjunto de 
dados devem receber um tratamento muito especial.
No nosso exemplo temos como valor da média das idades dos emprega-
dos da empresa ABC o valor 34 anos e a média dos salários é de R$1.791,20. 
Se considerarmos a idade de 64 anos como um outlier a nova média será 
de 33,2 anos, e se considerarmos os salários R$4.829,00 e R$5.572,00 como 
valores muito acima dos demais, teremos uma média salarial de R$1.611,76, 
quase R$200,00 de diferença com relação à primeira média.
No primeiro caso a diferença parece não ter sido de grande significância, 
mas para a média salarial essa diferença pode ser considerada importante, 
mesmo porque será um elemento importante na análise de cargos e salários. 
Retirar o salário dos dois gerentes no cálculo da média pode ser útil para a 
construção da nova política de cargos e salários.
Essa sensibilidade da média a valores extremos pode ser bem compreen-
dida com a seguinte ilustração. “Se coloco os pés próximos a uma área gelada 
e a cabeça próxima a uma área quente, a temperatura média do corpo será 
agradável”.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
38
Análise de dados
A média ponderada
Se tivermos o seguinte conjunto de dados: (2, 2, 2, 2, 2, 3, 3, 4, 4, 4) e que-
remos calcular a sua média, a soma dos dados pode ser realizada da seguinte 
forma: (2 . 5) + (3 . 2) + (4 . 3) = 10 + 6 +12 = 28. Isso porque a frequência do 2 
é 5, a do 3 é 2 e a do 4 é 3. Observe que a soma das frequências é 10 (5 + 2 + 3), 
igual ao número de observações. Podemos expressar esse fato por:
 = å
å
Xf
X
f
Em que f é a frequência de cada X. Essa expressão representa a chamada 
média aritmética ponderada ou simplesmente a média ponderada. Os ponde-
radores são as frequências.
Esse cálculo é muito útil quando os dados são apresentados em uma dis-
tribuição de frequências em que X será o ponto médio de cada classe e a 
frequência será o ponderador. Se observarmos que a frequência relativa é 
igual à frequência dividida pelo número de observações, isto é f freq
frel
=
å
. , 
podemos representar a média como:
 = . å relX X f
No cálculo da média ponderada das idades e dos salários, encontramos 
os seguintes valores para as médias, com o auxílio das tabelas a seguir. Idade 
média 34,75 anos e salário médio R$1.735,00.
Idade Ponto médio (X) frel ΣX frel
20 --- 30 24,5 0,35 8,575
30|--- 40 34,5 0,35 12,075
40|--- 50 44,5 0,25 11,125
50|--- 60 54,5 0,025 1,3625
60|---| 70 64,5 0,025 1,6125
 34,75
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Análise de dados
39
Salário (R$) Ponto Médio (X) frel ΣX frel
X < 1.000,00 500 0,28 140
1.000,00 ≤ X < 2.000,00 1.500 0,43 645
2.000,00 ≤ X < 3.000,00 2.500 0,15 375
3.000,00 ≤ X < 4.000,00 3.500 0,1 350
X ≥ 4.000,00 4.500 0,05 225
1.735
Os valores encontrados para os dados brutos foram idade média de 34 
anos e salário médio de R$1.791,20. Os valores obtidos a partir da distribui-
ção de frequências sofreram pequenas alterações, principalmente o valor do 
salário médio, em razão de considerarmos o valor dos salários dos gerentes 
como R$4.500,00 na distribuição de frequências, quando de fato eles tinham 
valores bem superiores ao considerado.
Essas distorções costumam desaparecer quando retiramos os outliers do 
cálculo ou quando o número de observações for grande.
A mediana
A mediana é o valor que divide o rol em duas partes iguais. O rol é de-
finido como a sequência ordenada de dados. Por exemplo, para o seguinte 
conjunto de dados (2, 3, 7, 7, 9) a mediana é o número 7 que divide o rol em 
duas partes iguais.
Quando o número de dados é muito grande convém definir a posição da 
mediana antes de sua determinação. A posição da mediana será definida por 
PMed = (n + 1)/2. No exemplo acima, a posição da mediana será PMed = (5 + 1)/2 = 
6/2 =3, portanto, a mediana será o terceiro elemento do rol. O valor da media-
na será o do elemento que ocupa a terceira posição, nesse caso Med = 7.
No caso de “n” ser par, o procedimento é semelhante, define-se a posição 
da mediana e depois calcula-se a média aritmética dos dois números imedia-
tamente inferior e superior do valor da posição da mediana. No exemplo da 
empresa ABC, em que n = 40, teremos PMed = (40 +1)/2 = 41/2 = 20,5. A mediana 
será então a média entre os valores que ocupam a vigésima e a vigésima pri-
meira posições da variável em consideração.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
40
Análise de dados
No nosso exemplo a idade mediana será Med = 33, porque X20 = X21 = 33. O 
salário mediano será Med = R$1.318,50, porque X20 = 1.307,00 e X21 = 1.330,00.
A mediana para dados agrupados
Uma forma aproximada de determinação da mediana para dados agru-
pados consiste em localizar inicialmente a classe que contém a mediana, com 
o auxílio da distribuição de frequências acumulada. Em seguida, tomar o 
ponto médio da classe mediana como um valor aproximado do verdadeiro 
valor da mediana. 
Observe na tabela a seguir que o vigésimo e o vigésimo primeiro va-
loresestão na segunda classe que contém do décimo segundo ao vigési-
mo oitavo elementos. Podemos, por simplicidade, determinar o valor da 
mediana como aproximadamente R$1.500,00, o valor do ponto médio da 
classe mediana.
Essa aproximação para esse caso foi bastante razoável, como podemos 
observar pela comparação do valor obtido nesse cálculo e o valor real deter-
minado pelos dados do rol. Quando a posição da mediana estiver muito pró-
xima de alguma dos limites da classe, uma interpolação deve ser realizada.
Salário (R$) Freq. Ponto médio Freq. acumulada
X < 1.000,00 11 500 11
1.000,00 ≤ X < 2.000,00 17 1.500 28
2.000,00 ≤ X < 3.000,00 6 2.500 34
3.000,00 ≤ X < 4.000,00 4 3.500 38
X ≥ 4.000,00 2 4.500 40
Total 40
A moda
A moda é o valor que ocorre com maior frequência. Para o conjunto de 
dados (2, 3, 3, 3, 4), a moda será o valor 3. Quando um conjunto tem uma só 
moda, ele é chamado de unimodal. Se tiver duas modas, de bimodal, e poli-
modal se tiver três modas, ou mais. Se o conjunto não tiver nenhuma moda 
será chamado de amodal.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Análise de dados
41
Separatrizes
As separatrizes são medidas que dividem um rol em duas partes pro-
porcionais a certos valores. A medida que separa os dados em duas partes 
iguais, ou em 50% e 50% é a mediana, como vimos a pouco.
Uma série de três medidas pode separar o rol em quatro partes iguais. 
Elas são chamadas de quartis. O primeiro quartil (Q1) separa o rol em 25% 
e 75%, o segundo quartil (Q2) é a própria mediana e o terceiro quartil (Q3) 
divide o rol em 75% e 25%.
Da mesma forma que a mediana, para os quartis devemos inicialmente 
calcular a sua posição para depois determinar o seu valor. A posição do quar-
til de ordem i, com i = 1..., 3 é dada por ( +1)=
4Qi
i n
P .
No nosso exemplo, se desejamos verificar o valor dos quartis para os sa-
lários, teremos PQ1 = (40 + 1)/4 = 10,25 e PQ13 = 3(40 +1 )/4 = 30,75, lembran-
do que o segundo quartil é a própria mediana. Então, verificando no rol de 
dados, teremos Q1 = R$987,50 e Q3 = R$2.584,50, uma vez que o décimo salá-
rio é de R$975,00 e o décimo primeiro de R$1.000,00 e que o trigésimo é de 
R$2.372,00 e o trigésimo primeiro de R$2.797,00. Esses são valores aproxima-
dos, mas podemos verificar que são aproximações bastante razoáveis. 
Podemos tambem definir um conjunto de nove medidas que separam 
o rol em 10 partes, chamadas de decis, e um conjunto de 99 medidas que 
separam o rol em 100 partes, chamadas de percentis. Bastando, para isso, 
determinar as posições de cada decil pela expressão i.(n + 1)/10 e de cada 
percentil por i.(n + 1)/100. É fácil verificar que o vigésimo quinto percentil, 
por exemplo, é o primeiro quartil.
Com base nas separatrizes, podemos construir duas representações que 
fazem parte também da chamada análise exploratória de dados, que são: o 
esquema de cinco números e o diagrama de caixa ou Box-plot.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
42
Análise de dados
Esquema de cinco números
O esquema de cinco números consiste em apresentar os valores extre-
mos, os quartis e a mediana, conforme desenho a seguir:
Q1 Med Q3
Xmín Xmáx
Diagrama de caixa ou Box-plot 
O Box-plot, como é corriqueiramente conhecido, constitui-se de uma caixa 
ou um retângulo cujo valor à esquerda na caixa é o primeiro quartil, e o valor 
à direita na caixa é o terceiro quartil. Um traço no centro da caixa representa 
a mediana e os pontos extremos são mostrados fora da caixa. 
+---+---+---+---+---+---+---+---+---+---+---+---+ 
0 1 2 3 4 5 6 7 8 9 10 11 12
No exemplo acima, o primeiro quartil (Q1) é 7, a mediana é 8,5 e o terceiro 
quartil (Q3) é 9. Essas três medidas são utilizadas para a construção da caixa. 
A diferença entre o terceiro e o primeiro quartis é chamada de amplitude in-
terquartílica (Aiq). Qualquer valor abaixo de Q1 – 1,5 Aiq e acima de Q3 + 1,5 Aiq é 
considerado como outlier. No exemplo em foco Aiq = 9 – 7 = 2, então valores 
menores do que 7 – 2(1,5) = 4 e maiores que 7 + 2(1,5) = 10 são outliers.
O valor 5 no diagrama é o menor valor dos dados que não é outlier, e o 
valor 10 é o maior valor dos dados que também não é outlier. Marcamos 
esses dois pontos e os unimos à caixa por um traço. 
Podemos também definir outlier extremo como valores abaixo de Q1 – 3 Aiq e 
acima de Q3 + 3 Aiq . O valor 3,5 é um outlier, por ser menor do que 4 e o valor 
0,5 é um outlier extremo por ser menor do que 7 – 3(2) = 1. Não temos valores 
de outlier à direita. Marcamos então o outlier com um asterisco (*) e o outlier 
extremo com uma circunferência (°). 
Esse diagrama indica que temos um conjunto de dados com uma certa 
assimetria negativa. 
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Análise de dados
43
Medidas de dispersão
Essas medidas são úteis para que possamos verificar o quanto os dados 
se dispersam, ou, mais comumente, o quanto eles se dispersam em torno da 
média. São medidas de variabilidade. Podemos dizer que dados com grande 
variabilidade representam um conjunto heterogêneo.
As três principais medidas de variabilidade são (I) a variância, (II) o desvio-
padrão e (III) o coeficiente de variação.
A variância
A variância mede a variabilidade média dos desvios dos valores em torno 
da média ao quadrado. Pode ser representada por VAR(X) ou σ2. O quadrado é 
utilizado porque a média tem sempre a propriedade que a soma dos desvios 
em torno de si é igual a zero, ou seja, Σ(X – μ) = 0. Dessa forma, a variância 
pode ser definida como:
σ2 =
∑(X – μ)2
N
Quando tratamos de amostra em vez de população, N é substituído por 
(n – 1), cuja justificativa será apresentada no capítulo referente à Estimação, 
quando tratarmos de distribuições amostrais. Nesse caso substituímos σ2 
por S2. Então, para o caso de amostra, teremos:
S2 =
∑(X – X)2
n – 1
Uma forma alternativa de determinar o valor da variância, derivada da 
expressão acima, é dada por:
S2 = ∑X
2 – nX2
n – 1
ou
S2 =
∑X2 –
n – 1
(∑X)2
n
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
44
Análise de dados
A variância para dados agrupados pode ser determinada pela expressão:
S2 = ∑(X – X)
2
 . f
n – 1
Em que f é a frequência de cada classe, X o ponto médio de cada classe e 
X a média aritmética dos dados. Ou de forma alternativa por:
S2 =
∑X2 . f –
n – 1
(∑X . f )2
n
O desvio-padrão
Como a unidade da variância é sempre ao quadrado, a forma de represen-
tar uma medida de dispersão na mesma unidade dos dados é calculando a raiz 
quadrada da variância. Essa medida é chamada de desvio-padrão e é, como 
veremos, uma das medidas mais importantes da Estatística.
O coeficiente de variação
O desvio-padrão tem várias utilidades em Estatística. Uma delas é com-
parar a variabilidade entre dois conjuntos que têm a mesma média. Como o 
desvio-padrão não tem um significado físico mais bem definido, o seu valor 
será grande ou pequeno dependendo da dimensionalidade dos dados.
Um desvio-padrão pode ser irrisório ou imenso dependendo da dimen-
são dos dados que estamos tratando. Existe, no entanto, uma possibilidade 
de comparação da variabilidade entre dois conjuntos padronizando o valor 
do desvio-padrão pelo valor da média do conjunto de dados.
Ou seja, se igualarmos a média a 100 e fizermos uma regra de três simples, 
obteremos:
X 100
 S CV
Então,
CV = . 100%S
X
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Análise de dados
45
CV é conhecido como o coeficiente de variação dos dados. Seu valor é 
dado em percentagem, o que possibilita uma informação mais intuitiva da 
variabilidade, e é a forma de comparar-se a heterogeneidade entre dois con-
juntos com médias diferentes.
Observe que os conjuntos A ={1, 2, 3}, B = {11, 12, 13} e C = {111, 112, 113} têm 
o mesmo desvio-padrão. Nos três casos o seu valor é igual a 1. No entanto, os 
valores dos coeficientes de variação são: CVA = 50%, CVB = 8,3% e CVC = 0,9%.
Verifique que esses resultados estão mesmo de acordo com a intuição. 
Se cada medida dessas for uma medida de distância aferida por algum apa-
relho, é muito menor o erro entre as medidas do conjunto C do que do 
conjunto A. 
Medidas de assimetria
Existem várias medidas para verificar se os dados são simétricos em 
torno de um valor central (a média) de um conjunto. A mais usual é a apre-
sentada abaixo:
A = 3 (média – mediana)
S
Se A < 0, dizemos que os dados têm assimetria negativa, caso contrário as-
simetria positiva. Se A = 0, o conjunto de dados é simétrico. O aspecto gráfico 
de dados simétricos e assimétricos é dado abaixo:
X = Md = MoMo Md X X Md Mo
assimetria positiva assimetria negativasimétrico
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
46
Análise de dados
Atividades de aplicação
1. Uma pesquisa realizada com fornecedores de uma determinada indús-
tria tinha por objetivo atualizar alguns dados importantes para o contro-
le financeiro e administrativo. As seguintes variáveis foram observadas: 
a) Nome da empresa
b) Idade da empresa
c) Faturamento anual
d) Número de funcionários
e) Localização (UF)
f) Área construída
Indique, para as variáveis acima, qual o tipo de cada uma delas.
2. Indique a letra adequada à coluna de acordo com as afirmativas abaixo:
a) Processo utilizado para selecionar elementos numa pesquisa 
ou estudo.
b) Uma das formas de apresentação de dados.
c) Medida observada a partir de uma característica da amostra.
d) Característica observada em estudos ou pesquisas.
e) Medida observada a partir de uma característica da população.
 Distribuição de frequências. )(
 Estatística. )(
 Amostragem. )(
 Parâmetro. )(
 Variável. )(
3. A diretoria de uma empresa, preocupada com a participação de seus 
membros nas reuniões ordinárias, fez um levantamento do número 
de faltas no último semestre. Os dados obtidos para os 48 membros 
participantes estão apresentados a seguir:
 2 0 0 4 3 0 0 1 0 0 1 1
 2 1 1 1 1 1 1 0 0 0 3 0
 0 0 2 0 0 1 1 2 0 2 0 0
 0 0 0 0 0 0 0 0 0 0 1 0
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Análise de dados
47
a) Especifique o tipo de variável estudada, classificando-a.
b) Construa um diagrama de bastões.
c) Construa uma tabela de frequências.
d) Qual a proporção de membros que faltou no máximo a duas 
reuniões?
e) Determine as frequências relativas.
4. A distribuição de frequências abaixo apresenta os salários dos 120 fun-
cionários da empresa “A” .
Salários (em S. M.) fi (n.
o de funcionários)
0 ---- 5 52
5 |--- 10 38
10|--- 15 17
15|--- 20 8
20|---| 50 5
Total 120
 Determine:
a) A amplitude observada entre a 2.a e a 4.a classe.
b) O salário médio da 4.a classe de frequências.
c) A frequência acumulada da 3.a classe de frequências.
d) Quantos funcionários que recebe entre 5 e 15 salários mínimos?
e) Quantos funcionários que recebe pelo menos 10 salários mínimos?
5. Pesquisando-se o preço médio de fornos micro-ondas de diversas 
marcas em 28 lojas e pontos de venda em Curitiba, observou-se a se-
guinte distribuição:
Preço (R$) 192,00 220,00 240,00 255,00 262,00 280,00
Lojas 1 7 11 6 2 1
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
48
Análise de dados
a) Calcule o preço médio do produto.
b) Calcule o preço mediano.
6. Os dados abaixo apresentam as vendas semanais em classes de salá-
rios mínimos de vendedores de gêneros alimentícios:
Vendas semanais n.º de vendedores
20 – 30 2
30 – 40 10
40 – 50 18
50 – 60 50
60 – 70 70
70 – 80 30
80 – 90 18
90 – 100 2
 Total 200
a) Determine o número médio de vendas semanais.
b) Determine o desvio-padrão e o coeficiente de variação das vendas 
semanais.
7. Trinta embalagens plásticas de mel foram pesadas com precisão de 
decigramas. Os pesos, após convenientemente agrupados, fornece-
ram a seguinte distribuição de frequências (em gramas):
Xi 31,5 32,5 33,5 34,5 35,5 36,5
fi 1 5 11 8 3 2
 Determine: 
a) A média da distribuição dos pesos das embalagens.
b) A mediana dos pesos.
c) A moda dos pesos.
d) A variância dos dados.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Análise de dados
49
8. A tabela abaixo apresenta as taxas de juros do rotativo, cobradas pelos 
cartões de crédito, em determinado mês.
American Express 10,95 30 Horas Visa Gold 11,90 Federal Card Nac. 9,80
D
is
po
ní
ve
l e
m
: F
ol
ha
 d
e 
Sã
o 
Pa
ul
o/
Ca
de
rn
o 
D
in
he
iro
. 
Credicard Nac. 9,20 30 Horas Visa Int. 11,90 Federal Card Int. 9,80
Credicard Intern. 9,04 Ourocard Intern. 8,50 Federal Card Gold 9,50
Diners 10,70 BFB Gold 9,90 HSBC Open Card 10,50
Bradesco Nac. 10,32 BFB Intern. 9,90 HSBC Gold 5,90
Bradesco Intern. 10,22 Sudameris Classic 10,20
Bradesco Gold 9,53 Sudameris Gold 10,20
a) Qual a taxa média cobrada no mercado?
b) Qual a taxa mediana?
c) Qual o valor do desvio-padrão das taxas? O comportamento das 
taxas é homogêneo?
d) Existe algum cartão que possa ser considerado um outlier, supon-
do uma variação de 2 desvios da média?
9. A idade média dos candidatos a um determinado curso de aperfeiço-
amento sempre foi baixa, na ordem de 22 anos. Como esse curso foi 
planejado para atender a todas as idades, decidiu-se fazer uma cam-
panha de divulgação. Para verificar se a campanha foi ou não eficiente, 
fez-se um levantamento da idade dos candidatos à última promoção, 
e os resultados estão apresentados na tabela abaixo:
Idade Número de candidatos
18 – 20 18
20 – 22 12
22 – 26 10
26 – 30 8
30 – 36 2
 Baseando-se nesses resultados, você diria que a campanha produziu 
algum efeito (isto é, a idade média aumentou)?
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
50
Análise de dados
10. Os salários dos empregados da empresa “A” são 20% maiores que os da 
empresa “B”, para todos os empregados comparados individualmente. 
Com base nessa informação, podemos afirmar que:
a) O desvio-padrão dos empregados é o mesmo para ambas as 
empresas.
b) O desvio-padrão dos salários dos empregados da empresa “A” é 
20% maior do que o dos salários da empresa “B’.
c) O desvio-padrão dos salários dos empregados da empresa “A” é 
igual ao desvio-padrão dos salários dos empregados da empresa 
“B”, multiplicado pelo quadrado de 1,20 .
d) Não há elementos para se comparar o desvio-padrão dos salários 
dessas empresas.
Gabarito
1.
a) Qualitativa nominal.
b) Quantitativa contínua.
c) Quantitativa contínua.
d) Quantitativa discreta.
e) Qualitativa nominal.
f) Quantitativa contínua.
2. b, c, a, e, d.
3.
a) Variável quantitativa discreta, pois o número de faltas é dado por 
um valor inteiro.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Análise de dados
51
b) 
5
10
15
20
25
30
M
em
br
os
Diagrama de Bastões
Faltas
0
0 1 2 3 4
c)
Distribuição de frequências
Número de faltas Número de membros (f)
0 28
1 12
2 5
3 2
4 1
Total 48
d) No máximo duas reuniões é o mesmo que duas ou menos reuniões, 
logo será a soma das frequências de 0 + 1 + 2 dividido pelo total de 
casos.
 Proporção de no máximo 2 reuniões = 28 + 12 + 5
48
 = 0,9375 
ou 93,75%
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
52
Análise de dados
e) 
Distribuição das frequências relativas
Número de faltas Frequência relativa (fr)
0 0,583
1 0,250
2 0,104
3 0,042
4 0,021
Total 1
4. 
a) A amplitude entre a 2.ª e a 4.ª classes varia entre 5 (limite inferior 
da 2.ª classe)e 20 (limite superior da 4.ª classe), logo a Amplitude = 
20 – 5 = 15.
b) O salário médio da 4.ª classe é dado pela média entre 15 e 20, por-
tanto, o valor é 17,5.
c) A frequência acumulada da 3.ª classe será: 52 + 38 +1 7 = 107. 
d) O número de funcionários que recebem entre 5 e 15 salários míni-
mos será dado pela soma dos que ganham entre 5 e 10 mais os que 
recebem entre 10 e 15 s.m., portanto, 38 + 17 = 55 funcionários.
e) Pelo menos 10 s.m. é o mesmo que no mínimo 10 s.m. Sendo as-
sim, será a soma das frequências das classes a partir de 10 s.m. O 
resultado será 17 + 8 + 5 = 30. Outra forma de cálculo seria subtrair 
do total os que ganham menos de 10 s.m., ou seja, 120 – 90 = 30.
5. 
a) Este é um caso de média ponderada, sendo assim a fórmula para a 
resolução é:
 
= ∑
∑
Xf
X
f
 = + + + + +(192).1 (220).7 (240).11 (255).6 (262).2 (280).1
28
 
 = 6.706
28 
 239,50=X .
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Análise de dados
53
b) Para obter o preço mediano do produto, é necessário verificar a 
posição da mediana, ou seja:
 
( 1)
2
+=Med
n
P , logo a 
(28 1)
14,5
2
+= =MedP , então a mediana será 
 a média entre os valores ordenados correspondentes às posi-
ções 14 e 15.
 Verificando na distribuição, temos os valores; XPos14 = 240,00 e 
XPos15 = 240,00. Portanto, como a média entre os valores será de 
240,00, a mediana será 240,00. 
6. 
a) Calcula-se o ponto médio das classes e obtém-se o resultado da 
média por meio da expressão:
 
12 480
62, 4
200
= = =∑
∑
Xf
X
f
Vendas (X) Freq (f) X.f
25 2 50
35 10 350
45 18 810
55 50 2 750
65 70 4 550
75 30 2 250
85 18 1 530
95 2 190
TOTAL 200 12 480
 Ou, de outra forma, utilizando a frequência relativa:
= ∴ = + + + =∑ 25.(0,01) 35.(0,05) ... 95.(0,01) 62, 4X XrelX .f
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
54
Análise de dados
Vendas (X) Freq (f) X.f F relativa X. Freq rel
25 2 50 0,01 0,25
35 10 350 0,05 1,75
45 18 810 0,09 4,05
55 50 2 750 0,25 13,75
65 70 4 550 0,35 22,75
75 30 2 250 0,15 11,25
85 18 1 530 0,09 7,65
95 2 190 0,01 0,95
TOTAL 200 12 480 1 62,4
b) Como o desvio-padrão é a raiz quadrada da variância, então pode-
mos calcular a variância através da expressão:
 
S2 =
n – 1
∑x2 . f – (∑x . f )
2
n
, em que precisamos obter os valores 
de ∑x2 . f 
X2 X2.f
625 1 250
1 225 12 250
2 025 36 450
3 025 151 250
4 225 295 750
5 625 168 750
7 225 130 050
9 025 18 050
∑ 813 800
 Logo, temos que a variância será:
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Análise de dados
55
 
S2 =
199
813 800 –
(12 480)2 
200
 
= 176,12 e dessa forma o resultado do 
desvio-padrão será obtido por meio de:
 176,12 13,27= =S
 O coeficiente de variação será determinado por:
 
.100%= SCV
X
, onde 
13,27
.100% 21,3%
62, 4
= =CV
7.
a) X = ∑xf
30∑f
= (31,5).1 + (32,5) 5 + (33,5).11 + (34,5).8 + (35,5).3 + (36,5).2 =
 
30
1018= X = 33,93.
b) ( 1) (30 1)
2 2
+ += =Med
n
P = 15,5, logo, a mediana será a média entre os 
 valores de X na posição 15 e na posição 16. O resultado da mediana
 será dado por 
+
= =
33,5 33,5
Md 33,5
2
.
c) A moda é representada pelo valor de maior frequência, e nesse 
caso a Mo = 33,5.
d) A variância será expressa por: S2 =
n – 1
∑X2 . f – (∑X . f )
2
n , em que 
obtemos os valores dos somatórios na tabela: 
Xi i Xi.fi X
2 X2.fi
31,5 1 31,5 992,25 992,25
32,5 5 162,5 1 056,25 5 281,25
33,5 11 368,5 1 122,25 12 344,75
34,5 8 276,0 1 190,25 9 522,00
35,5 3 106,5 1 260,25 3 780,75
36,5 2 73,0 1 332,25 2 664,50
1 018,00 34 585,50
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
56
Análise de dados
 Logo:
 
 S2 =
29
34 585,5 –
(1 018)2
30
 
= 1,43
8.
a) x =
1
n
∑
n
i = 1
xi , em que
 
x =
1
19
(10,95 + 9,20 + 9,04 + ... + 10,50 + 5,90) =
187,96
19
= 9,89.
b) Após a ordenação dos valores, encontramos a posição da mediana 
 dada por ( 1) (19 1)
2 2
+ += =Med
n
P = 10, em que o valor de X na posição 
 10 corresponde a uma mediana igual a 9,9.
c) O desvio-padrão será obtido pela raiz quadrada da variância, logo, 
a variância é:
 S
2 =
n – 1
∑X2 – (∑X)
2
n
 e obtendo os somatórios através da 
tabela a seguir:
Taxas (X) X2
10,95 119,9025
9,2 84,64
9,04 81,7216
10,7 114,49
10,32 106,5024
10,22 104,4484
9,53 90,8209
11,9 141,61
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Análise de dados
57
Taxas (X) X2
11,9 141,61
8,5 72,25
9,9 98,01
9,9 98,01
10,2 104,04
10,2 104,04
9,8 96,04
9,8 96,04
9,5 90,25
10,5 110,25
5,9 34,81
187,96 1 889,486
 
 Temos: S2 =
18
1 889,49 –
(187,96)2
19 = 1,67, logo o desvio-padrão 
 será dado pela 1,67 1,29= .
 Para verificarmos se o grupo de dados é homogêneo, calcula-
mos o coeficiente de variação (CV). Normalmente, grupos com 
dispersão relativa até 30% são considerados homogêneos. O 
 cálculo do coeficiente de variação é dado por: .100%= SCV
X 
∴
 1,29 .100% 13,07%
9,89
= =CV
Logo, as taxas cobradas no mercado são homogêneas.
d) Será considerado um cartão outlier aquele em que a taxa cobrada do 
rotativo exceda os limites de X ± 2S, ou seja, 9,89 ± 2.(1,29). Sendo 
assim, os limites estarão entre 7,31 e 12,47. Dessa forma, o único valor 
fora desse intervalo corresponde a 5,90 do cartão HSBC Gold.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
58
Análise de dados
9. Utiliza-se o ponto médio das classes como valor de X na classe (obser-
ve que as classes têm amplitudes diferentes) e através da expressão
 X =
∑Xf
∑f
 obtém-se a média das idades. Então, 
 
X =
19.(18) + 21.(12) + 24.(10) + 28.(8) + 33.(2)
50
= 22,48
 Logo, a campanha não surtiu efeito, pois a idade média permanece 
em torno de 22 anos.
10. B
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Probabilidades e 
distribuições de probabilidades
Problema
A Companhia de Seguros ABC deseja acionar uma empresa de ônibus 
para indenizar a viúva de um cliente, que foi morto em um acidente com um 
dos ônibus da empresa. Deseja, para isso, construir peças de evidências que 
demonstrem imperícia do motorista e, portanto, culpabilidade da empresa. 
Entre as peças de evidências, a Companhia ABC pretende demonstrar que a 
chance de quatro testemunhas que depuseram a favor do motorista mora-
rem em casas do mesmo quarteirão dele e estarem no ônibus no evento do 
acidente é muito pequena.
O acidente ocorreu no meio da tarde de um dia de semana. Um casal de 
pessoas idosas desceu do ônibus em um determinado ponto do itinerário e 
o homem foi atropelado pelo próprio ônibus. A viúva garantiu que o ônibus 
arrancou antes que o seu esposo tivesse alcançado a calçada.
O motorista alegou que esse fato não ocorreu e apresentou em sua defesa 
o depoimento de quatro testemunhas que teriam acompanhado o acidente 
por estarem no ônibus naquele momento.
O advogado da companhia de seguros tinha ouvido falar que as empre-
sas de transporte coletivo só contratavam motoristas se os mesmos apresen-
tassem juntamente com os documentos pessoais uma relação de pessoas 
que deporiam a seu favor em caso de acidentes, uma vez que as empresas 
estavam tendo um prejuízo muito grande com causas judiciais. 
Diante das circunstâncias, o advogado levantou o endereço das testemu-
nhas e do motorista e constatou que todos moravam em um mesmo quar-
teirão do bairro para o qual o ônibus se dirigia.
Como então determinar a probabilidade de as testemunhas de fato não 
serem forjadas? O advogado procurou um consultorestatístico e solicitou 
a ele que determinasse essa probabilidade, mesmo que fosse de forma 
aproximada.
61Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
62
Probabilidades e distribuições de probabilidades
Depois de alguma reflexão, o estatístico pensou que poderia aproximar 
essa situação através de um procedimento clássico em Estatística: o de tirar 
bolas coloridas de uma caixa. O experimento aleatório consiste em misturar 
em uma caixa bolas de duas cores. Por exemplo, colocar seis bolas azuis em 
uma caixa com 20 bolas brancas, misturar bem e retirar dessa caixa, sem 
olhar, uma amostra de quatro bolas. Calcular então a probabilidade que duas 
dessas quatro bolas sejam azuis.
Essa probabilidade pode ser calculada da seguinte forma: de quantas ma-
neiras pode-se retirar quatro bolas sem reposição de um total de 26? Esse 
número é igual a C26,4. Dentre todas essas combinações, de quantas manei-
ras pode-se retirar duas bolas brancas das 20 contidas na caixa? Da mesma 
forma, C20,2. E as outras duas azuis de seis? C6,2. Então, a probabilidade de se 
retirar duas bolas azuis na situação exposta é dada por:
P (X = 2) =
C6,2C20,2
C26,4
O cálculo dessa probabilidade resulta em P(X = 2) = 
190 . 15
14 950
 = 0,1906, 
então a probabilidade de se retirar duas bolas azuis em uma amostra sem 
reposição de uma caixa com 26 bolas, sendo 20 brancas e 6 azuis, é de 0,19 
ou 19%.
Se o bairro em que mora o motorista e suas testemunhas for a caixa que 
contém um número N de moradores, o número de habitantes do quarteirão 
for N1, correspondentes ao número de bolas azuis na caixa e a lotação do 
ônibus for a amostra n, qual é a probabilidade que dessa amostra n, n1 sejam 
de moradores do quarteirão?
A expressão geral para o cálculo dessa probabilidade é:
P (X = n1) =
CN1,n1C(N – N1), (n – n1)
CN,n
Resta, então, verificar os valores de N, N1, n e n1. Depois de um trabalho 
intenso de levantamento de dados, o estatístico chegou às seguintes informa-
ções. O bairro é composto por 112 quarteirões, os quarteirões têm em média 
20 casas e cada casa uma média de quatro moradores, portanto, o número de 
habitantes do bairro era de N = 8 960. No quarteirão em que moravam o mo-
torista e suas testemunhas havia 20 casas com também quatro moradores em 
cada casa, um total de N1 = 80 moradores no quarteirão. A lotação do ônibus 
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Probabilidades e distribuições de probabilidades
63
é de 30 lugares sentados, ou seja, n = 30, e queremos calcular a probabilidade 
de que cinco moradores do mesmo quarteirão (o motorista e as quatro teste-
munhas) estivessem juntos no ônibus, isto é, P(X = n1) = P(X = 5).
O cálculo dessa probabilidade é então:
P (X = 5) =
C80,5C8880,35
C8960,40
= 0,00002
Ou seja, uma chance em 50 000. De fato, muito pequena. 
Na avaliação feita, todos os benefícios de aproximação foram feitos a favor 
do motorista. O ônibus tinha lotação completa, quando se pode verificar que 
nesse horário da tarde ela nunca está completa. O número de pessoas que o 
ônibus servia era maior do que somente o seu bairro terminal. O número de 
pessoas por residência em bairros da periferia é normalmente maior do que 
a média de um casal com dois filhos. Todos esses fatores foram colocados a 
favor do motorista. E ademais, há que se supor que todos os quatro passa-
geiros estivessem prestando atenção ao acidente.
Esse é um problema típico de modelagem com probabilidades. Há muitos 
outros tipos de exemplo. Mas, talvez mais importante do que a aplicação direta 
de probabilidades na solução de problemas seja a sua grande utilidade como 
instrumento para se trabalhar com inferência estatística e com as técnicas de 
tomada de decisões aplicadas nos últimos três capítulos do livro.
Conceitos fundamentais
A teoria de probabilidades foi desenvolvida para solucionar jogos de azar 
durante o século XVII, mas somente no início do século XX, graças ao mate-
mático russo A. Komolgorov, que formulou toda a teoria a partir de axiomas 
básicos, a teoria de probabilidades ganhou status próprio como um ramo 
autônomo da matemática. Existem várias propostas de como medir a incer-
teza. Entre elas, a mais desenvolvida é a da teoria de probabilidades. Mesmo 
assim, há diferentes escolas que propõem diferentes meios de acessar valores 
de probabilidades. Há, portanto, alguma controvérsia sobre os fundamentos 
da teoria. Discutiremos três enfoques conceituais diferentes, mas que, inde-
pendentemente das diferentes definições, usam as mesmas regras matemá-
ticas como medidas objetivas de incerteza. Os três enfoques são o da proba-
bilidade clássica, o da frequência relativa de ocorrências e o da probabilidade 
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
64
Probabilidades e distribuições de probabilidades
subjetiva, que apesar do nome trata a probabilidade como uma medida ob-
jetiva, embora a forma de sua determinação seja subjetiva. Aqui a palavra 
objetiva significa uma medida exata que se submete ao corpo axiomático da 
teoria de Komolgorov.
Esses três enfoques foram apresentados porque serão usados indistinta-
mente na solução dos problemas colocados no livro. As diferenças possíveis 
decorrentes da diferença de enfoques serão discutidas toda vez que pude-
rem causar algum tipo de dúvida ou desconforto.
Iniciaremos com a apresentação de uma série de definições básicas que 
ajudarão na construção de toda a teoria de probabilidades necessária para a 
solução dos problemas apresentados nos demais capítulos.
Experimento aleatório
Experimento aleatório é um experimento no qual sabe-se que resultados 
podem ocorrer, mas não se sabe de antemão que resultado ocorrerá. Pode-se, 
no entanto, determinar a probabilidade associada a cada resultado. Por exem-
plo, no lance de um dado honesto sabe-se que os resultados possíveis são 1, 2, 
3, 4, 5 ou 6 na face superior, cada resultado com probabilidade 1/6.
Como determinar a probabilidade de sair um número par? Pela teoria 
clássica de probabilidades verificamos que há seis resultados possíveis. A pro-
babilidade de sair um número par é determinada pela razão entre o número 
de casos favoráveis e o número de casos possíveis, ou seja, 3 casos favoráveis 
sobre 6 casos possíveis, então essa probabilidade é de 3/6 ou ½.
Do ponto de vista frequentista, essa probabilidade pode ser calculada 
com o lance de um dado 1 000 vezes, verificando-se quantas vezes saiu um 
número par e dividindo-se esse valor por 1 000.
Também se pode determinar intuitivamente, através de probabilidade 
subjetiva, que o resultado “sair um número par no lance de um dado” é equi-
valente a “sair cara no lance de uma moeda”, e que, portanto, pela experiência 
do tomador de decisões, ele pode concluir que essa probabilidade seja ½.
Evento
Eventos são cada um dos resultados possíveis de um experimento alea-
tório. O evento de sair cara no lance de uma moeda é chamado de evento 
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Probabilidades e distribuições de probabilidades
65
simples, porque estamos interessados em um resultado singular do experi-
mento aleatório. O evento “sair um número par no lance de um dado” é um 
evento composto, porque o resultado está associado a três possíveis eventos 
simples.
Aos eventos no geral associa-se um conjunto, e a notação utilizada será a 
da teoria dos conjuntos, que estabelece denotar o conjunto com letras maiús-
culas, e quando necessário, os elementos do conjunto com letras minúscu-
las. Então o evento sair um número par pode ser representado pelo conjunto 
A = {2, 4, 6}.
Também podemos pensar no caso da moeda, que o resultado do lance 
pode ser 1 no caso de sucesso em sair uma cara e 0 no caso de fracasso em 
sair uma coroa. Assim, se X é o resultado do lance de uma moeda, X = 1 re-
presenta cara e X=0 representa coroa.
Espaço amostral
Podemos definir de forma simples o espaço amostral como o conjunto 
de todos os resultados possíveis de um experimento aleatório ou de outra 
forma o conjunto de todos os eventos simples de um experimento aleatório. 
No geral, o espaço amostral é denominado por S (space, em inglês) ou pela 
letra grega Ω (ômega).
No lance de um dado o espaço amostral será o conjunto S = {1, 2, 3, 4, 5, 
6}. No lance de uma moeda o espaço amostral será S = {C, K}, em que C re-
presenta cara e K, coroa. Em muitos livros traduzidos encontramos o espaço 
amostral para esse experimento aleatório como S = {H,T}. Aqui H representa 
cara e T coroa, porque o jogo cara ou coroa em inglês é chamado de head or 
tail, cabeça ou rabo.
Observe que o espaço amostral é o conjunto de todos os elementos, ou o 
conjunto universo da teoria de conjuntos.
Evento certo e eventos mutuamente exclusivos
Um evento é dito certo quando não há possibilidade de ocorrência de 
outro evento. Também evento impossível é aquele que não tem qualquer 
possibilidade de ocorrência. No lance de um dado, um número de 1 a 6 apa-
recer na face superior do dado é um evento certo. No lance de dois dados, a 
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
66
Probabilidades e distribuições de probabilidades
soma das faces superiores ser 15 é um evento impossível. Essa definição será 
útil um pouco mais tarde quando tratarmos de probabilidades.
Eventos mutuamente exclusivos são aqueles cujos elementos não podem 
pertencer a dois conjuntos ao mesmo tempo. Segue um exemplo de eventos 
não mutuamente exclusivos com relação ao número que aparece na face 
superior do lançamento de um dado. Seja o evento A sair um número par e 
o evento B um número menor do que 4. Então A e B não são mutuamente 
exclusivos porque o evento 2 ocorre em ambos os conjuntos. A = {2, 4, 6} e 
B = {1, 2, 3}.
Eventos complementares
Dois eventos são complementares quando os seus elementos pertencem 
a eventos mutuamente exclusivos e a reunião de todos os elementos é igual 
ao espaço amostral. Por exemplo, no lance de um dado o evento A = {1, 2} é 
complementar ao evento B = {3, 4, 5, 6}. Também o evento sair um número 
par na face superior no lançamento de um dado é complementar ao evento 
sair um número ímpar.
É usual denotar o evento complementar de A como Ā ou Ac.
Probabilidade
Probabilidade é uma medida de incerteza que pode assumir valores entre 
0 e 1. Não existe probabilidade negativa nem maior do que 1. A probabilidade 
de sair cara no lance de uma moeda é igual a ½ ou 0,5 e não 50%. 
Embora probabilidade e percentagem sejam medidas de naturezas di-
ferentes, não é incomum que se utilize percentagem com o sentido de pro-
babilidade. Quando isso não nos atrapalhar, utilizaremos indistintamente as 
duas acepções.
A probabilidade de um evento A pode ser definida como o número de 
elementos favoráveis sobre o número de elementos possíveis. O cardinal do 
conjunto A, denotado por #A, representa o número de elementos favoráveis 
do evento A e o #S o número de elementos do espaço amostral, então:
P (A) = #A
#S
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Probabilidades e distribuições de probabilidades
67
No evento número par no lance de um dado, A = {2, 4, 6}, cujo número de 
elementos é dado por #A = 3 e S = {1, 2, 3, 4, 5, 6} com #S = 6, então:
P (A) = #A
#S
 = 3
6
 = 1
2
 = 0,5
Probabilidade, chance e verossimilhança
Esses três termos são muitas vezes utilizados indistintamente, mas de fato 
representam fenômenos de natureza distinta.
Dizemos que a chance de se ganhar na mega-sena é de aproximadamente 
1 para 50 milhões se jogarmos um bilhete com 6 números. A ideia de chance 
está relacionada a jogo. É curioso notar que a teoria de probabilidade em 
seus primórdios era denominada nos meios acadêmicos como a teoria das 
chances, somente mais tarde se distinguiu chance de probabilidade, tendo 
sido reservada para essa última a primazia de denominar a teoria que se en-
carrega de medir incerteza.
Por outro lado, a palavra verossimilhança também não tem o mesmo sig-
nificado de probabilidade. Por exemplo, é bem sabido que se em uma noite 
de inverno o frio for intenso e o céu estiver estrelado, a possibilidade de 
ocorrência de geada na manhã do dia seguinte é bastante grande. Devemos 
dizer que é verossímil e não que é provável a ocorrência de geada. Essa pala-
vra é muito pouco utilizada coloquialmente em português e por isso falamos 
em provável ou verossímil indistintamente.
Na língua inglesa, a palavra correspondente à verossimilhança é likelihood, 
bastante comum no uso coloquial. Então, em muitos livros de estatística tra-
duzidos do inglês para o português, o tradutor prefere utilizar probabilida-
de nos locais em que aparece likelihood e isso pode trazer alguma confusão 
conceitual. Forçaremos um pouco o uso correto e distinto de probabilidade 
e verossimilhança quando for necessário no texto.
Axiomas e regras de probabilidades
As regras para o uso de probabilidades, muitas vezes apresentadas como 
teoremas, partem de um conjunto de princípios que leva em conta a natu-
reza da medida de probabilidade. Esse conjunto de princípios é conhecido 
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
68
Probabilidades e distribuições de probabilidades
como os Axiomas de Kolmogorov, o matemático russo que as estabeleceu no 
início do século XX.
Axiomas de Kolmogorov
Seja A um evento e S o espaço amostral de um experimento aleatório, então:
(I) 0 ≤ P(A) ≤ 1;
(II) P(S) = 1;
(III) P(A B) = P(A) + P(B) – P(A B), se A e B não são eventos mutuamente 
exclusivos.
O primeiro axioma define probabilidade como uma medida não nega-
tiva e não maior que a unidade. Então, é um número definido no intervalo 
de 0 a 1 e não uma percentagem. Ela pode ser apresentada em forma de 
fração 4/10, com o numerador sempre menor ou igual ao denominador, 
ou em forma decimal 0,4. Não teremos preferência neste livro na forma 
de apresentação final das probabilidades calculadas, mas sempre convém 
fazer as operações através de frações para não haver acúmulo de erros 
devido a arredondamentos.
O segundo axioma informa que a probabilidade do espaço amostral é 
sempre 1. O espaço amostral pode ser tomado como o evento composto 
certo. Por outro lado, o evento complementar a S é o conjunto vazio, denota-
do por { } ou ø.
O terceiro axioma diz que a probabilidade da união de dois eventos é a 
soma das probabilidades dos eventos menos a probabilidade de sua inter-
seção. Se A e B são mutuamente exclusivos, então A B = ø. Vejamos um 
exemplo de eventos não mutuamente exclusivos. 
No lance de um dado, seja A o evento sair um número par e B o evento 
sair um número menor que 4. Então, A = {2, 4, 6} e B = {1, 2, 3}, a união dos 
dois eventos A B = {1, 2, 3, 4, 6} e a interseção e A B = {2}. Então P (A B) 
= 1/2 + 1/2 – 1/6 = 5/6, uma vez que P (A) = 1/2; P (B) = 1/2 e P(A B) = 1/6. 
Verifique que de fato o cardinal de A B é #(A B) = 5. 
É necessário fazer a subtração porque caso contrário o elemento 2 en-
traria duas vezes, enquanto na união ele só entra uma vez, apesar de ser 
elemento dos conjuntos A e B.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Probabilidades e distribuições de probabilidades
69
Regras de probabilidades
Algumas regras úteis derivadas dos axiomas de probabilidades serão 
apresentadas sem prova. Em um contexto formal elas poderiam ser apre-
sentadas como teoremas com as devidas provas, mas esse não é o interesse 
neste texto.
Eventos complementares
Se A é um evento e Ā é o seu evento complementar, então P(A) + P(Ā) = 
1, ou ainda P(Ā) = 1 – P(A). Um caso particular ocorre para o caso do conjun-
to vazio, sabidamente complementar ao conjunto universo. P(ø) = 1 – P(S), 
então como P(S) = 1, P(ø)= 0.
Regra da adição
Se A e B são eventos mutuamente excludentes, isto é, A B = ø , então 
P(A B) = P(A) + P(B), haja vista que P(ø) = 0.
Sejam os eventos A ={2, 4} e B { 3, 5} e S = {1, 2, 3, 4, 5, 6}, então P(A B) = 
P(A) + P(B) = 2/6 +2/6 = 4/6, verifique que A B = {2, 3, 4, 5}, cujo cardinal e 
#( A B) = 4.
2
1
6
S
A B
34
5
Regra da diferença
Se A e B são dois conjuntos quaisquer, podemos definir a diferença entre 
os dois conjuntos, A\B como o conjunto de todos os elementos que perten-
cem a A e que não pertencem a B. Então P(A\B) = P(A) – P(A B).
Sejam os eventos A ={2, 4} e B { 2, 3, 5} e S = {1, 2, 3, 4, 5, 6}, então P(A\B) = P(A) 
– P(A B) = 2/6 – 1/6 = 1/6. Verifique que A\B = {4} cujo cardinal é #(A\B) = 1.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
70
Probabilidades e distribuições de probabilidades
2
1 6 S
A B
3
4
5
Probabilidades conjunta, 
marginal, condicional e independência
Probabilidade conjunta
Em muitas aplicações, estaremos interessados na probabilidade de ocor-
rência conjunta de dois ou mais eventos. Considere uma pesquisa de merca-
do em que dois produtos, A e B, foram apresentados para uma amostra de 1 
000 pessoas, 500 homens e 500 mulheres. Os resultados das preferências são 
apresentados na tabela a seguir:
Sexo Prefere produto A Prefere produto B Total
Masculino (M) 200 300 500
Feminino (F) 100 400 500
Total 300 700 1 000
O evento, quando um homem prefere o produto A, é representado por 
(M e A), quando uma mulher prefere o produto A por (F e A) e assim por 
diante, e a probabilidade associada ao primeiro é representada por P(M 
e A). Essa probabilidade pode ser determinada por P(M e A) = 200/1 000 
= 0,2. Então, podemos construir uma tabela de probabilidades conjuntas, 
conforme a seguir:
Sexo Prefere produto A Prefere produto B Total
Masculino (H) 0,2 0,3 0,5
Feminino (M) 0,1 0,4 0,5
Total 0,3 0,7 1,0
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Probabilidades e distribuições de probabilidades
71
Probabilidade marginal
Adicionalmente às probabilidades conjuntas, é possível determinar as 
probabilidades marginais com respeito ao sexo e à preferência por produto. 
Essas probabilidades são chamadas de probabilidades marginais ou de pro-
babilidades incondicionais. Por exemplo, a probabilidade marginal de que 
um indivíduo escolhido aleatoriamente seja homem é de P(H) = 0,5 e a pro-
babilidade que o produto A seja escolhido é de P(A) = 0,3.
Observe que a probabilidade de que o produto A seja escolhido é a soma 
de duas probabilidades mutuamente excludentes: P[(A e H) ou (A e M)] = P(A 
e H) + P(A e M) = 0,2 + 0,1 = 0,3.
Probabilidade condicional
Se estivermos interessados na probabilidade de ocorrência de um evento 
uma vez que outro evento já ocorreu, podemos definir probabilidades condi-
cionais. Por exemplo, podemos estar interessados em saber qual é a proba-
bilidade de ocorrência do evento “preferência pelo produto A” dado que o 
elemento sorteado foi um homem.
Definimos então, P(A/H) como a probabilidade condicional e diz-se “pro-
babilidade de A dado H”:
P(A/H) = 
P(A H)
P(H)
0,2
0,5
 = 0,4= 2
5
=
Na verdade restringimos nosso espaço amostral para o evento “ocorreu 
homem”. Podemos também restringir o espaço amostral por preferência por 
produto. Assim, podemos determinar a probabilidade de escolhermos um 
homem dado que o produto preferido foi o produto A, desejamos então cal-
cular P(H/A):
P(H/A) = 
P(H A)
P(A)
0,2
0,3
 = 0,67= 2
3
=
Independência
Verificamos que a probabilidade de preferência do produto A dado que 
um homem foi sorteado é igual a 0,4. Então:
P(A/M) = 
P(A M)
P(M)
0,2
0,5
 = 0,4= 2
5
=
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
72
Probabilidades e distribuições de probabilidades
Podemos concluir desse fato que a preferência pelo produto A depende 
do sexo da pessoa sorteada. Definimos assim que dois eventos são esta-
tisticamente independentes quando a ocorrência de um evento não afeta a 
ocorrência do outro. E, portanto, se C e D são independentes, denotamos 
(C D), então: 
P(C/D) = P(C)
Alguns exemplos interessantes de eventos independentes: Evento C, 
sexo do segundo filho e evento D, sexo do primeiro filho. Evento C, resulta-
do do lance da segunda moeda, e evento D, resultado do lance da primeira 
moeda. Evento C, sorteio do número correspondente à dezena da loteria 
federal, e evento D, resultado do número correspondente à unidade da lo-
teria federal.
Então, a probabilidade de o segundo filho ser homem, dado que o pri-
meiro foi mulher, é igual à probabilidade de o segundo filho ser homem.
Regra da multiplicação
Quando dois eventos são independentes, temos que P(C/D) = P(C). Ob-
serve também que 
Se P(C/D) = P(C D)/P(D) então P(C D) = P(C/D) P(D).
Utilizando a afirmação de independência, temos então que: se C e D são 
eventos independentes:
P(C D), = P(C) P(D)
Verifique que para o exemplo da pesquisa de mercado a seguir os even-
tos preferência por um produto e sexo são independentes.
Sexo Prefere produto A Prefere produto B Total
Masculino (H) 0,08 0,32 0,4
Feminino (M) 0,12 0,48 0,6
Total 0,20 0,80 1,0
P(A/H) = 0,08/0,4 = 8/40 = 1/5 = 0,2 e P(A/M) = 0,12/0,6 = 12/60 = 0,2. 
Nesse caso, pode-se verificar que o produto das probabilidades marginais 
correspondentes é igual à probabilidade conjunta. P(A) P(H) = 0,2 . 0,4 = 0,08 
= P(A e H). Normalmente, denota-se P(A e H) como a probabilidade da inter-
seção, então: P(A H) = P(A) P(H).
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Probabilidades e distribuições de probabilidades
73
Teorema de Bayes
O objetivo do teorema de Bayes é o de fazer revisão de probabilidades 
com base em novas peças de evidência. Vamos apresentar o teorema a partir 
de um exemplo prático. A Companhia de Petróleo ABC deseja verificar qual 
é a probabilidade de haver petróleo no litoral paranaense, uma vez que foi 
descoberto petróleo no litoral sul de São Paulo. Especialistas da Companhia 
acreditam que devido às circunstâncias geográficas há uma probabilidade 
de 70% de haver petróleo no Paraná. 
Contratam, então, uma empresa de prospecção que realiza pesquisas 
amostrais. Da experiência passada dessa empresa com a realização desse 
teste, ela garante uma sensibilidade do teste de 90%, isto é, em 90% das 
vezes em que ele fornece resultado positivo, de fato há petróleo. E garantem 
também uma especificidade de 80%, ou seja, em 80% das vezes em que o 
teste fornece resultado negativo, de fato não há petróleo. Com esses dados, 
a empresa fará uma revisão da probabilidade de haver petróleo, estimada 
em 70% pelos técnicos da Companhia ABC.
Para equacionar o problema, vamos chamar o evento “ter petróleo” de A, 
de tal forma que A1 representará resultado positivo e A2 resultado negativo. 
Assim, P(A1) = 0,7 e P(A2) = 0,3. Chamaremos essas probabilidades de proba-
bilidades a priori.
O evento B representará o teste. Então, se o teste fornece resultado positi-
vo quando há petróleo em 90% das vezes, podemos representar essa proba-
bilidade como P(B/A1) = 0,9. E se o teste fornece resultado negativo quando 
não há petróleo em 80% das vezes, significa que em 20% fornece resultado 
negativo quando há petróleo, portanto P(B/A2) = 0,20.
Da definição de probabilidade condicional, temos que se P(B/A1) = 
P(A1 B) /P(A1) então P(A1 B) = P(A1) P(B/A1). 
Assim, P(A1 B) = (0,7).(0,9) = 0,63. E P(A2 B) = (0,3).(0,2) = 0,06.
Observamos que se B = {(A1 B) U (A2 B)}, então P(B) = P(A1 B) + P(A2 B). 
Então P(B) = 0,63 + 0,06.
Por outro lado, P(A1/B) = P(A1 B)/ P(B). Logo, P(A1/B) = 0,63/0,69 = 0,90. 
Então, a probabilidade de haver petróleo no Paraná, dado o resultado posi-
tivo do teste, é de 91%. Assim, a probabilidade de 70% de haver petróleo foi 
atualizada para 91%.
Este material é parte integrantedo acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
74
Probabilidades e distribuições de probabilidades
Esses cálculos podem ser mais bem acompanhados através da tabela a 
seguir:
Probabilida-
de a priori
Probabilidade 
condicional
Probabilida-
de conjunta
Probabi-
lidade a 
posteriori
Eventos Ai P(Ai) P(x2/θi) P(θi) P(x2/θi) P(θi/x2)
A1 = tem petróleo 0,7 0,9 0,63 0,91
A2 = não tem petróleo 0,3 0,2 0,06 0,09
Total 1,0 0,69 1,0
Verifique que a distribuição conjunta dos eventos pode ser dada por:
Teste positivo 
(B)
Teste negativo 
(Bc) Total
A1 = tem petróleo 0,63 0,07 0,7
A2 = não tem petróleo 0,06 0,24 0,3
Total 0,69 0,31 1,0
Confira na tabela a probabilidade P(B/A1) = P(B A1)/P(A1) = 0,63/0,7 = 0,9, 
que é o valor da sensibilidade de 90%. Todas as outras probabilidades podem 
ser verificadas.
Como reforço, vamos deduzir uma expressão geral para o teorema de 
Bayes, a partir da análise do seguinte diagrama de Venn e da definição de 
probabilidade condicional.
A1
A2
B
Pela definição de probabilidade condicional, temos que P(A1/B) = 
P(A1 B)/P(B).
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Probabilidades e distribuições de probabilidades
75
Mas também P(B/A1) = P(A1 B)/P(A1). Então P(A1 B) = P(A1) P(B/A1). 
Substituindo essa última expressão na primeira, teremos:
P(A1/B) =
P(A1) P(B/A1)
P(B)
Como P(B) = P(A1 B) + P(A2 B) = P(A1)P(B/A1)+ P(A2)P(B/A2)
Temos a expressão geral do Teorema de Bayes para o caso de dois eventos:
P(A1/B) =
P(A1) P(B/A1)
P(A1) P(B/A1) + P(A2) P(B/A2)
Deduzimos, através de um exemplo de desenvolvimento matemático, a 
expressão do Teorema de Bayes quando temos dois eventos, cada um com 
dois elementos. Uma expressão mais geral pode ser demonstrada, e sua ex-
pressão é:
P(A1/B) =
P(Ai) P(B/Ai)
∑P(Ai) P(B/Ai)
Distribuições de probabilidades discretas
Variável aleatória
Podemos definir aproximadamente variável aleatória como uma variá-
vel que assume valores numéricos em função do acaso. Rigorosamente, do 
ponto de vista matemático, uma variável aleatória é uma função consistindo 
de elementos de um espaço amostral associados a números reais relaciona-
dos a esses elementos. 
São exemplos de variáveis aleatórias: sair cara no lance de uma moeda, 
a soma dos números das faces superiores no lançamento de dois dados, o 
faturamento de uma empresa no final de um período, o rendimento de apli-
cação de uma dada carteira e assim por diante.
Qualquer variável que seja função de resultados que dependem de incer-
teza podem ser consideradas como variável aleatória.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
76
Probabilidades e distribuições de probabilidades
Distribuição de probabilidades de uma variável aleatória
Podemos associar os valores possíveis de uma variável aleatória a um 
certo nível de probabilidade. A tabela formada por esse conjunto é chamada 
de distribuição de probabilidades.
Por exemplo, distribuição de probabilidades dos preços de um determi-
nado produto em estoque:
Preço dos produtos em R$ (X) Probabilidade de X P(X = x)
67 0,10
68 0,25
69 0,50
70 0,10
71 0,05
A probabilidade de sortearmos um produto no estoque e que ele custe 
R$69,00 é igual a ½. Ou P(X = 69) = ½.
A representação gráfica de uma variável aleatória pode ser feita através 
de um gráfico de bastões.
0,1
0,2
0,3
0,4
0,5
0,6
Pr
ob
ab
ili
da
de
s
Preço dos produtos
0
1 2 3 4 5
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Probabilidades e distribuições de probabilidades
77
Propriedades de uma variável aleatória discreta
Uma variável aleatória discreta X tem duas propriedades:
(I) P(X = x) ≥ 0
(II) P(X = x) =1
Também podemos representar P(X = x) por f(x), então, as condições acima 
poderiam também ser expressas da seguinte forma:
(I) f(x) ≥ 0
(II) f(x) =1
Função de distribuição acumulada
Dada uma variável aleatória X, o valor da função de distribuição acumu-
lada no ponto x, denotada por F(x), é a probabilidade que X tome valores 
menores ou iguais a x. Ou seja:
F(x) = P(X ≤ x)
No exemplo dos preços dos produtos em estoque teremos:
Preço dos produtos 
(X) em R$
Probabilidade de X
 P(X = x)
Probabilidade acumulada
P(X ≤ x) = F(x)
67 0,10 0,10
68 0,25 0,35
69 0,50 0,85
70 0,10 0,95
71 0,05 1,00
Esperança e variância 
de uma variável aleatória discreta
A esperança de uma variável aleatória discreta, também chamada de ex-
pectância ou valor esperado, é a média aritmética ponderada pelas probabili-
dades. Ela pode ser definida como:
μ = E(X) = Σ X P(X = x)
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
78
Probabilidades e distribuições de probabilidades
A variância de uma variável aleatória discreta é definida como:
σ2 = VAR(X) = Σ (X – μ)2 = E(X2) – [E(X)]2
onde, E(X2) = Σ X2 P(X = x).
Para o exemplo dos produtos em estoque, temos:
X P(X = x) X P(X = x) X2 X2 P(X = x)
67 0,10 6,70 4 489 448,90
68 0,25 17,00 4 624 1 156,00
69 0,50 34,50 4 761 2 380,50
70 0,10 7,00 4 900 490,00
71 0,05 3,55 5 041 252,05
Total 68,75 4 727,45
E(X) = 68,75
VAR(X) = E(X2) – [E(X)]2 = 4 727,45 – (68,75)2 = 0,8875. 
O valor médio dos produtos em estoque é de R$68,75 e sua variância é 
igual a 0,8875.
Distribuição conjunta de probabilidades
Quando temos mais de uma variável aleatória em consideração, pode-
mos construir uma distribuição conjunta de probabilidades.
Seja, por exemplo, um distribuidor que vende seu produto para duas em-
presas. A tabela abaixo representa as vendas por dia para cada empresa e as 
probabilidades associadas:
Empresa X
Empresa Y 0 1 2 P(Y = y)
0 0,1 0,1 0,0 0,2
1 0,1 0,5 0,0 0,6
2 0,0 0,0 0,2 0,2
P(X = x) 0,2 0,6 0,2 1,0
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Probabilidades e distribuições de probabilidades
79
Definimos como distribuição de probabilidades marginais as distribuições 
de Y e de X conforme tabelas a seguir:
Empresa Y P(Y = y)
0 0,2
1 0,6
2 0,2
P(Y = y) 1,0
Empresa X P(X = x)
0 0,2
1 0,6
2 0,2
P(X = x) 1,0
Podemos definir também distribuições de probabilidades condicionais. Por 
exemplo, a distribuição de probabilidades de X dado que Y = 1.
Empresa X P(X = x / Y = 1)
0 0,1/0,6 = 0,17
1 0,5/0,6 = 0,83
2 0,0
P(Y = y) 1,0
Dessas distribuições de probabilidades podemos calcular suas médias e 
suas variâncias:
E(X) = XP(X = x) = (0).(0,2) + (1).(0,6) + (2).(0,2) = 0,6 + 0,4 = 1,0
Var(X) = E(X2)–[E(X)]2 = (0)2.(0,2) + (1)2.(0,6) + (2)2.(0,2) – (0,4)2 = 0,6 + 0,8 – 
0,16 = 1,24
A esperança condicional de X dado Y = 1 será:
E(X/Y=1) = (0).(0,17) + (1).(0,83) + (2).(0) = 0,83.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
80
Probabilidades e distribuições de probabilidades
Covariância e correlação
Definimos covariância e correlação conforme segue:
Cov(X,Y) = E(X,Y) – E(X)E(Y) e 
Corr(X, Y) = x, y =
Cov(X, Y)
Var(X) Var(Y)
E(X,Y) XYP(X = x, Y = y) = 0.0.0,1+ 0.1.0,1+ 0.2.0 + 1.0.0,1 + 1.1.0,5 + 1.2.0 + 
2.0.0 + 2.1.0 + 2.2.0,2 = 0,5 + 0,8 = 1,3
E(X) = E(Y) = 1
Cov (X,Y) = 1,3 – 1.1 = 1,3 – 1 = 0,3
X,Y = 0,3 / 1,24 = 0,24
A correlação mede a força do relacionamento das variáveis X e Y. Pode variar 
em módulo de 0 a 1. Correlação igual a 0 significa que não há correlação entre as 
variáveis e correlação 1 resulta de relação muito forte entre X e Y.
Variáveis aleatórias discretas
Existem algumas distribuições de probabilidades discretas que têm ca-
racterísticas especiais e são muito utilizadas na prática. Faremos uma expo-
sição de cada uma delas, evitando o desenvolvimento teórico que exigiria 
certa manipulação matemática que temos evitado.
Estudaremos as distribuições uniforme, binomial, multinomial, hipergeo-
métrica e de Poisson.
Distribuição uniforme
Algumas vezes, todos os valorespossíveis da variável aleatória assumem 
o mesmo valor. Tal distribuição de probabilidades é chamada de distribuição 
uniforme e tem a seguinte distribuição de probabilidades: 
P(X = x) = f(x) = 1N, x = 0 ,..., N
E(X) = ΣXN = μ
Var(X) = 1N [( X
2) – (X)2 ] = σ2
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Probabilidades e distribuições de probabilidades
81
Exemplo:
Lance de um dado não viciado. A função de probabilidade (ou função 
densidade de probabilidades) é dada por:
P (X = x) = 1
6
E(X) = 3,5
VAR(X) = 2,92
Exemplo:
Um voo internacional está escalado para chegar ao Aeroporto Interna-
cional de Cumbica em São Paulo às 7h30min da manhã. Um estudo mostrou 
que a hora real de chegada é uniformemente distribuída por minutos no 
intervalo de 7h05min às 8h40min. Seja X = 1 a chegada às 7h05min, X = 2 a 
chegada às 7h06min, e assim por diante.
a) Escreva a expressão matemática de f(x) = P(X = x).
b) Qual é a probabilidade que o voo se atrase?
c) Qual é a probabilidade que o voo chegue depois das 8h00?
d) Qual é a probabilidade que o voo chegue às 8h00 ou depois das 
8h00?
e) Qual é probabilidade que o voo chegue antes das 7h30min?
Entre 7h05min e 8h40min existem 96 minutos, então:
a) f(x) =1/96, x = 1, ... , 96.
b) A probabilidade que o voo se atrase é a probabilidade que ele chegue 
depois das 7h30min. Entre 7h31min e 8h40min existem 70 minutos, 
então:
 P(7h31min ≤ X ≤ 8h40min) = P(7h30min < X ≤ 8h40min) = 
70
96
 = 0,729.
c) A probabilidade que o voo chegue depois das 8h00 e P(X > 8h00) = 40
96
 
= 0,417.
d) A probabilidade que o voo chegue às 8h00 ou depois das oito é 
P(X ≥ 8h00) = 41
96
 = 0,427. 
e) Entre 07h05min e 07h30min existem 25 minutos. 
 Então, P(7h05min ≤ X ≤ 7h30min) = 25
96
 = 0,260.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
82
Probabilidades e distribuições de probabilidades
Distribuição binomial
Na distribuição binomial há dois resultados possíveis em cada experimen-
to aleatório. E uma das distribuições mais importantes por suas aplicações na 
área de negócios e de ciências sociais. O processo que se utiliza da distribui-
ção binomial é conhecido como prova de Bernoulli ou processo de Bernoulli, 
matemático suíço que pela primeira vez deu sentido ao uso da distribuição 
binomial.
As seguintes suposições devem ser feitas para o uso da distribuição 
binomial:
(I) em cada processo há dois possíveis resultados mutuamente exclusivos, 
que são chamados de “sucesso” ou “fracasso”;
(II) a probabilidade de “sucesso”, denotada por “p”, permanece constante du-
rante todo o processo. A probabilidade de “fracasso”, denotada por “q” é 
igual a 1 – p;
(III) cada passo do processo é independente do anterior. 
A distribuição binomial tem a seguinte distribuição de probabilidades:
P(X = x) = f(x) = Cn,x p
x qn-x
E(X) = n.p
VAR(X) = n.p.q
O exemplo clássico do uso da distribuição binomial é o cálculo da proba-
bilidade de, por exemplo, saírem duas caras no lance de seis moedas hones-
tas. Nesta situação, n = 6, p = 1
2 
e X = 2. Então:
P(X = 2) = C6,2 (1/2)
2.(1/2)4 = (15).(0,015625) = 0,2344
A tabela abaixo fornece toda a distribuição de probabilidades para o ex-
perimento acima:
X 0 1 2 3 4 5 6
P(X = x) 0,0156 0,0938 0,2344 0,3125 0,2344 0,0938 0,0156
E(X) = n.p = 6 . 1
2
= 3 
V(X) = n.p.q = 6 . 1
2
= 1,5. 1
2
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Probabilidades e distribuições de probabilidades
83
A distribuição binomial é aplicável em situações de amostragem de uma 
população finita com reposição ou de uma amostragem com uma população 
infinita com ou sem reposição.
Exemplo:
A gerência de Atendimento ao Cliente dos Correios é responsável por 
expedir a correspondência atrasada. Da experiência passada, essa Gerência 
sabe que em 90% das vezes as correspondências são entregues sem atraso. 
Da tabela A da distribuição binomial acumulada retire os valores para deter-
minar as probabilidades de que em 10 remessas:
a) três ou menos correspondências serão entregues com atraso.
b) entre três e cinco correspondências serão entregues com atraso.
c) três ou mais correspondências serão entregues em dia.
d) exatamente duas correspondências serão entregues com atraso.
e) sete ou mais correspondências serão entregues com atraso.
Seja X a variável aleatória correspondente à entrega com atraso da corres-
pondência. Então, podemos estabelecer p = 0,10. Repare que a ação corres-
pondente a “sucesso” é a entrega com atraso. Então, q = 0,90 e n = 10. 
a) Da tabela A, temos que F(3) = 0,9872
Essa probabilidade corresponde a calcular P(X≤3) = F(3) = ∑
3
x = 0
C10,X (0,10)
X 
(0,90)10 – X
Ou ainda P(X ≤ 3) = P(X = 0) + P(X = 1) + P(X =2) + P( X = 3), esses valores 
podem ser encontrados na tabela B da distribuição de probabilidades bino-
mial para n = 10, p = 0,10.
P(X ≤ 3) = 0,3487 + 0,3874 + 0,1937 + 0,0574 = 0,9872.
b) P(3 ≤ X ≤ 5) = P(X ≤ 5) – P(X < 3) = P(X ≤ 5) – P(X ≤ 2) = F(5) – F(2) = 
 = 0,9999 – 0,9298 = 0,0701.
c) três ou mais “fracassos” correspondem a sete ou menos “sucessos”. 
Lembrando que “fracasso” aqui é entregar a correspondência em dia. 
Então, precisamos calcular P(X ≤ 7) = F(7) = 1,0000.
d) A probabilidade de exatamente dois “sucessos” é P(X ≤ 2) – P(X ≤ 1) = 
F(2) – F(1) = 0,9298 – 0,7361 = 0,1937, esse valor pode ser confirmado 
na tabela B para P(X = 2).
e) P( X ≥ 7) = 1 – P(X ≤ 6) = 1 – F(6) = 1 – 1 = 0.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
84
Probabilidades e distribuições de probabilidades
Distribuição multinomial
No caso da distribuição binomial havia dois possíveis resultados para o 
processo, “sucesso” ou “fracasso”. No caso da distribuição multinomial, pode-
mos ter mais do que dois resultados possíveis. A sua distribuição de probabi-
lidades é dada pela expressão:
P(X1 = x1, X2 = x2, ..., Xn = xn) = f(x) = [n!/x1!x2!...xn!] p1
x1 p2
x2 ...pn
xn
E(Xi) = ni.pi
VAR(Xi) = ni.pi.qi
Exemplo:
A loja ABC está liquidando o seu estoque, distribuindo roupas de tama-
nhos diferentes em três salas. Uma sala para manequim pequeno, outra para 
médio e outra para grande. Uma pessoa entra na sala de roupas médias e 
escolhe 10 peças. Por causa de um erro de classificação das peças, 15% delas 
na sala de roupas médias eram grandes, e 5% eram pequenas, as demais 
eram de fato roupas de tamanho médio.
a) Qual é a probabilidade de que a pessoa que escolheu as peças na sala de 
roupas de tamanho médio, tenha pegado exatamente cinco roupas de ta-
manho médio, uma de tamanho grande e quatro de tamanho pequeno?
b) Qual é a probabilidade de ela ter pego sete roupas de tamanho médio, 
duas de tamanho grande e uma de tamanho pequeno?
Aplicando a expressão da distribuição multinomial, teremos:
a) f(5,1,4) = [10!/5!1!4!].(0,80)5.(0,15).(0,05)4 = 0,0004
b) f(7,2,1) = [10!/7!2!1!].(0,80)7.(0,15)2.(0,05) = 0,0849.
Distribuição hipergeométrica
A distribuição binomial foi utilizada para amostragens de populações fi-
nitas com reposição. Em muitas situações práticas, as amostragens são rea-
lizadas sem reposição e, nesse caso, o modelo adequado é o da distribuição 
hipergeométrica.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Probabilidades e distribuições de probabilidades
85
Suponha que temos bolas de duas cores em uma caixa com N bolas, 
sendo que N1 são brancas e N – N1 são azuis. Uma amostra de tamanho n é 
retirada da caixa e desejamos saber qual a probabilidade que x dessas bolas 
sejam brancas.
A expressão para o cálculo de x “sucessos” na amostra aleatória de tama-
nho n sem reposição é dada por:
f(x) = P(X = x) =
CN1,xC(N – N1), (n, x)
CN, n
para x = 0,1, ...
O exemplo do início do capítulo que diz respeito à probabilidade de cinco 
pessoas que moram no mesmo quarteirão estarem em um mesmo ônibus é 
uma aplicaçãoda distribuição hipergeométrica.
Distribuição de Poisson
A distribuição de Poisson tem uma grande aplicação em situações como 
demanda por produtos, número de telefonemas que chegam a uma central, 
número de acidentes, números de tráfego de chegadas (como caminhões 
em um terminal, aviões em aeroportos, navios nos portos etc.) e número de 
defeitos observados em linhas de produção.
Todas essas situações têm dois pontos em comum:
(I) as ocorrências podem ser descritas por uma variável aleatória que 
toma valores como 0, 1, 2 e assim por diante;
(II) existe um índice do número de ocorrências por intervalo de tempo ou 
espaço.
Algumas suposições são feitas para a utilização dessa distribuição, que são:
(I) a probabilidade de exatamente uma ocorrência acontecer em um subin-
tervalo é um número pequeno que é constante em cada subintervalo;
(II) a probabilidade de duas ou mais ocorrências em um subintervalo é 
tão pequena que é considerada igual a zero;
(III) o número de ocorrências em um subintervalo não depende onde este 
subintervalo está localizado;
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
86
Probabilidades e distribuições de probabilidades
(IV) o número de ocorrências em um subintervalo não depende do núme-
ro de ocorrências em qualquer outro subintervalo.
A distribuição de Poisson pode ser descrita pela função densidade de 
probabilidade:
P(X = x) = f(x) = (μ
x . e–μ)
x!
, ... para x = 0, 1, 2.......
A esperança e a variância de X são iguais. E(X) = VAR (X) = μ.
Exemplo:
Seja X a variável aleatória “número de chamadas telefônicas por minuto” 
durante um dado período de tempo. Então μ = 0,4 chamadas por minuto é 
o parâmetro da distribuição de probabilidades de Poisson. A probabilidade 
que certo número de chamadas chegará à central é dada pela expressão da 
função densidade. Então:
Para X = 0
P(X = 0) = f(0) = (0,4)
0.e–0,4
0!
 = 0,670.
Para X = 1 
P(X = 1) = f(1) = (0,4)
1.e–0,4
1!
 = (0,4)(0,670) = 0,268.
Para encontrar esses e outros valores de f(x), pode-se consultar direta-
mente a tabela C dos valores da função de distribuição acumulada para a dis-
tribuição de Poisson.
∑
c
x = 0
F(c) = P(X ≤ c) = f(x)
A distribuição de Poisson 
como aproximação da distribuição binomial
Quando n é muito grande, o uso da distribuição binomial pode tor-
nar--se tedioso. Para evitar essa situação podemos tomar a distribuição 
de Poisson como uma aproximação da distribuição binomial, quando n é 
muito grande e p muito pequeno.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Probabilidades e distribuições de probabilidades
87
Se na distribuição binomial n cresce sem limites e p se aproxima de zero 
de tal maneira que np permaneça constante, podemos tomar n . p = μ como 
o parâmetro da distribuição de Poisson. 
Exemplo:
Calcular a probabilidade de não se sortear nenhuma criança em uma 
amostra de tamanho 5 de uma população com 950 adultos e 50 crianças.
Os parâmetros da distribuição binomial neste exemplo são p = 0,05 e n = 
5, então:
F(0) = (0,25)
0 . e–0,25
0!
 = 0,779
Resolvendo esse problema através da distribuição binomial teríamos 
P(X = 0) = 0,774, bem próximo ao encontrado pela distribuição de Poisson.
Atividades de aplicação
1. Determine o complemento para cada um dos seguintes eventos:
a) Obter 2 ou 3 na jogada de um dado.
b) Extrair uma carta de copas de um baralho de 52 cartas.
c) Retirar menos de 10 defeituosos.
d) Retirar pelo menos 5 defeituosos.
2. Considere o lançamento de dois dados. Considere os eventos A: “soma 
dos números obtidos é igual a 9”, e B: “número no primeiro dado maior 
ou igual a 4”. 
a) Enumere os elementos de A e B.
b) Obtenha A B, A B e Ac.
3. Sejam P(A) = 0,30, P(B) = 0,80 e P(A e B) = 0,15.
a) A e B são mutuamente exclusivos? Explique.
b) Determine P(Bc).
c) Determine P(A ou B).
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
88
Probabilidades e distribuições de probabilidades
4. Um grupo de 12 homens e oito mulheres concorre a três prêmios através 
de um sorteio, sem reposição de seus nomes. Qual a probabilidade de:
a) nenhum homem ser sorteado?
b) um prêmio ser ganho por homem?
c) dois homens serem premiados?
5. Uma remessa de 1 500 componentes eletrônicos contém 400 defei-
tuosos e 1 100 perfeitos. Duzentos componentes são escolhidos ao 
acaso (sem reposição) e classificados.
a) Qual é a probabilidade que sejam encontrados exatamente 90 
componentes defeituosos?
b) Qual é a probabilidade que se encontrem ao menos dois compo-
nentes defeituosos?
6. Certo curso de treinamento aumenta a produtividade de certa popu-
lação de funcionários em 80% dos casos. De 10 funcionários quais-
quer que participam desse curso, encontre a probabilidade de:
a) exatamente sete funcionários aumentarem a produtividade.
b) pelo menos três não aumentarem a produtividade.
7. O processo de parametrização no Aeroporto Internacional tem apre-
sentado um índice de 70% de ocorrências de sinal verde (mercadoria 
liberada sem a necessidade de vistoria física e documental), 20% de 
sinal amarelo (vistoria documental) e 10% de sinal vermelho (neces-
sidade de vistoria física e documental). Supondo num dia qualquer a 
chegada de oito lotes de produtos, determine a probabilidade de:
a) todos serem liberados sem nenhuma vistoria.
b) pelo menos dois lotes sofrerem inspeção física e documental.
c) no máximo três apenas passarem pela vistoria documental.
8. Está sendo planejado um novo hospital para uma cidade no interior 
do Nordeste, dentro de uma comunidade que ainda não tem hospital 
próprio. Sabe-se que essa cidade tem uma média de 2,3 nascimentos 
por dia, determine a probabilidade de que, em um dia qualquer, o nú-
mero de nascimentos seja:
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Probabilidades e distribuições de probabilidades
89
a) nenhum.
b) exatamente 2.
c) pelo menos 1.
9. Num processo de fabricação de certo tipo de componentes, a taxa 
de defeituosos é de 6%. Esses componentes são acondicionados em 
caixas com cinco unidades para a venda no mercado. A empresa fa-
bricante paga uma multa de R$10 por caixa em que tenha algum com-
ponente defeituoso. Num lote de 5 000 caixas, qual o valor esperado 
para pagamento de multas? 
10. Certo departamento de uma empresa está dimensionado de forma a 
poder atender, no período normal, até cinco pedidos de serviços. Se 
chegarem mais que cinco pedidos, o pessoal deve recorrer a horas ex-
tras para cumprir o atendimento. Sabendo-se que o número médio de 
pedidos que chegam diariamente é de 4,2, calcular:
a) a probabilidade de ocorrência de horas extras num dia qualquer.
b) sendo o custo diário de horas extras de R$375,00, qual será o custo 
médio mensal estimado com horas extras (considerar 22 dias)?
Gabarito
1.
a) O complemento será {1,4,5,6}.
b) O complemento será extrair uma carta de ouros ou de espadas ou 
de paus. 
c) O complemento será retirar 10 ou mais defeituosos.
d) O complemento será retirar no máximo quatro defeituosos (ou menos 
de cinco).
2.
a) A:{(3,6)(4,5)(5,4)(6,3)}
 B:{(4,1)(4,2)(4,3)(4,4)(4,5)(4,6)(5,1)(5,2)(5,3)(5,4)(5,5)(5,6)(6,1)(6,2) 
(6,3)(6,4)(6,5)(6,6)}.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
90
Probabilidades e distribuições de probabilidades
b) Os elementos de A B serão os elementos de A mais os elemen-
tos de B A B={(3,6)4,1)(4,2)(4,3)(4,4)(4,5)(4,6)(5,1)(5,2)(5,3)(5,4)
(5,5)(5,6)(6,1)(6,2)6,3)(6,4)(6,5)(6,6)}
 Os elementos de A B serão aqueles comuns aos dois conjun-
tos, logo:
 A B = {(4,5) (5,4) (6,3)}.
 Os elementos do complemento de A serão aqueles que não perten-
cem a A, mas pertencem aos demais conjuntos do espaço amostral: 
 
Ac =
 
(1,1)(1,2)(1,3)(1,4)(1,5)(1,6)(2,1)(2,2)(2,3)(2,4)(2,5)(2,6)(3,1)(3,2)(3,3)(3,4)
(3,5)(4,1)(4,2)(4,3)(4,4)(4,6)(5,1)(5,2)(5,3)(5,5)(5,6)(6,1)(6,2)(6,4)(6,5)(6,6)3.
a) Não são mutuamente exclusivos, pois existe A B = 0,15.
b) O complemento de B é dado por: P(Bc) = 1 – P(B), logo P(Bc) = 
1 – 0,80 = 0,20.
c) P(AUB) = P(A) + P(B) – P(A∩B) . .. P(AUB) = 0,30 + 0,80 – 0,15 = 0,95.
4.
a)
 
3 0
8 12
3
20
.
0,049=
C C
C 
b)
 
2 1
8 12
3
20
.
0,295=
C C
C 
 
c)
 
1 2
8 12
3
20
.
0, 463=
C C
C
5.
a) 
90 110
400 1100
200
1500
.C C
C
b) 
0 200 1 199 2 198
400 1100 400 1100 400 1100
200
1500
. . .
1
 + +
−  
 
C C C C C C
C
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Probabilidades e distribuições de probabilidades
91
6.
a) Esse é um caso de uma distribuição binomial, em que p = 0,80 e 
n = 10, sendo assim:
 P(X = 7) = C10.7(0,8)
7.(0,2)3 ∴ P(X = 7) C10,7(0,8)7.(0,2)3 = 
 120.(0,2097).(0,008) = 0,2013
b) Nesse caso, o valor de p = 0,20 (probabilidade de não aumentar), 
então pelo menos 3 não aumentarem é a P(X ≥ 3) = 1 – P(X < 3), 
ou seja, P(X ≥ 3) = 1 – [P(X = 0) + P(X = 1) + P(X = 2) ∴ P(X ≥ 3) = 1 
– [C10,0 (0,2)
0.(0,8)10 + C10,1(0,2)
1.(0,8)9 + C10,2 (0,2)
2.(0,8)8] ∴ P(X ≥ 3) = 
1 – [0,1074 + 0,2684 + 0,3020] ∴ P(X ≥ 3) = 1 – [0,6778] = 0,3222
7. Esse problema é um caso de distribuição binomial em que o valor de p 
se altera em função do evento solicitado e n = 8, sendo assim em:
a) P(todos receberem o sinal verde) com p = 0,7 e n = 8, logo,
 P(X = 8) = C8,8 (0,7)
8.(0,3)0 = 0,0576.
b) P(pelo menos 2 lotes receberem o sinal vermelho) com p = 0,10 
e n = 8
 P(X ≥ 2) = 1 – P(X < 2) = 1 – [P (X = 0) + P(X = 1)]
 P(X ≥ 2) = 1 – [C8,0 (0,1)
0.(0,9)8 + C8,1 (0,1)
1.(0,9)7]
 P(X ≥ 2) = 1 – [0,4305 + 0,3826] = 0,1869.
c) P(no máximo 3 receberem o sinal amarelo) com p = 0,2 e n = 8
 P(X ≤ 3) = P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3)
 P(X ≤ 3) = [C8,0 (0,2)
0.(0,8)8 + C8,1 (0,2)
1.(0,8)7 + C8,2 (0,2)
2.(0,8)6 + C8,3 
(0,2)3.(0,8)5]
 P(X ≤ 3) = [0,1678 + 0,3355 + 0,2936 + 0,1468] = 0,9437.
8. Esse problema trata de uma distribuição de Poisson, com média de 2,3 
ocorrências por dia. Sendo assim, temos que:
a) P(X = 0) = 
(2,30 . ε–2,3)
0! 
 = 0,1002 ou 10,02%.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
92
Probabilidades e distribuições de probabilidades
b) P(X = 2) = 
(2,32 . ε–2,3)
2! 
 = 0,2652 ou 26,52%.
c) P(X ≥ 1) = 1 – P(X < 1) = 1 – P(X = 0) ∴ P(X ≥ 1) = 1 – 0,1002 = 0,8998 
ou 89,98%.
9. É uma aplicação da distribuição binomial. Inicialmente, devemos ob-
ter a probabilidade de ocorrer algum componente defeituoso numa 
caixa, ou seja: 
 P(X ≥1) com n = 5 e p = 0,06 ∴ P(X ≥1) = 1 – P(X < 1) = 1 P(X = 0). Logo:
 P(X ≥1) = 1 – [C5,0 (0,06)
0 (0,94)5] ∴ P(X ≥ 1) = 1 – [0,7339] = 0,2661 
ou 26,61%.
 Como a empresa paga R$10,00 por caixa com algum componente de-
feituoso e o lote contempla 5 000 caixas, então a multa esperada será 
dada por:
 E(multa) = P(caixa com algum componente defeituoso) x total de cai-
xas x R$10,00
 E(multa) = 0,2661 x 5.000 x R$ 10,00 em que E(multa) = R$13.305,00.
10. É um caso de aplicação de uma distribuição de Poisson, com média de 
4,2 pedidos/dia.
a) P(X ≥5) = 1 – P(X < 5) = 1 – [P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3) + 
P(X = 4)]
 
- - - - -é ùe e e e eê ú= + + + +ê úë û
0 4 ,3 1 4 ,3 2 4 ,3 3 4 ,3 4 4 ,34,2 4,2 4,2 4,2 4,2
1
0! 1! 2! 3! 4 !
 = 1 – [0,5704] = 0,4296 ou 42,96%.
b) E(custo horas extras/mês) = P(realizar horas extras) x custo/dia x 
número de dias/mês em que E(custo horas extras/mês) = 0,4296 x 
R$375,00 x 22 = R$3.544,20.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Amostragem
Problema
A empresa ABC tem uma administração participativa e decidiu que os 
funcionários devem eleger os chefes de seção. No almoxarifado, dois can-
didatos apresentam-se. João parece ter a preferência de seus pares, mas 
Pedro acredita que pode superar João se fizer uma boa campanha. Resol-
ve então fazer uma pesquisa de opinião para compreender quais são os 
principais anseios de seus colegas e quer aproveitar a pesquisa para ver o 
nível de aceitação de seu nome. Como o número de empregados do almo-
xarifado é muito grande, opta por fazer um levantamento através de um 
processo de amostragem.
Para tanto, elabora um plano amostral e um questionário para realizar o 
seu levantamento. Faz parte de seu planejamento a determinação do tipo de 
sorteio que realizará, a determinação do tamanho da amostra e a estratégia 
do trabalho de campo.
Ele sabe que o tamanho da amostra dependerá fundamentalmente de duas 
determinações; a precisão do resultado e o erro amostral. Resolve, então, que 
deseja ter uma grande precisão que implique um desvio de mais ou menos 3% 
com um nível de confiança de 95%, ou seja, um erro amostral de 5%.
Assim, se ele tiver 40% das intenções de voto, saberá, então, com 95% de 
confiança, que em uma eleição com todos os funcionários, sua proporção de 
votos estará entre 37% e 43%. Ou, de outra forma, a proporção de votos que 
ele terá na população estará dentro desse intervalo e, uma vez que a pesqui-
sa foi feita por amostragem, esse intervalo será construído através de uma 
amostra que poderá ser representativa da população ou não, e a chance que 
esse sorteio retire uma amostra não representativa é de 5%, porque o nível 
de confiança e o erro amostral representam probabilidades complementa-
res, ou seja, a sua soma é sempre 100%. Se o levantamento for realizado com 
um erro amostral de 2%, então o nível de confiança será de 98%.
Comumente os resultados de pesquisas como essa falam em margem de 
erro de mais ou menos 2 ou 3%. O que se publica como margem de erro é 
95Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
96
Amostragem
na verdade o desvio. O desvio está relacionado com a precisão que se deseja 
obter. Quanto menor o desvio, maior a precisão. 
Essa declaração pode ser escrita em termos matemáticos através do se-
guinte intervalo de confiança:
Pr ( 37% < P < 43%) = 0,95
Pr (40 – 3 < P < 40 + 3) = 1 – 0,05
De forma genérica, o intervalo de confiança de uma proporção é dado 
pela seguinte expressão:
Pr ( p – d < P < p + d ) = 1 – α
Nessa expressão, Pr significa probabilidade, P (p maiúsculo) é a proporção 
de votos de Pedro na população, p (p minúsculo) é a proporção de votos de 
Pedro na amostra, d é o desvio e α é o erro amostral. Portanto, (1 – α) é defi-
nido como o nível de confiança.
Rigorosamente, segundo a Teoria Estatística Clássica, uma vez que P é um 
parâmetro da população, portanto, um valor exato, não se pode falar em 
probabilidade de um parâmetro estar dentro de um intervalo. E mais, a in-
terpretação de um intervalo de confiança é a de que, se fossem retiradas 100 
amostras, em 95 delas o parâmetro deveria pertencer ao intervalo. Mas essa 
simplificação não atrapalha o raciocínio realizado.
Conceitos fundamentais
Um levantamento amostral ou através de amostragem é uma pesqui-
sa realizada em parte de uma população com o objetivo de calcular uma 
medida na amostra que sirva de estimativa dessa medida na população. 
No exemplo acima, a proporção de votos de Pedro na amostra serve como 
uma estimativa da proporção de seus votos na população. Além da propor-
ção, outras medidas muito comuns realizadas na amostra como estimado-
res dos parâmetros populacionais são a média e o desvio-padrão.
Formalizando alguns conceitos:
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Amostragem
97
População
População é um conjunto de pessoas, animais, objetos ou coisas que têm 
uma característica em comum e que sejam objeto de investigação.
Exemplos:
 população de pessoas que habitam uma cidade;
 população de eleitoresde uma cidade. Nesse caso, são consideradas 
somente as pessoas cadastradas no tribunal regional eleitoral das 
zonas eleitorais do município em questão. Não importa se a pessoa de 
fato reside na cidade ou não. Muitos eleitores de curitiba residem nas 
cidades da região metropolitana;
 população de empregados de uma empresa, ou de um setor de uma 
empresa;
 população de cachorros de rua de uma cidade;
 população de refrigeradores produzidos por uma indústria no ano y;
 população das carteiras de uma escola.
As medidas observadas em uma população são chamadas de parâmetros. 
No geral, são apresentadas por caracteres maiúsculos ou por letras gregas.
 Tamanho da população – N.
 Media da população – μ (letra grega mi).
 Desvio-padrão da população – σ (letra grega sigma).
Um levantamento realizado com todos os elementos de uma população 
é chamado de censo. Os primeiros censos de que se tem notícia foram reali-
zados na China. Mais tarde ficaram famosos os censos do Império Romano, 
cujo objetivo era conhecer o tamanho de seu domínio. Um desses censos foi 
realizado no ano do nascimento de Jesus Cristo. Os cristãos acreditam que 
esse censo foi realizado justamente para identificar a figura de uma criança 
que mais tarde se tornaria o filho de Deus.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
98
Amostragem
Os censos populacionais são realizados em todo o mundo, de dez em 
dez anos, por recomendação da Organização das Nações Unidas. No Brasil, 
o primeiro censo foi organizado pelo estatístico Italiano Giorgio Mortara, em 
1940, que também foi o fundador do IBGE (Instituto Brasileiro de Geografia e 
Estatística). Hoje, o IBGE é considerado um dos maiores e mais competentes 
institutos do gênero ao redor do mundo. O IBGE trabalha com técnicas esta-
tísticas complexas e sofisticadas.
Na realização do censo, existem dois questionários. Um questionário 
básico que todas as famílias brasileiras respondem e um questionário com-
pleto que é respondido por uma amostra de 10% da população. Ou seja, uma 
em cada 10 famílias deve responder o questionário completo. Até o censo de 
1991 essa amostra era de 25%. Mas com a evolução das técnicas estatísticas 
de estimação pode-se diminuir o tamanho da amostra. Na maioria dos países 
com tradição em realização de levantamentos amostrais, como, por exemplo, 
os Estados Unidos, o censo serve somente para a contagem da população, 
todas as outras determinações são realizadas através de amostragens.
Observe-se que os censos devem ser realizados nos anos de final zero. O 
censo de 1990 foi realizado com um ano de atraso por dificuldades operacio-
nais durante o governo de Fernando Collor de Melo. Essa defasagem causa 
problemas de ordem técnica bastante graves quando se deseja realizar es-
timativas baseadas nos resultados do censo. As séries temporais que deve-
riam ter uma mesma amplitude de dez em dez anos passaram a ter nesse 
período uma defasagem de onze e depois nove anos. 
Curiosidade
Giorgio Mortara dizia que os estatísticos são como os músicos. Onde todos 
veem cifras musicais, o músico escuta uma canção. Da mesma forma onde 
todos veem números, os estatísticos enxergam a realidade.
Amostra
Amostra é um subconjunto de uma população que pretende representá-la. 
As medidas realizadas em uma amostra são chamadas de estatísticas. 
Como elas pretendem estimar o valor da mesma medida na população, os 
seus valores calculados são chamados de estimativa. A expressão utilizada 
para calcular a medida é chamada de estimador.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Amostragem
99
No exemplo anterior, a proporção de votos de Pedro na população é um pa-
râmetro. A proporção de votos na amostra é um estimador desse parâmetro. O 
seu valor, no caso em tela, 40% é uma estimativa do valor do parâmetro. 
A média da amostra é um estimador da média da população, mas não é o 
único estimador possível. A mediana da amostra, por exemplo, pode ser um 
estimador da média da população. Ocorre que a média da amostra é um es-
timador da média da população que tem certas propriedades que a tornam 
um estimador melhor do que a mediana amostral.
As medidas realizadas na amostra são representadas por letras minús-
culas ou através de caracteres especiais. Quando é um estimador, também 
podem ser representadas através da mesma letra do parâmetro que desejam 
estimar acrescentada de um acento circunflexo que é chamado de chapéu.
 Tamanho da amostra – n.
 Média da amostra – X , µ^ .
 Desvio-padrão da amostra – S, s, σ.
Tipos de amostragem
Quanto à repetição de elementos da amostra
Uma amostra pode ser retirada da população podendo os elementos 
dessa população aparecerem mais de uma vez na amostra, ou não. Se todos 
os elementos da amostra são diferentes, ou seja, um mesmo elemento não 
pode participar duas vezes da amostra, a amostragem é dita ser amostra sem 
reposição. Caso contrário, a amostra é dita ser com reposição.
No processo de sorteio da loteria federal, por exemplo, quando são sor-
teados seis números de 0 a 9 para formar uma centena de milhar, a amostra-
gem é com reposição. Sorteia-se de um globo uma bola que representará a 
unidade. Esse número é verificado e colocado novamente no globo para o 
sorteio da dezena e assim por diante até o sorteio da bola correspondente à 
centena de milhar. Na verdade, o sorteio é feito com seis globos, o que equi-
vale ao processo descrito acima. Então esse sorteio é com reposição.
No processo de sorteio da mega-sena, por outro lado, o processo é sem 
reposição, porque se sorteiam seis bolas de um globo que tem um total de 
60 bolas numeradas.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
100
Amostragem
Em um processo sem reposição, a probabilidade de um número ser sorte-
ado de uma população de tamanho N é 1
N
. Em um processo com reposição, 
a probabilidade de n números especiais participarem da amostra é 1
CN, n
.
Curiosidade
Se um vendedor de bilhetes da loteria federal tiver somente duas opções 
de bilhetes para a venda, a cobra 333 333 ou o cachorro 234 320, qual deles 
tem maior probabilidade de ser o bilhete vencedor? Qual você compraria?
A tendência imediata de qualquer apostador seria que intuitivamente o 
segundo bilhete tem maior chance de ocorrer. No entanto, como em muitos 
outros casos, a intuição da probabilidade é enganosa. A chance de ocorrer 
3 ou 0 no sorteio da unidade é idêntica e igual a 1/10. Da mesma forma, a 
chance de ocorrer 3 ou 2 no sorteio da dezena também é idêntica e igual 
a 1/10. Os sorteios são com reposição e independentes. A chance final dos 
dois bilhetes serem vencedores é idêntica e igual a (1/10)6, ou uma chance 
em 1 000 000 (um milhão). De fato uma probabilidade bem pequena.
A probabilidade de se ganhar na mega-sena é 
1
C60, 6 que é igual a 1 em 
50 063 860, ou seja, uma chance em cinquenta milhões, uma probabilida-
de bem menor que a da loteria federal. E se jogar dois bilhetes na mega- 
-sena? A probabilidade então será 2 em 50 milhões, ou uma chance em 25 
milhões. Ainda muito difícil de ganhar. Então seria melhor jogar em sete 
números? Bom, aí a probabilidade de se acertar seis números é de uma 
chance em 7 151 980, aproximadamente uma em 7 milhões. Exatamente 
sete vezes maior do que jogar somente em seis números. Por isso se o bi-
lhete de aposta com seis números custa R$1,50 o bilhete de apostas com 
sete números custa R$10,50, exatamente sete vezes mais. 
 
Quanto à representatividade
Uma amostra pode ser probabilística ou não probabilística. Para efeito 
de inferência, isto é, se o propósito é o de estimar valores de parâmetros 
da população, somente amostras probabilísticas conseguem ser úteis. Ou 
seja, só é possível fazer inferências para a população através de observa-
ções da amostra se os elementos forem escolhidos através de algum pro-
cesso de sorteio. 
Este materialé parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Amostragem
101
Em um processo de amostragem probabilístico há que se poder calcular 
o valor da probabilidade de um elemento da população que participa da 
amostra.
Amostragens não probabilísticas servem para se fazer sondagens sem 
propósitos inferenciais. Nesses casos, os procedimentos que envolvem com-
parações estatísticas que impliquem cálculos científicos não são válidos.
Processos de amostragem não probabilísticos
Amostragem por cotas
Esse procedimento é muito utilizado e às vezes confundido com o pro-
cesso de amostragem estratificada proporcional, que será estudado mais 
adiante. Consiste em buscar repetir na amostra a proporção de elementos 
de cada estrato da população. Então, se a população é composta de 50% 
de homens, 20% de jovens e assim por diante, a amostra terá também essa 
composição. O que diferencia a amostragem por cotas da amostragem estra-
tificada proporcional é que, no primeiro caso, os elementos da amostra não 
são selecionados através de sorteio.
Muitos institutos de pesquisa utilizam esse tipo de levantamento. Fazem 
entrevistas na rua, por exemplo, em que o agente de campo vai escolhen-
do as pessoas até que complete cada uma das cotas. O processo não serve 
para propósitos de inferência porque pode ser contaminado pela escolha 
realizada pelo agente. No geral, pessoas com pressa ou mais sisudas acabam 
não participando da amostra, embora possam representar uma parcela im-
portante de opinião, dependendo do objeto da pesquisa. Pesquisas de mer-
cado, por exemplo, podem ter resultados completamente tendenciosos em 
razão da escolha da amostra.
Por outro lado, em pesquisas eleitorais, candidatos podem forçar a par-
ticipação de assessores ou cabo eleitorais em pesquisas de rua com o pro-
pósito de fazer da pesquisa uma peça de campanha. Embora não se tenha 
comprovação científica ainda, supõe-se que eleitores indecisos votem em 
candidatos com maior chance de vitória para “não perderem o seu voto”. No 
processo de eleição americana, bastante diferente do brasileiro, o Instituto 
Gallup verificou que os resultados das pesquisas eleitorais não afetam de 
forma importante o resultado final da eleição. É bom lembrar, no entanto, 
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
102
Amostragem
que o voto nos Estados Unidos não é obrigatório e que as eleições são reali-
zadas de forma indireta através de delegados partidários. 
Amostragem de voluntários
Nesse tipo de amostragem, os elementos da amostra são definidos pela 
opção do próprio elemento em participar do processo. Ele é muito comum 
em publicações de revistas ou jornais ou então na opinião de usuários de 
certos serviços, como restaurantes, por exemplo.
Muitas revistas colocam em determinados números encartes em que 
o leitor deve opinar sobre a qualidade da revista e de certas seções es-
pecíficas. O que ocorre no geral é que a grande maioria das pessoas que 
respondem ao questionário, o fazem porque não estão satisfeitas com a 
publicação ou pelo menos com parte dela. Essa sondagem pode ser útil 
para os editores da revista porque terão uma ideia do que podem melhorar, 
mas não há como se fazer estimativas acerca do que a maioria dos leitores 
pensa da publicação. O mesmo ocorre em restaurantes ou em conferências 
quando os comensais ou os participantes das conferências são instados a 
responderem questionários.
Amostragem intencional
Aqui o pesquisador busca na população uma parte dela que lhe inte-
ressa. Os participantes da amostra são escolhidos por terem alguma ca-
racterística que interessa ao pesquisador. Da mesma forma que os outros 
processos não probabilísticos, nesse caso não há como se fazer inferências 
para toda a população.
Uma pesquisa sobre qualidade de atendimento hospitalar pode ser re-
alizada em um setor do hospital. Podem ser escolhidos para participarem 
da amostra pacientes desse setor. Naturalmente os resultados obtidos dessa 
forma não podem ser estendidos para todo o hospital.
Amostragem a esmo
Muitas vezes este processo é confundido com uma amostragem aleatória. 
A palavra aleatória vem de alea (de sorte do latim – todos lembram de alea 
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Amostragem
103
jacta est, “a sorte está lançada”, de Júlio César ao invadir Roma). No contexto 
da estatística, a palavra aleatória está relacionada com processo de escolha 
por sorteio. Em contextos específicos a palavra aleatória é substituída pela 
palavra estocástica. 
Escolher a esmo, portanto, não é processo científico de escolha de ele-
mentos da população para participarem da amostra. 
Processos de amostragem probabilísticos
As amostragens que têm valor científico são aquelas em que se conse-
gue de alguma forma determinar a probabilidade de um elemento da po-
pulação em participar da amostra. Não necessariamente todos os elementos 
da população devam ter a mesma chance de participar da amostra, como 
no caso da amostragem estratificada proporcional (por exemplo, como será 
visto logo a seguir), mas, repetindo, há que se conseguir determinar qual a 
probabilidade de participação na amostra.
As principais técnicas de amostragem probabilística serão estudadas na 
seção que segue. São elas: amostragem aleatória simples, amostragem es-
tratificada proporcional, amostragem sistemática, amostragem por conglo-
merados e amostragem em dois estágios. Antes, porém, será conveniente a 
apresentação da Tabela de Números Aleatórios.
Tabela de números aleatórios
As tabelas de números aleatórios são tabelas de algarismos geradas em 
computador para auxiliar o pesquisador a sortear números de elementos 
da população que deverão participar da amostra. Na verdade, elas simulam 
uma urna na qual bolas ou papéis são colocados com números de 1 a N, 
onde N é o último elemento numerado de uma população. 
Essas tabelas podem ser geradas em programas simples, como o Excel, 
por exemplo. Elas são especialmente úteis quando se deve fazer o sorteio 
sem que se tenha um computador em mãos ou mesmo uma máquina de 
calcular científica. Muitas delas têm um módulo para sorteio de números ale-
atórios. Um exemplo de tabela é a apresentada a seguir:
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
104
Amostragem
1 2 3 4 5 6 7 8 9
1 5 7 5 1 8 1 9 6 1
2 2 6 6 5 9 1 2 4 5
3 4 5 3 6 1 7 4 7 9
4 7 2 8 3 2 3 9 7 4
5 5 6 9 6 0 5 5 4 6
6 0 6 8 7 3 7 1 2 1
7 6 9 2 0 3 1 7 2 8
8 4 1 5 6 3 6 0 1 5
9 7 2 4 7 1 3 8 3 1
10 7 5 1 1 7 3 1 3 6
11 1 7 0 3 5 7 8 3 5
12 4 6 2 8 3 1 4 5 6
13 5 5 6 6 5 2 4 8 8
14 5 2 4 4 6 2 3 6 5
15 5 6 8 8 7 4 7 8 6
16 4 4 6 0 6 8 4 4 2
17 8 2 1 0 5 6 9 6 2
18 9 9 5 9 4 3 7 9 8
19 8 2 9 4 3 5 4 5 3
20 9 7 8 8 6 4 9 2 2
21 2 3 2 7 4 9 0 6 7
22 4 6 5 8 2 8 8 1 4
23 3 0 1 8 1 1 7 5 9
24 3 8 1 6 4 4 5 2 3
25 1 3 8 3 4 7 7 7 7
26 5 1 0 0 3 8 6 6 3
27 3 0 1 4 4 5 1 2 6
28 3 5 8 7 7 5 3 7 6
29 1 3 3 5 1 7 6 8 1
30 9 6 4 9 5 2 3 1 9
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Amostragem
105
A tabela gerada possui 30 linhas e 9 colunas. Suponhamos que se deseje 
sortear um número de um componente de uma população com 80 elemen-
tos numerados de 1 a 80. Primeiramente, devemos escolher uma linha e uma 
coluna para início do processo. Vamos tomar uma data qualquer para iniciar o 
processo. Dia 16 de abril, data de nascimento de Charles Chaplin e do Cardeal 
Ratzinger, atual Papa Bento 16. Quando olhamos a tabela verificamos na linha 
16 e coluna 4 que o dígito sorteado foi o zero. Mas como precisamos de um 
número com dois dígitos tomaremos o 0 e o seu vizinho imediatamente à di-
reita para compor o número sorteado. Então o número sorteado foi o 06. Como 
a população está numerada de 01 a 80, tomamos o elemento de número 6 e 
verificamos o valor da variávelde interesse correspondente àquele elemento. 
Se for a idade, por exemplo, verificamos qual é a idade do elemento 6.
Principais técnicas de amostragem
Amostra aleatória simples
O processo de amostragem aleatória simples (AAS) é o processo mais 
simples. Nele, todos os elementos da população têm a mesma probabilida-
de em participar da amostra. No exemplo em tela, se a população tem 80 
elementos, então a probabilidade de um elemento da população vir a parti-
cipar da amostra é de 1/80.
Se desejamos tomar uma amostra maior e o processo for com reposição, 
essa probabilidade permanece 1/80 para cada etapa do sorteio. Se for sem 
reposição, na segunda etapa a probabilidade é de 1/79, a seguinte 1/78 e 
assim por diante. Mas a chance de que cada elemento participe da amostra 
é a mesma.
Supondo agora que desejamos sortear uma amostra de tamanho 10, 
então, teremos que tomar 10 elementos da população numerada de 1 a 80. 
Utilizando a mesma entrada, linha 16 e coluna 4, já tínhamos verificado que 
o primeiro elemento a participar da amostra era o de número 6. Estabelecen-
do o critério de tomar os números a seguir para baixo na tabela, o próximo 
número sorteado é o 05. O número seguinte é o 94, que é maior que 80 e, 
portanto, não serve. Não há ninguém da população com esse número.
Selecionamos, então, o próximo, que é o número 43, e assim por diante 
até completar os dez números. Já temos três números, mas ainda faltam sete 
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
106
Amostragem
para completarmos o tamanho estabelecido para a amostra. Continuando 
na tabela, os próximos números menores que 80 são 74, 64, 34, 03, 44 e 51, 
quando termina a tabela. Ainda nos falta um número. Retomamos o pro-
cesso da linha 1, colunas 5 e 6. Aparecem os números 81, 91 e 17. Os dois 
primeiros não servem, então o último número sorteado é o 17. Dessa forma, 
completamos o processo e os números sorteados foram:
06, 05, 43, 74, 64, 34, 03, 44, 51 e 17.
Como não há nenhum número repetido, não precisamos nos preocupar 
se o sorteio era com ou sem reposição. No geral, essa determinação é feita 
antes do sorteio e, na maior parte das vezes, nos interessam sorteios sem 
reposição. Quando nada é dito a respeito, supõe-se que o sorteio seja sem 
reposição, ou seja, todos os elementos devem ser diferentes.
O trabalho agora consiste em verificar o valor da variável ou do atributo 
de interesse de cada um dos elementos. Sua idade, seu sexo e sua intenção 
de voto, por exemplo.
Amostra estratificada proporcional
Esse tipo de amostragem é semelhante ao processo de amostragem por 
cotas, com a diferença de que nesse caso os elementos são escolhidos atra-
vés de algum tipo de sorteio. Assim, se a população pode ser dividida em 
estratos e estes se constituem em diferenças de características que podem 
afetar o resultado da pesquisa, a proporção que cada estrato tem na compo-
sição da população deve ser repetida na amostra.
O cuidado que se deve tomar aqui é o de que a divisão em estratos deve 
fazer sentido para a pesquisa que se deseje realizar. Se, por exemplo, o obje-
tivo é fazer uma pesquisa sobre a inteligência de um grupo, que será mensu-
rada através da medida do QI (quoeficiente de inteligência), e, supondo que 
essa possa ser uma boa medida, apesar das críticas que recebe, não parece 
razoável dividir a população em estratos por sexo. Não há nenhuma com-
provação científica de que as mulheres sejam mais inteligentes do que os 
homens, muito embora essa seja a impressão geral.
Por outro lado, se desejamos fazer um estudo antropométrico de uma 
população através da medida da altura média dessa população, parece bas-
tante razoável dividi-la em estratos segundo o sexo. E por que devemos fazer 
isso? Suponha que somente 20% da população em questão seja de mulheres. 
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Amostragem
107
Como é sabido, os homens são, de uma forma geral, mais altos do que as mu-
lheres, e se fizermos um sorteio através de uma amostra aleatória simples, 
poderemos correr o risco de termos na amostra 40% de mulheres ou mais, o 
que nos levaria ao final a subestimar a altura média daquela população. 
Suponha que tal pesquisa seja realizada em uma população com 60 pes-
soas e que uma amostra de tamanho 10 deva ser retirada de uma população 
com 12 mulheres e 48 homens. 
Primeiramente, verifica-se a proporção de homens e mulheres na popula-
ção. A proporção de mulheres (pm) é dada por:
Pm =
Nm
N
onde Nm é o numero de mulheres e N o total da população. Assim:
Pm =
12
60
. 100 = 20%
Se a amostra é de tamanho 10, então o número de mulheres na amostra 
será dado por:
nm = n . pm = 10 . 20% = 10 . (20/100) = 2
Então, o número de homens será de 8. De fato, 8 representa 80% da amos-
tra, da mesma forma que 48 representa 80% de 60. Em uma tabela, teríamos:
Sexo População Amostra
Homens Nh nh
Mulheres Nm nm
Total N n
Para uma população com a composição acima, o número de mulheres na 
amostra é determinado por:
nm = (Nm/N) . n
E o número de homens por:
nh = (Nh/N) . n
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
108
Amostragem
Exemplo:
Deseja-se fazer uma estimativa do salário médio dos empregados de uma 
empresa através de uma amostra de tamanho 10, em um sorteio sem repo-
sição, utilizando a tabela de números aleatórios a partir da linha 29 coluna 3, 
correspondente a 29 de março, dia do aniversário de Curitiba.
A tabela a seguir corresponde à divisão dos funcionários segundo os seus 
cargos na empresa:
Setor Empregados
Técnico 20
Administrativo 60
Operacional 120
Total 200
Supondo que os valores dos salários dos técnicos sejam maiores do que 
o de pessoal administrativo, que por sua vez é maior do que o dos empre-
gados do setor de operações, faz sentido fazer uma amostragem estratifi-
cada proporcional.
O primeiro passo é determinar o número de funcionários de cada setor 
que irá compor a amostra de tamanho 10, respeitadas as proporções de cada 
setor na população. Então:
Setor População Amostra
Técnico 20 (20/200) . 10 = 1
Administrativo 60 (60/200) . 10 = 3
Operacional 120 (120/200) . 10 = 6
Total 200 10
Determinado o tamanho de cada estrato na amostra, procede-se o 
sorteio. Antes, porém, é necessário numerar os empregados de 1 até 200. 
Pode-se, então, atribuir aos empregados do setor técnico a numeração de 
1 a 20. Para os do setor administrativo, de 21 a 80 e para os do setor opera-
cional, de 81 a 200. 
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Amostragem
109
Setor Amostra Números sorteados
Técnico [1;20] 1 015
Administrativo [21;80] 3 031, 068, 056
Operacional [81;200] 6 181,173,174,138,117,176
Total 10
Sorteados os números dos empregados, deve-se verificar qual é o salário 
de cada um deles e depois calcular a média salarial da amostra, cujo valor 
estimará a média salarial de todos os empregados da empresa.
Amostra sistemática
A amostra sistemática é utilizada quando a população já se encontra or-
ganizada em alguma forma de arquivo. 
Suponha que desejamos fazer uma revisão tipográfica em um livro de 
400 páginas através de uma amostra de tamanho 10. O processo consiste em 
determinar o valor da fração amostral, que é dada por:
f = N
n
O primeiro passo é sortear o primeiro elemento da amostra através da 
tabela de números aleatórios. O segundo será determinado pela soma do 
primeiro número com a fração amostral. O terceiro é o segundo mais a fração 
amostral e assim por diante até completar o tamanho da amostra.
No exemplo dado, a fração amostral é igual a 400/10 = 40. Vamos deter-
minar a entrada pela linha 1 coluna 1, primeiro dia do ano, que corresponde 
à página 57.
A segunda página será 57 + 40 = 97. A terceira, 137, e na sequência as pági-
nas 177, 217, 257, 297, 337, 377. A seguinte seria a página 417,mas ela supera o 
número de páginas do livro. Subtraímos então 400 de 417 e a página sorteada 
será a de número 17. A próxima seria a página 57, mas que já foi sorteada, o 
processo, então, se completa com a determinação da décima página, que é a de 
número 17. As páginas que serão verificadas são, então, as de números:
17, 57, 97, 137, 177, 217, 257, 297, 337 e 377.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
110
Amostragem
Observe que esse é um processo circular no qual não importa onde seja 
o início. A amostra sistemática é um caso particular de uma amostra estrati-
ficada proporcional, em que cada estrato corresponde a um conjunto de 40 
páginas e que de cada estrato se sorteia um elemento.
Esse processo é o utilizado pelo IBGE na determinação de quem responde-
rá o questionário completo com uma fração amostral igual a 10. Seleciona-se 
uma casa para fazer o questionário completo e a cada dez casas ele é repas-
sado para a família que o responderá. Esse processo é também utilizado para 
a realização de pesquisas eleitorais. Sorteia-se uma quadra, determina-se a 
primeira residência em que uma pessoa será entrevistada (no geral, a que 
atende a porta ou a de aniversário mais próximo, desde que seja eleitor no 
município), salta-se o número de casas correspondentes à fração amostral e 
a nova entrevista será feita na casa determinada por esse processo.
Amostra por conglomerados
Na amostragem por conglomerados divide-se a área a ser pesquisada em 
setores bem definidos, sorteia-se uma certa quantidade desses setores atra-
vés de uma amostra aleatória simples e pesquisa-se todos os elementos da 
sua população.
Na amostragem por conglomerados, quanto mais os elementos dentro 
do setor forem “parecidos” com a população como um todo, melhor será o 
resultado obtido. Isto é, se a variância interna dentro do setor for alta, a varia-
bilidade total será menor. Exatamente o oposto do que ocorre com a amos-
tra estratificada proporcional, em que as variâncias dentro de cada estrato 
devem ser pequenas.
Amostragens por conglomerados são bastante utilizadas em pesquisas 
de campo que envolvem a opinião de moradores de uma cidade. Os setores 
podem ser as zonas eleitorais em uma pesquisa de intenção de votos ou os 
setores censitários do IBGE, que são áreas bem definidas com cerca de 300 
domicílios, os quais são utilizados para fazer o censo demográfico. 
A principal vantagem de uma amostra por conglomerados é a facilidade 
de realização do trabalho de campo, que pode implicar uma economia bas-
tante grande de recursos empregados para a realização da pesquisa.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Amostragem
111
Amostragem em dois estágios
Quando os elementos de um setor têm grande homogeneidade, a efici-
ência da amostragem por conglomerados pode ficar comprometida. Uma 
forma de se contornar esse problema é a realização de sorteio entre os ele-
mentos de cada setor já sorteado na amostragem por conglomerados. No 
geral, ambos os sorteios são realizados através de uma amostra aleatória 
simples, ou o primeiro através de uma amostra aleatória simples e o segundo 
através de uma amostra sistemática.
O procedimento de amostragem em dois estágios ou em duplo estágio 
consiste em:
organização da população em setores (conglomerados); �
sorteio de alguns conglomerados através de uma amostra aleatória �
simples;
dentro de cada setor, sorteio dos elementos que participarão da amos- �
tra através de um processo de amostragem aleatória simples ou amos-
tragem sistemática.
Tamanho da amostra
A determinação do tamanho da amostra é uma das tarefas mais comple-
xas em um processo de pesquisa e requer um trabalho bastante cuidadoso. 
Vários aspectos devem ser considerados no seu cálculo e uma falácia deve 
ser definitivamente abandonada, que é a ideia de que se pode determinar 
o tamanho da amostra através de uma determinação percentual em rela-
ção ao tamanho da população. Por exemplo, tomar uma amostra de 5% da 
população ou de 10% da população como representativa dela; esse proce-
dimento só pode ter alguma validade se a partir dele forem determinados o 
erro estatístico e o desvio dos valores dos parâmetros obtidos.
De outra forma, vale dizer que uma amostra de 0,5% da população pode 
ser representativa dela e que uma amostra de 10% pode não ser, dependen-
do do tamanho da população e da técnica de amostragem utilizada.
Outra consideração fundamental na determinação do tamanho da amostra 
é o limite imposto pela quantidade de recursos disponíveis para a realização 
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
112
Amostragem
do levantamento amostral. Esse fator limitante pode inclusive inviabilizar o 
trabalho de pesquisa, como veremos um pouco mais adiante.
Três fatores técnicos são considerados no cálculo do tamanho da amos-
tra: a precisão, o nível de confiança e a variabilidade da amostra. 
A precisão é determinada pelo desvio do valor da estimativa na amostra 
em relação ao verdadeiro valor do parâmetro na população, também conhe-
cido como margem de erro.
O nível de confiança é um valor de probabilidade complementar ao erro 
estatístico. O erro estatístico, por sua vez, é a probabilidade em que a amos-
tra sorteada não represente a população.
Em relação à variabilidade da amostra, podemos dizer que, quanto mais 
homogênea a população, menor será a necessidade de uma amostra grande. 
Poucos elementos representam bem a amostra.
Uma última consideração deverá ser feita com relação ao tamanho da 
amostra, que diz respeito ao tamanho da população. Para populações pe-
quenas, há que se fazer uma correção na determinação do tamanho da 
amostra, chamada de correção para populações finitas.
A “margem de erro”
O que é chamado de “margem de erro” ou “erro máximo da estimativa” 
é na verdade a diferença máxima provável entre a medida do estimador 
observado na amostra e o verdadeiro valor do parâmetro da população. 
Trata-se, portanto, do desvio entre o valor calculado na amostra e o verda-
deiro valor do parâmetro da população.
 Na pesquisa amostral do exemplo da eleição do chefe do setor, se Pedro 
tem 40% da intenção de votos, mais ou menos 3% – esses 3% são o desvio do 
valor central de 40% que a pesquisa se propôs a admitir – com certa probabi-
lidade de que a amostra selecionada não represente a população, chamada 
de erro estatístico.
Reforçando, a “margem de erro” ou “desvio” tem natureza absolutamente 
diferente do chamado erro estatístico. Enquanto o desvio é uma percenta-
gem, ou uma medida na unidade em que se está observando os valores (cm, 
anos, m2 etc), o erro estatístico é uma medida de probabilidade.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Amostragem
113
No exemplo da eleição de Pedro, temos 95% de confiança (erro estatístico 
de 5%) que ele terá entre 37% e 43% dos votos, se a eleição fosse realizada 
no momento da pesquisa, contra 57% a 63% de João. Qualquer resultado 
dentro deste intervalo pode acontecer. É preciso que se compreenda isso 
para não cometer erros de interpretação dos resultados.
Suponha que a estimativa da proporção de votos de Pedro fosse de 48% 
e, portanto; a de João 52%. Será que realmente João está na frente de Pedro? 
A resposta tem que ser um peremptório não.
De fato, o que a pesquisa amostral informa é que a proporção de votos de 
Pedro na população, salvo o erro amostral, estará dentro do intervalo [45%, 
51%] e que a proporção de João estará no intervalo [49%, 55%]. Assim, qual-
quer resultado dentro desses intervalos é admissível, como, por exemplo, 
51% para Pedro e 49% para João, e, embora aparentemente João estivesse na 
frente, ele pode perder a eleição. Esse fato é conhecido como “empate técni-
co” ou “empate estatístico”. Convém a João saber fazer a leitura da pesquisa. 
Mas será que Joãonão está ao menos um pouquinho à frente de Pedro? 
Com base no resultado da pesquisa, pode-se afirmar categoricamente que 
não necessariamente.
Uma pesquisa que antecedeu uma eleição para prefeito de Curitiba 
trouxe como resultado as seguintes intenções de voto com um nível de 
confiança de 95%:
Candidato A – 58%
Candidato B – 09%
Candidato C – 08%
Candidato D – 07%
Candidato E – 07%
Candidato F – 05%
Candidato G – 05%
Candidato H – 01%
O instituto que realizou a pesquisa afirmou que entrevistou 405 eleitores 
em um certo dia e que a “margem de erro” de sua pesquisa foi de mais ou 
menos 5%. O que se pode concluir da pesquisa?
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
114
Amostragem
Em primeiro lugar, o Candidato A seria virtualmente eleito no primeiro 
turno com no mínimo 53% dos votos.
E mais, não há como se saber qual dos seis candidatos teria mais votos se 
a eleição fosse realizada naquele dia. O candidato B, por exemplo, poderia 
ter 4% dos votos e o candidato H poderia ter 6% dos votos. Essa é a leitu-
ra correta do resultado da pesquisa de intenção de votos realizada. Não há 
outra leitura possível. 
O que aconteceu então? A amostra de 405 é muito pequena para garantir 
melhor precisão.
Um resultado como esse pode ser útil para informar que no momento 
o Candidato A seria eleito no primeiro turno. Só isso. Em momentos mais 
próximos da eleição essa margem de erro terá que ser necessariamente 
diminuída, com o consequente aumento do tamanho da amostra.
 Também em situações em que os candidatos estão mais próximos, uma 
pesquisa como essa pode ser não informativa. Um candidato com 55% dos 
votos pode perder para um candidato com 45% dos votos, por exemplo.
Quanto maior a precisão desejada, maior deve ser o tamanho da amostra.
De outra forma, quanto menor a margem de erro, maior será o tamanho 
da amostra. 
A determinação da margem de erro é feita antes da realização da pes-
quisa para se calcular o tamanho da amostra. A margem de erro é escolhida 
pelo pesquisador e será do tamanho necessário para que possa discriminar 
as medidas que serão realizadas. Não adianta tomar uma amostra pequena 
que não consiga ser sensível de observar pequenas diferenças. No entanto, 
se essa escolha implicar em uma amostra muito grande em que não se tenha 
recursos para a realização da pesquisa, ela pode ficar inviabilizada.
Porque dizer que um candidato terá 60% dos votos, mais ou menos 
30% de precisão, significa dizer que o candidato pode ter entre 30% e 90% 
dos votos. Esse é um resultado que realmente não interessa porque não é 
informativo. 
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Amostragem
115
Matematicamente pode-se dizer que o desvio é inversamente proporcio-
nal ao tamanho da amostra, lembrando, no entanto, que essa não é uma 
relação linear. Se d é o desvio e n o tamanho da amostra, temos a relação:
d n 
O erro estatístico
O erro estatístico é a probabilidade de sortear uma amostra que não seja 
representativa da população. Toda vez que se faz um sorteio o risco de que a 
amostra não represente a população está presente. 
Para ilustrar essa ideia, suponha uma população de tamanho quatro, 
composta pelos elementos A, B, C e D, colocados assim em ordem crescente 
de medida. Suponha que estes quatro elementos são pessoas em que A é o 
mais novo e D, o mais velho. 
Quantas amostras de dois elementos são possíveis de serem sorteadas?
Esse número pode ser calculado através da determinação da combinação 
de quatro elementos dois a dois: C4,2 = 6.
As possíveis combinações são:
AB, AC, AD, BC, BD, CD
Qual é a probabilidade de cada uma delas serem sorteadas? É de 1 em 
6, ou 1/6. As amostras derivadas das combinações AB e CD parecem não re-
presentarem bem a população. A primeira subestimaria a média de idade da 
população e a segunda a superestimaria. As melhores combinações seriam 
possivelmente AD e BC, mas também AC e BD poderiam trazer resultados 
bastante razoáveis.
Então, qual seria a probabilidade de tomar-se uma amostra “ruim”, que 
não representa a população? Seriam 2/6, correspondentes às amostras AB e 
CD. Essa probabilidade é de 1/3 = 0,33. Então, o nível de confiança associado 
a essa amostragem é de 67% (100 – 33) e o erro estatístico é de 0,33.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
116
Amostragem
Um erro estatístico de 33% é muito alto. É claro que isso é só uma simu-
lação para ilustrar o significado de erro estatístico. Com uma população tão 
pequena não faz qualquer sentido fazer um procedimento de amostragem. 
No entanto, a informação que se tira dessa discussão é a de que quanto 
menor for o erro estatístico, maior deverá ser o tamanho da amostra. Ou, 
ainda, quanto maior for a confiança desejada, maior deverá ser o tamanho 
da amostra.
O erro estatístico está relacionado com o escore “z” da tabela da distribui-
ção normal padrão. Quanto menor o erro, maior será “z” e, por consequência, 
maior será o tamanho da amostra. Se o erro estatístico for designado por “α”, o 
nível de confiança será (1 – α)x 100%. Maior confiança implica maior tamanho 
da amostra. Matematicamente, podemos estabelecer a seguinte relação:
α (1 – α) z n 
Que valor deve ser estabelecido para o erro estatístico? Essa determi-
nação depende da gravidade de cometer-se tal erro. Em uma pesquisa de 
verificação da qualidade de componentes de avião em uma fábrica, pode-
-se fazer uma inspeção de qualidade nas mesinhas de lanche do avião com 
um erro estatístico mais dilatado do que de um componente de vedação da 
janela. Nesse último caso, o erro deve ser igual a zero e, portanto, a inspeção 
deve ser realizada em todas as unidades. Nesse caso, a amostra deverá ser do 
tamanho da população.
Em pesquisas eleitorais é muito comum trabalhar-se com um erro de 5% 
ou uma probabilidade de 1/20 de que a amostra não seja boa, o que repre-
senta uma probabilidade muito pequena. Para construir uma ideia intuitiva 
por comparação, a probabilidade de acertar o número na face superior de 
um dado é de 1/6. Imagine um dado de 20 lados. 
Mas ainda com um erro tão pequeno, é possível tomar uma amostra ruim 
ou não representativa da população? É possível sim, mas muito raro. O pes-
quisador mais experiente percebe nas primeiras determinações dos resulta-
dos da amostragem se a amostra pode ser ruim. Se em uma pesquisa eleito-
ral, a grande maioria dos entrevistados for muito jovem, ou se, por exemplo, 
a amostra contemplou um número excessivamente grande de homens ou 
de mulheres, por exemplo, em torno de 80%, deve-se desconfiar do proces-
so amostral, haja vista que é sabido que as mulheres são somente um pouco 
mais do que 50% da população.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Amostragem
117
A variabilidade
A variabilidade é um componente importante na determinação do ta-
manho da amostra. Talvez o mais simples processo de amostragem seja o 
de exame de sangue. Tira-se uma pequena amostra do sangue e determina-
ções completas sobre o tipo de sangue, o fator RH, a saúde da pessoa, entre 
outras verificações, podem ser feitas. Isso porque o sangue é uma substân-
cia homogênea e uma simples gota representa todo o volume de sangue 
do corpo humano.
Por outro lado, populações heterogêneas exigirão maior número de ele-
mentos da amostra para que ela possa captar as diferenças entre esses com-
ponentes da população.
A variabilidade pode ser medida através da variância ou do desvio-pa-
drão, sua raiz quadrada. Matematicamente pode-se estabelecer uma relação 
direta entre o tamanho da amostra e o desvio-padrão, ou seja:
σ n 
O problema aqui está em determinar um valor estimativo para o desvio-
-padrão, porque uma vez que a pesquisa ainda não foi feita e precisaremos 
dessa medida para o cálculo do tamanho da amostra, enfrentamosum pro-
blema circular. Existem algumas soluções de contorno para esse problema. 
A primeira é “emprestar” o resultado de uma pesquisa anterior semelhante 
a que se está realizando. A segunda é buscar uma estimativa para o desvio- 
-padrão através da realização de uma amostra piloto. E a terceira é obter essa 
informação através de algum tipo de simulação. Há varias possibilidades 
para isso. Apresentaremos duas.
A primeira simulação consiste em considerar um intervalo onde aproxi-
madamente 95% dos elementos da população estariam concentrados. Esse 
intervalo pode ser associado à quantidade ± 1,96 σ da tabela normal padrão. 
Então, o comprimento desse intervalo seria de aproximadamente 4 σ. Tería-
mos aí então uma forma indireta de obter um valor aproximado para σ.
Uma outra simulação é possível quando se trata de obter uma estimativa 
para o desvio-padrão ou a variância em uma pesquisa que envolve propor-
ções. Nesse caso, a variância é dada pelo produto de p por (1–p). O maior 
valor possível para esse produto é quando p for igual a 0,5. Observe, por 
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
118
Amostragem
exemplo, que se p for igual a 0,3, então (1–p) = 0,7 e o produto será 0,21. 
Assim, quando tomamos 0,5 . 0,5 = 0,25 obtemos maior valor possível para a 
variância, garantindo então que no mínimo o tamanho da amostra calculado 
terá os valores de “desvio” e “erro de amostragem” estabelecidos a priori.
Essa simulação vale para o caso em que o confronto ocorre entre dois 
candidatos, pois aí se tem uma distribuição Bernoulli, cuja expressão da vari-
ância é dada pelo produto de p por (1–p). Quando se tem um maior número 
de candidatos, esse cálculo pode ser aprimorado pela determinação da vari-
ância máxima de uma distribuição multinomial. Mas essa aproximação pela 
distribuição Bernoulli pode ser realizada se for feita a consideração de um can-
didato contra todos os demais. No geral, não há uma mudança muito grande 
na determinação do tamanho da amostra ao se fazer essa consideração.
Determinação do tamanho da amostra
Estabelecidos os principais componentes para a determinação do tama-
nho da amostra, podemos construir uma expressão matemática de forma 
intuitiva a partir das relações de proporcionalidade verificadas.
Vimos que o tamanho da amostra é diretamente proporcional ao nível de 
confiança (que pode ser expresso através do valor “z” da distribuição normal 
padrão), também é diretamente proporcional ao desvio-padrão (σ) e inver-
samente proporcional ao valor estabelecido pelo desvio (d). Dessa forma, 
uma possível expressão para o tamanho da amostra seria:
n = (z.σ)
d
Mas essa relação não é linear e é, portanto, necessária uma determinação 
mais técnica da expressão para o cálculo do tamanho da amostra.
Partiremos do intervalo de confiança estabelecido inicialmente:
Pr ( p – d < P < p + d ) = 1 – α
Essa expressão é conhecida da inferência estatística, em que o desvio 
pode ser expresso como:
d = z . σ
n
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Amostragem
119
Isolando o valor de n da expressão anterior, teremos
n = z . σ
d
2
 
Essa é a expressão inicial para o cálculo do tamanho da amostra.
Exemplo:
Calcular o tamanho de uma amostra para uma pesquisa eleitoral na 
cidade do Rio de Janeiro, com nível de confiança de 95% e desvio de mais 
ou menos 5%.
Então, z = 2; σ2 = 0,5 e d = 0,05
n = 2 . 0,5
0,05
2
 = 400
A rigor para exatos 5% de erro estatístico o valor de z é igual a 1,96, por-
tanto, o tamanho da amostra poderia ser de 385 pessoas que as margens 
estabelecidas estariam asseguradas.
Como havia sido afirmado anteriormente, a relação entre o tamanho da 
amostra e o erro estatístico, a “margem de erro” e a variabilidade não são line-
armente proporcionais. Pode-se verificar essa propriedade através de exemplos 
em que a “margem de erro” ou o erro estatístico variem nas diferentes direções.
Exemplo:
Calcular o tamanho da amostra para “margens de erro” de 1%, 2%, 3%, 5% 
e 10% e erros estatísticos de 1%, 5% e 10%.
Aplicando a expressão acima para esses dados e tendo os valores de z 
correspondentes a 1%, 5% e 10%, respectivamente, 2,58, 1,96 e 1,64, obte-
mos os seguintes valores para o tamanho da amostra:
Margem
de erro
Erro estatístico
0,01 0,05 0,1
0,01 16641 9604 6724
0,02 4160 2401 1681
0,03 1849 1067 747
0,05 666 384 269
0,10 166 96 67
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
120
Amostragem
Observe na tabela o valor encontrado anteriormente de 384 eleitores 
para “margem de erro” de 5% e nível de confiança de 95% e compare com os 
resultados vizinhos.
Custo da pesquisa
Supondo que a produção de cada entrevista seja em torno de R$10,00, 
sendo já inseridos todo o trabalho de campo, seguros para os pesquisadores, 
planejamento, análise dos dados, impressão e impostos. Uma pesquisa com 
384 eleitores, ± 5% de desvio e nível de confiança de 95% custaria em torno 
de R$3.840,00.
Em uma situação mais adequada, mudando somente a “margem de erro” 
para ± 2% de desvio, o custo da pesquisa subiria para R$24.000,00. Mesmo 
que se pudesse admitir um erro estatístico de 10%, ou seja, uma confiança 
de 90%, o custo da pesquisa para um desvio de ± 2% seria de R$16.810,00.
De fato, o fator custo é extremamente limitante da potencialidade da pes-
quisa. Mas essa discussão chama a atenção para que a leitura da pesquisa 
seja feita sempre olhando o nível de confiança e a “margem de erro” e não só 
a estimativa pontual das percentagens.
No caso da pesquisa eleitoral discutida anteriormente, com a margem de 
erro de 5% e nível de confiança de 95%, justifica-se pelo acerto do instituto 
em verificar que a eleição se resolveria no primeiro turno. Para os demais 
candidatos, que não o vencedor Candidato A, a pesquisa não informa com 
precisão as suas situações. 
Em datas mais próximas da eleição, quando o quadro pode tender a 
uma aproximação dos demais candidatos, o instituto deverá modificar 
sua estratégia, melhorando a precisão e consequentemente o volume da 
amostra, resultando fatalmente num aumento do custo da pesquisa.
Há expressões estatísticas apropriadas que já embutem o custo da pes-
quisa no próprio cálculo do tamanho da amostra, mas é uma sofisticação 
que pode ser contornada com um estudo comparativo como o que foi feito. 
Há livros de estatística teórica que apresentam essas circunstâncias para o 
caso de necessidade de aprofundamento da discussão.
Correção para populações finitas
As considerações realizadas até o momento não tomam em conta o tama-
nho da população. Ocorre que esses cálculos não mudam substancialmente 
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Amostragem
121
quando as populações são muito grandes. Os cálculos realizados para For-
taleza ou para São Paulo indicarão que não haverá mudança significativa no 
cálculo do tamanho das amostras. Para efeito de cálculos estatísticos, essas 
populações são consideradas infinitas.
A estratégia de campo pode sim ser modificada e dependendo do tipo de 
amostragem a ser realizada o tamanho da amostra pode mudar um pouco. 
Essa forma de cálculo do tamanho da amostra é adequada para quando 
se realiza uma amostra aleatória simples, muito embora as mudanças para 
outros tipos de amostragem possam não modificar de forma importante 
essa determinação, ao menos de estudos particulares sobre a variabilidade 
interna de estratos ou de conglomerados. Porém, esse estudo está fora do 
escopo do presente livro.
Para populações finitas e sem reposição, é necessário que se proceda uma 
correção. Ela é chamada de correção para populações finitas. A expressão do 
desvio é modificada para 
d = z . σ
n
. N – n
N – 1
Esse último fator, N – n
N – 1
, é a correção para a população finita. Pode-se 
verificar que o cálculo de n pode então ser determinadopor:
n = [N . σ
2 . z2]
[(N – 1) . d2 + σ2 . z2] 
De outra forma, pode-se determinar pela expressão original n’ e depois 
corrigi-la multiplicando o valor obtido pela correção para população 
finita. Então:
n’ = z . σ
d
2
e
n = n’ .
N – n
N – 1
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
122
Amostragem
Exemplo:
Calcular o tamanho da amostra para uma pesquisa com 95% de confiança 
e “margem de erro” de 5% para uma população de eleitores de (a) 5 000 e (b) 
1 000 000:
O calculo de “n’ ” para os dois casos será de 384 eleitores. A correção para 
uma população de 5 000 eleitores será de 0,9898 e o tamanho da amostra 
corrigido será de 380 eleitores. Para a população de 1 000 000 a correção será 
de 0,999 e o novo cálculo do tamanho da amostra será de 383,62, ou aproxi-
madamente 384 eleitores, não implicando, portanto, nenhuma modificação 
no tamanho da amostra, uma vez que o fator de correção para populações 
infinitas é praticamente igual à unidade. 
Atividades de aplicação
1. Foi encomendado um estudo para avaliação de uma instituição de 
Ensino Superior. Para isso, aplicou-se um questionário e foram obtidas 
as respostas de 110 alunos.
 Indique:
a) a variável em estudo;
b) a população em estudo;
c) a amostra escolhida.
2. Supondo que a variável escolhida de uma pesquisa seja nominal e a 
população finita de 600 indivíduos (em que 60% dos indivíduos são 
mulheres), e deseja-se trabalhar com um alfa (α) 5% e um erro amos-
tral de 7%. Calcule o tamanho da amostra. 
3. Indique o tipo de amostragem realizada em cada um dos casos a seguir: 
a) um fornecedor de peças para automóveis obtém uma amostra 
de todos os itens de cada um de 12 fornecedores selecionados 
aleatoriamente;
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Amostragem
123
b) um fabricante de automóveis faz um estudo de mercado compre-
endendo testes de direção feitos por uma amostra de 30 homens 
em quatro diferentes faixas etárias;
c) num processo de fabricação de certo componente de refrigera-
dores, o inspetor retira os 20 primeiros componentes fabricados e 
os inspeciona.
4. Um jornal americano realizou uma pesquisa solicitando a resposta dos 
leitores a esta questão: “ Você apoia o desenvolvimento de armas atômi-
cas que poderiam matar milhões de pessoas inocentes?” Relata-se que 20 
pessoas responderam à pergunta, sendo 87% com não e 13% com sim.
 Identifique as 4 maiores falhas da pesquisa.
5. Retirada uma amostra sistemática de 35 elementos a partir de uma po-
pulação ordenada formada de 2 590 elementos, qual ou quais dos ele-
mentos a seguir seria escolhido para pertencer à amostra, sabendo-se 
que o elemento de ordem 1 546 (1 546.º) a ela pertence?
 242.º 636.º 2 323.º 1 028.º 1 841.º 592.º
6. Uma população se encontra dividida em três estratos, com tamanhos, 
respectivamente, N1 = 80, N2 = 120 e N3 = 60. Realizada uma amostra-
gem estratificada proporcional, 12 elementos foram retirados do pri-
meiro estrato. Qual o número total de elementos da amostra?
7. Uma indústria especializada em montagens de equipamentos indus-
triais recebeu 70 dispositivos de controle do fornecedor A e outros 30 
dispositivos do mesmo tipo do fornecedor B. O aspecto relevante, que 
se deseja controlar nesses dispositivos, é a resistência elétrica de certo 
componente crítico. Vamos admitir que os 100 dispositivos recebidos 
foram numerados de 1 a 100 ao darem entrada no almoxarifado, e 
que os 70 primeiros foram aqueles recebidos do fornecedor A. Vamos 
admitir, também, que os valores reais da variável de interesse (a resis-
tência elétrica do componente crítico) dos 100 dispositivos recebidos 
sejam os seguintes, respectivamente na ordem de entrada no almoxa-
rifado (lê-se seguindo as linhas, tal como se lê um livro):
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
124
Amostragem
33 38 34 34 34 31 36 35 32 37
35 34 30 37 36 33 34 34 32 39
35 33 33 34 31 32 36 33 29 36
34 35 34 33 31 35 35 35 37 32
34 34 36 35 34 33 32 38 34 33
33 32 34 35 37 35 35 30 35 34
36 36 33 34 33 32 31 37 35 34
39 40 40 42 39 38 40 40 40 40
40 41 45 41 40 39 41 41 40 42
39 40 41 40 40 42 39 39 38 40
a) Retire uma amostra aleatória simples de 10 dispositivos, sem repo-
sição, utilizando a tabela de números aleatórios (do livro) a partir 
da interseção da quinta linha com a oitava coluna. A seguir, calcule 
a resistência elétrica média da amostra obtida.
b) Imagine que se pensasse em fazer uma amostragem estratificada. 
Em sua opinião, seria isso razoável? Em caso afirmativo, indique 
como você procederia, ainda utilizando os números aleatórios. Su-
ponha que o total de dispositivos a examinar na amostra continue 
sendo 10.
c) Considere agora que tivesse sido utilizada uma amostragem estra-
tificada uniforme, num total ainda de 10 dispositivos examinados, 
e que a média para o primeiro estrato foi 33,8 e para o segundo, 
40,2. Em quanto você estimaria a média da população de 100 dis-
positivos?
d) Suponha agora que dos 70 dispositivos provenientes do fornece-
dor A tenha sido obtida uma amostra sistemática de 10 disposi-
tivos, sendo constante o período de retirada dos elementos para 
a amostra e sendo conhecido que o segundo dispositivo a entrar 
no almoxarifado (cujo valor da resistência é 38) pertencia a essa 
amostra. Calcule a média para os valores observados. 
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Amostragem
125
Gabarito
1.
a) A avaliação da instituição.
b) Os alunos da instituição.
c) Os 110 alunos respondentes.
2. Como p = 0,6, N = 600, d = 0,07 e z = 1,96, então como a população é 
finita, temos:
 
  = − ∴ = = ∴      
22 1,96
' .(1 ) ´ (0,6)(0, 4) 189
0,07
z
n p p n
d
em que devemos 
 aplicar o fator de correção para populações finitas, de tal forma que:
 
( )
( )
' .
1
 −=  −  
N n
n n
N
 onde 
( )
(600 189)
189.
600 1
 −=  −  
n ∴ n –157.
3.
a) Conglomerados.
b) Estratificada.
c) Conveniência.
4.
a) O texto da questão é tendencioso e induz à resposta negativa.
b) O tamanho da amostra é pequeno (20 unidades).
c) Os entrevistados foram autosselecionados, ou seja, não houve 
uma seleção aleatória por parte do jornal.
d) Como apenas 20 entrevistados responderam, os percentuais obri-
gatoriamente devem ser múltiplos de cinco. Logo, 87% e 13% não 
são resultados possíveis. 
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
126
Amostragem
5. Como a fração amostral será N
n
, então 2.590 74
35
= =f.a. , isso significa 
 que os elementos da amostra foram retirados num intervalo de 
74 unidades. Sendo assim, pertencerá à amostra o elemento Xi em 
 que 1 546 X
74
-
=
 
número inteiro (corresponde ao número de intervalos 
 de 74 unidades distante do valor 1 546). Logo, o único elemento que 
satisfaz essa condição é o 1 028º, conforme se observa no cálculo: 
 1 546 1 028 7
74
-
=
6. Existem várias formas de solução para essa questão, mas basicamente 
a ideia é que a amostra mantenha a representatividade da população. 
Sendo assim, temos que: 
População Amostra
N1 = 80 n1 =12
N2 = 120 n2 =?
N3 = 60 n3 =?
N = 260 n =?
 Então: PropN1 = 
80
0,3077
260
= , logo n1 = 0,3077 de n ∴
12
39
0,3077
= =n ,
 então:
 como PropN2 = 
120
0, 4615
260
= , logo n2 = 0,4615 de n ∴ n = (0,4615).39 
= 18.
 Portanto, n2 = 18 e n3 = 39 – 12 – 18 = 9.
7.
a) Números selecionados: 46 21 28 15 31 36 35 56 88 65.
 Resistências: 33 35 33 36 34 35 31 35 41 33.
 Resistência média =
 = 33 35 33 36 34 35 31 35 41 33 346 34,6
10 10
+ + + + + + + + + = = .
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Amostragem
127
b) Sim, pois os valores das resistências correspondentes ao fornece-
dor B têm uma diferença clara emrelação aos do fornecedor A, no 
entanto, o comportamento é homogêneo dentro de cada um dos 
fornecedores. Sendo assim, podemos tratar como dois estratos.
 O procedimento para a estratificação seria manter na amostra 
a representatividade observada na população, ou seja, 70% de 
componentes do fornecedor A e 30% de componentes do forne-
cedor B. Dessa forma, teríamos numa amostra de tamanho 10 a 
inclusão de sete componentes do fornecedor A e três componen-
tes do fornecedor B. No processo de seleção por meio da tabela de 
números aleatórios, os componentes ordenados de 01 a 70 seriam 
do fornecedor A e de 71 a 100 (00) do fornecedor B. Partindo da 
quinta linha com a oitava coluna, obteríamos a seguinte amostra:
 Números selecionados: 46(A) 21(A) 28(A) 15(A) 31(A) 36(A) 35(A). 
Como já estão contemplados sete componentes do fornecedor A, 
somente nos interessa, a partir de agora, a obtenção dos componen-
tes do fornecedor B. Logo, apenas participarão da amostra elemen-
tos que estejam entre 71 e 100 na sequência da tabela de números 
aleatórios. Sendo assim, encontraremos os números 88, 86 e 98.
 Resistências: : 33 35 33 36 34 35 31 41 39 39.
 Resistência média =
 = 33 35 33 36 34 35 31 41 39 39 356 35,6
10 10
+ + + + + + + + + = = .
c) Nesse caso, foi utilizada uma amostra com cinco componentes de 
A e 5 de B. O procedimento correto para realizar a estimativa da 
média populacional seria corrigir os valores médios em função da 
representatividade na população, ou seja:
 Resistência média (33,8).70 (40,2).30( ) 35,72
100
+= =X .
d) Como o 2.º elemento pertence à amostra e como a fração de amostra-
gem é sete , então a amostra é composta dos seguintes elementos:
 Números selecionados: 02 09 16 23 30 37 44 51 58 65.
 Resistências: 38 32 33 33 36 35 35 33 30 33.
 Resistência média = 
 = 38 32 33 33 36 35 35 33 30 33 338 33,8
10 10
+ + + + + + + + + = = .
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
128
Amostragem
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Estimação
Problema
A Empresa ABC de Engenharia, Construções e Empreendimentos prima 
pela qualidade de seus edifícios. Entre outros padrões, estabeleceu que a 
resistência do concreto utilizado em suas construções nunca deverá ser infe-
rior a 200 Kgf/cm2. Todo o concreto a ser utilizado deverá então ser submeti-
do a um teste de resistência.
Ocorre que os testes de resistência do concreto são testes destrutivos e, 
portanto, a única forma de realizá-los é através de um processo amostral em 
que pequenas partes do concreto são submetidas a testes de ruptura. Para 
cada betoneira são retiradas 10 quantidades de concreto que formarão os 
corpos de prova. A média da resistência desses corpos de prova é determi-
nada e se supõe que o resultado encontrado seja representativo da média de 
todo o concreto.
Como esse processo envolve certo nível de incerteza, não se pode garantir 
de forma absoluta que o valor encontrado para a média de resistência dos 
corpos de prova seja igual ao valor da resistência de toda a população. 
Dois procedimentos podem ser realizados a partir do resultado amostral. 
O primeiro é construir um intervalo em torno do valor da média amostral no 
qual se possa afirmar, com certo nível de confiança, que o verdadeiro valor 
da média populacional pertença a esse intervalo. O segundo procedimento 
é o de testar se, com base na média amostral, o valor mínimo estabelecido de 
resistência do concreto pode ser aceito.
Então, três procedimentos de estimação foram estabelecidos. O primeiro 
é chamado de estimação pontual, em que o valor da média amostral é uma 
estimativa da média populacional; a partir dele constroem-se os outros dois 
procedimentos, um de estimação por intervalo, ou construção de um interva-
lo de confiança, e o último de testagem de hipóteses estatísticas. 
De acordo com um importante conceito teórico da Estatística, o Teore-
ma Central do Limite, a distribuição de probabilidade amostral da média para 
129Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
130
Estimação
tamanhos adequados das amostras pode ser assumida como tendo distri-
buição normal, independentemente da forma da distribuição populacional. 
A distribuição normal joga então um papel central para a realização de testes 
de hipóteses. Ela tem a mesma importância na construção de intervalos de 
confiança.
O estudo das distribuições amostrais antecede então o estudo da 
estimação.
Conceitos fundamentais
No geral, estamos interessados em verificar como uma variável de uma deter-
minada população se comporta. Em um estudo de mercado sobre a aceitação de 
um novo artigo alimentar, pode ser interessante conhecer variáveis que caracte-
rizem o estado nutricional da população a quem o produto possa estar destina-
do. O peso da população, por exemplo, pode ser uma dessas variáveis.
A caracterização do peso da população pode ser feita através de uma 
distribuição de frequências que pode aproximar uma distribuição de probabi-
lidades. Essa distribuição tem algumas características importantes, como o 
valor da média, do desvio-padrão e da forma da distribuição, além de poder 
ser discreta ou contínua. No capítulo anterior, estudamos as distribuições 
discretas. Neste capítulo, estudaremos algumas distribuições contínuas de 
grande utilidade para se fazer inferência. Vamos nos restringir às distribui-
ções contínuas mais importantes para o propósito de estimação contido 
neste capítulo: a distribuição normal e a distribuição “t” de Student.
Quando fazemos um processo de amostragem, verificamos em uma 
única amostra o valor de uma estatística, a média do peso dos elementos 
da amostra, por exemplo, e tentamos inferir algo sobre o parâmetro da po-
pulação, nesse caso, a média da população. Então, a média da amostra é um 
estimador da média da população.
Para fazermos isso, precisamos conhecer algumas propriedades teóri-
cas do estimador e a forma de fazer esse estudo é através de simulações 
de várias amostragens. Reforçando o conceito: na prática, só retiramos uma 
amostra, mas para construir um corpo teórico que nos auxilie a inferir sobre 
o parâmetro, construímos teoricamente várias amostragens.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Estimação
131
Se fizéssemos várias amostragens, cada amostra teria possivelmente um 
valor diferente como sua média. Teríamos, assim, uma população de médias 
amostrais. Podemos calcular dessa população de médias amostrais a sua 
média e o seu desvio-padrão e também verificar qual é a distribuição dessas 
médias. Construímos, assim, a distribuição de probabilidades das médias 
amostrais, que como toda distribuição tem sua média e seu desvio-padrão.
Distribuição amostral
A distribuição amostral é a distribuição de probabilidades de alguma esta-
tística de cada amostra. Assim, podemos determinar a distribuição amostral 
das médias, a distribuição amostral das proporções e ainda a distribuição 
amostral das variâncias ou dos desvios-padrões. 
Média e variância da 
distribuição amostral das estimativas
Cada distribuição dessas tem uma média e uma variância. A média da dis-
tribuição amostral das estimativas também é conhecida como valor espera-
do da distribuição amostral das estimativas. O desvio-padrão da distribuição 
amostral das estimativas, que é a raiz quadrada da variância da distribuição 
amostral das estimativas, é conhecido como erro-padrão das estimativas.
Essas estimativas podem ser os valores assumidos pelas médias ou pelas 
proporções, por exemplo.
Estimação por ponto
Uma estimativa pontual é um simples valor de um estimador utilizado para 
estimar o verdadeiro valor do parâmetro correspondente. A média amostral 
é um estimador da média populacional. Poderíamos eventualmente usar a 
mediana para estimar a média populacional,mas a média da amostra é um 
estimador com qualidades que a mediana da amostra não tem.
Estimação por intervalo
A estimativa intervalar de um parâmetro populacional é um intervalo 
entre dois valores, o limite inferior e o limite superior do intervalo, entre os 
quais temos certo nível de confiança que o parâmetro estará.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
132
Estimação
Nível de confiança e erro amostral
O erro amostral é a probabilidade de que a amostra não represente a po-
pulação. No geral, é representado pela letra grega α. O nível de confiança é o 
complemento do erro amostral, no geral é dado em percentagem e, portan-
to, sua representação é (1 – α) . 100%. Um erro amostral de 0,05 tem como 
correspondente de nível de confiança o valor 95%.
Teste de hipóteses estatísticas
O teste de hipóteses é realizado com o estabelecimento de duas hipóteses 
contrapostas. Cada hipótese é constituída de uma declaração acerca do valor 
do parâmetro. Elas são chamadas de hipótese nula e hipótese alternativa.
A hipótese nula, denotada por H0, é a hipótese de que o parâmetro em 
questão seja igual a certo valor. Por exemplo, H0 = Um automóvel tem um 
consumo médio de 10km/litro, ou seja, H0: μ = 10km/litro. A hipótese alter-
nativa, denotada de H1, pode ser bilateral, H1: μ ≠ 10km/litro, ou unilateral, H1: 
μ > 10 km/litro. O teste será unilateral ou bilateral dependendo do contexto 
do problema. Se tivermos alguma informação sobre o comportamento dos 
dados a partir de uma base teórica, devemos realizar um teste unilateral.
Estatística do teste
Os dados da amostra fornecerão os valores das estimativas dos parâme-
tros. A partir da determinação desses valores e utilizando-se a base teórica 
da distribuição amostral estabeleceremos uma estatística para o teste. Ve-
rificaremos em que nível de probabilidade poderemos rejeitar H0 ou não. Esse 
procedimento será explicado em detalhes mais adiante no capítulo.
Erro tipo I e erro tipo II
A probabilidade de cometer-se erro tipo I é associada ao erro estatístico, e, 
portanto, chamada de α. É também a probabilidade de rejeitarmos H0 quando 
a hipótese nula é verdadeira. O erro tipo II, chamado de β, é a probabilidade de 
aceitarmos H0 quando a hipótese nula é falsa. No geral, controla-se o erro tipo 
I por ser considerado o mais grave e por isto é o mais utilizado para o cálculo 
do tamanho da amostra.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Estimação
133
Região crítica e p-valor
Associado à estatística do teste, podemos estabelecer uma região crítica 
para a aceitação de H0 através do cálculo de valores críticos associados a um 
nível preestabelecido do tamanho do erro aceitável. 
Alternativamente, podemos, depois de calcular o valor da estatística do 
teste, verificar o nível de erro associado através da determinação do p-valor. Os 
dois procedimentos se assemelham e serão discutidos mais tarde no capítulo.
A distribuição normal
Como vimos no tratamento de dados, quando construímos uma distri-
buição de frequências a partir de observações, podemos aproximá-la a uma 
distribuição de probabilidades. Os dados podem levar a diferentes tipos de 
distribuição, uma delas exerce um papel central na teoria e na prática esta-
tísticas. É a distribuição normal.
Propriedades da curva normal
A distribuição normal é uma distribuição contínua. Enquanto as distribui-
ções discretas assumem valores a partir de números inteiros, as distribuições 
contínuas assumem todos os valores entre os números inteiros, ou seja, seu 
domínio é o dos números reais. A distribuição normal, particularmente, tem 
como domínio qualquer valor real entre menos infinito e mais infinito.
Uma característica importante da distribuição normal é que ela é uma 
função de x que pode ser inteiramente determinada com o conhecimen-
to dos valores da média e do desvio-padrão. Fala-se que X tem distribuição 
normal com média µ e desvio-padrão σ. A sua expressão matemática é dada 
pela função:
f(x) = 1
σ 2π
. ξ
–1/2 x – μ
σ
2
, – ∞ ≤ x ≤ ∞
Nessa equação, a média μ e o desvio-padrão σ, que determinam o ponto 
central e a dispersão da distribuição em torno da média, são os dois parâme-
tros da distribuição normal. Então, substituindo x por seus valores obtém-se 
os valores de f(x) e pode-se, então, traçar o gráfico da função.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
134
Estimação
O seu aspecto é o de um sino, por isso muitas vezes é chamada de curva 
do sino.
xμ
f(x)
O valor central é o da média μ, e a curva é simétrica em relação a μ. A área 
total sob a curva é igual à unidade. Nos pontos de inflexão de cada lado da 
curva temos o valor de X igual a μ – 1σ e μ + 1σ. E a curva é assintótica ao 
eixo X, ou seja, ela se aproxima do eixo X em – ∞ e em + ∞. Representamos 
essa distribuição como X ~ N(μ;σ). Em muitos livros, a representação leva em 
conta o valor da variância. Nesses casos, a notação fica X ~ N(μ;σ2).
Áreas abaixo da curva normal
Como a área abaixo da curva é igual a 1, podemos associar áreas a valores 
de probabilidade, a exemplo do que fizemos com o histograma. Assim, a pro-
babilidade de sortearmos um elemento da população cujo valor da variável 
seja maior do que μ e de 0,5 ou 50%. Da mesma forma que 50% da área da 
curva está associada a valores menores do que μ. Esses fatos podem ser des-
critos através das expressões:
P( X ≤ μ ) = 0,5 e P(X ≥ μ) = 0,5
xμ μ + 1σ
f(x)
Observe que essas probabilidades são complementares.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Estimação
135
Dessa forma, se pudermos calcular as áreas entre dois pontos da curva, 
essa área será igual à probabilidade de sortearmos um elemento cujo valor 
esteja entre esses dois pontos.
Vejamos algumas probabilidades associadas a algumas áreas particulares:
P(– ∞ ≤ X ≤ μ + 1 σ) = 0,8413, isto é, a área sob a curva entre – ∞ e μ + 1 σ 
é sempre de 84,13%, independente dos valores de μ e de σ.
xμ + 1σ
f(x)
Outras probabilidades particulares importantes:
P(– ∞≤ X ≤ μ + 2 σ) = 0,9772
x
f(x)
μ + 2σ
P(– ∞≤ X ≤ μ + 3 σ) = 0,9987
x
f(x)
μ + 3σ
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
136
Estimação
P(– ∞ ≤ X ≤ μ + 4 σ) = 0,9999
x
f(x)
μ + 4σ
Observe que embora X varie de – ∞ até + ∞, praticamente 100% da área 
da curva está entre – ∞ e + 4 σ. Observaremos mais tarde que, na verdade, o 
intervalo (– 4 σ, + 4 σ) abrange quase 100% de toda área.
Exemplo:
Considerando o exemplo do estudo nutricional, se a variável considerada 
for o peso da população com média 70kg e desvio-padrão 10kg, ao sortear-
mos um elemento ao acaso dessa população, poderemos calcular algumas 
probabilidades, por exemplo:
 Probabilidade de sortearmos uma pessoa com mais de 70kg, P(X ≥ 
70) = 0,5.
x70
f(x)
Probabilidade de sortearmos uma pessoa entre 60kg e 80kg, P(60 ≤ X ≤ 
80) = P(70 –10 ≤ X ≤ 70 + 10) = P(μ – 1σ ≤ X ≤ μ + 1σ) = P( – ∞ ≤ X ≤ μ + 1σ) – 
P( – ∞ ≤ X ≤ μ – 1σ ).
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Estimação
137
Mas, P( – ∞ ≤ X ≤ μ + 1σ) = 0,8413 e P( – ∞ ≤ X ≤ μ – 1σ) = 1 – 0,8413 = 
0,1587, veja que as áreas são simétricas ao ponto central μ.
 P(60 ≤ X ≤ 80) = 0,8413 – 0,1587 = 0,6826
x60 80
f(x)
Probabilidade de sortearmos uma pessoa entre 70kg e 80kg, P(70 ≤ X ≤ 
80) = P(70 ≤ X ≤ 70 + 10) = P(– ∞ ≤ X ≤ μ + 1σ) – P(– ∞ ≤ X ≤ μ) = 0,8413 – 0,5 
= 0,3413. Lembre-se novamente que as áreas são simétricas em relação a μ, 
então P(– ∞ ≤ X ≤ μ) = 0,5.
x70 80
f(x)
Probabilidade de sortearmos uma pessoa com menos de 60kg, P(X ≤ 60) 
= P(X ≤ 70 – 10) = P(X ≤ μ – 1σ) = 1 – 0,8413 = 0,1587.
x60
f(x)
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br138
Estimação
Probabilidade de sortearmos uma pessoa entre 60kg e 90kg, P(60 ≤ X ≤ 
90) = P(70 – 10 ≤ X ≤ 70 + 20) = P(μ – 1σ ≤ X ≤ μ + 2σ) = P(– ∞ ≤ X ≤ μ + 2 σ) 
– P(– ∞ ≤ X ≤ μ – 1σ) = 0,9772 – 0,1587 = 0,8185.
x60 90
f(x)
Probabilidade de sortearmos uma pessoa entre 80kg e 100kg, P(80 ≤ X ≤ 
100) = P(70 – 10 ≤ X ≤ 70 + 30) = P(μ + 1σ ≤ X ≤ μ + 3σ) = P( – ∞ ≤ X ≤ μ + 3σ) 
– P( – ∞ ≤ X ≤ μ + 1σ) = 0,9987 – 0,8413 = 0,1574.
x10080
f(x)
Duas observações devem ser feitas nesse ponto:
(I) A probabilidade em um ponto em uma distribuição contínua é sempre 
igual a zero. Não há como calcularmos área. Então, por ser indiferente de-
terminamos por convenção que no cálculo dessas probabilidades, usa-
remos um intervalo aberto à esquerda. Isto é, P(μ – 1σ ≤ X ≤ μ + 1σ) = P(μ 
– 1σ < X ≤ μ + 1σ). E essa convenção vale para todos os intervalos.
(II) Precisamos sempre verificar a quantos desvios-padrões está o valor de 
X em relação à média. Seja X ~ N(70,10). Então em P(60 ≤ X ≤ 90) = P(70 
– 10 ≤ X ≤ 70 + 20) = P(70 – 1 σ ≤ X ≤ 70 + 2 σ). Para determinar o valor 
“z” de quantos desvios-padrões 90 está distante da média, fazemos 90 
= μ + zσ. Isolando “z”, temos z = (90 – μ)/σ. Como μ = 70 e σ = 10, temos 
que z = (90 – 70)/10 = 2. Ou seja, “z” é o número de desvios-padrões 
que separam a média do valor desejado.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Estimação
139
Normal padrão
Vimos que se soubermos quantos desvios-padrões separam a média dos 
valores para os quais desejamos determinar as probabilidades, basta saber a 
área associada ao número de desvios-padrão. Isso equivale a trabalhar com 
uma distribuição normal com média 0 e desvio-padrão 1. Essa distribuição 
é chamada de distribuição normal padrão e a representamos por Z ~ N(O,1), 
em que z = (X – μ)/σ.
A forma como foram determinadas as probabilidades fornecidas anterior-
mente, entre – ∞ e a média mais um desvio-padrão, entre – ∞ e a média mais 
dois, três e quatro desvios-padrões é a forma usual no cálculo de áreas de 
funções, que é o cálculo da integral da função entre – ∞ e μ + 1σ da função 
normal padrão para o primeiro caso. O mesmo vale para os demais casos. A 
área entre – ∞ e μ + 2σ foi determinada pelo cálculo da integral definida da 
função f(x) da expressão da distribuição normal padrão, tendo como limites 
– ∞ e μ + 2σ.
Então, a probabilidade P(X ≤ 60) = P(X ≤ μ – 1 σ ) = P(– ∞ ≤ X ≤ μ – 1 σ) = 
P(– ≤ Z ≤ 1) e a integral definida de f(x) de – ∞ e – 1 fornecerão o valor exato 
dessa probabilidade. Está claro que esse cálculo seria tedioso, além de envol-
ver um procedimento altamente complexo de cálculo de integrais.
Aqui vale ressaltar uma característica importantíssima da distribuição 
normal. Independentemente dos valores da média e do desvio-padrão, 
essas áreas são sempre as mesmas. Queremos dizer com isso que para qual-
quer população normal a área entre – ∞ e μ – 1 σ será sempre a mesma. Se 
temos duas populações normais, a primeira X com média 70 e desvio-padrão 
10 e a segunda Y com média 20 e desvio-padrão 2, as probabilidades P(X ≤ 60) 
e P(Y ≤ 18) serão iguais, porque ambas representam P(X ≤ μ – 1 σ) = P(Z ≤ 1).
Se a área entre – ∞ e 1 σ é 0,8413, área correspondente à função de distribui-
ção acumulada, então a área entre μ e (μ + 1 σ) será 0,8413 – 0,5 = 0,3413.
xμ μ + 1σ
f(x)
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
140
Estimação
Função de distribuição 
acumulada da distribuição normal
Como vimos, a área acumulada entre – ∞ e um certo valor de Z pode 
ser utilizada para calcularmos as probabilidades correspondentes. Então, se 
queremos P(μ – 1 σ ≤ X ≤ μ + 2 σ), devemos calcular P(X ≤ μ + 2 σ ) – P(X ≤ 
μ – 1 σ). Essa diferença é igual a P(Z ≤ 2) – P(Z ≤ – 1) = F(2) – F(–1).
x–1 2
f(x)
A tabela D representa as áreas de uma distribuição normal padrão acumula-
da. No exemplo anterior temos que F(2) – F(1) = 0,9772 – 0,1587 = 0,8185.
Refazendo o exemplo do estudo nutricional, se a variável considerada for 
o peso da população com média 70kg e desvio-padrão 10kg, e se sortearmos 
um elemento ao acaso dessa população, poderemos calcular probabilidades 
utilizando a tabela D, por exemplo:
 Probabilidade de sortearmos uma pessoa com mais de 70kg:
P(X ≥ 70) = 1 – P(X ≤ 70) = 1 – P[(X – μ)/ σ ≤ 70 – μ)/ σ] = 1 – P[Z ≤ 70 – 70)/ 
10] = P(Z ≤ 0) = F(0) = 0,5.
x70
f(x)
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Estimação
141
Probabilidade de sortearmos uma pessoa entre 60kg e 80kg:
P(60 ≤ X ≤ 80) = P[(60 – μ)/ σ ≤ (X – μ)/ σ ≤ 80 – μ)/σ] = P[(60 – 70)/10 ≤ Z ≤ 
(80 – 70)/10] = P(– 1 ≤ Z ≤ 1) = F(1) – F(– 1) = 0,8413 – 0,1587 = 0,6826.
x60 80
f(x)
Probabilidade de sortearmos uma pessoa entre 70kg e 80kg:
P(70 ≤ X ≤ 80) = P[(70 – 70)/10 ≤ Z ≤ (80 – 70)/10] = P(0 ≤ Z ≤ 1) = F(1) – 
F(0) = 0,8413 – 0,5 = 0,3413.
x70 80
f(x)
Probabilidade de sortearmos uma pessoa com menos de 60kg:
P(X ≤ 60) = P[Z ≤ (60 – 70)/10] = P(Z ≤ – 1) = 0,1587.
x60
f(x)
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
142
Estimação
Probabilidade de sortearmos uma pessoa entre 60kg e 90kg: P(60 ≤ X ≤ 
90) = P[(60 – 70)/10 ≤ Z ≤ (90 – 70)/10) = P(– 1 ≤ Z ≤ 2) = F(2) – F(– 1) = 0,9772 
– 0,1587 = 0,8185.
x60 90
f(x)
Probabilidade de sortearmos uma pessoa entre 80kg e 100kg: P(80 ≤ X ≤ 
100) = P[(80 – 70)/10 ≤ Z ≤ (100 – 70)/10] = P(1 ≤ Z ≤ 3) = F(3) – F(1) = 0,9987 
– 0,8413 = 0,1574
x10080
f(x)
Observe que podemos calcular qualquer probabilidade, mesmo que os 
números não sejam redondos. Por exemplo:
P(56,5 ≤ X ≤ 64,8) = P[(56,5 – 70)/10 ≤ Z ≤ (64,8 – 70)/10] = F(– 0,52) – 
F(–1,35) = 0,3015 – 0,0885 = 0,2130.
x56,5 64,8
f(x)
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Estimação
143
Distribuição amostral das médias
Vamos utilizar, a partir de agora, o conhecimento adquirido no estudo 
do cálculo de probabilidades de uma distribuição normal na discussão da 
distribuição amostral de algumas estatísticas, começando pela distribuição 
amostral das médias.
Se em uma fábrica de lâmpadas desejamos fazer inferências para toda a 
produção de lâmpadas de um lote, retiramos uma única amostra de lâmpa-
das e verificamos alguma variável de interesse, o tempo de vida média das 
lâmpadas, por exemplo.
Para fazermos estimativas acerca dessa variável, utilizando uma só amos-
tra, precisamos construir um corpo teórico sobre o comportamento dessa 
amostra. Se tirarmos várias amostras de tamanho 10, por exemplo, e calcu-
larmos a vida média de cada uma dessas amostras, poderemos construir uma 
distribuição das médias amostrais chamada de distribuição amostral empíri-
ca. No entanto, se retirarmos todas as amostras possíveis de tamanho 10 e 
calcularmos a média de cada amostra, poderemos determinar a distribuição 
amostral teórica. O estudo dessa distribuição amostral teórica é que nos aju-
dará a construir o corpo teórico para a realização da estimação do parâmetro 
vida média das lâmpadas de todo o lote. 
Amostragem de populações normais
A primeira amostra de 10 elementos terá certa média de vida igual a X1, 
a segunda amostra, X2, e assim por diante. Podemos calcular a média dessas 
médias e o desvio-padrão delas. Se a variável vida útil das lâmpadas for distri-
buída normalmente com média μ e desvio-padrão σ, então a variável aleatória 
“média X de uma única amostra aleatória de tamanho n” será também normal-
mente distribuída com média μX = μ e desvio-padrão igual a:
σ = σ
nX
O desvio-padrão da distribuição amostral da estimativa é chamado de 
erro-padrão da estimativa.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
144
Estimação
Observe que se o tamanho de cada amostra for 100 ao invés de 10, o erro 
padrão σ 
X
 terá o seu valor diminuído, uma vez queo denominador da razão 
que o caracteriza ficará aumentado. Isso ocorre porque amostras maiores 
tenderão a representar melhor a média da população. 
Amostragem de populações não normais
Muitas das distribuições na área de economia e negócios não têm distri-
buição normal. Qual é, então, a natureza da distribuição amostral de X?
Essa resposta pode ser estabelecida pelo talvez mais importante teore-
ma da Estatística, o Teorema Central do Limite (TCL). É bom deixar claro que 
embora muitas traduções falem em Teorema do Limite Central, quem é cen-
tral é o teorema e não o limite, por isso a primeira denominação parece ser 
a mais adequada.
Esse teorema estabelece que se uma variável aleatória X, seja discreta ou 
contínua, tem média μ e desvio-padrão finito σ, então a distribuição de pro-
babilidades de X se aproxima da distribuição normal com média μ e desvio-
-padrão σ/ n à medida que n cresça ilimitadamente.
Uma outra forma de estabelecer-se o teorema é dizer que a distribuição de
z = (X – μ)
n
σ tem distribuição normal padrão à medida que n cresça
 ilimitadamente, em que 
n
σ
 é σ
X
.
Duas observações são importantes nesse momento:
(I) para distribuições que não são extremamente assimétricas, valores de 
n aproximadamente iguais a 30 já garantem a normalidade;
(II) estamos falando da distribuição de X quando n é uma grande amos-
tra e não de X, a variável aleatória original. Muitas variáveis aleatórias, 
como já foi afirmado, nunca terão distribuição normal por mais que 
a amostra cresça. Veja, por exemplo, o caso da distribuição de renda, 
que tem uma distribuição exponencial negativa. Por mais que tome-
mos uma amostra imensa, a distribuição da variável aleatória renda 
nunca terá uma distribuição normal.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Estimação
145
Exemplo para população normal:
Um gerente de produção de uma gráfica está pensando em comprar 
uma nova impressora para cartões. Em média, essas máquinas podem im-
primir 1 900 cartões por dia com um desvio-padrão de 200. Assuma que o 
número de cartões impressos por dia tenha uma distribuição normal.
a) Determine a probabilidade em que uma máquina possa imprimir me-
nos do que 1 850 cartões por dia.
b) Se 25 máquinas são escolhidas aleatoriamente da revendedora, deter-
mine a probabilidade que o número médio de cartões impressos por 
dia seja menor que 1 850.
Antes de calcularmos os valores das probabilidades acima, vamos tentar 
verificar intuitivamente qual das duas probabilidades será a menor. O valor do 
desvio-padrão é conhecido, e no primeiro caso estamos trabalhando com σ; no 
segundo caso, trabalharemos com σ =
X n
σ . Então, a dispersão em torno 
da média no primeiro caso será maior do que no segundo e a área abaixo de 
um dado valor de X será maior do que para uma distribuição mais concentra-
da, como é o segundo caso. Logo, esperamos que a primeira probabilidade 
seja maior do que a segunda. Vejamos:
a) P(X ≤ 1 850) = P((X – μ) / σ ≤ (1 850 – 1 900) / 200) = P(Z ≤ – 50/200) = 
P(Z ≤ – 0,25) = 0,4013.
b) P(X ≤ 1 850) = P((X – μ) / (σ/√ 25) ≤ (1 850 – 1 900) / (200/5) = P(Z ≤ – 
50/40) = P(Z ≤ – 1,25) = 0,1056.
De fato, a nossa intuição estava correta.
Exemplo para população não normal:
Um gerente de vendas está considerando uma nova campanha de vendas. 
É sabido que a média de consumo por cliente é de R$200,00 com desvio-pa-
drão de R$15,00. Sabe-se que a distribuição das vendas não se comporta se-
gundo uma distribuição normal; uma amostra de 36 clientes foi escolhida 
aleatoriamente. Determine a probabilidade em que a média de consumo 
será maior do que R$204,00.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
146
Estimação
P(X > 204) = 1 – P(X ≤ 204) = 1 – P(Z ≤ (204 – 200) / (15/ 36 )) = 1 – P(Z ≤ 
1,6) = 1 – 0,9452 = 0,0548
Distribuição amostral das proporções
Muitas vezes é conveniente considerar a proporção de ocorrências. Pode-
mos converter o número de ocorrências X para proporções, dividindo-o pelo 
tamanho da amostra. A proporção amostral será denotada por p. Então:
p = x
n
Suponha o seguinte exemplo: Em uma sorveteria entraram cinco pesso-
as. Elas podem comprar sorvetes com probabilidade p = 0,10, ou não com-
prar. Isso constitui um ensaio de Bernoulli. A distribuição de probabilidades 
que associa o número de pessoas que podem comprar sorvete é dada na 
tabela a seguir, cujas probabilidades foram retiradas da tabela B da distribui-
ção binomial:
X 0 1 2 3 4 5
f(X) 0,59 0,33 0,07 0,01 0,00 0,00
Então, por exemplo, a probabilidade de que das cinco pessoas que en-
traram na sorveteria duas comprem sorvetes é de 0,07, destacado na tabela 
acima.
Essa mesma distribuição de probabilidades poderia ser apresentada pela 
proporção de pessoas que compraram sorvetes. Verifique que duas em cinco 
pessoas significa 40% das pessoas comprando sorvete, indicado por 0,40:
p 0 0,20 0,40 0,60 0,80 1,00
f(p) 0,59 0,33 0,07 0,01 0,00 0,00
Observe que o número de ocorrências em uma amostra de tamanho n é 
dada por X = n. p. Vale chamar a atenção para a diferença de significado de 
“p” da distribuição binomial e p a proporção na amostra.
Calculando a esperança (média) e o desvio-padrão das duas distribuições 
de probabilidades acima, temos:
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Estimação
147
Para X = n . p
E(X) = E(n . p) = (1).(0,33) + (2).(0,07) + (3).(0,01) = 0,50
VAR(X) = VAR(n . p) = E(X2) – (E(X))2 = (1)2.(0,33) + (2)2.(0,07) + (3)2.(0,01) – 
(0,5)2 = 0,67
Lembrando que E(X) = E(n . p) = n . p = (5).(0,1) = 0,5 e VAR(X) = VAR(n . p) 
= n . p . q = 5 . (0,1).(0,9) = 0,67, conferindo com o resultado acima.
Para p=x
n
E(p) = (0,2).(0,33) + (0,4).(0,07) + (0,6).(0,01) = 0,10 = 10%
VAR(p) = (0,2)2.(0,3) + (0,4)2.(0,07) + (0,6)2.(0,01) – (0,1)2 = 0,0168 = 1,68%
Podemos verificar também que E(p) = E x
n 
= 1
n 
E(X) = 1/5(0,5) = 0,1 = p
e VAR(p) = 
n
p.q
Podemos utilizar uma notação um pouco diferente que:
Variável aleatória Média Desvio-padrão
Número de ocorrências np μnp = n.p σnp = n.p.q
Proporção de ocorrências p μ p = p σp = n
 p.q 
Uma derivação do Teorema Central do Limite, considerando a aproximação 
da distribuição binomial pela normal, pode ser estabelecida da seguinte forma:
Se X tem uma distribuição qualquer e o tamanho da amostra “n” for 
grande, a estatística Z dada a seguir tem distribuição normal padrão:
z = X – (np) =
σnp 
X – (n.p)
n.p.q
Também tem distribuição normal padrão a estatística Z dada a seguir:
z =
(p – μp ) =
σp 
p – p
p.q
n
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
148
Estimação
Exemplo:
Segundo uma teoria que relaciona estoque e mercado, se em uma semana 
o mercado como um todo declina, então, na semana seguinte, 70% do es-
toque apresentará um crescimento de preço. Supondo que a teoria esteja 
correta e que em uma determinada semana uma amostra aleatória dos es-
toques de 60 empresas foi observada, qual é a probabilidade de 36 ou mais 
deles apresentarem um crescimento de preço?
Considerando a proporção de sucessos solução:
Pelos dados do problema: μ = p = 0,7, σ = σp = 
p.q
n
= (0,7).(0,3)
60
 = 
0,05916, então Z = (0,60 – 0,70)/0,05916 = – 1,69. Na tabela da distribuição 
normal verificamos que P (p ≥ 0,60) = P(Z ≥ – 1,69) = 1 – P(Z ≤ – 1,69) = 1 – 
0,0455 = 0,9545.
Considerando o número de sucessos solução:
Pelos dados do problema: μ = n.p = (60).(0,7) e σ = σ = n.p.q = 
60.(0,7).(0,3) = 3,55, então Z = (36 – 42)/3,55 = – 1,69. Na tabela da distri-
buição normal, verificamos que P(X ≥ 36) = P(Z ≥ – 1,69) = 1 – P(Z ≤ – 1,69) = 
1 – 0,0455 = 0,9545.
Estimação por ponto
Temos verificado até aqui alguns tópicos sobre como tirar informações de 
uma amostra para fazer declarações sobre uma população da qual a amostra 
provém. Essas declarações dizem respeito a estimativasde parâmetros e à 
forma da distribuição de estatísticas e populações.
Para a média populacional μ temos trabalhado com a média amostral, 
como seu estimador. 
Devemos reforçar esse conceito. Estimador é uma expressão matemática. O 
seu valor para uma particular amostra é chamado de estimativa. Uma amostra é 
também chamada de uma particular realização de uma variável aleatória.
Quando falamos de forma genérica, costumamos designar o parâmetro 
por θ, e o seu estimador por θ^ .
Já comentamos que poderíamos estimar a média da população através 
do cálculo de uma outra medida como a mediana da amostra, por exemplo, 
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Estimação
149
ou mesmo através de um palpite. Mas qual desses estimadores é o mais ade-
quado? Qual deles reúne melhores propriedades matemáticas para o propó-
sito de estimação? 
Vamos verificar três propriedades de um bom estimador, não vício, con-
sistência e eficiência.
Estimador não viciado
Um estimador é dito ser não viciado ou não tendencioso se E( ) = .
Vamos tomar uma simulação bem simples para mostrar sobre o que es-
tamos falando. Seja uma população com três elementos, X1 = 2, X2 = 4 e X3 = 
6. Essa população com N = 3 tem como média E(X) = μ = 4 e com variância 
VAR(X) = σ2 = 8/3. 
Dessa população podemos tomar as seguintes amostras com reposição 
(23 = 9 amostras) e calcular os valores das médias e das variâncias de cada 
uma dessas nove amostras, conforme mostrado na tabela a seguir:
Amostras Médias = X Variâncias = S2 
(2,2) 2 0
(2,4) 3 2
(4,2) 3 2
(4,4) 4 0
(2,6) 4 8
(6,2) 4 8
(4,6) 5 2
(6,4) 5 2
(6,6) 6 0
N = 9 μX = E(X ) = 4 E(S
2) = μS2
Calculamos para a variável X sua média, E(X) = 4 e VAR(X) 4/3. Para o cál-
culo da VAR(X), utilizamos a fórmula da variância para a população porque se 
trata de uma população de médias. Dividimos, então, a soma ao quadrado 
dos desvios por N = 9.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
150
Estimação
Podemos verificar que E(X) = μ = 4 e que VAR(X) = 
2 4
3
=σ
n
. Usamos aqui 
n = 2 porque é o tamanho de cada amostra.
Calculamos para a variável S2 cada variância de uma amostra de tamanho 
2. Dividimos, portanto, por n – 1 , n = 2. S2 é chamada de variância amostral. A 
média das nove medidas de S2 e a E(S2) = 8/3, valor igual ao de σ2, a variância 
populacional.
Tiramos três conclusões dessa simulação:
(I) E(X) = μ
(II) 
 
2
( ) =VAR X
n
σ
(III) E(S2) = σ2 
De (I) e de (III) concluímos que a média amostral X e que a variância amos-
tral S2 são estimadores não viciados para μ e para σ, respectivamente, em 
que S2 é dado por:
2 21 ( )
( 1)
= −
− ∑S X Xn
Poderíamos usar algum outro estimador para σ2 a variância populacional? 
A resposta é sim. Poderíamos, por exemplo, utilizar o seguinte estimador:
2 21 ( )= −∑ X Xnσ
Ocorre, no entanto, que esse último estimador de σ2 não é um estimador 
não viciado do parâmetro σ2. E está aí a razão de utilizarmos o denominador 
“n – 1” quando calculamos o valor da variância amostral.
Para formalizar, se 1 = μ e E( 1) = 1, então o estimador 1 é dito ser não vicia-
do para 1. O mesmo vale para 2 = σ
2 e o seu estimador não viciado 2 = S
2.
Estimador consistente e eficientes
Um estimador é dito consistente se o seu valor aproxima-se do valor do 
parâmetro à medida que a amostra cresce. 
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Estimação
151
Um estimador é mais eficiente do que outro se a sua variância for menor 
do que a variância do estimador concorrente. O estimador eficiente é o que 
possui a menor variância. 
Pode-se demonstrar que além de não viciado, a média amostral é um es-
timador consistente e eficiente para estimar a média populacional.
Intervalo de confiança
Como verificado no estudo de amostragem, a estimativa pontual de um 
parâmetro nem sempre é suficiente. Como se trata de um processo que en-
volve amostragem, e incerteza, muitas vezes queremos estimar um valor do 
parâmetro adicionando a essa estimativa um intervalo para o qual tenhamos 
um certo nível de confiança que o parâmetro possa pertencer.
No caso de estarmos estimando a proporção da preferência entre dois pro-
dutos que competem no mercado, podemos concluir, através de um proces-
so de amostragem, que a proporção da preferência pelo produto A pode ser 
maior do que a do produto B, mas que, no entanto, essa diferença possa ocorrer 
somente devido a variações daquela amostra particular que foi tomada. Nesse 
caso, caracterizamos o fenômeno do empate técnico ou empate estatístico.
Devemos construir, então, em torno do valor estimado pontualmente um 
intervalo de confiança.
Fornecemos a seguir as expressões para o cálculo de intervalos de con-
fiança para diversas situações que ocorrem na prática, sem entrar nas consi-
derações matemáticas que levam à construção destes intervalos.
Intervalo de confiança para a 
média com σ conhecido
Se o desvio-padrão é conhecido, utilizamos o seu valor para o cálculo do 
intervalo, além do valor da média e da estatística Z da distribuição normal.
P(X – z . σX ≤ µ ≤ X + z . σX ) = 1 – α
Em que o erro-padrão σX = 
σ
n
 e (1 – α) é o nível de confiança da 
declaração.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
152
Estimação
Exemplo:
Uma empresa fabricante de pneus deseja verificar, através de uma amos-
tra de 100 pneus retirada de um grande lote, a vida média desse produto. 
Sabe-se que o desvio-padrão da população é de 3 000km. Para a amostra de 
100 pneus, a vida útil dos pneus foi verificada em 32 500km para rodar com 
segurança.
Desejamos construir para todo o lote um intervalo de confiança de 95% no 
sentido de que o verdadeiro valor da vida média possa estar nesse intervalo.
Para construir esse intervalo, que terá como limites X z.σX , sabemos que 
X = 32 500 e que 
X =
σσ
n
= 3 000 300
100
= .
O valor de Z pode ser buscado na tabela D da distribuição normal padrão. 
Construiremos, então, três regiões na curva normal, a primeira correspon-
dendo à probabilidade de 0,025, a segunda a 0,95 e a terceira também a 
0,025. Buscando dentro da tabela da normal padrão o valor 0,025, encon-
tramos Z = – 1,96. Como a curva é simétrica, o valor de Z correspondendo a 
0,975 será Z = 1,96.
x–1,96 1,96
f(x)
95%
Portanto, o intervalo construído será: [32 500 – (1,96).(300), 32 500 + 
(1,96).(300)], cujo valor é então (31 912km, 33 088km). 
Pode-se concluir, assim, que temos uma probabilidade de 0,95 de que o 
verdadeiro valor da vida média dos pneus estará no intervalo (31 912km, 
33 088km)? Rigorosamente não. O valor de μ é um dado real, portanto μ não 
é uma variável aleatória e, portanto, no contexto da estatística clássica, um 
parâmetro não tem distribuição de probabilidade nem se pode atribuir uma 
probabilidade a ele. 
A interpretação de intervalo de confiança é a de que se construirmos 
100 intervalos baseados em 100 amostras, o valor do parâmetro deve estar 
dentro de 95 desses intervalos.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Estimação
153
Para efeitos práticos, no entanto, não estaremos muito errados ao afirmar 
que temos uma confiança aproximada de 95% de que o parâmetro esteja 
dentro do intervalo construído a partir de uma única amostra. Essa interpre-
tação é mais do que suficiente para que possamos tomar as decisões cabí-
veis ao trabalho realizado.
Intervalo de confiança 
para a média com σ desconhecido
Na maior parte das aplicações práticas, o valor do desvio-padrão não é conhe-
cido. A forma de se construir o intervalo de confiança da média é feita através da 
estimação do valor de σ. O desvio-padrão populacional pode ser estimado pelo 
valor do desvio-padrão da amostra, S, que é a raiz quadrada da variância. Já vimos 
as boas propriedades da estatísticaS2 como estimador de σ2. Elas valem também 
para S como estimador de σ.
Mas aqui surge um outro problema: vimos que 
X – µ
σ
n
 tem distribuição 
normal padrão e, por isso, quando σ é conhecido, podemos utilizar a estatís-
tica Z na determinação do intervalo de confiança.
Até aqui nada sabemos sobre a distribuição de X – µ
S
n
.
Pode-se demonstrar teoricamente que a distribuição da estatística 
X – µ
S
n 
é muito parecida com a distribuição normal e que é chamada de distribui-
ção “t” de Student que é devida a um químico e matemático inglês chamado 
Gosset que a desenvolveu trabalhando na cervejaria Guinness. Student era 
o seu pseudônimo, porque a cervejaria não permitia que seus empregados 
divulgassem qualquer tipo de estudo.
Quando a amostra for muito grande, os valores da distribuição “t” se apro-
ximam muito da distribuição normal e, por isso, nessa situação, será indife-
rente o uso de uma ou de outra. No caso de amostras menores, é necessário 
calcular o valor de “t” que é sempre referenciado pelos graus de liberdade do 
erro-padrão. No caso da média, trabalharemos sempre com n – 1 graus de 
liberdade. Então, se a amostra tem tamanho 20, buscamos na tabela E da dis-
tribuição “t” o valor de “t” correspondente ao nível de confiança do intervalo 
(1 – α) com os graus de liberdade correspondentes.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
154
Estimação
Na tabela “t” verificamos na parte superior as probabilidades chamadas 
de bicaudal. Então, se queremos um intervalo de 95% de confiança, bus-
camos na tabela o valor de 0,05. Para o caso de uma amostra de tamanho 
20, o valor de “t0,95” é de 2 093. Esse valor pode ser verificado na tabela E. 
Veja também que para amostras muito grandes o valor de “t” se aproxima 
dos valores de “Z” da distribuição normal padrão. Veja essa indicação na 
própria tabela. 
Exemplo:
Vamos considerar o mesmo exemplo da empresa fabricante de pneus 
que deseja verificar, através de uma amostra de 100 pneus retirada de um 
grande lote, a vida média deles. Não se conhece o desvio-padrão da popu-
lação. Para a amostra de 100 pneus, a vida útil foi determinada como 32 500km 
para rodar com segurança, e o desvio-padrão amostral foi calculado em 
3 000km.
Desejamos construir para todo o lote um intervalo de confiança de 95% no 
sentido de que o verdadeiro valor da vida média possa estar nesse intervalo.
Para construir esse intervalo que terá como limites X t . SX , sabemos que 
X = 32 500 e que = = =3 000 300
100X
S
S
n
. O valor de “t” pode ser buscado na 
tabela E da distribuição “t” de Student com 99 graus de liberdade. Esse valor 
será de aproximadamente 1,98.
Portanto, o intervalo construído será: [32 500 – (1,98).(300), 32 500 + 
(1,98).(300)] cujo valor é então (31 906km, 33 094km). Veja que esses valores 
não diferem muito do resultado obtido para σ conhecido.
Mas e se a amostra for pequena, digamos n = 36? Em primeiro lugar, o valor 
de 3 000 500
36
= = =X
S
S
n
. O valor de “t” para 95% e 35 graus de liberdade
é aproximadamente igual a 2,030. Então o intervalo será determinado por: 
[32 500 – (2,03).(500), 32 500 + (2,03).(500)] = (31 485km, 33 515km).
Veja que nesse caso a precisão da estimativa dos limites do intervalo é 
ainda menor do que no caso de amostras de tamanho 100 e no caso do des-
vio-padrão conhecido. É bastante intuitivo perceber que quanto menor é o 
nosso nível de informação menos precisas serão as estimativas.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Estimação
155
Intervalo de confiança para outros parâmetros
Ficou claro da exposição anterior que para construirmos um intervalo de 
confiança precisamos saber quem é o estimador do parâmetro, quem é o 
erro-padrão da estimativa e qual é a estatística associada ao estimador.
Tendo essas informações, podemos construir o intervalo de confiança para 
o parâmetro , sabendo quem é ô, quem é o seu erro-padrão σô ou o seu es-
timador Sô e qual é a estatística associada. E o intervalo, no geral, terá como 
limites:
 ± z σ ou ± t S
O quadro seguinte apresenta os principais elementos para a construção 
de intervalos de confiança:
Parâmetro Parâmetro θ Estimador ô Erro-padrão Estatística
Média 
σ conhecido μ X
s
n
Z
Média σ desco-
nhecido μ X
S
n
tn-1
Proporção P p
pq
n
Z
Diferença de 
médias com σ1 e 
σ2 conhecidos μ1 – μ2
X 1 – X 2
2 2
1 2
1 2
æ ö÷ç ÷+ç ÷ç ÷çè ø
s s
n n Z
Diferença de 
médias com σ1 
e σ2 desconhe-
cidos
μ1 – μ2
X 1 – X 2
2 2
1 2
1 2
æ ö÷ç ÷+ç ÷ç ÷çè ø
S S
n n
tn1 + n2 – 2
Diferença de 
proporções P1 – P2 p 1 – p 2
1 1 2 2
1 2
æ ö÷ç ÷+ç ÷ç ÷çè ø
p q p q
n n
Z
Outros intervalos de confiança podem ser construídos como o interva-
lo de confiança para a variância e para a razão de duas variâncias, as distri-
buições de probabilidades associadas a esses intervalos são a distribuição 
qui-quadrado e a distribuição “F” de Fisher-Snedecor, que pelo pouco uso no 
contexto deste livro, não foram incluídas. Qualquer livro de estatística inter-
mediária traz esses intervalos para o caso de algum leitor necessitar.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
156
Estimação
Testes de hipóteses
Uma outra forma de se fazer inferência sobre parâmetros da população 
com base em dados da amostra é através da escolha de uma entre duas pos-
sibilidades de ação, minimizando o risco na tomada de decisões.
Hipótese nula versus hipótese alternativa
Um teste de hipótese estatística consiste em fazer declarações sobre o pa-
râmetro e submetê-las às evidências amostrais. Duas hipóteses então são 
estabelecidas: a hipótese da nulidade ou hipótese nula versus uma hipótese 
alternativa. 
A hipótese nula é denotada por H0, na qual se faz uma suposição sobre o 
valor do parâmetro, e na hipótese alternativa denotada de H1, que se contra-
põe à hipótese nula, podendo-se afirmar que o parâmetro é diferente, maior 
ou menor que o valor estabelecido pela hipótese da igualdade. A represen-
tação formal de um teste é dada por:
Teste bilateral:
H0: θ = c
H1: θ ≠ c
Teste unilateral à direita:
H0: θ = c
H1: θ > c
Teste unilateral à esquerda:
H0: θ = c
H1: θ < c
A escolha de qual dos três tipos de teste deve proceder depende da quan-
tidade e qualidade de informação que se tenha antes da coleta dos dados. No 
caso de ter informação suficiente sobre a direção do teste, os testes unilaterais 
são preferíveis aos bilaterais pela maior força de seu resultado.
No exemplo de abertura do capítulo, quando o construtor deseja que 
seu concreto tenha resistência mínima de 200kgf/cm2, o mais adequado é o 
teste unilateral à direita. Reflita sobre essa afirmação.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Estimação
157
Erro tipo I e erro tipo II
Como o teste está associado à amostragem e, portanto, à incerteza, exis-
tem quatro possíveis resultados. Rejeitar H0 incorreta ou corretamente e não 
rejeitar H0 incorreta ou corretamente. O quadro a seguir apresenta essas 
quatro possibilidades:
Ação com relação a H0 H0 é verdadeira H0 é falsa
Não rejeitar H0 Decisão correta Erro tipo II
Rejeitar H0 Erro tipo I Decisão correta
O tamanho de cada tipo de erro é dado pela sua probabilidade de ocor-
rência. A probabilidade de se cometer o erro tipo I é chamada de α e a proba-
bilidade de se cometer o erro tipo II é chamada de β.
Para o cálculo do tamanho da amostra e para a tomada de decisões, no 
geral controla-se o erro tipo I por ser considerado o mais grave. Uma analo-
gia pode ser feita em um julgamento. A hipótese nula é a de que o réu é 
inocente. Pergunta-se: o que é mais grave, rejeitar H0 quando H0 é verdadeira, 
que significa condenar um inocente, ou não rejeitar H0 quando ela é falsa, que 
significa absolver um culpado? Do ponto de vista ético parece ser mais grave 
condenar um inocente.
O erro tipo I é tambémchamado do erro do consumidor. Um laboratório 
testa um novo medicamento. Rejeitar H0 significa que esse medicamento é 
melhor do que o que está na praça. Se de fato ele não for, isto é, H0 é verda-
deiro, o consumidor estará sendo prejudicado. O erro tipo II é chamado de 
erro do produtor, ele ocorre quando o novo medicamento é melhor, deve-
ria ser rejeitado o H0, mas, no entanto, os testes não permitem rejeitar H0, 
ou seja, o fabricante terá prejuízo por não colocar um novo medicamento 
melhor que o tradicional no mercado.
Procedimento de testagem 
de hipóteses para a média populacional μ
Vamos expor o procedimento de testagem de hipóteses através de uma 
aplicação. 
Suponha que a renda média das famílias de certo município foi determi-
nada através do Censo como sendo igual a R$2.000,00 para um particular 
ano, e dois anos depois desejamos verificar se houve alguma mudança na 
renda familiar através de um levantamento amostral.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
158
Estimação
No Brasil, as PNADs, Pesquisas Nacionais por Amostra de Domicílios, cum-
prem esse papel entre os Censos que são realizados a cada dez anos.
Devemos estabelecer as duas hipóteses estatísticas. A hipótese nula é de 
que a renda média familiar continua sendo de R$2.000,00. A hipótese alter-
nativa pode tomar uma de três formas. Se não há qualquer informação adi-
cional de que a renda média possa ter aumentado ou diminuído, toma-se 
como alternativa a hipótese de que a renda média é diferente de R$2.000,00. 
Os dados dirão se ela aumentou ou diminuiu e se esta mudança foi significa-
tiva ou se a diferença pode ter ocorrido por pequenas variações do acaso.
Se algum novo empreendimento foi realizado no município, pode-se 
supor que houve um aumento do nível de emprego, gerando maior renda 
média familiar. Então a hipótese alternativa pode ser construída como: a 
média é maior do que R$2.000,00.
Por outro lado, se alguma indústria deixou a cidade ou se houve movi-
mentos migratórios importantes, como a chegada de pessoas de municípios 
mais pobres ou a saída de força de trabalho para centros maiores, a hipótese 
alternativa pode ser a de que a média é menor do que R$2.000,00.
Vamos ficar inicialmente com a primeira possibilidade. Então, o primeiro 
passo é o de estabelecer as hipóteses estatísticas para um teste bilateral:
H0: μ = 2 000
H1: μ ≠ 2 000
Suponha então que uma amostra de 25 famílias foi pesquisada e que a 
média amostral da renda familiar foi calculada em R$2.200,00. Pergunta-se, 
com base nesse dado e sabendo-se que o desvio-padrão da renda familiar 
foi determinado no censo como tendo o valor de R$500,00, se há uma dife-
rença significativa da renda média familiar nesses dois anos.
Precisamos agora estabelecer a estatística do teste. Sabemos que 
X – µ
σ
n
 
tem distribuição normal padrão, Z. Então:
Z=
-
= =
2 200 2 000
500
25
200
100
2
. .
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Estimação
159
Precisamos agora verificar qual é a área sob a curva normal padrão entre 
– 2 e 2, por ser este um teste bilateral.
P(– 2 < Z ≤ 2) = F(2) – F(– 2) = 0,9772 – 0,0228 = 0,9544. Essa probabilida-
de está associada a um valor de α = 1 – 0,9544 = 0,0456. Ela é chamada de 
p-valor.
Para a tomada de decisão, precisamos compreender o significado desse 
p-valor. O p-valor é a probabilidade de rejeitarmos H0 quando ele é verdadei-
ro. Ou seja, dizemos que μ ≠ 2 000 quando de fato não é. Nesse caso temos 
uma probabilidade de 4,56% de estarmos errando se afirmarmos que a renda 
média familiar mudou nesses dois anos.
Por outro lado, podemos dizer que temos uma confiança de 95,44% de 
que houve mudança na renda média familiar do município. O que decidir?
Tradicionalmente, quando o p-valor for menor do que 5%, decidimos por 
H1. Nessas circunstâncias diríamos que houve sim uma mudança na renda. 
Esse padrão de 5%, porém, não deve ser tomado de forma absoluta. A deci-
são deve depender das consequências da gravidade da admissão da possi-
bilidade de se estar cometendo um erro. Se as consequências forem graves, 
talvez o tomador de decisões resolva ser mais rigoroso e só admitir H1 se o 
p-valor for menor do que 0,01, por exemplo. Isto é, ele deseja uma confiança 
de no mínimo 99% para rejeitar H0. 
Mas se as consequências da tomada de decisão incorreta forem menos 
traumáticas, ele pode admitir tomar a decisão com 90% de confiança. Por-
tanto, somente se o p-valor for maior do que 0,10 ele não admitirá a hipó-
tese alternativa.
Esse é o procedimento-padrão para testagem de hipóteses estatísticas.
Variações no procedimento de testagem 
de hipóteses para a média populacional μ
Nesse procedimento adotado, duas variações importantes podem acon-
tecer: (I) pode-se supor no exemplo que haveria uma mudança para maior 
na renda média mensal e um teste unilateral deveria ter sido feito e (II) não 
se conhece o valor de σ.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
160
Estimação
Analisando os dados para a suposição (I), devemos fazer o teste unilateral. 
Então, as hipóteses estatísticas seriam estabelecidas como:
H0: μ = 2 000
H1: μ > 2 000
A estatística do teste é a mesma e o seu valor determinado com base nos 
valores amostrais foi de Z = 2. Agora (1 – α) compreende toda a área da curva 
normal de – ∞ até 2, que corresponde à P( Z ≤ 2) = 0,9772. Então α ou o p- 
-valor = 1 – 0,9772 = 0,0228.
O tomador de decisões tem agora um risco menor em afirmar que a renda 
familiar aumentou. O seu nível de confiança subiu para 97,7%. Por que isso 
ocorreu no teste unilateral? O nível de confiança cresceu porque foi agrega-
da maior quantidade de informação através do direcionamento do teste. Já 
supúnhamos que haveria aumento da renda.
Para o caso de não se conhecer o valor de σ, ele deve ser estimado a partir 
dos dados da amostra, tendo como estimador o desvio-padrão amostral, S. 
Vamos supor que o valor calculado de S na amostra tenha sido de R$500,00. 
Tomamos o mesmo valor dos primeiros dois exemplos só a título de compa-
ração. Há que ficar bem claro que o valor de S da amostra não tem qualquer 
correspondência com algum valor determinado no Censo.
Vamos manter o teste unilateral, a exemplo do último exercício:
H0: μ = 2 000
H1: μ > 2 000
A estatística do teste agora muda. A distribuição de 
X – µ
σ
n não é mais 
normal. Ela é uma estatística “t” com n – 1 graus de liberdade. O valor de “t” 
será determinado com base em dados amostrais como:
t=
-
= =
2 200 2 000
500
25
200
100
2
. .
O nível de significância de t = 2 com 24 graus de liberdade é aproximada-
mente 0,028. Esse valor pode ser determinado por interpolação ou através 
da ajuda de uma planilha eletrônica para a função distribuição “t”. 
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Estimação
161
Com p-valor de 0,028, o nível de confiança para a rejeição de H0 será de 
97,21%. Observe que esse valor é a favor de H1, mas com menos força do que 
o 97,7% para o caso de conhecermos o valor de σ (ao conhecer o seu valor, 
temos mais informação agregada).
Se o teste “t” tivesse sido realizado para a hipótese bilateral, o p-valor seria 
igual a 0,057 e o nível de confiança, de 94,3%, visto que não teríamos nem a 
informação de σ nem a informação fornecida pelo direcionamento do teste.
Testes de hipóteses para outros parâmetros
Estudamos como realizar testes de hipóteses para a média populacional 
μ. O procedimento passo a passo seguido foi:
(I) estabelecimento das hipóteses estatísticas;
(II) cálculo da estatística do teste (θ – θ)
σθ
 ;
(III) determinação do p-valor.
Esse procedimento vale para as testagens de hipótese sobre os parâme-
tros estabelecidos na tabela a seguir, a exemplo do que foi realizado com 
intervalos de confiança.
Parâmetro Parâmetro θ Estimador Erro-padrão EstatísticaMédia σ conhecido μ X
s
n Z
Média σ desconhe-
cido μ X
S
n tn-1
Proporção P p
pq
n Z
Diferença de médias 
com σ1 e σ2 conheci-
dos
μ1 – μ2 X 1 – X 2
2 2
1 2
1 2
æ ö÷ç ÷+ç ÷ç ÷çè ø
s s
n n Z
Diferença de médias 
com σ1 e σ2 desco-
nhecidos
μ1 – μ2 X 1 – X2
2 2
1 2
1 2
æ ö÷ç ÷+ç ÷ç ÷çè ø
S S
n n tn1 + n2 – 2
Diferença de propor-
ções P1 – P2 p 1 – p 2
1 1 2 2
1 2
æ ö÷ç ÷+ç ÷ç ÷çè ø
p q p q
n n Z
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
162
Estimação
Para efeito de ilustração, construiremos um exemplo de testagem de hi-
póteses para a diferença entre duas médias.
Exemplo:
Uma firma de consultoria foi contratada para verificar se os níveis salariais de 
trabalhadores não qualificados de uma indústria eram diferentes com relação 
ao sexo. Suponhamos que as mulheres tivessem uma média salarial menor que 
a dos homens. Uma amostra estratificada proporcional por sexo foi retirada e os 
dados resultantes do levantamento amostral seguem na tabela abaixo:
Sexo Salário médio amostral
Desvio-padrão 
amostral Tamanho da amostra
Feminino X 1 = R$590,00 S1 = R$8,00 n1= 10
Masculino X 2 = R$600,00 Ss = R$9,00 n2 = 20
Hipóteses estatísticas:
H0: μ1 = μ2 
H1: μ1 < μ2
Essas hipóteses podem ser reescritas como:
H0: μ1 – μ2 = 0
H1: μ1 – μ2 < 0
Estatística do teste:
1 2 1 2
2 2
1 2
1 2
( ) ( )− − −=
 
+  
X X
t
S S
n n
µ µ
 
“t” com 10+20–2 = 28 g.l.
 1 2
2 2
(590 600) ( ) 10
3,09
3,2338 9
10 20
− − µ − µ −= = = −
 
+  
tCálculo do p-valor:
p-valor = 0,0022
Conclusão: com nível de confiança de 99,8%, podemos concluir que de 
fato o nível salarial das mulheres da indústria pesquisada é menor que o 
nível salarial dos homens.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Estimação
163
Atividades de aplicação
1. Seja Z ~ N(0,1), calcule:
a) P(0 < Z ≤ 1,2)
b) P(–0,9 ≤ Z ≤ 0)
c) P(1,21 ≤ Z < 1,75)
d) P(Z > –0,75)
e) P(Z ≤ 1,35)
f) P(–1,44 < Z < 0)
2. Determinar z0 tal que:
a) P(Z > z0) = 0,5
b) P(Z < z0) = 0,8645
c) P(–z0 ≤ Z ≤ z0) = 0,90
3. Suponha que a renda de uma comunidade possa ser razoavelmente 
aproximada por uma distribuição normal com média de R$1.500,00 e 
desvio-padrão de R$300,00.
a) Que porcentagem da população terá renda superior a R$1.860,00?
b) Em uma amostra de 50 pessoas dessa comunidade, quantos pode-
mos esperar com renda inferior a R$1.050,00?
4. Uma fábrica de automóveis calcula que os motores de sua fabricação 
têm duração com distribuição normal de média 150 000km e desvio- 
-padrão de 10 000km. 
a) Qual é a probabilidade que um automóvel, escolhido aleatoria-
mente entre os fabricados pela empresa, tenha um motor que 
dure entre 140 000 e 165 000km?
b) Se a fábrica substitui o motor que apresenta duração inferior à 
garantia, qual deve ser essa garantia para que a percentagem de 
motores substituídos seja inferior a 0,2%?
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
164
Estimação
5. Uma equipe de pesquisadores deseja estudar as condições de vida 
dos habitantes dos 15 000 domicílios de uma cidade-dormitório. 
Devido à dificuldade de pesquisar todos os domicílios, a equipe op-
tou por selecionar aleatoriamente 36. Uma das variáveis de interes-
se, no estudo em questão, era o número de pessoas que residem 
em cada domicílio. Para os selecionados foram obtidas as seguintes 
informações sobre o número de residentes:
 5 6 3 3 2 3 3 3 4
 4 3 2 7 4 3 4 2 1
 5 4 4 3 3 4 3 3 1
 2 4 3 4 2 4 5 3 5
a) Os pesquisadores desejam saber o número médio de pessoas que 
residem em cada domicílio. Como eles podem utilizar as informa-
ções obtidas para estimar esse valor? Determine a estimativa.
b) Qual o estimador utilizado e sua distribuição de amostragem?
c) Considerando que, pelo último censo, o número médio de pessoas 
em cada domicílio é 5 com variância 12,96, determine:
I. P(X > 4)
II. P(X ≥ 6,5)
III. P(X = 2)
IV. P(3,5 < X ≤ 5)
6. Uma amostra consiste em 75 aparelhos de TV adquiridos há vários 
anos. Os tempos de substituição desses aparelhos têm média de 8,2 
anos e desvio-padrão de 1,1 ano. 
a) Construa um intervalo de 90% de confiança para o tempo médio 
de substituição de todos os aparelhos de TV daquela época. 
b) Em sua opinião, o resultado poderia ser aplicado aos aparelhos de 
TV que estão sendo vendidos atualmente? Justifique.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Estimação
165
7. Em um estudo sobre a aplicação do tempo em serviços, constatou- 
-se que para uma amostra de 20 administradores selecionados alea-
toriamente, o tempo gasto em média por dia de trabalho em serviços 
burocráticos é de 2,4 horas com desvio-padrão de 1,3 horas. Os dados 
apresentam uma distribuição normal. Construa um intervalo de con-
fiança de 95% para o tempo médio gasto com serviços burocráticos 
para todos os administradores.
8. Uma amostra aleatória de 625 pessoas, selecionadas de uma popu-
lação de 6 500 pessoas, revelou que 440 delas preferiam o detergen-
te de marca X. Através dessas informações, construa um intervalo de 
confiança de 90% para a proporção de pessoas na população que pre-
ferem o detergente da marca ABC.
9. Sabe-se que o consumo mensal per capita de um determinado pro-
duto tem distribuição normal, com desvio-padrão de 2kg. A diretoria 
de uma empresa que fabrica esse produto resolveu que o retiraria da 
linha de produção se a média de consumo per capita fosse menor que 
8kg. Caso contrário, continuaria a fabricá-lo. Foi realizada uma pesqui-
sa de mercado tomando-se uma amostra de 36 indivíduos e verificou-
-se que ∑Xi = 284kg, onde Xi representa o consumo mensal do i-ésimo 
indivíduo da amostra. 
a) Com base nos resultados da amostra e com um risco de 5%, qual 
deveria ser a decisão da diretoria?
b) Se a diretoria tivesse fixado = 0,10, a decisão seria a mesma? Justi-
fique sua resposta.
10. Uma companhia de cigarros anuncia que o índice médio de nicotina 
dos cigarros que fabrica apresenta no máximo 23mg por cigarro. Um 
laboratório realiza 6 análises, obtendo as seguintes quantidades de 
nicotina: 27, 24, 21, 25, 26, 22. Sabe-se que o índice de nicotina se dis-
tribui normalmente. Pode-se aceitar, ao nível de 10% de significância, 
a afirmação do fabricante? 
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
166
Estimação
Gabarito
1.
a) P(0 < Z < 1,2) = P(Z < 1,2) – P(Z < 0) = 0,8849 – 0,50 = 0,4849 ou 
48,49%.
b) P(–0,9 ≤ Z ≤ 0) = P(Z < 0) – P(Z < –0,9) = 0,50 – 0,1841 = 0,3159 ou 
31,59%.
c) P(1,21 ≤ Z < 1,75) = P (Z < 1,75) – P(Z < 1,21) = 0,9599 – 0,8869 = 
0,073 ou 7,3%.
d) P(Z > –0,75) = 1 – P(Z < –0,75) = 1 – 0,2266 = 0,7734 ou 77,34%.
e) P(Z ≤ 1,35) = 0,9115 ou 91,15%
f) P(–1,44 < Z < 0) = P(Z < 0) – P(Z < –1,44) = 0,50 – 0,0749 = 0,4251 
ou 42,51%.
2.
a) Na tabela D, encontramos o valor z0 = 0
b) A área abaixo de z0 é 0,8645. Logo, a área entre 0 e z0 será de 0,8645 
– 0,50 = 0,3645. Sendo assim, na tabela encontraremos z0 = 1,1.
c) A área abaixo de z0 é 0,95. Logo, a área entre 0 e z0 será de 0,95 – 
0,50 = 0,45. Sendo assim, na tabela encontraremos z0 = +1,645.
 3.
a) μ = 1.500 e σ = 300, então, desejamos encontrar a P(X > 1.860).
 Calculamos o valor de Z, em que Z = X – µσ = 
1.860 – 1.500
300
= 1,2 . 
Sendo assim, a
 P(X >1.860) = P(Z >1,2) . .. P(Z >1,2) = 1 – P(Z < 1,2) = 1 – 0,8849 = 
0,1151 ou 11,51%.
b) E (pessoas com renda inferior a R$1.050,00) = n. P(X<1.050). 
 A P(X < 1.050) = ( )
−< XP Z µ
σ
, em que P(X<1.050) =
 <
1.050–1.500
P Z
300
. Sendo assim, a
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Estimação
167
 P(X < 1.050) = P(Z< –1,5) = 0,067. O número esperado de pessoas 
com renda inferior a R$1.050,00 será de 50 x 0,067 = 3,35, ou seja,três pessoas. 
4. Sendo μ = 150 000 e σ = 10 000, então:
a) P(140 000 ≤ X ≤ 165 000) + P(X ≤ 165 000) – P(X ≤ 140 000), em que
 1
140 000 150 000
1
10 000
−= = −z e 2
165 000 150 000
1,5
10 000
−= =z , logo a
 P(140,00 ≤ X 165 000) = P(–1 ≤ Z ≤ 1,5) – P(Z ≤ 1) = 0,9332 – 0,1587 
= 0,7745 ou 77,45%.
b) Área abaixo do valor de X corresponde a 99,8%. Área entre 
0 e z0= 0,998 – 0,50 = 0,498. Sendo assim, o valor de z0 = 2,88 e 
dessa forma encontramos o valor de X por meio da expressão: 
X 150 000
2,88
10 000
−= ou seja, X = 178 800km.
5.
a) Baseado no resultado obtido através da média amostral, essa esti-
mativa terá como valor 3,44. 
b) O estimador utilizado é X com distribuição normal 
2
( )
n
σµ .
c) Como μ – 5 e σ2 = 12,96, então:
I. P(X > 4) = 1 – P(X < 4) ∴ 
4 5
1,67
12,96 / 36
−= = −z , logo, P(X > 4) = 
P(z > –1,67) = 1 – P(z ≤ –1,67) = 1 – 0,0475 = 0,9525 ou 95,25%.
II. P(X ≤ –6,5) ∴ 
6,5 5
2,5
12,96 / 36
−= =z , logo, P(X ≤ 6,5) = P(z ≤ 2,5) ∴
 P(z ≤ 2,5) = 0,9938 ou 99,38%.
III. P(X = 2) = 0, pois numa distribuição contínua não é possível calcu-
lar a probabilidade no ponto exato.
IV. P(3,5 < X ≤ 5) = P(X ≤ 5) – P(X < 3,5) ∴ 1
3,5 5
12,96 / 36
−=z e 
 2
5 5
12,96 / 36
−=z , então
 z1 = –2,5 e z2 = 0. Dessa forma, P(3,5 < X ≤ 5) = P(–2,5 < Z ≤ 0) = 
P(Z ≤ 0) – P(Z < – 2,5) = 0,50 – 0,0062 = 0,4938 ou 49,38%.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
168
Estimação
6.
a) n = 75; X = 8,2; S = 1,1. Como o tamanho da amostra é maior que 
30, utilizaremos a estatística z para a construção do intervalo de 
confiança com 1 – α = 0,90. O valor de z será 1,645. Então:
( ) 1− ≤ ≤ + = −X XP X z.S X z.Sµ α
1,1 1,1
(8,2 (1,645) 8,2 (1,645) ) 0,90
75 75
− ≤ ≤ + =P µ ∴
P(8,2 – 0,21 ≤ μ ≤ 8,2 + 0,21) = 0,90.
P(7,99 ≤ μ ≤ 8,41) = 0,90
 Com 90% de confiança podemos afirmar que os aparelhos de te-
levisão dessa população têm um tempo médio para substituição 
entre 7,99 anos e 8,41 anos.
b) Não, pois o estudo foi restrito aos aparelhos adquiridos há vários 
anos.
7. n = 20; X = 2,4; S = 1,3. Sendo o tamanho da amostra menor do que 30 
e o desvio-padrão da população desconhecido, utilizaremos a estatísti-
ca "t" de Student para a construção do intervalo de confiança com 1 – α 
= 0,95. Nesse caso, o valor de t será dado por t1 – α; n – 1 = t0,95; 19 = 2,093. Des-
sa forma, o intervalo de confiança será obtido por meio da expressão:
( ) 1− ≤ ≤ + = −X XP X t.S X t.Sµ α
1,3 1,3
(2, 4 (2,093) 2, 4 (2,093) ) 0,95
20 20
− ≤ ≤ + =P µ ∴
P(2,4 – 0,61 ≤ μ ≤ 2,4 + 0,61) = 0,95 ∴
P(1,79 ≤ μ ≤ 3,01) = 0,95.
 Ou seja, com 95% de confiança podemos afirmar que o tempo médio 
gasto por dia com serviços burocráticos dos administradores dessa 
população estará entre 1,79 horas e 3,01 horas.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Estimação
169
8. N = 6.500, n = 625, f = 440 e 1 – α = 0,90, então 440 0,704
625
= = =fp
n
 e 
 z = 1,645. O intervalo de confiança será dado pela expressão:
P( p – z . Sp ≤ P ≤ p + z . Sp) = 1 – α
 Nela, .(1 ) ( ).
( 1)
− −=
−p
p p N n
S
n N
. A inclusão do fator de correção para 
 populações finitas, ( ).
( 1)
−
−
N n
N
se deve ao fato de n > 5% da população 
 (N). Sendo assim, o valor de Sp será 
0,704.(0,296) (6500 625)
.
625 (6500 1)
−
−
= 
 0,017. Portanto, o intervalo de confiança será:
P[0,704 – (1,645).(0,017) ≤ P ≤ 0,704 + (1,645).(0,017)] = 0,90∴
P[0,676 ≤ P ≤ 0,732] = 0,90.
 Ou seja, com 90% de confiança podemos afirmar que, das pessoas dessa 
população, entre 67,6% e 73,2% preferem o detergente da marca ABC.
9.
a) α = 5%, n = 36, 284 7,89
36
= =X e σ conhecido é igual a 2.
 Hipóteses:
 H0: μ = 8
 H1: μ < 8
 É um teste unilateral à esquerda, em que o valor crítico de z será 
–1,645. A estatística calculada será obtida por:
 
7,89 8
0,33
2
36
− −= = = −calc
X
z
n
µ
σ .
 Decisão: como o valor de z calculado é maior que z crítico, não se 
rejeita H0, de maneira que a empresa deve continuar fabricando o 
produto.
b) Caso tivéssemos α = 10%, o valor de z crítico seria igual a –1,282. 
Logo, manteríamos a decisão encontrada anteriormente para 5%, 
ou seja, ainda assim não rejeitaríamos H0.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
170
Estimação
10.
 Dados:
 
27 24 21 25 26 22
6
+ + + + +=X = 24,17 e 
2(145)
3531
6
5
−
=S = 2,32.
 Hipóteses:
 H0: μ0 = 23
 H1: μ1 > 23
 α – 10%; Como n < 30 e σ é desconhecido, então utilizaremos a esta-
tística "t" de Student com cinco graus de liberdade e 90% de confiança 
para um teste unilateral. Neste caso o valor de t será 1,476.
 O valor de t calculado será dado por 0−X
S
n
µ , em que 
24,17 23
1,235
2,32
6
−= =t .
 Decisão: como o valor de t calculado, 1,235, é inferior ao valor do t 
crítico, 1,476, não se rejeita H0. A afirmação do fabricante de cigarros 
procede, portanto, ao nível de 10% de significância. 
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Análise de regressão 
e de correlação
Problema
A inovação tecnológica tem tido papel central na economia de países de-
senvolvidos e de países que têm crescido a taxas em torno de 10% nas últimas 
décadas. O investimento em pesquisa e desenvolvimento (p&d) nas empresas 
de base tecnológica tem sido apontado como fator determinante do cresci-
mento desses países em consequência também da melhoria dos resultados de 
produção das empresas de setores estratégicos. 
Uma pesquisa foi realizada com 15 empresas que oferecem produtos de 
informática para o mercado. Pretende-se verificar se o resultado da aplicação 
de recursos em p&d em um determinado ano implicou em ganhos significa-
tivos de receita no ano seguinte.
A tabela a seguir apresenta as aplicações em milhões de reais dessas em-
presas e os resultados das receitas no ano seguinte:
Empresa Faturamento (2007) em milhões de reais
Gastos em p&d (2006) 
em milhões de reais
A 221 15,0
B 83 8,5
C 147 12,0
D 69 6,5
E 41 4,5
F 26 2,0
G 35 0,5
H 40 1,5
I 125 14,0
J 97 9,0
173
Métodos quantitativos aplicados a negócios.indb 173 28/1/2013 09:21:02
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
174
Análise de regressão e de correlação
Empresa Faturamento (2007) em milhões de reais
Gastos em p&d (2006) 
em milhões de reais
K 53 7,5
L 12 0,5
M 34 2,5
N 48 3,0
O 64 6,0
Algumas questões são prontamente apresentadas para o estudo dessa 
relação. A primeira verificação a ser realizada é se de fato essa relação não é 
espúria, ou seja, se a relação entre investimento em p&d e faturamento pode, 
teoricamente, ter uma relação causal. Essa determinação pertence muito 
mais ao campo da teoria econômica que ao da teoria estatística. 
Supondo que essa relação causal possa mesmo ser estabelecida, então 
uma série de questões pode ser levantada para verificação através de pro-
cedimentos estatísticos como: (I) existe um modelo matemático que possa 
descrever analiticamente essa relação? (II) se o modelo existe, que modelo 
melhor ajusta os dados de gastos com p&d e o faturamento de empresas 
desse setor? (III) qual é a força dessa relação? Ou de outro modo, qual é o 
poder do modelo construído com base nos dados amostrais, para se fazer 
previsões? (IV) uma vez construído o modelo, qual é a margem de erro das 
previsões? (V) é possível e necessário incorporar novas variáveis que possam 
explicar o faturamento além dos investimentos em p&d?
Conceitos fundamentais
A tarefa de fazer predições é inerente a muitos dos aspectos do geren-
ciamento e do planejamento da produção de empresas com administração 
profissionalizada.Previsões de vendas, compras, custos, produção, contra-
tação de pessoal e aplicação de capital fazem parte dos fundamentos do 
planejamento e controle atual das empresas.
Existe uma enormidade de técnicas matemáticas, estatísticas e economé-
tricas para a realização dessa tarefa de predição. Muitos modelos determinís-
ticos e muitos modelos não determinísticos se propõem a realizar essa tarefa. 
Uma das ferramentas mais importantes para a construção de modelos que 
envolvem certo grau de incerteza, inerente a levantamentos amostrais, é o 
Métodos quantitativos aplicados a negócios.indb 174 28/1/2013 09:21:02
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Análise de regressão e de correlação
175
modelo de regressão, cuja análise está sempre associada a um processo de 
verificação da força da relação entre as variáveis envolvidas e que é chamado 
de análise de correlação.
A análise de regressão consiste em construir uma função matemática a 
partir de observações amostrais que relacione uma ou mais variáveis indepen-
dentes a uma variável dependente. As variações da variável dependente são 
decorrentes em grande medida das variações da variável independente ou 
das variáveis independentes. Essa função pode ser uma função linear ou não, 
dependendo da forma da relação entre as variáveis.
Análise de regressão
Consiste fundamentalmente em construir, a partir dos dados amostrais, 
uma função matemática que relacione uma variável independente a uma 
outra variável que dependa desta e que é chamada de variável dependente. 
A forma geral adotada para descrever essa relação é Y = f(X) + ε, em que X é 
a variável independente, Y a variável dependente e ε é o erro estatístico. Essa 
relação possui, portanto, uma componente determinística f(X) e uma compo-
nente aleatória ε.
Análise de regressão linear
Se a relação entre a variável independente e a variável dependente puder 
ser expressa através de uma função que descreva a equação de uma reta, 
então o modelo em questão é um modelo de regressão linear. A expressão 
geral desse modelo é Y = α + βX + ε, α e β são os parâmetros do modelo. Como 
a construção do modelo é baseada em observações amostrais, esses parâ-
metros nunca são conhecidos. Eles são os verdadeiros valores do modelo do 
mundo real, mas, repetindo, nunca são conhecidos. Eles devem, portanto, 
ser estimados através de estimadores estatísticos, cujas expressões são deter-
minadas por algum critério de minimização do erro estatístico e cujos valo-
res são calculados com base nos dados amostrais.
Análise de regressão não linear
A relação entre duas ou mais variáveis nem sempre pode ser expressa 
através da equação de uma reta, porque essa relação pode ser não linear. 
Métodos quantitativos aplicados a negócios.indb 175 28/1/2013 09:21:02
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
176
Análise de regressão e de correlação
Muitos outros modelos, como o exponencial, o potencial, o logístico, entre 
outros, podem descrever melhor a relação entre as variáveis.
Análise de regressão simples
Quando somente duas variáveis estão envolvidas na construção do modelo, 
dizemos que ele é um modelo de regressão simples. Assim, só participarão do 
modelo uma variável independente e outra variável dependente, além do erro 
estatístico, é claro. Um modelo de regressão simples pode ser linear ou não. Se 
a relação entre as variáveis puder ser bem descrita através da equação de uma 
reta, eles são ditos lineares, conforme definição acima. 
Análise de regressão múltipla
Se a variável dependente estiver relacionada a mais de uma variável in-
dependente, então o modelo de regressão é conhecido como modelo de re-
gressão múltipla. Da mesma forma que no caso anterior, a relação entre as 
variáveis independentes e a variável dependente pode ser linear ou não. No 
caso da relação ser linear, o modelo a ser construído será o de um plano, no 
caso de estarem envolvidas duas variáveis independentes, ou de hiperpla-
nos, se mais de duas variáveis independentes estiverem sendo utilizadas na 
construção do modelo.
Um modelo de regressão linear múltipla, por exemplo, pode ser expresso 
através da seguinte função: Y = β0 + β1X1 + β2 X2 + ... + βpXp + ε. A troca de α 
por β0 é feita aqui somente por comodidade de notação. No caso de termos 
somente duas variáveis independentes, estaremos construindo a equação 
de um plano.
Erro estatístico
O termo ε é definido como o erro estatístico ou resíduo e é a componente 
aleatória do modelo. Ele precisa ser bem compreendido. Vale sempre lem-
brar que esses modelos são construídos através de observações amostrais, e 
sempre que se faz um levantamento de dados através de amostra os resul-
tados obtidos estarão associados a certo grau de imprecisão, que nos mode-
los estatísticos são considerados de natureza aleatória, ou seja, associados a 
certa distribuição de probabilidades.
Métodos quantitativos aplicados a negócios.indb 176 28/1/2013 09:21:02
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Análise de regressão e de correlação
177
Os modelos de regressão têm, portanto, uma parte aleatória e outra de-
terminística. Na parte determinística estão todas as variáveis independentes 
que explicam as variações da variável dependente. Esse modelo deve ser o 
mais esbelto possível, desde que possa explicar bem a relação entre as va-
riáveis independentes e a variável dependente. Na componente aleatória 
estão, além das variações devidas ao acaso, todas aquelas variáveis que têm 
importância reduzida na explicação da variável dependente.
Alguns pressupostos são impostos ao erro para que se possa construir o 
modelo de regressão através dos critérios propostos de redução de funções 
do erro, conforme será visto mais adiante no capítulo.
Critério dos mínimos quadrados ordinários
Existem vários critérios propostos para a minimização de funções do erro. 
O mais comumente utilizado é o chamado critério dos mínimos quadrados or-
dinários, que objetiva minimizar a função Σε2 (soma dos erros ao quadrado), 
conforme será visto um pouco mais adiante.
Gráfico de dispersão
Os gráficos de dispersão apresentam os valores da variável independente 
no eixo (X) das abscissas e o valor da variável dependente no eixo (Y) das or-
denadas. O gráfico a seguir é o dos dados de investimento das 15 empresas 
de informática em planejamento e desenvolvimento em 2006 relacionados 
com o faturamento de cada empresa no ano seguinte. Eles são muito úteis 
para uma impressão visual do relacionamento entre as variáveis.
Gráfico de dispersão
0
Fa
tu
ra
m
en
to
 (y
)
0
50
100
150
200
250
2 4 6 8 10 12 14 16
Gastos com p&d (x)
Métodos quantitativos aplicados a negócios.indb 177 28/1/2013 09:21:02
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
178
Análise de regressão e de correlação
Variáveis independente e dependente
Conforme exposto acima, a variável dependente depende da variável inde-
pendente, que, a rigor, para a análise em questão, não depende de ninguém. 
No caso em tela, o faturamento supostamente depende dos gastos em p&d.
A variável independente recebe também o nome de preditor e é sempre 
apontado no eixo X das abscissas; a variável dependente, que recebe o nome 
de resposta, é sempre plotada no eixo Y das ordenadas.
O que se pode observar inicialmente do gráfico é que a relação entre X e 
Y pode ser aproximada por uma reta que passe pelo “meio” dos pontos, mas 
que não é uma relação perfeita, no sentido de que não é possível construir-
mos uma reta que passe por todos os pontos amostrais. Talvez uma curva 
não linear possa também ser ajustada aos dados. O estudo da escolha da 
forma da curva (ou reta) será feito mais adiante.
Reta de regressão
Para o caso de um modelo de regressão linear simples, o objetivo será o de se 
construiruma reta que “passe pelo meio” dos pontos amostrais através de uma 
expressão determinada pelas estimativas de α e de β no modelo Y = α + βX + ε. 
Essa reta será chamada de reta de regressão e terá como sua expressão analítica a 
forma Ŷ = a + bX, em que o coeficiente linear “a” é o estimador de α, o coeficiente 
angular “b” é o estimador de β e Ŷ (y chapéu), e será o valor da estimativa do 
verdadeiro valor de Y observado na amostra para cada um dos pontos de X. Um 
exemplo da construção da reta de regressão é dado na figura a seguinte.
O significado desses estimadores e a forma de encontrá-los serão estuda-
dos em seguida neste capítulo.
Reta de regressão
0
Fa
tu
ra
m
en
to
 (y
)
0
50
100
150
200
250
2 4 6 8 10 12 14 16
Gastos com p&d (x)
Métodos quantitativos aplicados a negócios.indb 178 28/1/2013 09:21:02
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Análise de regressão e de correlação
179
Construindo a reta de regressão
Como vimos até aqui, um dos objetivos da análise de regressão é a cons-
trução de um modelo matemático que relacione a variável dependente e a va-
riável independente. Se o modelo é o de regressão linear simples, a tarefa é 
determinar a equação da reta que melhor aproxime os pontos observados dos 
dados amostrais. Vale a pena fazer um pequeno estudo da equação de uma 
reta para melhor compreendermos o significado do que iremos construir.
Equação da reta
Uma reta é representada através da função Y = a + bX em que “a” e “b” são, 
respectivamente, o coeficiente linear e o coeficiente angular da reta em questão. 
Suponha que a reta em discussão seja dada pela expressão Y = 2 + X. Então, o 
coeficiente linear da reta é o valor 2 e o coeficiente angular da reta é o valor 1.
Vamos fazer um estudo dessa reta começando por verificar os valores de Y para 
diferentes valores de X. Então, se Y = 2 + X, os valores a seguir são pontos da reta:
X Y
0 2
1 3
2 4
3 5
4 6
O gráfico correspondente a estes valores é:
Reta y = 2 + x
4
3
2
1
0
7
6
5
y
0 1 2 3 4 5
Métodos quantitativos aplicados a negócios.indb 179 28/1/2013 09:21:02
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
180
Análise de regressão e de correlação
Com base nesses dados e no gráfico, podemos analisar agora o significa-
do do coeficiente linear e o significado do coeficiente angular.
O coeficiente linear “a” é o ponto em que a reta corta o eixo Y. Isso ocorre 
para o valor de X = 0. Valores negativos de “a” implicam que a reta cruza o 
eixo Y abaixo da origem enquanto valores positivos de “a” implicam que a 
reta corta o eixo Y acima da origem. 
O coeficiente angular “b” é a inclinação da reta, ou seja, é o valor da tangen-
te do ângulo θ formado pelo eixo X e a reta. Ele representa também a variação 
da variável Y para cada variação de um ponto de X. Se tomarmos um pequeno 
triângulo de base unitária, verificaremos que a altura desse triângulo defini-
do pela reta Y = 2 + X também será unitário. Tomando então a razão entre o 
cateto oposto e o cateto adjacente desse triângulo retângulo, verificaremos 
que a tg θ = 1. Ou seja, a inclinação da reta é igual a 1 e o ângulo correspon-
dente será de 45º. 
Valores positivos de “b” significam que a reta crescerá na medida em que 
X cresce, e valores negativos de “b” significam que a reta decrescerá em Y 
quando X cresce. Ou seja, no primeiro caso a relação entre X e Y é de propor-
cionalidade direta, enquanto no segundo caso a relação entre as variáveis é 
de proporcionalidade indireta.
Significado dos elementos da reta na regressão
Os coeficientes da reta têm a mesma interpretação na regressão que na 
geometria analítica adicionado da interpretação do fenômeno em estudo.
Supondo que a reta construída com os dados dos gastos em p&d versus 
faturamento das empresas fosse a reta estudada acima, Ŷ = 2 + X. Algumas 
conclusões imediatas poderiam ser tomadas, quais sejam:
se o valor de “a” é igual a 2, isso significa que se não houver qualquer �
investimento em p&d, o faturamento esperado será de duas unidades 
monetárias, no nosso caso 2 milhões de reais;
o valor positivo de “a” indica que, se não houver investimento em p&d, �
ainda assim o faturamento será positivo. Um valor negativo de “a” im-
plicaria prejuízo. Vale a pena observar que a interpretação do coefi-
ciente linear pode não ter sentido dependendo do problema tratado;
Métodos quantitativos aplicados a negócios.indb 180 28/1/2013 09:21:03
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Análise de regressão e de correlação
181
para o valor de “b”, no coeficiente angular, teríamos como resultado que �
para cada variação de uma unidade de X teríamos a variação de uma 
unidade em Y. Ou seja, para o investimento de cada real em p&d, o retor-
no em termos de faturamento seria o do acréscimo de mais um real;
como o valor de “b” é positivo, significa que a relação entre as variáveis �
é de proporcionalidade direta, isto é, o aumento do investimento em 
p&d implica aumento do faturamento;
podemos calcular o valor esperado de faturamento (Ŷ) para certo in- �
vestimento em p&d (X). Por exemplo, se aplicarmos três milhões em 
p&d, o faturamento esperado será de Ŷ = 2 + X, ou Ŷ = 2 + 3 = 5, cinco 
milhões de faturamento.
Um pouco mais adiante determinaremos o valor da reta de regressão para 
os dados do problema em questão. Por ora, o objetivo é o de compreender o 
significado da reta de regressão e de seus elementos.
O método dos mínimos quadrados ordinários
No gráfico a seguir verificamos que para cada valor do eixo X (Xi) há um 
correspondente valor de Y (Yi) e um valor de Ŷi. Os valores Yi são os verdadei-
ros valores observados na amostra, os valores de Ŷi são os valores estimados 
pela substituição do valor de Xi na reta de regressão. A diferença entre o valor 
observado e o valor estimado é chamado de erro estatístico ou resíduo. Assim, 
podemos definir cada erro de observação como:
εi = Yi – Ŷi
x
y
y
yi
yi
εi
Métodos quantitativos aplicados a negócios.indb 181 28/1/2013 09:21:03
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
182
Análise de regressão e de correlação
Como a reta de regressão é uma “reta média”, de acordo com o que ve-
remos adiante, a soma dos desvios em relação à reta de regressão é igual a 
zero. Isto é, Σεi = 0. 
O critério dos mínimos quadrados ordinários sugere que a determinação 
da expressão da reta média se dê pela minimização da soma dos quadrados 
dos erros. Ou seja, o critério expresso em termos matemáticos é:
Min Σεi
2
Com esse procedimento, encontra-se a expressão da reta que passa mais 
perto do conjunto dos pontos amostrais.
O processo de minimizar a função Σ(Y – Ŷ)2 = Σ [Y – (a + bX)]2 consiste 
em encontrar as derivadas parciais desta função em relação aos coeficientes 
“a” e “b” e igualar cada expressão resultante a zero. É fácil demonstrar que o 
resultado dessas derivadas parciais será o sistema de duas equações e duas 
incógnitas apresentado a seguir:
ΣY = n a + b ΣX
ΣXY = a ΣX + b ΣX2
Assim, podemos verificar nas equações supracitadas que os valores de ΣY, 
n, ΣX, ΣXY, e ΣX2 podem ser calculados diretamente dos valores da amostra, 
ficando por determinar os valores das incógnitas “a” e “b”, que são os valores 
dos coeficientes da reta Ŷ = a + bX, resolvendo assim o nosso problema.
O último sistema de equações citado pode ser rearranjado de forma a 
facilitar o cálculo de “a” e de “b” através das expressões:
a = Y – bX
( )
( )22
n
 
 −
  =
 
− 
  
∑ ∑∑
∑∑
X Y
XY
b
X
X
n
Embora muitos pacotes estatísticos estejam disponíveis para o cálculo 
direto da reta de regressão e mesmo alguns aplicativos do Excel possam 
Métodos quantitativos aplicados a negócios.indb 182 28/1/2013 09:21:03
Este material é parte integrante do acervo do IESDE BRASIL S.A.,mais informações www.iesde.com.br
Análise de regressão e de correlação
183
calcular a expressão da reta, é conveniente mostrar esse processo para a 
compreensão do engenhoso método de construção da equação da reta de 
regressão a partir dos dados amostrais.
Determinação da equação 
da reta para o problema dos gastos em p&d
A partir dos dados das 15 empresas, vamos determinar através do método 
de mínimos quadrados ordinários a equação da reta que explica a relação 
entre os gastos em planejamento e desenvolvimento (X) e o faturamento de 
empresas de informática (Y).
A tabela a seguir apresenta os cálculos necessários para a determinação 
de “a” e de “b”:
Empresa X Y XY X2 Y2
A 15,00 221,00 3 315,00 225,00 48 841,00
B 8,50 83,00 705,50 72,25 6 889,00
C 12,00 147,00 1 764,00 144,00 21 609,00
D 6,50 69,00 448,50 42,25 4 761,00
E 4,50 41,00 184,50 20,25 1 681,00
F 2,00 26,00 52,00 4,00 676,00
G 0,50 35,00 17,50 0,25 1 225,00
H 1,50 40,00 60,00 2,25 1 600,00
I 14,00 125,00 1 750,00 196,00 15 625,00
J 9,00 97,00 873,00 81,00 9 409,00
K 7,50 53,00 397,50 56,25 2 809,00
L 0,50 12,00 6,00 0,25 144,00
M 2,50 34,00 85,00 6,25 1 156,00
N 3,00 48,00 144,00 9,00 2 304,00
O 6,00 64,00 384,00 36,00 4 096,00
Total 93,00 1 095,00 10 186,50 895,00 122 825,00
Métodos quantitativos aplicados a negócios.indb 183 28/1/2013 09:21:03
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
184
Análise de regressão e de correlação
Assim, os valores de “a” e de “b” são determinados por:
a = Y – bX
1 095
73
15
= = =∑YY
n
93
6,2
15
= = =∑ XX
n
a = 73 – (6,2).b
O cálculo de “a” se completará após o cálculo do valor de b, que é dado por:
( )
( )22
n
 
 −
  =
 
− 
  
∑ ∑∑
∑∑
X Y
XY
b
X
X
n
10 186,5 – 
(93) . (1 095) 
15
b)
895 – 
(93)2
15
b = 10,67054
Retornando ao cálculo de “a”, teremos:
a = 73 – (6,2).(10,67054) = 6,842651
Portanto, a reta de regressão calculada terá a forma:
Ŷ = 6,84 + 10,67 X
A partir da qual se podem fazer predições para o valor do faturamento em 
relação a um dado valor de investimento em p&d, bastando para isso substi-
tuir X pelo valor da aplicação em pesquisa e desenvolvimento. Por exemplo, 
se uma empresa fizer um investimento de R$2 milhões em p&d, deverá ter 
um faturamento de Ŷ = 6,84 + 10,67 . (2) = 28,18, ou R$28.180.000,00. Observe 
que a empresa F que fez um investimento de R$2 milhões teve um fatura-
mento de R$26.000.000,00, bem próximo do esperado.
Métodos quantitativos aplicados a negócios.indb 184 28/1/2013 09:21:03
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Análise de regressão e de correlação
185
Essa diferença entre o valor de faturamento estimado para a firma F e o re-
almente realizado é devida ao acaso. Distorções maiores poderiam acontecer. 
Mais na frente, construiremos intervalos de confiança para essas previsões.
Do modelo ainda podemos concluir que se não houver investimento 
em p&d, uma empresa do ramo deve ter um faturamento aproximado de 
R$6,84 milhões, no caso de X = 0. E ainda, para cada R$1 milhão aplicado 
em pesquisa e desenvolvimento, o retorno esperado no faturamento é de 
R$10,67 milhões.
Pressupostos da análise 
de regressão linear (base teórica do modelo)
Existem fundamentalmente duas razões para se estudar os pressupos-
tos do modelo de regressão linear simples: (I) quando falamos em erro es-
tatístico, reta média, método dos mínimos quadrados ordinários e outros 
termos, que já foram apresentados anteriormente, é necessário que saiba-
mos que há algumas restrições no seu uso. O modelo de regressão é um 
modelo matemático que objetiva descrever um fenômeno real através de 
uma expressão matemática. Naturalmente isso implica em uma simplifica-
ção da realidade e por isso fazemos restrições para que essa simplificação 
funcione matematicamente; (II) a verificação da bondade do ajustamento, 
ou de outra forma, da força de representação do modelo com relação ao 
fenômeno que se está estudando implica, entre outros procedimentos, a 
realização de testes de hipóteses estatísticas, que só podem ser realizados 
se conhecermos a forma da distribuição dos erros e dos valores de Y.
Reta de regressão populacional
O uso de uma variável para predizer os valores de outra variável deve ser 
visto como um problema de inferência estatística. A população consiste de 
todos os pares de observações das variáveis independentes e variável de-
pendente. As estimativas são realizadas através de somente uma amostra 
dessa população. No nosso exemplo selecionamos apenas uma amostra de 
15 empresas de informática que investiram em planejamento e desenvolvi-
mento, mas desejamos fazer predições para todas as empresas com caracte-
rísticas semelhantes e muitas delas não foram contempladas na amostra.
Métodos quantitativos aplicados a negócios.indb 185 28/1/2013 09:21:03
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
186
Análise de regressão e de correlação
O gráfico a seguir mostra a relação entre as duas variáveis envolvidas:
x
y
P(X = x) 
y
A figura mostra que a relação populacional entre as duas variáveis é linear. 
Observe que quando o valor do investimento é igual a R$2 milhões (X = 2), Y 
pode assumir qualquer valor ao longo da reta paralela ao eixo Y. Da mesma 
forma para X = 4 ou para outro qualquer valor.
A reta real passa exatamente pelo ponto que representa a média da distri-
buição de Y quando X assume um particular valor, seja ele 2, 4 ou algum outro 
valor. Esse fato pode ser representado através de uma distribuição condicio-
nal de Y dado um particular X [ f(Y/X = 2) ], cuja média ou esperança matemá-
tica é dada por E(Y/X = 2), justamente o ponto em que a reta corta a paralela 
ao eixo Y. Assim, o fenômeno real pode ser representado por uma série de 
distribuições condicionais paralelas.
Essa reta é então chamada de reta de regressão populacional ou reta de 
regressão verdadeira.
Para cada valor de X temos então uma distribuição de probabilidades 
associada a esse valor, e como toda distribuição de probabilidades ela tem 
uma determinada média e um determinado desvio-padrão (tem também, é 
claro, uma variância associada).
A média pode ser representada por E(Y/X = x) ou μY.X e o desvio-padrão 
pode ser representado por σY.X, cujo quadrado é a variância. 
Métodos quantitativos aplicados a negócios.indb 186 28/1/2013 09:21:03
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Análise de regressão e de correlação
187
A reta Y = α + βX passa então pelos diversos valores das médias das dis-
tribuições e os seus parâmetros populacionais α e β devem ser estimados 
através de dados amostrais.
As distribuições condicionais de probabilidades descrevem a variação de 
Y para cada valor de X. A reta que liga os pontos das médias das distribuições 
μY.X é a reta de regressão populacional que pode ser mais adequadamente 
apresentada como E[Y/X] = α + βX. 
Pressupostos do modelo de regressão linear
Em adição à suposição de relação linear entre as variáveis, as seguintes 
três suposições estão envolvidas no modelo de regressão linear:
(I) os valores de Y são independentes entre si;
(II) as distribuições de probabilidades condicionais de Y dado X são nor-
mais;
(III) os desvios-padrões σY.X são iguais para todos os valores de X.
A primeira suposição significa que existe independência entre as obser-
vações. Isso pode significar, por exemplo, que um baixo valor para Y na pri-
meira observação não implique também em baixo valor de Y na segunda. 
A segunda suposição significa que para cada valor de X estamos assu-
mindo que os valores de Y são normalmente distribuídos em torno de μY.X. 
Como veremos adiante, essa suposição é útil para fazermos declarações de 
probabilidades acerca das estimativas da variável dependente Y.
A terceira suposição implica que existea mesma quantidade de variabili-
dade em torno da reta de regressão para cada valor da variável independen-
te X. Essa característica é chamada de homocedasticidade. Note que somente 
Y é considerada uma variável aleatória enquanto X é considerado como fixo. 
Então, o valor de Y é que está sujeito a erro, uma vez que assumimos que X 
é conhecido. 
Vale a pena observar que nem sempre essas três suposições são encon-
tradas no mundo real. Mas muitas vezes são aproximadamente verdadeiras, 
o que permite o uso do modelo.
Métodos quantitativos aplicados a negócios.indb 187 28/1/2013 09:21:03
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
188
Análise de regressão e de correlação
Verificação da bondade do modelo
Retornamos ao exemplo da aplicação de recursos em p&d e o faturamen-
to de empresas de informática. Até aqui determinamos a equação da reta de 
regressão, verificamos o significado dos coeficientes angular e linear e fize-
mos uma estimativa pontual de valores de faturamento (Y) para um certo 
investimento em p&d (X).
É conveniente neste ponto verificar se o modelo ajustado é adequado para 
descrever a relação entre X e Y. Para esse propósito necessitaremos que os pres-
supostos expostos acima sejam obedecidos. Faremos essa verificação através 
de alguns procedimentos. Calcularemos os coeficientes de determinação e de 
correlação e faremos testes de hipóteses para verificar se o modelo é estatistica-
mente significativo. Testaremos a significância do coeficiente de correlação e do 
coeficiente angular e faremos um teste F para verificar todo o modelo.
Coeficiente de determinação
O cálculo do coeficiente de determinação ou coeficiente de explicação será 
útil para dizer o quanto da variação de Y pode ser explicado pela variação de 
X.
Vamos verificar exatamente de que forma o coeficiente de determinação 
(r2) pode auxiliar na tarefa de verificação da bondade do modelo. A interpre-
tação será feita em termos da variação na variável dependente Y. A figura 
que se segue, em que somente um ponto será considerado, fornece uma 
interpretação gráfica da situação. 
X
Y
Y – Y
Y – Y
YY
Y
Y – Y
Métodos quantitativos aplicados a negócios.indb 188 28/1/2013 09:21:03
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Análise de regressão e de correlação
189
Nesse contexto, três pontos e três distâncias serão considerados. O ponto 
Y é o valor real observado para um determinado X. O ponto Ŷ é o valor da es-
timativa de Y para o valor de X considerado. E o ponto Y é a média dos valo-
res de Y. Se o modelo não fosse significativo, a reta de regressão estaria muito 
próxima da reta Ŷ = Y , paralela ao eixo X. Ou seja, a mudança dos valores de X 
não implicariam mudanças em Y. Esse conceito será reforçado no estudo do 
coeficiente de correlação.
Para o ponto considerado, podemos pensar que a variação total (Y – Y) é 
a soma das parcelas correspondentes à variação devida à regressão (Ŷ – Y) 
e a variação devida ao acaso (Y – Ŷ).
A variação devida à regressão ou explicada pela regressão pode ser ex-
pressa pela diferença (Ŷ – Y) porque, se não houvesse regressão, o valor de Ŷ 
seria a própria média de Y, Y .
A variação devida ao acaso é o erro estatístico ou resíduo, conforme 
já apresentado anteriormente. Se o modelo fosse determinístico, todos os 
pontos estariam sobre a reta de regressão e Y seria igual a Ŷ, de forma que a 
diferença Y – Ŷ seria igual a zero.
Se considerarmos todos os pontos amostrais, poderíamos estabelecer 
então a seguinte relação:
∑(Y – Y)2 = ∑ (Ŷ – Y)2 + ∑(Y – Ŷ)2
Variação total, variação explicada e variação não explicada.
A razão 
( )
( )
2
2
ˆ −
−
∑
∑
Y Y
Y Y
, entre a variação explicada pela regressão e a variação 
total, é a proporção da variação que é explicada pelo modelo. Esse valor é 
conhecido como coeficiente de explicação ou coeficiente de determinação. 
r2 = Variação explicada
Variação total
 = ∑ (Ŷ – Y)
2 
∑(Y – Y)2 
Pode-se observar que r2 varia de zero até um. 
Se não houver regressão, todos os pontos estimados estarão sobre a reta 
Y e, portanto, a soma Σ (Ŷ – Y)2 será igual a zero. Se o denominador for igual 
Métodos quantitativos aplicados a negócios.indb 189 28/1/2013 09:21:04
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
190
Análise de regressão e de correlação
a zero, significa que r2 também será igual a zero. Neste caso, a variação total 
será igual somente à variação não explicada. Ou, ainda, qualquer variação na 
observação de Y será devida ao acaso e, portanto, o modelo matemático não 
explicará nada. Esse é o menor valor possível para r2. O modelo explica zero 
por cento da variação de Y.
Por outro lado, se todos os pontos de Y observados estiverem sobre a 
reta, não há nenhuma variação devida ao acaso. Toda variação é explicada 
pelo modelo e nesse caso a variação explicada é igual à variação total e assim 
r2 = 1. Ou seja, 100% da variação total é devida à regressão.
Uma forma simplificada de realizar esse cálculo é através da expressão:
( )
( )
2
2
22
 + − =
 − 
∑ ∑
∑
a Y b XY n Y
r
Y n Y
No nosso exemplo,
é ù+ê úë û= = =
é ùê úë û
2
2
2
(6,84).(1 095) (10,67).(10 186,5) - (15).(73) 36 244,75
r 0,845
42 890(122 825) - (15).(73)
Assim, concluímos que 84,5% da variação de Y (faturamento) é explica-
da por X (gastos em p&d). Os outros 15,5% da variação do faturamento são 
explicados por outras variáveis, como investimento em propaganda, con-
corrência de empresas estrangeiras etc. Podemos também afirmar que o 
modelo de regressão construído tem alto poder de explicação. Esta última 
afirmação pode ser confirmada através da Análise de Correlação e da testa-
gem de hipóteses que serão feitas na sequência.
Quando a população é pequena, o coeficiente de determinação pode ser 
afetado pelo tamanho da amostra. Nesse caso, sugere-se o cálculo do coe-
ficiente de determinação ajustado. Lembrar que uma regressão realizada so-
mente com dois pontos amostrais terá sempre coeficiente de determinação 
igual a 1.
A expressão para o cálculo do coeficiente de determinação ajustado é 
dada a seguir:
Métodos quantitativos aplicados a negócios.indb 190 28/1/2013 09:21:04
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Análise de regressão e de correlação
191
( )
( )
*2 211 1
2
 −
 = − −   − 
n
r r
n
( )
( )
*2 211 1
2
 −
 = − −   − 
n
r r
n
.
 
No nosso problema, o valor do coeficiente de determinação ajustado é igual 
a 0,833, que não difere de forma substancial do primeiro valor encontrado.
Coeficiente de correlação
O coeficiente de correlação é uma medida da relação entre as variáveis X e 
Y. Ele varia entre os valores –1 e 1, passando pelo zero. 
Se não existe correlação entre as variáveis X e Y, o coeficiente de corre-
lação será igual a zero. Se a relação entre X e Y for perfeita, isto é, se todos 
os pontos amostrais estiverem sobre a reta de regressão, o coeficiente de 
variação terá valor igual a 1, no caso de a correlação ser perfeita e positiva, 
ou seja, se o crescimento de X implicar crescimento de Y e será igual a –1 
se a correlação perfeita for negativa, ou seja, o crescimento de X implica em 
decrescimento de Y.
No caso da correlação igual a zero, não haverá tendência da reta, ela será 
paralela ao eixo X. O diagrama de dispersão se constituirá de uma nuvem 
de pontos em torno da reta de regressão paralela ao eixo X, conforme o 
seguinte gráfico.
Métodos quantitativos aplicados a negócios.indb 191 28/1/2013 09:21:04
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
192
Análise de regressão e de correlação
Se a correlação for perfeita e positiva, o coeficiente de correlação será 
igual a 1.
Se a correlação for perfeita e negativa, o coeficiente de correlação seráigual a –1.
O que ocorre na prática, no entanto, é que o coeficiente de correlação 
assume valores intermediários entre os extremos expostos acima. Não há uma 
regra única para se avaliar a força da relação através do coeficiente de correla-
ção. No entanto, há indicativos que podem orientar a decisão sobre a força de 
uma relação. Uma proposta bem aceita é a presente na seguinte tabela:
Coeficiente de correlação (r) Força da relação
r = 0 Não há correlação
0 < |r| ≤ 0,5 Correlação fraca
0,5 < |r| ≤ 0,75 Correlação moderada
0,75 < |r| ≤ 0,9 Correlação forte
Métodos quantitativos aplicados a negócios.indb 192 28/1/2013 09:21:04
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Análise de regressão e de correlação
193
Coeficiente de correlação (r) Força da relação
0,9 < |r| < 1 Correlação muito forte
r =1 Correlação perfeita
Os gráficos a seguir apresentam algumas das situações expostas na tabela:
Correlação forte e negativa
Correlação forte e positiva
Correlação não linear
Métodos quantitativos aplicados a negócios.indb 193 28/1/2013 09:21:04
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
194
Análise de regressão e de correlação
Correlação fraca e positiva
Como vimos, o coeficiente de correlação pode ser calculado como a raiz 
quadrada do coeficiente de determinação. Uma outra forma de determinar di-
retamente o valor do coeficiente de correlação é através da expressão:
( ) ( )
( ) ( ) ( ) ( )
  
 −      =
− −
∑ ∑∑
∑ ∑∑ ∑
2 2
2 2
X . Y
XY
n
r
X Y
X Y
n n
Uma forma tecnicamente mais avançada para verificar se existe relação 
entre as variáveis em estudo é através da realização de um teste de hipóte-
ses sobre o coeficiente de correlação populacional representado pela letra 
grega ro (ρ). O coeficiente de correlação amostral é r.
As hipóteses nula e alternativa podem ser expressas como segue:
H0: ρ = 0 (não há correlação linear significativa)
H1: ρ ≠ 0 (correlação linear significativa)
A estatística do teste é dada por:
( )
( )
21
2
=
−
−
r
t
r
n
que tem distribuição “t” de Student com n-2 graus de liberdade.
Métodos quantitativos aplicados a negócios.indb 194 28/1/2013 09:21:04
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Análise de regressão e de correlação
195
Para o problema do investimento em planejamento e desenvolvimento 
em estudo neste capítulo, verificamos que o valor do coeficiente de corre-
lação é de 0,919, portanto, um valor que revela uma relação positiva e forte 
entre as variáveis em estudo. Uma observação importante a ser feita neste 
ponto é o de que o sinal do coeficiente angular tem que ser o mesmo do 
coeficiente de correlação. Neste caso, ambos positivos indicando uma cor-
respondência direta entre as variáveis investimento em p&d e faturamento 
de empresas de informática.
A estatística do teste de significância para o coeficiente de correlação é:
( )
( )
0,919
8, 42
1 0,845
15 2
= =
−
−
t
Esse valor de “t”, com 13 graus de liberdade, está associado a um nível de 
significância de 0,0000013. Ou seja, podemos afirmar com nível de confiança 
de praticamente 100% que o coeficiente de correlação é diferente de zero, 
ou ainda, a correlação entre as variáveis X e Y é altamente significativa.
Uma observação de ordem teórica importante deve ser feita nesse ponto. 
Embora na regressão somente a variável Y seja uma variável aleatória, por-
tanto X é fixo, na Análise de Correlação supõe-se que ambas as variáveis 
sejam variáveis aleatórias. Se X de fato é fixado de antemão, não se aplica 
essa testagem de hipóteses e a avaliação deve ser feita somente para o valor 
de r e de r2. 
Um outro alerta deve ser feito: a testagem de hipóteses para o coeficiente 
de correlação é feita somente para a hipótese ρ = 0, que pode ser bilateral 
ou unilateral, mas não pode ser feita para qualquer outro valor diferente de 
zero. Assim, muitas vezes o teste resulta em significância do coeficiente de 
correlação, mas ele pode ainda ser fraco e, portanto, dependendo de sua 
dimensão, vale a pena fazer a análise somente através do coeficiente de 
determinação.
Teste de hipóteses 
para o coeficiente angular da reta (β)
Para que o modelo de regressão seja significativo, o ângulo entre a reta de 
regressão e o eixo X tem que ser bem maior do que zero, ou, de outra forma, a 
Métodos quantitativos aplicados a negócios.indb 195 28/1/2013 09:21:04
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
196
Análise de regressão e de correlação
sua tangente representada pelo coeficiente angular tem que ser bem maior 
que zero. Vimos que quando a reta de regressão é paralela ao eixo X não há 
correlação entre as variáveis independente e dependente, isto é, a variação 
dos valores de X não implica nenhuma ou pouca variação dos valores de Y.
Dessa forma, uma maneira de verificar se o modelo de regressão é signifi-
cativo é através da verificação da seguinte hipótese estatística:
H0: β = 0 
H1: β ≠ 0 
A estatística associada a esse teste é:
( )−=
b
b
t
S
β
Esta tem distribuição “t” de Student com n – 2 graus de liberdade, em que Sb 
é o erro-padrão da estimativa do coeficiente de regressão e é dado por:
( )2
S
=
−∑
Y,X
bS
X X
E Sy.x, o desvio-padrão dos resíduos é o estimador de σY.X, o desvio-padrão 
da reta de regressão populacional. Sy.x é o erro-padrão da estimativa da vari-
ância condicional dos valores de Y em torno da reta de regressão populacio-
nal. Sua expressão é:
2ˆ( )
2
−
=
−
∑
Y,X
Y Y
S
n
Ou de uma forma mais simples de cálculo:
2
2
 − − =
−
∑ ∑ ∑
Y,X
Y a Y b XY
S
n
Métodos quantitativos aplicados a negócios.indb 196 28/1/2013 09:21:05
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Análise de regressão e de correlação
197
É importante distinguir a diferença entre SY.X de SY e de SX. O SY.X diz respei-
to à dispersão dos dados em relação à reta de regressão e, portanto, envolve as 
duas variáveis Y e X. A soma Σ(Y –Ŷ)2, pode ser expressa como Σ(Y – (a + bX))2 
uma vez que Ŷ = a + bX.
Já SY diz respeito à dispersão dos valores de Y em torno de sua média e sua 
expressão é:
( )2
1
−
=
−
∑
Y
Y Y
S
n
Da mesma forma, SX diz respeito à dispersão dos valores de X em torno de 
sua média e sua expressão é:
( )2
1
−
=
−
∑
X
X X
S
n
Para o problema do investimento em p&d buscaremos investigar se o 
modelo proposto é significativo através do teste de hipóteses apresentado 
anteriormente:
H0: β = 0 
H1: β ≠ 0 
Através da estatística:
( )−=
b
b
t
S
β
Como vimos, a estatística acima tem distribuição “t” de Student com 
(n–2) graus de liberdade.
Para determinação de “t”, devemos calcular o valor de Sb:
( )2 2 2n( )
= =
−− ∑∑
Y,X Y,X
b
S S
S
X XX X( )2 2 2n( )
= =
−− ∑∑
Y,X Y,X
b
S S
S
X XX X( )2 2 2n( )
= =
−− ∑∑
Y,X Y,X
b
S S
S
X XX X .
Onde,
2
2
 − − =
−
∑ ∑ ∑
Y,X
Y a Y b XY
S
n
Métodos quantitativos aplicados a negócios.indb 197 28/1/2013 09:21:06
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
198
Análise de regressão e de correlação
Retomando os dados originais, temos:
Empresa X Y XY X2 Y2
A 15,00 221,00 3 315,00 225,00 48 841,00
B 8,50 83,00 705,50 72,25 6 889,00
C 12,00 147,00 1 764,00 144,00 21 609,00
D 6,50 69,00 448,50 42,25 4 761,00
E 4,50 41,00 184,50 20,25 1 681,00
F 2,00 26,00 52,00 4,00 676,00
G 0,50 35,00 17,50 0,25 1 225,00
H 1,50 40,00 60,00 2,25 1 600,00
I 14,00 125,00 1 750,00 196,00 15 625,00
J 9,00 97,00 873,00 81,00 9 409,00
K 7,50 53,00 397,50 56,25 2 809,00
L 0,50 12,00 6,00 0,25 144,00
M 2,50 34,00 85,00 6,25 1 156,00
N 3,00 48,00 144,00 9,00 2 304,00
O 6,00 64,00 384,00 36,00 4 096,00
Total 93,00 1 095,00 10 186,50 895,00 122 825,00
1 095
73
15
= = =∑YY
n
93
6,215
= = =∑ XX
n
a = 6,842651
b = 10,67054 
Métodos quantitativos aplicados a negócios.indb 198 28/1/2013 09:21:06
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Análise de regressão e de correlação
199
Assim,
122 825 (6,842651).(1 095) (10,67054)(10 186,5)
510,53 22,59483
15 2
− −= = =
−Y,X
S
122 825 (6,842651).(1 095) (10,67054)(10 186,5)
510,53 22,59483
15 2
− −= = =
−Y,X
S
122 825 (6,842651).(1 095) (10,67054)(10 186,5)
510,53 22,59483
15 2
− −= = =
−Y,X
S
122 825 (6,842651).(1 095) (10,67054)(10 186,5)
510,53 22,59483
15 2
− −= = =
−Y,X
S .
= =
− 2
22,5949
1,266
895 15.(6,2)
bS
10,67054
8, 427
1,266
= =t
O nível de significância (p – valor) correspondente a t = 8,427 com 13 
graus de liberdade é igual a 0,00000126, altamente significativo.
Concluímos, então, com 99,99% de confiança, que o modelo proposto 
representa bem a relação entre as variáveis investimento em p&d e fatura-
mento de empresas de informática.
Complementarmente podemos construir um intervalo de confiança para 
o parâmetro β, escolhendo o nível de confiança e o valor de “t” associado a 
esse nível fazendo b ± t Sb.
Se quisermos construir um intervalo de confiança de 95% para β, verifica-
mos que para 13 graus de liberdade o valor de t será igual a 2,16, obtemos para 
b ± t Sb os valores 10,67 ± (2,16)(1,266) =10,67 ± 2,74. Assim, temos então uma 
confiança de 95% que o verdadeiro valor de β estará entre 7,93 e 13,41.
Análise de variância da regressão
Um procedimento semelhante a testar a significância de β no modelo de 
regressão linear simples é a realização da Análise de Variância da Regressão, 
que consiste fundamentalmente em trabalhar com o modelo de variações 
dado pela expressão a seguir, já estudada no contexto do coeficiente de 
determinação:
( ) ( ) ( )2 22 ˆ ˆ− = − + −∑ ∑ ∑Y Y Y Y Y Y
Métodos quantitativos aplicados a negócios.indb 199 28/1/2013 09:21:07
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
200
Análise de regressão e de correlação
Variação total/variação explicada/variação não explicada
Fonte de 
variação
Graus de 
liberdade
Soma de 
quadrados
Quadrados 
médios Estatística F
Modelo 1 ( )−∑ 2Ŷ Y −∑
2ˆ( )
1
Y Y Q.M. Modelo
Q.M. Resíduo
Resíduo n – 2 ( )−∑ 2ˆY Y −∑
−
2ˆ( )
2
Y Y
n
Total n – 1 ( )−∑ 2Y Y
Os graus de liberdade do modelo correspondem ao número de variáveis 
independentes (no caso da regressão linear simples, um só X). Os graus de 
liberdade total são sempre iguais a n – 1 e o do resíduo é a diferença entre o 
g.l. total e g.l. do modelo.
Substituindo os valores derivados dos dados na tabela, teremos:
Fonte de 
variação
Graus de 
liberdade
Soma de 
quadrados
Quadrados 
médios Estatística F
Modelo 1 36 253,16 36 253,16 71,011
Resíduo 13 6 636,84 510,53
Total 14 42 890,00
O nível de significância da estatística F para 1 e 13 graus de liberdade é de 
0,00000126. Altamente significativo. Então o teste F para o modelo conduz 
à conclusão de que o modelo como um todo explica muito bem a relação 
entre as duas variáveis consideradas.
Nesse ponto, algumas observações são pertinentes:
o nível de significância para o teste “t” para o parâmetro β (0,00000126) �
é exatamente igual ao nível de significância para o teste “F” da Análise 
de Variância;
o valor de F = 71,011 é o quadrado do valor de t = 8,427. Isso sempre �
ocorre na regressão linear simples. Este é um resultado teórico de ope-
rações entre distribuições de probabilidade, cuja complexidade está 
fora do contexto do presente livro;
Métodos quantitativos aplicados a negócios.indb 200 28/1/2013 09:21:07
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Análise de regressão e de correlação
201
o valor do Quadrado Médio do Resíduo, 510,53 é igual ao quadrado �
do valor do quadrado do erro-padrão da estimativa SY,X = 22,59483. 
Esse resultado não é coincidência. O quadrado de SY,X é a estimativa 
da variabilidade total.
Predição e intervalos de predição
Como vimos anteriormente, a reta de regressão é um instrumento útil 
para se fazer predições. Ou seja, podemos, através da substituição de va-
lores de X na equação da reta Ŷ = a + bX, fazer previsões para valores da 
variável dependente Y. No exemplo das empresas de informática, podemos 
fazer predições de faturamento tendo em conta os investimentos em pes-
quisa e desenvolvimento.
Como trabalhamos em um ambiente de incerteza, a estimativa pontual não 
é uma informação suficiente. Em torno dos valores estimados pontualmente 
devemos construir intervalos nos quais os parâmetros devam pertencer.
Duas situações então são postas. A primeira diz respeito à construção 
de um intervalo de confiança para a média populacional do faturamento das 
empresas de informática e a segunda, à construção de um intervalo de con-
fiança para uma empresa individual. A diferença é que na primeira estimativa 
estamos preocupados com o faturamento médio de empresas que investem 
certo valor fixado em p&d. No segundo caso, o foco é para uma particular 
empresa.
Intervalo de confiança da 
estimativa da média populacional
Assumindo que a variável dependente é normalmente distribuída, pode-
mos calcular os limites superior e inferior de um intervalo de confiança para a 
média de Y através de:
± YY tS
Em que = YY
S
S
n
 e “t” é o valor da estatística da distribuição “t” de Student 
com n – 1 graus de liberdade.
Métodos quantitativos aplicados a negócios.indb 201 28/1/2013 09:21:07
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
202
Análise de regressão e de correlação
O valor de SY é dado pela expressão 
2( )
1
−
=
−
∑
Y
Y Y
S
n
, conforme visto 
anteriormente. Esse valor pode ser calculado mais facilmente através da
expressão 
−
=
−
∑ 2 2( )
1Y
Y n . Y
S
n
.
No exemplo das empresas de informática, temos:
Ybarra = 73
−= =
212 2825 15.(73)
55,34954
14Y
S
Em que 55,34954 14,29
15
= = =YY
S
S
n
T13g.l. = 2,160
O intervalo de confiança de 95% será então:
73 ± (2,160) . (15,3512) = 73 ± 33,16
Os limites inferior e superior para a predição da média serão, respectiva-
mente, 39,84 e 106,16. O valor médio esperado de faturamento será de R$73 
milhões, podendo-se afirmar com 95% de confiança que esse valor não será 
inferior a R$39,84 milhões nem superior a R$106,16 milhões.
Se substituirmos em Ŷ = 6,842651 + 10,67054X a reta de regressão X pelo 
valor de sua média X , teremos Ŷ = 6,842651 + (10,67054)(6,2) = 73. Esse fato 
decorre da propriedade que a reta de regressão passa pelo ponto (X , Y).
Esses são os limites da previsão média de faturamento para todas as em-
presas do setor. 
Mas se um grupo de empresas investe em p&d um outro valor de X0, diga-
mos R$2 milhões, ou se uma empresa investe em média esse valor, o interva-
lo de confiança para o seu faturamento será dado por:
Ŷ ± t SŶ
Em que o erro-padrão da estimativa SŶ, será dado por:
( )  + −  
=
−∑
2
ˆ 2
1
.
( )
0
Y,XY
X X
nS S
X X
Métodos quantitativos aplicados a negócios.indb 202 28/1/2013 09:21:08
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Análise de regressão e de correlação
203
Aplicando os valores do problema das firmas de informática para X0 = 2 
nessas expressões, obteremos:
Ŷ = 6,842651 + 10,67054X = Ŷ = 6,842651 + 10,67054.(2) = 28,18373
Uma vez que SY,X = 22,59483 e que SŶ pode ser expresso pela expressão 
mais conveniente:
( )  + −  
=
 − ∑
2
ˆ 2 2
1
( )
0
Y,XY
X X
nS S
X n . X
Temos que:
( )  + −  
= =
 − 
2
ˆ 2
1
2 6,2
1522,59483. 5,328328
895 (15) . (6,2)Y
S
Sabendo que t13g.l. = 2,160, o intervalo de confiança de faturamento para a 
média de investimento de R$2 milhões, terá como limites inferior e superior 
os seguintes valores:
 Limite inferior será igual a 28,18 – (2,160) . (6,64) = 28,18– 14,34 = 
13,84, e o limite superior será igual a 28,18 + (2,160) . (6,64) = 28,18 + 
14,34 = 42,52.
Concluímos, então, que em média o faturamento das empresas que in-
vestirem R$2 milhões em p&d será de aproximadamente R$28,18 milhões, e 
ainda podemos afirmar com 95% de confiança que esse valor não será infe-
rior a R$13,84 milhões nem superior a R$42,52 milhões.
Intervalo de confiança 
da estimativa de um valor individual de Y
Se estivermos interessados na estimativa de faturamento de uma única 
empresa que aplicou R$2 milhões em p&d, a forma de determinar o intervalo 
de confiança muda um pouco. Na realidade, o que muda no procedimento é 
o cálculo do erro-padrão da estimativa, que será dado por:
Métodos quantitativos aplicados a negócios.indb 203 28/1/2013 09:21:08
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
204
Análise de regressão e de correlação
( )2
ˆ 2
1
1
( )
 + + −  
=
−∑
0
Y,XY individual
X X
nS S
X X
 No nosso problema:
( ) + + −  
= =
 − 
2
ˆ 2
1
1 2 6,2
1522,59483. 5, 4767
895 15.(6,2)Y
S
Mais uma vez utilizando t13g.l. = 2,160, o intervalo de confiança de fatu-
ramento de uma empresa individual para um investimento de R$2 milhões 
terá como limites inferior e superior os seguintes valores:
 Limite inferior será igual a 28,18 – (2,160) . (5,4767) = 28,18 – 11,83 = – 
16,35, e o limite superior será igual a 28,18 + (2,160) . (5,4767) = 28,18 + 
11,83 = 40,01.
Observe que o intervalo de confiança para a estimativa do faturamento 
de uma empresa individual é muito mais extenso do que o intervalo para a 
estimativa da média do investimento, isso porque para a média de investi-
mento temos mais informação do que no caso de uma empresa individual.
O gráfico a seguir ilustra as duas situações.
x
média uma empresa
y
y
Atividades de aplicação
1. Uma cadeia de supermercados financiou um estudo dos gastos com 
mercadorias para famílias de quatro pessoas. A pesquisa se limitou a 
famílias com renda entre R$10.000,00 e R$20.000,00. Obteve-se a se-
guinte equação:
Y = –400 + 0,10X
Métodos quantitativos aplicados a negócios.indb 204 28/1/2013 09:21:08
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Análise de regressão e de correlação
205
 Suponha que a equação proporcione um ajustamento razoavelmente 
bom e que os dados tenham sido obtidos por métodos de amostra-
gem aleatória.
a) Estime a despesa de uma família de quatro pessoas com renda 
anual de R$15.000,00.
b) Um dos vice-presidentes da empresa ficou intrigado com o fato de 
a equação aparentemente sugerir que uma família com R$4.000,00 
de renda não gaste nada em mercadorias. Qual a explicação?
2. Uma determinada ação apresentou o seguinte comportamento du-
rante a última semana:
Preço 21,00 20,94 20,78 20,56 20,49
Dia Seg Ter Qua Qui Sex
a) Ajuste a equação de regressão linear para o valor da ação no de-
correr da semana.
b) Determine estatisticamente qual o valor da ação para a terça-feira 
da próxima semana.
3. Uma empresa, estudando como varia a demanda de certo produto (em 
unidades) em função do preço de venda (em R$), obteve a seguinte equa-
ção: Ŷ = 1 028,07 – 2,90X . Por meio dessa informação, deseja-se saber:
a) Qual a influência do preço sobre a demanda, ou seja, o que ocorre 
com a demanda a cada R$1,00 de aumento no preço?
b) Ao preço atual de venda, a quantidade mensal absorvida pelo mer-
cado é de 80 unidades menos que a capacidade atual de produção 
da empresa. Estime em quanto deve ser reduzido o preço de ven-
da para que a empresa possa utilizar toda a capacidade total.
4. Um jornal quer verificar a eficácia de seus anúncios na venda de carros 
usados. A tabela a seguir mostra o número de anúncios publicados e o 
correspondente número de carros vendidos por seis companhias que 
usaram apenas esse jornal como veículo de propaganda.
Métodos quantitativos aplicados a negócios.indb 205 28/1/2013 09:21:09
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
206
Análise de regressão e de correlação
Companhia A B C D E F
Anúncios 74 45 48 36 27 16
Carros vendidos 139 108 98 76 62 57
a) Ajuste a equação de regressão para o modelo.
b) Interprete o coeficiente de explicação R2.
c) Para uma venda de 200 carros, quantos anúncios devem ser feitos, 
segundo o modelo? 
d) Como você argumentaria com a companhia F para que ela aumen-
tasse o número de anúncios?
5. Num estudo realizado com famílias domiciliadas em São Paulo, veri-
ficou-se, para as variáveis gastos com seguro de vida e número de fi-
lhos, uma correlação 0,92. Essa informação indica que:
a) a correlação é forte entre os gastos com seguro e o número de filhos.
b) a correlação é negativa entre os gastos com seguro e o número 
de filhos.
c) não há correlação entre os gastos com seguro e o número de filhos.
d) a correlação é moderada entre os gastos com seguro e o número 
de filhos.
6. Uma grande rede de supermercados deseja determinar o efeito de 
uma promoção sobre a concorrência relativa. Para isso, obteve dados 
de 15 estados sobre as despesas de promoções relativas de um con-
corrente vulto (despesas do concorrente = 100) e sobre as vendas des-
se concorrente (vendas do concorrente = 100).
a) Você deve informar ao gerente se há alguma relação entre as des-
pesas promocionais relativas e as vendas relativas.
b) Ajuste a equação de regressão das vendas com as despesas pro-
mocionais.
c) Se a companhia igualasse o concorrente em termos de despesas 
promocionais (se as despesas promocionais fossem 100), qual se-
ria a venda relativa da companhia?
d) Interprete o r2 resultante. 
Métodos quantitativos aplicados a negócios.indb 206 28/1/2013 09:21:09
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Análise de regressão e de correlação
207
Tabela 1 – Despesa promocional relativa e vendas relativas por estado
Estado Despesa promocional relativa Vendas relativas
1 95 98
2 92 94
3 103 110
4 115 125
5 77 82
6 79 84
7 105 112
8 94 99
9 85 93
10 101 107
11 106 114
12 120 132
13 118 129
14 75 79
15 99 105
Gabarito
1.
a) Substituindo X por 15 000 teremos que Y = –400 + 0,10(15 000), 
em que Y = 1 100.
b) A explicação é dada pelo fato de o estudo não ter contemplado 
esse público em sua amostra. Logo, essa equação não cabe para 
qualquer tipo de previsão ou estimativa desse público.
2.
a) Desejamos ajustar a equação linear do modelo Ŷ = α + bX em que 
Métodos quantitativos aplicados a negócios.indb 207 28/1/2013 09:21:09
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
208
Análise de regressão e de correlação
 α – Y – b X e 
2
2
( . )
n
( )
X
X Y
XY
b
X
n
 Σ Σ Σ −    =
  ΣΣ −  
  
. Obtendo os somatórios, 
 temos a seguinte tabela: 
Y (Preço) X (Dia) XY X2
21,00 1 21,00 1
20,94 2 41,88 4
20,78 3 62,34 9
20,56 4 82,24 16
20,49 5 102,45 25
103,77 15 309,91 55
 Logo, teremos X = 3 e Y = 20,75 e sendo assim:
 
2
2
( . )
n
( )
 Σ Σ Σ −    =
  ΣΣ −  
  
X Y
XY
b
X
X
n
∴ 
2
(15).(103,77)
309,91
5
(15)
55
5
  −    =
  
−  
  
b = – 0,14, e:
 α = Y – b X ∴ α = 20,75 – (–0,14).(3) ∴ α = 21,17.
 Sendo assim, a equação de regressão linear será:
 Ŷ = 21,17 – 0,14 . X
b) A próxima terça-feira corresponderá a X = 7 (considera-se apenas 
os dias úteis), logo: Ŷ = 21,17 – 0,14 . (7) ∴ Ŷ = 20,19
3.
a) A cada R$1,00 de aumento, a demanda decresce em 2,90 unidades 
(valor de b).
b) Se, com o preço atual, a empresa coloca 80 unidades menos no 
mercado e se, a cada R$1,00 de redução no preço, a demanda au-
menta em 2,9 unidades, logo, o valor de redução será a razão entre 
80
R$ 27,59
2,90
= .
Métodos quantitativos aplicados a negócios.indb 208 28/1/2013 09:21:09
Este material é parteintegrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Análise de regressão e de correlação
209
4.
a) A equação de regressão será dada por Ŷ = a + bX em que:
 a = Y – b X e 
2
2
( . )
( )
 Σ Σ Σ −    =
  ΣΣ −  
  
X Y
XY
nb
X
X
n 
 Através dos somatórios apresentados na tabela a seguir, calcula-
mos as estimativas dos parâmetros da equação:
X Y XY X2 Y2
74 139 10 286 5 476 19 321
45 108 4 860 2 025 11 664
48 98 4 704 2 304 9 604
36 76 2 736 1 296 5 776
27 62 1 674 729 3 844
16 57 912 256 3 249
246 540 25 172 12 086 53 458
 Sendo assim, X = 4 e Y = 41 ∴ 2
2
( . )
n
( )
 Σ Σ Σ −    =
  ΣΣ −  
  
X Y
XY
b
X
X
n
 
 Logo, 
  −    =
  
−  
  
2
(246).(540)
25 172
6
(246)
12 086
6
b em que b = 1,516 e a = 90 – 1,516.(41)
 a = 27,84. Portanto, a equação de regressão será: Ŷ = 27,84 + 1,515 . X
b) O valor de r2 será obtido por 
2
2
2 2
Y XY (Y)
Y (Y)
Σ + Σ −=
Σ −
a b n
r
n
 em que:
 
+ −= =
−
2
2
2
(27,84).(540) (1,516).(25 172) 6.(90)
0,9457
53 458 6.(90)
r . Significa que 
 o número de anúncios explica 94,57% da variação das vendas 
dos automóveis, restando 5,43% para outros fatores não inseri-
dos no modelo. 
Métodos quantitativos aplicados a negócios.indb 209 28/1/2013 09:21:10
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
210
Análise de regressão e de correlação
c) Para uma venda Y = 200, qual a estimativa de anúncios (X)? Então, 200 
= 27,84 + 1,516 . X.
 Sendo assim, 200 27,84
1,516
−=X = 113,56 114
d) O argumento básico é que nesse caso cada um anúncio de acrésci-
mo impactará num aumento de 1,516 carros vendidos. 
5. a) A correlação é forte entre os gastos com seguro e o número de 
filhos.
6.
a) Nesse caso, o coeficiente de correlação é a medida adequada para 
obter essa informação. Sendo assim, o cálculo de r é dado por 
2 2
2 2
( )( )
n
( ) ( )
Σ Σ Σ −  =
   Σ ΣΣ − Σ −   
   
X Y
XY
X Y
X Y
n n
r
 Determinando os somatórios, temos a seguinte tabela: �
X Y XY X2 Y2
95 98 9 310 9 025 9 604
92 94 8 648 8 464 8 836
103 110 11 330 10 609 12 100
115 125 14 375 13 225 15 625
77 82 6 314 5 929 6 724
79 84 6 636 6 241 7 056
105 112 11 760 11 025 12 544
94 99 9 306 8 836 9 801
85 93 7 905 7 225 8 649
101 107 10 807 10 201 11 449
106 114 12 084 11 236 12 996
Métodos quantitativos aplicados a negócios.indb 210 28/1/2013 09:21:10
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Análise de regressão e de correlação
211
X Y XY X2 Y2
120 132 15 840 14 400 17 424
118 129 15 222 13 924 16 641
75 79 5 925 5 625 6 241
99 105 10 395 9 801 11 025
1464 1563 155 857 145 766 166 715
 Logo, substituindo os valores na expressão, temos que:
 
2 2
(1 464).(1 563)
155 857
15
(1 464) (1 563)
145 766 . 166 715
15 15
r
 −  =
   
− −   
   
 ∴ r = 0,9935
 Portanto, existe uma forte correlação positiva entre as despesas 
promocionais relativas e as vendas relativas.
b) Sendo X = 97,6 e Y = 104,2, temos que: 
 
2
(1 464).(1 563)
155 857
15
(1 464)
145 766
15
b
 −  =
 
− 
 
 em que b = 1,149 e
 
 a = 104,2 – 1,149.(97,6) ∴ a = –7,942
 Portanto, a equação de regressão é Ŷ = –7,942 + 1,149 . X
c) Sendo X = 100, temos que Ŷ = –7,942 + 1,149 . (100) em que Ŷ = 
106,958 ≅ 107
d) O valor de r2 será obtido pelo quadrado do valor do coeficiente de 
correlação, logo:
 r
2 = (0,9935)2 = 0,987
 Portanto, os gastos promocionais relativos explicam 98,7% das 
despesas promocionais relativas, restando 1,3% para outros fato-
res não contemplados.
Métodos quantitativos aplicados a negócios.indb 211 28/1/2013 09:21:11
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Teoria da decisão
Problema
A empresa ABC está fabricando um novo equipamento que deseja dispo-
nibilizar para o mercado. É sabido que o investimento em propaganda pode 
trazer um grande retorno se a vendagem do produto for alta. No entanto, o 
investimento tem um custo elevado e se a quantidade vendida do produto 
não for alta, esse investimento em propaganda pode trazer prejuízo para a 
empresa. A questão colocada para a diretoria é se ela deve ou não proceder 
ao investimento em propaganda.
Duas ações, então, são possíveis de serem tomadas. A primeira é não in-
vestir em propaganda e a segunda é realizar o investimento. Uma pesquisa 
extensiva foi realizada e os cenários que foram apresentados para a diretoria 
representavam três possibilidades de venda (forte, moderada e fraca). Os re-
sultados financeiros podiam variar como segue.
No caso de investimento em propaganda, se as vendas do novo produ-
to forem fortes, o retorno financeiro pode chegar a R$90.000,00 por mês. Se 
as vendas forem moderadas, o retorno pode chegar a R$30.000,00 e se as 
vendas forem fracas a empresa, pode ter um prejuízo de R$4.000,00. Na hipó-
tese de não se fazer o investimento em propaganda, os retornos esperados 
para as três situações de venda serão R$60.000,00, R$10.000,00 e R$2.000,00, 
dependendo de as vendas serem fortes, moderadas ou fracas.
Diante desse quadro de possibilidades, qual a ação que a diretoria deve 
tomar de forma a potencializar as suas possibilidades de lucro?
A tabela abaixo resume as situações de retorno expostas:
Eventos A1 = Investir em propaganda (R$)
A2 = Não investir
em propaganda (R$)
θ1 = venda forte 90 60
θ2 = venda moderada 30 10
θ3 = venda fraca -4 2
213Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
214
Teoria da decisão
Observa-se que nenhuma das ações é preferível em todos os eventos ou 
estados da natureza. A ação de investir em propaganda é preferível nos casos 
de futuras vendas fortes ou moderadas, mas se a venda for fraca a ação pre-
ferida é não investir em propaganda.
Se a diretoria soubesse com certeza qual evento ocorreria, o processo de 
decisão seria simples. Bastaria olhar para a linha que representasse maior 
ganho e selecionar a ação que produzisse o melhor rendimento. No entanto, 
a incerteza de que evento ocorrerá torna o problema mais interessante.
Vários diferentes critérios de seleção da melhor ação podem ser sugeri-
dos. Se houvesse ainda a possibilidade de agregar mais informações sobre 
as probabilidades de ocorrência de cada um dos eventos, a tomada de de-
cisão poderia ser realizada com base nessas informações, o que seria muito 
desejável.
Conceitos fundamentais
A tomada de decisão gerencial tem crescido em complexidade e os ins-
trumentos da Teoria de Decisão Estatística têm se tornado um importante 
modelo para se fazer escolhas racionais entre ações alternativas quando a 
informação é incompleta e sob ambiente de incerteza. O problema de de-
cisão sob estudo pode ser representado por um modelo que compreende 
cinco elementos.
O tomador de decisão
É o agente a quem cabe a responsabilidade por tomar as decisões. O to-
mador de decisões pode ser um indivíduo, uma corporação, uma agência 
governamental e assim por diante.
Ações
A decisão envolve uma seleção entre duas ou mais alternativas de ações. 
O problema é escolher a melhor entre essas ações alternativas. Algumas 
vezes o tomador de decisões deve escolher a melhor das estratégias dispo-
níveis, em que cada estratégia é uma regra de decisão que indica qual ação 
deve ser tomada em resposta a um tipo específico de informação amostral 
ou experimental.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Teoria da decisão
215
Eventos
Os eventos estão fora do controle do tomador de decisões, que não 
sabe ao certo qual evento de fato ocorrerá. Os eventos se constituem de 
um conjunto de resultados mutuamente exclusivos,isto é, um e somente 
um deles ocorrerá. Os eventos também são chamados de estados da natu-
reza ou simplesmente resultados.
Ganho
É a medida do resultado da opção por uma ação específica. Os ganhos são 
apresentados em tabelas de ganhos ou matrizes de ganho, que apresentam as 
consequências de cada ação selecionada e cada evento que possa ocorrer.
Incerteza
A falta de definição de qual evento ou estado da natureza irá ocorrer 
é definido como incerteza. Essa incerteza será indicada em termos de pro-
babilidades associadas aos eventos. Uma das características da Teoria Esta-
tística de Decisão é o assinalamento de probabilidades para a ocorrência 
desses eventos. Entre os tipos de probabilidades utilizadas está a probabili-
dade subjetiva.
A tabela de ganhos é expressa em termos genéricos. Assumimos que 
existem “n” ações alternativas A1, A2 ... An e “m” possíveis eventos ou estados 
da natureza denotados por θ1, θ2 ... θm. Os resultados de ganhos possíveis são 
denotados pela letra “u” com os indicadores respectivos de ações e eventos. 
A letra “u” está sendo usada por sua associação com “utilidade”, conforme 
será mais bem explicado adiante. A matriz a seguir resume as relações acima 
descritas:
Ações
Eventos A1 A2 ... An
θ1 u11 u12 ... u1n
θ2 u21 u22 ... u2n
... ... ... ... ...
θm um1 um2 ... umn
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
216
Teoria da decisão
Como essas utilidades podem ser determinadas será assunto para este 
capítulo. Em síntese, a utilidade de se selecionar ação A2 e ter o resultado 
do evento θ1 é denotada por u12 e assim por diante. A utilidade uij se refere à 
ação “j” e o evento “i”.
Se de antemão for sabido com certeza que o evento que irá ocorrer é o 
θ3, então basta ao tomador de decisões olhar ao longo da linha correspon-
dente qual é a maior utilidade e assim definir que ação deve ser tomada. No 
entanto, no mundo real, uma vez que o estado da natureza não é de domínio 
do tomador de decisões, ele não sabe com certeza qual específico evento irá 
ocorrer. A escolha da melhor ação a ser tomada em face de um ambiente de 
incerteza é o problema central da tomada de decisão.
Critérios de escolha 
utilizando distribuição a priori
Muitos diferentes critérios existem para selecionar a melhor ação. O crité-
rio mais imediato é conhecido como o critério maximin de ganho. Outros três 
critérios simples também são bastante utilizados, são normalmente conhe-
cidos como: ganho esperado sob incerteza, perda esperada de oportunidade e 
critério minimax da perda de oportunidade.
Critério maximin de ganho
No método chamado critério maximin, o tomador de decisões assume 
que uma vez que uma ação seja escolhida, a natureza será malevolente e 
escolherá o estado da natureza que minimize o rendimento de sua escolha. 
O tomador de decisões escolhe a ação que maximize o rendimento sob a 
pior perspectiva.
Em outras palavras, o melhor do pior é uma forma de proteção. No exem-
plo do investimento em propaganda, a matriz de rendimentos é apresentada 
a seguir:
Eventos A1 = Investir em propaganda (R$)
A2 = Não investir
em propaganda (R$)
θ1 = venda forte 90 60
θ2 = venda moderada 30 10
θ3 = venda fraca –4 2
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Teoria da decisão
217
Se os diretores escolherem a ação A1, a natureza provocará a ocorrência 
de θ3 e o resultado será um prejuízo de R$4.000,00. Se o tomador de decisões 
escolher a ação A2, também a natureza provocará a ocorrência de θ3 e o lucro 
será de R$2.000,00.
Sendo assim, o tomador de decisões deverá escolher a ação que produza 
o maior rendimento, no caso a ação A2. Isto é, a empresa não deve inves-
tir em propaganda. Então, o objetivo desse processo de decisão é escolher 
aquela ação que produza o máximo entre os mínimos rendimentos, por isso, 
o termo maximin.
Naturalmente, o critério maximin é um tipo de critério pessimista. Não 
é razoável supor que um executivo tomaria decisões ou deveria tomar de-
cisões dessa forma. Na maioria das situações o critério maximin congelaria 
o tomador de decisões em completa paralisia e implicaria que seria melhor 
que ele mudasse de ramo de atividade.
Parece ser razoável que um tomador de decisões deva levar em conta 
as probabilidades de ocorrência dos diferentes possíveis estados da natureza. 
Se, no exemplo acima, a probabilidade de vendas fracas for muito pequena, 
não há porque concentrar-se sobre a possibilidade dessa ocorrência. Os pró-
ximos procedimentos procurarão dar conta dessa alternativa.
Ganho esperado sob incerteza
Em um problema real de tomada de decisão, deve-se esperar que o toma-
dor de decisões tenha alguma ideia sobre a probabilidade de ocorrência dos 
vários estados da natureza e que esse conhecimento possa ajudar na escolha 
da melhor ação a ser tomada.
No exemplo em questão, se a diretoria percebe que as vendas do novo 
produto serão fracas e que não compensarão o investimento em propagan-
da, deve-se decidir pela ação A1. No entanto, se a diretoria percebe que o 
produto pode ter uma boa aceitação, talvez valha a pena fazer um investi-
mento em propaganda. 
Se o número de eventos e o número de ações possíveis passarem a ser 
muito grandes, o problema pode tornar-se muito complexo, e o tomador 
de decisões necessitará de outro tipo de método para processar as informa-
ções relevantes. No entanto, os procedimentos apresentados neste capítulo 
cobrem uma grande gama de problemas de tomada de decisão.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
218
Teoria da decisão
Voltando ao problema do investimento em propaganda. Nesse caso, a maxi-
mização consiste em selecionar a ação que produza o maior ganho esperado. 
Vamos assumir que a diretoria da empresa ABC tome o seguinte procedi-
mento de assinalamento de probabilidades para cada um dos eventos. Com 
base em uma extensiva pesquisa da experiência passada com produtos seme-
lhantes e de acordo com a opinião de especialistas, a diretoria conclui que as 
vendas podem ser moderadas (evento θ2) em uma razão de 50 para 50. E mais, 
concluem que é um pouco menos provável que as vendas aumentem com 
investimento em propaganda (evento θ1) do que as vendas sejam pequenas 
(evento θ3). Com base nessa perspectiva, a diretoria estabelece a seguinte dis-
tribuição de probabilidades subjetivas para os eventos em questão:
Evento Probabilidade
θ1 = venda forte 0,2
θ2 = venda moderada 0,5
θ3 = venda fraca 0,3
Total 1
Para determinar a base de escolha entre investir em propaganda (Ação 
1) e não investir em propaganda (Ação 2), é necessário calcular o ganho es-
perado para cada ação. Como indicado na tabela a seguir, o ganho é tratado 
como uma variável que toma diferentes valores dependendo de que evento 
ocorra. O valor esperado de cada ação será a média ponderada dos resultados 
sob cada ato, em que os pesos são as probabilidades de que cada evento 
possa ocorrer.
Evento
Ação 1: investir em
propaganda
Ação 2: não investir em
propaganda
Probabi-
lidade Resultado
Resultado 
ponderado
Probabili-
dade Resultado
Resultado 
ponderado
θ1 0,2 90 18,0 0,2 60 12,0
θ2 0,5 30 15,0 0,5 10 50,
θ3 0,3 –4 –1,2 0,3 2 0,6
Total 1,0 31,8 1,0 17,6
Resultado esperado: R$31.800,00 Resultado esperado: R$17.600,00
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Teoria da decisão
219
Verifica-se dos cálculos realizados que a diretoria pode esperar um resul-
tado de R$31.800,00 de retorno de vendas se investir em propaganda e de 
R$17.600,00 caso não invista em propaganda. Para maximizar o ganho espe-
rado, a diretoria deveria selecionar a ação A1 e investir em propaganda. 
Perda de oportunidade esperada
Um conceito útil na análise de decisão sobre incerteza é o da perda de 
oportunidade. A perda de oportunidade é a perda causada pela falha em es-
colher a melhor ação. As perdasde oportunidade são calculadas separada-
mente para cada evento que pode acontecer.
Da ocorrência de um específico evento pode-se determinar a melhor 
ação possível. Para um dado evento, a perda de oportunidade é a diferença 
entre o ganho daquele ato e o ganho para o melhor ato que poderia ter sido 
selecionado.
No exemplo do investimento em propaganda, se o evento θ3 ocorrer 
(vendas fortes), a melhor ação é a A1, para a qual o ganho é de R$90.000,00. 
A perda para esta ação é 90 – 90 = 0. O ganho para a ação A2 é R$30.000,00 
e a perda de oportunidade da ação A2 é a quantidade que o ganho para 
a melhor ação, ou seja, R$90.000,00 excedem os R$30.000,00 de ganho da 
ação A2, que é, portanto, R$90.000,00 – R$30.000,00 = R$60.000,00.
A tabela das perdas de oportunidade para o problema em questão é:
Tabela de ganhos 
(R$)
Tabela de perda de 
oportunidades (R$)
Evento A1 A2 A1 A2
θ1 = venda forte 90 60 0 30
θ2 = venda moderada 30 10 0 20
θ3 = venda fraca –4 2 6 0
Pode-se calcular agora as perdas de oportunidades esperadas, levando-
se em conta a distribuição de probabilidades subjetivas estimadas de maneira 
análoga ao que foi feito com o ganho esperado sob incerteza. O objetivo 
será o de escolher aquela ação com menor perda de oportunidade esperada.
As seguintes quantidades podem então ser definidas POE(A1) e POE(A2) 
como perda de oportunidade esperada para a ação de investir em propagan-
da e a perda de oportunidade esperada ao não se investir em propaganda:
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
220
Teoria da decisão
Evento
Ação : investir em propaganda Ação 2: não investir em propaganda
Probabi-
lidade Resultado
Resultado 
ponderado
Probabili-
dade Resultado
Resultado 
ponderado
θ1 0,2 0 0,0 0,2 30 6,0
θ2 0,5 0 0,0 0,5 20 10,0
θ3 0,3 6 1,8 0,3 0 0,0
Total 1,0 1,8 1,0 16,0
Resultado esperado: R$1.800,00 Resultado esperado: R$16.000,00
Se a diretoria escolher a ação que minimize a perda de oportunidade 
esperada, escolherá a ação A1, a mesma ação selecionada sob o critério de 
maximizar o ganho esperado. Pode ser demonstrado que esse resultado não 
ocorreu por acaso. Sempre a ação escolhida pelo critério da maximização do 
ganho esperado também será o escolhido para a minimização da perda de 
oportunidade esperada.
Critério minimax da perda de oportunidade
No método do critério minimax de perda de oportunidade, o tomador de 
decisão seleciona a ação que minimiza a pior perda de oportunidade possí-
vel. Como no critério de maximin, de maximizar os piores ganhos, o critério 
minimax para a perda de oportunidade toma uma perspectiva pessimista. O 
tomador de decisão determina para cada ação a maior perda de oportunida-
de que pode ocorrer.
No exemplo em discussão, para a ação A2 a maior perda de oportunidade 
possível é de R$16.000,00, para a ação A1, é R$1.800,00. Então, o tomador de 
decisões opta pela ação A2, que é a de não se investir em propaganda.
Nesse exemplo, a ação escolhida pelo processo minimax foi a mesma da es-
colhida para o processo maximim, ação A2, mas esse fato nem sempre ocorre.
Valor esperado da informação 
perfeita (VEIP) ou o custo da incerteza
A quantidade perda de oportunidade esperada (POE) pode ser interpre-
tada também através do valor esperado da informação perfeita (VEIP) ou do 
custo da incerteza (CI).
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Teoria da decisão
221
O valor esperado da informação perfeita (VEIP) é a diferença entre o 
ganho esperado com informação perfeita e o ganho esperado sob incerte-
za. Como foi visto acima, para o problema do investimento em propagan-
da, o ganho esperado sob incerteza foi de R$31.800,00, o ganho esperado 
com informação perfeita pode ser determinado pela escolha do melhor 
ganho para cada evento e as probabilidades aqui são consideradas como 
aproximações das frequências relativas calculadas por várias observações 
anteriores.
Evento Ganhos (R$) Probabilidades
Ganhos 
ponderados
θ1 = venda forte 90 0,2 18,0
θ2 = venda moderada 30 0,5 15,0
θ3 = venda fraca 2 0,3 0,6
33,6
Então, o valor esperado da informação perfeita será igual a R$33.600,00 
– R$31.800,00 = R$1.800,00. Exatamente o mesmo valor encontrado para a 
perda de oportunidade esperada.
A expressão custo da incerteza destaca o custo associado à tomada de 
decisão sob incerteza, uma vez que o ganho esperado com perfeita informa-
ção subentende que esse seria o ganho esperado com o conhecimento de 
eventos passados ou ganho esperado “sob certeza”.
Representação através de diagrama de decisão
Pode ser útil para melhor visualização representar a estrutura de um 
problema de decisão sob incerteza através de um diagrama de árvore 
de decisão, também chamado de diagrama de decisão ou diagrama de 
árvore.
O problema do investimento em propaganda pode ser apresentado atra-
vés do diagrama a seguir:
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
222
Teoria da decisão
1
2
2
A1
θ1
R$90,00
R$60,00
R$10,00
R$2,00
R$30,00
– R$4,00
θ1
θ2
θ2
θ3
θ3
A2
Saindo do ponto 1, o tomador de decisões pode seguir o ramo A1 ou 
o ramo A2, correspondentes, respectivamente, às ações de investir em 
propaganda e não investir em propaganda. No ponto 2, um novo ramo 
pode ser aberto a partir da primeira decisão que corresponde aos possí-
veis eventos, alcançando os valores de ganhos pela escolha da ação e o 
acontecimento do evento. 
Para a tomada de decisão, o diagrama precisa receber as novas informa-
ções correspondentes ao valor das estimativas de probabilidade que cada 
evento ocorra e a realização da análise retrospectiva ou de indução backward 
(para trás). Multiplica-se, então, os valores dos ganhos no final de cada ramo 
pelo valor da probabilidade de cada um dos eventos somando os resulta-
dos destes produtos e retornando ao ponto 2, que assume o valor de ganho 
esperado para cada uma das ações, A1 e A2, com valores de R$31.800,00 e 
R$17.600,00, respectivamente.
O valor do ganho esperado para a ação 1 foi determinado pela seguinte 
expressão:
31,8 = (0,2).(90) + (0,5).(30) + (0,3).(–4)
O novo passo é retornar do nó 2 para o nó 1 através da escolha do ganho 
esperado de maior valor, no caso o ganho esperado correspondente da ação 
1, conforme exposto no diagrama 2:
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Teoria da decisão
223
1
2
2
A1
(0,2)
(0,2)
R$90,00
R$31,8
R$31,8
R$23,0
R$60,00
R$10,00
R$2,00
R$30,00
– R$4,00
(0,5)
(0,5)
(0,3)
(0,3)
A2
Dessa forma, o diagrama de árvore reproduz de forma esquemática 
e compacta a análise realizada através das tabelas. Um diagrama análogo 
pode ser construído em termos de perdas de oportunidade.
Estabelecimento 
de distribuições de probabilidades
Estabelecer as probabilidades de ocorrência de cada estado da natureza 
(eventos) é uma tarefa fundamental para o equacionamento do esquema de 
tomada de decisões. Até agora, o estabelecimento dessas probabilidades foi 
realizado de forma subjetiva e simples. Se houver uma forma mais científica 
de estabelecimento da distribuição de probabilidades dos possíveis eventos, 
o problema da tomada de decisões pode ser mais bem equacionado.
Se a variável aleatória que representa os estados da natureza for discre-
ta e houver somente um número pequeno de resultados possíveis, então 
o tomador de decisões provavelmente será capaz de assinalar diretamente 
probabilidades para cada possível resultado. No entanto, se a variável alea-
tória tiver um número grande de valores possíveis, o tomador de decisões 
terá que tratar a variável aleatória como contínua e necessitará construir uma 
função de distribuição acumulada trabalhando com um número de interva-
los selecionados da variável aleatória.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br224
Teoria da decisão
Duas situações possíveis são apresentadas ao tomador de decisões:
o tomador de decisões � estabelece diretamente uma distribuição de 
probabilidades subjetivas sem um processamento formal dos dados; 
existe uma pequena quantidade de � dados do passado, e o tomador de 
decisões processa essa informação para construir uma distribuição de 
probabilidades acumulada ou cumulativa.
O problema agora é encontrar meios para a construção dessas distribuições 
de probabilidades. Trabalharemos com as duas possibilidades, a saber: (I) assi-
nalamento subjetivo direto; e (II) assinalamento usando dados do passado.
Assinalamento subjetivo direto
Nesse caso, o estabelecimento de uma distribuição cumulativa de probabi-
lidades subjetiva será feito sem processamento formal de dados.
Tomemos por exemplo um caso em que o tomador de decisões infere 
que para o próximo ano as vendas de certo produto de sua companhia 
deverão ficar entre 100 000 e 500 000 unidades, e deseja estabelecer uma 
distribuição de probabilidades cumulativas subjetivas sem usar explicita-
mente qualquer dado.
A base de procedimento é focalizar a atenção em poucos pontos da dis-
tribuição. Uma proposta é trabalhar com os percentis. Se pensarmos em três 
percentis, o mais adequado é tomar o primeiro e o quarto quartil e a media-
na. O primeiro quartil divide o rol de dados em duas partes, os primeiros 25% 
e os últimos 75%. A mediana divide o rol de dados em duas partes iguais, os 
primeiros 50% e os últimos 50%. E o terceiro percentil divide o rol também 
em duas partes, os primeiros 75% e os últimos 25%. 
Observe que o primeiro quartil representa o vigésimo quinto percentil, a 
mediana representa o quinquagésimo percentil e o terceiro quartil, o septu-
agésimo quinto percentil.
Comecemos pela mediana ou o quinquagésimo percentil. O tomador 
de decisões deve escolher, entre 100 000 e 500 000, um valor que acredite 
que a probabilidade de ocorrer um valor menor ou igual a ele seja igual a 
50%. Pode ser qualquer valor no intervalo inicialmente estabelecido. Vamos 
supor que após muita reflexão ele acredite que esse valor deve ser algo em 
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Teoria da decisão
225
torno de 350 000. Ou seja, o tomador de decisões acredita que a chance de 
se vender menos de 350 000 unidades do produto é de 50%. Naturalmente, 
a chance de vender mais de 350 000 também é de 50%.
O raciocínio deve ser repetido para a determinação dos outros dois valo-
res. Vamos supor que esses valores sejam 250 000 e 400 000. Ou seja, o toma-
dor de decisões acredita que a probabilidade de vender mais do que 250 000 
produtos seja de 75% e que a probabilidade de vender mais do que 
400 000 produtos seja de 25%. 
Dessa forma, três pontos da distribuição de probabilidades cumulativa 
foram determinados. Os percentis de ordem 25, 50 e 75, ou equivalente-
mente o primeiro, o segundo e o terceiro quartis. Lembrando que o segundo 
quartil coincide com a mediana.
O procedimento usual é o de determinar mais dois pontos, preferencial-
mente mais próximos dos extremos e usar esses cinco pontos para a constru-
ção da função que represente a distribuição de probabilidades cumulativa.
Uma proposta é usar o primeiro e o nonagésimo nono percentis, ou os 
percentis de ordem 1 e de ordem 99. Esses valores podem ser considerados 
como os valores limites inferior e superior da primeira condição estabeleci-
da. Ou seja, podemos escolher como primeiro percentil o valor de 100 000 
unidades de venda e 500 000 como o valor do nonagésimo nono percentil. 
Dessa forma, estabelecemos que a probabilidade de vender mais do que 
100 000 unidades do produto em questão é de 99% e que a probabilidade 
de vender mais do que 500 000 unidades é de somente 1%.
A figura seguinte representa a situação construída. O gráfico pode ser 
considerado como uma aproximação da distribuição de probabilidade cumu-
lativa subjetiva da venda do produto no próximo ano.
Distribuição de probabilidade cumulativa
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
0 100 200 300 400 500 600
Vendas
Pr
ob
ab
ili
da
de
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
226
Teoria da decisão
A distribuição anterior, que representa uma distribuição de probabilidades 
discreta, pode ser mais bem aproximada através de uma curva em forma de “s” 
pela união de seus pontos, para a construção de uma distribuição de probabi-
lidades contínua.
Distribuição de probabilidade cumulativa
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
0 100 200 300 400 500 600
Vendas
Pr
ob
ab
ili
da
de
s
 
O assinalamento direto da distribuição de probabilidades cumulativa 
subjetiva é apropriada para as seguintes situações: (I) quando existir um 
número pequeno de dados e não houver dados do passado; e (II) quando, 
apesar de existirem dados do passado, o tomador de decisões não se sentir 
confortável para usar esses dados para o estabelecimento da distribuição de 
probabilidade cumulativa. Este último caso pode ocorrer em razão de mu-
danças da política da empresa ou de algum avanço tecnológico importante 
implementado, por exemplo.
Assinalamento de probabilidades 
usando dados do passado
Se existe uma grande quantidade de dados do passado, o tomador de de-
cisões pode usá-los para estabelecer a distribuição de probabilidades atra-
vés do uso das frequências relativas dos dados. No entanto, se a quantidade 
de dados for pequena, um procedimento deve ser realizado tomando a dis-
tribuição de frequências destes dados para a construção de uma distribuição 
de frequências acumulada através de aproximações.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Teoria da decisão
227
Vamos ilustrar a construção de uma distribuição cumulativa de probabi-
lidades através de um exemplo simples. Certa loja vende, entre outros, um 
produto A. Acompanhando a venda desse produto nos últimos 20 meses, 
observamos que em um determinado mês foram vendidos 33 unidades. Em 
outros dois meses foram vendidos 38. Fazendo observações dessa ordem, 
pudemos construir a seguinte distribuição de frequências que relaciona o 
número de produtos vendidos com a quantidade de meses em que esse 
número foi alcançado. Um possível resultado é o que segue:
Número de 
 produtos 
vendidos
Número de meses em 
que os produtos vendi-
dos alcançaram a venda
Número de 
produtos 
vendidos
Frequência relativa 
 do número de 
produtos vendidos
33 1 33 1/20 = 0,05
34 0
35 4 35 4/20 = 0,20
36 5 36 5/20 = 0,25
37 0
38 2 38 2/20 = 0,10
39 3 39 3/20 = 0,15
40 0
41 1 41 1/20 = 0,05
42 2 42 2/20 = 0,10
43 2 43 2/20 = 0,10
Podemos, com base nos dados acima, construir a distribuição de frequên-
cias acumuladas para o número de produtos vendidos:
Número de 
produtos vendidos
Frequência relativa do número 
de produtos vendidos
Frequência relativa 
acumulada
33 0,05 0,05
34 0,05
35 0,20 0,25
36 0,25 0,50
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
228
Teoria da decisão
Número de 
produtos vendidos
Frequência relativa do número 
de produtos vendidos
Frequência relativa 
acumulada
37 0,50
38 0,10 0,60
39 0,15 0,75
40 0,75
41 0,05 0,80
42 0,10 0,90
43 0,10 1,00
Considerando que a frequência relativa é uma aproximação de probabili-
dades e que, portanto, a frequência relativa acumulada é uma aproximação 
da probabilidade acumulada, podemos construir o seguinte gráfico da dis-
tribuição de frequências relativas acumuladas, que representam as probabi-
lidades de vender até certo número de produtos. Observando a tabela ante-
rior ou o próximo gráfico, podemos verificar que a probabilidade de vender 
até 36 produtos em um determinado mês é de 50%.
Distribuição de probabilidade cumulativa
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
30 35 40 45
Número de produtosvendidos
Pr
ob
ab
ili
da
de
50
Para aplicações em tomada de decisões sob incerteza, trabalhar com 
dados contínuos pode dificultar enormemente a tarefa. Até aqui trabalha-
mos com dados discretos. Existem técnicas para transformar dados contínu-
os em dados discretos, mas que estão fora do escopo do presente texto.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Teoria da decisão
229
Tomada de decisões 
baseada na utilidade esperada
Até agora as análises de tomada de decisão tiveram por critério a escolha 
da ação ótima como aquela que resultaria em maior ganho médio a longo 
prazo se a mesma decisão tivesse que ser tomada repetidamente sob idên-
ticas condições. No entanto, algumas decisões pessoais e nos negócios são 
tomadas frente a um único conjunto de condições. Em algumas dessas oca-
siões não seria realístico pensar em termos de muitas repetições da mesma 
situação de decisão.
Sendo assim, é útil ter um aparato para lidar com tomada de decisão em 
tempo único. A Teoria da Utilidade fornece tal aparato e também um método 
lógico para tomada de decisões repetitivas. Para ilustrar a ideia, vamos supor 
três situações com duas ações alternativas para cada uma delas. Na primeira 
(A) se contrapõem duas decisões que têm como consequência para a ação A1 
receber R$0 com certeza e, para a ação A2, receber R$0,60 com probabilidade 
½ e perder R$0,40 com probabilidade ½. Na segunda situação, B1 implica 
ganhar R$0,00 com certeza e B2, receber R$60.000,00 com probabilidade ½ 
e perder R$40.000,00 com probabilidade ½. A terceira situação, C1 implica 
receber R$1 milhão com certeza contra C2, que implica receber R$2 milhões 
com probabilidade ½ e receber R$0,00 com probabilidade ½.
O cálculo do ganho esperado para a decisão colocada em A é de R$0,10 
[(1/2).(0,6)+(1/2).(0,4)]. Isso significa que a longo prazo o resultado deverá 
ser positivo. Ocorre, no entanto, que se a decisão tem que ser tomada para 
somente uma realização, a perda pode ser de R$0,40. A firma talvez possa 
correr esse risco. Mas na situação B, o valor do ganho esperado a longo prazo 
seria de R$10.000,00, o que levaria o tomador de decisões a optar pelo risco, 
ou seja, escolher a ação B2. Como a situação é pontual, a firma pode perder 
R$40.000,00. Ficando invibializado o tomador de decisões pode optar por 
não correr o risco e optar por ganho certo de R$0,00.
No caso da situação C, mesmo pensando a longo prazo, o valor do ganho 
esperado seria R$1.050.000,00 se a opção fosse por C2, contra um ganho certo 
de R$1.000.000,00 pela ação C1. Nesse caso, não resta muita dúvida que, apesar 
de a ação C2 poder resultar num ganho de R$2,1 milhões, a melhor ação seria 
mesmo tomar a ação C1, com ganho certo de R$1 milhão.
Fica claro que grandes e pequenas corporações podem tomar diferentes 
atitudes diante do risco. A questão que o tomador de decisões deve respon-
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
230
Teoria da decisão
der é: “Qual é a probabilidade para que a consequência M1 se torne indiferente 
para que se possa correr o risco de optar por ganhar M1 com certa probabilida-
de p ou M2 com probabilidade 1–p?”. Esse tipo de questão pode ser respondido 
pela aplicação da metodologia da Teoria da Utilidade. Não é objeto de estudo 
aqui o desenvolvimento mais aprofundado dessa teoria, senão o de apresen-
tá-la ilustrativamente, mesmo porque essa situação não é muito comum na 
prática diária da tomada de decisões. Maiores informações sobre essa teoria 
podem ser adquiridas através de bibliografia mais aprofundada, como o livro 
de R. S. Schlaifer, Analysis of Decisions Under Uncertainty, McGraw Hill.
Tomada de decisão com 
probabilidades a posteriori
As análises feitas até agora podem ser consideradas como análises a 
priori, isto é, a tomada de decisões foi baseada em melhor ganho (ou menor 
perda) com base em ações relacionadas com uma distribuição de probabi-
lidades construída sem a utilização de levantamento de dados amostrais 
auxiliares. Aqui discutiremos a chamada análise a posteriori, em que a distri-
buição de probabilidades envolvida na tomada de decisões será feita com 
base em probabilidades a priori revisadas pela observação de dados amos-
trais complementares.
Probabilidades a posteriori
As probabilidades a posteriori são calculadas com base em duas informa-
ções, as probabilidades a priori e a informação obtida através da observação 
de um conjunto de dados. O meio de fazer essa atualização é o Teorema de 
Bayes. Se uma nova atualização for necessária, a atual probabilidade a pos-
teriori será utilizada como probabilidade a priori no novo contexto em que 
uma nova tomada amostral seja realizada.
O propósito de incorporar mais evidência através de processos amostrais 
é o de reduzir o custo esperado da incerteza.
Se o custo esperado da incerteza (ou de outra forma, o custo esperado da 
perda de oportunidade) for elevado, então o acréscimo de nova informação 
através de um processo de amostragem pode se tornar desejável. O método 
geral para se incorporar nova informação, ou nova evidência amostral, pode 
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Teoria da decisão
231
ser ilustrado pelo uso de dois tipos de informação amostral: (I) através da 
especificação da confiabilidade da informação amostral; e (II) através da es-
pecificação do tamanho da amostra.
Análise a posteriori: uma ilustração 
da especificação da confiabilidade
Retomando o exemplo do investimento em propaganda, a situação colo-
cada para o tomador de decisões era a de decidir entre duas ações, A1 (inves-
tir em propaganda de um novo produto) e A2 (não investir em propaganda 
de um novo produto).
Qual a ação que a diretoria deve tomar de forma a potencializar as suas 
possibilidades de lucro, diante do quadro de retorno ou possíveis ganhos?
A tabela a seguir resume a situação de retorno exposta, na qual os valo-
res são expressos em milhares de reais, isto é, 90 representa um ganho de 
R$90.000,00:
Eventos A1 = investir em propaganda (R$)
A2 = não investir em 
propaganda (R$)
θ1 = venda forte 90 60
θ2 = venda moderada 30 10
θ3 = venda fraca -4 2
Com base em avaliações subjetivas, a diretoria estabelece a seguinte dis-
tribuição de probabilidades para os eventos em questão:
Evento Probabilidade
θ1 = venda forte 0,2
θ2 = venda moderada 0,5
θ3 = venda fraca 0,3
Total 1,0
Diante desses dados, foram determinados os valores esperados de ganhos 
sob incerteza para a ação A1 de R$31.800,00 e para a ação A2 de R$17.600,00.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
232
Teoria da decisão
Associado a esses cálculos, foi determinado o custo da incerteza (ou valor 
esperado da perda de oportunidade) em R$1.800,00, considerado alto pela 
diretoria. Decide-se, então, por proceder a um levantamento amostral no 
sentido de verificar os ganhos esperados para cada ação de forma que o 
custo da incerteza possa ser reduzido através da incorporação de evidências 
adicionais e, portanto, com a diminuição da incerteza.
Vamos assumir que a pesquisa possa resultar em três resultados amostrais, 
denotados por x1, x2 e x3, correspondentes aos três estados da natureza (even-
tos) θ1, θ2 e θ3. Especificamente, os resultados da pesquisa podem ser: a amos-
tra indica vendas fortes (x1), vendas moderadas (x2) ou vendas fracas (x3).
A pesquisa foi realizada e a amostra indicou um nível de venda moderada 
para o produto, isto é, x2 foi observado.
Suponha agora que, com base em pesquisas anteriores semelhantes, os 
pesquisadores possam acessar a confiabilidade da evidência amostral nos 
seguintes termos: no passado, quando o nível de venda real foi moderado, 
a pesquisa amostral indicou corretamente venda moderada em 80% das 
vezes. No entanto, quando o nível real de vendas foi forte, em cerca de 20% 
das pesquisasrealizadas o nível indicado foi erroneamente indicado como 
moderado. E quando o nível real de vendas foi baixo, cerca de 30% das pes-
quisas amostrais indicaram vendas moderadas.
Essas frequências relativas representam probabilidades condicionais que as 
evidências indicassem nível moderado de vendas, dados os três possíveis even-
tos de nível de venda. Essas probabilidades podem ser representadas por:
P(x2/θ1) = 0,2
P(x2/θ2) = 0,8
P(x2/θ3) = 0,3
Com essa informação, a distribuição de probabilidades a priori original 
pode ser revisada conforme indica a seguinte tabela:
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Teoria da decisão
233
Probabilidade 
a priori
Probabilidade 
condicional
Probabilidade 
conjunta
Probabilidade 
a posteriori
Eventos θi P(θi) P(x2/θi) P(θi) P(x2/θi) P(θi/x2)
θ1 = venda forte 0,2 0,2 0,04 0,0755
θ2 = venda 
moderada 0,5 0,8 0,40 0,7547
θ3 = venda fraca 0,3 0,3 0,09 0,1698
Total 1,0 0,53 1,0000
Observe a utilização do Teorema de Bayes para cada um dos θi:
P(θ1 / x2) =
P (θ1)P(x2 / θ1)
∑P (θi)P(x2 / θi)
Na tabela, multiplicar cada probabilidade a priori P(θi) pela sua correspon-
dente probabilidade condicional P(x2/θi), obtendo-se assim as probabilida-
des conjuntas, cuja soma é ΣP(θi) P(x2/θi). Para calcular as probabilidades a 
posteriori associadas a cada um dos eventos θi, basta dividir a probabilidade 
conjunta de cada evento pela soma das probabilidades conjuntas. Essa é 
uma forma confortável de calcular as probabilidades a posteriori através do 
uso do Teorema de Bayes. 
Fica bem ilustrativo a diminuição do espaço amostral com a corresponden-
te probabilidade de 0,53 e quanto dessa probabilidade será destinada a cada 
um dos eventos. Equivale, portanto, a considerar 0,53 como a totalidade (1,0) 
e verificar quanto disso corresponde a cada um dos eventos.
Assim, com uma indicação amostral de vendas moderadas, a probabili-
dade a priori de 0,5 do evento vendas moderadas foi revisado e cresceu para 
aproximados 0,75. Da mesma forma, as probabilidades 0,2 e 0,3, correspon-
dentes aos eventos venda fraca e venda forte, foram revisados e declinaram 
para 0,07 e 0,17.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
234
Teoria da decisão
Essas probabilidades revisadas podem ser agora utilizadas para os cál-
culos do ganho esperado a posteriori e da perda esperada de oportunidade a 
posteriori ou custo esperado da incerteza. Então, os resultados obtidos foram 
de R$28.756,80 de ganho esperado para a ação A1 (investir em propaganda) 
e R$12.416,60 para A2 (não investir em propaganda) e o custo esperado da 
incerteza diminuiu de R$1.800,00 para R$1.018,80.
Tabela 1 – Ganho esperado a posteriori
Evento
Ação 1: investir em propaganda Ação 2: não investir em propaganda
Probabi-
lidade Resultado
Resultado 
ponderado
Probabi-
lidade
Resulta-
do
Resultado 
ponderado
θ1 0,0755 90 6,795 0,0755 60 4,53
θ2 0,7547 30 22,641 0,7547 10 7,547
θ3 0,1698 -4 -0,6792 0,1698 2 0,3396
Total 1,0000 28.756,80 1,0000 12.416,60
Resultado esperado: R$28.756,80 Resultado esperado: R$12.416,60
Tabela 2 – Perda de oportunidade esperada a posteriori
Ação 1: investir em propaganda Ação 2: não investir em propaganda
Evento Probabi-lidade Resultado
Resultado 
ponderado
Probabi-
lidade Resultado
Resultado 
ponderado
θ1 0,0755 0 0 0,0755 30 2,265
θ2 0,7547 0 0 0,7547 20 15,094
θ3 0,1698 6 1,0188 0,1698 0 0
Total 1,0000 1,0188 1,0000 17,3590
Resultado esperado: R$1.018,80 Resultado esperado: R$17.359,00
O diagrama de árvores a seguir descreve a situação para os ganhos espe-
rados a posteriori.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Teoria da decisão
235
1
2
2
A1
R$90,00
R$28.756,60
R$28.756,60
R$12.416,60
R$60,00
R$10,00
R$2,00
R$30,00
– R$4,00
(0,07
55)
(0,7547)
(0,1698)
(0,07
55)
(0,7547)
(0,1698)
A2
Como o ganho esperado sob A1 é maior que o ganho esperado sob A2, 
a melhor das duas ações continua sendo a de investir em propaganda. Ob-
serve, no entanto, que essa decisão poderia ter sido modificada após o assi-
nalamento da distribuição de probabilidades a posteriori, com a inclusão de 
novas evidências devido ao processo de busca de dados na amostragem.
A amostragem indicada anteriormente indicou “vendas moderadas”, mas 
se ela tivesse indicado vendas fracas ou vendas fortes, o mesmo procedi-
mento poderia ser realizado para o cálculo dos novos valores de ganhos es-
perados e de custos da incerteza. 
O custo da incerteza teve uma diminuição de R$1.800,00 para R$1.088,00. 
Esse custo significa o quanto o tomador de decisões estaria disposto a pagar 
para ter a informação perfeita. Se esse valor tivesse crescido ao invés de di-
minuído, como foi o caso, significaria que a evidência amostral não resultou 
em diminuição da dúvida de que ação tomar e que a nova situação não traria 
maior segurança na decisão.
Análise a posteriori: 
uma ilustração da aceitação da amostragem
Como uma segunda ilustração da análise a posteriori, vamos considerar 
o problema da aceitação da amostragem de um produto manufaturado. 
Vamos assumir que a empresa ABC inspeciona artigos de componentes de 
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
236
Teoria da decisão
seus produtos vindos de certo fornecedor. Observando dados de inspeções 
passadas, a empresa verifica que 10%, 20% e 30% dos componentes do for-
necedor tinham defeitos. 
Da experiência passada, a empresa ABC estabeleceu como critério de 
aceitação de lotes com até 10% peças de defeituosas para retrabalho, e rejei-
tar lotes com 20% e 30% de peças defeituosas. A questão consiste em decidir 
se aceita ou não um novo lote através do exame de uma amostra sua.
Essa decisão deverá ser tomada com base em algumas informações que 
a empresa tem. Primeiro, com base em frequências relativas, lotes com essas 
percentagens de peças defeituosas ocorreram 50%, 30% e 20% das vezes. 
Ou seja, lotes com 10% de peças defeituosas ocorreram em 50% das entre-
gas. Outra informação que será utilizada será a matriz de resultados baseada 
na matriz de perda de oportunidades em tomar a ação A1, de rejeitar o lote, 
e a ação A2, de aceitar o lote. Com base em resultados anteriores, essa matriz 
é dada por:
Tabela 3 – Matriz de perda de oportunidade
Evento Ação A1 Ação A2
Proporção de defeituosas Rejeitar o lote Aceitar o lote
0,10 R$30,00 R$0,00
0,20 R$0,00 R$15,00
0,30 R$0,00 R$20,00
Seria mais realístico tomar eventos com proporções de defeituosas va-
riando de 0%, 1% até 100%, ou mesmo considerar esta como uma variável 
contínua. Para efeito de simplificação de apresentação do método, serão 
consideradas somente essas três possibilidades.
Com essas informações e com base no resultado de uma amostra de, diga-
mos, 10 elementos de uma nova entrega, em que será verificado o número de 
peças defeituosas entre essas 10, a empresa decidirá se aceita ou não o lote.
A empresa pode usar as frequências relativas (50%, 30% e 20%) como dis-
tribuição a priori e determinar a perda esperada de oportunidade para cada 
uma das duas ações possíveis:
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Teoria da decisão
237
Evento
p
Ação A1 - rejeitar o lote Ação A2 - aceitar o lote
P0(p)
Perda de
oportunidade
Perda
ponderada
P0(p)
Perda de 
oportunidade
Perda
ponderada
0,10 0,50 30 15,00 0,50 0 0,00
0,20 0,30 0 0,00 0,30 15 4,50
0,30 0,20 0 0,00 0,20 20 4,00
Total 1,00 R$15,00 1,00 R$8,50
Quando então utilizamos os dados do passado, verificamos que a perda 
esperada de oportunidade a priori para ação A1 (R$15,00) supera a perda da 
ação A2 (R$8,50). Assim, a ação ótima é a ação A2, de aceitar o lote.
Indo agora para a análise a posteriori, quando uma amostra de tamanho 
10 com reposição dos itens do lote é retirada para análise.Verifica-se que três 
peças são defeituosas. Qual será agora a melhor ação?
As evidências amostrais devem ser utilizadas para revisar as probabilida-
des a priori das proporções de peças defeituosas. Para aplicar o Teorema de 
Bayes, é necessário determinar as probabilidades condicionais P(X = 3/n = 
10, p). Aqui será necessária a aplicação do cálculo de probabilidades de um 
processo de Bernoulli através da distribuição binomial. Então:
P(X = 3/n = 10, p) = Cn,xp
x (1– p)n – x
Essas probabilidades serão iguais a 0,0574, 0,2013 e 0,2668 para “p” igual 
a 0,10, 0,20 e 0,30, respectivamente. Senão, vejamos para p = 0,10, o mesmo 
pode ser feito para p = 0,20 e p = 0,30:
P(X = 3/n = 10, p) = Cn, xp
x (1 – p)n – x = C10, 3 (0,10)
3.(0,9)7
(120).(0,001).(0,478297) = 0,057396 ≈ 0,0574
Dessa forma, as probabilidades a posteriori podem ser determinadas di-
retamente pelo Teorema de Bayes através de uma tabela auxiliar. Como já 
realizado anteriormente, denotaremos a probabilidade a priori por P0 e a 
probabilidade a posteriori por P1:
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
238
Teoria da decisão
Eventos p
Probabilidade 
a priori
Probabilidade 
condicional
Probabilidade 
conjunta
Probabilidade 
a posteriori
P0(p) P(X=3/n=10,p) P(p) P(X=3/n=10,p) P1(p)
0,10 0,5 0,0574 0,02870 0,20147
0,20 0,3 0,2013 0,06039 0,42394
0,30 0,2 0,2668 0,05336 0,37459
Total 1,0 0,14245 1,00000
As perdas esperadas de oportunidade podem agora ser recalculadas uti-
lizando essas probabilidades a posteriori. O novo cálculo das perdas espera-
das de oportunidade é apresentado na tabela a seguir:
Evento
P
Ação A1: rejeitar o lote Ação A2: aceitar o lote
P1(p)
Perda de
oportunidade
Perda
ponderada
P1(p)
Perda de 
oportunidade
Perda
ponderada
0,10 0,20147 30,00 6,04 0,20147 0,00 0,00
0,20 0,42394 0,00 0,00 0,42394 15,00 6,36
0,30 0,37459 0,00 0,00 0,37459 20,00 7,49
Total 1,00000 R$6,04 1,00000 R$13,85
A ação ótima agora é a de rejeitar o lote, uma vez que a perda esperada de 
oportunidade de A2 é maior do que a perda esperada de oportunidade de A1.
Para efeito de comparação, pode-se verificar que se supuséssemos que o 
número de peças defeituosas na amostra de 10 itens fosse de 2 unidades, a 
ação preferida seria A1 com perda de oportunidade de 12,41 contra 9,79 de 
A2. E se houvesse uma única defeituosa, a perda de oportunidade de A1 seria 
de 19,47 contra 5,67 de A2.
Efeito do tamanho da amostra
Podemos analisar o efeito do tamanho da amostra no cálculo das pro-
babilidades a posteriori. Suponha que uma amostra de tamanho 100, e não 
mais de tamanho 10, seja retirada. Vamos assumir a mesma proporção de 
defeituosas, 30% como no caso da amostra pequena. Então, um número de 
30 peças defeituosas foi encontrado no lote.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Teoria da decisão
239
Eventos
p
Probabilidade 
a priori
Probabilidade 
condicional Probabilidade conjunta
Probabilidade 
a posteriori
P0(p) P(X=30/n=100,p) P(p) P(X=30/n=100,p) P1(p)
0,10 0,5 0,000000018 0,000000009 0,00000005
0,20 0,3 0,005189 0,0015567 0,082
0,30 0,2 0,086784 0,0173568 0,918
Total 1,0 0,018913509 1,000
A maior probabilidade, 91,8%, foi encontrada para o evento p = 0,30 
depois que foi acrescentada à informação que na amostra de tamanho 100 
havia 30% de defeituosas. Pode-se generalizar esse resultado da seguinte 
forma: à medida que o tamanho da amostra cresce, a distribuição de pro-
babilidades a posteriori da variável aleatória “proporção de defeituosas” é 
influenciada muito mais pelo tamanho da amostra do que pela distribuição 
de probabilidades a priori.
Atividades de aplicação
As informações a seguir devem ser utilizadas para a resolução dos exercí-
cios de 1 a 5. Um investidor tem R$50.000,00 e deve decidir entre três portfó-
lios preparados por um especialista. Os portfólios são caracterizados como de 
alto risco, médio risco e baixo risco, e os retornos dependem da situação eco-
nômica. Assumindo que somente duas situações econômicas sejam conside-
radas (“crescimento” e “recessão”), a probabilidade de recessão é de 30%. Dada 
a seguinte matriz de resultados (dada em centenas de reais), qual portfólio o 
investidor deveria escolher?
Estados da natureza
Portfólio
Risco alto Risco médio Risco baixo
Crescimento 10 4 2
Recessão -15 -2 1
1. Qual dos três portfólios deve ser escolhido se o critério utilizado for 
o maximim?
2. Para o problema em questão, qual a crítica ao uso desse critério?
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
240
Teoria da decisão
3. Para o critério ganho esperado sob incerteza, qual a decisão a ser to-
mada?
4. Calcule as perdas de oportunidade esperada para cada portfólio. 
5. Faça a representação através do diagrama de decisão para o critério 
minimax.
6. Construa a distribuição de probabilidades acumulada através da uti-
lização de dados de vendas do passado com relação aos números de 
pedidos e ao número de semanas em que eles foram feitos, conforme 
tabela a seguir:
Número de 
 equipamentos 
vendidos
Número de semanas 
que o número de 
ordens foi recebido 
Número de 
equipamentos 
 vendidos
Número de semanas 
em que o número de 
ordens foi recebido
21 1 32 1
22 0 33 1
23 0 34 1
24 2 35 0
25 2 36 0
26 3 37 1
27 3 38 1
28 1 39 1
29 0 40 0
30 0 41 0
31 1 42 1
Dados para os exercícios 7 e 8. Um novo curso está sendo ofertado em 
uma faculdade. Seja “p” a proporção de estudantes que tiveram notas infe-
riores à média no trabalho final do curso. Os estados da natureza e suas res-
pectivas probabilidades condicionais são as seguintes:
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Teoria da decisão
241
P P0(p)
0,05 0,30
0,10 0,40
0,15 0,20
0,20 0,10
7. Das informações dadas, preencha as células em branco e interprete os 
dados. O X é o resultado da pesquisa de 1 000 empresas de construção.
Estados da natureza P0(θ) P(X/θ) P0(θ) P(X/θ) P1(θ/X)
θ1 = casas terão preços aumen-
tados no próximo ano 0,80
θ1 = casas terão preços iguais 
ou diminuídos no próximo ano 0,60
8. São dados os seguintes resultados de um experimento em que θ1 é 
“produto superior” e θ2 é “produto igual ou inferior”. Calcule as proba-
bilidades a priori.
Estados da natureza P(X/θ) P1(θ/X)
θ1 0,50 0,25
θ2 0,50 0,75
 
Gabarito
1. No critério maximim, o tomador de decisão assume que uma vez que 
uma ação seja escolhida a natureza escolherá o estado da natureza 
que minimize o rendimento sob a pior perspectiva.
Estados da 
 natureza Risco alto
Portfólio
risco médio
Risco baixo
Crescimento 10 4 2
Recessão –15 –2 1
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
242
Teoria da decisão
 Possíveis ações: A1 = risco alto, A2 = risco médio e A3 = risco baixo.
 Se o investidor escolher A1, a natureza provocará a ocorrência de θ2 
(recessão) e o resultado será um prejuízo de R$15.000,00. Para a ação 
A2, o resultado será um prejuízo de R$2.000,00, e para A3 o resultado 
será um lucro de R$1.000,00.
 O investidor deve escolher a ação que produza o maior rendimento. 
Nesse caso, a ação A3, é escolher o portfólio de risco baixo.
2. O critério é um critério pessimista. No caso em questão, a decisão 
pelo portfólio de risco baixo dá um retorno de R$2.000,00 se a situa-
ção for de crescimento da economia e de R$1.000,00 para o caso de 
recessão. O investidor ganha nas duas situações, mas ganha pouco.
 Se houver uma situação de crescimento na economia, a aquisição dos 
portfólios de risco médio e risco alto dariam resultados muito bons. 
Valeria a pena ter informações sobre as probabilidades de ocorrência 
dos vários estados da natureza. Se houver uma boa probabilidade de 
crescimento econômico, valerá a pena outra opção.
3. Uma vez que a probabilidade de recessão é de 30% ou0,3, então a 
probabilidade de crescimento é de 70% ou 0,7. Assim, a distribuição 
de probabilidades pode ser expressa pela tabela:
Evento Probabilidade
θ1 = crescimento 0,7
θ2 = recessão 0,3
Total 1
 O valor esperado de cada ação será a média ponderada dos resultados 
para cada ação, tendo como peso as probabilidades de ocorrência de 
cada evento:
Evento Prob. Risco alto
Resultado 
ponderado
Risco 
médio
Resultado
ponderado
Risco 
pequeno
Resultado 
ponderado
θ1 0,7 10 70 4 2,8 2 1,4
θ2 0,3 –15 –45 –2 –0,6 1 0,3
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Teoria da decisão
243
Evento Prob. Risco alto
Resultado 
ponderado
Risco 
médio
Resultado
ponderado
Risco 
pequeno
Resultado 
ponderado
Total 1,0 35 2,2 1,7
Resultado 
esperado R$35.000,00 R$2.200,00 R$1.700,00
 Pelo critério de ganho esperado sob incerteza, o tomador de decisões 
deve escolher aquela ação com maior resultado esperado. No proble-
ma, a ação a ser escolhida é A1, ou seja, escolher o portfólio de risco 
alto, que deve ter como resultado o valor de R$35.000,00.
4. Para determinar as Perdas de Oportunidade Esperada, é necessário 
inicialmente determinar a tabela de perda de oportunidades. Esse cál-
culo é o resultado da diferença entre o ganho daquele ato e o ganho 
para o melhor ato que poderia ter sido selecionado.
Evento
Ganhos Perda de oportunidade
A1 A2 A3 A1 A2 A3
θ1 10 4 2 0 6 8
θ2 –15 –2 1 16 3 0
 A partir da determinação das perdas de oportunidade, podemos cal-
cular agora as perdas de oportunidade esperada para cada ação.
Evento Prob. Risco alto
Resultado 
ponderado
Risco 
médio
Resultado 
ponderado
Risco 
pequeno
Resultado 
ponderado
θ1 0,7 0 0 6 4,2 8 5,6
θ2 0,3 16 4,8 3 1,8 0 0
Total 1,0 4,8 6,0 5,6
Resultado
Esperado
R$4.800,00 R$6.000,00 R$5.600,00
 As perdas de oportunidade esperada para cada portfólio são: risco 
alto POE(A1) = R$4.800,00; risco médio POE(A2) = R$6.000,00; e risco 
pequeno POE(A3) = R$5.600,00.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
244
Teoria da decisão
5. A ação que minimiza a perda de oportunidade esperada é a ação A1, 
cuja perda de oportunidade esperada é R$4.800,00, a menor das três. 
Portanto, a ação a ser tomada é a de investir no portfólio de risco alto.
6. São dados números de aparelhos vendidos e a quantidade de ordens 
recebidas. Ou seja, ocorreu somente em uma semana o pedido de 21 
equipamentos. 24 equipamentos foram pedidos em duas semanas, e 
assim por diante.
Número de 
equipamentos 
vendidos
Número de semanas 
em que o número de 
ordens foi recebido 
Número de 
 equipamentos 
vendidos
Número de semanas 
em que o número de 
ordens foi recebido
21 1 32 1
22 0 33 1
23 0 34 1
24 2 35 0
25 2 36 0
26 3 37 1
27 3 38 1
28 1 39 1
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Teoria da decisão
245
Número de 
equipamentos 
vendidos
Número de semanas 
em que o número de 
ordens foi recebido 
Número de 
 equipamentos 
vendidos
Número de semanas 
em que o número de 
ordens foi recebido
29 0 40 0
30 0 41 0
31 1 42 1
 Reorganizando a tabela e computando as frequências relativas, teremos:
Número de 
 equipamentos vendidos
Frequência de 
ocorrências 
Frequência relativa 
de ocorrências
21 1 0,05
24 2 0,10
25 2 0,10
26 3 0,15
27 3 0,15
28 1 0,05
31 1 0,05
32 1 0,05
33 1 0,05
34 1 0,05
37 1 0,05
38 1 0,05
39 1 0,05
42 1 0,05
 Distribuição de frequências relativas acumuladas:
Número de 
equipamentos 
vendidos
Número de semanas 
em que o número de 
 ordens foi recebido 
Número de 
equipamentos 
vendidos
Número de semanas 
em que o número de 
ordens foi recebido
21 0,05 32 0,70
22 0,05 33 0,75
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
246
Teoria da decisão
Número de 
equipamentos 
vendidos
Número de semanas 
em que o número de 
 ordens foi recebido 
Número de 
equipamentos 
vendidos
Número de semanas 
em que o número de 
ordens foi recebido
23 0,05 34 0,80
24 0,15 35 0,80
25 0,25 36 0,80
26 0,40 37 0,85
27 0,55 38 0,90
28 0,60 39 0,95
29 0,60 40 0,95
30 0,60 41 0,95
31 0,65 42 1,00
 O gráfico da distribuição de frequências acumuladas é a ogiva de 
Galton a seguir:
Distribuição acumulada
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
Pr
ob
ab
ili
da
de
7. Preenchendo os vazios:
Estados da 
natureza P0(θ) P(X/θ) P0(θ) P(X/θ) P1(θ/X)
θ1 = Casas terão 
preços aumenta-
dos no próximo 
ano
0,80 1,00 – 0,60 = 0,40 0,80 . 0,40 = 0,32 0,32/0,44 = 0,73
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Teoria da decisão
247
Estados da 
natureza P0(θ) P(X/θ) P0(θ) P(X/θ) P1(θ/X)
θ1 = Casas terão 
preços iguais ou 
diminuídos no pró-
ximo ano
1,00 – 0,80 = 0,20 0,60 0,20 . 0,60 = 0,12 0,12/0,44 = 0,27 
Total 1,00 1,00 0,32 + 0,12 = 0,44 0,73 + 0,27 = 1,00
 Interpretação das probabilidades:
 P0(θ) – probabilidades a priori dos estados da natureza. A probabilida-
de a priori de que as casas terão seus preços aumentados no próximo 
ano é de 80%. E de não terem seus preços aumentados é de 20%.
 P(X/θ) – probabilidades determinadas através de observações amos-
trais ou de dados do passado.
 P1(θ/X) – probabilidades a posteriori dos estados da natureza. São chama-
das de probabilidades revisadas com base em observações amostrais. 
8. Encontrar os valores de “a” e de “b”.
Estados da natureza P0(θ) P0(θ) P0(θ) P0(θ) P1(θ/X)
θ1 a 0,50 0,5 a 0,25
θ2 b 0,50 0,5 b 0,75
Total 0,5a + 0,5b 
 Sabemos que:
 
0,5
0,25
0,5 0,5
0,5
0,75
0,5 0,5
 = +

 =
 +
a
a b
b
a b
 Resolvendo o sistema de duas equações e duas incógnitas, chegamos 
ao resultado que: a = P0(θ1) = 0,25 e que b = P0(θ2) = 0,75.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Análise de séries temporais
Problema
A empresa ABC é do ramo de informática. Um dos carros-chefe da em-
presa é um novo modem que está tendo muita aceitação no mercado. Os 
diretores desejam fazer previsões de vendas para os próximos meses com 
base nos dados de venda dos últimos 24 meses.
A tabela abaixo apresenta o resultado das vendas:
Tabela 1 – número de modems vendidos
Mês Vendas (R$)
1 48
2 53
3 46
4 51
5 47
6 50
7 49
8 55
9 55
10 51
11 54
12 52
13 51
14 55
15 47
16 51
17 53
249Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
250
Análise de séries temporais
Mês Vendas (R$)
18 56
19 52
20 50
21 50
22 48
23 51
24 53
Desejamos construir um modelo matemático idealmente satisfatório 
dessa série temporal. Idealmente deveríamos procurar definir e medir os 
muitos fatores que determinam as variações da quantidade vendida e então 
estabelecer as relações matemáticas entre esses fatores e a particular série 
em questão. No entanto, as determinantes das mudanças de uma série tem-
poral como essa são múltiplas, incluindo fatores como concorrência, prefe-
rências do consumidor, tecnologia, investimentos, clima, costumes e mais 
uma série de variáveis econômicas e não econômicas. 
A enormidade e a impraticabilidade da tarefa de medir todos esses fa-
tores e então relacioná-los matematicamente dificulta o enfoque chamado 
direto. Assim, a opção por um enfoque mais prático e indireto tem sido a 
opção de contorno dessas dificuldades.
Conceitos fundamentais
A análise de séries temporal clássica é essencialmente um método que 
busca quebrar uma série em distintos componentes que representam os 
efeitos de fatores explanatórios. Esses componentes são: (I) tendência; (II) 
flutuações cíclicas; (III) variações sazonais; e (IV) movimentos irregulares.
Série temporal
Uma série temporal é um conjunto de observaçõesde uma variável quan-
titativa coletada no tempo. A série pode ser determinada em qualquer in-
tervalo de tempo, hora, dia, semana, mês, trimestre ou ano, dependendo do 
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Análise de séries temporais
251
interesse do tomador de decisões ou das condições do estudo ou ainda da 
disponibilidade de informações.
Qualquer variável quantitativa pode ser medida no tempo e na área de 
negócios pode interessar fazer medidas de vendas, preços, inventários e 
assim por diante.
Gráfico de linhas
Como verificado no capítulo de análise de dados, o gráfico adequado 
para a apresentação dos dados de uma série temporal é um gráfico de 
linhas. Para o exemplo da venda dos modems, o gráfico correspondente é 
o apresentado a seguir:
Gráfico de linhas
40
42
44
46
48
50
52
54
56
58
1 24232221201918171615141312111092 3 4 5 6 7 8
Métodos de séries temporais
As técnicas que analisam o comportamento de dados do passado e do 
presente para predizer o futuro são chamadas de modelos de extrapolação. A 
forma geral de tais modelos é Ŷt+1 = f (Yt, Yt-1, Yt-2 ...), em que Ŷt+1 representa o valor 
predito para a variável em questão no período t + 1. Yt representa o valor da série 
no tempo t, Yt-1 representa o valor da série no tempo t – 1 e assim por diante.
O objetivo de um modelo de extrapolação é identificar a função f(.) que 
produza previsões de valores futuros da variável da série temporal.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
252
Análise de séries temporais
Tendência
A tendência se refere a movimentos crescentes ou decrescentes de uma 
série temporal em um longo período de tempo.
Antes que uma tendência de uma particular série possa ser determinada, 
é geralmente necessário submeter os dados a algum tratamento prelimi-
nar, como, por exemplo, verificar a quantidade em relação a uma população 
determinada durante o período em que os dados foram coletados. Dessa 
forma, caracteriza-se a quantidade per capita.
O gráfico a seguir apresenta uma série com tendência crescente. Observe 
que a linha de tendência faz um ângulo significativamente maior que zero 
com o eixo X.
1050
1200
1350
1500
1650
1 20171395
Série temporal estacionária
Uma série temporal é dita estacionária se não há uma tendência de cresci-
mento ou decrescimento significativo nos dados através do tempo. Se a série 
temporal apresentar alguma dessas tendências, ela é dita não estacionária.
Em uma série estacionária, os dados estão espalhados no tempo de forma 
aleatória ao redor de uma reta paralela ao eixo X, que representa os valores da 
média dos dados, apresentando um equilíbrio estável. Uma série pode ser esta-
cionária durante um período e não estacionária durante outro período.
A série a seguir pode ser considerada estacionária. Observe que a linha de 
tendência da série é paralela ao eixo X. 
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Análise de séries temporais
253
80
90
100
110
120
1 1082 3 4 5 6 7 9 11 12 13 14 15 16
Erro Médio Quadrático (EMQ)
Vários métodos podem ser utilizados para modelar dados de uma série 
temporal. Uma forma de avaliar qual é o melhor modelo é estudar qual ex-
plica melhor o comportamento da série em relação aos dados do passado. 
Podemos fazer essa verificação através da comparação dos dados reais (Y) 
com os dados decorrentes do ajuste do modelo (Ŷ).
Com base nas observações acima, podemos definir o Erro Médio Quadráti-
co (EMQ) correspondente a cada um dos modelos propostos. Aquele modelo 
com o menor erro médio quadrático será considerado o mais adequado.
O EMQ é definido como a soma da diferença entre os valores observados 
e valores reais dividida por n.
EMQ =
∑(Y – Ŷ)2
n
O EMQ é bastante próximo do critério de mínimos quadrados ordinários 
utilizado na construção do modelo de regressão linear simples.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
254
Análise de séries temporais
Ciclo
Flutuações cíclicas ou movimentos cíclicos são movimentos de cresci-
mento ou decrescimento recorrentes em torno dos níveis de tendência.
Sazonalidade
Variações sazonais são ciclos que se completam dentro de um período de 
calendário regular, repetindo esse padrão básico ao longo de toda a série. Os 
maiores fatores que produzem esses padrões repetidos ocorrem em séries 
anuais que obedecem a variações sazonais devido ao clima e aos costumes.
Todos os anos, no período que antecede o inverno, há um crescimento 
da venda de roupas para o frio. Também há todo ano um crescimento de 
vendas em datas como o Dia das Mães, Dia dos Pais, Dia das Crianças e no 
período do Natal.
Movimentos irregulares
Movimentos irregulares são flutuações nas séries temporais que têm du-
ração curta, têm natureza errática e não seguem nenhuma regularidade re-
corrente ou outro padrão discernível. 
Método dos mínimos quadrados ordinários
Para situações nas quais é desejável ter uma equação matemática para 
descrever a tendência em uma série temporal, o método mais comumente 
usado é ajustar alguma forma de função polinomial para os dados. Nesta 
seção, vamos ilustrar o método geral através de um exemplo simples, ajus-
tando uma linha reta ao método dos mínimos quadrados.
O método dos mínimos quadrados
O método dos mínimos quadrados, quando usado para ajustar linhas 
retas de tendência em dados de séries temporais, é empregado principal-
mente porque é simples e prático e fornece o melhor ajustamento de acordo 
com um critério razoável.
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Análise de séries temporais
255
No entanto, devemos alertar que o método de mínimos quadrados não 
tem o mesmo tipo de suporte teórico quando aplicado para ajustar retas na 
análise de regressão, conforme visto no capítulo 6.
A maior dificuldade é que as suposições probabilísticas feitas na análise de 
regressão simplesmente não são encontradas na análise de séries temporais. 
No exemplo que analisamos naquele capítulo, verificamos como gastos em 
pesquisa e desenvolvimento tecnológico podem afetar positivamente o fatura-
mento de empresas de informática. Naquele caso, o faturamento era considera-
do uma variável aleatória e o investimento uma variável fixa ou controlada.
Para a variável dependente, o modelo assumia distribuições de proba-
bilidade condicional dessa variável aleatória em torno de seus valores que 
caiam na reta de regressão. Os valores Y eram as médias das distribuições 
de probabilidade condicional. Algumas suposições estavam implícitas nesse 
tipo de modelo: os desvios em torno da reta eram considerados erros alea-
tórios descritos por uma distribuição de probabilidades. As sucessivas ob-
servações da variável dependente foram assumidas como independentes. 
Por exemplo, os gastos da empresa B em p&d não dependiam dos gastos da 
empresa A, e assim por diante.
Se uma reta é ajustada, por exemplo, para uma série de tempo anual 
sobre vendas, o tempo é tratado como a variável independente X e as 
vendas como a variável independente Y. Não é razoável pensar que os des-
vios das vendas reais em um dado ano seja um erro aleatório. De fato, se os 
dados originais são anuais, os desvios em relação à reta podem ser devido 
a operações cíclicas ou fatores irregulares. Se a série for de um ano, não faz 
sentido pensar em fatores sazonais devidos ao clima ou costumes porque a 
série duraria um só período. 
Finalmente, a suposição de independência não é encontrada em uma 
série temporal. As vendas de um determinado mês certamente não são in-
dependentes do que foi vendido no mês anterior.
Ajustamento de uma reta
Como exemplo, vamos ajustar uma reta pelo método dos mínimos qua-
drados para as vendas de computadores de uma grande loja durante o perí-
odo de 1993 a 2007, conforme tabelaa seguir:
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
256
Análise de séries temporais
Ano Tempo Vendas (R$)
1993 1 2.484
1994 2 2.767
1995 3 2.088
1996 4 3.611
1997 5 4.216
1998 6 4.665
1999 7 5.275
2000 8 5.616
2001 9 6.165
2002 10 6.720
2003 11 7.400
2004 12 7.975
2005 13 8.800
2006 14 9.520
2007 15 10.450
A reta de regressão pode ser expressa como Ŷ = a + b t. Os valores de “a” 
e “b” estimados através do método de regressão são substituídos na reta e o 
modelo linear que explica a relação.
O sistema de equações normais é dado então por:
y = a + b t
∑tY = a∑t + b∑t 2
Usualmente, quando uma equação de regressão é utilizada para séries 
temporais, os valores dos tempos são transformados para valores com 
poucos dígitos. Então, o ano 1993 será transformado para 1, o de 1994 para 2 
e assim por diante. Poderíamos também transformar os dados fazendo o ano 
central igual a 0, os anteriores –1, –2 ... e os posteriores 1, 2... Utilizaremos a 
primeira opção. Dessa forma, o sistema de equações normais será:
88 752 = 15a + 120b
8 666 864 = 120a + 1 240b
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Análise de séries temporais
257
Resolvendo o sistema, encontraremos os valores de a = 1 435,43 e b = 
560,17. A reta de regressão será então: Ŷ = 1 435,43 + 560,17 t.
O gráfico que se segue representa os dados originais e a reta de regressão 
ajustada.
4 000
6 000
8 000
10 000
12 000
0 105 15
2 000
0
20
Gráfico de vendas
O valor de r2, o coeficiente de determinação, é igual a 0,987, ou seja, o ajuste é 
bastante bom para essa série. O valor de a = 1 453,43 tem a mesma interpretação 
que na reta de regressão. É o valor de vendas para t = 0, ou seja, para o ano 1992. 
Também b = 560,17 é a variação de vendas para a variação de um ano.
Projeção no tempo
Projeções na reta determinada podem ser obtidas se substituirmos t na 
reta por valores apropriados. Por exemplo, a projeção para vendas de com-
putador para o ano de 2008, por exemplo, pode ser realizada assumindo o 
valor t = 16 na reta de tendência. Então, os valores das vendas seriam Ŷ = 1 
435,43 + 560,17 t = 1 435,43 + 560,17 . (16) = 10 398,2, ou simplesmente 10 
398 computadores.
Essas estimativas podem ser feitas para mais um ou dois períodos, e ainda 
assim há um alto grau de incerteza. Se predições para mais tempo forem 
desejadas, estimativas de outros fatores teriam que ser acrescentados à esti-
mativa da tendência. 
Flutuações cíclicas
Como foi indicado previamente, quando uma série temporal consistir de 
dados anuais, ela poderá conter tendência, ciclo e elementos irregulares. As 
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
258
Análise de séries temporais
variações sazonais estarão ausentes, uma vez que elas ocorrem dentro de 
um ano. Então, desvios dos dados anuais em relação à reta de tendência são 
atribuíveis somente a fatores cíclicos e irregulares. 
Os desvios em relação à tendência são mais facilmente observados divi-
dindo o valor dos dados originais pelos valores correspondentes na linha de 
tendência para o mesmo período. Por convenção, o resultado da divisão do 
dado original pelo valor na linha de tendência é multiplicado por 100 para 
expressar os resultados como percentuais de tendência. 
Assim, se o dado original é exatamente igual ao valor estimado, a per-
centagem de tendência será igual a 100. Se o dado original é maior do que 
o valor estimado, o valor da percentagem de tendência será maior que 100, 
caso contrário será menor.
A expressão para a percentagem de tendência é então dada por:
Percentagem de tendência = (Y/Ŷ).100
Quando convertidos à percentagem de tendência, os dados contêm so-
mente os movimentos cíclicos e irregulares, uma vez que a divisão pela ten-
dência elimina aquele fator. O modelo multiplicativo para a análise fornece a 
lógica desse procedimento. Isto é, os dados originais são vistos como repre-
sentando os efeitos combinados de tendência, ciclo e fatores irregulares.
Em símbolos, T, C e I representam tendência, ciclo e fatores irregulares, 
respectivamente. Dividindo a série temporal original pelos resultados obti-
dos dos valores da tendência, produzem:
= T.C.I
T
Y
Ŷ
= C.I
As percentagens de tendência da série de vendas de computador mos-
trada no início desta seção está apresentada na tabela e no gráfico a seguir:
Tempo Vendas (R$) Yest. %Tend.
1 2.484 1 995,6 124,5
2 2.767 2 555,8 108,3
3 3.088 3 115,9 99,1
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Análise de séries temporais
259
Tempo Vendas (R$) Yest. %Tend.
4 3.611 3 676,1 98,2
5 4.216 4 236,3 99,5
6 4.665 4 796,5 97,3
7 5.275 5 356,6 98,5
8 5.616 5 916,8 94,9
9 6.165 6 477,0 95,2
10 6.720 7 037,1 95,5
11 7.400 7 597,3 97,4
12 7.975 8 157,5 97,8
13 8.800 8 717,7 100,9
14 9.520 9 277,8 102,6
15 10.450 9 838,0 106,2
Percentagem de tendência
90
95
100
105
110
115
120
125
130
1 15141312111092 3 4 5 6 7 8
Tempo
Abaixo e acima da linha que representa 100% estão as percentagens que 
podem mostrar picos e vales durante o período estudado. Esses gráficos de 
flutuações cíclicas são muito úteis na área de negócios e aparecem frequen-
temente em jornais e periódicos econômicos. Eles podem ainda ser utilizados 
para verificar a amplitude das flutuações, da duração dos períodos de expansão 
e contração e para outros itens de interesse dos ciclos de negócios. 
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
260
Análise de séries temporais
Modelo de médias móveis
A técnica conhecida como médias móveis é provavelmente o método 
de extrapolação mais simples para dados estacionários. Com essa técnica, o 
valor predito para a série temporal no período t + 1, denotado Ŷt+1, é simples-
mente a média das k observações anteriores da série, isto é:
Ŷt+1 = (Yt + Yt-1 + ... + Yt-k+1)
K
O valor k determina quantas observações prévias serão incluídas na média 
móvel. Não há um valor de k que seja teoricamente melhor que outro, sendo 
assim devemos tentar vários valores para escolher o melhor.
O primeiro exemplo do capítulo forneceu informações da quantidade de 
modems vendidos durante um período de 24 meses. A tabela a seguir repro-
duz a quantidade das vendas. Observe que para k = 2, o valor Ŷ3 = 50,5 é a 
média entre Y1 = 48 e Y2 = 53. O valor Ŷ4 = 49,5 é a média entre Y2 = 53 e Y3 = 
46, e assim por diante. 
Mês Vendas (R$)
Ŷ p/ média móveis Ŷ p/ média móveis
2 meses 4 meses
1 48
2 53
3 46 50,5
4 51 49,5
5 47 48,5 49,5
6 50 49 49,25
7 49 48,5 48,5
8 55 49,5 49,25
9 55 52 50,25
10 51 55 52,25
11 54 53 52,5
12 52 52,5 53,75
13 51 53 53
14 55 51,5 52
Este material é parte integrante do acervo do IESDE BRASIL S.A., 
mais informações www.iesde.com.br
Análise de séries temporais
261
Mês Vendas (R$)
Ŷ p/ média móveis Ŷ p/ média móveis
2 meses 4 meses
15 47 53 53
16 51 51 51,25
17 53 49 51
18 56 52 51,50
19 52 54,5 51,75
20 50 54 53
21 50 51 52,75
22 48 50 52
23 51 49 50
24 53 49,5 49,75
EMQ 9,55 9,35
Procedimento semelhante se aplica a outros valores de k. Para k = 4, em 
que Ŷ5 = (Y1 + Y2 + Y3 + Y4)/4, os valores restantes são calculados com igual 
procedimento. O gráfico a seguir apresenta as três séries. A série 1 corres-
ponde aos dados reais. A série 2 e a série 3 correspondem às médias móveis 
com k = 2 e k = 4, respectivamente.
Média móvel com k = 2 e k = 4
44
46
48
50
52
54
56
58
1 15131193 5 7 17 19 21 23
Série 1
Série 2
Série 3
Os gráficos mostram que os valores preditos tendem a ser menos volá-
teis, ou mais suaves, do que os dados reais. Isso ocorre porque o método 
de médias móveis retira os picos e os vales. Esse método então é conhecido 
como método de suavização ou alisamento. Quanto maior for o valor de k, 
maior será a suavização, como pode

Mais conteúdos dessa disciplina