Buscar

Livro-Texto Estatística Aplicada Unip - Unidade I

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 51 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 51 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 51 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Autor: Prof. Mauricio Martins do Fanno
Colaboradores: Prof. Flávio Müller Martin
 Prof. André Galhardo Fernandes
Estatística Aplicada
Professor conteudista: Mauricio Martins do Fanno
Formado em Engenharia Mecânica pela Faculdade de Engenharia Industrial (FEI), tem exercido a profissão por 
mais de 30 anos em empresas de porte médio e grande nas funções de gerente e diretor na área de engenharia de 
produção. Simultaneamente, tem exercido o magistério superior há cerca de 30 anos, ministrando disciplinas ligadas às 
ciências exatas e à administração da produção. É pós-graduado em docência do Ensino Superior. Na UNIP, é professor 
desde 1993, acumulando a coordenação de curso e tendo escrito os livros-textos de Estatística, Estatística Aplicada e 
Pesquisa Operacional, todos usados no curso de Administração, na modalidade EaD.
© Todos os direitos reservados. Nenhuma parte desta obra pode ser reproduzida ou transmitida por qualquer forma e/ou 
quaisquer meios (eletrônico, incluindo fotocópia e gravação) ou arquivada em qualquer sistema ou banco de dados sem 
permissão escrita da Universidade Paulista.
U514.66 – 22
Dados Internacionais de Catalogação na Publicação (CIP)
F213e Fanno, Maurício Martins do.
Estatística aplicada. / Maurício Martins do Fanno. – São Paulo: 
Editora Sol, 2022.
116 p., il.
Nota: este volume está publicado nos Cadernos de Estudos e 
Pesquisas da UNIP, Série Didática, ano XXV, n. 2-131/19, ISSN 1517-9230.
1. Estatística aplicada. 2. Distribuição. 3. Amostragem. I. Título.
CDU 519.2
Prof. Dr. João Carlos Di Genio
Reitor
Profa. Sandra Miessa
Reitora em Exercício
Profa. Dra. Marilia Ancona Lopez
Vice-Reitora de Graduação
Profa. Dra. Marina Ancona Lopez Soligo
Vice-Reitora de Pós-Graduação e Pesquisa
Profa. Dra. Claudia Meucci Andreatini
Vice-Reitora de Administração
Prof. Dr. Paschoal Laercio Armonia
Vice-Reitor de Extensão
Prof. Fábio Romeu de Carvalho
Vice-Reitor de Planejamento e Finanças
Profa. Melânia Dalla Torre
Vice-Reitora de Unidades do Interior
Unip Interativa
Profa. Elisabete Brihy
Prof. Marcelo Vannini
Prof. Dr. Luiz Felipe Scabar
Prof. Ivan Daliberto Frugoli
 Material Didático
 Comissão editorial: 
 Profa. Dra. Christiane Mazur Doi
 Profa. Dra. Angélica L. Carlini
 Profa. Dra. Ronilda Ribeiro
 Apoio:
 Profa. Cláudia Regina Baptista
 Profa. Deise Alcantara Carreiro
 Projeto gráfico:
 Prof. Alexandre Ponzetto
 Revisão:
 Kleber Souza
 Lucas Ricardi
Sumário
Estatística Aplicada
APRESENTAÇÃO ......................................................................................................................................................7
INTRODUÇÃO ...........................................................................................................................................................7
Unidade I
1 REVISÃO DOS CONCEITOS BÁSICOS DE PROBABILIDADES E DISTRIBUIÇÕES 
DE PROBABILIDADES ......................................................................................................................................... 10
1.1 Amostragem: processos e conceitos ............................................................................................ 20
1.2 Teoria Elementar da Amostragem ................................................................................................. 22
2 DISTRIBUIÇÃO AMOSTRAL DAS MÉDIAS ............................................................................................... 23
3 DISTRIBUIÇÃO AMOSTRAL DAS PROPORÇÕES ................................................................................... 32
4 DISTRIBUIÇÃO AMOSTRAL DAS SOMAS E DIFERENÇAS .................................................................. 43
Unidade II
5 TEORIA DA ESTIMAÇÃO ESTATÍSTICA ...................................................................................................... 53
6 TEORIA DA DECISÃO ESTATÍSTICA ............................................................................................................ 69
Unidade III
7 CORRELAÇÃO LINEAR .................................................................................................................................... 87
8 REGRESSÃO LINEAR ....................................................................................................................................... 92
7
APRESENTAÇÃO
Prezado(a) aluno(a),
Neste livro-texto, utilizaremos conceitos de estatística como matéria-prima para que possamos 
iniciar os estudos em estatística aplicada. Veremos assuntos próximos da prática profissional, e para isso 
necessitaremos de ferramentas matemáticas elaboradas. 
O estudo da estatística, como de todas as ciências exatas, obriga a repetição, o maior número 
de vezes possível, de exercícios de fixação. No presente livro-texto, os cálculos definidos são 
mostrados uma única vez, mas o aluno deve se lembrar de que terá à disposição nos materiais 
complementares uma grande quantidade de exercícios e problemas e que o aprendizado somente 
será garantido caso eles sejam feitos em sua totalidade.
Veremos em nossa disciplina as populações e as relações entre elas, assim como suas amostras. A 
ideia geral é conhecer primeiro qual o comportamento previsto para populações e amostras e a seguir 
relacioná-las, obtendo previsões com razoável grau de confiança.
INTRODUÇÃO
Esta disciplina será dividida em partes. Primeiramente, nos depararemos com os conceitos básicos da 
amostragem, ou seja, o estudo das relações entre amostras e a população da qual foram retiradas. Trata-se 
basicamente da previsão do comportamento de amostras a partir do conhecimento da população da qual 
foram retiradas. Iniciaremos com uma revisão dos conceitos básicos de probabilidades e suas distribuições, 
necessários para o correto entendimento dos novos conceitos apresentados.
Na sequência, veremos as estimações, ou seja, a partir do conhecimento do comportamento das 
amostras estimaremos o comportamento das populações das quais vieram. Basicamente trataremos 
desse assunto em duas vertentes:
• a previsão do comportamento de uma população a partir do estudo de amostras dela retiradas;
• a comparação entre amostras e populações, na pesquisa de diferenças casuais ou causais.
Por fim, estudaremos as relações e correlações entre duas variáveis e o comportamento matemático 
delas. Procuraremos verificar se dadas duas variáveis, existe entre elas algum tipo de relacionamento e 
se houver, qual é.
Terminados esses assuntos, estaremos aptos a entender como se pode prever um acontecimento 
futuro ou desconhecido, a partir de estudos relativamente menos trabalhosos, permitindo que se 
tenham ferramentas preciosas para a tomada de decisões, em última análise a finalidade básica de 
qualquer ramo profissional.
8
Esperamos que, com esse material, seja possível realizar a conclusão do aprendizado de estatística 
e haja ferramentas para utilizá-la como instrumental básico para seu melhor desempenho profissional.
Bons estudos!
9
ESTATÍSTICA APLICADA
Unidade I
Amostragem: fundamentos
Primeiramente, vamos nos ater aos conceitos básicos da amostragem. Por amostragem, entendem-se 
os procedimentos destinados a estudar as relações entre populações e suas amostras. Através dessas 
relações, podemos prever ou estimar o comportamento de uma população através de amostras dela 
retiradas, ou o que esperar de uma amostra retirada de uma população conhecida, ou ainda comparar 
diferentes amostras verificando se as diferenças que elas apresentam são causais ou não casuais.
Objetivos do módulo
Caso queira saber se uma determinada marca de uísque é boa, é necessário beber a garrafa inteira? 
A menos que você tenha acabado de bebê-la, sua resposta será certamente não. Sabemos que basta 
uma dose para conseguirmos avaliar a qualidade da bebida. Essa pequena dose é chamada de amostra, 
e o processo pelo qual estimamos a qualidade do uísque usando a avaliação de uma amostra é chamado 
de amostragem.
Agora, note que se quiser fazer o mesmo raciocínioem uma feijoada, terá que considerar alguns 
aspectos: O processo de amostragem ainda é válido, mas a amostra certamente terá que ser maior do 
que aquela de uísque. E por que isso? Porque enquanto o uísque é totalmente homogêneo, a feijoada 
tem um alto grau de heterogeneidade. Trocando em miúdos, se você pegar uma pequena amostra da 
feijoada, corre o risco de não provar o paio, que está ruim, e assim chegar a conclusões errôneas.
Em estatística, a medida que nos informa qual é o grau de homogeneidade do universo que estamos 
trabalhando é o desvio padrão, e quanto maior ele for, menos homogêneo serão o universo e a amostra.
Portanto, quando quisermos saber qual é o tamanho que uma amostra deve ter, deveremos entender 
qual é o seu desvio padrão.
Por outro lado, observe que, ao experimentar uma amostra para saber como funciona o universo 
todo você está fazendo uma estimação, ou seja, uma previsão do todo a partir de uma parte. Isso é 
possível, mas com um cuidado fundamental: a previsão está sujeita a um erro estatístico, ou seja, uma 
tolerância para mais e para menos em torno do valor previsto. Tal tolerância é chamada de margem de 
erro da estimativa e deve ser estabelecida em função da precisão da resposta que espera obter. Note 
que, quanto menor for o erro aceito, maior será o tamanho da amostra que terá que ser colhida, ou seja, 
mais cara será sua amostragem.
Consequentemente, quando quisermos saber qual é o tamanho que uma amostra deve ter, deveremos 
estabelecer qual é o erro máximo esperado.
10
Unidade I
Por fim, é necessário notar que a estimativa merece certa confiança de sua parte, ou seja, o quanto 
você acredita que ela está certa. Lembre-se de que se quiser ter 100% de confiança, terá que pagar 
por isso. A amostra ficará grande e cara. Na maior parte das vezes, uma confiança de 90 ou 95% é 
suficientemente boa para podermos tomar uma decisão segura e coerente. Certamente você trabalhou 
com uma confiança muito menor quando decidiu pedir a mão daquela garota bonita ou aceitou o 
pedido de casamento daquele galante rapaz.
Portanto, quando quisermos saber qual é o tamanho que uma amostra precisa ter, precisaremos 
estabelecer qual é o nível de confiança com que devemos trabalhar.
Note que grande parte de nossas preocupações no processo de amostragem é a determinação do 
tamanho das amostras.
Amostragem, fundamentalmente, é o processo de colher amostras, estudá-las, determinando suas 
medidas estatísticas e, a partir desse estudo, induzir os parâmetros populacionais.
Quando falamos que estamos estimando um parâmetro estatístico, queremos dizer que a partir do 
conhecimento de uma medida estatística iremos prever o valor da medida (parâmetro) populacional. Por 
exemplo, suponha que tenhamos escolhido aleatoriamente 100 alunos de estatística, dentro de uma população 
de 1.000 estudantes, coletado as notas de cada um deles e encontrado a média dessas notas. Imagine que tal 
média tenha sido 5,6. É lógico supor, em princípio que a média de todos eles também seja igual a 5,6.
A fim de diferenciarmos as duas informações, utilizaremos simbologia diferente para as medidas 
estatísticas e os parâmetros populacionais. Assim sendo, diríamos que para a amostra de 100 alunos a 
média é: X = 5,6, e que para a população de 1.000 estudantes a média estimada é µ = 5,6. Ambas medidas 
estatísticas são simbolizadas por letras do nosso alfabeto e os parâmetros estatísticos por letras gregas.
Essa estimativa realizada é chamada de estimativa por pontos e normalmente é preterida em favor 
daquelas realizadas por intervalos, que indicam a precisão ou exatidão. As estimativas por intervalos são 
dadas por dois números obtidos pela introdução do conceito de erro estatístico.
Consequentemente, seria preferível apresentar a estimativa anterior da seguinte maneira: o valor 
estimado para a média dos 100 estudantes mencionados é de 5,6±0,2, ou seja, a média será um valor 
entre 5,4 e 5,8. O valor 0,2 é o erro esperado nessa estimativa.
Os cálculos envolvendo essas estimativas, bem como outras dimensões dos processos de amostragem, 
serão mostrados.
1 REVISÃO DOS CONCEITOS BÁSICOS DE PROBABILIDADES E DISTRIBUIÇÕES 
DE PROBABILIDADES
Quando falamos de amostragem estamos tendo em mente a ideia de previsão, predição, estimativa, 
ou seja, algo que é provável de vir a ocorrer, mas que não é certo. Isso nos remete aos conceitos de 
probabilidades já estudados, os quais iremos rapidamente revisar nesse momento.
11
ESTATÍSTICA APLICADA
Entre as definições de probabilidades, a que nos mais será útil é a que a define como uma frequência 
relativa, ou seja, a divisão do número de ocorrências de um evento pelo número total de vezes que essa 
circunstância foi repetida. Assim, por exemplo, se jogarmos uma moeda (que não sabemos a priori se é 
honesta ou viciada) 1.000 vezes e obtivermos 575 caras, podemos assumir que para ela em particular a 
probabilidade de se obter cara em uma jogada é de 57,5%, isso porque:
i
fi 575
p fr 0,575 ou 57,5
ft 1000
= = = =
Recordando a simbologia:
p = probabilidade de ocorrência; no nosso caso, probabilidade de sair cara
fri = frequência relativa, relação entre as frequências simples e total
fi = frequência simples; no nosso caso, quantas caras ocorreram
ft = frequência total; no nosso caso, quantas vezes a moeda foi jogada
Desse modo, a probabilidade de essa moeda em particular resultar em cara em uma jogada em 
particular é de 57,5%, o que parece querer dizer que se trata de moeda viciada. Essa afirmação na verdade 
é uma hipótese, veremos mais à frente que essa possibilidade pode ser confirmada ou desmentida, com 
determinado grau de exatidão.
Vamos assumir, por ora, que a tal moeda seja honesta, e que nós estejamos apostando os resultados 
dela. Na próxima jogada, a moeda poderá resultar em cara ou coroa. Não temos a menor possibilidade 
de prever o que acontecerá, e o mesmo se sucederá a cada jogada que fizermos. Porém, se eu convidá-lo 
para um jogo no qual eu venço se sair cara, você provavelmente não aceitará participar. Por uma razão 
muito simples, ambos sabemos que a moeda é viciada, e, portanto, em cada jogada eu terei uma 
porcentagem a mais de probabilidade de vencer do que você. Mas isso não é uma certeza a cada jogada.
Talvez, se o ganho for grande, até topem jogar com essa moeda apostando coroa, já que suas 
chances de vencer ainda são grandes (42,5%); todavia, se o jogo consistir em muitas repetições e o outro 
sempre estiver sendo favorecido pela ocorrência de cara, dificilmente aceitarão o jogo.
Por exemplo, suponha que o jogo seja a repetição da jogada nove vezes e ganha quem obtiver 
mais caras (eu) ou mais coroas (você). A probabilidade de você ganhar esse jogo será de apenas 32%, 
enquanto a minha será de 68%. Isso porque o vício da moeda vai fincando mais evidente e mais estável 
quanto mais vezes repetirmos as jogadas. Isso é claro, mas o que nos interessa é como eu calculei essas 
duas probabilidades.
Esse cálculo é feito através do conceito conhecido como distribuição de probabilidades, o qual também 
já vimos. As distribuições de probabilidades são muito parecidas com as tabelas de frequências-base 
12
Unidade I
para todos os cálculos de estatística descritiva, o campo da estatística que trata da descrição das 
amostras e que foi nosso assunto na disciplina anterior.
A grande diferença entre as tabelas de frequências e as distribuições ou tabelas de probabilidades 
é o tempo em que os eventos ocorrem. Tabelas de frequência referem-se ao passado ou ao presente. 
Distribuições de probabilidades ao futuro.
Em uma situação ideal e utópica, ambas as tabelas seriam idênticas. Por exemplo, se fizéssemos 
um estudo das notas de estatística de um grupo de alunos e esse estudo fosse absolutamente preciso, 
chegaríamos a valores idênticos nas duas situações. Claro que isso não é possível, mas, se fosse, 
poderíamos afirmar algo do tipo: 22% dos alunos irão tirar notas finais de Estatística entre 7 e 8. 
Quando as avaliações fossemefetivamente executadas em 50 alunos, teríamos exatamente 11 com 
notas entre 7 e 8.
Apesar de não ser viável essa exatidão toda, é possível chegarmos bem perto do resultado desejado 
verdadeiro, isso porque o comportamento das amostras e populações não só são bastante proporcionais 
como, principalmente, os comportamentos probabilísticos dos experimentos estatísticos são previsíveis 
e equacionáveis, seja qual for o ramo do conhecimento humano trabalhado.
Esses equacionamentos são modelos matemáticos que representam o comportamento de um 
experimento prático, dependendo das características particulares de cada situação. Isso vale para 
coisas tão díspares como a previsão das notas de Estatística, a eficácia de um novo medicamento ou a 
produtividade estimada de um processo industrial.
Vários são esses modelos matemáticos, sendo que os principais foram vistos na disciplina de 
Estatística, notadamente a distribuição binomial e a distribuição normal.
O jogo proposto anteriormente tem suas probabilidades calculadas pela distribuição binomial, visto 
apresentar as características recomendadas, que, como visto, são:
• envolvem variáveis discretas;
• existem apenas dois eventos possíveis, complementares;
• tratam-se de eventos cujas probabilidades são independentes.
Recordando, a formulação matemática é dada por:
x n xn!P(X x) p (1 p)
x!(n x)!
−= = × × −
−
Onde:
• P(X = x) é a probabilidade que o número de sucessos obtidos seja exatamente igual a x.
13
ESTATÍSTICA APLICADA
• n é o número de tentativas realizadas, ou seja, quantas vezes o experimento é realizado.
• x é o número de sucessos que desejamos obter.
• p é a probabilidade de sucesso em uma única tentativa.
Retomando o jogo proposto, no qual n = 9 jogadas, p = 0,575 e x = 0 a 9, teríamos as seguintes 
probabilidades:
Tabela 1
Nº de caras Nº de coroas Quem ganha Probabilidade de ocorrência Somatório
0 9 Você 0,05%
32,09%
1 8 Você 0,55%
2 7 Você 2,98%
3 6 Você 9,41%
4 5 Você 19,10%
5 4 Eu 25,84%
67,91%
6 3 Eu 23,31%
7 2 Eu 13,51%
8 1 Eu 4,57%
9 0 Eu 0,69%
Perceba que suas chances de vencer o jogo são bem menores que as minhas e observe também que 
na tabela anterior estão calculadas e relacionadas as probabilidades de acontecer todos os resultados 
possíveis. Essa é a distribuição de probabilidades do experimento que tomamos como exemplo. Caso 
efetivamente lançássemos a moeda nove vezes, provavelmente, mas não certamente, teríamos uma 
tabela, agora de frequências, muito semelhante à anterior.
 Lembrete
Tabelas de frequência referem-se ao passado ou ao presente. Consistem 
em distribuições de probabilidades ao futuro.
Essas mesmas informações poderiam ser apresentadas na forma gráfica, mais visual e de melhor 
entendimento. Nesse nosso exemplo, o gráfico ficaria assim:
14
Unidade I
0 2 4 6 8 10
30,00%
25,00%
20,00%
15,00%
10,00%
5,00%
0,00
Número de caras obtidas
Pr
ob
ab
ili
da
de
s
Nove lances de uma moeda com 57,5% de 
probabilidades de sair cara
Figura 1
Sempre que nos deparamos com experimentos estatísticos com as características desse modelo 
matemático, chamado de distribuição binomial, nos é adequado, mas nem todos os experimentos 
têm essas particularidades. Experimentos com outras características devem ser tratados com outros 
modelos matemáticos, que já vimos ou ainda veremos. São exemplos dessas distribuições a de Poison; a 
hipergeométrica; a exponencial; a t de student, entre outras, e principalmente a distribuição normal ou 
distribuição de Gauss, a mais importante de todas.
A distribuição normal é a mais utilizada em todos os campos do conhecimento humano (daí seu 
nome normal), e em especial na administração. A imensa maioria dos experimentos estatísticos ligados 
à administração é tratada pela normal, que é uma distribuição para variáveis contínuas, mas que pode 
ser usada para variáveis discretas desde que o tamanho conjunto universo seja igual ou superior a 30.
Vamos partir dessa última informação para entender o funcionamento da normal. O raciocínio é 
chamado de aproximação da distribuição binomial pela normal.
Suponha que no caso da moeda viciada com 57,5% de chances de sair cara sejam efetuadas cem 
jogadas e não mais apenas nove. Os raciocínios e cálculos são idênticos, apenas mais trabalhosos e 
cansativos. Usando recursos computacionais e transformando as informações obtidas para a forma 
gráfica teríamos o seguinte comportamento estatístico:
0 20 40 60 80 100 120
9,00%
8,00%
7,00%
6,00%
5,00%
4,00%
3,00%
2,00%
1,00%
0,00
-1,00
Número de caras obtidas
Pr
ob
ab
ili
da
de
s
Cem lances de uma moeda com 57,5% de
probabilidade de sair cara
Figura 2
15
ESTATÍSTICA APLICADA
Perceba que os gráficos se assemelham, mesmo porque ambos se referem a distribuições binomiais, 
mas o segundo aproxima-se muito do formato padrão da distribuição normal, apesar de se referir a 
variáveis discretas.
Caracteristicamente, a distribuição normal é uma curva em formato de sino que atinge um valor 
máximo coincidente com a média da distribuição. No caso que estamos focando, o número médio de 
caras esperado seria de 57,5, como mostra o gráfico e como também estabelece a forma de cálculo da 
média da distribuição binomial, dado por:
µ = Np, no nosso caso, µ = 100 * 0,575 = 57,5 caras
Evidentemente, não é possível obtermos 57,5 caras, ou serão sorteadas 57 ou 58, cujas probabilidades 
de ocorrência, por esse motivo, são calculadas pela fórmula binomial, ou seja:
( ) ( ) ( )
n xxn!P X x p 1 p
x! n x !
−= = × × − →
−
( ) ( ) ( )
100 5757100!P X 57 0,575 1 0,575 0,0800 ou 8,00%
57! 100 57 !
−= = × × − =
−
( ) ( ) ( )
100 5858100!P X 58 0,575 1 0,575 0,0802 ou 8,02%
58! 100 58 !
−= = × × − =
−
Perceba que o valor encontrado nas fórmulas é exatamente aquele mostrado no gráfico.
 Observação
Perceba que se as operações matemáticas das fórmulas citadas forem 
efetuadas em uma calculadora normal, tipo, por exemplo, a HP12C, o 
resultado obtido não será o mostrado, isso porque os valores trabalhados 
são muito grandes, estouram a capacidade da calculadora. Os resultados 
exibidos foram atingidos através do uso da planilha eletrônica Excel. 
Poderiam também ser conseguidos pelo cálculo passo a passo, usando-se 
números arredondados.
Como dito anteriormente, a curva normal tem a aparência de um sino, cujo ponto máximo é o valor 
médio provável, também chamado de valor esperado. Já a largura dela é dada pelo desvio padrão da 
distribuição. No nosso exemplo, como estamos ajustando uma distribuição binomial pela distribuição 
normal, o desvio padrão seria dado por:
16
Unidade I
( )N p 1 pσ = × × −
( )no nosso caso seria 100 0,575 1 0,575 4,94 5 carasσ = × × − = ≅
Portanto, existe um desvio padrão de 5 caras para mais ou para menos, o que significa que o mais 
provável é obtermos em 100 jogadas dessa moeda viciada entre 53 e 63 caras. Sabemos que essa 
probabilidade é de aproximadamente 70%. A seguir vemos tal afirmação na forma de gráfico:
0 20 40 60 80 100 120
9,00%
8,00%
7,00%
6,00%
5,00%
4,00%
3,00%
2,00%
1,00%
0,00
-100,00
Número de caras obtidas
Pr
ob
ab
ili
da
de
s
Cem lances de uma moeda com 57,5% de
probabilidade de sair cara
53 63
aproximadamente 70% da 
área total sob a curva
Figura 3
Note que a área entre o valor correspondente a 53 caras e o referente a 63 caras abrange por volta 
de 70% da área total do gráfico sob a curva. Isso nos permite afirmar que a probabilidade de se obter 
entre 53 e 63 caras ao jogar a referida moeda é de cerca de 70%.
Esse raciocínio pode ser aplicado a variáveis discretas quando o número de elementos envolvidos 
é muito alto (acima de 30), como, principalmente,quando trabalhamos com variáveis contínuas. Além 
disso, o cálculo dessas probabilidades será muito mais fácil do que usar, por exemplo, a fórmula da 
distribuição binomial.
 Observação
Quando falamos em aproximadamente 70%, estamos favorecendo a 
rápida leitura. O valor na verdade é de 68,26%.
Conceitualmente, a distribuição normal é usada quando trabalhamos com variáveis contínuas, 
apesar de ser possível o uso para variáveis discretas, como já visto. A distribuição normal é, portanto, 
caracterizada por duas informações: a média provável ou também chamada de valor esperado e o 
desvio padrão dessa média. Conhecidos esses dois valores, enxergamos o comportamento estatístico da 
situação estudada.
17
ESTATÍSTICA APLICADA
Isso é especialmente importante para nós quando tratamos de amostragens. Podemos determinar 
para uma amostra a média e o desvio padrão e depois extrapolar para toda a população da qual foi 
retirada a amostra o comportamento previsto para esses indivíduos.
Vamos rever através de um exemplo como funcionaria esse raciocínio teórico, vinculando-o inclusive 
aos conceitos básicos de amostragem.
Uma nova máquina, mais automatizada, está nos sendo oferecida pelo fabricante com o argumento 
de venda de que é mais produtiva dos que as máquinas de que dispomos atualmente. Em princípio, uma 
nova máquina nos interessaria se apresentasse uma produtividade acima de 86 toneladas por hora. 
Para verificar se isso é provável, realizou-se um acompanhamento da máquina em produção durante 
168 horas, chegando-se na tabela a seguir.
Tabela 2
Produtividade horária em toneladas Quantidade de horas analisadas
Limite inferior Limite superior Frequência simples
80 |----- 82 28
82 |----- 84 35
84 |----- 86 46
86 |----- 88 32
88 |----- 90 27
Consta a informação, entre outras coisas, que em 28 horas trabalhadas a produtividade da máquina 
esteve entre 80 e 82 toneladas por hora.
Sabemos calcular para essa amostra a média e o desvio padrão, e a tabela a seguir irá nos ajudar 
nesse cálculo.
Tabela 3
Produtividade horária 
em toneladas
Quantidade de 
horas analisadas Ponto médio 
de classe
Ponto médio 
de classe vezes 
frequência 
simples
Desvios ao 
quadrado vezes 
frequência 
simples
Limite 
inferior |--|
Limite 
superior Frequência simples
80 |--- 82 28 81 2268 426
82 |--- 84 35 83 2905 126
84 |--- 86 46 85 3910 0
86 |--- 88 32 87 2784 141
88 |--- 90 27 89 2403 454
Somatórios 168 14270 1147
18
Unidade I
O cálculo da média é dado por:
pmi fi 14270
X 84,9 toneladas por hora
fi 168
∑ ×= = =
∑
Já o cálculo do desvio padrão obtém-se através de:
( )2xi X fi 1147
S 2,6 toneladas por hora
fi 1 168 1
∑ − ×
= = =
∑ − −
Os cálculos feitos nos permitem afirmar que para a amostra que coletamos, de 168 horas de produção 
apresentaram uma produtividade média de 84,9 toneladas por hora com desvio padrão de 2,6 toneladas 
por hora. Isso é verdade absoluta para a referida amostra e, com certeza, é algo bem próximo para o 
funcionamento dessa máquina ao longo do tempo. Deixando claro que como a amostra apresentou 
uma produtividade média de 84,9 toneladas por hora é lícito pensar que ao longo de todo o futuro 
funcionamento a produtividade horária será provavelmente de 84,9 toneladas por hora. É lícito, mas 
não é absolutamente certo. É possível e, mais que isso, é esperada uma variação em torno desse valor. 
Essa variação é caracterizada pelo desvio padrão de 2,6 toneladas por hora.
É possível que ao longo do tempo a máquina apresente produtividade maior ou menor, e assim 
sendo talvez ela apresente produtividade média superior a 86 toneladas por hora, que é o que deseja a 
empresa compradora. A questão é: qual a probabilidade que isso ocorra?
O cálculo dessa probabilidade será dado pelos conceitos de distribuição normal. A figura a seguir nos 
dá uma visão gráfica do que queremos calcular. Note que é apenas um esboço.
Pr
ob
ab
ili
da
de
s
Produtividade
84,9 86 em toneladas por hora
Área que engloba a probabilidade 
de a máquina apresentar uma 
produtividade superior a 
86 toneladas por hora
Figura 4
A resposta a essa questão é obtida através do cálculo da área percentual mostrada na figura. Esse 
cálculo, descrito em estatística, é feito com o auxílio da tabela das áreas sob a curva normal reduzida.
19
ESTATÍSTICA APLICADA
x 86 84,9
z 0,42
2,6
− µ −= = =
σ
Com esse valor de z, entramos na tabela e encontramos uma área tabelada correspondente, no caso, 
Atab = 0,6628. Como a área tabelada é a que está à esquerda do valor considerado e a área que 
queremos está à direita, devemos subtrair a área tabelada de 1, obtendo então a área pedida: 
Ap = 1 – Atab = 1-0,6628 = 0,3372 ou 33,72%.
Isso quer dizer que a máquina tem 33,72% de probabilidade de operar com produtividade média 
acima de 86 toneladas por hora.
Note que não temos possibilidade nesse texto teórico para dizer se isso é bom ou mau, mas teríamos 
todas as informações necessárias para tomar uma decisão racional frente a uma situação real.
Encerrando nossa revisão, devemos notar que no exemplo anterior nos foi dada uma condição e 
calculamos a probabilidade de que ela ocorra. Poderíamos ter a situação inversa, ou seja, ter que calcular 
qual a condição que atenda a uma determinada circunstância.
Imagine que para a máquina mencionada não queiramos correr um risco de mais de 20% de não 
atingir a determinada produtividade. Qual seria essa produtividade?
Observe o gráfico da figura a seguir:
Pr
ob
ab
ili
da
de
s
Produtividade
Risco de 20%
? 84,9 em toneladas por hora
Figura 5
Entrando na tabela da curva normal reduzida com o valor 0,2000 (ou seja, 20%) encontramos que o 
valor de z correspondente é de -0,84 (valor mais próximo). Usando a fórmula de equivalência, teríamos:
x x 84,9
z 0,84
2,6
− µ −= → − = →
σ
20
Unidade I
x 84,9 0,84 2,6 x 82,7 toneladas por hora= − × → =
Portanto, o risco de a máquina ter uma produtividade menor ou igual a 82,7 toneladas por hora é 
igual ou menor que 20%.
1.1 Amostragem: processos e conceitos
O conhecimento do que é probabilidade e de como operam suas distribuições nos será útil para 
conceituar e operacionalizar os cálculos que envolvem os processos de amostragem. Em primeiro lugar, 
vamos retornar rapidamente às definições fundamentais de população e amostra.
Definimos anteriormente que população é o conjunto de todos os elementos possíveis que 
apresentam entre si uma característica comum sendo estudada. Por exemplo, os eleitores de 
uma determinada região geográfica que vão eleger um novo mandatário, ou todas as empresas 
de determinada indústria que estão fazendo orçamentos para um próximo período, ou então os 
potenciais compradores de roupas de praia para o próximo verão.
É característico da população o grande número de elementos que ela geralmente envolve e/ou o 
fato de os elementos dela apresentarem valores prováveis e não reais. Essas características nos trazem 
problemas operacionais grandes. Como prever quem será o próximo prefeito em uma eleição que 
ocorrerá em uma cidade que tem, digamos, 200 mil eleitores?
A resposta é o processo de amostragem, que se inicia com a definição de amostra, um “pedaço coerente” 
da população. Essa “coerência” diz respeito à necessidade de a amostra reproduzir percentualmente a 
composição dos indivíduos em tudo aquilo que é determinante para o comportamento estatístico das 
pessoas. Por exemplo, é sabido que o nível socioeconômico de um eleitor interfere nas suas intenções 
de voto; assim sendo, uma amostra eleitoral deve ter uma porcentagem de elementos de cada nível 
socioeconômico idêntico à população.
Caso um conjunto de elementos seja realmente uma amostra da população, é correto se 
afirmar que o comportamento de ambas, população e amostra, serão semelhantes, não idênticos. 
Assim, se em uma amostra de eleitores o candidato X tiver 25% de intenção de votos, é lógico se 
esperar que na população da qual fosse tirada a amostra ele teria os mesmos 25%. Evidentemente 
que issonão é exato, trata-se de uma aproximação. Se ele vir a ter 26% dos votos na população 
toda, não ficaremos surpresos.
A ideia básica então passa a ser aceitar que população e amostra provavelmente terão o mesmo 
valor para uma determinada medida de tendência central (média, mediana, moda etc.), mas não com 
exatidão. A esse raciocínio damos o nome de estimativa e toda ela está sujeita a uma margem de erro, 
faixa na qual o verdadeiro valor estimado pode se localizar.
A margem de erro depende basicamente de três fatores que se justapõem:
21
ESTATÍSTICA APLICADA
• Homogeneidade da população: populações mais homogêneas permitem estimativas mais exatas, 
com menor margem de erro. Quem vai nos dar a medida de homogeneidade da população é o 
desvio padrão.
• Tamanho da amostra: quanto maior for a amostra, maiores serão as previsões a partir delas. 
Ocorre, no entanto, que aumentar o tamanho da amostra implica em subir o custo do estudo 
estatístico. Sabemos que o custo se eleva muito mais rapidamente do que a margem de erro cai.
• O nível de confiança com que desejamos trabalhar: caso queiramos trabalhar com confiança total 
(100%), teremos que pagar por isso, e o custo é alto. Sabemos que níveis de confiança menores 
(95%, por exemplo) nos dão uma margem adequada a um custo razoável.
No fundo, o cálculo em um processo de amostragem é dado pelos passos:
• Planejar a amostra através da determinação e reprodução percentual das características 
intervenientes (aquelas que influem no que está sendo estudado) da população.
 Saiba mais
A coerência da amostra com a população depende do correto 
relacionamento percentual das características intervenientes. No Brasil, 
a enorme maioria desses aspectos é mensurado pelo IBGE – Instituto 
Brasileiro de Geografia e Estatística, que pode ser acessado em:
<https://ibge.gov.br/>.
• Aplicar os conceitos de estatística descritiva na amostra, determinando as medidas estatísticas 
que nos interessam (o mais frequente é trabalharmos com a média e o desvio padrão).
• Estimar o comportamento da população através do cálculo da margem de erro.
 Lembrete
População é o conjunto de todos os elementos possíveis que apresentam 
entre si uma característica comum sendo estudada.
Apesar de que, quando falamos de amostragem, surge em nossa mente a ideia de que estimar 
uma população a partir de uma amostra, nem sempre é o que acontece. Didaticamente, podemos 
dividir os conceitos de amostragem em três campos diferentes, de acordo com as informações que 
temos e as conclusões que queremos obter:
22
Unidade I
• Teoria Elementar da Amostragem: conhecemos o comportamento estatístico da população e 
queremos prever como devem se comportar amostras que forem efetivamente retiradas dela. 
Um campo importante de utilização desses conceitos em administração é o controle estatístico 
de qualidade, quando sabemos como a população deve se comportar e queremos saber se a 
amostra retirada corresponde efetivamente ao esperado. Por exemplo, compreendemos que 
determinada peça usinada em uma máquina automática deve apresentar um diâmetro de 10,2 mm. 
Em certo momento, tomamos na produção dessa máquina 50 peças ao acaso e medimos uma a 
uma. Notamos que o diâmetro médio delas é de 10,1 mm. O que significa isso? A máquina está 
funcionando normalmente? Ele está com problemas? É necessário calcular a resposta.
• Teoria da Estimação Estatística: aqui desejamos estimar o comportamento estatístico da população 
a partir de amostras coletadas. As amostras são estudadas e com base delas estimamos os hábitos 
da população. É o uso mais clássico da amostragem e um exemplo recorrente em administração 
é a medição de eficiência ou eficácia de processos operacionais. Um modelo comum é a pesquisa 
de mercado, na qual desejamos saber, por exemplo, a quantidade prevista de vendas de um novo 
produto. Tomamos uma amostra, analisamos como ela se comporta frente a essa questão e 
extrapolamos as conclusões para a população.
• Teoria da Decisão Estatística: quando comparamos duas ou mais amostras ou duas ou mais populações 
entre si, certamente encontraremos diferenças. Essas distinções, no entanto, podem advir de fatores 
que ocorrem ao acaso (diferenças casuais) ou de elementos devidos às características intrínsecas 
de cada conjunto (diferenças causais). Digamos que estejamos estudando a produtividade de dois 
métodos. O processo A apresenta uma produtividade de 180 toneladas por hora e o processo B, de 
170 toneladas por hora. Essa diferença em favor do primeiro é devido a uma causa (ele é efetivamente 
melhor que o segundo) ou é apenas decorrência do acaso (por motivos indeterminados, neste estudo, 
o resultado do processo A foi melhor do que o do B)?
De modo didático, iremos estudar separada e sucessivamente esses três campos.
1.2 Teoria Elementar da Amostragem
Ao retirarmos amostras aleatórias de uma população, teremos comportamentos diferentes. Por exemplo, 
cada uma das amostras coletadas pode apresentar uma média. Esses valores obtidos irão compor um 
conjunto ao qual nos referimos como distribuição amostral da referida medida estatística, por exemplo, 
distribuição amostral das médias.
Não é só a média que apresenta distribuições amostrais, todas as outras medidas estatísticas o 
fazem. Entre elas, temos as distribuições amostrais das proporções, distribuições amostrais da soma ou 
diferença de duas médias, distribuições amostrais da soma ou diferença de duas proporções, distribuição 
amostral das variâncias, distribuições amostrais dos desvios padrões etc.
No presente livro-texto iremos nos ater às principais delas, ressaltando que as demais seguem 
exatamente os mesmos princípios, alterando fundamentalmente o cálculo do erro padrão.
23
ESTATÍSTICA APLICADA
Como médias são as medidas de posição mais utilizadas, começaremos o estudo por elas estendendo 
posteriormente o conceito para as demais distribuições.
2 DISTRIBUIÇÃO AMOSTRAL DAS MÉDIAS
Imagine uma população de grande quantidade de valores, da qual são retiradas todas as amostras 
possíveis de tamanho N. Para cada uma dessas amostras, podemos calcular uma determinada grandeza 
estatística – digamos, por exemplo, a média, a qual irá variar em toda amostra. Todos os valores calculados 
juntos formarão uma distribuição amostral, que no caso da média se chamará distribuição amostral das 
médias. Para essa distribuição, como qualquer outra, podem ser calculados a média e o desvio padrão; 
portanto, podemos falar de média e desvio padrão da distribuição amostral das médias, por exemplo.
Observe o exemplo a seguir, tendo em mente que se trata de um modelo muito simples, com 
pouquíssimos elementos, visto que desejamos entender o funcionamento das definições anteriores. 
No mundo real teríamos populações infinitamente maiores e amostras com maior número de elemento.
Temos uma população composta pelos seguintes valores {2;4;6;8;10}. Como são poucos números 
(o que na prática nunca acontece), podemos calcular diretamente a média e o desvio padrão.
ix 2 4 6 8 10 30 6
N 5 5
∑ + + + +µ = = = =
2 2 2 2 2 2
id 4 2 0 2 4 16 4 0 4 16 40 2,8
N 5 5 5
∑ + + + + + + + +σ = = = = ≅
 Lembrete
Desvio padrão é um tratamento matemático para os desvios 
apresentados pelos elementos do conjunto; já desvio é a diferença entre o 
valor de um elemento e o valor da medida de tendência central.
Para o cálculo do desvio padrão, seguimos o critério estabelecido por Kazmier (1982), ou seja:
2
idDesvio padrão de amostra S
n 1
∑→ =
−
2
idDesvio padrão da população
N
∑→ σ =
24
Unidade I
Observe que calculamos a média e o desvio da população, tanto que simbolizamos média e desvio 
padrão pelos símbolos µ e σ e não por X e S, característicos das amostras.
Vamos imaginar agora que sorteemos ao acaso amostras de tamanho dois dessa população, ou seja, 
aleatoriamente dois dentre os cinco elementos. Poderíamos obter 25 amostras diferentes, mostradas na 
tabela a seguir:
Tabela 4
2;2 4;2 6;2 8;2 10;2
2;4 4;4 6;4 8;4 10;4
2;6 4;6 6;6 8;610;6
2;8 4;8 6;8 8;8 10;8
2;10 4;10 6;10 8;10 10;10
 Observação
As amostras anteriores foram tomadas com reposição, ou seja, o valor 
sorteado em primeiro lugar é reposto e pode ser sorteado também no 
segundo momento. Esse critério faz com que tenhamos uma população 
semelhante às populações infinitas. Muitas vezes a amostragem será sem 
reposição ou sobre populações finitas. Nesses casos, deveremos introduzir 
um fator de correção.
Cada uma das amostras retiradas terá evidentemente uma média. Utilizaremos uma delas como 
exemplo: (4;8). Seu valor médio seria 6:
4 8
X 6
2
+= =
Assim, todas as outras amostras teriam suas respectivas médias, como mostrado a seguir:
Tabela 5
2 3 4 5 6
3 4 5 6 7
4 5 6 7 8
5 6 7 8 9
6 7 8 9 10
25
ESTATÍSTICA APLICADA
Imagine que calculemos a média dos números agora apresentados. Estaríamos calculando uma 
média das médias das amostras. Para tanto, bastaria somar as 25 médias e dividir por 25, ou seja, 
150 dividido por 25, o que resulta em 6. Perceba então que a média das médias das amostras 
( )Xµ apresenta o mesmo valor da média da população (µ).
Esse raciocínio demonstra que podemos calcular a média de uma população diretamente, o que 
em geral é impossível em função da enorme quantidade de elementos envolvidos, ou através do 
cálculo sucessivo das médias das amostras e em sequência das médias das médias das amostras.
Note que isso é algo teórico, não seria viável coletar todas as amostras possíveis e imagináveis 
de uma população. Seria mais difícil do que trabalhar com a própria população, mas veremos que 
a teoria é válida quando temos uma pequena quantidade de amostras, ou muitas vezes uma única 
delas, de tamanho adequado.
Voltando ao exemplo anterior, podemos observar que as médias das várias amostras obtidas 
apresentam, cada uma, desvio em relação à média obtida (6). Podemos montar tabela com todos 
esses desvios, subtraindo a média de cada amostra da média das médias das amostras (a partir de 
agora iremos nos referir a essa média como média da distribuição amostral das médias).
Tabela 6
-4 -3 -2 -1 0
-3 -2 -1 0 1
-2 -1 0 1 2
-1 0 1 2 3
0 1 2 3 4
Esses desvios podem ser, cada um deles, elevados ao quadrado:
Tabela 7
16 9 4 1 0
9 4 1 0 1
4 1 0 1 4
1 0 1 4 9
0 1 4 9 16
A soma de todos esses desvios ao quadrado daria 100. Assim sendo, o desvio padrão seria:
2
id 100desvio padrão 4 2,0
N 25
∑= = = =
26
Unidade I
Observe agora que tínhamos calculado o desvio padrão da população deste exemplo e obtido o valor 
2,8. Vamos dividir esse valor populacional pela raiz quadrada do tamanho da amostra, ou seja, 25. Assim:
2,8
0,56
25
=
Perceba, portanto, que podemos afirmar que o desvio padrão da média da distribuição amostral 
das médias é igual ao desvio padrão da população dividido pela raiz quadrada do tamanho da amostra. 
Geralmente, refere-se ao desvio padrão da média das médias como erro padrão.
Resumindo e organizando essas informações, além de estabelecermos a simbologia pertinente, teríamos:
i i ix f xMédia de uma amostra: X ou X 
n fi
∑ ∑ ×= =
∑
i i ix f xMédia de uma população : ou 
n fi
∑ ∑ ×µ = µ =
∑
xMédia amostral das médias : µ = µ
2 2
i i i
i
d d f
Desvio padrão de uma amostra: S ou S
n 1 f 1
∑ ∑ ×= =
− ∑ −
2 2
i i i
i
d d f
Desvio padrão de uma população : ou 
n f
∑ ∑ ×σ = σ =
∑
XDesvio padrão da distribuição amostral das médias ou erro padrão : n
σσ =
Admita que uma determinada população tenha média µ e desvio padrão σ e que retiremos dessa 
população todas as amostras possíveis de tamanho n. Para cada amostra, calculamos a média, e todas as 
médias calculadas irão compor a distribuição amostral das médias, cuja média é chamada de média da 
distribuição das médias e simbolizada por µx; já o desvio padrão da distribuição das médias é simbolizado 
por σx, sendo o valor de ambos dados, respectivamente, por:
X X e n
σµ = µ σ =
27
ESTATÍSTICA APLICADA
Através de alguns exemplos teremos condições de consolidar o entendimento desses conceitos.
Exemplo 1: sabemos que a altura média de 5.000 estudantes universitários do sexo masculino é 
de 1,728 m com desvio padrão de 0,067 m. Desse grupo, retiramos 100 amostras de 30 estudantes 
cada uma. Qual é a média da distribuição amostral das médias e qual é o desvio padrão da distribuição 
amostral das médias?
Resolução:
Observe que nos foram informados os seguintes dados:
• Média populacional: µ = 1,728.
• Desvio padrão populacional: σ = 0,067.
• Tamanho das amostras: N = 30.
Assim, podemos calcular a média e o desvio padrão da distribuição amostral:
x x 1,728µ = µ ⇒ µ =
x x x
0,067
0,012
N 30
σσ = ⇒ σ = ⇒ σ =
Sobre esses cálculos, é importante ressaltar:
• Não estamos considerando todas as amostras possíveis e imagináveis, somente 100 delas estão 
sendo levadas em conta. Isso faz com que essa não seja a verdadeira distribuição amostral das 
médias, mas uma amostragem experimental. No entanto, como o número 100 é suficientemente 
grande, podemos afirmar que essas duas distribuições são muito aproximadas, e do ponto de vista 
prático, poderão ser consideradas iguais.
• Esses cálculos foram considerados para uma população muito grande, tão grande que a 
consideramos infinita. Caso a população não fosse tão grande e a amostragem não fosse feita com 
reposição, deveríamos fazer uma correção no cálculo do desvio padrão da distribuição amostral. 
Essa correção é feita pela multiplicação do valor do desvio padrão pela expressão:
N n
N 1
−
−
Onde N é o tamanho da população e n o tamanho da amostra. Assim, o cálculo do desvio padrão 
ficaria sendo:
28
Unidade I
X
N n 0,067 3000 30
0,012 0,987 0,012
N 1 3000 1n 30
σ − −σ = = = × =
− −
Perceba que, na prática, não ocorrem diferenças, em virtude do tamanho muito grande da população. 
Para Kazmier (1982), a correção seria insignificante e poderia ser omitida sempre que n < 0,05 N. É o que 
ocorre nesse caso: 0,05 x 3000 = 150. Não precisaríamos usar a correção, porque 30 < 150.
• O desvio padrão da distribuição amostral é normalmente chamado de erro padrão.
• Para grandes valores de N (N≥30), a distribuição amostral é quase normal, independentemente do 
comportamento da população. Essa característica permite responder à seguinte questão:
Exemplo 2: quantas das 100 amostras colhidas apresentarão valores médios acima de 1,735 m?
Resolução:
Esse cálculo é feito de modo idêntico ao que realizamos em distribuição normal, ou seja:
1
x 1,735 1,728
z 0,58 tabela At 0,7190
0,012
− µ −= = = → → =
σ
p tA 1 A 1 0,7190 0,2810 28,10%= − = − = =
A probabilidade de que uma das amostras tiradas tenha valor médio superior a 1,735 m é de 28,10%.
Exemplo 3: uma máquina produz peças cujo diâmetro médio tem que ser de 25,4 mm, mas com uma 
tolerância aceitável expressa pelo desvio padrão de 0,8 mm. Uma vez por turno de trabalho é colhida na 
produção uma amostra aleatória de 64 peças, que após serem medidas fornecem o cálculo do diâmetro 
médio da amostra. Qual é a probabilidade de uma determinada amostra apresentar diâmetro médio 
inferior a 25,2 mm?
Resolução:
Observe que foram informados os seguintes dados:
• Média populacional: µ = 25,4 mm.
• Desvio padrão populacional: σ = 0,8 mm.
• Tamanho das amostras: n = 64.
29
ESTATÍSTICA APLICADA
Portanto, espera-se que a média amostral seja:
X 25,4µ = µ =
E que o erro padrão seja:
X X X
0,8
0,1
n 64
σσ = → σ = → σ =
Consequentemente, a probabilidade de uma amostra apresentar diâmetro médio abaixo de 25,2 mm 
será dada pelo cálculo:
AAtabtab
σ xx = 0,1 = 0,1
µ xx = 25,4 = 25,4
DiâmetroDiâmetro
Figura 6
X
tab
X
xx 25,2 25,4
z 2,00 A 0,0228 ou 2,28%
0,1
− µ− µ −= = = = − → =
σ σ
Existe, portanto, uma probabilidade de apenas 2,28% de que o diâmetro médio de uma amostra 
desse tipo seja inferior a 25,2 mm.
Exemplo 4: nas condições descritas do exemplo anterior foi encontrada uma amostra na qual o 
diâmetro médio calculado foi de 25,8 mm. Qual era a probabilidade de isso ter acontecido e, caso tenha 
ocorrido, qualo problema apresentado?
Resolução:
Perceba que o cálculo é semelhante ao exemplo prévio, ou seja,
X
tab
X
xx 25,8 25,4
z 4,00 A 1,0000
0,1
− µ− µ −= = = = → =
σ σ
30
Unidade I
Como desejamos a probabilidade de ocorrência em algo acima da média, devemos fazer o raciocínio 
de determinação da área pedida, ou seja:
p tabA 1 A 1 1 0 ou 0%= − = − =
Não existe, portanto, probabilidade se uma amostra apresentar diâmetro médio de 25,4 mm. Caso 
isso tenha acontecido, significa que ela não pode ter saído da população considerada. Forçosamente, a 
média populacional considerada, ou o desvio padrão considerado, ou ambos estão errados, não podem 
ter o valor informado.
Do ponto de vista prático, significaria que a tal máquina teria saído de regulagem apresentando 
valores diferentes daqueles que eram considerados corretos. Em uma operação produtiva, o processo seria 
paralisado para regulagem do equipamento. Frequentemente, chamamos isso de quebra catastrófica.
Exemplo 5: nas condições do exemplo 3 foram realizadas amostragens em 30 turnos de trabalhos 
sucessivos. Nesse processo foram encontradas 8 amostras cujos diâmetros médios calculados 
situaram-se abaixo de 25,3 mm, mas acima de 25,0 mm. Isso é possível ou algo está errado nesse 
método de controle.
Resolução:
Observe que 25,0 mm é o menor diâmetro médio que uma amostra pode apresentar. Trata-se do 
mesmo raciocínio do exemplo anterior, sendo apenas invertido o lado da curva.
Aceita-se que uma curva normal tenha existência no intervalo que ocorre do valor na média menos 
quatro vezes o desvio padrão até a média mais quatro vezes o desvio padrão. Fora desse intervalo, as 
probabilidades de ocorrência são desprezíveis. Veja figura a seguir: 
P(z)
100,0%
68,2%
95,4%
99,7%
-4σx -3σx -2σx -1σx µx 1σx 2σx 3σx 4σx
Z
Figura 7
31
ESTATÍSTICA APLICADA
Portanto, é possível termos amostras com diâmetros médios superiores a 25,0 mm (mas inferiores 
a 25,8 mm, obviamente). A probabilidade de possuirmos diâmetros média inferiores a 25,3 mm (mas 
superiores a 25,0 mm) é obtida pela repetição dos cálculos dos exemplos anteriores:
X
tab
X
xx 25,3 25,4
z 1,00 A 0,1587 ou1 5,87%
0,1
− µ− µ −= = = = − → =
σ σ
A probabilidade de que o diâmetro médio de uma amostra retirada nesse controle esteja entre 
25,0 mm e 25,3 mm é, portanto, de 15,87%. Como foram feitas 30 amostragens, é esperado que 4,76 
amostras apresentem o intervalo citado (15,87% de 30). Vamos aceitar 5 amostras nessas condições.
Obter 8 amostras nessas condições é, com certeza, uma impossibilidade estatística. Temos 
consequentemente um problema.
O significado prático é que a máquina foi progressivamente perdendo a regulagem, ou seja, de 
modo gradativo os valores populacionais de média e desvio padrão foram alterados. Em termos 
objetivos, a máquina sofreu uma deterioração gradativa e a produção deve ser paralisada para 
regulagem do processo.
Os exemplos 4 e 5 envolvem os conceitos fundamentais do controle estatístico da qualidade.
Exemplo 6: um auditor fiscal toma uma amostra de 49 contas a receber de um conjunto de 700 
contas existentes em determinada empresa. Ele sabe que o valor médio da população de contas a 
receber é de R$ 680,00, mas não conhece o desvio padrão populacional. Verificou, no entanto, que o 
desvio padrão da amostra é de R$ 86,00. Qual é a probabilidade que a média da amostra considerada 
seja igual ou inferior a R$ 640,00?
Resolução:
Observe que foram informados os seguintes dados:
• Média populacional: µ = R$ 680,00.
• Desvio padrão da amostra: S = R$ 106,00.
• Tamanho da amostra: n = 49.
• Tamanho da população: N = 700.
Note também que a população não é tão grande assim, o que nos obriga a pensar se essa amostragem 
é com ou sem reposição. Vamos nos lembrar da recomendação de Kazmier (1982). Estamos dispensados 
de usar correção se n < 0,05N. Nesse caso, 49 > 0,05 x 700; fazendo a multiplicação, 49 > 35, portanto, 
não estamos dispensados do uso do fator de correção.
32
Unidade I
Em primeiro lugar, devemos calcular o valor da média da distribuição amostral e do erro padrão:
X R$ 680,00µ = µ =
E que o erro padrão seja:
X X X
N n 106,00 700 49
R$14,61
N 1 700 1n 49
σ − −σ = → σ = → σ =
− −
É possível observar que apesar de a fórmula pedir o desvio padrão populacional (σ), usamos o 
desvio padrão da amostra (S). Isso é permitido por conta do chamado teorema do limite central, que 
afirma que quanto maior o tamanho da amostra, mais próxima a distribuição amostral está de uma 
distribuição normal, seja qual for a forma da distribuição da população. Na prática, sempre que n ≥ 30, 
podemos usar o desvio padrão da amostra no lugar do desvio padrão da população, sendo esse último 
desconhecido, no cálculo do erro padrão.
Recaímos então nos cálculos dos exercícios anteriores:
X
tab
X
xx 660,00 680,00
z 1,37 A 0,0853ou 8,53%
14,61
− µ− µ −= = = = − → =
σ σ
A probabilidade de que uma amostra apresente valores médios iguais ou inferiores a R$ 660,00 
é de 8,53%.
3 DISTRIBUIÇÃO AMOSTRAL DAS PROPORÇÕES
Admita que uma população seja infinita, que a probabilidade de ocorrência de determinado evento 
seja p (probabilidade de sucesso) e que retiremos dessa nação todas as amostras possíveis de tamanho n. 
Para cada amostra, calculamos a probabilidade de sucesso média, e todas as probabilidades médias 
calculadas irão compor a distribuição amostral das proporções, cuja média é chamada de média da 
distribuição das proporções e simbolizada por µp e o desvio padrão da distribuição das proporções (erro 
padrão) é simbolizado por σp, sendo o valor de ambos dados, respectivamente, por:
( )
p p
p 1 p
p e 
n
−
µ = σ =
Uma distribuição amostral das proporções se comporta de modo análogo à distribuição das médias, 
tendo em mente os seguintes fatores:
• Como visto anteriormente, uma proporção se comporta de acordo com uma distribuição binomial, 
a qual de modo geral nos leva a cálculos extenuantes. Por conta disso, normalmente utiliza-se a 
33
ESTATÍSTICA APLICADA
distribuição da binomial aproximada pela normal, desde que o valor de n seja maior ou igual a 30. 
Kazmier (1982) acrescenta a essa exigência mais duas: que np ≥ 5 e n(1-p) ≥ 5.
• Ao utilizar a normal como aproximação da binomial, nós precisamos ter em mente que a proporção 
é uma variável discreta e, portanto, em certos casos, será necessário fazer uma correção devido à 
descontinuidade. Veremos essa correção mais à frente.
• Assim como na amostragem das médias, a amostragem das proporções pode ser feita com 
reposição (ou populações infinitas) ou sem reposição (e populações finitas). A amostragem 
sem reposição obriga a mesma correção vista anteriormente, ou seja, o uso da correção 
N n
N 1
−
−
onde N é o tamanho da população e n o tamanho da amostra.
Esses conceitos, as restrições e as aplicações práticas ficam mais claros quando usamos exemplos 
objetivos. Faremos isso em seguida.
Exemplo 1: em determinado processo produtivo, 2,4% das peças produzidas são defeituosas. Em 
dado momento, retira-se dessa produção 500 peças, aleatoriamente. Qual é a média da distribuição 
amostral dessa proporção e seu erro padrão correspondente?
Resolução:
Observe que nos foram informados os seguintes dados:
• Probabilidade de sucesso: p = 2,4% ou 0,024.
• Tamanho das amostras: n = 500.
 Observação
Não se esqueça de que nunca se devem usar porcentagens em cálculos 
matemáticos. Sempre que necessário, devemos transformar as porcentagens 
em frações decimais ou ordinárias. Assim, 2,4% deve ser transformado em 
0,024 ou 24/1000.
A média e o erro padrão da distribuição amostral serão dados pelas fórmulas:
p p pp 0,024 ou 2,4%µ = → µ = µ =
34
Unidade I
( ) ( )
p p p p
p 1 p 0,024 1 0,024
0,0068 ou 0,68%
n 500
− −
σ = → σ = → σ = → σ =
Perceba que poderíamos expressar essas informações em termos de quantidades em vez porcentagens. 
Isso nos ajudará em alguns entendimentos posteriores. Como a nossa amostra é de 500 itens, teríamos:p 0,024 500 12 peçasµ = × =
p 0,0068 500 3,4 peçasσ = × =
Resumindo, cada vez que tirarmos uma amostra de 500 peças da produção, o mais provável é 
que 12 delas (ou 2,4%) sejam defeituosas. Essa informação está sujeita à tolerância expressa pelo erro 
padrão de 3,4 peças (ou 0,68%).
Como a amostra é de 500 peças (superior a 30, portanto), graficamente teríamos essa distribuição estatística:
3,4 peças (0,68%)
12 peças (2,4%)
z
Figura 8
Exemplo 2: em um processo produtivo, 2,4% das peças produzidas são defeituosas. Em dado 
momento retira-se dessa produção 500 peças, aleatoriamente. Qual é a probabilidade de que dessas 
500 peças inspecionadas 3% ou mais sejam defeituosas?
Resolução:
Para esse cálculo, precisamos introduzir o fator de correção para variáveis discretas. Isso é necessário 
porque usaremos conceitos da distribuição normal, uma distribuição para variáveis contínuas, em uma 
questão que envolve variáveis discretas. Isso é permitido porque o n é suficientemente grande (n ≥ 30), 
mas é necessário fazer uma correção.
A melhor maneira de se entender essa correção é fazer o cálculo utilizando quantidades e não 
porcentagens. Desejamos calcular a probabilidade de termos 3% ou mais peças defeituosas, ou seja, 15 
ou mais peças defeituosas (3% de 500 são 15). Graficamente, teríamos a seguinte situação:
35
ESTATÍSTICA APLICADA
Peças defeituosas
3,4 peças
Probabilidade de 
15 ou mais peças 
defeituosas
12 15
Figura 9
Sendo a probabilidade desejada dada por:
X
tab p tab
X
xx 15 12
z 0,88 A 0,8106 A 1 A
3,4
1 0,8106 0,1894 ou1 8,94%
− µ− µ −= = = = → = → = −
σ σ
− =
O problema é que esse cálculo está errado. O erro está na descontinuidade. Observe que a variável 
que estamos trabalhando é discreta. É possível ter 15 ou 16 peças defeituosas, mas não 15,8. Por outro 
lado, a ferramenta usada, a distribuição normal, serve às variáveis contínuas. Precisamos corrigir esse 
fato. Fazemos isso distribuindo a descontinuidade (no caso, o intervalo entre dois números inteiros, 14 e 
15, por exemplo) entre os valores permitidos. Assim sendo, a partir de agora o valor 15 peças defeituosas 
é um número entre 14,5 e 15,5.
O esquema a seguir mostra o efeito da descontinuidade em torno de um determinado valor nominal 
(no caso do exemplo o valor nominal é 15). De acordo com a situação especificada (mais ou menos que 
o valor nominal e se ele é incluído ou não), determina-se a utilização do fator de descontinuidade
15 ou menos
menos do que 15
Dados do exemplo: 14,5 15 15,5
mais do que 15
Valor nominal 
- descontinuidade Valor nominal
Valor nominal 
+ descontinuidade
15 ou mais
Figura 10
Como no cálculo queremos 15 ou mais peças defeituosas, usaremos na fórmula o valor 14,5, 
representando 15 peças. Caso o pedido fosse mais de 15 peças, usaríamos o valor 15,5. Observe bem, 15 
passou a ser um número intervalar, e, portanto, incluí-lo ou não incluí-lo altera o limite considerado.
36
Unidade I
A probabilidade desejada ficaria assim:
X
tab p tab
X
xx 14,5 12
z 0,74 A 0,7704 A 1 A
3,4
1 0,7704 0,2296 ou 22,96%
− µ− µ −= = = = → = → = −
σ σ
− =
Esse seria então o valor correto pedido. Existe uma probabilidade de 22,60% de que em uma 
amostragem de 500 peças do processo produtivo, 15 ou mais sejam defeituosas.
Note que é consideravelmente diferente dos 18,94% calculados quando não levamos em conta a 
descontinuidade.
Entretanto, e se desejássemos fazer o cálculo usando porcentagens e não quantidades? O processo 
seria basicamente o mesmo, mas utilizando-se um fator de descontinuidade percentual, dado por:
c
1
f
2n
=
Sendo, claro, n o tamanho da amostra.
Nesse exemplo o fator de correção é de 
c c c
1 1
f f f 0,001
2n 2 500
= → = → =
×
E consequentemente o cálculo das probabilidades, usando as ferramentas da distribuição normal, seria:
Peças defeituosas
0,83%
Probabilidade de 3% 
ou mais das peças 
serem defeituosas
2,4% 3,0%
Figura 11
X
X
xx
z
− µ− µ= =
σ σ
37
ESTATÍSTICA APLICADA
0,03 0,001 0,024
0,0068
− −=
tab0,74 A= →
p0,7754 A= →
tab1 A= −
1 0,7754= −
0,2246 ou 22,46%=
Confirmou-se o calculado anteriormente, ou seja, existe uma probabilidade de 22,60% de que em 
uma amostragem de 500 peças do processo produtivo, 3% ou mais delas sejam defeituosas.
Exemplo 3: um candidato obteve 48% dos votos em determinada eleição. Em uma seção eleitoral 
composta de 250 eleitores, quantos provavelmente votaram no referido candidato e qual o erro padrão 
da previsão?
Resolução:
O valor mais provável de ter ocorrido na seção eleitoral citada é calculado por:
p p pp 0,48 ou 48%µ = → µ = µ =
Já o erro padrão dessa previsão seria dado por:
( ) ( )
p p p p
p 1 p 0,48 1 0,48
0,0316 ou 3,16%
n 250
− −
σ = → σ = → σ = → σ =
Isso significa que nessa seção eleitoral o candidato citado deverá ter 48% dos votos, mas sujeito a um 
erro padrão, ou seja, uma variação de 3,16%, e como n é maior que 30 podemos utilizar a distribuição 
normal para calcularmos as diversas probabilidades envolvidas, como veremos na sequência.
Exemplo 4: qual é a probabilidade que o candidato utilizado no exemplo anterior tenha maioria 
absoluta na seção eleitoral considerada?
38
Unidade I
Resolução:
Como visto no exemplo anterior, a média amostral das proporções é de 48% e o erro padrão, de 
3,16%; podemos utilizar a distribuição normal, desde que consideremos o efeito da descontinuidade.
O fator de descontinuidade será:
c c c
1 1
f f f 0,002
2n 2 250
= → = → =
×
Por outro lado, devemos entender que maioria absoluta significa ter 50% dos votos mais um voto, 
ou seja, ter mais do que 50%. Assim, devemos somar a descontinuidade ao valor nominal, como vimos 
no exemplo 2.
Efetuando os cálculos, teremos:
X
tab p
X
tab
xx 0,50 0,002 0,48
z 0,70 A 0,7580 A
0,0316
1 A 1 0,7580 0,2420ou 24,20%
− µ− µ + −= = = = → = →
σ σ
= − = − =
Portanto, o candidato considerado tem 24,20% de probabilidade de obter maioria de votos na seção 
eleitoral citada.
Exemplo 5: em uma cidade, 53% das crianças nascidas são do sexo feminino. Foi tomada, em dado 
momento, uma amostra de 500 crianças. Qual a probabilidade de que:
A) Menos de 45% sejam meninos?
B) Entre 50% e 55% sejam meninas?
C) Mais de 60% sejam meninas?
Resolução:
Para calcularmos o solicitado, primeiramente devemos determinar o valor da média amostral das 
proporções e seu erro padrão.
Para meninas:
p p pp 0,53 ou 53%µ = → µ = µ =
39
ESTATÍSTICA APLICADA
( ) ( )
p p p p
p 1 p 0,53 1 0,53
0,0223 ou 2,23%
n 500
− −
σ = → σ = → σ = → σ =
E, para meninos:
p p pp 0,47 ou 47%µ = → µ = µ =
( ) ( )
p p p p
p 1 p 0,47 1 0,47
0,0223 ou 2,23%
n 500
− −
σ = → σ = → σ = → σ =
Para o cálculo das probabilidades, podemos utilizar a distribuição normal, visto que n ≥ 30, mas 
considerando o efeito da descontinuidade:
c c c
1 1
f f f 0,001
2n 2 500
= → = → =
×
• Item A: probabilidade inferior a 45% de que sejam meninos. Menos de 45% significa não incluir 
o 45%, portanto subtrairemos a descontinuidade.
X
tab p tab
X
xx 0,45 0,001 0,47
z 0,94 A 0,1736 A A 0,1736 ou1 7,36%
0,0223
− µ− µ − −= = = = − → = → = =
σ σ
• Item B: probabilidade entre 50% e 55% de que sejam meninas. Entre 50% e 55% de meninas 
inclui o valor nominal, logo, nos cálculos subtrairemos a descontinuidade de 50% e a somaremos 
ao valor 55%.
X
tab1
X
xx 0,50 0,001 0,53
z 1,39 A 0,0823
0,0223
− µ− µ − −= = = = − → =
σ σ
X
tab2
X
xx 0,55 0,001 0,53
z 0,94 A 0,8264
0,0223
− µ− µ + −= = = = → =
σ σ
p tab2 tab1A A A 0,8264 0,0823 0,7441 ou 74,41%= − = − =
• Item C: probabilidade de mais de 60% de que sejam meninas. Mais de 60% não inclui o valor 
nominal, portanto, somamos a descontinuidade.
40
Unidade I
X
tab p
X
tab
xx 0,60 0,001 0,53
z 3,18 A 0,9993 A
0,0223
1 A 1 0,9993 0,0007 ou 0,07%
− µ− µ + −= = = = → = →
σ σ
= − = − =
Exemplo 6: uma empresa de material eletroeletrônico forneceu 2.000 lotes de 100 unidades, cada 
um de determinado componente eletrônico. A probabilidade de um desses apresentar defeitosé de 4,5%. 
Em quantos dos lotes fornecidos:
A) Existem mais de 95 componentes perfeitos?
B) Existem 98 ou mais componentes perfeitos?
Resolução:
Parâmetros da distribuição amostral das proporções, para componentes perfeitos:
p p pp 0,955 ou 95,5%µ = → µ = µ =
( ) ( )
p p p p
p 1 p 0,955 1 0,955
0,0207 ou 2,07%
n 100
− −
σ = → σ = → σ = → σ =
 Observação
Perceba que o enunciado nos informa o índice de defeitos, mas desejamos 
calcular a probabilidade de componentes perfeitos, assim, logicamente tiramos a 
porcentagem de defeitos de 100%, visto serem eventos complementares. 
A probabilidade de um componente ser perfeito é 95,5%.
Novamente, temos que considerar a descontinuidade caracterizada pelo coeficiente:
c c c
1 1
f f f 0,005
2n 2 100
= → = → =
×
Item A: em quantos dos lotes fornecidos existem mais de 95 componentes perfeitos? Somar a 
descontinuidade.
X
tab p tab
X
xx 0,95 0,005 0,955
z 0,00 A 0,5000 A 1 A
0,0207
1 0,5000 0,5000 ou 50,00%
− µ− µ + −= = = = → = → = −
σ σ
= − =
41
ESTATÍSTICA APLICADA
Queremos 95 componentes perfeitos em lotes de 100 unidades, portanto, nosso objetivo é 95% de 
componentes perfeitos.
A probabilidade de um lote apresentar mais de 95 componentes perfeitos é de 50,00%, portanto, 
em 2.000 lotes, 1.000 apresentarão mais de 95 componentes perfeitos (50% de 2.000, ou seja, 
0,5 x 2.000 = 1.000). 
Item B: Em quantos dos lotes fornecidos existem 98 ou mais componentes perfeitos? Subtrair 
a descontinuidade.
X
tab p
X
tab
xx 0,98 0,005 0,955
z 0,97 A 0,8340 A
0,0207
1 A 1 0,8340 0,1660 ou1 6,60%
− µ− µ − −= = = = → = →
σ σ
= − = − =
A probabilidade de um lote apresentar 95 componentes ou mais perfeitos é de 16,60%, portanto, em 2.000 
lotes, 332 apresentarão 95 componentes ou mais perfeitos (16,60% de 2.000, ou seja, 0,1660 x 2.000 = 332). 
Exemplo 7: uma empresa de material eletroeletrônico forneceu 2.000 lotes de 100 unidades cada 
de determinado componente eletrônico. A probabilidade de um desses componentes apresentar 
defeitos é de 4,5%, e 50 desses lotes não foram aceitos por apresentarem excesso de defeitos. Quantos 
componentes perfeitos esses lotes demonstraram no máximo?
Resolução:
Como vimos no exemplo anterior, os parâmetros dessa distribuição amostral das médias são dados 
por: p p95,5% e 2,07%µ = σ = e o coeficiente de descontinuidade é cf 0,005= .
Graficamente, podemos mostrar o solicitado pela questão a seguir:
Lotes com mais defeitos,
95,5%
2,07%
ou seja, com menos 
componentes perfeitos
Figura 12 - Distribuição amostral das proporções de componentes perfeitos. Amostras de 100 componentes.
42
Unidade I
Observe que a área destacada é percentualmente igual à porcentagem de lotes rejeitados por excesso 
de defeitos. Como foram rejeitados 50 lotes em 2.000, a porcentagem de rejeitos e consequentemente 
a área percentual é de 2,5%.
lotes rejeitados 50
% lotes rejeitados 0,0250 ou 2,5%
total de lotes 2000
= = =
Como visto anteriormente, conhecendo uma área da curva normal conseguimos determinar os 
limites desta tal área:
d tabA 0,0250 A z 1,96= = → = −
( )x z 0,955 1.96 0,0207 0,9144 ou 91,44%= µ + σ = + − × =
Portanto, os lotes rejeitados tinham 91,44% de peças perfeitas ou menos. Isso significa que em um 
lote de 100, no máximo 91,44 peças eram perfeitas. Como não existem 91,44 peças, consideraremos os 
conceitos de descontinuidade, ou seja, aceitaremos a resposta 91 peças.
 Observação
Relembre que, em função da descontinuidade, o valor 91 peças é um 
intervalo entre 90,50 e 91,50, portanto, que inclui 91,44.
Estudamos até o presente momento as distribuições amostrais mais utilizadas, e a seguir observaremos 
uma composição entre elas. Porém, devemos observar que todas as medidas estatísticas podem gerar 
distribuições amostrais, sempre seguindo o modelo visto, ou seja, a medida de posição amostral é 
idêntica à medida correspondente populacional e o erro padrão é dado por uma fórmula que varia de 
uma medida estatística para outra.
 Saiba mais
Caso queira obter informações adicionais a respeito de conceitos e 
procedimentos de estatística, leia a obra:
WITTE, R. S.; WITTE, J. S. Estatística. 7. ed. Rio de Janeiro: LTC, 2005.
43
ESTATÍSTICA APLICADA
4 DISTRIBUIÇÃO AMOSTRAL DAS SOMAS E DIFERENÇAS
Dadas duas populações das quais são retiradas amostras de nA da população A e nB elementos da 
população B, a distribuição amostral das somas e diferenças (das médias, das proporções ou de qualquer 
outra medida estatística) é caracterizada pela soma ou diferença dos valores centrais e pela raiz quadrada 
da soma dos quadrados dos desvios padrões, divididos pelo tamanho da amostra. Em outras palavras, 
o valor amostral esperado é obtido pela soma ou pelas diferenças dos valores aguardados para cada 
amostra, já o erro padrão é sempre obtido pela soma dos erros padrões de cada amostra, conforme 
mostram as fórmulas a seguir, para as principais medidas.
Para médias
Somas:
X X x xA B A B+
µ = µ + µ
 e 
2 2
xA xB
X XA B
A BN N
−
σ σσ = +
Diferenças:
X X x xA B A B−
µ = µ − µ
 e 
2 2
xA xB
X XA B
A BN N
−
σ σσ = +
Para proporções
Somas:
p p A BA B
p p+µ = + e A A B Bp pBÁ
A B
p (1 p ) p (1 p )
N N−
− −σ = +
Diferenças:
p p A BA B
p p−µ = + e A A B Bp pBÁ
A B
p (1 p ) p (1 p )
N N−
− −σ = +
Veja que o cálculo da medida central, a média amostral, seja qual for a medida estatística considerada é 
intuitiva, não necessitando de maiores explicações, basta somar ou subtrair as medidas correspondentes 
de cada uma das amostras. Já o cálculo do erro padrão, em especial no caso das diferenças de médias 
ou proporções ou qualquer outra medida estatística, necessita de alguma reflexão.
O desvio padrão é a medida estatística que representa, por definição, a variação dos elementos de 
uma amostra (S) ou de uma população (σ) em torno da medida de tendência central (média, mediana, 
proporção etc.). As variações de uma amostra ou população não compensam, evidentemente, as variações 
de outra amostra ou outra população, elas se somam, acrescentam-se as variações de uma à outra.
44
Unidade I
Como o desvio padrão é tomado ao quadrado, para obter o seu resultante devemos extrair a raiz quadrada.
Em administração é fácil de aplicar e entender esse conceito. Em um processo administrativo 
qualquer o ideal é a constância absoluta, o que não é possível de ocorrer. Sempre haverá uma variação, 
decorrente dos diversos fatores e problemas que interferem no referido processo. Essa alternância é 
dada pelo desvio padrão.
Podemos então considerar que o desvio padrão de um processo qualquer é a medida dos problemas, 
imperfeições, defeitos e volatilidade. Assim, quando comparamos dois processos quaisquer, os problemas de 
cada um deles se somarão aos outros, aumentando a variação total, daí a necessidade de se acrescer os 
desvios padrões decorrentes.
Quando falamos dessas características dos desvios padrões, evidentemente, os estendemos para os 
erros padrões, que é o nosso maior interesse neste momento.
Verificaremos a seguir alguns exemplos de aplicações práticas destes conceitos.
Exemplo 1: os amortecedores do fabricante A rodam em média 65.000 km, com desvio padrão de 
4.500 km, normalmente distribuídos. Já os amortecedores do fabricante B duram em média 60.000 km, 
com desvio padrão de 3.500 km. Suponha que foram testados 36 amortecedores da marca A e 49 da 
marca B. Quais são a média e o desvio padrão da distribuição amostral da diferença entre as vidas úteis?
Resolução:
X X X XA B A B
65000 60000 5000− −µ = − ⇒ µ =
2 2 2 2
xA xB
X X X X X XA B A B A B
A B
4500 3500
901
N N 36 49− − −
σ σσ = + ⇒ σ = + ⇒ σ =
Isso significa que uma amostra de amortecedores da marca A irá durar, provavelmente, 5.000 km do 
que a da marca B. No entanto, essa afirmativa é sujeita a um erro padrão de 901 km.
Exemplo 2: os amortecedores do fabricante A rodam em média 65.000 km, com desvio padrão de 
4.500 km, normalmente distribuídos. Já os amortecedores do fabricante B duramem média 60.000 km, 
com desvio padrão de 3.500 km. Suponha que tenham sido testados 36 amortecedores da marca A e 
49 amortecedores da marca B. Qual é a probabilidade de que a amostra dos amortecedores da marca A 
dure 3.000 km a menos do que os da marca B?
Resolução:
Assim como populações e amostras envolvendo esse exemplo são distribuições normais, as 
distribuições amostrais delas também o serão, portanto, podemos utilizar os conceitos sobejamente 
conhecidos, para o cálculo das probabilidades.
45
ESTATÍSTICA APLICADA
Marca A (n = 36) Marca B (n = 49) Diferença entre as marcas
4500 3500 901
65000 60000 5000
3000
Área 
pedida
km km km
Figura 13 - Distribuições amostrais dos amortecedores
tab p
x 3000 5000
z 2,22 A A 0,0132 ou1 ,32%
901
− µ −= = = − → = =
σ
Existe 1,32% de probabilidade de que a amostra dos amortecedores da marca A durem em média 
menos do que os 3.000 km dos amortecedores da marca B.
Exemplo 3: os resultados de uma eleição mostraram que um candidato obteve 60% dos votos. Qual 
é a probabilidade de que duas amostras aleatórias, cada uma com 200 eleitores, apresentem diferença 
superior a 10% uma em relação à outra?
Resolução:
Inicialmente devemos calcular a média amostral da diferença entre as proporções e o erro padrão 
correspondente. Depois, determinar as probabilidades com o uso das ferramentas conhecidas.
p p A B p p p pA B A B A B
p p 0,6 0,6 0− − −µ = − ⇒ µ = − ⇒ µ =
p p p pB BÁ Á
0,6(1 0,6) 0,6(1 0,6)
0,049
200 200− −
− −σ = + ⇒ σ =
A princípio, não deveria haver diferença entre as duas amostras, mas é possível que a amostra A seja 
maior que a amostra B ou vice-versa, por casualidades. A probabilidade de que a amostra A tenha 10% a 
mais de eleitores que a amostra B é calculada da forma costumeira, lembrando que a medida estatística 
considerada é discreta (não existe meio eleitor), mas como n ≥ 30, podemos aproximar pela distribuição 
normal, desde que façamos a correção pela descontinuidade.
c c c
1 1
f f f 0,0025
2n 2 200
= → = → =
×
Como queremos uma diferença superior a 10%, devemos somar a descontinuidade. Superior significa 
mais do que 10%; se fosse 10% ou mais, subtrairíamos a descontinuidade.
46
Unidade I
Assim, teremos:
p tab
x 0,10 0,0025 0
z 2,09 A 1 A 1 0,9817 0,0183 ou1 ,83%
0,049
− µ + −= = = → = − = − =
σ
Devemos lembrar, no entanto, que o oposto também pode ocorrer, ou seja, existe 1,83% 
de probabilidade de que a amostra B tenha mais de 10% de eleitores que a amostra A. Logo, 
a probabilidade que uma tenha mais que 10% de eleitores do que a outra é a soma das duas 
probabilidades: 0,0183 + 0,0183 = 0,0366 ou 3,66%.
Exemplo 4: um sistema de iluminação é composto de quatro lâmpadas do mesmo tipo ligadas 
de modo que uma permaneça acesa até queimar, quando então a segunda irá ligar permanecendo 
acesa até queimar, momento em que a terceira irá se acender, repetindo a ocorrência até a queima da 
quarta lâmpada. Considerando que as quatro lâmpadas tenham vida útil normalmente distribuída com 
média de 2.000 horas e desvio padrão de 120 horas, durante quantas horas estima-se que o sistema 
permanecerá funcionando, proporcionando iluminação?
Resolução:
A vida útil do sistema seria, em um mundo perfeito, a soma da vida útil das quatro lâmpadas, 
ou seja, 8.000 horas. Mas o mundo não é perfeito, e as lâmpadas podem eventualmente durar mais 
ou menos dependendo de fatores aleatórios expressos pelo desvio padrão de 120 horas. Dessa forma, 
estatisticamente poderíamos dizer que o sistema estará em funcionamento durante
�
� � � �
� � � �
X X X X
X X X
1 2 3 4
1 2 3 4
1 2 3 4
2000 2000 2000 200
� � � �
� � � �
� � � �
� � � 00
8000
�
horas
Mas sujeito a um erro padrão de 
22 2 2 2 2 2 2
31 2 4
X X X X1 2 3 4
120 120 120 120
240 horas
n n n n 1 1 1 1+ + +
σσ σ σσ = + + + = + + + =
Estima-se, portanto, que o sistema permanecerá funcionando por 8.000 horas, mas com um erro 
padrão de 240 horas.
Exemplo 5: o sistema de iluminação descrito no exemplo anterior poderia permanecer funcionando 
menos do que 7.800 horas? Qual a probabilidade de que isso ocorra?
47
ESTATÍSTICA APLICADA
Resolução:
O sistema de iluminação segue em sua vida útil uma distribuição normal, portanto, as 
probabilidades envolvidas podem ser calculadas usando a tabela de distribuição normal reduzida, 
como fizemos anteriormente.
tab p
x 7800 8000
z 0,83 A A 0,2033 ou 20,83%
240
− µ −= = = − → = =
σ
Consequentemente, devemos afirmar que é possível o sistema permanecer iluminando menos do 
que 7.800 horas e a probabilidade que isso ocorra é de 20,83%.
Exemplo 6: qual o número de horas máximo e mínimo que o sistema de iluminação descrito no 
exemplo 4 poderá permanecer funcionando?
Resolução:
A situação descrita segue a distribuição normal, portanto, as probabilidades de ocorrência se situam 
entre os limites de -4 ≤ z ≤ 4, onde z é a variável normal reduzida; consequentemente, a vida útil 
máxima do sistema é dada por:
maxX z 8000 4 240 8960 horas= µ + σ = + × =
E a vida útil mínima por:
minX z 8000 4 240 7040 horas= µ − σ = − × =
O sistema permanecerá ativo no intervalo de 7.040 a 8.960 horas.
 Observação
Ligação em série é um termo técnico em eletricidade que significa que 
as voltagens das várias baterias serão somadas, formando um valor total 
de voltagens do sistema.
48
Unidade I
 Resumo
Para a administração, a estatística é uma ótima ferramenta na tomada de 
decisões, reduzindo os riscos de decidirmos erradamente. Ela consegue isso 
através da observação do presente e do passado, visando prever o futuro, 
ou alternativamente, analisando um pequeno conjunto de elementos e a 
partir daí entendendo um conjunto muito maior. 
As observações de eventos passados ou presentes podem ser resumidas 
e entendidas através da estatística descritiva, e exceder os conhecimentos 
já aprendidos é o objetivo de nossa disciplina atual.
O comportamento de uma amostra (passado ou presente) é 
provavelmente semelhante ao de sua população correspondente (futuro 
ou conjunto com grande quantidade de elementos). Esse termo, de modo 
presumível, é a chave de todo o segredo desses estudos.
Vimos o estudo de probabilidades e dos modelos matemáticos que 
as representa. Retomamos os conceitos básicos de probabilidades e das 
distribuições de probabilidades. Em especial, as duas principais, a binomial 
e a normal.
Esses modelos matemáticos nos servirão para relacionar populações e 
amostras, introduzindo o tema amostragem, fundamental para o exercício 
das atividades científicas e profissionais na atualidade.
A amostragem, com suas regras e limitações, permite que uma 
observação relativamente rápida e de pouco custo nos dê as informações 
necessárias para entender toda a complexidade que envolve estimativas 
e previsões.
Nesta unidade, constatamos a possibilidade de, ao saber como uma 
população se comporta ou deveria se comportar, prever o comportamento 
de amostras dela retiradas. Esses conhecimentos lastreiam o controle 
estatístico de qualidade, fundamental na administração dos processos 
administrativos. Fase importante do ciclo PDCA, o controle (C) pode e deve 
muitas vezes se utilizar desses conceitos estatísticos na montagem de 
indicadores, vitais para a administração.
49
ESTATÍSTICA APLICADA
 Exercícios
Questão 1. “O que era o pior que poderia ter acontecido ao mercado imobiliário dos Estados Unidos 
em 2008? [...] a resposta depende de uma amostra de dados que calibre o modelo. Antes de 2007, o pior 
período de recessão de que as empresas tinham dados foi o calote de hipotecas no Texas na década de 
1980, quando as casas perderam 40% do seu valor. Pegue-se estes dados como parâmetro-limite, ou 
como o máximo em que chega a cauda antes do sigma se tornar demasiado grande para ser imaginável, 
e concluirá, dado o pressuposto de uma distribuição normal dos acontecimentos, que a probabilidade de 
todas as hipotecas da sua carteira perderem mais de 40% do seu valor ao mesmo tempo é ridiculamente 
pequena. Tão pequena, de

Outros materiais