Logo Passei Direto
Buscar
Material
páginas com resultados encontrados.
páginas com resultados encontrados.

Prévia do material em texto

PROBABILIDADE 
E ESTATÍSTICA
PROF. JONAS BORSETTI
SILVA SANTOS
FACULDADE CATÓLICA PAULISTA
Prof. Jonas Borsetti Silva Santos
PROBABILIDADE
E ESTATÍSTICA
“A Faculdade Católica Paulista tem por missão exercer uma 
ação integrada de suas atividades educacionais, visando à 
geração, sistematização e disseminação do conhecimento, 
para formar profissionais empreendedores que promovam 
a transformação e o desenvolvimento social, econômico e 
cultural da comunidade em que está inserida.
Missão da Faculdade Católica Paulista
 Av. Cristo Rei, 305 - Banzato, CEP 17515-200 Marília - São Paulo.
 www.uca.edu.br
Nenhuma parte desta publicação poderá ser reproduzida por qualquer meio ou forma 
sem autorização. Todos os gráficos, tabelas e elementos são creditados à autoria, 
salvo quando indicada a referência, sendo de inteira responsabilidade da autoria a 
emissão de conceitos.
Diretor Geral | Prof. Valdir Carrenho Junior
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 5
SUMÁRIO
CAPÍTULO 01
CAPÍTULO 02
CAPÍTULO 03
CAPÍTULO 04
CAPÍTULO 05
CAPÍTULO 06
CAPÍTULO 07
CAPÍTULO 08
CAPÍTULO 09
CAPÍTULO 10
CAPÍTULO 11
CAPÍTULO 12
CAPÍTULO 13
CAPÍTULO 14
CAPÍTULO 15
07
17
27
36
45
55
64
76
88
98
107
117
125
137
146
ESTATÍSTICA
DISTRIBUIÇÃO DE FREQUÊNCIAS
DISTRIBUIÇÃO DE FREQUÊNCIA: VARIÁVEL 
CONTÍNUA
MEDIDAS DE TENDÊNCIA CENTRAL
MEDIDAS DE TENDÊNCIA CENTRAL - 
VARIÁVEL CONTÍNUA
MEDIDAS SEPARATRIZES
MEDIDAS DE DISPERSÃO
GRÁFICOS ESTATÍSTICOS
PROBABILIDADE
DISTRIBUIÇÃO BINOMIAL
DISTRIBUIÇÃO NORMAL
AULA PRÁTICA - VARIÁVEL DISCRETA
AULA PRÁTICA - VARIÁVEL CONTÍNUA
VARIÁVEL DISCRETA NO EXCEL
VARIÁVEL CONTÍNUA USANDO O EXCEL
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 6
INTRODUÇÃO
Caro estudante. Seja bem vindo ao curso de Indicadores educacionais, que na 
verdade é um curso de estatística, uma disciplina que permeia praticamente todos 
os aspectos da nossa vida moderna. Da ciência à economia, da saúde às ciências 
sociais, a estatística desempenha um papel crucial na compreensão e interpretação 
dos dados que encontramos em nosso dia a dia.
Este livro é um convite para explorar os conceitos fundamentais da estatística de 
forma clara e acessível. Ao longo das próximas páginas, vamos mergulhar nas técnicas 
e ferramentas estatísticas que nos permitem extrair significado dos dados, identificar 
padrões, tomar decisões informadas e fazer previsões sobre o futuro.
Começaremos nossa jornada aprendendo sobre os princípios básicos da estatística 
descritiva, que nos ajudam a resumir e visualizar conjuntos de dados, fornecendo uma 
compreensão inicial de sua estrutura e características. 
À medida que avançamos, discutiremos diferentes métodos de coleta de dados, 
técnicas de amostragem, distribuições de probabilidade e muito mais. Veremos 
como esses conceitos podem ser aplicados em uma variedade de contextos, desde 
pesquisas científicas até análises de mercado, passando por estudos epidemiológicos 
e planejamento financeiro.
Prepare-se para desvendar os mistérios dos números, desafiar suas intuições e 
descobrir o poder transformador da estatística. Vamos começar essa jornada juntos!
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 7
CAPÍTULO 1
ESTATÍSTICA
Caro estudante. Seja bem vindo ao curso de Indicadores Educacionais. Esse curso 
é um curso em que usaremos a estatística como base. Ou seja, iremos trabalhar 
com a estatística em suas mais diferentes vertentes e formas. Esperamos que seja 
um curso proveitoso e que consigam compreender tudo aquilo que aqui tentaremos 
transmitir. Tenham um bom curso
1.1 O que é Estatística
O termo Estatística provém da palavra Estado e foi utilizado originalmente para 
denominar levantamentos de dados, cuja finalidade era orientar o Estado em suas 
decisões. 
Neste sentido foi utilizado em épocas remotas para determinar o valor dos 
impostos cobrados dos cidadãos, para determinar a estratégia de uma nova batalha 
em guerras que se caracterizavam por uma sucessão de batalhas. (Era fundamental 
aos comandantes saber de quantos homens, armas, cavalos etc. dispunham após a 
última batalha.) Atualmente, a estatística é definida da seguinte forma: 
Estatística é um conjunto de métodos e processos quantitativos que serve para 
estudar e medir os fenômenos coletivos. 
A estatística teve acelerado desenvolvimento a partir do século XVII, com os estudos 
de BERNOULLI, FERMAT, PASCAL, LAPLACE, GAUSS, GALTON, PEARSON, FISHER, 
POISSON e outros que estabeleceram suas características atuais. 
Ela não alcançou ainda um estado definitivo. Continua a progredir na razão direta 
do desejo de investigação dos fenômenos coletivos. 
A Estatística é considerada por alguns autores como Ciência no sentido do estudo 
de uma população. É considerada como método quando utilizada como instrumento 
por outra Ciência. 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 8
A Estatística mantém com a Matemática uma relação de dependência, solicitando-
lhe auxílio, sem o qual não poderia desenvolver-se. 
Com as outras Ciências mantém a relação de complemento, quando utilizada como 
instrumento de pesquisa. 
1.2 Conceitos fundamentais
OBJETIVO: Estatística tem como objetivo o estudo dos fenômenos coletivos. 
POPULAÇÃO E AMOSTRA 
Conceituaremos População como sendo o conjunto de todos os itens (pessoas, 
coisas, objetos) que interessam ao estudo de um fenômeno coletivo segundo alguma 
característica. 
Entenderemos por Amostra, qualquer subconjunto não vazio de uma população. 
Uma característica numérica estabelecida para toda uma população é denominada 
parâmetro. 
Uma característica numérica estabelecida para uma amostra é denominada 
estimador. 
Por exemplo: no fenômeno coletivo eleição para governador no Estado de São Paulo, 
a população é o conjunto de todos os eleitores habilitados no Estado de São Paulo. 
Um parâmetro é a proporção de votos do candidato A. Uma amostra é um grupo de 
1000 eleitores selecionados em todo o Estado. Um estimador é a proporção de votos 
do candidato A obtida na amostra. 
Em aplicações efetivas, o número de elementos componentes de uma amostra é 
bastante reduzido em relação ao número de elementos componentes da população. 
Processos Estatísticos de Abordagem
Quando solicitados a estudar um fenômeno coletivo podemos optar entre os 
seguintes processos estatísticos: 
a) Estimação. 
b) Censo. 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 9
Censo: é uma avaliação direta de um parâmetro, utilizando-se todos os componentes 
da população. 
Estimação: é uma avaliação indireta de um parâmetro, com base em um estimador 
através do cálculo de probabilidades. 
Propriedades Principais do Censo: 
• Admite erro processual zero e tem confiabilidade 100%. 
• É caro. 
• É lento. 
• É quase sempre desatualizado. 
• Nem sempre é viável. 
Propriedades Principais da Estimação:
• Admite erro processual positivo e tem confiabilidade menor que 100%. 
• É barata. 
• É rápida. 
• É atualizada. 
• É sempre viável. 
Se admitirmos que podemos retirar do Censo todo tipo de erro de natureza humana 
(erro de cálculo de avaliação, de anotação etc.), restará apenas outro tipo de erro 
devido ao procedimento empregado. 
Este erro é chamado erro processual. No caso de um Censo, o erro processual é 
zero, pois avaliamos um por um, todos os elementos componentes da População. 
Como o erro processual na avaliação é zero, a confiabilidade no parâmetro obtido 
é 100%. A precisão, no Censo, é total. 
Na estimação, como avaliamos apenas parte e não todos os elementos que 
compõem a população, admitimos um erro processual positivo na avaliação do valor 
numérico e por consequência uma confiabilidade menor que 100%, sendo, portanto, 
menos precisa que o Censo.Determine a amplitude total da sequência X: 11, 12, 9, 10, 10, 15. 
Solução: O maior valor desta sequência é 15 e o menor valor é 9. Portanto, a 
amplitude total da sequência é At = 15 - 9 = 6 unidades. 
2º Caso - VARIÁVEL DISCRETA 
Como os valores já se apresentam ordenados, a amplitude total é a diferença entre 
o último e o primeiro elemento da série. 
Exemplo: Determine a amplitude total da série. 
Solução: O maior valor da série é 7 e o menor valor da série é 2. Portanto, a amplitude 
total da série é A, = 7 - 2 = 5 unidades. 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 65
3º Caso - VARIÁVEL CONTÍNUA
Nesta situação, por desconhecer o maior e o menor valor da série, devemos fazer 
um cálculo aproximado da amplitude total da série. 
Consideraremos como maior valor da série o ponto médio da última classe e como 
menor valor da série o ponto médio da primeira classe. A amplitude total é a diferença 
entre estes valores. 
Exemplo: Determine a amplitude total da série: 
Solução: O ponto médio da última classe é 11 e o ponto médio da primeira classe 
é 3. Portanto, At = 11 - 3 = 8 unidades. 
COMENTÁRIO: 
Apesar da facilidade de obtenção da amplitude total, esta medida apresenta a 
inconveniência de depender apenas de dois valores da série. É possível modificar 
completamente a dispersão ou a concentração dos elementos em torno da média, 
sem alterar a amplitude total da série. É uma medida que tem pouca sensibilidade 
estatística. 
Desvio Médio Simples 
O conceito estatístico de desvio corresponde ao conceito matemático de distância. 
A dispersão dos dados em relação a média de uma sequência pode ser avaliada 
através dos desvios de cada elemento da sequência em relação a média da sequência. 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 66
O desvio médio simples que indicaremos por DMS é definido como sendo uma 
média aritmética dos desvios de cada elemento da série para a média da série.
Cálculo do Desvio Médio Simples 
1º Caso - DADOS BRUTOS OU ROL 
Calculamos inicialmente a média da sequência. Em seguida identificamos a distância 
de cada elemento da sequência para sua média. Finalmente, calculamos a média 
destas distâncias. 
Se a sequência for representada por X: x1, x2, ..., xn, então o DMS admite como 
fórmula de cálculo: 
Exemplo: Calcule o DMS para a sequência: X:2, 8, 5, 6. 
Solução: Determinamos inicialmente a média da série: 
em seguida determinamos as distâncias de cada elemento da série para a média 
da série: 
O DMS é a média aritmética simples destes valores. 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 67
Interpretação: Em média, cada elemento da sequência está afastado do valor 5,25 
por 1,75 unidades. 
2º Caso - VARIÁVEL DISCRETA
No caso da apresentação de uma variável discreta, lembramos que a frequência 
simples de cada elemento representa o número de vezes que este valor figura na série. 
Consequentemente, haverá repetições de distâncias iguais de cada elemento distinto 
da série para a média da série. Assim, a média indicada para estas distâncias é uma 
média aritmética ponderada. 
Exemplo: Determine o DMS para a série: 
Solução: O número de elementos da série é n = fi = 10. A média da série é:
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 68
O DMS é dado por: 
Incluiremos outra coluna para efetuar estes cálculos: 
O desvio médio simples é: 
Interpretação: Em média, cada elemento da série está afastado do valor 3 por 0,8 
unidade. 
3º Caso - VARIÁVEL CONTÍNUA 
Nesta situação, por desconhecer os valores individuais dos elementos componentes 
da série, substituiremos estes valores Xi, pelos pontos médios de classe. Desta forma, 
o desvio médio simples tem por cálculo a fórmula:
onde Xi é o ponto médio da classe i.
Exemplo: Determine o DMS para a série. 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 69
Solução: O número de elementos da série é n = fi = 20. 
Usaremos a disposição da tabela acrescentando as colunas necessárias para a 
resolução dos cálculos. 
Inicialmente acrescentamos a coluna dos pontos médios das classes: 
Em seguida, calculamos a média da série:
A média da série é:
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 70
O DMS então será:
Interpretação: Em média, cada elemento da série está afastado de 5.1 por 1,15 
unidades. 
COMENTÁRIO: O desvio médio simples depende de cada componente da série. Se 
mudarmos o valor de um único elemento da série, mudaremos também o DMS. Portanto, 
o desvio médio simples tem perfeita sensibilidade estatística. A maior dificuldade desta 
medida é envolver módulos, cujas propriedades, em geral, não são suficientemente 
conhecidas pelas pessoas que normalmente desenvolvem estes cálculos. 
Variância e Desvio Padrão 
Observamos no item anterior que a dificuldade em se operar com o DMS se deve 
a presença do módulo, para que as diferenças xi - x possam ser interpretadas como 
distâncias. 
Outra forma de se conseguir que as diferenças xi - x se tornem sempre positivas 
ou nulas é considerar o quadrado destas diferenças, isto é: (xi - x)². 
Se substituirmos, nas fórmulas do DMS a expressão |xi - x| por (xi - x)², obteremos 
uma nova medida de dispersão chamada variância. 
Portanto, variância é uma média aritmética calculada a partir dos quadrados dos 
desvios obtidos entre os elementos da série e a sua média. 
O desvio padrão é a raiz quadrada positiva da variância. 
Em particular, para estas medidas levaremos em consideração o fato de a sequência 
de dados representar toda uma população ou apenas uma amostra de uma população. 
Cálculo da Variância e Desvio Padrão 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 71
Essa é a fórmula para o cálculo da variância independentemente se forem dados 
brutos, uma variável discreta ou uma variável contínua. 
Vejamos como calcular então usando uma variável discreta.
Primeiramente, devemos calcular a média dessa distribuição
A média dessa distribuição será:
Desenvolvendo nova coluna para os cálculos, obtém-se: 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 72
Assim, a variância será:
e o desvio padrão correspondente é
Observação. Caso estejamos lidando com uma amostra, ou seja, se o exercício 
disser que nossa distribuição representa uma amostra da população, então a fórmula 
da variância ficaria 
Já o desvio padrão permanece inalterado.
Vejamos um exemplo de uma variável contínua. Partindo de uma tabela mais 
completa, teremos:
A média dessa distribuição é 
Calculando-se agora mais uma coluna, para o cálculo da variância, teremos:
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 73
e o desvio padrão será 
COMENTÁRIOS:
1. No cálculo da variância, quando elevamos ao quadrado a diferença (xi - x), a 
unidade de medida da série fica também elevada ao quadrado. Portanto, a 
variância é dada sempre no quadrado da unidade de medida da série. Se os 
dados são expressos em metros, a variância é expressa em metros quadrados. 
Em algumas situações, a unidade de medida da variância nem faz sentido. É 
o caso, por exemplo, em que os dados são expressos em litros. A variância 
será expressa em litros quadrados. Portanto, o valor da variância não pode 
ser comparado diretamente com os dados da série, ou seja: variância não tem 
interpretação. 
2. Exatamente para suprir esta deficiência da variância é que se define o desvio 
padrão. Como o desvio padrão é a raiz quadrada da variância, o desvio padrão terá 
sempre a mesma unidade de medida da série e portanto admite interpretação. 
Interpretação do Desvio Padrão 
O desvio padrão é, sem dúvida, a mais importante das medidasde dispersão. 
É fundamental que o estudante consiga relacionar o valor obtido do desvio padrão 
com os dados da série. 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 74
Quando uma curva de frequência representativa da série é perfeitamente 
simétrica como a curva abaixo, podemos afirmar que o intervalo [x - σ, x + σ] contém 
aproximadamente 68% dos valores da série. 
O intervalo [x - 2 σ, x + 2 σ] contém aproximadamente 95% dos valores da série. 
O intervalo [x - 3 σ, x + 3 σ] contém aproximadamente 99% dos valores da série.
Estes percentuais 68%, 95% e 99% que citamos na interpretação poderão mais 
tarde ser comprovados, com maior precisão, no estudo da distribuição normal de 
probabilidades. 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 75
Para uma compreensão inicial do desvio padrão, estas noções são suficientes. 
Quando a distribuição não é perfeitamente simétrica estes percentuais apresentam 
pequenas variações para mais ou para menos, segundo o caso. 
De modo que, quando se afirma que uma série apresenta média x = 100 e desvio 
padrão σ(x) = 5, podemos interpretar estes valores da seguinte forma: 
1. Os valores da série estão concentrados em torno de 100. 
2. O intervalo [95, 105] contém aproximadamente, 68% dos valores da série. O 
intervalo [90, 110] contém aproximadamente 95% dos valores da série. O intervalo 
[85, 115] contém aproximadamente 99% dos valores da série. 
É importante que se tenha percebido que, ao aumentar o tamanho do intervalo, 
aumenta-se o percentual de elementos contido no intervalo. 
3. As medidas de dispersão vistas até agora são medidas absolutas e portanto 
avaliam a dispersão absoluta da série. Todas elas são diretamente proporcionais 
à dispersão absoluta. 
Assim, se a série X apresenta x = 20 e σ(x) = 3 e se a série Y apresenta y= 22 e 
σ(y) = 2, podemos afirmar, comparando os desvios padrão, que a série X apresenta 
maior dispersão absoluta. 
7.2 Conclusão
Neste capítulo, estudamos medidas de dispersão, importantes medidas que nos 
falam sobre a dispersão, ou seja, o afastamento dos dados com relação à média 
calculada. Estas medidas devem ser apresentadas juntamente da média, para que a 
interpretação seja feita de forma mais correta. 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 76
CAPÍTULO 8
GRÁFICOS ESTATÍSTICOS
Caro estudante. Vamos a mais um capítulo do nosso curso de Indicadores 
educacionais. Neste capítulo, iremos tratar dos gráficos estatísticos, como são feitos 
e as particularidades de cada um deles. Como sempre, havendo dúvidas, recorra a 
esse material
8.1 Gráficos
Os gráficos são representações que facilitam a análise de dados, os quais costumam 
ser dispostos em tabelas quando se realiza pesquisas estatísticas. Eles trazem muito 
mais praticidade, principalmente quando os dados não são discretos, ou seja, quando 
são números consideravelmente grandes. Além disso, os gráficos também apresentam 
de maneira evidente os dados em seu aspecto temporal.
Elementos do gráfico
Ao construirmos um gráfico em estatística, devemos levar em consideração alguns 
elementos que são essenciais para sua melhor compreensão. Um gráfico deve ser 
simples devido à necessidade de passar uma informação de maneira mais rápida e 
coesa, ou seja, em um gráfico estatístico, não deve haver muitas informações, devemos 
colocar nele somente o necessário.
As informações em um gráfico devem estar dispostas de maneira clara e verídica 
para que os resultados finais sejam dados de modo coeso com a finalidade da pesquisa.”
8.2 Tipos de Gráficos
Em estatística é muito comum a utilização de diagramas para representar dados, 
diagramas são gráficos construídos em duas dimensões, isto é, no plano. Existem 
vários modos de representá-los, as principais são: gráfico de pontos, gráfico de linha, 
gráfico de barra, gráfico de coluna e gráfico de setor.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 77
8.2.1 Gráfico de pontos
Também conhecido como Dotplot, é utilizado quando possuímos uma tabela de 
distribuição de frequência, sendo ela absoluta ou relativa. O gráfico de pontos tem 
por objetivo apresentar os dados das tabelas de forma resumida e que possibilite a 
análise das distribuições desses dados.
Exemplo
Suponha uma pesquisa, realizada em uma escola de educação infantil, na qual 
foram coletadas as idades das crianças. Nessa coleta foi organizado o seguinte rol:
Rol: {1, 1, 2, 2, 2, 2, 3, 3, 4, 4, 4, 4, 4, 4, 5, 5, 6}
Podemos organizar esses dados utilizando um Dotplot 
8.2.2 Gráfico de linhas
É utilizado em casos que existe a necessidade de analisar dados ao longo do tempo, 
esse tipo de gráfico é muito presente em análises financeiras. O eixo das abscissas 
(eixo x) representa o tempo, que pode ser dado em anos, meses, dias, horas etc., 
enquanto o eixo das ordenadas (eixo y) representa o outro dado em questão.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 78
Uma das vantagens desse tipo de gráfico é a possibilidade de realizar a análise de 
mais de uma tabela, por exemplo.
Exemplo
Uma empresa deseja verificar seu faturamento em determinado ano, os dados 
foram dispostos em uma tabela:
Mês Faturamento Mês Faturamento
Janeiro R$ 10.000,00 Julho R$ 8.000,00
Fevereiro R$ 15.000,00 Agosto R$ 16.000,00
Março R$ 8.000,00 Setembro R$ 10.000,00
Abril R$ 15.000,00 Outubro R$ 11.000,00
Maio R$ 20.000,00 Novembro R$ 11.000,00
Junho R$ 24.000,00 Dezembro R$ 20.000,00
Veja que nesse tipo de gráfico é possível ter uma melhor noção a respeito do 
crescimento ou do decrescimento dos rendimentos da empresa.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 79
8.2.3 Gráfico de barras
Tem como objetivo comparar os dados de determinada amostra utilizando retângulos 
de mesma largura e altura. Altura essa que deve ser proporcional ao dado envolvido, 
isto é, quanto maior a frequência do dado, maior deve ser a altura do retângulo.
Exemplo
Imagine que determinada pesquisa tem por objetivo analisar o percentual de 
determinada população que acesse ou tenha: internet, energia elétrica, rede celular, 
aparelho celular ou tablet. Os resultados dessa pesquisa podem ser dispostos em 
um gráfico como este:
Os gráficos de barras, normalmente, são colocados em barras horizontais, como o 
exemplo abaixo, mas podem ser barras verticais, porém esses são mais conhecidos 
como gráfico de colunas, como veremos mais adiante:
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 80
8.2.4 Gráfico de colunas
Seu estilo é semelhante ao do gráfico de barras, sendo utilizado para a mesma 
finalidade. O gráfico de colunas então é usado quando as legendas forem curtas, a 
fim de não deixar muitos espaços em branco no gráfico de barra.
Exemplo
Este gráfico está, de forma genérica, quantificando e comparando determinada 
grandeza ao longo de alguns anos.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 81
8.2.5 Gráfico de setor
É utilizado para representar dados estatísticos com um círculo dividido em setores, 
as áreas dos setores são proporcionais às frequências dos dados, ou seja, quanto 
maior a frequência, maior a área do setor circular.
Exemplo
Este exemplo, de forma genérica, está apresentando diferentes variáveis com 
frequências diversas para determinada grandeza, a qual pode ser, por exemplo, a 
porcentagem de votação em candidatos em uma eleição.
No gráfico de setores, podem aparecer as porcentagens ou a quantidade de cada 
uma de suas fatias.
8.2.6 Histograma
Um histograma é uma espécie de gráfico de barras que demonstra uma distribuição 
de frequências. No histograma, a base de cada uma das barras representa uma classe 
e a altura representa a quantidadeou frequência absoluta com que o valor de cada 
classe ocorre. Ao mesmo tempo, ele pode ser utilizado como um indicador de dispersão 
de processos.
Quando você precisa apresentar ou tirar conclusões de um grande conjunto de 
dados e está trabalhando com conceitos envolvendo frequências, sejam absolutas 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 82
ou relativas, o histograma é o melhor caminho a se tomar. Ele nos auxilia com a 
representação gráfica dos conjuntos de dados de forma mais amigável, tornando 
mais fácil a visualização de onde a maioria dos valores se concentram.
É útil construir um histograma quando você deseja:
• Resumir grandes conjuntos de dados de forma visual: Muitas vezes quando 
utilizamos tabelas não é tão fácil tirar conclusões. Nós podemos facilitar nosso 
trabalho e ganhar muito mais tempo e eficiência utilizando um histograma.
• Comparar os resultados: É possível, com o auxílio do histograma, rapidamente 
comparar os resultados e, com o auxílio do eixo y, conhecer, se houver, quais 
colunas ultrapassaram os limites que você precisava ou não.
• Comunicar as informações graficamente: Tanto as pessoas da sua equipe, quanto 
os clientes, podem ver facilmente os valores que ocorrem com mais frequência. 
Quando você usa um histograma para resumir grandes conjuntos de dados ou 
para comparar resultados você está utilizando uma poderosa ferramenta de 
comunicação.
Assim que coletamos os dados, o primeiro passo que vamos dar é obter o melhor 
entendimento deles, já que nosso cérebro pode ter dificuldade para compreender um 
extenso conjunto de dados de forma automática. Dessa forma, nossa missão é deixar 
a visualização dos dados mais inteligível e explícita.
É aqui que entra o histograma, pois permitirá a obtenção das seguintes informações 
sobre o nosso processo:
• Centralidade: qual é o centro da distribuição? Onde é esperado que esteja a 
maioria das observações?
• Amplitude: a distribuição normalmente contém observações entre quais valores? 
Qual é o ponto de máximo e o ponto de mínimo?
• Simetria: será que devemos esperar a mesma frequência de pontos com valor 
alto e com valor baixo? Será que o processo é simétrico ou valores mais altos 
são mais raros?
Os histogramas às vezes são confundidos com gráficos de barras. Um histograma 
é usado para dados contínuos, em que os intervalos de classe representam a extensão 
dos dados. Já um gráfico de barra é um gráfico de variáveis categóricas ou discretas. 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 83
Alguns autores recomendam que os gráficos de barras tenham espaços entre os 
retângulos para esclarecer a diferença.
O objetivo de um histograma é ilustrar como uma determinada amostra de dados ou 
população está distribuída, dispondo as informações de modo a facilitar a visualização 
da distribuição dos dados. Ao mesmo tempo, ressalta a localização do valor central 
e da distribuição dos dados em torno deste valor central.
TIPOS DE HISTOGRAMA
Simétrico
Um histograma simétrico (ou unimodal) centraliza os dados na média (medida 
central) e possui características por meio da distribuição da média e do desvio padrão. 
Uma característica do histograma simétrico é conter a partir do centro do gráfico o 
maior número de dados. Em estatística, este modelo é chamado de normal e permite 
analisar o quanto outros dados se afastam desse modelo.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 84
Distorcido à direita
Um histograma é distorcido à direita quando a distribuição de dados indica a 
ocorrência de altos valores com baixa frequência. Este modelo também é comumente 
chamado de modelo com “cauda à direita”, pois ele vai “afinando” conforme percorremos 
o eixo x, indicando que a frequência vai diminuindo.
Portanto, se você se deparar com um gráfico desse tipo, rapidamente vai ser capaz 
de identificar o comportamento dos dados.
Distorcido à esquerda
Dessa vez vamos chamar o histograma de distorcido à esquerda quando a frequência 
dos dados está concentrada nos altos valores, do lado esquerdo, conforme percorremos 
o eixo x. Podemos, então, também chamá-lo de histograma com “cauda à esquerda”, 
pelo mesmo motivo anterior, já que à esquerda formamos uma espécie de cauda 
devido à baixa frequência dos dados no início. Observa-se que há mais informações 
acima da média devido a falta de simetria.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 85
Bimodal
Vamos chamar o histograma de bimodal quando há o aparecimento de dois picos. 
Dessa forma sabemos que em dois momentos diferentes há uma concentração de 
frequência que se destaca.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 86
Multimodal
Um histograma é multimodal quando há o aparecimento de vários picos. Os picos 
vão nos indicar o maior número de ocorrências.
Platô (Achatado)
Muito tem se falado atualmente do “efeito platô”. Essa palavra, “platô”, nos remete 
a um certo tipo de achatamento, de igualdade constante dos dados. Um histograma 
tem o formato Platô quando suas barras têm praticamente as mesmas alturas. Isto 
ocorre quando existem várias distribuições juntas com médias diferentes.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 87
8.3 Conclusão
Neste capítulo, estudamos os gráficos e seus diferentes tipos. Mais à frente, veremos 
como podemos construir esses gráficos usando uma planilha eletrônica, como o 
Excel ou o app Planilhas, do Google. Quanto mais conhecimento tivermos da análise 
de dados, principalmente com o auxílio de gráficos, nosso trabalho será muito mais 
simples e mais visual, ou seja, poderemos explicar de maneira mais prática nossas 
decisões.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 88
CAPÍTULO 9
PROBABILIDADE
Caro estudante. Vamos a mais um capítulo do nosso curso de Indicadores 
educacionais. Neste capítulo, trataremos do estudo da probabilidade. Veremos como 
podemos calcular uma probabilidade e como podemos usá-la no nosso cotidiano. 
9.1 Probabilidade
Quando solicitados a estudar um fenômeno coletivo, verificamos a necessidade de 
descrever tal fenômeno por um modelo matemático que permita explicar da melhor 
forma possível este fenômeno.
A teoria das probabilidades permite construir modelos matemáticos
que explicam um grande número de fenômenos coletivos e fornecem estratégias 
para a tomada de decisões.
Iniciaremos o estudo da teoria das probabilidades enfocando o objeto
de estudo do cálculo de probabilidades. 
FENÔMENOS ALEATÓRIOS
Entendemos por fenômeno qualquer acontecimento natural.
Se observarmos os fenômenos com respeito a seus possíveis resultados, podemos 
classificá-los em dois tipos:
a) determinísticos;
b) aleatórios. 
a) Fenômenos determinísticos - são aqueles que repetidos sob mesmas condições 
iniciais conduzem sempre a um só resultado. As condições iniciais determinam 
o único resultado possível do fenômeno.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 89
b) Fenômenos aleatórios - são aqueles que repetidos sob mesmas condições iniciais 
podem conduzir a mais que um resultado. As condições iniciais não determinam 
o resultado do fenômeno. 
Embora teoricamente tenhamos exigido as repetições, nas mesmas condições 
iniciais, isto na prática dificilmente ocorre. Mesmo quando procuramos manter as 
mesmas condições iniciais, pequenas variações certamente ocorrerão. Isto provocará 
alterações no resultado final. 
• Se estas alterações forem mínimas, para a maioria das aplicações práticas elas 
poderão ser desprezadas. Poderemos afirmar que o resultado final é único, e 
classificar o fenômeno como determinístico. 
• Se estas alterações forem significativas, então o fenômeno será classificadode aleatório. 
Exemplos:
a. Se deixarmos uma massa M cair em queda livre de uma altura de 1 metro sobre 
uma superfície, poderemos anotar o tempo t, de queda livre.
Ao tentarmos repetir o fenômeno, dificilmente conseguiremos as mesmas condições 
iniciais. Certamente repetiremos o fenômeno em condições muito próximas das iniciais.
Estas pequenas alterações nas condições iniciais provocarão pequenas alterações 
no tempo de queda. Para a maioria das aplicações, estas pequenas alterações no 
tempo de queda podem ser desprezadas e afirmamos que o resultado é único. O 
fenômeno é classificado como determinístico.
b. Se lançarmos um dado sobre uma superfície, podemos anotar o número de 
pontos da face superior do dado.
Da mesma forma que no exemplo anterior, dificilmente conseguiremos repetir o 
lançamento nas mesmas condições anteriores.
Estas pequenas variações que certamente ocorrerão na repetição do lançamento 
podem provocar substanciais mudanças no número de pontos apresentados na face 
superior do dado.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 90
Estas mudanças não podem em geral ser desprezadas e consequentemente o 
fenômeno admitirá, por repetição, mais que um resultado. Desta forma, este fenômeno 
é classificado como aleatório.
Quando um fenômeno é determinístico, a teoria das probabilidades não fornece 
um modelo adequado para a explicação do fenômeno.
A teoria das probabilidades só é útil e deve ser aplicada quando lidarmos com um 
fenômeno aleatório.
Portanto, o objeto de estudo da teoria das probabilidades são os fenômenos 
aleatórios.
Para facilitar o desenvolvimento da teoria sem usar recursos matemáticos mais 
sofisticados, vamos restringir nosso estudo a uma classe de fenômenos aleatórios 
chamados experimentos.
Os experimentos são fenômenos aleatórios que possuem as seguintes
características: 
a) repetitividade; 
b) regularidade. 
a) Repetitividade: é a característica de um fenômeno de poder ser repetido quantas 
vezes quisermos. Se por algum motivo não pudermos repetir sistematicamente 
o fenômeno, ele não será classificado como experimento. 
b) Regularidade: é a característica que diz respeito à possibilidade da ocorrência dos 
resultados do fenômeno. A avaliação numérica da possibilidade de ocorrência 
destes resultados dará origem às probabilidades. 
ESPAÇO AMOSTRAL
Como o objeto de nosso estudo são os experimentos e eles admitem mais do 
que um resultado, faz sentido definir o conjunto de todos os possíveis resultados do 
experimento.
Este conjunto será denotado por S e denominado espaço amostral do experimento.
Exemplos: O experimento consiste em:
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 91
1. Lançar uma moeda e anotar a face superior.
Se representamos cara com a letra c e coroa com a letra k, então o espaço amostral 
do experimento é S = {c, k} 
Para evitar complicações, recomendamos que o interessado sempre raciocine em 
termos de materiais ideais.
A moeda que utilizamos no caso anterior deve ser imaginada como duas calotas 
coladas adequadamente com as faces cara e coroa convencionadas por duas cores 
distintas. O material, é claro, deve ser homogêneo. O que queremos dizer é que a 
moeda não pode ser uma moeda “viciada”.
O dado idealizado, com o qual trabalharemos no próximo exemplo, deve ser um 
cubo perfeito com o número de pontos convencionado por cores. 
2. Lançar um dado e anotar o número de pontos da face superior. O espaço amostral 
é: S = (1, 2, 3, 4, 5, 6). 
3. Retirar uma carta de um baralho comum de 52 cartas e anotar o naipe da carta 
selecionada. O espaço amostral é: S = {paus, copas, ouros, espadas} 
4. Lançar duas moedas e observar as faces superiores. 1 O espaço amostral é: S 
= {cc, ck, kc, kk}. 
5. Lançar uma moeda sucessivamente, até que se obtenha a primeira face cara. 
Anota-se como resultado do experimento a sequência de caras e coroas do primeiro 
ao último lançamento. O espaço amostral é: S = {c, kc, kkc, kkkc, ...}. 
Os espaços amostrais podem ser finitos ou infinitos. Os exemplos 1, 2, 3 e 4 
apresentam espaços amostrais finitos. O exemplo 5 apresenta espaço amostral infinito. 
Para evitar recursos matemáticos mais sofisticados, vamos estudar apenas os 
espaços amostrais finitos. 
Uma excelente técnica para não omitirmos resultados do experimento na construção 
de seu espaço amostral está baseada no princípio fundamental da contagem, que 
estabelece: Se um procedimento A pode ser realizado de n maneiras diferentes e um 
procedimento B pode ser realizado de rn maneiras diferentes, então o encadeamento 
dos procedimentos A e B pode ser feito de n.m maneiras diferentes. 
Isto sugere uma disposição gráfica chamada diagrama de árvore.
O espaço amostral do exemplo 4, lançamento de duas moedas e observação das 
faces superiores, pode ser obtido utilizando-se esta técnica.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 92
Para efeito da observação das faces superiores, lançar simultaneamente duas 
moedas é o mesmo que lançar uma moeda duas vezes.
No primeiro lançamento há duas ocorrências possíveis. No segundo lançamento há 
também duas ocorrências possíveis. A sequência dos dois lançamentos terá 2.2 = 4 
ocorrências possíveis, que podem ser representadas na forma do diagrama de árvore: 
0s possíveis resultados estão estabelecidos em cada ramo da árvore:
S = {cc, ck, kc, kk}. 
EVENTO
Evento é qualquer subconjunto do espaço amostral do experimento. 
Exemplo: Se considerarmos o lançamento de um dado e a observação da face 
superior, então o espaço amostral do experimento é: S = (1, 2, 3, 4, 5, 5). 
Note que A = {I, 2); B = (2, 4, 6); C = { }; S são subconjuntos de S e portanto são 
eventos. 
Os eventos podem ser enunciados na linguagem usual. Assim, enunciaremos A 
como: sair face 1 ou face 2 no lançamento de um dado. 
Há, normalmente, várias maneiras equivalentes de se enunciar um mesmo evento. 
O evento A também poderia ser enunciado como: sair face menor que 3 no lançamento 
de um dado. 
O evento B é enunciado como: sair face 2 ou face 4 ou face 6 no lançamento de 
um dado. Isto é equivalente a afirmar: sair face par no lançamento de um dado. 
Para enunciar o evento C, basta usar qualquer propriedade que não caracterize 
nenhum dos valores de S. 
Deste modo, C pode ser enunciado como: sair face 8 no lançamento de um dado. 
Note que cada elemento que constitui o evento é um possível resultado do experimento. 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 93
Assim sendo, quando realizamos o experimento uma só vez, apenas um dos 
elementos do espaço amostral irá ocorrer não ocorrendo os demais. 
Diremos então que um evento A ocorre quando ocorrer, como resultado do 
experimento, um dos elementos de A. 
De modo resumido, podemos afirmar que um evento A ocorre quando ocorrer um 
de seus pontos. 
No exemplo inicial, se lançarmos o dado e sair face 4, diremos que: não ocorreu o 
evento A; ocorreu o evento B; não ocorreu o evento C; ocorreu o evento S. 
O conjunto vazio é subconjunto de qualquer conjunto. Portanto, em qualquer espaço 
amostral C = { } é sempre um evento. 
Observe que o evento C = { ) não possui elementos, portanto este evento nunca 
ocorrerá. 
Neste sentido, C é denominado evento impossível. 
Note também que todo conjunto é subconjunto de si próprio. Desta forma, o próprio 
espaço amostral S é sempre um evento. 
Como S contém todos os possíveis resultados do experimento, S certamente 
ocorrerá. Neste sentido, S é denominado evento certo. 
9.2 Cálculo de Probabilidade
A forma mais simples de se calcular uma probabilidade é o uso da probabilidade 
clássica, que veremos a seguir.
PROBABILIDADE CLÁSSICA
Aplica-se às situações em que os resultados que compõem o espaço amostral 
ocorrem com mesma regularidade, ou seja, os resultados são equiprováveis. Deste 
modo definimos: 
Tambémpodemos definir como sendo:
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 94
Existem outras formas de calcular uma probabilidade, que veremos em outros 
capítulos.
Vejamos alguns exemplos:
O experimento consiste no lançamento de uma moeda e na observação da face 
superior. Determine o espaço amostral do experimento e a probabilidade de cada um 
desses elementos. 
Solução: O espaço amostral é S = {c, k}. Os elementos c e k que compõem o espaço 
amostral são equiprováveis. Usando o conceito clássico de probabilidades, avaliamos: 
2. O experimento consiste no lançamento de um dado e na observação da face 
superior. Determine o espaço amostral do experimento e a probabilidade de cada 
elemento. 
Solução: O espaço amostral é S = {I, 2, 3, 4, 5, 6). Os elementos que compõem o 
espaço amostral são equiprováveis. 
3. O experimento consiste no lançamento de duas moedas e na observação do 
número de caras obtidas neste lançamento. Determine o espaço amostral e a função 
de probabilidade. 
Solução: O espaço amostral do experimento é S = {0, 1,2}. O resultado 0 (zero) 
caras só ocorre quando ocorrer (k, k) no lançamento das moedas. O resultado 2 só 
ocorre quando ocorrer (c, c) no lançamento das moedas. O resultado 1 ocorre quando 
ocorrer (c, k) ou (k, c) no lançamento das moedas. Portanto, o resultado 1 tem o dobro 
de possibilidade de ocorrer que o resultado 2 ou o resultado zero. 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 95
4. O experimento consiste no lançamento de dois dados e na observação da soma 
dos pontos das faces superiores. Determine o espaço amostral do experimento e a 
função de probabilidade. 
Solução: O espaço amostral do experimento é S = (2, 3, 4, 5, 6, 7, 8, 9, 10,11,12}. 
Estes resultados não são equiprováveis, pois há várias combinações que conduzem 
a soma 6, enquanto apenas uma combinação conduz a soma 2. 
O experimento anterior pode ser colocado em uma tabela, que nos auxilia na 
visualização dos resultados
SOMA 1 2 3 4 5 6
1 2 3 4 5 6 7
2 3 4 5 6 7 8
3 4 5 6 7 8 9
4 5 6 7 8 9 10
5 6 7 8 9 10 11
6 7 8 9 10 11 12
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 96
Perceba que, além de obtermos todos os resultados possíveis, que no caso seriam 
36, obtemos também as diferentes somas que podem ser obtidas nesse evento.
Esse tipo de tabela é muito útil quando temos repetição de eventos, como por 
exemplo o lançamento de 2 dados.
PROBABILIDADE CONJUNTA E TOTAL
Um mesmo espaço amostral pode ser analisado de diversas formas. Por exemplo, 
das respostas de 1.000 funcionários a uma pesquisa interna da empresa de serviços, 
na tabela seguinte foram registrados os resultados do hábito de fumar dos funcionários 
classificados por sexo, mulher e homem. 
Para analisar as informações dessa tabela é melhor construir a tabela a seguir 
com os mesmos resultados, porém considerando a população de 1.000 funcionários, 
registrando os valores unitários ou como porcentagens. À primeira tabela, foram 
adicionados outros resultados obtidos dos anteriores e registrados nas novas coluna 
e linha adicionadas.
A tabela construída é denominada tabela de probabilidades conjuntas e marginais e 
é uma forma prática de calcular a probabilidade condicional de dois eventos. Entretanto, 
analisemos primeiro os resultados: 
• O primeiro resultado 0,068 indica que 6,8% das mulheres fumam. Esse resultado 
representa a probabilidade conjunta: Fuma e é Mulher. 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 97
• Da mesma forma, 38,8% dos homens não fumam. Esse resultado representa a 
probabilidade conjunta: não Fuma e é Homem. 
• O total 0,15 da coluna Total é o resultado da soma das probabilidades conjuntas 
0,068 mais 0,082. O resultado 0,15 ou 15% é a probabilidade total, ou marginal, 
de Fuma ou, de outra maneira, 15% dos que responderam tem o hábito de fumar. 
• Da mesma forma, o total 0,53 da linha Total é o resultado da soma das 
probabilidades conjuntas 0,068 mais 0,462. O resultado 0,53 ou 53% é a 
probabilidade total de Mulher ou, de outra maneira, 53% dos que responderam 
são mulheres. 
• Como controle, a soma das quatro probabilidades conjuntas deve ser sempre 
igual a 1 ou 100% e, da mesma maneira, a soma das probabilidades da linha 
Total e da coluna Total deve ser sempre igual a 1 ou 100%. 
Com os resultados dessa tabela é possível obter probabilidades condicionais, por 
exemplo, a probabilidade de que o respondente da pesquisa seja mulher sabendo que 
não fuma. Essa pergunta pode ser representada da seguinte forma P(Mulher/Não fuma).
Como o evento conhecido é Não fuma, primeiro, na tabela selecionamos a linha Não 
fuma, que representa o espaço amostral reduzido, depois de ter tomado conhecimento 
do evento Não fuma. Depois, calculamos a probabilidade P(Mulher/Não fuma)=0,5435 
ou 54,35%, dividindo a probabilidade conjunta 0,462 pela probabilidade total 0,85. 
9.3 Conclusão
Neste capítulo começamos a estudar o cálculo de probabilidades. Existem outros 
métodos de cálculo de probabilidade, que veremos em capítulos posteriores. Esperamos 
que tenham compreendido e que possam usar esses conhecimentos para as tomadas 
de decisões.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 98
CAPÍTULO 10
DISTRIBUIÇÃO BINOMIAL
Caro estudante. Vamos ao nosso próximo capítulo no curso de indicadores 
educacionais. Neste capítulo, trataremos de uma distribuição de probabilidade, chamada 
de distribuição binomial. 
10.1 Distribuição Binomial
A distribuição binomial é uma distribuição de probabilidade que é calculada quando 
aparecem apenas dois resultados possíveis em um evento: um resultado que seria o 
sucesso e o resultado que seria o fracasso (ou falha).
Para que ocorra, então, devemos ter uma variável aleatória e apenas dois resultados 
possíveis. Vejamos alguns exemplos:
• O técnico do controle de qualidade sempre retira uma amostra de dez peças 
de cada lote recebido do fornecedor. O número de peças que não atendem à 
especificação é uma variável aleatória X. 
• O número de respostas sim a uma pergunta da pesquisa aplicada em 1.800 
pessoas é uma variável aleatória X. 
• O número de ações que ontem subiram comparadas com as 50 ações mais 
negociadas é uma variável aleatória X. 
Nos três exemplos, o número de vezes em que um resultado ocorre durante um 
determinado número de repetições do experimento é a variável aleatória X. 
Premissas de um experimento binomial 
• O experimento é repetido n vezes, e os n resultados do experimento são 
independentes. 
• O experimento tem apenas dois possíveis resultados ou eventos mutuamente 
excludentes: sucesso ou falha. 
• A probabilidade de sucesso do experimento é p e se mantém constante durante 
as n repetições do experimento. A probabilidade de falha do experimento é (1 - p).
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 99
Vejamos um exemplo
O gerente da loja estima que de dez vendas realizadas, três são microcomputadores 
e sete equipamentos eletrônicos. Qual a probabilidade de que uma das quatro próximas 
vendas seja um microcomputador? 
Solução.
Começamos por determinar as quatro próximas vendas e depois suas probabilidades 
de ocorrência. 
• Sendo E a venda de um equipamento eletrônico e M a de um microcomputador, 
os quatro possíveis resultados (eventos elementares) são: EEEM, EEME, EMEE 
e MEEE. 
• Dos dados do gerente, deduzimos que 70% das vendas realizadas são de 
equipamentos eletrônicos E e 30% de microcomputadores M. Se a sequência 
de venda de um M for EEEM, sua probabilidade será igual a:
P (EEEM) = 0,70 x 0,70 x 0,70 x 0,30 
P (EEEM) = 0,70³ x 0,30 = 0,1029
O resultado P(EEEM) = 10,29% foi obtido multiplicando-se todas as probabilidades, 
pois os eventos são independentes. Repetindo o mesmo procedimentopara a sequência 
de venda EEME, sua probabilidade será igual a: 
P (EEME) = 0,70 x 0,70 x 0,30 x 0,70 
P (EEME) = 0,70² x 0,30 x 0,70 = 0,1029
As probabilidades das duas sequências restantes têm o mesmo valor obtido das 
seguintes fórmulas: 
P (EMEE) = 0,70 x 0,30 x 0,70 x 0,70 
P (EMEE) = 0,70 x 0,30 x 0,70² = 0,1029
P (MEEE) = 0,30 x 0,70 x 0,70 x 0,70
P (MEEE) = 0,30 x 0,70³ = 0,1029
Considerando que os quatro eventos são mutuamente excludentes, a probabilidade 
de que uma das quatro próximas vendas seja um microcomputador é igual a 41,16%, 
resultado obtido da regra da soma com a seguinte fórmula:
P (final) = P (EEEM) + P (EEME) + P (EMEE) + P (MEEE)
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 100
P (final) = 0,1029 + 0,1029 + 0,1029 + 0,1029
P (final) = 0,4116
10.1.1 Fórmula da Distribuição Binomial
Perceberam que fazer esse tipo de probabilidade, dependendo da quantidade de 
repetições, começa a ficar cada vez maior? 
Por esse motivo, usaremos uma fórmula que nos auxiliará a calcular essa 
probabilidade.
De forma geral, a probabilidade P(x) de conseguir em n experiências k sucessos 
com probabilidade p é medida pela fórmula: 
Onde q = 1 - p
Mas o que seria esse ?
Isso é o que chamamos de binômio de Newton. Daí vem o nome de distribuição 
binomial. O binômio de Newton é calculado da seguinte forma:
 = 
Já esse ponto de exclamação, em um número, refere-se ao cálculo de um fatorial. 
Um fatorial é uma multiplicação sucessiva onde os números vão diminuindo.
Por exemplo, 5! = 5 x 4 x 3 x 2 x 1 = 120;
 7! = 7 x 6 x 5 x 4 x 3 x 2 x 1 = 5 040
Sabendo, então, o que é o fatorial e a fórmula do número binomial, podemos calcular 
alguns casos, para podermos nos aprofundar na distribuição binomial.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 101
Vejamos, agora, alguns exemplos da distribuição binomial:
Uma moeda é lançada dez vezes seguidas. Calcule a probabilidade de conseguir 
três caras. 
Solução. 
A probabilidade de conseguir três caras é 0,3125 ou 31,25%, resultado obtido com 
a fórmula:
Podemos usar o Excel, que veremos mais a fundo em próximos capítulos, para 
calcular essas probabilidades.
Por exemplo, no caso anterior, esse resultado pode ser obtido com a função estatística 
DISTRBINOM do Excel registrando a fórmula =DISTRBINOM(3;5;0,5;FALSO) em uma 
célula vazia de qualquer planilha.
DISTRBINOM(núm_s; tentativas; probabilidade_s; cumulativo) 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 102
A função estatística DISTRBINOM retorna a probabilidade ou a probabilidade 
acumulada do número de tentativas bem-sucedidas núm_s, conforme o valor do 
argumento cumulativo. 
• Se o argumento cumulativo for FALSO, a função retornará a probabilidade do 
número de sucessos núm_s com probabilidade_s de sucesso para um número 
de tentativas independentes. Neste exemplo, a função retorna a probabilidade 
0,3125 de conseguir três sucessos com probabilidade 0,5 em um experimento 
com cinco tentativas. 
• Se o argumento cumulativo for VERDADEIRO, a função retornará a probabilidade 
acumulada do número máximo de sucessos núm_s com probabilidade_s de 
sucesso para um número de tentativas independentes. 
Vejamos um exemplo usando o Excel.
Uma experiência com distribuição binomial foi repetida quatro vezes seguidas. 
Considerando a probabilidade de sucesso p=0,50: 
a) Calcule as probabilidades de todos os possíveis sucessos x. 
b) Construa o gráfico da distribuição de probabilidades.
Numa planilha, foi construída a tabela de probabilidades com a fórmula 
e ao lado foi construído o histograma.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 103
O primeiro resultado da tabela, probabilidade de x=0, pode ser obtido com a função 
estatística DISTRBINOM do Excel, registrando em uma célula vazia de qualquer planilha a 
fórmula =DISTRBINOM(0;4;0,5;FALSO), resultando no valor 0,0625. O segundo resultado, 
probabilidade de x=1, pode ser obtido com a fórmula =DISTRBINOM(1;4;0,5;FALSO), 
resultando no valor 0,25. Da mesma forma, os demais resultados da tabela. 
Usando esse mesmo caso, vejamos as seguintes situações:
• A probabilidade que x seja menor do que 2. 
• A probabilidade que x seja menor ou igual a 2. 
Solução. Na planilha foi construída a tabela utilizando a função DISTRBINOM. Na 
célula C6, foi registrada a fórmula =DISTRBINOM(B6;$C$4;$C$3;VERDADEIRO) com 
o argumento cumulativo igual a VERDADEIRO. Depois essa fórmula foi copiada até a 
célula C10. A figura seguinte mostra também o gráfico de probabilidades acumuladas. 
Vejamos as respostas. 
• A probabilidade que x seja menor do que 2 é a probabilidade acumulada até 
x=1, pois não deve ser incluída a probabilidade quando x=2. Esse resultado 
P(xum 
dado. Para obter P(x>3), aplicamos a regra do complemento P(x>3)=1-P(x≤3)=0,4335.
Exemplo 4
Uma urna contém 10 bolas, sendo 2 verdes e 8 brancas. Realizando 15 retiradas 
com reposição, calcule: 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 106
• A probabilidade de retirar cinco bolas verdes. 
• A probabilidade de conseguir até cinco bolas verdes. 
• A média e a variância desse experimento. 
Solução. 
A probabilidade de sucesso de retirar uma bola branca é 0,20. Utilizando a função 
DISTRBINOM: 
Registrando a fórmula =DISTRBINOM(5;15;0,2;FALSO), temos a probabilidade 
P(x=5)=0,1032 de conseguir cinco bolas verdes em um experimento de 15 retiradas 
com reposição. 
Registrando a fórmula =DISTRBINOM(5;15;0,2;VERDADEIRO), temos a probabilidade 
P(x≤5)=0,9389 de conseguir até cinco bolas verdes em um experimento de 15 retiradas 
com reposição. 
A média é igual a 3, e a variância, igual a 2,4.
10.2 Conclusão
Neste capítulo, vimos a distribuição binomial e como podemos usar o Excel para 
fazer alguns desses cálculos de probabilidade. O Excel é uma poderosa ferramenta, 
que usaremos em aulas futuras para podermos fazer os cálculos de estatística e 
probabilidade de um jeito mais rápido e prático.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 107
CAPÍTULO 11
DISTRIBUIÇÃO NORMAL
Caro estudante. Neste capítulo, trataremos da distribuição normal. Essa é uma das 
distribuições mais usadas para o cálculo de probabilidade. Veremos também como 
podemos usar o Excel para esses cálculos.
11.1 A distribuição normal
A distribuição normal é uma das distribuições fundamentais da moderna teoria 
estatística. A vantagem da distribuição normal reside na facilidade de defini-la com 
apenas dois parâmetros, a média μ e o desvio padrão σ da distribuição, por exemplo, 
a curva da distribuição normal f(x) para μ=40, σ=10 e valores da variável aleatória no 
intervalo (10, 70) é mostrada na figura abaixo. Uma das características importantes é 
que a partir desses dois parâmetros será possível calcular, por exemplo, a porcentagem 
de valores que deverão estar acima ou abaixo de um determinado valor da variável 
aleatória, ou entre esses dois valores definidos etc.
Existe uma fórmula para calcular essa probabilidade.
A variável aleatória X tem distribuição normal de probabilidades com parâmetros 
média –∞a. O procedimento de cálculo passa pela integração da 
função f(x) no intervalo (a,b), procedimento bastante trabalhoso. Todavia, utilizando a 
função estatística DIST.NORM do Excel, esse cálculo se tornará mais simples e, neste 
momento, nos permitirá compreender o processo de cálculo da probabilidade P(X) da 
variável aleatória contínua X com distribuição normal. Os exemplos a seguir mostram 
os procedimentos básicos de cálculo com a distribuição normal.
Os resultados do experimento formam uma variável aleatória X com distribuição 
normal N(40, 10). Qual a probabilidade de um resultado do experimento ser menor ou 
igual a 50? Solução. Os resultados do experimento têm distribuição normal com média 
μ=40 e desvio padrão σ=10. Estamos procurando o valor da probabilidade P(X≤50), a 
área sob a curva da distribuição normal no intervalo (–∞, 50), como mostra a figura 
seguinte.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 110
O valor dessa área é o resultado da integração da função f(x) entre menos infinito 
e 50. Uma forma prática de calcular a probabilidade P(X≤50) é utilizando a função 
estatística DIST.NORM do Excel. 
DIST.NORM(x; média; desv_padrão; cumulativo) 
A função DIST.NORM retorna a função densidade da distribuição normal ou a 
probabilidade acumulada de menos infinito até o valor do argumento x, conforme o 
valor registrado no argumento cumulativo. 
Se no argumento cumulativo for registrado o valor FALSO, a função estatística DIST.
NORM retornará a valor f(x) para o valor x informado no primeiro argumento da função, 
considerando os parâmetros média e desvio padrão da distribuição, registrados no 
argumento média e no argumento desv_padrão. 
Se no argumento cumulativo for registrado o valor VERDADEIRO, a função DIST.
NORM retornará a probabilidade acumulada de menos infinito até x, considerando os 
parâmetros média e desvio padrão da distribuição, registrados no argumento média 
e no argumento desv_padrão. Nesse caso, a função DIST.NORM calcula a integral da 
função f(x) no intervalo (–∞, x). 
Neste exemplo, a probabilidade P(X≤50) é igual a 84,13%, resultado obtido com 
a fórmula =DIST.NORM(50;40;10;VERDADEIRO), registrada em uma célula vazia de 
qualquer planilha Excel. Esse resultado tem o seguinte significado: 
• A probabilidade de um resultado do experimento (ou valor da variável aleatória 
X) com distribuição normal N(40, 10) ser menor ou igual a 50 é 84,13%. 
• Ou podemos dizer que 84,13% dos resultados do experimento (ou valores da 
variável aleatória X) com distribuição normal N(40, 10) estão dentro do intervalo 
(–∞, 50).
Continuando com a distribuição normal do exemplo acima, qual a probabilidade de 
um resultado do experimento ser igual ou menor do que 35? 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 111
Solução. 
Este problema é parecido com o anterior, pois devemos calcular a probabilidade 
P(X≤35) obtida da área sob a curva no intervalo (–∞, 35), como mostra a figura a seguir.
A probabilidade P(X≤35) é igual a 30,85%, resultado obtido com a fórmula =DIST.
NORM(35;40;10;VERDADEIRO), registrada em uma célula vazia de qualquer planilha 
Excel. Ou seja, a probabilidade de um resultado do experimento (ou valor da variável 
aleatória X) com distribuição normal N(40, 10) ser menor ou igual a 35 é 30,85%, 
ou 30,85% dos resultados do experimento (ou valores da variável aleatória X) com 
distribuição normal N(40, 10) estão dentro do intervalo (–∞, 35).
Distribuição normal padronizada 
Na primeira parte da apresentação da distribuição normal foi mostrado que: 
• A probabilidade P(X≤a) é o resultadode integrar a função f(x) da distribuição 
normal N(μ,σ) entre os limites (–∞, a). 
• O cálculo de probabilidades é bastante trabalhoso, pois não há apenas uma 
única distribuição normal e sim uma família de distribuições normais N(μ,σ). 
A função estatística DIST.NORM do Excel reduz sensivelmente o procedimento 
de cálculo; entretanto, o procedimento clássico de cálculo de probabilidades 
utiliza a distribuição normal padronizada obtida da distribuição normal N(μ, σ), 
realizando a mudança da variável X.
A variável aleatória desvio padrão normalizado Z de uma distribuição normal 
padronizada é definida pela expressão .
A nova variável Z realiza cálculos de probabilidades com uma única curva de 
distribuição denominada distribuição normal padronizada N(0, 1).
Propriedades da Distribuição Normal Padronizada 
A distribuição normal da variável aleatória Z com média μZ e variância σ2 Z tem 
as seguintes propriedades: 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 112
• μ Z = 0 e σ² Z = 1 
• f(Z) → 0 quando Z → ± ∞ 
• A curva é simétrica ao redor da média μ Z = 0. A área total sob a curva é 100%, 
e cada metade da curva tem 50% da área total. 
• A probabilidade P(Z1≤Z≤ Z2) é a área sob a curva no intervalo (Z1,Z2).
Uma das vantagens da distribuição normal padronizada é a facilidade de visualizar 
resultados como, por exemplo, a percentagem de valores da variável Z com um, dois 
e três desvios padrão ao redor da média. Outra vantagem é que, com a passagem 
para o desvio padrão normalizado Z, a distribuição Z agrupa a família da distribuição 
normal em uma única distribuição, o desvio padrão normalizado.
Depois de realizar a transformação, a curva da distribuição normal padronizada Z 
tem a mesma forma que a da distribuição normal, porém com média e desvio padrão, 
respectivamente, zero e um, representada como N(0, 1). A seguir, será mostrado o 
procedimento de cálculo de probabilidade utilizando a distribuição Z.
Tabela Z
Essa tabela é usada com a distribuição normal padronizada. Ela começa no valor 
z=0, com o valor 0,5000 correspondente à probabilidade acumulada da metade negativa 
da curva, região de valores de z negativos. Tanto a primeira coluna quanto os títulos 
dos cabeçalhos das demais colunas registram valores de z. Na primeira coluna, são 
registrados os valores de z, variando com intervalo de um décimo, por exemplo, 0; 0,10; 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 113
0,20, e assim por diante, até o valor z=4. Nos cabeçalhos das colunas, são registrados 
os valores de z variando com intervalo de um centésimo, por exemplo, 0,00; 0,01; 0,02, 
e assim por diante, até o valor z=0,09.
Vejamos como se procura o valor da probabilidade P(Z≤1,24) na tabela Z. A 
localização do valor z na tabela começa pela seleção da linha 1,20 e depois da coluna 
0,04. Na interseção dessa linha e dessa coluna, tem-se z=1,24 e, nessa célula, o valor 
procurado P(Z≤1,24)=0,8925, como mostra a Figura 8.11. Qual o significado do resultado 
P(Z≤1,24)? O resultado 0,8925 é a probabilidade P(–∞≤Z≤1,24), correspondente à área 
da curva de Z no intervalo (-∞, +1,24). Quando o valor de z não estiver explicitamente 
registrado na planilha, deverá ser realizada uma interpolação linear entre os dois valores 
mais próximos, um deles o maior seguinte, e o outro, o menor anterior ao valor de z 
procurado.
Colocaremos abaixo um recorte dessa tabela, para podermos entender como 
procurar os valores e como usar a tabela em si.
A curva da distribuição Z tem a mesma forma que a curva da distribuição X, com 
a mudança dos valores do eixo X para o eixo Z. Sugerimos que você tente visualizar 
a mesma curva de distribuição normal com os dois eixos X e Z. Como há diversos 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 114
cálculos de probabilidade, a tabela abaixo apresenta o resumo dos procedimentos 
de cálculo de probabilidade utilizando a tabela da distribuição normal padronizada Z.
A tabela acima mostra como operar com a tabela quando se procura o valor de 
probabilidade diferente do registrado na tabela. Essas regras registradas na tabela 
utilizam a propriedade de simetria da distribuição normal. Por exemplo, a probabilidade 
P(Z ≥ a), sendo a positivo, corresponde à cauda superior da curva a partir do valor a. 
A área que procuramos é a área complementar de P(Z ≤ a), que pode ser obtida da 
tabela. Portanto, o valor de P(Z ≥ a) procurado é o resultado de (1–P(Z ≤ a)).
Vejamos alguns exemplos:
Se a variável X tem distribuição normal com parâmetros N(40, 10), qual a probabilidade 
P(X≤50)? 
Solução. 
O valor equivalente de X=50 na distribuição normal padronizada é Z=+1, resultado 
obtido com a fórmula . Da tabela Z, para Z=+1, obtém-se 
P(X≤50)=P(Z≤1)=0,8413 ou 84,13%.
Continuando com a variável X do Exemplo acima qual a probabilidade P(X≤35)?
Solução. 
Para X=35, obtém-se Z=-0,50, porém na tabela não podemos procurar P(Z≤–0,50). 
Contudo, a terceira linha da tabela de procedimentos registra que a probabilidade 
P(Z≤a), sendo a negativo, deve ser calculada como complemento utilizando a fórmula 
1 – P(Z≤|a|), onde |a| significa que deve ser utilizado o valor a como positivo. Nesse 
caso, 1 – P(Z≤|a|) = 1 – P(Z≤+0,50) = 1 – 0,6915=0,3085.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 115
Continuando com a variável X do Exemplo acima, qual a probabilidade P(25≤X≤60)? 
Solução. 
Os valores de Z para X=25 e X=60 são Z1=–1,50 e Z2=+2,0. Como a probabilidade 
P(–1,5≤Z≤+2,0) não é obtida diretamente da tabela Z, ela será o resultado da diferença 
P(Z≤+2) – P(Z≤ –1,5), procedimento que deve ser realizado por partes: 
• A probabilidade P(Z≤+2,0) é igual a 0,9772, obtida diretamente da tabela. 
• A segunda parte é P(Z≤–1,5)=1–P(Z≤+1,5)=1-0,9332=0,0668. 
• Finalmente, P(–1,5≤Z≤+2,0)=0,9772–0,0668=0,9104 ou 91,04%.
Mais um exemplo:
Jota afirma que está entre os 5% maiores vendedores da empresa, pois seu total de 
vendas no ano passado foi de $1.350.000. Considerando que as vendas de todos os 
vendedores têm a distribuição normal N($1.250000, $100.000), verifique se a afirmação 
do vendedor Jota é correta.
Solução. 
Os 5% maiores vendedores da empresa estão localizados no final da cauda superior 
da distribuição normalizada da figura acima. Qual o valor Z1 que verifica a relação 
P(Z≥Z1)=5%? Como a tabela não tem registrada essa parte da área da curva, deveremos 
procurar a probabilidade complementar 0,95 obtida como resultado da diferença (1-
0,05). Procurando no miolo da tabela Z, verificamos que o valor 0,95 não coincide 
com nenhum dos valores registrados na tabela Z, pelo que será necessário realizar 
uma interpolação. Como o valor 0,95 situa-se entre 0,9495 (Z=1,64) e 0,9505 (Z=1,65), 
interpolando entre esses valores obtém-se Z=1,645, que corresponde à probabilidade 
P(Z≥1,645)=0,05. Com os dados disponíveis, a N($1.250000, $100.000) e o valor 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 116
Z=1,645, calculamos o valor de venda mínimo x correspondente a 5% dos maiores 
vendedores, utilizando a fórmula do desvio padrão normalizado Z:
Dessa expressão, temos que o valor de venda mínimo x correspondente a 5% dos 
maiores vendedores é x=$1.414.500, como mostra a fórmula: 
x = 1,645 × $ 100.000 + $ 1.250.000 = $ 1.414.500 
Concluindo, para pertencer ao grupo dos 5% maiores vendedores da empresa, seria 
necessário vender pelo menos $1.414.500. Como o vendedor Jota vendeu $1.350.000, 
ele não pertence ao grupo dos 5% maiores vendedores.
11.2 Conclusão
Neste capítulo, estudamos a distribuição normal, uma das principais distribuições 
de probabilidade que usamos para a tomada de decisões. Essa distribuição é muito 
usada no cotidiano de empresas quando estas querem tomar decisões sobre assuntos 
relacionados a suas vendas, a suas compras, etc.PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 117
CAPÍTULO 12
AULA PRÁTICA - 
VARIÁVEL DISCRETA
Caro estudante. Estamos quase chegando ao final de nosso curso de indicadores 
educacionais. Nesta aula, faremos uma aula prática, retomando alguns conceitos 
importantes já vistos anteriormente. Vamos a ela?
12.1 Aula prática - Retomada de conteúdos
Relembrando…
As variáveis quantitativas discretas são um tipo de variável estatística que podem 
ser medidas numericamente e que possuem um conjunto finito ou enumerável de 
valores possíveis, com pouca variabilidade de dados.
Por serem valores distintos e finitos, é possível realizar uma enumeração completa 
de todos os valores possíveis da variável.
Essa variável é amplamente útil em diversas áreas, como nas ciências sociais, na 
saúde, nas finanças e em muitas outras áreas que envolvem a coleta e análise de 
dados.
A análise estatística dessas variáveis pode fornecer informações importantes para 
a tomada de decisão em diversas áreas, como previsões e estimativas, análises de 
tendências, comparações entre grupos, entre outras aplicações.
Vejamos, então, um exemplo de uma variável discreta e como vamos fazer os 
cálculos usando uma tabela de distribuição de frequências.
Foi publicado, no jornal Diário de Marília, as idades dos 25 alunos do 1º semestre 
A, do curso de Ciência da Computação, da faculdade Kinquina, como vistas abaixo:
Dados Brutos:
20 - 20 - 24 - 25 - 23
20 - 21 - 25 - 21 - 22
24 - 21 - 22 - 25 - 20
21 - 25 - 21 - 22 - 23
22 - 21 - 21 - 20 - 24
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 118
Podemos, primeiramente, organizar esses dados em um Rol, que são os dados 
acima em ordem crescente.
Rol:
20 - 20 - 20 - 20 - 20
21 - 21 - 21 - 21 - 21
21 - 21 - 22 - 22 - 22
22 - 23 - 23 - 24 - 24
24 - 25 - 25 - 25 - 25
Vamos, agora, construir a tabela de distribuição de frequência, que nos auxiliará 
nos cálculos que faremos:
Construção da tabela da variável discreta
Xi = O que vou observar, no caso, as idades dos alunos da menor para maior. Nesta 
situação, a variável em estudo é a idade.
Fi = Frequência simples ou frequência absoluta, significa quantas vezes ocorreu cada 
idade. Por exemplo: quantos alunos possuem 24 anos; quantos possuem 25 anos. 
Fa = Frequência acumulada, é o acúmulo das frequências simples, a partir da primeira. 
Para completar a coluna de frequência acumulada, basta repetir o primeiro elemento 
da primeira linha da frequência simples e somar com o próximo elemento dessa coluna 
sucessivamente, ou seja, somar na diagonal. 
A última frequência acumulada deverá ser igual a somatória de Fi. 
Fr = Frequência relativa, é o Fi dividido por N linha a linha; a somatória tem que dar 1.
F% = Frequência percentual é igual a frequência relativa multiplicada por 100 (Fr 
vezes 100), O total da somatória tem que ser igual a 100%.
Xi . Fi = é uma coluna que é usada para o cálculo da média. Basta multiplicar linha 
a linha o elemento da coluna Xi pelo elemento da coluna Fi.
N = Somatória do Fi
Vejamos como ficaria a tabela
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 119
Agora, podemos começar a fazer alguns cálculos e retomar alguns conteúdos.
12.1.1 Média aritmética simples
Para uma sequência numérica X: x1, x2, ......, xn, a média aritmética simples, que 
designaremos por é definida por: 
No caso de estarmos trabalhando com a tabela da variável discreta, teremos:
Assim, no nosso exemplo, 
Ou seja, a idade média dos estudantes é de 22,12 anos.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 120
12.1.2 Mediana
É o valor central, aquele que divide a distribuição em duas partes iguais. No nosso 
caso, como temos uma tabela, podemos proceder da seguinte forma:
Se n é impar - admite apenas um termo central que ocupa a posição . 0 valor 
do elemento que ocupa esta posição é a mediana. 
Se n é par - Neste caso, admite dois termos centrais que ocupam as posições 
e . A mediana é convencionada como sendo a média dos valores que ocupam 
estas posições centrais. 
Como temos 25 elementos, então vamos proceder com n sendo ímpar.
Olhamos agora na coluna da frequência acumulada (Fa) para sabermos qual o 
elemento que ocupa a 13ª posição. No nosso caso, é o 22, basta ver que para o 
elemento 21, temos até 12 elementos. Então o 13º seria o próximo, no caso, o 22.
12.1.3 Moda
É o valor de maior frequência em um conjunto de dados. 
Quando trabalhamos com uma tabela, é muito simples identificar a moda desta 
distribuição. Basta verificar qual o elemento que possui a maior frequência.
No nosso exemplo, teremos que Mo = 21.
Vamos agora calcular as medidas de dispersão
12.1.3 Medidas de Dispersão
DESVIO MÉDIO SIMPLES
O conceito estatístico de desvio corresponde ao conceito matemático de distância. 
A dispersão dos dados em relação a média de uma sequência pode ser avaliada 
através dos desvios de cada elemento da sequência em relação a média da sequência. 
O desvio médio simples que indicaremos por DMS é definido como sendo uma 
média aritmética dos desvios de cada elemento da série para a média da série.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 121
No nosso exemplo:
Xi Fi Fa F% Xi . Fi
20 5 5 0,20 20 100 2,12 10,6
21 7 12 0,28 28 147 1,12 7,84
22 4 16 0,16 16 88 0,12 0,48
23 2 18 0,08 8 46 0,88 1,76
24 3 21 0,12 12 72 1,88 5,64
25 4 25 0,16 16 100 2,88 11,52
N=25 1,00 100% 553 34,84
COMENTÁRIO: O desvio médio simples depende de cada componente da série. Se 
mudarmos o valor de um único elemento da série, mudaremos também o DMS. Portanto, 
o desvio médio simples tem perfeita sensibilidade estatística. A maior dificuldade desta 
medida é envolver módulos, cujas propriedades, em geral, não são suficientemente 
conhecidas pelas pessoas que normalmente desenvolvem estes cálculos. 
Observamos no item anterior que a dificuldade em se operar com o DMS se deve 
a presença do módulo, para que as diferenças xi - possam ser interpretadas como 
distâncias. 
Outra forma de se conseguir que as diferenças xi - se tornem sempre positivas 
ou nulas é considerar o quadrado destas diferenças, isto é: (xi - )². 
Se substituirmos, nas fórmulas do DMS a expressão |xi - | por (xi - )², obteremos 
uma nova medida de dispersão chamada variância. 
Portanto, variância é uma média aritmética calculada a partir dos quadrados dos 
desvios obtidos entre os elementos da série e a sua média. 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 122
Xi Fi Fa Fr F% Xi . Fi
20 5 5 0,20 20 100 22,47
21 7 12 0,28 28 147 8,78
22 4 16 0,16 16 88 0,04
23 2 18 0,08 8 46 1,55
24 3 21 0,12 12 72 10,60
25 4 25 0,16 16 100 33,18
N=25 1,00 100% 553 76,62
 
Observação: na tabela, os valores da última coluna estão aproximados para duas 
casas decimais.
Assim, a variância será:
Agora vamos calcular o Desvio Padrão
O Desvio Padrão é a raiz quadrada da variância. Assim:
COMENTÁRIOS:
1. No cálculo da variância, quando elevamos ao quadrado a diferença (xi - ), 
a unidade de medida da série fica também elevada ao quadrado. Portanto, a 
variância é dada sempre no quadrado da unidade de medida da série. Se os 
dados são expressos em metros, a variância é expressa em metros quadrados. 
Em algumas situações, a unidade de medida da variância nem faz sentido. É 
o caso, por exemplo, em que os dados são expressos em litros. A variância 
será expressa em litros quadrados. Portanto, o valor da variância não pode 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 123
ser comparado diretamente com os dados da série, ou seja: variância não tem 
interpretação. 
2. Exatamente para suprir esta deficiência da variância é que se define o desvio 
padrão. Como o desvio padrão é a raiz quadrada da variância,o desvio padrão terá 
sempre a mesma unidade de medida da série e portanto admite interpretação. 
Interpretação do Desvio Padrão 
O desvio padrão é, sem dúvida, a mais importante das medidas de dispersão. 
É fundamental que o estudante consiga relacionar o valor obtido do desvio padrão 
com os dados da série. 
Quando uma curva de frequência representativa da série é perfeitamente simétrica 
como a curva abaixo, podemos afirmar que o intervalo [x - , x + ] contém 
aproximadamente 68% dos valores da série. 
O intervalo [x - 2 , x + 2 ] contém aproximadamente 95% dos valores da série. 
O intervalo [x - 3 , x + 3 ] contém aproximadamente 99% dos valores da série.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 124
Estes percentuais 68%, 95% e 99% que citamos na interpretação poderão mais 
tarde ser comprovados, com maior precisão, no estudo da distribuição normal de 
probabilidades. 
Quando a distribuição não é perfeitamente simétrica estes percentuais apresentam 
pequenas variações para mais ou para menos, segundo o caso. 
Vimos, no capítulo anterior, a distribuição normal. Agora, podemos interpretar de 
modo mais amplo esse conceito do desvio padrão e seus intervalos em torno da 
média. Perceba que o gráfico é exatamente o gráfico de uma distribuição normal. 
Essas porcentagens são obtidas da tabela Z, vista no capítulo 11.
12.2 Conclusão
Procuramos nesta aula retomar os conteúdos vistos quando trabalhamos como uma 
variável discreta. Retomamos os conceitos de média, mediana, moda, desvio médio 
simples, variância e desvio padrão e pudemos conferir de modo mais aprofundado 
os conceitos deste desvio padrão.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 125
CAPÍTULO 13
AULA PRÁTICA - 
VARIÁVEL CONTÍNUA
Caros estudantes. Nesta aula, iremos retomar alguns conteúdos referentes à 
variável contínua. Vamos relembrar as fórmulas e como fazemos para criar a tabela 
de distribuição de frequências com variável contínua.
13.1 Variável contínua
Uma variável quantitativa será considerada contínua quando a variabilidade dos 
dados é muito grande. Ou seja, podemos ter um rol com mais de 1 000 números, 
mas com uma variabilidade muito baixa, por exemplo apenas 5 diferentes. Neste caso, 
essa variável é considerada discreta.
Vejamos como podemos criar a tabela. Vamos a um exemplo.
Uma empresa náutica selecionou ao acaso, uma amostra de 40 revendedores 
autorizados no litoral e anotou em determinado mês o número de unidades adquiridas 
por estes revendedores. Obteve os seguintes dados:
Dados Brutos
9 14 19 20 32 18 16 26 24 20
7 18 17 28 35 22 19 39 18 21
15 18 22 20 25 28 30 16 12 20
10 15 25 21 5 23 15 21 26 32
1º passo: Encontrar os possíveis valores de K.
 
Já sabemos que a tabela terá 5,6, ou 7 classes.
 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 126
2º passo: Encontrar a amplitude total.
Li=5
Ls=39
(Não esqueça que precisamos ajustar os limites)
3º passo: Encontrar a amplitude de classe, dividindo pelos três possíveis valores de K.
A divisão deu um número inteiro para K=5 e K=7, logo vamos trabalhar com o 
maior número de K.
Neste caso trabalhamos com K=7, hc=5 , Li=5 e Ls=40.
Classe Intervalo de classe Fi Fac Ponto central (Pmi) Pmi . Fi
1 5 |------ 10 3
2 10 |----- 15 3
3 15 |----- 20 12
4 20 |----- 25 11
5 25 |----- 30 6
6 30 |----- 35 3
7 35 |----- 40 2
TOTAL 40
Vamos agora calcular a frequência acumulada e o ponto central.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 127
Classe Intervalo de classe Fi Fac Ponto central (Pmi) Pmi . Fi
1 5 |------ 10 3 3 7,5
2 10 |----- 15 3 6 12,5
3 15 |----- 20 12 18 17,5
4 20 |----- 25 11 29 22,5
5 25 |----- 30 6 35 27,5
6 30 |----- 35 3 38 32,5
7 35 |----- 40 2 40 37,5
 N=40 
Por fim, vamos fazer o cálculo do ponto central multiplicado pela frequência simples, 
para podermos fazer o cálculo da média.
Classe Intervalo de classe Fi Fac Ponto central (Pmi) Pmi . Fi
1 5 |------ 10 3 3 7,5 22,5
2 10 |----- 15 3 6 12,5 37,5
3 15 |----- 20 12 18 17,5 210
4 20 |----- 25 11 29 22,5 247,5
5 25 |----- 30 6 35 27,5 165
6 30 |----- 35 3 38 32,5 97,5
7 35 |----- 40 2 40 37,5 75
 N=40 855
Agora vamos começar alguns cálculos:
Média: 
Podemos também calcular a mediana e a moda:
Mediana:
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 128
Moda: (aqui calcularemos apenas a Moda de Czuber, pois é a mais completa)
Agora, vamos partir para as medidas de dispersão, mais precisamente a variância 
e o desvio padrão:
Para isso, precisamos criar algumas colunas que nos facilitarão o cálculo.
Primeiro, vamos criar a coluna que subtrai cada um dos pontos médios da média 
calculada. 
Classe
Intervalo de 
classe
Fi Fac
Ponto 
central (Pmi)
Pmi . Fi
1 5 |------ 10 3 3 7,5 22,5 -13,875
2 10 |----- 15 3 6 12,5 37,5 -8,875
3 15 |----- 20 12 18 17,5 210 -3,875
4 20 |----- 25 11 29 22,5 247,5 1,125
5 25 |----- 30 6 35 27,5 165 6,125
6 30 |----- 35 3 38 32,5 97,5 11,125
7 35 |----- 40 2 40 37,5 75 16,125
N=40 855
Agora, vamos calcular cada um desses valores ao quadrado
Classe
Intervalo 
de classe
Fi Fac
Ponto 
central (Pmi)
Pmi . Fi
1 5 |------ 10 3 3 7,5 22,5 -13,875 192,515625
2 10 |----- 15 3 6 12,5 37,5 -8,875 78,765625
3 15 |----- 20 12 18 17,5 210 -3,875 15,015625
4 20 |----- 25 11 29 22,5 247,5 1,125 1,265625
5 25 |----- 30 6 35 27,5 165 6,125 37,515625
6 30 |----- 35 3 38 32,5 97,5 11,125 123,765625
7 35 |----- 40 2 40 37,5 75 16,125 260,015625
N=40 855
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 129
Por fim, vamos multiplicar cada um dos elementos dessa coluna pela frequência 
simples (ou absoluta) de cada uma de suas linhas correspondentes.
Classe Intervalo de classe Fi Fac Ponto central (Pmi) Pmi . Fi
1 5 |------ 10 3 3 7,5 22,5 -13,875 192,515625 577,546875
2 10 |----- 15 3 6 12,5 37,5 -8,875 78,765625 236,296875
3 15 |----- 20 12 18 17,5 210 -3,875 15,015625 180,1875
4 20 |----- 25 11 29 22,5 247,5 1,125 1,265625 13,921875
5 25 |----- 30 6 35 27,5 165 6,125 37,515625 225,09375
6 30 |----- 35 3 38 32,5 97,5 11,125 123,765625 371,296875
7 35 |----- 40 2 40 37,5 75 16,125 260,015625 520,03125
N=40 855 2124,375
Então, agora, podemos calcular a variância e o desvio padrão:
Variância: 
Já o desvio padrão, que é a raiz quadrada da variância, será:
Desvio Padrão: 
Esses são os cálculos que fazemos para variáveis contínuas.
ISTO ESTÁ NA REDE
Em um mundo repleto de variabilidade e incerteza, o desvio padrão surge como um 
guia confiável — ele representa uma das ferramentas mais usadas e fundamentais 
em estatística e análise de dados.
Pontos-chave
O desvio padrão quantifica a variação de um conjunto de dados.
Outliers podem influenciar significativamente o valor do desvio padrão.
A regra empírica (68-95-99,7) se aplica a dados com distribuição normal.
O coeficiente de variação relaciona o desvio padrão à média do conjunto.
O desvio padrão pressupõe observações independentes e distribuição normal.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 130
O que é o Desvio Padrão?
O desvio padrão é uma medida estatística que quantifica a variação ou dispersão 
de um conjunto de dados — em outras palavras, ele indica o grau de variação dos 
valores de um conjunto em relação à sua média.
Esta medida serve para expressar o quão “espalhados” ou “concentrados” estão os 
dados em um conjunto.
Imagine que você queira saber o quão similares ou distintos são os resultados de 
um grupo de estudantes em um teste.
O desvio padrão fornece uma resposta quantitativa, esclarecendo se os escores são 
consistentemente próximos da média ou variamComo o número de elementos que compõem uma amostra é consideravelmente 
menor que o número de elementos que compõem uma População, a Estimação é 
sempre bem mais barata que o Censo, é concluída mais rapidamente que o Censo e, 
portanto, mais atualizada. 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 10
Se a maneira de avaliar um elemento é um teste destrutivo, o Censo se torna um 
processo inviável, pois destruiria a população objeto do estudo. 
Entretanto, na maioria das vezes em que o Censo é considerado inviável é por 
razões econômicas e de tempo. 
Na sociedade moderna, a maioria dos problemas exigem decisões de curto prazo. 
Por isso, as informações estatísticas úteis à resolução destes problemas devem ser 
obtidas rapidamente. 
Pela rapidez e facilidade da obtenção destas informações, a estimação tem sido 
cada vez mais utilizada como procedimento estatístico. 
1.3 Dados Estatísticos
Normalmente, no trabalho estatístico, o pesquisador se vê obrigado a lidar com 
grande quantidade de valores numéricos resultantes de um Censo ou de uma estimação. 
Estes valores numéricos são chamados dados estatísticos. 
No sentido de disciplina, a Estatística ensina métodos racionais para a obtenção de 
informações a respeito de um fenômeno coletivo, além de obter conclusões válidas 
para o fenômeno e também permitir tomada de decisões, através de dados estatísticos 
observados. 
Desta forma, a estatística pode ser dividida em duas áreas: 
a) Estatística Descritiva - é a parte da Estatística que tem por objeto descrever os 
dados observados. 
b) Estatística Indutiva - é a parte da Estatística que tem por objetivo obter e 
generalizar conclusões para a população a partir de uma amostra, através do cálculo 
de probabilidade. 
O cálculo de probabilidade é que viabiliza a inferência estatística. 
1.3.1 Estatística Descritiva
A Estatística Descritiva, na sua função de descrição dos dados, tem as seguintes 
atribuições: 
a) A obtenção dos dados estatísticos. 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 11
b) A organização dos dados. 
c) A redução dos dados. 
d) A representação dos dados. 
e) A obtenção de algumas informações que auxiliam a descrição do fenômeno 
observado. 
• A obtenção ou coleta de dados é normalmente feita através de gm questionário 
ou de observação direta de uma população ou amostra. 
• A organização dos dados consiste na ordenação e crítica quanto a correção dos 
valores observados, falhas humanas, omissões, abandono de dados duvidosos 
etc. 
• Redução dos dados - O entendimento e compreensão de grande quantidade 
de dados através da simples leitura de seus valores individuais é uma tarefa 
extremamente árdua e difícil mesmo para o mais experimentado pesquisador. 
A Estatística descritiva apresenta duas formas básicas para a redução do número de 
dados com os quais devemos trabalhar, chamadas variável discreta e variável contínua. 
• A representação dos dados - 0s dados estatísticos podem ser mais facilmente 
compreendidos quando apresentados através de uma representação gráfica, o 
que permite uma visualização instantânea de todos os dados. 
Os gráficos, quando bem representativos, tornam-se importantes instrumentos de 
trabalho. 
É ainda atributo da Estatística Descritiva a obtenção de algumas informações como 
médias, proporções, dispersões, tendências, índices, taxas, coeficientes, que facilitam 
a descrição dos fenômenos observados. Isto encerra as atribuições da Estatística 
Descritiva. 
Completando o processamento estatístico, no caso de uma Estimação, a 
Estatística Indutiva estabelece parâmetros a partir de estimadores usando o cálculo 
de probabilidade. Esta última etapa será desenvolvida posteriormente. 
1.3.2 Variáveis
Como o procedimento estatístico a ser aplicado dependerá da natureza dos dados 
ou das observações de cada variável, deve-se desenvolver a habilidade de distinguir 
os tipos de dados possíveis e suas unidades de medida. Quanto a sua natureza, 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 12
as observações ou dados se classificam em quantitativas discretas e contínuas, 
qualitativas nominais e ordinais, de corte transversal e séries temporais.
• Dados quantitativos. Refere-se a quantidades medidas numa escala numérica, em 
geral, acompanhadas de alguma unidade de medida e podem ser de dois tipos: 
• Dados discretos. Referem-se aos valores numéricos que assumem somente 
números inteiros positivos 0, 1, 2, 3 .... Os dados discretos resultam, em geral, 
de contagens: a quantidade de vendas diárias de uma empresa, o número 
de filhos das famílias de uma região do país, o número de movimentos da 
conta corrente dos clientes de um banco comercial, a quantidade de peças 
defeituosas em um lote de produção, o número de transações financeiras 
com erro de lançamentos, o número de acidentes nas estradas durante as 
férias anuais de verão etc.
• Dados contínuos. Referem-se aos valores numéricos que assumem qualquer 
valor do conjunto dos números reais. Os dados contínuos resultam, em geral, 
de medições que podem ter grande precisão: o valor das vendas diárias de 
uma empresa, a estatura dos alunos da terceira série, o valor dos depósitos e 
retiradas da conta corrente dos clientes de um banco comercial, o consumo 
mensal de energia elétrica, o tempo necessário para realizar uma tarefa 
repetitiva, o tempo de espera para ser atendido em um serviço de saúde 
pública etc.
• Dados qualitativos. Refere-se às observações não numéricas e são classificados 
em nominais e ordinais:
• Dados nominais. Esses dados não têm ordenamento nem hierarquia. Por 
exemplo, o sexo dos funcionários registrados no cadastro da empresa, o 
estado civil, o nome das empresas que têm ações negociadas na Bolsa de 
Valores, cidade de residência do respondente etc.
• Dados ordinais. Esses dados são equivalentes aos nominais, porém incluindo 
uma ordem, uma hierarquia. Por exemplo, o cargo dos funcionários registrados 
no cadastro da empresa: presidente, diretor, gerente etc.; a resposta a um 
questionário de pesquisa onde há uma escala para escolher: bom, regular e 
ruim; as posições das cinquenta maiores empresas por vendas durante um 
ano: primeira, segunda etc.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 13
1.4 Exemplo de análise estatística
Um exemplo de Estatística é o Censo 2000 realizado pelo IBGE cujo primeiro resultado 
mostra que a população do Brasil no ano 2000 era de 169.799.170 pessoas. Depois, 
a população nos anos 1980, 1990, 1996 e 2000 classificadas por sexo, por grandes 
grupos de idade e por situação de domicílio em % está registrada na tabela.
Dos resultados registrados na tabela, pode-se deduzir como essas proporções 
evoluíram com o passar do tempo, as tendências de crescimento, mas não permitem 
medir a força dessas tendências. Uma forma de analisar essas tendências é medir 
a variação desses crescimentos durante os anos definidos nas colunas da tabela.
Podemos, por exemplo, calcular a taxa de crescimento, usando a média geométrica 
(não se preocupe com o cálculo, procure entender o que estamos mostrando).
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 14
Análise dos resultados 
Os resultados da tabela acima mostram que: 
• A população total continua crescendo, entretanto a média geométrica da taxa de 
crescimento anual diminui, pois durante os anos 1980 e 1990 a média geométrica 
foi de 2,12% ao ano e durante os anos 1990 e 2000 foi de 1,5% ao ano. 
• Quanto à classificação por sexo, a população de mulheres continua sendo maior 
que a dos homens com tendência de aumentar essa diferença. De 1980 a 2000 
a população de homens tem diminuído com taxa média geométrica de –0,047% 
ao ano, e a população de mulheres tem aumentado, curiosamente, com taxa 
média geométrica +0,047% ao ano.amplamente.
Importância do Desvio Padrão
O Desvio Padrão é uma métrica essencial na estatística e análise de dados, atuando 
como uma lente pela qual podemos avaliar a consistência e confiabilidade de um 
conjunto de dados.
Uma das suas funções primárias é permitir a identificação de tendências e padrões 
significativos, ajudando os pesquisadores a discernir se um padrão é resultado de 
uma variação aleatória ou se é indicativo de uma tendência subjacente.
Além disso, oferece uma maneira robusta de comparar a variabilidade entre 
diferentes conjuntos de dados, fornecendo insights sobre a dispersão e centralidade 
dos pontos de dados em relação às médias.
No mundo das finanças e outros campos que lidam com incertezas, o desvio 
padrão é inestimável na avaliação de riscos, permitindo que os profissionais 
prevejam a volatilidade e planejem de acordo.
Ele também é a pedra angular de muitos testes estatísticos, influenciando decisões 
sobre a validade e confiabilidade dos resultados.
Por último, mas não menos importante, quando os dados são apresentados, 
seja em pesquisa, negócios ou ciência, o desvio padrão ajuda a contextualizar os 
resultados, oferecendo uma imagem mais completa da situação em análise.
Aplicações do Desvio Padrão
O Desvio Padrão, pela sua capacidade de quantificar a variabilidade dos dados, 
encontra aplicação em inúmeros campos e indústrias.
O desvio padrão é usado no setor financeiro para avaliar a volatilidade dos 
investimentos. Ele ajuda investidores e gestores a comparar a volatilidade de ativos 
com a média do mercado ou benchmarks. Um desvio padrão elevado pode sinalizar 
tanto riscos mais altos quanto potencial para maiores retornos.
Em ciências sociais e pesquisa de mercado, o desvio padrão auxilia na análise 
de dados coletados de pesquisas ou experimentos, destacando variações nas 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 131
respostas e ajudando a identificar segmentos de população ou comportamentos de 
consumo.
Na manufatura, é usado para monitorar a qualidade do produto. Processos de 
fabricação que produzem itens com baixo desvio padrão são considerados 
confiáveis e consistentes.
Na medicina, ele pode avaliar a eficácia de tratamentos, onde um baixo desvio 
padrão pode indicar que um tratamento produz resultados consistentes e positivos.
Em meteorologia e análise climática, ajuda a identificar padrões e tendências, 
fornecendo insights sobre variabilidades climáticas e previsões.
No esporte, treinadores e cientistas do esporte o usam para avaliar o desempenho 
de atletas, identificando consistência e áreas de melhoria.
Como Calcular o Desvio Padrão
Calcular o desvio padrão pode parecer complexo à primeira vista, mas ao dividir o 
processo em etapas sequenciais, ele se torna mais compreensível.
Exemplo de Cálculo do Desvio Padrão
Entender o desvio padrão por meio de um exemplo prático é uma abordagem eficaz 
para consolidar o conceito.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 132
O processo de cálculo pode ser um pouco diferente dependendo se você está 
lidando com dados de uma população inteira ou apenas uma amostra dessa 
população.
A seguir, apresentamos um exemplo detalhado, mostrando cada passo do cálculo 
do desvio padrão para um conjunto de dados.
Interpretação do Desvio Padrão
Veja algumas diretrizes para uma interpretação eficaz do desvio padrão:
Medida de dispersão: O desvio padrão evidencia a dispersão dos valores em um 
conjunto. Quanto maior o desvio padrão, maior a dispersão ou variabilidade dos 
dados. Já um desvio padrão menor indica que os valores estão mais agrupados em 
torno da média.
Regra empírica: Para dados que seguem uma distribuição normal, a regra empírica 
(ou regra 68-95-99,7) é uma ferramenta valiosa. Ela estabelece que cerca de 68% 
dos dados estão a um desvio padrão da média, 95% a dois desvios padrão, e 
aproximadamente 99,7% a três desvios padrão.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 133
Identificando outliers: Ao analisar o desvio padrão, é crucial estar atento à presença 
de outliers. Estes são valores que se distanciam significativamente da média e 
podem influenciar consideravelmente o desvio padrão. Muitas vezes, é necessário 
investigar mais profundamente para entender a origem desses outliers.
Interpretação conforme o contexto: A relevância e aceitabilidade do valor do desvio 
padrão variam conforme o campo de aplicação. Em algumas áreas, um desvio 
padrão alto pode ser indicativo de maior risco, como nas finanças. Já em processos 
de controle de qualidade, um desvio padrão baixo é sinônimo de consistência e 
padronização.
Relativo à média: É importante interpretar o desvio padrão em relação à média 
do conjunto de dados. Em certos contextos, o coeficiente de variação (CV) — que 
relaciona o desvio padrão à média — pode ser uma ferramenta útil. O CV, sendo 
uma medida adimensional, permite comparar a variabilidade entre conjuntos de 
dados de diferentes magnitudes ou unidades.
Limitações do Desvio Padrão
Relevância da Média: Para que o desvio padrão seja uma medida válida de 
dispersão, a média do conjunto de dados deve ser a representação adequada do 
centro dos dados.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 134
Observações Independentes: A correlação ou dependência entre pontos de dados 
pode distorcer o desvio padrão. Assim, é essencial garantir que as observações 
sejam independentes para uma análise correta.
Escala de Medição: É crucial reconhecer se os dados estão em uma escala 
intervalar ou de razão. Essas escalas permitem cálculos de desvio padrão 
relevantes, ao contrário das escalas nominal e ordinal.
Distribuição Normal dos Dados: Em certos contextos, a aplicação do desvio padrão 
pressupõe que os dados sejam normalmente distribuídos. A não conformidade com 
essa distribuição pode levar a interpretações imprecisas.
Considerações Sobre o Desvio Padrão
O desvio padrão é utilizado como uma ferramenta estatística para quantificar a 
dispersão de um conjunto de dados.
Ele oferece insights valiosos sobre a variabilidade dos dados.
No entanto, é essencial reconhecer suas limitações ao usá-lo como uma métrica de 
análise:
Incomparabilidade entre Unidades Diferentes: O desvio padrão, sendo uma medida 
de dispersão, é expresso na mesma unidade que os dados originais. Isso pode 
tornar difícil a comparação da variabilidade entre conjuntos de dados que têm 
diferentes unidades de medida.
Desafios na Interpretação: Embora o desvio padrão forneça uma medida 
quantitativa da dispersão, sua interpretação pode ser desafiadora, especialmente 
para aqueles que não estão familiarizados com estatísticas. Sem o devido contexto, 
pode ser difícil discernir se um desvio padrão é considerado alto ou baixo para um 
determinado conjunto de dados.
Suposição de Distribuição Normal: Em muitos contextos, o desvio padrão é mais 
relevante quando os dados têm uma distribuição normal. No entanto, nem todos 
os conjuntos de dados seguem essa distribuição. Quando aplicado a dados 
que não são normalmente distribuídos, o desvio padrão pode não fornecer uma 
representação precisa da dispersão.
Alternativas ao Desvio Padrão: Dependendo da natureza e da distribuição dos dados, 
outras medidas de dispersão, como a amplitude, o intervalo interquartil ou o desvio 
médio absoluto, podem ser mais apropriadas. Além disso, ferramentas gráficas, 
como histogramas e box plots, podem complementar o desvio padrão ao oferecer 
uma visualização mais intuitiva da dispersão dos dados.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 135
Sensibilidade a Outliers: O desvio padrão pode ser significativamente influenciado 
por outliers ou valores extremos. Um único valor atípico pode distorcer a percepção 
da dispersão geral de um conjunto de dados. Por exemplo, emum conjunto onde 
a maioria dos valores está agrupada em torno de uma média, um outlier extremo 
pode aumentar o desvio padrão, dando a impressão de que os dados são mais 
dispersos do que realmente são.
Quando Usar o Desvio Padrão
Quantificação da Dispersão: Uma das principais funções do desvio padrão é 
quantificar o quanto os dados se dispersam em relação à média. Isso permite 
entender o grau de variabilidade ou consistência em um conjunto de dados.
Dados com Distribuição Normal: Se seus dados seguem uma distribuição normal, 
o desvio padrão se torna ainda mais relevante, permitindo insights mais precisos 
sobre a variabilidade dos dados.
Limitações a Considerar: O desvio padrão tem suas restrições. Em dados 
enviesados ou que não estão em uma escala intervalar, outras medidas de 
dispersão, como o intervalo interquartil, podem ser mais apropriadas.
Comparando Variabilidade: Em situações onde dois ou mais conjuntos de dados 
têm médias parecidas, o desvio padrão pode ser uma ferramenta valiosa para 
comparar a variabilidade entre eles.
Avaliação em Finanças: No campo financeiro, o desvio padrão é frequentemente 
usado para avaliar riscos ou volatilidade de investimentos. Um desvio padrão mais 
alto pode indicar um investimento mais arriscado.
Uso Integrado com Outras Ferramentas: O desvio padrão não deve ser a única 
ferramenta em sua caixa de ferramentas estatísticas. Combiná-lo com outras 
métricas e técnicas pode proporcionar uma compreensão mais rica e abrangente 
dos seus dados.
fonte: https://estatisticafacil.org/desvendando-o-desvio-padrao/
13.2 Conclusão
Neste capítulo, revisamos conceitos fundamentais referentes à variável contínua, 
seus cálculos e mais algumas considerações acerca do desvio padrão, uma das mais 
(se não a mais importante) medida de dispersão que usamos na estatística. Nos dois 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 136
últimos capítulos, veremos como podemos fazer os cálculos usando uma planilha 
eletrônica, como o MS Excel ou o Planilhas Google.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 137
CAPÍTULO 14
VARIÁVEL DISCRETA NO EXCEL
Caro estudante, neste penúltimo capítulo, iremos estudar como podemos usar o 
MS Excel ( ou o Planilhas Google ) para fazer os cálculos de variável discreta.
14.1 O MS Excel
O Microsoft Excel é um software utilizado para elaboração, edição e gerenciamento 
de planilhas eletrônicas. Este software permite a criação e organização de dados a 
partir da criação e edição de planilhas onde os dados principais a serem trabalhados 
são números.
A tela inicial do Microsoft Excel permite a escolha de uma planilha em branco, ou 
de planilhas já pré-formatadas em um modelo. O usuário pode escolher se deseja 
iniciar a sua planilha a partir de uma planilha em branco ou de um modelo que já 
possui algumas formatações pré-definidas
Na tela inicial começamos pela barra de menus onde precisamos salvar a nossa 
pasta de trabalho no Microsoft Excel.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 138
Essa barra é composta pelos seguintes menus: Arquivo, Página Inicial, Inserir, Layout 
da Página, Fórmulas, Dados, Revisão, e Exibir. 
No menu Arquivo é possível realizar as funções de gerenciamento dos arquivos 
do Microsoft Excel como iniciar uma nova pasta, salvar uma pasta, salvar uma pasta 
com um nome diferente, abrir uma pasta existente, imprimir uma pasta ou planilha, 
compartilhar, exportar, publicar e fechar a pasta. É importante salvar a pasta com um 
nome antes de iniciar a inserção dos dados na planilha.
Para começarmos a inserir os dados em uma planilha, primeiramente, vamos 
compreender como a área de trabalho da planilha está organizada.
Esta área de trabalho inicia com linhas e colunas formando uma grande matriz, 
com linhas identificadas por números, e colunas identificadas por letras do alfabeto. O 
encontro de uma linha e uma coluna é chamado de célula e esta célula é identificada 
com a letra da coluna seguida pelo número da linha, como por exemplo, coluna A e linha 
1 é identificada como célula A1, e assim por diante para todas as células da planilha.
Vale frisar que o Excel não é um editor de texto, portanto não é possível que 
criemos determinados padrões de texto nas colunas de nossa tabela, como símbolos 
matemáticos ou sobrescrito ou subscrito.
Vamos conhecer algumas funções do Excel que nos auxiliarão nos cálculos da 
tabela discreta ( e mais à frente, na variável contínua ).
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 139
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 140
Essas são algumas das funções estatísticas que o Excel apresenta. Existem muitas 
outras, mas que não fazem parte do escopo de nossa aula.
Vamos a um exemplo, onde colocaremos os valores no Excel para fazermos os 
cálculos apropriados
Foram inseridos os dados em cada uma das células. Para contar qual a frequência 
do valor 1, vamos usar a função cont.se. Veja na figura como fazemos isso. 
Toda função do Excel deve ser precedida do sinal de igual ( = ).
Uma outra coisa importante é que podemos copiar a função, basta posicionar o 
cursor do mouse nesse ponto azul da célula B8. Ele faz com que, ao arrastarmos o 
cursor para baixo, a função seja copiada.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 141
Agora, vamos calcular a frequência acumulada. Basta copiar a primeira célula da 
frequência simples e ir somando as frequências subsequentes.
Usamos ainda a função SOMA, para somarmos os valores da coluna da frequência 
simples.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 142
Vamos criar uma outra coluna, agora fazendo a multiplicação da coluna xi pela 
coluna Fi.
E, aproveitando, vamos calcular a soma dessa coluna.
Agora, podemos calcular a média dessa distribuição, vamos fazer esse cálculo na 
célula C16.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 143
Agora, vamos fazer a coluna que usamos para calcular a variância e o desvio padrão. 
Primeiro, vamos criar a coluna que subtrai cada um dos valores da coluna xi da média. 
Agora, vamos elevar essa coluna ao quadrado.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 144
Por fim, vamos fazer essa última coluna multiplicada pela frequência simples ( ou 
absoluta). Aproveitamos e já fazemos a somatória dessa coluna.
Podemos, agora, calcular a variância e o desvio padrão. Para calcular o desvio padrão, 
podemos usar a função RAIZ, que retorna a raiz quadrada de um determinado valor.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 145
Neste exemplo, podemos, simplesmente observando, dizer que a moda Mo = 5. 
E a mediana, podemos usar uma função chamada MED ou podemos usar a fórmula 
vista em nossas aulas.
Neste caso, usamos a função MED. 
14.2 Conclusão
Neste capítulo, começamos a entender um pouco mais como usamos o Excel para 
nos auxiliar na construção de uma variável discreta. O uso de uma ferramenta desse 
tipo, além de ser muito mais rápido, faz com que, se tivermos que mudar um valor, 
todos os valores seriam modificados. Isso nos facilita sobremaneira os cálculos, caso 
um dos valores seja alterado.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 146
CAPÍTULO 15
VARIÁVEL CONTÍNUA 
USANDO O EXCEL
Caro estudante, chegamos ao último capítulo do nosso curso de Indicadores 
Educacionais. Esperamos que tenham gostado do curso e que tenham compreendido 
a importância e os cálculos usados na estatística. Neste último capítulo, usaremos o 
Excel para tratarmos de uma variável contínua.
15.1 Usando o Excelpara tratamento de variável contínua
Vamos ver como podemos usar o Excel para nos auxiliar no tratamento de dados 
de uma variável contínua. Vejamos o exemplo abaixo, onde já começamos usando a 
função MÁXIMO, que retorna o maior valor dentro de um intervalo de dados.
Agora, logo abaixo, vamos usar a função MÍNIMO, para nos indicar qual o menor 
valor dessa distribuição.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 147
Podemos ver que temos 50 dados, pois temos até a linha 10 e até a coluna E (5ª 
coluna). Então, vamos ver quais são os possíveis valores de k (basta usar a regra da raiz).
Lembrando ainda que precisamos ajustar os valores para calcular a amplitude total.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 148
Então, teremos 7 linhas, com uma amplitude de intervalo de classe de 5110.
Podemos, portanto, criar nossa tabela.
Para criarmos nossa tabela, criamos duas colunas, uma com o limite inferior da 
classe e uma com o limite superior da classe.
Além disso, usamos a função CONT.SES, onde podemos colocar vários critérios 
para a contagem dos termos.
Perceba que, primeiramente, colocamos essa tabela mais para a direita, para que 
não apagássemos os dados, obviamente. Poderíamos fazer mais para baixo também, 
ou ainda, colocar em uma outra aba, uma outra planilha.
Perceba, ainda, na figura, como foi criada a função CONT.SES, para a contagem da 
frequência simples. Colocamos “>37210”, mas o limite inferior é 37211, para que ele 
comece a contar a partir do 37211, que é o menor valor dessa linha. Quando usamos 
o sinal de maior ou menor no Excel, ele pega estritamente os valores maiores ou 
menores, não os que são iguais.
Agora, vamos fazer a frequência acumulada, como fizemos para a variável discreta.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 149
E, agora, vamos achar o ponto médio de cada classe.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 150
Verifique na figura como ficou a função que calcula esse ponto médio. Poderíamos 
também ter usado a função MÉDIA.]
Criamos agora a coluna que faz a multiplicação de cada Ponto Médio por sua 
frequência simples
Vamos calcular a média:
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 151
Neste caso, calculamos a média real, usando a função MÉDIA, para podermos 
comparar com a média calculada usando a tabela, que é o quociente entre a somatória 
da coluna da multiplicação do ponto médio multiplicado pela frequência e o total de 
elementos.
Sempre haverá um erro, pois na tabela estamos usando um valor aproximado para 
representar a classe.
Vamos agora partir para o cálculo da variância e do desvio padrão.
Já criamos as colunas, e já fizemos a subtração de cada ponto médio pela média, 
nesse caso a média calculada pela tabela. Vamos completar as colunas.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 152
E por fim, a coluna que usamos no cálculo da variância e do desvio padrão.
Colocamos os números dessa última coluna com 3 casas decimais, para mostrar 
a você como ficaram essas multiplicações. Mas isso não é necessário, pois o Excel 
fará as contas usando os valores que estão efetivamente em cada célula, não o valor 
que está aparecendo para nós.
Calculamos a variância e, por fim, calcularemos o desvio padrão, usando a função 
RAIZ.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 153
Para efeitos de comparação, vamos calcular o desvio padrão dos dados brutos, ou 
seja, dos dados que foram coletados, usando a função DESPAD.
Perceba que há uma grande diferença entre o desvio padrão calculado com os dados 
brutos e o calculado usando a tabela. Isso se dá, novamente, pelo fato de usarmos 
um valor aproximado para representar os dados dentro de uma classe.
Não entraremos aqui no mérito do cálculo na Moda e da Mediana, pois já vimos 
anteriormente, basta utilizarmos as fórmulas já vistas nos capítulos anteriores.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 154
15.2 Conclusão
Chegamos ao fim do nosso curso de Indicadores Educacionais. Esperamos que 
tenham gostado do curso, que tenham compreendido aquilo que aqui tentamos 
transmitir e mais ainda, que possam utilizar esses conhecimentos no seu dia a dia. 
O uso da Estatística é muitas vezes relegado, porém, devemos ter em mente que, por 
ser uma ciência exata, ela pode (e deve) nos auxiliar na tomada de decisões. Muito 
obrigado.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 155
CONCLUSÃO
Chegamos ao final desta jornada pelo mundo da estatística, uma jornada repleta 
de descobertas, desafios e insights reveladores. Ao longo deste livro, exploramos 
os fundamentos da estatística, desde os conceitos básicos até as técnicas mais 
avançadas, e espero que você tenha adquirido uma compreensão mais profunda e 
uma apreciação pelo poder analítico que a estatística oferece.
A estatística é muito mais do que apenas números e fórmulas; é uma ferramenta 
poderosa que nos permite fazer sentido dos dados, encontrar padrões ocultos e tomar 
decisões informadas em face da incerteza. Através da estatística, somos capazes 
de explorar o desconhecido, testar hipóteses e revelar as verdades subjacentes que 
moldam o nosso mundo.
Ao longo deste livro, discutimos como a estatística é aplicada em uma ampla gama 
de campos, desde a ciência e a medicina até a economia e os negócios. Vimos como 
as técnicas estatísticas são usadas para entender o comportamento humano, prever 
tendências futuras, melhorar processos e informar políticas públicas. Em essência, a 
estatística é uma linguagem universal que transcende fronteiras disciplinares e nos 
permite comunicar e compreender o mundo de maneiras novas e empolgantes.
No entanto, é importante lembrar que a estatística é uma ferramenta poderosa, mas 
não é infalível. Devemos sempre estar cientes de suas limitações e das armadilhas 
que podem surgir ao interpretar dados. A incerteza e a variabilidade são inerentes à 
natureza dos dados, e é nossa responsabilidade como estatísticos e analistas exercer 
o devido cuidado e rigor em nossas análises.
À medida que encerramos este livro, espero que você se sinta capacitado a utilizar os 
princípios da estatística de forma crítica e eficaz em sua vida pessoal e profissional. Que 
você seja capaz de questionar, explorar e descobrir, sempre usando a estatística como 
uma bússola confiável em seu caminho em direção ao conhecimento e à compreensão.
A estatística é uma jornada sem fim, e espero que este livro tenha sido apenas 
o começo de uma jornada emocionante e gratificante rumo ao domínio da análise 
de dados. Que você continue explorando, aprendendo e aplicando os princípios da 
estatística com entusiasmo e determinação.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 156
Obrigado por acompanhar esta jornada conosco. Que seus futuros empreendimentos 
estatísticos sejam prósperos e repletos de descobertas fascinantes!
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 157
ELEMENTOS COMPLEMENTARES 
LIVRO
Título: Estatística Aplicada à Educação com Abordagem 
Além da Análise Descritiva - Volume 1
Autor: Giovani Glaucio de Oliveira Costa
Editora: Ciência Moderna
Sinopse: Estatística Aplicada à Educação com 
Abordagem além da Análise Descritiva’ não pressupõe 
conhecimentos anteriores do assunto, pois foi escrito 
para quem se inicia no aprendizado dessa matéria. Este 
livro enfatiza a relação das técnicas estatísticas com 
a educação, com análises descritivas e também com 
a introdução de técnicas inferenciais, o que diferencia 
dos livros-textode estatística educacional, que tem foco 
basicamente em estatística descritiva. Decorre que é uma obra que serve tanto aos 
graduandos quanto aos pós-graduandos de áreas educacionais. É uma obra fácil de 
ler e explora o uso efetivo de técnicas estatísticas nas áreas educacionais e ciências 
humanas, incluindo solução de problemas que envolvem aplicação da estatística na 
administração escolar, na elaboração de testes e provas, e na pesquisa educacional de 
produção de novas teorias, usando exemplos do cotidiano do profissional de educação. 
O texto é repleto de exemplos e exercícios, extraídos da vida real do profissional 
de educação. Para facilitar a fixação de conceitos, logo após a explicação teórica é 
apresentado um ou mais exemplos. O livro propõe todos os exercícios na área de 
educação resolvidos. Também são apresentados textos com projetos e/ou pesquisas 
em ‘cases’ na área de educação. O leitor encontrará neste livro um texto de leitura 
simples, agradável, aplicada e ‘antenada’ com a vida cotidiana, e com as necessidades 
de administradores, professores e pesquisadores em educação.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 158
FILME
Título: Quebrando a Banca
Ano: 2008
Sinopse: Ben Campbell (Jim Sturgess) é um jovem 
tímido e superdotado do MIT que, precisando pagar 
a faculdade, busca a quantia necessária em jogos de 
cartas. Ele é chamado para integrar um grupo de alunos 
que, todo fim de semana, parte para Las Vegas com 
identidades falsas e o objetivo de ganhar muito dinheiro. 
O grupo é liderado por Micky Rosa (Kevin Spacey), um 
professor de matemática e gênio em estatística, com 
quem consegue montar um código infalível. Contando 
cartas e usando um complexo sistema de sinais, 
eles conseguem quebrar diversos cassinos. Até que, 
encantado com o novo mundo que se apresenta e também por sua colega Jill Taylor 
(Kate Bosworth), Ben começa a extrapolar seus próprios limites. Ótimo filme para 
entendermos a importância da probabilidade na tomada de decisões
WEB
No site do INEP, podemos ter acesso a diversas informações e estatísticas acerca do 
censo escolar que é feito anualmente. Ótimo para termos referências dos problemas 
que ocorrem em nosso país sobre essa área.
https://www.gov.br/inep/pt-br/areas-de-atuacao/pesquisas-estatisticas-e-indicadores/censo-escolar/resultados
https://www.gov.br/inep/pt-br/areas-de-atuacao/pesquisas-estatisticas-e-indicadores/censo-escolar/resultados
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 159
REFERÊNCIAS
BOLFARINE, Heleno & BUSSAB, Wilton O. Elementos de Amostragem. 1. ed. São 
Paulo: Edgard Blücher, 2005.
LAPONNI Juan Carlos Estatística usando Excel / Juan Carlos Lapponi. – Rio de 
Janeiro: Elsevier, 2005 – 8a reimpressão. 
MEDEIROS, et al. - Estatística para os cursos de economia, administração e ciências 
contábeis - São Paulo: Ed. Atlas, 1999
MORETTIN, L. G. Estatística Básica Probabilidade. São Paulo: Makron Books, 1993.
SPIEGEL MR. Estatística. Coleção Schaum. São Paulo: Editora Afiliada, 1993.
	_heading=h.gjdgxs
	_heading=h.30j0zll
	_heading=h.vf0btp5vqohw
	_heading=h.5m1ho8r3ejw1
	_heading=h.of0aem38qmxh
	_heading=h.1fob9te
	_heading=h.wsbqyu6garls
	_heading=h.52r5clu29piy
	_heading=h.i4bac6im4zym
	_heading=h.x0b4cfcio6bc
	_heading=h.6qc2q3ybs1zw
	_heading=h.pjfexl30mwgt
	_heading=h.b16td820jf5l
	_heading=h.hcte2ga302bw
	_heading=h.b4l80urt7am
	_heading=h.f1mwyhk0i03o
	_heading=h.q4juy47iy4g9
	_heading=h.dkpf7hb65rm6
	_heading=h.1s6tt44uae57
	_heading=h.gjdgxs
	_heading=h.2vbgltnclglc
	_heading=h.si505qr36ggi
	_heading=h.v5lhaqyn5g22
	_heading=h.amgey97p5suk
	_heading=h.1fob9te
	_heading=h.tvcj704nfw8z
	_heading=h.twc7kkgv6qxx
	_heading=h.2gwxs51gr4jl
	_heading=h.7p5vmc1k21ce
	_heading=h.7nmg662sddhm
	_heading=h.mx1g434r89uh
	_heading=h.k731ab4t2w2y
	_heading=h.yfgjgaspfswn
	_heading=h.n19idcfp6ttj
	_heading=h.3l6vbqttirv
	_heading=h.5h1bg7hcxo65
	_heading=h.zh7yh3xwciad
	_heading=h.kmdo40gv1dc3
	_heading=h.sktfyljb07pm
	_heading=h.pkxmna6c2pmn
	_heading=h.pgr5my69iqgl
	_heading=h.ab00vxvcyzxq
	_heading=h.8g58gg6ql680
	_heading=h.yh4zljhxbjt6
	_heading=h.7izok4t7anry
	_heading=h.w2mri6k17ipl
	_heading=h.xigqa83zsy70
	_heading=h.9u9247xo98zy
	_heading=h.4nvnnuq5p5pk
	_heading=h.h1ei0ilr23qt
	_heading=h.dwatgu451mt8
	_heading=h.etehndy3f9qr
	_heading=h.ayabkeyqdaf4
	_heading=h.n9yoi3orlhhh
	_heading=h.tyi5eknb791g
	_heading=h.8ntbhcdflvm3
	_heading=h.sprxwomlboa6
	_heading=h.sotru58l7oo4
	_heading=h.p3hf8tqfiqiv
	_heading=h.ad11m7rlux1v
	_heading=h.kbzrnxwiwf7p
	_heading=h.yd2p9ii52fq5
	_heading=h.s9ll2jkrvdaq
	_heading=h.87anfcdeyhxc
	_heading=h.uzegnonivhq2
	_heading=h.igcbzdf9tbmm
	_heading=h.r97fm2qabocj
	_heading=h.brr3alhw4i5p
	_heading=h.gkm40b3vev9k
	_heading=h.c5iya421akot
	_heading=h.dn57w1j0z2rn
	_heading=h.o0qosz8opeov
	_heading=h.1v7miziwtkao
	_heading=h.on23q9gwntxd
	_heading=h.l40u85nbu78c
	_heading=h.tnumr4x6jzfw
	_heading=h.cwursi8ex6t8
	_heading=h.ww15werrasfi
	_heading=h.ygxjnwd4vvlc
	_heading=h.mrwzpwyzzsta
	_heading=h.wvyl2t2q4osb
	_heading=h.e83923uam
	_heading=h.p8pejk85gli3
	_heading=h.6hyztu7nwx72
	_heading=h.gjdgxs
	_heading=h.30j0zll
	_heading=h.7mv301sykpkh
	_heading=h.1fob9te
	_heading=h.mbwnrnlidkj2
	_heading=h.n5eu30yymxhr
	_heading=h.8f3gbdg6bw4q
	_heading=h.bd7c4jdokdr
	_heading=h.a3cuye3grkvv
	_heading=h.y2lrxo2wp72v
	_heading=h.5spez1bieivx
	_heading=h.hfd63raiou6k
	_heading=h.3hacpvdh5shb
	_heading=h.gv2vrtqkiop3
	_heading=h.oexge4o4q3fg
	_heading=h.ww143lsu4lw5
	_heading=h.85wc0uxw6jf6
	_heading=h.gj8euuuw7ga0
	_heading=h.ji505wvivxlp
	_heading=h.gjdgxs
	_heading=h.30j0zll
	_heading=h.1fob9te
	_heading=h.y8yzxh3l0fcp
	_heading=h.2usj3jn3p5tp
	_heading=h.4n9hqc70p9j
	_heading=h.2vpz8g9bzx69
	_heading=h.vp7cinzd18qy
	_heading=h.yunz054m977s
	_heading=h.siujrpp57a1a
	_heading=h.de6rme3ldbb2
	_heading=h.xxjjacpy3ujh
	_heading=h.e552cftjlb7a
	_heading=h.edpvn3y5e78a
	_heading=h.9nuq8st53myl
	_heading=h.7t1rfxb89ip8
	_heading=h.m9bwnqkmoj9h
	_heading=h.kodo0stgzvnx
	_heading=h.t9lex5pbl8h6
	_heading=h.yvq55cqs71fc
	_heading=h.j93j6w4yqomf
	_heading=h.c6gwlu2wuzqu
	_heading=h.dkjmd9cvt2bx
	_heading=h.nqabqg33vu3n
	_heading=h.xxhasoqne059
	_heading=h.x6g7d1l2pxex
	_heading=h.iww2otusx6w
	_heading=h.ynek02fwvv7x
	_heading=h.rimwkoyvaf7r
	_heading=h.7fjr7vpxhz83
	_heading=h.sl0kb1ienud4
	_heading=h.kqf0jtpfl2wz
	_heading=h.j89g0wszib16
	_heading=h.ymly3r7022l3
	_heading=h.w004kk90qdxa
	_heading=h.k0b2zvg2z0zr
	_heading=h.mywrby8317c3
	_heading=h.xiyuvx62p9e7
	_heading=h.9phpxvrbuja5
	_heading=h.e98tqv6kaspb
	_heading=h.rsywqw3cksix
	_heading=h.m0dhnk9fq98
	_heading=h.b0djipsl86v8
	_heading=h.wzh5isd2jjmg
	_heading=h.eh1nugs91p0f
	_heading=h.gjdgxs
	_heading=h.30j0zll
	_heading=h.u23pz2y3goz2
	_heading=h.1fob9te
	_heading=h.jtdwtb7sit42
	_heading=h.cf8wcunhtar1
	_heading=h.hf7ikkibg2xp
	_heading=h.uawpzn99ldyg
	_heading=h.67ke36jd8ojy
	_heading=h.fs9mqs6fkkjd
	_heading=h.lqlp3ets8wbp
	_heading=h.lse8t7esqoh4
	_heading=h.fkk3dnsd6scc
	_heading=h.u06hxh70nnmn
	_heading=h.cdja8ikeqwq5
	_heading=h.3znysh7
	_heading=h.jg78hc7ti1t7
	_heading=h.sfq5ont0cy88
	_heading=h.x0v61iedwcwz
	_heading=h.8a69d0mlzfjs
	_heading=h.oectljn6jo41
	_heading=h.2m3hvf81ujo7
	_heading=h.k3fnh5xvdr64
	_heading=h.yfdjqeirj8tw
	_heading=h.tqjdgmbzon41
	_heading=h.gjdgxs
	_heading=h.30j0zll
	_heading=h.1fob9te
	_heading=h.2kfwcr6xv7gt
	_heading=h.q6nuf0ibi0g9
	_heading=h.467tzgsy05y6
	_heading=h.mnyfyls1k2qh
	_heading=h.ltqvmt8q4brg
	_heading=h.gxeuihb4sofn
	_heading=h.oi71ful63hxi
	_heading=h.my2mr1wxrrxr
	_heading=h.d14po6rahfvs
	_heading=h.evevnjfkoktx
	_heading=h.b0z4spradvsp
	_heading=h.hfu2lvq5svf9
	_heading=h.ffbrtacg61ub
	_heading=h.glymvb9onbkx
	_heading=h.3qmnz7yiff1s
	_heading=h.nqfcdmvdulwz
	_heading=h.ccwl9o1fzk68
	_heading=h.lrmqp066nzkh
	_heading=h.deow0jgqa6t0
	_heading=h.z28wh855yc9w
	_heading=h.zf94598udoze_heading=h.b1b2y7um1gu
	_heading=h.qorhd17raes5
	_heading=h.f0sq4oeww7ij
	_heading=h.dw8m9ff4mlwm
	_heading=h.xctm446rl82c
	_heading=h.4vbeaqm1125h
	_heading=h.emdyj4v7iu4
	_heading=h.504l6muybeqy
	_heading=h.2n7e8h5tr72j
	_heading=h.r1b6s9woqive
	_heading=h.glymvb9onbkx
	_heading=h.ma2or1gskizc
	_heading=h.ktdnl8ui8d3t
	_heading=h.udmsbphy46su
	_heading=h.ao9hoy8jnc31
	_heading=h.4tuvtslriei3
	_heading=h.1wbwayqov0fe
	_heading=h.rpnie3makfa5
	_heading=h.pp9kr876gpkz
	_heading=h.5r463zly4sd5
	_heading=h.emg3ibjz6nli
	_heading=h.ri9pw9k3uyg1
	_heading=h.orora91xe2j6
	_heading=h.r40ur931v1t6
	_heading=h.f76fqsax9arf
	_heading=h.8atte3l5xsv9
	_heading=h.ibcyl0uv3czl
	_heading=h.7a53ufie0ssp
	_heading=h.l2943zvh3v6x
	_heading=h.rh8d6khkipxi
	_heading=h.e42g2tg8t1y1
	_heading=h.lnfqki8d5o9g
	_heading=h.wxkkhvgmr218
	_heading=h.jgmv1ci24xxg
	_heading=h.v0pun9y5of4u
	_heading=h.2jk63jdvjy4v
	_heading=h.17f8uy7q7mb2
	_heading=h.2x2428nafktv
	_heading=h.z486vc3dq51h
	_heading=h.gd0p1ddduws8
	_heading=h.qknmlbun47gr
	_heading=h.em0awlwfwjgm
	_heading=h.vhswrondfiui
	_heading=h.yd5ktwsvkfhb
	_heading=h.v5zh8366hnr4
	_heading=h.f0q0y12a5emp
	_heading=h.h3lrefhj3x6c
	_heading=h.fngauqw7m3wu
	_heading=h.31ninqpf1qmi
	_heading=h.rtcdda5y44n2
	_heading=h.rfssg7tyb35m
	_heading=h.18jjxtmhrx4c
	_heading=h.3rcsmvi1fqk1
	_heading=h.5bkevh17nrcy
	_heading=h.xjdhbzlxhtlj
	_heading=h.ofdji7s7tmt3
	_heading=h.atfgu9erf55r
	_heading=h.nurf9xx9sapa
	_heading=h.vdj14x54rlvj
	_heading=h.d6yoqrlxalue
	_heading=h.ut0np3vrfc7t
	_heading=h.dq7sapew66i4
	_heading=h.3xs1rfanu6mz
	_heading=h.dbianupfsf1n
	_heading=h.sckm2kgfg8ap
	_heading=h.6aw4rvhccn64
	_heading=h.8znzdaj9erd5
	_heading=h.n3jmc917ti73
	_heading=h.d0g5c66txts1
	_heading=h.sdmwz2u2hrlx
	_heading=h.2sy2ybu9dwpf
	_heading=h.6midc7eg8lqf
	_heading=h.tbq4mc5a7ota
	_heading=h.wgt1g0z60rsn
	_heading=h.dbianupfsf1n
	_heading=h.sfsapsai7hlx
	_heading=h.3pvvmgpab1wx
	_heading=h.f76fqsax9arf
	_heading=h.tiroja86ab2a
	_heading=h.keawezk4brwb
	_heading=h.2kwd7guhb43
	_heading=h.25zmttf58qjt
	_heading=h.us24fdmq7o5b
	_heading=h.rl9r2cpm8pdk
	_heading=h.aulc0cws17s5
	_heading=h.i2txq189s51s
	_heading=h.x4jwxjb3poyq
	_heading=h.t9ni0pcdvxsg
	_heading=h.n9o7fx3tmw74
	_heading=h.uw3l5ov2dxh4
	_heading=h.o3k1shjvfj04
	_heading=h.1omn3v8gupm
	_heading=h.jlnt67qhdxlj
	_heading=h.54fa3ni2332y
	_heading=h.wgt1g0z60rsn
	_heading=h.dbianupfsf1n
	_heading=h.sfsapsai7hlx
	_heading=h.3pvvmgpab1wx
	_heading=h.f76fqsax9arf
	_heading=h.tiroja86ab2a
	_heading=h.keawezk4brwb
	_heading=h.2kwd7guhb43
	_heading=h.25zmttf58qjt
	_heading=h.us24fdmq7o5b
	_heading=h.rl9r2cpm8pdk
	_heading=h.aulc0cws17s5
	_heading=h.i2txq189s51s
	_heading=h.x4jwxjb3poyq
	_heading=h.t9ni0pcdvxsg
	_heading=h.n9o7fx3tmw74
	_heading=h.trpfvbyumwhj
	_heading=h.cso5358jpcuo
	_heading=h.km4lqam4oppd
	_heading=h.jlnt67qhdxlj
	_heading=h.54fa3ni2332y
	_heading=h.wgt1g0z60rsn
	_heading=h.dbianupfsf1n
	_heading=h.sfsapsai7hlx
	_heading=h.3pvvmgpab1wx
	_heading=h.f76fqsax9arf
	_heading=h.tiroja86ab2a
	_heading=h.keawezk4brwb
	_heading=h.2kwd7guhb43
	_heading=h.25zmttf58qjt
	_heading=h.us24fdmq7o5b
	_heading=h.rl9r2cpm8pdk
	_heading=h.aulc0cws17s5
	_heading=h.i2txq189s51s
	_heading=h.x4jwxjb3poyq
	_heading=h.t9ni0pcdvxsg
	_heading=h.n9o7fx3tmw74
	_heading=h.uvlivnejrktl
	_heading=h.gjdgxs
	_heading=h.30j0zll
	_heading=h.ty1y4pq1nim6
	_heading=h.1fob9te
	_heading=h.dbozi3b1gy5r
	_heading=h.dki137lgwu3z
	_heading=h.a9alwq6ds9ap
	_heading=h.n0rmi2n5x6pa
	_heading=h.2txiwm56rhmi
	_heading=h.8tgactz3ydxz
	_heading=h.qhr8f9bwqlo3
	_heading=h.orzb1fa7lbv1
	_heading=h.bhfjdf99vjnm
	_heading=h.ed3rrzrl55t8
	_heading=h.bp3mqm3cm87b
	_heading=h.jqjh6m533z57
	_heading=h.cpmg3fd1laxe
	_heading=h.6pxizgofltmj
	_heading=h.7u92f2e7zz09
	_heading=h.cbx1f08pvw0q
	_heading=h.twdq64g3lggf
	_heading=h.di8ocg5ylz12
	_heading=h.k8pjyz1ig1lc
	_heading=h.c271zpu5t4hi
	_heading=h.iac6m2v9gk76
	_heading=h.s3kydh2os9w9
	_heading=h.t5bxj93gfwav
	_heading=h.acypje8hm7qn
	_heading=h.zd7j8qg6fi9m
	_heading=h.hj5t33t30pbc
	_heading=h.fndzpbo1559c
	_heading=h.hh24ia88x3lk
	_heading=h.ufuuw1d4te7q
	_heading=h.n8uy81q8t9d4
	_heading=h.xhss8jr5jtyz
	_heading=h.g0071nbbh5gi
	_heading=h.4ya3hth3o3d5
	_heading=h.ufl2j3ecv9cg
	_heading=h.uqchhc5pmmlh
	_heading=h.gjdgxs
	_heading=h.30j0zll
	_heading=h.jkf9oacpmy3p
	_heading=h.9b3hi4pk9nm0
	_heading=h.3znysh7
	_heading=h.3znysh7
	_heading=h.3znysh7
	_heading=h.3znysh7
	_heading=h.3znysh7
	_heading=h.3znysh7
	_heading=h.3znysh7
	_heading=h.3znysh7
	_heading=h.3znysh7
	_heading=h.3znysh7
	_heading=h.cxg240gb1oi2
	_heading=h.8l8c9s8c82px
	_heading=h.ufvmwwgk1rpl
	_heading=h.ufvmwwgk1rpl
	_heading=h.ufvmwwgk1rpl
	_heading=h.rt79mogl4bfp
	_heading=h.qj7sm6f01guq
	_heading=h.8leb2vdkcnxq
	_heading=h.t9ismm2d4h9x
	_heading=h.2ycwc0u9vekw
	_heading=h.gjdgxs
	_heading=h.30j0zll
	_heading=h.ioo7eawhp74p
	_heading=h.1fob9te
	_heading=h.b5kqo05tt3ca
	_heading=h.bp3xyhi6tpm9
	_heading=h.itqx4gp6f1cc
	_heading=h.td5doacqgb5u
	_heading=h.w4umz9rxpbec
	_heading=h.bz4jdfa3mm7t
	_heading=h.uqhy1dk4h0hl
	_heading=h.bnzw0uja2zpv
	_heading=h.miv5wvocxjnv
	_heading=h.wbtinkkeop3x
	_heading=h.s2m945hv8om4
	_heading=h.o08a02fin8l7
	_heading=h.tg7llnbg4pi9
	_heading=h.iquehejiqxvb
	_heading=h.zcli4t66gqll
	_heading=h.o08a02fin8l7
	_heading=h.tg7llnbg4pi9
	_heading=h.i9hstf4h9kfa
	_heading=h.j5mwxxo1agnj
	_heading=h.o08a02fin8l7
	_heading=h.tg7llnbg4pi9
	_heading=h.o08a02fin8l7
	_heading=h.tg7llnbg4pi9
	_heading=h.f057dp3lnxiv
	_heading=h.l2fkddv9y15c
	_heading=h.hm04ogqbr3fc
	_heading=h.9hl9jg9pjdp8
	_heading=h.ja0jrghbinpm
	_heading=h.q9zby2r2oov3
	_heading=h.lkflovl4ndm3
	_heading=h.p4jv9s2mtdcr
	_heading=h.mt1fe6k446q3
	_heading=h.c87dykbx7i0n
	_heading=h.awfytkplydo
	_heading=h.ox3uocvlrf6o
	_heading=h.jccq0xtx06h3
	_heading=h.t7efmk4dt43h
	_heading=h.1opbyvh085et
	_heading=h.yz947bbe4fgo
	_heading=h.i8w2i5hudnaj
	_heading=h.rq3x0ufbg6xp
	_heading=h.7nbbgaewznox
	_heading=h.hf3gftglcuz5
	_heading=h.uap9myzfyjy0
	_heading=h.u6cpbtgb0g2
	_heading=h.bjheq34v014l
	_heading=h.1tynaf2ic3x7
	_heading=h.h9efc9pzypw
	_heading=h.741ze5gf6h5v
	_heading=h.umkjpqsdxv9
	_heading=h.xmiergvgz9vd
	_heading=h.n8eyjpx51qje
	_heading=h.633mw42bq0i9
	_heading=h.ycxss0zh5h61
	_heading=h.qtwamrfcf9e1
	_heading=h.7tbkl1o4p91s
	_heading=h.fy2k52qv5kqc
	_heading=h.qi8qs78dr0kl
	_heading=h.ab14exycn7fj
	_heading=h.mf1nbsjms09a
	_heading=h.dcv15h465ke8
	_heading=h.f505i2i7lfoo
	_heading=h.csa587f36w46
	_heading=h.sgp8ohq9cntu
	_heading=h.iptsjqciyqvg
	_heading=h.pn8jf3howrbb
	_heading=h.gtvhnsoybam7
	_heading=h.lg26ksanmh2d
	_heading=h.3znysh7
	_heading=h.kuvil4sw4vsw
	_heading=h.uwkfir38pki1
	_heading=h.5tdv2ep0eygu
	_heading=h.dws5dlshtii7
	_heading=h.eo3ugt9f8a2z
	_heading=h.e3aytygfpjoc
	_heading=h.d04u3wnms5e6
	_heading=h.c9o1rpx3eghs
	_heading=h.z225ilmhqyxh
	_heading=h.l5dm8mjpd3de
	_heading=h.kwn3otif9tic
	_heading=h.t16ul3o0fb4m
	_heading=h.dws5dlshtii7
	_heading=h.7wwii4vxsra8
	_heading=h.2229hv40eyqm
	_heading=h.xt4l2j5qzvyj
	_heading=h.htg8fmwh38vz
	_heading=h.r3px5e5r5e3b
	_heading=h.kbab9br9tgri
	_heading=h.lyyltfqqzvpt
	_heading=h.dws5dlshtii7
	_heading=h.pt9r04s1ggd3
	_heading=h.bisqdgr6ztg
	_heading=h.vsqcyn677luh
	_heading=h.49tpdbypxy6
	_heading=h.lf8j6hq73wz4
	_heading=h.2ifcm2tp02ss
	_heading=h.y0m4s6rsdf95
	_heading=h.1g4lilcxsw9w
	_heading=h.fz1scp2q7z8i
	_heading=h.g4es1ohncrs8
	_heading=h.ynbx2hgfjxf2
	_heading=h.xlfndn91ez9a
	_heading=h.mq8w8fv5j6wm
	_heading=h.orqw1qk3qbk0
	_heading=h.wjen685sbjok
	_heading=h.cykbekxvoke2
	_heading=h.q3l1cm7b4217
	_heading=h.69zgubatd9nc
	_heading=h.kn9mkhxeqox1
	_heading=h.kzw704rsrm7m
	_heading=h.n902mnruv8e7
	_heading=h.7h3ht9cjt6b2
	_heading=h.nq7masq5k3r5
	_heading=h.5lu39imws1fe
	_heading=h.p86nr374qxrx
	_heading=h.cf75zrm3v24u
	_heading=h.h0z1reou7dwp
	_heading=h.75ryqxmx0u6j
	_heading=h.txraymc130w6
	_heading=h.qtya4njuh9li
	_heading=h.70kirfn7wxcn
	_heading=h.q6bp2mt0qacv
	_heading=h.ywiuj5v7h6il
	_heading=h.r6a3q7drsxml
	_heading=h.9ws57kjdd1s1
	_heading=h.z94pzk6ak1e4
	_heading=h.ewdzt01cmhf9
	_heading=h.gjdgxs_heading=h.30j0zll
	_heading=h.fmv4jfqyws48
	_heading=h.1fob9te
	_heading=h.wywpf1oxdfco
	_heading=h.24niy3rvimpo
	_heading=h.lgjkbhfbt3s4
	_heading=h.l09dyv39q6ap
	_heading=h.u496t7rgitem
	_heading=h.upou9y3qin25
	_heading=h.4xdi7779ki4f
	_heading=h.6py798rxpea1
	_heading=h.8e9w8nazxjcb
	_heading=h.9c39bshyf0n
	_heading=h.e9yvf66kahw6
	_heading=h.9m73e2u0eo8u
	_heading=h.ene8o4k6qlax
	_heading=h.4btqthkp45w2
	_heading=h.why3ytx30sxc
	_heading=h.ga6yuuhssfju
	_heading=h.axvnmv1kpkye
	_heading=h.9p1zcnl9a9qo
	_heading=h.l7vyu07k1v9m
	_heading=h.26itxd182n1h
	_heading=h.qunlb72uvgrc
	_heading=h.wh7b5423o5ds
	_heading=h.s2igjupupigg
	_heading=h.pfvqryoj03cr
	_heading=h.i0x4l2nppr59
	_heading=h.n368yjalh3i2
	_heading=h.v6f0y5i84gt1
	_heading=h.t9fudqcsptwz
	_heading=h.jt7suebw3x1g
	_heading=h.wqiiuaa2og1h
	_heading=h.gogg5rojg8hx
	_heading=h.vxm0f2tou5ez
	_heading=h.q9mwlqez822h
	_heading=h.uk24id8dbhfr
	_heading=h.3xisq2caad48
	_heading=h.9mtd7mu86yho
	_heading=h.qr0btnol73vy
	_heading=h.tl6i5x80dtx4
	_heading=h.gjdgxs
	_heading=h.30j0zll
	_heading=h.m0dhnk9fq98
	_heading=h.zg9mcc51enn1
	_heading=h.wzh5isd2jjmg
	_heading=h.8pyxfso9aztp
	_heading=h.cbx1f08pvw0q
	_heading=h.5tkjoeidqawf
	_heading=h.gjdgxs
	_heading=h.30j0zll
	_heading=h.1fob9te
	_heading=h.7j67bbtn0eh2
	_heading=h.gjdgxs
	_heading=h.30j0zll
	_heading=h.1fob9te
	_heading=h.70irgov3t5wt
	_heading=h.h2vz6sffll29
	_heading=h.irkop9j7jam3
	_heading=h.dpn4q5r1duv2
	_heading=h.9y5n2x80dmc
	_heading=h.jvi2f1x3g1xc
	_heading=h.gjdgxs
	_heading=h.30j0zll
	_heading=h.pqzavjyp2bt4
	Estatística
	Distribuição de frequências
	Distribuição de frequência: variável contínua
	Medidas de tendência central
	Medidas de tendência central - variável contínua
	Medidas separatrizes
	Medidas de dispersão
	Gráficos estatísticos
	Probabilidade
	Distribuição Binomial
	Distribuição Normal
	Aula prática - Variável discreta
	Aula prática - Variável contínua
	Variável discreta no Excel
	Variável contínua usando o Excel
	_heading=h.30j0zll
	_heading=h.gjdgxs• Quanto à classificação por grandes grupos de idade entre 1980 e 2000, a 
população entre 0 e 14 anos diminuiu com taxa média geométrica de –1,27% 
ao ano, a população entre 15 e 64 anos aumentou com taxa média geométrica 
de 0,56% ao ano, e a população com mais de 65 anos aumentou com taxa 
média geométrica 1,91% ao ano. 
• Quanto à classificação por situação de domicílio 1980 e 2000, a população com 
domicílio urbano aumentou com taxa média geométrica de crescimento positiva 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 15
de 0,9% ao ano e a população com domicílios rurais diminuiu com taxa média 
geométrica de crescimento negativa de –2,7% ao ano.
Projeções 
A análise desses resultados não se esgota nas poucas medidas que realizamos na 
tabela, pois a partir desses resultados surgem perguntas relacionadas, primeiro, com 
as causas que vêm provocando esses resultados e, depois, com as projeções futuras 
que se podem extrair desses resultados. Por exemplo, enumerando as causas que 
vêm provocando a diminuição da população jovem e aumentando a população adulta 
com destaque às pessoas com mais de 65 anos e, olhando para o futuro, também 
poderiam ser enumeradas as possíveis consequências dessas tendências. Um resultado 
rápido das consequências futuras pode-se resumir da seguinte forma: em longo prazo 
a população será mais velha e crescerá menos como mostra a projeção abaixo:
Decisões 
Os resultados estatísticos ajudam a tomar decisões com base em poucos dados. 
O processo estatístico de amostragem ou censo gera informações que auxiliam na 
realização de previsões ou projeções e é, ou deve ser, uma das preocupações das 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 16
atividades de negócios e governamentais. Nas empresas é necessário prever as vendas, 
os estoques, os custos, o fluxo de caixa etc. para um determinado período como é o 
orçamento anual do próximo ano. Na administração pública faz-se necessário prever o 
número de habitantes, a arrecadação, os custos dos serviços prestados etc. Voltando 
ao Censo 2000, o seguinte trecho é um exemplo do que dizemos “...O estadista tem o 
dever de governar com olho no futuro, antecipando-se em dar respostas a problemas 
que explodirão depois de seu mandato....”
Nas empresas que desejarem continuar crescendo no mercado em que atuam 
os desafios não são muito diferentes. As tendências dos índices mostram riscos, 
oportunidades e desafios. Enquanto o cliente dos serviços da administração pública 
é formado praticamente por todos os habitantes do país, o cliente das empresas 
privadas é uma parte desses habitantes. Por exemplo, o gerente de marketing necessita 
determinar o tamanho do mercado de seu novo produto, mas a população desse 
produto nem sempre coincide com a população do país, como descreve o seguinte 
trecho de um editorial: “Que a afirmação, repetida à exaustão, de que o Brasil é um 
mercado constituído por 170 milhões de consumidores é uma falácia não é novidade. ... 
40 milhões de pessoas, ou 23,5% da população do País, com rendas média e alta, que 
participam plenamente do mercado consumidor. ... Do consumo depende o crescimento 
sustentado da economia. As pessoas com rendas média e alta, segundo a pesquisa, 
já atingiram o limite de sua capacidade de consumo. A expansão das atividades 
dependeria, portanto, dos 130 milhões de pessoas que compõem as faixas mais 
baixas de rendimento ...”.
1.5 Conclusão
Neste primeiro capítulo, começamos a ver o que é a estatística, qual a diferença 
entre população e amostra e quais os tipos de variáveis que existem e como podemos 
começar a entender uma análise estatística. Esperamos que tenham gostado e, caso 
tenham alguma dúvida, recorram a esse material. Bons estudos.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 17
CAPÍTULO 2
DISTRIBUIÇÃO DE 
FREQUÊNCIAS
Caro estudante. Vamos continuar nossos estudos com relação à estatística. Neste 
capítulo, vamos estudar como funciona a distribuição de frequências, mais precisamente 
das variáveis discretas. Veremos como podemos começar a preencher essa tabela 
que nos auxiliará na tomada de decisões.
2.1 A tabela de distribuição de frequências
Quando lidamos com poucos valores numéricos, o trabalho estatístico fica 
sensivelmente reduzido. No entanto, normalmente teremos que trabalhar com grande 
quantidade de dados. 
Um dos objetivos da Estatística Descritiva neste caso, é obter uma significativa 
redução na quantidade de dados com os quais devemos operar diretamente. Isto pode 
ser conseguido modificando-se a forma de apresentação destes dados. 
Suponha que observamos as notas de 30 alunos em uma prova e obtivemos os 
seguintes valores: 
Se entendermos como frequência simples de um elemento o número de vezes 
que este elemento figura no conjunto de dados, podemos reduzir significativamente 
o número de elementos com os quais devemos trabalhar.
 Para isso organiza-se o conjunto de dados na forma de uma série estatística 
chamada variável discreta. 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 18
Distribuição de Frequência - Variável Discreta 
É uma representação tabular de um conjunto de valores em que colocamos na 
primeira coluna em ordem crescente apenas os valores distintos da série e na segunda 
coluna colocamos os valores das frequências simples correspondentes. 
Se usarmos f para representar frequência simples, a sequência pode ser representada 
pela tabela: 
OBSERVAÇÕES: 
(1) Note que a colocação de um índice i para x e para f tem a finalidade de referência. 
Deste modo, x1 representa o primeiro valor distinto da série, x2 representa o segundo 
valor distinto da série, f1 representa a frequência simples do primeiro valor distinto 
da série, f2 representa a frequência simples do 2º valor distinto da série e assim 
sucessivamente. 
(2) Note que conseguimos reduzir de 30 elementos que constituíam a série original 
para apenas 12 elementos. 
(3) Note também que a variável discreta só é uma forma eficiente de redução dos 
dados, quando o número de elementos distintos da série for pequeno. 
Devemos optar por uma variável discreta na representação de uma série de valores 
quando o número de elementos distintos da série for pequeno. 
2.1.1 Construção da variável discreta
A construção de uma variável discreta é bastante simples. Basta observar quais 
são os elementos distintos da sequência, ordená-los, e colocá-los na primeira coluna 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 19
da tabela. Em seguida, computar a frequência simples de cada elemento distinto e 
colocá-la na segunda coluna da tabela. 
Exemplo de construção de uma variável discreta: A sequência abaixo representa a 
observação do número de acidentes por dia, em uma rodovia, durante 20 dias.
Os valores distintos da sequência são: 0, 1, 2, 3. 
As frequências simples respectivas são: 8, 5, 5, 2. 
Portanto, a variável discreta representativa desta sequência é: 
2.1.2 Frequência relativa de um elemento da série - fr
É a divisão da frequência simples deste elemento pelo número total de elementos 
da série. 
Exemplo: Considere a variável discreta: 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 20
O total de elementos desta série é 25. Portanto, a frequência relativa 30 primeiro 
elemento distinto da série, que é 2, vale: 
A frequência relativa do segundo elemento distinto, que é 3, vale: 
Da mesma forma determinamos a frequência relativa dos elementos seguintes da 
série: 
Note que estes valores representam a participação percentual de cada elemento 
distinto na série. Assim, podemos fazer a interpretação: 12% dos valores da série são 
iguais a 2; 28% dos valores da série são iguais a 3; 32% dos valores da série são iguais 
a 4; 24% dos valoresda série são iguais a 6; e 4% dos valores da série são iguais a 7. 
2.1.3 Frequência acumulada de um elemento da série - fac
 ou Fi
É a soma da frequência simples deste elemento com as frequências simples dos 
elementos que o antecedem. 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 21
Desta forma, a frequência acumulada para os elementos 2, 3, 4, 6 e 7 valem 
respectivamente: 
Estes valores podem ser interpretados da seguinte forma: 
• 3 elementos componentes da série são valores menores ou iguais a 2. 
• 10 elementos componentes da série são valores menores ou iguais a 3. 
• 18 elementos componentes da série são valores menores ou iguais a 4. 
• 24 elementos componentes da série são valores menores ou iguais a 6. 
• 25 elementos componentes da série são valores menores ou iguais a 7. 
2.1.4 Frequência acumulada relativa de um elemento da série - fac ri
 ou Fri
É a divisão da frequência acumulada deste elemento, pelo número al de elementos 
da série: 
Assim, a frequência acumulada relativa dos elementos 2, 3, 4, 6 e 7 valem 
respectivamente: 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 22
Estes valores podem ser interpretados da seguinte forma: 
• 12% dos valores da série são menores ou iguais a 2. 
• 40% dos valores da série são menores ou iguais a 3. 
• 72% dos valores da série são menores ou iguais a 4.
• 96% dos valores da série são menores ou iguais a 6.
• 100% dos valores da série são menores ou iguais a 7. 
Quando acrescentamos estes valores a tabela original, esta passa a se chamar 
distribuição de frequências. Para o exemplo estabelecido, a distribuição de frequências é: 
Vejamos mais um exemplo, para entendermos melhor
O gerente do departamento de uma instituição financeira deseja analisar o 
número diário de operações fechadas nos últimos dois anos por um operador de 
seu departamento de opções de ações negociadas na Bolsa de Valores. Na tabela 
a seguir foi registrada uma amostra probabilística simples de tamanho 26, extraída 
das operações diárias fechadas pelo Operador B nos últimos dois anos. O objetivo é 
obter as possíveis conclusões dos registros dessa tabela.
Solução. 
Aplicando inicialmente apenas o bom senso, pode-se constatar que: 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 23
• O número de operações fechadas por dia é um número do conjunto {11, 12, 13, 
14, 15, 16, 17}. 
• O Operador B fechou entre 11 e 17 operações por dia. 
• O número diário máximo de operações fechadas pelo Operador B é 17, e o 
número mínimo é 11.
Embora tenham sido obtidas algumas conclusões, o simples ordenamento dos 
dados não permite obter maiores conclusões, pois ainda nos deparamos com a mesma 
quantidade de dados. Necessitamos agrupar os dados de alguma maneira, tendo em 
mente que esse procedimento não deve interferir na obtenção de conclusões. 
Vejamos agora como ficariam as frequências relativas desta distribuição
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 24
Da tabela de frequências relativas, chegamos a estas conclusões: 
• Em 3,85% dos 26 dias amostrados, o Operador B fechou 17 negócios por dia. 
• Em 7,69% dos dias amostrados, o Operador B fechou 11 negócios por dia. 
• Durante 26,92% dos dias da amostra, o Operador B fechou 14 negócios.
Vejamos por fim como ficam as frequências acumuladas:
Das tabelas de frequências acumuladas absolutas e relativas acima, temos as 
seguintes conclusões: 
• Ao afirmar que o operador B fechou 14 ou menos operações por dia em 76,92% 
dos dias da amostra, foi incluído nessa afirmativa o fechamento de 14 operações 
por dia. Diferente das seguintes declarações: 
• O operador B fechou menos de 14 operações por dia em 50% dos dias da 
amostra; o fechamento de 14 operações não está incluído. 
• O operador B fechou menos de 15 operações por dia em 76,92% dos dias da 
amostra; o fechamento de 15 operações por dia não está incluído. 
• Ao afirmar que em 23,08% dos dias o operador B fechou 15 ou mais operações 
por dia, está incluído nesse resultado o fechamento de 15 operações por dia. 
Verifique que esse último resultado (23,08%) é o complemento do operador ter 
fechado menos de que 15 operações por dia (76,92%), pois o resultado da soma 
desses dois valores é 100%. 
• Ao afirmar que em 61,54% dos dias o operador B fechou entre 13 e 15 operações, 
incluindo esses valores, estamos realizando os seguintes cálculos: 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 25
• Em 88,46% dos dias, o operador B fechou 15 ou menos operações. 
• Em 26,92%, fechou 12 ou menos operações, ou fechou menos de 13 operações. 
• Portanto, em 61,54%=88,46% – 26,92% dos dias o operador B fechou entre 
13 e 15 operações, incluindo esses valores.
Outro ponto importante a ser destacado é que, analisando o procedimento da 
construção dessa tabela, observamos que: 
• A construção da tabela de frequências acumuladas absolutas é realizada com 
os dados registrados na tabela de frequências absolutas. No sentido inverso, 
a construção da tabela de frequências absolutas poderá ser realizada com os 
dados registrados na tabela de frequências acumuladas absolutas. E da mesma 
maneira para as frequências relativas. 
• A construção da tabela de frequências acumuladas relativas pode ser realizada 
com os dados registrados na tabela de frequências acumuladas absolutas se for 
conhecido o tamanho da amostra. No sentido inverso, a tabela de frequências 
acumuladas absolutas poderá ser construída com os dados registrados na tabela 
de frequências acumuladas relativas se for conhecido o tamanho da amostra.
2.2 Conclusão
Neste capítulo começamos a construir a tabela de distribuição de frequências de 
uma variável discreta. Vimos também como calculamos as frequências relativa e 
acumulada. Essa construção já nos auxilia na tomada de decisões e na análise das 
variáveis trabalhadas. 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 26
CAPÍTULO 3
DISTRIBUIÇÃO DE FREQUÊNCIA: 
VARIÁVEL CONTÍNUA
Caro estudante. Neste capítulo, veremos como fazemos a construção de uma tabela 
de distribuição de frequências usando uma variável contínua. Temos que tomar um 
certo cuidado com essa construção, como veremos a seguir.
3.1 A variável contínua
Uma variável quantitativa será considerada contínua quando a variabilidade dos 
dados é muito grande. Ou seja, podemos ter um rol com mais de 1 000 números, mas 
com uma variabilidade muito baixa, por exemplo apenas 5 diferentes. Neste caso, essa 
variável é considerada discreta, como vimos no capítulo anterior. 
Vejamos como construímos então a variável contínua.
Suponha que a observação das notas de 30 alunos em uma prova nos conduzisse 
aos seguintes valores: 
Observando estes valores notamos grande número de elementos distintos, o que 
significa que neste caso a variável discreta não é aconselhável para a redução de dados. 
Nesta situação é conveniente agrupar os dados por faixas de valores, ficando a 
série com a seguinte apresentação: 
A construção da variável contínua requer o conhecimento de alguns conceitos que 
vamos estabelecer aproveitando a tabela acima como exemplificação: 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 27
1. AMPLITUDE TOTAL DE UMA SEQUÊNCIA é a diferença entre o maior e o menor 
elemento de uma sequência. Representando a amplitude total por At, o maior elemento 
da sequência Xmáx , e o menor elemento por Xmín, a amplitude total é denotada por: 
No exemplo da sequência que deu origem à tabela, Xmáx = 9,5 e Xmín = 2, portanto: 
A amplitude total representa o comprimento total da sequência e é dada na mesma 
unidade de medida dos dados da sequência. 
2. INTERVALO DE CLASSE é qualquer subdivisão da amplitude total de uma série 
estatística.No exemplo da tabela, subdividimos a amplitude total em quatro classes, obtendo 
os intervalos de classe 2 |-- 4, 4 |-- 6, 6 |-- 8, 8 |-- 10.
Note que na realidade não trabalhamos com a At = 7,5 e sim com a amplitude total 
ajustada para 8 como justificamos adiante.
3. LIMITE DE CLASSE: cada intervalo de classe fica caracterizado por dois números 
reais. O menor valor é chamado limite inferior da classe e será indicado por I. O maior 
valor é chamado limite superior da classe e será indicado por L. Por exemplo, na 
Classe 2 |-- 4, I= 2 e L = 4. 
4. AMPLITUDE DO INTERVALO DE CLASSE é a diferença entre o limite superior e 
o limite inferior da classe. Se usarmos h para representar a amplitude do intervalo de 
classe podemos estabelecer:
OBSERVAÇÕES: 
(1) Na realidade, as classes não precisam necessariamente ter a mesma amplitude 
como no exemplo acima. Porém, sempre que possível, devemos trabalhar com classes 
de mesma amplitude. Isto facilita sobremaneira os cálculos posteriores. 
(2) Note que usamos para representar as classes, intervalos reais semiabertos 
à direita. Isto significa que o intervalo contém o limite inferior, mas não contém o 
limite superior, ou seja, o intervalo de classe 2 |-- 4 contém os valores reais maiores 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 28
ou iguais a 2 e menores que 4. Desta forma, o último intervalo da série que é 8 |-- 10 
não contém o valor 10. É por isso que não utilizamos a amplitude 7,5, pois se isto 
fosse feito, o limite superior da última classe seria 9,5 e como o limite superior não 
deve pertencer a classe, o elemento 9,5 da sequência estatística original ficaria sem 
classificação. Como vamos utilizar este critério, precisaremos ajustar sempre o valor 
máximo da série ao definir a amplitude total. Outros critérios poderiam ser adotados 
como o intervalo real semiaberto à esquerda ou mesmo o intervalo real aberto, mas 
nenhum destes critérios é melhor que o critério adotado. 
5. NÚMERO DE CLASSES: o número de classes a ser utilizado depende muito da 
experiência do pesquisador e das questões que ele pretende responder com a variável 
contínua. 
Isto pode ser verificado facilmente pelo próprio interessado ao longo desta exposição. 
Para efeito de nossos exemplos, utilizaremos o critério da raiz para a determinação 
do número de classes. 
CRITÉRIO DA RAIZ 
Se a sequência estatística contém n elementos e se indicarmos por K o número 
de classes a ser utilizado, então pelo critério da raiz: 
Como o número K de classes deve ser necessariamente um número inteiro e como 
dificilmente √n, é um número inteiro, deixaremos como opção para o valor de K o 
valor inteiro mais próximo de √n, uma unidade a menos ou a mais que este valor. 
Vejamos na prática:
No exemplo da tabela, n = 30 e consequentemente k = √30 = 5,477, portanto o valor 
inteiro mais próximo de √30 é 5. As opções para k então são: 4 ou 5 ou 6. 
A amplitude do intervalo de classe que designamos por h é determinada da seguinte 
forma: 
Portanto, 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 29
Observe que a opção por quatro classes, foi feita em função de um valor de h mais 
fácil de se operar. 
Se tivéssemos optado por cinco classes, o valor de h seria 8/5 = 1,6; se tivéssemos 
optado por seis classes, o valor de h seria 8/6 = 1,3333 …
Veja que o melhor valor para se trabalhar em cálculos é o h = 2. Foi por isto que 
optamos por quatro classes. 
Conhecendo-se o valor Xmin = 2 e a amplitude de classe h = 2, concluímos que o 
limite superior da primeira classe é 4. Portanto, a primeira classe é o intervalo 2 |-- 4. O 
limite inferior da segunda classe é 4. Somando-se a amplitude de classe obteremos 6. 
Portanto, a segunda classe é 4 |-- 6. A terceira classe por analogia é 6 |-- 8 e a quarta 
classe é 8 |-- 10. 
6. FREQUÊNCIA SIMPLES DE UMA CLASSE fi: chama-se frequência simples de 
uma classe ao número de elementos da sequência que são maiores ou iguais ao limite 
inferior desta classe e menores que o limite superior desta classe. 
No exemplo, a frequência simples da primeira classe é o número de elementos da 
sequência que são maiores ou iguais a 2 e menores que 4. 
Note que os valores da sequência nestas condições são os valores 3, 2,5, 2, 3,5. 
Portanto, a frequência simples da primeira classe é 4. 
Da mesma forma determinamos as frequências simples das demais classes, 
completando o quadro representativo da variável contínua. 
Existem outros critérios para a determinação do número de classes, como por 
exemplo a fórmula de STURGES. Segundo STURGES, O número K de classes é dado por: 
Para valores de n muito grandes, esta fórmula apresenta mais vantagens que o 
critério da raiz, embora apresente o mesmo problema de aproximação do valor de K. 
Como acreditamos que na prática a experiência do pesquisador é que na verdade 
vai determinar o número de classes, optamos pelo método mais simples que é o 
critério da Raiz. 
Vejamos um exemplo na prática de construção de uma variável contínua:
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 30
Um teste para aferir o Quociente de Inteligência em determinada classe de alunos 
de uma Faculdade deu origem a sequência de valores 
Para a construção da variável contínua, devemos determinar o número de elementos 
da sequência. Verificamos que a sequência possui n = 70 elementos. 
Pelo critério da raiz K = √n. No caso, K = √70 = 8,37. O valor inteiro mais próximo é 
8. Portanto, temos opção para construir a variável contínua com 7 ou 8 ou 9 classes.
O maior valor da sequência é Xmax = 139 e o menor valor da sequência é Xmin=61. 
Portanto, a amplitude total da sequência é At = 139 - 61 = 78. No entanto, sabemos 
que pelo fato de o critério adotado do intervalo de classe ser semiaberto à direita, 
devemos ajustar o valor Xmax. Se ajustássemos Xmax para 140, a amplitude ajustada 
passaria a ser At = 140 - 61 = 79. Este valor não é divisível de forma inteira nem por 
7 nem por 8 e nem por 9, que são nossas opções de classes. 
Nesta situação devemos ajustar Xmax para 141 obtendo a At = 141 - 31 = 80 que é 
divisível exatamente por 8, obtendo-se uma amplitude do intervalo de classe h dada por: 
Observe que o ajuste do valor Xmax foi de duas unidades, passando de 139 para 141. 
A experiência do pesquisador, nesta situação, o levaria a distribuir este erro de duas 
unidades, iniciando a representação da série em 60 e terminando em 140. A amplitude 
total ajustada para a série é: At = 140 - 60 = 80. 
Ou seja, quando devemos ajustar mais de duas vezes a Amplitude total, devemos 
distribuir o erro, de modo que este não fique pendendo apenas para um lado.
O comprimento do intervalo de classe é h = 10 e o número de classes é K=8. 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 31
Computando as frequências simples de cada classe, construímos a variável contínua 
representativa desta série. 
Vejamos agora como ficam as demais frequências, já vistas no capítulo anterior, 
para a variável contínua:
FREQUÊNCIA RELATIVA DE UMA CLASSE - fri
É a divisão da frequência simples desta classe pelo número total de elementos da 
série. 
O total de elementos desta série é 40. Portanto, a frequência relativa da primeira 
classe é: 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 32
A frequência relativa da segunda classe é: 
A frequência relativa da terceira classe é:
 e a frequência relativa da quarta classe é: 
Observe que estes valores representam a participação percentual dos elementos 
por classe. A interpretação para estes valores é: 
- 15% dos valores da série são maiores ou iguais a 2 e menores que 4. 
- 45% dos valores da série são maiores ou iguais a 4 e menores que 6. 
- 25% dos valores da série são maiores ou iguais a 6 e menores que 8. 
- 15% dos valores da série sãomaiores ou iguais a 8 e menores que 10. 
FREQUÊNCIA ACUMULADA DE UMA CLASSE - Fi 
É a soma da frequência simples desta classe com as frequências simples das 
classes anteriores. 
Desta forma, as frequências acumuladas para estas classes são: 
Estes valores podem ser interpretados da seguinte forma, lembrando que são todos 
maiores ou iguais a 2. 
- 6 elementos da série são valores menores que 4. 
- 24 elementos da série são valores menores que 6.
- 34 elementos da série são valores menores que 8. 
- 40 elementos da série são valores menores que 10. 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 33
FREQUÊNCIA ACUMULADA RELATIVA DE UMA CLASSE - FRi
É a divisão da frequência acumulada desta classe pelo número total de elementos 
da série.
Assim, teremos:
Estes valores podem ser interpretados da seguinte forma, lembrando que são todos 
maiores ou iguais a 2: 
- 15% dos valores da série são menores que 4. 
- 60% dos valores da série são menores que 6. 
- 85% dos valores da série são menores que 8. 
- 100% dos valores da série são menores que 10. 
Perceba que em nada muda o que vimos com relação à variável discreta.
A tabela completa ficaria assim:
3.2 Conclusão
Neste capítulo, vimos a construção da variável contínua e como completamos a 
tabela da mesma. Para que isso fique muito bem guardado, devemos treinar esses 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 34
passos, para que não sejam cometidos erros em sua construção. Havendo dúvidas, 
recorra a esse material. Bons estudos.
3.3 Referências bibliográficas
BOLFARINE, Heleno & BUSSAB, Wilton O. Elementos de Amostragem. 1. ed. São 
Paulo: Edgard Blücher, 2005.
LAPONNI Juan Carlos Estatística usando Excel / Juan Carlos Lapponi. – Rio de 
Janeiro: Elsevier, 2005 – 8a reimpressão. 
MEDEIROS, et al. - Estatística para os cursos de economia, administração e ciências 
contábeis - São Paulo: Ed. Atlas, 1999
MORETTIN, L. G. Estatística Básica Probabilidade. São Paulo: Makron Books, 1993.
SPIEGEL MR. Estatística. Coleção Schaum. São Paulo: Editora Afiliada, 1993.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 35
CAPÍTULO 4
MEDIDAS DE 
TENDÊNCIA CENTRAL
Caro estudante. Como estão indo em suas aulas? Esperamos que estejam 
conseguindo entender tudo que estamos transmitindo aqui. Neste capítulo, iremos 
começar a aprender como calculamos as medidas de tendência central. Vamos 
começar com as variáveis discretas.
4.1 Medidas de tendência central
No estudo de uma série estatística é conveniente o cálculo de algumas medidas 
que a caracterizam. 
Estas medidas, quando bem interpretadas, podem fornecer-nos informações muito 
valiosas com respeito à série estatística. 
Em suma, podemos reduzi-la a alguns valores, cuja interpretação fornece-nos uma 
compreensão bastante precisa da série. 
Um destes valores é a medida de tendência central. 
É um valor intermediário da série, ou seja, um valor compreendido entre o menor 
e o maior valor da série. É também um valor em torno do qual os elementos da série 
estão distribuídos e a posiciona em relação ao eixo horizontal. 
Em resumo, a medida de tendência central procura estabelecer um número no eixo 
horizontal em torno do qual a série se concentra. 
As principais medidas de tendência central são: média, mediana e moda. 
No cálculo de várias medidas estatísticas, vamos utilizar somas de um grande 
número de parcelas. 
Para facilitar a representação destas somas, introduziremos o conceito de somatório. 
Somatório - Notação Sigma (Σ)
Quando queremos representar uma soma de n valores do tipo x1 + x2 + ... + xn, 
podemos codificá-la através da expressão: 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 36
onde: 
Σ - é utilizada para representar as operações de adição entre as parcelas. 
xi - é a parcela genérica 
A parcela genérica é obtida tomando-se os termos constantes em todas as parcelas, 
no caso x. Para representar a parte variável em cada parcela, no caso os índices, 
utilizamos a letra i e indicamos a variação de i. (No exemplo i varia, segundo números 
inteiros consecutivos de 1 até n.) 
A expressão
deve ser lida “soma dos valores xi, para i variando de 1 até n.” 
Para que uma soma possa ser representada por esta notação é fundamental que i 
assuma todos os valores inteiros consecutivos entre dois valores dados. Assim, a soma: 
Exemplos: 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 37
Da mesma forma que codificamos a soma através da notação Sigma, podemos 
decodificar obtendo as parcelas componentes. 
Para obter a primeira parcela da soma: 
basta substituir na parcela genérica 3xi, a variável i pelo valor indicado no extremo 
inferior, i = 2.
A primeira parcela da soma é 3x2.
Para obter a segunda parcela, basta substituir na parcela genérica 3x, a variável i por 
3. A segunda parcela vale 3x3. A última parcela da soma é obtida quando substituímos 
na parcela genérica 3xi o valor de i por 4, que é o valor indicado no extremo superior. 
A última parcela é 3x4. 
Portanto, 
Exemplos: 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 38
Apesar de ser apenas um código e não uma operação, a notação Sigma tem algumas 
propriedades que podem simplificar operações. Entre elas destacamos: 
1. O somatório de uma soma é a soma dos somatórios. 
2. O somatório de uma diferença é a diferença dos somatórios. 
3. O somatório do produto de uma constante por uma variável é o produto da 
constante pelo somatório da variável. 
4. O somatório da divisão de uma variável por uma constante é a divisão do 
somatório da variável pela constante. 
4.1.1 Média aritmética simples
Para uma sequência numérica X: x1, x2, ......, xn, a média aritmética simples, que 
designaremos por é definida por: 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 39
No caso de estarmos trabalhando com a tabela da variável discreta, teremos:
Exemplo: Determinar a média da distribuição: 
Solução: Inicialmente devemos somar a coluna de frequências simples para obter 
o número total de elementos da série: Σ fi = 10 elementos. Em seguida, utilizamos a 
própria disposição da tabela para efetuar os produtos xi . fi acrescentando estes valores 
dispostos em uma nova coluna. Em seguida, somamos os valores desta coluna. 
Na sequência substituímos esses valores na expressão obtendo: 
4.1.2 Mediana
1º Caso - DADOS BRUTOS OU ROL 
Inicialmente devemos ordenar os elementos caso sejam dados brutos, obtendo o 
Rol. Em seguida determinamos o número n de elementos do Rol. 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 40
Se n é impar - O Rol admite apenas um termo central que ocupa a posição 
. 0 valor do elemento que ocupa esta posição é a mediana. 
Exemplo: Determinar a mediana do conjunto: 
Solução: Ordenando estes elementos obtemos o rol. X: 2, 8, 12, 12, 20, 20,23. 
O número de elementos é n = 7 (ímpar), a posição do termo central é .
A mediana é o quarto elemento do Rol: md = 12. 
O valor 12 deixa a sua esquerda e à sua direita o mesmo número de elementos, 
sendo, portanto, o elemento central da série. 
Quando lidamos com séries com urn grande número de elementos, a quantidade 
de elementos à esquerda e à direita é aproximadamente 50% do total de elementos, 
o que conduz à seguinte interpretação genérica para a mediana: “50% dos valores 
da série são valores menores ou iguais a 12 e 50% dos valores da série são valores 
maiores ou iguais a 12”. 
Se n é par - Neste caso, o rol admite dois termos centrais que ocupam as posições 
e . A mediana é convencionada como sendo a média dos valores que 
ocupam estas posições centrais. 
Exemplo: Determinar a mediana da série: X: 7, 21, 13, 15, 10, 8, 9, 13.Solução: Ordenando estes elementos, obtemos o rol: X: 7, 8, 9, 10, 13, 13, 15, 21.
O número de elementos é n = 8 (par). 
As posições dos termos centrais são: .
O elemento que ocupa a quarta posição na série é 10 e o elemento que ocupa a 
quinta posição é 13. Portanto, 
Interpretação: 50% dos valores do rol são valores menores ou iguais a 11,5 e 50% 
dos valores do rol são valores maiores ou iguais a 11,5. 
2º Caso - VARIÁVEL DISCRETA 
Se os dados estão apresentados na forma de uma variável discreta, eles já estão 
naturalmente ordenados. 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 41
Assim, basta verificar se o número de elementos da série é ímpar ou par e aplicar 
o mesmo raciocínio do caso anterior. 
Para facilitar a localização dos termos centrais, construímos a frequência acumulada 
da série. 
Solução: O número de elementos da série é n = fi = 23 (ímpar). 
Portanto, a série admite apenas um termo central que ocupa a posição 
. 
Construindo a frequência acumulada podemos localizar com facilidade o décimo 
segundo elemento da série. 
Note que o elemento que ocupa a primeira posição na série é 2. Em seguida aparecem 
quatro elementos iguais a 5. Estes elementos ocupam na série as posições de segundo 
a quinto. Depois aparecem mais dez elementos iguais a 8 que ocupam na série as 
posições de sexto a décimo quinto. 
Consequentemente, o elemento que ocupa a décima segunda posição vale 8, e 
podemos afirmar que md= 8. 
Interpretação: 50% dos valores da série são menores ou iguais a 8 e 50% dos valores 
da série são maiores ou iguais a 8. 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 42
Outro exemplo: 
Solução: O número de elementos da série é 32 (par) e a série admite dois termos 
centrais que ocupam as posições: (32/2)º = 16º e (32/2 + 1)º = 17°. Para localizar 
estes elementos, construímos a frequência acumulada da série. 
As três primeiras posições da série são ocupadas por elementos iguais a 3.
Da quarta a oitava posição os elementos são iguais a 1. Da nona à décima sexta 
posição os elementos são iguais a 2. Da décima sétima à vigésima sexta posição os 
elementos valem 3. 
Portanto, o elemento que ocupa a décima sexta posição é 2 e o elemento que ocupa 
a décima sétima posição é 3 e, consequentemente, a mediana é: 
Interpretação: 50% dos valores da série são valores menores ou iguais a 2,5 e 50% 
dos valores da série são valores maiores ou iguais a 2,5. 
4.1.3 Moda
É o valor de maior frequência em um conjunto de dados. 
Notação: A moda será denotada por mo. 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 43
Quando trabalhamos com uma tabela, é muito simples identificar a moda desta 
distribuição. Basta verificar qual o elemento que possui a maior frequência.
Assim, vejamos no exemplo:
Neste exemplo, a moda seria mo = 3, que é o elemento que possui a maior frequência 
(fi = 8).
A maior frequência observada na segunda coluna é 5 e corresponde aos valores 2 
e 4. Portanto, é uma série bimodal com mo = 2 e mo= 4. 
Observe que todos os elementos da série possuem a mesma frequência. Portanto, 
a série é amodal. 
4.2 Conclusão
Neste capítulo, começamos a estudar as medidas de tendência central e como 
podemos calculá-las usando uma variável discreta. No próximo capítulo, veremos 
essas mesmas medidas agora em uma variável contínua. Havendo dúvidas, consulte 
sempre esse material.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 44
CAPÍTULO 5
MEDIDAS DE TENDÊNCIA 
CENTRAL - VARIÁVEL CONTÍNUA
Caro estudante. Neste capítulo, veremos como calculamos as medidas de tendência 
central agora em uma tabela de distribuição contínua. Devemos prestar atenção pois, 
apesar da teoria ser a mesma, os cálculos e fórmulas são diferentes. Todo cuidado 
é pouco. Bons estudos.
5.1 Medidas de tendência central na variável contínua
Quando trabalhamos com as variáveis contínuas, devemos lembrar, primeiramente, 
que a distribuição na tabela é feita usando os intervalos de classe. Dessa forma, 
devemos ficar atentos aos cálculos que deverão ser feitos.
Vejamos cada uma delas
5.1.1 Média aritmética simples
Antes de vermos como calculamos a média, vejamos como calculamos a média 
aritmética ponderada.
Para uma sequência numérica X: x1, x2: ...... , xn afetados de pesos p1, p2, ......., pn, 
respectivamente, a média aritmética ponderada, que designaremos por , é definida por: 
Exemplo: Se X: 2, 4, 5, com pesos 1, 3, 2 respectivamente, então: 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 45
Se os dados estão apresentados na forma de uma variável contínua, utilizaremos a 
média aritmética ponderada, considerando as frequências simples das classes como 
sendo as ponderações dos pontos médios destas classes. O ponto médio, de cada 
classe é definido por: 
, onde:
l = limite inferior da classe
L = limite superior da classe
A fórmula de cálculo de X que originalmente era 
passa a ser escrita como: 
Exemplo: Determinar a média da distribuição: 
Solução: 
Inicialmente, devemos somar a coluna das frequências simples, obtendo fi = 20. 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 46
Na sequência, calculamos os pontos médios de classe: o ponto médio da primeira 
classe é = 3,5; O ponto médio da segunda classe é = 6,5; o ponto médio da 
terceira classe é = 9,5 e o ponto médio da quarta classe é = 12,5. 
Estes valores serão dispostos em uma nova coluna na tabela. Como no caso anterior, 
da variável discreta, usaremos a própria tabela para a sequência de cálculos. 
Portanto, 
Interpretação: O valor médio desta série é 7,85, isto é, 7,85 é o valor em torno do 
qual os elementos desta série se concentram. 
COMENTÁRIO: Quando agrupamos os dados na disposição de uma variável contínua, 
passamos a trabalhar com os dados sem conhecimento de seus valores individuais. 
Note no exemplo acima, que o máximo que podemos afirmar com respeito ao 
menor valor desta série é que ele é um valor maior ou igual a 2 e menor que 5. Mas 
não conhecemos seu valor individualizado. 
O mesmo ocorre com todos os outros valores da série. 
Este fato é que nos leva a substituir as classes pelos seus pontos médios ao 
calcular a média da série. 
5.1.2 Mediana
Se os dados são apresentados na forma de uma variável contínua, o raciocínio 
usado na variável discreta não pode ser utilizado, uma vez que mesmo identificada 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 47
a posição da mediana na série, o valor do elemento da série que ocupa esta posição 
não é identificável. 
Utilizaremos um exemplo, para generalizar a fórmula de cálculo da mediana. 
Considere a distribuição de frequência: 
O número de elementos da série é n = Σ fi = 19. 
A mediana, por definição, separa o número de elementos da série em dois grupos, 
contendo cada um deles 50% dos elementos. 
Portanto, a posição da mediana na série é n/2. No exemplo (19/2)º = 9,5º.
O valor decimal 9,5 indica que a mediana é um elemento posicionado entre o nono 
e o décimo elemento da série. 
Construiremos a frequência acumulada para identificar em qual classe estão situados 
o nono e o décimo elemento da série. 
Note que o nono e o décimo elementos estão posicionados na terceira classe, o 
que indica que a mediana é um valor compreendido entre 9 e 12. A classe que contém 
a mediana será identificada como classe mediana. 
Este intervalo de três unidades contém oito elementos. Supondo que eles estão 
uniformemente distribuídos neste intervalo, então poderemos dividir este intervalo de 
modo proporcional a posição da mediana na série. 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 48
Ou seja: 
Simplificando:
Portanto:
md = 9 + x.
md = 9,9375Observando na fórmula em destaque acima que: 
- 9 é o limite inferior da classe mediana. 
- 9,5 é a metade dos elementos da série, isto é, n/2. 
- 7 é a frequência acumulada da classe anterior a classe mediana. 
- 8 é a frequência simples da classe mediana. 
- 3 é a amplitude do intervalo de classe, poderemos generalizar a fórmula de cálculo 
da mediana para variável contínua: 
onde:
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 49
COMENTÁRIO: 
Devido às condições impostas na obtenção da fórmula da mediana, fica evidente 
que o valor obtido pela fórmula é um valor aproximado do verdadeiro valor da mediana 
da série. 
De modo geral, todas as medidas calculadas para uma variável contínua serão valores 
aproximados para estas medidas, uma vez que ao agruparmos os dados segundo 
uma variável contínua, há perda de informações quanto a identidade dos dados.
5.1.3 Moda
Para determinar a moda de uma variável contínua, podemos optar por vários 
processos. Daremos destaque para a moda de Pearson, a moda de King e a moda 
de Czuber. 
1º Processo: MODA DE PEARSON 
Segundo PEARSON, a moda de uma variável contínua pode ser obtida através do 
valor da média e da mediana: 
Exemplo:
Solução: 
Cálculo da média: 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 50
• Cálculo da mediana: 
A mediana corresponde ao sexto elemento da série. O sexto elemento da série está 
na terceira classe. Esta é a classe mediana. A mediana vale: 
Consequentemente: 
mo = 25
Note que a moda está situada na terceira classe, que é a classe de maior frequência 
da série. A classe de maior frequência será chamada de classe modal.
2º Processo: MODA DE KING 
KING levou em consideração, em sua fórmula, a frequência simples da classe anterior 
e a frequência simples da classe posterior a classe modal. 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 51
onde:
Exemplo: Calcule a moda de King para a distribuição:
Solução: A classe modal é a de maior frequência portanto é a terceira classe e a 
moda vale: 
Interpretação: 24 é o valor mais frequente nesta distribuição. 
3º Processo: MODA DE CZUBER 
CZUBER levou em consideração, em sua fórmula, a frequência simples da classe 
anterior, a frequência simples da classe posterior, além da frequência simples da 
classe modal. 
É, portanto, uma fórmula mais completa que a fórmula de King. 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 52
onde:
Exemplo: Calcule a moda de Czuber para a distribuição: 
Solução: A classe modal é a terceira classe, portanto, a moda vale: 
Interpretação: 24,29 é o valor mais frequente nesta distribuição. 
COMENTÁRIO: 
A fórmula de Pearson tem normalmente interesse teórico. Se não dispusermos da 
média e da mediana da distribuição, a fórmula de Pearson é a mais trabalhosa. 
A fórmula de King é a mais simples delas, mas não é a mais precisa. 
A fórmula de Czuber é mais precisa que a fórmula de King, pois leva também em 
consideração a frequência da classe modal. 
OBSERVAÇÃO: Se a classe modal for a primeira classe, então fant = 0 e se a classe 
modal for a última então fpost = 0. 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 53
5.2 Conclusão
Neste capítulo, estudamos as medidas de tendência central para a variável contínua. 
Devemos ficar atentos, primeiramente, ao tipo de variável que estamos trabalhando, 
se é uma variável discreta ou contínua e, sendo do tipo contínua, ter muito cuidado 
com as aplicações das fórmulas. Havendo dúvidas, consulte sempre esse material
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 54
CAPÍTULO 6
MEDIDAS SEPARATRIZES
Caros estudantes, esperamos que estejam curtindo essas aulas e conseguindo 
compreender tudo que aqui estamos transmitindo. Nesta aula, iremos aprender as 
medidas separatrizes. Vamos a elas?
6.1 Medidas separatrizes
São números reais que dividem a sequência ordenada de dados em partes que 
contêm a mesma quantidade de elementos da série. 
Desta forma, a mediana que divide a sequência ordenada em dois grupos, cada 
um deles contendo 50% dos valores da sequência, é também uma medida separatriz. 
Além da mediana, as outras medidas separatrizes que destacaremos são: quartis, 
quintis, decis e percentis. 
Se dividirmos a série ordenada em quatro partes, cada uma ficará com 25% de 
seus elementos. 
Os elementos que separam estes grupos são chamados quartis. Assim, o primeiro 
quartil, que indicaremos por Q1, separa a sequência ordenada deixando 25% de seus 
valores à esquerda e 75 % de seus valores à direita. 
O segundo quartil, que indicaremos por Q2, separa a sequência ordenada, deixando 
50% de seus valores à esquerda e 50% de seus valores à direita. Note que o Q2 é a 
mediana da série. 
O terceiro quartil, que indicaremos por Q3, separa a sequência ordenada deixando 
à sua esquerda 75% de seus elementos e 25% de seus elementos à direita. 
Se dividirmos a sequência ordenada em cinco partes, cada uma ficará com 20% 
de seus elementos. 
Os elementos que separam estes grupos são chamados quintis. 
Assim, o primeiro quintil, que indicaremos por K1, separa a sequência ordenada, 
deixando à sua esquerda 20% de seus valores e à sua direita 80% de seus valores. 
De modo análogo são definidos os outros quintis. 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 55
Se dividirmos a sequência ordenada em dez partes, cada uma ficará com 10% de 
seus valores. 
Os elementos que separam estes grupos são chamados decis. 
Assim, o primeiro decil, que indicaremos por D1 separa a sequência ordenada, 
deixando à sua esquerda 10% de seus valores e 90% de seus valores à direita. De 
modo análogo são definidos os outros decis. 
Se dividirmos a sequência ordenada em 100 partes, cada uma ficará com 1% de 
seus elementos. 
Os elementos que separam estes grupos são chamados centis ou percentis. 
Assim, o primeiro percentil, que indicaremos por P1, separa a sequência ordenada 
deixando à sua esquerda 1% de seus valores e 99% de seus valores à direita. De modo 
análogo são definidos os outros percentis. 
Note que o Q4, K5, D10 e P100 são elementos que deixam à sua esquerda 100% 
dos valores da sequência ordenada e correspondem diretamente ao último valor da 
sequência. 
Se observarmos que os quartis, quintis e decis são múltiplos dos percentis, então 
basta estabelecer a fórmula de cálculo de percentis. Todas as outras medidas podem 
ser identificadas como percentis. Desta forma: 
6.2 Cálculo das medidas separatrizes
1º Caso - DADOS BRUTOS OU ROL 
Devemos ordenar os elementos, caso sejam Dados Brutos obtendo o Rol. 
Identificamos a medida que queremos obter com o percentil correspondente, Pi. 
Calculamos i% de n, ou seja, para localizar a posição do percentil i do Rol. 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 56
Em seguida, identificamos o elemento que ocupa esta posição. 
Note que se for um número inteiro, então Pi que estamos procurando identificar 
é um dos elementos da sequência ordenada. 
Se não for um número inteiro, isto significa que o Pi é um elemento intermediário 
entre os elementos que ocupam as posições aproximadas por falta e por excesso do 
valor . Neste caso, o Pi é definido como sendo a média dos valores que ocupam 
estas posições aproximadas. 
Exemplo 1. 
Calcule o Q1 da sequência X: 2, 5, 8, 5, 5, 10, 1, 12, 12, 11, 13, 15. 
Solução: 
Ordenando a sequência, obtemos o Rol: X: 1,2, 5, 5,5, 8, 10, 11, 12, 12, 13, 15. 
Identificamos Q1 = P25. 
Calculamos 25% de 12 que é o número de elementos da série obtendo: 
Este valor indica a posição do P25 no Rol, isto é, o P25 é o terceiro elemento do Rol. 
Observando o terceiro elemento do Rol obtém-se 5. 
Portanto, Q1= P25 = 5. 
Interpretação: 25% dos valores desta sequência são valores menores ou iguais a 5 
e 75 % dos valores desta sequência são valores maiores ou iguais a 5. 
Exemplo 2. Calcule o K3 da sequência X: 2; 8; 7,5; 6; 10; 12; 2; 9. 
Solução: Ordenando a sequência, obtemos: X: 2; 2; 6; 7,5; 8; 9; 10; 12. 
Identificamos K3 = P60. Calculamos 60% de 8, que é o número de elementos da 
série, obtendo: 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 57
Este valor não-inteiro indica que o P60 é um valor situado entre o quarto e o quinto 
elemento da sequência. 
Observando diretamente no Rol, os elementos que ocupam a quarta e a quinta 
posição obtemos 7,5 e 8. Portanto, 
K3 = P60 = = 7,75
Interpretação: 60% dos valores da sequência são valores menores ou iguais a 7,75 
e 40% dos valores da sequência são valores maiores ou iguais a 7,75. 
Note que se o número de elementos da sequência for menor que 100, alguns 
percentis podem coincidir em valores tornando estas interpretações não totalmente 
verdadeiras. 
2º caso - VARIÁVEL DISCRETA 
Se os dados estão apresentados na forma de uma variável discreta, eles já estão 
naturalmente ordenados. 
Identifica-se a medida que queremos obter com o percentil correspondente: Pi. 
Calcula-se i% de n ou seja para localizar a posição do percentil i na série. 
Em seguida utilizamos a frequência acumulada da série para localizar o elemento 
que ocupa esta posição. O valor deste elemento é o Pi. 
Exemplo: Calcule o D4 para a série: 
Solução: 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 58
O número de elementos da série é Σ fi = 24.
Identificamos D4 = P40 e calculamos 40% de 24, ou seja, .
Esta posição não-inteira significa que o P40 é um valor compreendido entre o nono 
e o décimo elemento da série. Construindo a frequência acumulada: 
observamos que o nono elemento é 5, e o décimo elemento também é 5. 
Assim, 
D4 = P40 = .
Interpretação: 40% dos valores desta série são valores menores ou iguais a 5 e 
60% dos valores desta série são valores maiores ou iguais a 5. 
3º Caso - VARIÁVEL CONTÍNUA
Se os dados estão apresentados na forma de uma variável contínua, eles já estão 
naturalmente ordenados e o número de elementos da série é n = Σ fi. 
Para se obter uma fórmula geral para o cálculo dos percentis, vamos generalizar 
a fórmula da mediana: 
Identificando md = P50, podemos obter uma fórmula particular para o P50. 
Note que a classe que contém a mediana é a mesma que contém o P50. 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 59
Portanto, identificamos o limite inferior da classe que contém a Mediana (Imd) com 
o limite inferior da classe que contém o P50 (I50).
O termo n/2 pode ser representado na linguagem do P50 como .
A frequência simples da classe mediana (fmd ) é a mesma frequência simples da 
classe que contém o P50 (f50). 
A frequência acumulada da classe anterior a classe mediana (Fant) é a frequência 
acumulada da classe anterior a classe que contém o P50. Este termo não se modifica, 
assim como h, que é a amplitude do intervalo de classe. 
Assim, a fórmula da mediana, adaptada para a linguagem do P50 pode ser escrita: 
Substituindo-se 50 pelo índice i, generalizamos a fórmula para o cálculo de qualquer 
percentil: 
onde:
Exemplo: Calcule o Q3 da série: 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 60
O número de elementos da série é dado por Σ fi= 105. Identificamos Q3 = P75.
Iniciamos o cálculo do valor P75 lembrando que neste caso i = 75 e que:
 .
Isto nos dá a posição do P75 na série. 
Construindo a frequência acumulada da série obtemos: 
A classe que contém o elemento que ocupa a posição 78,75 na série é a quarta 
classe. Esta é a classe que contém o P75. 
Substituindo os valores indicados na fórmula, obtém-se: 
Portanto Q3 = P75 = 35,93 
Interpretação: 75% dos valores da série são menores ou iguais a 35,93 e 25% dos 
valores da série são maiores ou iguais a 35,93. 
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 61
Vejamos mais um exemplo relacionado a esta tabela.
Vamos calcular o P85.
O número de elementos da série é dado por fi= 105. 
Iniciamos o cálculo do valor P85 lembrando que neste caso i = 85 e que:
 .
Isto nos dá a posição do P85 na série. 
Construindo a frequência acumulada da série obtemos: 
A classe que contém o elemento que ocupa a posição 89,25 na série é a quarta 
classe. Esta é a classe que contém o P85. 
Substituindo os valores indicados na fórmula, obtém-se: 
Portanto P85 = 38,92 
Interpretação: 85% dos valores da série são menores ou iguais a 38,92 e 15% dos 
valores da série são maiores ou iguais a 38,92.
Vejamos mais um exemplo:
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 62
Vamos calcular o P35.
O número de elementos da série é dado por Σ fi= 105. 
Iniciamos o cálculo do valor P35 lembrando que neste caso i = 35 e que:
.
Isto nos dá a posição do P35 na série. 
Construindo a frequência acumulada da série obtemos: 
A classe que contém o elemento que ocupa a posição 36,75 na série é a terceira 
classe. Esta é a classe que contém o P35. 
Substituindo os valores indicados na fórmula, obtém-se: 
Portanto P35 = 21,15 
Interpretação: 35% dos valores da série são menores ou iguais a 21,15 e 15% dos 
valores da série são maiores ou iguais a 21,15.
6.3 Conclusão
Neste capítulo, estudamos as medidas separatrizes. Perceba que a teoria tanto 
para as variáveis discretas quanto contínuas é a mesma. O que muda é a forma como 
calculamos para cada uma das variáveis. Como sempre, lembrem-se de diferenciar 
as variáveis discretas das contínuas e as suas diferentes fórmulas.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 63
CAPÍTULO 7
MEDIDAS DE DISPERSÃO
Caro estudante. Vamos a mais um capítulo no nosso curso de Indicadores 
Educacionais. Neste capítulo, vamos estudar as medidas de dispersão. Vamos entender 
o que são essas medidas, como podemos calculá-las e o que elas significam. 
7.1 Medidas de dispersão
Uma breve reflexão sobre as medidas de tendência central permite-nos concluir 
que elas não são suficientes para caracterizar totalmente uma sequência numérica. 
Se observarmos as sequências: 
concluiremos que todas possuem a mesma média 13. 
No entanto, são sequências completamente distintas do ponto de vista da variabilidade 
de dados. 
Na sequência Z não há variabilidade de dados. 
A média 13 representa bem qualquer valor da série. 
Na sequência Y, a média 13 representa bem a série, mas existem elementos da 
série levemente diferenciados da média 13. 
Na sequência X existem muitos elementos bastante diferenciados da média 13. 
Concluímos que a média 13 representa otimamente a sequência Z, representa bem 
a sequência Y, mas não representa bem a sequência X. 
O nosso objetivo é construir medidas que avaliem a representatividade da média. 
Para isto usaremos as medidas de dispersão. 
Observe que na sequência Z os dados estão totalmente concentrados sobre a 
média 13.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 64
Não há dispersão de dados. Na sequência Y há forte concentração dos dados sobre 
a média 13, mas há fraca dispersão de dados. Já na série X há fraca concentração 
de dados em torno da média 13 e forte dispersão de dados em relação à média 13. 
7.1.1 Medidas de dispersão absoluta
As principais medidas de dispersão absolutas são: amplitude total, desvio médio 
simples, variância e desvio padrão. 
Amplitude Total 
É a diferença entre o maior e o menor valor da sequência. 
Cálculo da Amplitude Total 
1º Caso - DADOS BRUTOS OU ROL
Basta identificar o maior e o menor valor da sequência e efetuar a diferença entre 
estes valores. 
Exemplo:

Mais conteúdos dessa disciplina