Buscar

Livro-Texto Unidade I - ESTATISTICA

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 126 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 126 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 126 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Autor: Prof. Mauricio Martins do Fanno
Colaboradoras: Profa. Sandra Castilho
 Profa. Christiane Mazur Doi
Estatística
Professor conteudista: Mauricio Martins do Fanno
É formado em Engenharia Mecânica pela Faculdade de Engenharia Industrial (FEI), tendo exercido a profissão por 
mais de trinta anos em empresas de porte médio e grande nas funções de gerente e diretor na área de engenharia 
de produção. Simultaneamente tem exercido o magistério superior há cerca de trinta anos, ministrando disciplinas 
ligadas às ciências exatas e à administração da produção. É pós-graduado em Docência do ensino superior. Na UNIP é 
professor desde 1993, acumulando a coordenação de curso e tendo escrito os livros-textos de Estatística; Estatística 
Aplicada e Pesquisa Operacional usados no curso de Administração, modalidade EaD. 
© Todos os direitos reservados. Nenhuma parte desta obra pode ser reproduzida ou transmitida por qualquer forma e/ou 
quaisquer meios (eletrônico, incluindo fotocópia e gravação) ou arquivada em qualquer sistema ou banco de dados sem 
permissão escrita da Universidade Paulista.
U510.44 – 21
Dados Internacionais de Catalogação na Publicação (CIP)
F213e Fanno, Maurício Martins do.
Estatística. / Maurício Martins do Fanno. – São Paulo: Editora 
Sol, 2021.
212 p., il.
Nota: este volume está publicado nos Cadernos de Estudos e 
Pesquisas da UNIP, Série Didática, ISSN 1517-9230.
1. Processos estatísticos. 2. Medidas estatísticas. 3. Teorias das 
probabilidades. I. Título.
CDU 519.2
Prof. Dr. João Carlos Di Genio
Reitor
Prof. Fábio Romeu de Carvalho
Vice-Reitor de Planejamento, Administração e Finanças
Profa. Melânia Dalla Torre
Vice-Reitora de Unidades Universitárias
Profa. Dra. Marília Ancona-Lopez
Vice-Reitora de Pós-Graduação e Pesquisa
Profa. Dra. Marília Ancona-Lopez
Vice-Reitora de Graduação
Unip Interativa – EaD
Profa. Elisabete Brihy 
Prof. Marcello Vannini
Prof. Dr. Luiz Felipe Scabar
Prof. Ivan Daliberto Frugoli
 Material Didático – EaD
 Comissão editorial: 
 Dra. Angélica L. Carlini (UNIP)
 Dr. Ivan Dias da Motta (CESUMAR)
 Dra. Kátia Mosorov Alonso (UFMT)
 Apoio:
 Profa. Cláudia Regina Baptista – EaD
 Profa. Deise Alcantara Carreiro – Comissão de Qualificação e Avaliação de Cursos
 Projeto gráfico:
 Prof. Alexandre Ponzetto
 Revisão:
 Vera Saad
 Vitor Andrade
Sumário
Estatística
APRESENTAÇÃO ......................................................................................................................................................7
INTRODUÇÃO ...........................................................................................................................................................7
Unidade I
1 O QUE É E COMO SE APLICA A ESTATÍSTICA NA ÁREA DE NEGÓCIOS ..........................................9
1.1 Definição de estatística .........................................................................................................................9
1.2 Utilização prática da estatística na área de negócios ........................................................... 11
1.3 Estatística como ferramenta para tomada de decisão: problemas dotados 
de incerteza e redução de riscos ........................................................................................................... 12
1.4 Diferenciação entre estatística descritiva e indutiva e suas relações ............................. 13
1.5 Campos de atuação da estatística descritiva e indutiva ...................................................... 14
1.6 Processo estatístico ............................................................................................................................. 16
1.7 Conceitos de população e amostra e aplicação dos conceitos na área 
de negócios .................................................................................................................................................... 16
1.8 Definição de variáveis qualitativas e quantitativas, discretas e contínuas .................. 20
1.9 Relações entre amostras e população ......................................................................................... 22
1.10 Amostragem, predição, valores reais e prováveis ................................................................. 23
2 ESTATÍSTICA DESCRITIVA – FUNDAMENTOS ......................................................................................... 26
2.1 Definições de medidas estatísticas como forma de previsão............................................. 26
2.2 Definição e cálculo .............................................................................................................................. 26
2.2.1 Coleta de dados ....................................................................................................................................... 26
2.2.2 Tabela de dados brutos ......................................................................................................................... 26
2.2.3 Frequência simples e frequências decorrentes ........................................................................... 30
2.2.4 Montagem de tabela de frequências .............................................................................................. 31
2.2.5 Representação gráfica e interpretações das frequências calculadas: 
histogramas; setogramas e ogivas acumuladas .................................................................................... 45
3 ESTATÍSTICA DESCRITIVA – MEDIDAS ESTATÍSTICAS ......................................................................... 64
3.1 Conceitos, cálculos e aplicações práticas de medidas de tendência: 
média simples, médias ponderadas, mediana e moda, quartis e percentis ......................... 64
3.1.1 Médias ......................................................................................................................................................... 65
3.1.2 Separatrizes ............................................................................................................................................... 78
3.1.3 Modas .......................................................................................................................................................... 93
3.2 Conceitos, cálculos e aplicações práticas de medidas de dispersão absolutas 
e relativas: desvio padrão, variância e coeficientes de variação ............................................100
3.2.1 Medidas de dispersão absolutas: desvio médio; desvio padrão; variância ...................100
3.2.2 Medidas de dispersão relativas: coeficientes de variação ....................................................107
4 ESTATÍSTICA DESCRITIVA – ASSIMETRIA E CURTOSE ......................................................................110
4.1 Cálculos e efeitos das diferenças entre a média, mediana, moda e o 
desvio padrão e o efeito da variação dos valores.........................................................................111
4.1.1 Análise da assimetria ...........................................................................................................................112
4.1.2 Análise da curtose ................................................................................................................................113
4.2 Correlação entre o aumento e a diminuição do desvio padrão com a 
eficiência e eficácia da gestão na área de negócios....................................................................116
Unidade II
5 TEORIA ELEMENTAR DAS PROBABILIDADES ......................................................................................128
5.1 Conceitos iniciais de probabilidades e como são calculadas ...........................................128
5.2 Definição de probabilidade como razão entre valores esperados 
e possíveis .....................................................................................................................................................129
5.2.1 Árvore de decisões ...............................................................................................................................132
5.2.2 Análises combinatórias ...................................................................................................................... 134
6 DEFINIÇÃO DE PROBABILIDADE COMO FREQUÊNCIA RELATIVA ...............................................140
6.1 Evento soma e evento produto ....................................................................................................142
6.2 Eventos independentes e eventos vinculados ........................................................................145
6.3 Revisão teórica dos conceitos estudados .................................................................................147
Unidade III
7 DISTRIBUIÇÕES DE PROBABILIDADES ...................................................................................................159
7.1 Conceitos de distribuição de probabilidades ..........................................................................159
7.2 Distribuições para variáveis discretas ........................................................................................161
7.2.1 Cálculo de distribuições binomiais a partir de probabilidades com 
poucos eventos .................................................................................................................................................161
7.2.2 Definição e cálculo de valores esperados (esperança matemática) e 
desvio padrão esperado para a binomial .............................................................................................. 167
7.2.3 Definição e cálculo de distribuição de Poisson.........................................................................171
8 DISTRIBUIÇÕES PARA VARIÁVEIS CONTÍNUAS .................................................................................176
8.1 Distribuição normal – definição ...................................................................................................178
8.2 Cálculo de probabilidades através da curva normal ............................................................180
8.3 Cálculo das condições correspondentes a probabilidades da curva normal .............189
7
APRESENTAÇÃO
Cada vez mais a estatística aumenta sua importância no elevado desempenho das nossas atividades 
profissionais. Qualquer que seja a área de atuação em que estejamos alocados, nossas decisões e 
conhecimento utilizarão largamente os conceitos estatísticos. Não é errado afirmar que a estatística 
é parte da linguagem da ciência e consequentemente das nossas atividades profissionais.
Na administração utilizamos métodos estatísticos no planejamento e controle da produção, na administração 
de marketing, na estimação de receitas e na previsão de demandas e de estoques, entre outros.
Nas ciências contábeis, a estatística é utilizada entre outras aplicações na modelagem financeira 
e econômica, envolvendo comportamento de crédito, inadimplência, previsões de taxas de juros etc. 
Nas ciências econômicas os modelos teóricos apoiam-se na estatística para, com base em dados 
empíricos, explicar o comportamento da economia.
Em resumo poderíamos dizer que esta disciplina apresenta ferramentas e técnicas de tratamento 
de dados visando o entendimento de situações práticas dotadas de alguma incerteza, permitindo 
tomadas de decisão mais rápidas, racionais e seguras. Descreve o processo de coleta, organização 
e apresentação de dados e o cálculo de medidas estatísticas que permitirão a compreensão do 
comportamento do universo estudado. Demonstra também como conclusões obtidas de pequenos 
conjuntos de elementos cujos valores são reais podem ser extrapoladas para grandes conjuntos de valores 
reais ou prováveis, permitindo estudos menos trabalhosos e, ainda, previsões sobre situações futuras. 
Espera-se que o aluno venha saber utilizar os conceitos estatísticos no tratamento de dados, 
numéricos ou não, entendendo como se comporta um conjunto de elementos resultantes de um 
particular problema prático, e como esse comportamento eventualmente pode ser generalizado. 
INTRODUÇÃO
A estatística é uma ciência com amplo espectro de teorias e aplicações. Neste livro-texto 
pretendemos apresentar ao aluno as ferramentas básicas necessárias para a atuação profissional na área 
de negócios, sem aprofundar os conceitos matemáticos e estatísticos produtores dessas ferramentas. 
Sempre que possível, utilizaremos exemplos práticos para mostrar como usar e qual a utilidade prática 
de cada ferramenta.
Não apresentaremos o desenvolvimento das fórmulas ou os conceitos matemáticos que lastreiam 
os cálculos estatísticos por considerar que não é esse o objetivo do nosso curso, mas necessitaremos 
de algumas ferramentas matemáticas mais básicas. Na medida do possível iremos revê-las quando 
forem necessárias. Porém, é sempre conveniente que você revise os conceitos matemáticos aprendidos 
em disciplinas anteriores.
O estudo da estatística, como de todas as ciências exatas, obriga à repetição, o maior número de vezes 
possível, de exercícios de fixação. No presente material os cálculos definidos são mostrados uma única 
vez, como exemplo, mas o aluno deve se lembrar de que terá à disposição nos materiais complementares 
8
uma grande quantidade de exercícios e problemas e que o aprendizado somente será garantido caso 
eles sejam feitos em sua totalidade.
Primeiro, discorreremos sobre o que conhecemos como estatística descritiva. Abordaremos, 
inicialmente, as definições fundamentais em estatística, como população e amostra, e evoluiremos 
para a coleta e tratamento de dados, sua organização, indexação e apresentação na forma gráfica e 
em quadros e tabelas. Posteriormente, veremos as medidas estatísticas, tanto as de posição como de 
dispersão. Faremos então uma análise do comportamento prático das grandezas estatísticas.
Posteriormente, trataremos do estudo das probabilidades. Ainda que, rigorosamente, o estudo das 
probabilidades esteja no campo da matemática, e não da estatística, veremos como esses conceitos são 
aplicados na prática e como eles nos conduzem ao conceito de distribuições de probabilidades. A ideia 
é apresentar probabilidades como uma tomada de decisão aleatória, o que nos leva ao campo da lógica, 
necessária para entendermos o uso das probabilidades na área de negócios.
Estudaremos, em seguida, as distribuições de probabilidades, focando não só as teorias e cálculos 
propostos, mas também sua aplicação prática. Iremos nos concentrar nas três distribuições mais 
importantes. São elas, a distribuição binomial, a de Poisson e principalmente a distribuição normal, a 
mais importante de todas, quando anteveremos as relações entre populações e amostras.
Esperamos que o material seja adequado a seu aprendizado e desejamos bons estudos.
9
ESTATÍSTICA
Unidade I
A estatística descritiva é a base de toda a estatística. Muitas vezes usamos o termo no plural, estatísticas, 
para significar a relação de dados coletados. Fundamentalmente a estatística descritiva descreve uma 
amostra com a finalidade de conhecer seu comportamento e de tentar extrapolar esse conhecimento 
para as populações correspondentes. Pretendemos entender, inicialmente, como os dados são coletados, 
organizados, divulgados e, não menos importante, como eles são trabalhados para gerar as medidas 
estatísticas. Com essas informações, podemos saber o que acontece ou aconteceu com determinado 
fenômeno e como isso pode influenciar em nossas decisões nas várias áreas de conhecimento humano. 
Podemos, por exemplo, estudar como as vendas de uma empresa se comportaram nos últimos meses 
para entender e decidir sobre as vendas futuras.
1 O QUE É E COMO SE APLICA A ESTATÍSTICA NA ÁREA DE NEGÓCIOS
1.1 Definição de estatística
Caso você procure num bom dicionário a definição de estatística, se deparará com algo semelhante 
ao que Houaiss (2009, p. 830) estabelece: 
• ramo da matemática que trata da coleta, da análise, da interpretação e da apresentação de massas 
de dados numéricos;
• qualquer coleta de dados quantitativos;
• lei de distribuiçãodos componentes de um sistema pelos diferentes estados do sistema.
Apesar de estarem absolutamente corretas, essas definições não abrangem totalmente o que significa 
estatística nos dias de hoje, em especial no entendimento das informações e no processo de tomadas de 
decisão. Num mundo progressivamente mais complexo, a estatística torna-se a linguagem da ciência, 
fundamental para transformar dados em informações adequadas.
Houaiss registra o uso da palavra estatística em português no ano de 1815, mas podemos remontar 
o conceito estatístico ao início da escrita com os babilônios, por exemplo, com as anotações relativas 
aos estoques, às entradas e saídas de produtos agrícolas e às riquezas diversas. 
Muitos autores defendem que a palavra estatística venha de statu, ou seja, uma disciplina ligada 
aos negócios de Estado. Uma evidência desse uso está numa das histórias mais conhecidas da Bíblia, o 
deslocamento de José e Maria de Nazaré para a Judeia, o que teria provocado o nascimento de Jesus na 
cidade de Belém. Apesar das possíveis adaptações à realidade, a história menciona a existência de um 
censo populacional no início da era cristã.
10
Unidade I
Apesar do uso histórico da estatística, é a partir do século XIX que ela começa a ganhar importância 
nas diversas áreas do conhecimento e notadamente no século XX que ela ganha protagonismo nas 
grandes organizações e nas aplicações às áreas de negócios.
Com o elevado desenvolvimento das telecomunicações e da informática a partir do final da Segunda 
Guerra Mundial, a quantidade de dados disponíveis sobre qualquer assunto se tornou próxima do 
infinito, o que reforçou a importância da estatística nas várias áreas de atuação humana.
Basicamente definimos estatística como um conjunto de métodos, técnicas e ferramentas envolvendo 
todas as etapas e aspectos de uma pesquisa através de passos subsequentes e encadeados. Esses passos 
podem ser estruturados em:
• planejamento da pesquisa; 
• coordenação da sua execução;
• levantamento de dados através de uma amostragem ou censo com a aplicação de questionários, 
entrevistas ou mensurações coletando a maior quantidade possível de informação a 
custos adequados;
• análise de consistência dos dados;
• processamento, organização e apresentação dos dados, através de tabelas e gráficos;
• cálculo de medidas e parâmetros estatísticos;
• análise e interpretação dos dados para explicar o fenômeno estudado;
• inferência e generalização das conclusões obtidas com o cálculo dos valores prováveis, margens 
de erro e níveis de confiança para fenômenos do tipo estudado.
 Observação
Censo é a pesquisa estatística em que todos os elementos de um conjunto 
são considerados. Normalmente trabalhar com um censo é muito custoso, 
daí o uso da amostragem, na qual apenas parte dos elementos é considerada.
O processo estatístico pode trabalhar com dois tipos de dados de acordo com sua origem: dados 
primários e dados secundários. Normalmente as pesquisas se valem de ambos os tipos. Dados primários 
são aqueles coletados especificamente para determinado estudo, por exemplo, a pesquisa de opinião 
sobre o estilo de um novo automóvel a ser lançado no mercado. Já dados secundários são aqueles 
coletados com uma finalidade, mas utilizados para outro fim. Por exemplo, os valores determinados 
11
ESTATÍSTICA
pelo Instituto Brasileiro de Geografia e Estatística (IBGE) para a determinação do Índice de Preços ao 
Consumidor Amplo (IPCA) utilizados por uma empresa para analisar seu desempenho econômico.
 Saiba mais
O IBGE é o órgão responsável pela produção de estatísticas oficiais que 
respaldam estudos e planejamentos governamentais no Brasil. No site é 
possível encontrar uma grande quantidade de informações para as mais 
variadas aplicações:
http://ibge.gov.br
Como veremos posteriormente, essa relação entre dados primários e secundários é importante para 
o processo de amostragem. No ambiente de negócios, uma das principais utilizações de estatística, 
se não for a principal, é a previsão de situações futuras com base em dados coletados numa situação 
similar, presente ou passada. A relação entre o ambiente futuro e o ambiente presente ou passado é feita 
largamente com o uso de dados secundários. 
1.2 Utilização prática da estatística na área de negócios
Quando falamos de administração, contabilidade e economia, estamos nos referindo ao 
desenvolvimento de conceitos, técnicas, ferramentas e processos que nos ajudam a entender e aperfeiçoar 
os mecanismos de causa e consequência dos fenômenos que envolvem a área de negócios. Queremos 
entender como determinada circunstância ocorre para poder aperfeiçoar os resultados obtidos nas 
futuras repetições. 
Digamos que nossa empresa venha a lançar um novo produto no mercado. Uma série enorme de 
decisões tem de ser tomada para que se atinja sucesso na empreitada. Precisamos estimar o volume 
de vendas para prever, entre outras, as necessidades de mão de obra, de materiais e de equipamentos.
No entanto, o volume de vendas depende de uma série enorme de fatores, como o preço do produto, 
o estado anímico da economia, a atratividade do produto no mercado, o efeito da concorrência e mais 
uma série de fatores nos quais incidem fortes incertezas.
O preço a ser praticado influi, como sabemos, pesadamente sobre o volume de vendas ao mesmo 
tempo em que uma série de outros fatores também é determinante. Aspectos econômicos e contábeis 
como taxações e ciclo operacionais vão defini-lo. Mais uma vez uma série de incertezas aparecerá.
Frente a isso podemos ter duas posturas: “chutar” um preço e um volume de vendas ou estimar 
estatisticamente essas duas grandezas. Evidentemente as chances de sucesso com a primeira são 
infinitamente menores do que com a segunda. 
12
Unidade I
Perceba que na situação mencionada são notáveis a existência de incerteza nos diversos fatores e 
o desejo de se saber algo que ocorrerá no futuro. Grande parte das decisões nas áreas de negócios está 
inserida nesse mesmo contexto, o de um futuro incerto.
 Saiba mais
No livro Moneyball: o homem que mudou o jogo, Michael Lewis narra 
experiência real do uso da estatística para contornar problemas de falta de 
capital. Aplicada a um time de beisebol americano, revolucionou o mundo 
esportivo mundial, mostrando como obter mais com menos. Em 2011, 
estreou o filme com o mesmo nome.
LEWIS, M. Moneyball: o homem que mudou o jogo. Rio de Janeiro: 
Intrínseca, 2015.
MONEYBALL. Direção: Bennett Miller. Estados Unidos: Columbia Pictures, 
2011. 133 min.
1.3 Estatística como ferramenta para tomada de decisão: problemas dotados 
de incerteza e redução de riscos
Para Calyampudi Radhakrishna Rao, grande matemático indiano, a estatística pode ser definida de 
uma forma simples e direta pela equação: conhecimento incerto + conhecimento sobre a incerteza = 
conhecimento útil. Note, portanto, que o grande objetivo da estatística é analisar os dados disponíveis 
sujeitos a certo grau de incerteza, o qual será também nosso objeto de estudo.
Por outro lado: 
A diferença entre racionalidade e intuição está na proporção de informação, 
de um lado, e opinião e sentimentos, de outro. Quanto maior a base de 
informação, mais racional é o processo. Quanto maior a proporção de opiniões 
e sentimentos, mais intuitivo se torna. A racionalidade e a intuição são atributos 
humanos complementares, e não concorrentes (MAXIMIANO, 2011, p. 77).
A diferença entre o grau de racionalidade e o grau de intuição que usamos em determinada decisão 
corresponderá a certo grau de risco. O aumento da racionalidade reduzirá esse risco e a estatística é 
importante fator de aumento da racionalidade.
A estatística pretende, portanto, investigar os dados existentes sobre determinado fenômeno e qual 
o grau de incerteza desses dados, e, com isso, prever acontecimentos futuros permitindo que tomemos 
decisões dotadas de uma maior racionalidade, reduzindo, consequentemente, o risco de insucesso 
da decisão tomada.
13
ESTATÍSTICA1.4 Diferenciação entre estatística descritiva e indutiva e suas relações
Esse processo estatístico acaba dividindo a ciência estatística em dois grandes campos. A estatística 
descritiva e a estatística indutiva. A estatística descritiva, como o próprio nome diz, descreve um ambiente 
para o qual os dados são conhecidos, ou seja, algo que está no presente ou no passado. A partir dessa 
descrição, preveremos situações futuras. Esse é o campo da estatística indutiva.
 Observação
Segundo Houaiss (2009, p. 1077), o verbo induzir tem nove significados 
diferentes. Em estatística ficamos com o significado elencado em segundo 
lugar: “concluir por meio de raciocínio lógico; inferir, deduzir”. Assim, 
indução para nós é sinônimo de predição, previsão, dedução, e não de 
inspirar, compelir, incitar.
Para exemplificar, vamos retornar ao exemplo do lançamento de um novo produto. Provavelmente 
esse produto não é totalmente inédito, deve ser semelhante a outro ou a outros produtos vendidos 
anteriormente pela nossa empresa. 
Poderíamos começar nosso estudo pela análise histórica das vendas de um produto similar. Essa 
análise seria no campo da estatística descritiva, feita através do levantamento histórico das vendas 
ocorridas, a organização desses dados e o cálculo das medidas estatísticas. 
Vamos supor que as vendas mensais de um produto X parecido com o novo produto que vamos 
lançar foram de 10.000 unidades ao longo dos últimos anos. Esse processo estaria dentro da 
estatística descritiva.
É lícito pensar que o nosso novo produto vai vender também cerca de 10.000 unidades por mês, já 
que eles são parecidos. É evidente que se trata de uma suposição bem grosseira, ainda que qualquer 
estimativa seja melhor que nenhuma. Certamente que essa estimativa teria que ser melhorada por 
intermédio de ferramentas estatísticas que avaliassem as diferenças entre a comercialização dos dois 
produtos, ou seja, em último caso, as incertezas. Esse seria o campo da estatística indutiva.
Um estudo estatístico adequado permitiria afirmarmos algo do tipo: “Baseados em dados 
históricos prevemos que as vendas do novo produto serão de 10.000 unidades por mês com uma 
margem de erro de mais ou menos 1.000 unidades e uma confiança de 95%”. A análise histórica 
seria o campo da estatística descritiva; e o cálculo da margem de erro e da confiança, o da 
estatística indutiva. 
Evidentemente que todos esses valores são calculados rigorosamente com técnicas e conceitos 
estudados e testados. Este será o assunto do curso.
14
Unidade I
1.5 Campos de atuação da estatística descritiva e indutiva
No mundo dos negócios utilizamos intensamente a estatística descritiva para resumir, informar, 
organizar dados característicos dos vários fenômenos contábeis, econômicos e administrativos 
com os quais convivemos. Numa rápida passada de olhos na internet podemos ver manchetes 
semelhantes a estas:
• Consumo aparente de bens industriais cresce 3% em maio.
• Indicador Ipea mostra avanço de 28,2% nos investimentos em maio.
• Desemprego no Brasil vai a 12,9% e apenas metade em idade de trabalhar estava ocupada no 
trimestre até maio.
• Brasil é o 10º país que mais consome energia no mundo.
• Arrecadação federal cai 32,92% em maio, para R$ 77,415 bilhões.
• Mercedes-Benz cresce em participação no mercado, mesmo com pandemia, mas volume de 
vendas cai.
Ou então gráficos do tipo:
21
/ju
n
22
/ju
n
23
/ju
n
24
/ju
n
25
/ju
n
26
/ju
n
27
/ju
n
28
/ju
n
29
/ju
n
30
/ju
n
01
/ju
l
02
/ju
l
03
/ju
l
04
/ju
l
05
/ju
l
06
/ju
l
07
/ju
l
08
/ju
l
09
/ju
l
10
/ju
l
11
/ju
l
12
/ju
l
13
/ju
l
14
/ju
l
15
/ju
l
16
/ju
l
1600
Mortes diárias
Legenda:
Média móvel para uma semana
Mortes diárias por Covid-19 no Brasil
1000
400
1400
800
200
1200
600
0
Figura 1
15
ESTATÍSTICA
 Saiba mais
Pesquisar dados é uma das mais trabalhosas e importantes atividades 
na estatística. A internet é uma grande facilitadora nessa árdua tarefa. 
Para nós, brasileiros, alguns sites, além do site do IBGE, são notadamente 
interessantes, entre eles citamos: 
http://datafolha.folha.uol.com.br/ (Datafolha) 
https://www.ipea.gov.br/portal/ (Ipea) 
http://www.periodicos.capes.gov.br/ (Capes)
https://www.scielo.br/ (SciElo)
Essas informações são todas de natureza estatística e obtidas através de processos descritivos. 
Fundamentalmente são tratamentos matemáticos a dados históricos, passados ou presentes, que 
permitem que cheguemos a determinadas conclusões. 
Por exemplo, podemos concluir que as concorrentes da Mercedes-Benz não só tiveram redução 
de faturamento como perderam participação de mercado e que as mortes por Covid-19 em São Paulo 
voltaram a crescer depois de um período de baixa.
Perceba, no entanto, que estamos falando do passado (ou presente); muitas vezes nos interessa, até 
mais, o futuro. Questões como:
• Quantos morrerão de Covid-19 no próximo mês?
• Quem será o próximo prefeito da nossa cidade?
• No próximo trimestre, a economia estará em recessão?
• No próximo Natal, as vendas aumentarão ou diminuirão?
• Que processo produtivo será mais eficiente para nossa empresa?
• Qual será nossa margem de lucro média no próximo semestre?
Essas e outras questões semelhantes serão respondidas com o uso da estatística indutiva. O raciocínio 
básico é olhar o presente e o passado e, através da estatística, prever o futuro.
16
Unidade I
Evidentemente que a estatística descritiva nos dá informações exatas e reais, até certo ponto 
inquestionáveis. Quando uma manchete na mídia afirma que “Brasil teve média de 1.056 mortes por dia 
por coronavírus na última semana”, estaremos diante de um valor real e exato (desde que corretamente 
calculado). É algo que já ocorreu. Matematicamente somaram-se todas as mortes ocorridas na última 
semana e dividiu-se por sete.
Já se a matéria for algo do tipo: “A Opas estima que, se as condições de combate ao vírus continuarem 
as mesmas, o Brasil atingirá o pico da epidemia em agosto, quando poderá ter 88,3 mil mortes”, o valor 
mencionado não é exato e algo estimado, portanto, é provável, e não real. 
Essa estimativa foi feita com base em modelos matemáticos que levam em conta os cenários 
possíveis de evolução da pandemia. Estatisticamente analisaram-se as mortes já ocorridas no passado e 
estimou-se o comportamento futuro. Evidentemente que não é um valor exato, é um valor dotado de 
uma margem de erro e de um nível de confiança que podem ser calculados com rigor.
1.6 Processo estatístico
Perceba que o processo estatístico é um longo caminho que se inicia com a coleta de dados 
pertinentes, passa por seu estudo e entendimento através da estatística descritiva e chega à subsequente 
extrapolação dos dados para ambientes prováveis, através do cálculo das incertezas envolvidas expresso 
em margem de erro e confiabilidade.
Todo o processo e em especial a parte inferencial são feitos através de métodos científicos aplicados 
a um determinado fenômeno estudado. Como Costa (2011), entendemos que fenômeno é tudo que 
pode ser percebido pelos sentidos ou pela consciência. Costa exemplifica, entre outros, os fenômenos, 
a incidência de uma doença; o comportamento de pessoas numa loja; o consumo de certo produto, a 
oferta de certo produto; a demanda de certo produto e o lucro de uma empresa. Poderíamos acrescentar, 
ainda, o comportamento e ações na bolsa; a produtividade de um processo; a variação de preços; contas 
auditadas; impostos recolhidos e muito mais.
A estatística normalmente estuda os chamados fenômenos coletivos ou de massa, aqueles cuja 
regularidade não está no indivíduo, e sim na massa de observações. Fenômenos como a renda dos 
brasileiros; o nível socioeconômico dos consumidores; o gênero dos compradores de confecções; o nível 
de demanda de leitos num hospital etc. 
Fenômenos de massa ocorrem quando estudamos uma ou mais características de elementos de um 
conjunto ao qual normalmente damos o nome de população.
1.7 Conceitos depopulação e amostra e aplicação dos conceitos na área 
de negócios
A estatística trabalha com grandes conjuntos de dados. Mesmo em estudos relativamente pequenos, 
a quantidade de dados pode chegar às centenas. Essas grandes quantidades são normalmente o primeiro 
desafio aos métodos estatísticos. Assim dois tipos de conjuntos aparecem em estatística e, no fundo, 
condicionam todas as ferramentas a eles.
17
ESTATÍSTICA
Ao primeiro desses dois conjuntos damos o nome de população. Definimos população como o 
conjunto formado por todos os elementos que apresentam em comum uma característica que está 
sendo estudada. Por exemplo, o conjunto dos eleitores de determinada cidade nas próximas eleições ou 
o conjunto de todos os funcionários de nossa empresa ou ainda o conjunto de todas as cotações diárias 
das ações da Petrobras na bolsa nos últimos três anos.
Perceba uma característica inicial das populações: a grande quantidade de elementos que a 
compõe. Pode chegar facilmente aos milhares, o que implica evidentemente a grande necessidade de 
recursos aplicados. 
Imagine que queiramos calcular a altura média dos alunos da UNIP (altura média é uma medida 
estatística que será vista detalhadamente mais adiante). O cálculo em si é muito fácil, basta somar a 
altura de todos os alunos da UNIP e dividir pelo número de alunos. O problema é que temos milhares 
de alunos na UNIP e em muitos locais diferentes. Imagine o custo para medir cada um deles e compilar 
essas informações!
Isso pode ainda piorar, pense em calcular o salário médio dos alunos da UNIP após cinco anos de 
formados. Agora, além da grande quantidade de elementos, temos o fato de que os valores trabalhados 
não são reais. O salário de um aluno depois de cinco anos de formado é algo provável, não real. Temos 
uma complicação em dobro!
Uma população é, portanto, um conjunto com uma grande quantidade de elementos e/ou o valor de 
cada elemento não é real, é provável. Para caracterizar uma população, estatisticamente falando, basta 
uma dessas duas características. 
Perceba que, quando nos referimos a uma grande quantidade de elementos, não estamos pensando 
em um valor absoluto, e sim num valor relativo à quantidade de recursos necessários. Assim uma 
população pode ter 100 ou 100.000 elementos. O que torna a quantidade de elementos grande são os 
recursos disponíveis.
Por exemplo, suponha que queiramos calcular a média de notas dos alunos da UNIP em determinada 
disciplina. Para você, com seus recursos, isso será um trabalho impossível. Para a UNIP, com os recursos 
de informática e com o banco de dados que tem, isso seria relativamente fácil. Isso significa que, para 
você, esse estudo estatístico envolve uma população. Para a UNIP não!
Como adequar nossos recursos ao problema estudado? Através do estudo de amostras da 
população. A amostra é um subconjunto finito da população, adequadamente selecionado de tal forma 
que a represente.
Essa seleção adequada compreende dois aspectos:
• Forçar que a amostra seja composta de poucos elementos (em relação aos recursos disponíveis) e 
que o valor dos elementos seja real.
18
Unidade I
• Garantir que a amostra seja uma miniatura da população de modo que todas as características 
importantes da população sejam percentualmente iguais na amostra.
Assim teremos um conjunto de poucos elementos com valor real, o que permite um cálculo 
descritivo relativamente fácil e pouco custoso.
 Observação
Muitas vezes nos deixamos levar por conclusões apressadas quando 
falamos de população e de amostra. Por exemplo, um conjunto de 
1.000 elementos é uma população; já um de 100 elementos é uma 
amostra. Isso está incorreto, a verdade pode ser o oposto. Depende dos 
recursos necessários.
Um exemplo bem conhecido do exposto anteriormente é a pesquisa eleitoral, à qual temos 
amplo acesso a cada dois anos. Uma eleição é decidida pela contagem de votos a favor de cada 
candidato dentro da população formada por todos os eleitores habilitados, frequentemente na 
casa dos milhões. 
No dia da eleição cada eleitor vota, seu voto é computado e um candidato é eleito. Perceba como 
a quantidade de recursos necessária é grande. Urnas eletrônicas; mesários; computadores centrais; 
telecomunicações etc. Esse enorme dispêndio só tem sentido pela importância da manutenção do 
regime democrático, mas não cabe para atender a interesses jornalísticos, por exemplo.
A sociedade gosta de saber com antecedência quem será o candidato eleito nas próximas eleições, 
que ocorrerão, digamos, daqui a alguns meses ou a alguns dias. A mídia tenta saciar essa curiosidade, 
mas não tem os recursos que a justiça eleitoral dispõe no dia da eleição. Assim sendo, recorre à 
pesquisa eleitoral.
A pesquisa eleitoral consiste em pegar uma amostra da população e estudá-la para depois estender 
as conclusões para todo o eleitorado. Dessa forma o instituto de pesquisa pega uma (relativamente) 
pequena quantidade de eleitores, pergunta em quem cada um irá votar e calcula a votação de cada 
candidato entre esses eleitores. 
Digamos que, em uma amostra com 3.000 eleitores, 56% deles disseram que votariam nas próximas 
eleições no candidato Jack O’Theft. É lógico pensar que, se a eleição fosse hoje, Jack teria 56% dos votos 
e seria eleito. É lógico, mas não é nem obrigatório, nem exato. É possível que seja um valor parecido, 
mas não exatamente o mesmo.
Um exemplo banal demonstra esse raciocínio. Um sommelier avalia um vinho sem precisar 
beber a garrafa toda, basta uma pequena amostra. As características que ele notar na pequena 
amostra experimentada é verdade para toda a garrafa e mesmo para todo o tonel do qual a 
19
ESTATÍSTICA
garrafa foi tirada. Na prática, qualquer fenômeno está submetido a esse raciocínio, mas com 
algumas ressalvas.
O vinho na garrafa é totalmente homogêneo, qualquer parte retirada será exatamente igual. 
Na maioria dos fenômenos, no entanto, isso não ocorre, há sempre certo grau de heterogeneidade. 
Seria o caso de se avaliar não certa safra de vinho, mas os vinhos de uma vinícola ao longo 
dos anos. Haveria uma heterogeneidade ao longo dos anos que tornaria a conclusão do 
sommelier menos exata.
Dessa forma, a precisão na avaliação de determinado vinho é maior do que a avaliação dos 
diversos vinhos da vinícola. Essa precisão gerará uma margem de erro, que é uma tolerância sobre os 
valores previstos. 
Outro aspecto que influi sobre a margem de erro é o tamanho da amostra. É fácil concluir que 
a margem de erro numa pesquisa eleitoral com 800 eleitores é maior do que com 2.000 eleitores. 
Assim, caso você abrisse um jornal e visse a manchete sobre a pesquisa a que nos referimos, ela seria 
provavelmente algo do tipo “Se a eleição fosse hoje Jack O’Theft teria 56% dos votos com 2% de margem 
de erro para mais ou para menos, com 95% de confiabilidade”. Essa margem de erro e a confiabilidade 
estão ligadas diretamente à homogeneidade da população e ao tamanho da amostra.
Esses conceitos são frequentemente aplicados à área de negócios. Alguns exemplos são 
bem conhecidos:
• A expectativa de vida dos potenciais clientes na área de seguros de vida. Esses clientes formam 
uma população com uma grande quantidade de elementos e com valores prováveis, não reais. 
Não sabemos quando um deles morrerá. Contudo, os estudos amostrais com elementos 
semelhantes, que já morreram, nos dão essa informação.
• A produtividade prevista de uma máquina automática. Tomamos uma amostra de alguns períodos 
de funcionamento e extrapolamos para o futuro.
• A inflação para o próximo ano. Pegamos uma amostra das inflações de meses passados e induzimos 
a inflação futura.
• O consumo de bebidas em um grande restaurante individual. A partir da análise do consumo 
individual com alguns poucos funcionários chegamos ao valor total multiplicando pelo número 
total de funcionários. 
• As diversas ações de marketing avaliadas quanto à sua eficácia, por intermédio de pesquisas de 
opinião, que consistem em tomar uma amostra de consumidores,verificar sua opinião e, em 
seguida, estender as conclusões para todo o mercado.
20
Unidade I
1.8 Definição de variáveis qualitativas e quantitativas, discretas e contínuas
Como vimos, tanto as populações como as amostras são conjuntos formados pelos valores de uma 
(ou mais) característica de elementos resultantes de um fenômeno estudado. Assim, caso estudássemos 
o nível socioeconômico de um determinado agrupamento humano, a população envolvida seria 
a renda de todos os elementos daquele agrupamento, por exemplo, todos os alunos da UNIP. Caso 
não considerássemos todos os alunos da UNIP, mas apenas uma quantidade relativamente menor, 
mas que reproduzisse em menor escala a população, teríamos uma amostra, formada pela renda dos 
alunos escolhidos.
Frequentemente usamos em estatística, principalmente em probabilidades, o termo “escolhido”. 
Quando isso ocorre, normalmente imaginamos uma escolha aleatória, ou seja, um sorteio, nunca uma 
escolha dirigida.
Independentemente de tratar-se de uma amostra ou de uma população, devemos observar que 
cada um dos elementos envolvidos apresenta uma grande quantidade de diferentes características, mas 
apenas uma delas é objeto de determinado estudo. Note que você tem inúmeras características: sua 
altura; seu peso; a cor de seus olhos e cabelos; sua religião; seu time de futebol; seu gosto musical; a 
quantidade de filhos ou irmãos; seu estado civil etc., e, claro, sua renda.
No estudo a que nos referimos, a característica estudada é a renda, portanto, é essa que nos interessa. 
À característica estudada damos o nome de variável estatística. Todas as demais características 
podem ou não ter importância; veremos, a seguir, a que é, realmente, objeto do nosso foco, a 
variável estatística.
As variáveis estatísticas são classificadas em diversos tipos que acabam por determinar o tipo de 
pesquisa que será possível fazer e a potência dos resultados dessa pesquisa.
Quadro 1
Variáveis 
estatísticas
Qualitativas
Nominais
Ordinais
Quantitativas
Discretas
Contínuas
As variáveis qualitativas correspondem a qualidades ou atributos. Caso possam ser hierarquizadas ou 
ordenadas, são chamadas de variáveis estatísticas ordinais, caso contrário, são as variáveis qualitativas 
nominais. Evidentemente que as variáveis qualitativas são expressas por palavras, por exemplo, a cor dos 
olhos dos alunos de uma classe pode ser preta, castanho-esverdeada, azul etc. 
Alguns exemplos de variável qualitativa nominal são: gênero; estado civil; naturalidade; 
nacionalidade; etnia; religião; time de futebol pelo qual se torce etc. Já teríamos como variáveis 
qualitativas ordinais o nível de instrução do indivíduo (superior é maior que médio e médio maior 
21
ESTATÍSTICA
que fundamental); nível socioeconômico (classe A maior que classe B maior que classe C…); cargos 
ocupados pelos funcionários de uma empresa (presidente > diretor > gerente > supervisor).
Já as variáveis quantitativas expressam valores numéricos. Também são divididas em dois grupos. 
As variáveis quantitativas discretas são aquelas que podem assumir apenas valores inteiros e que são 
contadas; por exemplo, o número de irmãos. Já as variáveis quantitativas contínuas podem assumir 
qualquer valor numérico dentro de uma faixa lógica. São resultados de medições. Por exemplo, o nosso 
peso corpóreo. Perceba que, se você disser que pesa 65,45263 quilos, eu tenho que aceitar. Você teria se 
pesado numa superbalança, mas o valor é lógico. Mas se você disser que pesa 500 quilos e não for um 
hipopótamo, eu não aceitarei. Está fora de uma faixa lógica de pesos corpóreos humanos.
Alguns exemplos de variáveis quantitativas discretas são: número de pacientes em um hospital; 
número de acidentes na produção de uma empresa; número de filhos por casal. Já algumas variáveis 
quantitativas contínuas seriam: nosso tempo de vida; quilometragem de um veículo; estatura e peso de 
alunos da UNIP; salários dos funcionários de uma empresa etc.
Observe que existe uma zona de penumbra entre as variáveis quantitativas discretas e contínuas 
devido à precisão adotada e ao instrumento de medida usado. A idade de uma pessoa é conceitualmente 
contínua. Alguém pode dar sua idade como sendo de 25 anos, 3 meses, 16 dias, 8 horas, 32 minutos e 
27 segundos... Ou seja, uma variável contínua, mas ninguém fala assim. Falamos que temos 25 anos, ou 
seja, uma variável discreta. No limite da precisão, toda variável contínua pode ser considerada discreta. 
Veremos mais à frente as consequências desse raciocínio.
Outra observação importante é o fato de que estudos com variáveis quantitativas são mais potentes 
que com variáveis qualitativas, motivo pelo qual muitas vezes transformamos um estudo qualitativo em 
quantitativo, como podemos ver a seguir.
Suponha que se queira avaliar um professor no que diz respeito ao grau de preparação de suas aulas. 
Poderíamos entrevistar seus alunos e fazer uma das perguntas a seguir:
I – O professor X prepara suas aulas antecipadamente? 
 SIM NÃO
Perceba que estamos falando de uma variável qualitativa nominal e tudo que tiraremos de conclusão 
dessa pergunta é a porcentagem de “sins” e de “nãos” obtidas, algo pouco potente, portanto.
II – Com qual frequência o professor X prepara suas aulas com antecedência? 
 SEMPRE FREQUENTEMENTE RARAMENTE NUNCA
Nesse caso a variável qualitativa é ordinal e note que nos dá mais informações que a pergunta 
anterior, ou seja, temos um estudo mais potente.
22
Unidade I
III – O professor X prepara suas aulas adequadamente? Dê a nota que melhor corresponda 
a esse aspecto, de acordo com o quadro a seguir: 
Quadro 2
Nota Descrição
1 Nunca tem as aulas preparadas
2 Às vezes tem as aulas preparadas
3 Frequentemente tem as aulas preparadas
4 Sempre tem as aulas preparadas
Apesar da semelhança com a pergunta anterior, essa pergunta suporta respostas numéricas, o que 
permite cálculos de medidas estatísticas; por exemplo, médias.
IV – Atribua uma nota entre 0 e 5 para a qualidade de preparação de aulas do professor X, 
sendo 0 uma preparação muito negativa e 5 uma muito positiva.
Nesse caso, apesar de conceitualmente termos uma variável qualitativa, conseguimos utilizar valores 
numéricos e grande precisão e variação. Algum aluno, se quiser, pode dar nota 3,6, por exemplo, e 
podemos calcular todas as medidas estatísticas existentes. A pesquisa assume a sua maior robustez.
Esse raciocínio é frequente quando queremos aumentar os recursos da pesquisa. Cores são variáveis 
qualitativas ordinais, mas numa indústria química ou têxtil elas serão determinadas de modo quantitativo 
usando-se um colorímetro.
1.9 Relações entre amostras e população
Quando falamos de populações e amostras algumas observações são importantes:
• Uma amostra não é um pedaço qualquer da população. É um subconjunto que reproduz 
percentualmente todas as características da população.
• As populações e suas amostras são relacionadas, ou seja, conhecendo uma amostra, podemos 
estimar uma população ou, conhecendo uma população, podemos prever como se comportam as 
amostras dela retirada. Essa relação, no entanto, não é exata, existe uma tolerância à qual damos 
o nome de margem de erro.
• A margem de erro depende fundamentalmente da homogeneidade de uma população e do 
tamanho da amostra. Quanto mais homogênea uma população, menor a margem de erro, assim 
como, quanto maior a amostra, menor a margem de erro. 
• Todo estudo indutivo está sujeito também a uma confiabilidade, ou seja, à confiança que temos 
na previsão feita.
23
ESTATÍSTICA
• Calcular a margem de erro e estabelecer a confiabilidade são fundamentais para fazermos 
previsões utilizáveis na prática.
1.10 Amostragem, predição, valores reais e prováveis
Como vimos, o conhecimento do comportamento de uma amostra permite predizer o comportamento 
da população correspondente e vice-versa, mas sempre com uma margem de erro. Erro em estatística é 
sinônimo de tolerância ou variação aceitável, não de algo incorreto,inexato ou inapropriado. Para esses 
casos usamos o termo viés estatístico, que significa algo malfeito.
Vários fatores podem levar ao viés estatístico, mas o mais importante e notável é a constituição 
equivocada da amostra, quando ela não representa percentualmente a população. Sabemos que uma 
população ou amostra são conjuntos formados por elementos que têm entre si uma característica 
comum, que está sendo estudada. A essa característica estudada damos o nome de variável estatística.
Mas os elementos têm mais uma série de características não estudadas. Suponha que estudemos o 
desempenho de determinados alunos em determinada disciplina. A variável estatística seria a nota que 
cada aluno tirou em tal disciplina. Porém, cada aluno tem uma série de outras características. 
Algumas dessas características podem de algum modo influenciar no valor da variável estatística. 
Alunos de determinados cursos têm mais facilidade com a disciplina do que alunos de outros cursos. 
Imagina-se que um aluno de Jornalismo tenha mais facilidade em língua portuguesa do que alunos de 
Engenharia. Quando isso acontece, damos o nome de característica interveniente.
Evidente que a maioria das propriedades de um elemento não influi na variável estatística. O seu 
peso ou altura não tem influência alguma na nota que você obtém em uma disciplina particular. Essas 
são as características não intervenientes.
Para garantir a não existência de viés estatístico é necessário que todas as características 
intervenientes sejam reproduzidas percentualmente de modo idêntico nas amostras retiradas 
de uma população. 
O exemplo da pesquisa eleitoral elucida bastante esse raciocínio. Suponha que uma determinada 
região vai eleger seu principal mandatário. Existem lá 15 milhões de eleitores, a eleição será daqui a seis 
meses e queremos prever o ganhador da eleição.
Evidentemente não podemos entrevistar e perguntar para todos os eleitores em quem votarão, 
nós teremos que pegar uma pequena (relativamente) quantidade de eleitores. Digamos uma amostra 
de 2.000 eleitores. Mas essa amostra não pode ser escolhida aleatoriamente, ela terá que seguir 
percentualmente a distribuição da população nas características intervenientes. Digamos que 
as características intervenientes nesse caso sejam: gênero; idade; nível socioeconômico; nível de 
escolaridade e localização geográfica.
24
Unidade I
 Observação
A determinação das características intervenientes pode ser polêmica. 
Por exemplo, religião é uma característica interveniente na intenção de 
voto? A resposta a essas perguntas é obtida com especialistas que se respaldam 
em outros estudos estatísticos. Um cientista político ou antropólogo 
poderia responder sobre a religião.
Deveríamos saber como a população (os 15 milhões de eleitores) se distribui em cada uma das 
características intervenientes. No Brasil essas informações seriam obtidas no IBGE. Imaginemos que no 
nosso exemplo a distribuição esteja dada na tabela a seguir:
Tabela 1 
Gênero
Mulheres Homens
52,3% 47,7%
Idade (dada em anos)
16 a 20 21 a 34 35 a 44 45 a 59 + de 60
7,0% 30,7% 20,3% 24,0% 18,0%
Nível socioeconômico
Classe A Classe B Classe C Classe D Classe E
4,1% 9,4% 16,6% 21,8% 48,1%
Nível de escolaridade
Superior Médio Fundamental Pré-Fund.
17,5% 31,4% 12,5% 28,6%
Localização geográfica
Zona Norte Zona Sul Zona Leste Zona Oeste
26,2% 20,5% 24,8% 28,5%
Para que não haja viés estatístico é necessário que a amostra de 2.000 eleitores siga exatamente a 
distribuição percentual da tabela anterior. Por exemplo, 1.046 dos entrevistados seriam mulheres 
e 954 homens; 188 seriam da classe B; 350 com nível superior e assim por diante. A tabela a seguir mostra as 
quantidades necessárias de cada característica para se manter a proporcionalidade amostra/população.
Tabela 2 
Gênero
Mulheres Homens
1.046 954
Idade (dada em anos)
16 a 20 21 a 34 35 a 44 45 a 59 + de 60
140 614 406 480 360
Nível socioeconômico
Classe A Classe B Classe C Classe D Classe E
82 188 332 436 962
Nível de escolaridade
Superior Médio Fundamental Pré-Fund.
350 628 250 572
Localização geográfica
Zona Norte Zona Sul Zona Leste Zona Oeste
524 410 496 570
25
ESTATÍSTICA
Perceba, portanto, que a amostra deve ser planejada como uma matriz na qual esses 2.000 eleitores 
atendam em conjunto todas as necessidades percentuais. É possível que um dos eleitores entrevistados 
seja uma mulher entre 35 e 44 anos, da classe B, com superior completo, que more na zona norte da 
localidade. Os outros 1.999 eleitores completarão a amostra seguindo a tabela no total.
Vamos supor que nossa amostra foi planejada, executada, compilada e revele que 52% dos eleitores 
dela votariam no candidato X. Essa informação é real e muito próxima da exatidão. É evidente que 
algum eleitor poderia mentir, e, mesmo que não mentisse, ele diria em quem votaria naquele momento 
e poderia depois mudar de ideia, mas, mesmo assim, teríamos uma informação muito próxima da 
exatidão para aquelas condições e aqueles eleitores. 
Valendo-nos do raciocínio que fizemos anteriormente, podemos estimar que o candidato X terá na 
eleição 52% dos votos. Perceba que essa estimação é permitida, mas não corresponde a um valor real e 
exato, e sim a um valor provável. O certo seria estimarmos que o candidato X terá provavelmente 52% 
dos votos na referida eleição. 
Esse valor previsto é fundamental no processo estatístico, mas deve ser visto com algumas ressalvas:
• É um valor provável, não real.
• Ele vale para a eleição se ela fosse realizada hoje, como não será, devemos entender a evolução 
das opiniões ao longo do tempo.
• O valor estimado é um valor de referência. Aceitá-lo como verdade absoluta é um equívoco. Devemos 
adicionar a ele a margem de erro. Essa margem de erro depende da heterogeneidade da população 
e do tamanho da amostra. Uma amostra maior ou uma votação mais alta produziria um erro menor. 
• O valor estimado e a margem de erro foram calculados a partir dos dados da amostra, e se 
outro instituto de pesquisa pegar outra amostra? Chegará a resultados muito próximos, mas não 
exatamente iguais. Essa variação de amostra para amostra é muito pequena e não compromete a 
nossa capacidade de decidir.
 Observação
Evidentemente os cálculos necessários ainda serão objeto de nosso 
estudo, mas nesse caso a margem de erro seria de 2,2% com 95% de 
confiança. No futuro detalharemos os cálculos.
A mídia comunicaria essa estimativa de forma semelhante a: “Se a eleição fosse hoje o candidato X 
estaria eleito com 52% dos votos. A pesquisa foi feita com 2.000 eleitores e pode variar 2,2% para mais 
ou para menos com 95% de confiança”.
A todo esse processo de estimar uma população a partir de suas amostras (ou vice-versa) damos o 
nome de amostragem; aprenderemos os cálculos um a um a partir do próximo tópico.
26
Unidade I
2 ESTATÍSTICA DESCRITIVA – FUNDAMENTOS
2.1 Definições de medidas estatísticas como forma de previsão
De modo geral as estimativas são feitas utilizando-se medidas estatísticas, as quais são valores 
calculados para uma série de dados e usados de algum modo para descrever e resumir esses dados. 
Em princípio os valores das medidas estatísticas correspondentes de uma população e de suas amostras 
têm o mesmo valor, sempre levando em conta, no entanto, a margem de erro. 
Calcular as medidas estatísticas de uma amostra é o objetivo final da estatística descritiva, que 
veremos a seguir.
2.2 Definição e cálculo
O cálculo das medidas estatísticas segue um processo passo a passo, que começa com o planejamento 
da amostra e termina na análise do seu comportamento geral. 
2.2.1 Coleta de dados
Vimos antes a necessidade de se planejar adequadamente uma amostra e dos procedimentos 
para isso ser feito. Os elementos da amostra apresentam certas características, que tornam a amostra 
adequada para representar a população. O próximo passo então é a coleta de dados, que corresponde à 
verificação do valor da variável de cada elemento gerando uma relaçãode valores a serem analisados.
Muitas vezes esse trabalho de descrição estatística é feito em conjunto, ele não é propriamente 
uma amostra e não tem por objetivo a indução estatística; podemos citar como exemplo quando numa 
partida de futebol se relaciona numa tabela o número de passes certos, escanteios, cartões vermelhos 
e amarelos etc. O interesse é contabilizar o valor de diversas características. Muitas vezes, se utiliza a 
palavra “estatísticas” no plural para nomear o processo. É frequente falar algo do típico “as estatísticas 
do Governo Federal indicam um aumento do desmatamento”. É uma afirmação importante em si, sem 
ambições de se fazerem previsões futuras ou globais.
2.2.2 Tabela de dados brutos
Os dados coletados, em qualquer tipo de estudo estatístico, vão gerar a tabela de dados brutos 
ou rol de valores, que nada mais são do que uma relação dos dados coletados sem nenhum tipo de 
organização e ordenação, além de normalmente serem em grande quantidade.
Apesar de hoje o grande desenvolvimento de métodos computacionais ter facilitado enormemente 
o manuseio de grandes quantidades de dados, ainda se torna necessário um trabalho de organização e 
indexação dos dados coletados.
Para exemplificar a coleta de dados e os subsequentes esforços de resumo e organização, criamos 
uma tabela com informações coletadas num campus universitário. Para tornar mais produtivo o nosso 
27
ESTATÍSTICA
estudo, coletamos muitas variáveis estatísticas de diferentes tipos de modo, de modo a usarmos a tabela 
para variados cálculos. 
As variáveis estatísticas coletas foram:
• Estado civil do aluno.
• Curso em que o aluno está matriculado.
• Avaliação da qualidade da instituição na opinião do aluno.
• Gênero do aluno.
• Idade do aluno em anos.
• Renda familiar mensal em reais do aluno.
• Número atual de dependências que o aluno tem.
Tabela 3 
Dados brutos coletados em um campus universitário
Or
de
m
N
om
e
Es
ta
do
 c
iv
il
Cu
rs
o 
m
at
ric
ul
ad
o
Qu
al
id
ad
e 
at
rib
uí
da
 à
 
in
st
itu
iç
ão
Gê
ne
ro
Id
ad
e 
em
 a
no
s
Re
nd
a 
fa
m
ili
ar
 
m
en
sa
l e
m
 R
$
Qu
an
tid
ad
e 
de
 
de
pe
nd
ên
ci
as
1 Arnaldo Solteiro Contabilidade Regular M 26 R$ 6.352 4
2 Marilia Solteiro Administração Péssima F 24 R$ 4.231 2
3 Neiva Solteiro Administração Boa F 27 R$ 1.289 3
4 Roberto Solteiro Direito Regular M 23 R$ 2.987 4
5 Wilson Divorciado Economia Ótima M 28 R$ 3.645 5
6 Manoel Casado Direito Regular M 22 R$ 9.564 3
7 Marina Solteiro Engenharia Boa F 21 R$ 6.523 4
8 Gustavo Solteiro Jornalismo Regular M 19 R$ 4.235 1
9 Maicon Solteiro Administração Ótima M 18 R$ 5.634 0
10 Ladyjane Casado Engenharia Péssima F 34 R$ 1.965 0
11 Cristina Solteiro Administração Boa F 18 R$ 1.350 0
12 Walter Casado Direito Péssima M 30 R$ 4.560 2
13 Leonardo Solteiro Jornalismo Boa M 34 R$ 5.892 3
14 Guilherme Divorciado Engenharia Regular M 29 R$ 7.652 5
28
Unidade I
Dados brutos coletados em um campus universitário
Or
de
m
N
om
e
Es
ta
do
 c
iv
il
Cu
rs
o 
m
at
ric
ul
ad
o
Qu
al
id
ad
e 
at
rib
uí
da
 à
 
in
st
itu
iç
ão
Gê
ne
ro
Id
ad
e 
em
 a
no
s
Re
nd
a 
fa
m
ili
ar
 
m
en
sa
l e
m
 R
$
Qu
an
tid
ad
e 
de
 
de
pe
nd
ên
ci
as
15 Paula Solteiro Administração Ruim F 20 R$ 1.950 5
16 Danilo Solteiro Contabilidade Boa M 20 R$ 1.386 2
17 Camila Solteiro Administração Ótima F 20 R$ 9.560 2
18 Pedro Solteiro Direito Regular M 18 R$ 4.325 2
19 Vinicius Casado Administração Péssima M 26 R$ 1.956 1
20 José Solteiro Engenharia Boa M 24 R$ 2.654 3
21 Carlos Solteiro Economia Ótima M 23 R$ 1.965 0
22 Vanessa Solteiro Administração Ruim F 22 R$ 3.645 0
23 Samanta Casado Jornalismo Boa F 21 R$ 2.987 0
24 Mauro Casado Administração Regular M 29 R$ 3.652 0
25 Mariana Solteiro Engenharia Ruim F 23 R$ 1.978 0
26 Juliana Casado Administração Boa F 24 R$ 5.478 1
27 Daiane Solteiro Jornalismo Ótima F 19 R$ 3.220 2
28 Alberto Solteiro Economia Boa M 20 R$ 4.050 0
29 Rui Casado Direito Regular M 25 R$ 1.950 4
30 Carolina Casado Engenharia Ruim F 21 R$ 1.682 6
31 Joaquim Divorciado Contabilidade Péssima M 28 R$ 7.850 8
32 Rubens Solteiro Engenharia Ótima M 23 R$ 4.567 0
33 Jezebel Solteiro Administração Boa F 20 R$ 9.567 0
34 L. Carlos Solteiro Engenharia Regular M 20 R$ 2.687 2
35 Fernando Casado Direito Ótima M 27 R$ 3.654 1
36 Mayra Solteiro Contabilidade Ruim F 19 R$ 3.956 1
37 Maria Solteiro Economia Boa F 36 R$ 1.932 1
38 Gabriel Solteiro Contabilidade Regular M 27 R$ 1.002 0
39 Karina Solteiro Administração Ótima F 20 R$ 2.342 1
40 Thais Solteiro Engenharia Ótima F 29 R$ 1.965 1
41 Vinicius Solteiro Administração Ruim M 34 R$ 1.932 1
42 Adriana Casado Engenharia Boa F 36 R$ 1.002 1
43 Luciano Casado Direito Ruim M 27 R$ 2.342 0
44 Liliane Divorciado Contabilidade Regular F 20 R$ 2.569 2
45 Luana Solteiro Administração Ruim F 21 R$ 3.789 3
29
ESTATÍSTICA
Dados brutos coletados em um campus universitário
Or
de
m
N
om
e
Es
ta
do
 c
iv
il
Cu
rs
o 
m
at
ric
ul
ad
o
Qu
al
id
ad
e 
at
rib
uí
da
 à
 
in
st
itu
iç
ão
Gê
ne
ro
Id
ad
e 
em
 a
no
s
Re
nd
a 
fa
m
ili
ar
 
m
en
sa
l e
m
 R
$
Qu
an
tid
ad
e 
de
 
de
pe
nd
ên
ci
as
46 Alex Solteiro Direito Boa M 21 R$ 7.850 5
47 Danielle Solteiro Jornalismo Ótima F 29 R$ 4.567 5
48 Diego Solteiro Administração Boa M 21 R$ 6.523 0
49 Sebastiao Casado Administração Péssima M 29 R$ 4.235 1
50 Vieira Solteiro Direito Boa M 21 R$ 7.652 4
51 Giovana Solteiro Jornalismo Regular F 28 R$ 1.950 2
52 Jean Divorciado Administração Ruim M 23 R$ 1.386 3
53 Jessica Casado Engenharia Regular F 20 R$ 9.560 4
54 Katia Solteiro Administração Boa F 20 R$ 4.325 5
55 Kesia Solteiro Contabilidade Ruim F 27 R$ 1.956 3
56 Lucas Solteiro Economia Ótima M 19 R$ 2.654 4
57 Nathalia Casado Administração Péssima F 18 R$ 1.965 1
58 Rafael Solteiro Direito Boa M 30 R$ 3.645 0
59 Stephanie Solteiro Contabilidade Regular F 34 R$ 2.987 0
60 João Casado Engenharia Regular M 24 R$ 10.567 2
61 Dimas Solteiro Administração Ruim M 21 R$ 2.569 2
62 Marcos Solteiro Direito Boa M 21 R$ 3.789 2
63 Valquíria Casado Administração Ruim F 29 R$ 4.675 3
64 Gilmar Solteiro Jornalismo Ótima M 34 R$ 4.231 3
65 Henrique Solteiro Administração Boa M 36 R$ 1.289 0
66 Jessica Solteiro Engenharia Regular F 27 R$ 2.987 0
67 Natalia Casado Administração Ótima F 20 R$ 3.645 0
68 Bruno Casado Contabilidade Ruim M 21 R$ 9.564 0
69 Leticia Solteiro Administração Péssima F 23 R$ 2.687 2
70 L. Paulo Solteiro Jornalismo Boa M 22 R$ 3.654 2
71 Thayna Casado Administração Ótima F 21 R$ 956 1
72 Thiago Divorciado Direito Regular M 29 R$ 1.350 3
Observe que as características arroladas no quadro são variáveis de diferentes tipos, como 
mostrado a seguir:
30
Unidade I
Quadro 3
Variável Significado Tipo de variável
Ordem
É a ordem com que coletamos os 
dados. Relaciona a entrevista à 
sequência utilizada
Variável qualitativa nominal. É apenas um 
atributo qualitativo
Nome do aluno O primeiro nome de cada um dos entrevistados
Variável qualitativa nominal. É apenas um 
atributo qualitativo
Estado civil Estado civil do aluno Variável qualitativa nominal. É apenas um atributo qualitativo
Curso matriculado Curso ao qual o aluno pertence Variável qualitativa nominal. É apenas um atributo qualitativo
Qualidade atribuída à 
instituição
Qual é qualidade do curso percebida 
pelo aluno
Variável qualitativa ordinal. É apenas um 
atributo qualitativo que mostra intensidade
Gênero M significa Masculino; F significa Feminino
Variável qualitativa nominal. É apenas um 
atributo qualitativo
Idade Quantos anos cada aluno tem
Variável quantitativa contínua. Apesar de ser 
dada em anos, permite que seja medida em 
valores fracionários (meses, dias, até horas)
Renda familiar Qual é a renda da família nuclear do aluno
Variável quantitativa contínua. É medida em 
valores fracionários
Número de 
dependências
Quantas dependências o aluno tem 
para cursar
Variávelquantitativa discreta. Os valores são 
obrigatoriamente inteiros. Não existe “meia DP”
Ainda que os dados apresentados não sejam tão numerosos, a compreensão da tabela não é fácil. 
Caso eu peça para você olhar a tabela e rapidamente me dizer qual o estado civil típico dos alunos creio 
que terá dificuldades de me responder. Por esse motivo devemos criar ferramentas que resumam e 
organizem esses dados. O conceito básico a se usar é o da frequência.
2.2.3 Frequência simples e frequências decorrentes
Definimos frequência simples como o número de vezes que um valor ou uma faixa de valores se 
repete no rol de dados coletados. Por exemplo, se você contar o número de alunos matriculados no 
curso de Engenharia da tabela anterior, você encontrará oito indivíduos, dizemos então que a frequência 
simples dos alunos de Jornalismo é oito ou então simbolizamos essa informação por fjornalismo = 8
 Observação
Todas as grandezas estatísticas são identificadas por um símbolo. 
Em cada obra os símbolos podem se alterar. A simbologia que usaremos 
está resumida no Anexo. A frequência simples é simbolizada por fT, em que 
o índice fi identifica um elemento em particular, ao qual normalmente nos 
referimos como o i-ésimo termo.
A frequência simples, portanto, é apenas a contagem do número de elementos que apresentam o 
mesmo valor e dá origem a três outras definições de frequências:
31
ESTATÍSTICA
• Frequência total: é o somatório de todas as frequências simples. Simbolizada por e calculada 
através da fórmula:
f f f f f ou simplesmentef fT n T
i
n
i� � � � � �
�
�1 2 3
1

 Observação
A letra grega sigma maiúscula simboliza o somatório, que consiste em 
somar todas as parcelas de uma série desde primeira (1) até a última (n), 
chamada de enésimo termo. É simbolizada por 
1 1�
�
n
ix e significa a soma de 
todos os termos da série x desde 1 até n.
• Frequência relativa: é a relação entre uma frequência simples e a frequência total. Dá-nos a 
ideia de participação de um determinado valor no total. É simbolizada for fri; lida como frequência 
relativa decimal do valor i e é obtida pela fórmula fr
f
fi
i
T
= . Usa-se mais a frequência relativa 
percentual de cálculo praticamente idêntico fr
f
fi
i
T
% � �100 .
• Frequências acumuladas: são somatórios das frequências simples ou relativas acima de 
determinado valor, incluindo esse valor. Podem ser absolutas ou relativas, crescentes ou 
decrescentes. Veremos os cálculos logo a seguir.
2.2.4 Montagem de tabela de frequências
Uma tabela de frequências, muitas vezes chamada de distribuição de frequências, é basicamente 
uma relação dos valores que a variável estatística assume no rol de dados e quantas vezes esse valor se 
repete. É apresentada como uma tabela de duas colunas relacionadas. Uma para os valores e outra para 
as frequências simples. 
Quando trabalhamos com variáveis qualitativas ou com variáveis quantitativas discretas, a 
montagem da tabela de frequências é única e exclusivamente uma contagem de elementos. Já quando 
trabalhamos com variáveis quantitativas contínuas, o trabalho é um pouco maior.
Usando a tabela anterior, montaremos algumas tabelas de frequências:
Tabela de frequências para os gêneros 
Temos apenas dois gêneros. Na coluna da esquerda ficam os gêneros, na direita a frequência 
simples. Ficaria assim:
32
Unidade I
Tabela 4 
Gênero Contagem (*) Frequência simples
xi fi
Feminino ||||| ||||| ||||| ||||| ||||| ||||| ||| 33
Masculino ||||| ||||| ||||| ||||| ||||| ||||| ||||| |||| 39
Frequência total 72
(*) contagem manual
 Observação
Atualmente a contagem é feita utilizando-se as ferramentas disponíveis 
nas planilhas eletrônicas. No Excel®, a contagem é feita utilizando-se a 
sequência Fórmulas/Inserir funções/CONT.SE. 
Tabela de frequências para a qualidade da instituição 
Temos cinco valores possíveis: péssima; ruim; regular; boa; ótima. Na coluna da esquerda fica a 
qualidade, na direita a frequência simples. Ficaria assim:
Tabela 5 
Qualidade Contagem (*) Frequência simples
xi fi
Péssima ||||| ||| 8
Ruim ||||| ||||| ||| 13
Regular ||||| ||||| ||||| || 17
Boa ||||| ||||| ||||| ||||| 20
Ótima ||||| ||||| |||| 14
Frequência total 72
(*) Contagem manual
Tabela de frequências para o número de dependências
Em uma rápida olhada na tabela, notamos que os alunos têm de zero a oito dependências. 
A contagem produziria a seguinte tabela de frequências:
33
ESTATÍSTICA
Tabela 6 
Número de dependências Contagem (*) Frequência simples
xi fi
0 ||||| ||||| ||||| ||||| 20
1 ||||| ||||| ||| 13
2 ||||| ||||| |||| 14
3 ||||| ||||| 10
4 ||||| || 7
5 ||||| | 6
6 | 1
7 0
8 I 1
Frequência total 72
(*) Contagem manual
Perceba que as tabelas que montamos referem-se respectivamente à variável qualitativa nominal; 
qualitativa ordinal e quantitativa discreta. A montagem da tabela de frequências para quantitativas 
contínuas é mais elaborada, conforme veremos em seguida, mas antes vamos pegar a última tabela 
montada e completá-la, ou seja, calcular as frequências relativas e acumuladas.
A frequência relativa é obtida pela fórmula ii
T
f
fr
f
= (decimal) ou ii
T
f
fr% 100
f
= × (percentual). 
Assim, a da frequência relativa do valor zero seria dada por 00 0
T
f 20
fr fr 0,278 ou 27,8%
f 72
= → = = 0,278 ou 27,8%.
Essa informação nos dá uma ideia da importância dos alunos que não têm dependências no total. 
Poderíamos dizer que 27,8 dos alunos não têm dependências. Essa ideia de participação, de importância, 
de peso, é frequentemente usada em informações estatísticas básicas.
A tabela a seguir mostra todas as frequências relativas, decimais e percentuais da distribuição das 
dependências na nossa amostra. 
Tabela 7 
Número de 
dependências Frequência simples
Frequência relativa 
decimal
Frequência relativa 
percentual
xi fi fri fr%i
0 20 0,278 27,8%
1 13 0,181 18,1%
2 14 0,194 19,4%
3 10 0,139 13,9%
4 7 0,097 9,7%
34
Unidade I
Número de 
dependências Frequência simples
Frequência relativa 
decimal
Frequência relativa 
percentual
5 6 0,083 8,3%
6 1 0,014 1,4%
7 0 0,000 0,0%
8 1 0,014 1,4%
Frequência total 72 1 100,0%
A frequência relativa nos dá ideia da participação de um determinado valor no total. Já as frequências 
acumuladas nos indicam a quantidade de elementos acima ou abaixo de determinado valor, por exemplo, 
quantos alunos têm mais do que duas dependências. 
Trabalhamos com quatro tipos de frequências acumuladas:
• Frequência acumulada absoluta acima de ou também chamada de frequência acumulada absoluta 
decrescente (simbolizada por faci↓. É o somatório das frequências simples dos elementos acima 
de um determinado valor, incluindo os elementos desse valor. Por exemplo, a frequência absoluta 
acima de cinco dependências é oito (6+1+0+1). 
• Frequência acumulada absoluta abaixo de ou também chamada de frequência acumulada absoluta 
crescente (simbolizada por faci↓. É o somatório das frequências simples dos elementos abaixo de 
um determinado valor, incluindo os elementos desse valor. Por exemplo, a frequência absoluta 
abaixo de duas dependências é 47 (14+13+20). 
• Frequência acumulada relativa acima de ou também chamada de frequência acumulada relativa 
decrescente (simbolizada por fac%i↓. É o somatório das frequências relativas dos elementos acima 
de um determinado valor, incluindo os elementos desse valor. Por exemplo, a frequência relativa 
acima de quatro dependências é 20,8% (0,097+0,083+0,014+0,000+0,014=0,208 ou 20,8%).
• Frequência acumulada relativa abaixo de ou também chamada de frequência acumulada relativa 
crescente (simbolizada por fac%i↓. É o somatório das frequências relativas dos elementos abaixo 
de um determinado valor, incluindo os elementos desse valor. Por exemplo, a frequência relativa 
abaixo de uma dependência é 45,9% (0,278+0,181=0,459 ou 45,9%).
 Lembrete
Importante notar que, no cálculo das frequências relativas, a frequência 
(simples ou relativa) do valor nominal considerado entra na soma, ou seja, 
a frequênciaacumulada no fundo corresponde à expressão “x ou mais”, em 
que x é o valor trabalhado.
Na tabela a seguir estão calculadas todas as frequências acumuladas da distribuição de dependências 
da nossa amostra.
35
ESTATÍSTICA
Tabela 8 
N
úm
er
o 
de
 d
ep
en
dê
nc
ia
s
Fr
eq
uê
nc
ia
 s
im
pl
es
Fr
eq
uê
nc
ia
 a
cu
m
ul
ad
a 
ab
so
lu
ta
 a
ci
m
a 
de
 o
u 
de
cr
es
ce
nt
e
Fr
eq
uê
nc
ia
 a
cu
m
ul
ad
a 
ab
so
lu
ta
 a
ba
ix
o 
de
 o
u 
cr
es
ce
nt
e
Fr
eq
uê
nc
ia
 re
la
tiv
a 
de
ci
m
al
Fr
eq
uê
nc
ia
 a
cu
m
ul
ad
a 
re
la
tiv
a 
ac
im
a 
de
 o
u 
de
cr
es
ce
nt
e
Fr
eq
uê
nc
ia
 a
cu
m
ul
ad
a 
re
la
tiv
a 
ab
ai
xo
 d
e 
ou
 
cr
es
ce
nt
e
xi fi faci↓ faci↓ fri fac%i↓ fac%i↓
0 20 72 20 0,278 1 ou 100% 0,278 ou 27,8%
1 13 52 33 0,181 0,722 ou 72,2% 0,459 ou 45,9%
2 14 39 47 0,194 0,541 ou 54,1% 0,653 ou 65,3%
3 10 25 57 0,139 0,347 ou 34,7% 0,792 ou 79,2%
4 7 15 64 0,097 0,208 ou 20,8% 0,889 ou 88,9%
5 6 8 70 0,083 0,111 ou 11,1% 0,972 ou 97,2%
6 1 2 71 0,014 0,028 ou 2,8% 0,986 ou 98,6%
7 0 1 71 0,000 0,014 ou 1,4% 0,986 ou 98,6%
8 1 1 72 0,014 0,014 ou 1,4% 1 ou 100%
Frequência 
total 72 1
 Observação
Perceba que a frequência acumulada absoluta crescente do primeiro valor 
é sempre igual à frequência total e a frequência acumulada crescente do 
último valor é sempre a frequência simples desse valor. O inverso ocorre para 
frequências acumuladas absolutas decrescentes. O mesmo raciocínio vale 
para as frequências acumuladas relativas em relação às frequências relativas.
A tabela contendo os valores e as frequências simples, relativas e acumuladas é frequentemente 
chamada de tabela de frequências completa e nos traz uma série de informações importantes e muito 
usadas, em especial quando trabalhamos com variáveis qualitativas. Estudos com variáveis qualitativas 
normalmente se encerram nessa tabela ou então na representação dela graficamente. Já o uso de 
variáveis quantitativas permite cálculos mais profundos e robustos.
Exemplo de aplicação
Considerando o que aprendemos até aqui e utilizando as duas tabelas sobre o número de dependências 
da nossa amostra, responda às seguintes questões:
36
Unidade I
fs =
fr2 =
fr%4 =
fac3↓ =
Pfac1↓ =
fac%6↓ =
fac%8↓ =
Qual a porcentagem de alunos que têm mais de cinco dependências?
Quantos alunos têm acima de quatro dependências?
Quantos alunos têm abaixo três dependências?
Qual a porcentagem de alunos que têm acima de duas dependências?
Qual a porcentagem de alunos que têm abaixo de três dependências?
Resolução
A resolução deste exemplo é feita por leitura direta das tabelas. A seguir as tabelas com linhas e 
colunas assinaladas para permitir entendimento dos resultados.
Tabela 9 
Tabela 1
Coluna A Coluna B Coluna C Coluna D
Número de 
dependências Frequência simples
Frequência relativa 
decimal
Frequência relativa 
percentual
xi fi fri fr%i
Linha 1 0 20 0,278 27,8%
Linha 2 1 13 0,181 18,1%
Linha 3 2 14 0,194 19,4%
Linha 4 3 10 0,139 13,9%
Linha 5 4 7 0,097 9,7%
Linha 6 5 6 0,083 8,3%
Linha 7 6 1 0,014 1,4%
Linha 8 7 0 0,000 0,0%
Linha 9 8 1 0,014 1,4%
Linha 10 Frequência total 72 1 100,0%
37
ESTATÍSTICA
Tabela 10 
Colunas A B C D E F G
Tabela 2
N
úm
er
o 
de
 d
ep
en
dê
nc
ia
s
Fr
eq
uê
nc
ia
 s
im
pl
es
Fr
eq
uê
nc
ia
 a
cu
m
ul
ad
a 
ab
so
lu
ta
 a
ci
m
a 
de
 o
u 
de
cr
es
ce
nt
e
Fr
eq
uê
nc
ia
 a
cu
m
ul
ad
a 
ab
so
lu
ta
 a
ba
ix
o 
de
 o
u 
cr
es
ce
nt
e
Fr
eq
uê
nc
ia
 re
la
tiv
a 
de
ci
m
al
Fr
eq
uê
nc
ia
 a
cu
m
ul
ad
a 
re
la
tiv
a 
ac
im
a 
de
 o
u 
de
cr
es
ce
nt
e
Fr
eq
uê
nc
ia
 a
cu
m
ul
ad
a 
re
la
tiv
a 
ab
ai
xo
 d
e 
ou
 
cr
es
ce
nt
e
Linhas xi fi faci ↓ faci ↓ fri fac%i ↓ fac%i ↓
1 0 20 72 20 0,278 1 ou 100% 0,278 ou 27,8%
2 1 13 52 33 0,181 0,722 ou 72,2% 0,459 ou 45,9%
3 2 14 39 47 0,194 0,541 ou 54,1% 0,653 ou 65,3%
4 3 10 25 57 0,139 0,347 ou 34,7% 0,792 ou 79,2%
5 4 7 15 64 0,097 0,208 ou 20,8% 0,889 ou 88,9%
6 5 6 8 70 0,083 0,111 ou 11,1% 0,972 ou 97,2%
7 6 1 2 71 0,014 0,028 ou 2,8% 0,986 ou 98,6%
8 7 0 1 71 0,000 0,014 ou 1,4% 0,986 ou 98,6%
9 8 1 1 72 0,014 0,014 ou 1,4% 1 ou 100%
10 Frequência total 72 1
f5 = 6 (Tabela 1; Coluna B; Linha 6)
fr2 = 0,194 (Tabela 1; Coluna C; Linha 3)
fr%4 = 9,7% (Tabela 1; Coluna D; Linha 5)
fac3↓ = 25 (Tabela 2; Coluna C; Linha 4)
Pfac1↓ = 33 (Tabela 2; Coluna D; Linha 2)
fac%6↓ = 2,8% (Tabela 2; Coluna F; Linha 7)
fac%8↓ = 100% (Tabela 2; Coluna G; Linha 9)
Qual a porcentagem de alunos que têm cinco dependências?
8,3% (Tabela 1; Coluna D; Linha 6)
Quantos alunos têm acima de quatro dependências?
38
Unidade I
15 (Tabela 2; Coluna C; Linha 5)
Quantos alunos têm abaixo de três dependências?
57 (Tabela 2; Coluna D; Linha 4)
Qual a porcentagem de alunos que têm acima de duas dependências?
54,1% (Tabela 2; Coluna F; Linha 3)
Qual a porcentagem de alunos que têm abaixo de três dependências?
79,2% (Tabela 2; Coluna G; Linha 4)
Como já dito, a montagem da tabela de frequências para variáveis qualitativas e variáveis quantitativas 
discretas é feita basicamente com uma contagem seguida de alguns cálculos aritméticos básicos. O uso 
dela organiza, resume e apresenta a amostra de maneira bastante adequada. Observe que setenta e 
duas informações sobre o número de dependências na amostra podem ser resumidas numa tabela com 
apenas nove conjuntos de informações.
Assim, se eu perguntar qual a quantidade mais frequente de dependências, você teria dificuldade 
de responder olhando a tabela de dados brutos, mas, se você olhar a tabela de frequências, a resposta é 
imediata: zero dependências.
Perceba que o uso da tabela de frequências facilita nossas conclusões mesmo que tenhamos 
elevado número de elementos na amostra. Caso estivéssemos estudando uma amostra semelhante, 
mas com 5.000 alunos no lugar dos 72, provavelmente teríamos uma tabela de frequências com 
quantidade de informações muito próximas da que acabamos de montar. Portanto, essa ferramenta 
será muito útil para nós.
Já quando a variável é quantitativa contínua, a produção da tabela de frequências não é tão simples, 
isso porque os valores variam continuamente e corremos o risco de ter uma tabela em que todas as 
frequências simples serão iguais a 1 ou muito próximo disso. Observe a coluna renda familiar da tabela 
3 e perceba que poucos valores se repetem e em poucas vezes.
A solução para isso é agrupar os dados em classes ou categorias. Em vez de considerarmos os valores 
isoladamente, iremos agrupá-los em classes. Uma renda familiar de R$ 5.500,00 ou de R$ 6.000,00 é 
praticamente a mesma coisa do ponto de vista estatístico, podemos então agrupar essas famílias numa 
única faixa, por exemplo, famílias com renda entre R$ 5.000,00 e R$ 6.000,00.
Apesar de mais longo, o processo para montagem da tabela de frequências para dados agrupados é 
relativamente fácil e iremos explicá-lo usando os dados de renda familiar da nossa amostra. O primeiro 
passo é determinar em quantas categorias iremos distribuir nossos elementos. Não há uma determinação 
39
ESTATÍSTICA
matemática para isso. Claro está que, ao agrupar dados, perdemos um pouco da precisão, mas essa 
perda é compensada pela facilitação dos cálculos.
Trabalhando com muitas categorias ou classes, teremos uma maior precisão, mas com maior trabalho 
e consequentemente maior custo envolvido. Uma quantidade menor de categorias reduz o custo, mas 
também a precisão.
Estudiosos trabalharam esse problema e chegaram a diversas recomendações sobre o número de categorias 
ou classes a ser usado. Nós usaremos neste texto a recomendação de Sturges, dada pela fórmula:
n = 1 + 1,44InN
Onde n é o número de classes recomendadas. N é o número total de elementos da amostra, ou seja, 
a frequência total. E, claro, ln é o símbolo de logarítmico neperiano ou natural.
 Lembrete
Uma recomendação matemática como a relação de Sturges é 
algo surgido de um estudo

Continue navegando