Buscar

Estatística descritiva (1)

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 148 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 148 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 148 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Fabíola Eugênio Arrabaça Moraes
Estatística descritiva
© 2017 by Universidade de Uberaba
Todos os direitos reservados. Nenhuma parte desta publicação poderá ser 
reproduzida ou transmitida de qualquer modo ou por qualquer outro meio, 
eletrônico ou mecânico, incluindo fotocópia, gravação ou qualquer outro tipo de 
sistema de armazenamento e transmissão de informação, sem prévia autorização, 
por escrito, da Universidade de Uberaba.
Universidade de Uberaba
Reitor 
Marcelo Palmério
Pró-Reitor de Educação a Distância
Fernando César Marra e Silva
Editoração
Produção de Materiais Didáticos
Capa
Toninho Cartoon
Edição
Universidade de Uberaba
Av. Nenê Sabino, 1801 – Bairro Universitário
Catalogação elaborada pelo Setor de Referência da Biblioteca Central UNIUBE
 Moraes, Fabíola Eugênio Arrabaça. 
M791e Estatística descritiva / Fabíola Eugênio Arrabaça Moraes. – 
Uberaba: Universidade de Uberaba, 2017.
 148 p.: il. 
 Programa de Educação a Distância – Universidade de Uberaba. 
 
 ISBN 978-85-7777-591-0
 
 1. Estatística. 2. Pesquisa. I. Universidade de Uberaba. 
Programa de Educação a Distância. II. Título. 
 
 CDD 519.5
Fabíola Eugênio Arrabaça Moraes 
Mestre em Estatística pela Universidade Federal de São Carlos (UFSCar). 
Graduada em Matemática pela Faculdade de Educação São Luís de 
Jabotica bal (FESL). É docente nos cursos de graduação, na modalidade 
presencial e à distância, da Universidade de Uberaba (Uniube), nas áreas 
afins de Matemática, Estatística e Bioestatística.
Sobre os autores
Sumário
Apresentação ..........................................................................................
Capítulo 1 Estatística Descritiva: a importância da estatística no dia a dia ... 1
1.1 A importância da Estatística no dia a dia ..................................................................4
1.2 Estatística descritiva – parte I ..................................................................................7
1.2.1 O que é população e o que é amostra? ........................................................8
1.2.2 Situações problema envolvendo a questão da representatividade .................11
1.2.3 Apresentação dos dados .............................................................................14
1.2.4 Representação tabular .................................................................................15
1.2.5 Distribuição de frequência ............................................................................17
1.2.6 Dados brutos ................................................................................................17
1.2.7 Rol ................................................................................................................18
1.2.8 Distribuição de frequência para variável discreta (tabela de frequência) ...18
1.2.9 Distribuição de frequência para variável contínua (intervalo de classe) .....19
1.3 Representação gráfica ............................................................................................24
1.4 Estatística descritiva – parte II ................................................................................28
1.4.1 Medidas de tendência central ......................................................................28
1.5 Medidas de variabilidade ........................................................................................48
1.5.1 Amplitude total ou intervalo total ..................................................................48
1.5.2 Desvio padrão ..............................................................................................49
1.5.3 Variância .......................................................................................................50
1.5.4 Coeficiente de variação ................................................................................50
Capítulo 2 Conhecendo o cálculo da probabilidade ............................ 61
2.1 Definições e notações básicas ...............................................................................64
2.2 Probabilidade ..........................................................................................................67
2.2.1 Definição clássica ........................................................................................68
2.2.2 Definição frequentista ...................................................................................69
2.2.3 Definição subjetiva .......................................................................................71
2.3 Axiomas da probabilidade .......................................................................................72
2.3.1 Alguns dos principais teoremas de probabilidade .......................................73
2.3.2 Probabilidade condicional ............................................................................74
2.3.3 Teorema do produto .....................................................................................76
2.3.4 Independência estatística ............................................................................77
2.3.5 Teorema da probabilidade total ....................................................................79
2.3.6 Teorema de Bayes .......................................................................................80
Capítulo 3 Distribuições de probabilidade ................................................. 85
3.1 Distribuições de probabilidade ................................................................................87
3.2 Variável aleatória .....................................................................................................90
3.2.1 Variável aleatória discreta ............................................................................91
3.2.2 Variável aleatória contínua ...........................................................................92
3.2.3 Algumas características numéricas importantes em uma distribuição de 
 probabilidade ................................................................................................93
3.3 Distribuições discretas de probabilidade ................................................................94
3.3.1 Distribuição binomial ....................................................................................95
3.3.2 Distribuição de Poisson ................................................................................97
3.4.1 Distribuição normal ....................................................................................100
3.4 Distribuições contínuas de probabilidade .............................................................100
Capítulo 4 Amostragem ..................................................................... 123
4.1 Noções sobre amostragem ..................................................................................126
4.2 Noções de planejamento amostral .......................................................................126
4.3 Formulação de hipóteses .....................................................................................128
4.4 Coleta de dados ....................................................................................................128
4.5.1 Amostra casual simples .............................................................................130
4.5 Principais métodos amostrais ...............................................................................130
4.5.2 Amostra aleatória sistemática ....................................................................134
4.5.3 Amostra aleatória estratificada ...................................................................135
4.5.4 Amostra por conglomerados.............................................................................136
Quando ouvimos falar em Estatística, sempre vem ao nosso pensamento 
números divulgados no dia a dia. A média de gols marcados por partida 
do campeonato brasileiro de futebol noticiada por um comentarista de 
um programa esportivo; a porcentagem das intenções de voto que um 
candidato à Presidência da República reúne, divulgada no noticiário 
da televisão; a quantidade de automóveis vendidos nos últimos doze 
meses, publicada no jornal; o número de pessoas infectadas por gripe 
nas regiões metropolitanas do país. Eis alguns exemplos de números 
contidos nas informações que diariamente chegam até nós. 
O que a Estatística significa para você? A Estatística apenas se resume 
a números? A Estatística é muito mais do que isso. Segundo o Instituto 
Brasileiro de Geografia e Estatística – IBGE, Estatística é o “conjunto 
de técnicas e métodos de pesquisa que entre outros tópicos envolve o 
planejamento do experimento a ser realizado, a coleta qualificada dos 
dados, a inferência, o processamento, a análise e a disseminação das 
informações”. 
Este volume compreende o ramo da Estatística conhecido por Estatística 
descritiva. A Estatística descritiva aborda a coleta, a classificação, o 
resumo, a organização, a análise e a interpretação de dados. Tudo isso 
com a finalidade de gerar informações. 
No decorrer dos estudos deste livro, você aprenderá a organizar dados, a 
descrevê-los, a calcular suas medidas representativas e a interpretá-los.
 
A área de aplicação da Estatística é, portanto, imensa. Abrange os mais 
variados campos do saber, como as ciências biológicas e da saúde, as 
ciências humanas, as ciências sociais aplicadas e as ciências exatas. 
Os profissionais que sabem utilizá-la reconhecem sua importância na 
formulação do raciocínio crítico no estudo, no trabalho e na vida diária. 
Por isso, desejamos a você bons estudos.
Apresentação
Introdução
Estatística Descritiva: 
a importância da 
estatística no dia a dia
Capítulo
1
Neste capítulo, iniciaremos nosso percurso de Estatística. Em 
particular, no primeiro momento, vamos refl etir sobre a aplicação 
de estatística no seu dia a dia, visando a compreensão dos 
conceitos de forma clara e concisa.
Faremos uma introdução à Estatística Descritiva, que, em 
geral, se ocupa do levantamento, organização, classifi cação e 
descrição de dados em estudo. Você verifi cará que a descrição 
dos dados facilitará a compreensão dos fatos envolvidos no 
estudo. A descrição se apresenta por meio de tabelas, gráfi cos ou 
outros recursos visuais, além abranger o cálculo de parâmetros 
representativos desses dados.
É sabido que parâmetro (MORETTIN, 2009 p. 183) é a medida 
usada para descrever uma característica numérica populacional. 
Genericamente representaremos um parâmetro por θ (lê-se 
theta). Especifi camente, representaremos a média por µ (lê-se 
mi), a variância por σ2 (lê-se sigma ao quadrado) e o coefi ciente 
de correlação por ρ (lê-se rô), os quais são alguns exemplos de 
parâmetros populacionais.
Estudaremos os procedimentos estatísticos descritivos, os quais 
permitem elucidar dúvidas, obter conclusões ou mesmo possibilitar 
a tomada de decisões a respeito de características de interesse. 
Por exemplo, imagine que no local em que você reside foi realizado 
um estudo ambiental, e este estudo revelou a presença de um
2 UNIUBE
perigoso poluente no ar. Esta revelação, com certeza geraria 
muitas dúvidas, quanto aos malefícios para a população! Você, 
certamente, irá buscar mais explicações respeito. Dependendo 
das conclusões do estudo, você, ou mesmo as autoridades 
responsáveis pelo local, terão de tomar decisões a respeito dos 
malefícios deste perigoso poluente para a sua família ou para a 
população. Certo?
Com base nos dados obtidos a respeito da concentração de 
poluentes, talvez você tenha que decidir pela saída imediata de 
sua família deste local por certo tempo. Por isso mencionamos, 
que os procedimentos descritivos também possibilitam a tomada 
de decisões sobre as características de interesse. 
Este exemplo e outros que estudaremos mostrarão o quanto a 
Estatística está presente no seu cotidiano. Os exemplos estão 
em todos os contextos e mostram a importância que a Estatística 
assume cada vez mais em todas as áreas do conhecimento. De 
modo geral, este capítulo permitirá a você se familiarizar com os 
conceitos abordados por meio de exemplos, situações problema 
e exercícios que enfocam a aplicação da estatística nas diversas 
áreas do conhecimento.
Ao final deste capítulo, esperamos que você seja capaz de: 
• determinar situações práticas nas quais a Estatística poderá 
ser aplicada com propriedade, combinando as possíveis 
interpretações e análises do fenômeno estatístico; 
• expressar dados mediante representação tabular e representação 
gráfica; 
• estabelecer intervalos de diferentes tipos e medidas; 
• calcular as principais medidas de posição e de variabilidade, 
tanto para dados agrupados como para dados não agrupados; 
• usar o método de resolução das várias situações problema mediante 
a descrição, demonstração, aplicação, análise, desenvolvimento e 
julgamento.
Objetivos
 UNIUBE 3
Para melhor entender a Estatística no âmbito dos principais tópicos 
que serão abordados neste capítulo, acompanhe o esquema na 
Figura 1.
Esquema
Qual é a importância da Estatística no seu dia a dia?
Discuta com seus colegas, busque ouvir outras opiniões! Acreditamos 
que isso será muito importante para você!
TROCANDO IDEIAS!
Aplicação da 
Estatística População Alvo
Amostra 
Representativa
Resultados 
Inferidos 
Análise Exploratória 
dos Dados
Resultados 
Descritivos
R
es
um
o
R
ef
er
ên
ci
as
Figura 1: Esquema do capítulo.
4 UNIUBE
A importância da Estatística no dia a dia1.1
A utilização da Estatística é cada vez mais acentuada em qualquer 
atividade profissional na vida moderna. Nos seus mais diversificados 
ramos de atuação, as pessoas estão frequentemente expostas à 
Estatística, utilizando a com maior ou menor intensidade. Isso se deve 
às múltiplas aplicações que o método estatístico proporciona àqueles que 
dele necessitam. Desde as ciências sociais de Psicologia e Sociologia até 
áreas como educação, ciências humanas e físicas, ciências da saúde, 
Administração, ciências contábeis, Economia, Engenharia, negócios, 
Jornalismo, comunicações e artes de forma geral. 
A seguir, você vai conferir alguns exemplos práticos, indicando a 
importância da Estatística no seu dia a dia e como ela tem assumido um 
papel bem mais abrangente nas últimas décadas.
Exemplo 1.1 Os institutos de pesquisa de opinião regularmente fazem 
pesquisas para determinar o índice de popularidade de um governo em 
exercício. Suponha que a pesquisa será conduzida na próxima semana com 
2.500 indivíduos e eles serão questionados se o governo está fazendo uma 
boa ou má administração.
Exemplo 1.2 Imagine que um nutricionista trabalha em uma escola e deseja 
conhecer os hábitos alimentares das crianças em idade pré-escolar.
Exemplo 1.3 Suponha que você e seu sócio desejam decidir um negócio e 
se deparam com uma análise de incerteza, ou seja, quais as chances de as 
vendas de certo produto decrescerem se aumentarem os preços?
Exemplo 1.4 O engenheiro civil responsável pela concretagem de um 
complexo industrial, suspeita que o concreto esteja fora das especificações 
quanto à resistência, em determinado momento da usinagem. Este problema 
o levará a indícios de falha no sistema de produção. Isso dará ao engenheiro 
oportunidade para formular algumas hipóteses. Por exemplo, quanto aos 
componentes usados na mistura, as máquinas utilizadas, ou, ainda, uma 
possível falha humana, entre outras.
Observe que, neste Exemplo 1.4, a hipótese exemplificada e a necessidade 
do engenheiro de pesquisar o problema surgiram a partir de um fato 
encontrado em dados observados.
EXEMPLIFICANDO!
 UNIUBE 5
O que é Estatística para você?Registre as suas ideias e continue os seus 
estudos, pois, a seguir, preparamos várias informações e fatos curiosos do 
seu dia a dia que estão intimamente relacionados à Estatística. Será que 
você já não se deparou com alguns destes fatos?
PARADA PARA REFLEXÃO
A Estatística é uma área do conhecimento que utiliza teorias 
probabilísticas para explicação de eventos, estudos e experimentos. 
Tem por objetivo obter, organizar e analisar dados, determinando as 
correlações que apresentem, tirando delas suas consequências para 
descrição e explicação do que passou, apresentando uma previsão e 
organização do futuro. 
A Estatística também é considerada uma ciência e prática de 
desenvolvimento de conhecimento humano através do uso de dados 
empíricos. Baseia se na teoria estatística um ramo da Matemática 
aplicada. Na teoria estatística, a aleatoriedade e incerteza são 
modeladas pela teoria da probabilidade. Algumas práticas estatísticas 
incluem, por exemplo, o planejamento, a sumarização e a interpretação 
de observações. Porque o objetivo da Estatística é a produção da 
“melhor” informação possível a partir dos dados disponíveis; alguns 
autores sugerem que a Estatística é um ramo da teoria da decisão.
Fique atento! Após as considerações já mencionadas você percebeu 
que, frequentemente, nos deparamos com terminologias e expressões 
específicas da ciência em estudo. Portanto, torna-se impreterível aguçar 
o seu interesse e compromisso em conhecer vocábulos ou expressões até 
então desconhecidos, porém necessários aos seus estudos.
IMPORTANTE!
Sugerimos acessar o link a seguir para a profundar o seu conhecimento: 
<http://www.ibge.gov.br/home/>
PESQUISANDO NA WEB
6 UNIUBE
Com as situações propostas a você até aqui, juntamente com as suas 
experiências de vida, seu dia a dia com sua família, na ida para o seu 
trabalho, a fila do caixa no supermercado, em seu momento de lazer, 
acreditamos que você está refletindo em relação aos conhecimentos em 
Estatística. Por exemplo, você poderá, em algum momento, se deparar 
ou até concordar com a seguinte ideia:
 
Podemos, então, comparar a Estatística a um grande baú!
 
Com muita calma, é possível aprender e conquistar tudo o que ela pode 
nos proporcionar, já que nos seus mais diversificados ramos de atuação, 
nós estamos frequentemente expostos a ela, utilizando a com maior ou 
menor intensidade! 
Conheça, a seguir, um pouco da história da origem do termo Estatística. 
O termo Estatística surgiu da expressão em latim statisticum collegium, 
palestra sobre os assuntos do estado, de onde surgiu a palavra em língua 
italiana Statista, que significa “homem de Estado”, ou político, e a palavra 
alemã Statistik, designando a análise de dados sobre o Estado. A palavra 
foi proposta pela primeira vez no século XVII, em latim, por Schmeitzel, 
na Universidade de Lena, e adotada pelo acadêmico alemão Gottfried 
Achenwall. Apareceu como vocabulário na enciclopédia Britânica, em 
1797, e adquiriu um significado de coleta e classificação de dados no 
início do século XIX.
Para saber um pouco mais sobre a história da Estatística e seus principais 
componentes acesse o link: <http://www.mat.ufrgs.br/~vigo/historia.html>.
SAIBA MAIS
Em 1085, Guilherme, O Conquistador, ordenou que se fizesse um 
levantamento estatístico da Inglaterra. Esse levantamento deveria incluir 
informações sobre terras, proprietários, uso da terra, empregados e animais, 
e serviria, também, de base para o cálculo de impostos. Tal levantamento 
originou um volume intitulado Domesday Book. Com este fato talvez seja 
mais fácil entender que o significado de Doomsday é Dia do juizo final!
CURIOSIDADE
 UNIUBE 7
Outro fato curioso são as Tábuas de mortalidade. Você sabia que as 
Tábuas de mortalidade usadas na atualidade pelas companhias de seguro 
originaram-se de estudos realizados no século XVIII?
Sim, e isso por causa dos estudos de John Graunt (1620-1674) e William 
Petty (1623-1687), aritméticos políticos mais destacados na época pela 
busca de leis quantitativas que pudessem explicar o estudo numérico dos 
fenômenos sociais e políticos. “Dessa forma, a escola dos aritméticos 
políticos pode ser considerada o berço da Demografia”.
Fonte: Disponível em: <http://www.mat.ufrgs.br/~vigo/historia.html > Acesso em jun. 2016.
Acompanhe, a seguir, algumas noções gerais de Estatística descritiva.
Estatística descritiva – parte I 1.2
De início, propomos a você uma reflexão: o que um analista que dispuser 
de dados de uma pesquisa deve fazer para extrair as informações de 
que precisa? 
Neste momento, acreditamos que você esteja construindo conhecimentos 
a partir de várias curiosidades e indagações, o que será ótimo para sua 
formação pessoal e profissional. Supõe se que você poderá em algum 
momento se deparar ou até concordar com a seguinte ideia: 
Os dados de uma pesquisa devem ser reduzidos até o ponto em que se 
possa interpretá los mais claramente! De onde vem o termo Estatística 
descritiva? O que ela descreve?
Pois bem, até aqui, acreditamos que você está conduzindo muito bem o 
seu estudo! Está refletindo sobre as terminologias apresentadas. Ou seja, 
nesse contexto, você começa a desenvolver a linguagem e o raciocínio 
estatísticos. Em outras palavras, você está sendo professor de você 
mesmo. 
Em definição, a Estatística descritiva é o ramo da Estatística que 
se preocupa em descrever os dados observados da amostra sem se 
preocupar em fazer previsões sobre os parâmetros do universo. A 
Estatística descritiva trata da coleta, da organização e da descrição dos 
dados. Então, vamos entender o que é população e o que é amostra.
8 UNIUBE
1.2.1 O que é população e o que é amostra? 
As pessoas de uma comunidade podem ser estudadas sob diversos 
pontos de vista. Por exemplo, podem ser classificadas quanto ao sexo 
(masculino ou feminino), quanto à estatura (baixa, média ou alta), quanto 
à renda (pobres ou ricas), entre outras. 
Portanto, sexo, estatura e renda são variáveis, isto é, são propriedades 
às quais podemos associar conceitos ou números e, assim expressar, 
de certa forma, informações sob forma de medidas.
E, para você, nome e sexo são formas de medida?
Reflita sobre essa questão! Em seguida, vamos para mais um desafio. 
Exercite suas habilidades sobre o conceito de medida desenvolvendo a 
atividade proposta a seguir.
PARADA PARA REFLEXÃO
Atividade 1.1
Para a realização dessa atividade escolha uma relação das pessoas que 
convivem com você, por exemplo, em sua residência, na residência do 
seu vizinho, ou em seu ambiente de trabalho. Agora, associe o nome das 
pessoas que você escolheu ao sexo, de forma que isso se transforme em 
medida.
AGORA É A SUA VEZ
Antes de propormos a atividade anterior, fazíamos referências às 
variáveis, isto é, às propriedades para as quais podemos associar 
conceitos ou números e, assim expressar, de certa forma, informações 
sob forma de medidas. Logo, qualquer conjunto de informações que 
tenham, entre si, uma característica em comum denotamos por 
população (representaremos população por N maiúsculo).
Portanto, uma população é um conjunto de unidades (geralmente 
pessoas, objetos, transações ou eventos) que nos interessa estudar 
(MCCLAVE et al., 2009).
 UNIUBE 9
São exemplos de população: 
• todas as lâmpadas produzidas por uma indústria no primeiro trimestre 
de determinado ano; 
• todos os pacientes atendidos no PS do HUMP no primeiro ano de 
sua inauguração (Pronto Socorro do Hospital Universitário Mário 
Palmério, destinado ao atendimento da população de Uberaba e 
região); 
• todos os animais, de uma determinada espécie, prontos para abate; 
• o número de unidades produzidas por um empregado de certa linha 
de produção, durante os trinta dias que antecederam à pesquisa. 
Os motivos de se estudar uma população são vários. Por exemplo, um 
engenheiro agrônomo pode estar interessado em determinar o peso 
médio de certa variedade de cana de açúcar cultivada em um determinado 
estado do Brasil;ou um engenheiro de materiais pode desejar estudar 
os tipos de polímeros adequados para a confecção de canos plásticos 
(PVC), cujo intuito é aumentar a durabilidade com menor custo; ou um 
ecologista pode ter o interesse de conhecer características de uma 
população constituída por todas as áreas de reservas extrativistas.
O estudo de uma população muito grande, por exemplo, o conjunto de 
todas as estaturas de uma comunidade, será um trabalho difícil de executar. 
Nesse caso, o pesquisador terá um grande trabalho para estudá-la além de, 
em alguns casos, ocorrerem falhas nos resultados.
PARADA PARA REFLEXÃO
A partir dessa ideia vamos aprender outro conceito. 
Nos casos de populações muito grandes, o pesquisador recorre, 
basicamente, a uma redução da população a dimensões menores, 
sem perda das características essenciais, ou seja, extrai uma amostra 
(representaremos amostra por n minúsculo) desta população.
Por exemplo, imaginemos uma pesquisa com 400 jogadores (no caso, 
representando a população N em estudo) participantes do Campeonato 
Brasileiro 2009, famoso Brasileirão. Esse estudo deseja verificar 
qual é a estatura média destes jogadores. Para simplificar o trabalho 
10 UNIUBE
colhemos uma amostra (n) de 40 jogadores, por exemplo, e estudamos 
o comportamento da variável estatura somente destes 40 jogadores. 
Assim, como escolhemos a variável estatura, poderíamos escolher 
outras variáveis como, por exemplo, renda familiar, número de irmãos, 
inteligência, tipo sanguíneo, grau de escolaridade, preferência musical, 
entre outras.
Uma amostra para ser boa, necessariamente, tem que ser 
representativa da população em estudo, ou seja, deve conter, 
em proporção, tudo o que a população possui qualitativa e 
quantitativamente. Todos os elementos da população devem ter 
igual oportunidade de fazer parte da amostra. No exemplo dado, 
não poderíamos escolher quem quiséssemos para a amostra. 
Portanto, para garantir a representatividade e a imparcialidade 
de urna amostra, é necessário seguir algumas regras. Veja estas 
regras a seguir.
Regras a serem seguidas objetivando uma boa amostra: 
I. Para assegurar a representatividade de uma amostra, devemos analisar 
a população para ver se seus elementos distribuem se homogeneamente 
ou se formam grupos com características peculiares. Caso observarmos 
isso, devemos respeitar as proporções com que esses grupos integram 
a população. 
II. A imparcialidade em uma amostra é obtida por sorteio dos elementos 
que farão parte desta amostra, mediante a utilização de uma máquina 
geradora de números aleatórios ou de uma tabela de números 
aleatórios. 
No decorrer dos seus estudos em Estatística, você aprenderá 
mais sobre a utilização de uma tabela de números aleatórios. 
Essas tabelas são construídas de modo a garantir que cada 
dígito, cada par de dígitos consecutivos, cada tema de dígitos 
consecutivos, e assim por diante, apareçam com a mesma 
frequência em uma longa sequência de números.
 UNIUBE 11
1.2.2 Situações problema envolvendo a questão da representatividade 
Voltemos ao exemplo da mensuração da estatura média de 40 jogadores 
participantes do Campeonato Brasileiro 2009. Sabe se que a amostra 
n só traz informações sobre a população da qual foi retirada, ou seja, 
da população de 400 jogadores participantes do referido campeonato. 
Para verificar o seu aprendizado sobre o significado prático da 
representatividade, reflita sobre a questão a seguir. Lembre-se: não é 
aconselhável seguir seus estudos com dúvidas a respeito de quaisquer 
dos conceitos abordados!
Faz sentido para você estudar a estatura dos jogadores participantes do 
Campeonato Brasileiro de determinado ano e considerar que as informações 
deste estudo se aplicam para descrever a estatura de jogadores participantes 
do campeonato italiano de futebol? 
A resposta é não. Não faz sentido, pois as amostras em estudo integram 
populações diferentes.
PARADA PARA REFLEXÃO
Após a reflexão estabelecida, observe que temos uma amostra 
representativa da população inicial. As pessoas (na situação problema, 
os jogadores) passam, a partir desse momento, a ser tratadas como 
dados (estaturas) e podem dar origem ao estudo de diversas relações 
estatísticas, como, por exemplo, a média aritmética, a mediana, a 
moda, a variância, o desvio padrão, entre outras que, mais adiante, 
farão parte de seus estudos. 
Essas relações estatísticas possibilitam descrever, sob diversos ângulos, 
o conjunto de dados representados pela amostra. Por essa razão, 
constituem o campo da Estatística descritiva. 
Lembre-se: o interesse do pesquisador está voltado para a população 
da qual se originou a amostra. Ele estuda as características da amostra 
pelo uso das relações estatísticas com o objetivo de atribuir estas 
características à população, generalizando suas conclusões.
12 UNIUBE
A parte da Estatística em que o interesse está nas generalizações por 
meio das transferências de conclusões das amostras para as populações 
chama-se Estatística inferencial. Nessas transferências de conclusões, 
o pesquisador se vale de um poderoso recurso que é a teoria das 
probabilidades, que lhe permite avaliar e controlar o quão ele pode “errar” 
nessas generalizações, ou seja, nas inferências.
IMPORTANTE!
Você certamente está se perguntando: como o pesquisador pode cometer 
“erros” nessas inferências? Será que não tem como o pesquisador 
“controlar” esses erros? 
Antes de respondermos a essas questões, você se lembra da 
comparação que fizemos entre a Estatística e um grande baú? E que 
com muita calma é possível aprender e conquistar tudo o que ela pode 
nos proporcionar? Muito bem! Então saiba que o pesquisador tem como 
aplicar recursos para manter o erro sob controle. Em seus estudos 
subsequentes, você irá aprender como o pesquisador controla esses 
erros. Vale a pena conferir. É muito interessante!
Atividade 1.2
Sobre o conteúdo até agora estudado, classifique em verdadeiro ou falso 
as seguintes afirmações. Apresente um argumento para a sua escolha. Se 
for verdadeiro, incremente mais informações ou exemplos. Se for falso, 
reescreva a questão corretamente.
a) Estatística é um conjunto de técnicas destinadas a organizar um conjunto 
de valores numéricos.
b) Uma população pode ser constituída de todo solo pertencente a uma área 
bem definida.
c) A Estatística descritiva fornece uma maneira adequada de tratar um 
conjunto de valores, numéricos ou não, com a finalidade de conhecermos 
o fenômeno de interesse.
AGORA É A SUA VEZ
 UNIUBE 13
d) No fenômeno coletivo da eleição para governador no Estado de Minas 
Gerais, a amostra é o conjunto de todos os eleitores habilitados nesse 
Estado.
e) Qualquer amostra representa, de forma adequada, uma população.
A seguir, vamos ressaltar a diferença entre dados e variáveis, e estudar 
como a descrição dos dados facilitará a compreensão dos fatos envolvidos 
no estudo, assim como apresenta-los por meio de tabelas ou gráficos.
Qual é a diferença entre dados e variáveis? 
Antes de prosseguir com seus estudos, reflita sobre esta questão. 
Acompanhe a ideia principal dessa diferença por meio do exemplo a seguir.
Exemplo 1.5 O gerente de certa empresa de transporte coletivo deseja 
saber a opinião dos usuários sobre a qualidade dos serviços de transportes 
diários que presta à comunidade. De acordo com a situação proposta, 
identifique qual é a variável em estudo e quais são os dados neste caso. 
Resolução: denomina-se variável uma característica de interesse da 
população em estudo. Portanto, no exemplo proposto, a variável de interesse 
é a opinião dos usuários de transporte coletivo. E como sabemos, os dados 
representam os valores da variável em estudo. Nesse caso, suponhamos 
que o gerente, ao realizar a pesquisa, peça aos usuários que deem uma nota 
de zero a três a cada serviço utilizado. Os dados coletados poderão ser, por 
exemplo, precisão no horário de ônibus (nota 2), composição das linhas e 
itinerários (nota 1), quadrofuncional (motorista, cobrador, atendimento ao 
usuário etc.) (nota 2), entre outros.
EXEMPLIFICANDO!
Agora que você já sabe a diferença entre dados e variáveis, saiba como 
os dados devem ser apresentados. 
14 UNIUBE
1.2.3 Apresentação dos dados 
Para melhor entendermos a apresentação dos dados, primeiro 
preparamos um esquema simples, conforme apresentado na Figura 2. 
Em seguida, confira, em detalhes, os conceitos necessários e exemplos.
De acordo com a Figura 2, temos: 
• Em I, os dados são classificados em dois tipos: 
– Dados quantitativos ou numéricos – denotam as variáveis que 
assumem valores numéricos. 
– Dados qualitativos ou categóricos – denotam as variáveis que 
assumem apenas valores categoriais. 
• Em II, as variáveis podem ser classificadas, segundo sua natureza, em 
discreta ou contínua. 
– Variável discreta – (o domínio assume valores no conjunto dos números 
naturais N ) – pode assumir apenas valores pertencentes a um conjunto 
enumerável. Exemplo: o número de estudantes entre os habitantes de 
uma cidade, a frequência cardíaca (batimentos/minuto) etc. 
– Variável contínua – (o domínio assume valores no conjunto dos 
números reais R ) – pode assumir qualquer valor em certo intervalo de 
variação. Exemplo: a idade das pessoas residentes em um município, 
o nível de glicemia (mg / 100 ml) etc. 
Ti
po
s 
de
 D
ad
os
 
Quantitativo ou 
Numérico 
Qualitativo ou 
Categórico
Discreto
II
I
III
Contínuo
Nominal
Ordinal
Figura 2: Esquema de apresentação dos dados.
 UNIUBE 15
• Em III, as variáveis podem ser de natureza nominal ou ordinal.
 
– Variável nominal – quando, entre as categorias possíveis, apenas 
podem-se estabelecer relações de igualdade ou diferença. Exemplo: 
a variável “sexo”, a qual é composta de duas categorias possíveis: 
“masculino” e “feminino”. 
– Variável ordinal – quando, entre as categorias, podem se estabelecer 
relações de ordem. Exemplo: (relação de idêntico, maior ou menor) 
a variável “nível socioeconômico”, com três categorias: “baixo”, “médio” 
ou “elevado”. 
Conforme já mencionamos, a descrição dos dados facilitará a 
compreensão dos fatos envolvidos no estudo. Agora, vamos estudar 
como apresentá los por meio de tabelas ou gráficos.
Fique atento(a) para a apresentação e construção de tabelas! Você já 
verificou a diferença entre construir um quadro e uma tabela? Confira!
IMPORTANTE!
1.2.4 Representação tabular 
A representação tabular consiste em dispor os dados em linhas e 
colunas distribuídas de modo ordenado. A elaboração de tabelas 
obedece à Resolução n. 886, de 26 de outubro de 1966, do Conselho 
Nacional de Estatística. As normas de apresentação são editadas pelo 
Instituto Brasileiro de Geografia e Estatística – IBGE. Na sequência, 
você acompanha o esquema de uma representação tabular, com 
as denominações de seus elementos, e, logo após, um glossário 
especificando um a um esses elementos.
16 UNIUBE
Representação esquemática
Título
Cabeçalho
Corpo
Rodapé
 
Elementos de uma tabela
Título: o título deve responder às seguintes questões:
• O quê? (Assunto a ser representado – fato).
• Onde? (O lugar onde ocorreu o fenômeno – local).
• Quando? (A época em que se verificou o fenômeno – tempo.)
Cabeçalho: parte da tabela na qual é designada a natureza do conteúdo 
de cada coluna. 
Corpo: parte da tabela composta de linhas e colunas. 
• Linhas: parte do corpo que contém uma sequência horizontal de 
informações. 
• Colunas: parte do corpo que contém uma sequência vertical de 
informações. 
Coluna indicadora: coluna que contém as discriminações correspondentes 
aos valores distribuídos pelas colunas numéricas. 
Casa ou célula: parte da tabela formada pelo cruzamento de uma linha 
com uma coluna. 
Rodapé: é o espaço aproveitado em seguida ao fecho da tabela, 
onde são colocadas as notas de natureza informativa (fonte, notas e 
chamadas). 
• Fonte: refere se à entidade que organizou ou forneceu os dados expostos. 
• Notas e chamadas: denotam esclarecimentos contidos na tabela 
(nota – conceituação geral; chamada – esclarecer minúcias em 
relação a uma tabela).
 UNIUBE 17
1.2.5 Distribuição de frequência 
Agora, os dados referentes a determinado fenômeno são apresentados 
por meio de gradações, em que são feitas a correspondência entre 
categorias ou valores possíveis e as respectivas frequências. A definição 
de alguns conceitos será importante para o uso da linguagem apropriada 
ao elaborarmos e analisarmos as distribuições de frequências. Vamos 
estudar as definições de dados brutos, rol, distribuição de frequência para 
a variável discreta (tabela de frequência) e distribuição de frequência para 
a variável contínua (intervalo de classes). 
1.2.6 Dados brutos 
Como primeiro resultado de uma pesquisa, obtém se dados brutos, um 
conjunto de números ainda sem nenhuma organização. Esse material é 
então ordenado de forma crescente ou decrescente, com a indicação da 
frequência, dando origem ao que chamamos de rol.
Exemplo 1.6 Uma pesquisa foi realizada numa cidade, do interior de Minas 
Gerais, cujo intuito é saber o número de pessoas por residência. A amostra 
é de 30 residências e as primeiras informações seguem no Quadro 1.
Quadro 1 – Número de pessoas por residência.
6 5 3 3 2 3 3 3 4 4
6 3 2 4 3 5 4 4 3 3
4 2 4 3 4 2 1 3 3 4
EXEMPLIFICANDO!
Antes de prosseguir com seus estudos, é muito importante e aconselhável 
que você tenha sempre uma calculadora para efetuar os cálculos que forem 
necessários.
IMPORTANTE!
18 UNIUBE
1.2.7 Rol 
O rol dos dados do Quadro 1 se apresenta arranjado no Quadro 2, a seguir. 
Quadro 2 – Número de pessoas por residência. 
1 2 2 2 2 3 3 3 3 3
3 3 3 3 3 3 3 4 4 4
4 4 4 4 4 4 5 5 6 6
O Quadro 2 apresenta vantagens concretas em relação aos dados 
brutos no Quadro 1. O rol (crescente) torna possível visualizar, de forma 
bem ampla, as variações dos dados, uma vez que os valores extremos 
são percebidos de imediato. Porém, a análise pelo uso desse tipo de 
disposição começa a se complicar quando o número de observações 
tende a crescer. 
1.2.8 Distribuição de frequência para variável discreta (tabela de 
frequência) 
Tabela 1 – Distribuição de frequência da variável número de pessoas por residência numa 
cidade do interior de Minas Gerais.
Xi 1 2 3 4 5 6 Total (n)
ƒi 1 4 12 9 2 2 30
Em que: 
Xi: denota os elementos da amostra (no caso, número de pessoas por 
residência); 
ƒi: denota a frequência ou peso de cada valor da amostra (n).
Conforme podemos observar no Quadro 1, os valores estão dispostos de 
forma desordenada. Em razão disso, pouca informação conseguimos obter 
analisando os dados apresentados. Mesmo um a informação simples, como 
saber os valores mínimos e máximos do número de pessoas por residência, 
requer certo exame dos dados coletados.
 UNIUBE 19
1.2.9 Distribuição de frequência para variável contínua (intervalo 
de classe) 
Para estudarmos este outro conceito, vamos continuar com a mesma 
pesquisa, ou seja, depois de elaborar o rol é necessário determinar 
quantas faixas etárias terá a tabela de frequência. O passo seguinte 
é subdividir os dados por classe ou categoria (no caso, o número de 
pessoas por residência) e determinar o número de pessoas pertencentes 
a cada uma, resultando na frequência de classe. Seja: 
k: número de classes que a tabela de classe deverá conter. 
n: número de elementos da amostra. 
Portanto, se você tem uma amostra com 30 dados, pode organizá los em 
uma tabela de distribuição de frequência, sendo k o número de classes. 
Para encontrarmos o número de classe k, usamos o critério da raiz, 
como é conhecido k n≅ , ou pelo uso da fórmula de Sturges em que 
log1
log 2
nk = + , em que n é o número de elementos da amostra. Usando a 
fórmula de Sturges, encontramos: 
log301 5,9 6
log 2
k k≅ + ≅ => =
 
Portanto, determinamos que a distribuição será composta de 6 classes. 
Após encontrar o valor de k, é preciso determinar o intervalo de classes, 
isto é, o tamanho que cada classedeverá ter. A determinação desta 
amplitude de classe será denotada por h, a qual será constante, isto 
é, todas as k classes deverão ter a mesma amplitude.
Como calcular h?
É simples. Fazemos minimomáximoA X X= − . Logo, 
Ah
k
= , em que,
A : denota a amplitude total, isto é, a diferença entre o maior e o menor 
 valor observado da variável em estudo. 
máximoX : denota o maior valor observado da variável em estudo. 
mínimoX : denota o menor valor observado da variável em estudo. 
h : denota a amplitude do intervalo de classe. 
20 UNIUBE
No exemplo apresentado, de acordo com o Quadro 2, temos, 
minimo 6 1 5.máximoA X X= − = − = Portanto, 
5 0,83 1
6
Ah
k
= = = ≅ .
Em seguida, o pesquisador determina os limites de cada classe, ou seja, 
o limite superior (lsup) e o limite inferior (linf), aplicando um dos quatro 
conceitos de intervalo que já estudamos. Escolhe se um ponto de partida, 
de acordo com os interesses da pesquisa. 
Por exemplo, decidimos que o limite inferior será de zero. E, a partir 
dele, serão construídas as classes da tabela de frequência, que deverá 
abranger todos os elementos do rol. 
No caso da não abrangência de todos os elementos do rol, devemos 
aumentar a amplitude do intervalo de classes (h) ou o número de 
classes (k).
Desta forma, se 6k = e 1h = , com a primeira classe iniciada por zero, 
temos a adição de h , a cada classe:
Tabela 2 – Intervalo de classes.
k
Classes
infl supl
if
1 1 |--- 2 1
4
12
9
2
2
2 2 |--- 3
3 3 |--- 4
4 4 |--- 5
5 5 |--- 6
6 6 |--- 7
∑ ---------- 30
 UNIUBE 21
Em que: 
∑: lê-se somatório. É uma letra grega (correspondente ao S latino) 
usada para indicar a adição dos termos de uma série; assume a mesma 
ideia do uso de total ( )n .
Vamos juntos recordar as ideias principais em relação à construção 
de tabelas de distribuição de frequência abrangendo os intervalos de 
classes. 
• Dado o tamanho da amostra , deve-se encontrar o valor de k
, 
que 
representa o número de classes. 
• Na sequência, calcular a amplitude total A, isto é, a diferença entre o 
maior e o menor valor observado da variável em estudo. 
• Encontrar o valor de h , amplitude do intervalo de classes. 
• E, por fim, escolhe-se um ponto de partida, de acordo com os interesses 
da pesquisa. 
Acompanhe, agora, algumas regras importantes abrangendo a construção 
dos intervalos de classe.
1. Geralmente, os intervalos de classe devem ser escritos de acordo 
com a Re solução n. 886/66 do IBGE. Para representar uma classe, 
utiliza-se o símbolo ׀— indicando a inclusão do limite inferior (linf) e 
exclusão do superior (lsup). Ou lê-se também um intervalo fechado à 
esquerda e aberto à direita. Portanto, de acordo com a Tabela 2, uma 
residência com 4 pessoas está incluída na quarta classe (linf = 4) e não 
na terceira. 
2. De acordo com o item “1”, é importante observar se os elementos 
estão in cluídos ou excluídos. 
3. Sempre que possível, deve-se evitar classe com frequência nula, 
principal mente em relação aos valores da primeira e última classe, 
ou com frequência relativa muito elevada.
22 UNIUBE
Todavia, mesmo em meio às ideias principais e algumas regras que 
acaba mos de apresentar; saiba que, às vezes, ainda é preciso algo 
mais! Como por exemplo, “agir com bom senso” ou “levar em conta 
a experiência pessoal no assunto”. Caso contrário, só as expressões 
e/ou as regras podem não nos levar a uma decisão final mais sensata!
 
Mas fique tranquilo, isso é natural nos estudos estatísticos, e se deve à 
natureza dos dados em estudo, da unidade utilizada para expressá-los e, 
principalmente, do objetivo que se tem em vista alcançar com a pesquisa. 
Veja mais alguns cálculos e suas respectivas expressões utilizadas na 
distribui ção de frequência para variável contínua (intervalo de classe).
• Ponto médio (representaremos por iPm a primeira letra maiúscula 
e a segunda minúscula) iPm – surge da necessidade de definir 
um número para representar cada classe, em geral denominado 
ponto médio ( )iPm , ou seja, a média entre os valores dos limites 
de classe. Logo, sua expressão é denotada por: 
inf sup
2
+
=i
l l
Pm
• Frequência relativa (representaremos por f “índice r” ambos 
minúsculos) – a frequência relativa denota qual proporção cada 
classe representa em rela ção ao total ( )n e é obtida dividindo-se 
cada uma das frequências absolutas ( )if pelo tamanho da amostra 
( )n . A frequência relativa é representada pela expressão:
A soma das frequências relativas sempre deverá ser igual a 1. Caso os 
valores aproximados contradigam essa regra, basta arredondar algum 
desses valores (para mais ou para menos) de modo a obter a soma 
necessária.
IMPORTANTE!
 UNIUBE 23
• Frequência percentual (representaremos por f
p 
“índice p” ambos 
minúsculos) – como o próprio nome sugere, a frequência porcentual 
indica a porcentagem de cada classe e, para obtê-la, basta multiplicar 
rf por 100 (assim a soma da frequência porcentual deverá ser igual a 
100%). Sendo assim, temos: 
100p rf f= ⋅
• Frequência acumulada (representaremos por F maiúsculo). A 
frequência acumulada corresponde à soma da frequência absoluta ( )if
de sua classe, mais a frequência acumulada das classes anteriores, caso 
existir. Dessa forma, sua expressão é representada por:
= +
atuali anterior
F f F sendo, 1,2, , ki = 
O valor da frequência acumulada F representado na última classe deverá 
ser igual ao valor de n , ou seja, ao total de elementos da amostra.
IMPORTANTE!
Com base no Exemplo 1.6 da pesquisa realizada numa cidade do 
interior de Minas Gerais, cujo intuito é saber o número de pessoas por 
residência, pode mos construir uma nova tabela de frequência (ver Tabela 
3), incluindo todos os cálculos relacionados anteriormente. 
Tabela 3 – Cálculos em função das frequências observadas quanto ao número de pessoas por 
 residência, numa cidade, do interior de Minas Gerais.
k
Classes
fi
i
r
ff
n
= inf sup
2
l l
Pm
+
= atuali anteriorF f F= +
infl
 
supl
1 1 --- 2 1 0,03 3 1,5 1
2 2 --- 3 4 0,13 13 2,5 5
3 3 --- 4 12 0,40 40 3,5 17
4 4 --- 5 9 0,30 30 4,5 26
5 5 --- 6 2 0,07 7 5,5 28
6 6 --- 7 2 0,07 7 6,5 30
∑ ---------- 30 1,00 100% ---- ----
( )100 %p rf f= ⋅
24 UNIUBE
Atividade 1.3 
Os funcionários da empresa FAJU-CAMADE estão em um sistema de 
horário flexí vel; eles podem iniciar sua entrada no trabalho a partir das 7h 
até às 9h. Os dados seguintes representam uma amostra estatística do 
horário de preferência, escolhido pelos funcionários. 
7h 7h15 8h 8h45 7h 9h 7h 7h15 8h 8h
7h 8h 8h15 7h45 7h30 8h30 8h 8h15 7h45 9h
8h15 9h 8h30 7h 8h 7h15 7h 9h 7h30 7h45
Com base nas informações apresentadas responda as letras a seguir:
a) Construa uma tabela de distribuição de frequências simples, relativa, 
percentual e acumulada (utilize as Normas da ABNT para a construção 
da tabela) 
b) Pode-se afirmar que 20% dos funcionários tem preferência para a entrada 
no trabalho às 8 horas. Em caso afirmativo ou não, apresente os cálculos 
necessários para sua conclusão.
AGORA É A SUA VEZ
Representação gráfica1.3
A representação gráfica da distribuição de uma variável tem a vantagem 
de, rápida e concisamente, informar sobre sua variabilidade. Entre os 
vários tipos de representações gráficas, os melhores gráficos são os que 
primam pela sim plicidade e clareza. 
Uma vez elaborada a tabela de frequência, prossegue-se com o desenho 
do gráfico, um recurso de visualização dos dados constantes na tabela. 
Entre os tipos de gráfico, temos o histograma, o polígono de frequência 
e o polígono de frequências acumuladas (ogivas de Galton). 
 UNIUBE 25
De acordo com as informações anteriores, o desenho gráfico é um 
recurso de visualização dos dados constantes na tabela, certo? O 
exemplo a seguir irá orientá lo e será muito importante para você concluir 
o que lhe será proposto mais adiante. Confira!
Figura 3: Percentuaissegundo o sexo versus doenças de notificação compulsória. 
Nota: notificação compulsória é a notificação obrigatória de casos de doenças da listagem 
de doenças de notificação compulsória. Além das DNC todo e qualquer surto ou epidemia, 
assim como a ocorrência de agravo inusitado, independente de constar na lista de doenças 
de notificação compulsória, deve ser notificado aos órgãos competentes. 
Você tem conhecimento do Microsoft Office Excel?
É um programa de planilha eletrônica, e seus recursos incluem uma interface 
intuitiva, além de capacitadas ferramentas de cálculo e de construção gráfica. 
Confira! Afinal, além de prepararmos os conteúdos básicos para sua base 
nos estudos estatísticos, também cuidamos para que você se intere das 
possibilidades deste software para a resolução de problemas estatísticos. 
Pois, independente da área de atuação, o mercado de trabalho almeja por 
profissionais cada vez mais qualificados!
DICAS
Exemplo 1.7 Interprete as informações seguintes, de acordo com o contexto 
em estudo.
Na Figura 3, estão representados os casos suspeitos ou confirmados de 
uma lista parcial de distribuição das Doenças de Notificação Compulsória 
(DNC), notificadas ao Serviço de Epidemiologia do Hospital dos Servidores 
do Estado (H.S.E.) do Rio de Janeiro, segundo o sexo.
EXEMPLIFICANDO!
65
Rú
be
ol
a
In
to
xic
aç
ão
 
al
im
en
ta
r
H.
I.V
./A
ID
S
M
en
in
gi
te
He
pa
tit
e 
C
De
ng
ue
Tu
be
rc
ul
os
e
35
100%
80%
60%
40%
20%
0%
73,4
26,6 40,7 27,3 46,9 53,5 49,4
M
F
69,3
72,7
63,1 46,5 60,6
Doenças de Notificação Compulsória
Fr
eq
uê
nc
ia
 (%
)
26 UNIUBE
Apresentamos, a seguir, uma argumentação básica para o exemplo proposto 
e ressaltamos que você certamente irá apresentar outras respostas, ou 
análises escritas diferentes, como, por exemplo, iniciar sua análise pelo 
sexo feminino. O importante é identificar o conteúdo e a coerência da 
argumentação apresentada.
Resolução: de acordo com a análise gráfica, podemos notar maior 
incidência de casos suspeitos ou confirmados de várias das Doenças de 
Notificação Compulsória (DNC) no sexo masculino. Como, por exemplo, em 
intoxicação alimentar e meningite; é possível observar que aproximadamente 
72% dos casos são do sexo masculino, contra aproximadamente 26% do 
sexo feminino. Logo depois, ainda com maior incidência no sexo masculino, 
aparecem as demais doenças, como mostram as respectivas porcentagens: 
Rubéola (65%), H.I.V./AIDS (59,3%), Hepatite C (53,1%) e Tuberculose 
(50,6%). A incidência de casos suspeitos no sexo feminino se dá com as 
seguintes porcentagens: Rubéola (35%), H.I.V./AIDS (40,7%), Hepatite C 
(46,9%) e Tuberculose (49,4%). Apenas a Dengue ocorreu em maior número 
de casos suspeitos ou confirmados no sexo feminino, em torno de 53,5% 
contra 46,5% dos casos no sexo masculino.
Exemplo 1.8 Note que para resolver o exemplo proposto você poderá fazer 
uma regra de três simples ou utilizar os conceitos de frequências (simples, 
relativa e percentual).
O exemplo retrata um gráfico em colunas para representar o tempo (em dias) 
de completo fechamento em cortes provenientes de cirurgia
Por exemplo, no final 
dessa coluna referente ao 
tempo de 17 dias (eixo x) 
de completo fechamento 
em cortes, observamos 
uma frequência igual 
a 7 (eixo y), ou seja, 7 
pacientes demoraram 
esse tempo para completo 
fechamento em cortes. 
Dessa mesma forma 
realizamos a leitura dos 
demais tempos. 
Para responder a 
letra B, observe o 
valor da frequência 
(5 pacientes) para 
14 dias de completo 
fechamento em 
cortes, num total 
de 30 pacientes 
(soma de todas as 
frequências: 5 + 7 + 
6 + 7 + 5 = 30).
14
8
7
6
5
4
3
2
1
0
15 16 17 18
Tempo(em dia)
Fr
eq
uê
nc
ia
 UNIUBE 27
Atividade 1.4
Procure, em jornais e revistas especializados, dois exemplos de histograma, 
polígono de frequência e polígono dê frequências acumuladas. Reflita sobre 
os resultados observados. Depois, analise os gráficos de acordo com o 
conteúdo estudado.
Agora, você vai conhecer as principais e mais importantes medidas de 
posição, entre elas a média, mediana e moda, e de variabilidade, como a 
variância, coeficiente de variação e medidas separatrizes; tanto para dados 
organizados em classes como para dados não organizados em classes 
ou organizados em distribuição de frequências. É importante entender como 
as fórmulas retratam ora uma medida de posição ora de variação, e saber 
realizar os seus cálculos para encontrar os valores procurados. Mais do que 
isso, você necessita compreender e interpretar esses valores.
AGORA É A SUA VEZ
Com base nas informações apresentadas responda as letras a seguir:
a) Analisando os resultados do gráfico, observamos que um número maior 
tempo (em dia) de completo fechamento em cortes provenientes de cirurgia 
é de 15 dias e de 17 dias, em ambos os casos observamos uma frequência 
de 7 pacientes cada? Em caso afirmativo ou não, apresente a sua análise 
por extenso.
Resposta: Sim, é verdadeira conforme a análise das colunas referentes aos 
dias 15 e 17, e o valor correspondente das frequências, em ambos os casos 
observamos uma frequência de 7 pacientes cada. 
 
b) Pode-se afirmar que 20% dos pacientes tiveram o completo fechamento 
em cortes provenientes de cirurgia em 14 dias. Em caso afirmativo ou não, 
apresente os cálculos necessários e descreva, por extenso, a análise para 
o resultado encontrado. 
Resposta: 5 0,17.100 0,17 ou 16,67%
30
= = . 
Portanto é falsa a afirmação, do total de 30 pacientes, pode-se afirmar que 
14 dias de completo fechamento em cortes provenientes de cirurgia ocorreu 
com aproximadamente 16,675 dos pacientes, conforme apresentado nos 
cálculos acima.
28 UNIUBE
Estatística descritiva – parte II1.4
Como você pôde observar até o momento, resumimos os valores 
que uma variável pode assumir em forma de tabelas, distribuição de 
frequências e gráficos. Agora, vamos aprender o cálculo de medidas que 
possibilitam representar um conjunto de dados relativos à observação 
de determinado fenômeno de forma resumida. São elas: medidas de 
tendência central e medidas de variabilidade que serão abordadas a 
seguir. 
1.4.1 Medidas de tendência central 
As medidas de tendência central são também chamadas de medidas 
de posição e estabelecem o valor em torno do qual os dados se 
distribuem. Podem ser utilizadas em conjunto para auxiliar a análise dos 
dados ou, em determinadas situações, uma pode ser mais conveniente 
do que a outra. 
Por exemplo, se um ou mais valores são muito discrepantes em relação 
aos demais valores observados, a média será muito influenciada por esse 
valor discrepante, tornando se, assim, inadequada para representar o 
conjunto de dados em estudo. 
Para o cálculo dessas medidas, é necessário que a variável seja quantitativa
IMPORTANTE!
1.4.1.1 Média aritmética 
A média aritmética representa o ponto de concentração dos valores de 
um conjunto de dados ou uma sequência numérica. Entre as medidas 
de tendência central, é a mais comumente utilizada para descrever 
resumidamente uma distribuição de frequência. Observe, no Quadro 3, 
as médias apresentadas, suas respectivas expressões e, na sequência, 
as aplicações destes conceitos.
 UNIUBE 29
Quadro 3 – Expressão para a média aritmética em relação ao tipo de dados analisados.
Média
Tipos de dados 
analisados
Expressão
Média aritmética simples Dados brutos ou em rol 1
n
i
i
x
X
n
==
∑
Média aritmética 
ponderada
Dados não organizados em 
classes ou organizados em 
distribuição de frequências
1
.
n
i i
i
x f
X
n
==
∑
Média
Dados organizados 
em classes 1
.
n
i i
i
Pm f
X
n
==
∑
Em que: 
X : denota a média aritmética ( X – lê-se “X barra”). 
ix : denota o valor genérico da observação. 
n : denota o tamanho da amostra (número de observações, ou seja, 
in f= ∑ ).
if : denota a frequência ou peso de cada valor da amostra ( )n . Os valores 
1 2, , , nx x x serão ponderados pelas respectivas frequências absolutas 
12, , , nf f f no cálculo da média aritmética ponderada. 
iPm : denota o ponto médio, ou seja, a média entre os valores dos limites 
de classe. Expressão denotada por inf sup
2
+
=i
l l
Pm .
30 UNIUBE
Situação-problema 1.1
Especialistas em Engenharia de Trânsito, ao realizar consultoria solicitada 
por órgãos públicos, coletaram o número de acidentes de trânsito verificados 
em certo cruzamento, no primeiro semestre de 2009, conforme indicados no 
Quadro 4. Determine a média do número de acidentes de trânsito mensais 
registrados pelos especialistas. Interprete o resultado obtido.
Quadro 4 – Registros de acidentes de trânsito.
Acidentes/mês 6 5 7 8 4 6
Resolução: 1 6 5 7 8 4 6 36 6
6 6
n
i
i
x
X
n
= + + + + += = = =
∑
Portanto, em média, o número de acidentes de trânsito mensais registrados 
pelos especialistas, no primeiro semestre de 2009, foi de 6 acidentes.
Na situação-problema 1.2 a seguir, observe que nos registros das 
observações, mostrados no Quadro 5, ocorrem muitos valores repetidos. Em 
um caso desses, o mais indicado é utilizar a média aritmética ponderada, em 
que os valores 1 2, , , nx x x serão ponderados pelas respectivas frequências 
absolutas 1 2, , , nf f f . Confira a resolução detalhada!
Situação problema 1.2 
Quadro 5 – Registro do número de peixes mortos por semana.
8 6 9 7 6 6 8 7 8
9 10 8 7 7 5 6 7 9
9 10 9 8 7 11 10
Resolução: De acordo com o conjunto de dados do Quadro 5 é aconselhável 
a construção de uma tabela de frequência, como a seguir:
EXEMPLIFICANDO!
 UNIUBE 31
Tabela 4 – Cálculos parciais para encontrar a média de peixes mortos por semana.
ix if i ix f⋅
5 1 5
6 4 24
7 6 42
8 5 40
9 5 45
10 3 30
11 1 11
∑ 25 197
Assim, a média para esta situação será: 1
.
197 7,88
25
n
i i
i
x f
X
n
== = =
∑
 
Portanto, em média, morrem aproximadamente 8 peixes por semana. 
Situação-problema 1.3
Suponha que você seja gestor de Recursos Humanos (RH) de uma Indústria 
e Comércio de Embalagens Hospitalares e necessite alinhar as políticas de 
RH com a estratégia da organização. Como consequência, você deverá 
recrutar candidatos com determinada faixa etária para o setor de Controle de 
Qualidade. A distribuição de frequência apresentada na Tabela 5 descreve 
a faixa etária dos candidatos à procura de emprego de auxiliar de controle 
qualidade, cuja função é de revisar embalagens hospitalares. Aponte, em 
média, a idade dos candidatos à procura deste cargo. Apresente os cálculos 
necessários e descreva, por extenso, a análise para o resultado encontrado.
Tabela 5 – Faixa etária dos candidatos.
Faixa etária if
 22 | --- 25 1
 25 | --- 28 10
 28 | --- 31 8
 31 | --- 34 1
32 UNIUBE
Resolução: Para facilitar a resolução do problema, sugerimos que 
você reescreva a Tabela 5. Para isso, basta acrescentar as colunas 
necessárias para desenvolver os cálculos. É bem prático calcular 
o ponto médio numa coluna, depois na coluna seguinte calcular o 
produto deste valor pela frequência; assim a somatória dessa coluna 
é um dos valores procurados, 
1
.
n
i i
i
Pm f
=
∑ . Verifique com atenção como 
realizamos a resolução. Observe a Tabela 6.
Tabela 6 – Cálculos parciais para a média da faixa etária dos candidatos.
Classes Faixa etária
if iPm i iPm f⋅
1 22 |--- 25 1 23,5 23,5
2 25 |--- 28 10 26,5 265
3 28 | --- 31 8 29,5 236
4 31 |--- 34 1 32,5 32,5
Total ( )n – 20 – 557
Observe que foi introduzida na Tabela 6 a coluna do ponto médio 
da classe ( )iPm . Recordar conteúdos estudados fortalece o seu 
aprendizado. Você se recorda do cál culo do ponto médio? O ponto 
médio da classe expresso pela fórmula inf sup
2
+
=i
l l
Pm .
Calculando a média, encontramos: 1
.
557 27,85
20
n
i i
i
Pm f
X
n
== = =
∑
Concluímos que a idade média dos candidatos assume o valor de 
27,85 anos, indicando que este é o valor em torno do qual as idades 
destes candidatos se concentram, isto é, de aproximadamente 28 
anos.
1.4.1.2 Mediana 
A mediana corresponde ao valor que ocupa a posição central numa 
sequência de números. Representaremos a mediana por Md . 
 UNIUBE 33
Supondo uma sequência numérica 1 2, , , , ,j nx x x x  , o elemento xj 
representa a mediana, caso o número de elementos que o antecedem 
seja igual ao nú mero de elementos que o sucedem. Para calcular a 
mediana, atente-se para as situações apresentadas no Quadro 6: 
Quadro 6 – Cálculo da mediana em relação ao tamanho da amostra assume valor ímpar ou par. 
Valor da amostra 
Mediana
Se n é ímpar, temos que o rol admite apenas um termo central 
ocupando a posição: 1
2
n + . O valor do elemento que ocupa esta 
posição é a mediana. 
Se n é par, temos que o rol admite dois termos centrais: e 1
2 2
n n
+ . 
O valor da mediana será expresso através da média, destes dois termos 
centrais.
Para os dados brutos ou rol, primeiro organizamos a sequência numérica 
em ordem crescente ou decrescente. Depois, verificamos se o número 
de elementos da amostra é par ou ímpar e adotamos os seguintes 
procedimentos, conforme apresentados a seguir.
IMPORTANTE!
Exemplo 1.8 Seja a sequência numérica: 4, 12, 9, 1, 17, 14, 5, 15, e 3.
Primeiro, ordenamos os dados em ordem crescente (ou rol crescente): 1, 3, 
4, 5, 9, 12, 14, 15, 17.
Como 9n = temos, 1 9 1 5
2 2
n + +
= = . Logo, o valor na sequência numérica 
que representa o 5º elemento, em ordem crescente, é o valor 9. Portanto, 
9Md = . Isso implica que 50% dos dados assume valor igual ou superior a 
9, e 50% dos dados assume valor igual ou inferior a 9.
EXEMPLIFICANDO!
34 UNIUBE
Situação-problema 1.4
O chefe do departamento de marketing de uma empresa compilou, no 
Quadro 7, os dados mensais (em milhares de reais) das despesas com 
propaganda, e deseja saber o valor mediano dessas despesas durante um 
ano. Desenvolva os cálculos necessários para apresentar, por extenso, a 
conclusão encontrada.
Quadro 7 – Dados mensais (em milhares de reais) das despesas com propaganda.
221 225,5 235 238 238 239
242 244 245 255 263 282,5
Resolução: Observe que os dados já se encontram em ordem crescente 
(ou rol crescente).
Como 12n = , temos 
12= =6 e 1 6 1 7
2 2 2
n n
+ = + = que a mediana situa-se 
entre o 6º e 7º elementos na amostra, ou seja, entre os valores 239 e 242 
(em negrito, no Quadro 7). Logo, 239 242 481 240,5
2 2
Md += = =
Portanto, o chefe do departamento de marketing concluirá que o valor 
mediano das despesas com propaganda, durante um ano, foi de $ 240,5 
milhares de reais.
Observe uma situação-problema para os dados agrupados em intervalos 
(variável contínua).
Situação-problema 1.5
Uma comissão criada por donas de casa, Estamos de olho no preço, faz a 
cotação e divulga entre os moradores do bairro onde residem os preços de 
produtos em geral. A Tabela 7 apresenta os dados referentes à variação de 
preço do macarrão em 19 supermercados ou lojas do gênero, pesquisados 
durante 6 meses. A partir dos dados registrados na tabela, a que conclusão a 
comissão de donas de casa chegou a respeito do preço mediano do pacote 
de macarrão? Desenvolva os cálculos necessários e descreva, por extenso, 
a análise para o resultado encontrado.
EXEMPLIFICANDO!
 UNIUBE 35
Tabela 7 – Intervalo de classes em função do preço do pacote de macarrão.
Classes Preço if iF
1 1,32 |--- 1,34 2 2
2 1,34 |--- 1,36 5 7
3 1,36 |--- 1,38 8 15
4 1,38 |--- 1,40 3 18
5 1,40 |--- 1,42 1 19
Total ( )n – 19 –
Resolução: Usaremos a expressão inf 2
amterior
i
n F
Md l h
f
−
= + ⋅ , em que:
infl : denota o limite inferior da classe da mediana.
anteriorF : denota a frequência acumulada anterior à classe da mediana, ou 
 seja, a soma dos valores de i anteriores à classe da mediana.
h : denota a amplitude da classe mediana.
if : denota a frequência da classe da mediana.
Temos 
1 19 1 10
2 2
n + +
= = (10º elemento). A seguir, identificamos a classe da 
mediana através da F e, como podemos observar, o 10º elemento pertence 
a 3ª classe(os valores foram destacado em negrito na tabela). Em seguida, 
substitui-se os valores conhecidos na expressão da mediana, isto é:
1,37Md =
Portanto, a comissão de donas de casa concluiu que 50% dos preços do pacote 
de macarrão pesquisado se apresentam igual ou menor que R$1,37, e 50% dos 
preços de macarrão pesquisados se apresentam igual ou maior que R$1,37.
( )
inf
2,59,5 72 1,36 0,02 1,36 0,02 1,36 0,01
8 8
anterior
i
n F
Md l h
f
− −
= + ⋅ = + ⋅ = + ⋅ = +
36 UNIUBE
Situação-problema 1.6
O rótulo em uma embalagem de detergente líquido afirma que a embalagem 
contém 500 ml. O controle de qualidade do fabricante, ao inspecionar a 
linha de produção, seleciona uma amostra de 12 recipientes desse produto, 
para verificar se os recipientes estão dentro das normas especificadas 
no rótulo da embalagem. Os dados obtidos estão registrados no Quadro 
8. Sabendo-se que o controle de qualidade aceita uma produção que 
esteja dentro de 500,02 ml do valor de mililitros especificados no rótulo 
do recipiente, desenvolva os cálculos necessários para apresentar o valor 
médio e mediano dos dados amostrais. Descreva, por extenso, as análises 
para os resultados encontrados.
Quadro 8 – Dados de milimitros de embalagens de detergente líquido.
500,03 500,00 500,04 500,02
500,02 500,05 500,03 500,00
500,02 500,03 500,00 500,02
De acordo com a situação-problema 1.6, vamos juntos refletir para outros 
aspectos importantíssimos com relação aos resultados desses valores 
médios e medianos.
Sabe-se que o controle de qualidade aceita uma produção que esteja dentro 
de 500,02 ml do valor de mililitros especificados no rótulo do recipiente, e 
que, em média, o valor obtido está dentro do valor de aceitação. Que tal 
fazermos neste momento uma reflexão a respeito de dois pontos de vista 
distintos nesta situação?
Olhar do consumidor: quais benefícios você observa nessa realidade 
apresentada?
Olhar do gestor: quais impactos positivos e negativos você nota quando 
analisa essa situação pelo ponto de vista da empresa?
Acompanhe, em detalhes, a resolução do cálculo da média dos dados de 
mililitros de embalagens de detergente líquido.
De acordo com os dados do Quadro 8, a construção de uma tabela irá 
auxiliar no desenvolvimento dos cálculos. Lembre-se desta dica.
 UNIUBE 37
Tabela 8 – Cálculos parciais da média em mililitros.
ix if .i ix f iF
500,00 3 1500,00 3
500,02 4 2000,08 7
500,03 3 1500,09 10
500,04 1 500,04 11
500,05 1 500,05 12
Total 12 6000,26 –
Assim, a média para esta situação será: 
1
.
6000,26 500,02
12
n
i i
i
x f
X
n
== = ≅
∑
Portanto, em média, o valor de mililitros por embalagem de detergente é de 
aproxima damente 500,02 ml, embora o rótulo da embalagem de detergente 
líquido afirme que o conteúdo é de 500 ml por embalagem. E, sabendo-se 
que o controle de qualidade aceita uma produção que esteja dentro de 
500,02 ml do valor de mililitros especifi cados no rótulo do recipiente, conclui 
-se que através da média o resultado satisfaz o volume aceito pelo controle 
de qualidade. 
Acompanhe em detalhes o cálculo da mediana. 
Sempre ordene os valores. Assim, em ordem crescente temos: 500; 500; 
500; 500; 02; 500,02; 500,02; 500,02; 500,03; 500,03; 500,03; 500,04; 
500,05. 
Como 12n = temos, 
12= =6 e 1 6 1 7.
2 2 2
n n
+ = + = Logo, a mediana 
apresenta -se en tre o 6º e 7º elementos, ou seja, entre 500,02 e 500,02. 
Assim, o valor mediano é: 
500,02 500,02 500,02
2
Md += =
38 UNIUBE
Portanto, concluiu-se que 50% do valor de mililitros por embalagem de 
detergente apresentam-se menores ou iguais a 500,02 ml e 50% dos preços 
do valor de mililitros por embalagem de detergente são maiores ou iguais 
a 500,02.
1.4.1.3 Moda 
A moda de um conjunto de dados é o valor que ocorre com maior 
frequência, ou seja, é o valor que aparece mais vezes. Representaremos 
a moda por Mo . A moda pode não existir e, mesmo que exista, pode 
não ser única.
Situação 1. Dados brutos ou em rol
Exemplo 1.9 Seja a amostra: 2, 3, 3, 4, 5, 5, 5, 7 e 10. O elemento de maior 
frequência é o número 5, portanto a moda 5Mo = , daí a série ser chamada 
de unimodal.
Exemplo 1.10 Seja a amostra 4, 6, 9, 11,13, e 14. Observe que todos os 
elementos apresentam a mesma frequência, logo a amostra é amodal.
No exemplo 1.11, a moda existe e não é única. Observe.
Exemplo 1.11 Na série 6, 6, 7, 7, 9, e 10, os elementos de maior frequência 
são os números 6 e 7, portanto temos Mo = 6 e Mo = 7, daí a série ser 
chamada de bimodal.
Situação 2. Dados não organizados em classes ou organizados em 
distribuição de frequências
Nesta situação, basta identificar o elemento de maior frequência. Observe a 
exemplificação da Tabela 9, com o correspondente valor da moda.
Tabela 9 – Distribuição de frequência.
xi 1 5 6 8 13
fi 1 3 5 2 4
EXEMPLIFICANDO!
 UNIUBE 39
Portanto, a moda, 6Mo = . Isso implica que o valor 6 é o valor com maior 
frequência, ou seja, ele se repete por 5 vezes. 
Situação 3. Dados organizados em classes 
Nesta situação, primeiro identificamos a classe modal, ou seja, aquela que 
possui maior frequência. Em seguida, aplicamos a fórmula. Acompanhe o 
exemplo da Tabela 10.
Tabela 10 – Intervalo de classes.
Classe Amostra fi
1 0 |-------10 1
2 10 |------ 20 3
3 20 |------ 30 6
4 30 |------ 40 2
Total – 12
Pela fórmula temos, 
em que: 
infl : denota o limite inferior da classe modal
1∆ : denota a diferença entre a frequência ( )if da classe modal e a imediatamente anterior.
2∆ : denota a diferença entre a frequência ( )if da classe modal e a 
 imediatamente posterior. 
h : denota a amplitude da classe. 
Identificamos na Tabela 10 que a classe modal é a 3ª classe (em negrito), 
ou seja, a terceira classe é a que exibe a maior frequência simples, isto é, 
6if = . 
Portanto, 
inf
1
1 2
320 10 20 0,43 10 24,3 24,3
3 4
Mo l h Mo∆= + ⋅ = + ⋅ = + ⋅ = ⇒ =
∆ + ∆ +
 .
inf
1
1 2
.Mo l h∆= +
∆ + ∆
40 UNIUBE
1.4.1.4 Medidas separatrizes 
As medidas separatrizes representam números reais que separam o rol 
ou a distribuição de frequências em partes iguais. Assim, a mediana, que 
divide a sequência ordenada em duas partes, cada uma delas contendo 
50% dos valores da sequência, é também uma medida separatriz.
 
Além da mediana, estudaremos outras medidas separatrizes 
denominadas quartis ( ), sendo 1,2,3,4iQ i = , quintis ( ), sendo 1,2,3,4,5ik i = , 
decis ( ), sendo 1,2, ,10iD i =  e percentis ( ), sendo i 1, 2, ,100iP =  . Observe, 
com atenção, a representação esquemática de uma sequência ordenada 
e, a seguir, relacione-a com o enun ciado denominado para cada divisão 
desta sequência.
Figura 4: Representação esquemática de uma sequência ordenada.
Decis: série ordenada dividida 
em 10 partes, cada uma ficará 
com 10% de seus elementos.
Quartis: série ordenada 
dividida em 4 partes, cada 
uma ficará com 25% de 
seus elementos.
Percentis: (ou centis): série 
ordenada dividida em 100 
partes, cada uma ficara com 
1% de seus elementos.
Quintis: série ordenada dividida 
em 5 partes, cada uma ficará 
com 20% de seus elementos.
P25
D1 D2
P20 P40 P60 P80
K1 K2 K3 K4
...
... ... .........
D3 D7 D8 D9
Q1
25%
0% 10% 20% 30% 40% 60% 70% 80% 90% 100%
50% 75%
Q2 Q3
P50 P15
 UNIUBE 41
em que: 
1Q : denominado primeiro quartil, separa a sequência ordenada 
deixando 25% de seus elementos à esquerda e 75% de seus elementos 
à direita. 
2Q : denominado segundo quartil, separa a sequência ordenada 
deixando 50% de seus elementos à esquerda e 50% de seus elementos 
à direita.
Observe que o 2Q é a mediana da série.
IMPORTANTE!
3Q : denominado terceiro quartil, separa a sequência ordenada deixando 
75% de seus elementos à esquerda e 25% de seus elementos à direita. 
1K : denominado primeiro quintil, separa a sequência ordenada 
deixando 20% de seus elementos à esquerda e 80% de seus elementos 
à direita. 
...
1D : denominado primeiro decil, separa a sequência ordenada deixando 
10% de seus elementos à esquerda e 90% de seus elementosà direita. 
...
1P : denominado primeiro centil ou primeiro percentil, separa a 
sequência ordenada deixando 1% de seus elementos à esquerda e 99% 
de seus elemen tos à direita.
...
20P : denominado vigésimo centil ou vigésimo percentil, separa a 
sequência ordenada deixando 20% de seus elementos à esquerda e 
80% de seus ele mentos à direita.
42 UNIUBE
Observe que o 4Q , 5K , 10D e 100P separa a sequência ordenada 
deixando 100% de seus valores à esquerda e correspondem 
diretamente ao último valor da sequência.
Mais ainda: podemos estabelecer a fórmula de cálculo de percentis 
onde todas as outras medidas podem ser identificadas como percentis, 
basta observarmos que os quartis, quintis e decis são múltiplos dos 
percentis. Dessa forma, observe as correspondentes colunas que 
apresentamos a seguir:
SAIBA MAIS
Para fixarmos melhor o estudo das medidas separatrizes, entre elas, 
o quartil, o quintil, o decil e o percentil (ou centil); vamos aprender a 
calcular essas medidas por meio da equação geral quartílica. Acompanhe 
o cálculo dessas equações: 
• Quartis ( )iQ – Genericamente, para encontrar a ordem ou posição do 
quartil Qi a ser calculado usaremos a expressão
.
4iQ
i nE =
em que: 
iQ
E : denota o elemento quartílico. 
i : denota o número do quartil a ser calculado, sendo 1,2,3,4i = .
n : denota o número de observações. 
1 25 1 20 1 10
2 50 2 40 2 20
3 75 3 60 3 30
4 80 4 40
5 50
 
 
 
 
 
 
Q P K P D P
Q P K P D P
Q P K P D P
K P D P
D P
= = =
= = =
= = =
= =
=
6 60
7 70
8 80
 
 
 
D P
D P
D P
=
=
=
 UNIUBE 43
• Quintis ( )iK – De maneira geral, para encontrar a ordem ou posição do Quintil ( )iK a ser calculado usaremos a expressão:
.
5iK
i nE =
em que: 
iK
E : denota o elemento quintílico. 
i : denota o número do quintil a ser calculado, sendo 1,2, ,5i =  .
n : denota o número de observações. 
• Decis ( )iD – De maneira geral, para encontrar a ordem ou posição 
do Decil ( )iD a ser calculado usaremos a expressão:
.
10iD
i nE =
em que: 
iD
E : denota o elemento decílico. 
i : denota o número do decil a ser calculado, sendo 1,2, ,10i =  .
n : denota o número de observações.
• Percentis ou Centis ( )iP – Para encontrar a ordem ou posição do percentil ou Centil ( ) a ser calculado usamos a expressão:
.
100iP
i nE =
em que: 
iP
E : denota o elemento percentílico. 
i : denota o número do percentil (ou centil) a ser calculado, sendo 
1,2, ,10i =  . 
n : denota o número de observações. 
Para o caso do . 100i n for um número inteiro ou não, temos: 
– se . 100i n for um número inteiro ⇒ iP é um dos valores da sequência 
ordenada. 
– se . 100i n não for um número inteiro ⇒ iP é definido como a média 
dos valores que ocupam as posições aproximadas, pois iP é um 
elemento inter mediário entre os elementos que ocupam estas posições.
44 UNIUBE
Para dados organizados em classes, encontraremos os quartis de 
maneira semelhante à usada para o cálculo da mediana: 
inf
iQ anterior
i
i
E F
Q l h
f
−
= + ⋅
em que: 
iQ : denota o Quartil i , sendo 1,2,3i = . 
infl : denota o limite inferior da classe que contém o quartil desejado ( )iQ
iQ
E : denota o elemento quartílico. 
anteriorF : denota a frequência acumulada até a classe anterior à classe 
mediana.
h : denota a amplitude do intervalo de classe. 
if : denota a frequência absoluta simples da classe quartílica.
Importante! Observe na expressão para dados organizados em 
classes que primeiro é preciso encontrar a equação geral quartílica 
desejada. Após o resultado encontrado na equação em estudo, devemos 
ir para a frequência acumulada F , e verificar em qual classe (ou linha do 
quadro ou tabela) se encontra esse valor obtido na equação quartílica. 
Isso implica que nessa classe, no geral, se encontra o valor da medida 
separatriz desejada.
Dessa forma para os dados organizados em classes, encontraremos 
as outras medidas separatrizes, ou seja, os quintis, decis e percentis 
de maneira semelhante à usada acima. Note que a mudança irá ocorrer 
apenas na notação da medida separatriz ( iQ , iK , iQ e iP e na equação 
geral quartílica desejada ( iQE , iKE , iD
E e 
iP
E ) .
Exemplo 1.13 Os dados do Quadro 9 informam a produção de barris de 
petróleo bruto por mês de 16 poços de petróleo.
Quadro 9 – Dados da produção de barris de petróleo bruto por mês.
390 420 390 510 420 450 410 510
430 420 400 520 450 420 450 510
EXEMPLIFICANDO!
 UNIUBE 45
Com base nas informações responda as letras a seguir:
a) Desenvolva os cálculos e apresente o valor do 1º quartil. Em seguida 
apresente, por extenso, a análise para esse resultado sobre a produção de 
barris de petróleo bruto por mês. 
b) Desenvolva os cálculos e apresente o valor do 2º decil. Em seguida 
apresente, por extenso, a análise para esse resultado sobre a produção de 
barris de petróleo bruto por mês. 
Resolução:
a) Ordenando a sequência, em rol crescente, temos: 390, 390, 400, 410, 
420, 420, 420, 420, 430, 450, 450, 450, 510, 510, 510, 520. 
Como sabemos, 1 25Q P= , assim calculamos 25% de 16 ( )16n = , obtendo:
25 16 4
100 100iP
i nE ⋅ ⋅= = = ⇒ 25P é o 4º elemento do rol crescente, ou seja, o 
valor 4 indica a posição do vigésimo quinto percentil ( )25P que corresponde 
ao primeiro quartil ( )1Q , ( )1 25Q P= , pedido na letra a. 
A seguir, observando o rol crescente concluímos que o 4º elemento 
corresponde ao valor 410. Portanto, 1 25 410Q P= = , ou seja, 25% dos 
poços de petróleo produzem valores menores ou iguais a 410 barris de 
petróleo bruto por mês, e 75% desses poços produzem valores maiores ou 
iguais a 410.
b) Ordenando a sequência, em rol crescente, temos: 390, 390, 400, 410, 
420, 420, 420, 420, 430, 450, 450, 450, 510, 510, 510, 520. 
Como sabemos, 1 10D P= , assim calculamos 10% de 16 ( )16n = , obtendo: 
10 16 1,6 2
100 100iP
i nE ⋅ ⋅= = = ≅ ⇒
10P é o 2º elemento do rol crescente, ou 
seja, o valor 2 indica a posição do décimo percentil ( )10P que corresponde 
ao primeiro decil ( )1D , ( )1 10D P= , pedido na letra b. 
46 UNIUBE
IMPORTANTE! Observe que o valor 390 é inferior ao valor 410, pois por se 
tratar de medidas de posição, 10% dos dados ocupam valores inferiores a 
25% dos dados.
Exemplo 1.14 A Tabela 11 informa a distribuição de frequência da 
dimensão, em milímetros ( )mm , de uma determinada peça. 
INFORMAÇÃO! Antes de iniciar os cálculos fixe a calculadora em 2 
casas decimais.
Tabela 11 – Distribuição de frequência da dimensão, em milímetros, de uma determinada peça.
Dimensão ( )mm Nº de peças ( )if
9,2 |--- 9,7 2
9,7 |--- 10,2 5
10,2 |--- 10,7 12
10,7 |--- 11,2 17
11,2 |--- 11,7 14
11,7 |--- 12,2 6
12,2 |--- 12,7 3
12,7 |--- 13,2 1
Após as informações sobre a distribuição de frequência da dimensão das 
peças, desenvolva e apresente os cálculos necessários para encontrar 
o valor do terceiro quartil. Descreva, por extenso, a conclusão para o 
resultado encontrado.
Resolução: 
Usaremos a expressão inf i
Q amterior
i
i
E F
Q l h
f
−
= + ⋅ , em que:
infl : denota o limite inferior da classe da quartílica.
A seguir, observando o rol crescente concluímos que o 2º elemento corresponde 
ao valor 390. Portanto, 1 10 390D P= = , ou seja, 10% dos poços de petróleo 
produzem valores menores ou iguais a 390 barris de petróleo bruto por mês, e 
90% desses poços produzem valores maiores ou iguais a 390. 
 UNIUBE 47
anteriorF : denota a frequência acumulada anterior à classe quartílica, ou 
seja, a soma dos valores de if anteriores à classe quartílica.
h : denota a amplitude da classe quartílica.
if : denota a frequência da classe quartílica.
Temos 
3 3
. 3.60 3.60 45
4 4 4iQ Q Q
i nE E E= ⇒ = ⇒ = = (45º elemento da F , frequência 
acumulada). A seguir, identificamos a classe quartílica

Continue navegando