Buscar

Livro-Texto - Unidade I

Prévia do material em texto

Autores: Prof. Alan Rodrigo Navia
 Profa. Alessandra Carvalho Teixeira
Colaboradoras: Profa. Amarilis Tudella
 Profa. Christiane Mazur Doi
Noções de Estatística
Professores conteudistas: Alan Rodrigo Navia / Alessandra Carvalho Teixeira
Alan Rodrigo Navia
É graduado em Materiais, Processos e Componentes Eletrônicos pela Fatec-SP. Possui mestrado em Engenharia 
Eletrônica pela Poli-USP, na área de Circuitos Integrados. Exerceu as seguintes funções no mercado de trabalho: 
pesquisador em Engenharia na Swiss Group, analista estatístico na Amcham, especialista em sistemas pleno no 
Carrefour e atualmente é coordenador de sistemas no Grupo Renac.
Academicamente, lecionou na Fundação Santo André no curso de Engenharia, foi auxiliar docente do curso de 
Engenharia Eletrônica na Poli-USP e leciona há quase dez anos na Universidade Paulista (UNIP). Suas principais áreas 
de atuação na docência são: estatística, banco de dados e programação de computadores e matemática. 
Alessandra Carvalho Teixeira 
Fez mestrado e doutorado em Ensino de Ciências e Matemática pela Universidade Cruzeiro do Sul. É licenciada em 
Matemática com ênfase em Ciências da Computação pelo Centro Universitário São Camilo, licenciada em Pedagogia 
pela Universidade São Bernardo, especialista em Modelagem Matemática pela Universidade Federal do ABC (UFABC). 
Atua na Educação Básica como professora de matemática dos anos finais do Ensino Fundamental e do Ensino 
Médio da rede pública do estado de São Paulo desde 1995. Já foi diretora e coordenadora pedagógica na rede estadual 
de ensino e professora de matemática para os anos finais do Ensino Fundamental no Centro de Mídias do Estado 
de São Paulo – CMSP, em 2020, por meio de aulas ao vivo. Hoje é coordenadora da área de ensino de ciências e 
matemática numa escola da rede estadual, coordenadora de estágio dos cursos de Matemática e Física EaD na UNIP, 
orientadora de trabalho de conclusão de curso das turmas de Pedagogia e Matemática da UNIP Interativa. Suas linhas 
de pesquisa são: avaliação em larga escala, currículo, didática da matemática.
 
© Todos os direitos reservados. Nenhuma parte desta obra pode ser reproduzida ou transmitida por qualquer forma e/ou 
quaisquer meios (eletrônico, incluindo fotocópia e gravação) ou arquivada em qualquer sistema ou banco de dados sem 
permissão escrita da Universidade Paulista.
U511.71 – 21
Dados Internacionais de Catalogação na Publicação (CIP)
F325e Navia, Alan Rodrigo 
Noções de Estatística / Alan Rodrigo Navia, Alessandra Carvalho 
Teixeira. – São Paulo: Editora Sol, 2021.
132 p., il.
Notas: este volume está publicado nos Cadernos de Estudos e 
Pesquisas da UNIP, Série Didática, ISSN 1517-9230
1. Estatística. 2. Pedagogia. 3. Serviço Social. I. Teixeira, 
Alessandra Carvalho. II. Título.
CDU 519.2
Prof. Dr. João Carlos Di Genio
Reitor
Prof. Fábio Romeu de Carvalho
Vice-Reitor de Planejamento, Administração e Finanças
Profa. Melânia Dalla Torre
Vice-Reitora de Unidades Universitárias
Profa. Dra. Marília Ancona-Lopez
Vice-Reitora de Pós-Graduação e Pesquisa
Profa. Dra. Marília Ancona-Lopez
Vice-Reitora de Graduação
Unip Interativa – EaD
Profa. Elisabete Brihy 
Prof. Marcello Vannini
Prof. Dr. Luiz Felipe Scabar
Prof. Ivan Daliberto Frugoli
 Material Didático – EaD
 Comissão editorial: 
 Dra. Angélica L. Carlini (UNIP)
 Dr. Ivan Dias da Motta (CESUMAR)
 Dra. Kátia Mosorov Alonso (UFMT)
 Apoio:
 Profa. Cláudia Regina Baptista – EaD
 Profa. Deise Alcantara Carreiro – Comissão de Qualificação e Avaliação de Cursos
 Projeto gráfico:
 Prof. Alexandre Ponzetto
 Revisão:
 Giovanna Cestari 
 Vitor Andrade
Sumário
Noções de Estatística
APRESENTAÇÃO ......................................................................................................................................................7
INTRODUÇÃO ...........................................................................................................................................................8
Unidade I
1 CONCEITOS FUNDAMENTAIS .........................................................................................................................9
1.1 Conceitos iniciais .....................................................................................................................................9
1.2 Dados ......................................................................................................................................................... 10
1.3 População versus amostra ................................................................................................................ 12
1.4 Amostragem ........................................................................................................................................... 13
2 DISTRIBUIÇÃO DE FREQUÊNCIA ................................................................................................................ 17
2.1 Conceitos básicos ................................................................................................................................. 17
2.2 Elementos de uma distribuição de frequência ......................................................................... 21
2.2.1 Classe (i) ...................................................................................................................................................... 21
2.2.2 Limites de classe (li ou Li) .................................................................................................................... 21
2.2.3 Amplitude de classe (hi) ....................................................................................................................... 22
2.2.4 Amplitude amostral (AA) ..................................................................................................................... 22
2.2.5 Ponto médio de classe (xi) ................................................................................................................... 22
2.3 Tipos de frequências ............................................................................................................................ 23
2.3.1 Frequência absoluta ou simples (fi) ................................................................................................. 23
2.3.2 Frequência relativa (fri) ........................................................................................................................ 23
2.3.3 Frequência acumulada (Fi) .................................................................................................................. 24
2.4 Construção de distribuições de frequências ............................................................................. 24
2.4.1 Distribuição sem intervalo .................................................................................................................. 24
2.4.2 Distribuição com intervalo .................................................................................................................. 25
2.5 Representações gráficas .................................................................................................................... 28
2.5.1 Histograma (gráfico de colunas) ...................................................................................................... 28
2.5.2 Polígono de frequências (gráfico cartesiano) .............................................................................. 28
2.5.3 Gráfico em colunas ................................................................................................................................ 29
2.5.4 Gráfico em barras ................................................................................................................................... 30
2.5.5 Gráfico em linhas .................................................................................................................................... 30
2.5.6 Gráfico em setores .................................................................................................................................31
2.5.7 Diagrama de dispersão ......................................................................................................................... 32
3 MEDIDAS DE TENDÊNCIA CENTRAL ......................................................................................................... 35
3.1 Média (x) ................................................................................................................................................. 35
3.1.1 Dados não agrupados ........................................................................................................................... 35
3.1.2 Distribuição de frequências sem intervalo ................................................................................... 36
3.1.3 Distribuição de frequências com intervalo .................................................................................. 36
3.2 Moda (Mo) ............................................................................................................................................... 38
3.2.1 Dados não agrupados ........................................................................................................................... 38
3.2.2 Distribuição de frequências sem intervalo ................................................................................... 39
3.2.3 Distribuição de frequências com intervalo .................................................................................. 39
3.3 Mediana (Md) ......................................................................................................................................... 41
3.3.1 Dados não agrupados ........................................................................................................................... 41
3.3.2 Distribuição de frequências sem intervalo ................................................................................... 42
3.3.3 Distribuição de frequências com intervalo .................................................................................. 43
4 MEDIDAS DE DISPERSÃO ............................................................................................................................. 47
4.1 Introdução ............................................................................................................................................... 47
4.2 Variância (s2) .......................................................................................................................................... 48
4.2.1 Dados não agrupados ........................................................................................................................... 48
4.2.2 Distribuição de frequências sem intervalo ................................................................................... 50
4.2.3 Distribuição de frequências com intervalo .................................................................................. 51
4.3 Desvio-padrão (s) ................................................................................................................................ 53
4.3.1 Dados não agrupados ........................................................................................................................... 53
4.3.2 Distribuição de frequências sem intervalo ................................................................................... 53
4.3.3 Distribuição de frequências com intervalo .................................................................................. 54
4.4 Coeficiente de variação (CV) ............................................................................................................ 55
Unidade II
5 CONCEITOS BÁSICOS DE PROBABILIDADE ............................................................................................ 66
5.1 Conceitos fundamentais ................................................................................................................... 66
5.2 Eventos complementares ................................................................................................................. 71
5.3 Eventos independentes ...................................................................................................................... 72
5.4 Eventos mutuamente exclusivos ................................................................................................... 74
5.4.1 Exercício resolvido .................................................................................................................................. 76
6 DISTRIBUIÇÃO NORMAL DE PROBABILIDADES ................................................................................... 79
6.1 Conceitos fundamentais ................................................................................................................... 79
6.1.1 Exercícios resolvidos .............................................................................................................................. 84
7 CORRELAÇÃO LINEAR .................................................................................................................................... 91
7.1 Conceito de diagrama de dispersão .............................................................................................. 91
8 COEFICIENTE DE PEARSON .......................................................................................................................... 93
8.1 Exercícios resolvidos ....................................................................................................................................... 99
7
APRESENTAÇÃO
A palavra estatística é muito conhecida por todos nós, por mais que não saibamos exatamente 
o que é e como utilizá-la. Ainda que de modo informal, utilizamos diversos conceitos e informações 
estatísticas para orientar nossa leitura da realidade, permitindo que possamos tomar decisões que 
dependam dessas informações.
Conforme Toledo e Ovalle (1995, p. 13) afirmaram há 25 anos, e perceberemos que ainda vale para 
os dias atuais:
A utilização da Estatística é cada vez mais acentuada em qualquer atividade 
profissional da vida moderna. Nos seus mais diversificados ramos de atuação, 
as pessoas estão frequentemente expostas à Estatística, utilizando-a com 
maior ou menor intensidade. Isto se deve às múltiplas aplicações que o 
método proporciona àqueles que dele necessitam.
Este livro-texto contempla os temas fundamentais para um curso de introdução à estatística. A 
grande quantidade de exercícios de aplicação e a preocupação em explicar os métodos de cálculo, passo 
a passo, de modo a facilitar a apreensão do conteúdo, são os pontos marcantes deste material, que tem 
como objetivo ensinar os conceitos básicos da estatística.
O pré-requisito para acompanhar a obra é a matemática do Ensino Fundamental, a qual, inclusive, é 
exercitada a todo o momento, nas mais diversas disciplinas e áreas do conhecimento.
Os objetivos desta disciplina foram definidos de modo que essa área do conhecimento seja um 
instrumento de análise da realidade para auxiliar na sua prática profissional. Eles estão listados a seguir:
• desenvolver a habilidade de futuros profissionais no decorrer de pesquisas;
• mostrar a importância da estatística descritiva em todas as áreas de ensino;
• ensinar a utilização de métodos estatísticos como ferramenta de trabalho a partir de coleta, 
descrição e organização de dados nas diversas áreas de conhecimento, tais como: ciências sociais, 
ciências humanas, ciências exatas, ciências administrativas e ciências da saúde.
Acima de tudo, pretendemos que esta obra possa ser um instrumento de auxílio na compreensão dos 
conceitos básicos de estatística de maneira mais consistente.
8
INTRODUÇÃO
Este livro-texto aborda os assuntos fundamentais da estatística, desde o estudo de uma variável até 
a introdução ao estudo do comportamento mútuo de duas variáveis.
A unidade I cobre os conceitos introdutórios – e importantíssimos – para o entendimento do restante 
do material,a organização de dados em tabelas de frequência, a obtenção de medidas de tendência 
central e posição e a determinação de medidas de dispersão e variabilidade. Esses tópicos fazem parte 
da estatística descritiva (responsável por organizar e descrever os dados coletados).
A unidade II aborda os conceitos de probabilidade simples, distribuição normal de probabilidades 
e determinação da correlação entre duas variáveis por meio do diagrama de dispersão e do 
coeficiente de Pearson.
Procuramos trazer exercícios de aplicação e revisão dos conceitos trabalhados com o intuito de 
auxiliar o desenvolvimento da aprendizagem.
Esperamos que este livro-texto auxilie você, aluno, a entender e aplicar os conceitos básicos de 
estatística, além de servir como guia para que você os relembre e possa aplicá-los sempre que precisar.
9
NOÇÕES DE ESTATÍSTICA
Unidade I
1 CONCEITOS FUNDAMENTAIS
1.1 Conceitos iniciais
A palavra estatística tem origem no vocábulo latino status, que significa estado, e foi utilizada para 
o levantamento de dados por parte do Estado, visando à tomada de decisões.
A estatística é a parte da matemática aplicada que se dedica ao estudo e à interpretação de 
fenômenos coletivos e deles extrai conclusões. Ela fornece métodos para:
• coleta de dados, feita normalmente por meio de um questionário ou da observação direta do 
fenômeno estudado;
• organização e descrição dos dados;
• análise e interpretação dos dados, visando à tomada de decisões.
 Observação
Dados são informações oriundas de observações, contagens, respostas 
ou medições.
A estatística pode ser aplicada às mais diversas áreas do conhecimento, tais como economia, física, 
medicina, psicologia, engenharia, pedagogia e serviço social, para tabular e interpretar os resultados de 
um experimento, e, mais recentemente, para a geração e a interpretação de indicadores.
Esses indicadores são largamente utilizados na gestão dos mais diversos segmentos do conhecimento.
Para um aluno de qualquer curso superior, a estatística é muito importante para:
• organizar e analisar os dados de um experimento científico/observação de um fenômeno em 
qualquer área do conhecimento;
• servir de embasamento para entender analisar e até criar indicadores relevantes em seu trabalho 
(entendendo que, muitas vezes, o egresso de um curso superior pode levar a assumir um cargo de 
gerência no seu segmento de formação).
10
Unidade I
Podemos citar como exemplos de indicadores: o índice de desenvolvimento humano (IDH) de uma 
determinada localidade, a taxa de evasão de clientes de uma empresa de telefonia, o índice de contágio 
da Covid-19 em uma determinada região e os vários indicadores de aprendizado utilizados na educação, 
por exemplo, a taxa de evasão de alunos de uma escola/faculdade, o rendimento dos alunos por meio 
dos indicadores notas e faltas, entre outros.
A estatística pode ser classificada em:
• descritiva: responsável pela coleta, organização e descrição dos dados;
• indutiva: responsável pela análise e interpretação de dados.
A estatística descritiva pode ser interpretada como uma função, cujo objetivo é a observação de 
fenômenos de mesma natureza, a coleta de dados referentes a esses fenômenos e a sua apresentação 
através de gráficos e tabelas, além do cálculo de coeficientes que permitem descrever resumidamente 
os fenômenos (TOLEDO; OVALLE, 1995) – e este é o foco do presente livro-texto.
1.2 Dados
Conforme definido anteriormente, dados (também denominados por alguns autores como variáveis) 
são informações obtidas a partir de medições, resultados de pesquisas, contagens e levantamentos 
em geral.
Alguns exemplos de dados são: o número de alunos de uma classe, o número de eleitores que 
votaram em um determinado candidato em uma eleição, o número de leitos ocupados por infectados 
pela Covid-19 em um hospital e as notas dos candidatos de um determinado concurso público.
Em estatística, os dados podem ser classificados como:
• Qualitativos: são dados compostos de qualquer informação não numérica (adjetivos/atributos/
rótulos). Exemplos: estado civil (solteiro, casado, divorciado); cor dos olhos (pretos, verdes, azuis, 
castanhos); time do coração (Corinthians, Palmeiras, São Paulo, Santos, Cruzeiro); religião praticada 
(católica, protestante, budista, espírita); tipo sanguíneo (A, B, O) etc.
• Quantitativos: são dados compostos de informações numéricas ou contagens e podem ser 
subdivididos em:
— Discretos: são compostos somente por números inteiros e enumeráveis (na maioria das vezes, 
são oriundos de uma contagem). Exemplos: número de filhos, população de um município, 
número de escolas particulares em um determinado local, número de visitas em um determinado 
site na internet etc.
— Contínuos: são compostos por números inteiros ou racionais, tanto na representação 
fracionária como na decimal (na maioria das vezes, são obtidos por meio de uma medição), ou 
11
NOÇÕES DE ESTATÍSTICA
seja, teoricamente, podem assumir qualquer valor entre dois limites. Exemplos: altura, peso, 
preço de um determinado produto, área de um terreno, renda mensal de uma família, o tempo 
gasto em uma viagem nacional, a distância entre dois bairros etc.
Dados Qualitativos
Quantitativos Discretos
Contínuos
Figura 1 – Classificação dos dados em estatística
Para identificarmos de que tipo é uma variável, podemos fazer algumas perguntas que nos ajudarão 
nessa identificação:
• Este valor representa uma quantidade, um valor numérico?
• Se a resposta for sim, é uma variável quantitativa? Se não, é uma variável qualitativa.
• Se for quantitativa, pode assumir qualquer valor entre dois limites ou é um número inteiro?
Se a resposta for sim sobre assumir qualquer valor entre dois limites, a variável é quantitativa 
contínua; caso contrário, é uma variável quantitativa discreta.
Para exemplificarmos os dados qualitativos e quantitativos, utilizaremos uma pesquisa fictícia. 
Observe a tabela a seguir:
Tabela 1 – Dados qualitativos e quantitativos
Estado civil Grau de instrução Número de filhos Salário (x. mínimo) Idade (anos-meses)
Casado Ensino Médio 2 19,40 32 10
Solteiro Ensino Superior – 4,00 23 03
Solteiro Ensino Fundamental – 10,53 25 08
Casado Ensino Médio 1 4,56 48 11
Solteiro Ensino Fundamental – 16,22 31 05
Nessa pesquisa, feita com cinco pessoas, duas perguntas apresentaram como respostas dados 
qualitativos, sendo eles o estado civil e o grau de instrução, pois se referem a informações não numéricas. 
Em contrapartida, três perguntas foram respondidas com dados quantitativos, sendo que uma delas 
é quantitativa discreta (número de filhos), pois são valores inteiros (obtidos a partir de uma contagem) 
12
Unidade I
e duas quantitativas contínuas (salário e idade) por representações decimais (obtidos a partir de 
uma medição).
Exemplo de aplicação
Como você faria a classificação das seguintes variáveis?
a) Número de páginas desta unidade.
b) Peso dos professores de uma escola.
c) Tipos de empresas em relação ao serviço prestado.
d) Tamanho de empresas (pequena, média e grande).
 Observação
A classificação da variável depende do contexto. Por exemplo: para fins 
cadastrais, a variável idade poderia ser quantitativa discreta; na pediatria, 
porém, é contínua, pois os meses também são considerados.
1.3 População versus amostra
População é a coleção de todos os resultados, respostas, medições ou contagens que são de interesse 
e possuem, no mínimo, uma característica comum. Um exemplo são os estudantes de uma instituição 
de ensino, pois a característica comum é o fato de estudarem na mesma instituição. Os eleitores de um 
estado da federação também são um exemplo de população.
Na maioria das vezes, podemos concluir que é inviável ter acesso a toda a população para a coleta 
de dados (por limitações monetárias, de tempo etc.). Logo, normalmente é feita a coleta em uma parte, 
que deve ser muito representativa dessa população. Essa parcela da população é denominada amostra.
Em alguns casos,seria impossível entrevistar todos os elementos de uma população, pois levaria 
muito tempo para concluir o trabalho ou poderia ser financeiramente inviável. Imagine, por exemplo, 
uma pesquisa com os integrantes de equipes multidisciplinares de todas as empresas privadas do 
país. Além de demorar para ser concluída, dependendo de como fosse realizada, implicaria questões 
financeiras inviáveis, bem como a impossibilidade física de examinar toda a população. Desse modo, o 
ideal seria determinar uma amostra representativa da população para participar dessa pesquisa.
Vamos a um exemplo adaptado de Farber e Larson (2015). Imagine que, em determinada pesquisa, 
perguntou-se a 720 proprietários de pequenas empresas no Estado de São Paulo se eles achavam que a 
13
NOÇÕES DE ESTATÍSTICA
presença de sua empresa no Facebook tinha valor. 269 dos 720 responderam que sim. Qual a população 
e a amostra? E como você descreveria o conjunto de dados da amostra?
Solução: a população consiste nas respostas de todos os proprietários de pequenas empresas do 
Estado de São Paulo e a amostra consiste nas respostas dos 720 pequenos empresários pesquisados. 
O conjunto de dados da amostra equivale aos 269 proprietários que responderam “sim” e 451 que 
responderam “não”.
Amostra, portanto, corresponde ao subconjunto finito e representativo de uma população. Para 
obter uma boa amostra, utilizamos a técnica da amostragem. 
1.4 Amostragem
Antes de obter uma amostra, precisamos definir os critérios/técnicas que serão usados para selecionar 
os elementos que farão parte de sua composição. O tipo de amostra está relacionado à técnica que 
usamos para obtê-la. 
Técnicas de amostragem apropriadas devem ser usadas para garantir que as inferências sobre a 
população sejam válidas. Não podemos nos esquecer de que, quando um estudo é realizado com dados 
falhos, os resultados apresentados serão questionáveis.
As três principais técnicas de amostragem são: 
• amostragem simples (ou aleatória); 
• amostragem sistemática; 
• amostragem estratificada.
Na amostragem simples (ou aleatória), todos os elementos da população têm igual chance de 
pertencer à amostra (normalmente feita por sorteio).
Observe como utilizamos essa técnica de amostragem. Vamos obter uma amostra representativa 
para a pesquisa de estatura de 150 alunos de uma escola, num exemplo adaptado de Crespo (2009).
Primeiro, numeramos os alunos de 1 a 150. Escrevemos os números, de 1 a 150, em pedaços iguais 
de um mesmo papel, colocando-os dentro de uma caixa. Depois, agitamos a caixa para misturar bem 
os pedaços de papel e retiramos, um a um, 15 números, que formarão a amostra, a qual, nesse caso, 
equivale a 10% da população.
Quando precisamos de uma amostra com uma grande quantidade de elementos, utilizamos a Tabela 
de Números Aleatórios, construída de modo que os dez algarismos (de 0 a 9) são distribuídos ao acaso 
nas linhas e colunas.
14
Unidade I
Já na amostragem sistemática, os itens encontram-se ordenados e numerados, e a coleta dos 
elementos da amostra é feita periodicamente. Se pensarmos em uma linha de produção, podemos, a 
cada 100 itens feitos, retirar 10 para pertencer a uma amostra de produção diária. Nesse caso, estaríamos 
fixando o tamanho da amostra em 10% da população (CRESPO, 2009).
Como mais um exemplo, suponhamos uma rua contendo 800 prédios, dos quais desejamos obter 
uma amostra de 40 prédios. Podemos, nesse caso, usar o seguinte procedimento: como 
800
40
20= , 
escolhemos por sorteio um número de 1 a 20 (inclusive), o qual indicaria o primeiro elemento sorteado 
para a amostra; os demais elementos seriam periodicamente considerados de 20 em 20. Assim, se o 
número sorteado fosse 7, tomaríamos, pelo lado esquerdo da rua, o 7º prédio, o 27º prédio, o 47º prédio 
etc. até voltarmos ao início da rua, pelo lado direito (CRESPO, 2009).
Na amostragem estratificada, a população encontra-se dividida em vários estratos, e as amostras 
são coletadas aleatoriamente de cada estrato.
Supondo que dos 150 alunos citados no exemplo de amostragem simples, 84 sejam meninos e 
66 sejam meninas, vamos obter a amostra populacional estratificada.
Temos dois estratos, sexo masculino e sexo feminino, e queremos uma amostra de 10% da população. 
Logo, temos:
Tabela 2 
Sexo População 10% Amostra
M 84
10 84
100
840
100
8 4
.
,= = 8
F 66
10 66
100
660
100
6 6
.
,= = 7
Total 150
10 150
100
1500
100
15
. = = 15
Para que possamos identificar o tamanho da amostra a partir de valores decimais, precisamos 
observar o valor que está após a vírgula (nos décimos, já que queremos um valor inteiro). Se esse valor 
estiver compreendido entre 0 e 4, como é o caso da amostra masculina (8,4), nós mantemos a parte 
inteira – que nesse caso é 8. Contudo, se o valor estiver compreendido entre 5 e 9, como é o caso da 
amostra feminina (6,6), nós arredondamos a parte inteira – no nosso exemplo, de 6,6 para 7, como se 
vê na tabela.
Numeramos os alunos de 1 a 150, sendo que de 1 a 84 temos os meninos e de 85 a 150, as meninas. A 
partir de então podemos usar o mesmo sistema empregado na amostragem simples, retirando 8 números 
relacionados aos meninos e 7 relacionados às meninas – lembrando que, para grandes quantidades, 
devemos usar a tabela de números aleatórios.
15
NOÇÕES DE ESTATÍSTICA
 Saiba mais
Após a leitura deste material, você pode aprofundar os estudos em 
amostragem para compreender melhor assuntos como tamanho e nível de 
confiança de amostra lendo o livro a seguir:
BRUNI, A. L. Estatística aplicada à gestão empresarial. São Paulo: 
Atlas, 2007.
Exemplo de aplicação
1. Pesquise um exemplo prático para cada tipo de amostragem.
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
2. Classifique as variáveis em qualitativas ou quantitativas (discretas ou contínuas):
a) População: alunos de uma escola
Variável: cor dos olhos________________________________________
b) População: casais residentes em uma cidade
Variável: número de filhos_____________________________________
c) População: as jogadas de um dado
Variável: os pontos obtidos em cada jogada________________________
d) População: peças produzidas por certa máquina
Variável: número de peças produzidas por hora_____________________
e) População: peças produzidas por certa máquina
Variável: diâmetro externo_____________________________________
f) População: casais residentes em uma cidade
Variável: sexo dos filhos_______________________________________
16
Unidade I
3. Uma escola dos anos iniciais do Ensino Fundamental abriga 124 alunos. Obtenha uma amostra 
representativa correspondendo a 15% da população.
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
4. O diretor de uma escola na qual estão matriculados 280 meninos e 320 meninas, desejoso de 
conhecer as condições de vida extraescolar de seus alunos e não dispondo de tempo para entrevistar 
todas as famílias, resolveu fazer um levantamento por amostragem, em 10% dessa clientela. Obtenha, 
para esse diretor, os elementos componentes da amostra.
5. Uma cidade Y apresenta a seguinte tabela relativa às suas escolas dos anos iniciais do Ensino 
Fundamental:
Tabela 3 – Anos iniciais do Ensino Fundamental
Escolas
Número de estudantes
Masculino Feminino
A 80 95
B 102 120
C 110 92
D 134 228
E 150 130
F 300 290
Total 876 955
Obtenha uma amostra estratificada de 120 estudantes.
______________________________________________________________________________
____________________________________________________________________________________________________________________________________________________________
______________________________________________________________________________
6. Para estudar o uso de serviços de saúde por mulheres em idade reprodutiva, moradoras de uma 
grande capital, um pesquisador buscou no Instituto Nacional de Estatística (INE) as subdivisões da 
idade utilizadas em censos, conhecidas como setores censitários. Como você procederia para tomar uma 
amostra de mulheres moradoras da capital nesses setores e em idade reprodutiva?
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
17
NOÇÕES DE ESTATÍSTICA
7. Uma empresa está interessada em testar a eficácia da propaganda de um novo comercial de 
televisão. Como parte do teste, o comercial é mostrado em um programa de notícias locais, às 18h30. 
Dois dias mais tarde, uma firma de pesquisa de mercados realiza um levantamento telefônico para obter 
informações sobre os índices de respostas (percentagem de telespectadores que responderam ter visto 
o comercial) e impressões sobre o comercial. 
a) Qual é a população desse estudo? __________________________________
b) Qual é a amostra para esse estudo? _________________________________
c) Por que se usaria uma amostra nessa situação? Explique.
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
2 DISTRIBUIÇÃO DE FREQUÊNCIA
2.1 Conceitos básicos
Para compreender melhor todos os conceitos, vamos utilizar uma amostra como exemplo. A 
amostra é de quarenta alunos de uma escola qualquer, e a variável a ser estudada é a estatura deles em 
centímetros.
Observe a tabela dos valos das estaturas (em cm) coletados:
Tabela 4 – Tabela primitiva das estaturas dos alunos
166 161 163 172 160 160 151 58
162 152 156 162 173 169 158 160
155 161 150 156 155 156 164 168
154 161 163 155 157 167 164 164
160 168 160 153 165 155 170 161
Essa tabela com os dados coletados (dados brutos), sem nenhuma organização, é chamada de 
tabela primitiva.
Para analisar os dados na tabela primitiva para determinar a maior e a menor estatura, será necessário 
examinar item a item, o que tende a ser ineficiente, principalmente se o tamanho da amostra for grande. 
Se os dados da tabela forem organizados em ordem crescente ou decrescente, será obtida uma nova 
tabela, chamada rol.
18
Unidade I
Tabela 5 – Rol das estaturas dos alunos
150 155 156 160 161 162 164 168
151 155 156 160 161 163 165 169
152 155 157 160 161 163 166 170
153 155 158 160 161 164 167 172
154 156 158 160 162 164 168 173
Examinando o rol, fica fácil determinar a maior e a menor estatura (173 cm e 150 cm, respectivamente), 
o que permite concluir que a faixa de estaturas é de 150 cm a 173 cm. Inclusive, com uma observação 
mais cuidadosa do rol, podem ser respondidos outros questionamentos, por exemplo: “qual é a estatura 
com o maior número de alunos?” (160 cm) e “qual(is) é(são) a(s) estatura(s) inexistente(s) no intervalo 
de 150 a 173 cm?” (159 e 171 cm).
Para responder ao questionamento anterior com mais agilidade, o rol será alocado em uma tabela, 
em que cada estatura terá um número correspondente de ocorrências (vindo da contagem do rol).
Tabela 6 – Tabela de ocorrências das estaturas dos alunos
Estatura (cm) Número de ocorrências (fi)
150 1
151 1
152 1
153 1
154 1
155 4
156 3
157 1
158 2
159 0
160 5
161 4
162 2
163 2
164 3
165 1
166 1
167 1
168 2
169 1
19
NOÇÕES DE ESTATÍSTICA
Estatura (cm) Número de ocorrências (fi)
170 1
171 0
172 1
173 1
Σfi 40
Onde:
fi = frequência número de ocorrências para cada valor de estatura
Σfi = soma das frequências
Σfi = n
n = quantidade de elementos da amostra (n = 40) 
A tabela de ocorrências para todos os valores das estaturas é chamada de distribuição de 
frequências. Nesse caso, como foram exibidos todos os valores de estatura, a distribuição é classificada 
como sem intervalo.
A amostra tem a faixa de estaturas de 23 cm (basta subtrair a menor estatura da maior), que resulta 
numa tabela com muitas linhas. Se a faixa de estaturas fosse maior, a tabela teria ainda mais linhas, o 
que prejudicaria a rapidez da análise dos dados.
Observe outro exemplo. Um professor organizou os resultados obtidos em uma prova com 25 alunos 
da seguinte forma:
Tabela 7 – Notas dos 25 alunos
4,0 5,0 7,0 9,0 9,0
4,0 5,0 7,0 9,0 9,0
4,0 5,0 7,0 9,0 9,0
4,0 6,0 8,0 9,0 9,0
4,0 6,0 8,0 9,0 9,0
A partir da organização dos dados em rol, podemos tabular as notas para analisar o desempenho 
da turma, a fim de que possam ser consultadas de uma forma simplificada e resumida. Vamos, então, 
elaborar a distribuição de frequência dessas notas por meio de contagem, ou seja, observando o número 
de vezes que cada uma aparece.
20
Unidade I
Tabela 8 – Distribuição de frequências, sem intervalos, para as notas dos alunos
Nota Frequência (f)(número de alunos)
4,0 5
5,0 3
6,0 2
7,0 3
8,0 2
9,0 10
Σfi 25
Podemos perceber, observando a distribuição de frequência, que cinco alunos tiraram nota 4; três 
tiraram nota 5; dois tiraram nota 6 e assim sucessivamente. Também é possível perceber que a maioria 
dos alunos tirou nota 9.
Para gerar uma tabela mais enxuta e de fácil análise, é possível agrupar as estaturas em intervalos. 
No exemplo, as estaturas serão agrupadas de quatro em quatro, gerando intervalos de 4 cm (no 
momento, não há necessidade de se preocupar com a razão de o agrupamento ser de quatro em quatro, 
pois adiante será explicado o critério de cálculo utilizado). Essa tabela é chamada de distribuição de 
frequências com intervalo.
Tabela 9 – Distribuição de frequências com intervalo para as estaturas dos alunos
Estaturas (cm) fi
150  154 4
154  158 9
158  162 11
162  166 8
166  170 5
170  174 3
Σfi 40
Onde:
Não inclui o valor (utiliza-se o anterior)Inclui o valor
É o operador de intervalo
Figura 2 
Vamos a um exemplo. O quinto intervalo da tabela anterior, que mostra 166  170 é para as 
estaturas de 166 a 169 cm (note que o valor 170 cm é considerado no sexto). Os valores do rol que 
21
NOÇÕES DE ESTATÍSTICA
atendem a esse intervalo são: 166, 167, 168 e 169. Esses cinco valores resultam na frequência igual a 5 
para o quinto intervalo.
A etapa da contagem dos valores do rol para a tabela de frequências deve ser feita com o máximo de 
cuidado, pois um erro na contagem ocasiona análises equivocadas e valores errados de todas as medidas 
estatísticas feitas a partir dessa tabela.
Em resumo, uma distribuição de frequência é uma tabela que mostra valores ou intervalos dos valores 
com a contagem da quantidade de vezes em que cada valor ocorre, o que chamamos de frequência f.
 Saiba mais
O modelo de distribuição estudado é o mais utilizado pelos autores, 
porém existem outros modelos, com outros tipos de intervalo além do 
. Matematicamente, um intervalo pode ser representado de diversas 
maneiras, como (, ,  e ).
Para mais informações sobre esse assunto, leia:
MORETTIN, L. G. Estatística básica. São Paulo: Makron Books, 1999.
2.2 Elementos de uma distribuição de frequência
Todos os conceitos a seguir serão explicados com base na distribuição de frequências, que 
acabamos de estudar.
2.2.1 Classe (i)
É cada intervalo ou cada linha para uma tabela de frequências. O total de classes de uma tabela de 
frequências é denominado k.
Exemplo
i = 3 (terceira classe: 158  162)
k = 6
2.2.2 Limites de classe (li ou Li)
São os extremos de cada classe, onde li é o limite inferior (extremo da esquerda) e Li éo limite 
superior (extremo da direita) da classe. O índice i apenas indica qual é a classe abordada.
22
Unidade I
Exemplo 
l2 = limite inferior da segunda classe = 154
L5 = limite superior da segunda classe = 170
2.2.3 Amplitude de classe (hi)
É a medida do intervalo de classe.
hi = Li – li
Exemplo
h3 = amplitude da terceira classe
h3 = L3 – l3 = 162 – 158 = 4 cm
 Observação
Uma distribuição com intervalos sempre terá a mesma amplitude para 
todas as classes. Note que para todos os intervalos o h é 4.
2.2.4 Amplitude amostral (AA)
É a diferença entre o valor máximo e o valor mínimo da amostra. É obtido por meio do rol (tabela 5).
AA = Xmax – xmin
Exemplo 
Amplitude amostral para as estaturas dos alunos:
AA = 173 – 150 = 23 cm
2.2.5 Ponto médio de classe (xi)
É o ponto que divide a classe em duas partes iguais. Será muito utilizado a partir deste ponto do 
nosso livro-texto.
xi
li Li= +
2
23
NOÇÕES DE ESTATÍSTICA
Exemplo 
Ponto médio da segunda classe:
x cm2
154 158
2
156= + =
2.3 Tipos de frequências
2.3.1 Frequência absoluta ou simples (fi)
É o número de ocorrências para cada uma das classes, obtida por meio de contagem no rol.
Exemplo 
f3 = 11
2.3.2 Frequência relativa (fri)
É a razão (divisão) da frequência simples com a soma das frequências da classe. Fornece a participação 
percentual de cada classe em relação à amostra.
fri
fi
fi
=
Σ
 Observação
Σ fi = n (significa que a soma das frequências é igual ao número de 
elementos do rol).
Σ fri = 1 (significa que a soma das frequências relativas deve ser sempre 
igual a 1, que indica 100%). 
Exemplo 
fr
f
fi
2
2 9
40
0 225= = =
Σ
,
Isso quer dizer que 22,5% das estaturas estão na segunda classe, pois 0,225 x 100 = 22,5%.
24
Unidade I
2.3.3 Frequência acumulada (Fi)
É a soma das frequências até a classe indicada.
Exemplo 
F2 = frequência acumulada da segunda classe = soma das frequências simples até a segunda classe.
F2 = 4 + 9 = 13
Finalmente temos a distribuição com as frequências e os pontos médios calculados.
Tabela 10 – Distribuição de frequências com intervalo para 
as estaturas dos alunos, com as frequências acumuladas
I Estaturas (cm) fi xi fri Fi
1 150  154 4 152 0,100 4
2 154  158 9 156 0,225 13
3 158  162 11 160 0,275 24
4 162  166 8 164 0,200 32
5 166  170 5 168 0,125 37
6 170  174 3 172 0,075 40
Σfi 40 1,000
Atenção aos seguintes pontos:
• Para a coluna fi, contar cuidadosamente os elementos do rol, lembrando-se da notação de 
intervalo e considerando as repetições.
• Para facilitar a determinação da coluna xi, basta calcular o ponto médio, a primeira classe (152) e 
somar a amplitude de classe (4), intervalo por intervalo.
• Não é obrigatório, mas é altamente recomendável utilizar duas ou três casas após a vírgula para 
os valores fri, visando sempre a um percentual preciso por classe.
• Note que o último valor de Fi é sempre a soma das frequências.
2.4 Construção de distribuições de frequências
2.4.1 Distribuição sem intervalo
A tabela a seguir fornece o rol de uma pesquisa referente ao número de crianças por residência em 
uma determinada rua de São Paulo (n = 20).
25
NOÇÕES DE ESTATÍSTICA
Tabela 11 – Rol do número de crianças por residência
0 1 1 2 3
0 1 1 2 3
1 1 1 2 4
1 1 2 2 4
Análise: esse rol apresenta poucas possibilidades de valores para a variável, mais precisamente de 
0 a 4 crianças, e isso permite concluir que a distribuição sem intervalos é a mais indicada.
Logo, para construir a distribuição de frequências sem intervalos, não existe nenhum cálculo. 
A partir do rol, basta colocar em cada classe um dos valores da variável e contar o número de ocorrências 
para cada classe.
Tabela 12 – Distribuição de frequências sem intervalo 
para o rol do número de crianças por residência
Número de crianças fi
0 2
1 9
2 5
3 2
4 2
Σfi 20
2.4.2 Distribuição com intervalo
Vamos usar como base o rol das estaturas dos alunos (n = 40), já mostrado e repetido a seguir para 
fins didáticos:
Tabela 13 – Repetição do rol das estaturas dos alunos
150 155 156 160 161 162 164 168
151 155 156 160 161 163 165 169
152 155 157 160 161 163 166 170
153 155 158 160 161 164 167 172
154 156 158 160 162 164 168 173
Análise: este rol apresenta muitas possibilidades de valores para a variável, mais precisamente de 
150 cm a 173 cm (o que resultaria em uma distribuição sem intervalo com muitas linhas, como vimos 
na tabela 5), e isso permite concluir que a distribuição com intervalos é a mais indicada.
Logo, para construir a distribuição de frequências com intervalos, é necessário determinar:
26
Unidade I
• O número de classes da distribuição (k):
k n=
Onde o valor de k deve ser sempre arredondado para um valor inteiro.
Para o rol das estaturas dos alunos:
K = =40 6 32, , arredondando temos 6.
Logo k = 6 (a distribuição deverá ter 6 classes).
 Lembrete
Quando precisamos trabalhar com valores arredondados, a técnica 
mais utilizada é: 
• quando o algarismo anterior ao da casa decimal que você quer 
arredondar for maior ou igual a 5, devemos aumentar 1 na casa 
decimal escolhida (por exemplo, ao arredondar 6,25 para a casa dos 
décimos, o arredondamento fica 6,3);
• quando o algarismo for menor do que 5, devemos manter o valor 
da casa decimal escolhida para ser arredondada (por exemplo, ao 
arredondar 6,23 para a casa dos décimos, o arredondamento fica 6,2). 
• A amplitude de classe (h):
h
AA
k
=
Em que o valor de h sempre será arredondado para cima.
Para o rol das estaturas dos alunos:
h = − = =173 150
6
23
6
3 83, , arredondando para cima, temos 4.
Logo h = 4 (cada uma das classes terá a amplitude de 4 cm).
De posse das duas informações necessárias para montar uma tabela com intervalo (k = 6 e h = 4), 
realizamos o seguinte procedimento:
27
NOÇÕES DE ESTATÍSTICA
Passo 1: colocar o menor valor do rol no limite inferior da primeira classe.
Passo 2: somar o valor de h calculado e colocar no limite superior da primeira classe. Colocar o sinal 
de intervalo entre os limites.
Tabela 14 – Início da construção de uma distribuição sem intervalo
i Estaturas (cm)
1 150  154 
Passo 3: repetir o limite superior da classe em foco na classe seguinte.
Tabela 15 – Andamento da construção de uma distribuição sem intervalo
i Estaturas (cm)
1 150  154 
2 154
Passo 4: somar o valor de h (h = 4) calculado e colocar no limite superior dessa classe. Colocar o 
sinal de intervalo entre os limites.
Tabela 16 – Andamento da construção de uma distribuição sem intervalo
i Estaturas (cm)
1 150  154 
2 154  158
Passo 5: repetir os passos 3 e 4 até completar o total de intervalos k calculados (k = 6).
Passo 6: determinar as frequências simples (pela contagem no rol) para todas as classes da 
distribuição. Finalmente, somar as frequências, lembrando que ∑fi deve ser igual a n.
Tabela 17 – Distribuição sem intervalo finalizada
I Estaturas (cm) fi
1 150├ 154 4
2 154├ 158 9
3 158├ 162 11
4 162├ 166 8
5 166├ 170 5
6 170├ 174 3
∑fi 40
k = 6
h=4
28
Unidade I
 Observação
Esse é um dos critérios existentes para se construir uma distribuição de 
frequências com intervalo de classe. Existe também o critério de Sturges, 
que também é bem conhecido. A principal diferença está no cálculo de k, 
pois, nesse caso, k é dado por:
k = 1 + 3,3 log n
2.5 Representações gráficas
Para a distribuição com intervalo, podemos representar os dados utilizando dois tipos de gráfico: o 
histograma e o polígono de frequências. 
2.5.1 Histograma (gráfico de colunas)
O histograma é composto da seguinte forma: 
• no eixo x (horizontal): os limites das classes da variável em estudo;
• no eixo y (vertical): as frequências para cada uma das classes;
• a altura da barra será proporcional à frequência de cada uma das classes.
f
12
9
6
3
0
150 154 158 162 170166 174 estaturas (cm)
Figura 3 – Histograma para uma distribuição com intervalo (usando como base a tabela 17)
2.5.2 Polígono de frequências (gráfico cartesiano)
A composiçãodo polígono de frequências é feita da seguinte forma:
• no eixo x (horizontal): os pontos médios das classes da variável em estudo;
29
NOÇÕES DE ESTATÍSTICA
• no eixo y (vertical): as frequências para cada uma das classes;
• ligar os pontos (no cruzamento das coordenadas dos eixos x e y). 
Para fechar o polígono, deve-se:
• subtrair a amplitude de classe (no exemplo, h = 4) do ponto médio da primeira classe (l1) para 
fechar o polígono pela esquerda (no eixo x);
• somar a amplitude da classe (h = 4) no ponto médio da última classe da distribuição para fechar 
o polígono pela direita.
f
12
9
6
3
0
150 154 158 162 166 174170 Estaturas (cm)
Figura 4 – Polígono de frequências para uma distribuição com intervalo (usando como base a tabela 17)
Apresentaremos também outros tipos de representações gráficas, as quais podem ser utilizadas para 
a distribuição sem intervalo.
2.5.3 Gráfico em colunas
Os gráficos em colunas são construídos tendo como eixo horizontal os valores da variável e na vertical 
a frequência. Assim, as colunas serão tanto mais altas quanto maior a frequência daquela variável.
10
9
5
8
4
7
3
1
6
2
0
0 1 2
Número de crianças
Fr
eq
uê
nc
ia
3 4
Figura 5 – Gráfico em colunas para uma distribuição sem intervalo (usando como base a tabela 12)
30
Unidade I
2.5.4 Gráfico em barras
Diferentes dos gráficos em colunas, os gráficos em barras são construídos tendo como eixo horizontal 
a frequência e na vertical os valores da variável.
1086420
0
1
2
3
4
Frequência
N
úm
er
o 
de
 c
ria
nç
as
Figura 6 – Gráfico em barras para uma distribuição sem intervalo (usando como base a tabela 12)
2.5.5 Gráfico em linhas
Como o próprio nome indica, aqui os dados são representados por pontos unidos por linhas. Esse 
tipo de gráfico costuma ser usado para controlar alterações dos dados ao longo do tempo, o que facilita 
a identificação de tendências.
10
7
4
9
6
3
1
8
5
2
0
0 1
Número de crianças
Fr
eq
uê
nc
ia
2 3 4
Figura 7 – Gráfico em linhas para uma distribuição sem intervalo (tabela 12)
31
NOÇÕES DE ESTATÍSTICA
2.5.6 Gráfico em setores
O gráfico de setores, também conhecido como gráfico circular ou gráfico de pizza, costuma ser usado 
para a representação de valores percentuais, no nosso caso, para a representação da frequência relativa. 
Tabela 18 – Distribuição de frequências sem intervalo 
para o rol do número de crianças por residência
Número de crianças fi fri (%)
0 2 10
1 9 45
2 5 25
3 2 10
4 2 10
Σfi 20 100
O tamanho de cada setor é estabelecido por meio de uma regra de três simples, lembrando que a 
circunferência tem 360°, o que corresponde a 100% da frequência relativa. 
Assim, se usarmos como exemplo a frequência relativa da terceira classe, temos:
100 360
25
100 25 360
9000
100
90
%
%
.
− °
−



= → = → = °
x
x x x
Dessa forma, o setor que representa 25% dos dados tem 90°.
0
1
2
3
4
45%
25%
10%
10%
10%
Figura 8 – Gráfico em setores para uma distribuição sem intervalo (tabela 12)
32
Unidade I
2.5.7 Diagrama de dispersão
Esse gráfico representa a possível relação entre duas variáveis. Ele é muito usado para indicar a 
correlação entre as medidas de dispersão. 
Na figura a seguir, o gráfico representa a relação entre MPG (milhas por galão – ou quilômetros por 
litro, no Brasil) para dirigir na cidade e potência.
MPG Cidade X Potência
Horsepower (Potência)
M
PG
 C
ity
 (M
PG
 C
id
ad
e)
300150 250100 20050
15
20
25
30
35
40
45
Figura 9 – Diagrama de dispersão 
Exemplo de aplicação
1. As notas obtidas por 50 alunos de uma classe foram:
Tabela 19 
1 2 3 4 5 6 6 7 7 8
2 3 3 4 5 6 6 7 8 8
2 3 4 4 5 6 6 7 8 9
2 3 4 5 5 6 6 7 8 9
2 3 4 5 5 6 7 7 8 9
a) Complete a distribuição de frequência a seguir:
33
NOÇÕES DE ESTATÍSTICA
Tabela 20 
i Notas fi xi
1 0  2 1 1
2 2  4
3 4  6
4 6  8
5 8  10
Σfi 50
b) Agora, responda:
i. Qual é a amplitude amostral? __________________________________
ii. Qual a amplitude da distribuição? _______________________________
iii. Qual é o número de classes da distribuição? _______________________
iv. Qual o limite inferior da quarta classe? ___________________________
v. Qual o limite superior da classe de ordem 2? _______________________
vi. Qual a amplitude do segundo intervalo de classe? ___________________
c) Complete:
i. h3 = ____
ii. n = ____
iii. l1 = ____
iv. L3 = ____
v. x2 = ____
vi. f5 = ____
2. A tabela a seguir traz as notas de um teste de inteligência aplicado a 100 alunos. Use-a para 
formar uma distribuição de frequência.
34
Unidade I
Tabela 21 
64 78 66 82 74 103 78 86 103 87
73 95 82 89 73 92 85 80 81 90
78 86 78 101 85 98 75 73 90 86
86 84 86 76 76 83 103 86 84 85
76 80 92 102 73 87 70 85 79 93
82 90 83 81 85 72 81 96 81 85
68 96 86 70 72 74 84 99 81 89
71 73 63 105 74 98 78 78 83 96
95 94 88 62 91 83 98 93 83 76
94 75 67 95 108 98 71 92 72 73
3. Complete os dados que faltam na distribuição de frequência nas tabelas a seguir:
a)
Tabela 22 
i xi fi fri Fi
1 0 1 0,05
2 1 0,15 4
3 2 4
4 3 0,25 13
5 4 3 0,15
6 5 2 18
7 6 19
8 7
ΣΣ 20 1,00
b)
Tabela 23 
i Classes xi fi fri Fi
1 0  2 1 4 0,04
2 2  4 8
3 4  6 5 30 0,18
4 7 27 0,27
5 8  10 15 72
6 10  12 83
7 13 10 93 0,10
8 14  16 0,07
Σ
35
NOÇÕES DE ESTATÍSTICA
3 MEDIDAS DE TENDÊNCIA CENTRAL
Para analisar um conjunto de dados, muitas vezes é necessário obter um único valor que represente 
toda a amostra em estudo. Esse valor é usualmente obtido pelas medidas de tendência central.
As medidas de tendência central abordadas serão:
• a média (x);
• a moda (Mo);
• a mediana (Md).
O cálculo de cada uma das medidas de tendência central será explicado em três abordagens:
• dados não agrupados (não alocados em tabelas de frequência);
• distribuição de frequência sem intervalo;
• distribuição de frequência com intervalo.
3.1 Média (x) 
A média de um conjunto de dados é a soma dos dados dividida pelo número de elementos 
do conjunto.
3.1.1 Dados não agrupados
x
xi
n
= ∑
Onde:
Σ xi é a soma dos valores do conjunto de dados
n é o número de elementos do conjunto de dados
Exemplo 
As notas de um aluno em uma determinada disciplina durante o ano foram: 3,5; 5,0; 6,5 e 9,0. A nota 
média do aluno na disciplina pode ser calculada por:
x = + + + = =3 5 5 0 6 5 9 0
4
24
4
6 0
, , , ,
,
36
Unidade I
3.1.2 Distribuição de frequências sem intervalo
x
xi fi
n
= ∑ .
Onde:
xi.fi é a multiplicação dos valores das classes com as respectivas frequências, classe por classe
n é o número de elementos do conjunto de dados que, nesse caso, é determinado pela soma 
das frequências
Exemplo 
Dada a distribuição sem intervalo da tabela 12, determine o número médio de crianças por residência 
em uma determinada rua.
Para armazenar os valores de xi.fi, uma coluna é criada. Em seguida, os valores da coluna são somados, 
gerando Σxi.fi.
Tabela 24 – Cálculo da média para uma distribuição sem intervalo
Número de crianças fi xi.fi
0 2 0 x 2 = 0
1 9 1 x 9 = 9
2 5 2 x 5 = 10 
3 2 3 x 2 = 6
4 2 4 x 2 = 8
ΣΣ 20 Σxi.fi = 33
x = =33
20
165,
Logo, no bairro citado há em média 1,65 crianças por residência (para efeito de interpretação, 
aproximadamente 2 crianças por residência).
3.1.3 Distribuição de frequências com intervalo
x
xi fi
n
= ∑ .
37
NOÇÕES DE ESTATÍSTICA
Onde:
xi.fi é a multiplicação dos pontos médios das classes com as respectivas frequências, classe por classe
Lembrando que:
x
li Li= +
2
n é o número de elementos do conjunto de dados que, nesse caso, é determinado pela soma 
das frequências
Exemplo 
Dada a distribuição com intervalo da tabela 17, determine a estatura média dos alunos que 
compõem a amostra.
O procedimento é similar ao da distribuição sem intervalo, apenas com o detalhe de xi que, para uma 
distribuição com intervalo, é o ponto médio da classe.
Tabela 25 – Cálculo da média para uma distribuição com intervalo
i Estaturas (cm) fi xi xi.fi
1150  154 4
150 154
2
152
+ = 152 x 4 = 608
2 154  158 9
154 158
2
156
+ = 156 x 9 = 1404
3 158  162 11
158 162
2
162
+ = 160 x 11 = 1760
4 162  166 8
162 166
2
164
+ = 164 x 8 = 1312
5 166  170 5
166 170
2
168
+ = 168 x 5 = 840
6 170  174 3
170 174
2
172
+ = 172 x 3 = 516
Σfi 40 Σwi.fi = 6440
x cm= =6440
40
161
Logo, a estatura média para a amostra de alunos é de 161 cm.
38
Unidade I
 Observação
Uma análise muito simples é comparar os dados com a média. No 
exemplo anterior, temos estaturas acima e abaixo da média. Logo, a média 
pode ser um interessante indicador de classificação.
Exemplo de aplicação
Compare as vendas mensais com uma média histórica para indicar o desempenho de cada vendedor.
 Observação
Além da média que estudamos, muito utilizada como indicador de 
tendência, existem outros tipos, como: média ponderada, que também 
indica tendência e considera os valores da variável com pesos diferentes, e 
a média móvel em um determinado número de valores (tipicamente de 3 a 12), 
largamente utilizada no cálculo de previsão.
3.2 Moda (Mo)
A moda é o valor que ocorre com maior frequência em um conjunto de dados. Serve para indicar as 
regiões das máximas frequências.
3.2.1 Dados não agrupados
Dados os conjuntos a seguir, a moda será determinada analisando-se as maiores frequências.
Exemplos:
Conjunto 1:
20 30 40 80 10 10 20 30 20
O valor 20 se repete mais vezes que os outros (possui maior frequência).
Mo = 20
Conjunto 2:
10 20 30 30 30 40 50 50 50 60
39
NOÇÕES DE ESTATÍSTICA
Os valores 30 e 50 se repetem mais vezes que os outros valores do conjunto; logo, existem duas 
modas (30 e 50).
Mo = 30 e Mo = 50 (conjunto bimodal)
Conjunto 3:
100 110 124 145 101 200 500
Nenhum valor se repete mais vezes do que os outros valores do conjunto; logo, não existe valor 
modal (conjunto amodal).
3.2.2 Distribuição de frequências sem intervalo
Para determinar a moda em uma distribuição sem intervalo, basta identificar a classe com maior 
frequência simples (classe modal). A moda será o valor da variável da classe modal.
Exemplo 
Dada a distribuição sem intervalo da tabela 12, determine o valor modal das crianças por residência 
em uma determinada rua.
Tabela 26 – Obtenção da moda para uma distribuição sem intervalo
N. de crianças fi
0 2
1 9
2 5
3 2
4 2
∑ 20
Maior fi na segunda classe (classe modal)
O valor da variável para a classe modal é igual a 1; logo, Mo = 1.
3.2.3 Distribuição de frequências com intervalo
Para determinar a moda em uma distribuição com intervalo, inicialmente é necessária a classe modal 
(da mesma forma que na distribuição sem intervalo).
Nesse caso, a moda será obtida aplicando-se a fórmula a seguir na classe modal:
40
Unidade I
Mo l
d
d d
h* *= +
+
1
1 2
.
Onde:
l* é o limite inferior da classe modal
h* é a amplitude da classe modal
d1 = f* - fant
d2 = f* - fpost
f* é a frequência simples da classe modal
fant é a frequência simples anterior (acima) à classe modal
fpost é a frequência simples posterior (abaixo) à classe modal
Existem vários modelos para cálculo da moda. O modelo aqui apresentado é o mais utilizado e 
chama-se moda de Czuber.
Exemplo 
Dada a distribuição com intervalo da tabela 17, determine a estatura modal dos alunos que 
compõem a amostra.
Tabela 27 – Cálculo da média para uma distribuição com intervalo
i Estaturas (cm) fi
1 150├ 154 4
2 154├ 158 9
3 158├ 162 11
4 162├ 166 8
5 166├ 170 5
6 170├ 174 3
∑fi 40
Maior fi na terceira classe (classe modal)
l* = 158
h* = 4
d1 = 11 – 9 = 2
d2 = 11 – 8 = 3
41
NOÇÕES DE ESTATÍSTICA
Logo:
Mo = +
+
158
2
2 3
4.
Mo = + = +158 8
5
158 16,
Mo = 159,6 cm
 Observação
Assim como nos dados não agrupados, uma distribuição pode ser 
bimodal, desde que existam duas maiores frequências. Nesse caso, basta 
calcular as modas para as duas classes modais. Isso vale para mais de duas 
modas em uma distribuição, ainda que essa ocorrência não seja tão comum.
3.3 Mediana (Md)
A mediana é o valor que caracteriza o centro de uma distribuição de frequências. Divide um conjunto 
ordenado de dados em duas partes iguais de 50% (daí o fato de a mediana ser considerada também uma 
medida de posição).
3.3.1 Dados não agrupados
Dados os conjuntos a seguir, antes de determinar a mediana, é necessário ordenar os dados 
da amostra.
Exemplos: 
Conjunto ordenado 1:
20 30 50 80 190 210 300
Esta é uma amostra ímpar, pois possui 7 elementos (n = 7).
Para amostras ímpares, a mediana é o elemento central da série de dados.
Logo, Md = 80
42
Unidade I
Conjunto ordenado 2:
100 230 300 500 600 800
Esta é uma amostra par, pois possui 6 elementos (n = 6).
Para amostras pares, existem dois elementos centrais na série de dados, então a mediana é a 
média de ambos.
Logo, Md = +300 500
2
Md = 800
2
Md = 400
3.3.2 Distribuição de frequências sem intervalo
Para determinar a mediana em uma distribuição sem intervalo, é necessário:
Passo 1: determinar as frequências acumuladas (Fi) de todas as classes da distribuição.
Passo 2: identificar a classe mediana. Para isso, é necessário calcular uma referência.
∑ fi
2
Passo 3: comparar o valor da referência com cada uma das frequências acumuladas. Se houver uma 
Fi igual à referência, a classe dessa Fi será a classe mediana. Caso contrário, deverá ser escolhida a Fi 
superior mais próxima da referência para obter a classe mediana.
Passo 4: a mediana é o valor da variável da classe encontrada (classe mediana).
Exemplo 
Dada a distribuição sem intervalo da tabela 28, determine o valor da mediana.
∑ = =fi
2
20
2
10 (referência)
43
NOÇÕES DE ESTATÍSTICA
Tabela 28 – Obtenção da mediana para a distribuição sem intervalo
Número de crianças fi Fi
0 2 2
1 9 11
2 5 16
3 2 18
4 2 20
∑ 20
Valor de Fi (11) superior mais próximo da referência 
(10). Esta é a classe mediana (segunda classe)
O valor da variável para a classe mediana é igual a 1; logo, Md = 1.
3.3.3 Distribuição de frequências com intervalo
Para determinar a mediana em uma distribuição com intervalo, inicialmente é necessária a classe 
mediana (da mesma forma que na distribuição sem intervalo, isto é, seguindo os passos 1, 2 e 3).
Nesse caso, a mediana será obtida aplicando-se a fórmula a seguir na classe mediana:
Md l
fi
Fant
f
h* *
*= +
∑ −


2 .
Onde:
I* é o limite inferior da classe mediana
∑ fi
2
 é a referência, já calculada anteriormente, para a escolha da classe mediana
Fant é a frequência acumulada anterior (acima) à classe mediana
f* é a frequência simples da classe mediana
h* é a amplitude da classe mediana
Exemplo 
Dada a distribuição com intervalo da tabela 17, determine a estatura mediana dos alunos que 
compõem a amostra.
∑ = =fi
2
40
2
20 (referência)
44
Unidade I
Tabela 29 – Obtenção da mediana para uma distribuição com intervalo
i Estaturas (cm) fi Fi
1 150├ 154 4 4
2 154├ 158 9 13
3 158├ 162 11 24
4 162├ 166 8 32
5 166├ 170 5 37
6 170├ 174 3 40
∑fi 40
Valor de Fi (24) superior mais próximo da 
referência (20). Esta é a classe mediana 
(terceira classe)
I* = 158
∑ =fi
2
20
Fant = 17 = 13 + 4
f* = 11
h* = 4
Logo:
Md = +
−[ ]
.158
20 17
11
4
Md = + .158 3
11
4
Md = +158 12
11
Md = 158 + 1,09
Md = 159,09 cm
Concluindo: a estatura que divide os 50% mais altos dos 50% mais baixos é de 159,09 cm.
45
NOÇÕES DE ESTATÍSTICA
 Observação
Além da mediana, uma medida tanto de tendência quanto de posição, 
existem outras importantes, como o quartil, o decil e o percentil. O método 
de obtenção é muito parecido com o da mediana, que tem dois como 
referências nos cálculos. O quartil, o decil e o percentil, por sua vez, dividem 
uma série em quatro, dez ou cem partes iguais.
Exemplos de aplicação
1. Complete a tabela a seguir e calcule a média aritmética da distribuição:
Tabela 30 
xi fi xi.fi
1 2 2
2 4
3 6
4 8
5 3
6 1
ΣΣ
2. Complete a tabela a seguir e calcule a média aritmética da distribuição:
Tabela 31 
i xi fi xi.fi
1 500 8 4000
2 600 10
311
4 16
5 13
6 5
7 1100 1
ΣΣ Σ
46
Unidade I
3. Complete a tabela a seguir e calcule a moda da distribuição:
Tabela 32
i Custos (R$) fi
 1 450  550 8
2 550  650 10
3 650  750 11
4 750  850 16
5 850  950 13
6 950  1050 5
7 1050  1150 1
ΣΣ Σ 64
4. Complete as tabelas seguintes e calcule a mediana da distribuição:
a)
Tabela 33 
xi fi Fi
2 3
4 7 10
6 12
8 8 30
10 4
Σ
b)
Tabela 34 
xi fi Fi
0 2 2
1 5
2 9
3 7
4 6
5 3
Σ
47
NOÇÕES DE ESTATÍSTICA
4 MEDIDAS DE DISPERSÃO
4.1 Introdução
As medidas de dispersão têm como finalidade indicar o quanto os dados apresentam-se dispersos 
em torno de uma região central, isto é, mostram o grau de variação em uma amostra.
As medidas de dispersão abordadas são:
• a variância (s2);
• a desvio-padrão (s);
• o coeficiente de variação (CV).
 Observação
Além das medidas de dispersão estudadas, existem modelos mais 
simplificados, como a amplitude e o desvio médio, que têm sua importância, 
porém não são tão utilizados quanto o desvio-padrão.
O cálculo de cada uma das medidas será explicado utilizando-se as três abordagens citadas 
anteriormente. Porém, antes de serem apresentadas as fórmulas e os métodos para o cálculo, é interessante 
acompanhar, por meio de um exemplo, o significado e a importância do cálculo de dispersão.
Exemplo 
Existem três grupos de pessoas (cada um com oito elementos). A variável em estudo é a idade 
das pessoas.
Grupo 1:
20 20 20 20 20 20 20 20
Grupo 2:
18 18 19 20 20 21 22 22
Grupo 3:
2 5 10 13 20 25 35 50
48
Unidade I
Desejamos tirar algumas conclusões sobre os três grupos analisando a principal medida de 
tendência, a média.
x do grupo 1 = 20 20 20 20 20 20 20 20
8
160
8
20
+ + + + + + + = =
x do grupo 2 = 18 18 19 20 20 21 22 22
8
160
8
20
+ + + + + + + = =
x do grupo 3 = 2 5 10 13 20 25 35 50
8
160
8
20
+ + + + + + + = =
Os valores das médias para os três grupos foram iguais, apesar de eles serem totalmente distintos 
quantos às idades:
• No grupo 1, todos os valores coincidem com a média, pois não existem diferenças em relação a 
ela, logo não existe dispersão. É um grupo formado por pessoas de 20 anos de idade.
• No grupo 2, os valores não coincidem exatamente com a média, mas também não se afastam 
muito dela, logo, existe uma pequena dispersão. É um grupo formado por pessoas com idades 
próximas de 20 anos.
• No grupo 3, a maioria dos valores estão bem afastados da média, logo, existe uma considerável 
dispersão. É um grupo formado pelas mais diversas idades.
Conclusão: apenas utilizando a média, os três grupos apresentavam um perfil de idades igual. No 
entanto, considerando também a dispersão das idades (afastamento dos valores em relação à média), 
podemos indicar as diferenças existentes entre os três grupos.
4.2 Variância (s2) 
É a média dos quadrados das diferenças dos valores em relação à sua média.
4.2.1 Dados não agrupados
s
xi x
n
2
2
=
∑ −( )
Onde: 
xi são os valores da variável
x é a média do conjunto de valores
n é o número de elementos do conjunto de valores
49
NOÇÕES DE ESTATÍSTICA
Exemplo 
As notas que um aluno tirou em uma determinada disciplina durante o ano foram: 
• 3,5 
• 5,0 
• 6,5 
• 9,0 
A variância das notas do aluno na disciplina pode ser calculada por:
• Obtenção da média:
x = 3 5 5 0 6 5 9 0
4
24
4
6 0
, , , ,
,
+ + + = =
• Obtenção da variância utilizando uma tabela para organizar os cálculos.
Tabela 35 – Tabela para auxiliar na obtenção 
da variância de dados não agrupados
xi xi - x (xi - x)2
3,5 3,5 – 6 = -2,5 (-2,5)2 = 6,25
5,0 5 – 6 = -1 (-1)2 = 1
6,5 6,5 – 6 = 0,5 (0,5)2 = 0,25
9,0 9 – 6 = 3 (3)2 = 9
Σ = 24 Σ(xi - x)2 = 16,5
s2
16 5
4
4 13= =, ,
 Observação
O número elevado ao quadrado é o produto do desse número por ele 
mesmo. Para os cálculos deste livro-texto, uma calculadora com operações 
básicas (+, -, x e /) e raiz quadrada é mais do que suficiente. 
50
Unidade I
4.2.2 Distribuição de frequências sem intervalo 
s
xi x fi
n
2
2
=
∑ −( ) .
Onde: 
xi são os valores da variável para cada classe
x é a média dos valores da distribuição
fi é a frequência simples de cada classe
n é o número de elementos do conjunto de valores
Exemplo 
Dada a distribuição sem intervalo da tabela 12, determine a variância de crianças por residência em 
uma determinada rua.
Obtendo a média:
x = 33
20
165= , crianças
 Lembrete
Vimos o conceito de obtenção da média quando falamos sobre 
distribuição de frequências sem intervalo, no título 3.1.2.
Tabela 36 – Cálculo da variância para uma distribuição sem intervalo
N. de crianças (xi) fi xi.fi xi - x (xi - x)2 (xi - x)2 . fi
0 2 0.2 = 0 0-1,65=-1,65 (-1,65)2 = 2,72 2,72x2 = 5,44
1 9 1.9 = 9 1-1,65=-0,65 (-0,65)2 = 0,42 0,42x9=3,78
2 5 2.5 = 10 2-1,65=0,35 (0,35)2 = 0,12 0,12x5=0,60
3 2 3.2 = 6 3-1,65=1,35 (1,35)2 = 1,82 1,82x2=3,64
4 2 4.2 = 8 4-1,65=2,35 (2,35)2 = 5,52 5,52x2=11,04
Σ 20 Σxi . fi = 33 Σ(xi - x)2 = 24,5
51
NOÇÕES DE ESTATÍSTICA
Logo:
s =
24,5
20
=1232 2crian asç
 Observação
Um dos problemas do uso direto da variância é que a unidade e o valor 
estarão elevados ao quadrado.
4.2.3 Distribuição de frequências com intervalo
Considere:
s
xi x fi
n
2
2
=
∑ −( ) .
Onde: 
xi é o ponto médio para cada classe
Lembrando que:
xi
li Li= +
2
Onde: 
x é a média dos valores da distribuição
fi é a frequência simples de cada classe
n é o número de elementos do conjunto de valores
Exemplo 
Dada a distribuição com intervalo da tabela 17, determine a variância das estaturas dos alunos que 
compõem a amostra.
O procedimento é similar ao da distribuição sem intervalo, apenas com o detalhe de xi que, para uma 
distribuição com intervalo, é o ponto médio da classe.
52
Unidade I
Tabela 37 – Cálculo da variância para uma distribuição com intervalo
a)
i Estaturas (cm) fi xi xi.fi
1 150  154 4
150 154
2
152
+ = 152 x 4 = 608
2 154  158 9
154 158
2
156
+ = 156 x 9 = 1404
3 158  162 11
158 162
2
162
+ = 160 x 11 = 1760
4 162  166 8
162 166
2
164
+ = 164 x 8 = 1312
5 166  170 5
166 170
2
168
+ = 168 x 5 = 840
6 170  174 3
170 174
2
172
+ = 172 x 3 = 516
Σfi 40 Σxi . fi = 6440
x = 6440
40
161= cm
b) 
Tabela 38 
xi . x (xi . x)2 (xi . x)2 . fi
152 – 161 = -9 (-9)2 = 81 81 x 4 = 324
156 – 161 = -5 (-5)2 = 25 25 x 9 = 225
160 – 161 = -1 (-1)2 = 1 1 x 11 = 11
164 – 161 = 3 (3)2 = 9 9 x 8 = 72
168 – 161 = 7 (7)2 = 49 49 x 5 = 245
172 – 161 = 11 (11)2 = 121 121 x 3 = 363
Σ (xi . x)2 . fi = 1240
Logo:
s cm2 2
1240
40
31= =
53
NOÇÕES DE ESTATÍSTICA
4.3 Desvio-padrão (s) 
É a raiz quadrada da variância. É a medida de dispersão mais utilizada, por ter a mesma unidade que 
a média, possibilitando uma melhor avaliação da dispersão da amostra.
4.3.1 Dados não agrupados
Considere:
s
xi x
n
=
−( )2
Onde: 
xi são os valores da variável
x é a média do conjunto de valores
n é o número de elementos do conjunto de valores
Utilizando o mesmo exemplo do título 4.2.1:
s2
16 5
4
4 13= =, ,
Logo:
s = =4 13 2 03, ,
4.3.2 Distribuição de frequências sem intervalo
Considere:
s
xi x fi
n
=
−( )2 .
Onde: 
xi são os valores da variável para cada classe
x é a média dos valores da distribuição
54
Unidade I
fi é a frequência simples de cada classe
n é o número de elementos do conjunto de valores
Utilizando o mesmo exemplo do título 4.2.2:
s crian as2 2
24 5
20
123= =, ç
Logo:
s= 1,23=1,11 crian asç
4.3.3 Distribuição de frequências com intervalo
Considere:
s
xi x fi
n
=
−( )2 .
Onde: 
xi é o ponto médio para cada classe
Lembrando que:
xi
li Li= +
2
x é a média dos valores da distribuição
fi é a frequência simples de cada classe
n é o número de elementos do conjunto de valores
Utilizando o mesmo exemplo do título 4.2.3:
s cm2 2
1240
40
31= =
55
NOÇÕES DE ESTATÍSTICA
Logo:
s cm= =31 5 57,
4.4 Coeficiente de variação (CV) 
É o quociente entre o desvio-padrão e a média. Em outras palavras, é a medida de dispersão relativa, 
que indicaa variabilidade percentual da amostra em relação à média.
O coeficiente de variação é útil para a comparação de variabilidade de dois conjuntos de dados com 
unidades de medidas diferentes – por exemplo, quando precisamos comparar altura e peso, idade e 
número de filhos. Quanto menor esse valor, mais homogêneo será o conjunto de dados.
CV
s
x
= .100
A unidade do coeficiente de variação é uma porcentagem (%).
A fórmula e o método de cálculo são exatamente os mesmos para as três abordagens apresentadas.
Vale ressaltar que quanto maior o CV, maior será a variabilidade dos dados do conjunto em relação 
à sua média.
Exemplo 
Calcular o coeficiente de variação do exemplo abordado no título 4.3.3 (estaturas dos alunos).
Como:
x = 161 cm
s = 5,57 cm
Logo:
CV %= = =5 57
161
100
557
161
3 46
,
. ,
As estaturas têm uma variabilidade de 3,46% em relação à média.
56
Unidade I
 Lembrete
É vital ressaltar: o coeficiente de variação é usado para comparar dois 
conjuntos e dados com unidades diferentes. Assim, é útil para a comparação de 
variabilidade de dois conjuntos de dados com unidades de medida diferentes. 
Quanto menor esse valor, mais homogêneo será o conjunto de dados.
Exemplos de aplicação
1. Calcule o desvio-padrão dos conjuntos de dados a seguir:
a) 1, 3, 5, 9
b) 20, 14, 15, 19, 21, 22, 20
c) -10, -6, 2, 3, 7, 9, 10
2. Calcule os desvios-padrão dos conjuntos de dados a seguir:
a)
Tabela 39 
xi fi
2 1
3 3
4 5
5 8
6 5
7 4
8 2
b)
Tabela 40 
Classes fi
1,5  1,6 4
1,6  1,7 8
1,7  1,8 12
1,8  1,9 15
1,9  2,0 12
2,0  2,1 8
2,1  2,2 4
57
NOÇÕES DE ESTATÍSTICA
3. Dada a tabela a seguir, que traz a distribuição relativa a cem lançamentos de cinco moedas 
simultaneamente, calcule o desvio-padrão.
Tabela 41 
Número de caras fi
0 4
1 14
2 34
3 29
4 16
5 3
4. Calcule o desvio-padrão da distribuição:
Tabela 42 
Classes fi
2  6 5
6  10 12
10  14 21
14  18 15
18  22 7
5. Em um exame final de matemática, a nota média de um grupo de 150 alunos foi 7,8 e o 
desvio-padrão 0,80. Em estatística, entretanto, a nota média final foi de 7,3 e o desvio-padrão 0,76. Em 
que disciplina houve a maior dispersão?
58
Unidade I
 Resumo
Nesta unidade abordamos inicialmente os principais conceitos teóricos 
para o estudo dos métodos estatísticos.
Foi apresentada a definição de estatística, bem como a sua divisão 
em estatística descritiva e indutiva, ressaltando que o foco deste material 
é abordar a maior parte da estatística descritiva e o início da indutiva. 
Conceitos como tipos de dados, que podem ser quantitativos (subdivididos 
em discretos e contínuos) e qualitativos foram abordados com uma 
quantidade significativa de exemplos a fim de possibilitar a perfeita 
compreensão de todas as ideias trabalhadas.
Vimos ainda as definições de população e amostra, e foi feita uma 
breve explicação introdutória de amostragem, na qual foram exibidos seus 
principais tipos: aleatória, sistemática e estratificada.
Estudamos os meios de se armazenarem dados quantitativos, que 
anteriormente estavam sob a forma de uma tabela primitiva ou um rol, em 
distribuições de frequências.
Aprendemos que existem dois tipos de distribuições de frequências: 
sem intervalo de classe e com intervalo de classe. Falamos das diferenças 
e dos métodos para a construção de uma tabela de frequências, com 
ou sem intervalo. Ressaltamos que erros, tanto na montagem da tabela 
quanto na contagem dos valores do rol, resultam em análise e medidas ou 
indicadores errados.
Na sequência, apresentamos os principais tipos de frequências 
existentes (simples, relativa e acumulada) e as suas respectivas finalidades. 
Mostramos também a montagem de gráficos (histograma e polígono de 
frequências) para distribuições de frequências com intervalo (por serem as 
mais utilizadas na prática).
Além disso, estudamos as três principais medidas de tendência central: a 
média, a moda e a mediana. As medidas foram analisadas sob três abordagens 
distintas (dados não agrupados, distribuição de frequência sem intervalo e 
distribuição de frequência com intervalo), pois os métodos de obtenção das 
medidas apresentam significativas diferenças para cada abordagem.
Vimos que a média de dados não agrupados é a média aritmética, 
muito utilizada academicamente para verificar o aproveitamento do aluno 
em uma disciplina. Aprendemos ainda que para a obtenção da média para 
59
NOÇÕES DE ESTATÍSTICA
distribuição de frequência, devemos levar em conta tanto a frequência 
quanto o valor da variável.
Abordamos a moda, que indica a(s) maior(es) frequência(s) em uma série 
de dados. Estudamos as três abordagens para a sua obtenção. A mediana, 
posição que indica o centro de uma série de dados (divide a série em duas 
partes de 50%) também foi apresentada das três maneiras.
No que se refere às medidas de dispersão, estudamos as três principais, 
novamente sob as três abordagens (dados não agrupados, distribuição sem 
intervalo e distribuição com intervalo).
Aprendemos que a variância, definida pela média dos quadrados das 
diferenças dos valores em relação à sua média, é importante, porém não 
muito utilizada, pelo fato de a unidade de grandeza envolvida no cálculo 
estar elevada ao quadrado. Vimos, entretanto, que o desvio-padrão, cuja 
definição é a raiz quadrada da variância, é muitíssimo utilizado em várias 
áreas do conhecimento, para quantificar a dispersão de uma série de dados.
Para termos uma noção percentual da dispersão em relação à média, 
foi apresentado o coeficiente de variação, que é uma medida de dispersão 
derivada do desvio-padrão e da média dos dados analisados.
60
Unidade I
 Exercícios
Questão 1. Imagine que, na tabela a seguir, tenhamos as frequências absolutas das idades 
de 132 alunos matriculados no 2º ano do Ensino Médio das escolas situadas em determinada 
cidade brasileira.
Tabela 43 – Idades dos alunos
Idade (anos) Frequência absoluta
14 1
15 16
16 77
17 30
18 6
19 1
22 1
 132
Com base no exposto e nos seus conhecimentos, analise as afirmativas.
I – A figura a seguir representa o gráfico da distribuição percentual das idades do grupo de 
alunos em estudo.
14
15
16
17
18
19
22
12,1%
58,3%
22,7%
4,5%
0,8%
0,8% 0,8%
Figura 10 – Porcentagens – Idades
61
NOÇÕES DE ESTATÍSTICA
II – A figura a seguir representa o gráfico da distribuição das frequências absolutas das idades do 
grupo de alunos em estudo.
2219181716
Idade (anos)
Fr
eq
uê
nc
ia
 a
bs
ol
ut
a
1514
0
10
20
30
40
50
60
70
80
90
Figura 11 – Frequências absolutas – Idades
III – A tabela a seguir representa as frequências relativas das idades do grupo de alunos em estudo.
Tabela 44 
Idade (anos) Frequência relativa
14 0,008
15 0,121
16 0,583
17 0,227
18 0,045
19 0,008
22 0,008
 1
É correto o que se afirma em:
A) I, apenas.
B) II, apenas.
C) III, apenas.
D) I e II, apenas.
E) I, II e III.
Resposta correta: alternativa E.
62
Unidade I
Análise da questão
Na tabela a seguir, temos os cálculos das frequências relativas e dos percentuais relativos à variável 
em estudo (idade do aluno).
Tabela 45 
Idade (anos) Frequência absoluta Frequência relativa Porcentagem
14 1 1/132=0,008 0,008.100%=0,8%
15 16 16/132=0,121 0,121.100%=12,1%
16 77 77/132=0,583 0,583.100%=58,3%
17 30 30/132=0,227 0,227.100%=22,7%
18 6 6/132=0,045 0,045.100%=4,5%
19 1 1/132=0,008 0,008.100%=0,8%
22 1 1/132=0,008 0,008.100%=0,8%
 132 1 1.100%=100%
Pela análise dos dados presentes na tabela anterior, verificamos que as afirmativas I, II e III são corretas.
Questão 2. Laura, assistente social responsável pela creche Infância Feliz, queria saber o número de 
frutas que as crianças comiam por semana. Para isso, fez um levantamento com as mães das crianças e 
obteve os resultados mostrados na tabela a seguir:
Tabela 46 
Nome da criança Número de frutas
Alice 3
Bianca 2
Beatriz 3
Catarina 2
Diego 1
Elsa 5
Fábio 1
Gabriela 2
Júlia 3
Laila 2
Lucas 0
Mariana

Continue navegando