Buscar

MDI Estatística

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 79 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 79 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 79 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

1 
 
Disciplina Estatística 
 
Apresentação 
 
Este material é parte integrante da Disciplina Estatística. Você acessa o ambiente virtual de 
aprendizagem: estuda, realiza as atividades, esclarece as dúvidas com seu professor-tutor! Aqui, 
você reforça o seu estudo, ainda tem a possibilidade de realizar mais atividades, aprimorando, 
assim, o seu aprendizado. 
 
Para ajudá-lo a consolidar seus conhecimentos, ao longo do material, você encontrará ícones com 
funções e objetivos distintos. Observe. 
 
Fique atento: destaca alguma informação importante que não deve ser esquecida por 
você. Também pode acrescentar um conhecimento novo ou uma experiência ao tema 
tratado. 
 
Dica: traz novos conhecimentos em relação ao tema tratado ou pode indicar alguma 
fonte de pesquisa para que você aprofunde ainda mais seus conhecimentos no futuro. 
 
Leitura complementar: indicação de um artigo com o objetivo de você se aprofundar no 
assunto a ser tratado. 
 
Consolidando a aprendizagem: são listas de perguntas cujo objetivo é você confirmar, 
negar ou criar um novo conhecimento ou opinião acerca do assunto que foi tratado no 
material. 
 
Objetivos da unidade: informam o que você precisa aprender em cada unidade. 
 
 
Aproveite! Você tem em mão a chance de desenvolver ou aprofundar seus conhecimentos na área 
de Estatística. 
 
 
Objetivos Gerais da Disciplina 
 
Introduzir os conceitos fundamentais para a utilização de técnicas estatísticas de análise de dados. 
Apresentar métodos para organização de dados por meio de tabelas e gráficos e sua aplicação 
utilizando pacotes estatísticos adequados. Utilizar medidas de posição para interpretar e analisar 
conjunto de dados. Introduzir os conceitos da teoria das probabilidades e técnicas de amostragem 
e sua utilização na modelagem e solução de problemas. Apresentar técnicas de correlação e 
regressão para elaboração de modelos de previsão. 
 
 
2 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
3 
 
Sumário 
Unidade I – Conceitos básicos - Organização de dados estatísticos ............................................... 4 
1 Conceitos Básicos ...................................................................................................................... 6 
1.1 Estatística .............................................................................................................................. 6 
1.2 População, atributos e variáveis ........................................................................................... 6 
1.3 Pesquisa, censo, amostragem e amostra .............................................................................. 8 
1.4 Experimento aleatório........................................................................................................... 9 
1.5 Apresentação de dados estatísticos .................................................................................... 11 
1.6 Fases do método estatístico ................................................................................................ 12 
2 Organização de dados estatísticos .......................................................................................... 14 
2.1 Série estatística ................................................................................................................... 14 
2.2 Distribuição de frequências ................................................................................................. 15 
2.3 Gráficos ............................................................................................................................... 19 
Unidade II – Medidas de Posição - Medidas de Dispersão .......................................................... 25 
3 Medidas de Posição ................................................................................................................. 26 
3.1 Medidas de tendência central ............................................................................................. 26 
3.2 Média aritmética ................................................................................................................. 26 
3.3 Mediana .............................................................................................................................. 30 
3.4 Moda ................................................................................................................................... 32 
3.5 Posição relativa da média, mediana e moda ...................................................................... 34 
3.6 Separatrizes: Quartis, Decis e Percentis .............................................................................. 35 
4 Medidas de Dispersão ............................................................................................................. 39 
4.1 Conceito de Dispersão ......................................................................................................... 39 
4.2 Principais Medidas de Dispersão ........................................................................................ 40 
Unidade III – Probabilidade ....................................................................................................... 49 
5.1 Introdução ........................................................................................................................... 50 
5.2 Definição de Probabilidade ................................................................................................. 51 
5.3 Probabilidade - Propriedades .............................................................................................. 53 
 
4 
 
5.4 Probabilidade condicional ................................................................................................... 54 
5.5 Regra do produto ................................................................................................................ 54 
5.6 Distribuição de probabilidade ............................................................................................. 55 
Unidade IV – Correlação e Regressão ........................................................................................ 63 
6.1 Correlação ........................................................................................................................... 64 
6.2 Correlação linear simples .................................................................................................... 64 
6.3 Covariância .......................................................................................................................... 68 
6.4 Regressão ............................................................................................................................ 69 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Unidade I – Conceitos básicos - Organização de dados estatísticos 
 
 
5 
 
 
 Conhecer os conceitos fundamentais para a utilização de técnicas 
estatísticas de análise de dados. 
 Conhecer métodos para organização de dados por meio de tabelas e 
gráficos e sua aplicação utilizando pacotes estatísticos adequados. 
 Conhecer os principais tipos de séries estatísticas. 
 Organizar e utilizar dados estatísticos em tabelas. 
 Conhecer as Distribuições de Frequências e seus elementos. 
 Conhecer os principais tipos de gráficos. 
 
6 
 
1 Conceitos Básicos 
 
1.1 Estatística 
 
De origem muito antiga, a Estatística teve durante séculos um caráter meramente 
descritivo e de registro de ocorrências. As primeiras atividades datam de cerca de 2000 a.C. e se 
referem a iniciativas como o recenseamento das populações agrícolas chinesas. 
O que modernamente se conhececomo Ciências Estatísticas, ou simplesmente Estatística, é 
um conjunto de técnicas e métodos de pesquisa que, entre outros tópicos, envolve o planejamento 
do experimento a ser realizado, a coleta qualificada dos dados, a inferência e o processamento e 
análise das informações. Grande parte das informações divulgadas pelos meios de comunicação 
atual provém de pesquisas e estudos estatísticos. 
 
Estatística  é o estudo dos processos de obtenção, coleta, organização e análise de um conjunto 
de dados relativos a fenômenos numericamente quantificáveis, e dos métodos de obtenção de 
conclusões ou de realização de previsões com base nos dados coletados. 
A estatística de divide em: 
 
Estatística Descritiva (ou Dedutiva)  que trabalha com a coleta, análise e interpretação de dados 
relativos a uma população. Por exemplo, análise dos dados do censo realizado periodicamente no 
Brasil. 
 
Estatística Indutiva (ou Inferencial)  é aquela que partir de dados de uma amostra, permite a 
tomada de decisão sobre a população de origem. Consiste em concluir ou prever a evolução de 
fenômenos ao longo do tempo. Um exemplo típico são as pesquisas de intenção de voto realizadas 
durante o período eleitoral. Os institutos de pesquisa (IBOPE, DataFolha etc.) não perguntam a 
todos os eleitores em quem eles vão votar, pois esse processo é inviável do ponto de vista 
operacional e também porque tem custo muito elevado. As entrevistas são realizas apenas com 
uma pequena parte dos eleitores - uma amostra (que represente bem essa população de 
eleitores)! 
 
Por meio das análises feitas a partir de dados organizados podemos, em muitos casos, fazer 
previsões, determinar tendências, auxiliar na tomada de decisões e, portanto, elaborar um 
planejamento com mais precisão. No estudo que faremos aqui veremos como organizar um grupo 
de dados em tabelas e como construir gráficos a partir desses dados. 
 
Para iniciarmos os nossos estudos em Estatística, vamos definir alguns conceitos 
importantes: população, amostra, variáveis, pesquisa, censo e amostragem. 
 
1.2 População, atributos e variáveis 
A Estatística parte da observação de grupos, geralmente numerosos, aos quais damos o 
nome de população ou universo estatístico. 
 
 
7 
 
População é o total do grupo a ser observado (universo) e que possui pelo menos uma 
característica em comum. Por exemplo, a população dos alunos do curso de Administração da 
UniCarioca. Uma população pode ser finita ou infinita. 
 
Finita - Quando apresenta um número finito de elementos. 
Por exemplo: 
- a população dos alunos do curso de Administração da UniCarioca. 
- a população dos eleitores do município do Rio de Janeiro. 
 
Infinita - Quando apresenta um número infinito de elementos, ou seja, é aquela cujos elementos 
não podem ser contados. 
Por exemplo: 
- os pontos de uma reta. 
- a população de insetos (formigas, por exemplo!). 
 
Cada elemento da população estudada é denominado unidade estatística. Observe na 
tabela abaixo. 
População Estatística Unidade Estatística 
Alunos do curso de Pedagogia da UniCarioca Cada aluno que estuda no Curso de Pedagogia 
Clubes campeões cariocas de futebol Cada clube campeão carioca de futebol 
 
Características de uma População 
 
Atributos - São as características que não podem ser medidas numericamente (são qualitativas), 
como por exemplo: religião, estado civil, cor etc. Quando alguém pergunta a sua religião você não 
pode responder simplesmente: minha religião é 2,8! Ou dizer que seu estado civil é 1,9! Religião e 
estado civil são atributos - ou variáveis qualitativas! Assim, não podem assumir valores numéricos. 
 
Variáveis - São as características que podem ser medidas numericamente (quantitativas), como 
por exemplo: peso, altura, taxas de inflação, salário etc. Assim, se alguém pergunta o seu peso você 
pode responder tranquilamente: 57,3 kg! Aqui peso não é qualidade, mas uma variável que pode 
ser mensurada (medida) numericamente! 
As variáveis podem ser discretas ou contínuas. 
 
Variáveis Discretas - São aquelas que usualmente assumem valores inteiros (contagens). Exemplo: 
número de automóveis, número de ligações, número de habitantes, número de dependentes, 
número de filhos etc. Assim, se alguém perguntar quantos filhos você tem - você não pode 
responder que tem 2,8 filhos! Você vai responder que tem um número inteiro de filhos, 0,1,2,3,4.... 
 
Variáveis Contínuas - São aquelas que podem assumir qualquer valor em um intervalo de 
observação. Exemplo: rendimentos, taxas de inflação, peso, altura etc. Por exemplo, qual o seu 
peso? Meu peso é 57,3 Kg! Quanto foi a taxa de inflação mês passado? 2,19 %! 
 
Observe o seguinte exemplo! 
 
8 
 
Número de fumantes em uma sala de 60 alunos? 8 alunos! Essa é uma variável discreta! 
Você não pode ter 8,2 fumantes! 
Agora veja! 
Qual o percentual de fumantes na sala? 
Percentual de fumantes: temos 8 alunos em um total de 60 alunos. 
Percentual de fumantes: = 8/60 = 0,133! Ou seja, 13,3% de fumantes. Essa é uma variável 
contínua! Sabe a razão? O valor desse percentual pode variar continuamente entre 0% (zero) e 
100%!!! Se for 0% ninguém, se for 100% todos fumam! 
 
1.3 Pesquisa, censo, amostragem e amostra 
 
Pesquisa - A pesquisa estatística pode ser feita através de CENSO ou AMOSTRAGEM. 
 
Censo - Contagem completa na população. Normalmente consideramos o tamanho da população 
como N (maiúsculo). 
 
Amostragem - É o processo de dimensionamento e coleta de informações de parte da população 
usando métodos de seleção adequados. Esse processo gera uma Amostra! 
 
Amostra - É uma parte representativa da população escolhida convenientemente. Normalmente 
consideramos o tamanho da amostra como n (minúsculo). 
Exemplo: quando os institutos (IBOPE etc.) vão realizar uma pesquisa sobre intenção de 
voto o tamanho da amostra, ou seja, a quantidade de eleitores que vão ser entrevistados é 
calculada a partir de técnicas da Teoria da Amostragem. 
 
Fração amostral (FA) - É o tamanho da amostra (n) dividido pelo tamanho da população (N). FA = 
n/N 
Por exemplo, se o tamanho da População (N) é 50 e o tamanho da Amostra (n) é 10 então 
a Fração Amostral FA = 10/50 = 20%. 
 
Estimação - É o processo que permite calcular a partir da amostra os correspondentes valores da 
população. Um exemplo são as pesquisas de intenção de voto que conseguem prever o resultado 
das eleições com base em uma amostra de eleitores. É claro que se usamos Amostra temos sempre 
um ERRO de previsão (estimação). Assim, quando os resultados das pesquisas são divulgados o 
percentual de ERRO é sempre informado. 
 
Rol - É uma lista em que os valores da variável de estudo estão organizados em ordem crescente ou 
decrescente. 
Exemplos: 
1 ; 4 ; 6 ; 10  esse é um Rol crescente. 
8; 6 ; 2 ; 1  esse é um Rol decrescente. 
E esse?  1 ; 4; 6; 6; 10  crescente ou decrescente? 
 
 
9 
 
1.4 Experimento aleatório 
Método científico de observação de um fenômeno sujeito ao acaso, ou seja, dependendo 
de fatores aleatórios (incertos). Assim, um experimento aleatório repetido sob as mesmas 
condições indefinidamente apresentará sempre variações nos resultados. 
 
 
 
Exemplos: 
E1 - retirar uma carta de um baralho com 52 cartas e observar o resultado. 
E2 - retirar com reposição bolas de uma urna que contém 5 bolas brancas e 6 pretas. 
E3 - jogar uma moeda 10 vezes e observar o número de caras. 
No experimento E1, por exemplo, você nunca sabe qual carta vai ser sorteada (são 52)! 
Será que a Megassena é um experimento aleatório? E o Jogo do Bicho? 
 
1.4.1 Espaço amostral (S)É o conjunto de todos os resultados possíveis de um Experimento Aleatório. O Espaço 
Amostral pode ser designado por (S) ou por  ômega! 
Exemplos: 
lançamento de uma moeda: S = {Ca , Co}  não existem outras possibilidades! 
lançamento de um dado: S = {1,2,3,4,5,6}  não existem outras possibilidades! 
 
1.4.2 Evento 
É qualquer subconjunto do espaço amostral S de um Experimento Aleatório. 
 
Exemplo: 
No lançamento de um dado o Espaço Amostral é S = {1,2,3,4,5,6} 
Então podemos ter os seguintes eventos: 
A = {2,4,6}  S é um evento de S, pois A está contido () em S. 
B = {1,2,3,4,5,6}  S é um evento de S denominado Evento Certo. 
C = {4}  S é um evento de S 
D = Ø  S é um evento de S denominado Evento Impossível. 
Um evento pode ser definido por uma sentença, logo os eventos acima podem ser assim 
definidos: 
A  obter um número par na face superior 
B  obter um número menor ou igual a 6 na face superior 
C  obter o número 4 na face superior 
D  obter um número maior que 6 na face superior! Não é possível obter um número 
maior do que 6 no lançamento de um dado! Por essa razão ele é chamado de evento impossível. 
 
1.4.3 Variável aleatória 
Entende-se por variável aleatória uma função que associa um número aos eventos (pontos) 
do espaço amostral de um dado experimento aleatório. Uma variável aleatória é usualmente 
representada por uma letra maiúscula e seus valores por letras minúsculas. 
 
Exemplo: 
 
10 
 
Suponha o espaço amostral (S) relativo ao “lançamento simultâneo” de duas moedas. 
Assim o nosso Espaço Amostra S = { (Ca,Ca), (Ca,Co), (Co,Ca), (Co,Co) }. Ou seja, não existe 
outra possibilidade de ocorrência quando lançamos 2 moedas além dessas quatro. Se escolhermos 
X para representar o “número de caras” que aparecem, podemos associar a cada ponto do espaço 
amostral (cada par (.,.)) um número para X. Esta associação está na tabela que se segue: 
 
 
Ponto Amostral X 
(Ca,Ca) 2 
(Ca,Co) 1 
(Co,Ca) 1 
(Co,Co) 0 
 
X assim definida é uma Variável Aleatória. 
 
Você saberia dizer qual a chance (a probabilidade!) de se obter 2 caras nesse experimento? 
Pense... Quantas possibilidades (pontos amostrais) nos temos? 
 
Temos no total 4 possibilidades! 
Dessas 4 possibilidades qual a que nos interessa? Somente uma que é (Ca,Ca)! 
Então a probabilidade é... 1/4 = 0,25 = 25 %! Olhou... e viu! 
 
Outros exemplos de variáveis aleatórias: 
- precipitação pluviométrica média na cidade do Rio de Janeiro no mês de julho. 
- produção brasileira anual de trigo. 
 
 
 
 
Sempre que trabalhamos com amostra temos um erro de 
estimação (previsão). 
Quanto menor o tamanho da amostra maior o erro e quanto 
maior o tamanho da amostra menor o erro. Se a amostra é a própria 
população o erro é zero. 
Quanto maior a fração amostral menor o erro e quanto menor a 
fração amostral maior o erro. 
 
11 
 
1.5 Apresentação de dados estatísticos 
Existem duas formas básicas para sintetizar informações de uma ou mais variáveis - Tabelas 
e Gráficos. 
 
Tabular: é a apresentação de dados estatísticos através de tabelas. 
Gráficos: é a apresentação de dados estatísticos sob a forma de gráficos. 
 
Observação: tabela é uma das formas mais simples que nós seres humanos utilizamos para 
armazenar dados! 
 
Tabela - É um quadro (linhas e colunas) que resume um conjunto de observações. 
 
Composição de uma tabela 
 Elementos essenciais: título, corpo, cabeçalho. 
 Elementos complementares: se situam no rodapé da tabela. 
Título: é a parte superior da tabela. Indica-se no título a natureza do fato estudado, o local e a 
época em que foi observado. 
Linha: parte da tabela que contém uma série horizontal de informações. 
Coluna: parte da tabela que contém uma série vertical de informações. 
Célula: cruzamento de uma linha com uma coluna. 
Corpo: parte da tabela composta de linhas e colunas. 
Cabeçalho: parte da tabela onde se informa a natureza do conteúdo de cada linha. É o conjunto de 
células que formam a parte superior do corpo da tabela. 
Coluna indicadora: é coluna que contém as discriminações correspondentes aos valores 
distribuídos pelas colunas numéricas. 
Rodapé: é o espaço após o fecho da tabela onde são colocadas as notas informativas (Fonte, 
Notas, Chamadas). 
Fonte: é a informação colocada no rodapé da tabela para indicar a entidade que fornece os dados 
exibidos. 
Notas e Chamadas: informações adicionais colocadas no rodapé (após a fonte) quando são 
necessários esclarecimentos específicos sobre os dados. Se houver mais de uma nota elas devem 
ser numeradas em algarismos romanos e as chamadas em algarismos arábicos. 
 
Observe o exemplo. 
 
12 
 
 
Observação 
De acordo com a Resolução nº 886 da Fundação IBGE, nas casas e células devemos colocar: 
 um traço horizontal ( - ) quando o valor for zero, não só quanto à natureza dos dados, como 
quanto ao resultado. 
 três pontos (...) quando não temos dados. 
 um ponto de interrogação (?) quando temos dúvidas quanto à exatidão de determinado 
valor. 
 zero(0) quando o valor é muito pequeno para ser expresso pela unidade utilizada. 
 
1.6 Fases do método estatístico 
Um estudo estatístico é composto de diversas fases que devem ser desenvolvidas para se 
chegar aos resultados finais. 
 
Principais fases do método estatístico 
 
1. Definição do problema: escolha das características mensuráveis do fenômeno a ser 
estudado (variáveis/atributos) e das relações entre essas caraterísticas (modelagem). 
 
2. Planejamento: consiste em se determinar o procedimento necessário para resolver o 
problema e como será o levantamento das informações (censo/amostragem) sobre o 
assunto que está sendo estudado. Outros elementos importantes são: o 
estabelecimento de um cronograma para as fases do projeto e os custos envolvidos. 
 
3. Coleta de dados: é a obtenção, reunião e registro sistemático de dados com um objetivo 
determinado. A coleta de dados pode ser direta ou indireta. 
 
Coleta direta: quando é feita sobre elementos informativos de registro obrigatório como os 
nascimentos, os casamentos e os óbitos, a importação/exportação de mercadorias. Ou ainda, 
quando os dados são coletados (coligidos) pelo próprio pesquisador, através de inquéritos e 
questionários, como é o caso das notas de verificação, exames e do censo demográfico. 
 
 
 
13 
 
A coleta direta se classifica em... 
 
Contínua: quando é feita continuamente, como nascimentos, óbitos, frequência de alunos às aulas. 
 
Periódica: quando é feita em intervalos constantes de tempo, como os censos (10/10 anos), as 
avaliações mensais de alunos. 
 
Ocasional: quando é feita ocasionalmente, com o objetivo de atender a uma conjuntura ou a uma 
emergência, como no caso de epidemias. 
 
Coleta indireta: quando é inferida a partir de elementos conseguidos pela coleta direta, ou através 
do conhecimento de outros fenômenos que, de algum modo, estejam relacionados com o 
fenômeno em questão. Um exemplo é uma pesquisa sobre mortalidade infantil, que é feita através 
de dados colhidos por uma coleta direta (óbitos). 
 
4. Apuração dos dados: consiste em resumir os dados através de sua contagem e 
agrupamento. A apuração pode ser manual, mecânica ou eletrônica (mais usada). 
 
5. Apresentação dos dados: os dados podem ser apresentados através de tabelas e 
gráficos. 
 
6. Análise e Interpretação dos dados: análise e interpretação objetivando tirar conclusões, 
obter informações e gerar previsões. 
 
 
 
 
14 
 
2 Organização de dados estatísticos 
 
2.1 Série estatística 
 
Étoda tabela que apresenta a distribuição de um conjunto de dados estatísticos em função 
da época, do local ou da espécie. Nessas tabelas os dados podem estar grupados ou não agrupados. 
 
2.1.1 Série de dados grupados 
É a série onde o tempo, o espaço e a qualidade/espécie permanecem constantes e o 
fenômeno é agrupado em subintervalos do intervalo total. Estas séries serão estudadas a partir de 
tabelas chamadas de Distribuição de Frequências que veremos a seguir. 
 
2.1.2 Série de dados não grupados 
É a série onde as variações do fenômeno são apresentadas de acordo com a época a que se 
referem ao espaço onde se observa, ou a qualidade/espécie do fenômeno. As principais são: 
 
Série temporal: é a série em que se verifica a variação do fenômeno em relação ao tempo. É 
também conhecida como série cronológica. 
 
Exemplo - População Brasileira - Urbana/Rural entre 1940 e 2010 
Ano Urbana Rural 
1940 12.880.182 28.356.133 
1950 18.782.891 33.161.506 
1960 31.303.034 38.767.423 
1970 52.084.984 41.054.053 
1980 80.436.409 38.566.297 
2010 160.925.792 29.830.007 
Fonte: IBGE 
Série estatística geográfica: é a série em que se verifica a variação do fenômeno em relação ao 
espaço geográfico. 
 
Exemplo - População Brasileira por Região - Censo 2010 
Região No. Habitantes % por região 
Norte 15.864.454 8% 
Nordeste 53.081.950 28% 
Centro-Oeste 14.058.094 7% 
Sudeste 80.364.410 42% 
Sul 27.386.891 14% 
TOTAL 190.755.799 100% 
 Fonte: IBGE 
 
 
 
 
 
15 
 
 
Série específica ou categórica: a variável é o fenômeno descrito. 
 
Exemplo - Produção da Região “XY” em 2013 
 
 
 
 
 
 
 
 
2.2 Distribuição de frequências 
É o método que consiste em agrupar dados em classes, categorias, ou intervalos. Existem 
dois tipos de Distribuição de Frequência: por intervalo e por pontos. 
 
2.2.1 Distribuição de frequências por intervalo 
As variações do fenômeno são agrupadas em intervalos (só para variáveis contínuas). 
Vamos estudar os elementos de uma Distribuição de Frequências a partir de um exemplo prático. 
Na tabela abaixo nós temos os rendimentos dos empregados de uma empresa do ABC paulista por 
faixa (classe) de Salário Mínimo (SM). Nesse exemplo o pesquisador (que é você!) dividiu os 
Rendimentos em 5 classes. Na classe 1 estão os empregados que ganham entre 1 e 3 salários 
mínimos (SM), na 2 os que ganham entre 3 e 5 e assim por diante. Perceba que a tabela já está toda 
preenchida, o que vamos aprender é como montar essa tabela a partir das informações básicas que 
são as frequências simples(fi). 
 
Classe SM fi 
Fi 
(Abaixo de) 
fri 
Fri 
(abaixo de) 
Xi Fi 
Fri 
(Acima de) 
1 1 ├─ 3 90 90 0.45 0,45 2 200 1,00 
2 3├─ 5 50 140 0.25 0,70 4 110 0,55 
3 5 ├─ 7 30 170 0.15 0,85 6 60 0,30 
4 7 ├─ 9 20 190 0.10 0,95 8 30 0,15 
5 9 ├─ 11 10 200 0.05 1,00 10 10 0,05 
 200 1.00 
Tabela1 – Rendimento dos empregados de uma empresa do ABC paulista em salários mínimos (SM). 
Antes de apresentarmos os elementos básicos de uma Distribuição de Frequência (DF) 
vamos analisar a notação utilizada nos intervalos de classe. 
 
Notação 
O símbolo ├─ significa que o intervalo é FECHADO À ESQUERDA e ABERTO À DIREITA. 
 
Por exemplo, o intervalo 3 ├─ 5 significa que o 3 pertence ao intervalo, mas o 5 não pertence. Nesse 
intervalo estão os empregados que ganham 3 SM (inclusive) até os que ganham menos que 5 SM (4,99 SM 
por exemplo!). Assim, um empregado que ganha exatamente 5 SM pertence ao intervalo de classe 3 (5 ├─ 7) 
Cereal Produção (Ton) 
Arroz 120.000 
Feijão 110.000 
Milho 145.000 
Soja 150.000 
Café 160.000 
 
16 
 
e não ao intervalo de classe 2 (3 ├─ 5). O entendimento dessa notação é fundamental para trabalharmos com 
esse tipo de tabela. 
Um intervalo fechado à esquerda pode ser representado de duas formas: 
Exemplo para 3 e 5 :  3├─ 5 ou [ 3 , 5). 
 
Elementos de uma distribuição de frequência (DF) por intervalo 
Como mencionado anteriormente os elemento básicos que serão apresentados aqui fazem 
referência à tabela anterior (Tabela1). 
 
Limite inferior da DF: valor a partir do qual são contadas as observações da distribuição. Logo, no 
nosso exemplo Li = 1 SM 
 
Limite superior da DF: valor até o qual são contadas as observações da distribuição. No nosso 
exemplo Ls = 11 SM 
 
Amplitude da DF: é a diferença entre o limite superior (Ls) e o limite inferior (Li). 
Amplitude = Ls - Li = 11 - 1 = 10 SM 
 
Classes da DF: são os subintervalos nos quais são contadas as observações da variável. Ou seja, são 
os intervalos que você (pesquisador) usou para dividir a variável que está sendo estudada. Que 
variável é essa? O rendimento dos empregados de uma empresa do ABC paulista! Como a 
amplitude total é 10 e dividimos a distribuição em 5 classes, cada uma delas terá amplitude igual a 
2 (10/5 = 2!). 
Temos então - Classe1: 1˫3 SM, Classe4 - 7˫9 SM, e assim por diante! 
Limite inferior da classe: valor a partir do qual são contadas as observações dentro de cada classe. 
Exemplos: 
li2 = 3 (o limite inferior da classe2 é 3) 
li4 = 7 (o limite inferior da classe4 é 3)..... 
 
Limite superior da classe: valor até o qual são contadas as observações dentro da classe. 
Exemplos: 
 ls2 = 5  o limite superior da classe2 é 5 
 ls5 = 11  o limite superior da classe5 é 11 
 
Amplitude de classe: diferença entre ls e li da classe. 
Exemplo: Ampl4 = 9 - 7 = 2  Amplitude da classe 4 é 2! 
Qual seria a amplitude da classe1? 
 
E da classe 2? Essas amplitudes têm algo em comum? 
 
Frequência simples absoluta (fi): é o número de observações da variável dentro da classe 
(frequência de classe). 
 
17 
 
f1 = 90  significa que 90 empregados ganham entre 1 (inclusive) e 3 (exclusive) salários mínimos! 
 
Sabe dizer por que é inclusive 1 e exclusive 3? 
Pense um pouco, já falamos sobre esse assunto em NOTAÇÃO! 
f5 = 10  significa que 10 empregados ganham entre 9 (inclusive) e 11 (exclusive) salários 
mínimos! 
 
Frequência acumulada absoluta “abaixo de” (Fi): é o número de observações da variável da classe 
1 até a classe considerada (i). Assim Fk = f1 + f2 + f3 + ... + fk 
Exemplos: 
F1 = 90 = f1 = 90 
F2 = f1 + f2 = 90 + 50 = 140 
F3 = f1 + f2 + f3 = 90 + 50 + 30 = 170 
F5 = f1 + f2 + f3 + f4 + f5 = 200  soma de todas as frequências, da classe 1 até a classe 5! 
Tem uma forma mais rápida (e racional) de calcular as frequências acumuladas? 
Veja F3 = f1 + f2 + f3 =, mas f1 + f2 = F2! (que já foi calculada!) 
Assim, F3 = F2 + f3 = 140 + 30 = 170! Muito mais fácil e rápido! 
 
Veja, estamos gerando informação! 
Assim, talvez seja importante saber não apenas quantos ganham menos que 3 SM (abaixo de), mas 
também saber quantos ganham 3 ou mais SM (acima de). Para responder essas questões temos o 
próximo elemento. Frequência Acumulada absoluta “acima de”. 
 
Frequência acumulada absoluta “acima de” (Fi): é o número de observações existentes com 
valores maiores ou iguais ao limite inferior da classe. 
Exemplo: 
F1 = 200  todos ganham 1 ou mais salários mínimos! 
F2 = 110  são os que ganham 3 ou mais salários mínimos. Confira na Tabela1! 
F5 = 10  somente 10 ganham 9 ou mais salários mínimos! 
 
Observe agora o seguinte: muitas vezes o pesquisador (ou o gestor - o que decide!) está mais 
interessado em percentuais do que em valores absolutos! Os próximos elementos que vamos 
trabalhar calculam esses percentuais! 
 
Frequência simples relativa (fri): é a relação entre a frequência simples da classe (fi) e a frequência 
total (soma das frequências Σfi). 
fri = fi / Σfi 
Na nossatabela Σfi = 200. 
Exemplos: fr1 = f1 / Σfi = 90/200 = 0,45 = 45% 
fr4 = f4 / Σfi = 20/200 = 0,10 = 10% 
fr5 = f5 / Σfi = 10/200 = 0,05 = 5% 
 
Observe esses valores de frequências relativas! 
Você saberia dizer o que eles significam? 
 
18 
 
Frequência acumulada relativa (Fri): é a relação entre a frequência acumulada (Fi) e a frequência 
total (Σfi). 
Fri = Fi / Σfi 
Exemplos: 
Fr1 = F1 / Σfi = 90/200 = 0,45 = 45% 
Fr4 = F4 / Σfi = 190/200 = 0,95 = 95% 
 
Observação 1. Da mesma forma que a Fi é a acumulada da fi a Fri é acumulada da fri! 
Observação 2. Frequências relativas (tudo que tem r!) são percentuais! 
Ponto médio da classe (xi): é a média aritmética entre o limite inferior (li) e o limite superior (ls) da 
classe. 
Exemplos: 
x1 = (1+3)/2 = 2 (soma e divide por 2!) 
x2 = (3+5)/2 = 4 
x3 = (5+7)/2 = 6 
 x4 = (7+9)/2 = 8 e assim por diante! 
 
Você seria capaz agora de reconstruir a Tabela 1 a partir das frequências simples? 
Observe abaixo a Tabela 1 apenas com as frequências simples. 
 
Classe SM fi Fi 
Acumulada 
(Abaixo de) 
fri 
Relativa 
Fri 
Relativa 
(Abaixo de) 
xi 
(Ponto médio) 
Fi 
Acumulada 
(Acima de) 
Fri 
Relativa 
(Acima de) 
1 1 ├─ 3 90 
2 3 ├─ 5 50 
3 5 ├─ 7 30 
4 7 ├─ 9 20 
5 9 ├─ 11 10 
  200 
Tente é um excelente exercício para testar os conhecimentos adquiridos! 
Comece pela Frequência Acumulada (Abaixo de)! 
 
2.2.2 Distribuição de frequências por pontos 
É uma série de pontos grupados na qual o número de observações da variável, está 
relacionado com um ponto real. São características das variáveis discretas. 
Classe 
nº de 
dependentes 
nº de 
empregados 
(fi) 
Fi 
(Abaixo 
de) 
fri 
Fri 
(abaixo 
de) 
Fi 
(acima 
de) 
Fri 
(Acima de) 
1 0 20 20 0.10 0,10 200 1.00 
2 1 30 50 0.15 0,25 180 0.90 
3 2 50 100 0.25 0,50 150 0.75 
4 3 70 170 0.35 0,85 100 0.50 
5 4 20 190 0.10 0,95 30 0.15 
6 5 10 200 0.05 1,00 10 0.05 
 Σ 200 1.00 
Tabela 2 – A tabela acima exibe o número de empregados com 0, 1, 2, 3, 4 ou 5 dependentes. 
 
19 
 
Os elementos da distribuição de frequência por pontos acima são semelhantes aos da 
distribuição de frequência por intervalo vista na Tabela 1. Assim, todos os cálculos para 
preenchimento das colunas são exatamente os mesmos. 
A partir da tabela acima já preenchida veja alguns exemplos de informações que podem ser 
obtidas. 
Empregados com 0 (zero) dependentes - 20 
Empregados com 1 dependente - 30 
Empregados com 1 ou menos dependente - 50 (aqui é Abaixo de) 
Empregados com 4 ou menos dependentes - 190 (Abaixo de...) 
Empregados com 4 ou mais dependentes - 30 (aqui é Acima de) 
Percentual de empregados com 1 dependente - 15% (fr1 - frequência relativa!) 
Percentual de empregados com 3 dependentes - 35% (fr3 - frequência relativa!) 
Percentual de empregados com 3 ou menos dependentes - 85% 
(aqui é relativa acumulada Abaixo de...) 
Percentual de empregados com 3 ou mais dependentes - 50% 
(aqui é relativa acumulada Acima de...) 
 
2.3 Gráficos 
É uma forma de apresentação de dados estatísticos, com o objetivo de produzir no 
investigador uma impressão mais rápida do fenômeno em estudo. A representação gráfica deve 
obedecer aos seguintes requisitos: 
 
simplicidade - O gráfico deve ser destituído de detalhes de importância secundaria. 
 
clareza - O gráfico deve possibilitar uma correta interpretação dos valores representativos do 
fenômeno em estudo. 
 
veracidade - O gráfico deve expressar a verdade sobre o fenômeno. 
 
2.3.1 Tipos de gráficos 
A tabela a seguir servirá de exemplo para os primeiros tipos de gráficos que iremos estudar. 
Histograma, Polígono de Frequência e Polígono de Frequência Acumulada. 
 
Notas Frequências (fi) fri fri 
0 ˫ 2 4 0,16 16% 
2 ˫ 4 6 0,24 24% 
4 ˫ 6 10 0,40 40% 
6 ˫ 8 3 0,12 12% 
8 ˫ 10 2 0,08 8% 
Σ 25 1,00 100% 
Tabela 3 - A tabela acima exibe as notas em uma prova de Estatística em uma turma com 25 alunos 
 
Esta tabela exibe as notas de Estatística em uma turma com 25 alunos. Todos os intervalos 
têm a mesma amplitude (2) e são fechados à esquerda e abertos à direita (como na maioria das 
 
20 
 
distribuições). A coluna de frequência relativa (fri) está exibida de duas formas, no formato decimal 
usual (0,16 para a classe1, por exemplo) e no formato percentual (16%). 
 
Histograma 
É a representação gráfica de uma distribuição de frequência usando-se retângulos 
justapostos (um ao lado do outro). A base corresponde aos intervalos de classes (eixo das abscissas- 
horizontal), e a altura (proporcional à frequência de cada classe) é colocada no eixo das ordenadas 
(vertical). Na construção do histograma, as amplitudes dos intervalos de classe (base dos 
retângulos) são iguais. Dessa forma, as áreas de cada retângulo do histograma são proporcionais às 
frequências de cada classe. 
 
HISTOGRAMA DA TABELA3 
Pergunta 1 - O que fornece um resultado mais imediato sobre o desempenho dos 25 alunos nessa 
prova, a Tabela3 ou o Histograma? 
 
Pergunta 2 - Vamos imaginar que na construção do Histograma em vez das frequências simples (fi) 
você tivesse usado as frequências relativas (fri). O que iria mudar no Histograma? Ele seria o 
mesmo? Teria o mesmo formato? 
 
Polígono de frequência 
É construído ligando-se os pontos médios dos topos dos retângulos de um histograma. 
Observação: a soma das áreas dos retângulos do histograma = Área total limitada pelo polígono de 
frequência e o eixo dos x. 
 
 
21 
 
 
Polígono de frequência acumulada “abaixo de” 
 
Polígono de frequência acumulada “acima de” 
 
 
 
 
 
 
22 
 
Exemplificaremos os demais tipos de gráficos a partir da tabela abaixo 
TÍTULO - FATURAMENTO DAS FILIAIS - MIL R$ 
Filiais Trim-1 Trim-2 Trim-3 Trim-4 Ano 
RJ 310 150 130 140 730 
SP 200 120 160 210 690 
PR 180 100 150 135 565 
Total 690 370 440 485 1985 
Tabela 4 Faturamento das filiais RJ, SP e PR nos 4 trimestres do ano em MIL R$. 
Gráfico de barras e colunas 
São representados por retângulos de base comum e altura proporcional à magnitude dos 
dados. Se os retângulos são colocados em uma posição vertical o gráfico é de colunas, se são 
colocados na posição horizontal o gráfico é de barras. Estes gráficos são usados para representar 
séries cronológicas, geográficas e categóricas. 
 
 
 
 
 
 
 
23 
 
Colunas justapostas 
É aquele em que os retângulos são dispostos um ao lado do outro. 
 
 
Barras múltiplas 
As barras são colocadas uma ao lado da outra. 
 
Colunas Superpostas 
 
 
 
24 
 
Barras Superpostas 
 
Observação: os gráficos de Colunas Justapostas, Barras Múltiplas, Colunas Superpostas e Barras 
Superpostas permitem a comparação de diversas variáveis. 
Gráfico de setores 
Representado por meio de setores em um círculo. Cada setor representa uma parte de um 
todo. 
 
Esse tipo de gráfico é utilizado quando desejamos observar as parte de um todo como no 
exemplo acima. 
 
 
 
1. O que é frequência simples absoluta? 
2. A frequência Acumulada “abaixo de” é crescente ou 
decrescente? 
3. O que é frequência simples relativa? 
4. Para que serve um Histograma? 
 
 
25 
 
Unidade II – Medidas de Posição - Medidas de Dispersão 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 Utilizar medidas de posição para interpretar e analisar conjunto 
de dados. 
 Utilizar as principais medidas de dispersão para interpretar e 
analisarconjuntos de dados. 
 
26 
 
3 Medidas de Posição 
São aquelas que indicam a posição da distribuição no eixo das abcissas. Se dividem em 
Medidas de Tendência Central e Separatrizes. 
 
3.1 Medidas de tendência central 
São as medidas estatísticas que sintetizam os valores das variáveis de um conjunto de 
dados observados (média, moda, mediana). São assim chamadas porque tendem a se localizar no 
centro da distribuição. 
 
3.2 Média aritmética 
Fórmula Geral: ̅ 
 
 
, onde: 
xi = variável em estudo 
N = número de observações 
 ̅ = média aritmética 
Exemplo 
Calcular a média aritmética do seguinte conjunto de dados: 6, 8, 0, 10. 
Usando a fórmula 
N
x
x
i

 temos: 
 ̅ 
 
 
 
 
3.2.1 Desvios em relação à média 
Denominamos de desvio em relação à média, a diferença entre cada elemento de um 
conjunto de valores e a média aritmética. Assim, cada desvio é dado por: di = xi - ̅ 
No exemplo acima, os desvios em relação à média são: 
d1 = 6 - 6 = 0; 
d2 = 8 - 6 = 2; 
d3 = 0 - 6 = -6; 
d4 = 10 - 6 = 4; 
 
Propriedade  a soma dos desvios em relação à média aritmética é 0 (zero)  0 + 2 - 6 + 4 = 0. 
 
3.2.2 Média aritmética para dados distribuídos por frequência 
Se os valores x1, x2, x3,..., xn ocorrem f1, f2, f3,....., fn vezes respectivamente, a média 
aritmética será: 
 ̅ 
 
 
 
Ou seja, ̅ 
 
 
 onde xi é o valor da observação da classe i e fi é o valor da 
frequência da classe i. 
Fazendo (soma das frequências) podemos escrever que: ̅ 
 
 
 
 
27 
 
 Neste caso, como as frequências são números indicadores da intensidade de cada valor da 
variável, elas funcionam como fatores de ponderação (média ponderada). Vamos ver em um 
exemplo prático como fazer. 
Exemplo 
Calcular a média aritmética da seguinte distribuição (dados agrupados): 
 x 2 3 5 7 9 
f 4 6 10 3 2 
 
Antes de fazer os cálculos entenda o significado da tabela. O valor 2 ocorreu 4 vezes, o valor 
3 ocorreu 6 vezes, e assim por diante... 
Usando a fórmula acima ̅ 
 
 
 temos: 
Temos: ̅ 
 
 
 
 
 
 
Perceba que N é a soma das frequências, ou seja, N = 4+6+10+3+2 = 25! 
 
Então a média aritmética desse conjunto de valores vale 4,6! 
Era esperado que esse valor fosse próximo de 5? 
Você saberia dizer a razão? 
 
3.2.3 Média aritmética para dados distribuídos em classes 
Neste caso, todos os valores incluídos em um determinado intervalo de classe (os xi) 
coincidem com seu ponto médio. 
Assim, ̅ 
 
 
, onde xi é o ponto médio do intervalo de classe i. 
N = Soma das frequências: 
 
Na tabela abaixo estão listadas as alturas (em cm) de um grupo de 40 pessoas. Calcular a 
média aritmética e os desvios da distribuição. 
i Estatura (cm) fi Ponto Médio (xi) fi × xi ̅ 
1 150 ˫ 154 4 
2 154 ˫ 158 9 
3 158 ˫ 162 11 
4 162 ˫ 166 8 
5 166 ˫ 170 5 
6 170 ˫ 174 3 
 40 
 
28 
 
Precisamos preencher cada uma das colunas desta tabela para calcular a Média e os 
respectivos desvios di. Vamos começar calculando a coluna dos Pontos Médios! 
 
Como calcular os Pontos Médios? Lembra da UNIDADE-II? 
 
O Ponto Médio em cada classe (nesse caso são 6 classes) é igual a média aritmética entre os 
limites da classe. 
Temos então: 
 
 
 
 
 
 
 
 
 
 
 
 E assim por diante... 
 
Mas será que precisamos calcular todos os pontos médios? 
 
Não! Basta calcular o da primeira classe (152) e somar a amplitude de cada intervalo de 
classe (no nosso exemplo essa amplitude vale 4). 
Assim se x1 = 152, 
x2 = 152 + 4 = 156, 
x3 = 156 + 4 = 160, e assim por diante... 
 
Refaça então o cálculo dos pontos médios dessa forma. Perceba que é muito mais fácil e 
muito mais rápido! 
Agora que os pontos médios estão prontos e colocados na tabela vamos calcular a coluna 
correspondente a fi xi. Nesse caso basta multiplicar cada valor da frequência pelo ponto médio da 
classe. Observa na tabela abaixo. Perceba que a soma dessa coluna é 6.440! 
 
i Estatura (cm) fi Ponto Médio (xi) fi x xi ̅ 
1 150 ˫ 154 4 152 608 
2 154 ˫ 158 9 156 1.404 
3 158 ˫ 162 11 160 1.760 
4 162 ˫ 166 8 164 1.312 
5 166 ˫ 170 5 168 840 
6 170 ˫ 174 3 172 516 
 40 6.440 
 
 
 
 
29 
 
Agora já podemos calcular o valor da Média Aritmética. 
Temos: ̅ 
 
 
, mas e 
Logo: ̅ 
 
 
 
Então a altura média dessas 40 pessoas é 161cm, ou 1,61m (1 metro e 61 cm!) 
 
Cálculo dos Desvios 
O próximo passo é preencher a coluna dos desvios em relação à média. 
Mas essa tarefa é muito simples, pois cada desvio é dado por ̅ 
Ou seja, basta subtrair de cada ponto médio a média aritmética (161). 
Temos então: 
d1 = 152 - 161 = -9 
d2 = 156 - 161 = -5 
d3 = 160 - 161 = -1 
d4 = 164 - 161 = ... 
 
Espere um pouco! Notou algum padrão? 
 
Veja, se cada ponto médio é igual ao anterior mais 4, então cada desvio é igual ao anterior 
mais 4! 
Fácil e imediato: 
-9 + 4 = -5 
-5 + 4 = -1 
-1 + 4 = 3 e assim por diante! 
 
Agora basta preencher na tabela a coluna dos desvios e depois multiplicar pelas frequências 
- não esqueça que essa tabela se chama Distribuição de Frequência! 
i Estatura (cm) fi Ponto Médio (xi) fi x xi ̅ 
1 150 ˫ 154 4 152 608 -9 -36 
2 154 ˫ 158 9 156 1.404 -5 -45 
3 158 ˫ 162 11 160 1.760 -1 -11 
4 162 ˫ 166 8 164 1.312 3 24 
5 166 ˫ 170 5 168 840 7 35 
6 170 ˫ 174 3 172 516 11 33 
 40 6.440 0 
 
Notou que a soma dos desvios (na última coluna) é ZERO! 
Lembra dessa propriedade da média aritmética? 
 
30 
 
3.2.4 Propriedades da média aritmética 
1. A soma dos desvios em relação a média é igual a zero (0). 
2. A média aritmética é um valor contido entre o menor valor (min) e o maior valor (max). 
3. Multiplicando-se ou dividindo-se todos os valores de um conjunto de dados por uma 
constante, a média ficará multiplicada ou dividida por esta constante. 
4. Somando-se ou subtraindo-se a todos os valores de um conjunto de dados uma 
constante, a média ficará aumentada ou subtraída desta constante. 
 
3.3 Mediana 
É o valor que ocupa a posição central de um conjunto de N dados ordenados. Assim, se N 
for par, a mediana será a média aritmética entre os dois termos centrais. Se N for ímpar a mediana 
é o termo central. Observe os exemplos a seguir. 
 
3.3.1 Mediana para dados não agrupados 
Achar a mediana do seguinte conjunto de dados: 
5 13 10 2 18 15 6 16 9 
 
Ordenando vem: 
2 5 6 9 10 13 15 16 18 
 
1 2 3 4 5 6 7 8 9 
Termo central 
Logo a mediana será: Md = 10 
 
Se o conjunto de dados tiver um número par de observações a mediana é igual a média 
aritmética entre os dois termos centrais. Observe o exemplo a seguir. 
2 6 7 10 12 13 18 21 
 
1 2 3 4 5 6 7 8 
Termos centrais 
 
Aqui a mediana será: 
 
 
 
 
Observações 
1. O valor da mediana pode ou não coincidir com um elemento da série, como vimos. 
Quando o número de elementos da série é ímpar, há a coincidência. O mesmo não 
acontece, em geral, quando esse número é par. 
2. A mediana e a média aritmética não têm necessariamente, o mesmo valor. 
 
31 
 
3. A mediana depende da posição e não dos valores dos elementos na série ordenada. Essa 
é uma das diferenças entre a mediana e a média (que é muito influenciada pelos valores 
extremos- outliers). 
4. A mediana é designada muitas vezes por valor mediano. 
 
3.3.2 Mediana para dados agrupados em classes 
Neste caso, o problema consiste em determinar o ponto do intervalo em que está 
compreendida a mediana. 
 
Fórmula Geral 
 
 
 
 
 
 , onde: 
 
 = Limite inferior da classe em que está a mediana 
 = Frequência acumulada da classe anterior à classe da mediana 
 = Amplitude do intervalo da classe da mediana 
 = Frequência simples da classe da mediana 
 
Regra Prática 
1. Determinar a frequência acumulada. 
2. Calcular 
 
 
 (metade das frequências) 
3. Marcar a classe correspondente à frequência acumulada imediatamente superior a 
 
 
 
 essa será a classe mediana! 
4. Aplicar a fórmula geral. 
 
Exemplo 
Determinar a mediana da seguinte distribuição de frequência: 
Classe i Estrutura (cm) fi Fi 
1 150 ˫ 154 4 4 
2 154 ˫ 158 9 13 
3 158 ˫ 162 11 24 
Classe da 
Mediana 
4 162 ˫ 166 8 32 
5 166 ˫ 170 5 37 
6 170 ˫ 174 3 40 
 40 
 
 
32 
 
Aplicando a regra prática para determinar a mediana vem: 
 
 
 = 20, logo a classe mediana é a Classe 3, pois 24 é a primeira frequência acumulada 
maior do que 20! 
 = 158  limite inferior da classe da mediana 
 = 13  frequência acumulada anterior à classe da mediana 
 = 4  amplitude da classe da mediana = (162-158) 
 = 11  frequência simples da classe da mediana 
Aplicando a fórmula geral 
 
 
 
 
 
 Vem: 
 
( )
 
 
 
 
 
 
 
3.4 Moda 
É o valor que ocorre com mais frequência (mais vezes) em um conjunto de dados. 
 
3.4.1 Moda para dados não agrupados 
Na série 5, 6, 7, 7, 8, 9, 10, 10, 10, 11 a moda é 10, pois é o valor que ocorre mais vezes (3 
vezes!). Nesse caso dizemos que a série é UNIMODAL - só tem uma moda! 
No entanto, podemos encontrar séries nas quais não existe uma moda. 
Exemplo: 5: 4, 5, 6, 7, 8, 9, 10  aqui ninguém se destaca, todos têm a mesma frequência! Dizemos 
então que essa série é AMODAL! 
Em outros casos pode haver dois ou mais valores de concentração. 
Exemplo: 6: 2, 2, 3, 4, 4, 4, 5, 6, 7, 8, 8, 9, 10, 10, 10, 11 
Aqui temos duas modas 4 e 10 e nesse caso a série é chamada de BIMODAL! 
Exemplo: 7: 1, 1, 2, 3, 4, 4, 5, 5, 6, 7, 8, 9 
Neste exemplo temos três modas: 1, 4 e 5 e a série é chamada de TRIMODAL ou 
POLIMODAL ou PLURIMODAL! 
 
3.4.2 Moda para dados agrupados em classes (Moda de Czuber) 
Sem Intervalos de Classe 
Agrupados os dados é fácil determinar a moda, basta observar o valor da variável associada 
à maior frequência. 
A tabela abaixo exibe o número de meninos em 34 famílias. Como o valor correspondente à 
maior frequência (12) é 3, a moda da distribuição é Mo = 3. Ou seja, a “moda” é ter 3 filhos homens 
na família - 3 meninos! 
 Nº meninos fi 
 0 2 
 1 6 
 2 40 
Moda 3 12 Maior frequência 
 4 4 
 
33 
 
Com Intervalos de classe 
A classe que apresenta a maior frequência é denominada classe modal. Pela definição, 
podemos afirmar que a moda, neste caso é o valor dominante que está compreendido entre os 
limites da classe modal. Existem várias fórmulas para o cálculo da Moda, no entanto a mais usual é 
a que veremos a seguir. 
 
Moda Czuber 
Fórmula de CZUBER 
 
 
 
 , onde: 
 
 = Limite inferior da classe modal 
 = Amplitude do intervalo da classe da mediana 
D1 = 
D2 = 
 = Frequência simples da classe modal 
 = Frequência simples da classe anterior à classe modal 
 = Frequência simples da classe posterior à classe modal 
 
Exemplo: 
Determinar a moda da seguinte distribuição de frequência (Fórmula de Czuber). 
Classe i Estrutura (cm) fi 
1 150 ˫ 154 4 
2 154 ˫ 158 9 
3 158 ˫ 162 11 
Classe Modal (maior 
frequência - 11) 
4 162 ˫ 166 8 
5 166 ˫ 170 5 
6 170 ˫ 174 3 
 40 
Temos: 
A maior frequência é 11, logo, a classe modal é a de ordem i = 3. 
Temos então: 
 = 158 
 = 162 – 158 = 4 
D1 = = 11 – 9 = 2 
D2 = = 11 – 8 = 3 
 
Aplicando a fórmula 
 
 
 vem: 
 
 
 
 
 
 
 
 
 
 
 
 
34 
 
3.5 Posição relativa da média, mediana e moda 
A posição relativa da Média, Moda e Mediana é importante para conhecermos o tipo de 
distribuição que estamos trabalhando. Em uma distribuição simétrica, por exemplo, as três 
medidas de posição são iguais, porém, quanto mais assimétrica for a curva, maior será a diferença 
entre essas medidas. Para uma distribuição em forma de sino (Normal) pode-se visualizar essas 
diferenças nos exemplos que se seguem. 
 
Em uma distribuição simétrica, verifica-se que: ̅ (Figura A). 
 
 
Figura A 
Em todas essas figuras marcamos os valores da média, mediana e da moda no eixo 
horizontal e no eixo vertical marcamos as frequências. Perceba que em todas as figuras o valor da 
Moda corresponde ao ponto mais alto da curva (o que tem a maior frequência!). 
 
Em uma distribuição assimétrica positiva (à direita), verifica-se que: ̅ 
(média > mediana > moda) (Figura B). 
 
 
Figura B 
Nesse tipo de distribuição a Média( ̅) é maior que a Mediana (Md) que por sua vez é maior 
que a Moda (Mo). 
Em uma distribuição com assimetria negativa (à esquerda), verifica-se que: ̅ 
(média < mediana < moda) (Figura C). 
 
35 
 
 
Figura C 
Aqui a Média é menor que a Mediana que por sua vez é menor que a Moda. 
Percebeu que a Mediana está entre a Média e a Moda? 
Percebeu também que a Moda corresponde sempre ao ponto mais alto do gráfico - o de 
maior frequência! 
 
3.6 Separatrizes: Quartis, Decis e Percentis 
Como vimos, a mediana separa a série em dois grupos que apresentam o mesmo número 
de observações (a metade para cada lado). Existe um grupo de medidas que juntamente com a 
mediana são conhecidas pelo nome genérico de separatrizes. Essas medidas são: os quartis, os 
decis e os percentis. 
 
QUARTIS 
Dividem os valores de uma série em 4 (quatro) partes iguais, ou seja, cada uma delas tem a 
mesma frequência – a mesma quantidade de dados! 
 
0% 25% 50% 75% 100% 
 
 
 25% 25% 25% 25% 
 Q1 Q2 Q3 
 
Temos então: 
Q1 (1º quartil): é um valor tal que a quarta parte (25%) dos dados é menor que ele. 
Q2 (2º quartil): coincide com a mediana, deixa 50% dos valores abaixo e 50% acima dele. 
Q3 (3º quartil): é um valor tal que (75%) dos valores é menor que ele. 
 
A fórmula usada para determinação dos quartis é a mesma da mediana substituindo-se 
apenas: 
 
 
 por 
 
 
, onde k é o número de ordem do quartil ( k = 1,2 e 3). 
 
 
 
36 
 
Temos, 
Md l
f
Faa
f
hi
i
md
 



[ ]
2 
 
 
 
 
 
 
 
Onde: 
 = Limite inferior da classe do quartil k 
 = Frequência acumulada da classe anterior à classe do quartil k 
 = Frequência simples da classe do quartil k 
Assim, 
 
*
 
 
 +
 
 k = 1  (1/4=25%) 
 
*
 
 
 +
 
 k = 2  (2/4=50%), ou seja, Q2 = Mediana! 
 
*
 
 
 +
 
 k = 3  (3/4=75%) 
Observação: os QUARTIS são três: Q1, Q2 e Q3. 
 
DECIS 
Separatrizes que dividem a série em 10 partes iguais (de mesma frequência). 
 
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% 
 
 
 D1 D2 D3 D4 D5 D6 D7 D8 D9 
 
 
Da mesma forma que os quartis, basta substituir na fórmula da mediana:por 
 
 
, onde k é o número de ordem do decil (k = 1,2,3,4,5,6,7,8,e 9). 
 
Assim, se k = 1 temos 1/10 = 10%, se k=2 temos 2/10 = 20%, se k = 3 temos 3/10 = 30%, se 
k=4 temos 4/10 = 40%, se k = 5 temos 5/10 =50% e assim por diante... 
Observações: 
Os DECIS são nove: D1 , D2 , D3 , D4 , D5 , D6 , D7 , D8 , D9! 
D5 = Md, ou seja, o quinto DECIL é igual a MEDIANA! 
 
 
 
 
 
 
 
37 
 
PERCENTIS 
São os valores que dividem uma série em 100 partes iguais. 
 
0% 
1% 2% 3% .......... 50% ........... 97% 98% 99% 100% 
 
 
 P1 P2 P3 ................................ P97 P98 P99 
 
Para determinar os percentis basta substituir na fórmula da mediana: 
 
 
 por 
 
 
, onde k é o número de ordem do percentil (k = 1,2,3,.......97,98,99) 
Observações 
Os PERCENTIS são 99  P1, P2, P3,................................,P97, P98, P99 
P25 = Q1 (o percentil 25 é igual ao 1º quartil - Q1) 
P50 = Q2 (o percentil 50 é igual ao 2º quartil - Q2) = MEDIANA 
P75 = Q3 (o percentil 75 é igual ao 3º quartil - Q3) 
Da mesma forma: 
P10 = D1 (o percentil 10 é igual ao 1º decil - D1) 
P50 = D5 = Q2 = Md (o percentil 50 é igual ao 5º decil-D5 que é igual a o 2º quartil-Q2 que é 
igual a Mediana! 
P90 = D9 (o percentil 90 é igual ao 9º decil - D9). 
 
 
Realize o exercício a seguir e depois confira a resposta na próxima página. 
Lembre-se: não vale olhar antes! 
 
1 - Determinar o 1º e o 3º quartis da seguinte distribuição de frequência: 
Classe i Estrutura (cm) fi Fi 
1 150 ˫ 154 4 4 
2 154 ˫ 158 9 13 
3 158 ˫ 162 11 24 
4 162 ˫ 166 8 32 
5 166 ˫ 170 5 37 
6 170 ˫ 174 3 40 
 40 
 
Percebe que para facilitar a coluna de frequência acumulada (Fi) já está 
calculada! 
 
38 
 
 
 
𝑄 
( )
 
 
 
 
 
 
 
 𝟏𝟓𝟔 𝟕 𝒄𝒎 
𝑄 
( )
 
 
 
 
 
 
 
 𝟏𝟔𝟓 𝒄𝒎 
Exercícios - Resolução 
 
1 - Temos 
Primeiro Quartil 
Vamos determinar a classe do Primeiro Quartil! 
Temos: 
𝑘 𝑓𝑖
 
 (como é o Primeiro Quartil, k=1) 
 𝑓𝑖
 
 
 
 
 , 
Como a primeira frequência acumulada maior do que 10 é 13 a classe do primeiro 
quartil é de ordem 2. 
Da tabela obtemos os valores abaixo: 
li = 154 
Faa = 4 (frequência acumulada anterior à classe do 1º quartil) 
h = 4 (Amplitude do intervalo = 158-154). Todas são iguais! 
fq1 = 9 (frequência simples da classe do 1º quartil) 
Temos então: 
Perceba que esse valor está no intervalo que vai de 154 até 158 (como era 
esperado!) 
Terceiro Quartil 
 𝑓𝑖
 
 
 
 
 (como é o Terceiro Quartil, k=3) 
Como a primeira frequência acumulada maior do que 30 é 32 a classe do terceiro 
quartil é de ordem 4. 
Da tabela obtemos os valores abaixo: 
li = 162 
Faa = 24 (frequência acumulada anterior à classe do 3º quartil) 
h = 4 (Amplitude do intervalo = 162-158). Todas são iguais! 
fq1 = 8 (frequência simples da classe do 3º quartil) 
Temos então: 
Perceba que esse valor está no intervalo que vai de 162 até 166 (como também era 
esperado!). 
 
39 
 
4 Medidas de Dispersão 
As medidas de posição (média, mediana e moda) não são suficientes para caracterizar 
perfeitamente um conjunto de dados. Duas distribuições (dois conjuntos de dados) podem ter a 
mesma média, mediana e moda, mas serem diferentes. Em uma delas, os valores podem se 
concentrar fortemente em torno da média, na outra, podem se espalhar nos dois lados desse valor 
médio. Os conjuntos X e Y a seguir exemplificam este fato. 
 
X = 11; 9; 8; 12; 7; 10; 10; 13 
Y = 2; 18; 1; 5; 19; 5; 0; 30 
Calculando as médias dos conjuntos X e Y obtemos: 
 ̅ 
 
 
 
 
 
 
 
 
 
 ̅ 
 
 
 
 
 
 
 
 
 
 
Apesar dos dois conjuntos de dados terem a mesma média, é fácil notar que o conjunto X é 
mais homogêneo que o conjunto Y. Ou seja, os valores do conjunto X, “variam menos” que os 
valores do conjunto Y. 
 
4.1 Conceito de Dispersão 
Dispersão (variabilidade) - é a maior ou menor diversificação dos valores de uma variável, 
em torno de um valor de tendência central tomado como referência (média ou mediana). Para 
medir essa dispersão são utilizadas várias medidas e as mais usadas são: amplitude total, desvio 
médio, desvio-quartil, variância, desvio padrão e coeficiente de variação. 
Antes de estudarmos as principais Medidas de Dispersão dê uma olhada nos dois gráficos 
abaixo e responda: onde a Dispersão é maior, no Gráfico A ou no Gráfico B? 
 
 
 
 
 
 
 
 
 
Veremos agora as principais medidas que utilizamos para medir Dispersão. 
 
 
 
 
GRÁFICO - A 
X 
Y 
GRÁFICO - B 
X 
Y 
 
40 
 
4.2 Principais Medidas de Dispersão 
 
4.2.1 Amplitude Total 
É a diferença entre o maior e o menor valor observados. Se os dados forem distribuídos em 
intervalos de classe, será a diferença entre o limite superior da última classe e o limite inferior da 
primeira classe. 
Exemplo: vamos calcular a Amplitude Total dos conjuntos X e Y da página anterior. 
Temos então: 
X = {11; 9; 8; 12; 7; 10; 10; 13 }  maior valor (13) menor valor (7) 
Y = {2; 18; 1; 5; 19; 5; 0; 30 }  maior valor (30) menor valor (0) 
Ampl(X) = 13 - 7 = 6; 
Ampl(Y) = 30 - 0 = 30; 
 
Ou seja, a amplitude do conjunto Y é maior que a amplitude do conjunto X, o que significa 
que os valores de Y são mais dispersos que os valores do conjunto X. 
Em relação à amplitude total pode-se fazer as seguintes observações: 
1. é afetada por valores extremos. 
2. depende do tamanho da amostra. 
3. apresenta muita variação de uma amostra para outra. 
 
4.2.2 Desvio médio 
É a média aritmética dos desvios absolutos em relação à média aritmética ou a mediana. O 
mais usual é calcular os desvios em relação à média. 
Observação - Desvio Absoluto é o valor do desvio sem o sinal, ou seja, é sempre positivo. 
Dados não Agrupados 
 
 ̅
 
 
Dados Agrupados 
 
 ̅ 
 
 
Exemplo 
Determinar a amplitude total e o desvio médio do seguinte conjunto de dados: 
X = 4; 10; 2; 6; 8 
Amplitude total = Maior valor - Menor valor: 
Ampl = 10 - 2 = 8 
Cálculo dos Desvios 
Vamos calcular os desvios em relação à média aritmética. 
Média aritmética: ̅ 
 
 
 
 
 
 
 
 
 
Como os dados são não agrupados a fórmula é: 
 ̅
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Ou seja, a distância média entre cada ponto e a média aritmética é 2,4! 
 
41 
 
Obs: | |  significa Módulo e é sempre positivo! Assim, |2| = 2 e |-2| = 2! 
 
4.2.3 Variância 
É a média aritmética dos quadrados dos desvios em relação à média. 
Dados não Agrupados 
 
 ( ̅)
 
 
, onde n = número de observações. 
Não esqueça! Desvio  ̅ 
Desenvolvendo-se a expressão acima, obtém-se uma fórmula mais simples para a variância. 
 
 
 
 
 (
 
 
)
 
 , ou seja: 
 
 
 
 ̅ 
Através da fórmula simplificada acima, pode-se então definir a variância como sendo: 
“a média dos quadrados, menos o quadrado da média”. 
É quase poético! A média dos quadrados... Menos o quadrado da média! 
Dados Agrupados 
 
 
 
 
 (
 
 
)
 
 ou 
 
 
 
 ̅ 
 
Perceba que quando os dados estão agrupados a única diferença é termos que usar 
frequências! Ou seja, cada valor xitem que ser multiplicado pela sua respectiva frequência! 
Variância é uma das três principais medidas de Dispersão, mas ela tem um pequeno 
problema que será analisado a seguir. 
Como a variância é calculada a partir dos quadrados dos desvios, ela possui a unidade de 
medida diferente da dos dados originais. Por exemplo, se os dados estão medidos em cm a 
variância está medida em cm
2
. Se os dados estão medidos em kg a variância está em kg
2
 e assim 
por diante! Objetivando eliminar este inconveniente, usa-se outra medida de dispersão chamada 
Desvio Padrão que veremos a seguir. 
 
4.2.4 Desvio padrão 
É a raiz quadrada da variância. 
Temos então: √ 
Simples! Conhecida a Variância para achar o Desvio Padrão basta calcular a sua raiz 
quadrada! Dessa forma o Desvio Padrão estará sempre medido na mesma unidade dos dados 
originais já que a variância está medida na unidade ao quadrado. Assim, se a variância for 16 cm2, o 
valor do desvio padrão será 4cm2. 
Exemplo 
Calcular a variância e o desvio-padrão do seguinte conjunto de dados X = 2; 4; 3; 6; 10 
(dados não agrupados) 
Primeira providência  calcular a média aritmética! 
Temos: média aritmética: ̅ 
 
 
 
 
 
 
Como os dados são não agrupados a variância é dada por: 
 ( ̅)
 
 
 
Substituindo os valores vêm: 
 
42 
 
 
( ) ( ) ( ) ( ) ( ) 
 
 
 
( ) ( ) ( ) ( ) ( ) 
 
 
 
 
 
 
 
 
 
O desvio-padrão é dado por: √  √ 
 
4.2.5 Propriedades da variância e do desvio padrão 
 
Propriedades da Variância 
1. Somando-se ou subtraindo-se uma constante a todos os elementos de um conjunto de 
dados, a variância deste conjunto não de altera. 
 
2. Multiplicando-se ou dividindo-se todos os elementos de um conjunto de dados por uma 
constante (diferente de zero), a variância deste conjunto fica multiplicada ou dividida pelo 
quadrado desta constante. 
 
Vamos verificar se estas duas propriedades são válidas. 
 
Veja, no exemplo anterior calculamos a Variância do conjunto de dados X = {2; 4; 3; 6; 10} e 
o resultado encontrado foi Var(X) = 8!  variância de X igual a 8! 
 
Crie um novo conjunto de dados Y = X + 2, ou seja, os valores do conjunto Y são os valores 
do conjunto X somado da constante 2. Assim, Y = { 4; 6; 5; 8; 12}. 
 
Problema proposto - Calcule a Variância do conjunto Y e comprove a Propriedade1 da 
Variância, ou seja: se Y = X + 2 então  Var(Y) = Var(X)! 
 
Faça os cálculos e comprove esse resultado! 
 
Vamos agora comprovar a Propriedade2 da Variância. 
 
Crie um novo conjunto de dados Z = 2X, ou seja, os valores do conjunto Z são os valores do 
conjunto X multiplicados pela constante 2. Assim, se X = {2; 4; 3; 6; 10} , Z = { 4; 8 ; 6 ; 12; 20}. 
 
Problema proposto - Calcule a Variância do conjunto Z e comprove a Propriedade2 da 
Variância, ou seja: se Z = 2X a nossa constante é 2) então Var(Z) = 22Var(X)  Var(Z) = 4Var(X). 
 
Ou seja, se multiplicamos todos os elementos de um conjunto por uma constante (no nosso 
caso 2) a Variância fica multiplicada pelo quadrado da constante (4)! Assim Var(Z) = 4 × Var(X) = 
4×8 = 32! 
Faça os cálculos e comprove esse resultado! 
 
 
 
43 
 
Propriedades do Desvio Padrão 
1. Somando-se ou subtraindo-se uma constante a todos os valores de um conjunto de 
dados, o desvio padrão não se altera. 
2. Multiplicando-se ou dividindo-se todos os valores de um conjunto de dados por uma 
constante (diferente de zero), o desvio padrão ficará multiplicado ou dividido por essa constante. 
3. O desvio-padrão não tem interpretação física como ocorre com a média, a mediana e a 
moda. 
4. Em uma distribuição normal tem-se entre: 
[ ̅ ̅ ] - 68,25% das observações 
[ ̅ ̅ ] - 95,46% das observações 
[ ̅ ̅ ] - 99,73% das observações 
 
Veja, se o Desvio Padrão é a raiz quadrada da Variância, as propriedades 1 e 2 são 
decorrência das propriedades 1 e 2 da Variância! 
Na próxima seção vamos estudar o Coeficiente de Variação que juntamente com a 
Variância e o Desvio Padrão compõe o conjunto das medidas de dispersão mais importantes. 
 
4.2.6 Coeficiente de variação 
Algumas medidas estatísticas quando observadas isoladamente não trazem muita 
informação. Dessa forma, um desvio padrão de 5 unidades pode ser considerado pequeno para um 
conjunto de valores cuja média é 500, no entanto, se a média for igual a 50 o mesmo não pode ser 
dito. Por outro lado, por ser o desvio padrão expresso na mesma unidade que os dados originais, é 
complicado o seu uso para efeito de comparação da dispersão entre dois conjuntos de dados 
expressos em unidades diferentes. Objetivando-se contornar essas dificuldades e limitações, 
criou-se uma nova medida chamada Coeficiente de Variação (CV) assim definida: 
 
 
 ̅
 (Desvio padrão dividido pela Média aritmética) 
Ou seja, o Coeficiente de Variação é o Desvio Padrão dividido pela Média Aritmética! 
Esse é o Coeficiente de Variação de Pearson! 
 
KARL PEARSON (Londres-1857 / Londres -1898) 
Matemático - criador da Estatística Aplicada. 
Principais contribuições 
 Correlação (Coeficiente de Correlação de Pearson) 
 Regressão Linear 
 Classificação das Distribuições de Probabilidade 
 Teste Chi-Quadrado de Pearson 
 Coeficientes de Assimetria 
 
Observação - Perceba que o Coeficiente de Variação (CV) é adimensional, pois é a relação entre 
dois valores (Desvio Padrão e Média) que são medidos na mesma unidade. Assim, o CV é sempre 
expresso em percentual (%) como veremos nos exemplos seguintes. 
 
 
 
 
 
44 
 
Exemplo - 1 
Para um conjunto de dados relativos a estaturas têm-se: 
Média =161 cm e Desvio Padrão S =5,57 cm. 
Achar o CV deste conjunto de dados. 
Temos: aplicação direta da nossa fórmula! 
 
 
 ̅
 
 
 
 
 
Exemplo-2 Consideremos os resultados das medidas de altura e peso de um mesmo grupo de 
indivíduos exibidos na tabela abaixo: 
 
Medidas 
x
 S 
Estatura 175 cm 5,0 cm 
Peso 68 Kg 2,0 Kg 
 
Qual apresenta maior grau de dispersão? 
 
Veja, aqui não podemos comparar o Desvio Padrão das Estaturas medido em cm (5,0 cm) 
com Desvio Padrão do Peso medido em kg (2 kg)! Essa é uma das grandes limitações da utilização 
do Desvio Padrão para comparar dispersão de conjuntos de dados que estão medidos em unidades 
diferentes. 
 
Nesse caso temos que usar o Coeficiente de Variação. 
Temos: 
 
 ̅
 
0285,0
175
5
ECV
  2,85%  CV das estaturas! 
0294,0
68
2
PCV
  2,94%  CV dos pesos! 
 
Logo, os pesos (2,94%) apresentam maior grau de dispersão RELATIVA que as alturas 
(2,85%), embora a dispersão ABSOLUTA (desvio padrão) seja maior para as alturas (5 cm). 
 
Veja, aqui fizemos referência a dois conceitos - Dispersão Absoluta e Dispersão Relativa! 
 
Dispersão Absoluta  é a Variância ou o Desvio Padrão! 
Dispersão Relativa  é o Coeficiente de Variação! 
 
Da mesma forma que a Variância e o Desvio Padrão o Coeficiente de Variação tem também 
as suas propriedades. Esse assunto será apresentado no próximo item. 
 
 
 
 
45 
 
4.2.7 Propriedades do coeficiente de variação 
 
1. Somando-se uma constante positiva a todos os elementos de um conjunto de dados o 
coeficiente de variação diminui. No entanto, não é possível determinar o novo valor a partir 
apenas do valor original. 
 
2. Subtraindo-se uma constante positiva de todos os elementos de um conjunto de dados o 
coeficiente de variação aumenta. No entanto, não é possível determinar o novo valora partir 
apenas do valor original. 
 
3. Multiplicando-se ou dividindo-se todos os elementos de um conjunto de dados por uma 
constante positiva, o coeficiente de variação não se altera. 
 
Vamos fazer uma reflexão e tentar comprovar essas propriedades usando o nosso 
conhecimento sobre as propriedades dos elementos que são usados no cálculo do Coeficiente de 
Variação, ou seja, o Desvio Padrão e a Média. Observe. 
 
Vamos supor um conjunto de Dados que tenha Média = 40 e Desvio Padrão = 4 
O seu coeficiente de Variação será: 
%1010,0
40
4
CV
 
 
Vamos agora verificar se as propriedades do Coeficiente de Variação são válidas. 
 
Propriedade 1. Somando-se uma constante positiva a todos os elementos de um conjunto de 
dados o coeficiente de variação diminui. No entanto, não é possível determinar o novo valor a 
partir apenas do valor original. 
 
Vamos somar a constante c = 10 ao nosso conjunto de dados. 
 
O que acontece com a Média? 
 
Fica somada de 10! Então Média Nova = 40 + 10 = 50! 
 
Esqueceu essa propriedade? Está na Unidade 3! 
 
O que acontece com o Desvio Padrão? 
 
Não se altera! Então o Desvio Padrão continua igual a 4! 
 
Esqueceu essa propriedade também? Está nesta Unidade, acabamos de ver! 
Assim, o novo CV será: 
%808,0
50
4
1040
4


CV
 
Ou seja... O CV passou de 10% para 8%  DIMINUIU! 
 
 
46 
 
Propriedade 2. Subtraindo-se uma constante positiva de todos os elementos de um conjunto de 
dados o coeficiente de variação aumenta. No entanto, não é possível determinar o novo valor a 
partir apenas do valor original. 
 
Vamos subtrair a constante c = 10 ao nosso conjunto de dados. 
 
O que acontece com a Média? 
 
Fica subtraída de 10! Então Média Nova = 40 - 10 = 30! 
 
Esqueceu dessa propriedade? Está na Unidade 3! 
 
O que acontece com o Desvio Padrão? 
 
Não se altera! Então o Desvio Padrão continua igual a 4! 
 
Esqueceu dessa propriedade? Está nesta Unidade, acabamos de ver! 
Assim, o novo CV será: 
%33,131333,0
30
4
1040
4


CV
 
Ou seja... O CV passou de 10% para 13,33%  AUMENTOU! 
 
Propriedade 3. Multiplicando-se ou dividindo-se todos os elementos de um conjunto de dados por 
uma constante positiva, o coeficiente de variação não se altera. 
 
Vamos multiplicar o nosso conjunto de dados pela constante c = 10. 
 
O que acontece com a Média? 
 
Fica multiplicada por 10! Então Média Nova = 10 × 40 = 400! 
 
Esqueceu essa propriedade? Está na Unidade 3! 
 
O que acontece com o Desvio Padrão? 
 
multiplicado por 10! Então o Desvio Padrão Novo = 4 ×10 = 40! 
 
Esqueceu essa propriedade? Está nesta Unidade, acabamos de ver! 
Assim, o novo CV será: 
%1010,0
400
40
CV
 
Ou seja, o CV passou de 10% para 10%  NÃO SE ALTERA! 
 
 
 
47 
 
 
 
 
 
 
 
Realize os exercícios e depois confira a resposta na próxima página. 
Lembre-se: Não vale olhar antes! 
 
2 - Achar a variância e o desvio-padrão da seguinte distribuição de frequência: 
 
Classe i Estrutura (cm) fi 
1 150 ˫ 154 4 
2 154 ˫ 158 9 
3 158 ˫ 162 11 
4 162 ˫ 166 8 
5 166 ˫ 170 5 
6 170 ˫ 174 3 
 40 
 
 
 
48 
 
 
 
 
 
 
𝑺𝟐 
𝟏𝟎𝟑𝟖𝟎𝟖𝟎
𝟒𝟎
 
𝟔𝟒𝟒𝟎
𝟒𝟎
 
 
 𝟑𝟏 𝒄𝒎𝟐 
Exercícios – Resolução (continuação) 
 
1 - Precisamos abrir na tabela novas colunas para xi (ponto médio), fi x xi e fi x xi
2. 
Classe i Estrutura (cm) fi xi fi x xi fi x xi
2 
1 150 ˫ 154 4 152 608 92.416 
2 154 ˫ 158 9 156 1.404 219.024 
3 158 ˫ 162 11 160 1.760 281.600 
4 162 ˫ 166 8 164 1.312 215.168 
5 166 ˫ 170 5 168 840 141.120 
6 170 ˫ 174 3 172 516 88.754 
 40 6.440 1.038.080 
 
Cálculo da Variância 
 
Como os dados estão distribuídos em intervalos devemos usar a fórmula: 
 
𝑆 
 𝑓𝑖 𝑥𝑖
 
 𝑓𝑖
 (
 𝑓𝑖 𝑥𝑖
 𝑓𝑖
)
 
 onde os xi são os pontos médios de cada intervalo. 
 
Da Tabela acima obtemos que: 
 
 
 𝑓𝑖 𝑥𝑖
 
 𝑓𝑖
 
 
 
 e (
 𝑓𝑖 𝑥𝑖
 𝑓𝑖
)
 
 (
 
 
)
 
 
 
Substituindo os valores na fórmula da Variância vem: 
 
 
O Desvio Padrão é a raiz quadrada da variância. Assim, 𝑺 √ 𝟓 𝟓𝟕 𝒄𝒎 
 
Coeficiente de Variação 
 
 
49 
 
Unidade III – Probabilidade 
 
 
 
 Conhecer os conceitos da teoria das probabilidades e sua utilização 
na modelagem e solução de problemas. 
 
 
50 
 
5.1 Introdução 
 
5.1.1 O que é Probabilidade? 
Os jogos de azar, que se caracterizam por ações como girar uma roleta, lançar dados ou 
retirar carta de baralho têm duas características básicas: a incerteza e a regularidade. Assim, por 
exemplo, toda vez que se joga um dado, pode ocorrer qualquer uma das faces. No entanto, o jogo, 
embora incerto, tem regularidade. Se forem feitos muitos lançamentos espera-se que todas as 
faces ocorram igual número de vezes. Essas características de jogos de azar, percebidas há muito 
tempo, criaram a ideia de que seria possível achar uma “fórmula” ou um “método”, que permitisse 
ao jogador ganhar sempre, ou pelo menos, ganhar na maioria das vezes. Isso não é possível, mas foi 
essa ideia que incentivou o estudo de tais jogos, o que levou a formulação da teoria da 
probabilidade, base da estatística moderna. 
 
Relembrando alguns conceitos vistos na unidade I 
 
Experimento Aleatório, Espaço Amostral (S) e Evento 
Chama-se experimento aleatório a todo experimento que, repetido inúmeras vezes nas 
mesmas condições, fornece resultados imprevisíveis. Ou seja, são experimentos cujos resultados 
são devidos ao acaso. O espaço amostral (S) é o conjunto de todos os resultados possíveis de um 
experimento aleatório. 
 
Exemplos 
Experimento 1 - Retirar uma carta de um baralho com 52 cartas e observar o seu naipe; 
Espaço amostral S1 = {Ouro, Paus, Espada, Copas}  só existem estes 4 naipes no baralho. 
 
Experimento 2 - Jogar um dado e observar o resultado 
Espaço amostral S2 = {1,2,3,4,5,6}  só existem estas 6 possibilidades. 
 
Experimento 3 - Jogar duas moedas e observar o resultado. 
Espaço Amostral S3 = {(c, c), (c, k), (k, c), (k, k)}  onde c = coroa; e k = cara 
 
Evento - é qualquer subconjunto do espaço amostral S de um Experimento Aleatório. 
Exemplo - No lançamento de um dado o Espaço Amostral é S = {1,2,3,4,5,6} 
Então podemos ter os seguintes exemplos de eventos: 
A = {2,4,6}  S é um evento de S, pois A está contido () em S. 
Este evento pode ser descrito como: lançar o dado e obter um número PAR! 
B = {1,2,3,4,5,6}  S é um evento de S denominado Evento Certo. 
Este evento pode ser descrito como: lançar o dado e obter um número de 1 até 6 ! 
 
Você saberia dizer por que B é um evento certo? 
C = {4}  S é um evento de S 
D = Ø  S é um evento de S denominado Evento Impossível. 
 
51 
 
Lembra como podemos descrever este evento? Obter um número maior que 6 no 
lançamento de um dado. É impossível obter o número 9 no lançamento de um dado! 
 
5.2 Definição de Probabilidade 
Considere um espaço amostral S e A um evento de S. Chama-se probabilidade do evento A, 
ao número real P(A) tal que: 
 
 ( ) 
 ( )
 ( )
 , onde: 
 ( ) = nº de elementos de A 
 ( ) = de elementos de S 
 
Exemplo - Qual é a probabilidade de se obter cara no lançamento de uma moeda? 
Temos: 
Espaço Amostral S = {Ca, Co} n(S) = 2. 
Seja A o evento - aparecer cara, então, A é dado por: A = {Ca} e n(A) = 1 
Logo, ( ) 
 ( )
 ( )
 
 
 
 .  A probabilidade de jogar uma moeda

Outros materiais