Buscar

Estatística Aplicada

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 69 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 69 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 69 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Estatística Aplicada
Professora conteudista: Angela Maria Pizzo
Sumário
Estatística Aplicada
Unidade I
1 INTRODUÇÃO À ESTATÍSTICA .........................................................................................................................1
1.1 Introdução ..................................................................................................................................................1
1.2 Importância da estatística ...................................................................................................................2
1.3 Grandes áreas da estatística ...............................................................................................................2
1.4 Fases do método estatístico ................................................................................................................5
1.5 Dados estatísticos ..................................................................................................................................9
1.6 Formas iniciais de tratamento dos dados .................................................................................. 10
1.7 Notação por índices .............................................................................................................................11
1.7.1 Notação sigma (∑) ..................................................................................................................................11
1.8 Séries estatísticas – simples e compostas .................................................................................. 15
1.8.1 Tipos de séries estatísticas .................................................................................................................. 16
1.8.2 Tabelas de dupla entrada ..................................................................................................................... 18
1.9 Apresentação de dados - gráficos e tabelas ............................................................................. 20
2 MEDIDAS DE TENDÊNCIA CENTRAL: MÉDIA, MODA E MEDIANA PARA 
DADOS SIMPLES .................................................................................................................................................. 24
2.1 A média aritmética simples (µ,x) ................................................................................................... 25
2.2 A média aritmética ponderada ....................................................................................................... 28
2.3 A mediana ............................................................................................................................................... 29
2.4 A moda ..................................................................................................................................................... 31
3 MEDIDAS DE DISPERSÃO PARA DADOS SIMPLES .............................................................................. 33
3.1 Amplitude total ..................................................................................................................................... 37
3.2 Desvio médio absoluto ....................................................................................................................... 37
3.3 Variância .................................................................................................................................................. 39
3.4 Desvio padrão ........................................................................................................................................ 44
4 DISTRIBUIÇÃO DE FREQUÊNCIAS ............................................................................................................. 47
4.1 A construção de uma distribuição de frequências para dados contínuos .................... 48
4.2 A construção de uma distribuição de frequências para dados discretos ...................... 55
4.3 Representação gráfica de dados agrupados ............................................................................. 56
Unidade II
5 AS MEDIDAS DE POSIÇÃO E VARIABILIDADE NUMA DISTRIBUIÇÃO DE FREQUÊNCIA ...... 66
5.1 As medidas de posição ....................................................................................................................... 67
5.1.1 A média ....................................................................................................................................................... 67
5.1.2 A mediana .................................................................................................................................................. 69
5.1.3 A moda ........................................................................................................................................................ 70
5.2 As medidas de dispersão numa distribuição de frequência .................................................71
5.2.1 O desvio médio ........................................................................................................................................ 71
5.2.2 Variância .................................................................................................................................................... 72
5.2.3 Desvio padrão ........................................................................................................................................... 74
6 INTRODUÇÃO À PROBABILIDADE ............................................................................................................. 78
6.1 Teoria dos conjuntos, espaço amostral e eventos ................................................................... 78
7 PROBABILIDADE: ORIGEM, MÉTODOS E PRINCIPAIS TEOREMAS ................................................ 90
7.1 Origens da probabilidade .................................................................................................................. 90
7.1.1 Métodos objetivos .................................................................................................................................. 91
7.1.2 Método subjetivo .................................................................................................................................... 96
7.2 Principais teoremas de probabilidade .......................................................................................... 97
8 REVISÃO ............................................................................................................................................................102
1
ESTATÍSTICA APLICADA
Di
ag
ra
m
aç
ão
: F
ab
io
 -
 1
9/
11
/0
8 
-|
|-
 1
a 
Co
rr
eç
ão
: F
ab
io
 / 
Re
v:
 A
na
 0
3/
12
/0
8
1 INTRODUÇÃO À ESTATÍSTICA
1.1 Introdução
A palavra estatística lembra, à maioria das pessoas, 
recenseamentos. Os censos existem há milhares de anos e 
constituem um esforço imenso e caro feito pelos governos 
com o objetivo de conhecer seus habitantes, sua condição 
socioeconômica, sua cultura, religião, etc. Portanto, associar-se 
estatística a censo é perfeitamente correto do ponto de vista 
histórico, sendo interessante salientar que as palavras estatística 
e estado têm a mesma origem latina: status.
A estatística é também comumente associada às pesquisas de 
opinião pública, aos vários índices governamentais, aos gráficos 
e médias publicadas diariamente na imprensa. Na realidade, 
entretanto, a estatística engloba muitos outros aspectos, sendo 
fundamental na análise de dados provenientes de quaisquer 
processos em que exista variabilidade.
É possível distinguir duas concepções para a palavra 
estatística:
No plural (estatísticas), indica qualquer coleção de dados 
numéricos, reunidos com a finalidade de fornecer informações 
acerca de uma atividade qualquer. Assim, por exemplo, as 
estatísticas demográficas referem-se aos dados numéricossobre nascimentos, falecimentos, matrimônios, desquites, etc. 
As estatísticas econômicas consistem em dados numéricos 
relacionados com emprego, produção, vendas e com outras 
5
10
15
20
Unidade I
2
Unidade I
Di
ag
ra
m
aç
ão
: F
ab
io
 -
 1
9/
11
/0
8 
-|
|-
 1
a 
Co
rr
eç
ão
: F
ab
io
 / 
Re
v:
 A
na
 0
3/
12
/0
8
atividades ligadas aos vários setores da vida econômica. No 
singular (estatística), indica a atividade humana especializada ou 
um corpo de técnicas, ou ainda uma metodologia desenvolvida 
para a coleta, a classificação, a apresentação, a análise e a 
interpretação de dados quantitativos e a utilização desses dados 
para a tomada de decisões. 
1.2 Importância da estatística
O mundo está repleto de problemas. Para resolvermos a 
maioria deles, necessitamos de informações. Mas que tipo de 
informações? Quantas? E após obtê-las, o que fazer com elas? 
A estatística lida com essas informações, associando os dados 
ao problema, descobrindo como e o que coletar e obtendo 
conclusões a partir de todas essas informações de tal forma que 
possam ser entendidas por outras pessoas. 
Portanto, os métodos estatísticos auxiliam o cientista social, 
o economista, o engenheiro, o agrônomo e muitos outros 
profissionais a realizarem o seu trabalho com mais eficiência. 
Vejamos alguns exemplos: 
Os estatísticos do governo conduzem censos de população, 
moradia, produtos industriais, agricultura e outros. São feitas 
compilações sobre vendas, produção, inventário, folha de 
pagamento e outros dados das indústrias e empresas. Essas 
estatísticas informam ao administrador como a sua empresa 
está crescendo, seu crescimento em relação a outras empresas 
e como planejar ações futuras. A análise dos dados é muito 
importante para se fazer um planejamento adequado.
1.3 Grandes áreas da estatística
Para fins de apresentação, é usual dividir-se a estatística em 
três grandes áreas, embora não se trate de ramos isolados: 
• amostragem, que é o mecanismo de coleta de dados; 
• estatística descritiva, que se ocupa da organização, 
apresentação e sintetização de dados; 
Estatística é um conjunto de 
técnicas e métodos que nos auxiliam 
no processo de tomada de decisão na 
presença de incerteza.
5
10
15
20
25
30
3
ESTATÍSTICA APLICADA
Di
ag
ra
m
aç
ão
: F
ab
io
 -
 1
9/
11
/0
8 
-|
|-
 1
a 
Co
rr
eç
ão
: F
ab
io
 / 
Re
v:
 A
na
 0
3/
12
/0
8
• estatística inferencial, que constitui o conjunto de métodos 
para a tomada de decisões, nas situações em que existem 
incerteza e variação. 
Amostragem
É o processo de escolha da amostra. É a parte inicial de 
qualquer estudo estatístico. Consiste na escolha criteriosa dos 
elementos a serem submetidos ao estudo.
Exemplo 1. Pesquisas sobre tendências de votação. Em 
épocas de eleição, é comum a realização de pesquisas com o 
objetivo de se conhecerem as tendências do eleitorado. Para 
que os resultados sejam, de fato, representativos, toma-se 
o cuidado de se entrevistar um conjunto de pessoas com 
características socioeconômicas, culturais, religiosas, etc. tão 
próximas quanto possível da população à qual os resultados 
da pesquisa serão estendidos. A escolha da amostra, a 
redação do questionário, a entrevista, a codificação dos 
dados, a apuração dos resultados são as etapas deste tipo de 
pesquisa. 
População e amostra 
O estudo de qualquer fenômeno, seja ele natural, social, 
econômico ou biológico, exige a coleta e a análise de dados 
estatísticos. A coleta de dados é, pois, a fase inicial de qualquer 
pesquisa.
População é a coleção de todas as observações potenciais 
sobre determinado fenômeno. O conjunto de dados efetivamente 
observados, ou extraídos, constitui uma amostra da população. 
É sobre os dados da amostra que se desenvolvem os estudos, 
visando a fazer inferências sobre a população. 
Exemplo 2. Avaliação de um programa de ensino. Toma-se 
certo número de pares de turmas: a um conjunto de turmas 
5
10
15
20
25
30
4
Unidade I
Di
ag
ra
m
aç
ão
: F
ab
io
 -
 1
9/
11
/0
8 
-|
|-
 1
a 
Co
rr
eç
ão
: F
ab
io
 / 
Re
v:
 A
na
 0
3/
12
/0
8
ensina-se um assunto por um novo método, e ao outro, pelo 
método clássico. Aplica-se uma prova a ambos os grupos. As 
notas observadas nesses conjuntos de turmas constituem 
a nossa amostra. Se os resultados do novo método forem 
melhores, iremos aplicá-lo a todas as turmas, isto é, à população. 
A partir da amostra, estabelecemos o que é conveniente 
para a população, ou seja, fazemos uma inferência sobre a 
população.
Exemplo 3. Renda média per capita em diversas regiões 
do país. Toma-se um conjunto de indivíduos em cada região, 
escolhidos ao acaso, e sobre esse grupo fazem-se os estudos. 
Os indivíduos assim escolhidos constituem a amostra, e os 
resultados nela observados serão estendidos à população. 
Estatística descritiva
É a parte mais conhecida. Quem vê o noticiário, na televisão 
ou nos jornais, sabe o quão frequente é o uso de médias, índices 
e gráficos nas notícias.
Exemplo 4. INPC (Índice Nacional de Preços ao Consumidor). 
Sua construção envolve a sintetização, em um único número, 
dos aumentos dos produtos de uma cesta básica.
Exemplo 5. Anuário Estatístico Brasileiro. O IBGE publica 
a cada ano este anuário, apresentando, em várias tabelas, 
os mais diversos dados sobre o Brasil: educação, saúde, 
transporte, economia, cultura, etc. Embora simples, fáceis de 
serem entendidas, as tabelas são o produto de um processo 
demorado e extremamente dispendioso de coleta e apuração 
de dados. 
Exemplo 6. Anuário Estatístico da Embratur. A Embratur 
publica este anuário apresentando, em várias tabelas e gráficos, 
os mais diversos dados sobre turismo interno e dados sobre 
entrada de turistas estrangeiros no Brasil. 
5
10
15
20
25
30
5
ESTATÍSTICA APLICADA
Di
ag
ra
m
aç
ão
: F
ab
io
 -
 1
9/
11
/0
8 
-|
|-
 1
a 
Co
rr
eç
ão
: F
ab
io
 / 
Re
v:
 A
na
 0
3/
12
/0
8
Estatística inferencial (ou indutiva)
A tomada de decisões sobre a população, com base em 
estudos feitos sobre os dados da amostra, constitui o problema 
central da inferência estatística. 
Exemplo 7. Análise financeira. Os analistas financeiros 
estudam dados sobre a situação da economia, visando a explicar 
tendências dos níveis de produção e de consumo, projetando-os 
para o futuro.
Exemplo 8. Ocorrência de terremotos. Os geólogos estão 
continuamente coletando dados sobre a ocorrência de 
terremotos. Gostariam de inferir quando e onde ocorrerão 
tremores, e qual a sua intensidade. Trata-se, sem dúvida, de uma 
questão complexa, que exige longa experiência geológica, além 
de cuidadosa aplicação de métodos estatísticos. 
Probabilidade 
O processo de generalização, que é característico 
do método indutivo, está associado a uma margem de 
incerteza. A existência da incerteza deve-se ao fato de 
que a conclusão que se pretende obter para o conjunto 
de todos os indivíduos analisados quanto a determinadas 
características comuns baseia-se em uma parcela do total 
das observações. A medida da incerteza é tratada mediante 
técnicas e métodos que se fundamentam na Teoria da 
Probabilidade. Essa teoria procura quantificar a incerteza 
existente em determinada situação. 
1.4 Fases do método estatístico
Quando se pretende empreender um estudo estatístico 
completo, existem diversas fases do trabalho que devem 
ser desenvolvidas para se chegar aos resultados finais do 
estudo.
Fica claro, assim, que as três áreas 
da estatística não são separadas ou 
distintas, mas tendem a se entrelaçar. Adescrição e o resumo dos dados tende 
a ser a primeira fase da análise dos 
mesmos; já a teoria e os fundamentos 
da amostragem se baseiam na teoria 
da probabilidade, que nos leva a 
uma inferência ou a uma tomada de 
decisões baseada nas informações 
apresentadas.
5
10
15
20
25
30
6
Unidade I
Di
ag
ra
m
aç
ão
: F
ab
io
 -
 1
9/
11
/0
8 
-|
|-
 1
a 
Co
rr
eç
ão
: F
ab
io
 / 
Re
v:
 A
na
 0
3/
12
/0
8
As fases principais são as seguintes:
• definição do problema;
• planejamento;
• coleta de dados;
• apuração dos dados;
• apresentação dos dados;
• análise e interpretação dos dados. 
Descrevendo mais atentatamente cada fase:
Definição do problema
A primeira fase do trabalho consiste em uma definição 
ou formulação correta do problema a ser estudado. Além de 
considerar detidamente o problema objeto do estudo, o analista 
deverá examinar outros levantamentos realizados no mesmo 
campo e análogos, uma vez que parte da informação de que se 
necessita pode, muitas vezes, ser encontrada nesses últimos.
Planejamento
O passo seguinte, após a definição do problema, compreende 
a fase do planejamento, que consiste em se determinar o 
procedimento necessário para resolver o problema e, em especial, 
como levantar informações sobre o assunto objeto do estudo. 
É preciso planejar o trabalho a ser realizado, tendo em vista o 
objetivo que se pretende atingir. É nesta fase que será escolhido 
o tipo de levantamento a ser utilizado. Sob esse aspecto, pode 
haver dois tipos de levantamento:
• levantamento censitário – quando a contagem for 
completa, abrangendo todo o universo;
• levantamento por amostragem, quando a contagem for 
parcial.
Observe quais são as fases principais 
do método estatístico – compõem 
a organização de um projeto, sua 
execução e apresentação final.
5
10
15
20
25
7
ESTATÍSTICA APLICADA
Di
ag
ra
m
aç
ão
: F
ab
io
 -
 1
9/
11
/0
8 
-|
|-
 1
a 
Co
rr
eç
ão
: F
ab
io
 / 
Re
v:
 A
na
 0
3/
12
/0
8
Outros elementos importantes que devem ser tratados nessa 
mesma fase são:
• cronograma das atividades – através do qual são fixados os 
prazos para as várias fases;
• custos envolvidos;
• exame das informações disponíveis;
• delineamento da amostra, etc.
Coleta dos dados 
O terceiro passo é essencialmente operacional, 
compreendendo a coleta das informações propriamente ditas. 
Nesta fase do método estatístico, é conveniente estabelecer 
uma distinção entre duas espécies de dados:
• dados primários – quando são publicados ou comunicados 
pela própria pessoa ou organização que os haja escolhido.
• dados secundários – quando são publicados ou comunicados 
por outra organização.
Um conjunto de dados é, pois, primário ou secundário em 
relação a alguém. As tabelas do censo demográfico são fontes 
primárias. Quando determinado jornal publica estatísticas 
extraídas de várias fontes e relacionadas com diversos setores 
industriais, os dados são secundários para quem desejar utilizar-
se deles em alguma pesquisa que esteja desenvolvendo.
A coleta de dados pode ser realizada de duas maneiras:
• coleta direta – quando é obtida diretamente da fonte, 
como no caso da empresa que realiza uma pesquisa 
para saber a preferência dos consumidores pela sua 
marca;
5
10
15
20
25
8
Unidade I
Di
ag
ra
m
aç
ão
: F
ab
io
 -
 1
9/
11
/0
8 
-|
|-
 1
a 
Co
rr
eç
ão
: F
ab
io
 / 
Re
v:
 A
na
 0
3/
12
/0
8
• coleta indireta – quando é inferida a partir dos elementos 
conseguidos pela coleta direta, ou através do conhecimento 
de outros fenômenos que, de algum modo, estejam 
relacionados com o fenômeno em questão.
Apuração dos dados
Antes de começar a analisar os dados, é conveniente que 
lhes seja dado algum tratamento prévio, a fim de torná-los mais 
expressivos. A quarta etapa do processo é, então, a da apuração 
ou sumarização, que consiste em resumir os dados através de 
sua contagem e agrupamento.
Apresentação dos dados
Há duas formas de apresentação ou exposição dos dados 
observados, que não se excluem mutualmente:
• apresentação tabular – é uma apresentação numérica dos 
dados. Consiste em dispor os dados em linhas e colunas 
distribuídas de modo ordenado, segundo algumas regras 
práticas adotadas pelos diversos sistemas estatísticos. As 
tabelas têm a vantagem de conseguir expor, sinteticamente 
e em um só local, os resultados sobre determinado assunto, 
de modo a se obter uma visão global mais rápida daquilo 
que se pretende analisar;
• apresentação gráfica – constitui uma apresentação 
geométrica dos dados numéricos. Embora apresentação 
tabular seja de extrema importância, no sentido de facilitar 
a análise numérica de dados, não permite ao analista obter 
uma visão tão rápida, fácil e clara do fenômeno e sua 
variação como conseguida através de um gráfico.
Análise e interpretação dos dados
Nesta última etapa, o interesse maior reside em tirar 
conclusões que auxiliem o pesquisador a resolver seu problema. 
Observe em jornais e revistas que, 
normalmente, as informações gráficas 
têm uma assimilação mais rápida por 
parte dos leitores.
5
10
15
20
25
30
9
ESTATÍSTICA APLICADA
Di
ag
ra
m
aç
ão
: F
ab
io
 -
 1
9/
11
/0
8 
-|
|-
 1
a 
Co
rr
eç
ão
: F
ab
io
 / 
Re
v:
 A
na
 0
3/
12
/0
8
A análise dos estatísticos está ligada essencialmente ao cálculo 
de medidas, cuja finalidade principal é descrever o fenômeno. 
Assim, o conjunto de dados a ser analisado pode ser expresso por 
números-resumos, as estatísticas, que evidenciam características 
particulares desse conjunto. O significado exato de cada um dos 
valores obtidos através do cálculo das várias medidas estatísticas 
disponíveis deve ser bem interpretado. É possível mesmo, nesta 
fase, arriscar algumas generalizações, as quais envolverão, como 
mencionado anteriormente, algum grau de incerteza, porque 
não se pode estar seguro de que o que foi constatado para 
aquele conjunto de dados (a amostra) se verificará igualmente 
para a população. 
1.5 Dados estatísticos
Quando se trabalha com a observação, a mensuração, 
a análise e a interpretação de números, esses números nos 
conduzem a índices inflacionários, índices de desemprego, 
probabilidade de determinado candidato ganhar as eleições, etc. 
Tais números, portanto, serão chamados de dados estatísticos. 
Esses dados precisarão ser organizados e sumarizados para sua 
correta interpretação.
Dado bruto significa que os dados não estão numericamente 
organizados e processados. O processamento e a organização 
dos dados é que os transformam em informação, enfatizando 
seus aspectos mais importantes. A informação, portanto, é 
resultado de um tratamento dos dados.
Para organizar e processar os dados estatísticos, podemos 
utilizar resumos visuais e numéricos, através de gráficos, mapas, 
tabelas e modelos numéricos.
A mensuração ou a observação de itens como índices de 
preços, renda mensal per capita de um Estado, etc., dão origem 
aos dados estatísticos. Como esses itens originam valores que 
tendem a apresentar um certo grau de variabilidade quando são 
medidos sucessivas vezes, chamamos então de variáveis. 
É importante identificar os quatro 
tipos de variáveis: variáveis contínuas, 
variáveis discretas, variáveis nominais e 
variáveis por posto.
5
10
15
20
25
30
10
Unidade I
Di
ag
ra
m
aç
ão
: F
ab
io
 -
 1
9/
11
/0
8 
-|
|-
 1
a 
Co
rr
eç
ão
: F
ab
io
 / 
Re
v:
 A
na
 0
3/
12
/0
8
I. Variáveis contínuas: são as variáveis que podemassumir 
qualquer valor num intervalo contínuo (dado contínuo). 
Exemplos: altura, peso, velocidade, etc.
II. Variáveis discretas: em geral originam-se da contagem 
de itens e só podem assumir valores inteiros. Exemplos: número 
de alunos em sala de aula, número de professores que trabalham 
na escola, etc.
III. Variáveis nominais: são aquelas que existem com o 
objetivo de definir categorias, e as observações, mensurações e 
análises são feitas levando-se em conta essas mesmas categorias. 
Exemplos de categorias seriam: a separação por sexo, idade, 
nível de escolaridade, etc.
IV. Variáveis por posto: quando existe o desejo de dispor 
os elementos observados segundo uma ordem de preferência 
ou desempenho, atribuem-se valores relativos para indicar esta 
ordem. Exemplo: primeiro, segundo, terceiro. 
As variáveis discretas e contínuas são ditas variáveis 
quantitativas porque envolvem dados numéricos. Já as 
variáveis nominais e por posto precisam ser transformadas em 
valores numéricos para serem objeto da análise estatística, e 
são ditas variáveis qualitativas.
1.6 Formas iniciais de tratamento dos dados
Em geral, quando nos propomos a buscar, construir 
informações a partir de dados, deparamo-nos, inicialmente, com 
um conjunto de dados brutos que pouco nos dizem. É preciso 
organizá-los minimamente para que eles comecem a fazer 
algum sentido, viabilizando sua análise.
Uma primeira forma de organização dos dados é o chamado 
rol. Obtemos o rol quando organizamos os dados brutos em 
ordem crescente ou decrescente de grandeza. A amplitude do 
• variáveis discretas e contínuas = 
variáveis quantitativas;
• variáveis nominais e por posto = 
variáveis qualitativas.
5
10
15
20
25
11
ESTATÍSTICA APLICADA
Di
ag
ra
m
aç
ão
: F
ab
io
 -
 1
9/
11
/0
8 
-|
|-
 1
a 
Co
rr
eç
ão
: F
ab
io
 / 
Re
v:
 A
na
 0
3/
12
/0
8
rol é obtida pela diferença entre o maior e o menor número do 
rol. Utiliza-se o rol quando o conjunto de dados for pequeno, ou 
seja, for inferior a 30 observações.
Por outro lado, quando se trata de um conjunto grande 
de dados, que seja superior a 30 observações, utilizamos a 
distribuição de frequências, que consiste em organizar os 
dados brutos em classes, a fim de identificar o número de itens 
pertencentes a cada classe, denominado frequência de classe. 
Os dados são assim organizados em intervalos de classes. Este 
assunto será estudado no módulo II.
1.7 Notação por índices
A notação por índices é bastante utilizada na estatística, 
sendo assim importante esclarecer seu significado. O símbolo xi 
(onde se lê “x índice i”) irá representar qualquer um dos n valores 
assumidos pela variável x, x1,x2,x3,x4,...,xn. “n” é denominado índice 
e poderá assumir qualquer dos números entre 1, 2, 3, 4, ..., n.
1.7.1 Notação sigma (∑)
A maioria dos processos estatísticos vai exigir o cálculo da 
soma de um conjunto de números. A letra maiúscula grega 
sigma (∑) é utilizada para representar essas somas. 
Assim, se uma determinada variável y tiver os valores 3, 5, 7, 
9 e 11, o ∑y será:
 ∑y = 3+5+7+9+11
 ∑y = 35
Por outro lado, se o consumo semanal de arroz de x, durante 
um mês, foram 2kg,4kg, 3kg, 5kg, o total consumido por x no 
mês teria sido:
 ∑x = 2+4+3+5
 ∑x = 14; x teria consumido 14kg de arroz durante o mês 
referido.
• rol inferior a 30 observações;
• distribuição de frequências superior a 
30 observações.
5
10
15
20
25
12
Unidade I
Di
ag
ra
m
aç
ão
: F
ab
io
 -
 1
9/
11
/0
8 
-|
|-
 1
a 
Co
rr
eç
ão
: F
ab
io
 / 
Re
v:
 A
na
 0
3/
12
/0
8
A notação sigma possui algumas propriedades que 
precisamos desenvolver, para facilitar os conteúdos que 
estudaremos nesta disciplina.
a) x x xii
n = = ∑∑∑ =1 ; isso significa que devemos somar 
as n observações de x, começando com a primeira. 
Por exemplo, num conjunto de dados em que xi={2,4,6,8,10,12}, 
onde n=6, temos:
x x
x
ii
n
ii
i
= =∑ ∑
∑
= = + + + + +
=
1 1
6
2 4 6 8 10 12
42
Por outro lado, é possível utilizar essa notação quando 
se pretende analisar a soma de apenas uma parte dos dados 
disponibilizados, podendo-se, portanto, abreviar a soma de um 
conjunto de dados. Desta forma, podemos ter:
I) x x x xii1 2 3 1
3+ + = =∑
II) x x x x xii8 9 10 11 8
11+ + + = =∑
b) Se cada valor da variável x é multiplicado ou dividido por 
uma constante, temos que isso será igual ao valor da constante 
multiplicado ou dividido pela somatória de x.
c x c x. .= ∑∑
Assim, 
4 4 4 4 4
4 4
1 2 3 4
1
4
1 2 3 4
1
4
x x x x x
x x x x x
i
i
i
i
= + + +
= + + + =
=
=
∑
∑( )
5
10
15
20
13
ESTATÍSTICA APLICADA
Di
ag
ra
m
aç
ão
: F
ab
io
 -
 1
9/
11
/0
8 
-|
|-
 1
a 
Co
rr
eç
ão
: F
ab
io
 / 
Re
v:
 A
na
 0
3/
12
/0
8
Por exemplo: 
se xi={2,4,6,8,10,12}; onde n=6 e cada valor de x é multiplicado 
pela constante c=2, temos: 
cx c x
cx c xi
i
i
i
=
= = + + + + + =
=
∑∑
∑ ∑
= =1
6
1
6
2 2 2 4 2 6 2 8 2 10 2 12( ) ( ) ( ) ( ) ( ) ( )
22 2 4 6 8 10 12
2 2 2 42 84
1
6
1
6
( )
( )
+ + + + +
= = =
==
∑∑ x xi i
ii
c) O somatório de uma constante c será igual ao produto 
da constante pelo número de vezes (n) que ela se repete. Assim, 
temos:
c nci
i i
n
=
=
∑
Por exemplo, se numa determinada observação o conjunto 
de dados de xi={7,7,7,7,7,7}, onde n=6, temos que xi é uma 
constante c que se repete. Então temos:
x c
x c nc
i i
i i
ii
=
= = = + + + + + = =
==
∑∑
1
6
1
6
7 7 7 7 7 7 6 7 42( )
d) O somatório de uma soma ou de uma diferença de duas 
variáveis será igual à soma ou à diferença dos somatórios 
individuais das duas variáveis. Assim, temos:
( )
( )
x y x y
x y x y
i i i i
i
n
i
n
i
n
i i i i
i
n
i
n
i
n
+ = +
− = −
===
===
∑∑∑
∑∑∑
111
111
5
10
15
20
14
Unidade I
Di
ag
ra
m
aç
ão
: F
ab
io
 -
 1
9/
11
/0
8 
-|
|-
 1
a 
Co
rr
eç
ão
: F
ab
io
 / 
Re
v:
 A
na
 0
3/
12
/0
8
Por exemplo:
i X Y (X-Y)
1 8 5 3
2 3 2 1
3 4 0 4
4 5 4 1
- - - -
∑ 20 11 9
( )x y
x y
− =
− = − =
∑
∑ ∑
9
20 11 9
e) O somatório de um conjunto de dados xi ao quadrado nos 
obriga a elevar cada elemento de xi ao quadrado para efetuar a 
soma. Assim, temos:
x x x x xi
i
n
n
2
1
1
2
2
2
3
2 2
=
∑ = + + + +...
 Por exemplo, se numa dada observação o conjunto de dados 
de xi={2,4,6,8,10}, onde n=5, temos:
xi
i
2
1
5
=
∑ =2 +4 +6 +8 +10 =4+16+36+64+100=2202 2 2 2 2
f) O somatório ao quadrado de um conjunto de dados será 
obtido tomando-se a soma dos valores de xi e elevando-se ao 
quadrado. Assim, temos:
( ) ( ... )x x x x xi
i
n
n
=
∑ = + + + +
1
2
1 2 3
2
Por exemplo, se temos um mesmo conjunto xi={2,4,6,8,10}, 
onde n=5, tal qual no exemplo do item e, teremos um resultado 
distinto. Vejamos, neste caso:
( ) ( ) ( )xi
i=
∑ = + + + + = =
1
5
2 2 22 4 6 8 10 30 900
Esta notação se encontra em 
livros de matemática. Busque outros 
exemplos.
5
10
15
15
ESTATÍSTICA APLICADA
Di
ag
ra
m
aç
ão
: F
ab
io
 -
 1
9/
11
/0
8 
-|
|-
 1
a 
Co
rr
eç
ão
: F
ab
io
 / 
Re
v:
 A
na
 0
3/
12
/0
8
1.8 Séries estatísticas – simples e compostas
Uma série estatística define-se como toda e qualquer 
coleção de dados estatísticos referidos a uma mesma ordem 
de classificação: quantitativa.No sentido mais amplo, série é 
uma sucessão de números referidos a qualquer variável. Se os 
números expressarem dados estatísticos, a série será chamada 
de série estatística.
Em sentido mais estreito, pode-se dizer que uma série 
estatística é uma sucessão de dados estatísticos referidos a 
caracteres qualitativos, ao passo que uma sucessão de dados 
estatísticos referidos a caracteres quantitativos configurará uma 
serração. Em outros termos, a palavra série é usada normalmente 
para designar um conjunto de dados dispostos de acordo com 
um caráter variável, residindo a qualidade serial na disposição 
desses valores, e não em uma disposição temporal ou espacial de 
indivíduos. As tabelas servem para apresentar séries estatísticas; 
os três caracteres presentes na tabela que as apresenta são:
• a época (fator temporal ou cronológico) – a que se refere 
o fenômeno analisado;
• o local (fator espacial ou geográfico) – onde o fenômeno 
acontece;
• o fenômeno (espécie do fato ou fator especificativo) – que 
é descrito. 
As séries são divididas em dois grupos:
• séries homógradas: aquelas em que a variável descrita 
apresenta variação discreta ou descontínua. São séries 
homógradas a série temporal, a série geográfica e a série 
específica.
• séries heterógradas: aquelas nas quais o fenômeno 
ou o fato apresenta gradações ou subdivisões. Embora 
5
10
15
20
25
16
Unidade I
Di
ag
ra
m
aç
ão
: F
ab
io
 -
 1
9/
11
/0
8 
-|
|-
 1
a 
Co
rr
eç
ão
: F
ab
io
 / 
Re
v:
 A
na
 0
3/
12
/0
8
fixo, o fenômeno varia em intensidade. A distribuição de 
frequências é uma série heterógrada.
1.8.1 Tipos de séries estatísticas
As séries estatísticas diferenciam-se de acordo com a 
variação de um dos três elementos: época, local e fenômeno.
 Série temporal
Também chamada de série cronológica, série histórica, série 
evolutiva ou marcha, identifica-se pelo caráter variável do fator 
cronológico. Assim, deve-se ter:
• elemento variável: época
• elementos fixos: local e fenômeno
Exemplo:
Tabela 1.1
Operadora WKX – Venda de bilhetes aéreos – Mercado 
Interno - 1995
Meses Vendas ( em milhares de reais)
Janeiro 2300
Fevereiro 1800
Março 2200
Abril 2210
Maio 2360
Junho 2600
Julho 2690
Agosto 3050
Setembro 3500
Outubro 3440
Novembro 3100
Dezembro 2760
TOTAL ANUAL 31510
Fonte: Departamento de Análise de Mercado
5
10
 
17
ESTATÍSTICA APLICADA
Di
ag
ra
m
aç
ão
: F
ab
io
 -
 1
9/
11
/0
8 
-|
|-
 1
a 
Co
rr
eç
ão
: F
ab
io
 / 
Re
v:
 A
na
 0
3/
12
/0
8
 Série geográfica
Também chamada de série territorial, série espacial ou 
série de localização, identifica-se pelo caráter variável do fator 
geográfico. Assim, deve-se ter:
• elementos variável: local;
• elementos fixos: época e fenômeno.
Exemplo:
Tabela 1.2
Operadora WKX - Vendas por Unidade da Federação – 2008
Unidades da Federação Vendas (em milhares de reais)
Minas Gerais 4000
Paraná 2230
Rio Grande do Sul 6470
Rio de Janeiro 8300
São Paulo 10090
Outros 420
TOTAL BRASIL 31510
Fonte : Departamento de Análise de Mercado
 Série específica
Também chamada de série categórica, série por categoria, 
identifica-se pelo caráter variável de fator especificativo. Assim, 
deve-se ter:
• elemento variável: fenômeno;
• elementos fixos: local e época.
Exemplos:
Tabela 1.3
Operadora WKX - Venda de bilhetes aéreos por Linha – 2008
Linha do produto Vendas (em milhares de reais)
Linha A 6450
Linha B 9310
Linha C 15750
TODAS AS LINHAS 31510
Fonte : Departamento de Análise de Mercado
5
10
15
18
Unidade I
Di
ag
ra
m
aç
ão
: F
ab
io
 -
 1
9/
11
/0
8 
-|
|-
 1
a 
Co
rr
eç
ão
: F
ab
io
 / 
Re
v:
 A
na
 0
3/
12
/0
8
Tabela 1.4
Número de empregados das várias classes de salários no estado 
de São Paulo – 2008
Classes de salários (R$) Número de empregados
Até 80 41.326
De 80 a 119 123.236
De 120 a 159 428.904
De 160 a 199 324.437
De 200 a 399 787.304
De 400 a 599 266.002
De 600 a 799 102.375
De 800 a 999 56.170
1000 e mais 103.788
TOTAL 2.233.542
Fonte: Serviço de Estatística da Previdência e Trabalho – (dados alterados para 
melhor compreensão)
1.8.2 Tabelas de dupla entrada
As tabelas apresentadas anteriormente são tabelas estatísticas 
simples, em que apenas uma série está representada. É comum, 
todavia, haver necessidade de apresentar, em uma única tabela, 
mais do que uma série. Quando as séries aparecem conjugadas, 
tem-se uma tabela de dupla entrada.
Exemplos: 
A) Série específico-temporal.
B) Série geográfico-temporal.
Tabela 1.5
População economicamente ativa por setor de atividades – Brasil
Setor
População (1000 hab.)
1940 1950 1960
Primário 8.968 10.255 12.163
Secundário 1.414 2.347 2.962
Terciário 3.620 4.516 7.525
Fonte : IPEA
5
10
19
ESTATÍSTICA APLICADA
Di
ag
ra
m
aç
ão
: F
ab
io
 -
 1
9/
11
/0
8 
-|
|-
 1
a 
Co
rr
eç
ão
: F
ab
io
 / 
Re
v:
 A
na
 0
3/
12
/0
8
Tabela 1.6
População indígena brasileira 
Unidade de produção
Produção
1937 1938 1939
Acre 5.007 4.765 4.727
Amazonas 6.858 5.998 5.631
Pará 4.945 4.223 4.500
Mato Grosso 1.327 1.285 1.235
Outros estados 333 539 337
Fonte : Anuário Estatístico do Brasil – IBGE (dados alterados para melhor 
compreensão)
Observação:
 Nem sempre uma tabela representa uma série estatística. 
Por vezes, os dados reunidos não revelam uniformidade, sendo 
meramente um aglomerado de informações gerais sobre 
determinado assunto, as quais, embora úteis, não apresentam a 
consistência necessária para se configurar uma série estatística.
Exemplo:
Tabela 1.7
Situação dos espetáculos cinematográficos no Brasil – 1967
Especificação Dados numéricos
Número de cinemas 2.488
Lotação dos cinemas 1.722.348
Sessões por dia 3.933
Filmes de longa metragem 131.330.488
Meia entrada 89.581.234
 Fonte : Anuário Estatístico do Brasil – IBGE
5
10
20
Unidade I
Di
ag
ra
m
aç
ão
: F
ab
io
 -
 1
9/
11
/0
8 
-|
|-
 1
a 
Co
rr
eç
ão
: F
ab
io
 / 
Re
v:
 A
na
 0
3/
12
/0
8
1.9 Apresentação de dados - gráficos e tabelas
A representação gráfica das séries estatísticas tem por 
finalidade representar os resultados obtidos, permitindo 
chegar-se a conclusões sobre a evolução do fenômeno ou 
sobre como se relacionam os valores da série. A escolha do 
gráfico mais apropriado ficará a critério do analista. Contudo, 
os elementos simplicidade, clareza e veracidade devem ser 
considerados quando da elaboração de um gráfico. 
Diretrizes para a construção de um gráfico:
• o título do gráfico deve ser o mais claro e completo possível. 
Sendo necessário, acrescentem-se subtítulos;
• a orientação geral dos gráficos deve ser da esquerda para 
a direita;
• as quantidades devem ser representadas por grandezas 
lineares;
• sempre que possível, a escala vertical há de ser escolhida 
de modo a aparecer a linha 0 (zero);
• só devem ser inclusas no desenho as coordenadas 
indispensáveis para guiar a vista na leitura. Um tracejado 
muito cerrado dificulta o exame do gráfico;
• a escala horizontal deve ser lida da esquerda para a direita, 
e a vertical, de baixo para cima;
• os títulos e marcações do gráfico dispor-se-ão de maneira 
que sejam facilmente legíveis, partindo da margem 
horizontal inferior ou da margem esquerda.
5
10
15
20
21
ESTATÍSTICA APLICADA
Di
ag
ra
m
aç
ão
: F
ab
io
 -
 1
9/
11
/0
8 
-|
|-
 1
a 
Co
rr
eç
ão
: F
ab
io
 /Re
v:
 A
na
 0
3/
12
/0
8
Leitura e interpretação de um gráfico:
• declarar qual o fenômeno ou fenômenos representados, a 
região considerada, o período de tempo, a fonte dos dados, 
etc.;
• examinar o tipo de gráfico escolhido, verificar se é o mais 
adequado, criticar a sua execução, no conjunto e nos 
detalhes;
• analisar cada fenômeno separadamente, fazendo notar 
os pontos mais em evidência, o máximo e o mínimo, as 
mudanças mais bruscas;
• investigar se há uma “tendência geral” crescente ou 
decrescente ou, então, se o fato exposto é estacionário;
• procurar descobrir a existência de possíveis ciclos periódicos, 
qual o período aproximado, etc.
Eis os tipos mais comuns de gráficos:
Gráfico em linhas
500
400
300
200
100
0
1 2 3 4 5 6 7
 Sequência 1
 Sequência 2
Gráfico em colunas
100
80
60
40
20
0
1940 1950 1960 1970
 População
População
5
10
15
22
Unidade I
Di
ag
ra
m
aç
ão
: F
ab
io
 -
 1
9/
11
/0
8 
-|
|-
 1
a 
Co
rr
eç
ão
: F
ab
io
 / 
Re
v:
 A
na
 0
3/
12
/0
8
Gráfico em barras
É semelhante ao gráfico em colunas, porém, os retângulos 
são dispostos horizontalmente. 
1970
1960
1950
1940
0 20 40 60 80 100
 População
do Brasil
População do Brasil
Gráfico em setores
Anos Receita (em R$ 1.000.000,00)
1975 90
1976 120
1977 150
Total 360
Fonte: Departamento da Fazenda, Município X.
É a representação gráfica de uma série estatística, em 
círculo, por meio de setores . É utilizado principalmente quando 
se pretende comparar cada valor da série com o total.
Total __________360º
Parte___________ xº
• Para 1975: 360 - 360º
 90 - xº 
 x = 90º
• Para 1976: 360 - 360º
 120 - xº 
 x = 120º
5
10
15
23
ESTATÍSTICA APLICADA
Di
ag
ra
m
aç
ão
: F
ab
io
 -
 1
9/
11
/0
8 
-|
|-
 1
a 
Co
rr
eç
ão
: F
ab
io
 / 
Re
v:
 A
na
 0
3/
12
/0
8
• Para 1977: 360 - 360º
 150 - xº
 x = 150º
 1975
 1976
 1977
Receita do Município X
Gráfico polar
É a representação de uma série por meio de um polígono.
Movimento mensal de compras de uma agência em 1972 
Meses Valores (R$1.000,00)
Janeiro 12
Fevereiro 13
Março 14
Abril 12
Maio 15
Junho 19
Julho 17
Agosto 18
Setembro 14
Outubro 16
Novembro 12
Dezembro 18
20
15
10
5
0
Jan
Dez
Nov
Out
Set
Ago
Jul
Jun
Mai
Abr
Mar
Fev
 Sequência 1
Resumindo:
• a estatística utiliza métodos 
matemáticos para solucionar 
problemas reais de tomada de 
decisão quando há incerteza;
• em situações nas quais poderíamos 
contar unicamente com a sorte, 
temos um instrumento que nos 
possibilita aumentar as chances de 
tomar a melhor decisão;
• utiliza ferramentas matemáticas 
definidas. Mesmo lidando com 
um grande número de dados, essas 
ferramentas resumem a análise em 
tabelas ou gráficos;
• na prática, a estatística pode ser 
empregada como base conceitual 
e fundamental em várias outras 
ciências, inclusive em análises 
gerenciais.
5
24
Unidade I
Di
ag
ra
m
aç
ão
: F
ab
io
 -
 1
9/
11
/0
8 
-|
|-
 1
a 
Co
rr
eç
ão
: F
ab
io
 / 
Re
v:
 A
na
 0
3/
12
/0
8
2 MEDIDAS DE TENDÊNCIA CENTRAL: MÉDIA, 
MODA E MEDIANA PARA DADOS SIMPLES
Na realização de qualquer estudo, quase nunca é possível 
examinar todos os elementos da população de interesse. Temos 
usualmente de trabalhar com uma amostra da população. 
A inferência estatística nos dá elementos para generalizar, 
de maneira segura, as conclusões obtidas da amostra para a 
população.
É errôneo pensar que, caso tivéssemos acesso a todos os 
elementos da população, seríamos mais precisos. Os erros 
de coleta e manuseio de um grande número de dados são 
maiores do que as imprecisões a que estamos sujeitos quando 
generalizamos, via inferência, as conclusões de uma amostra 
bem selecionada.
Em se tratando de amostra, a preocupação central é que ela 
seja representativa.
Assim que decidimos obter informações através de um 
levantamento amostral, temos imediatamente dois problemas:
• definir cuidadosamente a população de interesse;
• selecionar a característica que iremos pesquisar.
Portanto, temos situações profissionais em que nos bastam 
poucos dados ou estatísticas de dados simples. Por outro 
lado, há também situações nas quais um número maior de 
elementos deve ser investigado e tratado como distribuições 
de frequência.
Quando estamos diante de um conjunto de dados, seja ele 
pequeno ou grande, em geral, buscamos medidas que possam 
ser usadas para indicar um valor que tende a representar melhor 
aquele determinado conjunto de números. E as medidas mais 
5
10
15
20
25
25
ESTATÍSTICA APLICADA
Di
ag
ra
m
aç
ão
: F
ab
io
 -
 1
9/
11
/0
8 
-|
|-
 1
a 
Co
rr
eç
ão
: F
ab
io
 / 
Re
v:
 A
na
 0
3/
12
/0
8
usadas neste sentido são as chamadas medidas de tendência 
eventual ou central, que são a média, mediana e moda. 
Sabe-se que estes valores serão medidos de forma distinta 
conforme um grande conjunto de dados ou um pequeno 
conjunto de dados. Também o cálculo desses valores irá ser 
afetado caso as variáveis sejam discretas ou contínuas.
Distribuição por frequência é a tabela em que se resumem 
grandes quantidades de dados, determinando o número de 
vezes que cada dado ocorre (frequência) e a porcentagem com 
que aparece (frequência relativa).
ATENÇÃO: neste módulo, trataremos do cálculo destas 
estatísticas para os chamados dados simples ou conjuntos 
de dados com menos que 30 elementos. 
2.1 A média aritmética simples (µ,x)
A média aritmética é um dos valores mais representativos de 
um conjunto de dados. Obtém-se o valor da média aritmética 
dividindo-se o somatório dos valores do conjunto de dados pelo 
número de valores total deste conjunto.
Assim, temos que:
média = 
x
n
i
i
n
=
∑
1
Para a população, calcula-se a média aritmética utilizando-se 
os seguintes parâmetros:
µ = =
∑ Xi
N
i i
N
, onde 
µ ⇒ Média aritmética da população (parâmetro)
N ⇒ Total de observações da população (total da 
população)
Xi ⇒ Cada variável populacional
Em estatística a média é o valor 
médio de uma distribuição ou de 
um conjunto de dados, determinado 
segundo uma regra estabelecida a priori 
e que se utiliza para representar todos 
os valores da distribuição. Existem 
diversas formas de se calcular a média 
de um conjunto de números. Por 
exemplo, algumas delas são: aritmética, 
geométrica e harmônica.
5
10
15
20
26
Unidade I
Di
ag
ra
m
aç
ão
: F
ab
io
 -
 1
9/
11
/0
8 
-|
|-
 1
a 
Co
rr
eç
ão
: F
ab
io
 / 
Re
v:
 A
na
 0
3/
12
/0
8
Para a amostra, calcula-se o valor médio utilizando-se os 
seguintes parâmetros:
x
x
n
i
i
n
= =
∑
1 , onde
 
x ⇒ Média aritmética da amostra (estimativa)
n ⇒ Número de dados da amostra 
xi ⇒ Cada variável da amostra
 Vamos agora tomar um exemplo de média aritmética. 
Supondo um conjunto de dados xi = {2,4,6,8,10,12}, onde N=6, 
temos:
µ = = + + + + + ==
∑ X
N
i
i
N
1 2 4 6 8 10 12
6
7
Para simplificar o nosso estudo, padronizaremos a notação 
para o cálculo da média, e passaremos a utilizar sempre a 
notação utilizada para o cálculo da média aritmética simples 
em conjuntosde dados amostrais, como no exemplo abaixo:
Uma amostra das notas das provas de matemática dos 
estudantes da sétima série de uma grande escola de São Paulo: 
xi, onde xi = {87,42,64,58,90,90,85,63,47,74,100,94} e n=12, 
temos:
x
x
n
i
i
n
= =
∑
1 =
87+42+64+58+90+90+85+63+47+74+100+94
12
=74,5
A nota média na prova de matemática dos estudantes da 
sétima série desta escola de São Paulo, por amostragem, é 74,5.
São propriedades da média aritmética:
a) Em um conjunto de dados, é sempre possível o cálculo 
da média, independentemente de quais os elementos 
que compõem esse conjunto de dados.
Embora tenhamos destacado uma 
diferença na notação utilizada para o 
cálculo da média aritmética em uma 
amostra e numa população, a expressão 
para o cálculo da média é a mesma, 
tanto no cálculo da média de uma 
população quanto de uma amostra. 
São as propriedades que a média 
aritmética simples possui que a fazem a 
medida de tendência central mais usada 
e mais importante de todas.
5
10
15
20
27
ESTATÍSTICA APLICADA
Di
ag
ra
m
aç
ão
: F
ab
io
 -
 1
9/
11
/0
8 
-|
|-
 1
a 
Co
rr
eç
ão
: F
ab
io
 / 
Re
v:
 A
na
 0
3/
12
/0
8
b) Em um determinado conjunto de dados, o valor da 
média será único e corresponderá a uma constante.
c) Todos os valores de um determinado conjunto de 
dados irão afetar a média. Se um valor se modifica, a 
média aritmética também irá modificar-se. 
d) Somando-se ou subtraindo-se uma determinada 
constante c a cada elemento de um determinado 
conjunto de dados xi = x1,x2,x3,...,xn, a média aritmética 
ficará aumentada ou diminuída desta constante c. Se, 
por outro lado, multiplicarmos cada elemento deste 
conjunto de dados por uma constante c, a nova média 
será também multiplicada por esta constante c; se 
dividirmos cada elemento do conjunto de dados por 
esta mesma constante c, a média será dividida por c.
Assim, se temos um conjunto xi = x1,x2,x3,...,xn, a média será:
x
x
n
i
n
1
1
1= =
∑
, logo 
x
c x
n
x
x
n
nc
n
x x c
i
i
n
i
i
n
2
1
2
1
2 1=
+
⇒ = + ⇒ = += =
∑ ∑( )
e) A soma algébrica dos desvios dos números de um 
conjunto de dados em torno da média é zero. Isto 
pode ser representado da seguinte forma:
x xi − =∑ 0
Por exemplo, se temos um conjunto de dados xi = 2,4,6,8,10, 
onde n=5, temos que :
x
xi
i= = + + + + ==
∑
1
5
5
2 4 6 8 10
5
6
5
10
15
20
28
Unidade I
Di
ag
ra
m
aç
ão
: F
ab
io
 -
 1
9/
11
/0
8 
-|
|-
 1
a 
Co
rr
eç
ão
: F
ab
io
 / 
Re
v:
 A
na
 0
3/
12
/0
8
Se aplicarmos a fórmula acima, temos:
x x x
x
i i
i
− =∑ ∑
∑
-6=(2-6)+(4-6)+(6-6)+(8-6)+(10-6)
-x=-4-2+0+2+4
xxi-x=0∑
2.2 A média aritmética ponderada
Num conjunto de dados em que cada elemento ou cada 
observação possua a mesma importância, o cálculo da 
média aritmética simples mostrará bem a população ou a 
amostra estudada. Mas se queremos atribuir pesos distintos 
ou importâncias distintas aos elementos de um conjunto 
de dados, a estatística a ser adotada é a média aritmética 
ponderada, em que a cada valor xi deverá ser atribuído um 
determinado peso wi. A expressão estatística para o cálculo 
da média ponderada é:
x
w x
w
p
i i
i
n
i
i
n=
=
=
∑
∑
1
1
Supondo que um estudante tenha que efetuar uma série de 
4 exames para obter sua média final para passar de ano. Cada 
exame possui um peso diferente na composição desta média, 
conforme a tabela abaixo:
 
Exame Nota Peso
1 68 0,30
2 89 0,20
3 45 0,40
4 100 0,10
1,00
A média aritmética é a mais utilizada 
no nosso dia-a-dia. É obtida dividindo-
se a soma das observações pelo 
número delas.
5
10
15
29
ESTATÍSTICA APLICADA
Di
ag
ra
m
aç
ão
: F
ab
io
 -
 1
9/
11
/0
8 
-|
|-
 1
a 
Co
rr
eç
ão
: F
ab
io
 / 
Re
v:
 A
na
 0
3/
12
/0
8
x
w x
w
p
i i
i
n
i
i
n=
=
=
∑
∑
1
1 
,logo
xp =
+ + +
+ + +
( , ) ( , ) ( , ) , ( )
, , , ,
0 30 68 0 20 89 0 40 45 0 10 100
0 30 0 20 0 40 0 10
xxp = + + + =20 4 17 8 18 10 66 2, , ,
A nota média será então 66,2, resultado diferente do que 
seria obtido se utilizássemos a média aritmética simples.
Exemplificando média aritmética e ponderada:
• um aluno tirou as notas 5, 7, 9 e 10 em quatro provas. A 
sua média será (5 + 7 + 9 + 10) / 4 = 7,75; 
• um aluno fez um teste (peso 1) e uma prova (peso 2), 
tirando 10 no teste e 4 na prova. A sua média (ponderada) 
será (10 + 2 x 4) / 3 = 6. Se o teste e a prova tivessem 
mesmo peso (e não importa qual o valor do peso, importa 
apenas a relação entre os pesos), a média seria 7. 
2.3 A mediana
Uma outra medida importante de um conjunto de dados é 
a mediana. 
A mediana divide um determinado conjunto de dados, 
que deverá estar ordenado, em dois grupos iguais, em que 
metade terá valores menores que a mediana e metade terá 
valores maiores que a mediana.
Antes de calcular a mediana, é preciso organizar os valores em 
um rol em ordem crescente, para então contar até a metade dos 
Num conjunto de dados em que cada 
elemento ou cada observação possua 
importância diferente, utilizamos a 
média aritmética ponderada.
5
10
15
30
Unidade I
Di
ag
ra
m
aç
ão
: F
ab
io
 -
 1
9/
11
/0
8 
-|
|-
 1
a 
Co
rr
eç
ão
: F
ab
io
 / 
Re
v:
 A
na
 0
3/
12
/0
8
valores para encontrar a mediana. Em geral, após organizarmos 
os dados em um rol, podemos calcular a posição da mediana 
com a fórmula abaixo:
posmed
n= +( )1
2
,
onde n é o número de dados observados.
Por exemplo, para um conjunto de dados xi = {6,9,3,5,2,9,
5,5,8,7,1,7,2}, onde n=13, temos primeiro que organizar estes 
dados em um rol, depois encontrar a posição da mediana e 
então saber qual será a mediana. Vejamos:
rolxi = {1,2,2,3,5,5,5,6,7,7,8,9,9}
posição mediana = ( )n + = + =1
2
13 1
2
7
mediana = 5
Para um conjunto de dados xi={6,4,8,3,2,9,7,1}, onde n=8, 
temos, então:
rolxi = {1,2,3,4,6,7,8,9}
posição mediana = 
( )
,
n + = + =1
2
8 1
2
4 5
A mediana será o valor que está a meio caminho dos dois 
valores médios; neste caso, entre 4 e 6. Como fazer? Deve-se 
tirar a média entre os dois valores do meio para obter o valor da 
mediana. Assim, temos:
mediana = + =4 6
2
5
A mediana é outra medida de posição 
definida como o número que se encontra 
no centro de uma série de números, 
estando estes dispostos segundo uma 
ordem. Em outras palavras, a mediana de 
um conjunto de valores, ordenados, é 
o valor situado de tal forma no conjunto 
que o separa em dois subconjuntos de 
mesmo número de elementos.
Obs.: - se o número de elementos for 
ímpar, então a mediana será exatamente o 
valor “do meio”;
 - se o número de elementos for 
par, então a mediana será exatamente a 
média “dos dois valores do meio”.
Para determinar a mediana:
• organize o conjunto de dados em 
um rol;
• para um conjunto de dados cujo n 
= ímpar, a mediana será o valor do 
meio;
• para um conjunto de dados cujo n 
= par, a mediana será a média dos 
dois valores do meio.
5
10
15
20
31
ESTATÍSTICA APLICADA
Di
ag
ra
m
aç
ão
: F
ab
io
 -
 1
9/
11
/0
8 
-|
|-
 1
a 
Co
rr
eç
ão
: F
ab
io
 / 
Re
v:
 A
na
 0
3/
12
/0
8
Quando usamos a mediana?
Empregamos a mediana quando:
• desejamos obter o ponto que divide a distribuição em 
partes iguais;
• há valores extremosque afetam de uma maneira acentuada 
a média;
• a variável em estudo é salário.
2.4 A moda
Muitas vezes, em um conjunto de dados, existem valores 
que se repetem com uma frequência maior. A moda é 
justamente este valor ou estes valores que mais se 
repetem em um conjunto de dados. É possível haver 
estatísticas que não possuam moda ou que possuam mais de 
uma moda. 
No exemplo que demos acima, para um conjunto de dados 
xi={1,2,3,4,6,7,8,9}, não existe moda e diz-se que o conjunto ou 
distribuição é amodal.
A moda é uma estatística muito mais descritiva, e sua 
importância cresce na medida em que um valor ou grupo 
de valores se repete mais que outros; neste sentido, a moda 
indicaria o valor “típico” daquele conjunto de dados com maior 
ocorrência.
Por exemplo, o conjunto de dados xi={2,2,7,9,9,9,10,10,11,12,18}
tem moda igual a 9, porque o número 9 é aquele com maior 
frequência, repetindo-se três vezes.
Repetindo: denominamos moda, de um conjunto de dados, 
o valor (ou valores) que ocorre com maior frequência.
Então, em teoria da probabilidade 
e em estatística, a mediana é 
uma medida de tendência central, um 
número que caracteriza as observações 
de uma determinada variável de tal 
forma que este número (a mediana) de 
um grupo de dados ordenados separa a 
metade inferior da amostra, população 
ou probabilidade de distribuição, da 
metade superior. Mais concretamente, 
1/2 da população terá valores inferiores 
ou iguais à mediana e 1/2 da população 
terá valores superiores ou iguais à 
mediana.
Em casos de populações (n) ímpares, 
a mediana será o elemento central 
(n+1)/2. Para os casos de populações 
(n) pares, a mediana será o resultado 
da média simples dos elementos n/2 e 
(n/2)+1.
Para a seguinte população: 1, 3, 5, 7, 
9 – a mediana é 5 (igual à média); no 
entanto, para a população 1, 2, 4, 10, 
13, a mediana é 4 (enquanto a média 
é 6). Para populações pares: 1, 2, 4, 7, 9, 
10 – a mediana é (4+7)/2, que é 5,5.
5
10
15
20
25
32
Unidade I
Di
ag
ra
m
aç
ão
: F
ab
io
 -
 1
9/
11
/0
8 
-|
|-
 1
a 
Co
rr
eç
ão
: F
ab
io
 / 
Re
v:
 A
na
 0
3/
12
/0
8
Por exemplo: o salário modal dos empregados de uma 
indústria é o salário mais comum, isto é, o salário recebido pelo 
maior número de empregados dessa indústria.
Exemplo:
Sabendo-se que a produção leiteira diária da vaca A, durante 
uma semana, foi de 10, 14, 13, 15, 16, 18 e 12 litros, encontre 
a média, a moda e a mediana para a produção diária de leite 
desta vaca.
Média:
x
x
n
i
i
n
= = + + + + + + = ==
∑
1 10 14 13 15 16 18 12
7
98
7
14
Logo, x = 14 litros de leite em média por dia, que representa 
uma produção de 98 litros de leite em média por semana.
Obs.: a média pode ser um número diferente de todos os 
valores da amostra que ela representa.
Moda: como não existe um valor que aparece com maior 
frequência que os outros, não há valor de moda para este 
exemplo.
Mediana: ordenando os dados, temos:
10 12 13 14 15 16 18
 Desta forma, o valor mediano é o valor central dos dados, 
ou seja, 14 litros de leite por dia.
Em estatística descritiva, a 
moda é o valor que detém o maior 
número de observações, ou seja, o valor 
ou valores mais frequentes. A moda não 
é necessariamente única, ao contrário da 
média ou da mediana. É especialmente 
útil quando os valores ou observações 
não são numéricos, uma vez que a 
média e a mediana podem não ser bem-
definidas.
A moda de {maçã, maçã, banana, 
laranja, laranja, laranja, pêssego} é 
laranja.
A série {1, 3, 5, 5, 6, 6} apresenta 
duas modas (bimodal): 5 e 6.
A série {1, 3, 2, 5, 8, 7, 9} não apresenta 
moda.
5
10
15
20
33
ESTATÍSTICA APLICADA
Di
ag
ra
m
aç
ão
: F
ab
io
 -
 1
9/
11
/0
8 
-|
|-
 1
a 
Co
rr
eç
ão
: F
ab
io
 / 
Re
v:
 A
na
 0
3/
12
/0
8
3 MEDIDAS DE DISPERSÃO PARA DADOS 
SIMPLES
Vimos que a moda, a mediana e a média podiam ser usadas 
para resumir, num único número, aquilo que é “médio” ou 
“típico” de um conjunto de dados. Mas a informação contida 
fornecida pelas medidas de posição necessita, em geral, ser 
complementada pelas medidas de dispersão. Estas servem para 
indicar o quanto os dados se apresentam dispersos em torno 
da região central. Caracterizam, portanto, o grau de variação 
existente no conjunto de valores. As medidas de dispersão que 
nos interessam são:
• a amplitude total;
• o desvio padrão;
• a variância;
• o coeficiente de variação.
Observe que: quanto maior as medidas de dispersão, mais 
heterogêneos são os dados, e ao contrário, quanto menor essas 
medidas, mais homogêneo o conjunto.
Para ilustrar a necessidade de conhecermos as medidas de 
dispersão de um conjunto de dados, iremos introduzir alguns 
exemplos.
Exemplo 1:
Sabe-se que em Honolulu (Havaí) e Houston (Texas) a 
temperatura média diária é quase a mesma, em torno de 
aproximadamente 23,9ºC. Pergunta-se: será que, por isso, 
podemos admitir que a temperatura é basicamente a mesma 
em ambas as localidades? Ou não será possível que enquanto 
uma cidade é melhor para natação a outra o seja para atividades 
externas?
5
10
15
20
25
34
Unidade I
Di
ag
ra
m
aç
ão
: F
ab
io
 -
 1
9/
11
/0
8 
-|
|-
 1
a 
Co
rr
eç
ão
: F
ab
io
 / 
Re
v:
 A
na
 0
3/
12
/0
8
Sabemos que a temperatura em Honolulu varia muito 
pouco ao longo do ano, oscilando, em geral, entre 21,1ºC 
e 26,7ºC. Por outro lado, a temperatura em Houston 
pode diferir sazonalmente (nas estações do ano), isto é, 
apresentar-se baixa em janeiro (cerca de 4,4ºC) e alta em 
julho e agosto (bem perto de 37,8ºC). Desnecessário dizer 
que as praias em Houston não estão abarrotadas de gente 
o ano todo!
Exemplo 2:
Suponham que, numa particular cidade, tanto ladrões 
quanto professores secundários tenham uma renda média 
mensal de R$ 900,00. Será que essa informação indica 
que as duas distribuições de renda são necessariamente 
semelhantes? Muito ao contrário, poder-se-ia descobrir que 
elas diferem, e muito, num outro aspecto importante, que é 
o fato de as rendas dos professores concentrarem-se ao redor 
de R$ 900,00 (serem constantes, homogêneas), enquanto 
que as dos ladrões espalham-se mais (são descontínuas, 
heterogêneas), o que reflete, portanto, maiores oportunidades 
para prisões, desemprego, pobreza e, em alguns casos, fortunas 
excepcionais.
Tais fatos demonstram que necessitamos, além de uma 
medida de tendência central, de um índice que indique o grau 
de dispersão dos dados em torno da média. Este “índice” é uma 
medida indicativa do que costumamos chamar de variabilidade 
(ou dispersão).
Voltando ao exemplo 1, poderíamos dizer que a 
distribuição de temperatura em Houston (Texas) tem 
maior variabilidade do que a distribuição de temperaturas 
em Honolulu (Havaí). Da mesma forma, podemos dizer 
que a distribuição de rendas entre professores apresenta 
menos variabilidade do que a distribuição de rendas entre 
ladrões.
5
10
15
20
25
30
35
ESTATÍSTICA APLICADA
Di
ag
ra
m
aç
ão
: F
ab
io
 -
 1
9/
11
/0
8 
-|
|-
 1
a 
Co
rr
eç
ão
: F
ab
io
 / 
Re
v:
 A
na
 0
3/
12
/0
8
Exemplo 3:
Considere os seguintes conjuntos de valores das variáveis X, 
Y e Z:
X: 70, 70, 70, 70, 70.
Y: 68, 69, 70, 71, 72.
Z: 5, 15, 50, 120, 160.
Calculando a média aritmética de cada um desses conjuntos, 
obtemos:
X = 70
Y = 70
Z = 70
Vemos, então, que os três conjuntos apresentam a mesma 
média aritmética: 70; entretanto, é fácil notar que o conjunto 
X é mais homogêneo que os conjuntos Y e Z. Para quantificar oquão heterogêneos os dados são, precisamos encontrar algumas 
medidas de posição.
Assim, quando se deseja entender, analisar e descrever de 
forma adequada um determinado conjunto de dados, faz-
se necessário dispor não apenas de informações relativas às 
medidas de posição, vistas no módulo anterior. É preciso que 
se disponha de informações relativas à variabilidade (dispersão) 
daqueles números que compõem o referido conjunto de dados. 
Essas medidas de variabilidade ou dispersão indicam se os dados 
observados estão próximos ou separados uns dos outros. 
Diferente das medidas de posição, as medidas de dispersão 
não são autoexplicativas; sua aplicabilidade depende da 
comparação de populações ou amostras do mesmo tamanho e 
mesmas características para que se obtenha alguma informação 
importante a partir daquela determinada variabilidade. 
Medidas de dispersão não são 
autoexplicativas, dependem de suas 
aplicações em tratamentos comparativos 
de dados.
5
10
15
20
25
36
Unidade I
Di
ag
ra
m
aç
ão
: F
ab
io
 -
 1
9/
11
/0
8 
-|
|-
 1
a 
Co
rr
eç
ão
: F
ab
io
 / 
Re
v:
 A
na
 0
3/
12
/0
8
As principais medidas de dispersão são a amplitude total 
(ou intervalo), o desvio médio, a variância e o desvio padrão. A 
média serve de referência para todas essas medidas, exceto para o 
intervalo (ou amplitude total). À proporção que essas medidas se 
elevam, isto representa um aumento da dispersão. Isso significa 
que se a medida for igual a zero, não existe dispersão. 
As medidas de variabilidade que têm a média aritmética 
como ponto de referência são importantes porque nos 
permitem avaliar o grau de dispersão das observações em 
relação a esta mesma média, isto é, permitem-nos avaliar 
o quão distante os dados de um determinado grupo de 
observações estão da média calculada, dando-nos uma 
noção mais precisa da situação de determinada população ou 
amostra e condições de tirarmos conclusões e informações 
importantes daqueles dados disponíveis.
Exemplo 4: 
Um estudante de Economia resolve fazer uma pesquisa 
sobre os salários médios dos funcionários de determinado setor 
industrial em São Paulo. Nesta pesquisa, o estudante conseguiu 
os seguintes dados em termos de salários mínimos mensais:
xi={1.0;1.5;2.0;2.0;2.0;2.5;3.0;3.0;80.0;85.0}
Ao calcular o salário médio deste setor, ele chegou ao valor 
médio de 18,2 salários mínimos por mês. Ora, mas este dado, sem 
o cálculo de sua dispersão em relação à média aritmética, pouco 
nos diz sobre a realidade desta população e acabamos por ter uma 
visão distorcida do padrão de vida da maior parte dos funcionários 
do setor analisado pelo estudante. As medidas de variabilidade 
ou dispersão nos permitem perceber essa distorção.
Temos, como principais medidas de dispersão, intervalo, 
desvio médio, variância e desvio padrão.
As medidas mais comuns de 
variabilidade para dados quantitativos 
são a variância; a sua raiz quadrada, 
o desvio padrão; a amplitude total, 
a distância interquantílica e o desvio 
absoluto são mais alguns exemplos de 
medidas de dispersão.
5
10
15
20
25
30
37
ESTATÍSTICA APLICADA
Di
ag
ra
m
aç
ão
: F
ab
io
 -
 1
9/
11
/0
8 
-|
|-
 1
a 
Co
rr
eç
ão
: F
ab
io
 / 
Re
v:
 A
na
 0
3/
12
/0
8
3.1 Amplitude total
O intervalo, ou amplitude total, de um determinado 
conjunto de dados é obtido pela diferença entre o maior e 
o menor valor neste conjunto de números. Indica, portanto, 
a distância entre a maior e a menor observação de um conjunto 
de dados. Assim, temos:
Amplitudetotal = Valormáximo ∼ Valormínimo
Por exemplo, em um conjunto de dados xi={2,3,3,5,5,5,8,10,1
2}, onde n=9, a amplitude total será:
Atotal = Vmáximo - Vmínimo ⇒ Atotal = 12-2 = 10
Em alguns casos, o intervalo ou amplitude total pode 
ser expresso simplesmente pela indicação do menor e 
do maior número do conjunto de dados. No caso do 
exemplo anterior, a amplitude total poderia ser expressa 
simplesmente pela identificação do menor e do maior 
número, indicada como sendo de 2 a 12 ou 2-12.
 
A grande vantagem da amplitude total é que ela 
apresenta uma certa facilidade de ser calculada, mesmo 
quando o conjunto de dados observados é relativamente 
grande. No entanto, como a amplitude total apenas leva 
em conta os dois extremos do conjunto de números, em 
alguns casos, ela pode ser uma medida enganosa quanto à 
indicação da dispersão de um conjunto de números, tendo, 
portanto, uma utilidade limitada.
3.2 Desvio médio absoluto
O desvio médio absoluto inaugura o estudo das medidas de 
variabilidade que têm a média como ponto de referência. 
O intervalo de um determinado 
conjunto de dados é obtido pela 
diferença entre o maior e o menor valor 
neste conjunto de números.
5
10
15
20
25
38
Unidade I
Di
ag
ra
m
aç
ão
: F
ab
io
 -
 1
9/
11
/0
8 
-|
|-
 1
a 
Co
rr
eç
ão
: F
ab
io
 / 
Re
v:
 A
na
 0
3/
12
/0
8
O chamado “desvio” nada mais é que a diferença 
entre cada valor de um determinado conjunto de 
dados e a média deste mesmo conjunto de números (xi 
- x). O valor absoluto de um número será ele próprio, sem 
o sinal que lhe é associado, e é indicado por meio de duas 
linhas verticais que o enquadram. Assim, |-67|=67;|9|=9. 
É preciso calcular primeiro a média aritmética dos dados 
disponíveis, que, em geral, apresentam-se como dados 
amostrais.
 
O desvio médio absoluto será calculado pela média dos 
desvios dos valores a contar da média, ignorando o sinal (+ ou 
-) do desvio, ou seja, convertendo os valores dos desvios em 
valores absolutos, considerando-os todos desvios positivos. 
Assim, temos:
DmédioD
x x
nmØdio
i
i
n
=
−
=
∑
1 ,
onde n é o número de observações.
Vamos agora tomar um exemplo de desvio médio. Para 
um conjunto de dados amostrais xi=2,4,6,8,10,12, onde n=6, 
determine o desvio médio. Temos então:
Dmédio=
x x
n
i −∑
Precisamos primeiro calcular a média, para então passarmos 
ao cálculo do desvio médio. Relembrando a fórmula do cálculo 
da média aritmética, temos:
x
x
n
x xi= ⇒ = + + + + + = ⇒ =∑ 2 4 6 8 10 12
6
7 7
5
10
15
20
39
ESTATÍSTICA APLICADA
Di
ag
ra
m
aç
ão
: F
ab
io
 -
 1
9/
11
/0
8 
-|
|-
 1
a 
Co
rr
eç
ão
: F
ab
io
 / 
Re
v:
 A
na
 0
3/
12
/0
8
Agora podemos calcular os desvios para cada valor do 
conjunto de dados. Assim, temos:
 
xi - x
Dmédio=
Dmédio=
Dmédio=
=
−∑ x x
n
i
=
-5 + -3 + -1+ 1+ 3 + 5
6
=
5+3+1+1+3+5
6
=3
3
2-7 -5
4-7 -3
6-7 -1
8-7 1
10-7 3
12-7 5
0
O valor encontrado acima representa a diferença média de 
cada observação e a média da distribuição. Mas também neste 
caso só seria possível obter mais informações a partir do desvio 
médio comparando com outras populações ou amostras de 
mesmas características.
Por exemplo, se um outro conjunto de dados, com 
as mesmas características e tamanho, apresentasse um 
desvio médio absoluto igual a 2,4, ou seja, menor que 
o desvio médio absoluto calculado no exemplo acima, 
poderíamos dizer que este segundo conjunto de valores 
é mais homogêneo do que o nosso exemplo, já que a 
diferença de cada um dos seus elementos em relação à 
média aritmética é menor. Teríamos, assim, uma dispersão 
menor. 
3.3 Variância
Tanto para o cálculo do desvio médio como para o cálculo 
da variância precisaremos utilizar o desvio de cada elemento de 
um conjunto de dados em relação à média aritmética (xi - x). 
No entanto, ao invés de trabalharmos com os valores absolutos 
(em módulo), agora os desvios são elevados ao quadradoantes 
da soma. Para o caso de dados amostrais, ao invés de dividirmos 
por n, dividimos por n-1 (que é o total da amostra menos uma 
unidade).
O desvio é a diferença entre cada 
valor de um determinado conjunto de 
dados e a média deste mesmo conjunto 
de números.
5
10
15
20
40
Unidade I
Di
ag
ra
m
aç
ão
: F
ab
io
 -
 1
9/
11
/0
8 
-|
|-
 1
a 
Co
rr
eç
ão
: F
ab
io
 / 
Re
v:
 A
na
 0
3/
12
/0
8
A variância irá nos dizer o grau de dispersão de um 
determinado grupo de dados com relação à média aritmética 
desses números. 
Assim, a variância populacional poderá ser calculada da 
seguinte forma:
σ
µ2
2
=
−∑ ( )x
N
i , onde 
A variância amostral poderá ser calculada pela fórmula que 
se segue:
s
x x
n
i2
2
1
=
−
−
∑ ( ) , onde 
Por exemplo, seja um determinado conjunto de dados 
xi = {1,3,5,7,9,11,13}, onde n=7. Calcule a variância deste 
conjunto de dados, supondo:
a) que este conjunto de dados representa toda uma 
população;
b) que este conjunto de dados representa uma amostra.
a) Para calcular a variância deste conjunto de dados, 
considerando que ele representa toda uma população, devemos 
utilizar a seguinte fórmula:
σ
µ2
2
=
−∑ ( )x
N
i , onde devemos considerar n=N.
Ao invés de trabalharmos com os 
valores em módulo, agora os desvios 
são elevados ao quadrado antes da 
soma. Para o caso de dados amostrais, 
ao invés de dividirmos por n, dividimos 
por n-1.
5
10
15
41
ESTATÍSTICA APLICADA
Di
ag
ra
m
aç
ão
: F
ab
io
 -
 1
9/
11
/0
8 
-|
|-
 1
a 
Co
rr
eç
ão
: F
ab
io
 / 
Re
v:
 A
na
 0
3/
12
/0
8
Devemos passar ao cálculo da média deste conjunto de 
dados, para então proceder ao cálculo da variância. Sendo assim, 
temos:
 
µ µ
µ
= ⇒
=
∑ x
N
i =
1+3+5+7+9+11+13
7
=7
7
 
 
(média populacional)
Partindo da média, podemos agora calcular os desvios, e então 
partir para o cálculo da variância populacional, já que supomos 
que o conjunto de dados representava toda a população. Assim, 
temos:
 
µ xi - µ (xi - µ)
2
7 7-1=6 62
7 7-3=4 42
7 7-5=2 22
7 7-7=0 0
7 7-9=-2 (-2)2
7 7-11=-4 (-4)2
7 7-13=-6 (-6)2
Σ� 0 112
σ
µ
σ
σ
2
2
2
2
=
−
=
=
∑ ( )x
N
i
6 +4 +2 +(-2) +(-4) +(-6)
7
36+16+4+4+16+
2 2 2 2 2 2
336
7
=16
σ2 16=
Assim, a variância populacional desse conjunto de dados 
seria igual a 16.
b) Se, por outro lado, temos o mesmo conjunto de dados 
e supondo que ele represente apenas dados amostrais, 
devemos calcular a variância amostral de outra forma. 
Devemos partir do cálculo da média, para então calcularmos 
a variância.
5
10
15
42
Unidade I
Di
ag
ra
m
aç
ão
: F
ab
io
 -
 1
9/
11
/0
8 
-|
|-
 1
a 
Co
rr
eç
ão
: F
ab
io
 / 
Re
v:
 A
na
 0
3/
12
/0
8
Como vimos no módulo 2, a expressão para o cálculo da 
média aritmética em uma amostra é a mesma do cálculo da 
média para uma população, mas utilizaremos para as amostras 
uma outra notação. Vejamos:
x
x
n
xi= ⇒ =∑ 7
 
(média amostral)
Normalmente, a média amostral aproxima-se da média 
populacional quanto maior o tamanho da amostra, mas não se 
iguala a ela.
Passemos então ao cálculo da variância amostral. Utilizaremos 
os mesmos passos do cálculo da variância populacional.
Desta forma:
s
x x
n
i2
2
1
=
−
−
∑ ( )
 
x xi - x (xi - x)
2
7 7-1=6 62
7 7-3=4 42
7 7-5=2 22
7 7-7=0 0
7 7-9=-2 (-2)2
7 7-11=-4 (-4)2
7 7-13=-6 (-6)2
Σ� 0 112
s =
s =
6 +4 +2 +(-2) +(-4) +(-6)
7-1
s =
36+16+4+4
2
2
2 2 2 2 2 2
2
( )x x
n
i −
−
∑ 2
1
++16+36
7-1
=
112
6
s =18,666...2
A variância amostral deste conjunto de dados é igual a 
18,666...
5
10
43
ESTATÍSTICA APLICADA
Di
ag
ra
m
aç
ão
: F
ab
io
 -
 1
9/
11
/0
8 
-|
|-
 1
a 
Co
rr
eç
ão
: F
ab
io
 / 
Re
v:
 A
na
 0
3/
12
/0
8
Como a média aritmética, a variância possui algumas 
propriedades importantes que devemos colocar em 
destaque e que facilitam o cálculo de alguns problemas mais 
complexos. 
a) Somando-se ou subtraindo-se uma constante a cada 
elemento de um conjunto de dados, o valor da variância 
não se altera.
Por exemplo, um conjunto de dados xi={2,4,6,8}, onde n=4, 
e a média é igual a 5. A variância deste conjunto será dada como 
segue:
σ σ
σ
2 2
2
= ⇒ =
=
∑ (x -m)
N
(2-5) +(4-5) +(6-5) +(8-5)
4
(-3) +(-1)
i
2 2 2 2 2
2 2++1+3
4
=
9+1+1+9
4
=
20
4
=5
2
Se somarmos uma constante c=4 a cada um dos elementos 
do conjunto de dados, temos um novo conjunto de dados 
yi={6,8,10,12}, em que a média será igual a 9. A variância será 
então:
σ
µ
σ
2
2 2
2
2
=
−
=
∑ ( )y
N
i
2 2 2 2 2
2
=
(6-9) +(8-9) +(10-9) +(12-9)
4
(-3) +(-1)) +(1)+(3)
4
=
9+1+1+9
4
=
20
4
=5
2 2
Sendo assim, demonstramos que σ σ2 22= , ou seja, ao 
somarmos uma constante a cada elemento de um conjunto de 
dados, a variância permanece a mesma. 
b) Ao multiplicarmos uma constante c a cada elemento 
de um conjunto de dados, temos uma nova variância ao 
multiplicarmos a variância do conjunto de dados original 
por c2. 
5
10
15
20
25
44
Unidade I
Di
ag
ra
m
aç
ão
: F
ab
io
 -
 1
9/
11
/0
8 
-|
|-
 1
a 
Co
rr
eç
ão
: F
ab
io
 / 
Re
v:
 A
na
 0
3/
12
/0
8
Assim, a nova variância será representada da seguinte 
forma:
σ σ22 2 12= c .
c) Ao dividirmos cada elemento de um conjunto de 
dados por uma constante arbitrária c, obtém-se a nova 
variância dividindo-se a antiga variância por c2. 
Assim, podemos apresentar a nova variância da seguinte 
forma:
σ σ22 1
2
2= c
d) A variância de uma constante é igual a zero.
Existe uma fórmula alternativa e reduzida para o cálculo da 
variância populacional, deduzida da fórmula original, que é:
σ µ2
2
2= −∑ x
N
i
Para a variância amostral também existe uma fórmula 
alternativa bastante utilizada e que não exige o cálculo da 
média, que decorre da fórmula acima:
s
x x n
nx
i i2
2 2
1
=
−
−
∑ ∑( )
3.4 Desvio padrão
Obtém-se o desvio padrão extraindo-se a raiz 
quadrada da variância. Assim como a variância e o desvio 
médio, o desvio padrão também representa uma medida 
de variabilidade absoluta e indica o desvio de cada um dos 
Relembrando as propriedades de 
variância:
- ao somarmos uma constante a cada 
elemento de um conjunto de dados, 
a variância permanece a mesma;
- ao multiplicarmos uma constante c 
a cada elemento de um conjunto de 
dados, temos uma nova variância 
ao multiplicarmos a variância do 
conjunto de dados original por c2;
- ao dividirmos cada elemento de 
um conjunto de dados por uma 
constante arbitrária c, obtém-se a 
nova variância dividindo-se a antiga 
variância por c2;
- variância de uma constante é igual 
a zero.
5
10
15
20
45
ESTATÍSTICA APLICADA
Di
ag
ra
m
aç
ão
: F
ab
io
 -
 1
9/
11
/0
8 
-|
|-
 1
a 
Co
rr
eç
ão
: F
ab
io
 / 
Re
v:
 A
na
 0
3/
12
/0
8
números xi de um dado conjunto de observações em relação à 
média µ. É também chamado por alguns autores de desvio da 
raiz média quadrática.
Matematicamente, o desvio padrão poderá ser representado 
da seguinte forma:
Desvio padrão populacional:
σ
µ
=
−∑ ( )x
N
i
2

Outros materiais