Buscar

Estatística Aplicada a Economia I

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 93 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 93 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 93 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Continue navegando


Prévia do material em texto

Universidade Estadual de Santa Cruz 
Departamento de Ciências Exatas e Tecnológicas 
 
 
 
 
 
 
 
 
 
 
ESTATÍSTICA APLICADA À ECONOMIA I 
 
 
 
 
 
Professor: Marcelo Inácio Ferreira Ferraz 
mfferraz@uesc.br 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
2017
 
 
 
1
Introdução a Estatística Econômica 
 
1 CONCEITOS BÁSICOS .............................................................................................. 3 
1.1 Dados estatísticos .................................................................................................. 4 
1.2 Fases do trabalho estatístico .................................................................................. 4 
1.3 Arredondamento de dados ..................................................................................... 4 
1.4 Séries estatísticas ................................................................................................... 5 
1.5 População e amostra .............................................................................................. 9 
2 REPRESENTAÇÃO TABULAR .............................................................................. 10 
2.1 Normas de apresentação e elementos de uma tabela ........................................... 10 
3 REPRESENTAÇÃO GRÁFICA ................................................................................ 13 
4- DISTRIBUIÇÃO DE FREQÜÊNCIAS .................................................................... 21 
5 MEDIDAS DE POSIÇÃO (TENDÊNCIA CENTRAL) ........................................... 25 
5.1 Médias ................................................................................................................. 25 
5.2 Mediana ............................................................................................................... 28 
5.3 MODA (MO) ........................................................................................................ 31 
5.4 SEPARATRIZES ................................................................................................ 33 
5 MEDIDAS DE DISPERSÃO ..................................................................................... 36 
5.1. Amplitude total ou intervalo total (At a, R, It ) ................................................... 36 
5.2 Amplitude Interquartílica .................................................................................... 37 
5.3. Desvio médio ou média dos desvios (Dm, dm, d, DM, Dm) ................................ 37 
5.4 Variância .............................................................................................................. 39 
5.5 Desvio-padrão (S, ) ........................................................................................... 39 
5.6 Coeficiente de variação ou coeficiente de variação relativa (CV) ...................... 40 
5.7 – Medidas de Assimetria ..................................................................................... 41 
5.8 – Medidas de Curtose .......................................................................................... 42 
5.9 – Boxplot ou desenho esquemático ..................................................................... 43 
6-PROBABILIDADE .................................................................................................... 47 
6.1 Conceitos Básicos ................................................................................................ 47 
6.2 Probabilidade ....................................................................................................... 48 
6.3 Axiomas de probabilidades ................................................................................. 49 
7- DISTRIBUIÇÕES DE PROBABILIDADES ........................................................... 53 
Variável aleatória ................................................................................................... 53 
Esperança Matemática ........................................................................................... 54 
7.2 DISTRIBUIÇÕES DISCRETAS ........................................................................ 57 
7.2.1 Distribuição Binomial .................................................................................. 57 
7.2.2 - Distribuição de Poisson .............................................................................. 60 
7.3 - DISTRIBUIÇÃO CONTÍNUA ......................................................................... 63 
7.3.1 Distribuição Normal ..................................................................................... 64 
7.3.2 - Outras distribuições contínuas ................................................................... 69 
8 NÚMEROS-ÍNDICES ............................................................................................... 71 
8.1 INTRODUÇÃO ................................................................................................... 71 
8.2 CONCEITO DE RELATIVO .............................................................................. 71 
8.2.1 Relativo de Preço .......................................................................................... 71 
8.2.2 Relativo de Quantidade ................................................................................ 72 
8.2.3 Relativo de Valor .......................................................................................... 72 
 
 
 
2
8.3 ÍNDICES AGREGATIVOS ................................................................................ 73 
8.3.1 Índices Agregativos Simples ........................................................................ 73 
8.3.2 Índices Agreagativos Ponderados ................................................................ 73 
8.4 SÉRIE DE NÚMEROS ÍNDICES ...................................................................... 76 
8.4.1 Base Fixa ...................................................................................................... 77 
8.4.2 Base Móvel ................................................................................................... 78 
8.5 MUDANÇA DE BASE ....................................................................................... 80 
5.6 DEFLACIONAMENTO ..................................................................................... 81 
8 - EXERCÍCIOS .......................................................................................................... 81 
9 – PROVAS ANTERIORES ....................................................................................... 84 
10 TABELA .................................................................................................................. 92 
 
 
 
 
 
 
3
 
1 CONCEITOS BÁSICOS 
 
 Histórico - meados do século XVIII, a estatística referia-se apenas aos negócios do Estado 
por seus primeiros organizadores estarem ligados a departamentos criados pelos 
governantes. Atualmente atua em várias áreas como na física, química, engenharia, 
economia, administração, medicina, biologia, ciências sociais etc. 
 
a) A estatística: 
Como ciência - se preocupa com a organização, descrição, análise e interpretação 
(inferência, conclusão) dos dados. Como toda ciência sua essência é a observação e 
objetivo básico a inferência. 
 
Como método - serve para estudar e medir fenômenos coletivos, visando subsidiar as 
tomadas de decisões em condições de incerteza. Neste caso, os métodos estatísticos, tornam-
se ferramentas indispensáveis para a atuação de profissionais de gerência e supervisão, pois 
deles dependem: 
- obtenção de dados representativos de determinada situação; 
- análise da situação; 
- previsão dos negócios e do nível de atividades econômicas, pesquisa e 
análise do mercado e da mão-de-obra; 
- controle departamental ou global, das empresas, e da qualidade dos produtos. 
 
b) Ramos da estatísticai) Estatística descritiva - trata da organização e descrição dos dados (dedutiva); pretende 
somente descrever e analisar um certo grupo, sem tirar quaisquer conclusões ou inferências 
sobre um grupo maior. Os dados podem ser apresentados através de gráficos ou tabelas, além 
do cálculo de coeficientes. 
 
Ex.: o volume de vendas de um produto durante o ano. 
 
ii) Estatística indutiva ou inferência estatística ou estatística inferencial ou indução 
estatística - trata da análise e interpretação dos dados. Principalmente, se a amostra é 
representativa de uma população, conclusões importantes podem ser inferidas. 
 
Ex.: calculando a voltagem necessária para que um dispositivo elétrico chegue a falhar, a partir de uma 
amostra, estima-se uma probabilidade de falha, por a inferência não ser absolutamente certa. 
 
 Obs.: Normalmente, ambas as partes da estatística estão conjuntamente apresentadas na 
solução de problemas, ou seja, os dados são organizados em uma tabela, descritos, analisados 
e tirados inferências. 
 
 Duas concepções para a palavra estatística: 
1) no plural (estatísticas), indica coleção de dados numéricos, visando fornecer 
informações a respeito de uma atividade qualquer. 
2) no singular (estatística), esta relacionada à ciência ou aos métodos estatísticos. 
 
Ex.: Estatísticas demográficas: natalidade, desquites, falecimento, matrimônio etc - Estatísticas 
econômicas: emprego, produção, preços, vendas etc. 
 
 
 
4
1.1 Dados estatísticos 
É um conjunto de informações de um fenômeno apresentadas de forma quantitativa e 
qualitativa. 
 
a) Variáveis qualitativas 
- Os atributos caracterizam os dados ou variáveis qualitativas de uma população (sexo, estado 
civil, cor, religião etc.). 
- variável nominal: sexo, cor dos olhos 
- variável ordinal: classe social, grau de instrução 
 
b) Variáveis quantitativas 
Estes dados podem ser denominados de: 
- variável discreta - normalmente resulta de uma contagem (são no. e não-negativos). 
Ex.: os valores de uma população: números de adultos, crianças e idosos. 
 
- variável contínua - não-contável, resulta de medições, pode assumir um valor real qualquer 
entre dois dados. 
Ex.: altura, peso, a medição de temperatura etc. 
 
1.2 Fases do trabalho estatístico 
Para se chegar a um estudo estatístico há várias fases: 
1. Definição do problema, ou seja, saber o que vai ser pesquisado; 
2. Planejamento - procedimento, como obter os dados, quais são os dados, 
cronograma das atividades, custos envolvidos; 
3. Coleta dos dados - dados primários (publicados ou comunicados pela 
própria pessoa que os tenham recolhidos), dados secundários (publicados ou 
comunicados por outra pessoa ou instituição que os tenham recolhidos); 
4. Apuração dos dados - tratamentos nos dados como soma, divisão etc; 
5. Apresentação dos dados - por tabela e/ou gráficos; 
6. Análise e interpretação dos dados - tirar conclusões. 
 
1.3 Arredondamento de dados 
1. Se o dígito situado mais à esquerda dos que serão eliminados for maior do que cinco o 
último dígito remanescente será aumentado de uma unidade. 
2. Se o dígito situado mais à esquerda dos que serão eliminados for menor do que cinco o 
último dígito remanescente não será aumentado de uma unidade. 
3. Se o dígito situado mais a esquerda dos que serão eliminados for um cinco e o último 
dígito remanescente for par, não se alterará, mas se for ímpar será aumentado de uma 
unidade. 
 
Número a arredondar Arredondamento para Número arredondado 
12,489 inteiros 12 
15,504 inteiros 16 
20,733 décimos 20,7 
16,561 décimos 16,6 
35,992 centésimos 35,99 
17,578 centésimos 17,58 
 
 
 
5
1.4 Séries estatísticas 
 Define-se como uma coleção de dados estatísticos referidos a uma mesma ordem de 
classificação (com caráter variável). 
 Uma série estatística varia de outra pela época, local (onde acontece) e Fenômeno 
(espécie do fato). 
 São 4 os tipos de séries: 
a) Série temporal (histórica, cronológica, evolutiva ou marcha) 
 - elemento variável = época; 
 - elemento fixo = local e fenômeno. 
 Ex.: uma série de preços mensais ou uma série de produção anual de um produto. 
 
Tabela 1- Número de domicílios e estabelecimentos atendidos pelo serviço de abastecimento 
de água, no Município de Itabuna, no estado do Bahia – 2012 a 2016 
Ano Número de estabelecimentos 
2112 78574 
2013 81624 
2014 84788 
2015 87535 
2016 89322 
Fonte: EMASA, 2017. 
 
 
 
b) Série geográfica (territorial, espacial, de localização) 
 - elemento variável = local; 
 - elementos fixos = época e fenômeno. 
 Ex.: a produção de manga no Brasil por estado. 
 
TABELA 4 – Matrículas no curso EaD de Letras Vernáculas no primeiro semestre de 
2016 da UESC 
Polo Matriculados 1º semestre 
Amargosa 50 
Brumado 43 
Ibicuí 45 
Ilhéus 50 
Itamaraju 42 
Itapetinga 47 
Teixeira de Freitas 50 
TOTAL 327 
Fonte: EaD-UESC. 
 
 
 
 
 
 
 
6
Tabela 2 - Valor adicionado na região econômica no Litoral Sul, no estado da Bahia – 2013 
MUNICÍPIO Valor adicionado (R$ milhões) 
Almadina 14.188.252,24 
Arataca 30.382.063,36 
Aurelino Leal 27.045.716,99 
Barro Preto 17.222.158,47 
Buerarema 30.200.558,94 
Camacan 90.337.151,50 
Canavieiras 68.326.361,55 
Coaraci 43.070.247,27 
Floresta Azul 14.957.060,87 
Ibicaraí 30.670.613,32 
Ilhéus 1.681.776.461,96 
Itabuna 2.100.129.417,81 
Itacaré 59.874.181,06 
Itajú do Colônia 9.570.240,12 
Itajuípe 153.522.553,23 
Itapé 9.486.717,73 
Itapitanga 11.803.985,78 
Jussari 9.406.201,64 
Maraú 58.878.184,77 
Mascote 27.039.937,03 
Pau Brasil 18.484.274,99 
Santa Luzia 26.615.016,60 
São José da Vitória 7.799.511,33 
Ubaitaba 67.089.134,49 
Uma 94.581.745,07 
Uruçuca 58.609.303,41 
Fonte: SEFAZ. 
Nota: Disponível em https://www.sefaz.ba.gov.br/administracao/contas/iva/anexoII_ivadefin2015.pdf. 
Acesso em 26 de junho de 2017 
 
c) Série específica (categórica, ou por categoria) 
 - elemento variável = fenômeno; 
 - elementos fixos = época e local. 
 Ex.: o comportamento da venda de leite por categoria (leite tipo A, B e C) no Brasil, em 1994 ou produção 
de derivados de leite na Bahia - 1986. 
 
Tabela 3 - Produção de derivados de leite na Bahia - 1986 
Derivados Produção (T) 
Leite em pó 17.650 
Queijo 1.965 
Manteiga 1.104 
Outros 6.699 
Fonte: SERPA - Serv. de Insp. da Prod. Animal - Min. da Agricultura. 
 
 
 
 
 
7
TABELA 8 – RELAÇÃO DE CURSOS DE ESPECIALIZAÇÃO EM ANDAMENRO NO 
ANO DE 2016,UESC, ILHÉUS, BA 
CURSO MATRICULADOS 
Educação Física Adaptada 50 
Educação Infantil 40 
Ensino de Geografia 16 
Gestão Cultural 40 
História do Brasil 30 
Sociologia 12 
Total 188 
Fonte: Gerência de Pós-Graduação/UESC, 2016. 
 
d) Distribuição de freqüência 
 - elementos fixos = época, local e fenômeno. 
 Onde o fenômeno apresenta-se através de gradações. 
 Ex.: número de pessoas por várias classes de renda no Brasil ou número de empregados por faixa de 
salário horário de uma empresa. 
 
 
 
 
 
Tabela 4 - Número de empregados por faixa de salário horário dos empregados de uma empresa 
na Bahia, em 2016 
Salário (R$ /h) Número de Empregados 
16,60 ├── 19,10 3 
19,10 ├── 21,60 5 
21,60 ├── 24,10 7 
24,10 ├── 26,60 8 
26,60 ├── 29,10 5 
29.10 ├─┤ 31,60 2 
Total 30 
Fonte: Dados fictícios. 
 
 
Caso especial: 
 
Série de seção-cruzada (cross-section) – tabela com dupla entrada 
 - elemento variável = época e/ou fenômeno e/ou local; 
 - elementos fixos = época ou fenômeno ou local. 
 Ex.: a produção de manga no Brasil por estado. 
 
 
 
 
 
 
8
Tabela 5 - Produção de manga (em mil frutos) dos principais estadosbrasileiros produtores, 
em 1995-1998 
Estado 1995 1996 1997 1998 Participação 
1998 (%) 
FAC1 
(%) 
Brasil 1.823.917 1.695.459 2.033.399 1.874.371 100,00 
São Paulo 451.643 483.299 488.489 518.679 27,7 27,7 
Bahia 187.717 207.255 228.982 258.365 13,8 41,5 
Minas Gerais 205.276 228.460 419.530 242.646 12,9 54,4 
Pernambuco 115.813 147.999 177.259 191.160 10,2 64,6 
Paraíba 184.685 116.840 154.094 146.923 7,8 72,4 
Ceará 100.589 112.749 127.806 105.214 5,6 78,1 
Rio Grande do Norte 78.720 80.820 78.096 74.053 4,0 82,0 
Sergipe 53.749 59.131 68.481 67.942 3,6 85,6 
Piauí 176.812 39.826 61.604 56.254 3,0 88,6 
Pará 82.639 87.420 47.564 43.240 2,3 90,9 
Outros 186.274 131.660 181.494 169.895 9,1 100,0 
Fonte: IBGE - Produção Agrícola Municipal. 
1 FAC: freqüência acumulada. 
 
 
TABELA 10 - SÍNTESE NUMÉRICA DE DOCENTES DA UESC EM CAPACITAÇÃO, 
POR NÍVEL E LOCALIDADE OFICIALMENTE AFASTADOS, ILHÉUS, 2016 
 
Fonte: Gerência de Pós-Graduação/UESC, 2016. 
 
TABELA 70 – ORÇAMENTO GLOBAL, UESC – 2016 
GRUPO DE 
DESPESA 
Inicial Acréscimo Reajustado Desc. 
Concedida 
Empenhado Saldo 
disponível 
Pessoal 174.454.000,00 2.190.600,00 176.644.600,00 0,00 173.280.242,34 3.364.357,66 
Manutenção 32.458.000,00 3.801.466,98 36.259.466,98 48.058,77 29.732.201,93 6.479.206,28 
Manutenção - 
f-100 
0,00 0,00 39.000,00 0,00 29.099,10 9.900,90 
Investimento 18.753.334,00 10.263.864,02 29.017.198,02 216.520,14 11.632.044,84 17.168.633,04 
TOTAL 225.665.334,00 16.255.931,00 241.960.265,00 264.578,91 214.673.588,21 27.022.097,88 
Investimento/
provisões 
0,00 193.168,42 193.168,42 0,00 184.231,41 8.937,01 
TOTAL 
GERAL 
225.665.334,00 16.449.099,42 242.153.433,42 264.578,91 214.857.819,62 
27.031.034,89 
Fonte : GEFIN/UESC, 2016. 
 
Nivel da Capacitação 
Localidade do curso 
TOTAL Bahia Outros Estados / Nordeste Sul / Sudeste Exterior 
Mestrado 02 - - - 02 
Doutorado 16 02 22 08 48 
Pós-doutorado - - 03 02 05 
TOTAL 18 02 25 10 55 
 
 
 
 
9
 
1.5 População e amostra 
 
População ou universo: Uma população é um conjunto que engloba todos os elementos 
detentores de uma ou mais características em comum que os relacionam ao objeto de estudo. 
Sua amplitude depende do objeto e dos objetivos pesquisados. Depois de se estabelecer o objeto 
e os objetivos de estudo, o passo seguinte em uma pesquisa é a delimitação da população dentro 
da qual se deseja responder tais objetivos com vistas ao estudo de tal objeto. 
Delimitar a população é estabelecer o campo de validade do conhecimento que se quer 
obter. 
 
Delimitar a população não é tão fácil como pode parecer. A população de certa turma de 
Estatística é perfeitamente delimitada pela listagem expedida pela Secretaria Geral de Cursos. 
Se a população for os estudantes aptos a cursarem Estatística, no entanto, em todo final de 
semestre haverá uma renovação parcial. Somente se delimitássemos um período de tempo seria 
possível obter a lista de estudantes, mas poderia não ser interessante do ponto de vista do objeto 
de estudo a delimitação de um período restrito de tempo. Um outro exemplo: quem são 
precisamente os moradores de um bairro popular? A própria região física de um bairro é muito 
difícil de se demarcar, pois suas fronteiras estão em permanente movimento e além disso, as 
pessoas estão sempre se mudando, umas nascem, outras morrem. 
Podemos, em vista do exposto, classificar as populações em finitas quando é possível obter 
uma lista exata dos membros, ou infinitas, quando existem processos de renovação que impem 
o estabelecimento de limites exatos. 
 
Ex.: universo de animais ameaçados de extinção; o universo de pessoas economicamente ativas do 
Brasil; o universo constituído pelo peso dessas pessoas; o universo de suas rendas mensais; de suas 
idades. 
 
- A população pode ser ainda finita (número limitado de observações) ou infinita (número 
ilimitado de observações): 
Ex.: o universo dos estudantes da UESB (população finita); resultados obtidos lançando um dado 
(população infinita). 
 
 Amostra: subconjunto da população, necessariamente finito, pois todos seu elementos serão 
examinados para efeito da realização de um estudo estatístico desejado. 
- Se esta amostra é representativa da população (deve possuir as mesmas características básicas 
da população, no que diz respeito à(s) variável(is) que desejamos pesquisar) pode-se tirar 
conclusões importantes sobre a população (estatística inferencial). 
- As características da amostra são chamadas de estatísticas (descritivas), simbolizadas por 
caracteres latinos ( X , S, p) enquanto que os parâmetros da população terão como símbolos, os 
caracteres gregos (, , ). 
O uso de amostras em vez de estudar populações inteiras tem enormes vantagens, tais 
como o menor uso de recursos humanos, financeiros, de tempo, até de precisão na obtenção de 
medidas ou observações. 
 
 
 
 
 
10 
2 REPRESENTAÇÃO TABULAR 
 
 Importância - apresentar os dados coletados de uma forma que sintetiza as observações, 
facilitando a sua leitura e compreensão. “Qualquer processo ou método estatístico tem como 
ponto de partida uma tabela. Estas servem para apresentar os dados coletados, com a finalidade 
de sintetizar as observações, facilitando sua leitura e compreensão”. 
 
2.1 Normas de apresentação e elementos de uma tabela 
 
Denomina-se representação tabular a forma que se utiliza de tabelas para apresentar os 
dados coletados, com a finalidade de sintetizar as observações, facilitando sua leitura e 
compreensão.Toda tabela deve ser simples, clara, objetiva e auto-explicativa. 
 As tabelas estatísticas são classificadas segundo os mesmos critérios adotados para 
classificação das séries estatísticas. 
 Sendo assim, as tabelas estatísticas simples (que apresentam apenas duas colunas) são 
utilizadas para representar as séries especificativas, geográficas e temporais. 
 Já as tabelas de dupla entrada são utilizadas para representar as séries mistas, que 
combinam duas ou mais séries estatísticas simples (histórico - especificativa, por exemplo). 
 Os elementos componentes de uma tabela são os seguintes: referência; título; data de 
referência; cabeçalho; coluna indicadora; corpo; linha; coluna; casa; traço; fonte; data; 
chamada. 
 
 Referência - usada para identificar a tabela, a referência deve preceder o título, na 
mesma linha, separando-se deste por um hífen. 
 Título - deve ser auto-explicativo, indicando o que (são os dados incluídos na tabela, o 
fenômeno ou fato e/ou como estão classificados), onde (o local representado pelos dados) e 
quando os dados ocorreram. 
 Não deve ser colocado ponto final após a data de referência no título. 
 Cabeçalho - parte da tabela que especifica o conteúdo apresentado em cada coluna. 
 Coluna indicadora - especifica o conteúdo das linhas (1ª letra maiúscula). 
 Corpo - onde estão localizados os dados e/ou informações e sinais convencionais. 
 Linha - conjunto de elementos dispostos horizontalmente no corpo da tabela. 
 Coluna - conjunto de elementos dispostos verticalmente no corpo da tabela. 
 Casa - cruzamento de uma linha com uma coluna. Todas as casas de uma tabela devem 
estar preenchidas. A falta de qualquer informação deve ser suprida por algum sinal, conforme 
a convenção: 
 
 
 
11 
 . . . o dado é desconhecido, podendo ou não existir (por exemplo: preço da piaçava); 
.. para indicar que não se aplica dado numérico; 
 _ o dado não existe (Ex.: por razão da sazonalidade da produção); 
 0; 0,0; 0,00 o dado existe, mas seu valor é inferior à metade da unidade adotada na 
tabela; 
 X o dado foi omitido, para evitar a individualização da informação (único dado). 
 Traços - delimitam obrigatoriamente o cabeçalho, a coluna indicadora e a parte inferior 
da tabela. As tabelasnão devem ser delimitadas à direita e à esquerda por traços verticais; deve-
se evitar traços verticais e horizontais no corpo da tabela. 
 Rodapé - espaço inferior da tabela, após o fecho da mesma, onde se coloca informações 
adicionais para melhor entendimento da tabela. Inclui-se: 
a) Fonte - indicação do responsável pelo fornecimento dos dados ou pela sua 
elaboração. É citada imediatamente após o traço inferior da tabela. 
b) Nota - informações de natureza geral, destinadas a conceituar ou esclarecer o 
conteúdo das tabelas ou a indicar a metodologia adotada na coleta ou 
elaboração dos dados. Deve ser localizada logo abaixo da Fonte. 
c) Chamada - informações de natureza específica sobre determinada parte da 
tabela, enumerada em arábicos entre parênteses, destinadas a escrever 
conceitos ou esclarecer dados. Devem ser colocadas logo após a Nota. 
 No Brasil, cabe ao Conselho Nacional de Estatística e ao IBGE estabelecer normas para 
as representações estatísticas. Embora as resoluções desses órgãos não sejam necessariamente 
de uso obrigatório, é recomendável a sua utilização. Os procedimentos aqui relacionados são 
os de utilização e aceitação mais generalizadas. 
 
Tabela 6 - Produção de café do Brasil, no período de 1993 a 1995 
Ano Produção (1.000 T) 
1993 30.000 
1994 40.000 
1995(1) 50.000 
Total 120.000 
Fonte: IBGE, 1996. 
Nota - Não inclui nestes dados a produção de café do Estado de Minas Gerais. 
(1) Estimativa. 
 
 
 
 
 
 
 
 
12 
Tabela 2 - Concorrência e taxa de aprovação no vestibular da UESC de 2008 a 
2010 
Vestibular 
Candidato/vaga Aprovação % 
Cota N cota Cota N cota 
2008 9.63 10.38 
2009 7.92 10.07 32.4 45.3 
20 10 8.33 10.15 24.82 44.25 
Fonte: Relatórios Anuais de Atividades da UESC 2008, 2009 e 2010 
 
 
 
 
 
13 
3 REPRESENTAÇÃO GRÁFICA 
 
 Após representados em tabelas, os dados estatísticos podem também ser representados 
graficamente. Gráfico é uma representação em uma figura da relação entre variáveis. 
 Importância: os gráficos facilitam a compreensão de uma série estatística e permitem 
uma visualização imediata da distribuição dos valores observados. 
 Elementos: compõem os gráficos estatísticos: referência, título, data de referência, 
fonte, nota, chamada, escala e legenda. 
 Com exceção dos dois últimos, os demais elementos têm para os gráficos funções 
semelhantes às descritas anteriormente, quando eles foram relacionados como elementos que 
compõem as tabelas. 
 Escala: é a seqüência ordenada de valores que descreve o campo de variação de um 
fenômeno. Quando se trata de gráfico retangular, duas escalas são levadas em conta: 
 Escala vertical - que comumente, refere-se à freqüência ou intensidade dos fatos, e a; 
 Escala horizontal - que se refere ao local ou à época de variação do fato. Nesse caso, 
recomenda-se que as dimensões altura e largura devam ser, sempre, uma aproximadamente 
60% a 80% (AZEVEDO, 1980) da outra. 
 A escala aritmética é a mais largamente utilizada. Todavia, há casos em que se impõe a 
utilização de escalas logarítmica ou semilogarítmica. 
 Legenda: é a descrição das convenções utilizadas na elaboração de gráficos que 
representam mais de um fato. Devem ser localizadas à direita do gráfico, ou abaixo deste, 
antecedendo o título. 
 
TIPOS DE GRÁFICOS ESTATÍSTICOS 
 Os gráficos estatísticos podem ser classificados em quatro tipos básicos: diagramas 
(gráficos geométricos dispostos em 2 dimensões), cartogramas (mapas), pictogramas (figuras) 
e estereogramas (representam volume e são apresentados três dimensões). 
 Nos preocuparemos em detalhar apenas os diagramas. As demais formas de 
representação gráfica são mais complexas na sua elaboração e fogem ao objetivo deste trabalho. 
 Os diagramas são denominados segundo o método empregado para representação das 
séries estatísticas, tais como gráficos: de linha, de colunas, de barras, e de áreas ou de setores. 
Gráfico linear - (ou gráfico em curva) - é usado para representar alterações qualitativas sob a 
forma de uma poligonal aberta. Sua principal utilização é na representação das séries temporais. 
 
Exemplo: (série cronológica) 
 
Tabela 7 - Exportações brasileiras - 1975 a 1980 
Anos Valor da Exportação (US$ 1.000 fob) 
1975 8.669.944 
1976 10.128.303 
1977 12.120.175 
1978 12.658.944 
1979 15.144.377 
1980 20.132.401 
Fonte: CACEX. 
 
 
 
 
14 
 
Figura 1 - Exportações brasileiras, no período de 1975 
a 1980. 
Fonte: Cacex, 1990. 
 
 
Figura 1 - Exportações brasileiras, no período de 1975 a 1980. 
Fonte: Cacex. 
 
Escala Vertical para gráfico com corte 
 Para ampliar o gráfico, visando uma melhor observação do incremento anual, pode-se 
cortar o gráfico logo após a linha do zero, sem alterar as dimensões da moldura. 
 No gráfico anterior possui um espaço vazio desde o ponto de origem até a marca dos 
8.000. 
 
 
Gráfico em colunas - as variações quantitativas são representadas por colunas sucessivas de 
bases iguais e altura proporcionais à intensidade do fenômeno. Embora se preste para 
representar qualquer tipo de série, os diagramas em colunas têm seu uso mais comum na 
0
3000
6000
9000
12000
15000
18000
21000
1975 1976 1977 1978 1979 1980
U
S$
 1
00
00
00
 F
O
B
Anos
8500
10500
12500
14500
16500
18500
20500
U
S$
 1
00
00
00
 F
O
B
Anos1975 1976 1977 1978 1979 1980
0
 
 
 
15 
representação de séries geográficas e especificativas. 
 
 
Exemplo: (série geográfica ou especificativa) 
 
 
Tabela 7 - Produção de veículos no Brasil por tipo e combustível - 2010 
TIPO 
GASOLINA 660,182 
FLEX FUEL 2,625,092 
DIESEL 358,760 
Fonte: ANFAVEA - Associação Nacional dos Fabricantes de Veículos Automotores 
 
 
 
 
Gráfico 2 - Produção de veículos no Brasil por tipo e combustível - 2010 
Fonte: ANFAVEA - Associação Nacional dos Fabricantes de Veículos Automotores 
 
 
Gráfico de Barras - assemelha-se aos diagramas em colunas. As variáveis são representadas 
por barras (colunas na posição horizontal) sucessivas. 
 Prefere-se a sua utilização, em lugar dos diagramas em colunas, sempre que se tem que 
representar categorias com nomes de muitas letras. A posição horizontal das colunas permite 
que eles sejam escritos sem que se tenha que recorrer a abreviaturas ou legendas. 
 
Exemplo (série especificativa) 
Tabela 8 - Produção de derivados de leite na Bahia - 1986 
Derivados Produção (t) 
Leite em pó 17.650 
Queijo 1.965 
Manteiga 1.104 
Outros 6.699 
Fonte: SERPA - Serv. de Insp. da Prod. Animal - Min. da Agricultura. 
 
0
500,000
1,000,000
1,500,000
2,000,000
2,500,000
3,000,000
GASOLINA FLEX FUEL DIESEL
Pr
od
uç
ão
 
 
 
16 
 
 
Gráfico 3 - Produção de derivados de leite na Bahia, em 1986. 
Fonte: Serpa - Serv. de Insp. da Prod. Animal - Min. da Agricultura. 
 
 
 
Gráficos de Setores - são usados para representar séries estatísticas que relacionam a 
intensidade das variáveis ao total da série. Indicadas para representarem as séries geográficas e 
especificadas. Os tipos mais conhecidos são os gráficos em setores, tomados em um retângulo 
ou um círculo. 
Gráfico de Setores em Retângulo - consiste em dividir um retângulo em retângulos menores, 
com a mesma altura e base proporcional às parcelas que constituem a série. 
Exemplo: (série especificativa). 
 
Tabela 9 - Consumo de água, por categorias, na Bahia - 1986 
Categorias Consumo 
(1000 m3) 
Residencial 171.151 
Comercial 23.436 
Industrial 3.363 
Contratada 9.975 
Total 208.925 
Fonte: EMBASA - Emp. Baiana de Água e Saneamento 
0 5000 10000 15000 20000Leite em pó
Queijo
Manteiga
Outros
Produção (t)
 
 
 
17 
 
Cada retângulo deve ser reticulado (ou colorido) de forma diferente, seguindo a 
legenda previamente determinada. 
 
 
 Gráfico de Setores em Círculo - neste diagrama, a área total do círculo (360º) será 
dividida proporcionalmente às parcelas que constituem a série. 
 
Exemplo: (mesmo do retângulo) 
171151
23436
3363
9975
Residencial
Comercial
Industrial
Contratada
 
Gráfico 5 - Consumo de água, por categorias, na Bahia – 1986. 
Fonte: Embasa - Emp. Baiana de Água e Saneamento. 
 
Cada ângulo deve ser reticulado (ou colorido) de forma diferente, como no caso 
anterior. 
17
1,
15
1
23
,4
36
3,
36
3
9,
97
5
Residencial
Comercial
Industrial
Contratada
 
 
 
18 
Exemplos diversos 
 
 
 
 
 
 
 
 
 
19 
 
 
 
 
 
 
Figura 4 - Box plot para CRAA 2009.2 e área de conhecimento para cotas e não 
cotas para os cursos de graduação da UESC. 
Nota: EC – Exatas cotas; ENC -Exatas não cotas; HC – Humanas cotas; Humanas não cota; VC – 
Vidas cota; VCN – Vidas não cota 
Fonte: Dados da pesquisa elaborados a partir de relatórios da SEGREG/UESC 
 
 
 
 
 
20 
 
 
Fonte: ANFAVEA - Associação Nacional dos Fabricantes de Veículos Automotores 
 
 
 
 
 
21 
 
 
4- DISTRIBUIÇÃO DE FREQÜÊNCIAS 
 
 Os dados resultantes de uma coleta (dados brutos) para serem melhor analisados, 
devem-se submeter a alguns critérios de organização. 
 O mais preliminar desses critérios consiste em dispor os dados em rol, ou seja, arranjá-
los em ordem crescente ou decrescente. Para facilitar ainda mais a análise, costuma-se indexar 
os dados em classe e determinar o número de informações pertencentes a cada classe, as 
freqüências de classe. 
 Os dados representados em tabela que apresentam classes com as respectivas 
freqüências constituem uma distribuição de freqüências. 
 Nas distribuições de freqüências ressaltam-se os seguintes elementos: 
Freqüência simples de classe - nº de ocorrências das informações compreendidas em uma 
classe; 
Amplitude total - diferença entre o maior e o menor valor da série. 
Classe de freqüência - cada um dos grupos em que se subdivide a amplitude total. 
 Não existe regra fixa para determinação do número de classes de uma distribuição. Os 
critérios existentes servem apenas como indicação. Recomenda-se que esse número não seja 
inferior a 4 nem superior a 10. 
 A fórmula de Sturges é a mais usada para indicação do número ideal de classes: 
Número de classes = 1 + 3,3 log N, onde N é o número de observações. 
Limites de classes - são os números extremos de cada classe. São os limites inferiores e 
superiores. 
 Nas distribuições em que o limite superior de uma classe não coincide com o limite 
inferior da classe seguinte, os limites reais das classes são obtidos somando-se o limite superior 
de uma classe ao limite inferior da classe seguinte e dividindo-se os resultado por dois. 
Intervalo de classe - é a diferença entre os limites inferiores (ou superiores) de duas classes 
consecutivas. Esse intervalo deve ser constante e resulta da divisão da amplitude total pelo 
número de classe. 
(h = ____AT___). 
 nº classes 
 Há distribuições de freqüências que não têm definido o limite inferior da primeira classe 
ou o limite superior da última classe. Os intervalos assim representados são denominados 
intervalos de classe abertos (por exemplo, ao referir-se a níveis de renda, é comum constar da 
última classe a expressão “acima de”). 
 Para evitar interpretações ambíguas, recorre-se à seguinte convenção para representar 
com clareza os intervalos de classe: 
├─ (inclui o limite inferior e exclui o limite superior); 
─┤ (exclui o limite inferior e inclui o limite superior); 
── (exclui os dois limites); 
├─┤ (inclui os dois limites). 
 Ponto médio de classe - é o meio do caminho entre os limites reais de uma classe. É 
obtido somando-se esses limites e dividindo o resultado por dois. 
 
TIPOS DE FREQÜÊNCIAS 
 
 As freqüências podem ser dos seguintes tipos: Freqüência Simples e Freqüência 
Acumulada. 
 
 
 
22 
 As Freqüências Simples subdividem-se em absoluta - que corresponde ao número de 
informações de uma classe, e relativa - corresponde ao quociente entre a freqüência absoluta da 
classe e a freqüência total. É, geralmente, expressa em percentagem. 
 As Freqüências Acumuladas podem ser crescentes (ou “abaixo de”) - que corresponde 
à soma da freqüência de determinada classe com as anteriores, e decrescente (ou “acima de”) - 
que corresponde à soma da freqüência de determinada classe com as subsequentes. 
 As freqüências acumuladas tanto podem ser absolutas como relativas. 
 Para exemplificar o que foi anteriormente exposto, consideremos a distribuição 
seguinte, que se refere aos salários pagos por hora aos empregados da Empresa XYZ: 
 
27,60 23,20 27,00 23,00 20,80 19,20 
21,80 24,60 22,60 20,80 24,20 20,40 
17,00 31,60 24,80 16,60 25,20 19,60 
30,40 17,60 22,40 28,60 25,80 23,20 
24,80 23,60 25,20 26,40 26,60 28,40 
 
 Para que estes dados sejam representados em uma distribuição de freqüência, deve-se 
seguir o seguinte roteiro: 
1. Determinação da Amplitude Total: 
 AT = 31,60 - 16,60 = 15 
2. Determinação do número de classes: 
 C = 1 + 3,3 x log 30  6. 
3. Determinação do intervalo de classe: 
 h = AT = 15 = 2,5 
 C 6 
4. Determinação da freqüência das classes: 
Classes Freqüência 
16,60 ├── 19,10 | | | = 3 
19,10 ├── 21,60 | | | | | = 5 
21,60 ├── 24,10 | | | | | | | = 7 
24,10 ├── 26,60 | | | | | | | | = 8 
26,60 ├── 29,10 | | | | | = 5 
29,10 ├─┤ 31,60 | | = 2 
 
5. Representação tabular da série: 
SALÁRIO HORÁRIO DOS EMPREGADOS DA EMPRESA XYZ 
Classes F Fac Fad Fr F% Fac % Fad% 
16,60 19,10 3 3 30 0,10 10 10,0 100,0 
19,10 21,60 5 8 27 0,17 17 26,7 90,0 
21,60 24,10 7 15 22 0,23 23 50,0 73,3 
24,10 26,60 8 23 15 0,27 27 76,7 50,0 
26,60 29,10 5 28 7 0,17 17 93,3 23,3 
29,10 31,60 2 30 2 0,06 6 100,0 6,7 
 Total 30 1,00 100 
6. Determinação das freqüências relativas (FR): 
 3 ÷ 30 = 0,10; 5 ÷ 30 = 0,17; 7 ÷ 30 = 0,23; 8 ÷ 30 = 0,27; 5 ÷ 30 = 0,17; 2 ÷ 30 = 0,06 
 
 
 
 
23 
7. Determinação das freqüências relativas percentuais (F%): 
 Freqüência relativa x 100 
 
8. Determinação das freqüências acumuladas crescentes (ou abaixo de) FAC: 
3; 3 + 5 = 8; 8 + 7 = 15; 15 + 8 = 23; 23 + 5 = 28; 28 + 2 = 30 
 
9. Determinação das freqüências acumuladas decrescentes (ou acima de) FAD: 
30; 30 - 3 = 27; 27 - 5 = 22; 22 - 7 = 15; 15 - 8 = 7; 7 - 5 = 2. 
 
GRÁFICOS PARA DISTRIBUIÇÃO DE FREQÜÊNCIAS 
 
 As distribuições de freqüências têm representações gráficas especiais. As simples são 
representadas por histogramas ou polígonos de freqüências e as acumuladas por polígonos de 
freqüências acumuladas. 
Histogramas - assemelha-se aos diagramas de colunas, com a particularidade de ter os 
retângulos que representam as freqüências, adjacentes. No eixo horizontal são registrados os 
intervalos de classes e no eixo vertical as freqüências das classes. 
 É usado quando se deseja avaliar graficamente a freqüência das classes. 
 Exemplo: Considerando-se a distribuição anteriormente mostrada, tem-se: 
 Planejamento do gráfico 
Largura: 6 classes de 1 cm e dois intervalos também de 1 cm = 8 cm. 
Altura: 60% da largura: 0,6 x 8  5 cm 
80% da largura: 0,8 x 8 = 6,4 cm 
Escala Vertical: maior freqüência dividida pela altura: 
8 ÷ 5 = 1,6 
8 ÷ 6,4 = 1,25 
entre 1,25 e 1,6 pode-se utilizar como escala 1,5empregados/cm 
 
As medidas gráficas são obtidas dividindo-seas freqüências pelas escalas. 
Polígono de Freqüência - é um gráfico em linha resultante da união de pontos que 
representam as freqüências das classes. No eixo horizontal são marcados os pontos médios das 
classes e no eixo vertical as freqüências das classes. 
 Assim como o histograma é usado em avaliação própria das freqüências de uma série. 
É também utilizado para comparar graficamente duas ou mais distribuições de freqüência. 
 A construção de um polígono de freqüência segue os mesmos critérios adotados para 
construção do histograma, sendo que, no eixo horizontal, ao invés dos limites das classes, são 
tomados os pontos médios das classes. 
 Exemplo: com base na série anterior, tem-se: 
 Planejamento do gráfico 
Largura: 
Altura: 
Escala Vertical: 
(Para fixação usar polígonos justapostos). 
 
Polígono de freqüência acumulada - semelhante ao polígono de freqüência, é também um 
gráfico de linha, resultante da união de pontos que representam as freqüências acumuladas 
(absolutas e relativas) das classes. No eixo horizontal são marcados os limites reais das classes 
e no eixo vertical as freqüências acumuladas. 
 É usado para representar e analisar uma série estatística ou para compor duas ou mais 
séries. 
 
 
 
24 
 Exemplo: tomando-se, ainda, a série dos exemplos anteriores, tem-se: 
 Planejamento do gráfico 
Largura: 6 classes de 1 cm cada e dois espaços também de 1 cm = 8 cm. 
Altura: 60% da largura: 0,6 x 8 cm  5 cm. 
Escala Vertical: freqüência total dividida por altura: 30 ÷ 5 = 6. 
Faz-se: 1 cm = 6 empregados. 
 As medidas gráficas são obtidas dividindo-se as freqüências acumuladas pelas escalas. 
 
 
 
 
 
25 
5 MEDIDAS DE POSIÇÃO (TENDÊNCIA CENTRAL) 
 
São assim denominadas, em virtude da tendência dos dados observados se agruparem 
em torno dos valores centrais. 
 Uma medida de posição é um valor calculado para um conjunto de dados, e usado, de 
alguma forma, para descrever resumidamente o conjunto de dados. Esse valor tende a se 
localizar no centro do conjunto de dados, sendo conhecido por isso também como medida de 
tendência central. Espera-se que o valor seja representativo de todos os valores do conjunto. 
 
5.1 Médias 
a) média aritmética 
 
- média aritmética simples (ou simplesmente média) - é a soma dos valores do conjunto de 
dados dividida pelo número de valores. As fórmulas para as médias populacionais () e 
amostrais ( X )são, respectivamente: 
  = 1 2 3 1x x x x
x
N
i
i
N
N N
   
 
...
= X
N
 
 X = 1 2 3 1x x x x
x
n
i
i
n
n n
   
 
...
=
X
n
 
em que: 
Xi = valores observados; 
N = números de itens da população; 
n = números de itens da amostra; 
 = somatório. 
 
- média aritmética ponderada – obtém-se esta medida, por exemplo, com dados distribuídos 
em classes, os valores Xi, X2, ..., Xn, corresponderão aos pontos médios das n classes e f1, f2, 
...,fn as respectivas freqüências de classe, as fórmulas serão: 
  = 1 1 2 2 3 3
1 2 3
1
1
f x f x f x f x
f f f f
f x
f
N N
N
i i
i
N
i
i
N
   
   
 



...
...
= fX
f
fX
N


 
 X = 1 1 2 2 3 3
1 2 3
1
1
f x f x f x f x
f f f f
f x
f
n n
n
i i
i
n
i
i
n
   
   
 



...
...
= fX
f
fX
n


 
 
Exemplos: 
 
1) Os preços pesquisados de camisetas nas lojas de Ilhéus foram, em R$, os seguintes: 20,00; 
25,00; 30,00; 15,00 e 40,00. Calcular a média aritmética simples. 
= X
N
 = 20 25 30 15 40
5
    = 26 
 
 
 
26 
 
2) Calcular a média aritmética ponderada dos salários horários dos empregados da empresa X 
apresentados na tabela a seguir. 
 
Tabelas 9 - Salário horário dos empregados da empresa X, em 1994 
Salário (R$ /h) Ponto Médio 
(X`) 
N.o de Empregados (f) (fxX) 
16,60 ├── 19,10 17,85 3 53,55 
19,10 ├── 21,60 20,35 5 101,75 
21,60 ├── 24,10 22,85 7 159,95 
24,10 ├── 26,60 25,35 8 202,80 
26,60 ├── 29,10 27,85 5 139,25 
29.10 ├─┤ 31,60 30,35 2 60,70 
Total 30 718,00 
 
fX
f
fX
n


  71830 23,93 
 
b) Média geométrica ( gx ) - por definição, a média geométrica de n valores é, genericamente, 
a raiz n-ésima do produto de todos os valores. É utilizada em certas ocasiões para determinar 
taxas médias. 
Ex.:Aplicações: para estimativa do crescimento demográfico e cálculo do índice de custo de vida. 
 
 Média geométrica simples - esta média será calculada para série de dados do tipo em que 
os valores são apresentados apenas como X1, X2, X3, ..., Xn , a expressão é dada como: 
 g nn
i
n
i
nx x x x x x 

1 2 3
1
. . . ... .  
em que, a letra grega  (pi) é o símbolo utilizado para indicar o produto dos valores da variável 
 
ou
log log . . . ... . log
log log log ...log
logg nn
i
n
i
n nx x x x x x x x x xn n x  
  


1 2 3
1
1 2 3 1
 
gx = anti n xlog log
1
 
 
 
 
 


x
ngX
log1
10 
 
 
 
 
 
Exemplo: 
 
 
 
27 
Calcular a MG do conjunto X = {1, 4, 16, 64} 
 
 
R: gx = 8 
 
 Média geométrica ponderada - esta média se calcula para séries de dados apresentadas 
com suas freqüências, pela seguinte expressão: 
g k
j
k
jnx x x x xf f f
f fkj
k
j
j 

1 2
1
1 21 . . ...

 
onde: n = 
j
k
jf
1
 
log log . . ...
log log ... log
g k
k kx x x x f x f x f xf f f
f
n
kj
k
j
 
  

1 2
1 1 2 21 21

 
gx = anti n
f x f x f xk klog log log ... log1 1 2 2  





 



 

n
g
xfxfxf
X
kk
log...loglog 2211
10 
 
Exemplo: 
 
 
Calcular a média geométrica ponderada para os seguintes valores: 
X f log X f log X 
1 2 0 0 
3 4 0.4771 1.9085 
9 2 0.9542 1.9085 
27 1 1.4314 1.4314 
 9 5.2483 
 






9
2483,5
10x g 3,83 
 
 
d) Média harmônica ( hx ) 
Por definição é o inverso da média aritmética dos inversos. Utiliza para calcular as médias de 
valores que apresenta relação inversa (Ex.: velocidade média Km/h - para uma distância 
constante). 
 Média harmônica ( hx ) simples 
h
i
nx
x x xn
n
n
xi

  



1
1
1
1
2
1 1
1
...
 
 
 
 
 
28 
Exemplo: No trajeto de Ilhéus para Itabuna foram verificadas velocidades de 3 carros correspondentes a 80 km/h, 
120 km/h e 100 km/h. Calcular a média harmônica das velocidades. 
 
R: 
hx 
 

 
11
80
1
120
1
100
3
3
1
80
1
120
1
100
97 3, 
 
 Média harmônica ( hx ) ponderada 








 k
j
k
j
k
j
k
j
k
j
h
fj
xj
n
fj
xj
fj
fj
fj
xj
x
11
1
1
1
111
1 
 
Exemplo: Uma pessoa gastou R$ 120,00 em camisas de R$ 30,00 e R$ 100,00 em camisas de R$ 50,00 a unidade. 
Qual a média de preço/camisa (X = R$/camisa) dado os respectivos pesos (quantidade)? 
 
6,34
2
50
14
30
1
24 

X h 
Exemplo: 
CLASSES fj X´j (ponto médio) 
1 |- 3 2 2 
3 |- 5 4 4 
5 |- 7 8 6 
7 |- 9 4 8 
9 |- 11 2 10 
 20 
R: 4,96 
hX 
   
201
2
2 1
4
4 1
6
8 1
8
4 1
10
2
4 96, 
 
5.2 Mediana 
 Símbolos: X~ ou Md 
 É definida como o valor que divide uma série ordenada de tal forma que pelo menos a 
metade ou cinqüenta por cento dos itens sejam iguais ou maiores ou menores do que ela. Então, 
depois de colocados em ordem (crescente ou decrescente) os valores da série, a mediana é um 
valor que ocupa uma determinada ordem ou posição na série ordenada. 
 O elemento mediano (EMd)indicará a posição em que se encontra a mediana. 
 A mediana é mais utilizada do que a média, principalmente, nos casos em que a 
dispersão (CV>30%) das variáveis é grande. 
 
 
 
29 
 
a) Quando o número de observações é ímpar 
- primeiramente determina-se 
EMd = n 1
2
 
Exemplo: 
Determinar a mediana da série 9, 15, 3, 7, 6, 16, 4, 19 e 1. 
R:7 
 
b) Quando o número de observações é par 
- primeiramente determina-se 
E' Md = n
2
 
E'' Md = (
n
2
) +1 
Md = será a soma dos dois valores indicados pelos elementos medianos dividido por dois. 
Exemplo: Calcular a mediana da série 3, 4, 7, 12, 15, 10, 18 e 14. 
R:11 
 
c) Para valores com freqüências e não agrupados em classe 
 quando o número de observações (n = soma das freqüências) é ímpar 
- primeiramente calcula o elemento mediano 
EMd = n 1
2
 
 e na coluna de freqüência acumulada encontra-se a posição dada pelo elemento mediano. 
Exemplo: 
Xj fj FAC (Fj) 
3 3 3 
4 6 9 
5 9 18 
6 8 26 
7 6 32 
8 3 35 
 n=35 
 
EMd = n 1
2
= 35 1
2
 = 18, a mediana será o 18.o elemento do conjunto, ou seja, se tivéssemos 
os elementos dispostos individualmente teríamos a seguinte lista: 
3,3,3,4,4,4,4,4,4,5,5,5,5,5,5,5,5,5,6,6,6,6,6,6,6,6,7,7,7,7,7,7,8,8,8 . 
Md = 5 
 
 quando o número de observações (n = soma das freqüências) é par 
- primeiramente calcula o elemento mediano 
E' Md = n
2
 
 
 
 
30 
E'' Md = (
n
2
)+1 
- e na coluna de freqüência acumulada encontram-se as posições dadas pelos elementos 
medianos, soma-se os dois valores (Xj) e divide por dois. 
Exemplo: 
Xj fj FREQ. ACUMULADA (Fj) 
2 5 5 
3 10 15 
4 15 30 
5 12 42 
6 5 47 
7 3 50 
 n=50 
E' Md = n
2
= 50/2=25 
E'' Md = (
n
2
)+1= 25+1=26 
Md = (4+4)/2 
 
Exemplo 2: 
Xj fj FAC (Fj) 
3 3 3 
4 6 9 
5 9 18 
6 8 26 
7 6 32 
8 5 36 
 n=36 
E' Md = n
2
= 36/2=18 
E'' Md = (
n
2
)+1= 18+1=19 
Md = (5+6)/2=5,5 
 
d) Para valores com freqüências e agrupados em classe 
- primeiramente, calcula-se o elemento mediano que será sempre EMd = n
2
, seja par ou ímpar o 
número de observações. 
- e na coluna de freqüência acumulada encontra-se a posição da classe de acordo com o 
elemento mediano. 
- calcula-se em seguida a mediana; 
Md = 
Md
antMd
f
h l FE  , em que 
 
 
 
31 
l = limite inferior da classe mediana; 
h = amplitude do intervalo de classe; 
fMd = freqüência simples da classe que contém a mediana; 
EMd= elemento mediana; 
Fant= freqüência acumulada da classe anterior à classe que contém a mediana. 
Exemplo: Calcular a mediana do consumo de eletricidade (kw/hora) dos 80 usuários 
Consumo (Kw/h) Número de usuários (fj) FAC (Fj) 
5 |- 25 4 4 
25 |- 45 6 10 
45 |- 65 14 24 
65 |- 85 26 50 
85 |- 105 14 64 
105 |- 125 8 72 
125 |- 145 6 78 
145 |- 165 2 80 
 n = 80 
 
EMd = n
2
= 80/2 = 40 
- e na coluna de freqüência acumulada encontra-se a posição da classe (65|-85) de acordo com 
o elemento mediano (uma vez que até 85 Kw/h temos 50 observações e até 65 apenas 24). 
- calcula-se em seguida a mediana; 
Md = 
fMd
hl FE antMd  = 31,1265
26
32065
26
244020 65 
Md = 77,31kw/h 
Este é o consumo mediano. 
 
5.3 MODA (MO) 
 
 Como definição genérica, é o elemento que, dentro de um conjunto de valores, aparece 
com maior freqüência. 
 
a) Determinação da Moda de valores não-tabulados (não dispostos em tabela de 
freqüência) 
 A definição genérica pode ser utilizada neste caso, sendo a moda o valor predominante, 
o valor mais freqüente deste conjunto. 
 Se existir um único número com a maior freqüência o conjunto será denominado 
unimodal. 
 Caso haja mais de um número com a maior freqüência, teremos 2 ou 3 modas (bimodal 
ou multimodal ou plurimodal etc). 
 Se não ocorrer um termo mais freqüente, a distribuição será denominada amodal. 
 
Exemplo: 
X = {3,4,5,6,7} R: conjunto amodal. 
Y = {4,4,5,5,5,8,8,8,8,9,9,10} R:Mo=8 (unimodal). 
Z = {1,3,3,4,4,4,5,5,6,7,7,7} R: Mo1= 4; Mo2 = 7 (bimodal). 
 
 
 
32 
b) Determinação da Moda de valores tabulados (dispostos em tabela de freqüência 
individualmente ou agrupados em classe) 
- dados apresentados individualmente - a moda dos valores é determinada imediatamente, 
bastando, consultar a tabela, localizando-se o valor que apresenta a maior freqüência. 
 
Exemplo: 
 
Tabela 11 - salários mensais de operários da empresa X, em 1996 
Salário Mensal (R$) No. de Operários (fi) 
150 1 
165 5 
180 4 
190 6 
195 3 
215 2 
 
R: MO=190 (salário modal) 
 
- dados apresentados em tabela de freqüência e agrupados em classes - neste caso é necessário 
primeiramente localizar a classe que apresenta a maior freqüência, chamada de classe modal, 
então se determinará a moda pela seguinte expressão: 
 
 
ff
f
M
postant
post
o hLI 
 
em que: 
LI = limite inferior da classe modal; 
h = amplitude do intervalo de classe; 
fpost = freqüência simples da classe posterior à classe modal; 
fant = freqüência simples da classe anterior à classe modal. 
 
Exemplo: 
Tabela 12 - Salários semanais (R$) dos funcionários da empresa Y,em 1996 
Salário Semanal (R$) N.o de Funcionários 
25 |- 35 3 
35 |- 45 5 
45 |- 55 7 
55 |- 65 9 
65 |- 75 8 
75 |- 85 4 
f1=36 
R: classe modal = 55 |- 65; 33,60
87
81055 

M o 
 
 
 
 
33 
 
 
5.4 SEPARATRIZES 
 
 Os QUARTIS (Qi) dividem a série em quatro partes iguais, para tanto são necessários 
3 QUARTIS. 
 Os três QUARTIS são representados por Q1,Q2 e Q3 sendo chamados, respectivamente, 
de primeiro, segundo e terceiro quartil. 
 O Q1 é o valor que separa ¼ dos valores á esquerda e ¾ à direita; o Q2 é o valor que 
separa 2/4 dos valores à esquerda e a direita é a mediana; e Q3 é o valor que separa ¾ dos valores 
à esquerda e ¼ à direita. 
 Genericamente, para determinar a posição do quartil a ser calculado, usaremos a 
seguinte expressão para o elemento do quartil: 
 
QiE in 4 
onde: 
i = número do QUARTIL a ser DETERMINADO 
n = número de observações 
 
 Os DECIS (Di) dividem a série em dez partes iguais. 
 Os nove DECIS são representados po D1, D2, D3 ... D9, sendo chamados, 
respectivamente, de primeiro, segundo e terceiro ... e nono decil. 
 O D1 é o valor que separa 1/10 dos valores á esquerda e 9/10 à direita; o D2 é o valor 
que separa 2/10 dos valores à esquerda e 8/10 à direita; e D3 é o valor que separa 3/10 dos 
valores à esquerda e 7/10 à direita ... e D9 é o valor que separa 9/10 à esquerda e 1/10 à direita. 
 Genericamente, para determinar a posição do decil, usaremos a seguinte expressão para 
calcular o elemento do decil: 
 
DiE in 10 
onde: 
i = número do DECIL a ser DETERMINADO 
n = número de observações 
 
 Os CENTIS (ou percentis) dividem a série em cem partes iguais. 
 Os noventa e nove centis são representados Por C1, C2, C3 ... C99, sendo chamados, 
respectivamente, de primeiro, segundo e terceiro ... e nonagésimo nono CENTIL. 
 O C1 é o valor que separa 1/100 dos valores á esquerda e 99/100 à direita; o C2 é o valor 
que separa 2/100 dos valores à esquerda e 98/100 à direita; e C3 é o valor que separa 3/100 dos 
valores à esquerda e 97/100 à direita ... e C99 é o valor que separa 99/100 à esquerda e 1/100 à 
direita. 
 Genericamente, para determinar a posição do CENTIL, usaremos a seguinte expressão 
para calcular o elemento do decil: 
 
CiE in 100 
onde: 
 
 
 
34 
i = número do CENTIL a ser DETERMINADO 
n = número de observações 
 
 
PARA O CÁLCULO DAS SEPARATRIZES PARA DADOS TABULADOS E 
AGRUPADOS EM CLASSES 
f
FE
Si
facSihLIS

 
onde: 
S = separatriz desejada; 
LI =limite inferior da classe que contém a separatriz; 
Esi= elemento da separatriz, posição da separatriz; 
Fant= freqüência acumulada da classe anterior à classe da separatriz; 
Fsi= freqüência simples da classe que contém a separatriz; 
h = amplitude do intervalo de classe. 
 
Exemplo: 
Salário Semanal (r$) N.o de Funcionários FAC 
130 |- 140 11 11 
140 |- 150 12 23 
150 |- 160 20 43 
160 |- 170 15 58 
170 |- 180 8 66 
180 |- 190 7 73 
190 |- 200 4 77 
200 |- 210 3 80 
Para o Q1: 20
4
80x1E 1Q  
Com auxílio da coluna de freqüência acumulada encontra-se o 20.o termo que é o primeiro 
quartil da distribuição de salários pertencente a classe 140 |-150 . 
50,147
12
1120101401
1
1 


f
FE
Q
factQhlQ , 
isto significa que 25% dos empregados ganham até R$ 147,50 por semana e 75% restantes 
ganham acima desse valor. 
 
 
 
 
 
 
 
 
 
 
PARA O CÁLCULO DAS SEPARATRIZES PARA DADOS NÃO AGRUPADOS EM 
 
 
 
35 
CLASSES E ORGANIZADOS EM ROL 
Para os dados em rol, o cálculo das medidas separatrizes é dada por: 
 
onde Ip é a parte inteira de p e Fp a parte fracionária (ou decimal). 
 
 
 
 
 
 
 
 
36 
5 MEDIDAS DE DISPERSÃO 
 
 O cálculo de uma medida de posição só justifica em razão da variabilidade presente na 
natureza, se não houvesse essa variação não teria sentido calculá-la. Entretanto se a 
variabilidade dos dados for muito grande, sua medida de posição terá um grau de confiabilidade 
tão pequeno que será inútil calculá-la. 
As medidas de tendência central nos dizem alguma coisa sobre o nível geral de sua 
magnitude, indicando o ponto onde as observações tendem a concentrar. 
Porém muitas vezes desejamos saber algo mais sobre a dispersão de um conjunto de dados 
 
 Por exemplo: 
 Consideremos os tempos, de três máquinas semelhantes, para executar certa operação industrial. Foram 
tomados os tempos (em segundos) de 5 operações para cada máquina: 
 - máquina A: 10, 10, 10, 10, 10; 
 - máquina B: 11, 10, 9, 11, 9; 
 - máquina C: 3, 4, 5, 20, 18. 
 
média aritmética: 
 
A B CX X X s   10 , 
mas, observando detalhadamente os três grupos obtidos, notamos que se distribuem diferentemente em relação a 
sua média (10 s), como mostra a distribuição abaixo: 
 
máquina A: 
máquina B: 
máquina C: 
 Dispersão dos dados em torno da média. 
 Baseando-se apenas na média poderia se afirmar que os desempenhos das máquinas são 
iguais. Não nos diz a respeito da homogeneidade ou heterogeneidade do desempenho das 
máquinas. A máquina A nos revela completa homogeneidade do desempenho e as outras B e C 
maior heterogeneidade do desempenho. 
 Para analisarmos quantitativamente essa maior ou menor variação (ou dispersão) do 
conjunto de valores, em torno do valor médio, vamos estudar as medidas de dispersão. Estas 
servem para indicar o quanto os dados se apresentam dispersos em torno da região central. 
Permite estabelecer comparações entre fenômenos de mesma natureza e mostrando até que 
ponto os valores distribuem em acima ou abaixo da medida de posição. 
 As principais são: a amplitude total, desvio-médio, variância, desvio-padrão e o 
coeficiente de variação 
 
5.1. Amplitude total ou intervalo total (At a, R, It ) 
 É definida como a diferença entre o maior (Xmáx) e menor (Xmín) valor do conjunto de 
dados. Dar uma idéia do campo de variação dos valores da série. 
a) para dados não agrupados em classe 
Para os exemplos anteriores, teremos: 
 - máquina A: At= 10-10 = 0 s 
 - máquina B: At = 11 - 9 = 2 s; 
 - máquina C: At = 20 – 3 = 17 s., 
 
1
t 
t 
t 
 
 
 
37 
b) para dados agrupados em classe 
 Se os dados vierem representados em uma tabela de freqüências, agrupados em classes, 
há duas maneiras de se definir a amplitude total: 
1. o método: At = ponto médio da última classe - ponto médio da primeira classe. 
2. o método: At = limite superior da última classe - limite inferior da primeira classe. 
Exemplo: 
Classe fJ Ponto Médio 
10 |- 20 5 15 
20 |- 30 12 25 
30 |- 40 20 35 
40 |- 50 14 45 
50 |- 60 10 55 
60 |- 70 4 65 
 n = 65 
 
1. o método: At = 65 - 15 = 50, nesse método os valores extremos são eliminados. 
2. o método: At = 70 - 10 = 60 
 Apesar das restrições ao seu uso por considerar apenas os dois valores extremos e não 
o conjunto, não podendo fornecer uma idéia precisa quanto à dispersão, para alguns fenômenos 
como temperatura ela é satisfatória. 
 
 
5.2 Amplitude Interquartílica 
 
A amplitude interquartílica é a diferença entre o terceiro e o primeiro quartil. Esta 
medida é mais estável que a amplitude total por não considerar os valores mais extremos. Esta 
medida abrange 50% dos dados e é útil para detectar valores discrepantes. 
dq = Q3 – Q1 
 
Por outro lado, a amplitude semi-interquartílica é definida como a média aritmética da 
diferença entre a mediana e os quartis: 
2
13 QQdqm
 
 
5.3. Desvio médio ou média dos desvios (Dm, dm, d, DM, Dm) 
 
 É igual à média aritmética dos valores absolutos dos desvios tomados em relação a uma 
das seguintes medidas de tendência central: média X ou mediana. dM 
a) para dados sem freqüências 
 É calculado de acordo com a definição genérica, pelas seguintes fórmulas: 
 
nn
dXXD i
n
1i
i
m



  onde:  i id X X  , desvio em relação à média aritmética. 
 E a título de informação, 
t 
 
 
 
38 
nn
dMXD i
n
1i
di
m



  onde:  i i dd X M  , desvio em relação à mediana. 
 
Exemplo: calcular o desvio médio dos conjuntos a seguir: 
 A = {4,5,7,9,10}; B = {4,7,7,710}. 
CONJ. A CONJ. B 
Xi di = Xi- gx |di| Xi di = Xi- X |di| 
4 -3 3 4 -3 3 
5 -2 2 7 0 0 
7 0 0 7 0 0 
9 2 2 7 0 0 
10 3 3 10 3 3 
Total=35 0 10 35 0 6 
X = 7 7 
m
AD  105 2 m
BD  65 1 2, 
 Desvios médios em relação à média aritmética. 
 Como o conjunto A apresenta um desvio médio maior do que o conjunto B, concluímos 
ser ele o mais disperso. 
 A título de informação veremos: 
b) para dados com freqüências (agrupados ou não em classe) 
 

 



f
fXX
D
i
n
i
i
m
1 
onde: 
Xi= representa um valor individual ou um ponto médio quando agrupados em classe; 
fi = representa a freqüência simples absoluta de um valor individual ou de uma classe. 
 
 A pesar do desvio médio expressar aceitavelmente a dispersão de uma amostra, não é 
tão freqüentemente utilizado como o desvio-padrão, o qual será descrito mais adiante, pois este 
se adapta melhor a uma ampla gama de aplicações. Além disso, o desvio médio despreza o fato 
de alguns desvios serem negativos e outros positivos, pois essa medida os trata como se fossem 
todos positivos. Todavia será preferido o uso de desvio médio no lugar do desvio-padrão, 
quando esse for indevidamente influenciado pelos desvios extremos. 
Obs.: o desvio médio é, em geral, aproximadamente igual a 0,8 vezes o desvio-padrão. 
 
 
 
 
 
 
 
 
 
 
 
39 
5.4 Variância 
 
Símbolos 
 2- variância populacional; 
 s2 - variância amostral. 
 
 É a média aritmética dos quadrados das diferenças (desvios) dos valores em relação à 
sua média, isto é, 
 
a) para dados sem freqüências 
 
 
X
i
n
S
X Xi
n
2
2
1
1



 
 
b) para dados com freqüências (individualmente ou em classe) 
 
 
X
i
i
n
S
f X Xi
n
2
2
1
1



 
onde: n
i
i
k
f


1
 
fi= freqüência da classe i; 
Xi = valor do ponto médio da classe i. 
 
 
Obs.: para a variância populacional, usa-se no denominador apenas N. 
 
 Como, a unidade da variância difere da unidade dos dados, ou seja se a unidade dos 
valores for metro (m) a unidadeda variância será m2, sendo, portanto, difícil sua interpretação, 
por isso que a medida mais utilizada é o desvio-padrão. 
 
 
 
5.5 Desvio-padrão (S, ) 
 
Símbolos 
 - desvio-padrão populacional; 
 S - desvio-padrão amostral. 
 
 É a raiz quadrada da variância, por isso sua unidade é igual a unidade do valores. Então 
para o cálculo do desvio-padrão deve-se primeiramente determinar a variância e em seguida 
extrair a raiz quadrada desse resultado. 
 É a mais importante das medidas de dispersão, uma vez que é utilizada em numerosos 
métodos de inferência estatística. 
 
Obs.: na quase totalidade dos casos práticos, o desvio padrão supera um sexto da amplitude e é inferior a um terço 
 
 
 
40 
da amplitude, isto é t tA AS
6 3
  esta relação é útil para a verificação de erros grosseiros no cálculo do desvio 
padrão. 
 
 Sendo, o desvio-padrão por definição a raiz quadrada da variância, têm-se, portanto, 
como fórmulas deste as seguintes expressões: 
 
a) para dados sem freqüências 
 
 
X
i
n
S
X Xi
n




2
1
1
 
 
 
b) para dados com freqüências (individualmente ou em classe) 
 
 
1
1
2


 

n
i
n
i
i
X
XXf
S 
 
onde: n
i
i
k
f


1
 
fi= freqüência da classe i; 
iX = valor do ponto médio da classe i. 
 
Obs.: para o desvio padrão populacional, usa-se no denominador apenas N. 
 
 
5.6 Coeficiente de variação ou coeficiente de variação relativa (CV) 
 
É o quociente entre o desvio-padrão e a média. Esta é uma medida relativa de dispersão, 
mede percentualmente a relação entre o desvio-padrão e a média aritmética. É utilizada para a 
comparação em termos relativos do grau de concentração em torno da média de séries 
estatísticas. Assim, uma pequena dispersão absoluta pode ser, na verdade, considerável quando 
comparada com a ordem de grandeza dos valores da variável e vice-versa. Deste modo, com a 
utilização do CV pode-se evitar equívocos. 
 Sua expressão de cálculo é: 
 
100 
X
SCVou
X
SCV  
Exemplos: 
 
1. Consideremos os tempos, de três máquinas semelhantes, para executar certa operação 
industrial. Foram tomados os tempos (em segundos) de 5 operações para cada máquina: 
 - máquina A: 10, 10, 10, 10, 10; 
 - máquina B: 11, 10, 9, 11, 9; 
 - máquina C: 3, 4, 5, 20, 18. 
 
 
 
41 
Calcular para cada máquina: 
a) a variância 
b) o desvio-padrão 
c) o coeficiente de variação 
 
 Máquina A Máquina B Máquina C 
 Xi di=(Xi- X ) (di)
2 Xi di=(Xi- X ) (di)
2 Xi di=(Xi- X ) (di)
2 
 10 0 0 11 1 1 3 -7 49 
 10 0 0 10 0 0 4 -6 36 
 10 0 0 9 -1 1 5 -5 25 
 10 0 0 11 1 1 20 10 100 
 10 0 0 9 -1 1 18 8 64 
Total 50 0 0 50 4 50 274 
Média 10 10 10 
 
2. Dada uma amostra de distribuição das alturas de alunos da UESC, pede-se para calcular: 
a) a variância 
b) o desvio-padrão 
c) o coeficiente de variação 
 Altura (cm) fi Xi di=(Xi- X ) (di)
2 fi (di)2 fi di 
 160-164 5 162 -9.590 91.963 459.816 810.000 
 164-168 13 166 -5.590 31.245 406.188 2158.000 
 168-172 22 170 -1.590 2.527 55.600 3740.000 
 172-176 25 174 2.410 5.809 145.233 4350.000 
 176-180 10 178 6.410 41.091 410.914 1780.000 
 180-184 3 182 10.410 108.373 325.120 546.000 
total 78 1032 2.462 281.010 1802.872 13384.000 
Média 171.590 
 
5.7 – Medidas de Assimetria 
 
A medida de assimetria é um indicador da forma da distribuição dos dados. Ao construir 
uma distribuição de freqüências e/ou um histograma, está-se buscando, também, identificar 
visualmente, a forma da distribuição dos dados que é ou não confirmada pelo coeficiente de 
assimetria de Pearson (As) definido como: 

 o
S
M
A
 ou 
S
M
A oS
  
para dados populacionais e amostrais, respectivamente. 
 
Uma distribuição é classificada como: 
 
 simétrica se média = mediana = moda ou As = 0; 
 
 assimétrica negativa se média ≤ mediana ≤ moda ou As < 0. O lado mais longo do 
polígono de freqüência (cauda da distribuição) está à esquerda do centro. 
 
 assimétrica positiva se moda ≤ mediana ≤ média ou As > 0. O lado mais longo do 
polígono de freqüência está à direita do centro. 
 
 
 
 
42 
 
 
Exemplo: 
 
 
 
 
 
 
5.8 – Medidas de Curtose 
 
A medida de curtose é o grau de achatamento da distribuição, é um indicador da forma 
desta distribuição. É definido como: 
 
)(2
)(
1020
13
PP
QQ
K

 
A curtose ou achatamento é mais uma medida com a finalidade de complementar a 
caracterização da dispersão em uma distribuição. Esta medida quantifica a concentração ou 
dispersão dos valores de um conjunto de dados em relação às medidas de tendência central em 
uma distribuição de freqüências. 
Uma distribuição é classificada quanto ao grau de achatamento como: 
Uma distribuição é classificada quanto ao grau de achatamento como: 
 Leptocúrtica: quando a distribuição apresenta uma curva de freqüência bastante 
fechada, com os dados fortemente concentrados em torno de seu centro, K < 0,263. 
 
 Mesocúrtica: quando os dados estão razoavelmente concentrados em torno de seu 
centro, K= 0,263 
 
 Platicúrtica: quando a distribuição apresenta uma curva de freqüência mais aberta, com 
os dados fracamente concentrados em torno de seu centro, K > 0,263. 
 
Exemplo: 
 
 
 
 
43 
 
 
5.9 – Boxplot ou desenho esquemático 
 
O gráfico Box Plot (ou desenho esquemático) é uma análise gráfica que utiliza cinco 
medidas estatísticas: valor mínimo, valor máximo, mediana, primeiro e terceiro quartil da 
variável quantitativa. Este conjunto de medidas oferece a idéia da posição, dispersão, 
assimetria, caudas e dados discrepantes. A posição central é dada pela mediana e a dispersão 
pelo desvio interquartílico dq= Q3 - Q2. As posições relativas de Q1, Q2 e Q3 dão uma noção 
da assimetria da distribuição. 
Os comprimentos das caudas são dados pelas linhas que vão do retângulo aos valores 
atípicos. Segundo Triola (2004), um outlier ou ponto discrepante é um valor que se localiza 
distante de quase todos os outros pontos da distribuição. A distância a partir da qual considera-
se um valor como discrepante é aquela que supera 1,5dq. De maneira geral, são considerados 
outliers todos os valores inferiores Li= Q1-1,5dq ou os superiores a Ls=Q3+1,5dq. 
 
Exemplo 24: A construção do gráfico Box Plot idades de alunos. Sua elaboração segue os 
seguintes passos: 
 
1 - Ordenar os dados em seqüência crescente. 
18; 18; 19; 20; 20; 20; 20; 20; 20; 21; 21; 22; 23; 24; 25; 25; 25; 26; 29; 30; 35; 
37. 
 
2 - Determinar as seis medidas. 
Mediana: 
 
Primeiro quartil: 
 
Terceiro quartil: 
 
Desvio interquartílico: 
 
 
 
 
44 
Dq = Q3 – Q1 = 25,75 – 20 = 5,75 
 
Limite inferior: 
Li = Q1 – 1,5 dq 
Li = 20 – 1,5 x 5,75 = 11,375 
Limite superior: 
Ls = Q3 – 1,5 dq 
Ls = 25,75 + 1,5 x 5,75 = 34,375 
 
3 - Construir uma escala com valores que incluam o valor máximo e mínimo dos dados. 
 
4 - Construir uma caixa (retangular) estendendo-se de Q1 a Q3, e trace uma linha na caixa no 
valor da mediana. 
 
 
Traçar uma linha paralela à reta, com uma das extremidades alinhada ao limite inferior Li e 
a outra no centro do lado do retângulo correspondente ao primeiro quartil. Trace uma outra 
linha paralela à reta, com uma extremidade no centro do lado do retângulo correspondente ao 
terceiro quartil e a outra alinhada com o limite máximo Ls . 
 
 
Identificar os pontos discrepantes 
 
 
 
 
 
 
45 
 
 
No conjunto de dados não existe aluno com idade inferior a 11,375, ou seja, não há 
aluno com idade considerada discrepante inferiormente. Entretanto, existem dois indivíduos 
cujas idades são superiores a 34,375,pontos estes considerados discrepantes neste conjunto de 
dados: as idades 35 e 37. Estes pontos são identificados no diagrama de caixas por meio de um 
asterisco na direção das linhas traçadas nos item v. 
Note-se que no intervalo interquartílico (dentro do retângulo) existem 50% dos dados, 
dos quais, 25% estão entre a linha da mediana e a linha do primeiro quartil e os outros 25% 
estão entre a linha da mediana e a linha do terceiro quartil. Cada linha da cauda mais os valores 
discrepantes contêm os 25% restantes da distribuição. 
 
 
 
O Box Plot para a distribuição das idades dos alunos apresenta assimetria positiva, ou 
seja, dispersam-se para os valores maiores. 
O gráfico Box Plot pode ser utilizado para fazer comparações entre várias distribuições. 
Essa comparação é feita através de vários desenhos esquemáticos numa mesma figura conforme 
a seguir. Nota-se que para o sexo feminino, não ocorrência de valores discrepantes e a 
distribuição apresenta assimetria positiva, com idade mediana inferior ao do sexo masculino. 
 
 
 
A representação do diagrama de extremos e quartis tem o seguinte aspecto: 
 
 
Existem fundamentalmente 3 características, que nos dão idéia da simetria ou 
enviesamento e da sua maior ou menor concentração: distância entre a linha indicadora da 
mediana e os lados do retângulo; comprimento das linhas que saem dos lados dos retângulos e 
comprimento da caixa. Apresentamos a seguir 3 exemplos de boxplot, correspondentes a tipos 
diferentes de distribuição de dados. 
 
 
 
 
46 
 
 
 
 
 
 
 
 
Os dados são assimétricos 
Os dados são simétricos 
Os dados são assimétricos 
 
 
 
47 
 
6-PROBABILIDADE 
 
6.1 Conceitos Básicos 
 
Nos capítulos anteriores vimos como caracterizar um conjunto de dados, a fim de organizar e 
resumir informações. Porém a principal preocupação da estatística é tirar conclusões acerca dos 
parâmetros populacionais, baseando-se nos resultados observados em uma amostra. 
Em particular a distribuição de freqüência é um instrumento importante para avaliarmos a 
variabilidade das observações do fenômeno em estudo (medidas de posição e dispersão). Essas 
freqüência e medidas calculadas a partir dos dados são estimativas de quantidades desconhecidas, 
associadas em geral a populações das quais os dados foram extraídos na forma de amostras e forem 
aleatórias não podemos determinar, ou prever apriori, os resultados. 
Assim, em particular, a distribuição de freqüência são estimativas de probabilidades de 
ocorrências de certos eventos de interesse. Com as suposições adequadas podemos construir modelos 
probabilísticos que permitem calcular as chances de ocorrência dos possíveis resultados, através da 
teoria de probabilidades. 
Portanto, a teoria das probabilidades permite construir modelos matemáticos que explicam um 
grande número de fenômenos coletivos e fornecem estratégias para a tomada de decisão. 
 
Experimento é o processo pelo qual uma observação (ou medida) é obtida. Experimento Aleatório: 
procedimento que, ao ser repetido sob as mesmas condições, pode fornecer resultados diferentes 
Exemplos: 
1. Resultado no lançamento de um dado; 
2. Hábito de fumar de um estudante sorteado em sala de aula; 
3. Condições climáticas no próximo domingo; 
4. Taxa de inflação do próximo mês; 
5. Tipo sangüíneo de um habitante escolhido ao acaso. 
 
Espaço amostral ( ): é o conjunto de todos os resultados possíveis de um experimento aleatório. 
Exemplos: 
1. Lançamento de um dado.  = {1, 2, 3, 4, 5, 6} 
2. Exame de sangue (tipo sangüíneo).  = {A, B, AB, O} 
3. Hábito de fumar.  = {Fumante, Não fumante} 
4. Tempo de duração de uma lâmpada.  = {t: t ³ 0} 
O espaço amostral relativo a um experimento pode ser representado de diferentes maneiras. 
Ex.: o espaço amostral relativo ao lançamento de duas moedas é 
=> S={KK, KC, CK, CC} onde: K=cara e C=coroa.. 
=> Árvore de probabilidade ou diagrama em árvore (árvore de eventos) 
 
 
 
 
 
 
1o lançamento 2o lançamento 
K K 
K C 
..... 
..... 
..... 
..... 
 
 
 
48 
Evento: é o resultado de um experimento ou um subconjunto do espaço amostral  . 
 
Notação: A, B, C, ... 
 (conjunto vazio): evento impossível 
 : evento certo 
 
Exemplo: Lançamento de um dado alguns eventos são: 
A: sair face par A = {2, 4, 6}   
B: sair face maior que 3 B = {4, 5, 6}   
C: sair face 1 C = {1}   
Mais alguns exemplo: 
 
Experimento Espaço Amostral Evento 
Selecionar uma peça para inspeção Defeituosa, não defeituosa Defeituosa 
Jogar uma moeda Cara, Coroa Cara 
Jogar um dado 1, 2, 3, 4, 5, 6 Par 
Oferta de compra Aceita, rejeitada Aceita 
Jogar futebol Ganhar, perder e empatar Ganhar 
 
 
6.2 Probabilidade 
 
a) Definição clássica: É a freqüência relativa do evento A, ao quociente entre ele e o número de casos 
observados. 
 
 
 
 
 
 
 
b) Definição frequentista: É o quociente entre o número de vezes que ele ocorrer (evento A) e o total de 
repetições 
repetições de totalNúmero
ocorrerA que vezesde Número)( AP 
Probabilidade objetiva: São aplicadas a eventos que podem ser repetidos sob as mesmas condições. 
(Escola frequentista) 
Experimento Espaço Amostral Evento 
Jogar uma moeda Cara, Coroa Cara 
Jogar um dado 1, 2, 3, 4, 5, 6 Par 
 
Probabilidade subjetiva: Considera a probabilidade como uma crença pessoal de que determinado evento 
tenha ocorrido ou possa ocorrer. São usadas as informações disponíveis, experiências ou intuição. 
(quando os dados experimentais não são igualmente provável). 
Exemplo: Casal faz uma oferta de compra. E1 – Aceita E2 – rejeitada 
 
Homem P(E1) = 0,8 e P(E2) = 0,2 
Casos de Total Número
A Evento ao Favoráveis Casos de Número)( AP
 T.C. N.
A Evento ao F. C. N.)( AP
 
 
 
49 
Mulher P(E1) = 0,6 e P(E2) = 0,4 
 
 
Experimento Espaço Amostral Evento 
Selecionar uma peça para inspeção Defeituosa, não defeituosa Defeituosa 
Oferta de compra Aceita, rejeitada Aceita 
Jogar futebol Ganhar, perder e empatar Ganhar 
 
 
 
6.3 Axiomas de probabilidades 
 
 Sendo A e B dois eventos de um espaço amostral E, temos: 
 
1. 1 )( 0  AP 
2. P(S) = 1 
3. P() = 0 
4. Regra da soma de probabilidades. Se A e B forem dois eventos mutuamente exclusivos P(A 
 B) = , então P(A U B) = P(A) + 
P(B) 
5. Se A e B não são mutuamente excludentes então P(A U B) = 
P(A) + P(B) – P(A  B) 
6. Se A é o evento complementar de A, então P(
A ) =1 – P(A) 
 
Exemplo1: Lançamento de um dado 
A = (sair o número 3) 
B = (sair um número par) 
C = (sair número impar) 
Pede-se: 
P(A); P(B); P(C); P(A U B); P(A  C); P(A U C); P( A ). 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
50 
 
 
Exemplo2: Retirar uma carta de um baralho de 52 cartas. 
S = ( c1, c2, ...........c52) 
P(ci) = 1/52 tem a mesma probabilidade de ocorrer. 
Evento A = (retirar uma carta com o número 16) P(A) = 0/52 
 
Exemplo 3: Retirar uma carta vermelha ou um rei 
A = (carta vermelha) B = (um rei) 
 
A e B não são mutuamente exclusivos (há duas cartas de reis vermelhas) 
P(A  B) = P(A) +P(B) –P(A  B) 
P(A  B) = 26/52 + 4/52 – 2/52 = 7/13 ou 52,8% 
 
Exemplo 4: Retirar uma carta de espada ou uma rei de ouros. 
A = Carta de espadas B = rei de ouros 
A e B são mutuamente excludentes P(A  B) =  
P(A  B) = P(A) +P(B) 
P(A  B) = 13/52 + 1/52 = 14/52 = 7/26 ou 26,9% 
 
 
7. Probabilidade Condicional. Se A 
e B são eventos de um espaço amostral S, com P(B) ≠ 0, então a probabilidade condicional do 
evento A, tendo ocorrido o evento B, é indicada por P(A/B) e definida por: 
)(
)()/(
BP
BAPBAP  
B evento ao ..
A evento ao ..
...
B evento ao