Buscar

ESTATÍSTICA E PROBABILIDADE (13)

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 3, do total de 129 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 6, do total de 129 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 9, do total de 129 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Prévia do material em texto

Estatística – Notas de Aulas 
Professor Inácio Andruski Guimarães, DSc. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
ESTATÍSTICA 
 
Notas de Aulas 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Professor Inácio Andruski Guimarães, DSc. 
 
 
Estatística – Notas de Aulas 
Professor Inácio Andruski Guimarães, DSc. 
2 
 
SUMÁRIO 
 
1 CONCEITOS BÁSICOS 5 
 1.1 Estatística 
 1.2 Estatística Descritiva 
 1.3 Estatística Inferencial 
 1.4 População 
 1.5 Amostra 
 1.6 Variável 
 1.7 Séries Estatísticas 
 
2 APRESENTAÇÃO DE DADOS 7 
 2.1 Apresentação Tabular 
 2.2 Apresentação Gráfica 
 
3 DISTRIBUIÇÃO DE FREQÜÊNCIAS 11 
 3.1 Dados Brutos 
 3.2 Rol 
 3.3 Amplitude Total 
 3.4 Número de Classes 
 3.5 Amplitude de Classe 
 3.6 Intervalo de Classe 
 3.7 Freqüência Simples 
 3.8 Freqüência Acumulada 
 3.9 Freqüência Relativa 
 3.10 Ponto Médio de Classe 
 3.11 Representações Gráficas 
 
4 MEDIDAS DE TENDÊNCIA CENTRAL OU DE POSIÇÃO 17 
 4.1 Média Aritmética 
 4.2 Mediana 
 4.3 Moda ........................................................................................................................... 
 4.4 Relação entre Média, Mediana e Moda 
 4.5 Percentil 
 4.6 Decil 
 4.7 Quartil 
 
5 MEDIDAS DE DISPERSÃO 26 
 5.1 Amplitude 
 5.2 Desvio Médio 
 5.3 Variância 
 5.4 Desvio Padrão 
 5.5 Coeficiente de Variação 
 
6 ASSIMETRIA E CURTOSE 32 
 6.1 Coeficiente de Assimetria 
 6.2 Coeficiente de Curtose 
 
7 TEORIA DA PROBABILIDADE 36 
 7.1 Teoria dos Conjuntos 
 7.2 Técnicas de Contagem 
 7.3 Introdução à Probabilidade 
 
8 VARIÁVEIS ALEATÓRIAS 47 
 8.1 Tipos de Variáveis Aleatórias 
 8.2 Função de Probabilidade 
 8.3 Função Densidade de Probabilidade 
 8.4 Expectância 
 8.5 Variância 
Estatística – Notas de Aulas 
Professor Inácio Andruski Guimarães, DSc. 
3 
 8.6 Distribuição Conjunta 
 8.7 Independência 
 8.8 Função Distribuição Acumulada 
 
9 MODELOS DE PROBABILIDADE PARA VARIÁVEIS DISCRETAS 56 
 9.1 Distribuição Uniforme 
 9.2 Distribuição de Bernoulli 
 9.3 Distribuição Binomial 
 9.4 Distribuição Geométrica 
 9.5 Distribuição de Pascal 
 9.6 Distribuição de Poisson 
 9.7 Distribuição Hipergeométrica 
 9.8 Distribuição Multinomial 
 
10 MODELOS DE PROBABILIDADE PARA VARIÁVEIS CONTÍNUAS 61 
 10.1 Distribuição Uniforme 
 10.2 Distribuição Normal 
 10.3 Distribuição Gama 
 10.4 Distribuição Exponencial 
 10.5 Distribuição de Weibull 
 10.6 Distribuição Qui-Quadrado 
 10.7 Distribuição t, de Student 
 10.8 Distribuição F, de Fisher 
 10.9 Aproximação da Distribuição Binomial pela Normal 
 
11 INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA 67 
 11.1 Estimadores e Estatísticas 
 11.2 Estimadores Eficientes 
 11.3 Estatísticas Suficientes 
 11.4 Família Exponencial 
 11.5 Método da Máxima Verossimilhança 
 11.6 Distribuição Amostral da Média 
 
12 INTERVALOS DE CONFIANÇA 74 
 12.1 Intervalo de Confiança para a Média 
 12.2 Intervalo de Confiança para a Diferença de Médias 
 12.3 Intervalo de Confiança para a Proporção 
 12.4 Intervalo de Confiança para a Diferença de Proporções 
 12.5 Intervalo de Confiança para a Variância 
 12.6 Determinação do Tamanho de uma Amostra 
 
13 CONTROLE ESTATÍSTICO DE PROCESSO (CEP) 81 
 13.1 Conceitos 
 13.2 Diagrama de Pareto 
 13.3 Diagrama de Ishikawa 
 13.4 Gráfico de Controle para Média e Amplitude 
 13.5 Capabilidade 
 13.6 Gráficos de Controle para Amplitudes Móveis 
 13.7 Gráficos de Controle por Atributos 
 
14 TEORIA DA DECISÃO ESTATÍSTICA 98 
 14.1 Teste de Hipótese 
 14.2 Teste de Hipótese para a Média 
 14.3 Teste de Hipótese para a Diferença de Médias 
 14.4 Teste de Hipótese para a Proporção 
 14.5 Teste de Hipótese para a Diferença de Proporções 
 
15 ANÁLISE DA VARIÂNCIA (ANOVA) 104 
 15.1 ANOVA para um Fator 
 15.2 ANOVA para dois Fatores 
Estatística – Notas de Aulas 
Professor Inácio Andruski Guimarães, DSc. 
4 
 
16 TESTE QUI-QUADRADO 110 
 16.1 Teste de Bondade de Ajustamento 
 16.2 Teste de Independência de Variáveis 
 
17 TESTES NÃO PARAMÉTRICOS 113 
 17.1 Teste U, de Wilcoxon, Mann e Whitney 
 17.2 Teste H, de Kruskal – Wallis 
 
18 ANÁLISE DE CORRELAÇÃO E DE REGRESSÃO 118 
 18.1 Coeficiente de Correlação 
 18.2 Análise de Regressão Linear 
 18.3 Método dos Mínimos Quadrados 
 18.4 Modelo Exponencial 
 18.5 Modelo Potência 
 18.6 Modelo Logarítmico 
 
 
 APÊNDICE I – INTEGRAIS EULERIANAS 
 APÊNDICE II – MÉTODO DE NEWTON – RAPHSON 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Estatística – Notas de Aulas 
Professor Inácio Andruski Guimarães, DSc. 
5 
1. CONCEITOS BÁSICOS 
 
1.1 Estatística 
 
A Estatística compreende os métodos científicos utilizados para coleta, organização, resumo, 
apresentação e análise, ou descrição, de dados de observação. Também abrange métodos utilizados para 
tomadas de decisões sob condições de incerteza. 
 
1.2 Estatística Descritiva 
 
Inclui as técnicas empregadas para coleta e descrição de dados. Também é empregada na análise 
exploratória de dados. 
 
1.3 Estatística Inferencial 
 
É utilizada para tomar decisões a respeito de uma população, geralmente utilizando dados de 
amostras. Uma vez que tais decisões são tomadas sob condições de incerteza, faz-se necessário o uso de 
conceitos relativos à Teoria da Probabilidade. 
 
1.4 População 
 
Um dos conceitos fundamentais na Estatística, é empregado para designar um conjunto de 
indivíduos que possuem pelo menos uma característica, ou atributo, em comum. Alguns autores 
empregam o termo universo para referir-se a uma população. 
 
1.5 Amostra 
 
Refere-se a qualquer subconjunto de uma população. A amostragem é uma das etapas mais 
importantes na aplicação de métodos estatísticos, envolvendo aspectos como determinação do tamanho da 
amostra, metodologia de formação e representatividade da amostra com relação à população. 
 
1.6 Variável 
 
É usada para atribuição dos valores correspondentes aos dados observados. É importante 
ressaltar que os dados em questão não são necessariamente numéricos, uma vez que podem dizer respeito 
a atributos qualitativos observados na população. Por esta razão costuma-se classificar as variáveis nas 
categorias definidas a seguir. 
 
1.6.1 – Variável Numérica. Também chamada variável quantitativa, é utilizada para representação de 
dados numéricos, ou quantitativos. 
 
1.6.1.1 – Variável Numérica Discreta. Variável cujo domínio é um conjunto enumerável. Geralmente 
corresponde a dados de contagem. Exemplo: Número de defeitos em um componente, total de unidades 
defeituosas em uma amostra. 
 
1.6.1.2 – Variável Numérica Contínua. Variável cujo domínio é um conjunto não enumerável. Refere-se a 
dados de mensuração. Exemplo: Diâmetro de um eixo, peso de um recém-nascido. 
 
1.6.2 – Variável Qualitativa. É utilizada para representação de atributos. Pode ser dicotômica, ou 
binária, quando assume apenas dois possíveis valores, ou politômica, também referida como multinomial, 
quando pode assumir mais de dois possíveis valores. 
 
1.6.2.1 – Variável Qualitativa Categórica. É empregada para representar categorias, ou classes, às quais 
pertencem as observações registradas. Exemplo: Cor dos olhos, sexo. 
 
1.6.2.2 – Variável Qualitativa Ordinal. Utiliza-se este tipo de variável em situaçõesnas quais presume-se 
a necessidade de uma ordem, crescente ou decrescente, para os resultados. Exemplo: Grau de 
escolaridade, categoria salarial. 
 
 
Estatística – Notas de Aulas 
Professor Inácio Andruski Guimarães, DSc. 
6 
1.7 – Séries Estatísticas 
 
Uma série estatística consiste basicamente de um conjunto de valores observados para diferentes 
categorias de uma variável. As séries estatísticas são classificadas em três categorias, apresentadas a 
seguir. 
 
1.7.1 – Série Temporal. A variável de interesse refere-se a um período de tempo. 
 
Exemplo 1.7.1 – A tabela a seguir mostra o faturamento, em milhões de reais, da empresa fictícia ABC 
durante o ano de 20XY. 
 
Tabela 1.1 – Faturamento mensal (R$ 1000000) da empresa ABC (20XY). 
Mês Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez Total 
Faturamento 0,95 1,03 1,12 1,24 1,02 0,92 0,84 0,78 0,72 0,65 0,68 0,82 10,77 
Fonte: Dados fictícios. 
 
1.7.2 – Série Geográfica. Aqui a variável estudada é o local. 
 
Exemplo 1.7.2 – A tabela a seguir mostra o faturamento, em milhões de reais, da empresa fictícia ABC 
durante o ano de 20XY, nas respectivas regiões de atuação. 
 
Tabela 1.2 – Faturamento (R$ 1000000) da empresa ABC (20XY), por região. 
Região Grande Curitiba 
Interior 
do PR 
Interior 
de SC 
Porto 
Alegre 
Interior 
do RS 
Campo 
Grande Cuiabá Total 
Faturamento 2,75 2,58 1,82 1,42 0,80 0,75 0,70 10,77 
Fonte: Dados fictícios. 
 
1.7.3 – Série Específica. 
 
Exemplo 1.7.3 - A tabela a seguir mostra o faturamento, em milhões de reais, da empresa fictícia ABC 
durante o ano de 20XY, especificado por produto. 
 
Tabela 1.3 – Faturamento (R$ 1000000) da empresa ABC (20XY), por produto. 
Produto Rolamento Mancal Óleo Junta Válvula Retentor Total 
Faturamento 3,48 1,84 1,75 1,45 1,25 1,00 10,77 
Fonte: Dados fictícios. 
 
1.7.4 – Séries Combinadas. Na prática, é comum combinar séries estatísticas com o objetivo de 
aumentar, ou detalhar, as informações disponíveis. 
 
Exemplo 1.7.4 – O quadro a seguir mostra o faturamento da empresa ABC por produto e região, isto é, 
uma combinação de uma série geográfica e uma série específica. 
 
Quadro 1.1 – Faturamento (R$ 1000000) da empresa ABC, por produto e região. 
Produto Região Rolamento Mancal Óleo Junta Válvula Retentor Total 
Grande Curitiba 0,89 0,46 0,45 0,37 0,32 0,26 2,75 
Interior do PR 0,83 0,44 0,42 0,35 0,30 0,24 2,58 
Interior de SC 0,59 0,31 0,30 0,25 0,21 0,16 1,82 
Porto Alegre 0,45 0,24 0,23 0,19 0,16 0,15 1,42 
Interior do RS 0,26 0,14 0,13 0,11 0,09 0,07 0,80 
Campo Grande 0,24 0,13 0,12 0,10 0,09 0,07 0,75 
Cuiabá 0,22 0,12 0,10 0,08 0,08 0,10 0,70 
Total 3,48 1,84 1,75 1,45 1,25 1,00 10,77 
Fonte: Dados fictícios. 
 
 
 
 
Estatística – Notas de Aulas 
Professor Inácio Andruski Guimarães, DSc. 
7 
2. APRESENTAÇÃO DE DADOS 
 
A apresentação de dados pode ser efetuada através de dois modos, tabular ou gráfico, não 
mutuamente exclusivos. Para esta tarefa deve-se ter em mente o objetivo da apresentação, no que diz 
respeito ao nível de detalhamento e ao tipo de informação que se deseja extrair dos dados em questão. A 
apresentação tabular permite obter informações mais detalhadas, enquanto a apresentação gráfica permite 
uma compreensão mais rápida a respeito do comportamento da variável observada. 
 
2.1 – Apresentação Tabular 
 
Em primeiro lugar, é importante frisar que os termos “tabela” e “quadro” são utilizados para 
designar objetos distintos. O primeiro designa o arranjo de dados na forma de grade com laterais abertas, 
enquanto o segundo termo é empregado para designar arranjos em grades com laterais fechadas, 
conforme a Figura 2.1. 
 
 
 
 
 
 
 
Figura 2.1 – Formatos de tabela e quadro. 
 
Independente do formato escolhido, uma tabela deve conter três elementos: 
 
1 – Cabeçalho. Deve conter o máximo de informações sobre os dados apresentados 
 
2 – Corpo. De dimensões variáveis, é o espaço destinado à apresentação propriamente dita dos dados. 
 
3 – Rodapé. Deve conter a fonte dos dados e outras informações necessárias à compreensão. 
 
2.1.1 – Tabela Simples. 
 
É o tipo mais comum de tabela, utilizado para representar os valores correspondentes a uma série 
estatística. A disposição pode ser feita tanto por colunas como por linhas. 
 
Exemplo 2.1 – Exemplo de tabela simples. Dados dispostos em linha. 
 
Tabela 1.1 – Faturamento mensal (R$ 1000000) da empresa ABC (20XY). 
Mês Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez Total 
Faturamento 0,95 1,03 1,12 1,24 1,02 0,92 0,84 0,78 0,72 0,65 0,68 0,82 10,77 
Fonte: Dados fictícios. 
 
Exemplo 2.2 - Exemplo de tabela simples. Dados dispostos em coluna. 
 
Tabela 2.1 – Número de 
beneficiários de planos privados 
de saúde, em milhões, no período 
2000 – 2006. 
Ano Beneficiários (milhões) 
2000 34,5 
2001 34,3 
2002 35,0 
2003 36,2 
2004 38,8 
2005 41,6 
2006 44,7 
Fonte: Jornal Folha de São Paulo. 4/6/2007 
 
Variável Valores 
 
 
 
Total 
 
Variável Valores 
 
 
 
Total 
 
Estatística – Notas de Aulas 
Professor Inácio Andruski Guimarães, DSc. 
8 
2.1.2 – Tabela de Dupla Entrada. É utilizada para representar dados de duas séries combinadas. 
 
Exemplo 2.3 – Exemplo de tabela de dupla entrada. 
 
Tabela 2.2 – Faturamento (R$ 1000000) da empresa ABC, por produto e região. 
Produto Região Rolamento Mancal Óleo Junta Válvula Retentor Total 
Grande Curitiba 0,89 0,46 0,45 0,37 0,32 0,26 2,75 
Interior do PR 0,83 0,44 0,42 0,35 0,30 0,24 2,58 
Interior de SC 0,59 0,31 0,30 0,25 0,21 0,16 1,82 
Porto Alegre 0,45 0,24 0,23 0,19 0,16 0,15 1,42 
Interior do RS 0,26 0,14 0,13 0,11 0,09 0,07 0,80 
Campo Grande 0,24 0,13 0,12 0,10 0,09 0,07 0,75 
Cuiabá 0,22 0,12 0,10 0,08 0,08 0,10 0,70 
Total 3,48 1,84 1,75 1,45 1,25 1,00 10,77 
Fonte: Dados fictícios. 
 
2.1.3 – Tabela de Múltiplas Entradas. É utilizada na representação de dados correspondentes a mais de 
duas séries. 
 
Exemplo 2.4 – Exemplo de tabela de múltipla entrada. 
 
Tabela 2.3 – Unidades vendidas por região e por semestre. 
Produto 
Rolamento Mancal Região 
1o Semestre 2o semestre 1o Semestre 2o semestre 
Total 
Sul 38 24 18 14 94 
Sudeste 26 20 14 12 72 
Centro Oeste 16 18 8 17 59 
Total 80 62 40 43 225 
Dados Fictícios. 
 
2.2 – Apresentação Gráfica 
 
Para a apresentação gráfica deve-se levar em consideração o tipo de série estatística estudada e o, 
também, o tipo de variável observada, quantitativa ou qualitativa. Também é possível combinar as duas 
formas de apresentação, tabular e gráfica. Os principais tipos de gráficos são: 
 
2.2.1 – Gráfico Linear. É utilizado principalmente para representar séries temporais. 
 
Exemplo 2.5 
Tabela 1.1 – Faturamento mensal (R$ 1000000) da empresa ABC (20XY). 
Mês Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez Total 
Faturamento 0,95 1,03 1,12 1,24 1,02 0,92 0,84 0,78 0,72 0,65 0,68 0,82 10,77 
Fonte: Dados fictícios. 
 
Faturamento da Empresa ABC
0
0,5
1
1,5
1 2 3 4 5 6 7 8 9 10 11 12
Meses
R
$ 1
00
00
00
,0
0
 
Estatística – Notas de Aulas 
Professor Inácio Andruski Guimarães, DSc. 
9 
 
2.2.2 – Gráfico Setorial. É utilizado para representar séries geográficas ou específicas. 
 
Exemplo 2.6 
Tabela 1.2 – Faturamento (R$ 1000000) da empresa ABC (20XY), por região. 
Região Grande Curitiba 
Interior 
do PR 
Interior 
de SC 
Porto 
Alegre 
Interior 
do RS 
Campo 
Grande Cuiabá Total 
Faturamento 2,75 2,58 1,82 1,42 0,80 0,75 0,70 10,77 
Fonte: Dados fictícios. 
 
Faturamento por Região
Grande Curitiba; 
2,75
Interior do PR; 2,58Interior de SC; 1,82
Porto Alegre; 1,42
Interior do RS; 0,8
Campo Grande; 
0,75Cuiabá; 0,7
Grande Curitiba
Interior do PR
Interior de SC
Porto Alegre
Interior do RS
Campo Grande
Cuiabá
 
 
2.2.3 – Gráfico de Colunas. Pode ser utilizado no lugar do gráfico setorial. 
 
Exemplo 2.7 – Os dados da Tabela 1.2 poderiam ser representados através do gráfico a seguir. 
 
Faturamento por Região
0
0,5
1
1,5
2
2,5
3
Grande
Curitiba
Interior do
PR
Interior de
SC
Porto
Alegre
Interior do
RS
Campo
Grande
Cuiabá
 
 
2.2.4 – Gráfico de Colunas Superpostas. É utilizado para representar os dados de tabelas de dupla 
entrada. 
 
Exemplo 2.8 – Representação dos dados da Tabela 2.2. 
Faturamento por Produto e por Região (%)
0%
20%
40%
60%
80%
100%
Grande
Curitiba
Interior do
PR
Interior de
SC
Porto
Alegre
Interior do
RS
Campo
Grande
Cuiabá
Retentor
Válvula
Junta
Óleo
Mancal
Rolamento
 
Estatística – Notas de Aulas 
Professor Inácio Andruski Guimarães, DSc. 
10 
2.2.5 – Gráfico de Colunas Justapostas. È utilizado para representar dados de tabelas de dupla entrada. 
 
Faturamento por Produto e por Região
0
0,2
0,4
0,6
0,8
1
Grande
Curitiba
Interior do
PR
Interior de
SC
Porto
Alegre
Interior do
RS
Campo
Grande
Cuiabá
Rolamento
Mancal
Óleo
Junta
Válvula
Retentor
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Estatística – Notas de Aulas 
Professor Inácio Andruski Guimarães, DSc. 
11 
3. DISTRIBUIÇÕES DE FREQÜÊNCIAS 
 
As distribuições de freqüências são usadas principalmente para a apresentação de grandes 
conjuntos de dados. 
 
3.1 – Dados Brutos 
 
É a designação para um conjunto de dados não ordenados. 
 
3.2 – Rol 
 
É um conjunto de dados ordenados. 
 
Exemplo 3.1 – Teores de ácido palmítico (%) observados em 120 amostras de óleos vegetais, utilizadas 
em um estudo para comparar as características de óleos obtidos a partir de diferentes fontes. 
 
3,8 5,2 6,1 6,4 8,3 10,1 10,9 11,5 
3,9 5,4 6,1 6,4 8,3 10,2 10,9 11,5 
4,1 5,4 6,1 6,5 9,3 10,4 11 11,5 
4,5 5,5 6,2 6,6 9,4 10,4 11 11,5 
4,6 5,6 6,2 6,7 9,6 10,5 11 11,6 
4,8 5,7 6,2 6,7 9,7 10,5 11 11,6 
4,8 5,9 6,2 6,8 9,7 10,5 11,1 11,9 
4,8 5,9 6,2 7 9,7 10,5 11,1 11,9 
4,9 5,9 6,2 7,2 9,8 10,5 11,1 12,2 
5 6 6,2 7,5 9,8 10,5 11,1 12,2 
5,1 6 6,2 7,6 9,8 10,7 11,2 12,2 
5,1 6 6,2 7,7 9,9 10,8 11,2 13 
5,1 6 6,2 8 10 10,8 11,3 13 
5,1 6,1 6,3 8 10 10,9 11,4 13,1 
5,1 6,1 6,4 8,2 10 10,9 11,4 13,1 
Fonte: Brodnjak – Vončina et al. (2005) 
 
3.3 – Amplitude Total (R) 
 
É a diferença entre o valor máximo e o valor mínimo observados no conjunto de dados, isto é: 
 
)1()( xxR n −= (3.1) 
 
Exemplo 3.2 – Para o conjunto de dados do exemplo anterior a amplitude total é R = 13,1 – 3,8 = 9,3 
 
3.4 – Número de Classes (k) 
 
Pode ser determinado arbitrariamente ou de acordo com a expressão a seguir, denominada fórmula de 
Sturges, onde n é o número de observações, ou tamanho da amostra. 
 
nk log3,31+= (3.2) 
 
Exemplo 3.3 – Uma distribuição de freqüências para os dados do Quadro 3.1, de acordo com a fórmula de 
Sturges, terá 
886,7)120log(3,31 ≅=+=k 
 
3.5 – Amplitude de Classe (h) 
 
Pode ser calculada por 
k
Rh = (3.3) 
 
Estatística – Notas de Aulas 
Professor Inácio Andruski Guimarães, DSc. 
12 
Exemplo 3.4 – Para os dados dos exemplos anteriores, a amplitude de classe é 2,1
8
3,9
≅=h . 
 
3.6 – Intervalo de Classe 
 
Os limites de cada classe podem ser definidos de quatro modos distintos, mostrados a seguir. 
 
1. Intervalo “exclusive – exclusive”: 
 
2. Intervalo “inclusive – exclusive”: 
 
3. Intervalo “inclusive – inclusive”: 
 
4. Intervalo “exclusive – inclusive”: 
 
Exemplo 3.5 – Para os dados utilizados como exemplo até agora, as classes e intervalos são: 
 
Tabela 3.1 – Distribuição de freqüências para os teores 
(%) de ácido palmítico observados em amostras de 
óleos vegetais. 
Classe Teores de Ácido Palmítico Observações 
1 3,8 |-- 5,0 9 
2 5,0 |-- 6,2 24 
3 6,2 |-- 7,4 21 
4 7,4 |-- 8,6 8 
5 8,6 |-- 9,8 6 
6 9,8 |-- 11,0 24 
7 11,0 |-- 12,2 21 
8 12,2 |-- 13,4 7 
 Total (N) 120 
 
3.7 – Freqüência Simples (fi) 
 
A freqüência simples da i–ésima classe é igual ao número do observações pertencentes à mesma. 
 
Exemplo 3.6 – Na distribuição do exemplo anterior: f1 = 9 , f2 = 24 , ... , f8 = 4. 
 
3.8 – Freqüência Acumulada 
A freqüência acumulada crescente da i–ésima classe é dada por: ∑
=
=
i
j
ji ffac
1
 (3.4) 
 
Exemplo 3.7 – A freqüência acumulada crescente da quarta classe, na distribuição mostrada na Tabela 
3.1, é: fac4 = 9 + 24 + 21 + 8 = 62. 
 
A freqüência acumulada decrescente da i–ésima classe é dada por: ∑
=
=
k
ij
ji ffad (3.5) 
 
Exemplo 3.8 – Para a quarta classe da distribuição anterior, a freqüência acumulada decrescente é dada 
por: fad4 = 8 + 6 + 24 + 24 + 4 = 66. 
 
3.9 – Freqüência Relativa (fri) 
 
A freqüência relativa da i–ésima classe é dada por: 
∑
=
= k
j
j
i
i
f
ffr
1
 (3.6) 
Estatística – Notas de Aulas 
Professor Inácio Andruski Guimarães, DSc. 
13 
 
Exemplo 3.9 – As freqüências relativas para distribuição da Tabela 3.1 são 
 
Tabela 3.2 – Distribuição de freqüências simples e relativas para os teores (%) de 
ácido palmítico observados em amostras de óleos vegetais. 
Classe Teores de Ácido Palmítico Observações Freqüências Relativas 
1 3,8 |-- 5,0 9 0,0750 
2 5,0 |-- 6,2 24 0,2000 
3 6,2 |-- 7,4 21 0,1750 
4 7,4 |-- 8,6 8 0,0667 
5 8,6 |-- 9,8 6 0,0500 
6 9,8 |-- 11,0 24 0,2000 
7 11,0 |-- 12,4 21 0,1750 
8 12,4 |-- 13,6 7 0,0583 
 Total (N) 120 1,0000 
 
 
3.10 – Ponto Médio de Classe (Xi) 
 
O ponto médio da i–ésima classe é dado por: 
 
2
ii
i
LSLI
X
+
= (3.7) 
 
onde LIi e LSi são os limites inferior e superior da classe, respectivamente. 
 
Exemplo 3.10 – As classes da distribuição da Tabela 3.1 têm os seguintes pontos médios: 
 
Tabela 3.3 – Distribuição de freqüências simples e 
pontos médios de classe para os teores (%) de ácido 
palmítico observados em amostras de óleos vegetais. 
Classe Teores de Ácido Palmítico Observações Pontos Médios (Xi) 
1 3,8 |-- 5,0 9 4,4 
2 5,0 |-- 6,2 24 
3 6,2 |-- 7,4 21 
4 7,4 |-- 8,6 8 
5 8,6 |-- 9,8 6 
6 9,8 |-- 11,0 24 
7 11,0 |-- 12,2 21 
8 12,2 |-- 13,4 7 12,8 
 Total (n) 120 
 
3.11 – Representações Gráficas 
 
As distribuições de freqüências podem ser representadas através de três tipos de gráficos, não 
mutuamente exclusivos. 
 
3.11.1 – Histograma 
 
É um gráfico de colunas justapostas, onde a largura da base de cada coluna representa o intervalo de 
classe correspondente e a altura representa a freqüência simples da referida classe. 
 
Exemplo 3.11 – A Figura 3.1 mostra o histograma da distribuição mostrada na Tabela 3.1. 
 
Estatística – Notas de Aulas 
Professor Inácio Andruski Guimarães, DSc. 
14 
0
5
10
15
20
25
30
3,8 - 5,0 5,0 - 6,2 6,2 - 7,4 7,4 - 8,6 8,6 - 9,8 9,8 - 11,0 11,0 - 12,2 12,2 - 13,4
 
Figura 3.1 – Histograma da distribuição de freqüências de teores de ácido palmítico. 
 
3.11.2 – Polígono de FreqüênciasÉ definido por uma linha poligonal cujos vértices são definidos pelos pontos médios e pelas freqüências 
das classes representadas. 
 
Exemplo 3.12 – O polígono de freqüências para a distribuição anterior é mostrado na Figura 3.2. 
 
0
5
10
15
20
25
30
1 2 3 4 5 6 7 8
Classes
Fr
eq
üê
n
ci
as
 
Figura 3.2 – Polígono de freqüências da distribuição de teores de ácido palmítico. 
 
3.11.3 – Curva de Freqüências 
 
Exemplo 3.13 – A curva de freqüências para a distribuição dos exemplos anteriores é mostrada na Figura 
3.3. 
 
0
5
10
15
20
25
30
1 2 3 4 5 6 7 8
 
Figura 3.3 – Curva de freqüências para a distribuição de teores de ácido palmítico. 
 
 
Estatística – Notas de Aulas 
Professor Inácio Andruski Guimarães, DSc. 
15 
3.12 – Exercícios 
 
O Quadro 3.1 mostra 150 valores correspondentes ao comprimento da sépala, observados em flores de 
três espécies: íris virginica, íris setosa e íris versicolor, para um estudo cujo é a comparação das 
diferenças entre as dimensões observadas para cada um dos três grupos. 
 
Quadro 3.1 – Comprimentos (mm) das sépalas 
observadas em 150 exemplares de flores íris. 
43 46 44 46 50 54 50 49 56 58 
44 47 44 48 56 55 51 57 61 59 
46 48 45 49 56 55 55 58 61 60 
46 50 48 50 56 55 56 60 62 62 
47 50 49 51 58 56 57 64 63 63 
48 51 49 52 59 57 57 64 63 63 
48 51 50 53 59 58 57 65 64 64 
49 51 50 55 60 60 58 65 64 65 
49 51 50 57 61 60 58 67 67 67 
50 52 51 63 61 60 61 68 69 67 
50 52 51 64 61 63 62 72 72 67 
51 54 52 65 62 66 63 73 72 68 
54 54 54 66 63 67 63 76 74 69 
54 57 55 69 64 67 65 77 77 69 
58 57 55 70 67 68 71 77 79 77 
Fonte: Fisher (1936). 
 
1) Calcular a amplitude total. 
2) Calcular o número de classes para construir uma distribuição de freqüências. 
3) Calcular a amplitude de cada classe. 
4) Determinar os intervalos e limites de classes. 
5) Distribuir as freqüências. 
6) Calcular as freqüências acumuladas. 
7) Calcular os pontos médios. 
8) Traçar o histograma. 
 
Resposta: 
 
Classe Comprimento (mm) Flores faci fadi fri Ponto médio 
1 43 |-- 47 9 9 150 0,0600 45 
2 47 |-- 51 23 32 141 0,1533 49 
3 51 |-- 55 19 51 118 0,1267 53 
4 55 |-- 59 28 79 99 0,1867 57 
5 59 |-- 63 20 
6 63 |-- 67 23 
7 67 |-- 71 16 
8 71 |-- 75 6 
9 75 |-- 79 6 150 6 
 Total 150 
 
 
 
 
 
 
 
 
 
Estatística – Notas de Aulas 
Professor Inácio Andruski Guimarães, DSc. 
16 
 
 
0
5
10
15
20
25
30
 
Figura 3.4 – Histograma para os dados do Quadro 3.1. 
 
 
Referências 
 
Brodnjak – Vončina, D., Kodba, Z., Novič, M., Multivariate data analysis in classification of 
vegetable oils characterized by the content of fatty acids. Chemometrics and Intelligent Laboratory 
Systems 75, pp. 31-43, 2005. 
 
Fisher, R. A., The use of multiple measurements in taxonomic problems. Annals of Eugenics 7, pp. 
179-178, 1936. 
 
Johnson, R. A., Wichern, D. W., Applied multivariate statistical analysis. 2nd. Ed. New Jersey: Prentice-
Hall International, Inc., 1988. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Estatística – Notas de Aulas 
Professor Inácio Andruski Guimarães, DSc. 
17 
4. MEDIDAS DE TENDENCIA CENTRAL OU DE POSIÇÃO 
 
São medidas utilizadas principalmente para a descrição de dados. Neste caso o que se deseja 
encontrar são os valores representativos do conjunto de dados, de modo a resumir ao máximo as 
observações sobre os dados em questão. As principais medidas de posição são a média aritmética, a 
mediana e a moda. As definições, e algumas propriedades, destas medidas são brevemente descritas a 
seguir. 
 
4.1 – Média Aritmética ( x ) 
 
Seja um conjunto de dados {x1 , x2 , ... , xn }. A média aritmética, ou simplesmente “média”, é 
dada por 
 
n
x
x
n
i
i∑
=
=
1
 (4.1) 
 
Exemplo 4.1 – Seja o conjunto {2 , 4 , 3 , 5 , 6 , 2 , 5}. Então a média aritmética é: 
 
8571,3
7
5265342
=
++++++
=x . 
 
OBS: A notação x é empregada para representar a média de uma amostra de valores. A média da 
população costuma ser representada pela letra grega µ (“mi” ou “mu”). 
 
4.1.1 – Propriedades da Média Aritmética: 
 
P1: Se uma constante k é somada a cada valor do conjunto, então a média será acrescida de k. 
 
Exemplo 4.2 – Se todos os valores do conjunto do exemplo 3.1 forem aumentados em 5, a média será 
8,8571. 
 
P2: Se cada valor do conjunto é multiplicado por uma constante k, então a média também será 
multiplicada pelo mesmo valor. 
 
Exemplo 4.3 – Se todos os valores do conjunto do exemplo 3.1 forem multiplicados por 5, a média será 
19,2855. 
 
P3: Seja xxd ii −= o desvio do i – ésimo valor em relação à média aritmética. Então ∑
=
=
n
i
id
1
0 . 
 
4.1.2 – Média Aritmética Ponderada 
 
Para dados agrupados em distribuições de freqüências calcula-se a média ponderada, sendo que a 
freqüência observada para cada valor é o peso do mesmo. Então, se um conjunto de n valores foi 
agrupado em k classes, com pontos médios X1 , X2 , ... , Xk , e freqüências simples f1 , f2 , ... , fk , 
respectivamente, então a média aritmética é dada por: 
 
∑
∑
=
=
= k
i
i
k
i
ii
f
fX
x
1
1
 (4.2) 
 
 
 
 
Estatística – Notas de Aulas 
Professor Inácio Andruski Guimarães, DSc. 
18 
Exemplo 4.4 – O teor médio de ácido palmítico, para os dados da Tabela 3.1, é dado por: 
 
Classe Teores de Ácido Palmítico (%) Observações (fi) Xi Xi fi 
1 3,8 |-- 5,0 9 4,4 39,6 
2 5,0 |-- 6,2 24 
3 6,2 |-- 7,4 21 
4 7,4 |-- 8,6 8 
5 8,6 |-- 9,8 6 
6 9,8 |-- 11,0 24 
7 11,0 |-- 12,2 21 
8 12,2 |-- 13,4 7 12,8 89,6 
 Total (n) 120 
 
54,8
120
4,1024
≅=x 
 
OBS: Se a média para os 120 valores fosse obtida diretamente do conjunto, através da fórmula (4.1), o 
valor encontrado seria 8,40. 
 
4.2 – Mediana ( x~ ) 
 
É o valor que ocupa a posição central em um conjunto de dados, quando organizados em ordem 
crescente. Se a quantidade de valores é ímpar, a mediana, ou valor mediano, é simplesmente o valor 
central. Se a quantidade de valores é par, a mediana é a média dos dois valores centrais. 
 
Exemplo 4.5 – Seja o conjunto {2 , 2 , 3 , 5 , 5 , 6 , 7 , 7 , 9 , 9 , 10}. Neste caso a mediana é x~ = 6. 
 
Exemplo 4.6 – Seja o conjunto {0 , 1 , 1 , 2 , 3 , 4 , 5 , 5 , 6 , 6 , 7 , 8}. Aqui a mediana é dada pela média 
dos dois valores centrais, isto é, x~ = (4 + 5)/2 = 4,5. 
 
4.2.1 – Mediana para dados agrupados em distribuições de freqüências 
 
Para dados agrupados em distribuições de freqüências pode-se utilizar para o cálculo da mediana 
a expressão: 
hfme
fcan
LIx x












−
+= 2~ ~ (4.3) 
 
onde: LIx = limite inferior da classe que contém o valor mediano, isto é, da classe cuja freqüência 
acumulada crescente é igual ou imediatamente superior a n / 2. 
 fca = freqüência acumulada crescente da classe anterior à classe que contém o valor mediano. 
 fme = freqüência simples da classe que contém o valor mediano. 
 h = amplitude da classe que contém o valor mediano. 
 
Exemplo 4.7 – O teor mediano de ácido palmítico, para os dados da Tabela 3.1, é dado por: 
 
Classe Teores de Ácido Palmítico (%) Observações (fi) faci 
1 3,8 |-- 5,0 9 9 
2 5,0 |-- 6,2 24 33 
3 6,2 |-- 7,4 21 54 
4 7,4 |-- 8,6 8 62 
5 8,6 |-- 9,8 6 
6 9,8 |-- 11,0 24 
7 11,0 |-- 12,2 21 
8 12,2 |-- 13,4 7 
 Total (n) 120Estatística – Notas de Aulas 
Professor Inácio Andruski Guimarães, DSc. 
19 
 
60
2
=
n
 (Então a mediana pertence à 4ª. classe). 
LIx = 7,4 
fca = 54 
fme = 8 
h = 8,6 – 7,4 = 1,2 
 
Substituindo na expressão (4.3): 
 
OBS: Se a mediana fosse obtida a partir da definição, diretamente do conjunto de dados, o valor 
encontrado seria 8,25. 
 
4.3 - Moda 
 
A moda, ou valor modal, de um conjunto de dados é o valor com maior freqüência individual. É 
importante ressaltar que o valor modal pode não existir, além disto, caso exista, pode não ser único. Neste 
último caso, diz-se que o conjunto é bimodal, trimodal, etc. 
 
Exemplo 4.8 – O valor modal para o conjunto de observação dos teores de ácido palmítico é 6,2, cuja 
freqüência é 10. 
 
3,8 5,2 6,1 6,4 8,3 10,1 10,9 11,5 
3,9 5,4 6,1 6,4 8,3 10,2 10,9 11,5 
4,1 5,4 6,1 6,5 9,3 10,4 11 11,5 
4,5 5,5 6,2 6,6 9,4 10,4 11 11,5 
4,6 5,6 6,2 6,7 9,6 10,5 11 11,6 
4,8 5,7 6,2 6,7 9,7 10,5 11 11,6 
4,8 5,9 6,2 6,8 9,7 10,5 11,1 11,9 
4,8 5,9 6,2 7 9,7 10,5 11,1 11,9 
4,9 5,9 6,2 7,2 9,8 10,5 11,1 12,2 
5 6 6,2 7,5 9,8 10,5 11,1 12,2 
5,1 6 6,2 7,6 9,8 10,7 11,2 12,2 
5,1 6 6,2 7,7 9,9 10,8 11,2 13 
5,1 6 6,2 8 10 10,8 11,3 13 
5,1 6,1 6,3 8 10 10,9 11,4 13,1 
5,1 6,1 6,4 8,2 10 10,9 11,4 13,1 
 
Para dados agrupados em distribuições de freqüências, a moda pode ser calculada através da fórmula dada 
por: 
 
hLIMo 





∆+∆
∆
+=
21
1
mod
 (4.4) 
 
onde: 
 LImod = limite inferior da classe modal, isto é, a de maior freqüência simples. 
 ∆1 = (freqüência simples da classe modal menos a freqüência simples da classe anterior). 
 ∆2 = (freqüência simples da classe modal menos a freqüência simples da classe posterior). 
 h = amplitude da classe modal. 
 
 
Exemplo 4.9 – Calcular a moda para a distribuição de freqüências dos teores de ácido palmítico. 
 
A distribuição de freqüências é dada na tabela a seguir. 
 
 
Classe Teores de Ácido Palmítico (%) Observações (fi) 
Estatística – Notas de Aulas 
Professor Inácio Andruski Guimarães, DSc. 
20 
1 3,8 |-- 5,0 9 
2 5,0 |-- 6,2 24 
3 6,2 |-- 7,4 21 
4 7,4 |-- 8,6 8 
5 8,6 |-- 9,8 6 
6 9,8 |-- 11,0 24 
7 11,0 |-- 12,2 21 
8 12,2 |-- 13,4 7 
 Total (n) 120 
 
Neste caso as classes 2 e 6 têm a mesma freqüência. Então a distribuição obtida é bimodal, conforme se 
pode notar na Figura 3.3, com a curva de freqüências para este conjunto de dados. As respectivas modas 
são: 
 
Primeiro valor modal: 
 
 LImod = 5,0 
 ∆1 = 24 – 9 = 15 
 ∆2 = 24 – 21 = 3 
 h = 6,2 – 5,0 = 1,2 
 
Substituindo na fórmula (4.4): 
=





+
+= ),(,Mo 21
315
051
. 
 
Segundo valor modal: 
 
 LImod = 9,8 
 ∆1 = 24 – 6 = 18 
 ∆2 = 24 – 21 = 3 
 h = 11,0 – 9,8 = 1,2 
 
Substituindo na fórmula (4.4): 
=



+
+= ),(,Mo 21
318
892
. 
 
OBS: É importante chamar a atenção para o fato de que nenhum dos valores coincide com o real valor 
modal, que é igual a 6,2. 
 
Comentário 
 
Nos exemplos anteriores é possível observar que as medidas calculadas para um conjunto de 
dados podem apresentar discrepância quando calculadas através de abordagens distintas. Para a 
distribuição de freqüências dos teores (%) de ácido palmítico observados em amostras de óleos vegetais, 
por exemplo, a média aritmética foi calculada como 8,54, para os dados agrupados, e 8,40 para os dados 
apenas ordenados. O mesmo ocorre com a mediana, que, por definição, é 8,25. Entretanto, para os 
mesmos dados, quando agrupados, a mediana é igual a 8,30. Para o cálculo da moda a diferença é ainda 
mais gritante, pois foram encontrados dois valores, 6,0 e 10,8, para a moda. Contudo, é fácil perceber que 
o valor em questão é igual a 6,2. 
 
Este tipo de ocorrência deve ser levado em consideração quando se opta pela apresentação, e 
tratamento, de dados na forma de distribuições de freqüências. O fácil acesso a programas 
computacionais e aplicativos pode tornar dispensável a construção de distribuições de freqüências, 
especialmente quando o interesse do estudo restringe-se aos resultados obtidos para as diferentes medidas 
aqui estudadas. Neste caso, a distribuição de freqüências pode ser usada apenas como meio de 
apresentação dos dados. 
 
 
 
 
 
Estatística – Notas de Aulas 
Professor Inácio Andruski Guimarães, DSc. 
21 
4.4 – Relação entre Média, Mediana e Moda 
 
A relação entre os valores encontrados para a média, para a mediana e para a moda indica o tipo 
de assimetria da distribuição de freqüências. Aqui entende-se por assimetria o grau de desvio dos dados 
em relação ao centro da distribuição. 
 
 
Figura 4.1 – Assimetria positiva (Mo < x~ < x ). 
 
 
Figura 4.2 – Assimetria negativa (Mo > x~ > x ). 
 
22
 
Figura 4.3 – Distribuição simétrica (normal) (Mo = x~ = x ). 
 
Na prática é comum obter distribuições de freqüências cujas medidas não apresentam nenhum dos 
comportamentos descritos, e ilustrados, nas Figuras 4.1 a 4.3. Neste caso recomenda-se excluir a moda 
nas relações mostradas acima, isto é, comparar apenas a média e a mediana. 
 
4.5 - Percentil 
 
O valor mediano é aquele que divide um conjunto de dados ordenados em duas partes iguais. Da 
mesma forma, também pode ser útil discriminar valores correspondentes a uma determinada 
percentagem. Este tipo de situação ocorre, por exemplo, quando se deseja determinar a renda familiar que 
define os 10% mais ricos em uma sociedade. 
 
Estatística – Notas de Aulas 
Professor Inácio Andruski Guimarães, DSc. 
22 
Para determinar certo percentil em um conjunto de dados é suficiente ordenar estes mesmos 
dados e localizar o elemento correspondente à fração desejada, de modo análogo ao usado para 
determinar a mediana. 
 
Exemplo 4.10 – Seja o conjunto de dados mostrado no Quadro 4.1. O 90o percentil é o valor que separa 
90% dos exemplares com menor largura dos 10% com a maior largura. Então, considerando que o 
conjunto tem n = 150 observações, basta separar os 15 últimos elementos, que são justamente os 
pertencentes à última coluna. Neste caso o 90o percentil é igual a 37. Isto significa que 90% dos 
exemplares apresentam largura inferior a 37 mm. 
 
Quadro 4.1 – Larguras (em mm) das sépalas 
observadas em 150 exemplares de flores íris. 
20 25 27 28 30 30 31 32 34 37 
22 25 27 28 30 30 31 32 34 37 
22 25 27 29 30 30 31 33 34 37 
22 25 28 29 30 30 31 33 34 38 
23 26 28 29 30 30 32 33 34 38 
23 26 28 29 30 30 32 33 35 38 
23 26 28 29 30 30 32 33 35 38 
23 26 28 29 30 30 32 33 35 38 
24 26 28 29 30 31 32 34 35 38 
24 27 28 29 30 31 32 34 35 39 
24 27 28 29 30 31 32 34 35 39 
25 27 28 29 30 31 32 34 36 40 
25 27 28 30 30 31 32 34 36 41 
25 27 28 30 30 31 32 34 36 42 
25 27 28 30 30 31 32 34 36 44 
Fonte: Fisher (1936). 
 
Para dados agrupados em distribuições de freqüências pode-se utilizar a fórmula dada por: 
 
hfP
fcapn
LIP Pp












−
+= 100
 (4.5) 
onde: 
 LIP = limite inferior da classe que contém o p–ésimo percentil, isto é, da classe cuja freqüência 
acumulada crescente é igual ou imediatamente superior a pn / 100. 
 fca = freqüência acumulada crescente da classe anterior à classe que contém o p–ésimo percentil. 
 fP = freqüência simples da classe que contém o p–ésimo percentil. 
 h = amplitude da classe que contém o p–ésimo percentil. 
 
Exemplo 4.11 – Calcular o 90o percentil e o 10o percentil para os dados da distribuição de freqüências dos 
dados mostrados no Quadro 4.1. 
 
Classes Largura (mm) Exemplares faci 
1 20 |-- 23 4 4 
2 23 |-- 26 15 19 
3 26 |-- 29 28 47 
4 29 |-- 32 47 94 
5 32 |-- 35 31 125 
6 35 |-- 38 13 138 
7 38 |--41 9 147 
8 41 |--| 44 3 150 
 Total 150 
 
Estatística – Notas de Aulas 
Professor Inácio Andruski Guimarães, DSc. 
23 
Neste caso: p = 90. Então 135
100
15090
=
×
. O valor procurado pertence à 6ª. classe, que tem freqüência 
acumulada crescente igual a 138. 
 
 LIP = 35 
 fca = 125 
 fP = 13 
 h = 38 – 35 = 3 
 
Substituindo na fórmula 4.5: 3,37)3(
13
1251353590 ≅


 −
+=P . 
 
O cálculo do 10o percentil é deixado como exercício. 
 
4.6 - Decil 
 
Esta medida é aplicada quando de deseja dividir um conjunto de dados ordenados em dez partes 
iguais. Não é difícil perceber que: 
 
D1 = P10 
D2 = P20 
D3 = P30 
... 
D9 = P90 
 
Exemplo 4.12 – Para os dados do Quadro 4.1, o quarto decil corresponde ao valor que separa quatro 
décimos, ou 40% dos valores. Para n = 150 observações, isto representa 60 valores, ou as quatro 
primeiras colunas. Então D4 = 30. 
 
4.7 - Quartil 
 
Esta medida divide um conjunto de dados ordenados em quatro partes iguais. Também é fácil 
perceber que: 
 
Q1 = P25 
Q2 = P50 
Q3 = P75 
 
Exemplo 4.13 – Para os dados do Quadro 4.1, o terceiro quartil é valor que separa o conjunto em duas 
partes, uma correspondente a 75% dos valores e outra correspondente a 25% dos valores. Como o 
conjunto possui 150 observações, e ¾ de 150 correspondem a 112,5, o elemento procurado é a média do 
112o e do 113o valores. Então o Q3 = 33 (verifique no próprio quadro !) 
 
 
 
4.8 - Exercícios 
 
4.8.1) O Quadro 3.1 foi utilizado para construir uma distribuição de freqüências no Exercício 3.12. 
Calcular, para a distribuição de freqüências obtida: 
 
1) Média. 
2) Mediana. 
3) Moda. 
4) Comparar os resultados obtidos com os reais valores. 
5) Estudar a assimetria da distribuição. 
6) Calcular o 10o e o 90o percentís. 
7) Calcular o 1o e o 4o quartís. 
 
 
Respostas: O quadro original é dado a seguir. 
Estatística – Notas de Aulas 
Professor Inácio Andruski Guimarães, DSc. 
24 
 
Quadro 3.1 – Comprimentos (mm) das sépalas 
observadas em 150 exemplares de flores íris. 
43 46 44 46 50 54 50 49 56 58 
44 47 44 48 56 55 51 57 61 59 
46 48 45 49 56 55 55 58 61 60 
46 50 48 50 56 55 56 60 62 62 
47 50 49 51 58 56 57 64 63 63 
48 51 49 52 59 57 57 64 63 63 
48 51 50 53 59 58 57 65 64 64 
49 51 50 55 60 60 58 65 64 65 
49 51 50 57 61 60 58 67 67 67 
50 52 51 63 61 60 61 68 69 67 
50 52 51 64 61 63 62 72 72 67 
51 54 52 65 62 66 63 73 72 68 
54 54 54 66 63 67 63 76 74 69 
54 57 55 69 64 67 65 77 77 69 
58 57 55 70 67 68 71 77 79 77 
Fonte: Fisher (1936). 
 
A distribuição de freqüências obtida é dada na tabela a seguir. 
 
Classe Comprimento (mm) Flores faci fadi fri Ponto médio 
1 43 |-- 47 9 9 150 0,0600 45 
2 47 |-- 51 23 32 141 0,1533 49 
3 51 |-- 55 19 51 118 0,1267 53 
4 55 |-- 59 28 79 99 0,1867 57 
5 59 |-- 63 20 99 71 0,1333 61 
6 63 |-- 67 23 122 51 0,1533 65 
7 67 |-- 71 16 138 28 0,1067 69 
8 71 |-- 75 6 144 12 0,0400 73 
9 75 |-- 79 6 150 6 0,0400 77 
 Total 150 
 
1) Média: x = 59,03 mm. 
2) Mediana: x~ = 58,43 mm. 
3) Moda: Mo = 57,12 mm. 
4) x = 55,42 mm. 
 
4.8.2) O Quadro 4.1 mostra os valores observados para as larguras (mm) das sépalas observadas nos 150 
exemplares mencionados nos exemplos anteriores. 
 
1) Construir uma distribuição de freqüências para os dados observados. 
2) Calcular a largura média. 
3) Calcular a largura mediana. 
4) Calcular a largura modal. 
5) Comparar os valores obtidos a partir da distribuição de freqüências com os valores obtidos 
diretamente no conjunto de dados. 
6) Estudar a assimetria da distribuição. 
7) Calcular o 10o e o 90o percentís. 
 
 
 
 
 
 
Estatística – Notas de Aulas 
Professor Inácio Andruski Guimarães, DSc. 
25 
Quadro 4.1 – Larguras (em mm) das sépalas 
observadas em 150 exemplares de flores íris. 
20 25 27 28 30 30 31 32 34 37 
22 25 27 28 30 30 31 32 34 37 
22 25 27 29 30 30 31 33 34 37 
22 25 28 29 30 30 31 33 34 38 
23 26 28 29 30 30 32 33 34 38 
23 26 28 29 30 30 32 33 35 38 
23 26 28 29 30 30 32 33 35 38 
23 26 28 29 30 30 32 33 35 38 
24 26 28 29 30 31 32 34 35 38 
24 27 28 29 30 31 32 34 35 39 
24 27 28 29 30 31 32 34 35 39 
25 27 28 29 30 31 32 34 36 40 
25 27 28 30 30 31 32 34 36 41 
25 27 28 30 30 31 32 34 36 42 
25 27 28 30 30 31 32 34 36 44 
Fonte: Fisher (1936). 
 
Respostas: 
1) A distribuição de freqüências fica: 
 
Classes Largura (mm) Exemplares 
1 20 |-- 23 4 
2 23 |-- 26 15 
3 26 |-- 29 28 
4 29 |-- 32 47 
5 32 |-- 35 31 
6 35 |-- 38 13 
7 38 |-- 41 9 
8 41 |--| 44 3 
 Total 150 
 
2) A largura média é: x = 31,02 mm. 
 
3) A largura mediana é: x~ = 30,78 mm. 
 
4) A largura modal é: Mo = 30,63 mm. 
 
0
10
20
30
40
50
20 - 23 23 - 26 26 - 29 29 - 32 32 - 35 35 - 38 38 - 41 41 - 44
 
Figura 4.4 – Histograma para os dados do Quadro 4.1. 
 
 
 
Estatística – Notas de Aulas 
Professor Inácio Andruski Guimarães, DSc. 
26 
5. MEDIDAS DE DISPERSÃO 
 
A principal utilidade das medidas de tendência central, quando calculadas para determinado conjunto 
de dados, é a determinação de valores característicos ou típicos deste conjunto. Entretanto, a informação 
fornecida por tais medidas é incompleta, se não for acompanhada de alguma informação sobre a 
variabilidade dos dados. Esta informação é obtida através do cálculo de medidas de dispersão, ou 
variabilidade. 
 
5.1 – Amplitude Total 
 
Seja um conjunto de dados ordenados {x(1) , x(2) , ... , x(n) }, onde x(1) e x(n) representam o valor 
mínimo e o valor máximo, respectivamente, do conjunto. A amplitude total é dada por: 
 
)1()( xxR n −= (5.1) 
 
Exemplo 5.1 – A amplitude total para o conjunto de dados do Quadro 4.1 é: R = 44 – 20 = 24 mm. 
 
Quadro 4.1 – Larguras (em mm) das sépalas 
observadas em 150 exemplares de flores íris. 
20 25 27 28 30 30 31 32 34 37 
22 25 27 28 30 30 31 32 34 37 
22 25 27 29 30 30 31 33 34 37 
22 25 28 29 30 30 31 33 34 38 
23 26 28 29 30 30 32 33 34 38 
23 26 28 29 30 30 32 33 35 38 
23 26 28 29 30 30 32 33 35 38 
23 26 28 29 30 30 32 33 35 38 
24 26 28 29 30 31 32 34 35 38 
24 27 28 29 30 31 32 34 35 39 
24 27 28 29 30 31 32 34 35 39 
25 27 28 29 30 31 32 34 36 40 
25 27 28 30 30 31 32 34 36 41 
25 27 28 30 30 31 32 34 36 42 
25 27 28 30 30 31 32 34 36 44 
Fonte: Fisher (1936). 
 
5.2 – Desvio Médio 
 
Seja um conjunto de dados {x1 , x2 , ... , xn }, não necessariamente ordenados. Então o desvio 
médio dos valores do conjunto em relação à sua média é dado por: 
 
n
xx
D
n
i
i∑
=
−
=
1
 (5.2) 
 
Exemplo 5.2 – O Quadro 5.1 mostra os teores (%) de vanádio encontrados em uma amostra de sete 
estratos de óleo cru extraídas de solo do tipo “Wilhelm sandstone”. 
 
Quadro 5.1 – Teores de vanádio. 
Estrato 1 2 3 4 5 6 7 
Teor (%) 3,9 2,7 2,8 3,1 3,5 3,9 2,7 
Fonte: Johnson e Wichern (1988) 
 
A média é 2286,3=x . O desvio médio é: 4612,0
7
2286,37,2...2286,39,3
=
−++−
=D . 
 
Estatística – Notas de Aulas 
Professor Inácio Andruski Guimarães, DSc. 
27 
Para uma distribuição de freqüências com k classes, com freqüências simples f1 , ... , fk , e pontos 
médios X1 , ... , Xk , respectivamente, o desvio médio é dado por: 
 
∑
∑
=
=
−
= k
i
i
k
i
ii
f
fxX
D
1
1 (5.3) 
 
Exemplo 5.3 – O desvio médio para a distribuição de freqüências dos dados do Quadro 4.1 é calculado 
como: 
A média é x = 31,02 mm. 
 
Classes Largura (mm) Exemplares Ponto Médio (Xi) | Xi – x | | Xi – x | fi 
1 20 |-- 23 4 21,5 9,52 38,082 23 |-- 26 15 24,5 6,52 97,80 
3 26 |-- 29 28 27,5 3,52 98,56 
4 29 |-- 32 47 30,5 0,52 24,44 
5 32 |-- 35 31 33,5 2,48 76,88 
6 35 |-- 38 13 36,5 5,48 71,24 
7 38 |-- 41 9 39,5 8,48 76,32 
8 41 |--| 44 3 42,5 11,48 34,44 
 Total 150 517,76 
 
Então 4517,3
150
76,517
=D . 
 
5.3 – Variância 
 
Seja um conjunto de dados {x1 , x2 , ... , xn }, não necessariamente ordenados. Assim como o 
desvio médio, a variância é gerada a partir das diferenças dos valores do conjunto de dados em relação à 
média do mesmo. Entretanto, é necessário ter em mente a natureza dos dados estudados, mais 
especificamente, se os mesmos constituem uma população ou uma amostra. Para o primeiro caso, e 
representando a média populacional por µ , a variância é dada por: 
 
( )
n
x
n
i
i∑
=
−
=
1
2
2
µ
σ . (5.4) 
 
A fórmula acima pode ser facilmente transformada para uma expressão mais simples, dada por: 
 
21
2
2 µσ −=
∑
=
n
x
n
i
i
 . (5.6) 
 
Quando o conjunto de dados {x1 , x2 , ... , xn } representa uma amostra, calcula-se o estimador 
corrigido para a variância amostral, dado por 
 
( )
1
1
2
2
−
−
=
∑
=
n
xx
s
n
i
i
 . (5.7) 
 
O estimador acima também costuma ser representado por 2σˆ , e a fórmula (5.7) pode ser transformada 
para 
 
11
2
1
2
2
−
−
−
=
∑
=
n
xn
n
x
s
n
i
i
 . (5.8) 
Estatística – Notas de Aulas 
Professor Inácio Andruski Guimarães, DSc. 
28 
 
Exemplo 5.4 – Calcular a variância para a amostra de teores de vanádio, mostrados no Quadro 5.1. 
 
Quadro 5.1 – Teores de vanádio. 
Estrato 1 2 3 4 5 6 7 
Teor (%) 3,9 2,7 2,8 3,1 3,5 3,9 2,7 
Fonte: Johnson e Wichern (1988) 
 
A média é 2286,3=x . Então, usando a fórmula (5.8): 
 
2833,0
6
97,72
6
7,74
17
)2286,3)(7(
17
7,2...7,29,3 22222
=−=
−
−
−
+++
=s . 
 
Para uma distribuição de freqüências com k classes, com freqüências simples f1 , ... , fk , e pontos 
médios X1 , ... , Xk , respectivamente, a variância populacional é dada por: 
 
2
1
1
2
2 µσ −=
∑
∑
=
=
k
i
i
k
i
ii
f
fX
 . (5.9) 
 
Para dados amostrais, o estimador corrigido é dado por 
 
11
2
1
2
2
−
−
−
=
∑
=
n
xn
n
fX
s
k
i
ii
 . (5.10) 
 
Exemplo 5.5 – Calcular a variância amostral para os dados da distribuição de freqüências dos dados do 
Quadro 4.1. 
 
Classes Largura (mm) Exemplares (fi) Ponto Médio (Xi) Xi2 Xi2fi 
1 20 |-- 23 4 21,5 462,25 1849 
2 23 |-- 26 15 24,5 600,25 9003,75 
3 26 |-- 29 28 27,5 756,25 21175 
4 29 |-- 32 47 30,5 930,25 43721,75 
5 32 |-- 35 31 33,5 1122,25 34789,75 
6 35 |-- 38 13 36,5 1332,25 17319,25 
7 38 |-- 41 9 39,5 1560,25 14042,25 
8 41 |--| 44 3 42,5 1806,25 5418,75 
 Total 150 147319,5 
 
A média é x = 31,02 mm. Então, usando a fórmula (5.10): 
 
0231,20
149
06,144336
149
5,147319
1150
)02,31)(150(
1150
5,147319 22
=−=
−
−
−
=s . 
 
Quando não tem à disposição uma planilha de cálculo, ou mesmo uma calculadora adequada, 
pode-se reduzir o esforço para calcular a variância. Isto é possível através das fórmulas (5.12) e (5.13), 
obtidas a partir das fórmulas (5.9) e (5.10), respectivamente. Para tanto basta efetuar a substituição de 
variável dada por: 
ii hdAX += . (5.11) 
 
Efetuada a substituição nas fórmulas (5.9) e (5.10), após convenientes manipulações algébricas obtém-se 
as fórmulas dadas por: 
 
Estatística – Notas de Aulas 
Professor Inácio Andruski Guimarães, DSc. 
29 


























−=
∑
∑
∑
∑
=
=
=
=
2
1
1
1
1
2
22
k
i
i
k
i
ii
k
i
i
k
i
ii
f
fd
f
fd
hσ (5.12) 
 














−






−
−
=
∑∑
==
)1(1
2
11
2
22
nn
fd
n
fd
hs
k
i
ii
k
i
ii
 (5.13) 
Nas fórmulas acima: 
A = ponto médio de uma classe de referência escolhida arbitrariamente (em geral escolhe-se a classe 
modal, isto é, a que possui a maior freqüência simples). 
h = amplitude de classe (deve ser igual para todas as classes). 
di = desvio da i-ésima classe em relação à classe escolhida como classe de referência. 
∑
=
=
k
i
ifn
1
. 
 
Exemplo 5.6 – Calcular a variância amostral para a distribuição de freqüências do exemplo anterior. 
 
Escolhendo, arbitrariamente, a quarta classe como classe de referência: 
 
Classes Largura (mm) Exemplares (fi) di difi di2fi 
1 20 |-- 23 4 - 3 - 12 36 
2 23 |-- 26 15 - 2 - 30 60 
3 26 |-- 29 28 - 1 - 28 28 
4 29 |-- 32 47 0 0 0 
5 32 |-- 35 31 1 31 31 
6 35 |-- 38 13 2 26 52 
7 38 |-- 41 9 3 27 81 
8 41 |--| 44 3 4 12 48 
 Total 150 26 336 
 
Lembrando que h = 3 e n = 150: 
 
[ ] 0232,200302,02550,29)1150)(150(
26
1150
336)3(
2
22
=−=





−
−
−
=s 
 
5.3.1 – Método Breve para o Cálculo da Média Aritmética 
 
A substituição (5.15) aplicada à fórmula da média, permite a seguinte transformação: 
 
∑
∑
=
=
= k
i
i
k
i
ii
f
fX
x
1
1
 ↔ 
∑
∑
=
=+= k
i
i
k
i
ii
f
fd
hAx
1
1
 (5.14) 
 
A fórmula (5.14) também é conhecida como Método Breve para o cálculo da média. 
 
5.4 – Desvio Padrão 
 
È dado pela raiz quadrada da variância. Deste modo, para o cálculo do desvio padrão, deve-se 
levar em consideração a natureza dos dados. È a medida de dispersão mais utilizada para a descrição de 
dados, juntamente com a média aritmética. 
Estatística – Notas de Aulas 
Professor Inácio Andruski Guimarães, DSc. 
30 
 
Seja o conjunto de dados {x1 , x2 , ... , xn }, não necessariamente ordenados. Se o conjunto 
representa uma população, o desvio padrão é dado por: 
 
21
2
µσ −=
∑
=
n
x
n
i
i
. (5.15) 
 
Se o conjunto representa uma amostra, o estimador corrigido é dado por: 
 
11
2
1
2
−
−
−
=
∑
=
n
xn
n
x
s
n
i
i
 . (5.16) 
 
Exemplo 5.7 – Calcular o desvio padrão para os dados do Quadro 5.1. 
 
Quadro 5.1 – Teores de vanádio. 
Estrato 1 2 3 4 5 6 7 
Teor (%) 3,9 2,7 2,8 3,1 3,5 3,9 2,7 
Fonte: Johnson e Wichern (1988) 
 
A média é 2286,3=x . Então, usando a fórmula (5.16): 
 
5323,02833,0
17
)2286,3)(7(
17
7,2...9,3 222
==
−
−
−
++
=s . 
 
5.4.1 – Desvio Padrão para Dados Agrupados em Distribuições de Freqüências 
 
Para uma distribuição de freqüências com k classes, com freqüências simples f1 , ... , fk , e pontos 
médios X1 , ... , Xk , respectivamente, o desvio padrão populacional é dado por: 
 
2
1
1
2
µσ −=
∑
∑
=
=
k
i
i
k
i
ii
f
fX
 . (5.17) 
 
O estimador corrigido para o desvio padrão amostral é dado por: 
 
11
2
1
2
−
−
−
=
∑
=
n
xn
n
fX
s
k
i
ii. (5.18) 
 
Para o cálculo do desvio padrão através das fórmulas (5.17) e (5.18) também é possível efetuar a 
mesma substituição de variável aplicada ao cálculo da variância. Neste caso as duas fórmulas são 
transformadas para: 
 
2
1
1
1
1
2












−=
∑
∑
∑
∑
=
=
=
=
k
i
i
k
i
ii
k
i
i
k
i
ii
f
fd
f
fd
hσ
 , (5.19) 
e 
)1(1
2
11
2
−






−
−
=
∑∑
==
nn
fd
n
fd
hs
k
i
ii
k
i
ii
 . (5.20) 
 
Estatística – Notas de Aulas 
Professor Inácio Andruski Guimarães, DSc. 
31 
5.5 – Coeficiente de Variação 
 
É definido como a razão entre o desvio padrão e a média, isto é 
 
x
sCV = (5.21) 
 
Exemplo 5.8 – Calcular o coeficiente de variação para os dados do Quadro 5.1. 
1649,0
2286,3
5323,0
==CV . 
 
5.6 – Exercícios 
 
5.6.1) Seja a distribuição de freqüências dos dados do Quadro 3.1, ou seja: 
 
Classe Comprimento (mm) Flores faci fadi fri Ponto médio 
1 43 |-- 47 9 9 150 0,0600 45 
2 47 |-- 51 23 32 141 0,1533 49 
3 51 |-- 55 19 51 118 0,1267 53 
4 55 |-- 59 28 79 99 0,1867 57 
5 59 |-- 63 20 99 71 0,1333 61 
6 63 |-- 67 23 122 51 0,1533 65 
7 67 |-- 71 16 138 28 0,1067 69 
8 71 |-- 75 6 144 12 0,0400 73 
9 75 |-- 79 6 150 6 0,0400 77 
 Total 150 
 
Calcular: 
1) O desvio padrão. 
2) O coeficiente de variação. 
 
5.6.2) Repetir o exercício anterior para os dados da distribuição de teores de ácido palmítico. 
 
Classe Teores de Ácido Palmítico (%) Observações (fi) 
1 3,8 |-- 5,0 9 
2 5,0 |-- 6,2 24 
3 6,2 |-- 7,4 21 
4 7,4 |-- 8,6 8 
5 8,6 |-- 9,8 6 
6 9,8 |-- 11,0 24 
7 11,0 |-- 12,2 21 
8 12,2 |-- 13,4 7 
 Total (n) 120 
 
Respostas: Desvio padrão: s = 2,6515 ; Coeficiente de variação: CV = 0,3123. 
 
6. ASSIMETRIA E CURTOSE 
 
Assimetria é o afastamento de uma distribuição em relação a um valor central. Curtose é o 
achatamento de uma distribuição. 
 
6.1 – Coeficiente de Assimetria 
 
Já foi visto que uma distribuição de freqüências pode ser assimétrica positiva, negativa ou 
simétrica, neste caso também chamada distribuição normal. Os três casos são ilustrados nas figuras a 
seguir. 
Estatística – Notas de Aulas 
Professor Inácio Andruski Guimarães, DSc. 
32 
 
Figura 4.1 – Assimetria positiva (Mo < x~ < x ). 
 
 
Figura 4.2 – Assimetria negativa (Mo > x~ > x ). 
 
22
 
Figura 4.3 – Distribuição simétrica (normal) (Mo = x~ = x ). 
 
O coeficiente de assimetria de Pearson mede o afastamento que caracteriza o tipo de assimetria. 
Este coeficiente é dado por: 
 
s
xx
ass
)~(3 −
= . (6.1) 
 
Exemplo 5.1 – Calcular o coeficiente de assimetria para os dados do Quadro 5.1. 
 
 
Depois de ordenados, os valores ficam: 
 
Quadro 5.1 – Teores de vanádio (ordenados) 
Estrato (1) (2) (3) (4) (5) (6) (7) 
Teor (%) 2,7 2,7 2,8 3,1 3,5 3,9 3,9 
Fonte: Johnson e Wichern (1988) 
 
A média é x = 3,2286 e o desvio padrão é s = 0,5323. A mediana é x~ = 3,1. Então: 
 
Estatística – Notas de Aulas 
Professor Inácio Andruski Guimarães, DSc. 
33 
7248,0
5323,0
)1,32286,3(3
=
−
=ass . 
 
6.2 – Coeficiente de Curtose 
 
O coeficiente de curtose mede o achatamento de uma distribuição de freqüências, em 
comparação com uma distribuição normal. Na prática só é calculado para distribuições simétricas, ou 
muito aproximadamente simétricas. O coeficiente percentílico de curtose é dado por: 
 
)(2 1090
2575
PP
PPC
−
−
= . (6.2) 
 
Para uma distribuição normal, o coeficiente de curtose é C = 0,263. Se o valor calculado para C é inferior 
a 0,263, diz-se que a distribuição é leptocúrtica (alongada). Se o valor é superior a 0,263, diz-se que a 
distribuição é platicúrtica (achatada). As três situações são ilustradas nas Figuras 6.1, 6.2 e 6.3. 
 
0
10
20
30
40
50
60
70
 
Figura 3.1 – Distribuição leptocúrtica. 
 
0
5
10
15
20
25
30
35
40
45
 
Figura 3.2 – Distribuição mesocúrtica. 
 
 
 
Estatística – Notas de Aulas 
Professor Inácio Andruski Guimarães, DSc. 
34 
0
5
10
15
20
25
30
 
Figura 3.3 – Distribuição platicúrtica. 
 
A caracterização do tipo de curtose auxilia na avaliação da dispersão dos dados do conjunto. 
Uma distribuição leptocúrtica possui dispersão baixa, enquanto uma distribuição platicúrtica possui 
dispersão elevada, tomando como referência a dispersão verificada em uma distribuição normal. 
 
6.3 – Exercícios 
 
6.3.1) Seja a distribuição de freqüências para os dados do Quadro 4.1. Isto é, 
 
Classes Largura (mm) Exemplares 
1 20 |-- 23 4 
2 23 |-- 26 15 
3 26 |-- 29 28 
4 29 |-- 32 47 
5 32 |-- 35 31 
6 35 |-- 38 13 
7 38 |-- 41 9 
8 41 |--| 44 3 
 Total 150 
 
Calcular: 
 
1) O coeficiente de assimetria de Pearson. 
2) O coeficiente percentílico de curtose. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Estatística – Notas de Aulas 
Professor Inácio Andruski Guimarães, DSc. 
35 
EXERCÍCIOS DE REVISÃO 
 
O Quadro 6.1 contém os teores de ácido oléico observados em 120 observações de óleos vegetais. 
 
22,3 25,1 26,8 30,4 34,8 52,2 
22,7 25,1 27 31 34,9 53,2 
22,8 25,2 27,1 31,1 35 54,6 
22,9 25,3 27,1 31,1 35 55,5 
23,1 25,3 27,1 31,1 35 55,9 
23,1 25,3 27,2 31,1 35,2 56,6 
23,2 25,5 27,4 31,1 35,2 57,2 
23,2 25,6 27,8 31,7 35,2 58 
24 25,7 28,3 31,7 35,4 58,2 
24,1 25,7 28,3 31,8 35,8 59 
24,1 25,8 28,3 31,8 37,4 59,1 
24,4 25,8 29,1 32,1 37,7 59,2 
24,4 25,9 29,4 32,6 38,4 59,2 
24,4 26 29,5 32,9 39,3 59,3 
24,5 26 29,6 33,6 39,7 61,6 
24,5 26,1 29,6 33,6 40,1 61,8 
24,6 26,1 29,8 33,9 41,4 62,6 
24,6 26,4 29,9 34 43 64,9 
24,7 26,5 30,3 34,4 43,3 77,8 
24,9 26,7 30,4 34,5 45,7 80,6 
 
1) Construir uma distribuição de freqüências para os dados. 
2) Traçar o histograma. 
3) Calcular a média aritmética. 
4) Calcular a mediana. 
5) Calcular a moda. 
6) Tanto a mediana como a moda podem ser obtidas diretamente no Quadro 6.1. Comparar os 
valores encontrados pela observação direta com os valores obtidos pelas fórmulas, nos exercícios 
4 e 5. 
7) Calcular o desvio padrão. 
8) Estudar a assimetria da distribuição. 
9) O cálculo do coeficiente de curtose é justificado para este conjunto de dados ? Por quê ? 
 
Algumas respostas: 
 
1) Amplitude total: R = 58,3; Número de classes: k = 1 + 3,3log(120) = 8 ; Amplitude de classe 
(R/n) : h = 7,3. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Estatística – Notas de Aulas 
Professor Inácio Andruski Guimarães, DSc. 
36 
7. TEORIA DA PROBABILIDADE 
 
As mais freqüentes aplicações da estatística envolvem processos de tomada de decisões sob 
condições de incerteza. Este tipo de situação ocorre, por exemplo, em processos de inspeção de qualidade. 
Aqui o tomador de decisões deve decidir, após inspecionar uma amostra, se um lote de certo produto está 
conforme parâmetros de qualidade previamente definidos. Neste caso a incerteza decorre de fatores como 
tamanho da amostra, representatividade da mesma e método de inspeção, entre outros. Esta incerteza é 
tratada pela estatística com o auxílio da teoria da probabilidade. Na seqüência apresenta-se uma breve 
revisão dos principais conceitos envolvidos no estudo desta teoria. 
 
7.1– Teoria dos Conjuntos 
 
7.1.1 – Conjunto. 
 
 É o termo empregado para designar uma lista, ou coleção, bem definida de elementos. Um 
conjunto é representado por letra maiúscula, enquanto seus elementos são representados por letras 
minúsculas. Se um elemento x pertence a um conjunto C, escreve-se Cx ∈ . Caso contrário, Cx ∉ . 
 
 Diz–se que um conjunto A está contido em outro conjunto B, se todos os elementos de A 
pertencem também ao conjunto B. Neste caso escreve-se BA ⊂ , ou AB ⊃ . A negação para a 
primeira representação é BA ⊄ . 
 
 Há duas formas de se representar um conjunto. Pode-se listar os seus elementos ou utilizar uma 
representação gráfica conhecida como Diagrama de Venn. Seja por exemplo o conjunto C, de todos os 
resultados observáveis no lançamento de um dado. Então: 
 
C = { 1 , 2 , 3 , 4 , 5 , 6 } 
 
 
1 2 3 4 5 6 
 
 
 
Se um conjunto V não possui quaisquer elementos, diz-se que o mesmo é vazio. Neste caso pode-
se representar como V = { } ou V = Ø. 
 
7.1.2 – Operações com Conjuntos 
 
Sejam A, B e C três conjuntos arbitrários. São definidas as seguintes operações: 
 
7.1.2.1 – União 
 
 A união dos conjuntos A e B é o conjunto formado por todos os elementos que pertencem a A ou 
a B. 
}:{ BxAxxBA ∈∨∈=∪ . 
 
Exemplo 7.1 – Seja os conjuntos A = {1,2,3,4,5,6,7,8,9} e B = {7,8,9,10,11,12}. Então a união de A e B 
resulta no conjunto }12,11,10,9,8,7,6,5,4,3,2,1{=∪ BA . 
 
7.1.2.2 – Intersecção 
 
 A intersecção dos conjuntos A e B é o conjunto formado por todos os elementos que pertencem a 
A e a B. 
}{ BxAxBA ∈∧∈=∩ . 
 
Exemplo 7.2 – A intersecção dos conjuntos A e B do exemplo anterior resulta no conjunto 
}9,8,7{=∩ BA . 
 
Estatística – Notas de Aulas 
Professor Inácio Andruski Guimarães, DSc. 
37 
7.1.2.3 – Diferença 
 
A diferença dos conjuntos A e B é o conjunto de elementos de que pertencem ao conjunto A, mas 
não ao conjunto B. 
 
}:{\ BxAxxBA ∉∧∈= . 
 
Se BA ⊂ , diz-se que B \ A é o complemento de A em relação a B. 
 
 
 
 
B A 
 
 
 
 
Exemplo 7.3 – A diferença dos conjuntos A e B dos exemplos anteriores resulta no conjunto 
 
}6,5,4,3,2,1{\ =BA . 
 
Exemplo 7.4 – Sejam os conjuntos X = {2,3,4,5,6,7} e Y = {4,5,6}. Então o complemento de Y em relação 
a X é X \ Y = {2,3,7}. 
 
7.1.3 – Conjuntos Finitos e Enumeráveis 
 
Diz-se que um conjunto A é finito quando é formado por n elementos, onde n é um número 
inteiro positivo. Diz-se que um conjunto é enumerável quando é possível atribuir uma seqüência aos seus 
elementos. 
 
Exemplo 7.5 – Seja X o conjunto de todos os possíveis resultados observáveis no lançamento de um dado. 
Neste caso, X = {1,2,3,4,5,6} é finito e enumerável. 
 
Exemplo 7.6 – Seja I o conjunto de todos os números reais compreendidos entre 0 e 1. Então o conjunto 
dado por I = {x : 0 < x < 1} não é finito e nem enumerável. 
 
Exemplo 7.7 – Seja P o conjunto de todos os números inteiros positivos ímpares. Então o conjunto dado 
por P = {1,3,5,...} é infinito e enumerável. 
 
7.1.4 – Produto Cartesiano 
 
Sejam dois conjuntos, A e B. O produto cartesiano de A e B, representado por A × B é o conjunto 
de todos os pares ordenados (x , y) onde x pertence a A e y pertence a B. 
 
}:),{( ByAxyxBA ∈∧∈=× 
 
Exemplo 7.8 – Sejam os conjuntos A = {2,4,6} e B = {5,7}. Então o produto cartesiano é o conjunto dado 
por A × B = {(2,5) , (2,7) , (4,5) , (4,7) , (6,5) , (6,7)}. 
 
7.1.5 – Classes 
 
Há situações nas quais os elementos de um conjunto também são conjuntos. Seja por exemplo o 
conjunto dos números naturais, IN. O subconjunto de todos os múltiplos de 7 forma um conjunto. Seja um 
conjunto A. Uma classe de A é um conjunto de subconjuntos de A. 
 
Exemplo 7.9 – Seja o conjunto A = {1,2,3,4,5,6,7,8,9,10}. Algumas classes de A são dadas por: 
 
[{1,3,5,7,9} , {2,4,6,8,10} , {1,2,3,4}] , [{1,3,5} , {7,9} , {2,4} , {6,8,10}] , [{1},{3},{5},{7},{9}]. 
 
Estatística – Notas de Aulas 
Professor Inácio Andruski Guimarães, DSc. 
38 
7.1.5.1 – Classe Indexada 
 
Em algumas situações utiliza-se a expressão classe indexada de conjuntos, cuja notação 
geralmente é }:{ IiAi ∈ . Neste caso deseja-se esclarecer que a cada elemento i de I corresponde um 
conjunto A i . O conjunto I é chamado conjunto dos índices, e os conjuntos A i são os conjuntos indexados 
por I. Quando I é subconjunto do conjunto IN, dos números naturais, a classe indexada {A1 , A2 , ... } é 
chamada seqüência de conjuntos. 
 
O conjunto de elementos, cada um dos quais pertencente a pelo menos um conjunto A
 i , é 
chamado união dos A
 i , e pode ser representado por iIi A∈U . 
 
O conjunto de elementos, cada um dos quais pertencente a todos os conjuntos A
 i , é chamado 
intersecção dos A
 i , e pode ser representado por iIi A∈I . 
 
7.1.6 – Partição 
 
Seja um conjunto A. Uma partição é uma classe de subconjuntos não vazios e disjuntos deste 
conjunto. 
 
Exemplo 7.10 – Seja o conjunto D = {2,3,4,5,7,8,9}. Uma partição de D é [{2,3,4} , {5,7} , {8,9}]. Por 
outro lado, a classe [{2,3,4} , {4,5,7} , {8,9}] não é uma partição, pois o elemento “4” pertence a dois 
subconjuntos. 
 
7.1.7 – σ – Álgebra 
 
Sejam um conjunto A e uma classe A não vazia de subconjuntos de iIi A∈U . Diz-se que A é 
uma σ – álgebra se: 
 
1. O complemento de qualquer conjunto de A pertence a A. 
2. A união de um número finito, e enumerável, de conjuntos de A pertence a A. 
 
7.2 – Técnicas de Contagem 
 
 De acordo com o princípio fundamental da contagem, se um procedimento pode ser executado 
de m modos possíveis, e um segundo procedimento pode ser executado de n modos possíveis, então o 
número de modos pelos quais é possível executar os dois procedimentos é m.n . 
 
Exemplo 7.11 – Seja um experimento que consiste em lançar um dado e, na seqüência, uma moeda. Então 
o número de possíveis resultados é 6.2 = 12. 
 
Exemplo 7.12 – Quantas placas com três letras seguidas de quatro algarismos podem ser confeccionadas, 
sabendo que nenhuma placa possui quatro algarismos iguais a zero ? 
 
Neste caso pode-se considerar que há 26 letras disponíveis (incluindo k, w e y) e 10 algarismos, 0 , ... , 9. 
Como nenhuma placa pode ter quatro algarismos iguais a zero, para a última posição há nove algarismos 
possíveis. Então o total de placas possíveis é: 26 × 26 × 26 × 10 × 10 × 10 × 9 = 158 184 000 
 
7.2.1 – Fatorial 
 
Seja n um número inteiro positivo. O fatorial de n é dado por: 
 
1)...2)(1(! −−= nnnn . (7.1) 
 
É possível demonstrar que 0 ! = 1. 
 
Exemplo 7.13 – 5 ! = 5.4.3.2.1 = 120 ; 8 ! / 6 ! = (8.7.6 !) / 6 ! = 8.7 = 56. 
 
 
Estatística – Notas de Aulas 
Professor Inácio Andruski Guimarães, DSc. 
39 
7.2.2 – Coeficiente Binomial 
 
Sejam dois números inteiros positivos n e p, tais que p ≤ n. Então o coeficiente binomial de n 
sobre p é dado por: 
 
!)(!
!
pnp
n
p
n
−
=





 . (7.2) 
 
Exemplo 7.14 – 21
2
42
1.2
6.7
1.2!5
!5.6.7
!2!5
!7
)!57(!5
!7
5
7
=====
−
=





 
 
Propriedades: 
 
P1: 10
=




n
. 
 
P2: n
n
=





1
. 
 
P3: 1=





n
n
. 
P4: Se p + q = n , então 





=





q
n
p
n
. 
 
7.2.3 – Permutação 
 
A disposição dos elementos de um conjunto seguindo certa ordem é chamada permutação. O 
total de permutações que pode efetuar com n elementos é dado por 
 
!nPn = .(7.3) 
 
Exemplo 7.15 – Seja o conjunto X = {2,4,6}. As possíveis permutações com os três elementos são: 
 
246 , 426 , 462 , 264 , 624 , 642. Total: 3 ! = 3.2.1 = 6. 
 
7.2.4 – Arranjo 
 
Sejam n elementos. Uma permutação de p, p ≤ n, destes elementos, de acordo com determinada 
ordem, é denominada arranjo. O número de arranjos de n elementos, tomados p a p, é dado por: 
 
!)(
!
, pn
nA pn
−
= . (7.4) 
 
Exemplo 7.16 – Sejam os algarismos 1 , 2 , ... , 8 , 9. Quantos números com três dígitos podem ser 
formados a partir dos algarismos dados ? 
 
5047.8.9
!6
!6.7.8.9
!6
!9
3,9 ====A . 
 
OBS: Alguns autores não fazem distinção entre permutação e arranjo, preferindo utilizar apenas a 
primeira expressão. 
 
Estatística – Notas de Aulas 
Professor Inácio Andruski Guimarães, DSc. 
40 
7.2.5 – Permutação com Repetição 
 
Há situações nas quais alguns dos n elementos com os quais deseja-se efetuar um arranjo são 
iguais. Então, se n1 , n2 , ... , nr são iguais, o número de permutações é dado por: 
 
!...!!
!
21 rnnn
n
 . (7.5) 
 
Exemplo 7.17 – De quantos modos é possível arranjar as letras da palavra PARANÁ ? 
 
120
!3
!3.4.5.6
!3
!6
==
 
 
7.2.6 – Combinação 
 
Sejam n elementos. Uma disposição de p, p ≤ n, destes elementos, sem levar em consideração a 
ordem, é denominada combinação. O número de combinações de n elementos, tomados p a p, é dado por: 
 






=
p
n
C pn , . (7.6) 
 
Exemplo 7.18: Sejam os algarismos 1 , 2 , ... , 8 , 9. Quantas combinações com três dígitos podem ser 
formadas a partir dos algarismos dados ? 
 
Neste caso considera-se que 567 e 675, por exemplo, são uma só combinação, já que a ordem é 
irrelevante. Então o total de combinações é dado por: 
 
84
!6.1.2.3
!6.7.8.9
!6!3
!9
3,9 ===C . 
 
7.2.7 – Exercícios 
 
7.2.7.1) Arme e efetue: 
 
a) 6 ! 
b) 8 ! 
c) 





6
8
 
d) 





2
8
 
e) 












2
7
5
7
 
 
7.2.7.2) Uma loteria consiste em 60 números, numerados de 1 a 60, entre os quais o apostador deve 
escolher seis. De quantos modos é possível escolher os seis números ? 
 
7.2.7.3) Quantos anagramas é possível formar com as letras da palavra ESTATÍSTICA ? 
 
7.2.7.4) Um baralho completo possui 52 cartas, divididas em quatro grupos iguais (naipes). Deste baralho 
são retiradas cinco cartas. Quantos resultados são possíveis ? 
 
Estatística – Notas de Aulas 
Professor Inácio Andruski Guimarães, DSc. 
41 
7.3 – Introdução à Probabilidade 
 
As origens da teoria da probabilidade remontam a meados do século 17. Os conceitos 
fundamentais, como probabilidade e esperança matemática, surgiram nas correspondências trocadas 
entre Pascal e Fermat, e que geralmente tratavam de jogos de azar. De acordo com Gnedenko (1962), as 
questões então levantadas não faziam parte do escopo da matemática da época. O desenvolvimento da 
teoria da probabilidade, observado nos séculos subseqüentes, foi impulsionado em grande parte pelas 
necessidades das ciências naturais. A abordagem matemática, caracterizada pelo rigor formal, teve início 
em meados do século 19, prolongando-se até meados do século 20. As aplicações da teoria da 
probabilidade podem ser observadas em praticamente qualquer área de pesquisa, seja através da 
modelagem de experimentos aleatórios, ou através da aplicação de testes estatísticos fundamentados em 
conceitos da mencionada teoria. 
 
Embora não haja uma definição formal para o termo probabilidade, pode-se entender que o 
mesmo designa o estudo de experimentos aleatórios, isto é, experimentos cujos resultados estão sujeitos 
ao acaso. Alguns conceitos necessários ao referido estudo são apresentados a seguir. 
 
7.3.1 – Espaço Amostral e Evento 
 
Seja um experimento aleatório realizado sob condições fixas. Chama-se espaço amostral do 
experimento o conjunto Ω de todos os resultados observáveis para o experimento. Chama-se evento a 
qualquer subconjunto E, de Ω. Vale lembrar que um espaço amostral pode conter mais de um evento. 
Neste caso é possível combinar eventos através de operações com conjuntos, isto é: 
 
1. Evento união: BA ∪ . 
2. Evento intersecção: BA ∩ . 
3. Evento complementar: CA (só ocorre quando A não ocorre). 
 
Exemplo 7.19 – Um exemplo de experimento aleatório é o lançamento de um dado. Neste caso o espaço 
amostral correspondente é o conjunto Ω = {1 , 2 , 3 , 4 , 5 , 6}. Um exemplo de evento é o subconjunto de 
Ω dado por E = {2 , 4 , 6}, que corresponde ao resultado “número par”. 
 
Exemplo 7.20 – Imagine-se que um experimento aleatório consiste em registrar o tempo t, em horas, entre 
falhas apresentadas por determinado equipamento. Então Ω = {t ∈ IR ; 0 < t}. Não é difícil perceber que 
este espaço amostral contém resultados claramente impossíveis. Entretanto, na definição de um espaço 
amostral, deve-se ter a preocupação de definir um conjunto que contenha todos os possíveis resultados 
para o experimento aleatório em questão. Neste sentido, a escolha do conjunto acima é bastante adequada. 
 
7.3.1.1 – Eventos Mutuamente Exclusivos 
 
Sejam A e B eventos de um espaço amostral Ω. Diz-se que A e B são eventos mutuamente 
exclusivos se, e somente se, A e B são disjuntos. 
 
Exemplo 7.21 – O espaço amostral associado ao lançamento de um dado é Ω = {1 , 2 , 3 , 4 , 5 , 6}. Não é 
difícil perceber que os eventos A = {número par} = {2 , 4 , 6} e B = {número ímpar} = {1 , 3 , 5} são 
mutuamente exclusivos. 
 
7.3.2 – Enfoques 
 
Para a formalização do conceito de probabilidade pode-se adotar um de três enfoques: 
 
7.3.2.1 – Enfoque Clássico 
 
Também conhecido como definição clássica de probabilidade, estabelece que, se Ω é um espaço 
amostral finito, então a probabilidade de qualquer evento E, contido em Ω, é dada por 
 
)(#
)(#)(
Ω
=
EEP . (7.8) 
 
Estatística – Notas de Aulas 
Professor Inácio Andruski Guimarães, DSc. 
42 
7.3.2.2 – Enfoque Relativo 
 
De acordo com este enfoque, a probabilidade de um evento E é dada pela razão entre o total de 
ocorrências do evento e o total de observações. De outra forma, a probabilidade de ocorrência é igual à 
proporção de “sucessos”. Neste caso o cálculo da probabilidade está baseado na coleta de observações, 
razão pela qual este enfoque também é denominado enfoque empírico. 
 
Exemplo 7.22 – Se, numa entrevista com 200 eleitores, observou-se que 120 pretendem votar em 
determinado candidato, então a probabilidade encontrar um eleitor daquele candidato é p = 0,6. 
 
7.3.2.3 – Enfoque Subjetivo 
 
Também chamado personalístico, é baseado no “grau de crença” na ocorrência do evento em 
questão. Atualmente, é muito aplicado à tomada de decisões em finanças e mercado de capitais, por 
exemplo. 
 
7.3.3 – Axiomas de Probabilidade 
 
A1: Para qualquer evento E de um espaço amostral Ω: 0 ≤ P(E) ≤ 1. 
 
A2: P(Ω) = 1. 
 
A3: Se A e B são eventos mutuamente exclusivos, então )()()( BPAPBAP +=∪ . 
 
7.3.4 – Teoremas de Probabilidade 
 
T1: )(1)( APAP C −= . T2: )()( BPAPBA ≤⇒⊂ . 
 
T3: )()()\( BAPAPBAP ∩−= . T4: )()()()( BAPBPAPBAP ∩−+=∪ . 
 
7.3.5 – Espaço de Probabilidade 
 
Seja Ω um espaço amostral finito, isto é, Ω = {e1 , e2 , ... , en }. Um espaço de probabilidade é o 
conjunto P = {p1 , p2 , ... , pn } , obtido ao associar-se a cada ei ∈ Ω um valor pi ∈ IR, denominado 
probabilidade de ei

Outros materiais