Buscar

Apostila Estatística Descritiva

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 36 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 36 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 36 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

UNIVERSIDADE FEDERAL DO PARÁ 
FACULDADE DE ESTATÍSTICA - CURSO DE BACHARELADO EM ESTATÍSTICA 
ESTATÍSTICA DESCRITIVA – Profa. Dra. Silvia dos S. de Almeida 
 
1
 
 
 
APOSTILA 
DE 
ESTATÍSTICA DESCRITIVA 
 
 
 
 
 
 
 
Profa. Silvia dos Santos de Almeida, Dra. 
 
 
 
 
 
 
Belém – Dezembro de 2012 
 
 
UNIVERSIDADE FEDERAL DO PARÁ 
FACULDADE DE ESTATÍSTICA - CURSO DE BACHARELADO EM ESTATÍSTICA 
ESTATÍSTICA DESCRITIVA – Profa. Dra. Silvia dos S. de Almeida 
 
2
 
DISCIPLINA: (EN 0707) Estatística Descritiva - CH Semestral:90 h 
 
Plano de Ensino - 2º Semestre/2012 
 
 
EMENTA: Conceitos Fundamentais, Fases do Trabalho Estatística, Medidas de Tendência Central, 
Medidas de Dispersão, Momentos, Assimetria e Curtose, Correlação Linear Simples, ajustamento, 
Números Índices. 
 
 
OBJETIVO: Possibilitar ao aluno o entendimento e a aplicação de técnicas estatísticas na análise 
de dados. 
 
 
PROCEDIMENTOS DIDÁTICOS: aulas expositivas com uso de quadro negro/ e ou outros 
recursos didáticos, além de aulas práticas no Computador e resolução de lista de exercícios. 
 
 
IBGE. Centro de Documentação e Disseminação de Informação. Normas de apresentação 
tabular/Fundação Instituto Brasileiro de Geografia e Estatística, Centro de Documentação e 
Disseminação de Informações. 3ª Ed. Rio de Janeiro, 1993. 62 p. 
 
 
 
 
 
 
 
 
 
 
 
UNIVERSIDADE FEDERAL DO PARÁ 
FACULDADE DE ESTATÍSTICA - CURSO DE BACHARELADO EM ESTATÍSTICA 
ESTATÍSTICA DESCRITIVA – Profa. Dra. Silvia dos S. de Almeida 
 
3
 
1. Alguns Conceitos Importantes 
 
1.1 - Estatística 
 A literatura de estatística apresenta várias definições de Estatística, desde as mais simples 
até as mais complexas. Como por exemplo, a apresentada em Dugé de Bernonville, que julga-se ser 
simples e fácil de ser memorizada: 
“Estatística é um conjunto de métodos e processos quantitativos que serve para estudar e medir 
os fenômenos coletivos”. 
 Ou ainda Estatística é a ciência que se preocupa com coleta, análise, interpretação e 
apresentação dos dados, permitindo-nos a obtenção de conclusões válidas a partir destes dados, 
bem como a tomada de decisões razoáveis baseadas nessas conclusões. Didaticamente está 
dividida em duas partes: 
1.1.1 - Estatística Descritiva 
É aquela que se preocupa com a coleta, análise, interpretação e apresentação dos dados 
estatísticos. 
1.1.2 - Estatística Indutiva 
Também conhecida como amostral ou inferencial, é aquela que partindo de uma amostra, 
estabelece hipóteses sobre a população de origem e formula previsões fundamentando-se na teoria 
das probabilidades. 
1.2 - População 
 É todo conjunto, finito ou infinito, em um determinado período de tempo, que possui ao 
menos uma característica em comum entre todos os seus elementos componentes. Onde os estudos 
destas populações podem ser feito de duas formas: 
a) Censo: É a coleta exaustiva das informações de todas as “N” unidades da população. 
b) Amostra: É um subconjunto, uma parte selecionada da totalidade de observações abrangidas 
pela população da qual se quer inferir alguma coisa. 
 
1.3 - Amostragem 
 É o processo ou técnica de coleta das informações de parte da população - “n” - chamada 
amostra, mediante métodos adequados de seleção destas unidades. 
 
UNIVERSIDADE FEDERAL DO PARÁ 
FACULDADE DE ESTATÍSTICA - CURSO DE BACHARELADO EM ESTATÍSTICA 
ESTATÍSTICA DESCRITIVA – Profa. Dra. Silvia dos S. de Almeida 
 
4
 
1.6 - Experimento Aleatório 
 É quando efetuamos um experimento repetidas vezes, sob condições praticamente idênticas, 
e obtemos resultados que não são essencialmente os mesmos. 
 
Exemplo: Na jogada de uma moeda o resultado do experimento é o aparecimento de uma “cara” ou 
uma “coroa”. 
 
1.7 - Variável 
É o conjunto de resultados possíveis de um fenômeno (resposta), ou ainda é (ou são) a (as) 
característica(s) da população que se pretende conhecer. E didaticamente pode classificar conforme 
Quadro 1 a seguir: 
Quadro 1: Esquema de classificação de variáveis. 
Variável 
Qualitativa Nominal Ordinal 
Quantitativa Discreta Contínua 
 
 
1.7.1 - Variáveis Qualitativas 
É quando obtemos como resposta palavras. Se existir uma ordem natural nas respostas, 
dizemos que a variável é qualitativa ordinal, caso contrario, ela é dita variável qualitativa nominal. 
 
Exemplos: 
A Intenção de voto a um determinado candidato (A), a resposta (variável) é sim ou não. 
Avaliação dos alunos, a resposta (variável) é: Insuficiente, Regular, Bom e Excelente. 
 
1.7. 2 - Variáveis Quantitativas 
 É quando obtemos como resposta números. Podem ser ditas Discretas, quando obtidas através 
de contagem ou Contínuas quando obtidas através de medições. 
 
Exemplos: 
 Número de filhos. (discreta) 
Temperatura numa cidade. (continua) 
 
 
UNIVERSIDADE FEDERAL DO PARÁ 
FACULDADE DE ESTATÍSTICA - CURSO DE BACHARELADO EM ESTATÍSTICA 
ESTATÍSTICA DESCRITIVA – Profa. Dra. Silvia dos S. de Almeida 
 
5
 
Exercício: 
1. Classifique as variáveis abaixo: 
a) Número de filhos dos funcionários de uma escola. 
b) Altura dos estudantes da turma A do Ensino Fundamental de uma escola. 
c) Cor dos cabelos dos alunos de uma faculdade. 
d) Salário dos professores de uma escola. 
e) Número de indivíduos nas famílias dos moradores de um conjunto residencial. 
f) Estado civil dos funcionários de uma escola. 
g) Comprimento dos pregos produzidos por uma máquina. 
h) Número de peças defeituosas fabricadas por uma máquina diariamente. 
 
1.8 – Parâmetro: São valores singulares que existem na população e que servem para caracterizá-
la. Para definirmos um parâmetro devemos examinar toda a população. 
Exemplo: Os alunos do 2º ano da FACEV têm em média 1,70 metros de estatura. 
 
1.9. Estimativa: é um valor aproximado do parâmetro e é calculado com o uso da amostra. 
Exemplo: com base em uma amostra obteve-se que a estatura média dos alunos do 2º ano da 
FACEV é de 1,70. 
 
1.10. Estimador: é a forma de se obter a estimativa. 
Exemplo: .,,2,1,1 ni
n
x
média
n
i
i
L==
∑
=
 
 
 
1.11- Arredondamentos de Números 
Conforme IBGE (1993) as regras de arredondamento são: 
 
Regra 1 - Quando o primeiro algarismo a ser abandonado for: 0, 1, 2, 3 e 4. Fica inalterado o último 
algarismo a permanecer. 
Exemplo - arredondar para uma casa decimal os números: 
 53,24 → 53,2 ; 88,01 → 80,0 ; 10,43 → 10,4 
 
 
UNIVERSIDADE FEDERAL DO PARÁ 
FACULDADE DE ESTATÍSTICA - CURSO DE BACHARELADO EM ESTATÍSTICA 
ESTATÍSTICA DESCRITIVA – Profa. Dra. Silvia dos S. de Almeida 
 
6
Regra 2 - Quando o primeiro algarismo a ser abandonado for: 5 , 6, 7, 8 ou 9. Aumenta-se uma 
unidade no algarismo a permanecer. 
Exemplo - arredondar para uma casa decimal os números: 
 53,25 → 53,3 ; 88,09 → 88,1 ; 10,47 → 10,5 
 
Observação - Não se deve fazer arredondamentos sucessivos, se houver necessidade de um novo 
arredondamento, fica recomendado a volta aos dados originais. 
2. FASES DO TRABALHO ESTATÍSTICO 
2.1 - FASES DO MÉTODO ESTATÍSTICO 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1º - DEFINIÇÃO DO PROBLEMA: Saber exatamente aquilo que se pretende pesquisar é o 
mesmo que definir corretamente o problema. 
 
PLANEJAMENTO 
COLETA DE DADOS 
CRITICA DOS DADOS 
APURAÇAO DOS DADOS 
EXPOSIÇAO DOS DADOS 
ANALISE E 
DIVULGAÇAO DOS 
RESULTADOS 
Definição do 
Problema 
Método Estatístico – fluxograma 
 
 
UNIVERSIDADE FEDERAL DO PARÁ 
FACULDADE DE ESTATÍSTICA - CURSO DE BACHARELADO EM ESTATÍSTICA 
ESTATÍSTICADESCRITIVA – Profa. Dra. Silvia dos S. de Almeida 
 
7
2º - PLANEJAMENTO: Como levantar informações? Que dados deverão ser obtidos? Qual 
levantamento a ser utilizado? Censitário? Por amostragem? E o cronograma de atividades? Os 
custos envolvidos? etc. 
 
3º - COLETA DE DADOS: Fase operacional. É o registro sistemático de dados, com um objetivo 
determinado. 
 
Dados primários: quando são publicados pela própria pessoa ou organização que os tenha 
recolhido. Ex: tabelas do censo demográfico do IBGE. 
 
Dados secundários: quando são publicados pro outra organização. Ex: quando determinado jornal 
publica estatísticas referentes ao censo demográfico extraídas do IBGE. 
 
OBS: É mais seguro trabalhar com fontes primárias. O uso da fonte secundária traz o grande risco 
de erros de transcrição. 
 
Coleta Direta: quando é obtida diretamente da fonte. A coleta direta pode ser: contínua (registros 
de nascimento, óbitos, casamentos, etc.), periódica (recenseamento demográfico, censo industrial) e 
ocasional (registro de casos de dengue). 
 
Coleta Indireta: É feita por deduções a partir dos elementos conseguidos pela coleta direta, por 
analogia, por avaliação, indícios ou proporcionalidade. 
 
Instrumento de Coleta: é um instrumento para levantar informações a que se deve responder sem a 
interferência do avaliador/pesquisador (Questionário). Geralmente usa-se o termo “questionário” 
para designar qualquer instrumento de coleta de informações. No entanto, quando este instrumento 
é preenchido pela população-alvo da avaliação o termo técnico para designá-lo é “Formulário”. 
 
4º - APURAÇÃO DOS DADOS: Resumo dos dados através de sua contagem e agrupamento. É a 
condensação e tabulação de dados. 
 
5º - APRESENTAÇÃO DOS DADOS: Há duas formas de apresentação, que não se excluem 
mutuamente. A apresentação tabular, ou seja, é uma apresentação numérica dos dados em linhas e 
colunas distribuídas de modo ordenado, segundo regras práticas fixadas pelo Conselho Nacional de 
Estatística. A apresentação gráfica dos dados numéricos constitui uma apresentação geométrica 
permitindo uma visão rápida e clara do fenômeno. 
 
6º - ANÁLISE E INTERPRETAÇÃO DOS DADOS: A última fase do trabalho estatístico é a mais 
importante e delicada. Está ligada essencialmente ao cálculo de medidas e coeficientes, cuja 
finalidade principal é descrever o fenômeno (estatística descritiva). Na estatística indutiva as 
interpretações dos dados se fundamentam na teoria da probabilidade. 
 
 
 
UNIVERSIDADE FEDERAL DO PARÁ 
FACULDADE DE ESTATÍSTICA - CURSO DE BACHARELADO EM ESTATÍSTICA 
ESTATÍSTICA DESCRITIVA – Profa. Dra. Silvia dos S. de Almeida 
 
8
3. MEDIDAS DE TENDÊNCIA CENTRAL. 
 
Torna-se necessário, após a tabulação dos resultados e da representação gráfica, encontrar valores 
que possam representar a distribuição como um todo. São as chamadas medidas de tendência 
central ou medidas de posição. 
 
I - CONCEITO: as medidas de posição ou também conhecidas como medidas de tendência central 
compõem-se de um número que representa um conjunto particular de informações. Geralmente se 
localizam em torno do centro da distribuição, onde a maior parte das observações tende a concentra-
se. 
 
3.1 - MÉDIA ARITMÉTICA ( X ): consiste em somar todas as observações ou medidas 
dividindo-se o resultado pelo número total de valores. Didaticamente têm-se duas formas de 
calcular uma média aritmética: 
 
1º Caso - Quando se estiver trabalhando com dados brutos (dados que não foram tabulados em 
distribuições de freqüência). Neste caso utiliza-se a Equação (3.1). 
n
n
i
ix
n
nxxxX
∑
==
=+++ 121 L
, (3.1) 
onde x1, ...,xn são os valores da variável de interesse e n é a quantidade desses valores. 
 
 
Exemplo 1: seja o conjunto X = {2, 3, 5, 7, 6}, calcule a média. 
 
X
 
= (2 + 3 + 5 + 7 + 6) / 5 = 4,6 
 
 
Exemplo 2: se um estudante recebe nota 5 no primeiro dia de aula, 7 no segundo, 9 no terceiro, 10 
no quarto e 6 no quinto, qual a nota média deste aluno? 
 
 
2º Caso - Quando se estiver trabalhando com dados Tabulados (dados que foram tabulados em 
distribuição de freqüência). Neste caso utiliza-se a Equação (3.2). 
( )
∑
∑
=
=
=
n
i
i
n
i
ii
f
xf
X
1
1
, (3.2) 
 
 
Onde: fi = freqüência simples da classe i e xi = ponto médio da classe i. 
 
 
 
 
 
 
UNIVERSIDADE FEDERAL DO PARÁ 
FACULDADE DE ESTATÍSTICA - CURSO DE BACHARELADO EM ESTATÍSTICA 
ESTATÍSTICA DESCRITIVA – Profa. Dra. Silvia dos S. de Almeida 
 
9
3.1.1. PROPRIEDADES DA MÉDIA 
 
• A soma algébrica dos desvios de um conjunto de números em relação à média é zero. 
( ) ( )[ ] 00
11
=−=− ∑∑
==
n
i
ii
n
i
i XxfouXx 
• A soma dos quadrados dos desvios de um conjunto de números xj, em relação a qualquer número 
a, é um mínimo quando a = média e somente neste caso. 
 ( ) ( )[ ] ..
1
2
1
2 Xasemínimoaxfoumínimoax
n
i
ii
n
i
i ==−=− ∑∑
==
 
• Se n1 números têm média 1x , n2 números têm média 2x , . . ., nk números têm média kx , a média 
do conjunto formado por todos os números é dada pela expressão: 
∑
∑
=
=
= k
j
j
k
j
jj
n
nx
X
1
1 . 
• Somando-se (ou subtraindo-se) um valor constante e arbitrário a cada um dos elementos de um 
conjunto de números, a média aritmética fica somada (ou subtraída) por essa constante. Seja 
{ }nxxxX ,,, 21 K= e seja X0 uma constante escolhida arbitrariamente. 
 Faça Y = X- X0 ou Y = X- X0 , tem-se: 
00 xxYouxxY +=−= 
 
• Multiplicando-se (ou dividindo-se) cada elemento de conjunto de números por um valor constante 
e arbitrário, a média fica multiplicada (ou dividida) por essa constante. Sejam { }nxxxX ,,, 21 K= e 
seja c uma constante escolhida arbitrariamente. 
 Façamos Y = cX
 
ou 
c
XY =
 
, tem-se: 
 
c
xYouxcY ==
 
Obs: a média tem a desvantagem de ser sensível a valores aberrantes ou outliers. 
 
Exemplo: Calcule o salário médio dos funcionários da Escola W no ano de 2007. 
 
Tabela 3.1: SALÁRIOS DOS PROFESSORES DA ESCOLA W - ANO DE 2007 
Unidade Monetária Nº de Empregados (fi) 
 1 |--- 3 
 3 |--- 5 
 5 |--- 7 
 7 |--- 9 
 9 |--- 11 
11 |--- 13 
17 
30 
45 
52 
36 
20 
Σ 200 
 Fonte: Dados Hipotéticos 
 
 
 
 
UNIVERSIDADE FEDERAL DO PARÁ 
FACULDADE DE ESTATÍSTICA - CURSO DE BACHARELADO EM ESTATÍSTICA 
ESTATÍSTICA DESCRITIVA – Profa. Dra. Silvia dos S. de Almeida 
 
10
3.2. MÉDIA GEOMÉTRICA: é definida, genericamente, como a raiz enésima do produto de 
todos os seus valores, e defini-se, para variáveis que não assumam valores negativos ou nulos. A 
média geométrica pode ser simples ou ponderada, conforme se utilize ou não em seu cálculo uma 
tabela de freqüência. 
 
a) Média geométrica simples - dados n valores x1, x2 , ..., xn , a média geométrica desses valores 
será: 
n
ixMg C= 
 
Ex .: Calcule a média geométrica do seguinte conjunto de números: x = (2, 2, 2, 2) 
 
b) Média geométrica ponderada - dado um conjunto de números dispostos em uma tabela de 
freqüências, tem-se: 
∑
=
i
i
f
f
ixMg C 
obs: em geral é calculada utilizando o emprego de logaritmos. ( ∑=
=
n
i
ing xM 1
1 lnln ) 
Ex: Calcular a média geométrica dos valores constantes da Tabela 3.1 
 
3.3 - MÉDIA HARMÔNICA: é o inverso da média aritmética dos inversos. Aplica-se em 
situações em que não faz sentido somar os valores da variável por haver proporcionalidade inversa. 
 
a) Média harmônica simples- dado o conjunto de n valores x1 , x2, ..., xn , a média harmônica do 
conjunto será: 
 ( )∑
=
=
n
i
xi
nMh
1
1
 
 
Ex.: Calcular a média harmônica simples do seguinte exemplo y = (2, 2, 2, 2) 
 
b) Média harmônica ponderada 
 ( )∑
∑
=
=
=
n
i
x
f
n
i
i
i
i
f
Mh
1
1
 
 
Ex: calcular a média harmônica dos dados da Tabela 3.1 
 
Obs: (Murteira e Black, 1983), A média harmônica é menor ou igual à média geométrica para 
valores da variável diferentes de zero, que por sua vez é menor ou igual a média aritmética. ( )XMM gh ≤≤ . 
 
UNIVERSIDADE FEDERAL DO PARÁ 
FACULDADE DE ESTATÍSTICA - CURSO DE BACHARELADO EM ESTATÍSTICA 
ESTATÍSTICA DESCRITIVA – Profa. Dra. Silvia dos S. de Almeida 
 
11
 
3.4 - MÉDIA QUADRÁTICA OU RAÍZ MÉDIA QUADRÁTICA: é definida como, 
Para dados Simples é 
n
x
QMR
n
i
i∑
=
=
1
2
..
 e para dados Tabelados 
∑
∑
=
=
=
n
i
i
n
i
i
f
xf
QMR
i
1
1
2
..
. 
Exemplo: Obter a RMQ dos números 1,3,4,5 e 7 . 
 
Fórmula Geral das Médias 
As médias aritméticas, geométrica e harmônica são casos particulares da formula geral das médias 
ou média de ordem q , 
( ) ,
1
1
qn
i
q
i
n
x
qM




















∑
=
= 
que se obtêm fazendo respectivamente 1=q , 0=q , 1−=q . 
 
OBSERVAÇÃO: quando se tem valores “extravagantes”, pode-se utilizar as chamadas médias 
aparadas, pois esta atribui menor ponderação a esses valores. Uma média aparada a %100 α× , 
simbolicamente ( )αT , é obtida eliminando %100 α× das menores e maiores observações e 
calculando a média simples das restantes. Por exemplo: Dado 20 observações, 2021 ,,, xxx L , 
tem-se a média aparada a 10% igual a, 
( )
16
10,0 1843
xxx
T
+++
=
L
 
a média aparada a 25% , 
( )
10
25,0 1576 xxxT +++= L . 
 O problema da escolha do “melhor” α não cabe neste momento (disciplina). Porém, pode-
se dizer que a quantidade “ideal” para aparar está diretamente relacionada com o peso das caudas da 
distribuição da população de onde veio a amostra: 
(a) se as caudas são neutras (distribuição gaussiana), a média ( )0=α é a melhor medida de 
localização em termos de “eficiência” (nenhuma ou pouca perda de informação); 
(b) se as caudas são ligeiramente pesadas, para pequenas amostras ( )5=n a medida mais eficiente 
é a média aparada a 25% (meia média); para amostras ligeiramente maiores ( )2010 ≤≤ n a 
medida mais eficiente é a média aparada a 10%; 
(c) se as caudas são pesadas (Cauchy, etc.), a medida mais eficiente é a mediana. 
 
 
 
UNIVERSIDADE FEDERAL DO PARÁ 
FACULDADE DE ESTATÍSTICA - CURSO DE BACHARELADO EM ESTATÍSTICA 
ESTATÍSTICA DESCRITIVA – Profa. Dra. Silvia dos S. de Almeida 
 
12
3.5. MODA (Mo): é aquilo que está em evidencia, o valor que mais aparece num conjunto de 
informações ou o de maior freqüência em uma tabela. A moda pode não ser única ou ate mesmo 
pode não existir. 
 
3.5.1 - MODA DE VALORES BRUTOS: basta observar o valor que mais aparece no conjunto. 
Exemplo: 3 ; 3 ; 6 ; 8 ; 10 ; 10; 10; 11; 11; 12 → Mo = 10. 
 
3.5.2 - MODA DE VALORES TABELADOS: na literatura existem pelo menos três métodos de 
se calcular a moda de dados tabelados, porém neste curso utilizam-se somente dois métodos (Moda 
Bruta e Moda de Czuber). 
 
1º passo: identificar a classe modal (em uma distribuição de freqüência chama-se classe modal à 
classe que possui maior freqüência simples). 
 
2º passo: aplica-se a formula de acordo com o tipo de moda solicitada. 
 
Moda Bruta: como o ponto médio é representativo de qualquer classe de freqüências, chama-
se moda bruta ao ponto médio da classe modal. 
2)(
si
fidebrutaO
llXM +== > 
Moda de Czuber: método conhecido como método eficiente, e consiste na aplicação da 
formula: 
( ) hfff
fflMo
postantMo
antMo
i ×








+−
−
+=
2
, 
onde: 
li 
fpost 
fant
 
h 
fMO 
= 
= 
= 
= 
= 
Limite inferior da classe modal; 
Freqüência simples posterior à classe modal; 
Freqüência simples anterior à classe modal; 
Intervalo de classe; 
Freqüência modal. 
EXERCÍCIO - Dada a tabela abaixo, Pede-se: 
 
Tabela 3.2: Notas dos alunos da disciplina 
Estatística 
no Instituto Datavox, ano de 2007 
NOTAS fi 
1 |-- 3 
3 |-- 5 
5 |-- 7 
5 
7 
8 
Σ 20 
Fonte: dados hipotéticos 
 
a) A média aritmética da distribuição; 
b) A média harmônica da distribuição; 
c) Calcule a média geométrica da distribuição; 
d) A moda da distribuição pelo processo de 
Czuber; 
e) A moda bruta da distribuição. 
3.6 - MEDIDAS SEPARATRIZES: 
 
UNIVERSIDADE FEDERAL DO PARÁ 
FACULDADE DE ESTATÍSTICA - CURSO DE BACHARELADO EM ESTATÍSTICA 
ESTATÍSTICA DESCRITIVA – Profa. Dra. Silvia dos S. de Almeida 
 
13
 Estas medidas dividem o conjunto de dados (distribuição) em partes (2, 4, 10 e 100) iguais 
 
a) MEDIANA (Me): é o valor central em um rol, ou seja, a mediana de um conjunto de valores ordenados, ou 
ainda a mediana divide a distribuição ao meio. 
 
MEDIANA DE VALORES BRUTOS 
 
� Ordenar os valores em ordem crescente (Rol); 
� Verifica se o número de elementos é par ou ímpar; 
� Se n for ímpar, a posição da Me no conjunto, será o valor localizado na posição dada por: 2
1+
=
nP ; 
� Se n for par, o conjunto terá dois valores centrais, neste caso, a Me será igual à média aritmética dos 
valores centrais, cujas posições são dadas por: 
P1 = n / 2 e P2 = (n / 2) + 1 
 
 
Exemplo: Em um grupo de 6 alunos cujas as alturas medidas em centímetros fossem as seguintes: 183 cm, 
170 cm, 165 cm, 180 cm, 185 e 160 cm, qual a altura mediana deste grupo de pessoas? 
 
 
 MEDIANA DE VALORES TABELADOS 
 
 • Calcula-se primeiro a posição da mediana na tabela: P = Σfi / 2; 
 • A mediana é dada por: 
hf
F
lMe
i
aa
f
i
n
i
i
×












−
∑
+=
=
2
1
 
onde: 
li 
Faa 
fi 
h 
= 
= 
= 
= 
Limite inferior da classe da mediana; 
Freqüência acumulada anterior da classe da Me; 
Freqüência simples da classe da mediana; 
Intervalo de classe. 
 
Observação 1: a mediana é muito utilizada em pesquisas onde não interessam valores extremos, por terem 
pouca significação para o conjunto em geral. 
Observação 2: quando não se tem os dados originais, é valida a seguinte relação empírica 
2
3 oMMex
−
=
 
 
 
b) Quartis (Qi): são os valores que dividem um conjunto de dados em quatro partes iguais, representados por 
Q1, Q2 e Q3 denominam-se primeiro, segundo e terceiro quartis, respectivamente, sendo o valor de Q2 igual à 
mediana. Assim, temos; 
 
0% ----------------- 25% ----------------- 50% ----------------- 75% ----------------- 100% 
 Q1 Q2 Q3 
A formula para determinação dos quartis para dados agrupados é semelhante à usada para o cálculo da 
mediana. 
 
 
 
 
 
UNIVERSIDADE FEDERAL DO PARÁ 
FACULDADE DE ESTATÍSTICA - CURSO DE BACHARELADO EM ESTATÍSTICA 
ESTATÍSTICA DESCRITIVA – Profa. Dra. Silvia dos S. de Almeida 
 
14
Determinação de Qi: 
1º passo: calcula-se a posição ;4
1
∑
=
=
×
n
i
ifi
p 
2º passo: identifica-se a classe Qi pela coluna das Freqüências Acumuladas; 
3º passo: Aplica-se a fórmula: 
.3,2,1,4
1
=×












−
∑
+=
=
×
iparahf
F
lQ
i
n
i
i
i
iQ
aa
fi
iQi
 
onde: 
i 
liQi 
Faa 
fiQi 
h 
= 
= 
= 
= 
= 
Ordem do quartil, i =1 ou 2 ou 3; 
Limite inferior da classedo quartil de ordem i. 
Freqüência acumulada anterior da classe do quartil de ordem i; 
Freqüência simples da classe do quartil de ordem i; 
Intervalo de classe. 
 
Interpretação: 
Q1: é o valor que ocupa a posição tal que um quarto dos dados (25%) tomam valores menores ou iguais ao 
valor do primeiro quartil; 
Q2 = Me: Coincide com o valor da mediana, ou seja 50% dos dados tomam valores menores ou iguais aos da 
mediana. Entre o primeiro quartil (Q1) e a mediana (Me) ficam 25% dos dados; 
Q3: é o valor que ocupa a posição tal que um quarto dos dados (25%) tomam valores maiores ou iguais ao 
valor do terceiro quartil. Entre a mediana (Me) e o terceiro quartil (Q3) ficam 25% dos dados. 
 
Exemplo: Considerando a Tabela 3.1 e calcule o Q1, Q2 e Q3. 
 
 
c) Decis (Di): são as medidas separatrizes que dividem a série em 10 partes iguais, e são representadas por D1, 
D2, ...,D9. O quinto decil corresponde à mediana. 
 
0% -- 10% -- 20% -- 30% -- 40% -- 50% -- 60% -- 70% -- 80% -- 90% -- 100% 
 D1 D2 D3 D4 D5 D6 D7 D8 D9 
 
A formula, neste caso, é semelhante à das separatrizes anteriores. 
 
Determinação de Di: 
1º passo: calcula-se a posição 10
1
∑
=
=
×
n
i
ifi
p , onde i = 1,2,3,4,5,6,7,8 e 9. 
 
2º passo: identifica-se a classe Di pela Freqüência acumulada. 
 
3º Passo: aplica-se a fórmula: 
hf
F
lD
i
n
i
i
i
iD
aa
fi
iDi ×












−
∑
+=
=
×
10
1
 
 
UNIVERSIDADE FEDERAL DO PARÁ 
FACULDADE DE ESTATÍSTICA - CURSO DE BACHARELADO EM ESTATÍSTICA 
ESTATÍSTICA DESCRITIVA – Profa. Dra. Silvia dos S. de Almeida 
 
15
onde: 
i 
liDi 
Faa 
fiDi 
h 
= 
= 
= 
= 
= 
Ordem do decil, i =1; 2; 3; 4; 5; 6; 7; 8 ou 9; 
Limite inferior da classe do decil de ordem i. 
Freqüência acumulada anterior da classe do decil de ordem i; 
Freqüência simples da classe do decil de ordem i; 
Intervalo de classe. 
 
 
Exemplo: Considerando a Tabela 3.3, calcule o D3. 
 
 
d) Percentis (Pi): são as medidas separatrizes que dividem a série em 100 partes iguais, e são representadas 
por P1, P2, ...,P99. 
 
 
0% --- 1% --- 2% -- 3% --- -- -- 50% --- --- --- 97% --- 98% -- 99% -- 100% 
 P1 P2 P3 P50 P97 P98 P99 
 
 
Interpretação dos Percentis mais Importantes: 
 
P1 1% dos dados tomam valores menores ou iguais; 
P5 5% dos dados tomam valores menores ou iguais; 
P10 10% dos dados tomam valores menores ou iguais; 
P25 25% dos dados tomam valores menores ou iguais (Q1); 
P50 50% dos dados tomam valores menores ou iguais (Q2 = Me); 
P75 25% dos dados tomam valores maiores ou iguais (Q3); 
P90 10% dos dados tomam valores maiores ou iguais; 
P95 5% dos dados tomam valores maiores ou iguais; 
P99 1% dos dados tomam valores maiores ou iguais; 
 
Determinação de Pi: 
1º passo: calcula-se a posição 100
1
∑
=
=
×
n
i
ifi
p , onde i = 1,2,3,...,97,98 e 99. 
2º passo: identifica-se a classe de Pi pela Freqüência acumulada. 
3º Passo: aplica-se a fórmula: 
hf
F
lP
i
n
i
i
i
iP
aa
fi
iPi ×












−
∑
+=
=
×
100
1
 
onde: 
I 
liPi 
FAA 
fiPi 
h 
= 
= 
= 
= 
= 
Ordem do percentil, i =1; 2; ....;97; 98 ou 99; 
Limite inferior da classe do percentil de ordem i. 
Freqüência acumulada anterior da classe do percentil de ordem i; 
Freqüência simples da classe do percentil de ordem i; 
Intervalo de classe. 
 
Exemplo: Considerando a Tabela 3.1, calcule o P3. 
 
UNIVERSIDADE FEDERAL DO PARÁ 
FACULDADE DE ESTATÍSTICA - CURSO DE BACHARELADO EM ESTATÍSTICA 
ESTATÍSTICA DESCRITIVA – Profa. Dra. Silvia dos S. de Almeida 
 
16
3.7. Processo Gráfico 
 
GRÁFICO BOX-PLOT (DIAGRAMA DA CAIXA, GRÁFICO ESQUEMÁTICO) 
 * Valores extremos: valores maiores que 3 comprimentos da caixa, a 
partir do percentil 75% 
25% dos dados estão 
acima da caixa 
O 
 
Outliers: valores maiores que 1,5 comprimentos da caixa, a partir do 
percentil 75% 
 
 
 
 Maior valor que não é outlier 
 
 Percentil 75% 
 
50% dos 
dados estão 
 
 
 
 
 
 Mediana 
dentro da 
caixa 
 
 
 
 
 
 Percentil 25% 
 
 
 
 
Menor valor que não é outlier 
25% dos dados estão 
abaixo da caixa 
 
O 
 
Outliers: valores menores que 1,5 comprimentos da caixa, a partir do 
percentil 25% 
 
* 
Valores extremos: valores menores que 3 comprimentos da caixa, a 
partir do percentil 25% 
 
Obs.: Comprimento da caixa = amplitude interquartílica = Q3 - Q1 
 
Exemplo: Monte um Box-plot para a Tabela 3.1 e interprete os resultados. 
 
 
 
 
 
 
 
 
UNIVERSIDADE FEDERAL DO PARÁ 
FACULDADE DE ESTATÍSTICA - CURSO DE BACHARELADO EM ESTATÍSTICA 
ESTATÍSTICA DESCRITIVA – Profa. Dra. Silvia dos S. de Almeida 
 
17
4- MEDIDAS DE DISPERSÃO OU VARIABILIDADE. 
 
 As medidas que determinam o comportamento dos valores em termos de variabilidade são chamadas 
de medidas de dispersão ou de variabilidade, e as mais utilizadas são a variância e o desvio padrão. 
 
4.1 - AMPLITUDE TOTAL: é a diferença entre o maior e o menor valor observado. 
minmax XXAT −= 
 
4.2 - DESVIO MÉDIO: é a média dos valores absolutos dos desvios dos dados a partir de um valor de 
tendência central. 
 
a) DESVIO MÉDIO DE VALORES BRUTOS 
n
n
i
xix
DM
∑
=
−
=
1
)(
 
 
b) DESVIO MÉDIO DE VALORES TABELADOS 
 
n
n
i
ifonden
i
if
n
i
ifxix
DM =∑
=∑
=
∑
=
−
=
1
:,
1
1
.)(
 
 
Obs: no caso de amostra trabalha-se com n-1. 
 
Exemplo: calcule o desvio médio da distribuição abaixo 
 
Tabela 4.1: Notas dos alunos da disciplina Estatística 
no Instituto Datavox, ano de 2010 
NOTAS fi 
1 |-- 3 
3 |-- 5 
5 |-- 7 
5 
3 
2 
Soma 10 
 Fonte: dados hipotéticos 
 
 
4.3 - VARIÂNCIA OU VARIÂNCIA ABSOLUTA: Quando se trabalha com certo rigor de análise 
estatística se faz grande uso do que é chamada a variância de uma distribuição, a qual é a média quadrática 
das somas dos desvios em relação à média aritmética. 
 
Símbolo ⇒ S2 (amostra) ou σ2 (população) 
 
 
 
 
 
 
 
 
UNIVERSIDADE FEDERAL DO PARÁ 
FACULDADE DE ESTATÍSTICA - CURSO DE BACHARELADO EM ESTATÍSTICA 
ESTATÍSTICA DESCRITIVA – Profa. Dra. Silvia dos S. de Almeida 
 
18
a) FÓRMULA PARA DADOS BRUTOS 
 
Processo longo Processo breve ou simplificado 
1
1
)(
2
2
−
∑
=
−
=
n
n
i
xix
S 
1
2
1
2
2
−
−∑
=
=
n
xn
n
i
ix
S 
 
Observação: quando se tratar de população, dividi-se apenas por “N”. 
 
Exemplo: calcular a variância dos valores amostrais: 4, 2, 3, 5 e 1. 
 
 
b) FÓRMULA PARA DADOS TABELADOS: 
 
Processo longo Processo breve ou simplificado 
[ ]
1
1
)(
2
2
−
∑
=
−×
=
n
n
i
xixf
S
i
 
1
2
1
2
2
−
−∑
=
=
n
xnif
n
i
ix
S 
 
Observação: quando se trata de população dividimos apenas por “N”. 
 
Exemplo: calcule a variância da distribuição dada pela tabela 4.1. 
 
 
PROPRIEDADES DA VARIÂNCIA: 
a) A variância absoluta de uma constante é igual a zero; 
 
b) Somando-se ou diminuindo-se a todos os valores da série um valor constante K ≠ 0, a nova variância será 
igual a anterior, isto é, não se altera. 
 
c) Multiplicando-seou dividindo-se todos os valores de uma série por um valor constante, K ≠ 0, a nova 
variância calculada será igual à variância absoluta original multiplicada ou dividida pelo quadrado da 
constante utilizada. 
 
 
4.4 - DESVIO PADRÃO OU AFASTAMENTO PADRÃO: é a raiz quadrada da variância; assim: 
 
2SS = , é o desvio padrão amostral, ou 2σσ = , é o desvio padrão populacional. 
 
Resumindo: para o cálculo do desvio padrão, deve-se primeiramente determinar o valor da variância e, em 
seguida, extrair a raiz quadrada desse resultado. 
 
Exemplo 1: calcular o desvio padrão amostral dos valores: 2, 4, 5, 3 e 1. 
 
 
Exemplo2: calcule o desvio padrão amostral da distribuição dada pela tabela 4.1. 
 
UNIVERSIDADE FEDERAL DO PARÁ 
FACULDADE DE ESTATÍSTICA - CURSO DE BACHARELADO EM ESTATÍSTICA 
ESTATÍSTICA DESCRITIVA – Profa. Dra. Silvia dos S. de Almeida 
 
19
4.5- COEFICIENTE DE VARIAÇÃO: Às vezes pode-se querer comparar o grau de dispersão de dois 
conjuntos de dados com unidades de medidas diferentes. Neste caso, deve-se usar o coeficiente de variação 
(CV), que é uma medida de dispersão relativa, uma vez que ela não está afetada pelas unidades da medida da 
variável. 
CV = 100×
X
S
 
 
Observação 1: Será considerada a série mais homogênea, aquela que apresentar menor valor do coeficiente 
de variabilidade. 
 
Observação 2: é uma medida estatística que serve para avaliar a homogeneidade de séries estatísticas, que é o 
grau de concentração dos valores observados em torno da sua média aritmética. 
 
Observação 3: O seu valor numérico pode ser expresso em percentual. 
 
5 – MOMENTOS: 
 
 Os momentos podem ser caracterizados como quantidades numéricas, calculados a partir de 
uma distribuição de freqüência e que são utilizados para fornecer descrições resumidas da 
distribuição estudada. 
 
5.1 - Momento Natural (absoluto) de Ordem “ r ” 
→→→→ para valores brutos: 
n
x
m
n
i
r
i
r
∑
=
=
1'
 , r = 1, 2, 3 ou 4. 
Obs: o momento natural de 1ª ordem (r=1) é a própria média aritmética ( Xm ='1 ). 
 
Ex: calcular os momentos naturais de ordem r = 1, r = 2, r = 3 e r = 4, para os valores de x (2,3,5,7, 8) 
→→→→ para valores tabelados: 
n
xf
m
n
i
r
ii
r
∑
=
=
1'
 
 
Ex: calcular os momentos naturais de 1ª, 2ª, 3ª e 4ª ordens da distribuição de freqüências abaixo: 
 
 Notas dos alunos da disciplina Estatística 
 no Instituto Datavox , ano de 2010. 
NOTAS fi 
1 |-- 3 
3 |-- 5 
5 |-- 7 
5 
7 
8 
Σ 20 
 Fonte: dados hipotéticos 
 
 
 
 
 
 
UNIVERSIDADE FEDERAL DO PARÁ 
FACULDADE DE ESTATÍSTICA - CURSO DE BACHARELADO EM ESTATÍSTICA 
ESTATÍSTICA DESCRITIVA – Profa. Dra. Silvia dos S. de Almeida 
 
20
 
5.2 - Momento de ordem “r” centrado numa origem qualquer 
→→→→ para valores brutos: 
( )
n
xx
m
n
i
r
oi
rxo
∑
=
−
=
1
 
 
Ex: considerando a origem 4=ox , calcular o momento de segunda ordem do conjunto 
 x = (2, 3, 5, 7, 8), em relação a origem xo. 
→→→→ para valores tabelados: 
( )
n
xxf
m
n
i
r
oii
rxo
∑
=
−
=
1
 
 
 
Obs: fazendo-se xo = 0, o momento em relação à origem é igual ao momento natural. 
 
 
5.3 - Momento de Ordem r Centrado na média 
 
 Para se calcular o momento centrado na média, usa-se as mesmas fórmulas do centrado numa origem 
qualquer, fazendo xxo = . Com isto, tem-se: 
→→→→ para valores brutos: 
( )
n
xx
m
n
i
r
i
r
∑
=
−
=
1
 
 
 
 
→→→→ para valores tabelados: 
( )
n
xxf
m
n
i
r
ii
r
∑
=
−
=
1
 
 
 
Obs: O 2º momento centrado na média (r = 2), corresponde à variância da distribuição. 
 
Ex: calcular os momentos centrados na média de 3ª e 4ª ordens da distribuição de freqüências abaixo: 
 
 Notas dos alunos da disciplina Estatística 
 no Instituto Datavox , ano de 2010. 
NOTAS fi 
1 |-- 3 
3 |-- 5 
5 |-- 7 
5 
7 
8 
Σ 20 
 Fonte: dados hipotéticos 
 
→→→→ Relação entre os momentos: São validas as seguintes relações entre os momentos centrados na média, 
rm , e os referidos a uma origem arbitrária rx mo . 





−×+×−=
+×−=
−=
4
12
2
13144
3
12133
2
122
0000
00
364
23
mmmmmmm
mmmmm
mmm
xxxxxx
xxxx
xx
oo
oo
oo
 
 
 
UNIVERSIDADE FEDERAL DO PARÁ 
FACULDADE DE ESTATÍSTICA - CURSO DE BACHARELADO EM ESTATÍSTICA 
ESTATÍSTICA DESCRITIVA – Profa. Dra. Silvia dos S. de Almeida 
 
21
6 – ASSIMETRIA E CURTOSE 
 
6.1 - ASSIMETRIA 
 
 É o estudo do grau de enviezamento (viés) da curva. É o grau de desvio ou afastamento do eixo de 
simetria de uma distribuição Se o polígono de freqüência de uma distribuição tem uma cauda mais longa, diz-
se que a distribuição é assimétrica positiva. Se for o inverso que ocorre, diz-se que ela é assimétrica negativa. 
 
a) Simétrica 
 
 
 
 
 
b) Assimetria Positiva 
 
 
 
 
 
 
 
c) Assimetria Negativa 
 
 
 
 
 
 
 
 
 
MEDIDAS DE CALCULO: 
 
→→→→ Coeficiente do momento de assimetria: Este coeficiente pode ser definido usando o terceiro momento 
centrado na média e o desvio padrão: 
3
2
3
3
3
3
m
m
S
m
a == 
obs: para curvas perfeitamente simétricas, como a normal, a3 é nulo. 
 
→→→→ Primeiro coeficiente de assimetria de Pearson: 
S
MXA 0−= 
X = Mo = Md 
Mo <
 
Md < X 
 X < Md < Mo 
 
UNIVERSIDADE FEDERAL DO PARÁ 
FACULDADE DE ESTATÍSTICA - CURSO DE BACHARELADO EM ESTATÍSTICA 
ESTATÍSTICA DESCRITIVA – Profa. Dra. Silvia dos S. de Almeida 
 
22
 
→→→→ Segundo coeficiente de assimetria de Pearson: 
( )
S
MXA e−= 3 
 
Quando A = 0 ⇒ Simétrica, se A > 0 ⇒ Assimetria Positiva e se A < 0 ⇒ Assimetria Negativa. 
 
Ex: Se um conjunto possui 24=X , Mo = 25 e S = 3, Que tipo de viés possui a curva? 
 
 
6.2 - CURTOSE 
 
 É o estudo do grau de achatamento de uma distribuição, considerado em relação a uma distribuição 
normal. A distribuição que tem um pico alto é denominada leptocúrtica, enquanto a da curva que tem o topo 
achatado é denominada platicúrtica. E a distribuição que não é nem pontiaguda e nem achatada (normal), é 
denominada mesocúrtica. 
 
Curva Mesocúrtica 
 
 
 
 
 
 
 
Curva Platicúrtica 
 
 
 
 
 
 
 
Curva Leptocúrtica 
 
 
 
 
 
 
 
 
 
 
UNIVERSIDADE FEDERAL DO PARÁ 
FACULDADE DE ESTATÍSTICA - CURSO DE BACHARELADO EM ESTATÍSTICA 
ESTATÍSTICA DESCRITIVA – Profa. Dra. Silvia dos S. de Almeida 
 
23
 
MEDIDAS DE CALCULO: 
→→→→ Coeficiente do momento de Curtose: é definido pela divisão do momento de grau 4 centrado na média 
pela variância ao quadrado. Ou seja: 
2
2
4
4
4
2
m
m
S
mb == . 
Para a distribuição normal, 32 =b . Por essa razão, a curtose é definida freqüentemente por 
( )32 −b , que é positivo para uma distribuição leptocúrtica, negativa para uma platicúrtica e nulo para uma 
normal. 
→ Coeficiente percentílico de Curtose: ( )
( )
( )19
13
19 2 DD
QQ
DD
D
k q
−
−
=
−
= 
onde : K = coeficiente percentílicode curtose 
 Dq = Desvio quartílico = 
( )
2
13 QQ −
 
 D9 = 9º decil, D1 = 1º decil, Q1 = 1º quartil e Q3 = 3º quartil. 
 
 
Comparação: se K = 0,263 ⇒ curva de frequências mesocúrtica 
 se K > 0,263 ⇒ curva de frequências platicúrtica 
 se K < 0,263 ⇒ curva de frequências leptocúrtica 
 
Ex: calcular o Coeficiente momento de curtose e o percentílico de curtose para a tabela abaixo e classifique 
essa distribuição por ambos os coeficientes: 
 
 Notas dos alunos da disciplina Estatística 
 no Instituto Datavox , ano de 2010. 
NOTAS fi 
1 |-- 3 
3 |-- 5 
5 |-- 7 
5 
7 
8 
Σ 20 
 Fonte: dados hipotéticos 
 
 
 
 
 
 
 
 
 
UNIVERSIDADE FEDERAL DO PARÁ 
FACULDADE DE ESTATÍSTICA - CURSO DE BACHARELADO EM ESTATÍSTICA 
ESTATÍSTICA DESCRITIVA – Profa. Dra. Silvia dos S. de Almeida 
 
24
 
7 – CORRELAÇÃO LINEAR SIMPLES 
 
Freqüentemente procura-se verificar se existe relação entre duas ou mais variáveis. O peso 
pode estar relacionado com a idade das pessoas; o consumo das famílias pode estar relacionado com 
sua renda, bem como a demanda de um determinado produto e seu preço. A verificação da 
existência e do grau de relação entre variáveis é o objeto de estudo da correlação. Se um sistema de 
coordenadas retangulares mostra a localização dos pontos (x, y) e se todos os pontos desse diagrama 
parecem cair nas proximidades de uma reta, a correlação é denominada linear. Fazendo X a variável 
independente, se Y tende a aumentar quando X cresce, a correlação é denominada positiva. Se Y 
tende a diminuir quando X aumenta, a correlação é denominação negativa. 
7.1. DIAGRAMAS DE DISPERSÃO 
 
 
 
 
 
 
 
 
 
 
 
 
 
UNIVERSIDADE FEDERAL DO PARÁ 
FACULDADE DE ESTATÍSTICA - CURSO DE BACHARELADO EM ESTATÍSTICA 
ESTATÍSTICA DESCRITIVA – Profa. Dra. Silvia dos S. de Almeida 
 
25
7.2. COEFICIENTE DE CORRELAÇÃO: é o instrumento de medida da correlação linear, e é 
dado pelo coeficiente de correlação de Pearson. 
( )( )
( ) ( )








−








−
−
=
∑
∑∑
∑
∑
∑∑
n
Y
Y
n
X
X
n
YX
XY
r
2
2
2
2
 , -1 ≤ r ≤ 1. 
 
Exemplo 1: calcule o coeficiente de correlação linear entre as variáveis X e Y da tabela abaixo. 
X 1 3 4 6 8 
Y 1 2 4 4 5 
 
 
 
8. REGRESSÃO LINEAR SIMPLES 
 
8.1 – Considerações Gerais 
 
 Na prática, constata-se freqüentemente a existência de uma relação entre duas (ou mais) 
variáveis e se deseja expressar tal relação sob forma matemática, estabelecendo-se uma equação 
entre as variáveis. Supondo a variável X independente e a variável Y aleatória, se diz, que 
( )xfY = . 
 
8.2- Construção do Modelo de Regressão Linear Simples. 
 
Dados n pares de valores de duas variáveis, Xi, Yi (i = 1, 2, ...,n), admite-se que Y é função 
linear de X, ou seja ( )xfY = , pode-se estabelecer uma regressão linear simples , cujo modelo 
estatístico é 
iii XY εββ ++= 10 (2) 
onde: 
Yi é o i-ésimo valor da variável resposta; β0 e β1 são os parâmetros (coeficientes de regressão); 
Xi é o i-ésimo valor da variável preditora (é uma constante conhecida, fixo). 
εi é o termo do erro aleatório com distribuição normal e E(εi)=0 e σ2(εi)= σ2; 
εi e εj não são correlacionados σ(εi, εj)=0 para todo i,j; i≠ j; (covariância é nula).i=1,2,...,n. 
 
Deve-se verificar também se o número de observações é maior do que o número de 
parâmetros da equação de regressão. Os dados são usados para estimar β0 e β1, isto é, ajustar o 
modelo aos dados. Isto geralmente é feito pelo métodos de mínimos quadrados. 
 
UNIVERSIDADE FEDERAL DO PARÁ 
FACULDADE DE ESTATÍSTICA - CURSO DE BACHARELADO EM ESTATÍSTICA 
ESTATÍSTICA DESCRITIVA – Profa. Dra. Silvia dos S. de Almeida 
 
26
8.3 - Método dos mínimos quadrados 
 
 O Objetivo na aplicação típica: é prever o comportamento de uma variável 
dependente (Y) a partir do valor de uma variável independente (x). Logo, Y é uma variável aleatória 
cuja distribuição depende de X. 
 
 
Seja as observações (Xi,Yi) i=1,..,n, temos o modelo: 
n1,..,i XY iii =++= εββ 10 
 
Importante: A figura mostra a distribuição de Y para vários valores de X. Mostra onde cai a 
observação Y1. Mostra que o erro é a diferença entre Y1 e E(Y1). Observe que as distribuições de 
probabilidade apresentam a mesma variabilidade. 
 
Deseja-se ajustar o modelo, estimando os parâmetros desconhecidos β0 e β1. 
 
O método de mínimos quadrados considera os desvios de Yi em relação ao seu valor esperado 
(E(Yi)): 
)( 10 ii XY ββ ++++−−−− 
Elevando-se ao quadrado esses desvios e aplicando-se o somatório, temos o critério Q. 
( )
 
1
2
10∑
=
−−=
n
i
ii XYQ ββ 
De acordo com o método de mínimos quadrados, os estimadores de β0 e β1são os valores 0ˆβ e 1ˆβ , 
respectivamente, que minimizam o critério Q para a amostra (X1,Y1),..,(Xn,Yn). 
 
- Estimadores de mínimos quadrados 
 
Os valores de β0 e β1 que minimizam o critério Q podem ser obtidos diferenciando-se Q em 
relação a β0 e β1, obtendo-se: 
 
UNIVERSIDADE FEDERAL DO PARÁ 
FACULDADE DE ESTATÍSTICA - CURSO DE BACHARELADO EM ESTATÍSTICA 
ESTATÍSTICA DESCRITIVA – Profa. Dra. Silvia dos S. de Almeida 
 
27
∑
∑
=
∂
∂
=
∂
∂
−−−=
−−−=
n
i
iii
Q
n
i
ii
Q
XYX
XY
1
10
1
10
)(2
)(2
1
0
ββ
ββ
β
β
 
Iguala-se a zero as derivadas parciais, utilizando-se 0ˆβ e 1ˆβ para denotar os valores de 0β e β1 
tem-se: 
0ˆˆ
0ˆˆ
0)ˆˆ(
0)ˆˆ(
:se-obtem ,expandindo e ndosimplifica
0)ˆˆ(2
0)ˆˆ(2
1
2
1
1
0
1
1
10
1
1
10
1
10
1
10
1
10
=−−
=−−
=−−
=−−
=−−−
=−−−
∑∑∑
∑∑
∑
∑
∑
∑
===
==
=
=
=
=
n
i
i
n
i
i
n
i
ii
n
i
i
n
i
i
n
i
iii
n
i
ii
n
i
iii
n
i
ii
XXYX
XnY
XYX
XY
XYX
XY
ββ
ββ
ββ
ββ
ββ
ββ
 
De onde, se obtém o sistema de equações normais, dado por: 
∑∑ ∑
∑∑
== =
==
+=
+=
n
i
i
n
i
n
i
iii
n
i
i
n
i
i
XXYX
XnY
1
2
1
1
1
0
11
10
ˆˆ
ˆˆ
ββ
ββ
 
As equações normais podem ser resolvidas simultaneamente para 0ˆβ e 1ˆβ (estimadores pontuais): 
( )
( ) XYXY n
X
X
n
YX
XY
iin
XX
YYXX
i
ii
11
1
0
2
2
)(
))((
1
ˆˆˆ
ˆ
2
βββ
β
−=−=
−
−
=
∑
∑
=
∑ ∑
∑ ∑
∑ ∑∑
−
−−
 
 
Onde: n = número de observações; 
n
xX ∑= = média de X e 
n
yY ∑= = média de Y. 
- Portanto a reta estimada será: ii XY 10 ˆˆˆ ββ += . 
 
UNIVERSIDADE FEDERAL DO PARÁ 
FACULDADE DE ESTATÍSTICA - CURSO DE BACHARELADO EM ESTATÍSTICA 
ESTATÍSTICA DESCRITIVA – Profa. Dra. Silvia dos S. de Almeida 
 
28
Exercício – Utilizando-se os dados abaixo, 
Quantidade (X) 10 11 12 13 14 15 
Custos (Y) 100 112 119 130 139 142 
 
a) Construa o diagrama de dispersão; 
b) Calcule o coeficiente de correlação linear; 
c) Ajuste uma reta aos dados; 
d) Qual é o custo para 16 unidades? 
 
8.4 - Aplicação a séries de Tempo 
Quando se utiliza uma série de temporal é necessária uma transformação na variável X para 
facilitar os cálculos. Em geral se se tem um número ímpar de elementos (n) deve-se centra a 
variável X em zero, e proceder a uma escala de números naturais. Por exemplo, para n=5, tem-se X 
(-2, -1, 0,1, 2). No caso de n par o procedimento pode se de apenas excluir o zero, ou seja, para 
n=4, tem-se X (-2, -1, 1, 2). 
 
Exercício: 
 
1. As importações de determinada matéria prima, no período de 2004 a 2010, encontram-se na 
tabela a seguir: 
Ano 2004 2005 2006 2007 2008 2009 2010 
Quantidade (ton) 50 47 35 30 24 10 16 
 
Pede-se: 
a) Construir um diagrama de dispersão; 
 
b) Estimar a equação de regressão linear da quantidade sobre o tempo; 
 
c) Estimar a quantidade para 2011. 
 
 
 
 
 
 
 
 
 
 
UNIVERSIDADE FEDERAL DO PARÁ 
FACULDADE DE ESTATÍSTICA - CURSO DE BACHARELADO EM ESTATÍSTICA 
ESTATÍSTICA DESCRITIVA – Profa. Dra. Silvia dos S. de Almeida 
 
29
9. Ajustamento de Curvas 
 
9.1 - Considerações Gerais: a determinação de equações de curvas que se ajustem a determinados 
conjuntos de dados observados é chamado de ajustamento de curvas, onde ajustar, significa estimar 
uma variável dependente em função de outra independente. Porém, é necessário inicialmente 
identificar a curva matemática que mais se aproxima dos pontos característicos do fenômeno, e isto 
depende do conhecimento algébrico de cada um, a curva mais comum é a linear, vista anteriormente 
no capitulo 8. Porém, quando os dados se afastam da linearidade, deve-se cogitar outra curva que 
não seja a linha reta. A seguir apresentam-se outras curvas não lineares, porém possíveis de 
ajustamento. 
 
a) Curva Polinomial: Uma linha de tendência polinomial pode ajustar uma curva quando os 
dados têm diversas variações. Por exemplo, de grau 2, neste caso se possui apenas um 
máximo ou um mínimo relativo, pois se trata de uma parábola: 
2cxbxay ++= , 
 
 A seguir um exemplo gráfico da curva polinomial de grau 2 
 
 
 
 
b) Curva Exponencial: é muito útil para os casos em que a variável dependente varia com uma 
taxa percentual constante. E sua equação é dada por: 
bxeay ×= 
 Um exemplo gráfico é apresentado a seguir 
 
 
 
UNIVERSIDADE FEDERAL DO PARÁ 
FACULDADE DE ESTATÍSTICA - CURSO DE BACHARELADO EM ESTATÍSTICA 
ESTATÍSTICA DESCRITIVA – Profa. Dra. Silvia dos S. de Almeida 
 
30
c) Curva de Gompertz: é uma curva sigmoidal, ela descreve um crescimento cuja taxa relativa 
decresce exponencialmente como função do tempo. 
ctbeeay ×= 
 
 A figura a seguir é uma representação da curva de crescimento Gompertz. 
 
 
 
d) Curva de Lorenz: é um simples instrumental gráfico e analítico que nos permite 
descrever e analisar a distribuição relativa de uma variável em um domínio determinado. O 
domínio pode ser o conjunto de pessoas de uma região ou país, por exemplo. A variável 
cuja distribuição se estuda pode ser a renda das pessoas. A curva é traçada considerando-se 
a percentagem acumulada de pessoas no eixo das abscissas e a percentagem acumulada de 
renda no eixo das ordenadas. 
 
 
A equação (modelo) de Lorenz é comumente definida como três equações diferenciais 
ordinárias, como aliada 
 
= 
 
= 
 
 
UNIVERSIDADE FEDERAL DO PARÁ 
FACULDADE DE ESTATÍSTICA - CURSO DE BACHARELADO EM ESTATÍSTICA 
ESTATÍSTICA DESCRITIVA – Profa. Dra. Silvia dos S. de Almeida 
 
31
 
e) Logistica: é uma curva também sigmoidal, porém descreve um crescimento cuja a taxa 
relativa decresce linearmente como função do tempo. 
x
x
e
ey βα
βα
+
+
+
=
1
 
 
 A figura a seguir é uma representação da curva de crescimento logística. 
 
TAREFA EXTRA: Pesquise e apresente para cada uma das curvas dadas anteriormente, um 
exemplo resolvido. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
UNIVERSIDADE FEDERAL DO PARÁ 
FACULDADE DE ESTATÍSTICA - CURSO DE BACHARELADO EM ESTATÍSTICA 
ESTATÍSTICA DESCRITIVA – Profa. Dra. Silvia dos S. de Almeida 
 
32
10. NÚMEROS ÍNDICES 
 
São medidas estatísticas usadas para comparar grupos de variáveis relacionadas entre si e para obter 
um quadro simples e resumido das mudanças significativas ocorridas ao longo do tempo ou em 
diferentes lugares. 
 
10.1- RELATIVOS DE PREÇO, QUANTIDADE E VALOR 
 
Tratam-se dos números índices mais simples, relacionando o preço ou a quantidade ou ainda o valor 
de um produto numa época atual (a) com uma época base (b). Assim, para um produto: 
bP
 
= Preço da Época Base 
aP
 
= Preço da Época Atual 
bq
 
= Quantidade da Época Base 
aq
 
= Quantidade da Época Atual 
bV
 
= Valor da Época Base 
aV
 
= Valor da Época Atual 
 
Assim, Tem-se 
Relativo de Preço → b
a
ab P
PP =
,
 
Relativo de Quantidade → b
a
ab q
qq =
,
 
Relativo de Valor → b
a
ab V
VV =
,
 
onde, aaa qPV ×= e bbb qPV ×= . 
 
 
Exemplo - Em 2002, uma empresa vendeu 500 unidades de um produto ao preço unitário de R$ 
40,00. Em 2003, vendeu 700 unidades do mesmo produto ao preço unitário de R$80,00. Determine 
os relativos de preço, quantidade e de valor para o produto, tomando como base 2002. 
 
 
 
 
 
 
 
UNIVERSIDADE FEDERAL DO PARÁ 
FACULDADE DE ESTATÍSTICA - CURSO DE BACHARELADO EM ESTATÍSTICA 
ESTATÍSTICA DESCRITIVA – Profa. Dra. Silvia dos S. de Almeida 
 
33
10.2 - TIPOS DE NÚMEROS ÍNDICES 
 
Quando se pretende avaliar a variação de preços, entre duas épocas, por exemplo, de dez artigos, 
através de um número-resumo (Índice), o cálculo dos relativos visto anteriormente representa 
apenas o primeiro passo para a solução do problema. Sem levar em consideração a importância 
relativa de cada item, existem várias proposições no que diz respeito aos métodos de cálculo: Média 
Aritmética, Geométrica e Harmônica Simples, Índice Agregativo Simples e Mediana. 
 
1 - Número Índice Aritmético Simples (ou Média Aritmética Simples de Relativos) 
 
Basta calcular o valor dos relativos de todos os itens considerandos e, em seguida, aplicar a fórmula 
da média aritmética. 
 
a) Índice Aritmético Simples de Preços 
 
n
P
P abab
∑
=
,
,
, 
onde 
abP ,
 
= Relativos de Preços dos Itens considerados; 
n
 
= Número de Itens Considerados. 
 
b) Índice Aritmético Simples de Quantidade 
n
q
q abab
∑
=
,
,
, 
onde 
abq ,
 
= Relativos de Quantidades dos Itens considerados; 
n
 
= Número de Itens Considerados. 
 
2 - Número índice aritmético ponderado (IAP) 
 
Seu cálculo é uma média aritmética ponderada, em que as variáveis são os números relativos e os 
fatores de ponderação as quantidades originais do período dado (atual). 
 ( )
∑
∑
=
×
aiq
aiqbaiP
baIAP
)(
 
 
 
 
 
 
 
 
 
 
UNIVERSIDADE FEDERAL DO PARÁ 
FACULDADE DE ESTATÍSTICA - CURSO DE BACHARELADO EM ESTATÍSTICA 
ESTATÍSTICA DESCRITIVA – Profa. Dra. Silvia dos S. de Almeida 
 
34
III - NÚMEROS ÍNDICES OU COMPLEXOS 
 
Estes índices também são chamados de índices agregativos ponderados. A ponderação proposta 
nestes índices baseia-se na participação de cada bem no valor transacionado total e é feita, em geral, 
segundo dois critérios: peso fixo na época básica ou peso variável na época atual. 
 
1 - Números índices complexos de Laspeyres (ou método da época-base) 
Neste índice, a base de ponderação é a época básica; daí a denominação método da época básica. 
a) Números Índices de Laspeyres de Preço - abPL , 
 
∑
∑
=
×
×
ibqibP
ibqiaP
abPL ,
 
 
onde : 
abPL ,
 
= Índice de Preço de Laspeyres 
iaP
 
= Preços da Época Atual 
ibq
 
= Quantidade da Época Base 
ibP
 
= Preços da Época Base 
 
b) Números Índices de Laspeyres de Quantidade abQL , 
 O índice de quantidade, pelo método de Laspeyres, é obtido permutando-se p e q da expressãode 
preços. 
 
∑
∑
=
×
×
ibPibq
ibPiaq
abQL ,
, 
 
onde 
abQL ,
 
= Índice de Quantidade de Laspeyres 
iaq
 
= Quantidade da Época Atual 
ibq
 
= Quantidade da Época Base 
ibP
 
= Preços da Época Base 
 
 
 
 
 
 
 
 
 
 
 
UNIVERSIDADE FEDERAL DO PARÁ 
FACULDADE DE ESTATÍSTICA - CURSO DE BACHARELADO EM ESTATÍSTICA 
ESTATÍSTICA DESCRITIVA – Profa. Dra. Silvia dos S. de Almeida 
 
35
2 - Números índices de Paasche ou Método da época atual 
 
Neste índice, a base de ponderação é a época atual, daí a denominação método da época atual. 
 
a) Número índice de Paasche de Preços abPP , 
 
∑
∑
=
×
×
iaqibP
iaqiaP
abPP ,
 
 
onde : 
 
abPP ,
 
= Índice de Preço de Paasche 
iaP
 
= Preços da Época Atual 
iaq
 
= Quantidade da Época Atual 
ibP
 
= Preços da Época Base 
 
b) Números índices de Paasche de Quantidade abQP , 
 
∑
∑
=
×
×
ibqiaP
iaqiaP
abQP ,
 
onde 
abQP ,
 
= Índice de Quantidade de Paasche 
iaP
 
= Preço da Época Atual 
iaq
 
= Quantidade da Época Atual 
ibq
 
= Quantidade da Época Base 
 
 
Exemplo - Dada a tabela abaixo, calcule os índices de preço e quantidade de Laspeyres e Paasche. 
 
 1998 1999 
PRODUTOS Preço Qtde. Preço Qtde. 
A 
B 
C 
3 
4 
7 
2 
6 
4 
1 
5 
3 
4 
2 
2 
 
 
 
 
 
 
 
 
UNIVERSIDADE FEDERAL DO PARÁ 
FACULDADE DE ESTATÍSTICA - CURSO DE BACHARELADO EM ESTATÍSTICA 
ESTATÍSTICA DESCRITIVA – Profa. Dra. Silvia dos S. de Almeida 
 
36
10.3 - MUDANÇA DE BASE DOS NÚMEROS ÍNDICES 
 
 Na prática, é desejável que o período-base escolhido, para fins de comparação, seja de 
estabilidade econômica e não esteja muito distante no passado; de tempos em tempos, entretanto, 
pode ser necessário mudar o período-base (mudança de base) 
 
 A mudança de base é feita dividindo-se os números índices de uma série original pelo 
índice correspondente à nova época-base. 
 
Obs.: a mudança de base não é valida para os índices complexos, visto estes apresentarem 
pesos variáveis, exigindo a mudança no período de referência mudança nos pesos. 
 
Ex: Na tabela abaixo, encontra-se a produção anual de tratores no período de 1976 a 1982. Reduzir 
os dados a quantidades relativas, utilizando como base o ano de 1979. 
 
ANOS 1976 1977 1978 1979 1980 1981 1982 
TRATORES 71 59 55 64 69 47 37

Outros materiais