Buscar

Guia de estudos_estatistica_UFLA

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 171 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 171 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 171 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Guia de estudos de 
Estatística 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Guia de estudos de Estatística 
 
UUNNIIDDAADDEE 11 
IINNTTRROODDUUÇÇÃÃOO 
 
 
1.1. O CONCEITO DE ESTATÍSTICA 
 
Vamos buscar definir Estatística, e, para tanto, os dois conceitos a seguir são adequados. 
Conceito 1.1. Estatística. Conjunto de técnicas que se ocupa com a coleta, organização, análise e 
interpretação de dados, tendo um modelo por referência. 
 
Conceito 1.2. Estatística. Conjunto de métodos de obtenção e utilização de informações, para 
auxiliar a tomada de decisões em uma situação prática envolvendo incerteza. 
 
Conforme se observa pelo conceito 1.1, para descrever um fenômeno ou um sistema, a 
Estatística faz uso de dados (observações), os quais contêm as informações relevantes para a 
elaboração e a validação de modelos. 
 Mais alguns conceitos básicos se fazem necessários: 
Conceito 1.3. População. Corresponde ao sistema total, ou ao todo que se quer descrever, sem 
generalizações para um universo maior, ou para o futuro. É sempre um conjunto de elementos com 
características em comum. 
 
A população pode ser um conjunto de peças de um lote, de anos, de pontos no solo de um 
talhão, de animais, de plantas, entre outros. As populações podem ser classificadas em: 
 a) Finitas ou Reais; 
 b) Infinitas ou Conceituais. 
 
Populações reais são, por exemplo, todas as árvores de um povoamento florestal, ou todo 
o solo de um talhão de área. Por terem existência real, possuem número finito de elementos. 
Quanto às populações conceituais são aquelas sem existência real, mas de concepção 
bem definida, como o conjunto total de frangos que poderiam ser alimentados com uma certa 
Guia de estudos de Estatística 
 
ração, em condição de confinamento; ou ainda, todas as plantas de uma certa cultivar de milho 
que foram, são ou poderão vir a ser plantadas em condições de cerrado. Pela própria definição, 
tais populações só podem ser de tamanho infinito, porque nunca se disporá de todos os seus 
elementos na prática. 
 É conveniente observar que, muitas vezes, as populações reais têm um número de 
elementos tão grande, que são consideradas, sem maiores problemas, como sendo infinitas. 
Alguns exemplos são: a população de todos os pés de eucalipto existentes numa grande fazenda 
de reflorestamento ou, ainda, a população de todas as moléculas que compõe o volume de ar de 
uma sala. Neste texto, o número total de elementos de uma população finita será simbolizado pela 
letra maiúscula “N”. 
Nos primórdios do conhecimento estatístico, a descrição era feita apenas para populações 
reais, e por meio da observação de todos os seus elementos, conhecida como censo. Tais 
levantamentos eram (e são) em geral dispendiosos, e, portanto, promovidos pelo Estado. A palavra 
“Estatística” vem de “Estado”, por causa disso. 
 
Felizmente, com o desenvolvimento da teoria de probabilidades, a partir do século XVIII, 
verificou-se que as características populacionais poderiam ser obtidas (com grau variável de 
confiança) a partir da observação de parte dos elementos da população, conhecida como amostra. 
 
Conceito 1.4. Censo. Atividade de inspecionar (observar) todos os elementos de uma população 
real, objetivando conhecer, com certeza, as suas características. 
 
Conceito 1.5. Amostra. Um subconjunto ou parte da população. Ela sempre é finita. 
 
O critério básico para diferenciar uma população de uma amostra é a seguinte questão: 
“usarei minhas análises para extrapolar/generalizar os resultados para um universo maior, ou para 
o futuro?”. Se a resposta for “sim”, os dados representam uma amostra, se “não”, representam 
uma população. O número finito dos elementos da amostra será simbolizado pela letra minúscula 
“n”. 
 O processo de coleta de uma ou mais amostras de uma população é conhecido como 
amostragem. Como será visto ao longo do texto, existem maneiras adequadas de se proceder a 
amostragem, de modo a garantir que as amostras guardem características mais próximas 
possíveis da população, o que é chamado de representatividade. 
 
Guia de estudos de Estatística 
 
Conceito 1.6. Amostragem. Processo de obtenção ou coleta de amostras de uma população. 
 
O objetivo último da Estatística é o de descrever e/ou tomar decisões a respeito da 
população. Se isto é feito por meio de amostras, ao invés de censos, em razão da inviabilidade 
destes últimos, então deve ficar claro que a descrição da amostra objetiva, em última instância, 
descrever a população. Esse processo é chamado de inferência estatística, ou inferência indutiva, 
porque induzir consiste em buscar generalização para um todo (população) a partir de parte do 
todo (amostra). 
 
Conceito 1.7. Inferência Estatística. Processo de se tirar conclusões ou tomar decisões acerca da 
população com base em uma amostra dessa população. 
 
Assim, didaticamente, o estudo da Estatística é dividido nos seguintes itens: 
a) Estatística Descritiva: objetiva sintetizar a informação contida em um conjunto de dados, seja ele 
referente a uma população finita ou a uma amostra. 
b) Teoria de Probabilidades: objetiva descrever e prever as características de populações infinitas. 
c) Teoria da Amostragem: é a formalização de um conjunto de técnicas para a coleta de amostras 
em uma população. 
d) Inferência Estatística: como já definida, trata da obtenção de informações a respeito da 
população a partir de amostras, resultando na tomada de decisões a seu respeito. Como será visto 
ao longo do texto, basicamente a inferência é praticada mediante: 1) a estimação de parâmetros 
associados a modelos probabilísticos; e 2) testes de hipótese de interesse, sobre esses mesmos 
modelos. 
 
1.2. VARIÁVEIS E DADOS 
 
De todas as características da população, sua descrição é feita por aquelas de maior 
interesse do pesquisador. Por exemplo, as plantas de uma cultivar de milho definem uma 
população, a qual é descrita por características de interesse econômico, tais como: produtividade 
(t/ha), resistência a doenças, o ciclo cultural, arquitetura de planta, etc. 
 As características que descrevem a população são chamadas variáveis, e um valor 
observado com relação a uma variável é chamado dado ou observação, sejam eles provenientes 
de censos ou de amostras. 
Guia de estudos de Estatística 
 
 
Conceito 1.8. Variável. Característica pela qual deseja-se que a população seja descrita, ou pela 
qual decisões acerca da população são tomadas. 
 
Conceito 1.9. Dado. Observação ou realização referente a uma variável. Pode estar contido em um 
censo ou em uma amostra. 
 
Uma classificação possível quanto à natureza das variáveis está apresentada abaixo. 
As variáveis qualitativas (também denominadas categóricas) correspondem a atributos, 
categorias, e são oriundas da operação de classificação. Elas são nominais quando não são 
passíveis de ordenação, como, por exemplo, a cultura predominante em propriedades de uma 
região. As realizações dessa variável qualitativa nominal podem ser: milho, cana, soja, etc. 
Quando os atributos são passíveis de ordenação, a variável qualitativa é dita ordinal; por 
exemplo, esse é o caso quando usam notas para avaliar uma característica. Por exemplo, em um 
laboratório de cultura de tecidos, esse critério por vezes é utilizado para classificar o grau de 
regeneração no processo de micropropagação. 
Quanto às variáveis quantitativas, estas correspondem a números resultantes das 
operações de contagens ou medições, por isso também chamadas de numéricas. Quando se trata 
de contagens, como o número de ovos ovipositados por um inseto, a variável é dita discreta, sendo 
possível a separação em classes distintas (não há realização intermediária entre 2 e 3 ovos, por 
exemplo) normalmente associadas aos números internos. Outros exemplos são: número de folhas 
atacadas por certa praga; número de brotos germinados por tubérculode batata, etc. 
Nas variáveis quantitativas contínuas, as realizações resultam de medição, uma 
mensuração, como a altura de pés de algodão ou o peso de novilhas, não havendo assim classes 
distintas, mas antes um intervalo de números reais possíveis, só limitados pela precisão dos 
aparelhos de medida empregados (balança, paquímetro, etc). Alguns autores ainda subdividem as 
variáveis quantitativas contínuas em graduadas e proporcionais. 
As graduadas (ou de razão) são aquelas onde intervalos são definidos (como em toda 
variável quantitativa), mas o ponto de referência é arbitrário. Por exemplo, considere a escala 
Celsius de temperatura. Suponha que um pesquisador descubra que uma técnica bioquímica é 
mais eficiente a 15 0C do que a 10 0C. Nestes casos, deve-se tomar cuidado em afirmar que, 
aumentando a quantidade de calor em 50%, a eficiência da técnica aumentou, porque o ponto de 
referência (0 0C) foi escolhido arbitrariamente, como sendo aquele no ponto de congelamento da 
água, sob uma pressão específica. Se o ponto de referência fosse deslocado, por exemplo, para o 
Guia de estudos de Estatística 
 
zero absoluto (escala Kelvin), o aumento de temperatura acima seria de apenas 5 / (273+10) = 
1,8%. 
As proporcionais são aquelas onde intervalos também são definidos, mas o ponto de 
referência é absoluto. Por exemplo, dizer que o híbrido de milho A produz 10% mais que o híbrido 
B (em t/ha) tem sentido, uma vez que o ponto de referência (a produção zero) é natural, absoluta; 
não existe produção abaixo desse valor. 
Por fim, observe como estamos rodeados de variáveis e dados “por todos os lados”: no 
calendário abaixo, temos variáveis categóricas (o mês do ano, o dia da semana, a condição 
climática do dia) e variáveis numéricas (o dia do mês). Poderíamos ter, em alguma estação 
climatológica, os dados da variável numérica precipitação pluviométrica, temperatuta média do dia, 
entre muitas outras. 
 
 
 
 
 
 
 
 
 
Guia de estudos de Estatística 
 
1.3. A NOTAÇÃO DE SOMATÓRIO 
 
Apesar de existir vários tipos de variáveis, é muito frequente, em Estatística, trabalhar-se 
com variáveis quantitativas. Essas variáveis são, em geral, simbolizadas por alguma letra latina 
maiúscula, como X, Y, Z, etc. As observações ou dados, por sua vez, são representadas pelas 
letras minúsculas correspondentes. Além disso, os dados são identificados por um índice, ou 
contador, para indicar que trata-se da 1a observação, da 2a e assim por diante. Por exemplo, o 
símbolo x1 representa a 1
a observação do conjunto de dados (seja ele um censo ou uma amostra), 
referente à variável quantitativa X. 
 Como também é muito comum o interesse no cálculo de somas, somas de termos ao 
quadrado, cálculo de médias, entre outras, então é usual representar somas por um operador 
chamado somatório, que é representado pela letra grega “sigma” maiúscula �. Assim, por 
exemplo, a soma: 
 x1 + x2 + x3 + x4 , 
é representada em notação de somatório da seguinte forma: 
 ∑
=
4
1i
ix , 
ou seja, corresponde à soma dos termos “xi”, onde o índice i varia de 1 a 4. Esse operador é 
também uma taquigrafia matemática. 
 Em função de sua própria definição, o operador somatório possui algumas regras, dadas a 
seguir: 
 
1) Se k é constante, então: 
 ∑
=
n
i
k
1
 = k + k + ... + k = n k . 
 2) Se k é constante e xi valores de uma variável quantitativa, então: 
 ∑
=
n
i
ikx
1
 = k x1 + k x2 + ... + k xn = k (x1 + x2 + ... + xn) = k ∑
=
n
i
ix
1
. 
 3) O somatório de uma soma de variáveis é igual à soma dos somatórios de cada variável: 
 ( )∑
=
++
n
i
iii zyx
1
 = ∑
=
n
i
ix
1
 + ∑
=
n
i
iy
1
 + ∑
=
n
i
iz
1
 . 
Em consequência das regras 1, 2 e 3, se “a” e “b” são constantes, então: 
Guia de estudos de Estatística 
 
 4) ( )∑
=
+
n
i
ibxa
1
 = ∑
=
n
i
a
1
 + ∑
=
n
i
ibx
1
 = n.a + b. ∑
=
n
i
ix
1
 . 
 
 
 
1.4. EXERCÍCIOS RESOLVIDOS 
 
 
1. Expresse as seguintes somas usando notação de somatório: 
a. y 1 + y 2 + ... + y15 = i
15
1i
y∑
=
 
b. x 21 + x
2
2 + ... + x
2
n = 
2
i
n
1i
x∑
=
 
c. z
1
1 + z
2
3 + z
3
5 + ... + z
30
59 = ∑
=
−
30
1i
i
1i2z 
d. log x 1 + log x 2 + ... + log x 12 = ∑
=
12
1i
ixlog 
e. ( x1 - 1 ) + ( x
2
2 - 2
2 ) 2 + ( x
3
3 - 3
3 ) 3 + ... + ( x nn - n
n ) n = ∑
=
−
n
1i
iii
i )ix( 
 
2. Sabendo que: 
∑
=
=
4
1i
i 16x , ∑
=
4
1i
2
ix = 84 , ∑
=
=
4
1i
3
i 496x , ∑
=
=
4
1i
i 20y , ∑
=
=
4
1i
ii 100yx 
Determine o valor numérico das expressões: 
a) 39610049625x)25x(
4
1i
4
1i
3
i
4
1i
3
i =−=−=− ∑∑∑
===
 
b) ∑∑
==
=−+−=−
4
1
23
4
1
3 )3375202540527()153(
i
iii
i
i xxxx 
 =−+− ∑ ∑∑ ∑
= == =
4
1
4
1
4
1
4
1
23 3375202540527
i i
i
i i
ii xxx 
∑ ∑ ∑
= = =
=−+−
4
1
4
1
4
1
23 )3375(4202540527
i i i
iii xxx 
 172833754)162025()84405()49627( −=×−×+×−× 
 
 
 
 
Guia de estudos de Estatística 
 
1.5. EXERCÍCIOS PROPOSTOS 
 
 
1. Desenvolva cada uma das seguintes expressões, colocando-as na sua forma mais simples 
possível: 
 
a) ∑
=
5
1i
ix b) ∑
=
5
1i
2
iixz c) ∑
=
6
1i
iiyx d) ∑
=
−
4
1i
i xx 
e) ∑
=
−
6
1i
2
i )xx( 
 
2. Escreva em notação sigma (somatório) 
 
a) n21 x...xx +++ 
b) 
2
n21 )x...xx( +++ 
c) 721 x...xx +++ 
d) 
2
n
2
2
2
1 x...xx +++ 
 
 3. Sejam os conjuntos de dados: x= {4,3,0,1} e y={3,0,1,3}. Obtenha os seguintes somatórios: 
a) ∑
=
4
1i
ix b) ∑
=
4
1i
2
ix c) ∑
=
4
1i
iiyx 
d) 
2
4
1i
i )x(∑
=
 e) 
2
11
2
111








−
















−
=
∑∑
∑∑∑
==
===
n
i
i
n
i
i
n
i
i
n
i
i
n
i
ii
xxn
yxyxn
b xbya −= 
 
 
 
 
 
 
 
 
 
 
Guia de estudos de Estatística 
 
UUNNIIDDAADDEE 22 
EESSTTAATTÍÍSSTTIICCAA DDEESSCCRRIITTIIVVAA 
 
 
2.1. INTRODUÇÃO 
 
Neste capítulo serão abordados os conceitos elementares para a descrição de um conjunto 
de dados, objetivando a retirada de informações que sejam pertinentes, interessantes, e úteis. 
Duas situações devem ser ressaltadas: uma, onde os dados provêm de observações de uma 
população finita, a qual é toda ela conhecida, sendo, assim, elementos de um censo, e outra, 
quando os dados originam-se de uma amostra, recurso utilizado quando é impossível ou inviável 
observar todos os elementos individuais da população. O conjunto de conceitos e métodos 
estatísticos que operam sobre estes dois tipos de situação, populações finitas e amostras, é 
denominado Estatística descritiva. 
2.2. DESCRIÇÃO DE VARIÁVEIS CATEGÓRICAS 
 O conjunto de dados que se deseja descrever pode se referir a uma variável categórica 
(também denominada qualitativa). A título de ilustração, seja o exemplo hipotético a seguir (Tabela 
2.1), representando a atividade agropecuária predominante em 20 propriedades de um município. 
Este conjunto de dados será tratado, como informamos, considerando-o como uma amostra, 
proveniente de uma população das muitas propriedades de tal município. Como se observa, a 
atividade predominante corresponde a uma variável categórica nominal, pois não é passível de 
ordenação. 
 A maneira como os dados estão apresentados na Tabela 2.1 não deixa de ser uma 
representação. No entanto, não é difícil perceber que se trata de uma disposição muito limitada  
por exemplo, não se visualiza a atividade agropecuária predominante no município, e assim por 
diante. Uma maneira de realçar esse tipo de informação é apresentando a frequência de cada 
Tabela 2.1. Atividade predominante em 20 propriedades de um município. 
Café Leite Leite Milho 
Café Milho Soja Leite 
Leite Café Milho Café 
Olericultura Leite Café Laranja 
Café Milho Café Café 
atividade no município. 
Guia de estudos de Estatística 
 
 
Conceito 2.1. Frequência (de ocorrência) . Medida que quantifica, contando, a ocorrência dosvalores de uma variável em um dado conjunto de dados. 
 
 A frequência associada a uma variável X pode ser classificada em três tipos, conforme a 
Figura 2.1: 
 
 
 
 
 
Figura 2.1. Tipos de frequência de ocorrência. 
 
 A frequência absoluta, no caso de variáveis qualitativas, nada mais é do que o 
número de observações ocorridos (contadas) em cada classe da variável em questão. É 
representada por fa(x), ou simplesmente fa. A frequência relativa (fr) é obtida pela divisão da 
frequência absoluta pelo número total de dados ou observações. A frequência percentual (ou 
porcentual) (fp) é fornecida pela multiplicação da frequência relativa por 100%. 
 No exemplo das atividades agropecuárias predominantes em propriedades, as frequências 
correspondentes da categoria ‘Café’ são: 
 fa(café) = 8 ; 
 fr(café) = 
20
8
 = 0,40 ; 
 fp(café) = 0,40 × 100% = 40%. 
Assim, de forma geral, uma maneira informativa de descrever o conjunto de dados da Tabela 2.1 é 
a de apresentar as frequências de cada categoria da variável ‘atividade agropecuária’, ou seja, 
mostrar a sua distribuição de frequência. 
 
Conceito 2.2. Distribuição de Frequência . Consiste em uma função que associa os valores que 
uma variável assume com suas frequências de ocorrência, podendo ser elas absolutas, relativas 
ou percentuais. 
 
 
Frequência 
Absoluta (fa) 
 
Relativa (fr) 
 
Percentual (fp) 
Guia de estudos de Estatística 
 
A distribuição de frequência de uma variável observada em população finitas e amostras, 
pode ser apresentada mediante duas maneiras; a representação tabular ou a representação 
gráfica. A representação tabular consiste em dispor a distribuição de frequência das categorias da 
variável em tabelas. Para exemplificar, seja a Tabela 2.2 a seguir, representando a distribuição de 
frequência absoluta da atividade agropecuária predominante em 20 propriedades de um município. 
 
Tabela 2.2. Distribuição da frequência absoluta da atividade agropecuária predominante em 20 
propriedades de um município. 
Atividade predominante Frequência absoluta 
Café 8 
Milho 4 
Leite 5 
Olericultura 1 
Soja 1 
Laranja 1 
Total 20 
Fonte: dados fictícios. 
 
Essa representação tabular poderia ter seu aspecto melhorado pela criação de uma nova 
categoria, por exemplo, denominada ‘Outras’, que incluiria aquelas classes de menor frequência, a 
saber, Olericultura, Soja e Laranja. Opções como estas são fortemente dependentes dos objetivos 
e do bom senso do pesquisador. A nova representação da distribuição de frequência seria como a 
da Tabela 2.3. 
 Outra observação pertinente é a seguinte: nesse exemplo, a variável é qualitativa nominal, 
e, portanto, sem ordenação natural. Um critério sensato de ordenação, que facilita a interpretação 
dos dados, é a de dispô-las de maneira que as frequências correspondentes estejam ordenadas, 
como observado na Tabela 2.3. Além disso, a classe ‘Outras’, quando presente, deve 
preferencialmente vir em último lugar, mesmo que sua frequência seja maior. Outrossim, quando a 
variável for qualitativa ordinal como, por exemplo, o conjunto de notas: 
 {ótimo, bom, regular, ruim} 
então, a distribuição de frequência deve ser disposta respeitando-se a ordem das categorias da 
variável, crescente ou decrescente, mesmo que não seja obedecida a ordem de magnitude das 
frequências. 
 
Guia de estudos de Estatística 
 
Tabela 2.3. Distribuição da frequência absoluta da atividade agropecuária predominante em 20 
propriedades de um município. 
Atividade predominante Frequência absoluta 
Café 8 
Leite 5 
Milho 4 
Outras 3 
Total 20 
Fonte: dados fictícios. 
 
Quanto a sua estrutura, de maneira geral, as tabelas têm os seguintes componentes: título, 
cabeçalho, coluna indicadora, corpo, linha de totais e rodapé (Figura 2.2). Estes são definidos 
como: 
- O título deve conter as informações relativas ao conteúdo da tabela, a(s) variável(eis) dispostas, 
podendo ainda conter o local de coleta dos dados, e quando e como foi realizado o estudo. O título 
deve responder, no mínimo, a 3 perguntas: “o quê?”, “onde?”, e “quando?”. O cabeçalho especifica 
as variáveis e a frequência (ou outra característica) correspondente aos seus valores. 
- O corpo é representado por uma série de colunas e subcolunas, dentro das quais são colocados 
os dados apurados. Segundo o corpo, as tabelas podem ser de entrada simples, de dupla entrada, 
e de múltipla entrada. A Tabela 2.3 é de entrada simples. A cada entrada corresponde uma linha 
(ou coluna) de totais. Um exemplo de tabela de dupla entrada seria a classificação das 
propriedades também segundo o nível de tecnologia utilizada (Tabela 2.4). Observe que há duas 
totalizações marginais (totais de linhas e totais de colunas), e uma totalização geral. 
- No rodapé, são colocadas a legenda e todas as observações que venham a esclarecer a 
interpretação da tabela. Geralmente também é disposta a fonte dos dados (entidade que os 
fornece), embora em alguns casos, seja colocada no título. 
 
Guia de estudos de Estatística 
 
 
Figura 2.2. Componentes de uma tabela. 
 
Tabela 2.4. Distibuição de frequências absolutas das atividades predominantes e do nível de 
tecnologia utilizada em propriedades de um município. 
 Nível de tecnologia utilizada 
Atividade predominante Baixo Médio Alto Totais 
Café 1 3 4 8 
Leite 3 2 0 5 
Milho 3 1 0 4 
Olericultura 0 1 0 1 
Soja 0 0 1 1 
Laranja 0 0 1 1 
Totais 7 7 6 20 
 Fonte: dados fictícios. 
 
Traços horizontais para separar linhas são bastante utilizados. Quanto aos traços verticais, há a 
tendência no meio científico de serem evitados, quando não houver prejuízo na qualidade de 
apresentação. 
Dependendo do contexto, alguns componentes podem estar ausentes. Nota-se que a 
Tabela 2.1 é de natureza bastante simplificada, não tendo cabeçalho, coluna indicadora, linha de 
totais ou rodapé. Pode-se dizer que o título e o corpo são os componentes mínimos de uma tabela. 
Guia de estudos de Estatística 
 
A idéia básica por trás de todas as regras de construção de uma tabela é que “uma tabela deve ser 
autoexplicativa”, i.é, o leitor não deve precisar ter que recorrer ao texto para compreender um 
tabela: ela se explica por si mesma (a mesma regra básica vale para figuras, cujos métodos de 
construção serão vistos em seguida). 
Além da representação tabular, a representação dos dados também pode ser feita 
mediante gráficos. Para a representação de distribuições de frequência referentes a variáveis 
qualitativas, existem três gráficos mais utilizados: o gráfico de linhas, o gráfico de barras, e o 
setorgrama. O gráfico de linhas consiste em dois eixos, onde a frequência (absoluta, relativa ou 
porcentual) é disposta no eixo vertical e as classes da variável no eixo horizontal, sendo a 
identificação de cada par ordenado feita por uma linha vertical ligando o par ordenado ao eixo 
horizontal. O gráfico de linhas referente ao exemplo das atividades agropecuárias predominantes 
está apresentado na Figura 2.3. 
 
Conceito 2.3. Gráfico . Diagrama ou figura para ilustração de fenômenos ou tendências, no qual 
existem escalas definidas. 
 
 
Café Leite Milho Outras
0
0,1
0,2
0,3
0,4
0,5
 
Figura 2.3. Gráfico de linhas representando a distribuição de frequência relativa referente à 
atividade agropecuária predominante em propriedades de um município fictício. 
 
O gráfico de barras é bastante semelhante ao gráfico de linhas, com a diferença de que 
barras são utilizadas ao invés de linhas (Figura 2.4). 
Guia de estudos de Estatística 
 
Café Leite Milho Outras
0
0,1
0,2
0,3
0,4
0,5
 
Figura 2.4 . Gráfico de barras verticais representando a distribuição de frequência relativa referente 
à atividade agropecuária predominante em propriedades de um município fictício. 
 
É importante salientar que, na disposição gráfica de variáveis qualitativas, devem ser padronizadas 
as distânciasentre as categorias, bem como a largura das colunas, para que não cause falsas 
impressões, em razão da escala desigual. Uma outra opção para o gráfico de barras é que estas 
podem ainda ser horizontais (Figura 2.5). Outros recursos que algumas vezes são empregados em 
gráficos de barras são a moldura e os traços. Estes últimos, em geral, são apenas traçados 
paralelamente ao eixo x, para facilitar a visualização dos valores referentes às frequências (Figura 
2.6). 
 O setorgrama (também chamado de gráfico circular, gráfico de setores ou gráfico de pizza) 
consiste na figura de um círculo, cujos setores correspondem a categorias da variável em questão, 
possuindo áreas proporcionais às frequências relativas ou porcentuais. Para a construção de um 
setorgrama, basta obter o ângulo referente ao setor de uma dada categoria, pelo uso de uma regra 
de três. Por exemplo, para a atividade agropecuária ‘Café’, do exemplo anterior, tem-se, para as 
frequências porcentuais: 
 100%  360o 
 40%  x 
E assim, x = 144o. Os setores correspondentes podem ser então traçados. Hoje em dia, são 
disponíveis muitos softwares que constroem esse tipo de representação gráfica, e outros. 
 
Guia de estudos de Estatística 
 
Café
Leite
Milho
Outras
0 0,1 0,2 0,3 0,4 0,5
 
Figura 2.5. Gráfico de barras horizontais representando a distribuição de frequência relativa 
referente à atividade agropecuária predominante em propriedades de um município fictício. 
 
Café Leite Milho Outras
0
0,1
0,2
0,3
0,4
0,5
 
Figura 2.6. Gráfico de barras verticais representando a distribuição de frequência relativa referente 
à atividade agropecuária predominante em propriedades de um município fictício, contendo 
moldura e traços. 
 
O setorgrama referente ao exemplo das atividades agropecuárias está apresentado na Figura 2.7. 
 
Guia de estudos de Estatística 
 
Café 
40,0%
Leite 
25,0%
Milho 
20,0%
Outras 
15,0%
 
Figura 2.7. Setorgrama representando a distribuição de frequência relativa referente à atividade 
agropecuária predominante em propriedades de um município fictício. 
Fonte: dados fictícios, apenas para efeito didático. 
 No caso de variáveis qualitativas ordinais, a representação gráfica é muito semelhante a 
das nominais. Deve-se cuidar, contudo, para que a ordem das categorias da variável seja 
respeitada ao longo do eixo referente à variável, ou qualquer outra disposição conjunta delas. 
 Observe também o local de colocação de títulos em tabelas e figuras: em tabelas o título 
deve ficar em cima e em figuras o título deve ficar em baixo. 
 
2.3. DESCRIÇÃO DE VARIÁVEIS NUMÉRICAS 
 Variáveis quantitativas (numéricas) podem ser classificadas em dois tipos: discretas e 
contínuas. Conjuntos de dados referentes a variáveis quantitativas, de um modo geral, podem ser 
descritos de três maneiras: 
 1) Distribuições de freqüência. 
2) Medidas numéricas descritivas: medidas de posição (média, mediana, moda, e quantis) 
e medidas de variabilidade (amplitude total, variância, desvio-padrão, coeficiente de 
variação, entre outras). 
3) Gráficos: histogramas, gráfico de barras, entre outros. 
 
Frequentemente, as três maneiras são empregadas simultaneamente. Veremos o tratamento 
destes modos de descrever separadamente, primeiro para distribuições de freqüência de variáveis 
discretas e contínuas, e seus gráficos, e depois para medidas de posição e variabilidade, tanto 
para discretas quanto para contínuas também. 
Guia de estudos de Estatística 
 
 
2.3.1. Distribuições de freqüência. 
 Nesta seção trataremos de mostrar como se faz distribuições de freqüência tanto para 
variáveis contínuas quanto para variáveis discretas. Começando com as distribuições de 
frequências para variáveis discretas, a representação de um conjunto de dados referentes a 
realizações de uma variável quantitativa discreta é, em geral, bastante semelhante à das variáveis 
qualitativas, pois os valores inteiros que a variável assume podem ser considerados como 
“categorias”, ou “classes naturais”. Como exemplo, sejam dados referentes a um levantamento 
onde observaram-se 91 plantas de café, numa pequena lavoura, nas quais contou-se o número de 
folhas atacadas pela praga ‘bicho mineiro’, em cada planta. Como estabelecido, vamos considerar 
tal massa de dados como uma amostra, proveniente de uma população constituída de todas as 
plantas de café da lavoura de onde estas 91 plantas vieram (evidentemente a lavoura toda, que é a 
população de onde esta amostra veio, possuía muito mais do 91 plantas – frequentemente 
milhares de plantas!). A representação tabular da avaliação desse experimento está apresentada 
na Tabela 2.5. 
 Observa-se que a disposição da variável ‘número de folhas lesionadas’ é semelhante a de 
uma variável qualitativa ordinal com 11 categorias. A representação gráfica é, assim, igualmente 
parecida, embora com a diferença de que a escala referente à variável possui uma interpretação 
diferente, representando elementos do conjunto dos números inteiros. Exemplificando, o gráfico de 
barras horizontais desse experimento está mostrado na Figura 2.8. 
 
Tabela 2.5. Frequência de plantas de café em relação ao grau de infestação de bicho mineiro em 
amostragem em uma cultura de café. Lavras, 2005. 
Número de folhas 
lesionadas 
Frequência 
absoluta (plantas) 
Frequência 
percentual (%) 
0 3 3,30 
1 8 8,79 
2 15 16,48 
3 22 24,18 
4 21 23,08 
5 16 17,58 
6 4 4,40 
7 0 0,00 
8 2 2,20 
9 0 0,00 
 10 ou mais 0 0,00 
Total 91 100,00 
Fonte: levantamento amostral in loco na lavoura. 
Guia de estudos de Estatística 
 
0 1 2 3 4 5 6 7 8 9 10
0
5
10
15
20
25
 
Figura 2.8. Gráfico de barras verticais representando a frequência porcentual de plantas de café 
em relação ao grau de infestação de bicho mineiro, em amostragem na cultura do café. Lavras, 
2005. 
Fonte: levantamento amostral in loco na lavoura. 
 
Voltando-nos agora para a representação de variáveis numéricas contínuas, devemos 
explicitar que tal representação apresenta uma dificuldade adicional, em relação às discretas, e 
mesmo em relação às variáveis categóricas. Não existem aqui, em variáveis contínuas, “classes 
naturais”, porque as realizações (dados) de variáveis contínuas são números pertencentes ao 
conjunto dos números reais, e, assim, existe um conjunto infinito não-numerável (não-contável) de 
valores que a variável pode assumir. A título de ilustração, considere o exemplo a seguir, relativo à 
produção diária de leite (kg), durante o período de lactação, de um rebanho de 201 vacas da raça 
holandesa, pertencente a uma fazenda de gado holandês do Sul de Minas Gerais (Tabela 2.7). 
Vamos considerar estes dados como uma amostra, oriunda de uma população que poderia ser o 
conjunto de todas as vacas holandesas do Sul de Minas Gerais 
A solução para o problema da inexistência de classes naturais consiste na elaboração de 
classes a partir de intervalos, fixando um número adequado de classes segundo algum critério. Um 
exemplo de intervalo seria (5,0 ; 10,0), onde 5,0 kg é o limite inferior do intervalo, e 10,0 kg seria o 
limite superior do intervalo. 
A seguir, é apresentado um algoritmo (uma sequência de passos), propondo uma maneira 
de obtenção de uma distribuição de frequência relativa a uma variável numérica contínua, sendo o 
conjunto de dados referente a uma amostra. Antes do algoritmo, porém, devemos esclarecer que a 
 
Guia de estudos de Estatística 
 
Tabela 2.7. Produção diária de leite (kg), durante o período de lactação, de 201 vacas da raça 
holandesa, de um rebanho pertencente à fazenda Itirapuan, Sul de Minas Gerais, 2005. 
24,7 25,8 23,6 18,6 20,7 22,4 22,4 21,4 
19,2 18,2 21,2 20,0 17,8 17,5 19,7 23,7 
15,3 13,6 20,7 17,0 15,7 15,1 13,8 11,1 
14,7 17,6 16,2 13,4 13,2 14,1 13,1 20,1 
19,8 16,8 12,0 11,9 15,0 14,1 14,4 6,9 
26,6 24,6 22,2 22,8 24,0 30,6 33,0 23,0 
20,9 19,5 21,2 20,4 23,3 27,1 21,620,4 
25,5 19,6 26,2 21,6 14,3 17,9 15,4 12,6 
13,2 13,3 12,8 10,4 11,5 10,3 10,6 14,1 
13,8 27,5 25,4 26,6 28,5 25,9 25,2 26,3 
24,7 24,1 23,3 22,7 19,0 22,8 22,3 23,7 
21,0 19,3 21,2 19,7 16,7 19,3 18,9 19,7 
22,6 25,2 30,4 22,6 15,3 17,9 21,6 21,0 
25,1 21,3 26,2 23,8 24,6 27,3 18,9 18,8 
14,6 14,1 21,0 23,7 17,3 24,4 17,3 18,6 
19,9 19,5 15,3 20,8 18,9 20,3 18,0 16,9 
20,5 19,7 12,8 21,1 21,0 22,7 15 ,0 15,1 
13,3 17,7 14,1 6,7 14,5 19,3 15,8 16,7 
9,7 14,1 19,5 14,3 17,0 27,5 19 ,0 22,9 
18,0 16,7 18,5 12,9 18,2 14,3 18,6 17,2 
18,6 16,4 18,8 12,6 13,7 10,7 17,5 16,2 
15,1 13,9 11,8 17,8 17,0 15,7 15,3 22,4 
14,1 20,4 19,6 20,1 26,6 33,0 20,0 22,2 
20,4 25,8 17,7 15,0 19,2 12,7 22,7 19,0 
13,5 15,4 14,5 18,5 21,0 32,7 21,8 23,6 
 16,8 
 
 
elaboração de uma distribuição de frequência para variáveis contínuas requer a apresentação de 
alguns conceitos, dados a seguir: 
 
Conceito 2.4. Amplitude ou amplitude total . Corresponde à diferença entre o maior valor e o 
menor valor de um conjunto de dados. Em geral, é simbolizada por “A”. 
 
Conceito 2.5. Amplitude de Classe . Consiste na diferença entre o limite superior e o limite inferior 
de uma classe em uma distribuição de frequência. Será aqui simbolizada por “c”. 
 
Guia de estudos de Estatística 
 
Também, pode ser bastante útil, como primeiro procedimento a ser tomado para a elaboração de 
uma distribuição de frequências de uma variável contínua, proceder a ordenação dos dados, para 
permitir melhor manipulação (Tabela 2.8) 
. 
Tabela 2.8. Dados ordenados relativos à produção diária de leite de 201 vacas da raça holandesa, 
de um rebanho pertencente à fazenda Itirapuan, Sul de Minas Gerais, 2005. 
6,7 13,6 15,1 17,5 19,0 20,4 22,4 24,7 
6,9 13,7 15,3 17,5 19,0 20,4 22,4 24,7 
9,7 13,8 15,3 17,6 19,2 20,5 22,4 25,1 
10,3 13,8 15,3 17,7 19,2 20,7 22,6 25,2 
10,4 13,9 15,3 17,7 19,3 20,7 22,6 25,2 
10,6 14,1 15,4 17,8 19,3 20,8 22,7 25,4 
10,7 14,1 15,4 17,8 19,3 20,9 22,7 25,5 
11,1 14,1 15,7 17,9 19,5 21,0 22,7 25,8 
11,5 14,1 15,7 17,9 19,5 21,0 22,8 25,8 
11,8 14,1 15,8 18,0 19,5 21,0 22,8 25,9 
11,9 14,1 16,2 18,0 19,6 21,0 22,9 26,2 
12,0 14,1 16,2 18,2 19,6 21,0 23,0 26,2 
12,6 14,3 16,4 18,2 19,7 21,1 23,3 26,3 
12,6 14,3 16,7 18,5 19,7 21,2 23,3 26,6 
12,7 14,3 16,7 18,5 19,7 21,2 23,6 26,6 
12,8 14,4 16,7 18,6 19,7 21,2 23,6 26,6 
12,8 14,5 16,8 18,6 19,8 21,3 23,7 27,1 
12,9 14,5 16,8 18,6 19,9 21,4 23,7 27,3 
13,1 14,6 16,9 18,6 20,0 21,6 23,7 27,5 
13,2 14,7 17,0 18,8 20,0 21,6 23,8 27,5 
13,2 15,0 17,0 18,8 20,1 21,6 24,0 28,5 
13,3 15,0 17,0 18,9 20,1 21,8 24,1 30,4 
13,3 15,0 17,2 18,9 20,3 22,2 24,4 30,6 
13,4 15,1 17,3 18,9 20,4 22,2 24,6 32,7 
13,5 15,1 17,3 19,0 20,4 22,3 24,6 33,0 
 33,0 
 
 
 Postas estas considerações preliminares, vamos ao algoritmo: 
Passo 1. Determina-se o número k de classes, baseado em um dos critérios apresentados abaixo: 
i) Critério empírico. Escolhe-se k como um número entre 5 e 20. Se o número n de dados é 
pequeno, mais perto de 5; se n é grande, mais perto de 20. Considera-se que menos de 5 classes 
haveria pouca informação na distribuição de freqüências, pois condensaria excessivamente a 
 
Emanuelle
Realce
Emanuelle
Realce
Guia de estudos de Estatística 
 
massa de dados, e que mais de 20 haveria excesso de classes, tornando a distribuição outra vez 
pouco informativa. Para estes n = 201 dados, podemos utilizar 11 classes. 
ii) Critério de Sturges. Escolhe-se k = 1 + log2 n = 1 + 3,32 nlog10 . Para o exemplo da Tabela 2.8: 
=+= nlog.32,31k 10 ≅+ 201log.32,31 10 9 classes. 
iii) Critério de Scott. Escolhe-se a amplitude de classe c como; 
3
49,3..3.2
3
1
6
1
3
1
n
s
n
s
c == π 
Nota. No critério de Scott, s é o desvio-padrão da amostra, o qual será explicado mais adiante. 
Para a massa de dados da Tabela 2.8, s = 3,94 kg, portanto, c = 3,73 kg. O número de classes k 
será dado por 
k = A / c = (33,0 – 6,7)/3,73 = 7,05, isto é, aproximadamente 7 classes. 
iv) Critério prático. Escolhe-se o número k de classes segundo a Tabela 2.6 abaixo (esta tabela 
constitui-se numa fusão prática dos critérios (ii) e (iii) acima): 
Tabela 2.6. Critério para determinação do número k de classes na distribuição de frequência em 
função do tamenho n da amostra. 
Tamanho da Amostra (n) Número de Classes (k) 
Até 100 Arredondamento de n 
Mais de 100 Arredondamento de 5 n10log 
 
Para n = 201 dados, por exemplo, teríamos k = Arredondamento de 5 201log10 = 12. Este critério 
(iv) é especialmente recomendado, pela sua praticidade e bom desempenho. 
Passo 2. Calcula-se a amplitude total A dos dados: 
 A = Max – Min = x(n) – x(1) 
onde Max = maior valor observado (também simbolizado por x(n)) e Min = menor valor observado 
(também simbolizado por x(1)). Na Estatística é convenção simbolizar dados em ordem crescente 
com o índice da variável envolto por um parêntesis. 
Passo 3. Se k foi calculado anteriormente (quando se usa ou o critério (i) ou (ii) ou (iv)), então 
calcula-se a amplitude de classe c, por meio de: 
 c = 
1k
A
−
 
Guia de estudos de Estatística 
 
Note que aqui o denominador do cálculo da amplitude de classe c corresponde a (k-1), em vez de 
simplesmente k. Se em vez de k, foi dado o valor de c (quando se usa o critério (iii)), então calcula-
se o valor do número k de classes resolvendo-se a fórmula acima para k e arredondando-se para o 
inteiro mais próximo. 
Passo 4. O limite inferior LI1 da 1
a classe é obtido por: 
LI1 = Min - 
2
c
 
Observe que a subtração de c/2 do Passo 4, junto com o divisor k -1 do Passo 3, fazem com que 
os limites de classe extremos (LI1 e LSk) fiquem menor e maior, respectivamente, do que o mínimo 
e o máximo dos dados, ou seja, a distribuição fica mais “espichada”. A razão disto é a de que 
existe uma grande chance de não se ter coletado valores extremos e pouco freqüentes, presentes 
na população, fazendo com que a amplitude total A provavelmente tenha sido subestimada. Os 
passos 3 e 4 buscam corrigir esta subestimação. Quando os valores calculados de LI1 ou LSk forem 
incompatíveis com a variável estudada, pode-se ajustar tais valores. Uma ocorrência freqüente é, 
por exemplo, o cálculo de LI1 entregar um valor negativo, num cenário em que a variável não pode 
assumir valores negativos: neste caso, pode-se levar o valor de LI1 para zero. 
Passo 5. O limite superior da 1a classe é obtido por: 
 LS1 = LI1 + c, 
sendo que LS1 nada mais é que o limite inferior da 2
a classe: 
 LI2 = LS1, 
e assim, sucessivamente, as classes vão sendo construídas. 
Nota 1. Deve-se observar que, sempre que possível, há conveniência em que se tenham todas as 
classes de um histograma (e respectiva distribuição de freqüências) com mesma amplitude, isto é, 
sejam todas de mesmo tamanho. Este algoritmo está construído para que tal igualdade de 
tamanhos seja obtida. 
Nota 2. Há duas alterações que podem ser necessárias neste algoritmo, relativamente as 
instruções de seus passos: 
(i) A primeira, que já foi pré-anunciada parcialmente no passo 4, é de que quando a variável 
estudada tem valores mínimos e máximos naturais, como, por exemplo, notas em 
avaliações escolares numa escala de 0 a 100, onde o mínimo naturalmente é zero 
(não é possível uma nota negativa nesta escala) e o máximo naturalmente é 100 (não 
é possível uma nota maior do que 100 nesta escala), pode se alterar os valores 
calculados de k e/ou c para que LI1 seja igual ao mínimo natural e LSk seja igual ao 
máximo natural. Tal alteração não é obrigatória, mas costuma fazer gráficos e 
distribuições mais interpretáveis. 
Guia de estudos de Estatística 
 
(ii) A segunda é fundir várias classes numa só, ou alterar suas amplitudes de modo adequado 
ao tipo de dados que se tem em mãos. Essa necessidade ocorre quando temos dados 
com valores discrepantes (os outliers) ou quando a pesquisa transcorreu com 
restrições no modo e/ou instrumentode coleta de dados. Neste caso, será quebrada a 
convenção de que as classes tenham o mesmo tamanho, porém, este sacrifício será 
necessário em favor da possibilidade tanto de construir o gráfico e distribuição, quanto 
de interpretá-los. Um exemplo em que houve restrições está na Tabela A: para se 
estudar a distribuição de frequência do consumo semanal Y (kg) de carne de frango, 
em Antônio Dias (MG), foram entrevistadas 60 residências nos dias 20 e 21 de Julho 
de 2001. Os resultados obtidos podem ser visualizados no quadro da distribuição de 
frequência abaixo: 
(iii) 
 
 
 
 Consumo Número de residências 
Praticamente zero 5 
(0, 1] 7 
(1, 2] 22 
(2, 3] 11 
(3, 4] 6 
(4, 5] 6 
 (5, 6] 3 
 Total 60 
 
 
 
Um exemplo em que foi necessário alterar a amplitude das classes por causa de 
valores discrepantes está na Tabela B: na implantação de um Sistema de Gestão 
Ambiental (SGA) no modelo ISO 14.001 numa Pequena Central Hidrelétrica (PCH) a 
variável X: “Volume de solo nas encostas marginais erodidos pela ocorrência de 
processos erosivos” foi avaliada em vários pontos nas encostas do lago. Os dados 
obtidos mostraram valores baixos para X, mas alguns poucos pontos tiveram valores 
muito altos para X (estes são dados discrepantes). Estes outliers acarretaram a 
junção de várias classes, conforme mostra a distribuição de freqüências abaixo. 
 
 
 
 
 
Fonte: levantamento amostral na cidade, nos dias 20 e 21 de Julho de 2.009. 
Tabela A . Distribuição de frequência do consumo (kg) de carne de frango, em Antônio Dias 
(MG), em Julho de 2.001. 
Guia de estudos de Estatística 
 
Tabela B. Volume de solo erodido nas encostas. PCH Jardim do Mato Grosso, 
 MS, Setembro de 2009. 
X: Volume de solo erodido/carreado em m3. Número de ocorrências 
(0; 5] 2.419 
(5; 10] 759 
(10;50] 356 
(50; 100] 27 
Mais de 100 0 
Total 3.561 
Fonte: Levantamento amostral in loco na PCH. 
 
Um exemplo que mostra como a alteração da amplitude das classes afeta o histograma é 
dado abaixo na Figura A: 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Passo 6. Construídas as classes, são contados quantos dados estão contidos em cada classe 
(frequências absolutas de cada classe). 
Passo 7. Opcionalmente, são calculadas as frequências relativas e/ou percentuais de cada classe. 
Passo 8. Para a construção de um histograma, que é o gráfico (ou representação gráfica) de uma 
distribuição de freqüências de variável numérica contínua, é necessária calcular uma quantidade 
denominada densidade de freqüência, definida como: 
dfr(x) 
50 100 150 200 250 300 350 400 
x 
0,0100 
 
 
 
 
0,0075 
 
 
 
 
0,0050 
 
 
 
 
0,0025 
 
 
 
 
Figura A. Histograma das áreas de 1.412 propriedades agropecuárias localizadas na região Sul do estado de 
Minas Gerais, 2006. 
 
Fonte: dados simulados. 
Guia de estudos de Estatística 
 
densidade de frequência = frequência da classe / amplitude da classe, 
df = f / c 
Observe que cada classe tem a sua própria densidade de freqüência, que é calculada dividindo-se 
a freqüência de ocorrência (ou absoluta, ou relativa, ou percentual) daquela classe pela amplitude 
de classe daquela particular classe. 
 
Como exemplo de aplicação do algoritmo acima, serão utilizados os dados referentes ao 
rebanho de gado leiteiro da Tabela 2.8: 
Passo 1 : Escolhe-se k = 10 classes neste exemplo, apenas porque este valor é a média de todos 
os critérios acima (é claro, você pode escolher k segundo qualquer um dos 4 critérios 
individualmente). 
Passo 2 : A = 33,0 - 6,7 = 26,3 kg. 
Passo 3 : c = 26,3 / 9 = 2,92 ⇒ c = 2,9 kg. 
Passo 4 : LI1 = 6,7 - 
2
9,2
 = 5,25. 
Passo 5 : LS1 = LI2 + c = 5,25 + 2,9 = 8,15; 
 LS2 = 8,15 + 2,9 = 11,05, e assim por diante, cumprindo os demais passos. 
A representação tabular dessa distribuição de frequência está apresentada na Tabela 2.9. Para a 
elaboração de gráficos referentes à distribuição de frequência, é necessário o cálculo da densidade 
de frequência de cada classe, já dada como: 
 densidade de frequência = frequência da classe / amplitude da classe 
Por essa definição de densidade, pode-se definir três tipos de densidade, sendo elas referentes à 
frequência absoluta, relativa ou percentual. A densidade de frequência absoluta, por exemplo, é 
simbolizada por dfa, e é dada por: 
dfa(x) = 
( )
c
x fa
 
E assim, analogamente: 
dfr(x) = 
( )
c
xfr 
 e dfp(x) = 
( )
c
x fp
 
 
 
Guia de estudos de Estatística 
 
Tabela 2.9. Distribuição de frequências, relativa à produção diária de leite de 201 vacas da raça 
holandesa, de um rebanho pertencente a fazenda Itirapuan, Sul de Minas Gerais, 2005. 
Classes fa1 fr2 fp3 
(5,25 ; 8,15] 2 0,0100 1,00 
(8,15 ; 11,05] 5 0,0249 2,49 
(11,05 ; 13,95] 23 0,1144 11,44 
(13,95 ; 16,85] 38 0,1891 18,91 
(16,85 ; 19,75] 48 0,2388 23,88 
(19,75 ; 22,65] 37 0,1841 18,41 
(22,65 ; 25,55] 29 0,1443 14,43 
(25,55 ; 28,45] 13 0,0646 6,46 
(28,45 ; 31,35] 3 0,0149 1,49 
(31,35 ; 34,25] 3 0,0149 1,49 
Totais 201 1,0000 100,00 
1. frequência absoluta; 2. frequência relativa; 3. frequência porcentual. 
 Fonte: dados deste livro. 
 
A densidade de frequência permite que se obtenham valores para frequências a partir do cálculo 
de áreas nos gráficos. Esse aspecto torna-se importante em casos onde existem classes com 
amplitudes desiguais. As densidades de frequência relativa para o exemplo do rebanho de gado 
leiteiro estão apresentadas na Tabela 2.10. 
Com o conceito de densidade de frequência, pode-se agora apresentar a principal 
representação gráfica de distribuição de frequência de variáveis contínuas, o histograma. O 
histograma é semelhante ao gráfico de barras verticais, utilizado para variáveis categóricas, com a 
diferença de que as barras são dispostas lado a lado, porque suas extremidades são 
correspondentes aos limites das classes (Figura 2.9). No eixo vertical, se as classes possuem a 
mesma amplitude, podem ser dispostas tanto as frequências como as densidades de frequência. 
Quando as classes possuem amplitudes diferentes, estas últimas devem ser utilizadas. De um 
modo geral, quando um rigor científico é desejado, deve-se sempre dar preferência às densidades 
de frequência, pois, dessa forma, frequências sempre poderão ser calculadas a partir das áreas do 
histograma, independentemente da amplitude de classe utilizada. 
 Por exemplo, suponha que se queira determinar a frequência relativa de animais que 
produzem entre 19,75 e 22,0 kg de leite. A frequência relativa da 5a classe (produção entre 19,75 e 
22,65) é igual a 0,1841 (Tabela 2.11). A frequência relativa entre 19,75 e 22,0 consiste na área de 
 
Emanuelle
Realce
Guia de estudos de Estatística 
 
Tabela 2.10. Distribuição de frequências relativa e densidades de frequência relativa, referentes à 
produção diária de leite de 201 vacas da raça holandesa. 
Classes (kg de leite) fr dfr 
(5,25 ; 8,15] 0,0100 0,0034 
(8,15 ; 11,05] 0,0249 0,0086 
(11,05 ; 13,95] 0,1144 0,0395 
(13,95 ; 16,85] 0,1891 0,0652 
(16,85 ; 19,75] 0,2388 0,0823 
(19,75 ; 22,65] 0,1841 0,0635(22,65 ; 25,55] 0,1443 0,0498 
(25,55 ; 28,45] 0,0646 0,0223 
(28,45 ; 31,35] 0,0149 0,0051 
(31,35 ; 34,25] 0,0149 0,0051 
Totais 1,0000  
 
0,0000
0,0200
0,0400
0,0600
0,0800
34,2531,3528,4525,5522,6519,7516,8513,9511,058,155,25
dfr
Produção de leite
Figura 2.9. Histograma da distribuição de frequência relativa, referente à produção de leite em 
rebanho pertencente a fazenda Itirapuan, Sul de Minas Gerais, 2005. 
Fonte: levantamento realizado no escritório da fazenda. 
 
uma nova barra, mais estreita que aquela correspondente à 5a classe. Essa nova barra tem altura 
igual à dfr da 5a classe (=0,0635) e base igual a: 
Guia de estudos de Estatística 
 
 22,0 - 19,75 = 2,25. 
Assim, a área dessa nova barra é calculada multiplicando-se sua base por sua altura, ou seja: 
 2,25 x 0,0635 = 0,1429 e 
esse é o valor da frequência relativa entre 19,75 e 22,0. Podemos então dizer que há em torno de 
14,29% de vacas que produziam entre 19,75 kg de leite e 22,0 kg de leite, na fazenda Itirapuan, no 
ano de 2005. Essa porcentagem seria em torno de 29 vacas (0,1429 x 201). 
 
2.3.2. Medidas de posição. 
 Na tentativa de se descrever um conjunto de dados por meio de grandezas numéricas, 
talvez a noção mais imediata que ocorra seja a de um número que especifique a posição do 
conjunto de dados na escala de valores possíveis da variável em questão. Tais grandezas são as 
chamadas medidas de posição. As medidas de posição têm por objetivo definir o “centro” de uma 
distribuição de frequências, o valor em torno da qual todos os dados “gravitam”, ou ainda, definir 
“posições” de valores da variável sob estudo dentro da distribuição de frequências. Medidas de 
posição só fazem sentido para variáveis numéricas. Dentre elas, serão abordadas primeiramente a 
média, a mediana e a moda, as quais são as três principais medidas de posição. Existem outras, 
conhecidas como quantis, que são consideradas medidas de posição por alguns autores, mas que 
não têm por objetivo determinar o “centro” das distribuições de freqüências, mas apenas “posições” 
dentro da distribuição de frequências. Oportunamente abordaremos os quantis. 
 
Conceito 2.7. Medida de Posição . Grandeza numérica que descreve um conjunto de dados, pela 
indicação da posição do conjunto na escala de valores possíveis que a variável em questão pode 
assumir. 
 
Média 
A média aritmética (ou simplesmente média) amostral, calculada a partir de uma amostra, 
e referente à característica (variável) X, é simbolizada por x e é definida como: 
 x = 
n
x
n
i
i∑
=1 ∑
=
=
n
i
ixn 1
1
 
 
Para os dados de produção de leite da Tabela 2.8: 
 
Guia de estudos de Estatística 
 
 x = leite/dia kg 04,19)8,33...9,63,5(
201
1 =+++ 
Recorde que “n” refere-se ao número de elementos da amostra. 
 Muitas vezes, entretanto, há o interesse de associar a descrição por meio da distribuição 
de frequências com a descrição por meio de medidas de posição. Quando se dispõe das 
frequências relativas nas classes, a média aritmética pode ser obtida por: 
 x ∑
=
≅
k
i
ii xfr
1
. 
onde fri é a frequência relativa da classe i, e ix é o ponto médio da classe i . Para a distribuição de 
frequência da Tabela 2.10 temos a seguinte tabelinha auxiliar: 
 Produção (kg) ix ifr idfr 
 (5,25 ; 8,15] 6,70 0,0100 0,0034 
(8,15 ; 11,05] 9,60 0,0249 0,0086 
(11,05 ; 13,95] 12,50 0,1144 0,0395 
(13,95 ; 16,85] 15,40 0,1891 0,0652 
(16,85 ; 19,75] 18,30 0,2388 0,0823 
(19,75 ; 22,65] 21,20 0,1841 0,0635 
(22,65 ; 25,55] 24,10 0,1443 0,0498 
(25,55 ; 28,45] 27,00 0,0646 0,0223 
(28,45 ; 31,35] 29,90 0,0149 0,0051 
(31,35 ; 34,25] 32,80 0,0149 0,0051 
Totais  1,0000  
 
 x = 6,70 x 0,0100 + 9,60 x 0,0249 + ... + 32,80 x 0,0149 = 19,08 kg leite/dia 
Outra tabelinha que pormenoriza estes cálculos é apresenta abaixo: 
6,70 0,0100 0,0670 
 9,60 0,0249 0,2390 
 12,50 0,1144 1,4300 
 15,40 0,1891 2,9121 
 18,30 0,2388 4,3700 
 21,20 0,1841 3,9029 
 24,10 0,1443 3,4776 
 27,00 0,0646 1,7442 
 29,90 0,0149 0,4455 
 32,80 0,0149 0,4887 
 
Guia de estudos de Estatística 
 
 
19,0772 ≅ 19,08 
 
Convém observar que o valor obtido por essa expressão (19,08) não coincide com o valor da 
expressão que define a média (19,04). Esta diferença (19,08 – 19,04 = 0,04 kg leite/dia) é 
chamada de erro de agrupamento. Apesar de que este erro é quase sempre pequeno, a expressão 
da definição da média deve ser preferida, fazendo-se o cálculo diretamente sobre os dados 
originais, apesar de ser mais trabalhoso. Atualmente, com a grande disponibilidade de softwares 
específicos para Estatística, e mesmo planilhas de cálculos com poderes estatísticos, esse 
trabalho deixou de ser um problema. O uso da expressão aproximada, que calcula a média 
utilizando-se das frequências relativas das classes e de seus respectivos pontos médios, só deve 
se utilizada quando não se dispõe dos dados originais. 
 A média possui algumas propriedades notáveis, como: 
i) Somando-se a todas as observações uma constante k, a nova média fica acrescida de k. 
ii) Multiplicando-se todas as observações por uma constante k, a média fica multiplicada por k. 
iii) A soma dos desvios de cada observação em relação à média é igual a zero. O desvio da 
observação i é dado por: 
 di = xi - x 
e assim: 
 [ ]∑
n
1=i
i x - x = 0
1
=∑
=
n
i
id 
iv) A média minimiza a soma dos quadrados dos desvios. Ou seja, a quantidade 
 [ ]∑
n
1=i
2
i x - x , 
seria aumentada (ficaria maior) se colocássemos no lugar de x qualquer outro valor que não seja 
x . 
 
Mais duas observações são pertinentes: 
i) A média é muito afetada por valores discrepantes, extremos. 
ii) Trata-se da medida de posição mais amplamente utilizada. 
 
 
 
Guia de estudos de Estatística 
 
Mediana 
A mediana é o valor que, no conjunto de dados ordenados, é precedido e seguido pelo 
mesmo número de observações. É simbolizada por x
~
. Por exemplo, considere o seguinte conjunto 
de dados, com n = 5, referente a uma certa variável X: 
x1 x2 x3 x4 x5 
3 5 6 8 48 
 
x = 14,0 
Note que o valor da média, 14,0, influenciada pelo valor extremo 48, não corresponde a uma 
medida de posição conveniente, uma vez que a maioria das observações possuem valores abaixo 
de 10. A mediana x
~
 desses dados corresponde ao valor 6, pois é a observação, nos dados 
ordenados, que possui um igual número de observações abaixo e acima dela, ou seja, 2 dados (3 
e 5) são menores do que 6 e 2 dados (8 e 48) são maiores do que 6. Podemos considerar que 6,0 
representaria os dados melhor do que 14,0, no sentido de não ser tão sensível a valores 
discrepantes. 
 Quando o número de observações n é par, a mediana é definida como a média aritmética 
dos dois valores centrais. Por exemplo, se no mesmo conjunto de dados eliminássemos a última 
observação, a nova mediana seria dada por: 
 x
~
= 
5 6
2
+
 = 5,5. 
Podemos então propor as seguintes fórmulas para o cálculo da mediana: 
x~







+=





 +










 +
par én se,
2
ímpar én se,
1
22
2
1
nn
n
xx
x
 
Nota. x(i) é o i-ésimo valor da massa de dados em ordem crescente. 
Observe que, se n é par, a mediana x
~
 é um valor que pode não aparecer na massa de dados. 
Para a produção de leite apresentada na tabela 2.9, com n = 201 dados, n é ímpar e x
~
 = x(101) = 
19,0 kg leite/dia pela fórmula acima, um valor que aparece na massa de dados. Para os dados da 
duração das lâmpadas (tabela abaixo) 
 
 
 
 
 
Guia de estudos de Estatística 
 
Tabela. Dados ordenados para uma amostra de 50 lâmpadas (tempo de vida em horas). 
712,7 714,1 715,1 716,7 718,2 719,8 720,5 721,8 723,0 724,6 
712,8 714,3 715,3 717,3 718,5 719,9 720,8 722,2 723,6 725,1 
713,8 714,4 715,7 717,5 718,6 720,1 721,0 722,4 723,6 725,2 
713,9 714,6 715,7 717,7 718,8 720,4 721,2 722,7 723,7 725,9 
714,1 715,0716,2 717,8 719,0 720,4 721,6 722,8 723,8 728,5 
 
 a mediana seria a média de x(25) e de x(26): 
 
x~ = 
2
2,7188,717 +
= 718,0 horas 
Este valor (718,0 horas) não aparece na massa de dados. 
 Em dados agrupados em uma distribuição de frequências, a mediana é obtida pelo valor 
que divide o conjunto dos dados em dois grupos com igual frequência (50%). Para tanto, divide-se 
o número de observações por dois (independente de ser par ou ímpar), e a seguir faz-se uma 
interpolação na classe que contiver o resultado dessa divisão. No exemplo da produção de leite, 
tem-se 201 observações organizadas numa distribuição de frequências (Tabela 2.9), obtendo-se 
assim 201/2 = 100,5. Observando a distribuição de frequência absoluta nessa mesma Tabela 2.9, 
verifica-se que esse valor (mesmo que não exista a posição 100,5) se encontra entre 16,85 e 
19,75, ou seja, está contido na classe (16,85 , 19,75]. A interpolação é feita da seguinte maneira: 
sabe-se que a amplitude de classe c corresponde a 2,9 , e que essa classe contém 48 
observações (Tabela 2.9), a partir da 68a observação. A diferença entre 100,5 e 68 é igual a 32,5 , 
e assim: 
 48  2,9 
 32,5  x x = 1,96 
Somando-se x ao limite inferior dessa classe, obtém-se a mediana, qual seja, 
 x
~
= LIMd + x = 16,85 + 1,96 = 18,81; 
onde LiMd é o limite inferior da classe que contem a mediana, isto é, a classe que acumula o dado 
da posição n/2 em ordem cescente. 
Esse raciocínio pode ser posto na forma de uma fórmula, a saber: 
Md
Md
Md
Md cf
F
n
LIx
−−
+= 2
~
, 
onde: 
Emanuelle
Realce
Emanuelle
Realce
Guia de estudos de Estatística 
 
−MdF é a frequência absoluta acumulada até a classe imediatamente anterior à classe mediana; 
Mdf é a frequência absoluta da classe mediana; 
Mdc é a amplitude da classe mediana. 
Se utilizamos frequência relativa nos cálculos, então a fórmula é dada por: 
Md
Md
Md
Md cfr
Fr
LIx −
−
+=
5,0~
; 
onde: 
−MdFr é a frequência relativa acumulada até a classe imediatamente anterior à classe mediana; 
Mdfr é a frequência relativa da classe mediana; 
Mdc é a amplitude da classe mediana. 
Nota. Observe que essas fórmulas são aplicáveis apenas para variáveis contínuas, isto é, a 
princípio, essas fórmulas são aplicáveis somente em variáveis numéricas oriundas de medições. 
Lembre-se que não utilizamos, a principio, histogramas para representar variáveis discretas, e, 
portanto, tais fórmulas (que precisam de quantidades tais como amplitude de classe e limite de 
classe) não podem ser aplicadas no cálculos de mediana de variáveis discretas organizadas em 
tabela de distribuição de freqüência. 
 A mediana é uma medida de posição apropriada para distribuições assimétricas. Nas 
distribuições simétricas, mediana e média são iguais. Ela possui ainda as seguintes propriedades: 
i) Somando-se a todas as observações uma constante k, a nova mediana fica acrescida de k. 
ii) Multiplicando-se todas as observações por uma constante k, a mediana fica multiplicada por k. 
iii) A mediana é o valor que minimiza a soma dos valores absolutos (módulos) dos desvios, isto é: 
 ∑
n
1=i
i a - x é mínima se a = x
~
 
 
Moda 
A moda também foi idealizada visando descrever melhor aqueles conjuntos de dados com 
distribuição assimétrica. Ela busca apresentar como medida de posição dos dados o valor típico de 
ocorrência, isto é, por definição a moda é o valor mais frequente na massa de dados. Seu símbolo 
é *x e não temos uma “fórmula matemática” para defini-la. Sua definição é simplesmente : 
Guia de estudos de Estatística 
 
*x : valor da variável que tem a maior frequência de ocorrência. 
 
Assim como foi para média e mediana, apresentaremos seu cálculo para dados não-agrupados e 
para dados agrupados. 
 Começando pelos dados não agrupados, a moda, sendo definida como sendo o valor mais 
frequente, é calculada apenas buscando o valor que mais se repete na massa de dados. Por 
exemplo, no conjunto de dados. 
x1 x2 x3 x4 x5 
1 2 2 3 4 
 
a moda *x corresponde ao valor 2, que é o mais frequente, isto é, a moda é “calculada” como 
sendo 2, pois o valor “2” para X ocorre com frequência absoluta 2, maior do que todos os outros 
valores. Logo: 
 *x = 2. 
Para os dados da produção leiteira do rebanho de n = 201 vacas: 
*x = 14,1 kg leite/dia, 
 
Observe que o valor 14,1 ocorreu 7 vezes, isto é, frequência absoluta de ocorrência igual 7, maior 
que a frequência de ocorrência de todos os demais valores. Porém, é imediata a observação da 
inconveniência de seu uso dessa maneira para o caso de variáveis contínuas, onde, na maioria 
das vezes, é praticamente nula a chance de se encontrar valores exatamente iguais que se 
repitam várias vezes. Esta característica de probabilidades infinitesimais para variáveis contínuas 
leva alguns autores a declarar que “massa de dados brutos de variáveis contínuas não tem moda”, 
porém, a rigor, mesmo tais massas de dados podem ter moda, e sua definição é como estamos 
dando aqui. 
 Para contornar este imbróglio, convém-nos então, para variáveis contínuas, estimar a 
moda como o valor que possui a maior densidade de frequência na distribuição de frequências, 
obtida a partir do agrupamento dos dados. Para tanto, procede-se a construção de uma tabela de 
distribuição de freqüência para os dados, buscando-se, então, em tal distribuição, o valor de maior 
densidade de freqüência. Mais de um método poderia ser utilizado para este cálculo. Aqui 
apresentarmos dois métodos: 
(i) Método do ponto médio da classe de maior densidade de frequencia. 
Neste método, considera-se a moda como sendo o ponto médio da classe de maior densidade 
de freqüência, isto é, o ponto médio do retângulo de maior altura do histograma. 
(ii) Método de Czuber. 
Este método deriva-se de um raciocínio geométrico, que baseia-se no fato de que as classes 
imediatamente anterior e posterior influenciam o comportamento modal. A moda é obtida pela 
Guia de estudos de Estatística 
 
identificação da classe com maior densidade de frequência (absoluta, relativa ou porcentual), e 
utilizando a fórmula: 
 MoMo cLIx
21
1*
∆+∆
∆
+= 
onde MoLI : limite inferior da classe de maior densidade de frequência; 
 ∆1 : diferença entre a densidade de frequência da classe que contém a moda e a 
densidade da classe anterior; 
 ∆2 : diferença entre a densidade de frequência da classe que contém a moda e a 
densidade da classe posterior; 
 Moc : amplitude da classe de maior densidade de frequência. 
 A moda possui as seguintes propriedades: 
i) Somando-se a todas as observações uma constante k, a nova moda fica acrescida de k. 
ii) Multiplicando-se todas as observações por uma constante k, a moda fica multiplicada por k. 
Considerando um conjunto de dados com distribuição assimétrica à direita, as medidas de 
posição apresentam a tendência relativa mostrada na Figura 2.10. Em uma distribuição assimétrica 
à esquerda, a ordem seria invertida. Nas distribuições simétricas, a moda é igual a mediana que 
também é igual a média. A medida mais usada, e mais importante e informativa, é a média. 
Mediana e moda só devem ser usadas quando a média falha em informar a tendência central dos 
dados. 
 
Figura 2.10. Posicionamento da média, mediana e moda em uma distribuição assimétrica à direita. 
Mo é abreviatura de “moda”, Md de “mediana”, e Me de “média”. 
 
 
Guia de estudos de Estatística 
 
2.3.3. Medidas de variabilidade. 
 Na descrição de uma massa de dados, apenas a utilização de medidas de posição é 
insuficiente para explicitar o comportamento dos dados, pois tais medidas nada indicam a respeito 
de sua variabilidade. Para ver isto, considere, por exemplo, os três conjuntos de dados na Tabela 
2.11. Observa-se que as três regiões, apesar de apresentarem as mesmas medidas de posição, 
são visivelmente diferentes, uma vez que a uniformidade dos dados decresce da região A para aregião C. Por isso, se faz necessária a elaboração de uma grandeza que quantifique a distribuição 
dos dados (também chamada de dispersão ou variabilidade), as chamadas medidas de dispersão 
ou de variabilidade. Estas medidas, do modo como apresentado aqui, só fazem sentido para 
variáveis numéricas. Essas medidas constituem, junto com as medidas de posição, as medidas 
estatísticas mais importantes. As principais são: variância, desvio-padrão, e coeficiente de 
variação. Estudaremos essas principais mais a amplitude total. 
 
Conceito 2.8. Medida de Dispersão . Grandeza numérica que descreve um conjunto de dados, 
pela quantificação da variabilidade ou heterogeneidade neles presente. 
 
Tabela 2.11. Estrutura fundiária como área (variável X) em 3 regiões agrícolas (medidas em ha). 
i Região A Região B Região C 
1 100 80 10 
2 100 90 50 
3 100 100 100 
4 100 100 100 
5 100 100 100 
6 100 110 150 
7 100 120 190 
x 100 100 100 
 x
~
 100 100 100 
*x 100 100 100 
 
 
Amplitude ou Amplitude total (A) 
 Anteriormente empregada na elaboração de distribuições de frequências, a amplitude total 
corresponde à diferença do maior valor (máximo) para o menor valor (mínimo) do conjunto. Assim, 
temos: 
 Região A: A = 0 
Guia de estudos de Estatística 
 
 Região B: A = 40 
 Região C: A = 180 
fornecendo-nos diferentes graus de variabilidade, como esperado. 
 A amplitude possui alguns inconvenientes. Trata-se de uma medida muito influenciada por 
valores extremos, uma vez que é calculada somente a partir deles. Assim, sua interpretação 
independe até certo ponto do número de observações do conjunto. Para ilustrar esse aspecto, no 
exemplo do rebanho de gado holandês da fazenda Itirapuan, foram tomados subconjuntos de 
diferentes números de animais, do total de 201 observações, sempre a partir dos primeiros dados 
da Tabela 2.7 que estão fora de ordem, e, portanto, guardando uma certa “casualidade”. Foram 
obtidos os seguintes valores para a amplitude: 
 
Número de animais Min Max A 
16 13,2 26,6 13,4 
32 9,7 26,6 16,9 
64 9,7 30,4 20,7 
128 5,3 30,4 25,1 
 
 O primeiro conjunto de animais, possuindo um número relativamente satisfatório de 
observações, deveria representar razoavelmente bem a dispersão total de todo o rebanho. No 
entanto, observa-se que à medida que o número de observações aumenta, a chance do 
aparecimento de valores extremos, acima ou abaixo da média, também aumenta, fazendo com que 
os respectivos valores de amplitude aumentem, chegando quase a dobrar. Portanto, torna-se 
evidente a necessidade de uma medida de dispersão que baseie-se em todas as observações, de 
maneira a tornar-se menos sensível ao aparecimento de valores discrepantes. Isso pode ser 
igualmente visto no exemplo: 
 
Conjunto A 5 15 15 15 40 
Conjunto B 5 10 20 30 40 
 
Tais conjuntos possuem a mesma amplitude, 35, mas apresentam claramente diferentes 
magnitudes de variabilidade, sendo esta magnitude inferior no conjunto A, pois este terá maior 
uniformidade. Para resolver esse problema, foram concebidas duas medidas a partir de todas as 
observações: a variância e o desvio padrão. São estas que estudaremos a seguir. 
 
 
Guia de estudos de Estatística 
 
Variância e Desvio-padrão 
 Trata-se de medidas de dispersão baseadas nos desvios dos dados em relação à média: 
 di = xi - x 
Como quantificar a variabilidade de um conjunto de dados a partir dos desvios em relação à 
média? Já que se sabe que o valor médio dos desvios em relação a média é zero, poder-se-ia 
pensar então em se tomar a média dos módulos dos desvios: 
 
n
xx
n
d
n
i
i
n
i
i ∑∑
==
−
= 11 
Apesar desta medida ser uma possível medida de variabilidade, ela não tem boas propriedades 
nem estatísticas e nem matemáticas. Por causa disso, razões estatísticas levam à considerar o 
quadrado das diferenças (e não o módulo), e a divisão da soma dos quadrados dos desvios por n-
1 e não por n, definindo então a medida de variabilidade denominada variância: 
 s2 = 
( )
( ) ( ) ( )
1
...
1
22
2
2
11
2
−
−+−+−
=
−
−∑
=
n
xxxxxx
n
xx
n
n
i
i
 
 
O desvio padrão é definido como a raiz quadrada da variância: 
 s = 
( )
1
1
2
2
−
−
=
∑
=
n
xx
s
n
i
i
 
 
O denominador (n - 1) é chamado de graus de liberdade. Para a amostra da Tabela 2.9, s=3,94 kg, 
e s2 = 15,5442 kg2. Apesar do divisor n-1, a variância também pode ser denominada de “quadrado 
médio”, visto ser uma espécie de média dos desvios ao quadrado. Algumas vezes autores de 
textos sobre Estatística usam outra fórmula para a variância amostral, a saber, 
 
 s2 = 
( )
n
xx
n
i
i∑
=
−
1
2
 
 
e, consequentemente, também outra para desvio-padrão amostral, 
 
 
Guia de estudos de Estatística 
 
 s = 
( )
n
xx
s
n
i
i∑
=
−
= 1
2
2 
 
porém, devemos salientar que estas fórmulas levam a uma subestimação (isto é, apresenta um 
viés) do valor real da variabilidade da variável em estudo, devendo serem, portanto, evitadas. As 
fórmulas com divisor n-1 devem ser a utilizadas, pois permitem uma estimação exata (isto é, não 
viesada) da variabilidade da variável de interesse. 
 
 Voltando ao exemplo dado para mostrar a insuficiência da amplitude, vamos calcular a 
variância e o desvio-padrão dos conjuntos A e B: 
 
Conjunto A 5 15 15 15 40 
Conjunto B 5 10 20 30 40 
 
onde sA = 13,04 e sB = 14,32 
 
No conjunto de dados B do exemplo acima, tem-se: 
 
Observação xi di di
2 
1 5 -16 256 
2 10 -11 121 
3 20 -1 1 
4 30 9 81 
5 40 19 361 
Total 105 => 
=> x =21,00 
0 820 
 
 E assim: 
 x = 105 / 5 = 21,00 
 s² = 820 / 4 = 205,0000 
 s = 14,32 
Guia de estudos de Estatística 
 
O conjunto A do exemplo possui uma variância igual a 170,0000, refletindo assim a menor 
variabilidade nele existente, em relação ao conjunto B, que tem variância 205,0000. 
 O desvio padrão, ao tomar a raiz quadrada da variância, tem a vantagem de retornar à 
escala original (por exemplo, passando de kg2 para kg), melhorando a compreensão do quanto os 
dados se desviam em relação à média. 
Para os dados da produção leiteira da Tabela 2.8: 
 
( ) ( ) ( )[ ] 0007,2404,198,33...04,199,604,193,5
200
1
s² 222 =−++−+−= 
 
0007,24=s kg de leite/dia = 4,90 kg de leite/dia 
 
Nós podemos nos aproveitar do fato de que a soma de quadrados de desvios pode ser 
expressada em uma forma simplificada, para criarmos uma fórmula alternativa para a variância (e 
desvio-padrão), que é mais fácil para o cálculo, mesmo que pareça mais “complicada” para 
escrever, qual seja: 
 
( )
1
1
2
−
−∑
=
n
xx
n
i
i
 = 
1
2
1
1
2
−






−
∑
∑ =
=
n
n
x
x
n
i
in
i
i
 
Demonstração: 
 [ ]∑
=
−
n
i
i xx
1
2
 = [ ][ ]∑
=
+−
n
i
ii xxxx
1
22 2 = 
= [ ]∑∑∑
=
+−
==
nn
i
i
n
i
i
i
xxxx
1
2 2
11
2 = [ ]2
1
1
1
2 2 xnx
n
x
x
n
i
i
n
i
in
i
i +− ∑
∑
∑
=
=
=
 = 
= 
2
1
2
1
1
2 2












+






−
∑∑
∑ ==
= n
x
n
n
x
x
n
i
i
n
i
in
i
i = n
x
n
x
x
n
i
i
n
i
in
i
i
2
1
2
1
1
2 2






+






−
∑∑
∑ ==
=
 = 
= 
n
x
x
n
i
in
i
i
2
1
1
2






−
∑
∑ =
=
 
Guia de estudos de Estatística 
 
 
 Para dados agrupados, a variância também pode ser calculada da seguinte forma 
facilitada: 
 [ ]∑≅
k
1j=
j
2
j
2 .fr - xxs 
onde 
jx é o ponto médio da classe j. Essa expressão não fornece, na maioria das vezes, o 
mesmo valor da expressão dada anteriormente, em razão do chamado erro de agrupamento, 
sendo, portanto, uma fórmula aproximada para o verdadeiro valor de s2. 
Demonstração: 
( ) ( )
( ) ( ) j
k
j
j
j
k
j
j
k
j
jj
n
i
i
frxx
n
fa
xx
n
xxfa
n
xx
s .
111 1
2
1
21
2
1
2
2 ∑∑
∑∑
==
== −≅
−
−=
−
−
≅
−
−
= 
 
Nota. A aproximação final é tanto mais exata quanto maior for o valor de n, isto é: 
 
jj
n
j
n
j
n
frfrlim
nfa
lim
1n
fa
lim ===
− ∞→∞→∞→
 
 
A variância e o desvio padrão possuem as seguintes propriedades: 
i) Somando-se uma constante k a todas observações, nem a variância nem o desvio padrão se 
alteram. 
ii) Multiplicando-se uma constante k a todas as observações, a variância fica multiplicada por k2 e o 
desvio padrão por k. 
iii) O desvio padrão, em relação à média, ao invés de em relação a outro valor qualquer, é mínimo, 
em razão do fato de a média ser o valor que torna mínima a soma de quadrados dos desvios. 
 
Coeficiente de variação (cv) 
 Quando se deseja a comparação entre diferentes conjuntos de dados, mesmo a variância 
e o desvio padrão podem não quantificar adequadamente, em certas situações, a variabilidade 
presente em um conjunto de dados. Para ver isto, considere, a título de ilustração, os pesos dos 
animais de dois rebanhos diferentes, dados a seguir: 
Guia de estudos de Estatística 
 
 
i Rebanho A Rebanho B 
1 50 470 
2 70 490 
3 60 460 
4 80 480 
x 65 475 
 s 11,18 11,18 
 
Obviamente, trata-se de rebanhos com animais em idades diferentes. Apesar de possuírem o 
mesmo desvio padrão, é evidente que diferenças da ordem de 10 kg, por exemplo, possuem um 
peso relativo muito maior no rebanho A do que no rebanho B. Assim, é razoável afirmar que a 
variabilidade no rebanho A é bem superior; tornando-se necessária a elaboração de uma medida 
apropriada nessas situações onde se deseja comparar conjuntos de dados com médias bem 
discrepantes. Uma medida que reúne essas características é o chamado coeficiente de variação, 
definido por: 
cv = 100%
s
x
 
 
Para os dados da produção diária de leite da Tabela 2.9: 
 
25,7%100%
19,04
4,89
cv == 
Essa medida nos dá a magnitude da variabilidade, em relação à magnitude da média. No exemplo 
acima, tem-se: 
 Rebanho A: cv = 17,2% 
 Rebanho B: cv = 2,4% 
evidenciando que o rebanho A tem uma variabilidade maior que o rebanho B. 
 A necessidade da elaboração de uma medida apropriada nas situações onde se deseja 
comparar conjuntos de dados com médias bem discrepantes não é a única demanda que justifica o 
cv: também é verificada sua necessidade se o desejo é comparar variáveis medidas em unidades 
diferentes. Observa-se que o coeficiente de variação é uma medida relativa, porcentual, sendo, 
assim, adimensional, fazendo com que o cv seja útil não apenas na comparação entre conjuntos 
de dados de mesma unidade, mas ainda útil na comparação da variabilidade entre conjuntos de 
dados referentes a diferentes características, que são medidas em unidades diferentes. 
Guia de estudos de Estatística 
 
2.4. EXERCÍCIOS RESOLVIDOS 
 
1) Em um estudo da atividade predominante nas 20 propriedades de um município observaram-se 
os seguintes resultados: 
 
Café Feijão Café Soja Soja 
Café Milho Feijão Milho Soja 
Milho Milho Soja Soja Leite 
Leite Leite Milho Café Leite 
 
a) Classifique a variável. 
Variável qualitativa nominal, pois ela separa as diferentes culturas em categorias pelos respectivos 
nomes. 
b) Faça a representação tabular por meio das frequências absoluta (fi), relativa (fri) e percentual 
(fpi). 
 
ATIVIDADES fa fr fp 
MILHO 5 0,25 25 
SOJA 5 0,25 25 
CAFÉ 4 0,20 20 
LEITE 4 0,20 20 
FEIJÃO 2 0,10 10 
TOTAL 20 1,00 100 
 
c) Faça a representação gráfica por meio do gráfico de colunas. 
 
 
Guia de estudos de Estatística 
 
2) Os dados abaixo referem-se às áreas (em ha) de 25 propriedades rurais que receberam 
financiamento para pecuária de leite. Lavras, MG, de 1977 a 1982: 
 
42 40 45 46 48 
51 50 53 58 62 
73 66 73 82 89 
106 100 130 150 175 
231 181 252 267 268 
 
a) Reúna os dados em uma tabela de distribuição de frequências (use n k = ) 
1°- Calcula-se o número de classes (k) que comporão a distribuição: 
 classes 525nk === , sendo n é o número de propriedades que receberão 
financiamento; 
2°- Calcula-se a amplitude de classe (c): 
 ha
k
A
c 57
15
40268
1
=
−
−=
−
= , onde A é a amplitude total, ou seja, o maior valor 
observado menos o menor; 
3°- Calcula-se o limite inferior (LI) da primeira classe que irá compor a distribuição: 
 ha
c
MinLI 5,11
2
57
40
2
=−=−= , onde Min é o menor valor observado. 
 
 
 
 
4°- A tabela de distribuição de frequência: 
Classes ix ifa ifr %fpi 
(11,5;68,5] 40 11 0,44 44 
(68,5;125,5] 97 6 0,24 24 
(125,5;182,5] 154 4 0,16 16 
(182,5;239,5] 211 1 0,04 4 
(239,5;296,5] 268 3 0,12 12 
Total - 25 1,00 100 
 
b) Quantas propriedades na amostra têm área superior a 125,5 ha? 
 Nesta amostra, 8 propriedades possuem área superior a 125,5 ha. 
c) Pode-se esperar encontrar propriedades com área entre 70,0 e 100,0 ha? Se sim, qual a sua 
porcentagem de ocorrência? 
Guia de estudos de Estatística 
 
Sim, é possível encontrar propriedades com área entre 70,0 e 100,0 ha e para encontrar a 
porcentagem de ocorrência, pode-se utilizar uma regra de três simples: 
 125,5 – 68,5 = 57,0 ha --------------------------------- 6 propriedades 
 110,0 – 70,0 = 40,0 ha --------------------------------- x 
 x = 4,2 propriedades => 4,2 / 25 = 16,8% 
Assim, podemos inferir que 16,8% destas propriedades possuem área entre 70,0 e 110,0 ha. 
 
3)Os pesos em Kg, de 6 suínos submetidos a uma ração de engorda foram: 
184 193 204 
204 196 207 
a) Qual foi o desvio do 2° animal em relação à média? Explique o que ele significa. 
Calculando a média: =
+ + += = =
∑
x
i
i 1
x
184 193 ... 207
x 198 Kg
n 6
 
 
O desvio do 2° animal em relação à média: = − = − = −i id x x 193 198 5 Kg 
 
A média é uma medida de tendência central, ou seja, em torno dela se congregam valores abaixo 
e acima da mesma. Assim, esse desvio negativo do 2° animal com relação à média se deve ao fato 
de que ele esta 5 kg abaixo dela. 
b) Mostre que a soma dos desvios com relação à média é nula. 
0198)(207...198)(193198)(184)x(x
n
1i
i =−++−+−=−∑
=
 
c) Transforme os dados em arrobas. Qual é a constante de transformação? Encontre a média em 
arrobas partindo daquela obtida no item a. 
Como 1 arroba = 15 Kg, para transformar Kg em arrobas utilizamos: 
 
15
x
@Peso i= 
Assim: 
arrobas 13,20
6
13,8013,0713,6013,6012,8712,27
n
x
x
6
1i
i
=+++++==
∑
= 
d) Adicione 20 Kg a cada dado e encontre a média. Confronte o resultado com o obtido no item a. 
Qual a propriedade esta envolvida? 
Adicionando 20 Kg a cada dado, temos: 
204 213 224 
224 216 227 
Calculando a nova média: 
Guia de estudos de Estatística 
 
 kg 218
6
227...213204
n
x
x
6
1i
i
=+++==
∑
= 
 
Confrontando a média obtida no item a com a obtida no item d: 
 kg 198xa = kg 218x d = 
podemos perceber que a média se alterou na mesma proporção que cada observação foi 
aumentada. A propriedade envolvida é a propriedade da soma, que diz que se somarmos a cada 
observação uma constante “k” a média fica acrescida desta mesma constante “k”. 
e) Calcule a Soma de Quadrados dos Desvios “SQD” em relação à média e em relação à 
constante k = 196. Discuta os resultados. 
Vejamos a SQD em relação à média: 
∑
=
=−++−+−=−=
6
1i
2222
i 378198)(207...198)(193198)(184)x(xSQD 
E a SQD em relação à constante k = 196: 
∑
=
=−++−+−=−=
6
1i
222
i 402196)(207...196)(193196)(184k)(xSQD 
Comparando os dois resultados podemos perceber que a SQD em relação à média é menor que a 
SQD da constante k = 196. Confirma-se assim que a SQD em relação á média é o valor que torna 
mínimo o valor dos desvios. 
 
 
4) Para comparar 4 variedades de alfafa (A, B, C, D) foi conduzido um experimento em blocos 
completos casualizados com seis repetições, usando parcelas de 32 m 2 (4m x 8m). Os 
rendimentos em massa verde em Kg.parcela-1 foram os seguintes:

Outros materiais