Buscar

Estatística Aplicada

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 123 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 123 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 123 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
1
ESTATÍSTICA APLICADA
- Apresentação Geral do Caderno de Estudo
A palavra ESTATÍSTICA provém do latim status, que significa estado. A
primitiva utilização da estatística envolvia compilações de dados e gráficos que
descreviam vários aspectos de um estado ou país. As famílias, os governos e as
empresas se apóiam largamente em dados estatísticos para tomarem decisões.
A simples observação de um conjunto de dados não permite que sejam
tomadas decisões ou, quando muito possibilitarão decisões eivadas de princípios
empíricos.
Vivemos uma era em que a ciência deve prevalecer sobre o empirismo, em
que a lógica deve prevalecer sobre o “achismo”.
A estatística abrange muito mais do que o simples traçado de gráficos e o
cálculo de médias. Neste caderno será visto como tirar conclusões gerais e
significativas que vão além dos dados originais.
Os diversos assuntos serão abordados de forma objetiva, visando a
aplicação direta dos conceitos. Os únicos conhecimentos matemáticos necessários
para a compreensão do texto é a aritmética e elementos de álgebra básica. Quando
houver a necessidade de algum conceito um pouco mais avançado, o mesmo será
abordado de forma sintética e objetiva.
Nos casos em que forem necessários cálculos mais complexos será utilizado
o Microsoft Excel, poderosa ferramenta que reduz muito o tempo necessário para a
determinação de valores. Familiarize-se com esta ferramenta. Havendo
necessidade, utilize o Ajuda.
UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
2
1. Variáveis e Gráficos
1.1 – Estatística
O termo ESTATÍSTICA provém da palavra Estado e foi utilizado
originalmente para denominar levantamentos de dados, cuja finalidade era orientar
o Estado em suas decisões.
Neste sentido foi utilizado em épocas remotas para determinar o valor dos
impostos cobrados dos cidadãos, para determinar a estratégia de uma nova batalha
em guerras que se caracterizavam por uma sucessão de batalhas – era
fundamental aos comandantes saber de quantos homens, armas, cavalos, etc.
dispunham após a última batalha.
Atualmente, a ESTATÍSTICA é definida da seguinte forma:
A estatística teve acelerado desenvolvimento a partir do século XVII, com os
estudos de BERNOULLI, FERMAT, PASCAL, LAPLACE, GAUSS, GALTON, PEARSON,
FISHER, POISSON e outros que estabeleceram suas características atuais (da
SILVA, et al.; 1996,11).
Uma outra definição para ESTATÍSTICA (VIEIRA; 1999,6):
A Estatística tem importante papel no pensamento crítico, seja no trabalho,
na pesquisa, ou no dia-a-dia. Então o tempo que você usar estudando essa matéria
será um investimento para seu futuro. É verdade que algumas pessoas pensam que
as estatísticas mentem. Ou, como já disse alguém, “ os números dizem qualquer
coisa quando bem torturados”. Mas qualquer ciência produz resultado contrário ao
desejado, quando é mal aplicada. Então as estatísticas “mentem” apenas quando
estão erradas ou, no mínimo, estão sendo mal interpretadas.
Estatística é um conjunto de métodos e
processos quantitativos que serve para
estudar e medir os fenômenos coletivos.
Estatística é a ciência dos dados. Envolve a
coleta, a classificação, o resumo, a organização,
a análise e a interpretação da informação
numérica.
UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
3
A Estatística trata dados. Todo dado se refere a uma variável. Então a
Estatística trabalha com variáveis. A Estatística não trata constantes. As variáveis
assumem diferentes valores, nas diferentes unidades.
Exemplo:
A coordenação de um colégio pretende levantar dados sobre os alunos do 3º
ano do ensino médio, candidatos ao vestibular. O que você acha que a coordenação
pode anotar, porque é variável e o que você acha que não deve anotar, porque é
constante?
Solução:
A coordenação pode levantar dados sobre a renda familiar, sobre as
carreiras pretendidas, que são variáveis, mas não deve levantar dados sobre a
alfabetização porque, entre candidatos ao vestibular, a resposta seria uma
constante, já que todos possuem, no mínimo o ensino médio!
Os dados são freqüentemente selecionados de um conjunto maior, cujas
características é preciso estimar.
Exercícios:
1 – Um colégio pretender realizar uma festa de fim de ano. A maior queixa
dos responsáveis é com relação aos preços cobrados nas “barraquinha” pelos
alimentos disponibilizados. Que dados deverão ser coletados visando atender
melhor aos responsáveis?
2 – Há a necessidade de iniciar um ciclo de palestras para tratar de assuntos
como uso de drogas e sexualidade infantil. O profissional contratado para proferir
as palestras deseja preparar um material adequado ao perfil cultural dos
responsáveis. Que levantamento seria necessário para distribuir melhor os
responsáveis por turma e maximizar o resultado das palestras?
UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
4
1.2 – População e amostra
Conforme ficou claro na definição, a Estatística tem por objetivo o estudo
dos fenômenos coletivos e das relações que existem entre eles. Entende-se como
fenômeno coletivo aquele que se refere à população, ou universo, que compreende
um grande número de elementos, sejam pessoas ou coisas.
Note que a população é definida em função da informação que interessa ao
pesquisador. Se você quiser informações sobre estudantes com faixa etária entre 7
e 14 anos de um município do interior do estado, esta será a sua população,
mesmo que você só disponha dos alunos de uma única escola pala coletar os
dados.
Precisamos, também da definição de amostra:
Uma característica numérica estabelecida para toda uma população é
denominada parâmetro.
Uma característica numérica estabelecida para uma amostra é denominada
estimador.
Utilizando o exemplo citado acima, a população seria a totalidade dos alunos
com idades entre 7 e 14 anos do município pesquisado. Utilizando a população
poder-se-ia concluir como parâmetro que, por exemplo, 60 % dos alunos são do
sexo feminino. Podemos indicar como uma amostra somente os alunos do turno da
manhã da mesma escola. Utilizando somente a amostra, poder-se-ia estimar que,
por exemplo, 57 % dos alunos são do sexo feminino.
População é o conjunto de elementos sobre o qual
desejamos obter informação.
População é o conjunto de todos os itens (pessoas,
coisas) que interessam ao estudo de um fenômeno
coletivo segundo alguma característica.
Amostra é qualquer subconjunto não vazio de uma população,
ou, é todo subconjunto de elementos retirados da população para
obter a informação desejada.
UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
5
Quando os dados são obtidos de toda uma população, diz-se que foi feito
um recenseamento. Quando são obtidos dados de apenas parte da população, diz-
se que foi feita uma amostragem. O conjunto de dados obtidos de toda a população
é denominado censo.
Censo é uma avaliação direta de um parâmetro, utilizando-se todos os
componentes da população.
Estimação é uma avaliação indireta de um parâmetro, com base em um
estimador através do cálculo de probabilidades.
As principais propriedades do censo são:
• admite erro processual zero e tem confiabilidade 100 %;
• é caro;
• é lento;
• é quase sempre desatualizado;
• nem sempre é viável.As principais propriedades da estimação são:
• admite erro processual positivo e tem confiabilidade menor que
100 %;
• é barata;
• é rápida;
• é atualizada;
• é sempre viável.
População – todos os
elementos do conjunto
que interessa.
Amostra – subconjunto
não vazio de uma
população
Parãmetro
Estimador
UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
6
Comentário Importante:
Estatisticamente, a precisão de um valor numérico é avaliada através do
binômio: confiança e erro processual.
Se admitirmos que podemos retirar do Censo todo tipo de erro de natureza
humana (erro de cálculo de avaliação, de anotação), restará apenas outro tipo de
erro devido ao procedimento empregado.
Este erro é chamado erro processual. No caso de um Censo, o erro
processual é zero, pois avaliamos um por um, todos os elementos componentes da
População.
Como o erro processual na avaliação é zero, a confiabilidade no parâmetro
obtido é 100 %. A precisão, no Censo é total.
Na estimação, como avaliamos apenas parte e não todos os elementos que
compõem a população, admitimos um erro processual positivo na avaliação do
valor numérico e por conseqüência uma confiabilidade menor que 100 %, sendo,
portanto, menos precisa que o Censo. (da SILVA; 1996,13)
A população pode ser, segundo o seu tamanho, finita ou infinita. É finita a
população que possui um número determinado de elementos; aa população infinita
possui um número infinito de indivíduos. Esta definição existe somente no campo
teórico, uma vez que, na prática, nunca encontraremos populações com infinitos
elementos mas, sim, populações com grande número de componentes e, nestes
casos, tais populações são tratadas como se fossem infinitas.
Quando a população é muito grande, torna-se difícil a observação dos
aspectos a serem estudados de cada um dos elementos, devido ao alto custo, ao
intenso trabalho e ao tempo despendido para levar a cabo uma exaustiva
observação de todos os componentes da população. Nessas circunstâncias, fazemos
a seleção de uma amostra suficientemente representativa da população e, através
da observação dessa amostra, estaremos aptos a analisar os resultados, da mesma
No Brasil, os censos são feitos pela Fundação
Instituto Brasileiro de Geografia e Estatística
(Fundação IBGE), que obtém dados de toda a
população.
O censo demográfico é realizado a cada dez anos e
os seus resultados são corrigidos periodicamente
através da PNAD – Pesquisa Nacional por Amostra
Domiciliar.
UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
7
forma que se estudássemos toda a população, só que nesse caso sem os
inconvenientes anteriormente descritos.
Exercícios:
1 – Uma pesquisa foi realizada entre os alunos de um colégio. Considerando
os indicadores apresentados, identifique se o resultado foi baseado em uma
amostra ou em uma população:
a) todos os alunos foram abordados e indicaram a necessidade de
instalação de ventiladores nas salas de aula;
b) 75 % das meninas responderam os questionários e solicitaram
aulas de balé;
c) para obter informações sobre os inspetores responsáveis pelos
alunos do ensino médio foram consultadas somente as turmas da
manhã, sendo que existem turmas à tarde;
d) todos os alunos responderam que 80 % dos professores são muito
rigorosos nos critérios de avaliação.
2 – Para os casos acima, identifique se as características numéricas obtidas
são parâmetros ou estimativas.
3 – Em que situações será necessária a realização de um censo? Justifique.
1.3 – Estatística Indutiva e Descritiva
O tratamento estatístico de um conjunto de dados pode envolver dois
processos diferentes, isto é, a descrição dos dados e o estabelecimento de
conclusões sobre a população a partir dos dados obtidos por amostragem.
Normalmente, no trabalho estatístico o pesquisador se vê obrigado a lidar
com grande número de valores numéricos resultantes de um Censo ou de uma
estimação.
Estes valores numéricos são chamados de dados estatísticos.
A definição do tamanho da amostra vai depender do
universo que estiver sendo pesquisado. Em alguns
casos, coma nas pesquisas eleitorais, utiliza-se uma
pequena fração da população e verifica-se resultados
bem positivos. A definição do tamanho da amostra é
objeto de estudo mais aprofundado.
UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
8
A Estatística ensina métodos racionais para a obtenção de informações a
respeito de um fenômeno coletivo, além de obter conclusões válidas para o
fenômeno e também permitir tomada de decisões, através de dados estatísticos
observados.
A Estatística pode ser dividida em duas áreas:
a) Estatística Descritiva, e
b) Estatística Indutiva.
Necessitamos, também, conceituar Estatística Indutiva:
Quando é realizado um Censo Demográfico, obtém-se informações sobre a
totalidade da população em um determinado período. Por exemplo, verifica-se qual
é a proporção entre homens e mulheres. Pode-se, através destes dados, verificar-
se qual foi a evolução do crescimento de homens e mulheres em relação a um
período anterior, pela simples comparação entre os dados. Neste caso são
utilizados conceitos de Estatística Descritiva.
Entretanto, se forem coletadas amostras em populações das capitais, por
exemplo, e a partir dos dados obtidos forem verificadas as proporções entre
Estatística Descritiva ou Dedutiva é aquela que tem por
objetivo descrever e analisar determinada população, sem
pretender tirar conclusões de caráter mais genérico.
Estatística Descritiva utiliza métodos numéricos e gráficos
para mostrar os padrões de comportamento dos dados, para
resumir a informação contida nesses dados e apresentar a
informação de forma conveniente.
Estatística Indutiva ou Inferência Estatística é a parte da
Estatística que, baseando-se em resultados obtidos da análise
de uma amostra da população, procura inferir, induzir ou
estimar as leis de comportamento da população da qual a
amostra foi retirada.
Estatística Indutiva é a parte da Estatística que tem por
objetivo obter e generalizar conclusões para a população a
partir de uma amostra, através do cálculo de probabilidade.
UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
9
homens e mulheres, poder-se-á, através de Estatística Indutiva, generalizar a
relação entre os sexos para a população como um todo.
A Estatística Descritiva, na sua função de descrição dos dados, tem as
seguintes atribuições:
a) obtenção dos dados estatísticos.
 É normalmente feita através de um questionário ou de observação direta
de uma população ou amostra.
b) a organização dos dados.
 Consiste na ordenação e crítica quanto à correção dos valores
observados, falhas humanas, omissões, abandono de dados duvidosos, etc.
c) a redução dos dados.
 O entendimento e compreensão de grande quantidade de dados através
da simples leitura de seus valores individuais é tarefa extremamente árdua e difícil
mesmo para o mais experimentado pesquisador.
 A Estatística Descritiva apresenta duas formas básicas para a redução do
número de dados com os quais devemos trabalhar, chamadas variável discreta e
variável contínua, que serão objeto de definições mais adiante.
d) A representação dos dados.
 Os dados estatísticos podem ser mais facilmente compreendidos quando
apresentados atravésde uma representação gráfica, o que permite uma
visualização instantânea de todos os dados
 Os gráficos – que serão objeto de estudo mais adiante, quando bem
representativos, tornam-se importantes instrumentos de trabalho.
São, ainda, atributos da Estatística Descritiva, visando facilitar a descrição
dos fenômenos observados: obtenção de médias, proporções, dispersões,
tendências, índices, taxas e coeficientes.
Exercícios:
1 – Quais são as principais atribuições da Estatística Descritiva?
UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
10
2 – Dados amostrais foram coletados e em função deles um pesquisador
concluir fatos para abranger toda a população. Em que ramo da Estatística este
pesquisador está atuando?
UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
11
1.4 – Var iáveis Qual i tat ivas. Var iáveis
Quantitativas:contínuas e discretas
Quando se realiza um levantamento, de um modo geral, para cada elemento
investigado, tem-se associado um resultado ( ou mias de um resultado)
correspondendo à realização de uma certa variável (ou variáveis). Vamos, para
exemplificar, supor que você deseje efetuar um levantamento sobre alguns
aspectos sócio-econômicos das famílias dos alunos matriculados no colégio em que
trabalha. Para cada família investigada tem-se associado um resultado (ou mais de
um resultado) correspondendo à realização de uma certa variável (ou variáveis).
No exemplo em questão, serão consideradas as seguintes variáveis: estado civil do
responsável, educação do responsável, número de filhos, salário familiar, idade do
responsável e estado de procedência.
Algumas variáveis como sexo, educação, estado civil, etc. apresentam como
possíveis realizações uma qualidade (ou atributo) do indivíduo pesquisado, ao
passo que outras como número de filhos, salário, estatura, etc. apresentam como
possíveis realizações números resultantes de uma contagem ou mensuração.
Tabela 1
Informação sobre dados sócio-econômicos das famílias dos alunos do Colégio XXX.
Responsável
Família
Nº
Estado
Civil
Educação
Número
de
Filhos
Idade
(anos/meses)
Estado de
Procedência
Salário
Familiar
(R$)
01 Casado Superior 02 39 a 05 m RJ 1.250,00
02 Solteiro Fundamental 03 40 a 07 m BA 2.152,00
03 Solteiro Fundamental 02 37 a 03 m RJ 1.870,00
04 Casado Médio 03 40 a 10 m SE 1.470,00
05 solteiro superior 04 38 a 02 m MG 1.120,00
Fonte: Dados Hipotéticos
As variáveis que possibilitam como realizações qualidade
ou atributos são denominadas de variáveis qualitativas.
UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
12
No caso acima, as variáveis estado civil, educação, estado de procedência,
são variáveis qualitativas, ao passo que as variáveis número de filhos, idade e
salário familiar são variáveis quantitativas.
Dentre as variáveis qualitativas, ainda podemos fazer distinção entre dois
tipos:
a) variável qualitativa nominal – para a qual não existe nenhuma
ordenação nas possíveis realizações, como é o caso do estado de
procedência;
b) variável qualitativa ordinal – para a qual existe uma certa ordem
nos possíveis resultados, como é o caso da educação, pois a
classificação em fundamental, médio ou superior correspondem a
uma ordenação baseada no número de anos de escolaridade.
As variáveis quantitativas também possuem classificação dicotômica:
a) variáveis quantitativas discretas – aquelas cujos possíveis valores
formam um conjunto finito ou enumerável de números e que
resultam, freqüentemente, de uma contagem, como por exemplo o
número de filhos. Como exemplo, temos o número de filhos (0, 1,
2, 3 ...).
b) variáveis quantitativas contínuas – aquelas cujos possíveis valores
formam um intervalo de números reais e que resultam,
normalmente, de uma mensuração, como por exemplo o salário
familiar.
Classificação de uma variável
As variáveis que apresentam como possíveis realizações
números resultantes de uma contagem ou mensuração
são denominadas variáveis quantitativas.
Nominal
 Qualitativa
Ordinal
 Variável
Discreta
 Quantitativa
Contínua
UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
13
Para cada tipo de variável existem técnicas mais apropriadas para resumir
as informações.
1.5 – Arredondamento de Dados
Uma das questões que mais comumente interfere nos resultados de
questões envolvendo números é o arredondamento. Qual será a regra mais
adequada? Maior do que cinco arredonda para mais, menor do que cinco arredonda
para menos?
Vejamos uma regra bem simples:
a) em primeiro lugar precisamos determinar para quantas casas
decimais queremos arredondar o número;
b) vamos utilizar a regra do número par que precede.
Por exemplo:
- o resultado do arredondamento de um número como 72,8 para o inteiro
mais próximo é 73, posto que 72,8 é mais próximo de 73 do que de 72. De forma
semelhante, 72,8146 arredondado para o centésimo mais próximo, ou com duas
decimais, é 72,81, porque 72,8146 é mais próximo de 72,81 do que de 72,82.
- ao arredondarmos 72,465 para o centésimo mais próximo, entretanto,
deparamo-nos com um dilema pois 72,465 dista igualmente de 72,46 e de 72,47.
Utilizemos, então, a regra do número para que precede o cinco. Assim, 72,465 é
arredondado para 72,46; 183,575 é arredondado para 183,58.
A prática do arredondamento é especialmente valiosa para reduzir ao
mínimo os erros acumulados por arredondamento, quando trata-se de grande
número de operações.
1.6 – Notação Científica
Ao escrever números, especialmente aqueles que comportem muitos zeros,
antes ou depois da vírgula, é conveniente empregar a notação científica que utiliza
as potências de 10.
UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
14
Exemplos:
Número Notação Científica Número Notação Científica
10 101 0,00021 21 x 10-5
1.000 103 856.000.000 856 x 106
100.000 105 0,0000001 10-8
Note que, por exemplo, multiplicando-se 0 número 846 por 106, tem-se o
mesmo resultado que os deslocar a vírgula, para a direita, 6 (seis) casas. Já
multiplicando-se 21 por 10-5, tem-se o mesmo resultado do que deslocando-se a
vírgula para a esquerda 5 (cinco) casas.
A notação científica facilita a operação em muitos casos.
Por exemplo:
- sem o auxílio de uma máquina de calcular, vamos determinar o resultado
de (4.000.000) x (0,0000000002).
Em primeiro lugar:
4.000.000 = 4 x 106 e 0,0000000002 = 2 x 10-10
Desta forma, passamos a ter:
(4)x(106)x(2)x(10-10)
= (4)x(2)x(106)x(10-10)
= 8 x (106-10)
= 8 x 10-4 = 0,0008
Um exemplo utilizando a divisão:
- Qual será o resultado de 20.000 dividido por 0,005?
Na operação acima foi efetuada uma multiplicação com
potências de mesma base, ou seja, números em potência
de 10. Na multiplicação de potências de mesma base,
repete-se a base e soma-se os expoentes, respeitando-se
os sinais dos expoentes.
No caso de divisão, repete-se a base e subtrai-se os
expoentes, respeitando-se os sinais dos expoentes.
Talvez seja necessário que você efetue uma revisão nos
conceitos fundamentais de matemática, para tanto
consulte livros de Matemática Básica.UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
15
20.000 = 20 x 103
0,005 = 5 x 10-3
(20)x(103) : (5)x(10-3) = (20):(5)x(103:10-3) = 4 x (10 3-(-3)) = 4 x 106
1.7 – Gráficos
Um gráfico é uma representação gráfica da relação entre variáveis. Muitos
tipos de gráficos são empregados na estatística, dependendo da natureza dos
dados pertinentes e da finalidade para a qual ele é destinado.
Um gráfico corresponde à representação dos dados sob diferentes formas
gráficas, a fim de permitir uma visão rápida e global do fato estudado. De uma
maneira geral, pode-se dizer que os gráficos devem ser confeccionados de maneira
simples e clara, de tal sorte que o observador entenda claramente aquilo que o
gráfico busca evidenciar, sem necessidade de ficar procurando adivinhar o que ele
representa. É extremamente importante que o gráfico seja construído com
honestidade buscando retratar a realidade.
A maioria dos gráficos são construídos no plano cartesiano, ou seja entre
eixos coordenados – abscissas e ordenadas.
A abscissa é o eixo horizontal e a ordenada o eixo vertical. Ambos são
representativos de escalas de grandeza e o ponto onde se encontram é denominado
origem.
Exemplo:
Para a construção de um gráfico é necessário que sejam seguidas algumas
regras:
1 – todo gráfico deve ter título e escala;
2 – o título deve ser escrito acima do gráfico;
Ordenada
Abscissa
Origem
UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
16
3 – no eixo das abscissas a escala cresce da esquerda para a direita e é
escrita embaixo do eixo;
4 – no eixo das ordenadas a escala cresce de baixo para cima e é escrita à
esquerda do eixo;
5 – nos dois eixos devem estar identificadas as variáveis ali representadas;
6 – as linhas auxiliares (grade) são opcionais, mas ajudam a leitura;
7 – os gráficos podem exibir, em rodapé, a fonte, isto é, a instituição, o
pesquisador, ou o grupo de pesquisadores que forneceu o gráfico ou os dados que
permitiram a construção do gráfico.
Os principais tipos de gráficos são:
a) gráfico de linhas;
b) gráfico de colunas;
c) gráfico de barras e,
d) gráfico de setores.
Para que possamos construir os gráficos enumerados acima, vamos utilizar
um exemplo hipotético.
Exemplo:
Um levantamento feitos na Secretaria de uma escola, com relação ao
número de alunos que não adimpliram o pagamento das mensalidades, no
vencimento, no primeiro semestre do ano 20XX, possibilitou a elaboração da tabela
abaixo:
Outros tipos de gráficos são utilizados. Na estatística é
extremamente utilizado o HISTOGRAMA. Adiante será verificada a
técnica de construção do histograma, após as definições relativas
às distribuições de freqüência.
UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
17
Número de alunos que não adimpliram as mensalidades,
 no vencimento, no primeiro semestre de 20XX.
Meses Número de alunos
Janeiro 17
Fevereiro 12
Março 09
Abril 19
Maio 13
Junho 16
Fonte: dados hipotéticos.
Com base nos dados apresentados vamos construir cada um dos gráficos
enumerados.
a) Gráfico de Linhas
Para a construção do gráfico de linhas, siga os seguintes passos:
1 – trace o sistema de eixos cartesianos;
2 – apresente a variável (meses) no eixo das abscissas e as freqüências
(número de alunos) no eixo das ordenadas;
3 – marque as interseções de cada par ordenado (mês x número de alunos);
4 – para cada interseção faça um ponto bem visível;
5 – uma os pontos, e
5 – coloque o título na figura.
UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
18
Número de alunos que não adimpliram, no 
vencimento, as mensalidades do primeiro 
semestre de 20XX
0
5
10
15
20
Janeiro
F
evereiro
M
arço
A
bril
M
aio
Junho
Meses
N
ú
m
er
o
 d
e 
A
lu
n
o
s
Observe que o gráfico permite visualizar a evolução dos dados, permitindo
que sejam efetuadas conclusões, tais como:
a) há um decréscimo da inadimplência entre janeiro e março;
b) acentua-se a inadimplência no mês de abril.
Vamos, agora, construir, para o mesmo exemplo, um gráfico de colunas.
b) Gráfico de Colunas
Para construir um gráfico de colunas, siga os seguintes passos:
a) trace o sistema de eixos cartesianos;
b) apresente a variável no eixo das abscissas e as freqüências nos eixos das
ordenadas;
c) para representar a variável, construa colunas com bases de mesma
largura, mas alturas iguais às respectivas freqüências, e
d) coloque o título na figura.
UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
19
Número de alunos que não adimpliram as 
mensalidades, no vencimento, no primeiro 
semestre de 20XX
0
5
10
15
20
Janeiro Fevereiro Março Abril Maio Junho
Meses
N
ú
m
er
o
 d
e 
al
u
n
o
s
Veja que o Gráfico de Colunas permite visualizar, também, os mesmos
elementos descritos no gráfico de linhas.
Pode-se, com o auxílio do Microsoft Excel, construir algumas variações do
gráfico de colunas, como, por exemplo, o gráfico de colunas em três dimensões
(3D). As informações obtidas são as mesmas, somente a aparência muda.
Gráfico de Colunas em 3D
Ja
ne
iro
F
ev
er
ei
ro
M
ar
ço
A
br
il
M
ai
o
Ju
nh
o
S1
0
5
10
15
20
N
ú
m
er
o
 
d
e 
al
u
n
o
s
Meses
Número de alunos que não adimpliram as 
mensalidades, no vencimento, no primeiro 
semestre de 20XX
c) Gráfico de Barras
A construção do Gráfico de barras é muito similar à construção do gráfico de
colunas, o que ocorre é uma inversão dos eixos, ou seja, no gráfico de barras as
UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
20
variáveis são representadas no eixo das ordenadas e as freqüências nos eixos das
abscissas.
Para construir um gráfico de barras, siga os seguintes passos:
1 – trace o sistema de eixos cartesianos;
2 – apresente a variável no eixo das ordenadas e as freqüências no eixo das
abscissas;
3- para representar a variável, construa barras com bases de mesma
largura, mas comprimentos iguais às respectivas freqüências;
4 – coloque o título da figura.
Número de alunos que não adimpliram as 
mensalidades, no vencimento, no primeiro 
semestre de 20XX
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Janeiro
Fevereiro
Março
Abril
Maio
Junho
Meses
N
ú
m
er
o
 
d
e 
al
u
n
o
s
d) Gráfico de Setores
O gráfico de setores, também denominado de “gráfico de pizza” , possibilita
visualizar a importância relativa de cada variável no conjunto. Em outras palavras,
permite verificar qual é a participação percentual de cada elemento na formação do
conjunto avaliado.
Para a construção de um gráfico de setores inicialmente é necessário que
seja determinada a participação relativa de cada variável e para tal utiliza-se o
princípio das proporções.
Vejamos a tabela inicial:
UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
21
Número de alunos que não adimpliram as mensalidades,
 no vencimento, no primeiro semestre de 20XX.
Meses Número de alunos
Janeiro 17
Fevereiro12
Março 09
Abril 19
Maio 13
Junho 16
Fonte: dados hipotéticos.
Vamos efetuar a soma dos número de alunos que não adimpliram a
mensalidade, em todo o semestre:
Número de alunos que não adimpliram as mensalidades,
 no vencimento, no primeiro semestre de 20XX.
Meses Número de alunos
Janeiro 17
Fevereiro 12
Março 09
Abril 19
Maio 13
Junho 16
TOTAL 86
Fonte: dados hipotéticos.
O total, ou seja 86 alunos, corresponde a 100 % dos eventos.
Pode-se determinar através da Regra de Três, a participação de cada mês na
formação total. Desta forma estaremos calculando a freqüência relativa de cada
mês.
Para o mês de Janeiro, teremos:
86 -------- 100 %
17 --------- X %
Sabendo-se que o produto dos meios é igual ao produto dos extremos, têm-
se que:
UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
22
86 x X = 17 x 100 %
logo,
X = (17 x 100%) / 86
X = 19,8 %
O valor encontrado indica que 19,8 % das ocorrências verificados no
semestre foram no mês de janeiro.
Vamos calcular os valores para os outros meses:
Número de alunos que não adimpliram as mensalidades,
 no vencimento, no primeiro semestre de 20XX.
Fonte: dados hipotéticos.
Para a construção de um gráfico de setores, deve-se seguir os seguintes
passos:
1 – trace uma circunferência. A área do círculo representará o total, isto é,
100 %;
2 –lembre-se de que uma circunferência tem 360º. Então, se aos 100%
correspondem 360º, a freqüência relativa de cada mês (no exemplo),
corresponderá um setor cujo ângulo será calculado através de :
Yº = (360º x freqüência relativa) / 100
3– marque os valores dos ângulos calculados na circunferência (com o
auxílio de um transferidor) e trace raios separando os setores;
4 – faça um tracejado ou utilize cores diferentes para cada setor, para
facilitar a visualização;
5 – coloque o título na figura.
Meses Número de alunos
Freqüência
Relativa
Janeiro 17 19,8
Fevereiro 12 14,0
Março 09 10,5
Abril 19 22,0
Maio 13 15,1
Junho 16 18,6
TOTAL 86 100,0
UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
23
Vamos calcular os ângulos de cada um dos setores do exemplo:
Número de alunos que não adimpliram as mensalidades,
 no vencimento, no primeiro semestre de 20XX.
Meses Número de alunos
Freqüência
Relativa
Ângulo
Janeiro 17 19,8 71,28
Fevereiro 12 14,0 50,40
Março 09 10,5 37,80
Abril 19 22,0 79,20
Maio 13 15,1 54,36
Junho 16 18,6 66,96
TOTAL 86 100,0 360,00
Fonte: dados hipotéticos.
Após calculados os ângulos, tem-se que:
Número de alunos que não adimpliram as 
mensalidades, no vencimento, no primeiro 
semestre de 20XX
Janeiro Fevereiro
Março Abril
Maio Junho
Na construção do gráfico de setores, pode-se utilizar alguns artifício, visando
facilitar a visualização dos valores. Pode-se indicar no próprio gráfico o percentual
aproximado de cada setor, ou efetuar-se a “explosão” dos setores.
Veja os exemplos abaixo:
UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
24
Número de alunos que não adimpliram as 
mensalidades, no vencimento, no primeiro 
semestre de 20XX
Janeiro
20%
Fevereiro
14%
Março
10%Abril
22%
Maio
15%
Junho
19%
ou
Número de alunos que não adimpliram as 
mensalidades, no vencimento, no primeiro 
semestre de 20XXJaneiro
20%
Fevereiro
14%
Março
10%Abril
22%
Maio
15%
Junho
19%
A utilização do Microsoft Excel facilitará sobremaneira
a construção dos gráficos. Procure familiarizar-se com
a planilha eletrônica e utilize o tutorial gráficos para a
construção.
UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
25
2 – Distribuições de Freqüência
2.1 – Dados brutos
Quando são realizados levantamentos estatísticos normalmente são obtidos
um número muito grande de dados, o que dificulta a visualização dos resultados.
É necessário que os dados sejam “arrumados”, postos em ordem, para que
se possa tirar as conclusões que levaram a obtenção dos dados.
Quando um conjunto de dados é coletado, os dados estão geralmente em
forma bruta, isto é, as observações numéricas não estão arrumadas em qualquer
ordem ou seqüência específica.
 Conforme o número de observações cresce, vai-se tornando muito difícil
focalizar os principais aspectos em um conjunto de dados; assim precisamos de
meios para organizar as observações de modo que possamos compreender melhor
que informações os dados estão comunicando.
Vamos supor, por exemplo, que sejam coletadas as notas de 20 alunos em
um trabalho de História e que se obtenha os seguintes valores:
X: 2; 3; 2; 1; 2; 1; 2; 3; 2; 2; 2; 3; 1; 1; 1; 3; 3; 2; 3; 1.
Não está importando, para a análise, a correlação entre que aluno tirou qual
nota, ou seja, o que está em observação são as notas.
Deve-se, então, para facilitar a observação, ordenar os dados.
Vamos ordena-los em ordem crescente:
X: 1; 1; 1; 1; 1; 1; 2; 2; 2; 2; 2; 2; 2; 2; 3; 3; 3; 3; 3; 3.
Os dados coletados estão originalmente na forma
bruta, ou seja, são DADOS BRUTOS, que necessitam
ser “lapidados” para que se possa obter conclusões
sobre eles.
Dados brutos são aqueles que não foram
numericamente organizados.
UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
26
2.2 – Rol
Os dados ordenados são denominados de ROL.
A construção de um rol é imprescindível para que se possa efetuar análises e
observações nos dados coletados.
É a partir do rol que poder-se-á verificar qual será a forma mais eficiente de
representar de forma tabular os dados obtidos.
Quando os valores distintos forem em número reduzido pode-se optar pela
representação através de uma variável discreta. Quando o número de valores
distintos for grande, normalmente a melhor opção será a construção de uma
variável contínua.
2.3 – Distribuição de Freqüência
Representar os dados obtidos em um levantamento através de uma
distribuição de freqüência é o passo inicial para que se possa efetuar as análises
necessárias dos dados.
Representar os dados de forma tabular – através de uma tabela, é dispor os
dados de maneira ordenada.
Vamos necessitar de um conceito:
Observe que no conjunto apresentado, o número de elementos distinto da
série – no caso as notas, é pequeno (1, 2 e 3). Neste caso, torna-se fácil reduzir o
conjunto em uma única tabela.
Como o número de elementos distinto é pequeno, podemos utilizar uma
variável discreta para a representação da série de valores.
Neste caso, vamos dispor o conjunto em duas colunas: na primeira iremos
colocar os valores distintos em ordem crescente e na segunda coluna colocaremos
FREQÜÊNCIA SIMPLES de um elemento é o
número de vezes que este elemento figura no
conjunto de dados.
Rol é o arranjo dos dados brutos em ordem de
grandeza crescente ou decrescente.
UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
27
os valores das freqüências simples – número de vezes que cada valores é
verificado.
Os valores distintos, ou seja as variáveis, serão representados pela notação
xi, ou seja – x índice i, onde i representa a ordem do valor, a classe.
As freqüências serão representadas por fi, ou seja – f índice i,
Desta forma, teremos:
Notas dos alunos no trabalhode História
Notas (xi) Freqüência (fi)
1 6
2 8
3 6
Fonte: dados hipotéticos.
Observe que conseguiu-se reduzir um conjunto de 20 elementos que
constituíam a série original, para apenas 6, distribuídos em pares que possibilitam
uma perfeita visualização dos elementos observados.
Ocorre, entretanto, que o número de elementos distinto é muito grande.
Nestes casos, a construção de uma variável discreta não é aconselhável, pois
dificultaria a análise.
Nestes casos, deve-se utilizar a variável contínua.
Vamos, por exemplo, identificar as notas atribuídas para os alunos de uma
turma em uma prova de Língua Portuguesa:
A opção pela variável discreta só é possível quando
o número de elementos distintos da série for
pequeno.
A construção de uma variável discreta é
bastante simples. Basta observar quais são os
elementos distintos da seqüência, ordena-los, e
coloca-los na primeira coluna da tabela. Em
seguida computar a freqüência simples de cada
elementos distinto e colocá-la na segunda coluna
da tabela.
UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
28
Y: 7,2 4,9 9,8 6,4 4,8 4,6 6,8
5,9 8,5 8,7 1,2 2,5 4,3 6,7
9,5 5,4 1,3 7,6 5,9 6,7 8,6
9,5 9,3 7,4 8,6 8,1 5,9 1,8
7,8 7,2 8,4 6,8 8,2 6,9 7,4
6,3 4,6 4,9 8,7 9,3 8,8 5,8
Observando os valores nota-se grande número de elementos distintos, o que
significa que neste caso a variável discreta não é aconselhável na redução de
dados.
Nesta situação é conveniente agrupar os dados por faixas de valores,
ficando a série com a seguinte apresentação:
Tabela XXX
Notas dos alunos da Turma XX em Língua Portuguesa
Classe Notas Freqüência (fi)
1 0 __ 2 3
2 2 __ 4 1
3 4 __ 6 11
4 6 __ 8 13
5 8 __10 14
 Fonte: Dados hipotéticos
Esta apresentação da série de valores é denominada variável contínua.
Deve-se optar por uma variável contínua na
representação de uma série de valores quando o
número de elementos distintos da série for grande.
A construção de uma variável contínua requer que
sejam abordados alguns conceitos: intervalos e limites
de classe, limites de classes e amplitude do intervalo
de classe. Inicialmente serão abordados estes
conceitos, para depois verificar-se a metodologia para
a construção de uma variável contínua.
UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
29
2.4 – Intervalos e Limites de Classe
Uma variável contínua é disposta através de classes, isto é, os dados são
dispostos em grupos distintos, que, entretanto, apresentam características
semelhantes.
Um bom exemplo para demonstrar a divisão de um conjunto de dados em
classes é a divisão de um grupo de crianças para um torneio esportivo.
Normalmente as crianças são divididas por grupos de idades: até 7 anos; maiores
do que 7 anos até 9 anos; maiores do que 9 anos até 11 anos.
O que foi feito foi a divisão em classes.
Neste caso, ter-se-ia:
Classe 1 Até 7 anos
Classe 2 > 7 anos até 9 anos
Classe 3 > 9 anos até 11 anos
Observa-se que as classes representam grupos de crianças com idades
diferentes, mas que os intervalos de idades são iguais, exceto para a primeira
classe que inclui todas as crianças com idades inferiores a 7 anos.
Existes várias maneiras de apresentar-se o intervalo de classe: iguais ou
diferentes entre si. Porém, sempre que possível, deve-se optar por intervalos
iguais, o que facilitará os cálculos posteriores. Mas mesmo com intervalos iguais, as
distribuições poderão apresentar-se das seguintes formas: (a Classe 2 do exemplo
acima servirá como modelo)
7 __ 9 Compreende todas as idades entre 7 e 9, exclusive os extremos.
7 ___ 9 Compreende todas as idades entre 7 e 9, inclusive os extremos.
7 __ 9 Compreende todas as idades entre 7 e 9, inclusive o 9 e exclusive
o 7.
7 __ 9 Compreende todas as idades entre 7 e 9, inclusive o 7 e
exclusive o 9.
Em um intervalo, quando diz-se inclusive, quer se dizer
que o número pertence ao intervalo considerado, ou seja,
o número está contido no intervalo.
Quando diz-se exclusive, quer se dizer que o número não
pertence ao intervalo, ou seja, o número não está contido
no intervalo.
UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
30
Vamos optar pelo último tipo (7 __ 9), e desta forma podemos definir
como intervalo de classe a diferença entre o limite superior e o limite inferior
da classe. Portanto, no exemplo, 9 – 7 = 2 é o intervalo ou amplitude do
intervalo de classe.
Será utilizado L para representar o limite superior de uma classe, e l para
representar o limite inferior de uma classe.
2.5 – Amplitude do Intervalo de Classe
A definição da amplitude do intervalo de classe é de suma importância para
a construção de uma variável contínua.
Para identificar a amplitude do intervalo de classe será utilizado h.
Desta forma, então, tem-se que:
As classes possuem LIMITES. Como limite podemos
interpretar onde inicia e onde termina uma classe. O
LIMITE INFERIOR é onde começa uma classe, é o
ponto de partida; o LIMITE SUPERIOR é onde
termina a classe.
AMPLITUDE DO INTERVALO DE CLASSE é a diferença
entre o limite superior e o limite inferior da classe.
H = L - l
UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
31
Necessita-se um conceito adicional: o de amplitude total de uma
seqüência.
Representando
a amplitude total por At, o maior elemento da seqüência por Xmáx e o menor
elemento da seqüência por Xmin, a amplitude total será denotada por
At = Xmáx - Xmin
2.6 – Ponto Médio de uma Classe
O ponto médio de uma classe (mi), é o ponto intermediário do intervalo de
classe.
É obtido somando-se o limite inferior ao limite superior e dividindo-se por 2.
Na realidade, as classe não precisam necessariamente ter a mesma
amplitude. Porém, sempre que possível devemos trabalhar com
classes de mesma amplitude. Isto facilita sobremaneira os cálculos
posteriores.
Note que foi usado para representar a classe, intervalo real semiaberto
à direita. Isto significa que o intervalo contém o limite inferior, mas
não contém o limite superior. No caso da classe 2, significa dizer que
ela contém os valores reais maiores ou iguais a 7 e os valores menores
que 9.
A adoção dos intervalos semiabertos pode gerar algum empecilho para
a definição e interpretação dos valores da última classe, em especial
para a definição do seu limite superior. A prática favorecerá o melhor
entendimento.
AMPLITUDE TOTAL DE UMA SEQÜÊNCIA é a diferença
entre o maior e o menor elemento de uma seqüência.
É importante verificar que, quando não dispusermos dos
dados, o cálculo da amplitude se fará levando-se em
consideração a diferença entre o limite superior da
última classe e o limite inferior da primeira classe.
UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
32
Assim, o ponto médio da Classe 2 do exemplo é (7 + 9)/2 = 16/2 = 8.
O ponto médio de uma classe (mi) é a média aritmética
entre o limite inferior (l) e o limite superior da classe
(L).
Para as finalidades das análise posteriores, admitir-se-á
quer todas as observações relativas a um determinado
intervalo de classe coincidem com o seu ponto médio.
Quando é possível analisar os dados bruto ou o rol que
deram origem à distribuição de freqüência, é fácil efetuar-
se a contagemde cada um dos elementos que formam a
distribuição. Entretanto, quando só de dispõe da
distribuição (através de variável contínua), é impossível
determinar-se quantitativamente cada um dos
componentes da distribuição. Desta forma a utilização do
ponto médio é de fundamental importância para a análise
dos dados.
UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
33
2.7 – Regras Gerais para Elaborar uma Distribuição de
Freqüência – variável contínua.
Utilizando tanto os dados brutos, como uma distribuição ordenada – rol, o
pesquisador deseja construir as tabelas e gráficos apropriados que irão possibilitar
as conclusões.
É necessário que se organize os dados, à medida em que o número de
observações aumenta, ou seja, faz-se necessário condensar ainda mais os dados
nas tabelas adequadas.
Assim, precisa-se organizar os dados em grupos de classes, de acordo com
as divisões do intervalo de observações estabelecidas de modo conveniente. Tal
organização dos dados em tabelas é chamada de distribuição de freqüência.
Quando as observações são agrupadas ou condensadas em tabelas de
distribuição de freqüência , o processo de análise e interpretação de dados torna-se
mais fácil de manejar e mais significativo. Nesta forma resumida, as principais
características dos dados podem ser aproximadas, compensando desse modo o fato
de que, quando os dados estão demasiadamente agrupados, as informações iniciais
pertinentes a observações individuais, que se encontravam anteriormente
disponíveis, são perdidas ao longo do processo de agrupamento ou condensação.
A construção de uma distribuição de freqüência – variável contínua, deve
atentar para os seguintes detalhes:
a) seleção do número apropriado de grupos de classes;
b) a obtenção de um intervalo de classe e amplitude apropriados para cada
grupo de classe, e
c) o estabelecimento de limites para cada grupo de classe a fim de evitar a
 sobreposição.
Uma distribuição de freqüência é uma tabela resumida
na qual os dados são organizados em grupos de classe
ou categorias convenientemente estabelecidas e
numericamente ordenadas. (LEVINE; 2000,60)
UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
34
O número de classe a ser utilizado depende muito da experiência do
pesquisador e das questões que ele pretende responder com a variável contínua.
Utilizando o exemplo das notas atribuídas aos alunos em uma prova de
Língua Portuguesa, verifica-se que o total de observações é de 42 dados.
Não estaria errado a construção da tabela abaixo:
Tabela XXX
Notas dos alunos da Turma XX em Língua Portuguesa
Classe Notas Freqüência (fi)
1 0 __ 10 42
 Fonte: Dados hipotéticos
Entretanto, através de uma tabela tão resumida, não se obtém nenhuma
informação adicional que já não fosse conhecida a partir do exame dos dados
brutos ou da análise do rol. Uma tabela com uma concentração muito grande de
dados não é significativa.
É necessário que o número de classes seja bem definido para análises
realmente conclusivas.
Vamos verificar o critério para a determinação do número de classes de uma
distribuição de freqüência pelo denominado critério da raiz.
- Critério da Raiz
Se a seqüência estatística contém n elementos e se indicarmos por K o
número de classes a ser utilizado, então pelo critério da raiz:
Como o número K de classes deve ser necessariamente um número inteiro e
como dificilmente o resultado é um número inteiro, deixa-se como opção para o
valor de K o valor inteiro mais próximo do resultado, uma unidade a menos ou a
mais que este valor.
No exemplo (notas de alunos em uma prova de Língua Portuguesa), verifica-
se que n (número de elementos) é igual a 42.
nK =
O número de elementos total de uma
distribuição é, conforme será abordado mais
adiante, a freqüência total da distribuição.
UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
35
Para a determinação do número de classes deve-se proceder o cálculo:
Tem-se que K = 6,4807406984, portanto o valor inteiro mais próximo do
resultado é 6. As opções para K então são: 5, 6 e 7.
Necessita-se verificar qual é a amplitude total da seqüência, e para tanto,
inicialmente, necessita-se verificar qual é o valor mínimo e qual é o valor máximo,
e para tanto é aconselhável que os dados brutos estejam organizados em ordem
crescente (rol).
Dados Brutos
Y: 7,2 4,9 9,8 6,4 4,8 4,6 6,8
5,9 8,5 8,7 1,2 2,5 4,3 6,7
9,5 5,4 1,3 7,6 5,9 6,7 8,6
9,5 9,3 7,4 8,6 8,1 5,9 1,8
7,8 7,2 8,4 6,8 8,2 6,9 7,4
6,3 4,6 4,9 8,7 9,3 8,8 5,8
Dados Organizados em ordem crescente (ROL)
Y: 1,2 4,6 5,9 6,7 7,4 8,4 8,8
1,3 4,8 5,9 6,8 7,4 8,5 9,3
1,8 4,9 5,9 6,8 7,6 8,6 9,3
2,5 4,9 6,3 6,9 7,8 8,6 9,5
4,3 5,4 6,4 7,2 8,1 8,7 9,5
4,6 5,8 6,7 7,2 8,2 8,7 9,8
Desta forma verifica-se que Xmáx = 9,8 e que Xmín = 1,2.
Logo, como At = Xmáx - Xmin,
têm-se At = 9,8 – 1,2
At = 8,6.
42=K
UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
36
A amplitude do intervalo de classe que é designada por h, é determinada da
seguinte forma:
Utilizando o critério do par mais próximo para o arredondamento, verifica-se
que h = 1,4.
O critério adotado para o intervalo de classe é o semi-aberto à direita,
deve-se, então, proceder o ajuste dos valores.
Para que todos os valores sejam alocados na distribuição, passaremos a
considerar que Xmin = 1 e que Xmáx = 10, logo At = 9. Desta forma, considerando
K = 6, h = 1,5.
Então, a variável contínua terá a seguinte forma:
K
A
h t=
O número de classes a ser utilizado depende muito
da experiência do pesquisador e das questões que
ele pretende responder com a variável contínua.
Quando foram ampliados os valores mínimos e
máximos, não foram alteradas as características da
distribuição, pois, conforme será verificado, em uma
variável contínua o que vai identificar uma classe
será o seu ponto médio.
UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
37
Notas dos alunos da turma XX na prova de Língua Portuguesa
Classe Notas Freqüência
1 1 __ 2,5 3
2 2,5 __ 4 1
3 4 __ 5,5 7
4 5,5 __ 7 11
5 7 __ 8,5 9
6 8,5 __ 10 11
Total 42
Fonte: dados hipotéticos.
A variável contínua é conceituada como uma representação tabular em que
coloca-se na primeira coluna os intervalos de classe e na segunda coluna os valores
das freqüências simples correspondentes.
A coluna “classe” tem a finalidade apenas de facilitar a referência às classes,
não fazendo parte da variável contínua.
O quadro final tanto da variável discreta como da variável contínua é
denominado de distribuição de freqüência.
A representação tabular final apresenta intervalos
e freqüências diferentes da apresentada
inicialmente, pois agora foram utilizadas as
técnicas corretas para sua elaboração.
UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
38
2.8 – Freqüência : simples, acumulada e relativa.
A distribuição de freqüência deve ser utilizada como elemento que possibilite
a análise dos dados.
Verifica-se que os dados devidamente distribuídos permite a melhor
visualização de como, no exemplo apresentado, as notas foram distribuídas entreos alunos. Pode ser constatado que 11 alunos obtiveram notas iguais ou superiores
a 5, 5, porém inferiores à 7.
a) Freqüência Simples (fi).
A freqüência simples é resultante da “contagem” dos dados pertencentes à
cada classe.
A freqüência simples é a que aparece na forma original da distribuição de
freqüência.
b) Freqüência acumulada ( facm)
A freqüência acumulada irá representar o número de elementos até a classe
que está sendo visualizada, ou seja, é a soma da freqüência simples desta classe
com as freqüências simples das classes anteriores.
No exemplo, tem-se que:
Notas dos alunos da turma XX na prova de Língua Portuguesa
Classe Notas Freqüência Freqüência
Acumulada
1 1 __ 2,5 3 3
2 2,5 __ 4 1 4
3 4 __ 5,5 7 11
4 5,5 __ 7 11 22
5 7 __ 8,5 9 31
6 8,5 __ 10 11 42
Total 42
Fonte: dados hipotéticos.
UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
39
Os valores representados na coluna FREQUÊNCIA ACUMULADA representam
o número de eventos que estão contidos nas classes de forma cumulativa. Desta
forma, verifica-se que 22 alunos obtiveram notas inferiores a 7, ou seja, a
freqüência cumulada da Classe 3.
A freqüência acumulada da última classe da distribuição deve ser igual à
freqüência total, pois estarão sendo considerados todos os dados da distribuição.
c) Freqüência relativa (frel ou f %)
A freqüência relativa permitirá que sejam verificadas a participação
percentual de cada grupo de notas.
Qual foi o percentual de alunos com notas iguais ou superiores a 5,5, porém
inferiores a 7?
Para que se possa responder a esta pergunta, é necessário que lembremos
que a totalidades dos dados dispostos corresponde à 100 % da distribuição. Logo,
no exemplo, o total de alunos – 42, corresponde à 100 %.
A freqüência relativa de cada classe é a relação percentual da freqüência
simples de cada classe para a formação da freqüência total.
Mais uma vez necessita-se da Regra de Três:
f total .................... 100 %
f i ......................... f %
Então, para a determinação da freqüência relativa de cada classe, basta que
multiplique-se a freqüência simples da classe por 100 e divida-se o resultado pela
freqüência total.
Desta forma, as freqüências relativas da distribuição ficarão assim dispostas:
total
i
rel f
xf
f
100
=
UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
40
Notas dos alunos da turma XX na prova de Língua Portuguesa
Classe Notas Freqüência Freqüência
relativa
1 1 __ 2,5 3 7,14 %
2 2,5 __ 4 1 2,38 %
3 4 __ 5,5 7 16,67 %
4 5,5 __ 7 11 26,19 %
5 7 __ 8,5 9 21,43 %
6 8,5 __ 10 11 26,19 %
Total 42 100,00 %
Fonte: dados hipotéticos.
Assim é possível verificar-se que, por exemplo, 26,19 % dos alunos
obtiveram notas maiores ou iguais a 5,5 e menores do que 7 (Classe 3).
d) Freqüência relativa acumulada (frel acm)
A freqüência relativa acumulada irá representar a participação percentual
dos elementos até a classe que está sendo visualizada, tomando por base a
freqüência acumulada da classe.
Da mesma forma que é feito para a determinação da freqüência relativa,
toma-se por base que o total da distribuição corresponderá à 100 %.
Desta forma, tem-se que:
A soma das freqüências relativas deve ser
igual a 100 %, já quem estarão sendo
consideradas todas as classes da
distribuição de freqüência.
UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
41
f total .................... 100 %
f acm ......................... f rel acm %
Então, para a determinação da freqüência relativa acumulada de cada
classe, basta que multiplique-se a freqüência simples da classe por 100 e divida-se
o resultado pela freqüência total.
No exemplo, tem-se que:
Notas dos alunos da turma XX na prova de Língua Portuguesa
Classe Notas Freqüência
Freqüência
Acumulada
Freqüência
Relativa
acumulada
1 1 __ 2,5 3 3 7,14 %
2 2,5 __ 4 1 4 9,52 %
3 4 __ 5,5 7 11 26,19 %
4 5,5 __ 7 11 22 52,38 %
5 7 __ 8,5 9 31 73,81 %
6 8,5 __ 10 11 42 100,00 %
Total 42
Fonte: dados hipotéticos.
Observe que a freqüência relativa acumulada da última classe deve ser igual
à 100 %, por estar considerando a distribuição como um todo.
Assim, a distribuição de freqüência, considerando os elementos que foram
determinados até agora, ficará disposta da seguinte forma:
total
acm
relacm f
xf
f
100
=
UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
42
Notas dos alunos da turma XX na prova de Língua Portuguesa
Classe Notas Freqüência
Freqüência
Acumulada
Freqüência
relativa
Freqüência
Relativa
acumulada
1 1 __ 2,5 3 3 7,14 % 7,14 %
2 2,5 __ 4 1 4 2,38 % 9,52 %
3 4 __ 5,5 7 11 16,67 % 26,19 %
4 5,5 __ 7 11 22 26,19 % 52,38 %
5 7 __ 8,5 9 31 21,43 % 73,81 %
6 8,5 __ 10 11 42 26,19 % 100,00 %
Total 42 100,00 %
Fonte: dados hipotéticos.
É aconselhável ao se dispor os dados sob a
forma de uma distribuição de freqüência, que
sejam determinadas as freqüências acumulada,
relativa e relativa acumulada, pois desta forma
ter-se-á um volume de informações muito úteis
para o pesquisador.
UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
43
3 . Medidas de Tendência Central e
Separatrizes
Nos capítulos anteriores foi visto com apresentar dados numéricos tanto em
forma de tabelas quanto na forma de gráficos. Agora, como pode-se fazer essas
informações terem sentido?
A apresentação gráfica dos dados é um componente essencial da Estatística
Descritiva, porém não retrata toda a sua abrangência. A boa análise dos dados não
envolve somente apresentar os dados numéricos e observar o que os dados estão
tentando transmitir, mas também envolve calcular e resumir as funções-chave e
analisar os resultados encontrados. (LEVINE; 2000,118)
Em qualquer análise e/ou interpretação, várias medidas descritivas
representado as propriedades de tendência central, variação e formato podem ser
utilizadas para extrair e resumir as principais características do conjunto de dados.
Se essas medidas descritivas forem calculadas através de uma amostra de dados,
elas serão chamadas de estatísticas; caso sejam calculadas através de toda uma
população de dados, elas serão chamadas de parâmetros. (LEVINE; 2000,119)
As três principais propriedades que descrevem um conjunto de dados
numéricos são:
a) Tendência central
 A maioria dos dados apresenta uma diferente tendência de se agrupar ou
concentrar em torno de um ponto central. Assim sendo, para um conjunto de
dados, em particular, geralmente se torna possível selecionar um valor típico ou
média para descrever todo o conjunto. Tal valor típico é uma medida de
localização ou tendência central.
b) Variação
Uma segunda propriedade importante que descreve um conjunto de dados
numéricos é a variação. Variação é a quantidade de dispersão nos dados. Dois
conjuntos de dados podem divergir tanto na medida central como na variação, da
mesma forma que dois conjuntos de dados podem ter as mesmas medidas de
tendência central, porém divergir bastante em termos de variação.
UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________44
c) Formato
O formato da população é obtido através de uma comparação relativa entre
algumas medidas de tendência central.
Para facilitar o entendimento de diversas fórmulas que serão apresentadas,
faz-se necessário que sejam apresentados alguns conceitos, dentre os quais:
índice, notação por índice e notação em somatório.
3.1 – Índices ou notação por índices.
Suponha uma série com os seguintes elementos:
Y = { 2, 3, 4, 6, 7, 9 }
Há, na disposição dos dados, uma correlação entre o elemento e a posição
que ele ocupa da série.
O número 2 ocupa a primeira posição na série; o número 6 ocupa a quarta
posição na série.
Pode-se, então, convencionar que uma série pode ser identificada por
simbologias que representem o elemento e a posição que ele ocupa.
Supondo que o conjunto de dados Y seja representativo das notas de um
aluno.
Então, o conjunto Y é formado por variáveis notas, que podem ser
representadas pela letra X. Cada nota ocupa uma posição no conjunto, e cada
posição passará a ser representada pelo índice i.
Desta forma, o conjunto Y pode ser identificado pela seguinte notação:
Y = { X1, X2, X3, X4, X5, X6 }
Onde X é a variável (nota) e 1, 2, etc, a posição de cada nota no conjunto.
Pode-se dizer que o conjunto Y é formado por um conjunto de variáveis Xi
(leia-se X índice i ).
A notação em índice é muito útil pois possibilita a identificação imediata do
elemento que está em foco, sem a necessidade de grandes textos. A constância do
uso possibilitará uma familiarização com a simbologia.
UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
45
3.2 – Notação em somatório.
Muitas vezes é necessário escrever expressões que envolvem somas com
muitos termos, ou cujos termos obedecem uma certa formação, como por exemplo,
os dados numéricos disposto na forma de um rol.
Tomando como exemplo o conjunto de notas dos alunos, em uma prova de
Língua Portuguesa:
Y: 1,2 4,6 5,9 6,7 7,4 8,4 8,8
1,3 4,8 5,9 6,8 7,4 8,5 9,3
1,8 4,9 5,9 6,8 7,6 8,6 9,3
2,5 4,9 6,3 6,9 7,8 8,6 9,5
4,3 5,4 6,4 7,2 8,1 8,7 9,5
4,6 5,8 6,7 7,2 8,2 8,7 9,8
Verifica-se que são 42 notas, dispostas em ordem crescente.
Para identificar a soma, seria necessário a seguinte indicação:
Soma = 1,2 + 1,3 + 1,8 + 2,5 + .... + 9,5 + 9,8
Ora, o que verifica-se é que as variáveis (notas) estão dispostas em ordem:
a primeira nota ´2 1,2, a segunda nota é 1,3, a terceira nota é 1,8, e assim
sucessivamente.
Se for simbolizado por X a variável nota e por i o índice que indica a posição
da variável na série, pode-se passar a indicar a soma da série da seguinte forma:
ou seja, estariam sendo indicadas as variáveis e seu posicionamento na
série.
Supondo uma série onde não se saiba o número de variáveis, convenciona-
se que o último elemento da série será o enésimo termo, ou seja, o termo de
ordem n.
Desta forma, a soma de uma série onde não se conheça o número de termo
poderá ser indicada da seguinte forma:
42321 ... xxxxSoma ++++=
UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
46
Matematicamente a expressão indicada acima pode ser reduzida, utilizando-
se a notação em somatório e para tanto será utilizada a letra grega sigma - Σ que
corresponde, no nosso alfabeto à letra S (de soma).
Desta forma, a expressão acima poderá ser indicada da seguinte forma:
É necessário que se identifique cada parte da notação em somatório:
A forma correta de lê-se a expressão acima é:
“Somatório de xi para i variando de 1 a n” ou soma de xi, para i variando de
1 a n”.
Se houvesse o interesse de indicar somente a soma dos 15 primeiros
elementos da série, a notação em somatório seria:
nxxxxSoma ++++= ...321
∑
=
=++++
n
i
in xxxxx
1
321 ...
∑
=
n
i
ix
1
X é o “nome” dos
termos a serem
somados
i é u m a
observação
individual da
série, ou seja, a
p o s i ç ã o d o
termo na série
n é o último
elemento a ser
somado
Σ é a simbologia
que indica soma.
i=1 indica o
primeiro elemento
da série que será
somado
∑
=
15
1i
ix
UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
47
IMPORTANTE:
Para que uma soma possa ser
representada pela notação em somatório
é fundamental que i assuma todos os
valores inteiros consecutivos entre dois
valores dados (o termo inicial e o termo
final da soma).
UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
48
3.3 – Médias e medidas de tendência central.
Para resumir a quantidade de informação contida em um conjunto de dados,
os estatísticos definem medidas que descrevem, através de um só elemento,
características dos dados.
Algumas medidas descrevem a tendência central, isto é, a tendência que os
dados têm de se agrupar em torno de certos valores.
No dia-a-dia utiliza-se com freqüência o sentido de medidas de tendência
central. Por exemplo, pode-se, ao identificar-se um grupo de idosos, referir-se ao
grupo como tendo “ em torno de 65 anos”. O que se quer dizer com isso? Por certo
que as idades dos membros que formam o grupo estão próximas de 65 anos, para
mais ou para menos.
Tecnicamente as medidas de tendência central possuem metodologia própria
para sua determinação.
As principais medidas de tendência central são:
a) média aritmética (simples ou ponderada);
b) a mediana;
c) a moda.
Será verificado também o cálculo da média geométrica e da média
harmônica.
Inicialmente serão determinadas as formas para a determinação das
medidas de tendência central levando em consideração um conjunto de dados
dispostos sob a forma de uma variável discreta. Posteriormente será verificada a
metodologia para a determinação das medidas quando for utilizado um conjunto de
dados dispostos sob a forma de variável contínua.
3.4 – Média Aritmética.
A média aritmética, também comumente denominada somente de média, é
a mais comum das medidas de tendência central.
A facilidade de sua obtenção popularizou o seu uso.
UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
49
A média aritmética pode ser calculada através de duas metodologias:
a) a média aritmética simples ;
b) a média aritmética ponderada.
A média aritmética simples é calculada somando-se todos os termos de uma
série e dividindo-se o resultado pelo número total de itens envolvidos.
Supondo que um conjunto de dados, representativo das idades dos alunos
da Turma 201, em anos, esteja disposto na seguinte forma:
A = { 8, 8, 7, 9, 9, 10, 8, 9, 7, 8, 9, 10, 10, 10, 9, 9, 8, 8, 8, 9, 8 }
Para o cálculo da média aritmética, procede-se a soma das idades e divide-
se pelo número de observações (número de alunos da Turma, no exemplo). Desta
forma:
Logo, a média das idades será de 8,6 anos.
Identificando o que foi feito através de uma fórmula, tem-se que:
(média é igual a soma dos n termos de uma série, do primeiro até o último,
dividido pelo número total de termos).
Apresentado os dados sob a forma de variável discreta, têm-se que:
Idades, em anos, dos alunos da Turma 201.
Idades Número de Alunos
7 2
8 8
9 7
10 4
21
8988899101010987981099788 ++++++++++++++++++++
=Média
n
x
Média
n
n
i∑
== 1
UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
50
 Fonte: dados hipotéticos.Verifica-se que a variável (x) é a idade dos alunos, e que cada variável
possui uma freqüência (fi).
A freqüência total (n) é a soma do número de alunos.
Pode-se calcular a média aritmética diretamente na tabela.
Inicialmente, em uma nova linha, efetua-se a soma do número de alunos,
para que se obtenha a freqüência total (n)
Em seguida, em uma nova coluna, coloca-se o resultado da multiplicação de
cada idade pela freqüência respectiva. Desta forma, a nova tabela ficará assim
disposta:
 Idades, em anos, dos alunos da Turma 201.
Idades (xi) Número de Alunos (fi) Idade x Número de
alunos (xifi)
7 2 14
8 8 64
9 7 63
10 4 40
TOTAL 21 181
O resultado será a divisão dos dois totais:
Média = (181) / 21 , logo Média = 8,6 anos.
A média aritmética de dados disposto em uma distribuição discreta é
indicada através da seguinte fórmula:
n
fx
Média
n
i
ii∑
== 1
UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
51
(leia-se: média é igual à soma das variáveis i, multiplicadas pelas
respectivas freqüências i, da primeira até a última, dividido pelo número de
elementos).
Alguns autores indicam a fórmula para o cálculo da média aritmética da
seguinte forma:
(leia-se: média é igual à soma das variáveis i, multiplicadas pelas
respectivas freqüências i, da primeira até a última, dividido pela soma das
freqüências, da primeira até a última).
3.5 - A média aritmética Ponderada.
Algumas vezes, em especial nos colégios, é comum que sejam atribuídos
“pesos” às notas de determinadas provas. A atribuição de pesos visa fazer com que
determinados valores tenham mais influência no resultado final do que outros.
Considere-se o seguinte exemplo:
As provas bimestrais de um colégio são ponderadas com pesos 1, 2, 3 e 4,
respectivamente para o primeiro bimestre, segundo bimestre, terceiro bimestre e
quarto bimestre.
Um aluno, em Geografia, obteve as seguintes notas:
Notas em Geografia
Bimestre Nota
1º 6,0
2º 7,2
3º 5,5
4º 7,8
∑
∑
=
== n
ii
i
n
i
ii
f
fx
Média 1
UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
52
Fonte: dados hipotéticos.
Como é calculada a média, para a disciplina, do aluno?
Procede-se a multiplicação da nota de cada bimestre pelo peso respectivo,
soma-se os resultados das multiplicações e divide-se pela soma dos pesos.
Notas em Geografia
Bimestre Nota Pesos Nota x Peso
1º 6,0 1 6,0
2º 7,2 2 14,4
3º 5,5 3 16,5
4º 7,8 4 31,2
TOTAL 10 68,1
Fonte: dados hipotéticos.
A média aritmética ponderada, então, será igual a:
Média = 68,1 / 10 , logo Média = 6,81.
A notação (indicação através de uma fórmula) da média aritmética
ponderada é feita da seguinte forma:
(leia-se: média é igual à soma do produtos dos i elementos multiplicados
pelos respectivos pesos i, do primeiro até o último, dividido pela soma dos pesos,
do primeiro até o último).
∑
∑
=
==
n
i
i
n
i
ii
p
px
Média
1
1
UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
53
3.6 – Cálculo da Média Aritmética para dados grupados
Até então foi verificada a metodologia para o cálculo da média aritmética
(simples ou ponderada) considerando-se os dados isolados, ou aqueles que estão
dispostos em um variável discreta.
Entretanto muitas vezes o pesquisador necessita efetuar o cálculo de médias
e somente disporá dos dados dispostos em variável contínua.
Como proceder?
É necessário que para cada classe seja identificado um elemento que a
represente. Este elemento é denominado de ponto médio da classe (mi).
Então, o ponto médio de uma classe é:
(leia-se: o ponto médio da classe i é igual à média aritmética da soma do
limite inferior da classe i e o limite superior da classe i).
Para exemplificar será utilizada a variável contínua construída – as notas dos
alunos em uma prova de Língua Portuguesa.
Notas dos alunos da turma XX na prova de Língua Portuguesa
Classe Notas Freqüência Ponto médio
1 1 __ 2,5 3 1,75
2 2,5 __ 4 1 3,25
3 4 __ 5,5 7 4,75
4 5,5 __ 7 11 6,25
O ponto médio de uma classe (mi) é a média
aritmética entre o limite inferior (li) e o limite
superior (Li) da classe.
2
ii
i
Ll
m
+
=
UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
54
5 7 __ 8,5 9 7,75
6 8,5 __ 10 11 9,25
Total 42
Fonte: dados hipotéticos.
Ponto Médio da Classe 3 = 4,75
Ponto Médio da Classe 4 = 6,25
Distância = (Ponto Médio da Classe 4 – Ponto Médio da Classe 3)
Distância = m4 – m3
Distância = 6,25 – 4,75 , logo Distância = 1,5
A amplitude das classe também é igual a 1,5.
Para o cálculo da média aritmética de dados agrupados, os pontos médios
das classe serão ponderados pelas freqüências simples das respectivas classes.
Desta forma, apresentado a média aritmética para dados agrupados através
de uma fórmula, tem-se:
A “distância” entre os pontos médios de
classes consecutivas é igual à amplitude do
intervalo de classe.
∑
∑
=
==
n
i
i
n
i
ii
f
mf
X
1
1
_
UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
55
(leia-se: média aritmética é igual ao somatório dos produtos das freqüências
das classes i pelos pontos médios das classes i, dividido pelo somatório das
freqüências das classes i).
Desta forma, para o cálculo da média aritmética das notas, proceder-se-á a
multiplicação do ponto médio de cada classe pela freqüência da respectiva classe.
Em seguida, será efetuada a soma dos produtos obtidos e este resultado dividido
pela soma das freqüências (freqüência total).
Notas dos alunos da turma XX na prova de Língua Portuguesa
Classe Notas
Freqüência
(fi)
Ponto
médio
(mi)
fi mi
1 1 __ 2,5 3 1,75 4,75
2 2,5 __ 4 1 3,25 3,25
3 4 __ 5,5 7 4,75 33,25
4 5,5 __ 7 11 6,25 68,75
5 7 __ 8,5 9 7,75 69,75
6 8,5 __ 10 11 9,25 101,75
Total 42 281,50
Fonte: dados hipotéticos.
A média aritmética das notas, então, será:
A utilização da simbologia X barra (x com uma
barra horizontal sobreposta) é comumente
utilizada para identificar a média aritmética.
7,6
42
50,281_
==X
UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
56
Se você efetuar a soma do rol das notas, chegará a
um total de 279. Dividindo-se o valor por 42
(freqüência total), ou seja, calculando-se a média
aritmética simples, obter-se-á 6,64. A diferença, ou
seja 0,06, é inexpressiva, não importando para a
análise dos valores.
Quando os dados são agrupados na disposição de
uma variável contínua, passa-se a trabalhar com os
dados sem conhecimento de seus valores individuais.
Note no exemplo utilizado, que o máximo que se
pode afirmar com respeito ao menor valor desta
série é que ele é um valor maior ou igual a 1,0 e
menor do que 10. Mas não é possível, sem a
visualização do rol, conhecer-se os valores
individualizados.
Este fato é que leva a substituição das classes pelos
seus pontos médios para o cálculo da média da série.
UniverCidade
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
57
3.7 – A Mediana ( md)
A mediana é um valor real que separa

Outros materiais