Buscar

ORGANIZAÇÃO DE DADOS ESTATÍSTICOS

Prévia do material em texto

2. ORGANIZAÇÃO DE DADOS ESTATÍSTICOS 
 
Introdução 
 
Já foi discutido que o objetivo da estatística é descrever uma população. Sabemos também que 
teremos que coletar dados para conhecermos os fatos sobre a população a qual nos interessa 
conhecer. 
Devemos lembrar que na maioria dos casos teremos uma grande massa de dados e portanto, 
devemos procurar sintetizar ao máximo a informação neles existente, a fim de facilitar o 
manuseio, visualização e compreensão da “situação problema”. 
Mas como podemos realizar este estudo (descrição) de forma eficiente ? Uma maneira 
seria através da representação da distribuição de freqüências que nos permite construir tabelas e 
gráficos específicos para cada tipo de variável. Podemos também sintetizar esta informação, 
calculando alguma medidas numéricas como: média, mediana, desvio padrão, entre outras. 
 
REPRESENTAÇÕES POR MEIO DE TABELAS 
VARIÁVEIS QUALITATIVAS 
 
Considere o exemplo hipotético a seguir, que representa a atividade econômica 
desenvolvida em uma cidade por um grupo de 20 empresários, escolhidos aleatoriamente. 
 
 
 
Tabela 2 Dados brutos relativos a atividade econômica de 20 empresários. 
Agricultura Serviços Comércio Comércio 
Serviços Serviços Serviços Agricultura 
Indústria Comércio Comércio Comércio 
Comércio Comércio Agricultura Comércio 
Lazer Agricultura Comércio Serviços 
Fonte: Dados hipotéticos 
 
Suponha que se deseja estudar a variável atividade predominante - variável qualitativa 
nominal, pois não é passível de ordenação. Temos na tabela 2.1 a representação dos dados 
brutos. Uma melhor forma de resumirmos estes dados é apresentando o número de ocorrências 
de cada 
variável (freqüência). Daí, podemos definir 4 tipos de freqüência: 
1) Freqüência absoluta (Fa ou Fi) – Número de casos ocorridos em cada classe; 
2) Freqüência relativa (Fr) – Número de casos de uma classe em relação a todas as ocorrências (total); 
3) Freqüência percentual (Fp) – é a freqüência relativa multiplicada por cem. 
4) Freqüência acumulada (Fac) – é a soma da frequência da classe e de todas as classes que a 
antecedem. 
Com base na tabela 2.1 podemos calcular essas freqüências para a atividade econômica 
Comércio: 
Assim uma boa forma de apresentar o conjunto de dados é mostrando sua tabela de 
distribuição de freqüências. Antes porém de aprendermos sobre sua construção, vamos 
apresentar os principais componentes de uma tabela qualquer. 
 
COMPONENTES DE UMA TABELA 
 
 De uma maneira geral uma tabela deve conter os seguintes componentes: 
1. Título – Deve trazer informação sobre o conteúdo existente na tabela, sendo opcional a 
descrição do local e forma de coleta dos dados. 
2. Cabeçalho – Local onde deve-se especificar as variáveis em estudo e suas características 
(freqüências); 
3. Corpo – São as colunas e as subcolunas onde são anotados os dados apurados, podendo Ter 
entrada: simples, dupla ou múltipla. 
4. Coluna indicadora – Onde são anotadas as classes da variável em questão; 
5. Linha de totais – Quantificam-se os totais; 
6. Rodapé – São anotadas todas as informações que venham a esclarecer a interpretação da 
tabela; local reservado para se colocar a fonte dos dados, e quando necessário a legenda. 
Como exemplo vamos tomar os dados da tabela 2.1 e construir sua distribuição de 
freqüências: 
 
Tabela 2.2 Distribuição de freqüência da atividade econômica desenvolvida em uma cidade por 
um grupo de 20 empresários. 
Atividade predominante Fi Fr Fp (%) 
Comércio 
Serviços 
Agricultura 
Outros 
9 
5 
4 
2 
0,45 
0,25 
0,20 
0,10 
45 
25 
20 
10 
Total 20 1,00 100 
 
Fonte : Dados hipotéticos Rodapé 
Título 
Cabeçalho 
Corpo 
Linha de totais 
Coluna 
Indicadora 
No caso de tabelas qualitativas basta montar a tabela da mesma maneira descrita acima, 
organizar as classes da variável de interesse, e obter suas freqüências. Lembre-se que se a 
variável for qualitativa ordinal você deve escrever as classes respeitando sua ordem natural. 
 
GRÁFICOS EM COLUNAS / BARRAS 
 São a representação de uma tabela (ou série) por meio de retângulos verticais (colunas) 
ou horizontais (Barras), onde em uma das coordenadas são representadas as classes da variável 
em estudo e na outra a freqüência (absoluta, relativa ou percentual) relacionada a cada classe. 
OBS - Os retângulos devem seguir a um padrão como: distância entre eles, largura, estética, etc. 
Exemplo: Pede-se construir um gráfico de barras para a tabela abaixo: 
Tabela 2.8: Distribuição de freqüência das formas de treinamento dos empregados, adotados 
pela indústria brasileira. 
Formas Fp (%) 
Educação básica 
Empresas clientes ou fornecedoras 
Consultores / Instituições 
Fora do processo do trabalho 
“On the job” 
Não realiza 
20 
19 
40 
40 
78 
11 
Fonte: BNDS / CNI / SEBRAE (1995) 
 
Total
11
78
40
40
19
20
0 20 40 60 80 100
Não
realiza
"On the job"
Fora do processo
de trabalho
Consultores/
instituições
Empresas clientes
ou fornecedores
Educação
básica
%
 
 Figura A Gráfico de barras das formas de Treinamento dos empregados 
Fonte: BNDES / CNI / SEBRAE (1995) 
Exemplo: Construir um gráfico de colunas para a tabela abaixo: 
Tabela 2.9: Distribuição de freqüência dos critérios de seleção de fornecedores da indústria 
brasileira. 
CRITÉRIOS fp (%) 
Conceito no mercado 
Preço e condição de pagamento 
Pontualidade 
Flexibilidade às especificações 
Adoção de medidas de qualidade 
5 
25 
8 
27 
35 
Fonte: BNDS / CNI / SEBRAE (1995) 
 
 
 
 
 
 
 
 
 
 
 
Figura B Gráfico de colunas dos critérios de seleção de fornecedores da indústria brasileira 
 Fonte: BNDS / CNI / SEBRAE (1995) 
 
2.3.1.2 GRÁFICO DE SETORES 
Este gráfico é construído com base em um círculo, e é empregado sempre que 
desejamos ressaltar a participação de uma parte no todo. 
O todo é representado pelo círculo, que fica dividido em tantos setores quantas são as partes. Os 
setores são tais que suas áreas são, respectivamente, proporcionais aos dados. Obtemos cada 
setor por meio de uma regra de três simples e direta, lembrando que o total corresponde a 360o. 
Exemplo: 
 Tabela 2.11: Distribuição de freqüência para os 
 locais de estágio preferidos pelos alunos da 
 UNIPAC 
LOCAL fp (%) 
Indústria 
Bancos 
Comércio 
69 
18 
 7 
5
25
8
27
35
0
5
10
15
20
25
30
35
40
Conceito no
mercado
Preço e
Condiçao de
Pagamento
Pontualidade Flexibilidade Adoção de
medidas
Outros
Total
Fonte: Dados hipotéticos
Regras de 3 
100 % ------- 360 o 
 69 % ------ X 
 X = 248,4o 
100 % 
 18 % 
 Y = 64,8
 Figura 
 Fonte: Dados hipotéticos
VARIÁVEIS QUANTITATIVAS DISCRETAS
A construção da distribuição de freqüências, neste caso, é bastante semelhante à das
variáveis qualitativas, já que os valores podem ser considerados como 
naturais” 
Veja o exemplo: 
 Considerando que foi feita uma amostragem em uma linha de produção, onde mediu
o número de defeitos por unidade produzida, resultando a seguinte tabela.
 
2 
3 
0 
1 
4 
1 
1 
3 
2 
0 
1 
0 
1
5
2
1
Tabela 2.3 – Dados brutos com o 
Número de defeitos por unidade.
Fonte: Dados hipotéticos 
Basta então definir as classes, contar a 
informação em uma tabela. 
Indústria
Outros 6 
al 100 
Fonte: Dados hipotéticos 
100 % ------ 360 o 
18 % ------ Y 
Y = 64,8o 
100 % ------ 360 o 
 7 % ------ Z 
 Z = 25.2o 
100 % 
 6 % 
 
 C Gráfico de setores de local de estágio 
Fonte: Dados hipotéticos 
VARIÁVEIS QUANTITATIVAS DISCRETAS 
A construçãoda distribuição de freqüências, neste caso, é bastante semelhante à das
variáveis qualitativas, já que os valores podem ser considerados como “categorias
siderando que foi feita uma amostragem em uma linha de produção, onde mediu
o número de defeitos por unidade produzida, resultando a seguinte tabela. 
1 
5 
2 
1 
2 
1 
0 
2 
 0 
0 
0 
0 
1 
1 
1 
1 
1
1
1
2
Dados brutos com o Tabela 2.4 – Rol da tabe
Número de defeitos por unidade. Fonte: Dados hipotéticos
Basta então definir as classes, contar a freqüência em cada uma das classes e dispor esta 
Indústria
69%
Bancos
18%
Casa 
Comercial
7%
Outros
6%
100 % ----- 360 o 
6 % ----- W 
 W = 21,6o 
A construção da distribuição de freqüências, neste caso, é bastante semelhante à das 
categorias” ou “Classes 
siderando que foi feita uma amostragem em uma linha de produção, onde mediu-se 
1 
1 
1 
2 
2 
2 
2 
2 
3 
3 
4 
5 
Rol da tabela 2.3. 
Fonte: Dados hipotéticos 
em cada uma das classes e dispor esta 
 
 
 
 
Tabela 2.5 – Distribuição de freqüências para o número de defeitos em aparelhos de uma linha 
de montagem de uma fábrica X - produção diária. (1999) 
 
No defeitos Fi Fp (%) 
0 4 20 
1 7 35 
2 5 25 
3 2 10 
4 1 5 
5 1 5 
Total 20 100 
Fonte: Dados hipotéticos 
 
REPRESENTAÇÃO GRÁFICA 
 
 A apresentação gráfica é um complemento importante da apresentação em tabelas, 
porém com uma grande vantagem que é permitir uma visualização imediata da distribuição dos 
valores observados, o que sem dúvida é muito mais objetivo e interessante. 
 
OBS - Para construir um gráfico de forma eficiente, três pontos são importantes: 
1. Simplicidade - Deve-se optar em fazer o mais simples possível; 
2. Clareza - Ter o cuidado de não resumir omitindo informações 
importantes; 
3. Veracidade - É extremamente importante retratar a realidade e 
 traçando o gráfico com uma escala apropriada. 
 
GRÁFICO DE LINHA OU CURVA 
É um dos mais importantes gráficos, representa observações feitas ao longo do tempo, 
em intervalos iguais ou não. Traduzem o comportamento de um fenômeno em certo intervalo 
cronológico. 
 
Exemplo: De posse dos dados relativo as vendas da Companhia Alfa, para o período de 1980 a 
1985, podemos construir seu respectivo gráfico de linhas. 
 
 Tabela 2.12: Vendas da Companhia Alfa – 1980 à 1986 
ANO VENDAS (em milhões) 
1980 230 
1981 260 
1982 380 
1983 300 
1984 350 
1985 400 
1986 460 
 Fonte: Dados Fictícios 
 
 Figura D Gráfico de linhas de vendas da Companhia Alfa – 1980 à 1986 
 Fonte: Dados Fictícios 
 
0
100
200
300
400
500
1 2 3 4 5 6 7
VENDAS (em milhões)
VENDAS (em 
milhões)

Continue navegando