Apostila Metodos e Tec Pesq Ciências Sociais II

•

UNESP

Gisele Alves

16.11.2017

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 3, do total de 91 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 6, do total de 91 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 9, do total de 91 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Metodos Tec Pesq Educacional

6 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

1
APOSTILA DE MÉTODOS E TÉCNICAS DE PESQUISA NAS CIÊNCIAS SOCIAIS II

CONTEÚDO:
1. PLANEJAMENTO DE UMA PESQUISA: VARIÁVEIS e TAMANHO DE AMOSTRAS
2. TÉCNICAS DE AMOSTRAGEM
3. DISTRIBUIÇÃO DE FREQÜÊNCIAS DE DADOS CATEGORIZADOS E
QUANTITATIVOS
4. REPRESENTAÇÕES GRÁFICAS
5. MEDIDAS DESCRITIVAS: MEDIDAS DE TENDÊNCIA CENTRAL (Moda, Mediana e
Média) e MEDIDAS DE VARIABILIDADE (Desvio Padrão e Coeficiente de Variação)
6. INTRODUÇÃO AOS TESTES ESTATÍSTICOS INFERENCIAIS
7. TESTE NÃO-PARAMÉTRICO: Teste Qui-Quadrado.
8. CORRELAÇÃO LINEAR DE PEARSON
9. DISTRIBUIÇÃO NORMAL
APÊNDICE A - ARREDONDAMENTO DE NÚMEROS
APÊNDICE B - DISTRIBUIÇÃO QUI-QUADRADO

BIBLIOGRAFIA
BARBETTA, P. A. Estatística aplicada às Ciências Sociais. Florianópolis: Ed UFSC, 1999.
BUSSAB, W.O., MORETTIN, P.A. Estatística Básica. 4.ed. São Paulo: Atual, 1995.
BOLFARINE, H. BUSSAB, W.O. Elementos de amostragem. São Paulo: Edgard Blücher, 2005.
COMBESSIE, J.C. O método em sociologia. São Paulo: Edições Loyola, 2004.
GIL, A. C. Métodos e técnicas de Pesquisa Social. 5.ed. São Paulo: Atlas, 1999.
HOEL, P.G. Estatística Elementar. São Paulo: Atlas, 1981.
LEVIN, J. Estatística Aplicada a Ciências Humanas. 2.ed. São Paulo: Harbra,1987.
TOLEDO, G.L., OVALLE, I. I. Estatística Básica. 2.ed. São Paulo: Atlas, 1983.
VIEIRA, S.; WADA, R. O que é Estatística. São Paulo: Brasiliense, 1998.
VOLPATO, G.L. Ciência: da filosofia à publicação. 4.ed. Botucatu: Ed. Tipomic, 2004.

2
O USO DA ESTATÍSTICA NAS PESQUISAS CIENTÍFICAS

Aqueles que irão estudar estatística pela primeira vez, geralmente, a imaginam associada a
números, construção de tabelas e gráficos, que serão usados no momento de organizar e
apresentar os dados de uma pesquisa. Mas, a Estatística constitui, de fato, uma metodologia que
pode estar presente nas diversas etapas de uma pesquisa, desde o seu planejamento, até a
interpretação de seus resultados.
No dia-a-dia, todos nós temos um pouco de cientistas e estatísticos, ainda que
inconscientemente, uma vez que o uso informações estatísticas (via amostras) para concluir sobre
o todo faz parte da atividade diária da maioria das pessoas. Quase que diariamente, temos
“palpites” com relação a um todo ou acontecimentos futuros, com base em situações ou
“experiências” que realizamos. Por exemplo, ao irmos ao supermercado, experimentamos uma
uva para decidirmos se devemos ou não comprar uma porção daquele lote disponível, as
cozinheiras normalmente verificam se o prato que está preparando tem ou não a quantidade
adequada de sal, provando um pouco do tempero, podemos votar em algum candidato que
prometesse resolver os problemas sociais, baseando-nos na simpatia ou confiança que colocamos
no perfil do candidato, tomar um remédio para reduzir os incômodos de um resfriado.
À medida que essas situações ocorrem, podemos, às vezes, confirmar ou sustentar nossas
idéias; outras vezes, entretanto, não temos tanta sorte e, por isso, acabamos experimentando
conseqüências desagradáveis. A verdade é que, nem todas as nossas previsões acabem se
tornando realidade.
De modo mais ou menos semelhante, um pesquisador tem idéias sobre a natureza da
realidade, às quais ele denomina hipóteses, e freqüentemente testa suas idéias por meio de
pesquisas sistemáticas. Tomemos alguns exemplos de hipóteses:
- “famílias de um genitor produzem mais delinqüência que famílias de dois genitores”;
- “A probabilidade de estudantes universitários do gênero masculino de terem
experimentado maconha é maior que a probabilidade de estudantes do gênero feminino
terem feito o mesmo”.
Em qualquer uma das situações descritas, podemos observar que a Estatística apresenta duas
funções:
3
1- Descrição e exploração dos dados – Estatísticas descritivas: os dados coletados são
organizados/sintetizados para que possam evidenciar informações relevantes em termos
dos objetivos da pesquisa. Fundamentalmente, quando se procede uma análise de dados
busca-se alguma forma de regularidade ou padrão ou ainda modelo, presente nas
observações.
2- Inferência Estatística: tomada de decisões com base em dados colhidos de uma amostra.
O ato de generalizar resultados da parte (amostra) para o todo (população) é conhecido
como inferência estatística. A estimação de parâmetros (característica dos elementos da
população) é uma forma de inferência estatística. Uma outra forma de inferência
estatística é a categoria dos testes estatísticos de hipóteses ou testes de significância.
Esquematicamente, poderíamos em qualquer pesquisa que envolva estatística, observar
algumas etapas para o seu desenvolvimento:

Etapas de
uma
pesquisa:

PROBLEMA 
COLETA
DE
DADOS

DESCRIÇÃO
DOS
DADOS

TOMADA
DE
DECISÃO

  
Fases da
estatística:
PLANEJA-
MENTO
ESTATÍS-
TICO

COLETA
DE
DADOS

ESTATÍSTI-
CAS
DESCRITI-
VAS

ESTATÍS-
TICAS
INFEREN
CIAIS
  
Conceitos
envolvidos:

Variável,
população, amostra,
objetivo,
planejamento da
coleta de dados
(questionário, ...,
pré-teste)

Tabelas de distribuição
de freqüência, %,
gráficos, medidas de
posição (média,
mediana, moda, ...),
medidas de
variabilidade (desvio
padrão, coeficiente de
variação,...), etc

Estimação de
parâmetros e
testes de
hipótese
4
Planejamento de uma pesquisa

Nas pesquisas científicas, precisamos muitas vezes coletar dados que possam fornecer
informações capazes de responder às nossas indagações. Mas para que os resultados da pesquisa
sejam confiáveis, tanto a coleta dos dados, quanto a sua análise, devem ser feitas de forma
criteriosa e objetiva. Para que isto seja realizado com o menor custo possível, torna-se
fundamental a etapa do planejamento da pesquisa.
Assim, a organização do plano geral, primeira fase do trabalho estatístico, implica em obter
respostas para uma série tradicional de perguntas, antes mesmo do exame das informações
disponíveis sobre o assunto, perguntas que procuram delimitar melhor o problema a ser estudado,
bem como os objetivos da pesquisa em que a metodologia Estatística será aplicada.
As principais fases da elaboração do trabalho estatístico são as expostas a seguir.

Definição do problema / formulação dos objetivos
A primeira fase do trabalho estatístico consiste em uma definição ou formulação correta do
problema a ser estudado. Além de considerar detidamente o problema objeto do estudo, o
pesquisador deverá examinar outros levantamentos realizados no mesmo campo e análogos, uma
vez que parte da informação de que necessita pode, muitas vezes, ser encontrada nesses últimos.
Assim, o exame das informações disponíveis é, realmente, o grande trabalho inicial: reunir tudo
que já foi publicado sobre o assunto, compilar a legislação específica, obter relatórios sobre
atividades semelhantes ou correlatas, adquirir mapas da região geográfica, uma vez que a equipe
provavelmente não será a pioneira sobre o tema e, portando, não deverá partir do “nada”; sempre
que possível procurará analisar a experiência de trabalhos anteriores para não incidir nos mesmos
erros, para ganhar ou para não perder tempo, para não pisar em terreno totalmente desconhecido.
Ainda, os objetivos de uma pesquisa devem ser elaborados de forma bastante clara, já que
as demais etapas da pesquisa tomam como base estes objetivos.
Ex: Objetivo geral: Conhecer o perfil de trabalho de egressos do curso de Ciências Sociais do
Brasil do período de 1985 a 2005.
Para podermos darseqüência a esta pesquisa, precisamos especificar melhor o que
queremos conhecer da população de egressos deste curso. Alguns destes objetivos poderiam ser:
(1) Gênero, idade, naturalidade, instituição em que se graduou.
(2) Conhecer o tempo de formação profissional.
(3) Conhecer a área de atuação profissional.
5
(4) Conhecer o local de trabalho do egresso.
(5) Rendimento mensal obtido com a atividade desenvolvida.
(6) Avaliar o grau de satisfação com o trabalho.
(7) Verificar a continuidade de estudos de formação: especialização, aperfeiçoamento, mestrado,
doutorado, etc.

População e amostra
Um passo importante no delineamento da pesquisa (problema/objetivo) consiste na decisão
de quem vai ser pesquisado.
Segundo Barbetta, população alvo é o conjunto de indivíduos que queremos abranger em
nosso estudo. São os elementos para os quais desejamos que as conclusões oriundas da pesquisa
sejam válidas.
Segundo ainda Barbetta, denomina-se população acessível, ou simplesmente população, o
conjunto de elementos que queremos abranger em nosso estudo e que são passíveis de serem
observados, com respeito às características que pretendemos levantar.
Segundo Barbetta, a definição da população depende basicamente dos objetivos da
pesquisa, das características a serem levantadas e dos recursos disponíveis.
Em grandes populações torna-se interessante a realização de uma amostragem, ou seja, a
seleção de uma parte da população (amostra) para ser observada.

AMOSTRA: Uma parte dos elementos da população.
AMOSTRAGEM: Ato de selecionar uma parte da população.

Depois de os objetivos estarem explicitamente traçados, devemos decidir o tipo de
levantamento a ser utilizado. Sob este aspecto há dois tipos de levantamento:
 Levantamento censitário (censo): abrange todo o universo;
 Levantamento por amostragem: abrange uma parte da população.
Podemos ainda classificar as pesquisas quantitativas em dois tipos
1
de delineamentos:
 Survey – as características são observadas por meio de questionário (ou entrevista), sem
interferência do pesquisador;
 Pesquisa experimental – pesquisador exerce controle sobre o método que será aplicado.

1
Para uma apresentação/definição mais detalhada, veja Gil (1999, cap. 2 e 6)
6
O planejamento da coleta de dados
Definidos os objetivos, a população e o tipo de levantamento a ser realizado, precisamos
pensar como deverá ser a coleta de dados. O modo pelo qual serão obtidas e onde serão coletadas
as informações são as principais preocupações dessa etapa do trabalho.
Em muitas situações não precisamos ir até os elementos da população para obter os dados,
porque eles já existem em alguma publicação ou arquivo. Esses tipos de dados são denominados
dados secundários.
Exemplos de arquivos nos quais podemos buscar dados para uma pesquisa são: IBGE,
SEE, MEC, FIOCRUZ, TSE, ONG’S, periódicos, jornais, etc.
Em contrapartida, denominam-se dados primários aqueles que necessitam ser levantados
observando diretamente cada sujeito constituinte da nossa pesquisa.
É importante salientar que é na fase do planejamento da pesquisa que verificamos
exaustivamente o que já existe de dados sobre o problema em estudo. Alguns autores defendem o
uso dos dados secundários sempre que possível, baseados na argumentação de que eles podem
reduzir drasticamente os custos de uma pesquisa; outros defendem que é mais seguro trabalhar
com fontes primárias, argumentam que este tipo de fonte de dados oferece, em geral, informação
mais detalhada e que é mais provável que as definições de termos e unidades figurem somente
nas fontes primárias.
Quando trabalhamos com dados primários em pesquisas do tipo survey, torna-se necessário
construir um instrumento para que a coleta dos dados seja feita de forma organizada. Denomina-
se este instrumento de questionário
2
.
O questionário pode ser apresentado pessoalmente ao respondente ou remetido em
correspondência postal. Na primeira hipótese, o entrevistador poderá ser um simples estafeta,
para entrega e recebimento, ou uma pessoa mais habilitada, capaz de tirar dúvidas e prestar
esclarecimentos, deixando que o informante preencha os quesitos. Quando a apresentação do
questionário é feita por meio de um agente especializado, que registra as respostas dadas
verbalmente pelo respondente, a um roteiro fixo pré-estabelecido, denominamos a situação de
entrevista estruturada
3
.
Em pesquisas que envolvem aspectos íntimos dos respondentes, deve-se dar preferência a
um questionário anônimo, com o cuidado de que o respondente preencha o questionário
individualmente e à vontade.

2
Para uma apresentação mais detalhada sobre a construção de um questionário, veja Barbetta (1999, cap.2) e Gil
(1999, cap. 12)
7
A remessa por via postal dá grande percentual de evasão de respostas. A experiência tem
demonstrado que, em geral, somente uma porcentagem pequena (em torno de 30%) dos
questionários regressa. Ainda, neste tipo de levantamento (via postal), temos que nos lembrar da
possível presença das variáveis “invisíveis”. Será que não há um elemento (variáveis) comum
entre aqueles que se prontificam a responder e regressar o questionário que os diferencia
daqueles que não atendem à solicitação do pesquisador?
Pode haver, assim, variáveis que não há, a priori, como mensurar, distinguindo o grupo
dos respondentes e dos não-respondentes. Nesse tipo de pesquisa, é relevante, então, que na
metodologia o pesquisador descreva o percentual de retorno dos questionários e saliente, durante
a discussão dos resultados, que pode haver variáveis (“invisíveis”) que delimitam a população à
qual os resultados se aplicam.

Variáveis e itens de um questionário
Vamos chamar de variáveis as características que podem ser observadas (ou medidas) em
cada elemento da população, sob as mesmas condições. Uma variável observada (ou medida)
num elemento da população deve gerar um e apenas um resultado. Para algumas variáveis, esta
propriedade parece ser intuitiva, facilmente respeitada e até mesmo intrínseca, por exemplo,
idade, gênero, estatura, número de filhos e estado civil. Entretanto, esta propriedade parece ser
não intuitiva, e até mesmo impossível de ser respeitada, para outras questões que os
pesquisadores levantam junto à população em estudo, por exemplo: formas de lazer; esportes
praticados; motivos da escolha para cursar determinada Faculdade; preferências musicais e de
leitura do entrevistado; fontes de financiamento de uma instituição ou ONG. Neste caso, a
questão em estudo não corresponde diretamente a uma variável, mas há diferentes modos de
transformá-la em uma ou mais variáveis, como veremos adiante.
As variáveis podem ser classificadas quanto ao tipo de mensuração: qualitativa (ou
categórica) ou quantitativa. Quando os resultados possíveis de uma variável são
atributos/categorias ou qualidades, a variável é dita qualitativa. Quando os resultados possíveis
de uma variável são números resultantes de uma escala de contagem ou mensuração, dizemos
que esta variável é quantitativa
4
.

3
Para uma apresentação mais detalhada sobre a construção de um questionário, veja Gil (1999, cap. 11)
4
Não devemos confundir variável quantitativa e método de análise quantitativo. Podemos estar tratando um objetivo
por meio da análise quantitativa, mas a(s) variável(is) estudada(s) ser(em)qualitativa(s). A classificação de uma
variável como quantitativa ou qualitativa se refere ao nível de mensuração desta variável, ou seja, como se classifica
a resposta dada pelo indivíduo à variável: uma categoria (não ordenável - variável nominal ou ordenável – variável
8
Dentre as variáveis qualitativas, podemos ainda fazer uma distinção entre dois tipos:
nominal, para a qual não existe nenhuma ordenação nos possíveis resultados, e ordinal, para a
qual existe uma ordem entre as respostas possíveis. Assim, o nível nominal de mensuração
envolve simplesmente o ato de nomear ou rotular a resposta dos indivíduos, ao passo que,
quando o pesquisador vai além desse nível de mensuração e procura ordenar seus sujeitos em
função do grau que apresentam de uma determinada característica, ele está trabalhando no nível
ordinal de mensuração.
Quadro 1. Exemplos de variáveis nominais
VARIÁVEL CATEGORIAS
GÊNERO Masculino, feminino
SITUAÇÃO DO DOMICÍLIO Rural e urbano
ESTADO CIVIL Solteiro, casado, divorciado, viúvo
ENTIDADE MANTENEDORA Federal, estadual, municipal, particular
PARTIDO POLÍTICO PFL, PSDB, PT, PMDB, PDT, ...
PROFISSÃO Comerciário, bancário, profissional liberal, professor,
metalúrgico, trabalhador rural, trabalhador doméstico, ...
REGIÃO Norte, Nordeste, Centro-Oeste, Sudeste, Sul
RAMO DE ATIVIDADE Agrícola, indústria, comércio, serviços
CURSO Medicina, Ciências Sociais, Matemática, Direito, História, ...
LINHA DE PESQUISA DA PÓS-
GRAD. EM SOCIOLOGIA
Sociologia Rural, Sociologia da Cultura, Teoria Sociológica,
Sociologia da Educação, Sociologia do Trabalho, Sociologia
Jurídica, Sociologia do desenvolvimento, Metodologia
RELIGIÃO Católica, Evangélica, Budista, Muçulmana, Sem religião,

Ao trabalhar com dados nominais, algumas vezes não há relação direta entre um item de
um questionário e uma variável, como pode ser o caso nas variáveis: tipo de lazer, tipo de leitura
e esporte praticado, uma vez que um respondente pode ter mais de um tipo de leitura, bem como
tipo de lazer ou praticar mais de um esporte, violando a suposição básica de a variável assumir
um e apenas um resultado, por respondente. Podemos, por outro lado, associar várias variáveis a
este item, tais como: (1) quantidade de tipo de leitura realizada, (2) futebol (pratica ou não), (3)
basquete (pratica ou não) e assim por diante. Uma outra possibilidade seria definir a variável
“esportes que pratica”, tendo como possíveis respostas, todas as combinações de modalidades de
esportes. Mas a análise destas respostas seria difícil, dado o grande número de possíveis
alternativas.

ordinal) ou uma quantidade. Por outro lado, uma análise quantitativa de um objetivo, pressupõe que faremos, pelo
menos, uma contagem de quantos indivíduos responderam/pertencem a uma dada resposta para a variável em estudo
9
Quadro 2. Exemplos de variáveis ordinais
VARIÁVEL CATEGORIAS
CLASSE SÓCIO-ECONÔMICA classe baixa, classe média e classe alta
TAMANHO DA EMPRESA Microempresa, pequena empresa, média empresa, grande
empresa
INFLUÊNCIA NA NEGOCIAÇÃO DO
MERCOSUL
Pouca influência, influência intermediária, muita
influência
BENEFÍCIO PARA O PAÍS Pouco benefício, benefício intermediário, muito benefício
RENDA Alta, média, baixa
NÍVEL DE SATISFAÇÃO muito satisfeito, pouco satisfeito, insatisfeito
GRAU DE CONCORDÂNCIA discordo plenamente, discordo, indiferente,
concordo, concordo plenamente
NÍVEL DE ESCOLARIDADE Ensino Fundamental, Ensino Médio e Ensino Ensino
Superior
CONCEITO EM AVALIAÇÃO A, B, C, D, E

O nível ordinal de mensuração fornece informações sobre a ordenação das categorias, mas
não indica a magnitude das diferenças entre elas.
Em contraposição, a variável quantitativa orienta-nos relativamente à ordem das categorias,
bem como indica-nos a distância exata entre elas. Os resultados possíveis dessas variáveis são
números de uma escala. Escalas quantitativas implicam unidades constantes de medida, as
quais comportam intervalos iguais entre os vários pontos da escala.
De modo análogo, as variáveis quantitativas podem sofrer uma classificação dicotômica:
variáveis discretas, cujos resultados possíveis são resultantes de uma contagem, constituindo
assim um conjunto finito ou enumerável de números e variáveis contínuas, cujos possíveis
valores formam um intervalo de números reais e que resultam, normalmente, de uma
mensuração.
Quadro 3. Exemplos de variáveis quantitativas discretas
VARIÁVEL Respostas possíveis
Nº de filhos 0, 1, 2, 3, 4, ...
Nº de residentes na casa 1, 2, 3, ...
Nº de países 0, 1, 2, ....
Nº de conflitos internos 0, 1, 2, 3, ...
Nº de empregos gerados pela empresa 0, 1, 2, 3, 4, ...

(que pode ser qualitativa à qual se atribui categorias ou qualitativa à qual se atribui quantidades como resposta).
10
Nº de anos de estudo 0, 1, 2, 3, ...

Quadro 4. Exemplos de variáveis quantitativas contínuas
VARIÁVEL Respostas possíveis
Taxa de analfabetismo 0%  taxa  100%
Despesa governamental (%PIB) 0  Despesa Gov.  100%
Rendimento Mensal 0  Rendimento
IPTU 0  IPTU
Índice de Gini 0  índice  1
IDH 0  IDH  1
PIB 0  PIB

As variáveis quantitativas são mais informativas que as qualitativas. Dizer que há 30 anos
um funcionário trabalha em uma empresa é mais informativo que dizer que ele trabalha há muito
tempo. Do mesmo modo, dizer que uma pessoa tem 17 anos ou tem 65 anos é mais informativo
que dizer que ela é adolescente ou que é da 3ª idade. Ainda, dizer que um aluno tirou uma nota
7,5 é mais informativo que dizer que ele tirou o conceito B. Podemos passar de uma escala
quantitativa para uma escala qualitativa, categorizando as respostas, mas a recíproca não é
possível. Por exemplo, podemos, com base nas idades indicadas em uma pesquisa, criar as
categorias: criança, adolescente, adulto e 3ª idade, mas caso só tenhamos coletado as respostas
por essas categorias não temos como “resgatar” a idade (em anos ou meses) dos participantes da
pesquisa. Do mesmo modo, podemos categorizar as notas obtidas pelos alunos em uma avaliação
nos conceitos A, B, C, D ou E, mas não sendo possível fazer o caminho contrário.

Elaboração de um questionário

Na condução de uma pesquisa, a construção de um questionário é uma etapa longa, que
deve ser executada com muita cautela. Um aspecto fundamental nesta fase da pesquisa é o
planejamento de como usar as respostas dos diversos itens para responder às indagações da
pesquisa. O questionário também deve ser feito de forma a facilitar a análise dos dados. Segundo
Gil (1999, p. 131), questionários com muitas questões abertas, frequentemente retornam com
muitas não respondidas.
11
Tendo em mãos os objetivos da pesquisa claramente definidos, bem como a população a
ser estudada, alguns aspectos da construção do questionário devem ser levantados:
1 – separar as características a serem levantadas
Exemplo: Em uma pesquisa sobre matéria escolar, características a serem levantadas: a que mais
gosta, a que menos gosta, a mais difícil, a mais fácil, notas nas avaliações dessas disciplinas e
gênero.
2 – Fazer uma revisão bibliográfica para verificar como mensurar adequadamente algumas
características.
Exemplo: grau de satisfação – como medir satisfação?;classe sócio-econômica – como medir?
Pelo IBGE? Por outra escala?
3- Estabelecer a forma de mensuração das características (variáveis) a serem levantadas.
A unidade de medida que deve acompanhar as respostas. Para variáveis qualitativas, construir
uma lista completa das alternativas, inclusive, quando necessário, as categorias outras e não tem
opinião.
4- Elaborar uma ou mais perguntas para cada característica a ser observada.
Exemplo: Grau de satisfação do aluno com a faculdade: segurança, estrutura física, corpo
docente, biblioteca, atividades culturais, etc.
5- Verificar se a pergunta está suficientemente clara.
Linguagem compreensível para todos os indivíduos da população; por exemplo, pesquisando o
perfil dos catadores de lixo que passam na rua do aluno, verificar se a linguagem/ termos faz
parte do cotidiano dos entrevistados.
6 – Verificar se a forma da pergunta não está induzindo a algumas respostas ou se a resposta da
pergunta não é óbvia.
Por exemplo, quando há poucas alternativas como resposta à questão.
7 – Fazer pré-teste ou pesquisa piloto: Antes de iniciar a coleta de dados através do instrumento
selecionado, precisamos verificar se este instrumento está bom, aplicando o instrumento em
alguns indivíduos com características similares aos indivíduos da população em estudo ou
próprios da população. Somente pela aplicação efetiva do questionário é que podemos detectar
algumas falhas que tenham passado despercebidas em sua elaboração, tais como: ambigüidade de
alguma pergunta, resposta que não havia sido prevista, não variabilidade de respostas em alguma
12
pergunta, etc. O pré-teste também pode ser usado para estimar o tempo de aplicação do
questionário.
Ao trabalharmos com questionário devemos estar cientes que este deve ser completo, no
sentido de abranger características necessárias para atingir os objetivos da pesquisa, mas ao
mesmo tempo, não deve conter perguntas que fujam destes objetivos, pois quanto mais longo o
questionário, menor tende a ser a qualidade e a confiabilidade das respostas.
Além disso, questionários muito extensos apresentam alta probabilidade de não serem
respondidos (GIL, 1999, p.129)

EXERCÍCIOS

1. Para cada uma das variáveis abaixo indique o tipo: quantitativa (discreta ou contínua) ou
qualitativa.
a) Salário de sociólogos das várias instituições públicas e privadas existentes no Brasil.
b) Número de respostas certas num teste com 15 itens aplicados a 50 alunos.
c) Porcentagem da receita de municípios aplicada à cultura.
d) Opinião dos sociólogos sobre a realização ou não de determinado evento.
e) Região de procedência dos alunos da UNESP de Marília.
f) Grau de instrução dos pais de alunos ingressantes na UNESP em determinado ano.
g) Número de guerras civis do país desde o seu ingresso na ONU.
h) Taxa de ocupação (população ocupada/população economicamente ativa) dos municípios do
estado de São Paulo

2. Cite três situações de pesquisa, ou do cotidiano do cientista social, que tenha variáveis
quantitativas e outras três nas quais as varáveis em questão são qualitativas. Faça a distinção
entre variáveis contínuas e discretas.

Técnicas de Amostragem

Para trabalharmos em uma pesquisa científica com o levantamento por amostragem, a
seleção dos elementos que serão efetivamente observados, deve ser feita sob uma metodologia
adequada, de tal forma que os resultados da amostra sejam informativos e representativos para
avaliar características de toda a população.
13
O termo inferência estatística se refere ao uso apropriado dos dados da amostra para se ter
algum conhecimento sobre os parâmetros da população, generalizando os resultados para o todo
(população) a partir de uma parte (amostra).

Por que amostragem?

Citaremos quatro razões para o uso de amostragem em levantamentos de grandes
populações.
1. Economia: em geral, torna-se bem mais econômico o levantamento de somente uma parte
da população.
2. Tempo: torna-se bem mais rápido o levantamento de somente uma parte da população.
Exemplo desta necessidade: pesquisa eleitoral.
3. Confiabilidade dos dados: pode-se dar mais atenção aos casos individuais, evitando erros
nas respostas e na transcrição dos dados.
4. Operacionalidade: é mais fácil realizar operações de pequena escala.

Quando o uso de amostragem não é interessante?
(a) Característica de fácil mensuração;
(b) Necessidade de alta precisão;
(c) População pequena.

Tamanho de uma amostra aleatória simples

O cálculo do tamanho de uma amostra aleatória, muitas vezes omitido, é um componente
essencial no delineamento da pesquisa. O objetivo essencial desse cálculo é determinar a
quantidade de elementos que comporão a amostra em número suficiente para obter resultados
válidos, mas não mais do que é necessário, evitando-se assim gasto de tempo e de recursos
financeiros desnecessários.
Alguns princípios orientadores se fazem necessários. Um aumento no tamanho amostral
conduzirá a um aumento na precisão das estimativas populacionais, mas o custo da amostragem
também aumentará e, de modo geral, existe um limite de gasto disponível para esse
levantamento. Assim, quanto maior o tamanho da amostra, maior o gasto de recursos financeiros;
quanto menor a amostra, maior a probabilidade de se obter um estimador com precisão
insuficiente.
14
Analisando a situação em que não se pode determinar o tamanho da população (N), o
tamanho mínimo da amostra aleatória simples pode ser determinado através do cálculo de n0,
considerado uma primeira aproximação para o cálculo do tamanho da amostra, dado por:
2
0
0
1
E
n 
(I)
sendo E0 o erro amostral tolerável
5
.
A expressão acima apresentada mantém fixo o nível de confiança
6
de 95% e a variância
populacional no caso de maior heterogeneidade da população, ou seja, quando a proporção do
evento na população em estudo é de 0,5.
Tabela 1. Tamanho de amostra (n0) em função do erro amostral tolerável
7
.

E0 n0
0,010 10000
0,015 4444
0,020 2500
0,025 1600
0,030 1111
0,035 816
0,040 625
0,045 494
0,050 400

Conforme podemos observar na tabela anterior, quanto menor o erro amostral tolerável
associado à amostra a ser observada, maior o tamanho da amostra necessário para se atendê-lo,
sem levar-se em consideração o tamanho da população e trabalhando-se com o nível de
confiança de 95% e proporção do evento na população igual a 0,5.
Conhecendo-se o tamanho da população N, pode-se corrigir o cálculo de n0, obtido por I,
para se ter o tamanho da amostra aleatória simples, n, através da expressão:

5
Erro amostral tolerável é a diferença tolerada, pelo pesquisador, entre o valor que a estatística pode acusar e o
verdadeiro valor do parâmetro que se deseja estimar (Barbetta, 1999).
6
Nível de confiança é a probabilidade de o valor do parâmetro em estudo pertencer ao intervalo centrado na
estimativa estatística do parâmetro e limites determinados pelo erro amostral tolerado. Neste caso, a probabilidade
é de 0,95 ou 95%. Por exemplo, trabalhando-se com um E0 igual 2%, se obtivermos uma estimativa percentual
igual a 40% para o parâmetro em estudo, teremos 95% de probabilidade de o valor verdadeiro do parâmetro
populacional pertencer ao intervalo de 38% a 42%.
7
A descrição do erro amostral é, usualmente, feita em termos percentuais (por exemplo: 0,010 lê-se 1%).
15

0
0.
nN
nN
n

(II)
Tabela 2. Tamanho de amostra (n) em função do tamanho da população, assumindo erro amostral
tolerável igual a 0,025, nível de significância igual a 95%.
N n0 n
100 1600 94
1000 1600 615
10000 1600 1379
100000 1600 1575
1000000 1600 1597

Com base na simulação dos cálculos para o tamanho de amostra aleatória simples, por
meio das expressões I e II, observamos que o valor de n é sempre inferior ao valor de n0.
Entretanto, à medida que o tamanho N da população, cresce, o valor de n aproxima-se do valor
de n0. Desse modo, para uma população grande, pode-se adotar o valor de n0 como o tamanho n
da amostra. Então,
n = n0 = 1/E0
2
, (III)
sem necessariamente levar em conta o tamanho exato da população.
Podemos então, considerando as expressões I e II, estabelecer a seguinte relação
n0  n
A relação acima anunciada pode ser ilustrada na figura abaixo.
0
500
1000
1500
2000
2500
3000
0 10000 20000 30000 40000 50000
tamanho da população
tam
an
ho
da
am
os
tra
n0
n

Figura 1. Gráfico comparativo entre as expressões I e II para o cálculo do tamanho de uma
amostra aleatória simples

16
Conforme podemos observar na figura 1, quanto menor for o tamanho da população, mais
importante será conhecer-se seu valor exato. Em populações pequenas, os valores de n0, e n são
diferentes, ao passo que para populações grandes, a informação sobre o tamanho da população é
irrelevante.

Formas de amostragem

1. Aleatória ou casual: processo amostral em que cada membro da população tem a mesma
chance de ser escolhido (Hoel, p.157). A seleção dos elementos que farão parte da amostra é
feita sob alguma forma de sorteio ao acaso (Barbetta, p.41).
Estas amostragens são particularmente interessantes por permitirem a utilização das técnicas
clássicas de inferência estatística, facilitando a análise dos dados e fornecendo maior
segurança ao generalizar resultados da amostra para a população.
Tipos de amostragem aleatória: Simples, Estratificada, por Conglomerados, Sistemática e
por múltiplos estágios (ou etapas).

2. Não-casual: como o próprio nome já diz, são aqueles processos amostrais em que os
membros da população não têm a mesma chance de serem escolhidos. Exemplos: amostras
intencionais ou por tipicidade (os elementos são retirados com auxílio de especialistas),
amostras de voluntários, como ocorre em alguns testes sobre novos remédios e amostragem
por conveniência, em que os elementos escolhidos são aqueles julgados como típicos da
população que se deseja estudar, assemelha-se à amostragem intencional.

AMOSTRAGEM ALEATÓRIA SIMPLES

Para a seleção de uma amostra aleatória simples precisamos ter uma lista completa dos
elementos da população. Este tipo de amostragem consiste em selecionar a amostra através de
sorteio, sem restrição.
Seja uma população com N indivíduos. Uma forma de extrair uma amostra aleatória
simples de tamanho n, sendo n < N, é identificar os elementos da população em pequenos
pedaços de papel e retirar, ao acaso, n pedaços ou usar as tabelas de números aleatórios ou, então,
usar um gerador de números aleatórios.
17
A amostragem aleatória simples tem a seguinte propriedade: qualquer subconjunto da
população, com o mesmo número de elementos, tem a mesma probabilidade de fazer parte da
amostra. Em particular, temos que cada elemento da população tem a mesma probabilidade de
pertencer à amostra.
Exemplo: Retirar uma amostra aleatória, com E0 = 2,5%, de uma população de 40000 habitantes
de uma cidade. Para E0 = 2,5% (=0,025) e N = 40000, n = tamanho da amostra = 1538 habitantes.

AMOSTRAGEM ESTRATIFICADA

Consiste em dividir a população em subgrupos, que denominamos de estratos. Estes
estratos devem ser internamente mais homogêneos do que a população toda, com respeito às
variáveis em estudo. Devemos escolher um critério de estratificação que forneça estratos bem
homogêneos, com respeito ao que se está estudando. A amostragem estratificada proporcional é
um tipo particular de amostragem estratificada, no qual a proporcionalidade do tamanho de cada
estrato da população é mantida na amostra.

Exemplo:

Retirar uma amostra aleatória, com E0 = 2,5%, de uma população de 50000 alunos da área
de Ciências Humanas das Universidades Públicas Paulistas. Suponhamos que a população esteja
constituída da seguinte maneira:
Para E0 = 2,5% = 0,025 e N = 50000 alunos, n = tamanho da amostra = 1550 alunos.
Uma amostra de 1550 alunos equivale a 3,1% da população de 50000alunos.
Logo:

População: Amostra:
Sexo Noturno Diurno
Masculino 4840 18580
Feminino 5160 21420
Total 10000 40000

Sexo Noturno Diurno
Masculino 150 576
Feminino 160 664
Total 310 1240
18
AMOSTRAGEM SISTEMÁTICA

Quando os elementos da população já apresentam alguma forma de ordenação, podemos
utilizar essa ordenação na seleção da amostra aleatória a ser retirada. Exemplos de populações
ordenadas: lista telefônica, prontuários escolares, prontuários médicos, prontuários policiais
(boletins de ocorrência), número das casas de uma rua, número de tombo dos livros de uma
biblioteca, etc.
Consideremos uma população composta por N indivíduos (i.e., o tamanho da população é
igual a N) e dela desejamos retirar uma amostra de n indivíduos (i.e., a amostra terá tamanho n).
Definimos o intervalo de seleção S como:
S = N n.

Sorteamos um número entre 1 e S, o qual denominamos aqui por m. Então:

 O primeiro indivíduo da amostra é o de número m (ou m-ésimo indivíduo da população
ordenada);
 O segundo indivíduo da amostra é o de número S + m;
 O terceiro indivíduo da amostra é o número 2.S + m;
 ....
 O n-ésimo indivíduo da amostra é o de número (n – 1).S + m.

Exemplo: De um acervo de 60000 livros de uma biblioteca, deseja-se retirar uma amostra
aleatória sistemática de 2400 livros (suficientes para estabelecermos E0 = 2%) a fim de se estimar
a porcentagem de livros desaparecidos do acervo.
Com base nos dados fornecidos sobre a biblioteca, temos N (tamanho da população) =
60000 livros e n (tamanho da amostra) = 2400 livros. Utilizando o número de tombo dos livros
dessa biblioteca como referência na ordenação, para retirarmos a amostra aleatória sistemática,
calculamos inicialmente o intervalo de seleção S:

S = 60000  2400 = 25

19
Assim, o número de tombo (m) do primeiro livro que comporá a amostra está entre 1 e 25
(1 m  25). Suponhamos que m (número de tombo do primeiro livro a ser observado) = 8. A
amostra aleatória sistemática será constituída dos seguintes livros:
1º livro da amostra: 8º livro (= m) do acervo;
2º livro da amostra: 33º livro (= S+m) do acervo;
3º livro da amostra: 58º livro (= 2.S+m) do acervo;
┋
6000º livro da amostra: (2399 x 25) + 8 = 59983º livro do acervo.

COMENTÁRIOS ADICIONAIS SOBRE AMOSTRAGEM

O uso adequado das técnicas de amostragem ajuda a eliminar a tendenciosidade. Como a
amostra não é “escolhida”, não existe a tendenciosidade aberta, que aparece quando determinado
grupo de pessoas é escolhido para representar a população. No entanto, é preciso estar alerta para
outras fontes de tendenciosidade. Se você faz uma pesquisa domiciliar durante o dia, não
entrevista quem trabalha em horário diurno. A amostra é tendenciosa por não captar informação
desse tipo de pessoa. Se você faz a pesquisa à noite, não entrevista quem sai à noite, aserviço ou
a passeio.
Nas pesquisas de opinião pública, existem muitas fontes de tendenciosidade. Sabe-se, por
exemplo, que muitas pessoas respondem, quando perguntadas, o que se espera delas, ou o que
lhes parece mais adequado, ou mesmo o que lhes parece mais conveniente.
Assim, a próxima vez que você deparar com uma informação do tipo “o brasileiro toma,
em média, 1,5 banhos por dia”, pergunte-se: É fácil obter dados reais sobre esse assunto? O que
você diria à entrevistadora que bate à sua porta e lhe pergunta se você toma banho regularmente?
A resposta de alguns pode não ser verdadeira. Dependendo do humor do entrevistado, no
momento, poderá dar uma resposta rude, ou dizer qualquer coisa simpática.
A tendenciosidade da resposta pode também ser causada por outros motivos. Por exemplo,
em um país sob uma ditadura militar, as prévias eleitorais para o poder legislativo podem mostrar
muito mais votos para os candidatos do governo que se observará na realidade, possivelmente
pelo fato de as pessoas entrevistadas terem medo de dizer que irão votar contra o governo.
20
A tendenciosidade também pode ser trazida para a amostra pela maneira como se define a
característica de quem deve ser entrevistado. Existe a tendência de procurar os “típicos” e excluir
da amostra as pessoas que têm características menos definidas. Se você deve entrevistar negros,
possivelmente escolherá uma amostra que exclui os pardos. Se você deve entrevistar mulheres
com mais de 40 anos, possivelmente irá buscar as “com mais de 50” – apenas porque você não
terá dúvida de que elas atendem à característica – “com mais de 40”.
Também são feitas pesquisas com base em questionários publicados em jornais, revistas e
internet ou em cartas enviadas pelo correio. Nesses casos, é preciso ter em conta que as pessoas
que respondem são diferentes das que não respondem. Também é preciso ter em conta que o
questionário publicado em jornal, revista ou internet só será visto pelo público desse jornal ou
dessa revista.
Por outro lado, também não se pode deixar de lembrar que o próprio entrevistador pode
introduzir tendenciosidade nas respostas. Por exemplo, você pode obter mais opiniões
favoráveis ao uso gratuito de ônibus em São Paulo, se você perguntar “O senhor acha que as
pessoas muito idosas podem usar gratuitamente o serviço de ônibus nos horários de pouco
movimento?”. No entanto, provavelmente aumentará o número de respostas negativas se
perguntar: “O senhor acha que o governo deve pagar, com dinheiro dos impostos, o passeio de
aposentados em ônibus urbano?”
Em resumo, toda informação obtida através de amostras precisa ser analisada com cuidado.
Quando a informação é obtida por meio de entrevistas ou questionários, precisa ser observada
com muito mais cuidado.

Exercícios

1. Uma Faculdade de Ensino Superior possui 2000 alunos. Descreva como retirar uma amostra
aleatória simples dessa população com E0 = 3,5%.

2. O diretor de uma escola de Ensino Superior, na qual estão matriculados 1380 alunos no
período diurno e 1420 alunos no período noturno, desejoso de conhecer o perfil sócio-
cultural de seus alunos, resolveu fazer um levantamento, por amostragem, com E0 = 3,5%,
dessa clientela. Mostre, para esse diretor, como retirar uma amostra aleatória estratificada
proporcional, por período, adequada para representar o comportamento da população total de
alunos.
21

3. Mostre como retirar uma amostra de 32 elementos de uma população ordenada formada por
2432 elementos.

4. A tabela abaixo apresenta a população de docentes do Ensino Superior do país, por região e
gênero.
Gênero
Masculino Feminino
Região Nº de docentes Nº de docentes
Norte 6542 5464
Centro-Oeste 11102 9812
Nordeste 21491 18779
Sul 27249 23070
Sudeste 66524 51442
Total 132908 108567
Fonte: SINAES (http://sinaes.inep.gov.br:8080/sinaes/); acesso em 21/02/2007.

Obtenha uma amostra estratificada proporcional dos docentes do Ensino Superior do país, por
região e gênero simultaneamente, estabelecendo E0 = 5%.

5. Uma delegacia deseja fazer um levantamento amostral referente à distribuição de ocorrência
dos delitos. No arquivo da delegacia, existem 245.672 boletins de ocorrência arquivados
ordenadamente no período a ser analisado. Deseja-se extrair para esse levantamento uma
amostra de 1% do total de boletins. Como podemos retirar essa amostra?

6. Determine o tamanho da amostra aleatória simples para um erro amostral tolerável
estabelecido em 0,02 (ou 2,0%) e tamanho da população (N) igual a: 40, 400, 4000, 40000,
400000 e 4000000.

22
TABELAS DE DISTRIBUIÇÃO DE FREQÜÊNCIAS

A coleta de dados, seja de uma amostra ou de uma população de elementos, é o passo
inicial da análise estatística. Feita esta etapa, os dados originais ainda não se encontram prontos
para análise, por não estarem ainda organizados. Por esta razão costuma-se denominá-los de
dados brutos.
O passo seguinte consistirá em introduzir técnicas que permitam organizar, resumir e
apresentar esses dados, de tal forma que possamos interpretá-los à luz dos objetivos da pesquisa.
Com os dados adequadamente resumidos e apresentados em tabelas e gráficos, podemos
observar determinados aspectos relevantes, que possam ser cotejados com as hipóteses iniciais.
Um dos primeiros passos para entendermos o comportamento de uma variável, em termos
dos dados levantados, é resumir as informações por meio da construção de uma distribuição de
freqüências.
A distribuição de freqüências consiste na organização dos dados de acordo com a
ocorrência (freqüência) dos diferentes resultados observados. Ela pode ser apresentada sob a
forma tabular ou gráfica (Barbetta, 1999).
Iniciaremos, aprendendo a descrever e explorar dados de variáveis qualitativas. É o caso de
variáveis como sexo, estado civil, grau de instrução, etc.

Distribuição de Freqüências de Dados Qualitativos

Classificação simples

Para construir uma distribuição de freqüências com dados de uma variável qualitativa
bastar contar a quantidade de resultados (freqüência) observados em cada categoria (resposta).
A montagem de tabelas de distribuição de freqüências é normatizada pela Resolução nº886
do Conselho Nacional de Estatística, de 26 de outubro de 1966, e publicadas pelo IBGE.
Toda tabela deve ser auto-explicativa, sendo necessário um título que informe ao leitor o
quê está sendo apresentado, onde e quando foram coletados os dados e, quando apresentadas em
seqüência, serem numeradas consecutivamente em algarismos arábicos.
As tabelas devem ser abertas lateralmente e ter sua estrutura formada por pelo menos três
linhas horizontais, sendo duas que delimitam o cabeçalho e uma que faz o fechamento.
Apresenta, em seu formato básico, duas colunas: a coluna da esquerda, indicando a variável em
23
estudo e as categorias de análise e uma coluna adjacente, intitulada “freqüência” ou “f”,
indicando o número de sujeitos em cada categoria, bem como o número total de sujeitos.
A substituição de um dado numérico em uma célula (no centro da tabela – resultante do
cruzamento de uma linha com uma coluna) deve ser feita por um dos sinais abaixo, conforme o
caso
8
:
a) Dado numérico igual a zero não resultante de arredondamento, substituir por: -
b) Dado numérico igual a zero resultante de arredondamento de um dado numérico
originalmente positivo, sinal: 0 ou 0,0 ou 0,00 ou 0,000 etc.
c) Dado numérico igual a zero resultante de arredondamento de um dado numérico
originalmente negativo, sinal: - 0 ou - 0,0 ou - 0,00 ou - 0,000 etc.
No rodapéde uma tabela devem ser colocadas as notas explicativas referentes às fontes dos
dados, bem como as informações que não cabem na estrutura da tabela e que são importantes
para o entendimento dos dados apresentados. As notas de rodapé devem ser identificadas por
algarismos arábicos. Quando os dados forem retirados de alguma publicação, deve-se mencionar
sua autoria.
Quando uma tabela ocupar mais de uma página, não será delimitada na parte inferior
repetindo-se o cabeçalho na página seguinte.

Exemplo: Suponhamos que tenhamos coletado, em 03/10/2004, em uma classe do 3º ano do
Ensino Médio da rede pública da cidade de Marília, as respostas dos 27 alunos, quanto às
seguintes variáveis: Gênero, Nº de irmãos, Grau de instrução (completo) do pai, Grau de
instrução da mãe, Trabalha e Pretende cursar o Ensino Superior.

8
Há outras substituições não mencionadas nesta apostila, veja a publicação Normas de Apresentação Tabular do
IBGE (ISBN 85-240-0471-1, p.18).
24
Quadro 1. Dados de uma classe de 3º ano do Ensino Médio da rede pública da cidade de Marília
quanto às seguintes variáveis: Gênero, Nº de irmãos, Grau de instrução (completo) do
pai e da mãe, Trabalha e Pretende cursar Ensino Superior.

Aluno

Gênero

Nº de
irmãos

Grau instrução do pai

Grau instrução da mãe

Trabalha
Pretende
Cursar
Ensino
Superior
1 F 1 Ensino Fundamental Ensino Fundamental Não Sim
2 F 2 Ensino Médio Ensino Fundamental Sim Não
3 F 1 Ensino Fundamental Ensino Fundamental Sim Não
4 M 3 Ensino Fundamental Ensino Médio Não Sim
5 M 2 Ensino Médio Ensino Fundamental Não Não
6 F 1 Ensino Superior Ensino Médio Não Sim
7 M 0 Ensino Médio Ensino Médio Não Sim
8 M 2 Ensino Fundamental Ensino Fundamental Sim Sim
9 M 2 Ensino Fundamental Ensino Médio Não Sim
10 F 1 Ensino Médio Ensino Fundamental Sim Sim
11 F 3 Ensino Fundamental Ensino Fundamental Sim Não
12 M 1 Ensino Superior Ensino Superior Não Sim
13 F 4 Ensino Médio Ensino Médio Não Sim
14 M 2 Ensino Fundamental Ensino Fundamental Não Não
15 F 3 Ensino Médio Ensino Superior Não Sim
16 F 3 Ensino Fundamental Ensino Médio Sim Sim
17 M 4 Ensino Fundamental Ensino Fundamental Sim Não
18 F 2 Ensino Fundamental Ensino Fundamental Não Sim
19 F 1 Ensino Superior Ensino Superior Não Sim
20 M 0 Ensino Superior Ensino Superior Sim Sim
21 M 2 Ensino Fundamental Ensino Fundamental Sim Sim
22 M 2 Ensino Superior Ensino Médio Não Sim
23 F 3 Ensino Médio Ensino Médio Não Sim
24 M 3 Ensino Fundamental Ensino Médio Não Sim
25 M 1 Ensino Médio Ensino Fundamental Sim Sim
26 M 2 Ensino Médio Ensino Superior Não Sim
27 M 2 Ensino Fundamental Ensino Fundamental Sim Não

As variáveis “Gênero”, “Trabalha” e “Pretende Cursar Ensino Superior” são qualitativas
nominais. As variáveis “Grau de instrução do Pai” e “Grau de Instrução da Mãe” são qualitativas
ordinais e a variável “Número de Irmãos” é quantitativa discreta.
Iniciaremos o tratamento de dados analisando primeiramente as variáveis qualitativas do
tipo nominal. Para tal, usaremos para ilustração os dados referentes às variáveis “Gênero” e
“Trabalha”.
25
A tabela 1 mostra a distribuição de freqüências da variável gênero.
Tabela 1. Distribuição de freqüências do gênero dos alunos do 3º ano do Ensino Médio da rede
pública da cidade de Marília em 03/10/2002.
Gênero freqüência
Masculino 15
Feminino 12
Total 27

A primeira coluna da tabela 1, intitulada “Gênero”, mostra as categorias (masculino e
feminino) observadas para a variável Gênero, no conjunto de alunos em estudo. A segunda
coluna, intitulada “freqüência”, resulta da contagem do número de alunos de cada categoria
(masculino e feminino), bem como o número total de alunos (27).
Observemos, ainda, que a tabela está encabeçada por um número (1) e por um título que dá
ao leitor uma idéia da natureza dos dados apresentados.
Uma rápida inspeção da distribuição de freqüências constante na tabela 1 revela que a
classe é composta por mais alunos do gênero masculino.
A tabela 2 mostra a distribuição de freqüências dos dados da variável acesso à internet.
Tabela 2. Distribuição de freqüências, em números absolutos e relativos, da variável Traballha
dos alunos do 3º ano do Ensino Médio da rede pública da cidade de Marília em
03/10/2004.
Trabalha freqüência %
Sim 11 41
Não 16 59
total 27 100

A primeira coluna da tabela 2 mostra as categorias estabelecidas para a variável “Trabalha”.
A segunda coluna resulta da contagem de quantos alunos se identificam com cada categoria (sim
ou não). A terceira coluna apresenta uma medida relativa da freqüência de cada categoria. Estas
porcentagens são obtidas dividindo-se a freqüência de cada categoria pelo número total de
observações e, em seguida, multiplicando-se por 100. Em fórmula:
% = 100 x (f  N),
onde: f = freqüência da categoria,
N = total de indivíduos.
26
Esta medida relativa é particularmente importante para comparar distribuições de
freqüências quando os totais (tamanho da amostra ou da população) são diferentes, uma vez que
permite padronizar (em 100) as distribuições de freqüências quanto ao tamanho. O valor da
freqüência relativa de determinada categoria, expresso em termos de porcentagem, representa a
freqüência com que aquela categoria ocorre em relação ao número/total 100.

Tabela de Contingência ou Dupla Classificação

Quando em uma mesma tabela de distribuição de freqüências tratamos duas variáveis em
estudo denominamos a denominamos tabela de contingência ou de dupla classificação. Esse tipo
de construção de tabela de distribuição de freqüências nos permite observar se as duas variáveis
apresentam associação. Por exemplo, no exemplo sobre os alunos do 3º ano podemos construir
uma tabela de contingência para as variáveis “Grau de instrução do Pai” e “Pretende Cursar o
Ensino Superior” para avaliarmos se há associação entre essas variáveis. Outros exemplos de
tabelas de contingência sobre os dados dos alunos do 3º ano seriam: “Grau de instrução da mãe”
versus “Pretende cursar o Ensino Superior”; “Grau de instrução do pai” versus “Trabalha”;
“Gênero” versus “Pretende cursar o Ensino Superior”; “Trabalha” versus “Pretende cursar o
Ensino Superior”, entre outras.
Voltando ao nosso exemplo hipotético sobre os alunos do 3º ano do Ensino Médio,
podemos observar um exemplo da construção de uma tabela de contingência e utilização das
porcentagens/freqüências relativas.
Tabela 3. Distribuição de freqüências, em números absolutos e relativos, da variável Trabalha
dos alunos do 3º ano do Ensino Médio da rede pública da cidade de Marília em
03/10/2002, segundo o gênero.
Gênero
Masculino Feminino Total
Trabalha freqüência freqüência freqüência
Sim 6 (40,0) 5 (41,7) 11 (40,7)
Não 9 (60,0) 7 (58,3) 16 (59,3)
Total 15 (100,0) 12 (100,0) 27 (100,0)

27
A tabela 3 indica, ao mesmo tempo, as freqüências e as porcentagens
9
da variável Trabalha
por gênero e geral. Se ficarmos restritos apenas às freqüências, teremos dificuldades para tentar
estabelecer diferenças (ou não) ligadas ao gênero em termos da variável “Trabalha”. Em
contrapartida, as porcentagens revelam facilmente que não há diferença significativa entre
gêneros quanto ao trabalho. No geral, 59% dos alunos do 3º ano não trabalham. Por gênero, as
porcentagens estão próximas à observada no geral: entre os alunos do gênero masculino, 40%
trabalham e entre as alunas, 41,7% trabalham.
Suponhamos, agora, que estendendo este levantamento paratodos os 3º anos das escolas de
Ensino Médio de Marília tenhamos obtido os seguintes dados hipotéticos.
Tabela 4. Distribuição de freqüências, em números absolutos e relativos, da variável “Trabalha”
dos alunos do 3º ano do Ensino Médio, segundo a entidade mantenedora.
Escola
Pública Particular Total
Trabalha f f f
Não 811 (30,0) 110 (30,0) 921 (30,0)
Sim 1893 (70,0) 256 (70,0) 2149 (70,0)
Total 2704 (100,0) 366 (100,0) 3070 (100,0)

Observando a tabela, temos que a maioria (70%) dos alunos de escolas de ambas as
entidades mantenedoras trabalha. Ainda, em ambos os tipos de escola (pública e particular) a
porcentagem de alunos que trabalha é igualmente encontrada. Se a análise ficasse restrita às
freqüências, teríamos dificuldade ao tentar estabelecer rapidamente diferenças (ou semelhanças)
ligadas ao trabalho em termos do tipo de escola.
Quando calculamos as porcentagens em relação aos totais de coluna, denominamos essa
análise de perfil coluna, uma vez que a comparação será entre as colunas. Por outro lado, quando
calculamos as porcentagens tomando, como total na fórmula de %, os totais de linha,
denominamos essa análise de perfil linha.
Exemplo do cálculo de perfil linha:

9
As porcentagens podem aparecer em uma tabela de distribuição de freqüências tanto como uma coluna de números
entre parênteses adjacente à respectiva coluna de freqüências, sem título no cabeçalho (exemplo: tabela 3), como
uma coluna de números adjacente à respectiva coluna de freqüências, intitulada “%” (exemplo: tabela 2).
28
Tabela 5. Distribuição de freqüências, em números absolutos e relativos, da variável Trabalha
dos alunos do 3º ano do Ensino Médio da rede pública da cidade de Marília em
03/10/2002, segundo o gênero.
Gênero
Masculino Feminino Total
Trabalha freqüência freqüência freqüência
Sim 6 (54,5) 5 (45,5) 11 (100,0)
Não 9 (56,3) 7 (43,7) 16 (100,0)
Total 15 (55,6) 12 (44,4) 27 (100,0)

Por meio da tabela 5, observamos que mais da metade dos alunos da sala do 3º ano do
Ensino Médio é do gênero masculino. Tanto entre os alunos que trabalham como entre os alunos
que não trabalham, a porcentagem de alunos do gênero masculino é próxima àquela da presença
masculina na amostra, i.e., entre os alunos que trabalham a maioria é do gênero masculino e
também entre aqueles que não trabalham, a maioria é do gênero masculino.
A opção de escolha entre o cálculo do perfil coluna ou do perfil linha é feita pelo
pesquisador e depende do objetivo da pesquisa, uma vez que a leitura/interpretação dos
resultados é destinada a atender os objetivos propostos. Alguns pesquisadores optam por apontar
na tabela tanto o perfil linha como o perfil coluna, colocando ao lado das freqüências entre
parênteses o perfil linha e abaixo das freqüências, também entre parênteses, o perfil coluna.
As tabelas 1, 2, 3 e 4 apresentam as distribuições de freqüência de dados (variáveis)
qualitativos nominais. Posto que dados nominais são apenas “rotulados”, não apresentando
qualquer forma de graduação, as categorias dessas distribuições não precisam ser construídas em
nenhuma ordem específica. Em contraste, as categorias das variáveis ordinais representam o grau
em que uma característica particular está presente. O arrolamento de tais categorias dessas
variáveis nas distribuições de freqüências deve ser feito de tal forma que respeite essa ordem.
Por essa razão, as categorias ordinais são sempre dispostas em ordem. Como exemplo,
observemos a tabela 6 abaixo, referente à variável grau de instrução presente no Quadro 1.
29
Tabela 6. Distribuição de freqüências do grau de instrução dos pais dos alunos do 3º ano do
Ensino Médio da rede pública da cidade de Marília em 03/10/2004.

Grau de instrução freqüência
Ensino Fundamental 13
Ensino Médio 9
Ensino Superior 5
Total 27

Observando a tabela 6, temos que à medida que aumenta o grau de instrução diminui a
freqüência de pais de alunos do 3º ano do Ensino Médio em estudo. Perturbar a ordem de
categorias ordinais reduz a legibilidade das informações. Tal efeito pode ser observado na tabela
7, na qual apresentamos uma versão “incorreta” da distribuição apresentada na tabela 6.

Tabela 7. Distribuição de freqüências do grau de instrução dos pais dos alunos do 3º ano do
Ensino Médio da rede pública da cidade de Marília em 03/10/2004.
Grau de instrução freqüência
Ensino Fundamental 13
Ensino Superior 5
Ensino Médio 9
Total 27

Exercícios

1. Construa tabelas de distribuição de freqüências para as variáveis: “grau de instrução do pai”,
“grau de instrução da mãe” e “pretende cursar Ensino Superior” do quadro 1 (página 24).

2. Construa tabelas de contingência para as variáveis: “Pretende cursar Ensino Superior” versus
“Trabalha”; “Pretende cursar Ensino Superior” versus gênero; “Pretende cursar Ensino Superior”
versus “Grau de instrução do pai” do quadro 1 (página 24).
30
3. Total de docentes por titulação máxima, segundo a categoria da IES de vínculo.

Categoria da IES
de vinculo

Doutorado

Mestrado

Especialização

Graduação

Notório
Saber

TOTAL

Privada 20733 63201 57196 20092 25 161247
Pública 40597 27461 15016 7704 15 90793
TOTAL 61330 90662 72212 27796 40 252040
Fonte: SINAES (http://sinaes.inep.gov.br:8080/sinaes/), acesso em 22/02/2007.

Obtenha os perfis percentuais linha e coluna e faça a leitura dos resultados por aquele que
considerar mais adequado.

4. Total de Cursos de Graduação do Brasil, segundo a região do curso.

Região Curso
Graduação
Presencial
Curso
Graduação a
Distancia
Curso
Tecnológico
Presencial
Curso
Tecnológico a
Distancia
TOTAL
f
Centro-Oeste 2034 19 304 3 2360
Nordeste 4101 90 414 2 4607
Norte 1506 26 141 2 1675
Sudeste 9942 88 2238 4 12272
Sul 4186 48 653 23 4910
TOTAL 21769 271 3750 34 25824
Fonte: SINAES (http://sinaes.inep.gov.br:8080/sinaes/), acesso em 22/02/2007.

Calcule o perfil coluna percentual, arredondando os valores para inteiro, e faça a leitura dos
resultados.

Distribuição de Freqüências de Dados Quantitativos

Veremos agora a construção de tabelas de distribuição de freqüências de variáveis
quantitativas, bem como as interpretações que podemos fazer sobre essas distribuições.

Variáveis discretas
A construção de tabelas de distribuição de freqüências de dados resultantes de variáveis
discretas, quando não houver grande quantidade de diferentes valores observados, pode ser feita
31
do mesmo modo que uma distribuição de freqüência de dados qualitativos ordinais. Quando a
variável apresentar um grande número de diferentes valores, podemos usar a construção usada
para as variáveis contínuas. Como exemplo, usaremos os dados da variável número de irmãos,
presente no Quadro 1.
A tabela 8 apresenta a distribuição de freqüências desses dados, construída por meio da
contagem das repetições de cada resultado observado.
Tabela 8. Distribuição de freqüências, em números absolutos e relativos, do nº de irmãos dos
alunos do 3º ano do Ensino Médio da rede pública da cidade de Marília em 03/10/2002.

Nº de irmãos f %
0 2 7,4
1 7 26,0
2 10 37,0
3 6 22,2
4 2 7,4
Total 27 100

A tabela 8 nos mostra que o nº de irmãos mais freqüente entre os alunos é 2 irmãos. Ainda,
a maioria (85,2%) dos alunos têm entre 1 e 3 irmãos.

Variáveis Contínuas

Os valores das variáveis quantitativascontínuas espalham-se, muitas vezes, ao longo de
uma extensa amplitude (diferença entre o maior valor da distribuição e o menor valor da
distribuição), o que torna a distribuição de freqüências resultante não só longa, mas, também
difícil de visualizar as tendências gerais dos dados. Além disso, para essas variáveis não faz
muito sentido contar as repetições de cada resultado, pois, considerando que dificilmente os
resultados se repetem, não chegaríamos a um resumo apropriado dos dados observados.
Tomemos como ilustração a distribuição apresentada na tabela 9 a seguir.
32
Tabela 9. Taxa de urbanização de 52 cidades brasileiras, em 2002 (dados fictícios).
Taxa f
55 1
56 1
57 1
58 1
59 2
60 3
61 4
62 4
63 5
64 4
66 4
68 3
69 2
73 4
75 3
77 3
80 2
84 2
88 1
91 1
94 1
Total 52

Nesse caso, a grande extensão da tabela dificulta, tanto quanto os dados brutos, a leitura e
a interpretação dos resultados apurados. Esse fato impossibilita ou dificulta a visualização do
comportamento e tendência da população amostrada como um todo. Por esse motivo recomenda-
se nesses casos o agrupamento dos dados em classes.

33
DEFINIÇÕES:

(1) AMPLITUDE TOTAL (AT): é a diferença entre o maior e o menor valor observado da
variável em estudo.

(2) Classes ou intervalos de classe: são os intervalos de valores em que se subdivide a
amplitude total do conjunto de valores observados da variável. Esses intervalos devem ser
mutuamente exclusivos, tais que, quando reunidos, abrangem todo o conjunto de dados.
Em outras palavras, as classes devem ser construídas de tal forma que todo resultado
observado pertença a uma e apenas uma classe. Por simplicidade, e para facilitar a
interpretação, consideraremos todas as classes com a mesma amplitude.

(3) O Símbolo a | b indica a inclusão do valor a no intervalo e exclusão do valor b no
intervalo. O símbolo a | b indica a exclusão do valor a no intervalo e a inclusão de b no
intervalo. O símbolo a || b indica a inclusão de a e b no intervalo. O símbolo a ─ b indica
a exclusão de a e b no intervalo.

(4) Limite de classe: são os valores extremos do intervalo de classe, sendo o menor valor o
limite inferior da classe e o maior valor, o limite Ensino Superior da classe.

(5) Tamanho (ou amplitude) do intervalo de Classe (TC): é o comprimento da classe, sendo
geralmente definida como a diferença entre seus limites Ensino Superior e inferior.

É recomendável construir tabelas onde os intervalos de classe sejam iguais, i.e., de tamanho
igual.

Determinação do Número de Intervalos de Classe

Para apresentar os dados sob a forma de distribuição de freqüências agrupadas, devemos
levar em conta o número de classes que iremos empregar. Se esse número for pequeno, perde-se
informação, uma vez que os dados originais ficarão comprimidos, deixando de evidenciar
algumas características relevantes. Por outro lado, se forem utilizadas muitas classes, o objetivo
de resumir os dados fica prejudicado, não realçando aspectos relevantes da distribuição. Alguns
34
autores aconselham um número de 5 a 20 classes, outros apresentam uma fórmula (de Sturges)
para determinar o número ideal de classes. O número de classes, em uma distribuição de
freqüências, é representado por K.
A regra de Sturges estabelece que o número de classes é igual a:
K = 1 + 3,22log10 n
onde n = número de indivíduos (ou respostas) obtidas para a variável em estudo.
Para obter exemplos da aplicação da fórmula de Sturges, veja Toledo e Ovalle (1983, p.55).
Os exemplos acima mencionados revelam um dos inconvenientes resultantes da aplicação
da fórmula de Sturges, que é o de propor um número demasiado de classes para um número
pequeno de observações e, relativamente, poucas classes, quando o total de observações for
grande.
É importante que a distribuição conte com um número adequado de classes, para tal a
escolha de k deve contar com a familiaridade do pesquisador com os dados, que lhe indicará
quantas e quais classes devem ser usadas.

ROTEIRO PARA A ELABORAÇÃO DE UMA TABELA DE FREQUÊNCIAS COM DADOS
AGRUPADOS EM CLASSES

Para a construção de uma tabela de freqüências, é conveniente adotar-se um roteiro que,
embora baseado em critérios relativamente arbitrários, facilita e torna mais operacional o
trabalho de quem irá montar a tabela. O roteiro proposto consta dos seguintes passos:
(a) Encontrar a AT do conjunto de valores observados
(b) Escolher o número de classes, que chamaremos de K. Alguns autores propõem que se
escolha entre um número mínimo de 5 e máximo de 20 classes, ressaltando , todavia, que quanto
maior o número de observações, maior deverá ser o número de classes e vice-versa.
(c) Determinar o tamanho do intervalo de classe (TC), através de:

TC = AT  K

Quando chegarmos a um resultado não muito conveniente, convém arredondar o valor do
tamanho do intervalo de classe (TC) para um número mais adequado, que facilite os cálculos.
(d) Determinar os limites das classes, escolhendo-se, preferencialmente, números inteiros.
(e) Construir a tabela de freqüências.
35

PONTO MÉDIO (PM): é o valor que representa a classe, para efeito de cálculo de outras
estatísticas.

PM = Limite inferior da classe + Limite Ensino Superior da Classe
2

Representações Gráficas

É fato conhecido que as informações numéricas são mais facilmente assimiladas quando
são apresentadas na forma de gráficos, uma vez que fornecem, em geral, uma visualização mais
fácil e legível das informações do que as tabelas.
Iniciamos apresentando o gráfico de setores e o gráfico de barras, que são particularmente
úteis na representação de distribuições de freqüências de dados categorizados.

Gráfico de Setores

O gráfico de setores (ou setorial) é um dois mais simples recursos gráficos, posto que
consiste em um círculo cujos setores, i.e., partes do mesmo círculo, soma 100%. Assim, para
construir um gráfico de setores, basta fazer uma relação entre um ângulo, em graus, e a
freqüência observada em cada categoria, lembrando que um círculo tem 360°.
Divide-se, desse modo, a área total de um círculo em subáreas (setores) proporcionais às
freqüências.
setor (categoria) = 360° x (f  N),

onde f = freqüência da categoria;
N = total ode indivíduos observados

36
Exemplo: Distribuição dos Cursos de Graduação do Brasil, pelas regiões do país.

Região Nº de
cursos de
Graduação

Área
Centro-Oeste 2360 33°
Nordeste 4607 64°
Norte 1675 23°
Sudeste 12272 171°
Sul 4910 69°
TOTAL 25824 360°
Fonte: SINAES (http://sinaes.inep.gov.br:8080/sinaes/), acesso em 22/02/2007.

Temos que: setor (Centro-Oeste) = 360° x 2360/25824 = 33°
setor (Nordeste) = 360° x 4607/25824 = 64°
setor (Norte) = 360° x 1675/25824 = 23°
setor (Sudeste) = 360° x 12272/25824 = 171°
setor (Sul) = 360° x 4910/25824 = 69°

Distribuição percentual dos cursos de Graduação
no Brasil, por região (N = 25824)
9%
18%
6%
48%
19%
Centro-Oeste
Nordeste
Norte
Sudeste
Sul

Fonte: SINAES (http://sinaes.inep.gov.br:8080/sinaes/), acesso em 22/02/2007.

37
O gráfico de setores tem apelo visual muito grande e deve ser usado quando se quer passar
informação geral. Entretanto, ele não é muito adequado para a representação gráfica de variáveis
com muitas categorias (exemplo, no estudo do mês do nascimento do aluno), quando se deseja
transmitir padrões de comportamento,tendências ou precisão.

Gráfico de Barras Verticais

O gráfico de barras verticais (ou colunas) visa comparar grandezas por meio de retângulos
de igual largura e alturas proporcionais às respectivas grandezas. Na construção desse tipo de
gráfico, marcamos as categorias na linha de base horizontal (ou eixo dos X) e as respectivas
freqüências (ou freqüências relativas - %) são localizadas na linha vertical (ou eixo dos Y).
As freqüências de cada categoria são indicadas, então, por barras retangulares, que só
devem diferir em comprimento, e não em largura, a qual é arbitrária. Quanto mais alta a barra,
maior a freqüência de ocorrência.
Salientamos, ainda, que as barras devem vir separadas umas das outras pelo mesmo espaço,
o qual deve ser suficiente para que as legendas que identificam as diferentes barras não tragam
confusão ao leitor
10
. Quando, entretanto, as legendas não forem breves, é preferível usarmos o
gráfico de barras horizontais, que se prestam à mesma finalidade que os gráficos de barras
verticais. A única diferença entre os gráficos de barras horizontais e os de barras verticais reside
na direção dos retângulos.
Exemplo:
População de docentes do Ensino Superior do país, por região.
Região Nº de docentes
Norte 12006
Centro-Oeste 20914
Nordeste 40270
Sul 50319
Sudeste 117966
Total 241475
Fonte: SINAES (http://sinaes.inep.gov.br:8080/sinaes/); acesso em 21/02/2007.

10
Como regra prática, alguns autores, sugerem tomar o espaço entre as barras como aproximadamente
a metade de suas larguras.
38
População de docentes das Instituições de
Ensino Superior do país, por região (N=241475)
0
20000
40000
60000
80000
100000
120000
Norte Centro-
Oeste
Nordeste Sul Sudeste
região
Nº
d
e d
oc
en
tes

Fonte: SINAES (http://sinaes.inep.gov.br:8080/sinaes/); acesso em 21/02/2007.

O gráfico de setores ilustra, de modo fácil e rápido, dados que podem ser subdivididos em
algumas categorias. Comparativamente, o gráfico de barras pode “acomodar” qualquer
quantidade de categorias e, portanto, é mais usado em pesquisas.
Para efetuar uma análise comparativa de várias distribuições, podemos construir um gráfico
de barras múltiplas (ou agrupadas).
Exemplo: Taxa de mortalidade infantil/por mil por sexo.

Homens Mulheres
Região % %
Norte 37,8 27,3
Nordeste 58,9 46,3
Sudeste 29,7 21,5
Sul 25,9 19,6
Centro-Oeste 28,8 23,4
Brasil 39,4 30,0
Fonte: IBGE/DPE/Depto. de População e Indicadores Sociais. Estimativas referem-se, em média, ao período de
1993/1994.
39
Taxa de mortalidade infantil/mil por sexo
0
15
30
45
60
Norte Nordeste Sudeste Sul Centro-
Oeste
região
ta
xa
/m
il
Homens
Mulheres

Histograma

O Histograma é um gráfico usado para a representação de distribuições de freqüências de
variáveis quantitativas. Sua construção é feita de modo análogo ao gráfico de colunas com os
retângulos, entretanto, justapostos. Neste gráfico, as barras são unidas a fim de respeitar (e
enfatizar) a noção de ordem de grandeza das classes (do valor menor para o maior).
Em um histograma, sobre cada classe tem-se um retângulo, cuja altura corresponde à
freqüência observada desta classe. No caso de dados agrupados em intervalos de classe, são os
pontos médios dos intervalos de classe que se colocam no eixo dos X.

Exemplo: retomando a distribuição de freqüências apresentada na tabela 6, referente ao nº de
irmãos dos alunos da 5ª série, podemos construir o histograma apresentado a seguir.
Histograma referente ao nº de irmãos dos alunos da 5ª
série matutina da rede pública de Marília
0
2
4
6
8
10
12
0 1 2 3 4
Nº de irmãos
f

Podemos dizer que o histograma seja uma “versão” do gráfico de barras para as variáveis
quantitativas. Nos gráficos de barras, onde a variável observada é nominal, as barras são
40
apresentadas separadamente, ao passo que nos histogramas, em que a variável analisada é
quantitativa, as barras são colocadas justapostas.

Polígono de Freqüências

Outra representação gráfica comumente usada é o polígono de freqüências. Este tipo de
gráfico é bastante usado para mostrar tendências/padrões, tendendo a sugerir muito mais
continuidade do que discriminação; daí sua particular utilidade na representação de dados
longitudinais
11
e quantitativos.
Para construí-lo, toma-se a categoria ou o valor da variável (ponto médio, no caso de uma
classe), que chamaremos, aqui, por x e a correspondente freqüência (f). Colocam-se os pares (x,
f) como pontos num par de eixos cartesianos. Esses pontos são, a seguir, unidos por segmentos
de retas, ligando os pontos extremos ao eixo horizontal
12
.
Exemplo: Distribuição do rendimento mensal (em salários mínimos – s.m.) de 40 pessoas
entrevistadas em Marília, em 11/10/2002 (dados fictícios).

Rendimento (em s.m.) f Ponto Médio (x)
0 | 4 23 2
4 | 8 9 6
8 | 12 4 10
12 | 16 2 14
16 | 20 2 18
Total 40

11
Alguns autores também denominam este tipo de representação gráfica por Gráfico de Linhas, quando construído
para variáveis ordinais.
12
Quando construído para variáveis ordinais, não ligamos os pontos extremos ao eixo horizontal.
41
Distribuição da renda (em s.m.) de 40 pessoas
entrevistadas em Marília em 11/10/2002
0
5
10
15
20
25
0 2 6 10 14 18 22
renda (em s.m.)
f

Exemplo: Popularidade do governo FHC.
Grau de aprovação da maneira como FHC estava administrando o país, em 1999.
aprovação desaprovação
Fev/96 60 29
Mar/97 70 22
Out/97 60 30
Jan/98 57 33
Mar/98 54 36
Jul/98 60 30
Dez/98 60 38
Mar/99 35 56
Fonte:Jornal Estado de São Paulo de 09/04/99.
Grau de aprovação da maneira como o preseidene
FHC estava administrando o país, em 09/04/99.
0
10
20
30
40
50
60
70
80
Fe
v/
96
A
go
/9
6
Fe
v/
97
A
go
/9
7
Fe
v/
98
A
go
/9
8
Fe
v/
99
mês
%
aprovação
desaprovação

42
Finalizando o tema representações gráficas, devemos salientar que, embora os gráficos
constituam excelente forma de apresentar dados, eles podem também servir para enganar, uma
vez que o visual deles pode estar “maquiado”, por meio da ausência da apresentação da escala ou
por distorções entre a relação entre os eixos X e Y.
Sem escalas, aumentos irrisórios podem ser transformados em “aumentos evidentes”, pelo
menos visualmente (exemplo: Sonia Vieira, p. 33 – “O que é Estatística”). As distorções entre a
proporção entre os eixos X e Y podem ser obtidas, puxando o gráfico no sentido vertical
(“acentua” a tendência observada no gráfico – exemplo: Vieira, p. 35) ou puxando o gráfico no
sentido horizontal (“ameniza” ou “esconde” a tendência observada no gráfico). A impressão
também é falsa se tirarmos parte do gráfico. O crescimento (ou decrescimento) da curva fica
muito mais impressionante.
Desse modo, devemos prestar atenção nos gráficos, pois o visual pode estar “maquiado”.

Exercícios
1. Construa uma representação gráfica para as distribuições abaixo.
(a) Total de docentes por titulação máxima, segundo a categoria da IES de vínculo.

Categoria da IES
de vinculo

Doutorado

Mestrado

Especialização

Graduação

Notório
Saber

TOTAL

Privada 20733 63201 57196 20092 25 161247
Pública 40597