Buscar

Oficina_02-_Introdução_ao_Manuseiro_de_Base_de_Dados_e_Indicadores

Prévia do material em texto

Oficina 002
Introdução ao manuseio de base de 
dados governamentais e a construção de 
indicadores
XVI Semana de Administração Orçamentária, Financeira e de Contratações Públicas 
Introdução à base de dados
Conceitos
Passado Presente
Conceitos
• são um conjunto de valores ou ocorrências em um estado bruto 
com o qual são obtidas informações com o objetivo de adquirir 
benefícios¹. 
• Existem dois tipos de dados: estruturados e não estruturados. 
– Os dados estruturados, que são dados formatados, organizados em tabelas 
- linhas e colunas - e são facilmente processados, geralmente é utilizado 
um sistema gerenciador de banco de dados para armazenar esse tipo de 
dado, um exemplo são os dados gerados por aplicações empresariais. 
– Os dados não estruturados não possuem uma formatação específica e são 
mais difíceis de serem processados. Por exemplo, mensagens de email, 
imagens, documentos de texto, mensagens em redes sociais.
Dados
¹SHRIVASTAVA; SOMASUNDARAM (2009). Armazenamento e Gerenciamento de Informações: Como armazenar, gerenciar e proteger informações digitais. São Paulo: Bookman.
Conceitos
• Descrição das componentes semânticas e sintáticas de uma 
informação, necessárias para sua compreensão e para o seu 
manuseio computacional. 
• Os metadados fornecem informações sobre os dados e sobre os 
processos de produção e uso dos dados.
Metadados (dados sobre os dados)
Conceitos
• É uma coleção de dados inter-relacionados, representando 
informações sobre um domínio específico”, ou seja, 
sempre que for possível agrupar informações que se 
relacionam e tratam de um mesmo assunto, posso dizer 
que tenho um banco de dados¹.
• São um conjunto de arquivos relacionados entre si com 
registros sobre pessoas, lugares ou coisas. São coleções 
organizadas de dados que se relacionam de forma a criar 
algum sentido (Informação) e dar mais eficiência durante 
uma pesquisa ou estudo².
Banco/base de dados
¹KORTH, H.F. e SILBERSCHATZ, A.; Sistemas de Bancos de Dados, Makron Books, 2a. edição revisada, 1994.
²https://pt.wikipedia.org/wiki/Banco_de_dados
Conceitos
• Uma base de dados é uma coleção de dados logicamente 
relacionados, com algum significado. Associações aleatórias de 
dados não podem ser chamadas de bases de dados;
• Uma base de dados é projetada, construída e preenchida com 
dados para um propósito específico. Ela tem um grupo de 
usuários e algumas aplicações pré-concebidas para atende-los;
• Uma base de dados representa algum aspecto do mundo real, 
algumas vezes chamado de “mini-mundo”. Mudanças no mini-
mundo provocam mudanças na base de dados.
Banco/base de dados - Propriedades
Conceitos
• é um conjunto de dados dispostos em número infinito 
de colunas e número ilimitado de linhas (ou tuplas)¹.
• As colunas são tipicamente consideradas os campos da 
tabela, e caracterizam os tipos de dados que deverão 
constar na tabela (numéricos, alfanuméricos, datas, 
coordenadas, etc). 
• O número de linhas pode ser interpretado como o número 
de combinações de valores dos campos da tabela, e pode 
conter linhas idênticas, dependendo do objetivo. A forma de 
referenciar inequivocamente uma única linha é através da 
utilização de uma chave primária.
Tabelas
¹https://pt.wikipedia.org/wiki/Tabela_(banco_de_dados)
Conceitos
• Exemplo
Tabelas
Linhas
Colunas
Registro
• Pessoa
• Domicílio
• Empresa
• Propriedade
• Turma
• ...
Campo/Variáveis
• Atributos
• Características
Formatos
• Sequência de caracteres
• Numérico
• Data
Conceitos
• As tabelas relacionam-se umas as outras através 
de chaves. 
• Uma chave é um conjunto de um ou mais 
atributos que determinam a unicidade de cada 
registro.
Chave
¹https://pt.wikipedia.org/wiki/Banco_de_dados_relacional
Conceitos
• é um banco de dados que modela os dados de uma 
forma que eles sejam percebidos pelo usuário como 
tabelas, ou mais formalmente relações¹.
• A arquitetura de um banco de dados relacional pode 
ser descrita de maneira informal ou formal. 
• Na descrição informal estamos preocupados com aspectos 
práticos da utilização e usamos os termos tabela, linha e 
coluna.
• Na descrição formal estamos preocupados com a semântica 
formal do modelo e usamos termos como relação (tabela), 
tupla (linhas) e atributo (coluna).
Banco de dados relacional
¹https://pt.wikipedia.org/wiki/Banco_de_dados_relacional
Conceitos
• Exemplo - PNAD
Banco de dados relacional
Dicionário dos dados
Tabela 1 - Domicílio
Tabela 2 - Pessoa
Conceitos
• Conjunto de programas e ferramentas utilizadas 
para configurar, atualizar e manter um banco de 
dados.
Sistema de Gerenciamento de Banco de Dados (SGBD)
Exemplos
 Cadastros e registros administrativos
Tipos de bases de dados
• São dados individuais (sobre pessoas, empresas, transações 
comerciais, etc.) produzidos por instituições (como governo e 
empresas) com vistas ao agir administrativo.
Exemplo: SIGEPE, CADÚNICO, RAIS
• Características comumente encontradas para análise de dados:
– Informações sigilosas (acesso restrito)
– Problemas como duplicação, ausência de informação completa, ausência de 
documentação
– Disponibilidade em tempo real
Tipos de bases de dados
 Censos
• Tipo de levantamento que obtém informações de todas as 
pessoas de um grupo.
Exemplo: Censo Demográfico, Censo Escolar, Censo Agropecuário
• Características comumente encontradas para análise de dados:
– As informações obtidas em Censos e/ou pesquisas não amostrais, para estarem 
conformes com a legislação, devem ser desidentificadas e tratadas em áreas 
suficientemente grandes para não permitirem a revelação do informante. 
Pesquisas econômicas apresentam elevado número de informações únicas e/ou 
representativas que inviabilizam a divulgação de microdados;
– Bases muito grandes
– Exatidão das respostas
– Poucas variáveis
Tipos de bases de dados
 Pesquisas amostrais
• Levantamento que escolhe aleatoriamente algumas pessoas da 
população, as quais representam as respostas de um todo da 
população através de inferências estatísticas.
Exemplo: PNAD, Pesquisa Nacional de Saúde – PNS, Pesquisas 
Eleitorais
• Características comumente encontradas para análise de dados:
– Em pesquisas amostrais é viável a disponibilização de arquivos de microdados
para uso público sem comprometer o sigilo da informação, suprimindo-se as 
informações geográficas menores do que a das áreas de ponderação (utilizadas 
para expansão dos dados)
– Dados já trabalhados (imputação)
– Farta documentação
Atualmente, há uma diversidade de cadastros e registros 
administrativos que não “conversam” entre si.
Não há padronização, tampouco um Sistema de Interligação dos 
Dados Cadastrais, o que facilita fraudes e dificulta o cruzamento de 
informações entre os programas.
O conjunto de bases de dados já disponíveis no governo, se 
estiverem interligados, podem se constituir em grande fonte de 
informação para a tomada de decisão dos gestores públicos
INTEROPERABILIDADE DE BASES DE DADOS
Aproveitamento do conjunto de informações disponíveis no 
governo para avaliação e reformulação de programas
Bases com informação de 
renda e ocupação
(Fortalecimento do CNIS)
Bases com 
informação de 
educação e saúde
(CENSO, SIAB, 
CADSUS)
Bases com informação de 
acesso a programas e 
benefícios
(BPC, BF e Seguro Defeso)
Bases com identificação do 
cidadão
(CPF, NIS, CNH, SIRC, SIM, 
SISOB)
Bases com 
informação de bens e 
direitos
(RENAVAM, MCMV)
O que é?
• É a plataforma de análise de dados do Governo que 
permite aos órgãos do SISP* acesso a diversas bases de 
dados, para a geração de informações estratégicas com a 
utilização de ferramentas de descobertae mineração de 
dados, e de análises estatísticas e cognitivas.
*Sistema de Administração dos Recursos de Tecnologia da Informação
Benefícios
• Centralização no acesso às principais bases de dados do 
Governo Federal;
• Tempestividade na entrega e utilização de dados; 
• Reuso de dados e de análises;
• Custo de investimento e manutenção da infraestrutura 
concentrado no Serpro e Dataprev;
• Solução computacionalmente eficiente para o cruzamento 
de grande quantidade de dados;
Competências desejáveis para trabalhar 
com bases de dados
• Habilidade com ferramentas de análise de dados
• Conhecimento da política, objeto de análise
• Conhecimento da base de dados que vai trabalhar e de 
onde encontrar dados e informações complementares
Habilidade com ferramentas de 
análise de dados
Conhecimento da política, objeto 
de análise
• Legislação que regulamenta a política
Leis
Decretos
Portarias
 Instruções normativas
• Publicações
• Artigos
• Experiência na área (consultar quem trabalha 
na área)
Conhecimento da base de dados 
que vai trabalhar
• Importante ler/estudar toda a documentação, notas técnicas e 
dicionários das bases de dados, quando disponível
Exemplo:
• Quando a documentação não estiver disponível, buscar pelo 
questionário da pesquisa ou formulário que abastece o cadastro ou 
registro administrativo
Onde encontrar dados e 
informações complementares?
Fontes
• Tabelas prontas
Agregados (dados obtidos por estatísticas sobre os microdados)
Compõem o plano de divulgação dos resultados de uma pesquisa, observando:
Critérios de agregação: 
o Apesar dos dados serem coletados com grande precisão espacial, os dados 
são agregados em áreas mínimas que não permitam a revelação do 
informante;
o São observadas as classificações utilizadas na pesquisa para que categorias 
de baixa frequência não levem a revelação do informante.
Precisão:
o A expansão de pesquisas amostrais é feita no mínimo sobre as unidades 
espaciais consideradas no projeto da amostra para que os valores 
resultantes apresentem estimativas consistentes.
Índice CV (%)
Brasil 0,525 1,2
Norte 0,511 1,3
Nordeste 0,522 1,3
Sudeste 0,518 2,3
Sul 0,469 1,1
Centro-Oeste 0,512 1,3
Tabela 2.3 - Índice de Gini da distribuição do 
rendimento mensal das pessoas de 15 anos ou mais de 
idade, com rendimento, segundo as Grandes Regiões, 
as Unidades da Federação e os Municípios das Capitais - 
2016
Grandes Regiões, 
Unidades da Federação e 
Municípios das Capitais
Índice de Gini
Fonte: IBGE. Pesquisa Nacional por Amostra de Domicílios Contínua, 2016, 
consolidado de primeiras entrevistas.
Nota: Exclusive as informações das pessoas sem declaração de 
rendimento.
Onde encontrar dados e 
informações complementares?
Fontes
• Tabelas prontas
Planos Tabulares – Conjunto de tabelas com informações agregadas,
apresentados sob a forma de planilhas
São utilizados para divulgação de resultados de pesquisas e Censos.
Apresentam estrutura temática cobrindo os principais pontos de conhecimento obtido numa 
investigação.
Apesar de abrangentes, os planos tabulares não esgotam o potencial de informação de uma 
investigação. Em uma investigação, apenas uma parte dos possíveis cruzamentos de dados são 
apresentados.
A possibilidade de explorar dados não cobertos pelos planos tabulares leva os pesquisadores a 
demandar o acesso aos microdados.
Exemplo: PNAD Contínua de educação
Onde encontrar dados e 
informações complementares?
Fontes
• Ferramentas online
Business Intelligence – BI
Ferramenta de aceso pela internet que 
permite realizar algumas seleções de 
variáveis, realizar filtros e gerar lista e 
tabelas que podem ser baixadas no 
computador.
Onde encontrar dados e 
informações complementares?
Fontes
• Microdados
Arquivos que contém a menor fração de dados de pesquisas, cadastros ou registros 
administrativos. A partir da agregação de microdados é construída a informação.
São dados característicos de unidades de uma população, como dados de indivíduos, 
de domicílios, de estabelecimentos etc., coletados em procedimentos administrativos, 
operacionais ou através de pesquisas estatísticas.
As bases de microdados estão organizadas de forma a serem compreendidas por 
softwares específicos, o que agiliza o processo de tratamento e cálculos estatísticos.
Onde encontrar dados e 
informações complementares?
Vantagens do microdado em relação ao BI:
Geralmente estão disponíveis mais variáveis que 
no BI
Sem limitações quanto a combinações de variáveis
Pode ser cruzado com outro microdado
Atualização mais rápida
Onde encontrar dados e 
informações complementares?
Desvantagens do microdado em relação ao BI:
Em geral, a “qualidade” do microdado é inferior ao 
do BI, requer limpeza e transformação
É mais trabalhoso, quando não for uma tarefa 
rotineira
 Requer maior conhecimento da base de dados
Por que aprender a lidar com 
ferramentas de análise de dados?
Novas tendências em análise de dados
• Big Data
O termo amplamente utilizado na atualidade para 
nomear conjuntos de dados muito grandes ou complexos, 
principalmente, dados não estruturados, como logs de acesso, 
dados de sensores, frases escritas por funcionários e clientes, dados 
de redes sociais, posições geográficas, e-mails, arquivos no servidor 
de arquivos, entre outros.
Computação cognitiva
Novas tendências em análise de dados
• Inteligência artificial
Tecnologias cognitivas como o aprendizado de máquina (Machine
Learning, ML) e aprendizado profundo (Deep Learning, DL).
Máquina que consegue aprender sem o uso de um código específico -
capacidade de se auto modificar e melhorar o próprio desempenho 
sem intervenção humana.
Utilizada para gerar informações relevantes, a partir de grandes bases 
de dados (big data)
Computação cognitiva
• Acesso a tabelas prontas: Área de imprensa > Dados
• Ferramenta – TabCad: dados agregados do Cadastro Único
• Ferramenta - Relatórios de Informações Sociais: dados agregados
• Ferramenta - VIS DATA (Visualizador de Dados Sociais)
• Microdados
Explorando algumas bases de governo federal – Cadastros e 
registros administrativos
Ministério do Desenvolvimento Social e Agrário - MDS
Ministério do Desenvolvimento Social e Agrário - MDS
• Microdados do Cadastro Único
 Tipo Exemplos Acesso Cessão e/ou utilização
Dados que identificam 
famílias e pessoas 
cadastradas
Nome, documentos pessoais, Número de 
Identificação Social (NIS), Código Familiar, 
endereço e telefone.
Sigilosos
Só podem ser fornecidos para a gestão 
de políticas públicas e para a realização 
de estudos e pesquisas.
Dados que caracterizam 
pessoas, famílias e domicílios 
cadastrados
Características específicas do domicílio de 
uma família, total de membros de uma 
família, despesas mensais, rendimentos, 
escolaridade, situação no mercado de 
trabalho, etc.
Sigilosos
Só podem ser fornecidos para a gestão 
de políticas públicas e para a realização 
de estudos e pesquisas.
Dados não identificados
Aqueles que possam ser agregados, 
conformando números absolutos e 
porcentagens, bem como aqueles que, 
quando correlacionados, não identificam 
uma pessoa ou família.
Públicos
Podem ser consultados, por meio de 
diversas ferramentas disponibilizadas 
pelo MDS.
Explorando algumas bases de governo federal – Cadastros e 
registros administrativos
Saúde
• Sistema de Informações de Agravos de Notificação – SINAN
• Sistema de Informações de Nascidos Vivos – SINASC
• Sistema de Informações de Mortalidade – SIM
• Sistema de Informações Hospitalaresdo SUS – SIH/SUS
• Sistema de Informações Ambulatoriais do SUS – SIA/SUS
• Cadastro Nacional de Estabelecimentos de Saúde – CNES
• Sistema de Cadastramento de usuários do SUS – CADSUS
• Sistema de Avaliação do Programa de Imunização – PNI/API
• Sistema de Informação de Atenção Básica – SIAB
• Registro de Câncer de Base Populacional – RCBP
• Sistema de Informações sobre Orçamentos Públicos em Saúde – SIOPS
• Sistema de Informações de Beneficiários – SIB
• Sistema de Cadastro de Operadoras – CADOP
• Pesquisa Nacional sobre Demografia e Saúde – PNDS
• Inquérito domiciliar sobre comportamento de risco e morbidade referida de doenças e 
agravos não transmissíveis
• Vigilância de Doenças Crônicas por Inquérito Telefônico – VIGITEL
 Informações de Saúde (TABNET)
 MS não disponibiliza microdados
Explorando algumas bases de governo federal – Cadastros e 
registros administrativos
Educação
Fontes INEP (microdados):
• Censo Escolar – Educação Básica: Principais Variáveis: A) Escola: situação e local de funcionamento; 
caracterização da infraestrutura (abastecimento de água, energia elétrica, etc.); disponibilidade de 
equipamentos didático/pedagógicos; existência de dependências físicas; fornecimento de alimentação 
escolar; oferta de atendimento educacional especializado; disponibilidade de materiais didáticos de 
atendimento à diversidade sociocultural. B) Turma: horário de funcionamento; tipo de atendimento; 
existência de atividade complementar; atendimento educacional especializado; tipo de disciplinas. C) 
Alunos: idade; sexo; cor ou raça; uso de transporte escolar; necessidade educacional especial; rendimento 
escolar (aprovado/reprovado); D) Docentes: idade; sexo; cor ou raça; escolaridade; função que exerce na 
escola; turma que atua; disciplina que leciona; 
• Censo da Educação Superior: Principais variáveis: vagas, candidatos e ingressantes por área, curso, 
habilitação, modalidade, por turno, por tipo de processo seletivo e período; alunos matriculados; 
portadores de necessidades especiais; perdas de alunos; concluintes; alunos com financiamento 
educacional; alunos-bolsistas; servidores técnico-administrativos por grau de formação, tipo de contrato; 
número de docentes por grau de formação, regime de trabalho e por sexo; dados financeiros; infraestrutura 
e instalações, equipamentos e outros recursos institucionais
Explorando algumas bases de governo federal – Cadastros e 
registros administrativos
Educação
Fontes INEP (microdados):
• Exame Nacional de Desempenho dos Estudantes – ENADE: instituições, cursos e 
habilitações; resultados alunos; dados do questionário socioeconômico; médias e os 
conceitos das instituições de ensino superior.
• Exame Nacional do Ensino Médio – ENEM: variáveis de controle da escola, da prova 
objetiva, da prova de redação; questionário socioeconômico; características da família e 
do trabalho do estudante; características do estudo, do estudante e seus valores. 
• Prova Brasil e Sistema Nacional de Avaliação da Educação Básica – SAEB*: dados da 
turma; dados da escola; dados da proficiência em língua portuguesa e matemática; 
dados do aluno; dados do professor e dados do diretor.
* Prova Brasil: Censitária - Escola localizada na área urbana da rede pública 
SAEB: Amostragem probabilística - Escolas localizadas nas áreas urbana e rural da rede pública e da rede privada
Explorando algumas bases de governo federal – Cadastros e 
registros administrativos
Educação
Fontes MEC (microdados):
• FIES - Detalhamento dos financiamento a estudantes por mês, contendo UF; 
município; IES; curso e valor da mensalidade. Detalhamento do perfil dos 
beneficiários do FIES por sexo; raça/cor; data de nascimento. Sem 
identificador.
• ProUni - Detalhamento das bolsas concedidas pelo Prouni por ano, contendo 
a região; UF; município; IES; curso; modalidade de ensino (presencial ou 
EAD); turno e tipo de bolsa. Detalhamento do perfil dos beneficiários do 
Prouni por sexo; raça/cor; data de nascimento e pessoas com deficiência. 
Identificador: CPF camuflado
Explorando algumas bases de governo federal – Cadastros e 
registros administrativos
Trabalho
Dados Agregados BI
Microdados
Público Sigiloso
Síntese do Emprego Formal
INSPER
Anuário Estatístico da RAIS
Programa de Disseminação 
das Estatísticas do Trabalho -
PDET
Microdados da RAIS 
desidentificados
Microdados da RAIS 
identificados
Microdados da CAGED 
desidentificados
Microdados da CAGED 
identificados
Diferença entre microdados e PDET: 
 nos microdados estão disponíveis variáveis, como por exemplo, Indicador de Pessoa 
com Deficiência, Tipo de Deficiência, Atividade Econômica (Subclasse), Ocupação e 
Raça/Cor que devem ser utilizadas com certa cautela, pois, algumas são 
relativamente novas e outras, dado o nível de desagregação, podem apresentar 
algumas inconsistências. Contudo, em termos gerais, sua utilização em nível mais 
agregado não está comprometida.
Explorando algumas bases de governo federal – Cadastros e 
registros administrativos
Trabalho
ITEM RAIS CAGED
Levantamento Anual Mensal
Tipo de vínculo qualquer tipo: estatutários, celetistas, temporários, avulsos; apenas os celetistas
Abrangência todos os empregados do ano base em 31/12 e 
movimentação dos admitidos e desligados mês a mês
apenas a movimentação de admitidos e desligados
Obrigatoriedade todos os estabelecimentos, mesmo aqueles que não 
apresentaram movimentação
apenas os estabelecimentos que apresentaram 
movimentação
Útil para estudos estruturais do mercado de trabalho formal de análise de conjuntura do mercado de trabalho formal
Vantagens da RAIS e CAGED
 Abrangência, atingindo até o município, e à diversidade de cruzamento em nível ocupacional e setorial.
 Disponibilização dos dados em período relativamente pequeno no caso do CAGED. 
Limitações da RAIS e CAGED
 Omissão de declaração dos estabelecimentos e erro de preenchimento. 
Explorando algumas bases de governo federal – Cadastros e 
registros administrativos
Previdência
Dados Agregados BI
Microdados
Público Sigiloso
Boletim Estatístico da Previdência Social – BEPS
Infologo
N/D Maciça
Anuário Estatístico da Previdência Social – AEPS N/D CNIS
Previdência Social (Regime Geral / INSS): inclui grandes números da Previdência Social, tais como quantitativo de 
benefícios concedidos, dados do atendimento do INSS, arrecadação previdenciária, valores pagos aos beneficiários, entre 
outros.
Previdência no Serviço Público (Regimes Próprios / RPPS): inclui informações relativas aos RPPS, provenientes do Sistema 
de Informações dos Regimes Públicos de Previdência Social – CADPREV.
Previdência Complementar: inclui informações sobre as Entidades Fechadas de Previdência Complementar (EFPC) e seus 
planos de benefícios.
Saúde e Segurança do Trabalhador: inclui informações sobre acidentes de trabalho, benefícios por incapacidade e motivos 
de afastamento do trabalho.
Nota: Atentar para diferença entre benefícios e beneficiários na análise das estatísticas da Previdência Social. 
Explorando algumas bases de governo federal – Cadastros e 
registros administrativos
Portal da transparência (download de microdados)
• Bolsa Família – Pagamentos e Saques. Contém o valor da parcela paga ou sacada e o mês de referência. 
Identificador: NIS e Nome
• Seguro Defeso Pescador Artesanal – Contém, entre outros, nome do município; portaria defeso ibama; data 
início e fim defeso; data emissão parcela; número parcela; data saque parcela; valor parcela; data 
restituição. Identificador: CPF camuflado, PIS e nome
• Servidores Civis e Militares do Executivo Federal. Identificador: CPF camuflado e nome
o Cadastro – Dados como cargo; função; órgão de lotação e órgão de exercício; tipo esituação de vínculo; regime 
jurídico; data de ingresso e nomeação, etc;
o Remuneração – remunerações, gratificações, verbas indenizatórias, férias, deduções;
o Observações – demais observações como: serviço no exterior, valores incluídos na remuneração, etc;
o Honorários (Jetons) – empresa e valores recebidos
o Honorários Advocatícios – valores recebidos
o Afastamentos – data de início e fim de afastamentos
Explorando algumas bases de governo federal – Cadastros e 
registros administrativos
Pesquisa Nacional por Amostra de 
Domicílios - PNAD
Pesquisa Nacional por Amostra de Domicílios - PNAD
• Apresentação
• Histórico
• Estruturação
• Pesquisa Básica
• Pesquisas Suplementares
• Pesquisas Especiais
• Microdados
• Alguns conceitos importantes
• Apresentação
A pesquisa era realizada por uma amostra probabilística de domicílios. As 
informações eram prestadas por pessoa moradora ou não moradora, 
considerada apta a prestar informação para o conjunto de moradores e pelo 
domicílio. O entrevistador era orientado a não aceitar como informante uma 
pessoa menor de 14 anos de idade. 
Temas investigados
o Características da habitação 
o Características demográficas gerais 
o Características de migração
o Características de fecundidade feminina
o Características de educação
o Características de trabalho e rendimento
Pesquisa Nacional por Amostra de Domicílios - PNAD
• Histórico – abrangência
1967 1968-1972 1973-1979
Início da PNAD. A coleta de 
informações começa nos 
antigos Estados da Guanabara 
e Rio de Janeiro, tendo sua 
abrangência paulatinamente 
expandida.
Até o fim de 1968, a pesquisa 
já abrangia todos os estados 
das Regiões Nordeste, Sudeste 
e Sul, além do Distrito Federal, 
alcançando cerca de 92% da 
população brasileira.
Expansão da cobertura 
territorial da PNAD, que 
passa a alcançar as áreas 
urbanas das Regiões Norte 
e Centro-Oeste.
Ampliação da abrangência 
territorial da PNAD, que 
passava a alcançar as áreas 
rurais da Região Centro-Oeste. 
Somente as áreas rurais da 
Região Norte permaneciam de 
fora da amostragem.
Manutenção da abrangência 
territorial da PNAD.
Expansão da abrangência 
territorial da PNAD, que 
passa também a 
investigar as áreas rurais 
da Região Norte, cobrindo 
todo o Território 
Nacional.
A PNAD sofreu algumas interrupções, como nos anos em que ocorreu o Censo Demográfico.
Pesquisa Nacional por Amostra de Domicílios - PNAD
1981-1990 1992-2003 2004-2015
• Histórico – Populações abrangidas nos temas básicos da 
PNAD - 1967/2015
Para mais informações, consultar: https://biblioteca.ibge.gov.br/visualizacao/livros/liv94878.pdf
Pesquisa Nacional por Amostra de Domicílios - PNAD
• Estruturação
Pesquisa Básica
destina-se a investigar, de forma contínua, os temas definidos como de maior importância para medir o nível e 
acompanhar a evolução socioeconômica da população do País. 
Pesquisas Suplementares
destinam-se a aprofundar os temas permanentes e investigar outros assuntos de interesse que se interliguem 
com os da Pesquisa Básica. 
Ex.: Trabalho infantil, Segurança alimentar, Vitimização e Justiça, etc.
Pesquisas Especiais
destinam-se a tratar de assuntos de maior complexidade, que exigem tratamento à parte da Pesquisa Básica, 
podendo até requerer um esquema de amostragem distinto. 
Ex.: Tabagismo (2008)
Pesquisa Nacional por Amostra de Domicílios - PNAD
• Microdados
O IBGE disponibiliza para download os microdados das PNADs de 2001 a 2015. 
Os arquivos disponibilizados são:
- Dados – Microdados em txt de pessoas e domicílios
- Dicionários e input – Dicionários de variáveis e leitura em SAS dos arquivos
- Leitura em R
- Marca de imputação - Indicação de dados imputados
- Metodologia – Texto metodológico sobre a Pesquisa e anexos
- Questionário
Pesquisa Nacional por Amostra de Domicílios - PNAD
• Microdados
Arquivo de domicílios Arquivo de pessoas
Cada linha se refere a um domicílio. O quanto cada 
domicílio representa na amostra encontra-se na 
variável de peso do domicílio, que é igual ao peso da 
pessoa de referência do domicílio.
Cada linha se refere a uma pessoa. O quanto cada pessoa 
representa na amostra encontra-se na variável de peso da 
pessoa.
Domicílio
Pesquisa Nacional por Amostra de Domicílios - PNAD
• Microdados
Arquivo de pessoas - 2015
Arquivo de pessoas estruturado após 
leitura por software de análise dados
Pesquisa Nacional por Amostra de Domicílios - PNAD
• Alguns conceitos importantes
Datas e Períodos de Referência (encontra-se no arquivo de 
metodologia), exemplo de 2015:
Data de referência - Foi o dia 26 de setembro de 2015.
Semana de referência - Foi a semana de 20 a 26 de setembro 
de 2015.
Mês de referência - Foi setembro de 2015.
Obs.: Relevante para fins de deflacionamento de rendimentos 
monetários, por exemplo.
Pesquisa Nacional por Amostra de Domicílios - PNAD
• Alguns conceitos importantes
Domicílio
Local de moradia estruturalmente separado e independente, constituído por um ou mais cômodos.
Separação - limitado por paredes, muros, cercas etc., coberto por um teto, e permite que seus moradores se 
isolem, arcando com parte ou todas as suas despesas de alimentação ou moradia.
Independência - acesso direto, moradores podem entrar e sair sem passar por local de moradia de outras 
pessoas.
Domicílios particulares - quando destinados à habitação de uma pessoa ou de um grupo de pessoas cujo 
relacionamento é ditado por laços de parentesco, dependência doméstica ou, ainda, normas de convivência.
Domicílios coletivos - quando destinados à habitação de pessoas em cujo relacionamento prevalecesse o 
cumprimento de normas administrativas, como hotéis, pensões, orfanatos, asilos, casas de detenção, 
quartéis, hospitais etc.
Pesquisa Nacional por Amostra de Domicílios - PNAD
• Alguns conceitos importantes
Espécie do Domicílio
Permanente - Para o domicílio localizado em casa, apartamento ou cômodo e 
destinado à moradia; 
Improvisado - Para o domicílio localizado em unidade que não tivesse dependência 
destinada exclusivamente à moradia, tal como: loja, sala comercial etc. Assim 
também foi considerado o prédio em construção, embarcação, carroça, vagão, tenda, 
barraca, gruta etc., que estivesse servindo de moradia.
Pesquisa Nacional por Amostra de Domicílios - PNAD
• Alguns conceitos importantes
Família
Conjunto de pessoas ligadas por laços de parentesco, dependência 
doméstica ou normas de convivência, que residissem na mesma unidade 
domiciliar e, também, a pessoa que morasse só em uma unidade domiciliar.
Condição na Unidade Domiciliar e na Família
Dentro de cada unidade domiciliar e de cada família, as pessoas foram 
classificadas em função da relação com a pessoa de referência ou com o 
seu cônjuge
Pesquisa Nacional por Amostra de Domicílios - PNAD
• Alguns conceitos importantes
Estudante
Pessoa que frequentava curso de ensino regular (fundamental, ensino médio, primeiro 
grau, segundo grau ou superior de graduação), de mestrado ou doutorado, pré-escolar, 
alfabetização de jovens e adultos, educação de jovens e adultos ou supletivo ministrado 
em escola, ou pré-vestibular. 
Não é classificada como estudante a pessoa que frequentava somente: curso sequencial 
de educação superior; curso de especialização profissional; curso de extensão cultural 
(idioma, costura, datilografia etc.); ou curso de educação de jovens e adultos ou 
supletivo por meio de rádio, televisão ou correspondência. 
Pesquisa Nacional por Amostra de Domicílios - PNAD
• Alguns conceitos importantes
Trabalho
Considera-se como trabalho em atividade econômica o exercício de:
a) Ocupação remunerada em dinheiro, produtos, mercadorias ou benefícios (moradia, alimentação,roupas 
etc.) na produção de bens e serviços;
b) Ocupação remunerada em dinheiro ou benefícios (moradia, alimentação, roupas etc.) no serviço 
doméstico;
c) Ocupação sem remuneração na produção de bens e serviços, desenvolvida durante pelo menos uma 
hora na semana:
- em ajuda a membro da unidade domiciliar que tivesse trabalho como: empregado na produção de bens 
primários (que compreende as atividades da agricultura, silvicultura, pecuária, extração vegetal ou 
mineral, caça, pesca e piscicultura), conta própria ou empregador;
- em ajuda a instituição religiosa, beneficente ou de cooperativismo; ou
- como aprendiz ou estagiário; ou
Pesquisa Nacional por Amostra de Domicílios - PNAD
• Alguns conceitos importantes
Trabalho Continuação...
d) Ocupação desenvolvida, durante pelo menos uma hora na semana:
- na produção de bens, do ramo que compreende as atividades da agricultura, silvicultura, pecuária, 
extração vegetal, pesca e piscicultura, destinados à própria alimentação de pelo menos um membro da 
unidade domiciliar; ou
- na construção de edificações, estradas privativas, poços e outras benfeitorias (exceto as obras destinadas 
unicamente à reforma) para o próprio uso de pelo menos um membro da unidade domiciliar.
Portanto, no conceito de trabalho caracterizam-se as condições de:
- Trabalho remunerado (itens a e b);
- Trabalho não remunerado (item c); e
- Trabalho na produção para o próprio consumo ou na construção para o próprio uso (item d).
Pesquisa Nacional por Amostra de Domicílios - PNAD
• Alguns conceitos importantes
Rendimento Mensal Familiar
Soma dos rendimentos mensais dos componentes da família, exclusive os das pessoas de menos de 10 anos 
de idade e os daquelas cuja condição na família fosse pensionista, empregado doméstico ou parente do 
empregado doméstico.
Rendimento Mensal Domiciliar
Soma dos rendimentos mensais dos moradores da unidade domiciliar, exclusive os das pessoas de menos 
de 10 anos de idade e os daquelas cuja condição na unidade domiciliar fosse pensionista, empregado 
doméstico ou parente do empregado doméstico.
Rendimento Mensal Domiciliar per Capita
Divisão do rendimento mensal domiciliar pelo número de membros da unidade domiciliar, exclusive 
aqueles cuja condição na unidade domiciliar fosse pensionista, empregado doméstico ou parente do 
empregado doméstico.
Pesquisa Nacional por Amostra de Domicílios - PNAD
Pesquisa Nacional por Amostra de 
Domicílios Contínua - PNADC
• Apresentação
• Sistema Integrado de Pesquisas Domiciliares - SIPD
• Estruturação
• Pesquisa Básica
• Pesquisas Suplementares
• Pesquisas Especiais
• Microdados
• Diferenças entre PME, PNAD e PNAD Contínua
Pesquisa Nacional por Amostra de 
Domicílios Contínua - PNADC
As reformulações metodológicas e de abrangência das principais pesquisas domiciliares 
do IBGE, como a PNAD, a PME, a POF e a Pesquisa da Economia Informal Urbana (ECINF) 
sempre ocorreram isoladamente. Desta forma, estas pesquisas apresentavam distinções 
entre conceitos, instrumentos de coleta, processos de crítica de dados, cadastros, 
infraestrutura amostral, etc..
O SIPD Constitui em um modelo de produção de pesquisas amostrais domiciliares no 
qual, ao contrário do que ocorria anteriormente:
• o planejamento, a execução, a análise e a disseminação dos resultados, das 
principais pesquisas domiciliares do IBGE serão conduzidos de forma associada, 
facilitando o atendimento de novas demandas bem como otimizando os recursos a 
serem utilizados. 
Sistema Integrado de Pesquisas Domiciliares - SIPD
A implementação do SIPD significa a adoção de cadastros de 
seleção compartilhados (Cadastro Mestre) e de desenhos de 
amostras compartilhados (Amostra Mestra), a harmonização de 
conceitos, de variáveis e de classificações nas diversas 
investigações componentes do sistema, a padronização dos 
processos de crítica, de imputação, e de tabulação, além da 
ampliação da utilização de tecnologias de captura de dados.
Sistema Integrado de Pesquisas Domiciliares - SIPD
Corresponde a um conjunto de unidades de área selecionadas de um 
cadastro, segundo um método probabilístico de seleção de forma que seja 
possível selecionar subamostras para as diversas pesquisas.
• A amostra de cada uma das pesquisas do SIPD corresponderá a uma parte 
ou a integralidade de uma amostra mestra, e os conceitos e processos 
serão harmonizados.
• Em relação a PNAD, a PNAD Contínua permite um ganho considerável na 
precisão das estimativas, especialmente nas áreas rurais.
• Amostra mestra
Sistema Integrado de Pesquisas Domiciliares - SIPD
São componentes do SIPD
• a PNAD Contínua, pesquisa que resulta da integração da 
Pesquisa Nacional por Amostra de Domicílios e da Pesquisa 
Mensal de Emprego e o 
• esquema de realização anual de Pesquisas de Orçamentos 
Familiares. 
Sistema Integrado de Pesquisas Domiciliares - SIPD
• A PNAD Contínua substitui a Pesquisa Mensal de Emprego (PME) e a 
Pesquisa Nacional por Amostra de Domicílios (PNAD), potencializando os 
resultados produzidos por ambas, agregando, em relação à primeira, a 
cobertura do território nacional, e em relação à segunda, a 
disponibilização de informações sobre trabalho com periodicidade de 
divulgação que permite a análise conjuntural do tema.
• A PNAD Contínua propicia, mesmo em relação à PNAD anual, uma 
cobertura territorial mais abrangente.
Pesquisa Nacional por Amostra de Domicílios Contínua
PNAD
PME
PNAD 
Contínua
• Mensalmente - indicadores de divulgação mensal de mercado de trabalho para o nível Brasil
- PME - produzia indicadores mensais sobre força de trabalho apenas para as seis principais regiões 
metropolitanas investigadas pela PME, ou seja, para o Rio de Janeiro, São Paulo, Belo Horizonte, 
Recife, Salvador e Porto Alegre. A informação nacional sobre este tema era investigada apenas 
anualmente, através da PNAD, não possuindo, portanto, o caráter de acompanhamento 
conjuntural.
Pesquisa Nacional por Amostra de Domicílios Contínua
• Periodicidade
Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez
3º Trim 4º Trim
Ano
1º Trim 2º Trim
• Anualmente - Temas estruturais, tais como educação, migração e trabalho infantil.
- dados sobre consumo e orçamentos familiares eram produzidos a cada 5 anos (POF)
• Trimestralmente – Indicadores conjunturais de mercado de trabalho.
 Além disso, temas suplementares poderão ser investigados e divulgados com outra 
periodicidade.
Pesquisa Nacional por Amostra de Domicílios Contínua
• Composição
•sexo, cor ou raça, idade, 
composição do domicílio e nível 
de instrução
Núcleo Básico 
do SIPD
•Trabalho e Rendimento
Objetivo 
específico da 
pesquisa
•Ex.: Habitação, Educação, 
Migração, Fecundidade
Suplementos 
/ Módulos
Parte conjuntural 
da PNAD Contínua
Parte estrutural 
da PNAD Contínua
Investigadas em todos os 
domicílios, em todas as 
entrevistas (1 a 5), 
abrangendo todas as 
periodicidades.
investigados apenas em 
uma parte da amostra a 
cada trimestre e 
acumulados para 
garantir um resultado 
anual.
Presente em todas 
pesquisas do SIPD
A1 A2 A3 A4 A5 A6 A7 A8 A9 A10 A11 A12 A13 A14 A15 B1 B2 B3 B4 B5 B6 B7 B8 B9 B10 B11 B12
jan/16 5 4 3 2 1
fev/16 5 4 3 2 1
mar/16 5 4 3 2 1
abr/16 5 4 3 2 1
mai/16 5 4 3 2 1
jun/16 5 4 3 2 1
jul/16 5 4 3 2 1
ago/16 5 4 3 2 1
set/16 5 4 3 2 1
out/16 5 4 3 2 1
nov/16 5 4 3 2 1
dez/16 5 4 3 2 1
jan/17 5 4 3 2 1
fev/17 5 4 3 2 1
mar/17 5 4 3 2 1
Mês
Grupos de rotação de domicílios
Pesquisa Nacional por Amostra de Domicílios Contínua
• Rotação da amostra
 Mês: um domicílio é pesquisado uma vez no mês, fica fora dois meses, volta a ser pesquisado 
no 4º mês, fica fora outros 2 meses, repetindo esse esquema 5 vezes.
 Trimestre:o domicílio é pesquisado uma vez no trimestre e permanece na pesquisa por 5 
trimestres consecutivos, com 2 meses de intervalo entre as entrevistas.
Por trimestre 
• 3.464 municípios
• 211.344 domicílios
• Abrangência – até municípios 
de capitais
80% dos domicílios 
são repetidos a cada 
trimestre
Pesquisa Nacional por Amostra de Domicílios Contínua
• Módulos temáticos 2016
Entrevista Tema 1º trimestre 2º trimestre 3º trimestre 4º trimestre
1ª entrevista
Parte conjuntural + 
Mercado de trabalho - perguntas adicionais
Características dos domicílios
Rendimentos de outras fontes - Rendimento Domiciliar
2ª entrevista Parte conjuntural
3ª entrevista Parte conjuntural
4ª entrevista Parte conjuntural
5ª entrevista
Parte conjuntural +
Rendimentos de outras fontes - Rendimento Domiciliar
Trabalho Infantil
Outras Formas de Trabalho
Par
te c
onj
unt
ura
l +
Per
gun
tas
 ad
icio
nai
s de
 Ed
uca
ção
Par
te c
onj
unt
ura
l +
Ace
sso
 à In
ter
net
 e à
 tel
evi
são
 e p
oss
e d
e te
lefo
ne 
mó
vel
 
cel
ula
r pa
ra u
so p
ess
oal
Par
te c
onj
unt
ura
l
Par
te c
onj
unt
ura
l
Parte conjuntural – Disponível trimestralmente e anualmente:
Características Gerais dos Moradores
Características de educação para os moradores de 5 anos ou mais de idade
Características de trabalho das pessoas de 14 anos ou mais de idade - Conjuntural
Pesquisa Nacional por Amostra de Domicílios Contínua
• Módulos temáticos 2016
Possibilidade de inserir novos módulos 
temáticos/suplementos
Entrevista Tema 1º trimestre 2º trimestre 3º trimestre 4º trimestre
1ª entrevista
Parte conjuntural + 
Mercado de trabalho - perguntas adicionais
Características dos domicílios
Rendimentos de outras fontes - Rendimento Domiciliar
2ª entrevista Parte conjuntural
3ª entrevista Parte conjuntural
4ª entrevista Parte conjuntural
5ª entrevista
Parte conjuntural +
Rendimentos de outras fontes - Rendimento Domiciliar
Trabalho Infantil
Outras Formas de Trabalho
Par
te c
onj
unt
ura
l +
Per
gun
tas
 ad
icio
nai
s de
 Ed
uca
ção
Par
te c
onj
unt
ura
l +
Ace
sso
 à In
ter
net
 e à
 tel
evi
são
 e p
oss
e d
e te
lefo
ne 
mó
vel
 
cel
ula
r pa
ra u
so p
ess
oal
Par
te c
onj
unt
ura
l
Par
te c
onj
unt
ura
l
Pesquisa Nacional por Amostra de Domicílios Contínua
• Módulos temáticos 2016
Exemplo: Outras formas de trabalho
Os indicadores se referem às pessoas de 14 anos ou mais de idade, independente da 
situação na ocupação.
Abrange os seguintes indicadores:
Produção para o 
próprio consumo
Afazeres domésticos
Cuidado de pessoas Trabalho voluntário
Pesquisa Nacional por Amostra de Domicílios Contínua
• Diferenças entre PME, PNAD e PNAD Contínua
PME PNAD PNAD CONTINUA
Abrangência de 
coleta da 
informação
Área urbana de 6 Regiões 
Metropolitanas (Recife, Salvador, Belo 
Horizonte, Rio Janeiro, São Paulo, Porto 
Alegre) - (Amostra de 145 municípios)
Nacional (Amostra de 1100 municípios) Nacional (Amostra de 3500 municípios)
Abrangência de 
divulgação dos 
resultados
Conjunto das seis Regiões 
Metropolitanas e cada uma das seis 
Regiões Metropolitanas separadamente
Brasil, Grandes Regiões, Unidades da 
Federação e 9 Regiões Metropolitanas 
(Belém, Recife, Salvador, Belo Horizonte, Rio 
Janeiro, São Paulo, Curitiba e Porto Alegre )
Brasil, Grandes Regiões, Unidades da 
Federação, Regiões Metropolitanas que 
incluem os municípios das capitais e 
Municípios das capitais
Periodicidade Mensal Anual
Trimestral, Anual e Mensal, por meio de 
trimestres móveis, para um conjunto
restrito de indicadores de trabalho para 
Brasil.
Semana de 
referência
Semana imediatamente anterior à 
definida como de entrevista
Última semana completa de setembro.
Semana imediatamente anterior à 
definida como de entrevista.
Pesquisa Nacional por Amostra de Domicílios Contínua
PME PNAD PNAD CONTINUA
População Investigada para o tema trabalho Pessoas de 10 anos ou mais de idade Pessoas de 10 anos ou mais de idade Pessoas de 14 anos ou mais de idade
em dinheiro, produtos, mercadorias ou 
benefícios (moradia, alimentação, etc.) 
 desenvolvido durante pelo menos uma hora na 
semana
sem restrições ao número de horas trabalhadas 
na semana
desenvolvido durante pelo menos uma hora na 
semana
2.1 em ajuda a membro da unidade domiciliar 
que era conta própria ou empregador.
Considera como ocupada Considera como ocupada Considera como ocupada
2.2 em ajuda a membro da unidade domiciliar 
que era empregado
Considera como ocupada
Considera como ocupada apenas aquela: na 
produção de bens primários (ex. agricultura)
Considera como ocupada
2.3 em ajuda a instituição religiosa, 
beneficente ou de cooperativismo
Não considera como ocupada Considera como ocupada Não considera como ocupada
2.4 como aprendiz ou estagiário
Considera como empregado remunerado em 
benefícios
Considera como não remunerado
Considera como empregado remunerado em 
benefícios
3. 1 Trabalho na produção para o próprio 
consumo
Não considera como ocupada
Na produção de bens destinados 
exclusivamente à própria alimentação de pelo 
menos um membro da unidade domiciliar.
Não considera como ocupada
3.2 Na construção para o próprio uso Não considera como ocupada
Na construção de benfeitorias (exceto obras 
destinadas unicamente à reforma) para o 
próprio uso de pelo menos um membro da 
unidade domiciliar.
Não considera como ocupada
Há algumas restrições quanto ao tempo de 
afastamento para considerar a pessoa como 
ocupada
Não há restrição alguma quanto ao tempo de 
afastamento para considerar a pessoa como 
ocupada
Há algumas restrições quanto ao tempo de 
afastamento para considerar a pessoa como 
ocupada
3. Trabalho na produção para o próprio consumo ou na construção para o próprio uso (desenvolvido durante pelo menos uma hora na semana)
4 Pessoa que, na semana de referência, tinha trabalho remunerado do qual estava afastada
Pessoa que na semana de referência trabalhou em:
1.Trabalho Remunerado
2. Trabalho Sem Remuneração (desenvolvido durante pelo menos uma hora na semana)
• Diferenças entre PME, PNAD e PNAD Contínua - Ocupados
Pesquisa Nacional por Amostra de Domicílios Contínua
PME PNAD PNAD CONTINUA
a) na semana de referência, estava sem 
trabalho;
a) na semana de referência, estava sem 
trabalho; e
a) na semana de referência, estava sem 
trabalho;
b) estava disponível para assumir um 
trabalho na semana de referência; e
-
b) estava disponível para assumir um 
trabalho na semana de referência;
c) no período de referência de 30 dias, havia 
tomado alguma providência efetiva para 
conseguir trabalho, sem ter tido qualquer 
trabalho ou após ter saído do
último trabalho que teve neste período.
b) na semana de referência, havia tomado 
alguma providência efetiva para conseguir 
trabalho.
c) no período de referência de 30 dias, havia 
tomado alguma providência efetiva para 
conseguir trabalho; e
d) inclui, também, a pessoa, sem trabalho e 
disponível para trabalhar na semana de 
referência, que não havia tomado qualquer 
providência para conseguir trabalho no 
período de referência de 30 dias por já ter 
conseguido trabalho para começar após a 
semana de referência.
• Diferenças entre PME, PNAD e PNAD Contínua - Desocupados
Introdução ao cruzamento de dados
•Desafios na análise dados
Cadastros e registros administrativos
•Principais desafios do cruzamento de dados de registrosadministrativos:
Escolha das chaves 
Ausência de informação sobre a base de dados
Ausência de informação de campos na base de dados
Qualidade dos dados
Tratamento de dados – registros duplicados
Características especiais
Escolha do método
Análise do resultado
Escolha das chaves
• Não é uma tarefa 
simples 
Ex.: Mesmo que bata informação de CPF, haverá casos 
em que o nome é diferente, ou bate nome e CPF, mas 
a data de nascimento e o nome da mãe são diferentes.
Principais desafios do cruzamento de dados de 
registros administrativos
• É preciso conhecer as bases de dados
o Exemplo: vários benefícios para a mesma pessoa -> vários registros para a mesma pessoa
• É preciso saber como estão preenchidas as informações
o Exemplo: determinado campo só é preenchido para determinadas pessoas, benefícios, etc.
• Cuidado para não criar elos errados
• Regras de Localização e Unicidade
o Como localizar uma pessoa de uma base de dados em outra base de dados e ter certeza de que é a 
mesma pessoa?
o A eficiência da Regra de Localização e Unicidade está diretamente ligada à qualidade dos dados 
inseridos na base pelos usuários.
• Avaliação de Unicidade: rotina sistêmica, composta por um conjunto de critérios e regras, 
que possibilita a comparação de dados cadastrais da pessoa e a verificação de equivalência 
entre os registros avaliados, com a finalidade de confirmar se pertencem ou não a um 
mesmo titular.
Principais desafios do cruzamento de dados de registros 
administrativos
Escolha das chaves
Escolha das chaves 
• Regras de Localização e Unicidade - Matriz de Avaliação –
Exemplo do Cadastro NIS/CAIXA
Unicidade Cadastral
Coincidência de:
• 1 forma fonética do 
nome na Árvore de 
Decisão
+
• 2 ou + atributos da 
Matriz de Decisão
+
• utilização dos atributos 
complementares, 
quando necessário.
Árvore de Decisão Matriz de Decisão Matriz de Comparação
NIS Informado Atributos Prioritários Atributos de Complementares
Nome da Pessoa UF S UF S
1
Fonético 
Completo
1 CPF - - 1 Nome do Pai - -
2
Fonético 
Abreviado
2 Título de Eleitor - - 2
Município 
Nascimento
- -
3
Fonético Primeiro 
e Último
3 Carteira de Trabalho S 3 UF de Nascimento - -
4
Fonético Primeiro 
Nome
4 Identidade S S 4
Certidão Casamento
Certidão de Óbito
Certidão do Índio
S -
5
Certidão de 
Nascimento
S 5 Passaporte - -
6 Data de Nascimento - 6 Portaria Naturalização - -
7 Nome da Mãe - -
Ausência de informação sobre a base de dados
Em geral, o acesso as bases de dados não vem acompanhado de 
documentos como layout, dicionário de dados, descrição das variáveis, etc.
Importante:
Contato com responsáveis pela base de dados
Conhecer forma de inserção das informações na base de dados
Exemplos:
Ausência de informação sobre a base de dados
Ausência de informação de campos na base de dados
Exemplo: Registros de pensionistas do Siape, cruzamento com dados do CPF e BPC (CPF como chave primária)*
A ausência de informação dificulta a identificação da pessoa, gera dúvidas quanto a qualidade da base e pode atrapalhar a 
conclusão dos resultados.
*dados alterados para preservar o sigilo das informações
Qualidade dos dados
Exemplo: Registros do SDPA com problemas, cruzamento com dados do CPF (CPF como chave primária)*
*dados alterados para preservar o sigilo das informações
Informações incorretas:
• Nem sempre o documento informado pertence a própria pessoa;
• Grafias diversas dos nomes, (erro de digitação); 
• Dados pessoais divergentes;
• Alterações de nomes não refletidas em todas as bases de dados; etc.
nomerequerente_SDPA nom_contribuinte_CPF nomemaerequerente_SDPA nom_mae_CPF dt_nasc_sdpa dt_nasc_cpf
ERISVALDO FRAZAO COSTA ELISVALDO FRAZAO COSTA MARIA POMPEU DOS SANTOS MARIA CARLIZA DE OLIVEIRA 19810906 19800906
JACINILDE BELO NOGUEIRA JACILEIDE BELO FERREIRA LAURA GOMES DE SENA LAURA GOMES DE SENA 19750806 19750906
ALUIZIO SOBRINHO DE OLIVEIRA ALUISIO SOBRINHO DE OLIVEIRA ROZALIA FERREIRA MAFRA ROSALIA FERREIRA MAFRA 19630331 19630313
MARTILIANE DO SOCORRO DOS SANTOS BACE MARTIANE DO SOCORRO DOS SANTOS BACELAR MARIA DA GLORIA FRAZAO COSTA MARIA DA GLORIA FRAZAO COSTA 19701110 19721210
ROSILENE POMEU DOS SANTOS LENALDO DIAS DOS SANTOS NULL ANTONIA PAVAO 19780314 19841112
ZACARIAS FURTADO MARQUES ADEMIR MACHADO COSTA VALDIRENE DE JESUS CORDEIRA PESSOA CATARINA PAIM DE SOUZA 19830730 19861028
BRAZ MARINHO MAFRA BRAS MARINHO MAFRA MARIA IRACI SOBRINHO DE OLIVEIRA MARIA IRACI SOBRINHO DE OLIVEIRA 19901026 19900402
GUSTAVO FELIPE SARGES RAMOS CRISTIANA DA SILVA DIAS MARIA DOLORES DOS SANTOS FURTADO MARIA MACHADO COSTA 19900712 19560303
EDIVALDO GOMES DA SILVA EDVALDO GOMES DA SILVA GREGORIA BELO NOGUEIRA GREGORIA PEREIRA BELO 19570604 19570704
EDICLEIDE PESSOA FERREIRA MARIA DA SILVA MARIA DAS GRACAS SARGES RAMOS LUZIA DE JESUS DA SILVA DIAS 19770414 19650223
LAERCIO GONCALVES BENASSULI LAELCIO GONCALVES BENASSULI MARIA ONEIDE PEREIRA DOS SANTOS MARIA ONEIDE PEREIRA DOS SANTOS 19580513 19570513
Provável alteração de nome por casamento, não 
atualizada em um dos cadastros
Registros duplicados
Antes de cruzar os dados de uma tabela com outra, os dados 
duplicados devem ser tratados.
Exemplo: Registros duplicados do BPC, cruzamento com dados do CPF (CPF como chave primária)*
*dados alterados para preservar o sigilo das informações
CPF (fictício) nom_Maciça nom_CPF nom_mae_Maciça nom_mae CPF dt_nasc_Maciça dt_nasc_CPF
14704280114 JORGE HENRIQUE FREITAS DA SILVA JORGE HENRIQUE FREITAS DA SILVA MARIA DO SOCORRO DA SILVA MARIA RODRIGUES DA SILVA 21/10/1994 21/10/1994
14704280114 JORGE HENRIQUE FREITAS DA SILVA JORGE HENRIQUE FREITAS DA SILVA MARIA RODRIGUES DA SILVA MARIA RODRIGUES DA SILVA 21/10/1994 21/10/1994
1590510777 RAFAELA BERNARDES PEREIRA RAFAELA BERNARDES PEREIRA ROSILANE BERNARDES CABRAL ROSILANE BERNARDES CABRAL 03/05/1948 03/05/1948
1590510777 RAFAELA BERNARDES PEREIRA RAFAELA BERNARDES PEREIRA ROSILANE BERNARDES CABRAL ROSILANE BERNARDES CABRAL 03/05/1948 03/05/1948
4469464605 NATALIA SOARES A SILVA NATALIA SOARES DA SILVA AMARILDA ROSANGELA S DA SILVA AMARILDA ROSANGELA SOARES DA SILVA 14/12/1945 14/12/1945
4469464605 NATALIA SOARES DA SILVA NATALIA SOARES DA SILVA AMARILDA ROSANGELA S DA SILVA AMARILDA ROSANGELA SOARES DA SILVA 14/12/1945 14/12/1945
14891035416 JOSE CARLOS DE OLIVEIRA JOSE CARLOS DE OLIVEIRA ANTONIA GARCEZ DE OLIVEIRA ANNA MARIA DE OLIVEIRA 29/07/1998 29/07/1998
14891035416 JOSE CARLOS DE OLIVEIRA JOSE CARLOS DE OLIVEIRA FRANCISCA CORREIA DA SILVA ANNA MARIA DE OLIVEIRA 29/07/1998 29/07/1998
176626130 IVANILDA NEVES DA SILVA IVANILDA NEVES DA SILVA NOEMIA NEVES DOS SANTOS NOEMIA NEVES DOS SANTOS 03/07/1999 03/07/1999
176626130 MARIA DA CONCEICAO NEVES DA SILVA IVANILDA NEVES DA SILVA IVANILDA NEVES DA SILVA NOEMIA NEVES DOS SANTOS 03/07/1999 03/07/1999
1928672781 JUNIOR SANTOS CERQUEIRA JUNIOR DOS SANTOS CERQUEIRA LUZIA RODRIGUES DE JESUS LUZIA RODRIGUES DE JESUS 20/09/2001 20/09/2001
1928672781 JUNIOR SANTOS CERQUEIRA JUNIOR DOS SANTOS CERQUEIRA LUZIA RODRIGUES DE JESUS LUZIA RODRIGUES DE JESUS 20/09/2001 20/09/2001
2361365601 EUNICE CUNHA DE SOUZA EUNICE CUNHA DE SOUZA ALMERINDA CARIUS DA CUNHA ALMERINDA CARIUS DA CUNHA 03/10/1942 03/10/1942
2361365601 EUNICE CUNHA SOUZA EUNICE CUNHA DE SOUZA ALMERINDA CARMO DA CUNHA ALMERINDA CARIUS DA CUNHA 03/10/1942 03/10/1942
16391800366 MARIA NILZA DE ANDRADE MARIA NILZA DE ANDRADE ELIZABETE DOS SANTOS PEREIRA ELIZABETE DOS SANTOS PEREIRA 18/11/1961 18/11/1961
16391800366 MARIA NILZA DE ANDRADE MARIA NILZA DE ANDRADE ELIZABETE DOS SANTOS PEREIRA ELIZABETE DOS SANTOS PEREIRA 18/11/1961 18/11/1961
753899461 LUIZA GOMES DE OLIVEIRA LUIZA GOMES BARBOSA ADRIANA DE JESUS FREITAS ADRIANA DE JESUS FREITAS 20/01/1941 20/01/1941753899461 LUIZA GOMES BARBOSA LUIZA GOMES BARBOSA ADRIANA DE JESUS FREITAS ADRIANA DE JESUS FREITAS 08/09/1974 20/01/1941
Ex.: Filha cadastrada com CPF da mãe
Características especiais
Exemplo de utilização da base do CPF como referência (supondo ser mais confiável)
CPF não localizados na base da RFB
Casos com informação de óbito na base da RFB
Casos em que o CPF se encontra cancelado, suspenso ou anulado.
Situação do CPF na base da Receita Federal
o REGULAR: não há nenhuma pendência no cadastro do contribuinte.
o PENDENTE DE REGULARIZAÇÃO: o contribuinte deixou de entregar alguma Declaração do 
Imposto Renda da Pessoa Física (DIRPF) a que estava obrigado em pelo menos um dos últimos 
cinco anos.
o SUSPENSA: o cadastro do contribuinte está incorreto ou incompleto.
o CANCELADA: o CPF foi cancelado, em virtude de decisão administrativa ou judicial ou por 
falecimento do contribuinte
o NULA: foi constatada fraude na inscrição e o CPF foi anulado.
Esquema de cruzamento de dados: SIAPE X CPF X BPC
Resultados dos cruzamentos
Notas: 
Validado - Com CPF regular ou pendente de regularização na base da RFB e com informações compatíveis 
com o cadastrado no CPF (nome, nome da mãe e data de nascimento);
Não validado - Sem CPF ou CPF nulo, cancelado ou suspenso na base da RFB ou com informações 
incompatíveis com o cadastrado no CPF.
Resultado dos cruzamentos 
Tabela BPC 
4.364.500 
BPC validado BPC não validado 
3.971.373 393.127 
Tabela SIAPE_Servidor 
1.190.770 
SIAPE_Servidor validado 
196 
14 
1.190.765 
SIAPE_Servidor não validado 
 
5 
Tabela SIAPE_Pensionista 
611.033 
SIAPE_Pensionista validado 
5.520 
23 
503.945 
SIAPE_Pensionista não validado 
 
107.088 
 
• Análise tem que levar em consideração as regras dos programas:
Possibilidade de acumulação de benefícios indenizatórios
Possibilidade de trabalho de estágio
• São indícios - resultado precisa ser apurado individualmente
Resultados dos cruzamentos
Situação no SIAPE 
Categoria no BPC 
Total 
Pessoa com deficiência Idoso 
ANIST.PRIVADO L10559 3 20 23 
ANIST.PUBLICO L10559 1 5 6 
APOSENTADO 1 47 48 
ATIVO PERMANENTE 47 2 49 
CEDIDO SUS/LEI 8270 1 1 
CELETISTA/EMPREGADO 8 1 9 
CLT ANS -DEC 6657/08 1 1 2 
CONT.PROF.SUBSTITUTO 5 5 
CONTRATO TEMPORARIO 2 2 
ESTAGIARIO 51 2 53 
NOMEADO CARGO COMIS. 2 2 
REFORMA CBM / PM 4 4 
SEM VINCULO 4 2 6 
PENSIONISTA 1.640 3.903 5.543 
Total Geral 1.765 3.988 5.753 
 
Rafael Luís Giacomin
Analista de Planejamento e Orçamento
rafael.giacomin@planejamento.gov.br
XVI Semana de Administração Orçamentária, Financeira e de Contratações Públicas

Continue navegando