Baixe o app para aproveitar ainda mais
Prévia do material em texto
Oficina 002 Introdução ao manuseio de base de dados governamentais e a construção de indicadores XVI Semana de Administração Orçamentária, Financeira e de Contratações Públicas Introdução à base de dados Conceitos Passado Presente Conceitos • são um conjunto de valores ou ocorrências em um estado bruto com o qual são obtidas informações com o objetivo de adquirir benefícios¹. • Existem dois tipos de dados: estruturados e não estruturados. – Os dados estruturados, que são dados formatados, organizados em tabelas - linhas e colunas - e são facilmente processados, geralmente é utilizado um sistema gerenciador de banco de dados para armazenar esse tipo de dado, um exemplo são os dados gerados por aplicações empresariais. – Os dados não estruturados não possuem uma formatação específica e são mais difíceis de serem processados. Por exemplo, mensagens de email, imagens, documentos de texto, mensagens em redes sociais. Dados ¹SHRIVASTAVA; SOMASUNDARAM (2009). Armazenamento e Gerenciamento de Informações: Como armazenar, gerenciar e proteger informações digitais. São Paulo: Bookman. Conceitos • Descrição das componentes semânticas e sintáticas de uma informação, necessárias para sua compreensão e para o seu manuseio computacional. • Os metadados fornecem informações sobre os dados e sobre os processos de produção e uso dos dados. Metadados (dados sobre os dados) Conceitos • É uma coleção de dados inter-relacionados, representando informações sobre um domínio específico”, ou seja, sempre que for possível agrupar informações que se relacionam e tratam de um mesmo assunto, posso dizer que tenho um banco de dados¹. • São um conjunto de arquivos relacionados entre si com registros sobre pessoas, lugares ou coisas. São coleções organizadas de dados que se relacionam de forma a criar algum sentido (Informação) e dar mais eficiência durante uma pesquisa ou estudo². Banco/base de dados ¹KORTH, H.F. e SILBERSCHATZ, A.; Sistemas de Bancos de Dados, Makron Books, 2a. edição revisada, 1994. ²https://pt.wikipedia.org/wiki/Banco_de_dados Conceitos • Uma base de dados é uma coleção de dados logicamente relacionados, com algum significado. Associações aleatórias de dados não podem ser chamadas de bases de dados; • Uma base de dados é projetada, construída e preenchida com dados para um propósito específico. Ela tem um grupo de usuários e algumas aplicações pré-concebidas para atende-los; • Uma base de dados representa algum aspecto do mundo real, algumas vezes chamado de “mini-mundo”. Mudanças no mini- mundo provocam mudanças na base de dados. Banco/base de dados - Propriedades Conceitos • é um conjunto de dados dispostos em número infinito de colunas e número ilimitado de linhas (ou tuplas)¹. • As colunas são tipicamente consideradas os campos da tabela, e caracterizam os tipos de dados que deverão constar na tabela (numéricos, alfanuméricos, datas, coordenadas, etc). • O número de linhas pode ser interpretado como o número de combinações de valores dos campos da tabela, e pode conter linhas idênticas, dependendo do objetivo. A forma de referenciar inequivocamente uma única linha é através da utilização de uma chave primária. Tabelas ¹https://pt.wikipedia.org/wiki/Tabela_(banco_de_dados) Conceitos • Exemplo Tabelas Linhas Colunas Registro • Pessoa • Domicílio • Empresa • Propriedade • Turma • ... Campo/Variáveis • Atributos • Características Formatos • Sequência de caracteres • Numérico • Data Conceitos • As tabelas relacionam-se umas as outras através de chaves. • Uma chave é um conjunto de um ou mais atributos que determinam a unicidade de cada registro. Chave ¹https://pt.wikipedia.org/wiki/Banco_de_dados_relacional Conceitos • é um banco de dados que modela os dados de uma forma que eles sejam percebidos pelo usuário como tabelas, ou mais formalmente relações¹. • A arquitetura de um banco de dados relacional pode ser descrita de maneira informal ou formal. • Na descrição informal estamos preocupados com aspectos práticos da utilização e usamos os termos tabela, linha e coluna. • Na descrição formal estamos preocupados com a semântica formal do modelo e usamos termos como relação (tabela), tupla (linhas) e atributo (coluna). Banco de dados relacional ¹https://pt.wikipedia.org/wiki/Banco_de_dados_relacional Conceitos • Exemplo - PNAD Banco de dados relacional Dicionário dos dados Tabela 1 - Domicílio Tabela 2 - Pessoa Conceitos • Conjunto de programas e ferramentas utilizadas para configurar, atualizar e manter um banco de dados. Sistema de Gerenciamento de Banco de Dados (SGBD) Exemplos Cadastros e registros administrativos Tipos de bases de dados • São dados individuais (sobre pessoas, empresas, transações comerciais, etc.) produzidos por instituições (como governo e empresas) com vistas ao agir administrativo. Exemplo: SIGEPE, CADÚNICO, RAIS • Características comumente encontradas para análise de dados: – Informações sigilosas (acesso restrito) – Problemas como duplicação, ausência de informação completa, ausência de documentação – Disponibilidade em tempo real Tipos de bases de dados Censos • Tipo de levantamento que obtém informações de todas as pessoas de um grupo. Exemplo: Censo Demográfico, Censo Escolar, Censo Agropecuário • Características comumente encontradas para análise de dados: – As informações obtidas em Censos e/ou pesquisas não amostrais, para estarem conformes com a legislação, devem ser desidentificadas e tratadas em áreas suficientemente grandes para não permitirem a revelação do informante. Pesquisas econômicas apresentam elevado número de informações únicas e/ou representativas que inviabilizam a divulgação de microdados; – Bases muito grandes – Exatidão das respostas – Poucas variáveis Tipos de bases de dados Pesquisas amostrais • Levantamento que escolhe aleatoriamente algumas pessoas da população, as quais representam as respostas de um todo da população através de inferências estatísticas. Exemplo: PNAD, Pesquisa Nacional de Saúde – PNS, Pesquisas Eleitorais • Características comumente encontradas para análise de dados: – Em pesquisas amostrais é viável a disponibilização de arquivos de microdados para uso público sem comprometer o sigilo da informação, suprimindo-se as informações geográficas menores do que a das áreas de ponderação (utilizadas para expansão dos dados) – Dados já trabalhados (imputação) – Farta documentação Atualmente, há uma diversidade de cadastros e registros administrativos que não “conversam” entre si. Não há padronização, tampouco um Sistema de Interligação dos Dados Cadastrais, o que facilita fraudes e dificulta o cruzamento de informações entre os programas. O conjunto de bases de dados já disponíveis no governo, se estiverem interligados, podem se constituir em grande fonte de informação para a tomada de decisão dos gestores públicos INTEROPERABILIDADE DE BASES DE DADOS Aproveitamento do conjunto de informações disponíveis no governo para avaliação e reformulação de programas Bases com informação de renda e ocupação (Fortalecimento do CNIS) Bases com informação de educação e saúde (CENSO, SIAB, CADSUS) Bases com informação de acesso a programas e benefícios (BPC, BF e Seguro Defeso) Bases com identificação do cidadão (CPF, NIS, CNH, SIRC, SIM, SISOB) Bases com informação de bens e direitos (RENAVAM, MCMV) O que é? • É a plataforma de análise de dados do Governo que permite aos órgãos do SISP* acesso a diversas bases de dados, para a geração de informações estratégicas com a utilização de ferramentas de descobertae mineração de dados, e de análises estatísticas e cognitivas. *Sistema de Administração dos Recursos de Tecnologia da Informação Benefícios • Centralização no acesso às principais bases de dados do Governo Federal; • Tempestividade na entrega e utilização de dados; • Reuso de dados e de análises; • Custo de investimento e manutenção da infraestrutura concentrado no Serpro e Dataprev; • Solução computacionalmente eficiente para o cruzamento de grande quantidade de dados; Competências desejáveis para trabalhar com bases de dados • Habilidade com ferramentas de análise de dados • Conhecimento da política, objeto de análise • Conhecimento da base de dados que vai trabalhar e de onde encontrar dados e informações complementares Habilidade com ferramentas de análise de dados Conhecimento da política, objeto de análise • Legislação que regulamenta a política Leis Decretos Portarias Instruções normativas • Publicações • Artigos • Experiência na área (consultar quem trabalha na área) Conhecimento da base de dados que vai trabalhar • Importante ler/estudar toda a documentação, notas técnicas e dicionários das bases de dados, quando disponível Exemplo: • Quando a documentação não estiver disponível, buscar pelo questionário da pesquisa ou formulário que abastece o cadastro ou registro administrativo Onde encontrar dados e informações complementares? Fontes • Tabelas prontas Agregados (dados obtidos por estatísticas sobre os microdados) Compõem o plano de divulgação dos resultados de uma pesquisa, observando: Critérios de agregação: o Apesar dos dados serem coletados com grande precisão espacial, os dados são agregados em áreas mínimas que não permitam a revelação do informante; o São observadas as classificações utilizadas na pesquisa para que categorias de baixa frequência não levem a revelação do informante. Precisão: o A expansão de pesquisas amostrais é feita no mínimo sobre as unidades espaciais consideradas no projeto da amostra para que os valores resultantes apresentem estimativas consistentes. Índice CV (%) Brasil 0,525 1,2 Norte 0,511 1,3 Nordeste 0,522 1,3 Sudeste 0,518 2,3 Sul 0,469 1,1 Centro-Oeste 0,512 1,3 Tabela 2.3 - Índice de Gini da distribuição do rendimento mensal das pessoas de 15 anos ou mais de idade, com rendimento, segundo as Grandes Regiões, as Unidades da Federação e os Municípios das Capitais - 2016 Grandes Regiões, Unidades da Federação e Municípios das Capitais Índice de Gini Fonte: IBGE. Pesquisa Nacional por Amostra de Domicílios Contínua, 2016, consolidado de primeiras entrevistas. Nota: Exclusive as informações das pessoas sem declaração de rendimento. Onde encontrar dados e informações complementares? Fontes • Tabelas prontas Planos Tabulares – Conjunto de tabelas com informações agregadas, apresentados sob a forma de planilhas São utilizados para divulgação de resultados de pesquisas e Censos. Apresentam estrutura temática cobrindo os principais pontos de conhecimento obtido numa investigação. Apesar de abrangentes, os planos tabulares não esgotam o potencial de informação de uma investigação. Em uma investigação, apenas uma parte dos possíveis cruzamentos de dados são apresentados. A possibilidade de explorar dados não cobertos pelos planos tabulares leva os pesquisadores a demandar o acesso aos microdados. Exemplo: PNAD Contínua de educação Onde encontrar dados e informações complementares? Fontes • Ferramentas online Business Intelligence – BI Ferramenta de aceso pela internet que permite realizar algumas seleções de variáveis, realizar filtros e gerar lista e tabelas que podem ser baixadas no computador. Onde encontrar dados e informações complementares? Fontes • Microdados Arquivos que contém a menor fração de dados de pesquisas, cadastros ou registros administrativos. A partir da agregação de microdados é construída a informação. São dados característicos de unidades de uma população, como dados de indivíduos, de domicílios, de estabelecimentos etc., coletados em procedimentos administrativos, operacionais ou através de pesquisas estatísticas. As bases de microdados estão organizadas de forma a serem compreendidas por softwares específicos, o que agiliza o processo de tratamento e cálculos estatísticos. Onde encontrar dados e informações complementares? Vantagens do microdado em relação ao BI: Geralmente estão disponíveis mais variáveis que no BI Sem limitações quanto a combinações de variáveis Pode ser cruzado com outro microdado Atualização mais rápida Onde encontrar dados e informações complementares? Desvantagens do microdado em relação ao BI: Em geral, a “qualidade” do microdado é inferior ao do BI, requer limpeza e transformação É mais trabalhoso, quando não for uma tarefa rotineira Requer maior conhecimento da base de dados Por que aprender a lidar com ferramentas de análise de dados? Novas tendências em análise de dados • Big Data O termo amplamente utilizado na atualidade para nomear conjuntos de dados muito grandes ou complexos, principalmente, dados não estruturados, como logs de acesso, dados de sensores, frases escritas por funcionários e clientes, dados de redes sociais, posições geográficas, e-mails, arquivos no servidor de arquivos, entre outros. Computação cognitiva Novas tendências em análise de dados • Inteligência artificial Tecnologias cognitivas como o aprendizado de máquina (Machine Learning, ML) e aprendizado profundo (Deep Learning, DL). Máquina que consegue aprender sem o uso de um código específico - capacidade de se auto modificar e melhorar o próprio desempenho sem intervenção humana. Utilizada para gerar informações relevantes, a partir de grandes bases de dados (big data) Computação cognitiva • Acesso a tabelas prontas: Área de imprensa > Dados • Ferramenta – TabCad: dados agregados do Cadastro Único • Ferramenta - Relatórios de Informações Sociais: dados agregados • Ferramenta - VIS DATA (Visualizador de Dados Sociais) • Microdados Explorando algumas bases de governo federal – Cadastros e registros administrativos Ministério do Desenvolvimento Social e Agrário - MDS Ministério do Desenvolvimento Social e Agrário - MDS • Microdados do Cadastro Único Tipo Exemplos Acesso Cessão e/ou utilização Dados que identificam famílias e pessoas cadastradas Nome, documentos pessoais, Número de Identificação Social (NIS), Código Familiar, endereço e telefone. Sigilosos Só podem ser fornecidos para a gestão de políticas públicas e para a realização de estudos e pesquisas. Dados que caracterizam pessoas, famílias e domicílios cadastrados Características específicas do domicílio de uma família, total de membros de uma família, despesas mensais, rendimentos, escolaridade, situação no mercado de trabalho, etc. Sigilosos Só podem ser fornecidos para a gestão de políticas públicas e para a realização de estudos e pesquisas. Dados não identificados Aqueles que possam ser agregados, conformando números absolutos e porcentagens, bem como aqueles que, quando correlacionados, não identificam uma pessoa ou família. Públicos Podem ser consultados, por meio de diversas ferramentas disponibilizadas pelo MDS. Explorando algumas bases de governo federal – Cadastros e registros administrativos Saúde • Sistema de Informações de Agravos de Notificação – SINAN • Sistema de Informações de Nascidos Vivos – SINASC • Sistema de Informações de Mortalidade – SIM • Sistema de Informações Hospitalaresdo SUS – SIH/SUS • Sistema de Informações Ambulatoriais do SUS – SIA/SUS • Cadastro Nacional de Estabelecimentos de Saúde – CNES • Sistema de Cadastramento de usuários do SUS – CADSUS • Sistema de Avaliação do Programa de Imunização – PNI/API • Sistema de Informação de Atenção Básica – SIAB • Registro de Câncer de Base Populacional – RCBP • Sistema de Informações sobre Orçamentos Públicos em Saúde – SIOPS • Sistema de Informações de Beneficiários – SIB • Sistema de Cadastro de Operadoras – CADOP • Pesquisa Nacional sobre Demografia e Saúde – PNDS • Inquérito domiciliar sobre comportamento de risco e morbidade referida de doenças e agravos não transmissíveis • Vigilância de Doenças Crônicas por Inquérito Telefônico – VIGITEL Informações de Saúde (TABNET) MS não disponibiliza microdados Explorando algumas bases de governo federal – Cadastros e registros administrativos Educação Fontes INEP (microdados): • Censo Escolar – Educação Básica: Principais Variáveis: A) Escola: situação e local de funcionamento; caracterização da infraestrutura (abastecimento de água, energia elétrica, etc.); disponibilidade de equipamentos didático/pedagógicos; existência de dependências físicas; fornecimento de alimentação escolar; oferta de atendimento educacional especializado; disponibilidade de materiais didáticos de atendimento à diversidade sociocultural. B) Turma: horário de funcionamento; tipo de atendimento; existência de atividade complementar; atendimento educacional especializado; tipo de disciplinas. C) Alunos: idade; sexo; cor ou raça; uso de transporte escolar; necessidade educacional especial; rendimento escolar (aprovado/reprovado); D) Docentes: idade; sexo; cor ou raça; escolaridade; função que exerce na escola; turma que atua; disciplina que leciona; • Censo da Educação Superior: Principais variáveis: vagas, candidatos e ingressantes por área, curso, habilitação, modalidade, por turno, por tipo de processo seletivo e período; alunos matriculados; portadores de necessidades especiais; perdas de alunos; concluintes; alunos com financiamento educacional; alunos-bolsistas; servidores técnico-administrativos por grau de formação, tipo de contrato; número de docentes por grau de formação, regime de trabalho e por sexo; dados financeiros; infraestrutura e instalações, equipamentos e outros recursos institucionais Explorando algumas bases de governo federal – Cadastros e registros administrativos Educação Fontes INEP (microdados): • Exame Nacional de Desempenho dos Estudantes – ENADE: instituições, cursos e habilitações; resultados alunos; dados do questionário socioeconômico; médias e os conceitos das instituições de ensino superior. • Exame Nacional do Ensino Médio – ENEM: variáveis de controle da escola, da prova objetiva, da prova de redação; questionário socioeconômico; características da família e do trabalho do estudante; características do estudo, do estudante e seus valores. • Prova Brasil e Sistema Nacional de Avaliação da Educação Básica – SAEB*: dados da turma; dados da escola; dados da proficiência em língua portuguesa e matemática; dados do aluno; dados do professor e dados do diretor. * Prova Brasil: Censitária - Escola localizada na área urbana da rede pública SAEB: Amostragem probabilística - Escolas localizadas nas áreas urbana e rural da rede pública e da rede privada Explorando algumas bases de governo federal – Cadastros e registros administrativos Educação Fontes MEC (microdados): • FIES - Detalhamento dos financiamento a estudantes por mês, contendo UF; município; IES; curso e valor da mensalidade. Detalhamento do perfil dos beneficiários do FIES por sexo; raça/cor; data de nascimento. Sem identificador. • ProUni - Detalhamento das bolsas concedidas pelo Prouni por ano, contendo a região; UF; município; IES; curso; modalidade de ensino (presencial ou EAD); turno e tipo de bolsa. Detalhamento do perfil dos beneficiários do Prouni por sexo; raça/cor; data de nascimento e pessoas com deficiência. Identificador: CPF camuflado Explorando algumas bases de governo federal – Cadastros e registros administrativos Trabalho Dados Agregados BI Microdados Público Sigiloso Síntese do Emprego Formal INSPER Anuário Estatístico da RAIS Programa de Disseminação das Estatísticas do Trabalho - PDET Microdados da RAIS desidentificados Microdados da RAIS identificados Microdados da CAGED desidentificados Microdados da CAGED identificados Diferença entre microdados e PDET: nos microdados estão disponíveis variáveis, como por exemplo, Indicador de Pessoa com Deficiência, Tipo de Deficiência, Atividade Econômica (Subclasse), Ocupação e Raça/Cor que devem ser utilizadas com certa cautela, pois, algumas são relativamente novas e outras, dado o nível de desagregação, podem apresentar algumas inconsistências. Contudo, em termos gerais, sua utilização em nível mais agregado não está comprometida. Explorando algumas bases de governo federal – Cadastros e registros administrativos Trabalho ITEM RAIS CAGED Levantamento Anual Mensal Tipo de vínculo qualquer tipo: estatutários, celetistas, temporários, avulsos; apenas os celetistas Abrangência todos os empregados do ano base em 31/12 e movimentação dos admitidos e desligados mês a mês apenas a movimentação de admitidos e desligados Obrigatoriedade todos os estabelecimentos, mesmo aqueles que não apresentaram movimentação apenas os estabelecimentos que apresentaram movimentação Útil para estudos estruturais do mercado de trabalho formal de análise de conjuntura do mercado de trabalho formal Vantagens da RAIS e CAGED Abrangência, atingindo até o município, e à diversidade de cruzamento em nível ocupacional e setorial. Disponibilização dos dados em período relativamente pequeno no caso do CAGED. Limitações da RAIS e CAGED Omissão de declaração dos estabelecimentos e erro de preenchimento. Explorando algumas bases de governo federal – Cadastros e registros administrativos Previdência Dados Agregados BI Microdados Público Sigiloso Boletim Estatístico da Previdência Social – BEPS Infologo N/D Maciça Anuário Estatístico da Previdência Social – AEPS N/D CNIS Previdência Social (Regime Geral / INSS): inclui grandes números da Previdência Social, tais como quantitativo de benefícios concedidos, dados do atendimento do INSS, arrecadação previdenciária, valores pagos aos beneficiários, entre outros. Previdência no Serviço Público (Regimes Próprios / RPPS): inclui informações relativas aos RPPS, provenientes do Sistema de Informações dos Regimes Públicos de Previdência Social – CADPREV. Previdência Complementar: inclui informações sobre as Entidades Fechadas de Previdência Complementar (EFPC) e seus planos de benefícios. Saúde e Segurança do Trabalhador: inclui informações sobre acidentes de trabalho, benefícios por incapacidade e motivos de afastamento do trabalho. Nota: Atentar para diferença entre benefícios e beneficiários na análise das estatísticas da Previdência Social. Explorando algumas bases de governo federal – Cadastros e registros administrativos Portal da transparência (download de microdados) • Bolsa Família – Pagamentos e Saques. Contém o valor da parcela paga ou sacada e o mês de referência. Identificador: NIS e Nome • Seguro Defeso Pescador Artesanal – Contém, entre outros, nome do município; portaria defeso ibama; data início e fim defeso; data emissão parcela; número parcela; data saque parcela; valor parcela; data restituição. Identificador: CPF camuflado, PIS e nome • Servidores Civis e Militares do Executivo Federal. Identificador: CPF camuflado e nome o Cadastro – Dados como cargo; função; órgão de lotação e órgão de exercício; tipo esituação de vínculo; regime jurídico; data de ingresso e nomeação, etc; o Remuneração – remunerações, gratificações, verbas indenizatórias, férias, deduções; o Observações – demais observações como: serviço no exterior, valores incluídos na remuneração, etc; o Honorários (Jetons) – empresa e valores recebidos o Honorários Advocatícios – valores recebidos o Afastamentos – data de início e fim de afastamentos Explorando algumas bases de governo federal – Cadastros e registros administrativos Pesquisa Nacional por Amostra de Domicílios - PNAD Pesquisa Nacional por Amostra de Domicílios - PNAD • Apresentação • Histórico • Estruturação • Pesquisa Básica • Pesquisas Suplementares • Pesquisas Especiais • Microdados • Alguns conceitos importantes • Apresentação A pesquisa era realizada por uma amostra probabilística de domicílios. As informações eram prestadas por pessoa moradora ou não moradora, considerada apta a prestar informação para o conjunto de moradores e pelo domicílio. O entrevistador era orientado a não aceitar como informante uma pessoa menor de 14 anos de idade. Temas investigados o Características da habitação o Características demográficas gerais o Características de migração o Características de fecundidade feminina o Características de educação o Características de trabalho e rendimento Pesquisa Nacional por Amostra de Domicílios - PNAD • Histórico – abrangência 1967 1968-1972 1973-1979 Início da PNAD. A coleta de informações começa nos antigos Estados da Guanabara e Rio de Janeiro, tendo sua abrangência paulatinamente expandida. Até o fim de 1968, a pesquisa já abrangia todos os estados das Regiões Nordeste, Sudeste e Sul, além do Distrito Federal, alcançando cerca de 92% da população brasileira. Expansão da cobertura territorial da PNAD, que passa a alcançar as áreas urbanas das Regiões Norte e Centro-Oeste. Ampliação da abrangência territorial da PNAD, que passava a alcançar as áreas rurais da Região Centro-Oeste. Somente as áreas rurais da Região Norte permaneciam de fora da amostragem. Manutenção da abrangência territorial da PNAD. Expansão da abrangência territorial da PNAD, que passa também a investigar as áreas rurais da Região Norte, cobrindo todo o Território Nacional. A PNAD sofreu algumas interrupções, como nos anos em que ocorreu o Censo Demográfico. Pesquisa Nacional por Amostra de Domicílios - PNAD 1981-1990 1992-2003 2004-2015 • Histórico – Populações abrangidas nos temas básicos da PNAD - 1967/2015 Para mais informações, consultar: https://biblioteca.ibge.gov.br/visualizacao/livros/liv94878.pdf Pesquisa Nacional por Amostra de Domicílios - PNAD • Estruturação Pesquisa Básica destina-se a investigar, de forma contínua, os temas definidos como de maior importância para medir o nível e acompanhar a evolução socioeconômica da população do País. Pesquisas Suplementares destinam-se a aprofundar os temas permanentes e investigar outros assuntos de interesse que se interliguem com os da Pesquisa Básica. Ex.: Trabalho infantil, Segurança alimentar, Vitimização e Justiça, etc. Pesquisas Especiais destinam-se a tratar de assuntos de maior complexidade, que exigem tratamento à parte da Pesquisa Básica, podendo até requerer um esquema de amostragem distinto. Ex.: Tabagismo (2008) Pesquisa Nacional por Amostra de Domicílios - PNAD • Microdados O IBGE disponibiliza para download os microdados das PNADs de 2001 a 2015. Os arquivos disponibilizados são: - Dados – Microdados em txt de pessoas e domicílios - Dicionários e input – Dicionários de variáveis e leitura em SAS dos arquivos - Leitura em R - Marca de imputação - Indicação de dados imputados - Metodologia – Texto metodológico sobre a Pesquisa e anexos - Questionário Pesquisa Nacional por Amostra de Domicílios - PNAD • Microdados Arquivo de domicílios Arquivo de pessoas Cada linha se refere a um domicílio. O quanto cada domicílio representa na amostra encontra-se na variável de peso do domicílio, que é igual ao peso da pessoa de referência do domicílio. Cada linha se refere a uma pessoa. O quanto cada pessoa representa na amostra encontra-se na variável de peso da pessoa. Domicílio Pesquisa Nacional por Amostra de Domicílios - PNAD • Microdados Arquivo de pessoas - 2015 Arquivo de pessoas estruturado após leitura por software de análise dados Pesquisa Nacional por Amostra de Domicílios - PNAD • Alguns conceitos importantes Datas e Períodos de Referência (encontra-se no arquivo de metodologia), exemplo de 2015: Data de referência - Foi o dia 26 de setembro de 2015. Semana de referência - Foi a semana de 20 a 26 de setembro de 2015. Mês de referência - Foi setembro de 2015. Obs.: Relevante para fins de deflacionamento de rendimentos monetários, por exemplo. Pesquisa Nacional por Amostra de Domicílios - PNAD • Alguns conceitos importantes Domicílio Local de moradia estruturalmente separado e independente, constituído por um ou mais cômodos. Separação - limitado por paredes, muros, cercas etc., coberto por um teto, e permite que seus moradores se isolem, arcando com parte ou todas as suas despesas de alimentação ou moradia. Independência - acesso direto, moradores podem entrar e sair sem passar por local de moradia de outras pessoas. Domicílios particulares - quando destinados à habitação de uma pessoa ou de um grupo de pessoas cujo relacionamento é ditado por laços de parentesco, dependência doméstica ou, ainda, normas de convivência. Domicílios coletivos - quando destinados à habitação de pessoas em cujo relacionamento prevalecesse o cumprimento de normas administrativas, como hotéis, pensões, orfanatos, asilos, casas de detenção, quartéis, hospitais etc. Pesquisa Nacional por Amostra de Domicílios - PNAD • Alguns conceitos importantes Espécie do Domicílio Permanente - Para o domicílio localizado em casa, apartamento ou cômodo e destinado à moradia; Improvisado - Para o domicílio localizado em unidade que não tivesse dependência destinada exclusivamente à moradia, tal como: loja, sala comercial etc. Assim também foi considerado o prédio em construção, embarcação, carroça, vagão, tenda, barraca, gruta etc., que estivesse servindo de moradia. Pesquisa Nacional por Amostra de Domicílios - PNAD • Alguns conceitos importantes Família Conjunto de pessoas ligadas por laços de parentesco, dependência doméstica ou normas de convivência, que residissem na mesma unidade domiciliar e, também, a pessoa que morasse só em uma unidade domiciliar. Condição na Unidade Domiciliar e na Família Dentro de cada unidade domiciliar e de cada família, as pessoas foram classificadas em função da relação com a pessoa de referência ou com o seu cônjuge Pesquisa Nacional por Amostra de Domicílios - PNAD • Alguns conceitos importantes Estudante Pessoa que frequentava curso de ensino regular (fundamental, ensino médio, primeiro grau, segundo grau ou superior de graduação), de mestrado ou doutorado, pré-escolar, alfabetização de jovens e adultos, educação de jovens e adultos ou supletivo ministrado em escola, ou pré-vestibular. Não é classificada como estudante a pessoa que frequentava somente: curso sequencial de educação superior; curso de especialização profissional; curso de extensão cultural (idioma, costura, datilografia etc.); ou curso de educação de jovens e adultos ou supletivo por meio de rádio, televisão ou correspondência. Pesquisa Nacional por Amostra de Domicílios - PNAD • Alguns conceitos importantes Trabalho Considera-se como trabalho em atividade econômica o exercício de: a) Ocupação remunerada em dinheiro, produtos, mercadorias ou benefícios (moradia, alimentação,roupas etc.) na produção de bens e serviços; b) Ocupação remunerada em dinheiro ou benefícios (moradia, alimentação, roupas etc.) no serviço doméstico; c) Ocupação sem remuneração na produção de bens e serviços, desenvolvida durante pelo menos uma hora na semana: - em ajuda a membro da unidade domiciliar que tivesse trabalho como: empregado na produção de bens primários (que compreende as atividades da agricultura, silvicultura, pecuária, extração vegetal ou mineral, caça, pesca e piscicultura), conta própria ou empregador; - em ajuda a instituição religiosa, beneficente ou de cooperativismo; ou - como aprendiz ou estagiário; ou Pesquisa Nacional por Amostra de Domicílios - PNAD • Alguns conceitos importantes Trabalho Continuação... d) Ocupação desenvolvida, durante pelo menos uma hora na semana: - na produção de bens, do ramo que compreende as atividades da agricultura, silvicultura, pecuária, extração vegetal, pesca e piscicultura, destinados à própria alimentação de pelo menos um membro da unidade domiciliar; ou - na construção de edificações, estradas privativas, poços e outras benfeitorias (exceto as obras destinadas unicamente à reforma) para o próprio uso de pelo menos um membro da unidade domiciliar. Portanto, no conceito de trabalho caracterizam-se as condições de: - Trabalho remunerado (itens a e b); - Trabalho não remunerado (item c); e - Trabalho na produção para o próprio consumo ou na construção para o próprio uso (item d). Pesquisa Nacional por Amostra de Domicílios - PNAD • Alguns conceitos importantes Rendimento Mensal Familiar Soma dos rendimentos mensais dos componentes da família, exclusive os das pessoas de menos de 10 anos de idade e os daquelas cuja condição na família fosse pensionista, empregado doméstico ou parente do empregado doméstico. Rendimento Mensal Domiciliar Soma dos rendimentos mensais dos moradores da unidade domiciliar, exclusive os das pessoas de menos de 10 anos de idade e os daquelas cuja condição na unidade domiciliar fosse pensionista, empregado doméstico ou parente do empregado doméstico. Rendimento Mensal Domiciliar per Capita Divisão do rendimento mensal domiciliar pelo número de membros da unidade domiciliar, exclusive aqueles cuja condição na unidade domiciliar fosse pensionista, empregado doméstico ou parente do empregado doméstico. Pesquisa Nacional por Amostra de Domicílios - PNAD Pesquisa Nacional por Amostra de Domicílios Contínua - PNADC • Apresentação • Sistema Integrado de Pesquisas Domiciliares - SIPD • Estruturação • Pesquisa Básica • Pesquisas Suplementares • Pesquisas Especiais • Microdados • Diferenças entre PME, PNAD e PNAD Contínua Pesquisa Nacional por Amostra de Domicílios Contínua - PNADC As reformulações metodológicas e de abrangência das principais pesquisas domiciliares do IBGE, como a PNAD, a PME, a POF e a Pesquisa da Economia Informal Urbana (ECINF) sempre ocorreram isoladamente. Desta forma, estas pesquisas apresentavam distinções entre conceitos, instrumentos de coleta, processos de crítica de dados, cadastros, infraestrutura amostral, etc.. O SIPD Constitui em um modelo de produção de pesquisas amostrais domiciliares no qual, ao contrário do que ocorria anteriormente: • o planejamento, a execução, a análise e a disseminação dos resultados, das principais pesquisas domiciliares do IBGE serão conduzidos de forma associada, facilitando o atendimento de novas demandas bem como otimizando os recursos a serem utilizados. Sistema Integrado de Pesquisas Domiciliares - SIPD A implementação do SIPD significa a adoção de cadastros de seleção compartilhados (Cadastro Mestre) e de desenhos de amostras compartilhados (Amostra Mestra), a harmonização de conceitos, de variáveis e de classificações nas diversas investigações componentes do sistema, a padronização dos processos de crítica, de imputação, e de tabulação, além da ampliação da utilização de tecnologias de captura de dados. Sistema Integrado de Pesquisas Domiciliares - SIPD Corresponde a um conjunto de unidades de área selecionadas de um cadastro, segundo um método probabilístico de seleção de forma que seja possível selecionar subamostras para as diversas pesquisas. • A amostra de cada uma das pesquisas do SIPD corresponderá a uma parte ou a integralidade de uma amostra mestra, e os conceitos e processos serão harmonizados. • Em relação a PNAD, a PNAD Contínua permite um ganho considerável na precisão das estimativas, especialmente nas áreas rurais. • Amostra mestra Sistema Integrado de Pesquisas Domiciliares - SIPD São componentes do SIPD • a PNAD Contínua, pesquisa que resulta da integração da Pesquisa Nacional por Amostra de Domicílios e da Pesquisa Mensal de Emprego e o • esquema de realização anual de Pesquisas de Orçamentos Familiares. Sistema Integrado de Pesquisas Domiciliares - SIPD • A PNAD Contínua substitui a Pesquisa Mensal de Emprego (PME) e a Pesquisa Nacional por Amostra de Domicílios (PNAD), potencializando os resultados produzidos por ambas, agregando, em relação à primeira, a cobertura do território nacional, e em relação à segunda, a disponibilização de informações sobre trabalho com periodicidade de divulgação que permite a análise conjuntural do tema. • A PNAD Contínua propicia, mesmo em relação à PNAD anual, uma cobertura territorial mais abrangente. Pesquisa Nacional por Amostra de Domicílios Contínua PNAD PME PNAD Contínua • Mensalmente - indicadores de divulgação mensal de mercado de trabalho para o nível Brasil - PME - produzia indicadores mensais sobre força de trabalho apenas para as seis principais regiões metropolitanas investigadas pela PME, ou seja, para o Rio de Janeiro, São Paulo, Belo Horizonte, Recife, Salvador e Porto Alegre. A informação nacional sobre este tema era investigada apenas anualmente, através da PNAD, não possuindo, portanto, o caráter de acompanhamento conjuntural. Pesquisa Nacional por Amostra de Domicílios Contínua • Periodicidade Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez 3º Trim 4º Trim Ano 1º Trim 2º Trim • Anualmente - Temas estruturais, tais como educação, migração e trabalho infantil. - dados sobre consumo e orçamentos familiares eram produzidos a cada 5 anos (POF) • Trimestralmente – Indicadores conjunturais de mercado de trabalho. Além disso, temas suplementares poderão ser investigados e divulgados com outra periodicidade. Pesquisa Nacional por Amostra de Domicílios Contínua • Composição •sexo, cor ou raça, idade, composição do domicílio e nível de instrução Núcleo Básico do SIPD •Trabalho e Rendimento Objetivo específico da pesquisa •Ex.: Habitação, Educação, Migração, Fecundidade Suplementos / Módulos Parte conjuntural da PNAD Contínua Parte estrutural da PNAD Contínua Investigadas em todos os domicílios, em todas as entrevistas (1 a 5), abrangendo todas as periodicidades. investigados apenas em uma parte da amostra a cada trimestre e acumulados para garantir um resultado anual. Presente em todas pesquisas do SIPD A1 A2 A3 A4 A5 A6 A7 A8 A9 A10 A11 A12 A13 A14 A15 B1 B2 B3 B4 B5 B6 B7 B8 B9 B10 B11 B12 jan/16 5 4 3 2 1 fev/16 5 4 3 2 1 mar/16 5 4 3 2 1 abr/16 5 4 3 2 1 mai/16 5 4 3 2 1 jun/16 5 4 3 2 1 jul/16 5 4 3 2 1 ago/16 5 4 3 2 1 set/16 5 4 3 2 1 out/16 5 4 3 2 1 nov/16 5 4 3 2 1 dez/16 5 4 3 2 1 jan/17 5 4 3 2 1 fev/17 5 4 3 2 1 mar/17 5 4 3 2 1 Mês Grupos de rotação de domicílios Pesquisa Nacional por Amostra de Domicílios Contínua • Rotação da amostra Mês: um domicílio é pesquisado uma vez no mês, fica fora dois meses, volta a ser pesquisado no 4º mês, fica fora outros 2 meses, repetindo esse esquema 5 vezes. Trimestre:o domicílio é pesquisado uma vez no trimestre e permanece na pesquisa por 5 trimestres consecutivos, com 2 meses de intervalo entre as entrevistas. Por trimestre • 3.464 municípios • 211.344 domicílios • Abrangência – até municípios de capitais 80% dos domicílios são repetidos a cada trimestre Pesquisa Nacional por Amostra de Domicílios Contínua • Módulos temáticos 2016 Entrevista Tema 1º trimestre 2º trimestre 3º trimestre 4º trimestre 1ª entrevista Parte conjuntural + Mercado de trabalho - perguntas adicionais Características dos domicílios Rendimentos de outras fontes - Rendimento Domiciliar 2ª entrevista Parte conjuntural 3ª entrevista Parte conjuntural 4ª entrevista Parte conjuntural 5ª entrevista Parte conjuntural + Rendimentos de outras fontes - Rendimento Domiciliar Trabalho Infantil Outras Formas de Trabalho Par te c onj unt ura l + Per gun tas ad icio nai s de Ed uca ção Par te c onj unt ura l + Ace sso à In ter net e à tel evi são e p oss e d e te lefo ne mó vel cel ula r pa ra u so p ess oal Par te c onj unt ura l Par te c onj unt ura l Parte conjuntural – Disponível trimestralmente e anualmente: Características Gerais dos Moradores Características de educação para os moradores de 5 anos ou mais de idade Características de trabalho das pessoas de 14 anos ou mais de idade - Conjuntural Pesquisa Nacional por Amostra de Domicílios Contínua • Módulos temáticos 2016 Possibilidade de inserir novos módulos temáticos/suplementos Entrevista Tema 1º trimestre 2º trimestre 3º trimestre 4º trimestre 1ª entrevista Parte conjuntural + Mercado de trabalho - perguntas adicionais Características dos domicílios Rendimentos de outras fontes - Rendimento Domiciliar 2ª entrevista Parte conjuntural 3ª entrevista Parte conjuntural 4ª entrevista Parte conjuntural 5ª entrevista Parte conjuntural + Rendimentos de outras fontes - Rendimento Domiciliar Trabalho Infantil Outras Formas de Trabalho Par te c onj unt ura l + Per gun tas ad icio nai s de Ed uca ção Par te c onj unt ura l + Ace sso à In ter net e à tel evi são e p oss e d e te lefo ne mó vel cel ula r pa ra u so p ess oal Par te c onj unt ura l Par te c onj unt ura l Pesquisa Nacional por Amostra de Domicílios Contínua • Módulos temáticos 2016 Exemplo: Outras formas de trabalho Os indicadores se referem às pessoas de 14 anos ou mais de idade, independente da situação na ocupação. Abrange os seguintes indicadores: Produção para o próprio consumo Afazeres domésticos Cuidado de pessoas Trabalho voluntário Pesquisa Nacional por Amostra de Domicílios Contínua • Diferenças entre PME, PNAD e PNAD Contínua PME PNAD PNAD CONTINUA Abrangência de coleta da informação Área urbana de 6 Regiões Metropolitanas (Recife, Salvador, Belo Horizonte, Rio Janeiro, São Paulo, Porto Alegre) - (Amostra de 145 municípios) Nacional (Amostra de 1100 municípios) Nacional (Amostra de 3500 municípios) Abrangência de divulgação dos resultados Conjunto das seis Regiões Metropolitanas e cada uma das seis Regiões Metropolitanas separadamente Brasil, Grandes Regiões, Unidades da Federação e 9 Regiões Metropolitanas (Belém, Recife, Salvador, Belo Horizonte, Rio Janeiro, São Paulo, Curitiba e Porto Alegre ) Brasil, Grandes Regiões, Unidades da Federação, Regiões Metropolitanas que incluem os municípios das capitais e Municípios das capitais Periodicidade Mensal Anual Trimestral, Anual e Mensal, por meio de trimestres móveis, para um conjunto restrito de indicadores de trabalho para Brasil. Semana de referência Semana imediatamente anterior à definida como de entrevista Última semana completa de setembro. Semana imediatamente anterior à definida como de entrevista. Pesquisa Nacional por Amostra de Domicílios Contínua PME PNAD PNAD CONTINUA População Investigada para o tema trabalho Pessoas de 10 anos ou mais de idade Pessoas de 10 anos ou mais de idade Pessoas de 14 anos ou mais de idade em dinheiro, produtos, mercadorias ou benefícios (moradia, alimentação, etc.) desenvolvido durante pelo menos uma hora na semana sem restrições ao número de horas trabalhadas na semana desenvolvido durante pelo menos uma hora na semana 2.1 em ajuda a membro da unidade domiciliar que era conta própria ou empregador. Considera como ocupada Considera como ocupada Considera como ocupada 2.2 em ajuda a membro da unidade domiciliar que era empregado Considera como ocupada Considera como ocupada apenas aquela: na produção de bens primários (ex. agricultura) Considera como ocupada 2.3 em ajuda a instituição religiosa, beneficente ou de cooperativismo Não considera como ocupada Considera como ocupada Não considera como ocupada 2.4 como aprendiz ou estagiário Considera como empregado remunerado em benefícios Considera como não remunerado Considera como empregado remunerado em benefícios 3. 1 Trabalho na produção para o próprio consumo Não considera como ocupada Na produção de bens destinados exclusivamente à própria alimentação de pelo menos um membro da unidade domiciliar. Não considera como ocupada 3.2 Na construção para o próprio uso Não considera como ocupada Na construção de benfeitorias (exceto obras destinadas unicamente à reforma) para o próprio uso de pelo menos um membro da unidade domiciliar. Não considera como ocupada Há algumas restrições quanto ao tempo de afastamento para considerar a pessoa como ocupada Não há restrição alguma quanto ao tempo de afastamento para considerar a pessoa como ocupada Há algumas restrições quanto ao tempo de afastamento para considerar a pessoa como ocupada 3. Trabalho na produção para o próprio consumo ou na construção para o próprio uso (desenvolvido durante pelo menos uma hora na semana) 4 Pessoa que, na semana de referência, tinha trabalho remunerado do qual estava afastada Pessoa que na semana de referência trabalhou em: 1.Trabalho Remunerado 2. Trabalho Sem Remuneração (desenvolvido durante pelo menos uma hora na semana) • Diferenças entre PME, PNAD e PNAD Contínua - Ocupados Pesquisa Nacional por Amostra de Domicílios Contínua PME PNAD PNAD CONTINUA a) na semana de referência, estava sem trabalho; a) na semana de referência, estava sem trabalho; e a) na semana de referência, estava sem trabalho; b) estava disponível para assumir um trabalho na semana de referência; e - b) estava disponível para assumir um trabalho na semana de referência; c) no período de referência de 30 dias, havia tomado alguma providência efetiva para conseguir trabalho, sem ter tido qualquer trabalho ou após ter saído do último trabalho que teve neste período. b) na semana de referência, havia tomado alguma providência efetiva para conseguir trabalho. c) no período de referência de 30 dias, havia tomado alguma providência efetiva para conseguir trabalho; e d) inclui, também, a pessoa, sem trabalho e disponível para trabalhar na semana de referência, que não havia tomado qualquer providência para conseguir trabalho no período de referência de 30 dias por já ter conseguido trabalho para começar após a semana de referência. • Diferenças entre PME, PNAD e PNAD Contínua - Desocupados Introdução ao cruzamento de dados •Desafios na análise dados Cadastros e registros administrativos •Principais desafios do cruzamento de dados de registrosadministrativos: Escolha das chaves Ausência de informação sobre a base de dados Ausência de informação de campos na base de dados Qualidade dos dados Tratamento de dados – registros duplicados Características especiais Escolha do método Análise do resultado Escolha das chaves • Não é uma tarefa simples Ex.: Mesmo que bata informação de CPF, haverá casos em que o nome é diferente, ou bate nome e CPF, mas a data de nascimento e o nome da mãe são diferentes. Principais desafios do cruzamento de dados de registros administrativos • É preciso conhecer as bases de dados o Exemplo: vários benefícios para a mesma pessoa -> vários registros para a mesma pessoa • É preciso saber como estão preenchidas as informações o Exemplo: determinado campo só é preenchido para determinadas pessoas, benefícios, etc. • Cuidado para não criar elos errados • Regras de Localização e Unicidade o Como localizar uma pessoa de uma base de dados em outra base de dados e ter certeza de que é a mesma pessoa? o A eficiência da Regra de Localização e Unicidade está diretamente ligada à qualidade dos dados inseridos na base pelos usuários. • Avaliação de Unicidade: rotina sistêmica, composta por um conjunto de critérios e regras, que possibilita a comparação de dados cadastrais da pessoa e a verificação de equivalência entre os registros avaliados, com a finalidade de confirmar se pertencem ou não a um mesmo titular. Principais desafios do cruzamento de dados de registros administrativos Escolha das chaves Escolha das chaves • Regras de Localização e Unicidade - Matriz de Avaliação – Exemplo do Cadastro NIS/CAIXA Unicidade Cadastral Coincidência de: • 1 forma fonética do nome na Árvore de Decisão + • 2 ou + atributos da Matriz de Decisão + • utilização dos atributos complementares, quando necessário. Árvore de Decisão Matriz de Decisão Matriz de Comparação NIS Informado Atributos Prioritários Atributos de Complementares Nome da Pessoa UF S UF S 1 Fonético Completo 1 CPF - - 1 Nome do Pai - - 2 Fonético Abreviado 2 Título de Eleitor - - 2 Município Nascimento - - 3 Fonético Primeiro e Último 3 Carteira de Trabalho S 3 UF de Nascimento - - 4 Fonético Primeiro Nome 4 Identidade S S 4 Certidão Casamento Certidão de Óbito Certidão do Índio S - 5 Certidão de Nascimento S 5 Passaporte - - 6 Data de Nascimento - 6 Portaria Naturalização - - 7 Nome da Mãe - - Ausência de informação sobre a base de dados Em geral, o acesso as bases de dados não vem acompanhado de documentos como layout, dicionário de dados, descrição das variáveis, etc. Importante: Contato com responsáveis pela base de dados Conhecer forma de inserção das informações na base de dados Exemplos: Ausência de informação sobre a base de dados Ausência de informação de campos na base de dados Exemplo: Registros de pensionistas do Siape, cruzamento com dados do CPF e BPC (CPF como chave primária)* A ausência de informação dificulta a identificação da pessoa, gera dúvidas quanto a qualidade da base e pode atrapalhar a conclusão dos resultados. *dados alterados para preservar o sigilo das informações Qualidade dos dados Exemplo: Registros do SDPA com problemas, cruzamento com dados do CPF (CPF como chave primária)* *dados alterados para preservar o sigilo das informações Informações incorretas: • Nem sempre o documento informado pertence a própria pessoa; • Grafias diversas dos nomes, (erro de digitação); • Dados pessoais divergentes; • Alterações de nomes não refletidas em todas as bases de dados; etc. nomerequerente_SDPA nom_contribuinte_CPF nomemaerequerente_SDPA nom_mae_CPF dt_nasc_sdpa dt_nasc_cpf ERISVALDO FRAZAO COSTA ELISVALDO FRAZAO COSTA MARIA POMPEU DOS SANTOS MARIA CARLIZA DE OLIVEIRA 19810906 19800906 JACINILDE BELO NOGUEIRA JACILEIDE BELO FERREIRA LAURA GOMES DE SENA LAURA GOMES DE SENA 19750806 19750906 ALUIZIO SOBRINHO DE OLIVEIRA ALUISIO SOBRINHO DE OLIVEIRA ROZALIA FERREIRA MAFRA ROSALIA FERREIRA MAFRA 19630331 19630313 MARTILIANE DO SOCORRO DOS SANTOS BACE MARTIANE DO SOCORRO DOS SANTOS BACELAR MARIA DA GLORIA FRAZAO COSTA MARIA DA GLORIA FRAZAO COSTA 19701110 19721210 ROSILENE POMEU DOS SANTOS LENALDO DIAS DOS SANTOS NULL ANTONIA PAVAO 19780314 19841112 ZACARIAS FURTADO MARQUES ADEMIR MACHADO COSTA VALDIRENE DE JESUS CORDEIRA PESSOA CATARINA PAIM DE SOUZA 19830730 19861028 BRAZ MARINHO MAFRA BRAS MARINHO MAFRA MARIA IRACI SOBRINHO DE OLIVEIRA MARIA IRACI SOBRINHO DE OLIVEIRA 19901026 19900402 GUSTAVO FELIPE SARGES RAMOS CRISTIANA DA SILVA DIAS MARIA DOLORES DOS SANTOS FURTADO MARIA MACHADO COSTA 19900712 19560303 EDIVALDO GOMES DA SILVA EDVALDO GOMES DA SILVA GREGORIA BELO NOGUEIRA GREGORIA PEREIRA BELO 19570604 19570704 EDICLEIDE PESSOA FERREIRA MARIA DA SILVA MARIA DAS GRACAS SARGES RAMOS LUZIA DE JESUS DA SILVA DIAS 19770414 19650223 LAERCIO GONCALVES BENASSULI LAELCIO GONCALVES BENASSULI MARIA ONEIDE PEREIRA DOS SANTOS MARIA ONEIDE PEREIRA DOS SANTOS 19580513 19570513 Provável alteração de nome por casamento, não atualizada em um dos cadastros Registros duplicados Antes de cruzar os dados de uma tabela com outra, os dados duplicados devem ser tratados. Exemplo: Registros duplicados do BPC, cruzamento com dados do CPF (CPF como chave primária)* *dados alterados para preservar o sigilo das informações CPF (fictício) nom_Maciça nom_CPF nom_mae_Maciça nom_mae CPF dt_nasc_Maciça dt_nasc_CPF 14704280114 JORGE HENRIQUE FREITAS DA SILVA JORGE HENRIQUE FREITAS DA SILVA MARIA DO SOCORRO DA SILVA MARIA RODRIGUES DA SILVA 21/10/1994 21/10/1994 14704280114 JORGE HENRIQUE FREITAS DA SILVA JORGE HENRIQUE FREITAS DA SILVA MARIA RODRIGUES DA SILVA MARIA RODRIGUES DA SILVA 21/10/1994 21/10/1994 1590510777 RAFAELA BERNARDES PEREIRA RAFAELA BERNARDES PEREIRA ROSILANE BERNARDES CABRAL ROSILANE BERNARDES CABRAL 03/05/1948 03/05/1948 1590510777 RAFAELA BERNARDES PEREIRA RAFAELA BERNARDES PEREIRA ROSILANE BERNARDES CABRAL ROSILANE BERNARDES CABRAL 03/05/1948 03/05/1948 4469464605 NATALIA SOARES A SILVA NATALIA SOARES DA SILVA AMARILDA ROSANGELA S DA SILVA AMARILDA ROSANGELA SOARES DA SILVA 14/12/1945 14/12/1945 4469464605 NATALIA SOARES DA SILVA NATALIA SOARES DA SILVA AMARILDA ROSANGELA S DA SILVA AMARILDA ROSANGELA SOARES DA SILVA 14/12/1945 14/12/1945 14891035416 JOSE CARLOS DE OLIVEIRA JOSE CARLOS DE OLIVEIRA ANTONIA GARCEZ DE OLIVEIRA ANNA MARIA DE OLIVEIRA 29/07/1998 29/07/1998 14891035416 JOSE CARLOS DE OLIVEIRA JOSE CARLOS DE OLIVEIRA FRANCISCA CORREIA DA SILVA ANNA MARIA DE OLIVEIRA 29/07/1998 29/07/1998 176626130 IVANILDA NEVES DA SILVA IVANILDA NEVES DA SILVA NOEMIA NEVES DOS SANTOS NOEMIA NEVES DOS SANTOS 03/07/1999 03/07/1999 176626130 MARIA DA CONCEICAO NEVES DA SILVA IVANILDA NEVES DA SILVA IVANILDA NEVES DA SILVA NOEMIA NEVES DOS SANTOS 03/07/1999 03/07/1999 1928672781 JUNIOR SANTOS CERQUEIRA JUNIOR DOS SANTOS CERQUEIRA LUZIA RODRIGUES DE JESUS LUZIA RODRIGUES DE JESUS 20/09/2001 20/09/2001 1928672781 JUNIOR SANTOS CERQUEIRA JUNIOR DOS SANTOS CERQUEIRA LUZIA RODRIGUES DE JESUS LUZIA RODRIGUES DE JESUS 20/09/2001 20/09/2001 2361365601 EUNICE CUNHA DE SOUZA EUNICE CUNHA DE SOUZA ALMERINDA CARIUS DA CUNHA ALMERINDA CARIUS DA CUNHA 03/10/1942 03/10/1942 2361365601 EUNICE CUNHA SOUZA EUNICE CUNHA DE SOUZA ALMERINDA CARMO DA CUNHA ALMERINDA CARIUS DA CUNHA 03/10/1942 03/10/1942 16391800366 MARIA NILZA DE ANDRADE MARIA NILZA DE ANDRADE ELIZABETE DOS SANTOS PEREIRA ELIZABETE DOS SANTOS PEREIRA 18/11/1961 18/11/1961 16391800366 MARIA NILZA DE ANDRADE MARIA NILZA DE ANDRADE ELIZABETE DOS SANTOS PEREIRA ELIZABETE DOS SANTOS PEREIRA 18/11/1961 18/11/1961 753899461 LUIZA GOMES DE OLIVEIRA LUIZA GOMES BARBOSA ADRIANA DE JESUS FREITAS ADRIANA DE JESUS FREITAS 20/01/1941 20/01/1941753899461 LUIZA GOMES BARBOSA LUIZA GOMES BARBOSA ADRIANA DE JESUS FREITAS ADRIANA DE JESUS FREITAS 08/09/1974 20/01/1941 Ex.: Filha cadastrada com CPF da mãe Características especiais Exemplo de utilização da base do CPF como referência (supondo ser mais confiável) CPF não localizados na base da RFB Casos com informação de óbito na base da RFB Casos em que o CPF se encontra cancelado, suspenso ou anulado. Situação do CPF na base da Receita Federal o REGULAR: não há nenhuma pendência no cadastro do contribuinte. o PENDENTE DE REGULARIZAÇÃO: o contribuinte deixou de entregar alguma Declaração do Imposto Renda da Pessoa Física (DIRPF) a que estava obrigado em pelo menos um dos últimos cinco anos. o SUSPENSA: o cadastro do contribuinte está incorreto ou incompleto. o CANCELADA: o CPF foi cancelado, em virtude de decisão administrativa ou judicial ou por falecimento do contribuinte o NULA: foi constatada fraude na inscrição e o CPF foi anulado. Esquema de cruzamento de dados: SIAPE X CPF X BPC Resultados dos cruzamentos Notas: Validado - Com CPF regular ou pendente de regularização na base da RFB e com informações compatíveis com o cadastrado no CPF (nome, nome da mãe e data de nascimento); Não validado - Sem CPF ou CPF nulo, cancelado ou suspenso na base da RFB ou com informações incompatíveis com o cadastrado no CPF. Resultado dos cruzamentos Tabela BPC 4.364.500 BPC validado BPC não validado 3.971.373 393.127 Tabela SIAPE_Servidor 1.190.770 SIAPE_Servidor validado 196 14 1.190.765 SIAPE_Servidor não validado 5 Tabela SIAPE_Pensionista 611.033 SIAPE_Pensionista validado 5.520 23 503.945 SIAPE_Pensionista não validado 107.088 • Análise tem que levar em consideração as regras dos programas: Possibilidade de acumulação de benefícios indenizatórios Possibilidade de trabalho de estágio • São indícios - resultado precisa ser apurado individualmente Resultados dos cruzamentos Situação no SIAPE Categoria no BPC Total Pessoa com deficiência Idoso ANIST.PRIVADO L10559 3 20 23 ANIST.PUBLICO L10559 1 5 6 APOSENTADO 1 47 48 ATIVO PERMANENTE 47 2 49 CEDIDO SUS/LEI 8270 1 1 CELETISTA/EMPREGADO 8 1 9 CLT ANS -DEC 6657/08 1 1 2 CONT.PROF.SUBSTITUTO 5 5 CONTRATO TEMPORARIO 2 2 ESTAGIARIO 51 2 53 NOMEADO CARGO COMIS. 2 2 REFORMA CBM / PM 4 4 SEM VINCULO 4 2 6 PENSIONISTA 1.640 3.903 5.543 Total Geral 1.765 3.988 5.753 Rafael Luís Giacomin Analista de Planejamento e Orçamento rafael.giacomin@planejamento.gov.br XVI Semana de Administração Orçamentária, Financeira e de Contratações Públicas
Compartilhar