Prévia do material em texto
Governança de Dados Lauro de Freitas Unidade 01 Contexto Organizacional de Dados Definição de Governança de Dados Governança de Dados Ao longo dos anos e após a globalização, as empresas se viram obrigadas a estabelecer regras de gestão a fim de automatizar e possibilitar decisões rápidas no dia a dia. Com a grande demanda de tarefas e com a tecnologia altamente avançada, a Governança de Dados se estabeleceu como um aspecto não apenas importante, mas mandatório aos que querem ter vantagem competitiva através do conhecimento de seus resultados. Com esse sistema, as corporações ganham agilidade para entender o momento em que se encontram e destreza para se adaptar rapidamente, independente de qual seja o ramo de atuação. Definição: Um processo para gerenciar e melhorar os dados para o benefício de todas as partes interessadas. https://abeinfobrasil.com.br/a-importancia-da-governanca-de-dados-para-as-empresas-2/ Governança de Dados • “Governança de Dados é o exercício de autoridade e controle (planejamento, monitoramento e engajamento) sobre o gerenciamento de ativos de dados. A função de Governança de Dados guia como todas as outras funções da Gestão de Dados são realizadas. Governança de Dados é de alto nível, ou seja, é gestão estratégica de dados na esfera executiva.” (Fonte: Dama-DMBOK®) • “Governança de Dados é o exercício de tomada de decisão e autoridade para as questões relacionadas a dados.” (Fonte: Data Governance Institute) Fonte: valuehost.com.br/blog/governanca-de-dados/ Governança de Dados Missão • Defina e alinhe proativamente as regras de dados em toda organização. • Fornecer proteção e serviços contínuos e abrangentes para as partes interessadas em dados. • Identifique e resolva problemas de dados. Visão • As informações são tratadas como um ativo de toda a empresa e estão prontamente disponíveis para apoiar a tomada de decisões baseadas em evidências e a ação informada. Governança de Dados O que é: • Uma iniciativa ativa. • Uma estrutura inter-organizacional para: • Compartilhamento seguro de dados. • Análise de dados entre departamentos. • Colaboração das partes interessadas. • Melhorar a qualidade dos dados. • Um processo contínuo. • O mecanismo para controlar e confiar em dados. o que NÃO é: • Tecnologia • Limpeza de dados ou ETL. • Armazenamento de dados. • Projeto de banco de dados. • Supervisão de tecnologia ou projeto. • Uma iniciativa em silos. • Um projeto ou gerenciamento de projetos. Governança de Dados • É o novo petróleo, a nova eletricidade. • É caro, então é um ativo valioso. • Usado para referência ou análise. Governança de Dados - Importância https://dataaffect.com/data-governance Todos os dados estão sujeitos aos princípios de governança de dados: • Propriedade de dados. • Gerenciamento de dados. • Segurança. • Gerenciamento de qualidade de dados • Edições de coleção. • Auditorias de dados. • Ciclo de vida e gerenciamento de mudanças. Governança de Dados - Princípios Por que precisamos de Governança de Dados Os dados são um ativo que DEVEM ser gerenciados de uma perspectiva de toda a empresa. Data Governance Enables decision making Reduces operational friction Protects the needs of the stakeholders Educates management and staff to adapt common approaches Builds standards and processes Reduces cost and increases effectiveness Ensures transparency Fonte: Dama New England - https://damanewengland.org/ Porque Investir em Governança de Dados? • Perdas devido à ineficiência operacional: reorganizar processos para evitar perda de dinheiro, de qualidade, de tempo entre outros desperdícios. • Crescimento da cultura data-driven: Amazon e Netflix, por exemplo, baseiam todas as suas operações em análise de dados e esse modelo de gestão já é acessível a empresas de todos os portes e segmentos. • Necessidade de conformidade com os regulamentos de dados: proteção de dados, como a LGPD — Lei geral de Proteção de Dados. • Quando há uma fusão ou aquisição: Mesclar os dados de duas ou mais empresas, é preciso definir a origem dos dados, a forma como eles serão categorizados, os aplicativos que serão utilizados e o como será feito o controle de qualidade — para evitar duplicações e inconsistências. • Quando a empresa migra para a transformação digital: utilizar os dados para desenvolver as estratégias digitais, com qualidade, acessibilidade e relevância. O que são Objetivos Estratégicos? Fornecem uma visão de futuro e direcionam a organização de forma clara e concisa para um determinado caminho. Ou seja, estabelecem os resultados que se pretende atingir dentro de um período estipulado. Fonte: https://www.treasy.com.br/blog/como-fazer-um- planejamento-estrategico/ A Governança de Dados apoia as metas estratégicas de negócios • As necessidades de negócios impulsionam as necessidades de informação que impulsionam as necessidades técnicas (B.I.T.). • A Governança de Dados é principalmente uma função de negócios e apoia diretamente os objetivos estratégicos da Empresa. Business Needs Information Needs Technical Needs Data Governance Project Governance Fonte: Dama New England - https://damanewengland.org/ O que a Governança de Dados tem a ver comigo? • Problemas de dados afetam a todos • Eles impedem o uso efetivo de dados. • Eles podem vir em muitas formas: • Problemas de qualidade de dados: os dados não são adequados para uso. • Preocupações com a privacidade: dados não são identificadas ou são protegidos. • Lacunas de segurança: acesso ou disseminação não autorizados. • Interoperabilidade: Nomes de campo diferentes, mesmo significado. • Problemas de dados podem ser corrigidos • Através do processo de Governança de Dados. • A governança de dados é uma abordagem estruturada para gerenciar e proteger dados confidenciais. • Em cibersegurança, a governança de dados é crucial para garantir que os dados sensíveis sejam protegidos contra ameaças cibernéticas, incluindo roubo de dados, violação de dados e outras formas de ataque cibernético. • A governança de dados em cibersegurança envolve o estabelecimento de políticas e procedimentos para garantir que os dados sejam armazenados, gerenciados e compartilhados de maneira segura. Isso inclui a definição de quem tem acesso aos dados, como eles são protegidos e como as violações de dados são detectadas e gerenciadas Governança de Dados em CiberSegurança Algumas das práticas comuns de governança de dados em cibersegurança incluem: • Identificação de dados críticos: Identificação dos dados mais críticos e confidenciais da organização, que precisam de proteção adicional. • Definição de políticas de segurança: Estabelecimento de políticas e procedimentos claros para gerenciar e proteger os dados confidenciais. • Controle de acesso: Definição de quem pode acessar os dados críticos e como eles podem ser acessados. Governança de Dados em CiberSegurança Algumas das práticas comuns de governança de dados em cibersegurança incluem: • Monitoramento e análise: Monitoramento constante dos dados confidenciais para detectar qualquer atividade suspeita ou violação de segurança. • Treinamento e conscientização: Treinamento de funcionários para garantir que todos entendam a importância da governança de dados em cibersegurança e como seguir as políticas e procedimentos. • Revisão e melhoria contínua: Revisão regular das políticas e procedimentos de governança de dados para garantir que estejam atualizados e eficazes contra ameaças cibernéticas em constante evolução. Governança de Dados em CiberSegurança The Data Management Body of Knowledge (DAMA-DMBoK®) • A Data Management Association (DAMA) é uma associação sem fins lucrativos e independente de fornecedores de profissionais técnicos e de negócios dedicada ao avanço do gerenciamento de dados e gerenciamento de informações. • A organização cuida do desenvolvimento e execução deprocedimentos, práticas, políticas e arquitetura que gerenciam adequadamente todo o ciclo de vida dos dados de uma empresa. • O Guia DAMA-DMBOK® é um conjunto de boas práticas de Governança de Dados reunidas em um documento estruturado em forma de um framework. • https://www.dama.org/ O que é o Guia DAMA-DMBOK® Fonte: https://www.dama.org/ https://www.dama.org/ • Fornecer informações sobre as melhores práticas, funções e responsabilidades, entregáveis e métricas e modelos de maturidade para gerenciamento de dados. • Para padronizar as práticas de gestão em toda as áreas. • Servir como uma estrutura funcional para a implementação dessas práticas em qualquer contexto de negócios. • Estabelecer um vocabulário formal para esses conceitos. • Para esclarecer o escopo do que essas práticas podem e não podem fazer. • Para fornecer uma visão geral neutra do fornecedor das práticas de gerenciamento e possíveis alternativas para situações específicas. Objetivos do DAMA-DMBOK® Funções de Gestão de Dados • A estrutura DAMA DMBOK define 11 áreas funcionais de gerenciamento de dados de acordo com a 2ª edição de Julho de 2017. • A função Governança de Dados está localizada no centro da figura para demonstrar que exerce importante influência em todas as demais funções. • Além disso, a última edição do DMBoK contém seções dedicadas para ética de dados, big data, integração e interoperabilidade de dados e avaliação de maturidade em gerenciamento de dados. Fonte: DAMA-DMBOK2 Pirâmide DMBOK Fonte: https://dataninjago.com/ A pirâmide DMBOK define quatro fases para a jornada de gerenciamento de dados de uma organização: • Fase 1 (Camada azul) – Começa com a compra de ferramentas que incluem recursos de banco de dados. Modelagem e design de dados, armazenamento de dados e segurança de dados são as funções a serem implementadas inicialmente. • Fase 2 (camada laranja) – Começa a sentir as dores da má qualidade dos dados. Para melhorar a qualidade dos dados, metadados confiáveis e arquitetura de dados consistente são essenciais. Pirâmide DMBOK Fonte: https://dataninjago.com/ • Fase 3 (Camada verde) – Começam a aparecer as necessidades de suportes estruturais para as atividades de gerenciamento de dados que revelam a importância de uma prática adequada de governança de dados. Ao mesmo tempo, a governança de dados permite a execução de iniciativas estratégicas, como armazenamento de dados, gerenciamento de documentos e gerenciamento de dados mestres. • Fase 4 (camada vermelha) – dados bem gerenciados permitem análises avançadas. Ferramentas na Amazon Web Services https://aws.amazon.com/pt/blogs/aws-brasil/ferramentas-de-governanca-de-dados-na-amazon-web-services/ Definição de Gestão de Dados Derivado do termo que significa "fato“. É o novo petróleo, a nova eletricidade! É caro, por isso é um ativo valioso Nós o coletamos por um motivo... esperamos? Usado para referência ou análise. O que são dados e por que eles são importantes? Volumes do Big Data DADOS CORPORATIVOS MÉDIOS VOLUMES DOBRAM A CADA 1.2 ANOS 2.5 QUINTILHÃO GRÃOS DE AREIA NA TERRA 2.5 QUINTILHÃO BYTES DE NOVOS DADOS CRIADOS TODOS OS DIAS * Um quintilhão é 1 seguido por 18 zeros. Medida de Informação: Bits e Bytes Fonte: https://www.yumpu.com/en/document/view/4608427/disk-storage-measures Volumes do Big Data 1 TB = 1.024 GB = 1.048.576 MB = 1.073.741.824 KB = 1.099.511.627.776 B Por que os dados são importantes? • FATO - Os dados são o ativo mais valioso de uma organização depois de seu pessoal • FATO - Os dados são críticos para a execução de funções e processos de negócios • FATO - Sem vigilância constante e esforço para manter a entropia dos dados da ordem ou as rédeas da anarquia https://pt.wikipedia.org/wiki/Entropia_da_info rma%C3%A7%C3%A3o Fontte: sciphilos.info https://pt.wikipedia.org/wiki/Entropia_da_informa%C3%A7%C3%A3o https://pt.wikipedia.org/wiki/Entropia_da_informa%C3%A7%C3%A3o Econômico: Receitas, Custos, Lucros Lei e Regulamentação Marca e Reputação Fidelização de Clientes O Impacto Negativo da Má Gestão de Dados Então, Como Você Começa? • Faça dos dados uma prioridade de negócios, não uma função de TI. • Realizar uma auditoria de dados. • Implemente uma estratégia de dados – abrace tanto a melhoria quanto a exploração. • Preparar e aplicar uma política de dados para controlar as regras de acesso e uso. • Monitorar, medir e controlar os principais conjuntos de dados - dados de referência (ou núcleo) e dados mestre. • Criar e executar dados e projetos de aprimoramento de processos. • Implementar um sistema de Governança de Dados. O problema do Silo de Dados https://tigosoftware.com/data-silos-achilles-heel-large-organizations A solução “Centrada" nos Dados DADOS DE VENDAS DADOS DE MARKETING DADOS FINANCEIROS DADOS DE COMPRAS https://tigosoftware.com/data-silos-achilles-heel-large-organizations Trate os dados como infraestrutura Gestão dos Dados Fonte: https://inovecapacitacao.com.br/meta-brasileira-e-ser-lider-em-infraestrutura-de- transportes-na-america-latina/ Trate os dados como um ativo Ciclo PDCA Fonte: https://pt.wikipedia.org/wiki/Ciclo_PDCA Ciclo de vida dos dados Create Ingest StoreUse Archive Plan Fonte: Próprio autor ✓ Plano – Planejar/Especificar/Habilitar (Arquitetura do Sistema / Ciclo de Vida de Desenvolvimento / Conjuntos de Ferramentas / Infraestrutura / Padrões). ✓ Criar – capturar, adquirir, trocar, reutilizar, etapas do processo, controle de qualidade, metadados. ✓ Ingestão – Recebimento e Avaliação, Extração, Transformação e Carregamento. ✓ Armazenamento – Pastas vs Banco de dados, modelagem de dados. ✓ Uso – Finalidade, controle, controle de versão, acesso. ✓ Arquivo – como, onde, metadados, recuperação e acessibilidade, implicações de custo. Create Ingest StoreUse Archive Plan Ciclo de vida dos dados Fonte: Próprio autor Adapted from the well known Data-Information-Knowledge Triangle by OceanWise (2011) Wisdom??? Dados em Contexto • Gestão de Dados é a função na organização que cuida do planejamento, controle e entrega dos ativos de dados e de informação. • Esta função inclui: as disciplinas do desenvolvimento, execução e supervisão de planos, políticas, programas, projetos, processos, práticas e procedimentos que controlam, protegem, distribuem e aperfeiçoam o valor dos ativos de dados e informações. (Fonte: DAMA-DMBOK® Guide) Gestão de Dados Fonte: Rêgo (2013) Princípios da Gestão de Dados 5 princípios básicos que orientam a adoção da Gestão de Dados estabelecidos pelo DAMA: 1. Dados e informações são ativos valiosos das organizações. 2. Como todo ativo, os dados devem ser gerenciados, assegurando qualidade adequada, segurança, integridade, proteção, disponibilidade, compreensão e uso efetivo. 3. A responsabilidade da Gestão de Dados é compartilhada entre os Gestores de Dados de Negócio e os profissionais de Gestão de Dados de Tecnologia. 4. Gestão de Dados é uma disciplina de negócios e um conjunto de funções relacionadas. 5. Gestão de Dados é uma profissão emergente e em amadurecimento. Negócios: • Gerentes / Coordenadores • Gestor da Informação • Gestor de Dados do Negócio Estratégicos: • Executivo de Gestão de Dados (CDO – Chief Data Officer) • Gestor Estratégico de Dados Técnicos: • Gerentes / Coordenadores • Gestor Técnico de Dados • Administrador dos Repositórios de Metadados • Projetista de Dados • DBA de Infraestrutura • DBA de Aplicação • Arquiteto de Integração de Dados Papéis em Gestão de Dados Papéis em Gestão de Dados Fonte: Rêgo (2013) Certificações para o Profissional de Gestão de Dados alinhadas ao DMBOK: • CDMP - Certified Data Management Professional https://dama.org/content/certification • DGSP - Governance and Stewardship Professional https://www.iccp.org/data-professionals.html • CBIP - Certified Business Intelligence Professional https://tdwi.org/cbipCertificações em Gestão de Dados https://dama.org/content/certification https://www.iccp.org/data-professionals.html https://tdwi.org/cbip LGPD LGPD – Lei Geral de Proteção de Dados LGPD - Lei Geral de Proteção de Dados – Lei 13.709 de 14 de Agosto de 2018 • Dispõe sobre o tratamento de dados pessoais – Nome, gênero, preferências de lazer, GPS, IP, etc. • Conformidade/Compliance em agosto/2021. • Regras para coletar, armazenar, tratar e compartilhar dados pessoais. • Estende-se aos subcontratantes - fornecedores e parceiros. • Multas podem chegar em 2% do faturamento/R$ 50 milhões (por infração). • Somos os donos do nosso CPF, RG, número de telefone pessoal, endereço, etc. Apesar de não parecer, estes dados nos pertencem. O uso indiscriminado da internet no compartilhamento de dados só trouxe mais complexidade ao problema. Fonte: https://olhardigital.com.br/2021/08/17/tira- duvidas/lgpd-qual-a-diferenca-entre-dados-pessoais- sensiveis-e-anonimizados/ • Todo dado pessoal só pode ser tratado se seguir um ou mais critérios definidos pela LGPD, mas, dentro do conjunto de dados pessoais, há ainda aqueles que exigem um pouco mais de atenção: • Sobre crianças e adolescentes; • Dados “sensíveis”, que são os que revelam origem racial ou étnica, convicções religiosas ou filosóficas, opiniões políticas, filiação sindical, questões genéticas, biométricas e sobre a saúde ou a vida sexual de uma pessoa. LGPD • A comprovação se dará por meio dos documentos que devem compor o Relatório de Impacto à Proteção de Dados Pessoais, tais como: mapeamento do ciclo de vida do dado pessoal, mapeamento de risco, identificação dos agentes de tratamento em cada etapa ou processo de tratamento de dados, criação de políticas, códigos de conduta e comprovantes de treinamento, entre outros. • Ademais, existem certificações mundiais sobre segurança da informação, tais como a ISO 27001 e 27002. Como comprovar que a empresa garante a proteção dos dados? • Em âmbito administrativo, as multas aplicadas poderão ser arbitradas pelos órgãos fiscalizadores, tais como PROCONs, Ministério Público, entre outros. • Para cada multa será levado em consideração o grau de comprometimento da empresa com a segurança da informação e a proteção de dados pessoais, mediante a comprovação documental, a informação sobre o incidente aos titulares dos dados; o porte da empresa e seu faturamento. Multa caso a empresa não tenha se adequado à LGPD • O artigo 50 da LGPD determina que as empresas promovam ações educativas e de treinamento sobre o tratamento dos dados de acordo com a LGPD. • Desta forma, é recomendável que a empresa faça treinamentos com profissionais especializados para conscientização sobre a lei bem como faça treinamentos específicos para os setores mais envolvidos no tratamento de dados pessoais de acordo com o modelo de negócio de cada empresa. Treinamento para Segurança dos Dados Pessoais • Mapear e analisar o fluxo de dados pessoais tratado: o que envolve também a classificação entre o que é pessoal, sensível e crítico; • Identificar operações de tratamento realizadas: inclui a avaliação de plataformas e níveis de barreiras de segurança em cada armazenagem ou transferência de dados. O foco é avaliar todos os potenciais riscos de violações e vazamentos; • Indicação das bases legais para cada tratamento realizado: todas as formas de gestão de dados devem estar embasadas na legislação e em boas práticas de compliance; • Implantação de robustas metodologias de proteção: como por exemplo, criptografia de arquivos, uso de firewalls e uso de bancos de dados e tecnologias em compliance com segurança reforçada. Por onde começar a governança em LGPD? • Primeiramente, é importante ressaltar que os dados são separados em dois grupos; “estruturados” e “não estruturados”. • O primeiro trata de todo dado organizado, que segue um padrão e é facilmente processado, como por exemplo nomes e endereços. • Já os não estruturados são os dados que não possuem formatação, padrões ou sequências, sendo composto por elementos diferentes. Nesta categoria estão as mensagens de e-mail, posts em redes sociais, imagens, áudios e etc. Por onde começar a governança em LGPD? • De acordo com a lei, o dado pessoal é “toda informação relacionada a pessoa natural identificada ou identificável”, ou seja, são as informações básicas de um determinado individuo: nome, sobrenome, endereço de residência, RG, CPF, data de nascimento, e-mail, telefone, nacionalidade, hábitos de consumo, interesses – inclusive as informações que constam nas redes sociais, como as páginas que curtiu ou seguiu. Dados Pessoais Fonte: https://olhardigital.com.br/2021/08/17/tira-duvidas/lgpd-qual-a-diferenca-entre-dados-pessoais-sensiveis-e-anonimizados/ • O dado sensível é o “dado pessoal sobre origem racial ou étnica, convicção religiosa, opinião política, filiação a sindicato ou à organização de caráter religioso, filosófico ou político, dado referente à saúde ou à vida sexual, dado genético ou biométrico, quando vinculado a uma pessoa natural.” • Nesse caso, esse tipo de dado é relacionado à informações mais íntimas de um indivíduo. Essa característica acrescenta ainda maior cautela no manejo desse dado por instituições, porque seu uso só pode ser feito com autorização do titular e atendendo às regras legais – já que esse tipo de informação pode ser usada de forma discriminatória. Dados Sensíveis Fonte: https://olhardigital.com.br/2021/08/17/tira-duvidas/lgpd-qual-a-diferenca-entre-dados-pessoais-sensiveis-e-anonimizados/ • É o “dado relativo ao titular que não possa ser identificado, considerando a utilização de meios técnicos razoáveis e disponíveis na ocasião de seu tratamento.” • Esse tipo de dado é muito utilizado na realização de estudos e não está sujeito à aplicação da LGPD, no entanto, caso a empresa seja identificada, o dado recebe um novo nome e passa a ser um dado pseudonimizado. Dados Anonimizados Fonte: https://olhardigital.com.br/2021/08/17/tira-duvidas/lgpd-qual-a-diferenca-entre-dados-pessoais-sensiveis-e-anonimizados/ • Os dados identificáveis são aqueles que, sozinhos, não conseguem identificar o titular, mas somados a outras informações torna a ação possível. • Isso significa dizer que a soma de dados identificáveis, como por exemplo, o número do seu cartão de crédito (que você adicionou em uma loja on-line), seu CPF (usado, às vezes, em notas fiscais), o nome da empresa para a qual você trabalha (que você adicionou na hora de um cadastro), entre outros, se juntos, podem identificar você. Assim sendo, com a nova lei, também estão sob sua proteção. • Por sua vez, segundo o descrito em lei, a pseudonimização é “o tratamento por meio do qual um dado perde a possibilidade de associação, direta ou indireta, a um indivíduo, senão pelo uso de informação adicional mantida separadamente pelo controlador em ambiente controlado e seguro.” Dados Identificáveis e Pseudonimizados Fonte: https://olhardigital.com.br/2021/08/17/tira-duvidas/lgpd-qual-a-diferenca-entre-dados-pessoais-sensiveis-e-anonimizados/ • Por sua vez, segundo o descrito em lei, a pseudonimização é “o tratamento por meio do qual um dado perde a possibilidade de associação, direta ou indireta, a um indivíduo, senão pelo uso de informação adicional mantida separadamente pelo controlador em ambiente controlado e seguro.” • Tanto a anonimização quanto a pseudonimização são técnicas de mascaramento de dados, no entanto, a diferença é que um pode ter seu processo de reversão possível, oferecendo ao controlador informações adicionais na hora do tratamento de dados. Dados Identificáveis e Pseudonimizados Fonte: https://olhardigital.com.br/2021/08/17/tira-duvidas/lgpd-qual-a-diferenca-entre-dados-pessoais-sensiveis-e-anonimizados/ GDPR x LGPD • A LGPD possui inspiração em uma legislação europeia de proteção de dados pessoais, GDPR -General Data Protection Regulation ou Regulamento Geral sobre a Proteção de Dados, que entrou em vigor em maio de 2018. • O GDPR é a vanguarda do direito de privacidade de dados pessoais e possui amplitude a todo cidadão membro da União Europeia. • A LGPD brasileira tem influência direta do GDPR, pela sua característica vanguardista, mas também por questões comerciais, como ocorre frequentemente com normativos regulamentadores, nas mais diversas áreas. GDPR – General Data Protetion Regulation Fonte: https://tpomap.com/what-is-gdpr • Tanto a LGPD, quanto o GDPR, aplicam-se a qualquer empresa ou pessoa que trate dados pessoais dentro de suas respectivas jurisdições. A LGPD em território brasileiro, o GDPR no âmbito da União Europeia. • A LGPD e o GDPR definem de forma muito similar o conceito de dados pessoais, ou seja, informações relacionadas ou referentes a uma pessoa física identificada ou identificável. GDPR x LGPD Fonte: https://gatefy.com/pt-br/blog/pontos-comparacao-lgpd-brasileira-gdpr-europeia/ Princípios da LGPD: 1. Finalidade; 2. Adequação; 3. Necessidade; 4. Livre acesso; 5. Qualidade dos dados; 6. Transparência; 7. Segurança; 8. Prevenção; 9. Não discriminação; 10. Responsabilização. Princípios do GDPR: 1. Legalidade, justiça e transparência; 2. Limitação da finalidade; 3. Minimização de dados; 4. Precisão; 5. Limitação de armazenamento; 6. Integridade e confidencialidade e responsabilidade. GDPR x LGPD Em relação aos princípios de tratamento e proteção de dados, a LGPD estabelece dez princípios, enquanto o GDPR dispõe de seis princípios. Data Driven Data Driven • Data Driven Decision Making – DDDM – é o processo de coletar dados de acordo com os indicadores-chave de desempenho (KPIs) de uma empresa, e de transformar tais dados em percepções que podem ser colocadas em prática. • Esse processo é essencial para estratégias de negócios modernas. • Você pode usar ferramentas de BI neste processo, pois tornam a coleta de dados rápida e proveitosa. Tais ferramentas simplificam a visualização de dados e permitem que pessoas sem conhecimentos técnicos avançados possam analisá-los. Fonte: https://www.alamy.com/data-driven-business- concept-icon-image450776862.html Conceito de Data-Driven • Data-Driven refere ao uso de fatos (ou dados) para identificar padrões, deduções e percepções que fundamentem o processo de tomada de decisões. • Data-Driven significa a tentativa de tomar decisões sem permitir a interferência de vieses ou emoções. Assim, assegura-se de que as metas e o roteiro da empresa estejam fundamentados em fatos e padrões, não em preferências individuais. Fonte: www.questionpro.com/blog/data-driven-decision-making/ Porque Data Driven é Importante • DDDM é importante porque ajuda a fazer escolhas considerando fatos e com imparcialidade. Tomar decisões objetivas é a melhor forma de ser justo e equilibrado. • As decisões mais bem fundamentadas apoiam-se em dados que mensuram metas empresariais e se atualizam em tempo real. Podemos reunir dados necessários para identificar padrões e fazer previsões com softwares que geram relatórios. • Algumas decisões que podem ser amparadas por dados: • Impulsionar os lucros e as vendas; • Definir boas práticas de gestão; • Otimizar operações; • Melhorar o desempenho da equipe. 5 Passos para utilizar Data-Driven Fonte: asana.com/resources/data-driven-decision-making 1. Entenda qual é a visão de futuro da empresa – podemos usar OKRs anuais da empresa ou os KPIs trimestrais da equipe para fundamentar com dados as suas decisões). 2. Encontre fontes de dados • Margem bruta de lucro • ROI - Retorno sobre o investimento • Produtividade (total da produção pelo total dos custos) • Número total de clientes (quanto mais clientes, maiores as receitas do negócio). • Receita recorrente (SaaS), representa o montante de receita gerada por todos os assinantes ativos. 5 Passos para utilizar Data-Driven Fonte: asana.com/resources/data-driven-decision-making 3. Organize os Dados - 4. Analise os Dados 5. Tire Conclusões 3. Organize os Dados – Crie um painel executivo para examinar os dados relevantes num só lugar e compreender suas interconexões. 4. Analise os Dados - Contexto Organizacional de Dados • Em resumo, a governança de dados em cibersegurança é essencial para garantir que os dados sensíveis sejam protegidos contra ameaças cibernéticas. Isso requer uma abordagem abrangente que abrange políticas, procedimentos, treinamento e monitoramento constante. O Que são Dados? O que são Dados? • Os dados são elementos que constituem a matéria-prima da informação. • O dado representa a menor partícula de uma informação, assim como um átomo representa a menor partícula de uma matéria. • Podemos defini-los como o conhecimento bruto, que ainda não foi devidamente tratado de forma a prover insights para uma organização. • Dados, de forma isolada, não conseguem transmitir uma mensagem clara. O Que são Dados? • Exemplos: Manga, Roupa, Sapato. • Definimos dado como uma sequência de símbolos quantificados ou quantificáveis. Portanto, um texto é um dado. De fato, as letras são símbolos quantificados, já que o alfabeto por si só constitui uma base numérica. O Que são Dados? • Também são dados as imagens, sons e animação, pois todos podem ser quantificados a ponto de alguém que entra em contato com eles ter eventualmente dificuldade de distinguir a sua reprodução, a partir da representação quantificada, com o original. • É muito importante notar-se que qualquer texto constitui um dado ou uma sequência de dados, mesmo que ele seja ininteligível para o leitor. O Que são Dados? • Dados quantitativos ou numéricos que podem ser: • Discretos • número de ovos postos pela tartaruga marinha. • número de ataques de asma no ano passado. • Contínuos • Volume, área, peso, massa. • Velocidade do carro. Dados Quantitativos • Dados qualitativos ou categóricos podem ser: • Nominais • Cor dos olhos: castanho, verde, azul. • Fumante / Não Fumante. • Doente / Sadio. • Ordinais • Grau de periculosidade: baixa, média, alta. • Escolaridade: 1º grau, 2º grau, 3º grau. • Estágio do tratamento: inicial, intermediário, final. Dados Qualitativos Dados Estruturados x Dados Não Estruturados • Os dados estruturados, em essência, seguem uma estrutura rígida no qual foram armazenados. • Dados estruturados podem ser vistos como registros (ou transações) em um ambiente de banco de dados; por exemplo, linhas em uma tabela de um banco de dados SQL. Dados Estruturados Dados Estruturados • Os dados não estruturados vêm de fontes diversas, tais como internet e redes sociais. • Esses dados são coletados nos mais variados formatos – texto, imagem, som, vídeos – e precisam passar por um processamento antes de serem cruzados com outros dados e analisados. Dados Não Estruturados Dados Não Estruturados • Os dados não estruturados são mais abundantes do que os dados estruturados. • Exemplos de dados não estruturados são: Dados de mídia e entretenimento, dados de vigilância, dados geoespaciais, áudio, dados meteorológicos, e-mails, Internet das Coisas (IoT). Dados Não Estruturados Pirâmide DIKW • A Hierarquia ou pirâmide DIKW é o modelo utilizado para discussão de dados, informações, conhecimento, sabedoria e suas inter-relações. DIKW Fonte: https://www.researchgate.net/figure/ • Em 1955, o economista e educador anglo-americano Kenneth Boulding apresentou uma variação na hierarquia que consiste em "sinais, mensagens, informações e conhecimento". • No entanto, o primeiro autor a distinguir entre dados, informação e conhecimento e também empregar o termo “gestão do conhecimento” pode ter sido o educador americano Nicholas L. Henry, em um artigo de jornal de 1974. DIKW • No contexto do DIKW, os dados são concebidos como fato, símbolos ou sinais, representando estímulos ou sinais,que são inúteis. • Dados como fato: fatos ou observações discretas e objetivas, que são desorganizadas e não processadas. • Dados como sinal: estímulos sensoriais, que percebemos por meio de nossos “sentidos" ou "leituras de sinais", incluindo "leituras sensoriais e/ou sensoriais de luz, som, cheiro, sabor e toque”. • Dados como símbolos: "símbolos“ ou "conjuntos de sinais que representam estímulos ou percepções empíricas" de "uma propriedade de um objeto, um evento ou de seu ambiente". DIKW - Dados • A informação está contida nas descrições e é diferenciada dos dados por ser "útil". • Estrutural x Funcional • São dados organizados ou estruturados, que foram processados de tal forma que a informação agora tem relevância para um propósito ou contexto específico e, portanto, é significativo , valioso, útil e relevante. • Simbólico x Subjetivo • A informação pode ser concebida nos modelos DIKW como: • Universal, existindo como símbolos e signos; • Subjetivo, o significado ao qual os símbolos atribuem; • Ambos. DIKW - Informação • Conhecimento como Processado • É a síntese de múltiplas fontes de informação ao longo do tempo“ "organização e processado para transmitir compreensão, experiência, aprendizado acumulando uma mistura de informações contextuais, valores, experiência e regras. • Responde a perguntas “como”. • Caracterizado pela crença justificável do indivíduo de que é verdade - contextuais, valores, experiência e regras. DIKW - Conhecimento • Simplesmente é o conhecimento integrado—informação super útil. • A sabedoria como "saber as coisas certas a fazer" e "a capacidade de fazer julgamentos e decisões sensatas aparentemente sem pensar". DIKW - Sabedoria • A Pirâmide DIKW representa as relações entre dados, informações, conhecimento e sabedoria. Cada bloco de construção é um passo em direção a um nível superior - primeiro vêm os dados, depois as informações, depois o conhecimento e, finalmente, a sabedoria. • Cada etapa responde a diferentes perguntas sobre os dados iniciais e agrega valor a eles. • Quanto mais enriquecemos nossos dados com significado e contexto, mais conhecimento e percepções obtemos deles para que possamos tomar decisões melhores, informadas e baseadas em dados. DIKW - Sabedoria Fonte: Creative Commons Attribution 4.0 International DIKW – Diagrama de Fluxo, GI e GC O gerenciamento de informações combina processos de negócios, procedimentos e tecnologia para organizar, proteger e acessar os dados de uma organização independentemente do formato, incluindo dados digitais, documentos em papel e arquivos de áudio e vídeo. • A informação consiste em dados que um usuário inseriu em um computador, processou e colocou em contexto. • As empresas devem gerenciar essas informações com ferramentas como Microsoft SharePoint ou Alfresco; um sistema de gerenciamento de documentos, como Microsoft OneDrive ou Google Drive. Gestão da Informação - GI A gestão do conhecimento usa processos e ferramentas para transmitir sabedoria e compreensão de diferentes assuntos. • Quando a informação é colocada no contexto de ser usada para maior compreensão de um assunto, ela se torna conhecimento. • Esse conhecimento ajuda os funcionários a realizarem seus trabalhos, muitas vezes tornando-os mais eficientes. Também pode beneficiar os clientes de uma organização. • A gestão do conhecimento envolve a coleta, organização e compartilhamento do conhecimento. • Esse conhecimento pode estar na forma de documentos, vídeos e outros recursos destinados a ensinar as pessoas sobre um assunto específico. Gestão do Conhecimento - GC Ciclo de Vida do Dado ▪ Segundo o guia DAMA-DMBOK®, o dado pode ser: extraído, exportado, importado, migrado, validado, editado, atualizado, limpo, transformado, convertido, integrado, segregado, agregado, referenciado, revisado, relatado, analisado, garimpado, salvo, recuperado, arquivado e restaurado antes de eventualmente ser eliminado. Fonte: Rêgo (2013) Big Data Qual é o tamanho da web? ▪ Razões para usar o Big Data: – Entender padrões; – Prever situações; – Criar fronteiras; – Informar coleções de dados; – Estimar parâmetros escondidos; – Calibrar. Big Data Fonte: https://www.researchgate.net/publication/316994150_THE_INTERNET_OF_THINGS_EVOLUTION • Os 3Vs • Os 5Vs • Os 7Vs Big Data ❑ Volume: são os dados gerados a cada segundo. O volume define a quantidade de dados que temos – o que costumávamos medir em Gigabytes agora é medido em Zettabytes (ZB) ou mesmo Yottabytes (YB). A Internet das Coisas (IoT) cria um crescimento exponencial de dados. As projeções mostram o volume de dados mudando significativamente nos próximos anos. Os Vs do Big Data ❑ Velocidade: um dos grandes desafios do Big Data. A velocidade representa a velocidade com que os dados são processados e se tornam acessíveis. Hoje, se a entrega não for em tempo real, geralmente não é rápida o suficiente. Os Vs do Big Data ❑ Variedade: quanto mais dados e fontes, maior a complexidade, mas também é maior a chance de gerar informações úteis. A variedade descreve um dos maiores desafios do big data. Os insights podem vir sem estrutura. O ativo total pode incluir muitos tipos de dados, de XML a vídeo e SMS. Organizar os dados de maneira significativa não é tarefa simples quando os próprios dados mudam rapidamente. Os Vs do Big Data ❑ Variabilidade: a variabilidade é diferente de variedade. Uma cafeteria pode oferecer seis misturas diferentes de café, mas se você obtém a mesma mistura todos os dias e tem um sabor diferente a cada dia, isso é variabilidade. O mesmo acontece com os dados. Se o significado mudar constantemente, isso pode afetar significativamente a homogeneização de seus dados. Os Vs do Big Data ❑ Veracidade: o quanto a informação é verdadeira. A veracidade garante que os dados sejam precisos, o que requer processos para evitar que dados insuficientes se acumulem em seus sistemas. O exemplo mais simples é quando os contatos entram em seu sistema de automação de marketing com nomes falsos e informações de contato imprecisas. Quantas vezes você viu o Saci Pererê ou Mickey Mouse em seu banco de dados? É o clássico desafio de “entrar lixo, sair lixo”. Os Vs do Big Data ❑ Visualização: a visualização é fundamental no mundo de hoje. Usar tabelas e gráficos para visualizar grandes quantidades de dados complexos é muito mais eficaz em transmitir significado do que planilhas e relatórios repletos de números e fórmulas. Os Vs do Big Data ❑ Valor: deve-se gerar informações com valor. Depois de abordar volume, velocidade, variedade, variabilidade, veracidade e visualização – o que leva muito tempo, esforço e recursos –, você quer ter certeza de que sua organização está obtendo valor dos dados. Os Vs do Big Data IoT – Internet of Things IoT - Internet das Coisas • O termo foi utilizado pela primeira vez em 1999 para descrever um sistema onde os objetos poderiam ser conectados à internet. • Por causa do avanço do IoT, houve a necessidade de muito mais endereços de IP (IPv4 para IPv6 – 128 bits). • O fato de ter tantos dispositivos conectados à rede literalmente tem revolucionado o modo como vivemos. IoT - Internet das Coisas • Internet das Coisas ou, pela sigla “IoT” (Internet of Things), traz um conceito atual e transformador sobre a conexão entre objetos físicos utilizando sensores, chips e softwares. • Quando falamos de “coisas” em IoT, estamos nos referindo a qualquer objeto que teve a implementação de sensores e outros sistemas digitais para funcionar de forma mais inteligente por meio da troca de informações com pessoas e outros objetos, não necessariamente utilizando conexões de internet. • Essas trocas de informações podem ocorrer via radiofrequência (RFID), WiFi, Ethernet, Bluetooth, entre outras formas de conexão existentes atualmente, e os sistemas de redes de comunicação existemem diferentes proporções, podendo ser conectados à web mundial ou apenas à rede de casa ou ao carro do usuário, por exemplo. IoT − Internet das Coisas • 32 bilhões de coisas vão estar conectadas a internet. • 10% de todos os dados serão gerados por sistemas embarcados (versus 2% atualmente). • 21% dos mais valiosos dados serão gerados por sistemas embarcados (versus 8% atualmente). • Dados de telemetria - semiestruturados e contínuos - representam um desafio para bancos de dados relacionais, que exigem um esquema fixo e dados estruturados. IoT - Internet das Coisas • Poluição Sonora. • Otimizar coleta de lixo. • Controle de tráfego. • Controle de distribuição de energia elétrica. • Segurança pública. Cidades Inteligentes Casas Inteligentes Inteligência Empresarial ou de Negócios • A gestão pode ser mais eficiente com o uso das métricas corretas. Inteligência Empresarial • Processo de coleta, organização, análise, compartilhamento e monitoramento de informações para suporte a gestão de negócios. Inteligência Empresarial Inteligência Empresarial • Cloud Computing • Computação em nuvem, é um termo coloquial para a disponibilidade sob demanda de recursos do sistema de computador, especialmente armazenamento de dados e capacidade de computação, sem o gerenciamento ativo direto do utilizador. IOT – Internet of Things Fonte: https://www.linkedin.com/pulse/big-data-analytics-internet-things-ayushi- agrawal/ Big Data Fonte: https://towardsdatascience.com/how-is-the-current-state-of-big-data-analytics-in- controlling-1273c725ac6a Big Data Fonte: https://www.simpliaxis.com/resources/big-data-tools Business Intelligence (BI) x Business Analytics (BA) Fonte: Gartner Group Banco de Dados Ranking Banco de Dados https://db-engines.com/en/ranking https://db-engines.com/en/ranking Slide 1 Slide 2 Slide 3 Slide 4: Governança de Dados Slide 5: Governança de Dados Slide 6: Governança de Dados Slide 7: Governança de Dados Slide 8 Slide 9 Slide 10 Slide 11: Por que precisamos de Governança de Dados Slide 12 Slide 13: O que são Objetivos Estratégicos? Slide 14: A Governança de Dados apoia as metas estratégicas de negócios Slide 15: O que a Governança de Dados tem a ver comigo? Slide 16 Slide 17 Slide 18 Slide 19 Slide 20 Slide 21 Slide 22 Slide 23 Slide 24 Slide 25 Slide 26 Slide 27: Slide 28: Volumes do Big Data Slide 29 Slide 30: Por que os dados são importantes? Slide 31: O Impacto Negativo da Má Gestão de Dados Slide 32: Então, Como Você Começa? Slide 33: O problema do Silo de Dados Slide 34: A solução “Centrada" nos Dados Slide 35 Slide 36: Ciclo PDCA Slide 37: Ciclo de vida dos dados Slide 38 Slide 39 Slide 40 Slide 41 Slide 42 Slide 43 Slide 44 Slide 45 Slide 46 Slide 47 Slide 48 Slide 49 Slide 50 Slide 51 Slide 52 Slide 53 Slide 54 Slide 55 Slide 56 Slide 57 Slide 58 Slide 59 Slide 60 Slide 61 Slide 62 Slide 63 Slide 64 Slide 65 Slide 66 Slide 67 Slide 68 Slide 69 Slide 70 Slide 71 Slide 72 Slide 73 Slide 74 Slide 75 Slide 76 Slide 77 Slide 78 Slide 79 Slide 80 Slide 81 Slide 82 Slide 83 Slide 84 Slide 85 Slide 86 Slide 87 Slide 88 Slide 89 Slide 90 Slide 91 Slide 92 Slide 93 Slide 94 Slide 95 Slide 96 Slide 97 Slide 98 Slide 99 Slide 100 Slide 101 Slide 102 Slide 103 Slide 104 Slide 105 Slide 106 Slide 107 Slide 108 Slide 109 Slide 110 Slide 111 Slide 112 Slide 113 Slide 114 Slide 115 Slide 116 Slide 117 Slide 118 Slide 119 Slide 120 Slide 121 Slide 122