Buscar

GOVERNANÇA E QUALIDADE DE DADOS

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 3, do total de 41 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 6, do total de 41 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 9, do total de 41 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Prévia do material em texto

MBA EM GESTÃO DE INOVAÇÃO, TECNOLOGIA E EMPREENDEDORISMO
MODULO 3
GOVERNANÇA E QUALIDADE DE DADOS
1 - Era do Conhecimento
Quem tem a informação tem o poder
Peter Drucker é um dos mais renomados pensadores e consultores do mundo corporativo e foi o primeiro a se referir ao período que ocorre após a Era Industrial como a Era da Informação. Esta expressão revela uma mudança na importância que a propriedade da informação passa a ter no mundo naquele momento, em comparação com os antigos meios de produção e trabalho.
Os donos dos meios de produção sempre possuem um poder associado a esta propriedade na sociedade onde vivem, portanto nos tempos em que a agricultura era essencialmente o principal meio de produção, proprietários de grandes porções produtivas de terra possuíam também grandes riquezas e muito poder. Com o surgimento da Era Industrial, foram os donos dos meios industriais de trabalho que passaram a exercer este maior poder sobre a sociedade.
Como observado por Drucker, conforme o mundo caminhava em uma direção onde a informação passava a ser considerado um bem mais precioso, o número de trabalhadores mecânicos ou braçais vinha sendo substituído pelos trabalhadores intelectuais. Em outras palavras, o trabalho operário passou a ser cada vez mais automatizado e o trabalho intelectual cada vez mais valorizado.
"Que poder operário que nada! A sociedade caminha em direção à predominância do setor de serviços.”
 Daniel Bell, sociólogo nascido nos Estados Unidos.
Cada vez mais o poder foi se direcionando para às mãos das pessoas que possuíam conhecimentos de interesse aos demais. Isso acabou criando um conceito claramente expresso pela frase “Quem tem a informação tem o poder”. Governos e corporações rapidamente perceberam que a captura de informações seria um diferencial competitivo e investiram nesta direção. Em todo mundo foram criadas, por exemplo, agências de inteligência que suportavam os países em suas disputas militares na chamada Guerra Fria (CIA, KGB, MI6 etc.).
Nas corporações, muitos investimentos na coleta, armazenamento e processamento de dados foram feitos. Um grande exemplo é o varejista Walmart, um dos maiores do mundo. A empresa criou em meados dos anos 1980 aquele se tornou mais tarde o maior banco de dados privado do planeta. Mas ter a informação, na verdade, não cria nenhuma vantagem competitiva se o seu proprietário não puder (ou não souber como) usar esta informação.
Por isso a maneira mais adequada de se proferir a frase anterior deveria ser “Quem tem e usa a informação, tem o poder”. Foi isso que a equipe de gestão da Walmart fez: utilizando algoritmos de inteligência artificial ela transformou o dado que estava armazenado seu Banco de Dados em conhecimento aplicado. Este conhecimento trouxe lucro e vantagem competitiva para a empresa.
A Era do Conhecimento
Porém, diferentemente das mercadorias que os grandes varejistas mantêm estocadas em seus depósitos, a informação é um bem abstrato. A observação e registro de fatos concretos e que ocorrem no mundo à nossa volta vai gerar aquilo que chamamos de “dado”. São os dados que ficam armazenados em algum meio ou tecnologia. Pode ser um caderno, a nossa memória ou um dispositivo eletrônico de armazenamento como o HD de um computador.
Mas precisamos pensar no “dado” como o estado mais básico deste bem. Assim como o diamante bruto já é, em parte, o brilhante lapidado, o “dado” também já é um pouco de “informação”. Mas para que um dado se transforme efetivamente em informação ele precisa ser trabalhado. Ou como se diz geralmente, ele deve ser processado.
Contudo a quantidade de dados e informações com os quais nós e as empresas precisam lidar, muitas vezes, é maior do que percebemos em um primeiro momento. Então para que, de fato, se tenha algum tipo de poder ou vantagem competitiva, é necessário transformar “dado” em “informação” e combinar as informações na construção do conhecimento.
Esta percepção nos levou a, mais uma vez, mudar o nome da era em que vivemos de “Era da Informação” para a “Era do Conhecimento”. Além disso, hoje é cada vez mais fácil ter acesso a um volume enorme de informações, a verdadeira vantagem está em se conseguir extrair desta montanha de informações um volume significativo de conhecimento relevante.
No caso do Walmart a equipe foi capaz de identificar uma tendência de compra casada, onde um grupo significativo de pessoas que iam até a loja comprar fraldas também levavam cerveja. De posse deste conhecimento a equipe comercial pode rearrumar os produtos expostos de forma a potencializar sua venda e obter mais lucro.
Dado se Transforma em Conhecimento
Processar um dado em informação significa dar contexto e significado a este dado. O número “38”, por exemplo, é um dado bruto. Sem contexto e significado não diz muita coisa. Porém ao dizer que “38ºC se refere à medição da temperatura corporal de uma criança, feita por um termômetro analógico de mercúrio” o dado passa a ter contexto e significado. Passa a ser informação.
Toda mãe e pai sabe que uma criança com 38ºC de temperatura está com febre. Mas imagine, apenas por um instante, que esta informação chegou para uma pessoa que nunca foi apresentada ao conhecimento de que existe uma tabela padrão de temperatura corporal e que esta tabela indica qual é a faixa considerada “normal” da temperatura de um ser-humano. A temperatura de 38ºC está acima desta faixa.
Isso significa que, apesar de ter contexto e significado, a informação não tem utilidade prática para quem acabou de recebê-la. Do mesmo jeito, se a informação de que a criança está com febre chega para alguém que não sabe o que é febre ou que existem medicamentos para controlar este estado do corpo, também não tem utilidade, não lhe confere o poder de resolver a situação.
Agora voltemos à situação onde uma série de conhecimentos são combinados e possibilitam que esta mãe ou este pai possam tomar uma atitude. Vamos ver:
· Meu filho está com temperatura 38ºC.
· 38ºC é um estado de febre.
· Contra febre podemos aplicar um medicamento antitérmico.
· Porém a automedicação é perigosa, então devo consultar alguém.
· A pessoa que tem conhecimento e capacidade para me responder é o médico.
· Meu filho possui um médico pediatra que o acompanha.
· Eu tenho o número telefônico deste médico.
· Eu sei usar um telefone, então vou entrar em contato.
Perceba a quantidade e variedade de informações e conhecimentos que são utilizados, mesmo em um exemplo simples como este.
O Censo Americano
Conforme o mundo evoluiu, percebeu-se a importância do conhecimento e caminhamos da Era Industrial para a Era da Informação e depois a Era do Conhecimento. Isso significou que a sociedade precisou investir no desenvolvimento de novas ferramentas para processar tal volume de dados em um tempo tolerável. Foi exatamente o que fez Herman Hollerith ao inventar a sua máquina de contar usando cartões perfurados para dar suporte ao processamento do Censo Americano.
Nos Estados Unidos o censo da população é atualizado a cada dez anos e seus resultados interferem diretamente na política, já que o conhecimento gerado a partir dele é aplicado nas distribuições políticas do país. Porém no censo de 1880 foram necessários sete anos para apurar (contar) os dados coletados. Isso significa que o conhecimento só foi gerado sete anos após a coleta dos dados, quase no momento em que se precisava realizar uma outra coleta.
Identificando este prazo como um problema e, ao mesmo tempo, uma oportunidade, Herman Hollerith inventou uma máquina de contar que usava agulhas e cartões perfurados para processar os dados coletados. Como a implementação desta tecnologia, a apuração dos dados coletados no censo de 1890 levou apenas dois dias!
A máquina de contar inventada e comercializada pela empresa de Hollerith não era, ainda, um computador. Mas foi a base para o desenvolvimento alguns anos depois do IBM ASCC, também conhecido como MARK I. O primeiro computador comercial do mundo pesava 35 toneladas e tinha 16 metros de comprimento. Mas foi o grande precursor de todaa tecnologia que hoje nos permite viver em um mundo extremamente conectado e que gera e consome informação em uma velocidade extrema.
 
Atividade extra
Nome da atividade: Vídeo - Mario Sergio Cortella em A Era da Curadoria: O que Importa é Saber o que Importa
Link para assistir a atividade: https://www.youtube.com/watch?v=5TaaT30L8yg
2 - Conceitos Básicos
O que é Inteligência Competitiva?
Como uma evolução do conceito de “Era da Evolução” criado por Peter Drucker, passamos a chamar o tempo em que vivemos de “Era do Conhecimento”, quando ter a informação e transformá-la em conhecimento relevante e útil é o que realmente trará vantagens competitivas para uma empresa, um país ou mesmo para um profissional.
Desta forma, podemos afirmar que “Inteligência” é o ato de transformar “informação” em “conhecimento” e, por derivação, que “Inteligência Competitiva” é transformar as informações disponíveis em conhecimento que gere vantagens competitivas. Mas não seria correto afirmar que o campo da Inteligência Competitiva se restringe a esta transformação do dado.
O campo da Inteligência Competitiva reúne também todas as ações necessárias desde a coleta e armazenamento dos dados que serão matéria prima para a geração de conhecimento, bem como sua distribuição e apresentação de forma a permitir sua visualização, interpretação e utilização. Especificamente no caso da Inteligência Competitiva, o foco deverá sempre estar voltado para o ambiente competitivo onde opera uma organização.
Inteligência Competitiva é o ato de entender uma indústria e os concorrentes para que a empresa possa tomar as melhores decisões.
Significa que a Inteligência Competitiva tem como finalidade ajudar as empresas a prosperarem no mercado em que operam se mantendo competitivas a partir de decisões que são tomadas com mais inteligência e assertividade, pois são decisões baseadas no conhecimento extraído de informações do mercado.
Vale ressaltar que as informações de mercado em questão devem englobar a maior parte possível dos aspectos relevantes que atuam sobre o mercado em questão. Muitas vezes o foco acaba se resumindo aos concorrentes, que talvez seja a faceta mais explícita do mercado. Porém deve-se evitar uma visão restritiva quando uma série de outros elementos podem afetar a competitividade de uma organização. Veja, a seguir, alguns exemplos que devem ser levados em consideração:
· Clientes;
· Parceiros;
· Fornecedores;
· Governos;
· Agências reguladoras;
· Formadores de opinião, entre outros.
Muitas vezes o termo Inteligência Competitiva (“Competitive Intelligence”) se confunde com o termo Inteligência de Negócios (“Business Intelligence”), porém é importante ressaltar que, apesar de próximos, trata-se de conceitos diferentes. Enquanto o primeiro está focado nos elementos que estão no ambiente externo à organização e que afetam sua competitividade, o segundo engloba também elementos no contexto interno das organizações. Outra forma de expor a diferença é entender que o negócio envolve aspectos externos (competitivos) e aspectos internos que posicionarão a organização de forma mais ou menos competitiva no mercado.
O que é Big Data?
A Era do Conhecimento é tanto consequência como causa para o aumento significativo dos dados que são produzidos e consumidos no mundo. A evolução tecnológica acelerada, a diminuição do custo de armazenamento, o alto grau de conexão entre pessoas, empresa e sistemas e uma cultura de monitoramento e compartilhamento de informações são catalisadoras para que este aumento seja exponencial.
Observe a curva representada no gráfico a seguir.
Este gráfico impressiona não apenas pelo volume em si, pois estima-se que em 2020 a humanidade terá produzido o equivalente a 40.000 EB de informação digital. Mas ele impressiona também pela forma de uma curva exponencial e de crescimento acelerado. Ao mesmo tempo não conseguimos ver motivos para esta aceleração no crescimento do volume de dados diminuir nas próximas décadas. A tendência é que o mundo produza ainda mais informações.
A explosão no volume, complexidade e variedade de dados trouxe uma consequência rápida e direta: os sistemas e a tecnologia disponível não estavam preparados para lidar com isso. Em outras palavras, sistemas tradicionais passaram a ter dificuldade para armazenar e processar tantos dados e, com isso, surge o “Big Data”. Veja, a seguir, a definição oferecida pela própria McKinsey:
Big Data é “um grande conjunto de dados gerados e armazenados com os quais os aplicativos de processamento de dados tradicionais ainda não conseguem lidar em um tempo tolerável”.
Então o termo “Big Data” originalmente se refere aos dados, mas com o tempo passamos a utilizá-lo para designar também todas as técnicas, ferramentas e tecnologias criadas para lidar com tal volume de dados. Big Data passou a ser, até mesmo, usado como sinônimo do uso deste volume de dados e a transformação desde dado em conhecimento (“o big data nos mostra que nossos clientes têm uma tendência a preferir o produto A ao produto B na hora em que navega no site”, por exemplo).
A primeira e mais notável implicação do big data é justamente a produção, captura, armazenamento e processamento de cada vez mais dados. Se antes um dado parecia irrelevante por não trazer qualquer vantagem competitiva, agora as possibilidades de combinar imensos volumes destes dados com outros dados e de utilização de algoritmos de mineração de dados e inteligência artificial passou a gerar conhecimentos e possibilidades antes não percebidos. Que possibilidades são estas? Mais assertividade e maiores retornos financeiros.
Mas para que um grande volume de dados seja considerado, de fato, big data, algumas características devem ser observadas. Convencionou-se observar estas características através de um modelo baseado em 5 Vs:
· Volume - big data trata de um grande volume de dados.
· Variedade - são dados variados em termos de conteúdo e formato.
· Velocidade - nos processamentos envolvidos.
· Veracidade - das informações e conhecimentos derivados;
· Valor - gerado pela utilização destes dados.
Então não basta reunir uma grande quantidade de dados para que se esteja trabalhando com big data.
O que é Qualidade?
A palavra “qualidade” é um substantivo, não um adjetivo. Isso significa que é uma propriedade de um ser ou uma coisa. Não é algo que se “tem” ou “não tem”. É uma característica que pode ser medida e pode possuir um aspecto positivo ou negativo. Podemos dizer, por exemplo, que “este é um produto de boa qualidade” ou “este é um produto de baixa qualidade”.
Mas o que irá definir se algo tem boa ou má qualidade? Vários são os aspectos e elementos que podem contribuir para a avaliação da qualidade de algo. São alguns dos elementos básicos da qualidade:
· Desempenho;
· Confiabilidade;
· Conformidade;
· Durabilidade;
· Disponibilidade.
É, portanto, a medida de adequação dos indicadores destes elementos comparados com a expectativa que se tem em relação a algo que determinará o seu nível de qualidade. Ter alta qualidade significa que se tem alta adequação em relação às expectativas.
O que é Governança?
Na Sociedade do Conhecimento não apenas as empresas são grandes produtoras e consumidoras de dados. As pessoas também desenvolveram hábitos que as tornaram cada vez mais digitais, conectadas e ávidas por informação. Esta tendência acaba deixando uma infinidade de informações registradas e disponíveis na nuvem da internet, criando um perfil e rastros digitais universais e permanentes de praticamente qualquer pessoa.
Esta enorme profusão de dados tem efeitos extremamente positivos em vários aspectos, como uma melhor prestação de serviço por parte das empresas e recomendações que nos ajudam a ter experiências mais personalizadas e adequadas aos nossos gostos. Mas é claro que “todo este poder” traz, por outro lado, “grandes responsabilidades”. Valores e responsabilidades de toda a sociedade precisam ser revistos à luz desta nova realidade.
Mas como as empresas devem lidar com todas estas questões de ética no uso dos dados, privacidadee coleta de dados particulares? A resposta está na elaboração e divulgação de um plano de Governança de Dados. Governança de dados se refere ao gerenciamento dos dados de uma empresa, sua disponibilidade, seu uso e a segurança da informação compartilhada dentro da empresa. Suas políticas e mecanismos devem assegurar que a informação inserida pelos colaboradores ou por um processo automatizado cumpra requisitos e padrões consoantes com seus valores. Trata-se de aspectos como a integridade dos dados, regras de utilização, políticas de acesso e divulgação, segurança etc.
 
Atividade extra
Nome da atividade: Filme: Duplicidade (https://www.imdb.com/title/tt1135487/)
O filme duplicidade é uma comédia romântica de 2009 onde Claire Stenwick (Julia Roberts) é uma ex-agente da CIA (EUA) e Ray Koval (Clive Owen) é um ex-agentes do MI-6 (Reino Unido). Se conhecem de seu período como espiões governamentais, mas agora trabalham para corporações da iniciativa privada rivais e se encontraram “fortuitamente” em um caso de espionagem industrial. Eles têm como missão encontrar a fórmula química de um cosmético que renderá uma fortuna à corporação que patenteá-lo primeiro.
 
3 - Coleta de Dados
Onde os dados são produzidos?
Os dados são a matéria-prima fundamental para a criação de informação e transformação em conhecimento. Desta forma, para que se possa criar conhecimento em um ambiente de Inteligência Competitiva, a cadeia produtiva de conhecimento possui as seguintes etapas:
· Coleta;
· Higienização;
· Padronização;
· Contextualização;
· Disponibilização.
Portanto, para que haja dados disponíveis à produção do conhecimento, o primeiro passo é coletar estes dados para que possam ser inseridos em um ambiente de geração do conhecimento. Porém os dados não são criados no ambiente de inteligência Competitiva, mas sim armazenados e utilizados neste ambiente.
Os dados são representações (registros) de algo que ocorreu no mundo real e geralmente são coletados e armazenados em um sistema transacional. É bem da verdade que um dado, fundamentalmente, não precisaria ser registrado em um sistema transacional, já que existem outras tecnologias mais antigas de registro, como livros, cadernos etc. Mas do ponto de vista dos nossos estudos, um dado precisa estar registrado em uma fonte eletrônica para que possa ser inserido na cadeia produtiva de conhecimento.
Com isso, podemos afirmar que os sistemas transacionais são as origens dos dados que serão inseridos no processo de criação do conhecimento usando BI.
Onde o dado se transforma em conhecimento?
De forma mais concreta, muitos exemplos podem ser observados onde dados são registrados e armazenados em sistemas transacionais para que posteriormente sejam inseridos na cadeia produtiva de conhecimento. Em um supermercado, por exemplo, esta ação está muito bem delimitada pelo momento chamado de check-out.
O check-out é quando um cliente se direciona para a fila do caixa e um operador de caixa inicia o registro dos itens comprados no sistema. Podemos dizer que as principais funções do operador de caixa neste momento são:
1. Iniciar uma transação;
2. Eventualmente identificar o cliente, embora em muitos supermercados esta identificação ainda não aconteça;
3. Realizar o registro de um item da compra, ou seja, um produto que o cliente tenha colocado no carrinho e esteja levando para casa. Esta operação é repetida inúmera vezes, até que todos os itens estejam registrados.
4. Encerrar a transação recebendo o pagamento do valor total.
Do ponto de vista das operações do supermercado, este é um processo fundamental e que faz parte do dia-a-dia da empresa. Além de ser um registro digital de um evento que está ocorrendo fisicamente nas lojas. Do ponto de vista da cadeia produtiva de conhecimento, esta é uma ação fundamental de coleta de dados.
Porém este dado, após ser coletado, precisa ser processado e transformado em conhecimento. Esta transformação ocorre em um sistema de Inteligência de Negócios ou Inteligência Competitiva. Genericamente podemos dizer que se trata de um ambiente de Business Intelligence (BI). Ou seja, um banco de dados em formato analítico (Data Warehouse ou Data Mart) que reúne dados de diversas fontes transacionais.
Como os dados são coletados?
Algumas empresas, como os supermercados, não têm a informação como base fundamental de seu negócio. O registro e a coleta são realizados como parte do negócio, mas o supermercado não “vive” de informação, ele “vive” de adquirir, armazenar e vender produtos alimentícios. Supermercados não precisam usar os dados de forma estratégica, embora possam usar e com isso obter grandes resultados.
Outras empresas, entretanto, têm a informação como base fundamental de seus negócios. São empresas que geram receita justamente através da coleta e venda de dados e informação. Como exemplos podemos citar a empresas de processamento de dados, consultorias, auditorias, escolas etc.
Vamos olhar para a indústria de seguros, por exemplo. Ao adquirir uma apólice, o segurado está “comprando” uma promessa de que, caso algo venha a acontecer (um sinistro) com algo que esteja protegido pelo seguro (o bem segurado), a seguradora irá arcar parcial ou completamente com os custos de reposição ou reparação do bem (a indenização).
Em outras palavras, o que a seguradora “vende” é a administração de todos os riscos de sua carteira, tecnicamente conhecido como “sinistralidade”. Para tanto, uma série de cálculos atuariais precisam ser realizados com base nas características de sua carteira de risco, tornando a correta coleta de dados uma atividade fundamental para o sucesso e sobrevivência do negócio.
Os dados são coletados em diversos momentos, sendo os mais representativos a fase de proposição e avaliação do risco para a emissão da apólice e o registro dos sinistros que ocorrem com os bens da carteira segurada. Nos dois momentos estão envolvidas pessoas fundamentais para a correta coleta de dados, como os próprios clientes, corretores de seguro e inspetores de riscos (vistoriadores).
Como podemos notar, a coleta de dados neste exemplo é bastante sensível. Outro exemplo em que a coleta de dados é extremamente sensível são os serviços médicos. Imaginem um hospital, por exemplo, onde pacientes são consultados e precisam ser corretamente medicados. Neste caso podemos dizer que a coleta de dados é, de fato, um caso de vida ou morte.
Além disso há toda uma sensibilidade com relação à natureza do dado coletado. Informações trocadas por médicos e pacientes, e registradas nos sistemas de prontuário eletrônico dos hospitais, são informações sigilosas por lei. Questões éticas e de governança destes dados são extensamente discutidas nas escolas de medicina e são preocupação constante nos responsáveis de tecnologia da informação de hospitais.
São dados pessoais e que possuem extremo interesse médico, mas que também poderiam ser utilizados, por exemplo, pelas empresas de seguro no momento de avaliar o risco de uma pessoa em um seguro de vida. Porém é antiético e contra lei que estes dados sejam fornecidos pelo hospital para a seguradora sem que o paciente, verdadeiro dono desta informação, seja consultado.
Agora notem que nos exemplos acima, nas atividades de coleta de dados, há sempre um elemento em comum que são as pessoas responsáveis pela coleta do dado (operador de caixa de supermercado, corretor de seguros, vistoriadores, médicos, enfermeiros etc.). Acontece que cada vez mais o elemento humano vem sendo substituído no processo por sensores e sistemas eletrônicos que, muitas vezes, não apenas dão conta do recado como realizam a tarefa com muito mais assertividade, mais velocidade e menos custos.
Vamos olhar para o caso de uma rodovia, por exemplo. É extremamente importante para os operadores de tráfego da rodovia compreender quais são os volumes de tráfego que ocorrem em cada trecho da estrada nas diferentes horas do dia. Mas seria muito improdutivo que esta coleta fosse realizada por pessoas contando o número de veículos passando em alta velocidade a cada hora, em cadatrecho. Para coletar estes dados a administração deverá fazer uso de sensores espalhados nos pontos estratégicos do percurso e integrados a um banco de dados que centraliza o dado. Ou seja, o processo de coleta de dados neste caso ocorre sem interferência humana direta.
Outro exemplo em que sensores são utilizados para coletar os dados é no momento em que uma pessoa “conectada” está praticando exercícios físicos. Tradicionalmente a corrida era uma atividade simples, que não requer muita estrutura (diferentemente dos esportes de quadra, por exemplo) e na maioria das vezes realizada de forma individual.
Mas é cada vez mais comum que o praticante de corrida se utilize de vários devices tecnológicos que o acompanham durante a prática. Estes devices têm a função de tornar o treino mais agradável (possibilitando que o praticante ouça música por exemplo), mais seguro (acompanhando sinais vitais como pressão e batimento cardíaco) e mais otimizado em termos de performance (registrando dados de performance como tempo etc.), Mas é notável que todas estas facilidades são, ao mesmo tempo, fontes geradoras de dados.
Vamos avaliar algumas sob este aspecto:
· Música: enquanto a pessoa ouve música usando um aplicativo como o iTunes ou o Spotify, dados são coletados sobre os hábitos musicais de cada pessoa. Que estilo, músicos, autores são ouvidos com qual frequência, em quais horários do dia, em qual volume etc. Há ainda as informações de quais músicas são agrupadas em quais playlists, quais são compartilhadas entre amigos etc. Estes dados ajudam os aplicativos a fornecer uma experiência mais personalizada, recomendando com mais assertividade novas músicas e autores, por exemplo. Mas também traçam um perfil musical que, associado a outros dados de perfil (demográficos, locais onde costuma circular, navegação na internet etc.) são fonte valiosa para que a indústria da música possa direcionar os seus investimentos. Também são informações que podem ser utilizadas por outras indústrias como a publicidade e a indústria de entretenimento como um todo.
· Corrida: enquanto a pessoa corre usando um aplicativo de monitoramento (Nike Run, RunKeeper etc.) dados são coletados sobre tempo, ritmo, velocidade, percurso e batimentos cardíacos. Há ainda classificações feitas pelos próprios participantes (quão intenso foi aquele treino, se foi recreativo ou de velocidade etc.) e a possibilidade de associar grupos de amigos que correm separadamente, mas formam um grupo virtual de corrida. Estes dados são utilizados pelos aplicativos para otimizar a performance do corredor, propondo desafios, planilhas de treino personalizada etc. Mas também têm imenso valor para empresas de materiais esportivos (“está na hora de comprar um tênis novo!”), empresas promotoras de eventos esportivos (faz sentido realizar uma maratona na cidade?) e seguradoras (qual o nível de sedentarismo de uma pessoa que está fazendo um seguro de vida?).
Este exemplo ilustra com o conceito de coleta de dados está expandido e vem fazendo cada vez mais parte de nossa vida, de forma natural e muitas vezes onipresente.
Extração, Transformação e Carga de Dados
Pois bem, dados são representações de algo na vida real que são inseridos, armazenados e processados em sistemas operacionais, mas depois podem ser inseridos em uma cadeia produtiva de conhecimento suportada por uma estrutura de Business Intelligence (BI). Para que isso ocorra, o dado precisa ser:
· Extraído dos sistemas transacionais.
· Transformados de forma que fiquem higienizados e padronizados.
· Carregados no banco de dados do Business Intelligence.
Este processo recebe o nome de ETL, que significa Extract, Transform and Load. Como o conhecimento de qualidade é criado a partir de dados de qualidade, é importante que o processo de ETL mantenha, ou até acrescente, a qualidade a estes dados, o que é feito na etapa de transformação do dado.
Como exemplo, vamos imaginar uma falha no processo de coleta de dados onde, ao preencher o nome da cidade de residência de um cliente, os usuários do sistema transacional cometem pequenos erros de digitação. No final, clientes são associados a cidades reais como “São Paulo”, “Rio de Janeiro” e “Fortaleza”, mas também são associados a cidades que não existem como “Sao Paulo”, “Sâo Paulo”, “Rio Janeiro” e “Fortalesa”.
Neste caso será na etapa de transformação, após extrair estes dados do sistema transacional e antes de carregá-los no BI, que o processo irá tentar corrigi-los, Esta correção poderá usar um algoritmo de aproximação fonética, por exemplo, que analisa cada dado “cidade” que não esteja na base de municípios do Brasil e tenta correlaciona-lo com o texto (nome da cidade) mais próximo.
A etapa de transformação pode não apenas corrigir os dados, mas também padronizá-los de forma que fiquem sobre o mesmo contexto. Exemplos comuns de padronização são a conversão monetária para que todos os valores sejam armazenados em uma mesma moeda, evitando que US$ 100.00 sejam confundidos com R$ 100,00 já que representam valores bem diferentes.
 
Atividade extra
Nome da atividade: Veja o vídeo de apresentação da loja Amazon Go. Trata-se de um ponto de vendas físico totalmente baseado em autosserviço implantado pela Amazon. Note que toda a operação e coleta de dados são realizadas sem a interferência de um funcionário da loja. Apesar disso não podemos dizer, ainda, que não há um humano envolvido já que o cliente deve estar presente para escolher e pegar os produtos das prateleiras.
Local para acessar o vídeo: https://www.youtube.com/watch?v=NrmMk1Myrxc
4 - A Sociedade do Conhecimento
Sociedade do Conhecimento
Já deve estar claro que na Era do Conhecimento as empresas que não apenas possuem, mas usam a informação para gerar conhecimento estratégico, têm uma baita vantagem competitiva em relação às empresas que ainda não estão preparadas para este novo tempo. Mas não são apenas as empresas que estão preparando-se e ajustando-se à Era do Conhecimento. As pessoas, e por consequência, toda a sociedade já vive este momento de forma intensa.
Vivemos em uma sociedade digital, extremamente conectada e ávida pela produção e troca de informações. Nesta sociedade, uma grande parte das relações humanas se estabelecem por um meio digital como as redes sociais, sites de relacionamento, aplicativos de mensagens, e-mail etc. Casamentos são formados (e desfeitos) através da rede, amigos se mantém conectados e até mesmo pessoas que moram juntos realizam pelo menos uma parte de suas conversas usando um celular ou outro device.
Uma consequência direta e imediata desde jeito de se relacionar é que tudo isso fica registrado, pode ser rastreado e gera uma imensa quantidade de dados. Além disso cada um de nós tem um perfil, uma impressão digital pública, universal e eterna. Vivemos hiperconectados e nos tornamos cada vez mais dependentes das informações que produzimos e colhemos desta rede.
Pessoas e Organizações data centric
Estas características da nossa sociedade acabam nos moldando em pessoas muito mais dependentes da informação compartilhada. Passamos a fazer as nossas escolhas com base em reviews, recomendações e buscas. Raramente nos aventuramos em uma nova experiência sem antes checar a reputação da empresa ou das pessoas envolvidas em fornecer aquela experiência, antes de tentar alguma coisa nova pesquisamos se alguns dos nossos mais de um milhão de amigos da rede social já têm uma opinião formada sobre aquilo. Tão logo experimentamos algo, rapidamente corremos para compartilhar, avaliar, recomendar, ranquear etc.
Isso só fortalece as nossas pegadas digitais e enriquece o nosso profile (perfil) disponível na rede. Cada vez mais, nossos passos estão registrados, contabilizados e disponibilizados para que as organizações possam utilizá-los de forma estratégica. E estes registros cada vez extrapolam o mundo digital para o mundo real, quando passamos a ser monitorados por tecnologias como o GPS, contadores de passos, câmeras com reconhecimento facial e sensores de sinais vitais. Basta lembrar do exemplodiscutido há pouco em outro material onde uma pessoa praticava corrida usando devices como um smartphone e um smartwatch rodando apps de monitoramento.
A imensa disponibilidade de informações e o acesso facilitado a esta informação tem mudado não apenas a forma como as pessoas se relacionam entre si. Mudou também a forma como se relacionam com o aprendizado e com a forma de pensar. Se antes uma das capacidades mais valorizados do cérebro humano era a capacidade de memorização, hoje em dia é muito mais importante ter uma boa capacidade de pesquisa.
Por séculos toda a estrutura educacional da sociedade foi baseada na memorização. Era a figura de um mestre (ou professor), detentor do conhecimento e que mostrava ao aluno como algo deveria ser feito para que este memorizasse o jeito certo de fazer e se tornasse, ele próprio, um mestre para outros aprendizes.
Atualmente os conceitos mais modernos de ensino e educação pressupõem um modelo de “ensinar o aluno a aprender”. Treiná-los nas habilidades para que este possa utilizar-se das ferramentas disponíveis de acesso ao conhecimento. Hoje, para aprender sobre qualquer assunto, as pessoas podem buscar informações na internet ou nas redes sociais, por exemplo. E o conhecimento passar a ser criado de forma coletiva porque a partir do momento que todos podem ser detentores de uma parte do conhecimento, todos são mestres e aprendizes ao mesmo tempo.
A pesquisa e a busca passam a ser tão importante que em 2006 a palavra “google” é incluída no dicionário, alçando o nome de uma ferramenta de buscas a um verbo que descreve uma ação cada vez mais comum em nossas vidas. Se temos alguma dúvida, “googlamos” sobre o assunto.
Toda esta disponibilidade e informações e o grande número de opções deveria, intuitivamente, nos deixar mais livres. Hoje não dependemos do conhecimento ou da opinião de um pequeno grupo de pessoas, pois temos acesso a milhões de opiniões e conhecimentos à distância de apenas um clique de mouse. Porém, como bem observou Barry Schwartz, este excesso de opções pode ser, muitas vezes, extremamente opressor criando um efeito que ele chamou de “Paradoxo da Escolha”. Temos tantas opções que ficamos perdidos e passamos a ter, na verdade, menos liberdade.
É, portanto, uma realidade que também cria novos comportamentos e gera ansiedades que não tínhamos antes. Uma dessas é conhecida pela sigla FOMO, que significa Fear Of Missing Out. Em uma tradução livre seria algo como o temor de perder uma oportunidade. É a ansiedade de deixar alguma coisa passar porque estava desconectado ou desconectada.
De fato, pesquisas revelam que um terço das pessoas, quando estão sem acesso à internet, têm o sentimento de “perda de controle” e que 36% já ficam nervosas se o celular está próximo de ficar sem bateria. Isso é mais uma prova de que o ser-humano cria uma tecnologia e esta tecnologia molda um novo jeito de viver do próprio ser-humano, como se “criasse” de volta um novo ser-humano.
Esta é sociedade em que vivemos, uma sociedade onde o conhecimento coletivo, universal e compartilhado já faz tão parte de nossas vidas que desconectar-se dele passa a ser um grande problema para muitas pessoas.
Impressão Digital
Esta relação de hiperconexão, monitoramento e compartilhamento de informações criam para cada indivíduo da Sociedade do Conhecimento uma espécie de “impressão digital”. Neste caso o termo “impressão digital” não está relacionado ao uso comum que se refere ao desenho único formado pelas papilas dos dedos das mãos. Aqui estamos usando o termo para denotar a impressão, ou as pegadas, que cada um dos indivíduos deixa no mundo digital.
Note que, neste caso, a impressão deixada no mundo digital também é única para cada pessoa, permanente ou eterna dado que é quase impossível excluir um conteúdo que tenha sido espalhado pela nuvem da internet e virtualmente universal, já que é muito difícil controlar quem tem acesso ao que é compartilhado em redes sociais, sites etc.
Esta “impressão digital”, apesar de viver no mundo virtual digital, cada vez menos trata apenas da nossa persona digital e passa a englobar características do mundo real a partir do momento que nossos hábitos passam a separar cada vez menos estes “dois mundos”. Usamos devices reais como o telefone celular para ser um ponto de acesso permanente ao mundo virtual. Isso significa que, cada vez mais, pessoas, empresa e/ou governos passam a ter acesso a parte ou à totalidade desta impressão digital.
Eu, Você e os Robôs
E o mundo não tem demonstrando tendências de que esta característica irá arrefecer. Ao contrário, vemos cada vez mais oportunidade de interação com o mundo virtual em nosso dia-a-dia. Envolvendo cada vez mais sistemas, computadores e robôs em nosso cotidiano.
Antigamente tínhamos a impressão de que robôs viveriam misturados em nossa sociedade no futuro, mas prevíamos basicamente duas realidades: uma em que os robôs de fato pareciam robôs humanoides, onde estava claro que se tratavam de robôs que estavam postos ali para nos auxiliar (como a robô doméstica da família Jetson) ou imitações tão perfeitas do ser-humanos que, muitas vezes, teríamos dificuldades de identificá-los como robôs (como os androids do filme Blade Runner).
Mas o que a realidade tem nos mostrado é um pouco diferente. Os robôs, na verdade, não necessariamente se parecerão com robôs ou com seres-humanos. Quer dizer, alguns sim, mas a maioria será como um eletrodoméstico, um carro ou um item comum do dia-a-dia, mas com inteligência. Além disso não se trata mais de ficção científica. Os robôs já estão entre nós.
Sabe aquela máquina de autosserviço para venda de refrigerantes que fica no seu caminho para o trabalho? Que de vez em quando você para por ali para comprar alguma coisa, de vez em quando você apenas passa em frente dela? Pois bem, ela pode ser um “robô” com inteligência artificial capaz de lhe reconhecer e aprender com seus hábitos.
A Coca-cola possui um projeto de inteligência artificial implantada em máquinas de autosserviço onde clientes podem combinar ingredientes para criar o seu refrigerante favorito. Podem, por exemplo, misturar um refrigerante de cola com um pouco de suco de laranja ou, quem sabe, misturar sabores de frutas diferentes em um único copo de refrigerante.
Com o tempo espera-se que a máquina reconheça os clientes e suas preferências, melhorando a experiência de compra, mas também aprendendo e alimentando a companhia com sugestões de novos refrigerantes que podem ser oferecidos em cada região.
Extrapolando as funcionalidades, e aqui estou usando uma liberdade de imaginação sem qualquer compromisso com o que a empresa realmente está fazendo, podemos imaginar que estas máquinas também “observam” as pessoas que passam por ela, mas não param para realizar uma compra. Existe uma série de questões éticas sobre privacidade que precisam ser levadas em conta, é claro, mas imaginem o tipo de inteligência que poderia ser criada caso todas as máquinas de autosserviço passassem a ser observadores ativos do fluxo de pessoas que caminham diante delas?
 
Atividade extra
Nome da atividade: Assista à palestra de Ben Schwartz no TEDGlobal 2005 sobre o paradoxo da escolha.
Endereço para assistir ao vídeo: https://digitalks.com.br/noticias/hiperconectividade-como-e-relacao-do-usuario-com-os-meios-digitais/#
5 - O uso ético dos dados
O uso ético dos dados
Na Sociedade do Conhecimento não apenas as empresas são grandes produtoras e consumidoras de dados, mas pessoas também desenvolveram hábitos que as tornaram cada vez mais digitais, conectadas e ávidas por informação. Um dos hábitos mais comuns e que mais potencializa esta profusão de dados é o uso constante do celular. Segundo o IBGE, o Brasil fechou o ano de 2016 com 116 milhões de pessoas conectadas à internet (64,7% de toda a população), sendo que o celular ainda é o principal aparelho de conexão, usado por 94,6% dos internautas. Mas o celular vai além de um aparelho de acesso à internet. É o principal instrumento de acesso ao mundo virtual, mas é também uma máquina de geraçãode dados (acessos, localização, aplicativos etc.).
Mas quem usa esta informação? E quem usa, como usa esta informação? Vamos traçar um paralelo com os estudantes de medicina. Desde que estão na faculdade preparando-se para se tornarem médicos no futuro, estes estudantes estão em contato com as responsabilidades e preceitos éticos que envolvem a sua profissão e o uso de suas futuras habilidades profissionais. Médicos sabem que um erro seu por negligência podem causar danos muito sérios, como tirar a vida de um paciente. Sabem também que as informações trocadas entre médico e paciente são informações confidenciais e há de se ter muita responsabilidade com a coleta e divulgação destas informações.
Mas agora vamos olhar para os estudantes de tecnologia (desenvolvedores de aplicativos, engenheiros de celulares etc.). Hoje a tecnologia e o uso dos dados têm um impacto enorme na vida das pessoas, mas não há ainda uma definição clara sobre um código de ética envolvendo os usos destas informações e como este impacto deve ser controlado ou regulado e estes estudantes e profissionais simplesmente não estão sendo formados nesta questão. A Sociedade do Conhecimento ainda precisa evoluir muito nesta direção.
Privacidade
Dentre todas as questões envolvidas no uso ético das informações, uma que tem figurado com frequência é a questão da privacidade. O celular incorpora a principal interface com as redes sociais e possui mecanismos de monitoramento como o gps. Estamos o tempo todo com o celular. Então a questão da privacidade se tornou uma grande preocupação no mundo.
Mas há diferenças culturais que fazem com que as pessoas tratem de forma totalmente diferente estas questões. A China, por exemplo, tem uma visão bastante diferente da que estamos acostumados no ocidente. Como país, sua estratégia é tornar-se o maior fornecedor de dados de perfil (“profile”) do mundo. Como sociedade, a privacidade da população não é uma questão.
Como exemplo, podemos citar os experimentos de utilização da tecnologia de reconhecimento facial para possibilitar o acesso às residências. Vários condomínios já implantaram uma tecnologia que abre as portas do condomínio e da residência quando um dos moradores autorizados se aproxima da porta. Esta abertura acontece a partir de uma tecnologia de reconhecimento facial e é muito conveniente. Até aqui, nada demais, trata-se da tecnologia ajudando as pessoas.
O detalhe é que esta tecnologia está abertamente conectada com sistemas de monitoramento da polícia chinesa, que usa estes dados para rastrear pessoas que têm mandado de prisão expedida e que estão foragidas. Mas, pense bem. Esta tecnologia integrada permite também que o governo controle ativamente quem frequenta a sua casa e a que horas as pessoas chegam e saem, por exemplo. No senso comum sobre privacidade no ocidente isso seria um problema. No senso comum dos chineses parece não ser um problema.
Mas agora vamos pensar em termos globais. Cada vez mais as fronteiras políticas dos países têm sido sobrepostas por relações econômicas e de negócios entre empresas e empresas e entre pessoas e empresas. Cada vez mais é comum que empresas de um país (China, por exemplo) se relacionem com pessoas de outros países (Brasil, por exemplo). E como ficam estas diferenças culturais tão exacerbadas. É algo que ainda não foi resolvido, mas que merece nossa atenção urgente.
#tenyearschallenge
Falando em tecnologia de reconhecimento facial, sabemos que tem sido um dos maiores investimentos de muitas empresas nos últimos anos. Quando as redes sociais, como o Facebook por exemplo, começaram a fornecer facilidades de marcação de pessoas nas fotos, inclusive com sugestões (“É o Eduardo nesta foto?”).
Ao mesmo tempo em que melhorava a usabilidade para os seus usuários, facilitando a marcação de amigos nas fotos, o Facebook iniciava a construção do que é hoje, provavelmente, um dos maiores bancos de dados de reconhecimento facial do mundo.
Agora, uma das maiores dificuldades enfrentada pelos algoritmos de reconhecimento facial está justamente na capacidade de simular e reconhecer o envelhecimento das pessoas. Então, recentemente a internet viu um jogo chamado “#tenyearschallenge” (desafio dos 10 anos) viralizar na internet. Tratava-se de um desafio onde as pessoas postaram fotos suas com a diferença de 10 anos. Muitos entraram na brincadeira e a hashtag oficial do desafio passou dias entre as maiores tendências das redes sociais.
Até que alguém aventou a possibilidade de que tudo não passava de uma estratégia justamente para treinar e aprimorar algoritmos de reconhecimento facial. Empresas como o Facebook correram para declarar que não possuíam qualquer relação com a criação do desafio e, de fato, não há provas ou indícios de que houve alguma relação. Mas que a ideia faz sentido, sim ela faz.
Segurança
Se na Sociedade do Conhecimento concordamos que o conhecimento tem se tornado um dos bens mais valiosos e que, ao mesmo, se mal utilizado pode causar danos graves à pessoas e/ou organizações, faz sentido que o tema da segurança tenha se tornado cada vez mais importante e sensível nos tempos atuais. Não existe sistema 100% seguro e livre de vulnerabilidades, mas as empresas, governos e pessoas devem se preocupar cada vez mais em quão seguros estão os seus dados e sistemas.
Em 2007 o ator Bruce Willis estrelou o quarto filme da série Duro de Matar. Neste episódio o policial John McClane, personagem principal interpretado pelo ator, tem contato com o hacker Matthew Farrell enquanto outro hacker interpretado por Timothy Olyphant realiza um ataque massivo contra vários sistemas de infraestrutura americano (energia, comunicações, tráfego terrestre, tráfego aéreo etc.). O conceito que sustenta o filme é que todo o mundo está suportado por tecnologia, mas mesmo a tecnologia mais sofisticada pode ser capturada e se tornar refém de elementos mal intencionados (assista ao trailer em https://www.youtube.com/watch?v=joFa1cn26LA).
Mesmo envolto em todo o sensacionalismo do cinema de hollywood, este filme anunciava há mais de dez anos como a nossa vida se tornava cada vez mais dependente da segurança dos sistemas de informação. Mesmo com toda a imaginação dos roteirista, esta obra de ficção ainda não era capaz de prever o quanto nosso cotidiano estaria dependente e exposto a um ataque cibernético.
Hoje, por exemplo, vemos grandes investimentos e avanços no desenvolvimento dos carros autônomos. Já sabemos que eles serão uma realidade no futuro, apesar de não estar claro ainda quanto falta para chegar este futuro. Cinco anos? Dez ano? As previsões são variadas, mas ninguém discorda que é um futuro certo. Porém muitas discussões sobre segurança ainda precisam ser realizadas. Um carro autônomo pode ser invadido e utilizado como ataque terrorista? Ou, muito menos dramático, pode ser utilizado para rastrear e invadir a privacidade de uma pessoa?
É preciso, porém, lembrar que os crimes cibernéticos não começaram recentemente. Já no início dos anos 1990, Kevin Poulsen era preso e banido da internet por cometer crimes invadindo centrais telefônicas para ganhar concursos e sorteios em programas de rádio. Também é importante lembrar que as falhas de segurança envolvem muito mais do que os sistemas em si, pois pessoas podem, de forma intencional ou não, criar brechas na segurança dos sistemas. A exploração destas brechas por criminosos ganha o nome de engenharia social.
Governança de Dados
A Governança de Dados determina como as empresas devem lidar com todas estas questões de ética no uso dos dados, privacidade e coleta de dados particulares. Governança de dados trata de todo o gerenciamento de dados em uma empresa. No plano de Governança de Dados são definidas as políticas e os mecanismos que irão assegurar que a informação que colaboradores têm acesso receberão o melhor uso possível, de acordo com os valores praticados pela empresa.
Este movimento tem criado uma figura cada vez mais importante nas empresas que é o responsável pela governança de dados. Pode ser um papel cumprido pelo diretorde compliance, por exemplo. Mas algumas empresas já estão criando um executivo específico para isso, chamado de CDO (Chief Data Officer). Dependendo da importância que os dados possuem nas operações da empresa, faz bastante sentido.
Por fim, a governança de dados deve ser desenvolvida em cinco passos descritos a seguir:
1. Identifique os titulares da informação, ou seja, dentro da organização quem será responsável por cada dado, sobretudo para os dados mais sensíveis e críticos.
2. Determine a situação atual, pois fazer um diagnóstico de como estas informações têm sido tratadas na empresa atualmente é muito importante para o próximo passos, que é...
3. Desenvolva uma estratégia, deixando bem claras as políticas e os valores relacionados à coleta, armazenamento, uso e disponibilização de dados.
4. Use a informação da melhor forma possível, deixando claro quais são os conceitos de “melhor forma” na empresa. E, por fim...
5. Meça constantemente os riscos e oportunidades relacionados com cada parte da informação que permanece em posse da empresa.
Muitas empresas estão sendo obrigadas a formular suas políticas de governança de dados por determinação de governos ou pressão da sociedade. Conforme todos percebem os riscos (e as oportunidades) que surgem a partir da posse e uso dos dados, mais se dá valor à necessidade de governança de dados.
 
Atividade extra
Nome da atividade: Leia a matéria do G1 / BBC sobre o caso do Facebook e a Cambridge Analytica que veio à público em 2018.
Endereço para ler a matéria: https://g1.globo.com/economia/tecnologia/noticia/entenda-o-escandalo-de-uso-politico-de-dados-que-derrubou-valor-do-facebook-e-o-colocou-na-mira-de-autoridades.ghtml
6 - Plano de Qualidade dos Dados
Qualidade Total e Certificações
Como dito anteriormente, a palavra “qualidade” não é um adjetivo, mas sim um substantivo. Todo objetivo, item, ser ou coisa tem qualidade, que pode ser altamente consistente com a expectativa que se tem ou estar distante do que se considera adequado. Ou seja, a avaliação sobre a qualidade de algo está ligado a uma avaliação que nem sempre é objetiva, mas deveria ser.
Ao longo da história, a qualidade foi primeiramente observada em atividades de inspeção. Ou seja, a adequação de certas características de algo era avaliado e comparado com um padrão de expectativas. Tudo que atendia a este padrão era preservado enquanto o que não atendia era descartado. Esta é uma visão muito comum na Era Industrial onde a inspeção de qualidade era parte de uma linha de montagem, onde itens que passavam pela linha sem atender aos requisitos mínimos de qualidade após certas etapas de produção (fabricação) eram retirados da linha.
Este conceito evoluiu para um Controle da Qualidade onde não apenas o item era inspecionado, mas também o processo de fabricação. Ao mesmo tempo, controlar a qualidade deixa de ser uma prática apenas das fábricas e passa a fazer parte da “produção” de qualquer bem ou serviço, qualquer item concreto ou abstrato. Empresas que prestam serviço aos seus clientes começam a inspecionar se o serviço está sendo bem realizado, ou seja, está de acordo com a expectativa de seus clientes.
Há então uma mudança na cultura da qualidade onde as organizações passam a preocupa-se não apenas de forma reativa com relação à qualidade, mas sim de forma proativa. O processo e o produto não são apenas inspecionados para avaliar se houve qualidade, mas há uma preocupação de garantir que a qualidade seja obtida ao longo do serviço. São incluídos no processo ações que garantam, ou aumentem a chance, de que as expectativas sejam atingidas.
Há então uma mudança de paradigma onde o processo passa a ter mais importância do que o próprio produto final. Assume-se a premissa de que padrões precisam ser adotados e que se algo é feito sempre da maneira certa, o resultado sempre obterá a maior qualidade possível. Vira moda o termo “Qualidade Total” e são criadas uma série de normas que devem ser seguidas pelas empresas para garantir que o processo é feito sempre de acordo com os padrões estabelecidos. Junto com as normas aparecem agências certificadoras, profissionais especializados, certificações e muito investimento é feito na garantia dos padrões de processos em busca da obtenção da qualidade total.
A evolução natural deste conceito parece ser olhar menos para o processo e o produto e mais para o seu destino final: o cliente. Depois de muito evoluir no ramo da qualidade, as empresas se deram conta de que estavam olhando muito “para dentro” e não pensavam tanto “na dor dos clientes”. Termos como “entender a perspectiva do cliente” ou “olhar com os olhos do cliente” passaram a ser comumente utilizados e as empresas tornaram-se customer centric.
Percebeu-se que ter “boa qualidade” significa atender às expectativas dos clientes e a busca passa a ser pelo ato de “encantar o cliente”, que na verdade seria ter mais qualidade do que o cliente espera, surpreendendo este cliente. Percebe-se também que a qualidade pode ser medida de variada em dimensões abstratas como quando um produto “tem que ser bonito”, “deve estar na moda” ou “ser agradável e moderno”. Lembrando que “bonito”, “agradável”, “moderno” podem receber avaliações diferentes de pessoa para pessoa.
Mas e a qualidade em relação aos dados? No caso da qualidade de dados o próprio item “dado” é bastante abstrato e não existe uma norma ISO específica sobre a qualidade do dado. Afinal as normas têm foco nos processos e o “dado” é um resultado, não um processo. Existe, porém, uma norma que se refere ao produto software e como o dado é um registro eletrônico feito em um sistema, esta norma se aproxima bastante do conceito de garantir a qualidade do dado.
A norma ISO/IEC 9129 observa aspectos da qualidade interna e externa do software em seis dimensões principais:
· Funcionalidade;
· Confiabilidade;
· Usabilidade;
· Eficiência;
· Manutenibilidade;
· Portabilidade.
Observe que o dado é coletado, armazenado e processado por um software e, assim, passa de forma transversal em todas estas dimensões. Dito de outra forma, a qualidade do dado pode ser afetada pela qualidade do software em cada uma destas seis dimensões. A seguir a figura 1 apresenta o desmembramento destas dimensões em itens de qualidade.
É interessante notar que nas seis dimensões representadas abaixo o desmembramento “conformidade” está presente, de forma que estar em conformidade com os padrões estabelecidos em cada uma das seis dimensões é um aspecto fundamental da qualidade de software.
Planejamento da Qualidade de Dados
Dado é matéria-prima para a produção de informação e conhecimento. Para ter qualidade, a informação precisa ser “consistente”, “confiável”, “relevante”, “contextualizada” e “estar disponível”. Avaliar estas cinco dimensões e garantir que atendem às expectativas dos clientes (usuários) da informação é garantir a qualidade da informação.
A história da qualidade nos mostra que, para isso, é preciso garantir a qualidade do processo de produção da informação, do que chamamos a cadeia produtiva do conhecimento. Precisamos garantir que o dado, ao longo de todo o seu processo, mantém a qualidade esperada. Dados precisam ser “coletados”, “higienizados”, “padronizados”, “contextualizados” e “disponibilizados” seguindo os padrões esperados de qualidade.
Note que neste processo de garantir a qualidade do dado a estrutura de ETL (Extração, Transformação e Carga) tem papel de destaque. É fundamental que os processos internos do ETL não apenas garantam, mas insiram, qualidade ao dado. Para isso servem os passos de padronização e higienização, por exemplo.
Qualidade se traduz, neste caso, em conformidade com o que foi especificado. Uma informação de qualidade deve ser exata e precisa e o titular da informação deve criar uma espécie de “Dicionário de Conformidades” para cada tipo de informação ou dado que for tratado na cadeia produtiva de conhecimento. Veja alguns exemplos:
· A data de nascimento dos clientes é o registro do dia em que o cliente nasceu e deve estar completa com o dia, mêse ano, este último representado com quatro dígitos. Dia deve ser um número de 1 a 31, sendo que o limite varia de mês a mês (Janeiro, Março, Maio, Julho, Agosto, Outubro e Dezembro varia de 1 a 31. Abril, Junho, Setembro e Novembro varia de 1 a 30. Fevereiro varia de 1 a 28 em anos não bissextos, de 1 a 29 em anos bissextos). Mês deve ser um número de 1 a 12. Ano deve ser um número que represente uma idade maior que 18 anos, porque neste caso os clientes precisam ser maiores de idade, ou menor que 85 anos, porque neste caso há um limite de idade para que os clientes possam usufruir do serviço em questão.
· O número de telefone deve ser um número com n dígitos numéricos dependendo do país, unidade e estado onde o contato mora. Ele é um identificador de uma linha telefônica através da qual pode-se contatar uma pessoa da base de contatos.
Com o dicionário de conformidades, deve-se elaborar um Plano de Qualidade de Dados como parte dos projetos de software ou da cadeia produtiva de conhecimento. O plano deve possuir os seguintes itens:
· Título do Projeto: um nome que o identifica. Exemplos: Plano de Qualidade da Informação de Clientes ou Plano de Qualidade do Software de Ponto de Venda.
· Autores: são os titulares da informação, os responsáveis pela elaboração do plano de qualidade e das normas de conformidade.
· Lista de requisitos de qualidade: são as dimensões de qualidade que serão através das quais a informação será avaliada. Serão os elementos que garantem a exatidão e a precisão dos dados.
· Lista dos padrões de qualidade: determina todas as ferramentas que serão usadas para medir os dados, que métricas serão observadas e quais são as metas de conformidade esperadas.
· Sistema de controle de mudanças da qualidade: como a qualidade está associada à expectativa do cliente / usuário, que é um agente externo à cadeia produtiva do conhecimento, esta expectativa está sujeita a mudanças e estas mudanças precisam ser controlada.
· Frequência de avaliação dos requisitos de qualidade: com qual frequência as ferramentas de padrão de qualidade serão utilizadas para medir e garantir qualidade de um dado.
Gestão da Qualidade de Dados
Com a visão conceitual apresentada acima deve estar claro que o processo de gestão da qualidade de dados é algo contínuo e constante. Se o dado é uma representação de um fato que ocorre fora do sistema, “no mundo real”, e ter qualidade significa estar em conformidade com a expectativa de um agente também externo à cadeia produtiva de geração de conhecimento que é o cliente, seus parâmetros podem variar ao longo do tempo.
Para gerir a qualidade dos dados, portanto, são necessárias ferramentas de acompanhamento que podem se apoiar nas próprias ferramentas de geração do conhecimento, neste caso o conhecimento de que os dados estão ou não estão em conformidade com os padrões esperados de qualidade. Sugere-se, portanto, a criação de dashboards de acompanhamento da qualidade dos dados.
Garantia e Controle da Qualidade
Adicionalmente aos dashboards de qualidade de dados, que garantem um acompanhamento contínuo da qualidade, deve-se estabelecer um processo de melhoria contínua da qualidade. Sugere-se o uso de um framework (uma “abordagem”) conhecida pela sigla PDCA, que é a sigla em inglês para PLAN-DO-CHECK-ACT ou “Planejar”, “Realizar”, “Monitorar” e “Agir”.
Planejar diz respeito ao planejamento da qualidade, a determinação de quais são as ferramentas, métricas e metas da qualidade. Realizar diz respeito a colocar em prática o plano de qualidade enquanto a cadeia produtiva do conhecimento é executada. Monitorar através de indicadores e um dashboard, de forma constante para que qualquer desvio possa ser imediatamente percebido. Agir significa descobrir a causa do desvio e corrigi-lo para que se retorne ao estado anterior de conformidade.
O PDCA é uma abordagem de melhoria contínua muito usada em processos produtivos e que deve suportar a necessidade de monitoramento constante dos processos de qualidade de dados.
 
Atividade extra
Nome da atividade: Leia a matéria “Baixa qualidade dos dados impacta organizações; um custo financeiro de US$ 15 milhões em 2017” baseada em estudos do Gartner e reflita sobre a qualidade da informação na empresa em que você trabalha.
Endereço para ler a matéria: https://itforum365.com.br/baixa-qualidade-dos-dados-impacta-organizacoes-um-custo-financeiro-de-us-15-milhoes-em-2017/
7 - Implantando a Governança de Dados
Titulares da Informação
Relembrando, a Governança de Dados “é um sistema de tomada de decisões executado por um modelo que descreve quem age com qual informação, em que momento, usando que métodos e sob que circunstâncias” (VEYRAT, 2015). Em outras palavras a política de governança de dados de uma organização tem como objetivo:
· Proteger os dados que trafegam pela empresa;
· Dar eficiência aos processos que coletam e manipulam dados dentro da empresa;
· Reduzir os custos e riscos do uso dos dados; e
· Dar transparência às partes interessadas sobre os procedimentos que envolvem dados dentro da organização.
Em geral o plano de Governança de Dados será composto por:
· Um conselho que tem a missão de zelar pelos valores da organização no que tange ao uso dos dados por ela coletados, manipulados e divulgados. O conselho deve ser formado por pessoas com grande influência na gestão e que conheçam os detalhes dos processos que envolvem coleta, processamento e divulgação de dados.
· Procedimentos associados à manipulação de dados, tanto no que diz respeito às definições de políticas, princípios e valores.
· Planos de Ação que se refere a eventos que venham a ocorrer e exijam uma resposta da empresa como, por exemplo, o vazamento acidental de dados.
O primeiro passo para se desenvolver um Plano de Governança de Dados é definir quem é o Governador dos Dados. “Governador” aqui com o sentido de qual executivo se tornará o responsável pelas políticas de governança referentes ao uso dos dados e informações. Com a evolução da sociedade para a Era do Conhecimento e o agravamento dos valores e riscos envolvidos na gestão dos dados, tem se tornado cada vez mais comum a criação de um cargo específico para este fim, o Chief Data Officer (CDO).
Em muitas organizações, porém, este papel acaba sendo cumprido pelo responsável pela área de compliance, ou seja, considera-se que estar em conformidade em relação aos dados e informações é mais uma das responsabilidades desta área, junto com o cumprimento de outras leis e regulamentos internos ou externos.
Será o Governador de Dados quem irá conduzir a criação das políticas de governança de dados, as reuniões, definir pautas, cronogramas, objetivos etc. Mas o Governador de Dados não é, necessariamente, responsável direto por nenhuma informação dentro da organização. Os responsáveis são chamados de “Titulares da Informação”.
Significa que para cada dado coletado, armazenado, processado e distribuído o comitê deverá indicar um titular, que fica responsável por este dado. É como se ele fosse o “dono” ou gestor daquele bem (asset) dentro da companhia. Todo bem, e com os dados não é diferente, possui um valor, custo e riscos associados. Então é responsabilidade do titular equilibrar estas três dimensões.
Diagnóstico e Planejamento
Todo processo de governança começa com um diagnóstico para avaliar a situação atual e um planejamento de próximos passos para que a organização possa atingir os seus objetivos de governança. Para determinar a situação atual o trabalho deve começar com um levantamento de quais são as informações que a empresa possui. Que dados são coletados e armazenados na organização como parte de sua operação?
Este deve ser um levantamento extensivo e exaustivo, pois invariavelmente as empresas ficam surpresas com a quantidade e a variedade de dados que elas possuem. Neste levantamento, em geral, já se percebem duplicidades e redundâncias desnecessárias e, muitas vezes, dados que não precisavam ser coletados ou armazenados.
O comitê deve, então, priorizados os dados que são mais sensíveis. Não faz sentido tentarresolver todos os problemas de uma só vez, então é preciso fazer uma avaliação de valor versus custo. Bo ponto de vista do valor, leva-se em conta a importância que os dados têm para a execução das operações e o valor dos conhecimentos que são ou poderiam ser gerados com base naquele dado. Do ponto de vista de custo devem ser considerados os custos diretos e indiretos de coleta, armazenamento e processamento do dado, mas também os riscos da empresa manter aqueles dados armazenados.
Itens de alto valor e alto custo são os mais sensíveis e devem ser priorizados no planejamento da governança de dados. Por outro lado, itens de baixo valor e baixo custo podem ficar para o final da fila. Uma discussão mais detalhada sobre os riscos está presente adiante neste material. Seguindo a prioridade, o comitê deve avaliar que medidas de proteção já existem para estes dados e qual é a sua qualidade atual.
Nestes passos podemos usar um método de avaliação como a matriz SWOT, por exemplo. Um dado sensível pode trazer forças para a organização (Strengths), mas também pode gerar fraquezas (Weaknesses) se possui uma qualidade baixa, por exemplo. Por outro lado, pode gerar oportunidades (Opportunities) de diferenciais competitivos, dependendo do conhecimento estratégico que pode ser extraído dele, mas também traz consigo ameaças (Threats). Então uma boa prática consiste em utilizar a matriz SWOT para avaliar os dados prioritários definidos no levantamento anterior.
Concluído o Diagnóstico, o comitê parte para o planejamento, sempre seguindo a prioridade definida. O comitê deve escrever uma missão para o comitê e a política de governança e definir qual a visão da empresa com relação aos dados e informações. Esta missão e visão, é claro, precisa estar consoante com a visão e a missão da organização.
O comitê deve, então, criar um programa que contenha projetos específicos para os conjuntos de dados mais sensíveis, estabelecer os objetivos estratégicos e os desdobrando dos planos táticos e operacionais. Não necessariamente é o comitê quem vai gerenciar os projetos, ele pode atuar como um patrocinador que monitora os resultados ao longo do tempo.
Uso da Informação
Em resumo podemos dizer que a governança visa garantir a melhor utilização possível dos dados que estão sob gestão da organização. Com os projetos estabelecidos, o grupo deve elaborar os manuais de uso destes dados. O manual é um documento que deixa claro:
· O titular responsável por cada conjunto de dados;
· As políticas de acesso, definindo quem tem acesso, qual o objetivo do acesso e qual o tipo de acesso (leitura, edição, inserção etc.);
· Quais são as alçadas envolvidas no acesso ao dado;
· Como o acesso é controlado;
· Um plano de ação em caso de desvio.
Para não deixar totalmente no abstrato, vamos desenvolver um exemplo resumido para um dado que costuma ser considerado sensível na maior parte das organizações: o valor de salário dos colaboradores.
· Titular:
· Gerente do Departamento de Pessoal.
· Políticas de Acesso:
· Gerente do Departamento de Pessoal: acesso total (para realização das funções de folha de pagamento).
· Coordenador de Remuneração: acesso total (para realização das funções de folha de pagamento).
· Analista de Remuneração: acesso de leitura (para realização das funções de folha de pagamento).
· Gerentes Funcionais: acesso de leitura, respeitando as alçadas definidas a seguir.
· Alçadas
· Cada gerente funcional tem acesso de consulta aos salários de seu departamento.
· Como o acesso é controlado
· Informação armazenada no sistema do Departamento de Pessoal, módulo Folha de Pagamento. Acesso controlado por usuário, senha e perfil.
· Plano de ação em caso de desvio.
· O Comitê de Governança é acionado para uma reunião extraordinária e nomeia em até 24hs um auditor que deverá abrir uma sindicância e apresentar os resultados em até 72hs. O Gestor de TI suspende todos os acessos ao módulo de Folha de Pagamentos.
Um manual como este, porém muito mais elaborado e detalhado em casos reais, deve ser desenvolvido para cada conjunto de dados sensíveis da companhia.
Riscos e Oportunidades
Por fim o comitê tem a responsabilidade de monitorar constantemente os riscos e oportunidades envolvidas na gestão dos dados da companhia. Riscos e oportunidades são quaisquer evento que possua uma probabilidade x de ocorrer e, caso venha ocorrer, cause um impacto y. A avaliação dos riscos e oportunidades recai justamente em sua classificação entre probabilidade e impacto.
A partir desta análise de risco, planos de ação são desenvolvidos para mitigar as probabilidades ou remediar os impactos. A análise de riscos deve ser incorporada ao Manual de Uso de Dados, mas é importante ressaltar que um risco pode afetar mais do que um conjunto de dados. Exemplo, o risco de invasão do banco de dados de clientes de um site pode afetar itens como os dados de contato, número do cartão de crédito, comportamento de compras etc. 
 
Atividade extra
Nome da atividade: Leia a matéria “Os 10 Maiores Vazamentos de Dados da História” e reflita sobre como uma política de governança de dados poderia ter evitado os problemas e prejuízos relatados.
Endereço para ler a matéria: https://www.advogatech.com.br/blog/@HenriqueDantas/os-10-maiores-vazamentos-de-dados-da-historia-b05by2t
8 - Futuro da Qualidade e Governança de Dados
Como se prevê o futuro?
Estamos assolados por uma estatística que nos diz que a maioria dos empregos e profissões que existem hoje em dia deixarão de existir nos próximos anos. John Pugliano, autor do livro “Robots are Coming: A Human's Survival Guide to Profiting in the Age of Automation”, afirma que todos os trabalhos rotineiros ou previsíveis serão substituídos por algoritmos matemáticos até 2025.
Para avaliar se a nossa profissão continuará existindo e se continuarem “competitivos”, tentamos prever o futuro. Existe um dito popular que diz que “o futuro a Deus pertence”. Independentemente das crenças religiosas de cada um, a principal conotação deste dito é que o futuro não pertence a nós, ou seja, não está sob nosso controle. Assim como não podemos controlá-lo, não possuímos a capacidade de prevê-lo com 100% de assertividade. Mas isso nunca impediu a humanidade de tentar.
Tentar prever o futuro é sempre um exercício de adivinhação, mas esta adivinhação pode ser mais ou menos embasada em fatos, tendências e simulações de futuro. Para isso, recolhemos dados e olhamos para o passado, acompanhamos o que está acontecendo no presente e exercitamos caminhos possíveis no futuro.
Ao longo da história nos convencemos de que o passado e presente são os melhores indicadores possíveis para o futuro. E são mesmo, já que são os únicos indicadores que temos para trabalhar. Neste ponto, pessoas envolvidas com o trabalho baseado em dados têm uma grande vantagem competitiva. Os ambientes analíticos são os espaços perfeitos para identificar e observar tendências.
Em nosso escopo aqui devemos tentar prever se a Qualidade dos Dados e a Governança de Dados continuarão representando um papel significativo nas organizações nos próximos anos. Seguindo a prática, devemos observar quais são as tendências que hoje apontam para o mundo no que se refere ao uso dos dados pelas organizações.
Tendências alavancadas pelos dados
Uma forma de olhar, portanto, é entender tendências que estão ocorrendo e avaliar até que ponto são alavancadas e/ou alavancadoras de uma prática centrada em dados. Neste sentido podemos apontar três tendências que vêm ganhando muita relevância: a Internet das Coisas (IoT – Internet of Things), a Inteligência Artificial (AI - Artificial Intelligence) e a Nanotecnologia.
Também podemos dizer que a Inteligência Competitiva e o BI são cada vez mais atividades estratégicas dentro das organizações e, portanto, têm o seu valor nas tendências de evolução do mundo corporativo. Estas tendências que precisam ser identificadas pelos gestores para que as organizações retirem conhecimento estratégico deste contexto e garanta os melhores investimentos possíveis na evolução de sua estruturade BI.
Para mim está muito clara a tendência de o mundo produzir cada vez mais dados. Se antes os sistemas transacionais formais eram as principais origens de dados para os sistemas de BI, cada vez mais outras fontes são criadas e se tornam comuns. Desde sensores profissionais instalados com algum objetivo de negócio (ex.: sensores de movimento em estradas, sensores que medem a entrada de clientes em shoppings, câmeras que identificam o humor das pessoas em uma loja etc.) até devices de uso comum como celulares e relógios, cada vez mais se tornam máquinas de monitoramento.
Por falar em relógios, uma tendência que claramente incentiva este aumento da produção dos dados é o IoT. Como já citamos, IoT é a abreviação de Internet of Things (a tradução mais comum é “Internet das Coisas”, mas uma boa descrição seria “Internet nas coisas”). Trata-se de uma tendência de conectar itens usados no dia-a-dia à internet, incrementando suas funcionalidades e melhorando, com isso, a experiência. Mas é simples perceber que um item conectado, seja uma geladeira, uma fechadura ou um tênis, também se torna um importante gerador de dados.
Outra tendência a cada dia mais presente em nossas vidas é a Inteligência Artificial, que é a simulação de uma inteligência humana em mecanismos ou sistemas computacionais. Existem vários tipos e aplicações para a IA (ou AI, de Artificial Intelligence) mas todas elas se transformam em grandes geradoras de dados e, dependendo de quão sofisticada, até mesmo de conhecimento relevante.
Conjugada à IoT significa que cada vez teremos itens de nosso dia-a-dia operando com inteligência própria. Estes itens observarão o seu entorno, tomarão decisões e aprenderão sobre o ambiente e as pessoas que interagem com eles. Como estão conectados são capazes de criar uma grande inteligência universal, tendo acesso a mais ambientes e realidades do que um ser-humano teria de forma isolada.
Observamos, ainda, como uma forte tendência a miniaturização dos componentes digitais, chegando ao nível que chamamos de nanotecnologia. Segundo a Wikipedia, “nanotecnologia é uma ciência que se dedica ao estudo da manipulação da matéria numa escala atómica e molecular lidando com estruturas entre 1 e 1000 nanômetros”. Em outras palavras, trata-se de diminuir a um tamanho “nano” componentes digitais conectados à nuvem e com uma aplicação especializada.
Um exemplo muito comum de onde a nanotecnologia poderá ser usada é na área da saúde, onde nano componentes poderão ser implantados no corpo das pessoas e farão leituras constantes de indicadores que determinam as condições de saúde do usuário, podendo inclusive agir proativamente para combater entupimentos de artérias, infartos e acidentes vasculares.
Mais uma vez, do ponto de vista da informação, a quantidade e variedade de novos dados que poderão ser coletados é representativa. Em paralelo com a Internet das Coisas, a nanotecnologia funciona como uma Internet das Pessoas, ou seja, nós e nossos corpos estarão conectados em um nível que ainda não conseguimos prever.
Tendências para Qualidade e Governança de Dados
Com certeza estas três tendências se tornarão cada dia mais realidade no nosso mundo e no ambiente corporativo. Se dados em maior quantidade e variedade serão coletados e utilizados na geração de conhecimento estratégico, está claro que a necessidade de se garantir a qualidade destes dados será anda maior e sofisticada. Da mesma forma, aumentam as implicações sobre privacidade, segurança e uso ético dos dados, que é justamente o núcleo da política de Governança de Dados.
Além da necessidade destes dois conhecimentos aumentar ao longo dos próximos anos, é muito provável que empresas que antes não possuíam esta relação com os meandros da qualidade e governança de dados tenham que começar a se preocupar com o assunto em breve. Utensílios domésticos como geladeiras, fornos e porta-retratos, por exemplo, não possuíam uma interação intensa em troca de dados com seus usuários. Se passarão a ter, uma nova realidade se apresenta.
Isso significa que a atuação de profissionais especializados em Governança e Qualidade de Dados deve, ainda, se ampliar para novos mercados, com novos desafios e exigências cada vez maiores.
Como se preparar para o futuro?
Utilizando a própria filosofia de tomar decisões baseadas em informação é possível observar e identificar que tendências estão acontecendo e, a partir destas tendências deixar a organização mais preparada para crescer e sobreviver no futuro. Da mesma forma, o profissional pode direcionar os seus investimentos em educação e treinamento a partir da percepção destas tendências. Esta é a melhor maneira de se preparar para o futuro.
 
Atividade extra
Nome da atividade: Assista ao documentário “O Futuro em 2111 - Mundo Inteligente” do Discovery Channel e reflita sobre as quantidades e variedades de novos dados que poderão ser gerados para o BI conforme são apresentadas as previsões de como será o mundo e a vida cotidiana no próximo século.
Link: https://www.youtube.com/watch?v=LNcn2YUt1Ho
01
O que é a Sociedade do Conhecimento?
1. É um grupo de empresas que já percebeu a importância de se tornar data centric.
2. É um grupo de pessoas que estuda como Inteligência Competitiva pode ser aplicado à sociedade.
3. São organizações associadas ao monitoramento de fluxo realizado por robôs disfarçados de máquinas
de autosserviço.
4. É a sociedade da Era do Conhecimento, formado por pessoas e empresas cada vez mais data centric.
5. É a empresa que cunhou o termo Era do Conhecimento.
A percepção de vantagens em basear uma grande parte de suas decisões com base no conhecimento que pode ser criado a partir do grande volume de dados e informação que está disponível não criou a cultura do conhecimento apenas nas empresas, mas a sociedade como um todo passou a mover-se em uma direção mais data centric. Com isso novos comportamentos foram sendo criados e passaram a reforçar ainda mais as características da Sociedade do Conhecimento.
02
Dentre as alternativas abaixo, qual não foi citada como uma característica da Sociedade do Conhecimento?
1. Mais educada.
2. Muito digital.
3. Hiperconectada.
4. Ávida consumidora de informações.
5. Produz e compartilha um grande volume de dados.
Apesar da Sociedade do Conhecimento ter criado novos hábitos que estão mudando a forma como as pessoas são educadas, reforçando habilidades de pesquisa e criando novas relações de aprendizagem, não é certo que estas mudanças tenha feito com que as pessoas se tornem mais educadas no sentido cultural (mais cultura) ou comportamental (mais gentis e educadas umas com as outras).
03
Somos uma sociedade digital, extremamente conectada e ávida pela produção e troca de informações. Estabelecemos grande parte de nossas relações usando um canal digital que gera e armazena rastros sobre tudo que fazemos. Nas alternativas a seguir, qual representa um ato que fortalece estas características?
1. Pessoas costumam usar as redes sociais para compartilhar as experiências que gostam ou não gostam em seu dia-a-dia.
2. Antes de reservar um hotel, navegamos por sites agregadores de agentes de hospedagem avaliando as revisões que outras pessoas fizeram sobre cada local.
3. Realizamos atividades físicas acompanhadas por um monitor de exercícios que registra vários indicadores sobre nossa saúde, de forma que podemos acompanhar nosso ganho de rendimento ao longo do tempo.
4. Assistimos a filmes em um serviço de streaming (transferência de dados) que registra aquilo que gostamos para e nos envia recomendações periódicas sobre outros programas que podemos assistir.
5. Todas as alternativas anteriores registram comportamentos que reforçam as características da Sociedade do Conhecimento.
Em todas as alternativas são apresentados hábitos comuns das pessoas de nossa sociedade e estes hábitos reforçam o que é a Sociedade do Conhecimento, demonstrando o impacto de ferramentas e tecnologias de produção do conhecimento a partir de dados e informações têm sobre a nossa sociedade.
01
O que é Inteligência Competitiva?

Outros materiais