Baixe o app para aproveitar ainda mais
Prévia do material em texto
Modelagem da Informação Material Teórico Responsável pelo Conteúdo: Prof. Me. José Ahirton Batista Lopes Filho Revisão Textual: Prof.ª Dr.ª Selma Aparecida Cesarin Dos Tipos de Dados ao Conhecimento • Introdução – O Que São Dados? • Dados, Fontes de Dados e Conceitos Generalistas na Cultura de Dados; • Dados Estruturados, Semiestruturados e não Estruturados; • Dos Dados ao Impacto em Negócios; • Tipos de Dados em Modelagem da Informação; • De Dados ao Conhecimento – Modelo Dikw; • Gestão do Conhecimento. • Capacitar os alunos quanto ao processo de modelagem de informações; • Impulsionar o pensamento crítico quanto ao desenho e à utilização de modelos no pro- cesso de modelagem da informação para gestão de conhecimento; • Qualifi car os alunos para lidarem com o processo de gestão e construção de conhecimen- to quando inseridos em equipes ágeis, adotando uma verdadeira cultura de dados em suas vidas profi ssionais. OBJETIVOS DE APRENDIZADO Dos Tipos de Dados ao Conhecimento Orientações de estudo Para que o conteúdo desta Disciplina seja bem aproveitado e haja maior aplicabilidade na sua formação acadêmica e atuação profissional, siga algumas recomendações básicas: Assim: Organize seus estudos de maneira que passem a fazer parte da sua rotina. Por exemplo, você poderá determinar um dia e horário fixos como seu “momento do estudo”; Procure se alimentar e se hidratar quando for estudar; lembre-se de que uma alimentação saudável pode proporcionar melhor aproveitamento do estudo; No material de cada Unidade, há leituras indicadas e, entre elas, artigos científicos, livros, vídeos e sites para aprofundar os conhecimentos adquiridos ao longo da Unidade. Além disso, você tam- bém encontrará sugestões de conteúdo extra no item Material Complementar, que ampliarão sua interpretação e auxiliarão no pleno entendimento dos temas abordados; Após o contato com o conteúdo proposto, participe dos debates mediados em fóruns de discus- são, pois irão auxiliar a verificar o quanto você absorveu de conhecimento, além de propiciar o contato com seus colegas e tutores, o que se apresenta como rico espaço de troca de ideias e de aprendizagem. Organize seus estudos de maneira que passem a fazer parte Mantenha o foco! Evite se distrair com as redes sociais. Mantenha o foco! Evite se distrair com as redes sociais. Determine um horário fixo para estudar. Aproveite as indicações de Material Complementar. Procure se alimentar e se hidratar quando for estudar; lembre-se de que uma Não se esqueça de se alimentar e de se manter hidratado. Aproveite as Conserve seu material e local de estudos sempre organizados. Procure manter contato com seus colegas e tutores para trocar ideias! Isso amplia a aprendizagem. Seja original! Nunca plagie trabalhos. UNIDADE Dos Tipos de Dados ao Conhecimento Introdução – O Que São Dados? Dados podem ser considerados como sendo quaisquer observações, tanto docu- mentadas como quanto resultados de medição. No contexto de Modelagem da Informação, a alta na disponibilidade de dados observada nos últimos anos nos oferece muitas oportunidades para a obtenção de informações e, claro, construção de conhecimento. Nesse contexto, os dados podem então ser obtidos pela percepção por meio dos sentidos (por exemplo, via observação) ou pela execução de um processo de medição. Mais especificamente, temos, então, o seguinte fluxo generalista da figura 1 quando, via de regra, estamos falando de como os dados são constituídos: Mundo Físico Mundo Comportamental Mundo Sensorial Observar ou Medir Observações e Medições Documentadas Dados Figura 1 – Exemplo de fluxo da construção de dados Quando falamos de mundo físico, podemos exemplificar desde uma AÇÃO, como a realização de uma palestra, em que podemos MEDIR a atitude dos espec- tadores quanto ao conteúdo apresentado pelo palestrante utilizando um INSTRU- MENTO DE MEDIÇÃO, como, nesse exemplo, nossa própria observação, tendo como medidas se as atitudes são POSITIVAS, NEGATIVAS ou NEUTRAS. Os dados brutos podem advir das mais diversas fontes, sendo que ultimamente, a nível de ne- gócios, os Bancos de Dados relacionais continuam sendo a fonte mais significativa de dados explorada pela maioria das Empresas. Ex pl or Dados, Fontes de Dados e Conceitos Generalistas na Cultura de Dados Entretanto, cada vez mais, novas fontes de dados têm surgido, que já vêm sendo tratados como imprescindíveis para alguns negócios, principalmente, em se falando de Empresas que vêm adotando uma cultura orientada a dados. A combinação de dados e a utilização de tecnologias exponenciais tais como Inteligência Artificial e Internet das Coisas (do inglês, internet of things), têm feito com que dados gerados automaticamente por máquinas, e em tempo real, tenham sido cada vez mais aproveitados nas mais diferentes aplicações. 8 9 Por exemplo, podemos notar o crescimento de Empresas com linhas de negó- cio baseados na “raspagem” de dados (do inglês, data scraping), desde ao minerar preços em diferentes sites para apresentar uma comparação ao usuário ou minera- ção em mídias diversas, de transações, de arquivos de log e acompanhamento de tendências, dentre outros. A utilização desses dados advindos das mais diferentes interações humanas para com as diferentes mídias digitais acaba por produzir dados nos mais variados for- matos, sejam texto baseados em e-mails, vídeos, imagens, seja até mesmo a junção deles em diferentes formatos. Para se ter uma ideia do volume de dados produzido em escala mundial atu- almente, a DOMO, Empresa de software em nuvem, costuma lançar um rela- tório anual que mostra quantos dados são coletados/gerados a cada minuto em diversas plataformas, serviços e aplicações, tais como Uber (quantas viagens são feitas por minuto), Google (buscas por minuto) e Instagram (número de stories postados por minuto) dentre diversos outros, como pode ser observado no link a seguir (em inglês), a seguir: Dados coletados em plataformas e serviços conhecidos por minuto. Disponível em: http://bit.ly/35pTbxUEx pl or De acordo com o relatório, a população mundial presente na Internet está cres- cendo significativamente, ano após ano. Em janeiro de 2019, a Internet alcançou 56,1% da população mundial, o que agora representa 4,39 bilhões de pessoas, um aumento de 9% em relação a janeiro de 2018. No geral, de acordo com o estudo, os americanos usaram e geraram 4.416.720GB de dados no último ano, número esse que incluiu 188.000.000 e- -mails, 18.100.000 textos e 4.497.420 pesquisas no Google a cada minuto. Estamos numa era em que nos comunicamos das mais variadas maneiras e, a partir dos diferentes serviços digitais, tais como serviços de pagamento, streaming de música e filmes, delivery de comida e outros produtos, caronas compartilhadas etc. passamos a gerar muitos dados que, a princípio, não estão disponíveis em Ban- cos de Dados relacionais padrões. Assim sendo, uma das grandes preocupações na área de modelagem de infor- mação atualmente é como, a partir da abstração do entendimento de dados por parte do cérebro humano, o que é tido como muito bom nessa tarefa de extração de informações, podemos melhorar o modo como as máquinas possam “enten- der” tais dados, ditos como semiestruturados e não estruturados, ao passo que tais máquinas tendem a produzir dados estruturados. 9 UNIDADE Dos Tipos de Dados ao Conhecimento Dados Estruturados, Semiestruturados e não Estruturados Atualmente, existem três formas de se classificar dados de acordo com sua es- trutura: os dados estruturados, os semiestruturados e os não estruturados, como podemos ver na Figura 2, a seguir: Dados Estruturados Semi Estruturados Não Estruturados Figura 2 – Diferença visual entre dados estruturados, semiestruturados e não estruturados Mais especificamente, a partir da imagem anterior, a diferença visual observada sugere que dados estruturados são aqueles que possuemalgum tipo de organização para serem recuperados (tais como se fizessem o papel de etiquetas, linhas e colu- nas, ou seja, identificadores sobre aquela determinada informação). Já os dados não estruturados são aqueles que não seguem uma estrutura rígida, enquanto os dados ditos semiestruturados ficam entre os extremos, não são estruturados de forma rígida, mas também não são totalmente desestruturados. A seguir, estão melhor detalhadas cada uma dessas classificações, bem como é mostrado comparativo resumido quanto às diferenças mais notáveis entre dados estruturados e não estruturados. Dados Estruturados Dados estruturados são aqueles organizados e representados com uma estrutura rígida, que foi previamente planejada para armazená-los. A maioria das Empresas trabalha com dados armazenados de maneira estrutura- da há décadas embora, como visto na seção anterior, não sejam mais a maior parte do conteúdo produzido atualmente. Eles eram o que existia de melhor para se tirar conclusões e fazer os processos de tomada de decisão fluírem de maneira otimizada. O alto grau de organização desses tipos de dados acaba por facilitar o armazena- mento em um Banco de Dados relacional. Assim, algoritmos de busca e de consulta 10 11 podem recuperar esses dados com eficiência. Em contraste, dados não estrutura- dos não possuem uma estrutura facilmente legível por máquina. Os Bancos de Dados, em geral, não contêm todas as informações possíveis sobre algo lá armazenado. Pelo conteúdo apresentado nos tópicos anteriores, podemos concluir, então, que um dado é uma forma organizada de informação. Entretanto, tal organização só ocorre quando campos específicos são preenchidos para que haja o processo de recuperação de informação de forma automatizada. Por exemplo, ao pensarmos em um formulário de cadastro de um serviço com os campos “Nome”, “E-mail”, “Idade” e determinadas perguntas que admitem como resposta “Sim” ou “Não”. Podemos ter o campo “Nome” como um texto, uma sequência de letras, com ou sem a presença de espaços em branco, que terá um limite máximo e não poderá conter números ou símbolos. O campo “E-mail” também terá um padrão textual, mas formado por uma se- quência de caracteres (e não somente letras, pois pode admitir números e alguns símbolos em específico) e terá de ter, obrigatoriamente, uma arroba (@). Já “Idade” pode ser um campo que aceite apenas um número inteiro positivo, en- quanto o campo referente à pergunta armazena um valor binário (pense em um bit, que pode ser 0 ou 1, em que, comumente, o valor 0 representa “Não” e 1 para “Sim”). Dessa forma, cada campo possui um padrão bem definido, que representa uma estrutura rígida e um formato previamente projetado para a aplicação em específico. Do exemplo anterior, podemos observar ainda que: • Os dados de um mesmo cadastro costumam estar relacionados (em nosso exemplo, dizem respeito à mesma pessoa). Em outras palavras, os dados estru- turados de um mesmo bloco (registro) invariavelmente possuem alguma relação; • Registros ou grupos de dados diferentes (como os advindos de pessoas dife- rentes) possuem diferentes valores, mas se utilizam da mesma representação estrutural homogênea para o armazenamento dos dados, ou seja, possuem os mesmos atributos (pense em atributos como sinônimo dos campos vistos no exemplo acima) e formatos, mas com valores diferentes. Logo, podemos novamente perceber que os Bancos de Dados relacionais são um exemplo da utilização de dados estruturados, inclusive o mais típico, ao passo que neles os dados são estruturados conforme a definição de um esquema, que define as tabelas com seus respectivos campos (ou atributos) e tipos (formatos). O esquema pode ser pensado como uma metainformação do Banco de Dados, ou seja, uma descrição sobre a organização dos dados que serão armazenados no Banco. Entretanto, existem outros exemplos da utilização de dados estruturados, a pró- pria utilização de formulários de cadastro, mesmo que se salvassem os dados em outro recurso fora do Banco de Dados, como diretamente em um arquivo, também 11 UNIDADE Dos Tipos de Dados ao Conhecimento é um exemplo de dados estruturados por conter campos definidos por uma estru- tura rígida e previamente projetada, enquadrando-se na definição. Dados não Estruturados Ao passo que agora entendemos o conceito de dados estruturados, podemos perceber que documentos de texto, como tweets ou demais tipos de mensagens compartilhadas em Mídias Sociais, podem não ser corretamente analisados em toda a sua plenitude no contexto de um Banco de Dados relacional padrão, haja vista que, na maioria das vezes, seria inviável, por exemplo, tentar relacionar as pa- lavras contidas nesses textos a pessoas, contextos e outras informações em outros repositórios que não naquele mesmo texto. A esse tipo de dados, que possuem estruturas flexíveis e dinâmicas, ou nenhu- ma estrutura, dá-se o nome de dados não estruturados, que têm como exemplo mais comum os dados contidos em documentos, arquivos ou advindos de imagens, arquivos de áudio e mídias sociais, entre outros. Pense em um arquivo feito em um editor de texto do tipo em que você pode adicionar quanto texto quiser, sem se preocupar com campos, restrições e limites. O arquivo pode conter também imagens, como gráficos e fotos, misturados aos textos. Imagens, assim como vídeos ou arquivos de áudio, também são exemplos de dados não estruturados. Assim, é fácil concluir que as Redes Sociais, que possuem um enorme volume de dados, como textos, imagens e vídeos criados diariamente por usuários, repre- sentam outro exemplo de dados não estruturados. Atualmente, como se pode observar na Figura 3 a seguir, mais de 80% do con- teúdo digital gerado no mundo é do tipo não estruturado. Figura 3 – Previsão da diferença no volume gerado entre dados estruturados e não estruturados até 2020 Fonte: Adaptado de VMware, Inc. Normalmente, basta pensar em uma situação de dados que não seguem estrutura para termos exemplos de dados não estruturados, mas é preciso tomar um pouco de 12 13 cuidado com essa análise visto que, em computação, todo dado, seja ele um arquivo ou um campo rígido, terá de ter algum tipo de estrutura, mesmo que mínima. Um arquivo é um tipo de estrutura mínima, pois é a unidade básica de armaze- namento no contexto de um Sistema Operacional. Entretanto, ela é genérica, pois aceita diferentes tipos de dados. Em resumo, quase tudo acabará virando um arqui- vo, visto que, por exemplo, eventualmente, um vídeo acaba implicando a criação de um arquivo por meio de seus dados via um codificador (codec), acontecendo a mesma coisa para um áudio, e assim por diante. Portanto, se houver necessidade da diferenciação entre dados estruturados e não estrutura- dos, pense, principalmente, na estrutura interna do arquivo, se ela existe e é rígida, ou não. Ex pl or Dado o já exposto, possivelmente a maior parte dos arquivos que pudermos pensar serão do tipo não estruturados, tais como: • Imagens (fotos, gráficos, desenhos e ilustrações dos mais diversos tipos); • Arquivos de vídeo (filmes, seriados, filmagens diversas, vídeos advindos do YouTube e Vimeo dentre outros); • Arquivos de áudio (música, streaming, gravações diversas); • Textos diversos (páginas completas da Internet, relatórios diversos, documen- tos de editores de texto, e-mails, mensagens em aplicativos como WhatsApp e Telegram, dentre outros); • Mídias e Redes Sociais (blogs, Facebook, Twitter, Instagram, LinkedIn). Atualmente, os seres humanos ainda são melhores e mais eficientes que as má- quinas na leitura e na extração desses dados, porém, com alto esforço em termos de energia, além de, tendo em vista a natureza repetitiva de tais processos, quando centrados em humanos, serem propensos a erros. Afinal, o que tem tornado os dados não estruturados cada vez mais valiosos para as diferentes Empresas?Ex pl or O link a seguir mostra um comparativo entre dados estruturados e não estrutu-rados e as principais diferenças que pudemos observar em nosso texto: Comparativo entre dados estruturados e não estruturados. Disponível em: http://bit.ly/2KS1udPE xp lo r 13 UNIDADE Dos Tipos de Dados ao Conhecimento Dados Semiestruturados Já os dados semiestruturados, como visto anteriormente, apresentam represen- tação heterogênea, ou seja, possuem estrutura, mas ela é flexível. Assim, pensando nos exemplos acima para dados estruturados e não estruturados, temos alguns benefícios, tendo em vista o controle mais facilitado da utilização desses dados, por terem um pouco de estrutura, mas também permitem maior flexibilidade. Um exemplo típico de dado semiestruturado são os arquivos JSON (do inglês, Javascript Object Notation), nos quais, para cada valor representado, atribui-se um nome (ou rótulo) que se descreve o seu significado. Essa sintaxe é derivada da forma utilizada pelo JavaScript para representação de informações e é uma das mais utilizadas hoje em dia para a transmissão de grandes volumes de dados. A seguir, temos um exemplo da representação de dois registros de uma só vez, em que as informações quanto a dois filmes são representadas por meio de um array: [ { “titulo”: “Waterworld: O Segredo das Águas”, “resumo”: “Em um futuro em que as calotas polares derreteram e a Terra está quase totalmente submersa, um marinheiro mutante luta contra a fome e contra os smokers, além de relutantemente, ajudar uma mulher e uma jovem a tentar encontrar terra seca.”, “ano”: 1995, “genero”: [“aventura”, “ação”, “ficção”] }, { “titulo”: “Apocalypse Now”, “resumo”: “Um oficial do Exército dos EUA que serve no Vietnã tem a tarefa de assassinar um coronel renegado das Forças Especiais que se vê como um deus.”, “ano”: 1979, “genero”: [“ação”] } ] 14 15 Outros exemplos de arquivos com dados semiestruturados: • XML: eXtensible Markup Language; • RDF: Resource Description Framework; • OWL: Web Ontology Language. Na Tabela 1, a seguir, temos um comparativo entre dados estruturados, semies- truturados e não estruturados com mais detalhes e exemplos: Tabela 1 – Comparativo visual entre dados estruturados, semiestruturados e não estruturados Dados estruturados Dados semi estruturados Dados não estruturados Ex.: Branco de dados Ex.: XML, JSON, RDF, OWL. Ex.: Textos, arquivos, documentos, imagens, vídeos, áudios, redes sociais, etc. Estrutura rígida Projetada previamente Representação homogênea Estrutura flexível Representação Heterogênea Sem estrutura (ou com estrutura mínima de arquivo) Cada campo de dados tem um formato bem definido. Cada campo de dados tem uma estrutura, mas não existe uma imposição de formato. Mais de 80% dos dados gerados no mundo é deste tipo. Formato é um padrão aceito pelo campo. O esquema é criado com a definição de elementos internos dos arquivos (nós), legíveis para seres humanos. Dados de um mesmo registro possuem relação entre eles. Registros possuem valores diferentes, mas mesmos atributos. Atributos ou campos são definidos por um esquema. Fonte: Adaptada de Leandro Pinho Monteiro (Universidade da Tecnologia) Para mais detalhes a respeito de dados estruturados, semiestruturados e não estruturados, acesse: https://youtu.be/PCZgljKMSCg Ex pl or Dos Dados ao Impacto em Negócios Dados, geralmente, são uma mistura de fatos brutos, que os usuários precisam analisar de modo que sejam interpretáveis e organizados, de maneira adequada, para só então se tornarem, de fato, úteis. Como visto, anteriormente, dados podem vir nos mais diferentes formatos. Por exemplo, textos, imagens e vídeos podem conter muitos dados que exigem inter- pretação para se extrair informações úteis deles. 15 UNIDADE Dos Tipos de Dados ao Conhecimento Ainda, temos que, processos tais como a revisão e a filtragem de dados na bus- ca por fatos relevantes são dispendiosos em termos de tempo e recursos, sendo também processos subjetivos, inconsistentes e propensos a erros. A informação, ao contrário, pode ser tida como uma coleção de fatos consistentemente organizados e estruturados. Os usuários podem, então, investir menos tempo e energia ao procurar por fatos relevantes, visto que é mais fácil encontrar categorias de relevância ou de interesse no contexto de informação; isso acaba tornando as informações mais valiosas do que os dados brutos. Já conhecimento é tido como a aplicação de informações a fim de se responder a uma pergunta ou ao se resolver um problema de negócio. Em outras palavras, informação com contexto ou significado é conhecimento. Assim, resultados anteriores devem servir como base para atribuir contexto às infor- mações disponíveis, portanto, temos, então, que conhecimento depende da memória e da aprendizagem quanto a resultados bem-sucedidos e, mais ainda, sendo essa aprendizagem necessária, temos então que o processo de se converter informações em conhecimento é puramente determinístico. A Figura 4, a seguir, apresenta uma visão simplificada quanto a este processo de evolução no contexto de processamento de dados. Figura 4 – Visão simplificada da evolução em processamento de dados Fonte: fumsoft.org Para mais detalhes quanto a processos determinísticos e estocásticos, acesse: https://bit.ly/2KSJ7p5Ex pl or Tal processo pode ser demasiadamente caro em termos de tempo e recursos, fazendo com que o conhecimento seja mais valioso que simples informações. 16 17 Assim sendo, quando dados são submetidos a um processo de análise de dados, eles se tornam mais relevantes, úteis e valiosos. Problemas de mundo real comumente não possuem soluções simples, sendo, assim, muitas vezes necessária a aplicação de informações de vários e diferentes contextos para sua resolução. Ex pl or Temos, então, que a combinação de diferentes fontes de dados pode ajudar a fornecer diferentes contextos úteis na resolução de problemas e na tomada de de- cisões em mundo real. Em suma, os dados se tornam valiosos quando atendem aos seguintes critérios: • Possuem significado e contexto baseado na experiência e representam o mun- do real de alguma forma; • São um agregado de várias fontes diferentes de dados; • Estão prontamente disponíveis; • São concisos, bem organizados e relevantes. Dados, então, são um bem valioso para as diferentes Empresas tendo em vista que podem reduzir o tempo, esforço e os recursos necessários para se resolver problemas de mundo real e ajudarem a termos processos de tomada de decisões mais assertivos. Tipos de Dados em Modelagem da Informação No campo da Modelagem da Informação, um tipo de dado (no inglês, datatype) consiste em um classificador, similar a uma classe, cujas instâncias são identificadas apenas pelos seus respectivos valores. Mais especificamente, tipos de dados existem para se representar tipos de valo- res do domínio de negócio ou, ainda, tipos primitivos ou tipos estruturados de uma Linguagem de Programação. Por exemplo, datas, gênero, moeda corrente e endereços entre outros podem ser definidos como tipos de dados. Um tipo de dados pode, então, conter atributos e operações de forma a suportar a modelagem de tipos de dados estruturados. Na Figura 5, a seguir, vemos um exemplo padrão de um tipo de dado de ende- reço em UML: 17 UNIDADE Dos Tipos de Dados ao Conhecimento Figura 5 – Exemplo de tipo de dado endereço em UML Fonte: Acervo do conteudista Em geral, um tipo de dados (no inglês, DataType) consiste em, basicamente, três componentes: um espaço de valor, um espaço léxico e um mapeamento bem definido do léxico para o espaço de valor. Um espaço de valor nada mais é do que o conjunto infinito de valores possíveis que podem ser representados pelo tipo de dados em específico. Já o espaço léxico acaba por descrever a sintaxe dos valores do tipo de dados, enquanto o mapeamento é usado para mapear valores sintaticamente corretos para elementos dos espaços de valor. Assim, é possívelque, mesmo infinito, muitos valores sintaticamente diferentes sejam mapeados para o mesmo elemento do espaço de valores. Tipicamente, os tipos de dados, no contexto de Modelagem da Informação, também podem ser categorizados em tipos primitivos e enumerações, como visto a seguir. Os tipos de dados primitivos não possuem estrutura interna tais como números, cadeias de caracteres e valores lógicos, enquanto enumerações são um tipo espe- cial de tipos de dados sem estrutura interna. Mais ainda, um tipo de dado primitivo pode conter semântica precisa e opera- ções definidas fora de uma modelagem como ao utilizar UML, por exemplo, de forma matemática. Mais especificamente, em se tratando de UML, os tipos primitivos incluem os tipos booleanos, inteiros, ilimitados naturais, tipo string e reais. Além disso, em outros paradigmas, também existem os tipos abstratos de dados, ou TAD, os quais são especificações de um conjunto de dados e operações que podem ser executados sobre um determinado conjunto de dados. Por exemplo, se em UML, para representarmos um consumidor, teríamos variá- veis como nome, idade e código, na TAD teríamos um tipo consumidor. Em contraste com os tipos primitivos gerais, o espaço léxico e o espaço de valor de uma enumeração são conjuntos finitos equalizados e bem definidos. 18 19 Assim sendo, enumerações são, basicamente, tipos de dados cujos valores são enumerados no modelo, literais de enumeração definidos pelo usuário. O mapea- mento do espaço léxico para valor é, então, dado na forma de mapeamento um- -para-um. Um bom exemplo de um tipo de dados de enumeração pode ser os tipos de contas disponíveis em uma determinada instituição financeira, consistindo em três diferentes valores possíveis. Já em contraste com os tipos de dados primitivos, os tipos de dados ditos com- plexos possuem estrutura interna. Alguns dos exemplos para tipos de dados complexos que podem ser citados são o nome de um cliente, consistindo em nome e sobrenome e um endereço consistindo em número do imóvel, nome de rua, cidade em que se localiza, país e código postal. Representações mais Comuns de Tipo de Dados Além dos tipos primitivos pré-definidos já exemplificados, a UML permite a definição de tipos de dados adicionais em diagramas de classes. Como visto ante- riormente, eles podem ser do tipo de dados primitivos, complexos e enumerações. Em UML, tipos de dados, semelhantes a classes, podem ter atributos próprios, portanto, sendo usuais para descrever estruturas. A Figura 6, a seguir, traz exemplos para os três tipos de dados: Figura 6 – Exemplos dos diferentes tipos de dados em UML Fonte: Acervo do conteudista Em contraste com as instâncias de classes, embora as representações gráficas de tipos de dados em geral (instâncias de DataType), bem como os tipos primitivos (instâncias de PrimitiveType) e enumerações (instâncias de Enumeração), em par- ticular, sejam semelhantes à representação de classes (instâncias de Classes); ainda assim, são elementos diferentes do metamodelo. Na UML, as generalizações são definidas para classificador e, portanto, também para os tipos de dados. Dessa forma, as relações de herança e generalização entre tipos de dados podem ser definidas em um diagrama de classes UML. 19 UNIDADE Dos Tipos de Dados ao Conhecimento De Dados ao Conhecimento – Modelo Dikw Como visto anteriormente, no texto de introdução a esta unidade, os dados po- dem ser explicados como o produto da pesquisa ou a matéria-prima da informação. Mais especificamente, dados não têm significado a menos que o contexto seja de fato entendido. Para tanto, dados devem ser transformados em informações, que são vistas como um fluxo de mensagens de significados que podem ser adicionados a, e de fato, agirem na reestruturação e mudança em conhecimentos. Dretske (1981) define informação como aquela mercadoria capaz de produzir conhecimento, e que o real valor carregado por informação é o que podemos aprender com ela. Ex pl or O conhecimento como um recurso significativo tem mudado ambos, Sociedade e Economia, drasticamente, haja vista que a natureza do conhecimento na Socie- dade contemporânea é tão específica que até mesmo procedimentos especiais de controle e gerenciamento passaram a serem utilizados. Assim, nas emergentes áreas de Gestão do Conhecimento e Engenharia do Conhecimento, os termos básicos dessas Disciplinas são dados, informação, conhe- cimento e transformação do conhecimento. O conhecimento é um conceito multifacetado com significado de múltiplas ca- madas. A definição mais adotada de conhecimento o descreve como “crença verda- deira justificada” enquanto, na teoria da criação de conhecimento, o conhecimento é visto como um processo humano dinâmico de justificação de crenças pessoais como parte de uma aspiração pela “verdade”. O conhecimento, muitas vezes, então, não é explicitamente descritível, logo não é fácil de explicar e de se formular e formalizar. Portanto, o conhecimento é reco- nhecido como explícito e tácito. A observação formulada por Neil Fleming (1997), a seguir, pode ser vista como base para o pensamento relacionado ao diagrama DIKW, exposto mais abaixo. • Uma coleta de dados não é informação; • Uma coleção de informações não é conhecimento; • Uma coleção de conhecimento não é sabedoria; • Uma coleção de sabedoria não é verdade. A ideia é que informação, conhecimento e sabedoria são mais do que simples coleções. Em vez disso, o todo representa mais do que a soma de suas partes e tem, portanto, sinergia própria. 20 21 O modelo data-information-knowledge-wisdom (DIKW), apresentado na Figura 7, a seguir, é útil para entender como de fato os dados brutos se transformam em informações úteis, depois, em conhecimento e, finalmente, em sabedoria. Sabedoria Conhecimento Informação Dados Figura 7 – Modelo data-information-knowledge-wisdom (DIKW) E sse entendimento é importante à medida que, nos últimos anos, a Ciência da Informação deu saltos significativos, sejam os servidores locais dando espaço aos serviços de nuvem, os Bancos de Dados SQL e as Tabelas de Dados sendo aos poucos migradas para os armazenamentos de dados no SQL e key-value e, claro, sejam as mudanças advindas da maior automatização de utilização de tecnologias em Big Data e Inteligência Artificial, tendo em vista lidar com grandes volumes, variedades e velocidades de dados. Variantes do Modelo Dikw Existem muitas variantes do modelo DIKW. Uma variante, proposta por Milan Zeleny em 1987, é o DIKWE, que adiciona uma camada de ápice para a iluminação (do inglês, enlightenment). Outra variante, proposta por Russell Ackoff, em 1989, é a DIKUW, que acres- centa uma camada intermediária de entendimento (do inglês, understanding). Alguns especialistas modelam isso como DIKIW, em que o segundo “I” define percepção (do inglês, insight) ou inteligência. O modelo DIKW nos ajuda a descrever métodos para a solução de problemas ou tomada de decisão. Nele, o conhecimento é o resultado mais valioso a ser obtido por meio de dados e, embora o conhecimento forneça os meios para solucionar um problema, ele não mostra necessariamente a melhor maneira de fazê-lo. A capacidade de escolher a melhor maneira de alcançar o resultado dese- jado vem da experiência adquirida em tentativas anteriores de alcançar uma solução bem-sucedida. 21 UNIDADE Dos Tipos de Dados ao Conhecimento No topo, sabedoria é, então, a capacidade de “escolher a melhor escolha”, levan- do a bons resultados. Temos, assim, que as pessoas só ganham sabedoria por meio da experiência e do conhecimento, que vêm das capacidades de: • Desenvolver insights por meio da análise de dados e informações para um determinado contexto; • Coletar inteligência de outras pessoas resolvendo os mesmos problemas; • Desenvolver uma compreensão dos diferentes métodos de solução de problemas. Gestão do Conhecimento A Gestão do Conhecimento reconhece a necessidade de explorar o capital inte-lectual, mas muitas práticas são insuficientes apenas se concentrando componentes do conhecimento individual. O conhecimento integrado possui estrutura multiforme, links apropriados com possi- bilidade de agregar, separar e generalizar partes e totalidades na dependência temporal. Além disso, a Gestão do Conhecimento precisa de ferramentas que possam ajudar a fornecer aos usuários conhecimentos relevantes e adequados, em tempo apropria- do e de forma integrada aos consumíveis, ao resolver tarefas como a melhoria de processos, suporte a decisões, treinamento, gerenciamento de riscos e outros. No entanto, a introdução específica do termo conhecimento cria um ponto de vis- ta diferente e permite formas mais sofisticadas de uso. Não é mais suficiente fornecer grandes quantidades de informações aos usuários. Em vez disso, é importante apoiá- -los em suas atividades ao trabalhar com conhecimento. A Gestão do Conhecimento é uma abordagem holística, que pode ser analisada de diferentes maneiras. Nonaka e Takeuchi (1995) enfatizam, em sua definição, a importância da distin- ção entre conhecimento tácito e explícito: a Gestão do Conhecimento é a estrutura de conhecimento tácita e explícita para um processo humano dinâmico de justificar a crença pessoal em direção à verdade. Conhecimento explícito é, então, o conhecimento já extraído e consumível em livros ou outras mídias. O conhecimento tácito não está presente de forma explícita e nem sempre pode ser articulado por uma pessoa que possua o conhecimento. Thomas Davenport enfatiza a importância do processo e da cadeia de suprimen- tos: a gestão do conhecimento é para ele uma iniciativa formal e estruturada para me- lhorar a criação, a distribuição ou o uso do conhecimento em uma organização. É um processo formal de transformar o conhecimento corporativo em valor corporativo. Estamos interessados, principalmente, em como o conhecimento pode ser cap- turado e processado, quais áreas tecnológicas podem nos ajudar a realizar uma 22 23 estratégia de gerenciamento de conhecimento e que tipo de conhecimento é geren- ciado de fato. Temos de considerar que, nesse contexto, modelos são apenas uma aproxima- ção da realidade e o processo de modelagem é, portanto, um processo cíclico. Novas observações podem levar a um refinamento, modificação ou conclusão do modelo já construído. Por outro lado, o modelo pode guiar novas aquisições de conhecimento e, além disso, o processo de modelagem é dependente da interpretação subjetiva do conhecimento. A modelagem contextual lida, portanto, com diferentes tipos de informações de contexto. É possível considerar o contexto como o reflexo do objeto, ou fenômenos, usando diferentes interpretações por meio do sistema de cognição tal como percepção, concepção e interpretação. Nesta Unidade, aprendemos, então, que os dados são um bem valioso, haja vista que podem reduzir o tempo, o esforço e os recursos necessários para resolver pro- blemas e nos ajudar a tomar decisões cada vez mais acertadas. Para o restante de nossos tópicos nessa Disciplina de Modelagem da Informação é importante salientar que as máquinas já podem lidar eficientemente com dados estruturados, entretanto, 90% de todos os dados não são estruturados, incluindo textos, e-mails, imagens e vídeos. Os seres humanos ainda são mais adequados do que as máquinas ao lidar com dados não estruturados, mas os seres humanos são propensos a erros, inconsisten- tes e subjetivos ao realizarem tarefas repetitivas. O modelo DIKW e seus variantes nos permitem entender o processo por trás da conversão de dados em informação e conhecimento ao passo que procuramos fazer com que as máquinas se excedam em tarefas com base em dados não estruturados. 23 UNIDADE Dos Tipos de Dados ao Conhecimento Material Complementar Indicações para saber mais sobre os assuntos abordados nesta Unidade: Sites Agile Modeling http://bit.ly/35ytcV5 Data Type http://bit.ly/2qPpnvP Modelagem de Dados http://bit.ly/2OnxUzi Cinco passos para criar uma cultura orientada por dados http://bit.ly/2OSvgAG Dados Estruturados e Não Estruturados http://bit.ly/2KWQlsq 24 25 Referências ALLEMANG, D.; HENDLER J. Semantic Web for the Working Ontologist: Effective Modeling in RDFS and OWL. Morgan Kaufmann Publishers Inc. San Francisco, CA: Morgan Kaufmann, 2008. BOOCH, G.; RUMBAUGH, J; JACOBSON, I. The Unified Modeling Language user guide. EUA: Addison-Wesley, 1997. DAVENPORT, T. H.; PRUSAK, L. Working Knowledge. How Organizations manage what they know. EUA: McGraw-Hill/Harvard Business School Press, 1998. DRETSKE, F. I. Knowledge and the flow of information. I nglaterra: Basil Blackwell Publisher, 1981. FLEMING, N. Coping with a Revolution: Will the Internet Change Learning?, Canterbury, New Zealand: Lincoln University 1997. GODINEZ, M.; HECHLER, E. et al. The Art of Enterprise Information Architecture, A Systems-Based Approach for Unlocking Business Insight. EUA: IBM Press, 2010. HAY, D. C. Data Model Patterns: Conventions of Thought. New York: Dorset House Publishing, 2011. KLIMESOVA, D. Data, Information and Knowledge Transformation. PROCEEDINGS OF THE 10th WSEAS INTERNATIONAL CONFERENCE ON AUTOMATION & INFORMATION, Praga: 2009. MONTEIRO, L. P. Dados Estruturados e Não Estruturados. Universidade da Tecnologia, 2019. Disponível em: <https://universidadedatecnologia.com.br/ dados-estruturados-e-nao-estruturados>. NONAKA, I., TAKEUCHI, H. The Knowledge Creating Company: How Japanese Companies Create the Dynamics of Innovation. Inglaterra: Oxford University Press, 1995. TEOREY, T. J. Database modeling and design: logical design 5.ed. Burlington, Mass.: Morgan Kaufmann Publishers, Amsterdam, Boston, 2011. ZELENY, M. Management support systems: Towards integrated knowledge management, Human Systems Management. EUA, n. 7, p. 59-70, 1987. 25
Compartilhar