Modelagem da Informação: Dos Dados ao Conhecimento

•

CSV

Marcio Gonçalves

28/02/2021

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 26 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 26 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 26 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Modelagem de Dados

7.480 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Modelagem da
Informação
Material Teórico
Responsável pelo Conteúdo:
Prof. Me. José Ahirton Batista Lopes Filho
Revisão Textual:
Prof.ª Dr.ª Selma Aparecida Cesarin
Dos Tipos de Dados ao Conhecimento
• Introdução – O Que São Dados?
• Dados, Fontes de Dados e Conceitos Generalistas na Cultura de Dados;
• Dados Estruturados, Semiestruturados e não Estruturados;
• Dos Dados ao Impacto em Negócios;
• Tipos de Dados em Modelagem da Informação;
• De Dados ao Conhecimento – Modelo Dikw;
• Gestão do Conhecimento.
• Capacitar os alunos quanto ao processo de modelagem de informações;
• Impulsionar o pensamento crítico quanto ao desenho e à utilização de modelos no pro-
cesso de modelagem da informação para gestão de conhecimento;
• Qualifi car os alunos para lidarem com o processo de gestão e construção de conhecimen-
to quando inseridos em equipes ágeis, adotando uma verdadeira cultura de dados em
suas vidas profi ssionais.
OBJETIVOS DE APRENDIZADO
Dos Tipos de Dados ao Conhecimento
Orientações de estudo
Para que o conteúdo desta Disciplina seja bem
aproveitado e haja maior aplicabilidade na sua
formação acadêmica e atuação profissional, siga
algumas recomendações básicas:
Assim:
Organize seus estudos de maneira que passem a fazer parte
da sua rotina. Por exemplo, você poderá determinar um dia e
horário fixos como seu “momento do estudo”;
Procure se alimentar e se hidratar quando for estudar; lembre-se de que uma
alimentação saudável pode proporcionar melhor aproveitamento do estudo;
No material de cada Unidade, há leituras indicadas e, entre elas, artigos científicos, livros, vídeos
e sites para aprofundar os conhecimentos adquiridos ao longo da Unidade. Além disso, você tam-
bém encontrará sugestões de conteúdo extra no item Material Complementar, que ampliarão sua
interpretação e auxiliarão no pleno entendimento dos temas abordados;
Após o contato com o conteúdo proposto, participe dos debates mediados em fóruns de discus-
são, pois irão auxiliar a verificar o quanto você absorveu de conhecimento, além de propiciar o
contato com seus colegas e tutores, o que se apresenta como rico espaço de troca de ideias e
de aprendizagem.
Organize seus estudos de maneira que passem a fazer parte
Mantenha o foco!
Evite se distrair com
as redes sociais.
Mantenha o foco!
Evite se distrair com
as redes sociais.
Determine um
horário fixo
para estudar.
Aproveite as
indicações
de Material
Complementar.
Procure se alimentar e se hidratar quando for estudar; lembre-se de que uma
Não se esqueça
de se alimentar
e de se manter
hidratado.
Aproveite as
Conserve seu
material e local de
estudos sempre
organizados.
Procure manter
contato com seus
colegas e tutores
para trocar ideias!
Isso amplia a
aprendizagem.
Seja original!
Nunca plagie
trabalhos.
UNIDADE Dos Tipos de Dados ao Conhecimento
Introdução – O Que São Dados?
Dados podem ser considerados como sendo quaisquer observações, tanto docu-
mentadas como quanto resultados de medição.
No contexto de Modelagem da Informação, a alta na disponibilidade de dados
observada nos últimos anos nos oferece muitas oportunidades para a obtenção de
informações e, claro, construção de conhecimento.
Nesse contexto, os dados podem então ser obtidos pela percepção por meio dos
sentidos (por exemplo, via observação) ou pela execução de um processo de medição.
Mais especificamente, temos, então, o seguinte fluxo generalista da figura 1
quando, via de regra, estamos falando de como os dados são constituídos:
Mundo Físico
Mundo Comportamental
Mundo Sensorial
Observar
ou Medir
Observações e
Medições Documentadas
Dados
Figura 1 – Exemplo de fluxo da construção de dados
Quando falamos de mundo físico, podemos exemplificar desde uma AÇÃO,
como a realização de uma palestra, em que podemos MEDIR a atitude dos espec-
tadores quanto ao conteúdo apresentado pelo palestrante utilizando um INSTRU-
MENTO DE MEDIÇÃO, como, nesse exemplo, nossa própria observação, tendo
como medidas se as atitudes são POSITIVAS, NEGATIVAS ou NEUTRAS.
Os dados brutos podem advir das mais diversas fontes, sendo que ultimamente, a nível de ne-
gócios, os Bancos de Dados relacionais continuam sendo a fonte mais significativa de dados
explorada pela maioria das Empresas.
Ex
pl
or
Dados, Fontes de Dados e Conceitos
Generalistas na Cultura de Dados
Entretanto, cada vez mais, novas fontes de dados têm surgido, que já vêm sendo
tratados como imprescindíveis para alguns negócios, principalmente, em se falando
de Empresas que vêm adotando uma cultura orientada a dados.
A combinação de dados e a utilização de tecnologias exponenciais tais como
Inteligência Artificial e Internet das Coisas (do inglês, internet of things), têm feito
com que dados gerados automaticamente por máquinas, e em tempo real, tenham
sido cada vez mais aproveitados nas mais diferentes aplicações.
8
9
Por exemplo, podemos notar o crescimento de Empresas com linhas de negó-
cio baseados na “raspagem” de dados (do inglês, data scraping), desde ao minerar
preços em diferentes sites para apresentar uma comparação ao usuário ou minera-
ção em mídias diversas, de transações, de arquivos de log e acompanhamento de
tendências, dentre outros.
A utilização desses dados advindos das mais diferentes interações humanas para
com as diferentes mídias digitais acaba por produzir dados nos mais variados for-
matos, sejam texto baseados em e-mails, vídeos, imagens, seja até mesmo a junção
deles em diferentes formatos.
Para se ter uma ideia do volume de dados produzido em escala mundial atu-
almente, a DOMO, Empresa de software em nuvem, costuma lançar um rela-
tório anual que mostra quantos dados são coletados/gerados a cada minuto em
diversas plataformas, serviços e aplicações, tais como Uber (quantas viagens são
feitas por minuto), Google (buscas por minuto) e Instagram (número de stories
postados por minuto) dentre diversos outros, como pode ser observado no link a
seguir (em inglês), a seguir:
Dados coletados em plataformas e serviços conhecidos por minuto.
Disponível em: http://bit.ly/35pTbxUEx
pl
or
De acordo com o relatório, a população mundial presente na Internet está cres-
cendo significativamente, ano após ano. Em janeiro de 2019, a Internet alcançou
56,1% da população mundial, o que agora representa 4,39 bilhões de pessoas, um
aumento de 9% em relação a janeiro de 2018.
No geral, de acordo com o estudo, os americanos usaram e geraram
4.416.720GB de dados no último ano, número esse que incluiu 188.000.000 e-
-mails, 18.100.000 textos e 4.497.420 pesquisas no Google a cada minuto.
Estamos numa era em que nos comunicamos das mais variadas maneiras e, a
partir dos diferentes serviços digitais, tais como serviços de pagamento, streaming
de música e filmes, delivery de comida e outros produtos, caronas compartilhadas
etc. passamos a gerar muitos dados que, a princípio, não estão disponíveis em Ban-
cos de Dados relacionais padrões.
Assim sendo, uma das grandes preocupações na área de modelagem de infor-
mação atualmente é como, a partir da abstração do entendimento de dados por
parte do cérebro humano, o que é tido como muito bom nessa tarefa de extração
de informações, podemos melhorar o modo como as máquinas possam “enten-
der” tais dados, ditos como semiestruturados e não estruturados, ao passo que tais
máquinas tendem a produzir dados estruturados.
9
UNIDADE Dos Tipos de Dados ao Conhecimento
Dados Estruturados, Semiestruturados
e não Estruturados
Atualmente, existem três formas de se classificar dados de acordo com sua es-
trutura: os dados estruturados, os semiestruturados e os não estruturados, como
podemos ver na Figura 2, a seguir:
Dados
Estruturados Semi Estruturados Não Estruturados
Figura 2 – Diferença visual entre dados estruturados, semiestruturados e não estruturados
Mais especificamente, a partir da imagem anterior, a diferença visual observada
sugere que dados estruturados são aqueles que possuemalgum tipo de organização
para serem recuperados (tais como se fizessem o papel de etiquetas, linhas e colu-
nas, ou seja, identificadores sobre aquela determinada informação).
Já os dados não estruturados são aqueles que não seguem uma estrutura
rígida, enquanto os dados ditos semiestruturados ficam entre os extremos, não são
estruturados de forma rígida, mas também não são totalmente desestruturados.
A seguir, estão melhor detalhadas cada uma dessas classificações, bem como
é mostrado comparativo resumido quanto às diferenças mais notáveis entre dados
estruturados e não estruturados.
Dados Estruturados
Dados estruturados são aqueles organizados e representados com uma estrutura
rígida, que foi previamente planejada para armazená-los.
A maioria das Empresas trabalha com dados armazenados de maneira estrutura-
da há décadas embora, como visto na seção anterior, não sejam mais a maior parte
do conteúdo produzido atualmente.
Eles eram o que existia de melhor para se tirar conclusões e fazer os processos
de tomada de decisão fluírem de maneira otimizada.
O alto grau de organização desses tipos de dados acaba por facilitar o armazena-
mento em um Banco de Dados relacional. Assim, algoritmos de busca e de consulta
10
11
podem recuperar esses dados com eficiência. Em contraste, dados não estrutura-
dos não possuem uma estrutura facilmente legível por máquina.
Os Bancos de Dados, em geral, não contêm todas as informações possíveis sobre
algo lá armazenado. Pelo conteúdo apresentado nos tópicos anteriores, podemos
concluir, então, que um dado é uma forma organizada de informação. Entretanto,
tal organização só ocorre quando campos específicos são preenchidos para que
haja o processo de recuperação de informação de forma automatizada.
Por exemplo, ao pensarmos em um formulário de cadastro de um serviço com
os campos “Nome”, “E-mail”, “Idade” e determinadas perguntas que admitem
como resposta “Sim” ou “Não”. Podemos ter o campo “Nome” como um texto,
uma sequência de letras, com ou sem a presença de espaços em branco, que terá
um limite máximo e não poderá conter números ou símbolos.
O campo “E-mail” também terá um padrão textual, mas formado por uma se-
quência de caracteres (e não somente letras, pois pode admitir números e alguns
símbolos em específico) e terá de ter, obrigatoriamente, uma arroba (@).
Já “Idade” pode ser um campo que aceite apenas um número inteiro positivo, en-
quanto o campo referente à pergunta armazena um valor binário (pense em um bit,
que pode ser 0 ou 1, em que, comumente, o valor 0 representa “Não” e 1 para “Sim”).
Dessa forma, cada campo possui um padrão bem definido, que representa uma
estrutura rígida e um formato previamente projetado para a aplicação em específico.
Do exemplo anterior, podemos observar ainda que:
• Os dados de um mesmo cadastro costumam estar relacionados (em nosso
exemplo, dizem respeito à mesma pessoa). Em outras palavras, os dados estru-
turados de um mesmo bloco (registro) invariavelmente possuem alguma relação;
• Registros ou grupos de dados diferentes (como os advindos de pessoas dife-
rentes) possuem diferentes valores, mas se utilizam da mesma representação
estrutural homogênea para o armazenamento dos dados, ou seja, possuem os
mesmos atributos (pense em atributos como sinônimo dos campos vistos no
exemplo acima) e formatos, mas com valores diferentes.
Logo, podemos novamente perceber que os Bancos de Dados relacionais são
um exemplo da utilização de dados estruturados, inclusive o mais típico, ao passo
que neles os dados são estruturados conforme a definição de um esquema, que
define as tabelas com seus respectivos campos (ou atributos) e tipos (formatos).
O esquema pode ser pensado como uma metainformação do Banco de Dados, ou
seja, uma descrição sobre a organização dos dados que serão armazenados no Banco.
Entretanto, existem outros exemplos da utilização de dados estruturados, a pró-
pria utilização de formulários de cadastro, mesmo que se salvassem os dados em
outro recurso fora do Banco de Dados, como diretamente em um arquivo, também
11
UNIDADE Dos Tipos de Dados ao Conhecimento
é um exemplo de dados estruturados por conter campos definidos por uma estru-
tura rígida e previamente projetada, enquadrando-se na definição.
Dados não Estruturados
Ao passo que agora entendemos o conceito de dados estruturados, podemos
perceber que documentos de texto, como tweets ou demais tipos de mensagens
compartilhadas em Mídias Sociais, podem não ser corretamente analisados em
toda a sua plenitude no contexto de um Banco de Dados relacional padrão, haja
vista que, na maioria das vezes, seria inviável, por exemplo, tentar relacionar as pa-
lavras contidas nesses textos a pessoas, contextos e outras informações em outros
repositórios que não naquele mesmo texto.
A esse tipo de dados, que possuem estruturas flexíveis e dinâmicas, ou nenhu-
ma estrutura, dá-se o nome de dados não estruturados, que têm como exemplo
mais comum os dados contidos em documentos, arquivos ou advindos de imagens,
arquivos de áudio e mídias sociais, entre outros.
Pense em um arquivo feito em um editor de texto do tipo em que você pode
adicionar quanto texto quiser, sem se preocupar com campos, restrições e limites.
O arquivo pode conter também imagens, como gráficos e fotos, misturados aos
textos. Imagens, assim como vídeos ou arquivos de áudio, também são exemplos
de dados não estruturados.
Assim, é fácil concluir que as Redes Sociais, que possuem um enorme volume
de dados, como textos, imagens e vídeos criados diariamente por usuários, repre-
sentam outro exemplo de dados não estruturados.
Atualmente, como se pode observar na Figura 3 a seguir, mais de 80% do con-
teúdo digital gerado no mundo é do tipo não estruturado.
Figura 3 – Previsão da diferença no volume gerado entre dados estruturados e não estruturados até 2020
Fonte: Adaptado de VMware, Inc.
Normalmente, basta pensar em uma situação de dados que não seguem estrutura
para termos exemplos de dados não estruturados, mas é preciso tomar um pouco de
12
13
cuidado com essa análise visto que, em computação, todo dado, seja ele um arquivo
ou um campo rígido, terá de ter algum tipo de estrutura, mesmo que mínima.
Um arquivo é um tipo de estrutura mínima, pois é a unidade básica de armaze-
namento no contexto de um Sistema Operacional. Entretanto, ela é genérica, pois
aceita diferentes tipos de dados. Em resumo, quase tudo acabará virando um arqui-
vo, visto que, por exemplo, eventualmente, um vídeo acaba implicando a criação
de um arquivo por meio de seus dados via um codificador (codec), acontecendo a
mesma coisa para um áudio, e assim por diante.
Portanto, se houver necessidade da diferenciação entre dados estruturados e não estrutura-
dos, pense, principalmente, na estrutura interna do arquivo, se ela existe e é rígida, ou não. Ex
pl
or
Dado o já exposto, possivelmente a maior parte dos arquivos que pudermos
pensar serão do tipo não estruturados, tais como:
• Imagens (fotos, gráficos, desenhos e ilustrações dos mais diversos tipos);
• Arquivos de vídeo (filmes, seriados, filmagens diversas, vídeos advindos do
YouTube e Vimeo dentre outros);
• Arquivos de áudio (música, streaming, gravações diversas);
• Textos diversos (páginas completas da Internet, relatórios diversos, documen-
tos de editores de texto, e-mails, mensagens em aplicativos como WhatsApp e
Telegram, dentre outros);
• Mídias e Redes Sociais (blogs, Facebook, Twitter, Instagram, LinkedIn).
Atualmente, os seres humanos ainda são melhores e mais eficientes que as má-
quinas na leitura e na extração desses dados, porém, com alto esforço em termos
de energia, além de, tendo em vista a natureza repetitiva de tais processos, quando
centrados em humanos, serem propensos a erros.
Afinal, o que tem tornado os dados não estruturados cada vez mais valiosos para as
diferentes Empresas?Ex
pl
or
O link a seguir mostra um comparativo entre dados estruturados e não estrutu-rados e as principais diferenças que pudemos observar em nosso texto:
Comparativo entre dados estruturados e não estruturados.
Disponível em: http://bit.ly/2KS1udPE
xp
lo
r
13
UNIDADE Dos Tipos de Dados ao Conhecimento
Dados Semiestruturados
Já os dados semiestruturados, como visto anteriormente, apresentam represen-
tação heterogênea, ou seja, possuem estrutura, mas ela é flexível.
Assim, pensando nos exemplos acima para dados estruturados e não estruturados,
temos alguns benefícios, tendo em vista o controle mais facilitado da utilização desses
dados, por terem um pouco de estrutura, mas também permitem maior flexibilidade.
Um exemplo típico de dado semiestruturado são os arquivos JSON (do inglês,
Javascript Object Notation), nos quais, para cada valor representado, atribui-se um
nome (ou rótulo) que se descreve o seu significado.
Essa sintaxe é derivada da forma utilizada pelo JavaScript para representação de
informações e é uma das mais utilizadas hoje em dia para a transmissão de grandes
volumes de dados.
A seguir, temos um exemplo da representação de dois registros de uma só vez, em
que as informações quanto a dois filmes são representadas por meio de um array:
[
{
“titulo”: “Waterworld: O Segredo das Águas”,
“resumo”: “Em um futuro em que as calotas polares derreteram e a Terra
está quase totalmente submersa, um marinheiro mutante luta contra a fome e
contra os smokers, além de relutantemente, ajudar uma mulher e uma jovem a
tentar encontrar terra seca.”,
“ano”: 1995,
“genero”: [“aventura”, “ação”, “ficção”]
},
{
“titulo”: “Apocalypse Now”,
“resumo”: “Um oficial do Exército dos EUA que serve no Vietnã tem a
tarefa de assassinar um coronel renegado das Forças Especiais que se vê como
um deus.”,
“ano”: 1979,
“genero”: [“ação”]
}
]
14
15
Outros exemplos de arquivos com dados semiestruturados:
• XML: eXtensible Markup Language;
• RDF: Resource Description Framework;
• OWL: Web Ontology Language.
Na Tabela 1, a seguir, temos um comparativo entre dados estruturados, semies-
truturados e não estruturados com mais detalhes e exemplos:
Tabela 1 – Comparativo visual entre dados estruturados, semiestruturados e não estruturados
Dados estruturados Dados semi estruturados Dados não estruturados
Ex.: Branco de dados Ex.: XML, JSON, RDF, OWL. Ex.: Textos, arquivos, documentos, imagens, vídeos, áudios, redes sociais, etc.
Estrutura rígida
Projetada previamente
Representação homogênea
Estrutura flexível
Representação Heterogênea
Sem estrutura
(ou com estrutura mínima de arquivo)
Cada campo de dados tem um
formato bem definido.
Cada campo de dados tem uma
estrutura, mas não existe uma
imposição de formato.
Mais de 80% dos dados gerados
no mundo é deste tipo.
Formato é um padrão
aceito pelo campo.
O esquema é criado com a definição de
elementos internos dos arquivos (nós),
legíveis para seres humanos.
Dados de um mesmo registro
possuem relação entre eles.
Registros possuem valores
diferentes, mas mesmos atributos.
Atributos ou campos são definidos
por um esquema.
Fonte: Adaptada de Leandro Pinho Monteiro (Universidade da Tecnologia)
Para mais detalhes a respeito de dados estruturados, semiestruturados e não estruturados,
acesse: https://youtu.be/PCZgljKMSCg Ex
pl
or
Dos Dados ao Impacto em Negócios
Dados, geralmente, são uma mistura de fatos brutos, que os usuários precisam
analisar de modo que sejam interpretáveis e organizados, de maneira adequada,
para só então se tornarem, de fato, úteis.
Como visto, anteriormente, dados podem vir nos mais diferentes formatos. Por
exemplo, textos, imagens e vídeos podem conter muitos dados que exigem inter-
pretação para se extrair informações úteis deles.
15
UNIDADE Dos Tipos de Dados ao Conhecimento
Ainda, temos que, processos tais como a revisão e a filtragem de dados na bus-
ca por fatos relevantes são dispendiosos em termos de tempo e recursos, sendo
também processos subjetivos, inconsistentes e propensos a erros. A informação, ao
contrário, pode ser tida como uma coleção de fatos consistentemente organizados
e estruturados.
Os usuários podem, então, investir menos tempo e energia ao procurar por fatos
relevantes, visto que é mais fácil encontrar categorias de relevância ou de interesse
no contexto de informação; isso acaba tornando as informações mais valiosas do
que os dados brutos. Já conhecimento é tido como a aplicação de informações a
fim de se responder a uma pergunta ou ao se resolver um problema de negócio.
Em outras palavras, informação com contexto ou significado é conhecimento.
Assim, resultados anteriores devem servir como base para atribuir contexto às infor-
mações disponíveis, portanto, temos, então, que conhecimento depende da memória
e da aprendizagem quanto a resultados bem-sucedidos e, mais ainda, sendo essa
aprendizagem necessária, temos então que o processo de se converter informações
em conhecimento é puramente determinístico.
A Figura 4, a seguir, apresenta uma visão simplificada quanto a este processo de
evolução no contexto de processamento de dados.
Figura 4 – Visão simplificada da evolução em processamento de dados
Fonte: fumsoft.org
Para mais detalhes quanto a processos determinísticos e estocásticos,
acesse: https://bit.ly/2KSJ7p5Ex
pl
or
Tal processo pode ser demasiadamente caro em termos de tempo e recursos,
fazendo com que o conhecimento seja mais valioso que simples informações.
16
17
Assim sendo, quando dados são submetidos a um processo de análise de dados,
eles se tornam mais relevantes, úteis e valiosos.
Problemas de mundo real comumente não possuem soluções simples, sendo, assim,
muitas vezes necessária a aplicação de informações de vários e diferentes contextos
para sua resolução.
Ex
pl
or
Temos, então, que a combinação de diferentes fontes de dados pode ajudar a
fornecer diferentes contextos úteis na resolução de problemas e na tomada de de-
cisões em mundo real.
Em suma, os dados se tornam valiosos quando atendem aos seguintes critérios:
• Possuem significado e contexto baseado na experiência e representam o mun-
do real de alguma forma;
• São um agregado de várias fontes diferentes de dados;
• Estão prontamente disponíveis;
• São concisos, bem organizados e relevantes.
Dados, então, são um bem valioso para as diferentes Empresas tendo em vista
que podem reduzir o tempo, esforço e os recursos necessários para se resolver
problemas de mundo real e ajudarem a termos processos de tomada de decisões
mais assertivos.
Tipos de Dados em Modelagem da Informação
No campo da Modelagem da Informação, um tipo de dado (no inglês, datatype)
consiste em um classificador, similar a uma classe, cujas instâncias são identificadas
apenas pelos seus respectivos valores.
Mais especificamente, tipos de dados existem para se representar tipos de valo-
res do domínio de negócio ou, ainda, tipos primitivos ou tipos estruturados de uma
Linguagem de Programação.
Por exemplo, datas, gênero, moeda corrente e endereços entre outros podem
ser definidos como tipos de dados. Um tipo de dados pode, então, conter atributos
e operações de forma a suportar a modelagem de tipos de dados estruturados.
Na Figura 5, a seguir, vemos um exemplo padrão de um tipo de dado de ende-
reço em UML:
17
UNIDADE Dos Tipos de Dados ao Conhecimento
Figura 5 – Exemplo de tipo de dado endereço em UML
Fonte: Acervo do conteudista
Em geral, um tipo de dados (no inglês, DataType) consiste em, basicamente,
três componentes: um espaço de valor, um espaço léxico e um mapeamento bem
definido do léxico para o espaço de valor.
Um espaço de valor nada mais é do que o conjunto infinito de valores possíveis
que podem ser representados pelo tipo de dados em específico.
Já o espaço léxico acaba por descrever a sintaxe dos valores do tipo de dados,
enquanto o mapeamento é usado para mapear valores sintaticamente corretos para
elementos dos espaços de valor.
Assim, é possívelque, mesmo infinito, muitos valores sintaticamente diferentes
sejam mapeados para o mesmo elemento do espaço de valores.
Tipicamente, os tipos de dados, no contexto de Modelagem da Informação,
também podem ser categorizados em tipos primitivos e enumerações, como visto
a seguir.
Os tipos de dados primitivos não possuem estrutura interna tais como números,
cadeias de caracteres e valores lógicos, enquanto enumerações são um tipo espe-
cial de tipos de dados sem estrutura interna.
Mais ainda, um tipo de dado primitivo pode conter semântica precisa e opera-
ções definidas fora de uma modelagem como ao utilizar UML, por exemplo, de
forma matemática.
Mais especificamente, em se tratando de UML, os tipos primitivos incluem os
tipos booleanos, inteiros, ilimitados naturais, tipo string e reais.
Além disso, em outros paradigmas, também existem os tipos abstratos de dados,
ou TAD, os quais são especificações de um conjunto de dados e operações que
podem ser executados sobre um determinado conjunto de dados.
Por exemplo, se em UML, para representarmos um consumidor, teríamos variá-
veis como nome, idade e código, na TAD teríamos um tipo consumidor.
Em contraste com os tipos primitivos gerais, o espaço léxico e o espaço de valor
de uma enumeração são conjuntos finitos equalizados e bem definidos.
18
19
Assim sendo, enumerações são, basicamente, tipos de dados cujos valores são
enumerados no modelo, literais de enumeração definidos pelo usuário. O mapea-
mento do espaço léxico para valor é, então, dado na forma de mapeamento um-
-para-um.
Um bom exemplo de um tipo de dados de enumeração pode ser os tipos de
contas disponíveis em uma determinada instituição financeira, consistindo em três
diferentes valores possíveis.
Já em contraste com os tipos de dados primitivos, os tipos de dados ditos com-
plexos possuem estrutura interna.
Alguns dos exemplos para tipos de dados complexos que podem ser citados são o
nome de um cliente, consistindo em nome e sobrenome e um endereço consistindo
em número do imóvel, nome de rua, cidade em que se localiza, país e código postal.
Representações mais Comuns de Tipo de Dados
Além dos tipos primitivos pré-definidos já exemplificados, a UML permite a
definição de tipos de dados adicionais em diagramas de classes. Como visto ante-
riormente, eles podem ser do tipo de dados primitivos, complexos e enumerações.
Em UML, tipos de dados, semelhantes a classes, podem ter atributos próprios,
portanto, sendo usuais para descrever estruturas.
A Figura 6, a seguir, traz exemplos para os três tipos de dados:
Figura 6 – Exemplos dos diferentes tipos de dados em UML
Fonte: Acervo do conteudista
Em contraste com as instâncias de classes, embora as representações gráficas
de tipos de dados em geral (instâncias de DataType), bem como os tipos primitivos
(instâncias de PrimitiveType) e enumerações (instâncias de Enumeração), em par-
ticular, sejam semelhantes à representação de classes (instâncias de Classes); ainda
assim, são elementos diferentes do metamodelo.
Na UML, as generalizações são definidas para classificador e, portanto, também
para os tipos de dados. Dessa forma, as relações de herança e generalização entre
tipos de dados podem ser definidas em um diagrama de classes UML.
19
UNIDADE Dos Tipos de Dados ao Conhecimento
De Dados ao Conhecimento – Modelo Dikw
Como visto anteriormente, no texto de introdução a esta unidade, os dados po-
dem ser explicados como o produto da pesquisa ou a matéria-prima da informação.
Mais especificamente, dados não têm significado a menos que o contexto seja de
fato entendido.
Para tanto, dados devem ser transformados em informações, que são vistas
como um fluxo de mensagens de significados que podem ser adicionados a, e de
fato, agirem na reestruturação e mudança em conhecimentos.
Dretske (1981) define informação como aquela mercadoria capaz de produzir conhecimento,
e que o real valor carregado por informação é o que podemos aprender com ela. Ex
pl
or
O conhecimento como um recurso significativo tem mudado ambos, Sociedade
e Economia, drasticamente, haja vista que a natureza do conhecimento na Socie-
dade contemporânea é tão específica que até mesmo procedimentos especiais de
controle e gerenciamento passaram a serem utilizados.
Assim, nas emergentes áreas de Gestão do Conhecimento e Engenharia do
Conhecimento, os termos básicos dessas Disciplinas são dados, informação, conhe-
cimento e transformação do conhecimento.
O conhecimento é um conceito multifacetado com significado de múltiplas ca-
madas. A definição mais adotada de conhecimento o descreve como “crença verda-
deira justificada” enquanto, na teoria da criação de conhecimento, o conhecimento
é visto como um processo humano dinâmico de justificação de crenças pessoais
como parte de uma aspiração pela “verdade”.
O conhecimento, muitas vezes, então, não é explicitamente descritível, logo não
é fácil de explicar e de se formular e formalizar. Portanto, o conhecimento é reco-
nhecido como explícito e tácito. A observação formulada por Neil Fleming (1997),
a seguir, pode ser vista como base para o pensamento relacionado ao diagrama
DIKW, exposto mais abaixo.
• Uma coleta de dados não é informação;
• Uma coleção de informações não é conhecimento;
• Uma coleção de conhecimento não é sabedoria;
• Uma coleção de sabedoria não é verdade.
A ideia é que informação, conhecimento e sabedoria são mais do que simples
coleções. Em vez disso, o todo representa mais do que a soma de suas partes e tem,
portanto, sinergia própria.
20
21
O modelo data-information-knowledge-wisdom (DIKW), apresentado na Figura 7, a
seguir, é útil para entender como de fato os dados brutos se transformam em informações
úteis, depois, em conhecimento e, finalmente, em sabedoria.
Sabedoria
Conhecimento
Informação
Dados
Figura 7 – Modelo data-information-knowledge-wisdom (DIKW)
E sse entendimento é importante à medida que, nos últimos anos, a Ciência da
Informação deu saltos significativos, sejam os servidores locais dando espaço aos
serviços de nuvem, os Bancos de Dados SQL e as Tabelas de Dados sendo aos
poucos migradas para os armazenamentos de dados no SQL e key-value e, claro,
sejam as mudanças advindas da maior automatização de utilização de tecnologias
em Big Data e Inteligência Artificial, tendo em vista lidar com grandes volumes,
variedades e velocidades de dados.
Variantes do Modelo Dikw
Existem muitas variantes do modelo DIKW. Uma variante, proposta por Milan
Zeleny em 1987, é o DIKWE, que adiciona uma camada de ápice para a iluminação
(do inglês, enlightenment).
Outra variante, proposta por Russell Ackoff, em 1989, é a DIKUW, que acres-
centa uma camada intermediária de entendimento (do inglês, understanding).
Alguns especialistas modelam isso como DIKIW, em que o segundo “I” define
percepção (do inglês, insight) ou inteligência.
O modelo DIKW nos ajuda a descrever métodos para a solução de problemas ou
tomada de decisão. Nele, o conhecimento é o resultado mais valioso a ser obtido
por meio de dados e, embora o conhecimento forneça os meios para solucionar um
problema, ele não mostra necessariamente a melhor maneira de fazê-lo.
A capacidade de escolher a melhor maneira de alcançar o resultado dese-
jado vem da experiência adquirida em tentativas anteriores de alcançar uma
solução bem-sucedida.
21
UNIDADE Dos Tipos de Dados ao Conhecimento
No topo, sabedoria é, então, a capacidade de “escolher a melhor escolha”, levan-
do a bons resultados.
Temos, assim, que as pessoas só ganham sabedoria por meio da experiência e
do conhecimento, que vêm das capacidades de:
• Desenvolver insights por meio da análise de dados e informações para um
determinado contexto;
• Coletar inteligência de outras pessoas resolvendo os mesmos problemas;
• Desenvolver uma compreensão dos diferentes métodos de solução de problemas.
Gestão do Conhecimento
A Gestão do Conhecimento reconhece a necessidade de explorar o capital inte-lectual, mas muitas práticas são insuficientes apenas se concentrando componentes
do conhecimento individual.
O conhecimento integrado possui estrutura multiforme, links apropriados com possi-
bilidade de agregar, separar e generalizar partes e totalidades na dependência temporal.
Além disso, a Gestão do Conhecimento precisa de ferramentas que possam ajudar
a fornecer aos usuários conhecimentos relevantes e adequados, em tempo apropria-
do e de forma integrada aos consumíveis, ao resolver tarefas como a melhoria de
processos, suporte a decisões, treinamento, gerenciamento de riscos e outros.
No entanto, a introdução específica do termo conhecimento cria um ponto de vis-
ta diferente e permite formas mais sofisticadas de uso. Não é mais suficiente fornecer
grandes quantidades de informações aos usuários. Em vez disso, é importante apoiá-
-los em suas atividades ao trabalhar com conhecimento. A Gestão do Conhecimento
é uma abordagem holística, que pode ser analisada de diferentes maneiras.
Nonaka e Takeuchi (1995) enfatizam, em sua definição, a importância da distin-
ção entre conhecimento tácito e explícito: a Gestão do Conhecimento é a estrutura
de conhecimento tácita e explícita para um processo humano dinâmico de justificar
a crença pessoal em direção à verdade.
Conhecimento explícito é, então, o conhecimento já extraído e consumível em
livros ou outras mídias. O conhecimento tácito não está presente de forma explícita
e nem sempre pode ser articulado por uma pessoa que possua o conhecimento.
Thomas Davenport enfatiza a importância do processo e da cadeia de suprimen-
tos: a gestão do conhecimento é para ele uma iniciativa formal e estruturada para me-
lhorar a criação, a distribuição ou o uso do conhecimento em uma organização. É um
processo formal de transformar o conhecimento corporativo em valor corporativo.
Estamos interessados, principalmente, em como o conhecimento pode ser cap-
turado e processado, quais áreas tecnológicas podem nos ajudar a realizar uma
22
23
estratégia de gerenciamento de conhecimento e que tipo de conhecimento é geren-
ciado de fato.
Temos de considerar que, nesse contexto, modelos são apenas uma aproxima-
ção da realidade e o processo de modelagem é, portanto, um processo cíclico.
Novas observações podem levar a um refinamento, modificação ou conclusão do
modelo já construído.
Por outro lado, o modelo pode guiar novas aquisições de conhecimento e, além disso,
o processo de modelagem é dependente da interpretação subjetiva do conhecimento.
A modelagem contextual lida, portanto, com diferentes tipos de informações de
contexto. É possível considerar o contexto como o reflexo do objeto, ou fenômenos,
usando diferentes interpretações por meio do sistema de cognição tal como percepção,
concepção e interpretação.
Nesta Unidade, aprendemos, então, que os dados são um bem valioso, haja vista
que podem reduzir o tempo, o esforço e os recursos necessários para resolver pro-
blemas e nos ajudar a tomar decisões cada vez mais acertadas.
Para o restante de nossos tópicos nessa Disciplina de Modelagem da Informação
é importante salientar que as máquinas já podem lidar eficientemente com dados
estruturados, entretanto, 90% de todos os dados não são estruturados, incluindo
textos, e-mails, imagens e vídeos.
Os seres humanos ainda são mais adequados do que as máquinas ao lidar com
dados não estruturados, mas os seres humanos são propensos a erros, inconsisten-
tes e subjetivos ao realizarem tarefas repetitivas.
O modelo DIKW e seus variantes nos permitem entender o processo por trás da
conversão de dados em informação e conhecimento ao passo que procuramos fazer
com que as máquinas se excedam em tarefas com base em dados não estruturados.
23
UNIDADE Dos Tipos de Dados ao Conhecimento
Material Complementar
Indicações para saber mais sobre os assuntos abordados nesta Unidade:
Sites
Agile Modeling
http://bit.ly/35ytcV5
Data Type
http://bit.ly/2qPpnvP
Modelagem de Dados
http://bit.ly/2OnxUzi
Cinco passos para criar uma cultura orientada por dados
http://bit.ly/2OSvgAG
Dados Estruturados e Não Estruturados
http://bit.ly/2KWQlsq
24
25
Referências
ALLEMANG, D.; HENDLER J. Semantic Web for the Working Ontologist:
Effective Modeling in RDFS and OWL. Morgan Kaufmann Publishers Inc. San
Francisco, CA: Morgan Kaufmann, 2008.
BOOCH, G.; RUMBAUGH, J; JACOBSON, I. The Unified Modeling Language
user guide. EUA: Addison-Wesley, 1997.
DAVENPORT, T. H.; PRUSAK, L. Working Knowledge. How Organizations
manage what they know. EUA: McGraw-Hill/Harvard Business School Press, 1998.
DRETSKE, F. I. Knowledge and the flow of information. I nglaterra: Basil
Blackwell Publisher, 1981.
FLEMING, N. Coping with a Revolution: Will the Internet Change Learning?,
Canterbury, New Zealand: Lincoln University 1997.
GODINEZ, M.; HECHLER, E. et al. The Art of Enterprise Information
Architecture, A Systems-Based Approach for Unlocking Business Insight.
EUA: IBM Press, 2010.
HAY, D. C. Data Model Patterns: Conventions of Thought. New York: Dorset
House Publishing, 2011.
KLIMESOVA, D. Data, Information and Knowledge Transformation.
PROCEEDINGS OF THE 10th WSEAS INTERNATIONAL CONFERENCE ON
AUTOMATION & INFORMATION, Praga: 2009.
MONTEIRO, L. P. Dados Estruturados e Não Estruturados. Universidade da
Tecnologia, 2019. Disponível em: <https://universidadedatecnologia.com.br/
dados-estruturados-e-nao-estruturados>.
NONAKA, I., TAKEUCHI, H. The Knowledge Creating Company: How
Japanese Companies Create the Dynamics of Innovation. Inglaterra: Oxford
University Press, 1995.
TEOREY, T. J. Database modeling and design: logical design 5.ed. Burlington,
Mass.: Morgan Kaufmann Publishers, Amsterdam, Boston, 2011.
ZELENY, M. Management support systems: Towards integrated knowledge
management, Human Systems Management. EUA, n. 7, p. 59-70, 1987.
25