Buscar

Ciência de Dados: Conceitos e Ciclo de Vida

Prévia do material em texto

Ciência de Dados 
Wilson Benevides 
Dado, Informação e Conhecimento 
Apresentação da Unidade I - Ciência de Dados 
1. Conceitos Básicos 
2. O dado em meio digital 
3. A ciência dos dados. Conceitos. Análise de 
Dados e Estatística 
4. O Ciclo de Vida do dado 
5. A qualidade do dado e a tomada de decisão 
6. A ciência dos dados no contexto da LGPD 
UNIDADE I – Ciência de Dados e Decisão 
4. O ciclo de vida do dado. Fases: 
 
I. Produção 
II. Armazenamento 
III. Utilização. Análise (Produção de Informação e 
Conhecimento). Será visto na próxima unidade. 
IV. Descarte 
UNIDADE I – Ciência de Dados e Decisão 
4. O ciclo de vida do dado. 
 
I. Produção : 
• Produção: gerado por sistema. Ex: Folha, Estoque. 
• Compra: data broker 
• Coleta: origem em outro sistema ou repositório. 
• Ex:Documentos hitóricos, arquivos, etc. 
 
UNIDADE I – Ciência de Dados e Decisão 
4. O ciclo de vida do dado. 
I. Produção - Evolução Histórica: 
• Pulsos magnéticos (telégrafo) 
• Cartões perfurados 
• Scanners 
• Dispositivos independentes: 
• Câmaras e Celulares, 
• satélites, 
• estações meteorológicas 
UNIDADE I – Ciência de Dados e Decisão 
4. O Ciclo de vida do dado: 
 
4.2 Armazenamento. Banco de Dados 
Devem proporcionar : 
•Inclusão, alteração, exclusão e consulta 
ou pesquisa (operações básicas). 
•Manter integridade do dado 
•Assegurar indexação 
•Segurança 
UNIDADE I – Ciência de Dados e Decisão 
4. O Ciclo de vida do dado: 
 
4.2 Modelos de Bancos de Dados: 
• Hierárquico ou rede 
• Relacionais : Integridade, 
normalização e não redundãncia 
SQL – Strutured Query Language 
• Orientados por Objeto ou NoSQL: 
dados não normalizados. Ex: Nota 
Fiscal Eletrônica. 
ID 197803430 
UNIDADE I – Ciência de Dados e Decisão 
4. O Ciclo de vida do dado: 
4.2 – Armazenamento – Estrutura de dados - Bancos de Dados: 
• Os modelos tradicionais de análise de dados são adequados para 
tratar dados estruturados (estrutura rígida), normalmente 
organizados em linhas e colunas. Ex: planilhas e tabelas (arquivos em 
DB) com layout de registro definidos. 
 Modelo de Dados 
 Estruturados: 
 Não Estruturados