Prévia do material em texto
Ciência de Dados Wilson Benevides Dado, Informação e Conhecimento Apresentação da Unidade I - Ciência de Dados 1. Conceitos Básicos 2. O dado em meio digital 3. A ciência dos dados. Conceitos. Análise de Dados e Estatística 4. O Ciclo de Vida do dado 5. A qualidade do dado e a tomada de decisão 6. A ciência dos dados no contexto da LGPD UNIDADE I – Ciência de Dados e Decisão 1. Conceitos básicos. i. O dado - São FATOS produzidos ou coletados e ARMAZENADOS ii. A informação – é o dado analisado com algum significado iii. O conhecimento – é a informação interpretada e aplicada. UNIDADE I – Ciência de Dados e Decisão 1. Conceitos Básicos: Dado, informação, conhecimento/decisão Decisão UNIDADE I – Ciência de Dados e Decisão 1. Conceitos básicos. i. O dado: a) Físico b) Analógico c) Digital Obs: Apenas os dados em meio digital terão relevância em nosso estudo UNIDADE I – Ciência de Dados e Decisão 2. O dado em meio digital • A menor partícula do dado digital é o bit. • O bit é sempre binário e o é em virtude ser a presença ou ausência de tensão num ponto específico da memória. • A tensão + 5V (cinco volts) que magnetiza esse ponto é indicado como "ALTO“ ou aceso ou "1” e “0” V (zero volts) que é indicado como "BAIXO“ ou apagado, ou ainda “0”. • Nos computadores pessoais normalmente a organização de uma sequência de 8 unidade de bits forma o byte. ASCII. Tabela ASCII – Exemplo de Binário – 1 Bit / 8 Bytes Bin Oct Dec Hex Sinal 0100 0000 100 64 40 @ 0100 0001 101 65 41 A 0100 0010 102 66 42 B 0100 0011 103 67 43 C 0100 0100 104 68 44 D 0100 0101 105 69 45 E 0100 0110 106 70 46 F 0100 0111 107 71 47 G https://pt.wikipedia.org/wiki/@ https://pt.wikipedia.org/wiki/A https://pt.wikipedia.org/wiki/B https://pt.wikipedia.org/wiki/C https://pt.wikipedia.org/wiki/D https://pt.wikipedia.org/wiki/E https://pt.wikipedia.org/wiki/F https://pt.wikipedia.org/wiki/G UNIDADE I – Ciência de Dados e Decisão 2. O dado em meio digital UNIDADE I – Ciência de Dados e Decisão 3. A Ciência de Dados. Conceito, Análise e Estatística • “Data Science” – Interesse como ciência desde 1960 • Conceitualmente pode ser definido como o ramo da ciência (controverso) que estuda o registro de fatos (dados), de forma sistematizada, em qualquer meio (físico ou digital), por todo seu ciclo existencial (vida), desde a produção e/ou coleta, armazenamento, utilização (tratamento ou transformação e análise) até o descarte. • Ao produzir e armazenar o dado, devem ser pensados critério de acesso e publicidade. UNIDADE I – Ciência de Dados e Decisão 3. A Ciência de Dados. Conceito, Análise e Estatística. Ciência de dados e Análise de Dados • Análise de Dados consiste em qualquer operação que busque a extração de informação e conhecimento a partir de uma base de dados. • A Ciência de dados é mais ampla pois cuida de todo o ciclo de vida do dado, incluindo ai sua utilização (Ex:Analise de Dados). UNIDADE I – Ciência de Dados e Decisão 3. A Ciência de Dados. Conceito, Análise e Estatística. Ciência de dados e Estatística • A Estatística está associada a análise do dados, muitas vezes ainda mais limitada por seguir critérios e padrões pré-definidos. • Aqui também aplica-se o conceito de que a Ciência de Dados é mais ampla pois cuidaria do ciclo de vida do dado, inclusive da Estatística como forma de utilização dos dados.