Prévia do material em texto
Diferença entre dado, informação e conhecimento. Aula 2. Dado: · O dado pode ser considerado um elemento da informação, que, tomado isoladamente, não possui significado relevante e não conduz a nenhuma compreensão. · Os dados também podem ser divididos em dados qualitativos e dados quantitativos. Big Data Anos 70 = surgimento dos computadores pessoais = aumento substancial do volume de dados e da necessidade de armazenamento Anos 80 = construção dos primeiros data centers e desenvolvimento de bancos de dados 2005 = expansão dos dados por conta das redes sociais Anos seguintes = computação em nuvem e um novo aumento no volume de dados Subconjunto de dados = fluxo gerado por dispositivos conectados BIG DATA = tríade: volume, variedade e velocidade Vs complementares = valor e veracidade Big Data é um processo de análise e interpretação de um grande volume de dados armazenado remotamente. Requisitos do Big Data: · Integração: dados reunidos de diversas fontes, tecnologia para analisar conjuntos de Big Data; · Gerenciamento: armazenamento em nuvem e computadores locais · Análise: tratamento de dados que auxiliam na tomada de decisões Sugestões de sites de compras = uso do Big Data Apache Hadoop = Framework de processamento distribuído de grandes conjuntos de dados entre clusters de computadores. Cluster = agrupamento de computadores que trabalham juntos como um sistema único que aumenta a performance do processamento de dados. Informação: · um novo ponto de vista para a interpretação de eventos ou objetos, tornando-se visíveis aos significados antes invisíveis ou lançando luz sobre conexões antes inesperadas. Por isso, a informação é um meio ou material necessário para extrair e construir o conhecimento. Conhecimento: · A informação pode ser definida como valiosa, e a obtenção do conhecimento passa pelos crivos da reflexão, da síntese e do contexto. Gestão de dados: · Ferramentas, quando bem gerenciadas, permitem incremento de produtividade, competitividade e inovação (computer-based information systems – CBIS) são “um conjunto único de hardware, software, bancos de dados, telecomunicações, pessoas e procedimentos que tem a função de coletar, manipular, armazenar e processar dados em informações” o software chamado sistema de gestão de banco de dados (DBMS – database management system) em geral é usado para gerenciar o banco de dados, e o software chamado sistema de gestão de modelos (MMS, model management system) é utilizado para gerir a base de modelo. Sistema Vblock, da Virtual Computing Environment (VCE), que é um grupo de empresas da rede Cisco e a fornecedora de armazenagem de dados EMC. A VCE oferece soluções para a criação de uma plataforma em nuvem, ao mesmo tempo que elimina a necessidade de o usuário lidar com múltiplos fornecedores