Baixe o app para aproveitar ainda mais
Prévia do material em texto
Big Data: A nova formula para a inovação, a concorrência e produtividade. Eduardo Henrique R. Zanela, Diego de Lima Nascimento, Fagner Roger Pereira Couto³, Matheus Artur Saviczki Santana, André Luís Sanson. Ciência da Computação – Universidade do Estado de Mato Grosso (UNEMAT) Caixa Postal 92 – 78.390-000 – Barra do Bugres – MT – Brasil {eduardo-hnq,Fagner_roger32}@hotmail.com, {diego.lnasc,matheus.saviczki, alsanson}@gmail.com Abstract. This article presents primarily the technological evolution and the huge expansion of data and information, describes the concept of the Big date will be portrayed, cycles and runs, as well as the effect of the factors of "5 V ´ s" (Volume, variety, velocity, value and veracity) front to their decision- making processes, to obtain a greater profit margin and lower cost. Resumo. Este artigo apresenta primeiramente a evolução tecnológica e a enorme expansão de dados e informação, descreve o conceito do Big Data onde será retratado os seus aspectos, ciclos e funcionamentos, assim como o efeito dos fatores dos “5 V´s” (Volume, variedade, velocidade, valor e veracidade) frente aos seus processos decisórios, para a obtenção de uma maior margem lucrativa e redução de custos. 1. Introdução O Brasil tem sofrido uma proliferação de informações digitais e um enorme avanço tecnológico nos últimos tempos, principalmente pela web, telefones celulares, dispositivos que captam informações, e entre outros dispositivos, gerando enorme quantidade de dados, sendo estes dos mais diversos tipos. Em um levantamento da IDC 1 patrocinado pela EMC 2 , Gantz e Reinsel (2012) prevê que o universo digital chegará a 40 Zetabytes de dados até 2020, sendo que 2,8 Zetabytes de dados foram criados e replicados somente em 2012. De acordo com Taurion (2013), as informações sobre os produtos estão se tornando mais importantes que os produtos em si, pois se o conteúdo gerado para uma tomada de decisão de compra de um determinado produto o esperado, a tendência da compra é de ser direcionada a outro produto. Diante de uma enorme quantidade de dados e informações desestruturadas gerou-se um conceito conhecido, Big Data. “Big Data é um termo genérico para dados que não podem ser contidos nos repositórios usuais; dados volumosos para caber em um único servidor; não estruturados demais para se adequar a um banco de dados 1 International Data Corporation. 2 EMC Corporation é uma empresa multinacional norte-americana que fornece sistemas para infraestrutura de informação, software e serviços. Anais do 7º Congresso Acadêmico de Tecnologia e Informática (CATI 2015) UNEMAT – Barra do Bugres – ISSN 2448-119X 55 organizado em linhas e colunas; ou fluidos demais para serem armazenados” [Davenport 2014]. “O processo de tomada de decisão é um processo complexo e individual, visto que não é puramente racional e contempla fatores como intuição, sentimento e experiência anteriores do tomador de decisão, sejam de forma consciente ou inconsciente” [Nonohay 2012; Choo 2006; Perreora 2010 apud Canary 2013]. O objetivo deste artigo é apresentar o conceito e a finalidade do Big Data, verificando os efeitos dos fatores dos 5 V’s, para um melhor entendimento sobre o mesmo. 2. Fundamentação Teórica 2.1. Explosão de dados A tecnologia tem avançado mais do que nunca nos últimos tempos, e como consequência uma enorme quantidade de dados gerados, sendo estes dos mais diversos tipos. O resultado proveniente dos diversos tipos de fontes de informações e dados, como por exemplo, sensores climáticos, e-mails, SMS, GPS, celulares, compras online, mídias sociais, fotos e vídeos digitais e muitos outros. A IDC estima que, em 2020, até 33% do universo digital vai conter informações que podem ser valiosas se analisados, relata Gantz e Reinsel (2012). Felipe (2013) afirma que após o pulo tecnológico da Web 2.1 por volta de 2005 os pontos de acesso à Internet obtiveram um enorme crescimento, trazendo mudanças a Web 2.1. “O universo digital vive cada vez mais em uma nuvem de computação, com grandes quantidades de dados de hardware ligados a milhares de milhões de dispositivos distribuídos, todos governados e definida por softwares cada vez mais inteligentes” [Gantz e Reinsel, 2012]. Não exista área que a tecnologia não tenha se tornado presente, segundo Shaw (2014) basta perceber que as coisas mudaram nos últimos 50 anos, onde antibióticos comerciais não existiam 75% da população era ativa na agricultura, não existia o uso de produtos agrícolas, e medicamentos se tornaram disponíveis, e que este avanço só tende a crescer. Gantz e Reinsel (2012) relatam que entre 2012 e 2020, a participação do universo digital em expansão 'mercados emergentes vão crescer de 36% para 62%. 2.2. Big Data A explosão de tecnologia contagiou o mundo, e a consequência é o aumento gradativo de dados e informações. Aurélio (2010) define que dados nada mais é que símbolos quantitativos e qualitativos, que possam ser utilizados para o processo de uma informação. De acordo com Taurion (2013), os dados sobre os produtos estão se tornando mais relevante que os produtos em si, dados estes que podem influenciar em decisões, pois se uma tomada de decisão realizada com conteúdo de dados escasso ou falso para a Anais do 7º Congresso Acadêmico de Tecnologia e Informática (CATI 2015) UNEMAT – Barra do Bugres – ISSN 2448-119X 56 compra de um determinado produto existe uma grande probabilidade do mesmo não ter sido a melhor decisão, gerando uma margem de prejuízo. Diante desta extrema quantidade de dados deu-se origem ao Big Data, que é capaz de cruzar inúmeras quantidades de informações desestruturadas para chegar a uma, ou varias, tomadas de decisões, talvez não a melhor, porem a com maior porcentagem de acerto. “Big Data não é apenas um conjunto de dados desestruturados, mas o conceito que mostra como tirar proveito desses dados” [PEREIRA 2013]. O termo pode ser expresso como um conjunto de ferramentas de alto poder de mineração de dados com mais eficiência para chegar a informações, indicações, apontamentos e afins. A definição de Big Data é tão complexa quanto o próprio futuro, pois o mesmo é considerado relativamente novo no mercado, e tem expandido como linha de pesquisa e implantação apenas nos últimos anos (10 anos). Em implantação é nítido perceber que muitas das grandes empresas já utilizam esta tecnologia como principal recurso para o seu crescimento. “Em agosto de 1999 foi usada pela primeira vez a palavra Big Data em um artigo CACM, com o titulo “Explorar visualmente gigabyte de conjuntos de dados em tempo real” feito por Steve B., David K., Michael C., David E., e Robert H.” [PRESS 2013]. Uma das primeiras definições relatadas sobre o termo se da por Doug Laney, em 2001, da empresa Gartner Group, onde explicava os famosos 3 V´s (Volume, velocidade e variedade) de origens iniciais do Big Data. 2.3. Conceito do Big Data Das inúmeras pesquisas realizadas, cada autor indicava um conceito, levando a um mínimo comum, do qual é a analise de grandes quantidades de dados de diferentes tipos em uma grande velocidade. Para um melhor entendimento e desenvolvimento do presente trabalho, estabelecendo uma maior clareza na definição do conceito sobre Big Data, se faz uso do Quadro 1, conceitos sobre Big Data de importantes autores da área. Quadro 1 − Conceitos do Big Data Fonte: (CANARY, 2013 p. 22). MANYKA, J: et. al. (2011) (Mckinsey Global Institute) “Bid Data refere-se a conjunto de dados cujo tamanho é além da capacidade de ferramentas de software de banco de dados típicos para capturar, armazenar, gerenciare analisar.” MCAFEE, A; et. al. (2012) (Harvard Business Review) “Big Data como uma forma essencial para melhorar a eficiência e a eficácia das organizações de vendas e marketing. Ao Colocar o Big Data no coração de vendas e marketing, os insigths podem ser aproveitados para melhorar a tomada de decisão e inovar no modelo de vendas da empresa, o que pode envolver a utilização de dados para orientar ações em tempo real.” DEMIRKAN, et. “Há o desafio de gerenciar grandes quantidades de dados (Big Anais do 7º Congresso Acadêmico de Tecnologia e Informática (CATI 2015) UNEMAT – Barra do Bugres – ISSN 2448-119X 57 al.(2012) (Decision Support Systems) Data), que esta ficando cada vez maiores por causa do armazenamento mais barato e evolução dos dados digitais e dispositivos de coleta de informações, como telefones celulares, laptops, e sensores.” PHELAN, Mike (2012) (Forbes) “O fenômeno surgiu nos últimos anos devido a enorme quantidade de dados da maquina que esta sendo gerado hoje –[...]- juntamente com as informações adicionais obtidas por analise de todas essas informações, que por si só cria outro conjunto de dados enormes.” Gartner Group (2012) “Bid Data, em geral, é definido como ativos de alto volume, velocidade e variedade de informações que exigem custo- benefício, de formas inovadores de processamento de informações para maior visibilidade e tomada de decisão.” International Data Corporation “As tecnologias de Big Data descrevem uma nova geração de tecnologias e arquiteturas projetados para extrair economicamente o valor de volumes muito grandes e de uma grande variedade de dados, permitindo alta velocidade de captura, descoberta, e/ou analise.” É absolutamente necessário que a organização que programa projetos de Big Data obtenha retorno destes investimentos, afirma Taurion (2012) ao explicar os custos do investimento com implementação do Big Data. 2.4. Dados Estruturados e Desestruturados Dados estruturados contem uma organização para serem recuperados, que possuem relações, classificados em grupos possuindo as mesmas descrições. Dados mantidos em um SGBD 3 e são analisados através de linguagem SQL 4 . Dados desestruturados, não possuem estruturas definidas, normalmente são textos, documentos, gravações de serviços ao consumidor, fotos, imagens e vídeos, e não é possíveis armazenar em um banco de dado tradicional, devido inúmeras informações aleatórias. Hurwitz et al. (2013) diz que companhias também tem que considerar novas fontes de dados gerados por máquinas como, por exemplo, sensores. Perreira (2013) ainda complementa, outro exemplo de fonte de dados desestruturados são sensores, que podem ser usados com diversas finalidades como monitoram o trafego em rodovias, fazer leitura por RFID 5 nos supermercados, temperatura nas cidades, satélites que monitoram o tempo e terremotos, entre outros. 3 Sistema de Gerenciamento de Banco de Dados. 4 Structured Query Language (Linguagem de Consulta Estruturada). 5 Identificação por Rádio Frequência – Radio-Frequency Identification. Anais do 7º Congresso Acadêmico de Tecnologia e Informática (CATI 2015) UNEMAT – Barra do Bugres – ISSN 2448-119X 58 2.5. NoSQL Para poder armazenar as informações desestruturadas, foi desenvolvido um banco para todos os tipos de dados, onde poderia ser utilizado por dados relacionais e não relacionais e que oferece um alto grau de escalabilidade, criando assim o NoSQL. O NoSQL (Not only SQL) é um termo usado para se referir a qualquer armazenamento de dados que não seguem o modelo tradicional RDBMS 6 , aponta Perreira (2013). “Além da alta taxa de geração dos dados, outro fator que influenciou a criação de sistemas NoSQL foi o suporte a tipo de dados complexos, semiestruturados ou não estruturados” [Vieira 2012]. Segundo Taurion (2012) a principal base tecnológica para Big Data é os bancos de Dados NoSQL. 2.6. Geração de decisões através do relacionamento de dados Segundo Canary (2013), decisões são feitas através de processos de escolha, de pelo menos uma das alternativas propostas, atendendo a um problema existente. A decisão é compreendida em 3 dimensões: Importância: Relacionado a satisfação de valores e interesses; Velocidade exigida: Pois algumas decisões exigem certa velocidade; Individualidade: decisões tomadas sozinho ou em grupos. Para uma maior obtenção de valores de dados na grande dimensão, o Big Data é dividida em variáveis envolvidas, cada uma com um conceito proposto, assim como a sua importância nas tomadas de decisões. Em varias biografias estas variáveis são conhecidas como “os três vês”, sendo elas: Volume, Variedade e Velocidade, porém a inclusão de mais “dois vês” esta presente em algumas bibliografias pesquisadas, sendo elas: Valor e Veracidade, gerando assim como conhecido em algumas bibliografias “Os “5V’s” do Big Data”. 2.6.1. Variedade O conceito da variedade engloba o uso dos diferentes tipos de dados, onde são de diversas fontes origens, podendo ser estruturados ou não. “Os dados vêm de sistemas estruturados (hoje minoria) e não estruturados (a imensa maioria), gerados por e-mails, mídias sociais, documentos eletrônicos, apresentações estilo Powerpoint, mensagens instantâneas, sensores, etiquetas RFID, câmeras de vídeo, etc” [Taurion 2012]. As variáveis de estudos envolvidos são: Variedade de fontes de informação e variedade de tipos de dados 6 Relational Data Base Management System – sistema de gerenciamento de base de dados relacionais Anais do 7º Congresso Acadêmico de Tecnologia e Informática (CATI 2015) UNEMAT – Barra do Bugres – ISSN 2448-119X 59 2.6.2. Volume Enorme quantidade de dados, este sendo a dimensão mais comum de vários conceitos proposto ao Big Data, sabendo também que quanto maior a quantidade de informações, maior será a precisão. Taurion (2012) destaca o aumento acelerado de volume de dados vem chamando atenção pela acelerada escala em que volumes cada vez maiores de dados são criados pela sociedade. As variáveis de estudos envolvidos são: Volume de informação, acessibilidade de informações e mudança de comportamento em função de um volume. 2.6.3. Velocidade Para formar o tripé do conceito do big data, é necessário um grande poder de tempo de resposta com que os dados e informações são analisados, realizando as analises no menor tempo possível. “Muitas vezes é preciso agir em tempo real, exigindo um processamento que acompanhe esta velocidade” [TAURION 2012]. As variáveis de estudos envolvidos são: Velocidade de chegada da informação e velocidade a tomada de decisão. 2.6.4. Valor Não tem como retratar o conceito do Big Data, relatar a sua tamanha capacidade de processamento de dados, e deixar de lado os valores necessários para a realização da pratica deste conceito. Big Data só faz sentido se o valor da análise dos dados compensar o custo de sua coleta, armazenamento e processamento comenta Taurion (2012). Para a proximidade da exatidão, a qualidade dos dados analisados deve ser percebida pelos usuários. As variáveis de estudos envolvidos são: Qualidade das informações, resultados agregado a partir das analises das informações e valor financeiro para ter dados de qualidade. 2.6.5. Veracidade Taurion (2012) relata que é necessário ter certeza que os dados fazem sentido e são autênticos, pois quanto maior a porcentagem de autenticidade, menor será a chance de erro nas analises de dados do Big Data. É importante ressaltar a importância da qualidade dos dados para a analise adequada do Big Data, visto que dados de alta qualidade são pré-requisitospara auxiliar as organizações a adequarem-se as mudanças necessárias. 2.7. Gerenciamento do Big Data Para a conclusão do resultado final é importante o cumprimento dos requisitos funcionais do Big Data, passando assim por um ciclo de gerenciamento. Conforme a figura 1 proposta pelo autor Hurwitz et al. (2013), pode se analisar que os o processo da captura dos dados vem como a primeira função do ciclo de Anais do 7º Congresso Acadêmico de Tecnologia e Informática (CATI 2015) UNEMAT – Barra do Bugres – ISSN 2448-119X 60 gerenciamento, e, em seguida, são organizados e integrados, logo após esta fase ser implementada com sucesso, os dados podem ser analisados com base no problema a ser abordado, dando um resultado para que o usuário possa colocar em pratica através desta conclusão. Figura 1 - Ciclo de Gerenciamento do Big Data Fonte: Adaptado de Hurwitz et al. (2013, p.17). Hurwitz et al. (2013, p. 48), afirma que como qualquer arquitetura de dados importantes, você deve criar um modelo que tem um olhar holístico de como todos os elementos precisam se unir. 3. Metodologia O presente trabalho utiliza-se de pesquisa bibliográfica para a sua sintaxe, realizando leituras de dissertações, livros, sites oficiais, artigos publicados na Web e monografias concluídas, com o propósito de ampliar o conteúdo abordado, e para melhor compreensão do tema abordado. Através do levantamento, alcançou um melhor entendimento no conceito e na sua pesquisa de dados para uma aplicação. Trata-se de levantamento de toda bibliografia já publicada em forma de livros, revistas, publicações avulsas e imprensa escrita. Sua finalidade é colocar o pesquisador em contato direto com tudo aquilo que foi escrito sobre determinado assunto ou de manipulação de suas informações [LAKATOS 1992]. 4. Considerações Finais A quantidade de dados vem crescendo instantaneamente, tornando uma oportunidade de total crescimento e ganho do mercado que possuir e utilizar o Big Data em sua área de atuação. Varias organizações já visaram o enorme potencial de seu conceito e implantam para poder utilizar a imensidão de informações ao seu favor diante de seus negócios. Canary (2013) afirma que é fundamental que dirigentes saibam utilizar as características dos dados de hoje, no contexto do Big Data – Volume, Variedade, Velocidade, Valor e veracidade. Porem é preciso que aja uma compreensão para que as decisões apresentadas sejam as melhores. Anais do 7º Congresso Acadêmico de Tecnologia e Informática (CATI 2015) UNEMAT – Barra do Bugres – ISSN 2448-119X 61 Os resultados proposto pela pesquisa relacionada a Banco de Dados proporcionou o entendimento mínimo sobre Big Data, fascinando a cada informação coletada, assim como a importância dos dados desestruturados nas tomadas de decisões, estas por sua vez podem ser capaz de prever acontecimentos, como um estoque de produto, ou mudança de varejo devido ao clima. O conceito do Big Data, assim como algumas informações, varia muito conforme autores, criando certas limitações sobre o mesmo. O tema é considerado uma tecnologia nova que vem crescendo cada vez mais no mundo, porem sua utilidade ainda é considerada pouco comparada com tecnologias antigas. Varias abordagens podem ser examinadas para dar prosseguimento a este artigo, e tratando de um tema inovador, pode dar sequencia desenvolvendo um projeto de implementação da análise do Big Data para tomadas de decisões de alguma instituição, ou para a redução de gastos em alguma área, como o agronegócio por exemplo. Outra opção seria ir mais a fundo nas análises dos processos do ciclo que gerencia o Big Data. Referências AURÉLIO, Dicionário. (2010) Disponível em: http://www.dicionariodoaurelio.com Acesso em, v. 15, n. 05. CANARY, Vivian Passos. (2013) A tomada de decisão no contexto do Big Data: estudo de caso único. DAVENPORT, Thomas. (2014) Big data at work: dispelling the myths, uncovering the opportunities. Harvard Business Review Press. GANTZ, John; REINSEL, David. (2012) The digital universe in 2020: Big data, bigger digital shadows, and biggest growth in the far east. IDC iView: IDC Analyze the Future, v. 2007, p. 1-16. HURWITZ, Judith et al. (2013) Big Data For Dummies, a Wiley Brand. New Jersey: John Wiley & Sons, inc.. LANEY, Doug. (2001) 3D data management: Controlling data volume, velocity and variety. META Group Research Note, v. 6, p. 70. PEREIRA, Felipe Argenton. (2013) Explosão dos dados e o conceito de análise de dados relacionados para geração de informações (BIG DATA). PRESS, Gil. (2013). A very short history of big data. Forbes. Forbes Magazine, 9. SHAW, Jonathan. (2014) Why “Big Data” is a big deal. Harvard Magazine, v. 3, p. 30- 35. VIEIRA, Marcos Rodrigues et al. (2012) Bancos de Dados NoSQL: conceitos, ferramentas, linguagens e estudos de casos no contexto de Big Data. Simpósio Brasileiro de Bancos de Dados. Anais do 7º Congresso Acadêmico de Tecnologia e Informática (CATI 2015) UNEMAT – Barra do Bugres – ISSN 2448-119X 62
Compartilhar