Buscar

Caso_de_Uso_Biblioteca_40448

Prévia do material em texto

Big Data: A nova formula para a inovação, a concorrência 
e produtividade. 
Eduardo Henrique R. Zanela, Diego de Lima Nascimento, Fagner Roger Pereira 
Couto³, Matheus Artur Saviczki Santana, André Luís Sanson. 
Ciência da Computação – Universidade do Estado de Mato Grosso (UNEMAT) 
Caixa Postal 92 – 78.390-000 – Barra do Bugres – MT – Brasil 
{eduardo-hnq,Fagner_roger32}@hotmail.com, 
{diego.lnasc,matheus.saviczki, alsanson}@gmail.com 
Abstract. This article presents primarily the technological evolution and the 
huge expansion of data and information, describes the concept of the Big date 
will be portrayed, cycles and runs, as well as the effect of the factors of "5 V ´ 
s" (Volume, variety, velocity, value and veracity) front to their decision-
making processes, to obtain a greater profit margin and lower cost. 
Resumo. Este artigo apresenta primeiramente a evolução tecnológica e a 
enorme expansão de dados e informação, descreve o conceito do Big Data 
onde será retratado os seus aspectos, ciclos e funcionamentos, assim como o 
efeito dos fatores dos “5 V´s” (Volume, variedade, velocidade, valor e 
veracidade) frente aos seus processos decisórios, para a obtenção de uma 
maior margem lucrativa e redução de custos. 
1. Introdução
O Brasil tem sofrido uma proliferação de informações digitais e um enorme avanço 
tecnológico nos últimos tempos, principalmente pela web, telefones celulares, 
dispositivos que captam informações, e entre outros dispositivos, gerando enorme 
quantidade de dados, sendo estes dos mais diversos tipos. 
Em um levantamento da IDC
1
 patrocinado pela EMC
2
, Gantz e Reinsel (2012)
prevê que o universo digital chegará a 40 Zetabytes de dados até 2020, sendo que 2,8 
Zetabytes de dados foram criados e replicados somente em 2012. 
De acordo com Taurion (2013), as informações sobre os produtos estão se 
tornando mais importantes que os produtos em si, pois se o conteúdo gerado para uma 
tomada de decisão de compra de um determinado produto o esperado, a tendência da 
compra é de ser direcionada a outro produto. 
Diante de uma enorme quantidade de dados e informações desestruturadas 
gerou-se um conceito conhecido, Big Data. “Big Data é um termo genérico para dados 
que não podem ser contidos nos repositórios usuais; dados volumosos para caber em um 
único servidor; não estruturados demais para se adequar a um banco de dados 
1
 International Data Corporation. 
2
 EMC Corporation é uma empresa multinacional norte-americana que fornece sistemas para 
infraestrutura de informação, software e serviços. 
Anais do 7º Congresso Acadêmico de Tecnologia e Informática (CATI 2015) 
UNEMAT – Barra do Bugres – ISSN 2448-119X 
55
 
organizado em linhas e colunas; ou fluidos demais para serem armazenados” 
[Davenport 2014]. 
“O processo de tomada de decisão é um processo complexo e individual, visto 
que não é puramente racional e contempla fatores como intuição, sentimento e 
experiência anteriores do tomador de decisão, sejam de forma consciente ou 
inconsciente” [Nonohay 2012; Choo 2006; Perreora 2010 apud Canary 2013]. 
O objetivo deste artigo é apresentar o conceito e a finalidade do Big Data, 
verificando os efeitos dos fatores dos 5 V’s, para um melhor entendimento sobre o 
mesmo. 
2. Fundamentação Teórica
2.1. Explosão de dados 
A tecnologia tem avançado mais do que nunca nos últimos tempos, e como 
consequência uma enorme quantidade de dados gerados, sendo estes dos mais diversos 
tipos. O resultado proveniente dos diversos tipos de fontes de informações e dados, 
como por exemplo, sensores climáticos, e-mails, SMS, GPS, celulares, compras online, 
mídias sociais, fotos e vídeos digitais e muitos outros. 
A IDC estima que, em 2020, até 33% do universo digital vai conter informações 
que podem ser valiosas se analisados, relata Gantz e Reinsel (2012). Felipe (2013) 
afirma que após o pulo tecnológico da Web 2.1 por volta de 2005 os pontos de acesso à 
Internet obtiveram um enorme crescimento, trazendo mudanças a Web 2.1. 
“O universo digital vive cada vez mais em uma nuvem de computação, com 
grandes quantidades de dados de hardware ligados a milhares de milhões de 
dispositivos distribuídos, todos governados e definida por softwares cada vez mais 
inteligentes” [Gantz e Reinsel, 2012]. 
Não exista área que a tecnologia não tenha se tornado presente, segundo Shaw 
(2014) basta perceber que as coisas mudaram nos últimos 50 anos, onde antibióticos 
comerciais não existiam 75% da população era ativa na agricultura, não existia o uso de 
produtos agrícolas, e medicamentos se tornaram disponíveis, e que este avanço só tende 
a crescer. 
Gantz e Reinsel (2012) relatam que entre 2012 e 2020, a participação do 
universo digital em expansão 'mercados emergentes vão crescer de 36% para 62%. 
2.2. Big Data 
A explosão de tecnologia contagiou o mundo, e a consequência é o aumento gradativo 
de dados e informações. Aurélio (2010) define que dados nada mais é que símbolos 
quantitativos e qualitativos, que possam ser utilizados para o processo de uma 
informação. 
De acordo com Taurion (2013), os dados sobre os produtos estão se tornando 
mais relevante que os produtos em si, dados estes que podem influenciar em decisões, 
pois se uma tomada de decisão realizada com conteúdo de dados escasso ou falso para a 
Anais do 7º Congresso Acadêmico de Tecnologia e Informática (CATI 2015) 
UNEMAT – Barra do Bugres – ISSN 2448-119X 
56
 
 
compra de um determinado produto existe uma grande probabilidade do mesmo não ter 
sido a melhor decisão, gerando uma margem de prejuízo. 
Diante desta extrema quantidade de dados deu-se origem ao Big Data, que é 
capaz de cruzar inúmeras quantidades de informações desestruturadas para chegar a 
uma, ou varias, tomadas de decisões, talvez não a melhor, porem a com maior 
porcentagem de acerto. 
“Big Data não é apenas um conjunto de dados desestruturados, mas o conceito 
que mostra como tirar proveito desses dados” [PEREIRA 2013]. O termo pode ser 
expresso como um conjunto de ferramentas de alto poder de mineração de dados com 
mais eficiência para chegar a informações, indicações, apontamentos e afins. 
A definição de Big Data é tão complexa quanto o próprio futuro, pois o mesmo é 
considerado relativamente novo no mercado, e tem expandido como linha de pesquisa e 
implantação apenas nos últimos anos (10 anos). Em implantação é nítido perceber que 
muitas das grandes empresas já utilizam esta tecnologia como principal recurso para o 
seu crescimento. 
“Em agosto de 1999 foi usada pela primeira vez a palavra Big Data em um 
artigo CACM, com o titulo “Explorar visualmente gigabyte de conjuntos de dados em 
tempo real” feito por Steve B., David K., Michael C., David E., e Robert H.” [PRESS 
2013]. Uma das primeiras definições relatadas sobre o termo se da por Doug Laney, em 
2001, da empresa Gartner Group, onde explicava os famosos 3 V´s (Volume, 
velocidade e variedade) de origens iniciais do Big Data. 
2.3. Conceito do Big Data 
Das inúmeras pesquisas realizadas, cada autor indicava um conceito, levando a um 
mínimo comum, do qual é a analise de grandes quantidades de dados de diferentes tipos 
em uma grande velocidade. 
Para um melhor entendimento e desenvolvimento do presente trabalho, 
estabelecendo uma maior clareza na definição do conceito sobre Big Data, se faz uso do 
Quadro 1, conceitos sobre Big Data de importantes autores da área. 
Quadro 1 − Conceitos do Big Data 
Fonte: (CANARY, 2013 p. 22). 
MANYKA, J: et. 
al. (2011) 
(Mckinsey Global 
Institute) 
“Bid Data refere-se a conjunto de dados cujo tamanho é além da 
capacidade de ferramentas de software de banco de dados típicos 
para capturar, armazenar, gerenciare analisar.” 
MCAFEE, A; et. 
al. (2012) 
(Harvard Business 
Review) 
“Big Data como uma forma essencial para melhorar a eficiência e 
a eficácia das organizações de vendas e marketing. Ao Colocar o 
Big Data no coração de vendas e marketing, os insigths podem ser 
aproveitados para melhorar a tomada de decisão e inovar no 
modelo de vendas da empresa, o que pode envolver a utilização de 
dados para orientar ações em tempo real.” 
DEMIRKAN, et. “Há o desafio de gerenciar grandes quantidades de dados (Big 
Anais do 7º Congresso Acadêmico de Tecnologia e Informática (CATI 2015) 
UNEMAT – Barra do Bugres – ISSN 2448-119X 
57
 
al.(2012) 
(Decision Support 
Systems) 
Data), que esta ficando cada vez maiores por causa do 
armazenamento mais barato e evolução dos dados digitais e 
dispositivos de coleta de informações, como telefones celulares, 
laptops, e sensores.” 
PHELAN, Mike 
(2012) (Forbes) 
“O fenômeno surgiu nos últimos anos devido a enorme quantidade 
de dados da maquina que esta sendo gerado hoje –[...]- juntamente 
com as informações adicionais obtidas por analise de todas essas 
informações, que por si só cria outro conjunto de dados enormes.” 
Gartner Group 
(2012) 
“Bid Data, em geral, é definido como ativos de alto volume, 
velocidade e variedade de informações que exigem custo-
benefício, de formas inovadores de processamento de informações 
para maior visibilidade e tomada de decisão.” 
International Data 
Corporation 
“As tecnologias de Big Data descrevem uma nova geração de 
tecnologias e arquiteturas projetados para extrair economicamente 
o valor de volumes muito grandes e de uma grande variedade de
dados, permitindo alta velocidade de captura, descoberta, e/ou
analise.”
É absolutamente necessário que a organização que programa projetos de Big 
Data obtenha retorno destes investimentos, afirma Taurion (2012) ao explicar os custos 
do investimento com implementação do Big Data. 
2.4. Dados Estruturados e Desestruturados 
Dados estruturados contem uma organização para serem recuperados, que possuem 
relações, classificados em grupos possuindo as mesmas descrições. Dados mantidos em 
um SGBD
3
 e são analisados através de linguagem SQL
4
.
Dados desestruturados, não possuem estruturas definidas, normalmente são 
textos, documentos, gravações de serviços ao consumidor, fotos, imagens e vídeos, e 
não é possíveis armazenar em um banco de dado tradicional, devido inúmeras 
informações aleatórias. 
Hurwitz et al. (2013) diz que companhias também tem que considerar novas 
fontes de dados gerados por máquinas como, por exemplo, sensores. Perreira (2013) 
ainda complementa, outro exemplo de fonte de dados desestruturados são sensores, que 
podem ser usados com diversas finalidades como monitoram o trafego em rodovias, 
fazer leitura por RFID
5
 nos supermercados, temperatura nas cidades, satélites que
monitoram o tempo e terremotos, entre outros. 
3
 Sistema de Gerenciamento de Banco de Dados. 
4
 Structured Query Language (Linguagem de Consulta Estruturada). 
5
 Identificação por Rádio Frequência – Radio-Frequency Identification. 
Anais do 7º Congresso Acadêmico de Tecnologia e Informática (CATI 2015) 
UNEMAT – Barra do Bugres – ISSN 2448-119X 
58
 
 
2.5. NoSQL 
Para poder armazenar as informações desestruturadas, foi desenvolvido um banco para 
todos os tipos de dados, onde poderia ser utilizado por dados relacionais e não 
relacionais e que oferece um alto grau de escalabilidade, criando assim o NoSQL. O 
NoSQL (Not only SQL) é um termo usado para se referir a qualquer armazenamento de 
dados que não seguem o modelo tradicional RDBMS
6
, aponta Perreira (2013).
“Além da alta taxa de geração dos dados, outro fator que influenciou a criação 
de sistemas NoSQL foi o suporte a tipo de dados complexos, semiestruturados ou não 
estruturados” [Vieira 2012]. 
 Segundo Taurion (2012) a principal base tecnológica para Big Data é os bancos 
de Dados NoSQL. 
2.6. Geração de decisões através do relacionamento de dados 
Segundo Canary (2013), decisões são feitas através de processos de escolha, de pelo 
menos uma das alternativas propostas, atendendo a um problema existente. A decisão é 
compreendida em 3 dimensões: 
 Importância: Relacionado a satisfação de valores e interesses;
 Velocidade exigida: Pois algumas decisões exigem certa velocidade;
 Individualidade: decisões tomadas sozinho ou em grupos.
Para uma maior obtenção de valores de dados na grande dimensão, o Big Data é
dividida em variáveis envolvidas, cada uma com um conceito proposto, assim como a 
sua importância nas tomadas de decisões. Em varias biografias estas variáveis são 
conhecidas como “os três vês”, sendo elas: Volume, Variedade e Velocidade, porém a 
inclusão de mais “dois vês” esta presente em algumas bibliografias pesquisadas, sendo 
elas: Valor e Veracidade, gerando assim como conhecido em algumas bibliografias “Os 
“5V’s” do Big Data”. 
2.6.1. Variedade 
O conceito da variedade engloba o uso dos diferentes tipos de dados, onde são de 
diversas fontes origens, podendo ser estruturados ou não. 
“Os dados vêm de sistemas estruturados (hoje minoria) e não estruturados (a 
imensa maioria), gerados por e-mails, mídias sociais, documentos eletrônicos, 
apresentações estilo Powerpoint, mensagens instantâneas, sensores, etiquetas RFID, 
câmeras de vídeo, etc” [Taurion 2012]. 
As variáveis de estudos envolvidos são: Variedade de fontes de informação e 
variedade de tipos de dados 
6
 Relational Data Base Management System – sistema de gerenciamento de base de dados relacionais 
Anais do 7º Congresso Acadêmico de Tecnologia e Informática (CATI 2015) 
UNEMAT – Barra do Bugres – ISSN 2448-119X 
59
 
2.6.2. Volume 
Enorme quantidade de dados, este sendo a dimensão mais comum de vários conceitos 
proposto ao Big Data, sabendo também que quanto maior a quantidade de informações, 
maior será a precisão. 
Taurion (2012) destaca o aumento acelerado de volume de dados vem chamando 
atenção pela acelerada escala em que volumes cada vez maiores de dados são criados 
pela sociedade. 
As variáveis de estudos envolvidos são: Volume de informação, acessibilidade 
de informações e mudança de comportamento em função de um volume. 
2.6.3. Velocidade 
Para formar o tripé do conceito do big data, é necessário um grande poder de tempo de 
resposta com que os dados e informações são analisados, realizando as analises no 
menor tempo possível. “Muitas vezes é preciso agir em tempo real, exigindo um 
processamento que acompanhe esta velocidade” [TAURION 2012]. 
As variáveis de estudos envolvidos são: Velocidade de chegada da informação e 
velocidade a tomada de decisão. 
2.6.4. Valor 
Não tem como retratar o conceito do Big Data, relatar a sua tamanha capacidade de 
processamento de dados, e deixar de lado os valores necessários para a realização da 
pratica deste conceito. Big Data só faz sentido se o valor da análise dos dados 
compensar o custo de sua coleta, armazenamento e processamento comenta Taurion 
(2012). Para a proximidade da exatidão, a qualidade dos dados analisados deve ser 
percebida pelos usuários. 
As variáveis de estudos envolvidos são: Qualidade das informações, resultados 
agregado a partir das analises das informações e valor financeiro para ter dados de 
qualidade. 
2.6.5. Veracidade 
Taurion (2012) relata que é necessário ter certeza que os dados fazem sentido e são 
autênticos, pois quanto maior a porcentagem de autenticidade, menor será a chance de 
erro nas analises de dados do Big Data. 
É importante ressaltar a importância da qualidade dos dados para a analise 
adequada do Big Data, visto que dados de alta qualidade são pré-requisitospara auxiliar 
as organizações a adequarem-se as mudanças necessárias. 
2.7. Gerenciamento do Big Data 
Para a conclusão do resultado final é importante o cumprimento dos requisitos 
funcionais do Big Data, passando assim por um ciclo de gerenciamento. 
Conforme a figura 1 proposta pelo autor Hurwitz et al. (2013), pode se analisar 
que os o processo da captura dos dados vem como a primeira função do ciclo de 
Anais do 7º Congresso Acadêmico de Tecnologia e Informática (CATI 2015) 
UNEMAT – Barra do Bugres – ISSN 2448-119X 
60
 
 
gerenciamento, e, em seguida, são organizados e integrados, logo após esta fase ser 
implementada com sucesso, os dados podem ser analisados com base no problema a ser 
abordado, dando um resultado para que o usuário possa colocar em pratica através desta 
conclusão. 
Figura 1 - Ciclo de Gerenciamento do Big Data 
Fonte: Adaptado de Hurwitz et al. (2013, p.17). 
Hurwitz et al. (2013, p. 48), afirma que como qualquer arquitetura de dados 
importantes, você deve criar um modelo que tem um olhar holístico de como todos os 
elementos precisam se unir. 
3. Metodologia
O presente trabalho utiliza-se de pesquisa bibliográfica para a sua sintaxe, realizando 
leituras de dissertações, livros, sites oficiais, artigos publicados na Web e monografias 
concluídas, com o propósito de ampliar o conteúdo abordado, e para melhor 
compreensão do tema abordado. Através do levantamento, alcançou um melhor 
entendimento no conceito e na sua pesquisa de dados para uma aplicação. 
Trata-se de levantamento de toda bibliografia já publicada em 
forma de livros, revistas, publicações avulsas e imprensa escrita. Sua 
finalidade é colocar o pesquisador em contato direto com tudo aquilo 
que foi escrito sobre determinado assunto ou de manipulação de suas 
informações [LAKATOS 1992]. 
4. Considerações Finais
A quantidade de dados vem crescendo instantaneamente, tornando uma 
oportunidade de total crescimento e ganho do mercado que possuir e utilizar o Big Data 
em sua área de atuação. Varias organizações já visaram o enorme potencial de seu 
conceito e implantam para poder utilizar a imensidão de informações ao seu favor 
diante de seus negócios. 
Canary (2013) afirma que é fundamental que dirigentes saibam utilizar as 
características dos dados de hoje, no contexto do Big Data – Volume, Variedade, 
Velocidade, Valor e veracidade. Porem é preciso que aja uma compreensão para que as 
decisões apresentadas sejam as melhores. 
Anais do 7º Congresso Acadêmico de Tecnologia e Informática (CATI 2015) 
UNEMAT – Barra do Bugres – ISSN 2448-119X 
61
 
Os resultados proposto pela pesquisa relacionada a Banco de Dados 
proporcionou o entendimento mínimo sobre Big Data, fascinando a cada informação 
coletada, assim como a importância dos dados desestruturados nas tomadas de decisões, 
estas por sua vez podem ser capaz de prever acontecimentos, como um estoque de 
produto, ou mudança de varejo devido ao clima. 
O conceito do Big Data, assim como algumas informações, varia muito 
conforme autores, criando certas limitações sobre o mesmo. O tema é considerado uma 
tecnologia nova que vem crescendo cada vez mais no mundo, porem sua utilidade ainda 
é considerada pouco comparada com tecnologias antigas. 
Varias abordagens podem ser examinadas para dar prosseguimento a este artigo, 
e tratando de um tema inovador, pode dar sequencia desenvolvendo um projeto de 
implementação da análise do Big Data para tomadas de decisões de alguma instituição, 
ou para a redução de gastos em alguma área, como o agronegócio por exemplo. Outra 
opção seria ir mais a fundo nas análises dos processos do ciclo que gerencia o Big Data. 
Referências 
AURÉLIO, Dicionário. (2010) Disponível em: http://www.dicionariodoaurelio.com 
Acesso em, v. 15, n. 05. 
CANARY, Vivian Passos. (2013) A tomada de decisão no contexto do Big Data: estudo 
de caso único. 
DAVENPORT, Thomas. (2014) Big data at work: dispelling the myths, uncovering the 
opportunities. Harvard Business Review Press. 
GANTZ, John; REINSEL, David. (2012) The digital universe in 2020: Big data, bigger 
digital shadows, and biggest growth in the far east. IDC iView: IDC Analyze the 
Future, v. 2007, p. 1-16. 
HURWITZ, Judith et al. (2013) Big Data For Dummies, a Wiley Brand. New Jersey: 
John Wiley & Sons, inc.. 
LANEY, Doug. (2001) 3D data management: Controlling data volume, velocity and 
variety. META Group Research Note, v. 6, p. 70. 
PEREIRA, Felipe Argenton. (2013) Explosão dos dados e o conceito de análise de 
dados relacionados para geração de informações (BIG DATA). 
PRESS, Gil. (2013). A very short history of big data. Forbes. Forbes Magazine, 9. 
SHAW, Jonathan. (2014) Why “Big Data” is a big deal. Harvard Magazine, v. 3, p. 30-
35. 
VIEIRA, Marcos Rodrigues et al. (2012) Bancos de Dados NoSQL: conceitos, 
ferramentas, linguagens e estudos de casos no contexto de Big Data. Simpósio 
Brasileiro de Bancos de Dados. 
Anais do 7º Congresso Acadêmico de Tecnologia e Informática (CATI 2015) 
UNEMAT – Barra do Bugres – ISSN 2448-119X 
62

Continue navegando