BIG DATA

•

UFBA

Douglas Cerqueira

28/04/2022

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 27 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 27 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 27 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Redes de Computadores

64.746 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Big Data
Sumário
1 Introdução 3
2 O que é Big Data? 4
2.1 Big Data no cotidiano do mercado 7
3 Tecnologias parceiras do Big Data 8
3.1 Cloud computing 8
3.1.1 Cloud computing no cotidiano do mercado 9
3.2 Inteligência artificial 10
3.2.2 Inteligência artificial
no cotidiano do mercado 10
3.3 Machine learning 11
3.4 Internet das coisas (IOT) 11
3.4.1 Internet das coisas
no cotidiano do mercado 12
4 Big Data: um histórico 12
4.1 Bug do milênio 14
5 Momento atual dos dados 15
5.1 Dados estruturados 15
5.2 Dados não estruturados 17
5.3 Análise de dados e análise preditiva 17
5.4 Data science e Data analitycs 18
5.5 Coletando dados 19
6 Quarta revolução industrial,
Big Data e o impacto no mercado 20
6.1 Big Data no varejo 21
6.2 Big data na indústria de transformação 22
Resumo do curso 23
Referências 24
Módulo 1
Big Data
1 Introdução
Na era da informação, as decisões orientadas pela geração de dados com sua inevitável co-
leta e posterior análise não constituem mais uma escolha para o mundo corporativo e os go-
vernos, mais que isso, é um paradigma de sobrevivência. O efeito globalizante que acirra a
competitividade ao redor do planeta dispõe de um nascedouro gigantesco de dados que o
tempo todo surgem no panorama das mídias digitais e das diversas transações digitalizadas
presentes nos corredores da internet. A capacidade de extração da informação e produção
de conhecimento a partir desses dados criará melhores oportunidades de produção, venda e
otimização de gastos, atingirá um público cada vez maior e conhecerá a natureza de consu-
mo deste mesmo público, resultando em parcerias mais eficientes e na conformidade exigida
pelas agências de regulação. O futuro que se descortina ainda carrega muitas questões, mas
nos traz uma certeza: a de que a produção e análise de dados ocuparão (na realidade, já ocu-
pam) papel central. E mais do que nunca, esses dados que são produzidos em quantidades
estonteantes compõem hoje o chamado Big Data.
Em nosso estudo, trataremos também das tecnologias que dão auxílio ao Big Data, por isso
também trataremos da análise de dados, internet das coisas, computação em nuvem, inte-
ligência artificial, machine learning entre outras, bem como abordaremos fatores gerenciais
como a business inteligence e a forte influência do Big Data nos processos estratégicos e nas
tomadas de decisões gerenciais
5
2 O que é Big Data?
Antes de desenvolvermos melhor o amplo conceito de Big Data, vamos a uma abordagem mais
direta: Big Data está ligado a técnicas de armazenamento de dados, muitos dados, vindos de
todos os lugares e, em sua maioria, de forma não estruturada (AMARAL, 2016).
Importante
O que hoje é chamado de Big Data está, em grande parte, conectado ao mer-
cado, principalmente a atividades de gestão corporativa e gestão da infor-
mação (GOLDMAN, 2012). Além da propriedade em si de reunir dados estru-
turados, não estruturados e semiestruturados, também está intimamente
ligado a diversas e modernas técnicas e tecnologias de tratamento, compila-
ção e organização de dados (DAVENPORT, 2014).
O uso da enorme quantidade de informação presente hoje nos corredores virtuais não chega
a ser uma novidade nos meios da ciência da informação e administração, sistemas informa-
tizados já estão coletando dados desde a década de 50 (CHEN; CHIANG; STOREY, 2012). No
entanto, na contemporaneidade, o crescente número de fontes de informação se dá em alta
velocidade, redes sociais, sensores em produtos diversos, registros de tráfego na internet,
câmeras de vigilância, uso de aplicativos, entre outros.
A quantidade de dados nesse cenário cresce, assim como as alternativas para sua utilização.
Tal realidade constitui um grande desafio no uso desses dados, bem como na compreensão
de como os mesmos podem melhorar o ambiente de negócios. Mais que desenvolver tecnolo-
gia, é preciso uma nova mentalidade para o trânsito na estrada da dadosfera (AMARAL, 2016).
6
FIGURA 1 – BIG DATA
FONTE: Freepik (2021)
Os dados gerados atualmente são tão numerosos, que tecnologias mais tradicionais já não
dão conta de lidar com eles, por isso, uma abordagem referente ao Big Data não pode se dar
isoladamente, ela necessariamente trará em seu bojo outros implementos técnicos e tecno-
lógicos. Dentre os mais populares, trabalhando junto ao Big Data também se apresentam a
IA (Inteligência Artificial), o aprendizado de máquina do machine learning e a IOT – Internet of
Things (Internet das Coisas) (GOLDMAN et al., 2012). Tal força e quantidade de dados no cená-
rio moderno dá origem a grandes registros informacionais que, mais do que nunca, capaci-
tam processos de análises preditivas, ou seja, abre grandes possibilidades de planejamento
e ações preventivas a partir do suporte fornecido pelos dados. De certa forma, em termos
corporativos, seria com prever o futuro.
Atenção!
O ambiente de dados, se visto em uma perspectiva temporal, em recorte de
aproximadamente 30 anos, nos fornece um panorama de inovação informa-
cional cujas tecnologias foram se popularizando.
7
Vamos observar o quadro abaixo:
Quadro 1 – Avanços tecnológicos entre 1990 e 2020
Período Inovação tecnológica.
1990 - 2000 Vídeos, música e mídia em geral se tornam digitais.
2000 - 2010 Ascenção do comércio eletrônico e Internet Banking.
2010 - 2020 Início da hiperconectividade, cloud computing (computação em nuvem) e in-
ternet das coisas (IOT).
FONTE: Elaborado pelo autor (2021).
O Big Data não trata unicamente de grandes volumes de dados, mas também da heterogenei-
dade desses dados e toda essa diversidade é aplicada em processos de legitimação. Para tal
tarefa, foram desenvolvidas categorias classificadas nos cinco Vs do Big Data: volume, varie-
dade, velocidade, veracidade e valor. Vejamos o quadro abaixo:
Quadro 2 – Os cinco vs do big data
Os cinco Vs
Volume Quantidade de dados e informações adquiridas em processos de coleta. Auxi-
lia modelos de negócio de naturezas diversas para tomadas de decisão que se
apoiam em dados concretos. Após filtrados e devidamente compilados, pro-
porcionam visão ampla e holística do mercado.
Variedade Existe enorme heterogeneidade de dados à disposição. Fóruns, redes sociais,
e-commerce, fotografias, arquivos de áudio, números de telefone, cartões de
crédito, entre outros. Toda essa variedade gera dados que podem estar estru-
turados, semiestruturados ou ainda não estruturados.
Velocidade A informação é gerada, coletada e circula rapidamente na internet, exigindo
agilidade no aproveitamento desses dados. A lentidão no processamento de
informações pode resultar em uma limitação nos resultados de negócios ou
projetos. Em um ambiente de forte concorrência, a velocidade é um pilar vital.
Veracidade O grande volume de dados coletados necessita de validação, por isso existe
um cuidado especial com as fontes geradoras desses dados, e uma vez verifi-
cada a relevância, são possíveis ações direcionadas para públicos específicos.
Valor A utilidade dos dados após a validação deve ser criteriosa. Os insights criados
devem ser significativos no panorama organizacional.
FONTE: Adaptado de TAURION (2013, p. 53)
8
Taurion (2013) aponta acertadamente que um grande volume de dados por si só não possui a
significância e relevância necessárias para a geração de processos e negócios. Para que tal
seja suficiente, existem quatro pilares que devem ser percebidos, a saber:
• criação de uma esfera inteligente e um ecossistema de dados no interior das organi-
zações, compilando dados mais antigos, tradicionais e habituais aos formatos mais
recentes coletados no Big Data;
• investimentos na formação de capital intelectual, reunindo uma equipe talentosa e
com capacidade de utilização de dados;
• criação de metodologias ativas de estruturação de dados, validando-os e propiciando
mais operacionalização;
• cuidados no compliance e na ética processual de uso de dados e informações, respei-
tando as fontes geradoras, seu uso correto e a reputação da organização.Agora que compreendemos um pouco melhor sobre o que trata o Big Data, pensemos na quan-
tidade avassaladora de informações geradas e compartilhadas ao longo de um dia em nosso
planeta. O bom uso de tais informações rapidamente disponibilizadas nessas plataformas é
vital em estratégias corporativas, determinante para a elaboração de projetos voltados ao pú-
blico, para a proposição de novos produtos e serviços.
2.1 Big Data no cotidiano do mercado
Uma das maiores empresas de logística do planeta a United Parcel Service ou UPS trabalha
com volumes gigantescos de encomendas diárias em cerca de 200 países. São cerca de 14 mi-
lhões de encomendas diárias, por isso o uso do Big Data aliado a ferramentas de analytics tem
sido recorrente. Assim, é possível otimizar a performance de uma frota de aproximadamente
100.000 veículos pertencentes à empresa.
Todos os veículos são equipados com dispositivos de telemetria e rastreamento via satéli-
te, a coleta em tempo real desses dados é processada pelos servidores da UPS e utilizada
para minimizar espaços de ociosidade veicular e agilizar manutenções preventivas na frota.
Segundo dados da própria empresa, houve economia de milhões de litros de combustível
desde que uso de implementações do Big Data fizeram parte dos processos da empresa
(SANTO DIGITAL, 2019).
9
3 Tecnologias parceiras do
Big Data
Não é possível falar de Big Data sem abordar as diversas técnicas e tecnologias que lhe dão
suporte.
Atenção!
Sem o apoio de outras modalidades, a enorme quantidade de dados que hoje
temos disponíveis de nada nos serviria.
Por isso, é interessante e necessário que tomemos conhecimento de outras premissas tecno-
lógicas que trabalham junto ao Big Data (AMARAL, 2016).
3.1 Cloud computing
A computação em nuvem dá suporte ao Big Data e já está incorporada ao mercado, pode pro-
ver serviços para usuários físicos e jurídicos e se presta a hospedagem de arquivos (TAURION,
2013). No mundo corporativo, é comum a terceirização de serviços de armazenagem em nu-
vem, contratados sob demanda. O acesso rápido aos recursos, facilidade de manipulação de
arquivos e compartilhamento são vantajosos aos usuários, oferece maior segurança e con-
tratação planejada. Existem quatro modalidades de nuvem, vejamos:
Quadro 3 – Formatos de nuvem
Nuvem privada Infraestrutura disponibilizada através de uma organização,
gerenciada pela corporação ou terceiros.
Nuvem pública A infraestrutura fica disponibilizada para o público, que aces-
sa suas funcionalidades através de login e senha.
10
Nuvem
comunitária
A infraestrutura é dividida entre empresas que têm objetivos
e interesses em comum, dividindo dados. A gestão pode ser
interna ou terceirizada.
Nuvem híbrida São nuvens de naturezas distintas, via níveis de acesso, cer-
tas informações não são compartilhadas, porém outras per-
manecem disponíveis a todos.
FONTE: Adaptado de SOUSA; MOREIRA; MACHADO (2009, p. 8)
A cloud computing, devido às suas vantagens e dinamicidade, propagou-se rapidamente pelo
mercado, atingindo empresas de segmentos variados, bem como diversos portes e estrutu-
ras. Existem pacotes de acesso dos mais acessíveis até os mais caros e complexos. Não de-
vemos nos esquecer de que o armazenamento em nuvem também atingiu o cidadão comum
(pessoa física) para prover segurança de armazenagem a e-mails e arquivos diversos.
FIGURA 2 – COMPUTAÇÃO EM NUVEM
FONTE : Freepik (2021)
3.1.1 Cloud computing no cotidiano do mercado
Atualmente, os aplicativos baseados em nuvem são muito utilizados por usuários físicos e
corporativos, proporcionando armazenamento instantâneo com a vantagem de que tais ar-
quivos podem ser acessados de diversos hardwares. Existem muitas opções de cloud com-
puting, e algumas são muito populares, tais como o Dropbox, Google Drive, iCloud e Micro-
soft One Drive.
Na condição de usuários pessoa física, por vezes não temos uma dimensão maior do uso al-
tamente disseminado da cloud computing na esfera corporativa. A gigante do e-commerce
Amazon foi uma das primeiras empresas a fornecer provimento em cloud para o mercado, no
que foi seguida por outros grandes players como Google, Amazon e Microsoft (ZARDO, 2018).
11
3.2 Inteligência artificial
A inteligência artificial trata de uma junção de várias tecnologias, redes neurais, algoritmos,
aprendizado de máquina (machine learning), entre outros. O caminho é a simulação das capa-
cidades humanas ligadas à inteligência, como o ato de raciocinar, a percepção do ambiente ao
redor e habilidades de análise de dados.
Sendo assim, o conceito de inteligência artificial é a capacidade da tecnologia de realizar ati-
vidades de uma forma que seja considerada inteligente e até intuitiva. As inteligências artifi-
ciais (IAs) aprendem por si, sistemas analisam dados (daí sua capacidade de atuar como su-
porte ao Big Data) possibilitando a ampliação de conhecimentos.
FIGURA 3 – MACHINE LEARNING
FONTE : Freepik (2021)
3.2.2 Inteligência artificial no cotidiano do mercado
Sediada em Curitiba, a Startup Laura está se consolidando como um exemplo de sucesso na
área de saúde e de uso de inteligência artificial. Seu robô de mesmo nome (Laura) monitorou
cerca de 2,5 milhões de pacientes em parceria com o Hospital Nossa Senhora das Graças. Por
meio de IA, criou-se um mapeamento das necessidades de ambientes hospitalares utilizando
recursos digitais. No monitoramento de atividades, surgiram insights que indicaram a imple-
mentação de soluções tecnológicas que estão auxiliando médicos e enfermeiros no melhor
gerenciamento no atendimento aos pacientes. Análises de dados otimizaram a conferência e
encaminhamento de exames, bem como quais pacientes necessitam ser priorizados no aten-
dimento (AMARAL, 2016).
12
3.3 Machine learning
Pode-se considerar o machine learning como um segmento da IA (Inteligência Artificial), e
que dá suporte a ela. Faz uso de tecnologias que aprendem a partir de interações e opera-
ções calcadas na tentativa e erro (como em certa medida, humanos aprendem), a partir de
premissas básicas.
Atenção!
Instruções básicas fornecidas por desenvolvedores são o aporte inicial para
que então um sistema baseado em machine learning desenvolva seu proces-
so de aprendizado. Lacunas na programação vão aos poucos sendo preen-
chidas, a própria máquina vai interagindo com o ambiente.
Um exemplo do poder computacional do machine learning é o célebre caso do robô que, em 11
de maio de 1997, venceu o enxadrista russo Garry Kasparov, que foi derrotado por um progra-
ma denominado Deep Blue. Após sucessivas derrotas, o robô aprendeu as principais jogadas
de Kasparov e, por fim, o venceu (VEJA, 2020).
3.4 Internet das coisas (IOT)
Tecnologias se interpenetram, desenvolvem-se e se auxiliam, junto ao Big Data, a IOT (Internet
of Things) que é altamente interativa e possui um grande repositório de dados de interação
com usuários, está se impondo no mercado e despertando cada vez mais interesse. Dados
apontam que até o ano de 2025, apenas em território nacional, algo em torno de 100 milhões
de dispositivos estarão conectados na esfera da IOT (EPOCA NEGÓCIOS, 2019).
A busca é pela conexão de diferentes aparatos a diferentes redes, todos conectados entre
si. Essa tecnologia oferece a ampliação de atividades diárias automatizadas, gerenciamento
mais competente e mais controlado de diversos sistemas, prevenção e diminuição de taxas
de retrabalho e acidentes e maior conforto para os usuários. A relação com o Big Data é bas-
tante clara, a enorme quantidade de aparelhos conectados e os dados disponibilizados entre
eles exigem um alto poder de processamento que processos de IOT podem proporcionar.
13
FIGURA 4 – INTERNET DAS COISAS
FONTE : Freepik (2021)
3.4.1 Internet das coisas no cotidiano do mercado
Os mercados agrícolas estadunidense e brasileiro contam com diversas iniciativas de aplica-
ção da IOT. Na Califórnia, um dos maiores períodos de seca de sua história prejudicou a agri-
cultura local no iníciodos anos 2010. Graças ao uso de drones munidos de sensores de quali-
dade de solo, análises foram enviadas aos produtores que conseguiram identificar os locais
mais apropriado para o plantio de novas safras, criando um novo ciclo virtuoso de plantio. Tal
tecnologia já está presente também no Brasil, startups dedicadas ao segmento instalam junto
às plantações sensores de meteorologia que analisam indicadores como fatores de radiação
solar, direção do vento, pressão barométrica e umidade do solo.
Ainda no Brasil, drones e máquinas agrícolas enviam dados sobre uso de solo e fornecem
insghts sobre o melhor aproveitamento do mesmo, com o apoio de GPS, Wi-Fi, Bluetooth e
tecnologias RFID (EPOCA NEGÓCIOS, 2019).
4 Big Data: um histórico
Estudiosos do assunto como Chen, Chiang e Storey (2012) e Davenport (2014) apontam cerca
de três períodos em que o sistema de informação foi utilizado como suporte para análise de
dados em apoio a negócios e gestão, todos esses períodos estão diretamente ligados ao nas-
cimento de inovações tecnológicas que produziram significativas alterações, ou nas fontes
de dados ou em suas formas de processamento. Vejamos o quadro abaixo:
14
Quadro 4 – Períodos de sistemas de dados e características
Período 1: estruturas
administráveis de
dados
Computação comercial na década de 60, armazenamento em
arquivo simples, ausência de estruturas, modelos detalhados de
programação, dados relacionais, escalabilidade de hardware, ad-
ministração de dados.
Período 2:
administração Web
Investimento em sistemas com dados estruturados, sistemas
transacionais, gerenciamento de conteúdo corporativo, armaze-
namento e gerenciamento de conteúdo web, unificação de proto-
colos, plataformas de gestão de processos, entre outros.
Período 3:
Administração de Big
Data
Visualização de dados, armazenamento baseado em nuvem,
remoção de limitações físicas, capacidade de administração de
quantidades massivas de dados, hibridismo de dados.
FONTE: Adaptado de SILVEIRA; MARCOLIN; FREITAS (2015, p. 40)
A grosso modo, o uso de ferramentas de tecnologia da informação no universo empresarial
já era tema de interesse de estudiosos desde o início da década de 50. Por volta dessa época,
dados passam a ser coletados e armazenados através de sistemas estruturados de dados re-
lacionais (AGRAWAL, 2014).
A partir da década de 90, novas aplicações foram ganhando mais protagonismo na estrutura-
ção de oportunidades de negócio como forma de organizar informações das empresas. Esse
tipo de aplicação teve forte contribuição ao estruturar modelos de negócio diversos (AGRA-
WAL, 2014). A partir de então, houve forte aprimoramento de ferramentas destinadas a con-
sulta a bancos de dados. Podemos destacar o OLAP – On-Line Analytical Processing (Processa-
mento Analítico On-line); BPM - Business Performance Management (Gestão do Desempenho
Empresarial/Gestão); BI - Business Intelligence (Inteligência de Mercado). Essas e outras alter-
nativas promoveram aplicações que ofereceram maior segurança a processos de tomada de
decisão. Esse período, que foi até aproximadamente o início dos anos 2000, ficou conhecido
como Business Intelligence and Analitics 1.0 (BI&A 1.0) (CHEN; CHIANG; STOREY, 2012).
Nos anos 2000, veio uma gigantesca maré de dados gerada quase instantaneamente (DA-
VENPORT, 2014). Fluxos de cliques, operações comerciais, padrões de navegação, conteúdo
gerado pelo usuário, blogs, imprensa alternativa, mídias sociais entre tantos outros são res-
ponsáveis por nortear um dilúvio crescente de dados (CHEN; CHIANG; STOREY, 2012). Tama-
nha produção foi apontada como a era 2.0 do Business Intelligence and Analitics (BI&A 2.0)
(CHEN; CHIANG; STOREY, 2012), cujas ferramentas de análise de negócios ganham espaço e
melhorias tecnológicas (AGRAWAL, 2014). Dispositivos móveis de maciça utilização, aliados
ao Cloud Computing, às conexões da IOT e à crescente sofisticação, canalizaram um fluxo con-
tínuo e incessante de dados que constituíram o pilar central do Big Data (DAVENPORT, 2014).
15
4.1 Bug do milênio
Um fato marcante e curioso na história do armazenamento e registro de dados foi o chamado
de Bug do milênio, que se deu pela forma como foram estipuladas as configurações de datas
em sistemas operacionais. Na tentativa de se poupar espaço de memória, o formato utilizado
foi o dia/mês/ano e nele foram utilizados dois dígitos para cada sessão. Assim, se a data in-
dicada era 12/05/96 o sistema automaticamente compreenderia que a referência era ao ano
de 1996. Os computadores até então estavam programados para interpretar o ‘00’ no final de
uma data como 1900. Sendo assim, os sistemas, ao contrário de continuarem linearmente em
uma linha temporal progressiva, acabariam por recuar no tempo cem anos, criando um efeito
cascata que poderia levar a falhas sucessivas nos equipamentos em rede (GAMEHALL, 2017).
Nos anos 1960, o uso de computadores passou a ser muito mais difundido dentro da esfera
governamental e das corporações. Naquele momento era um equipamento caro e de aces-
so limitado, desenvolvedores buscavam maneiras de diminuir o consumo de memória desses
equipamentos. Uma forma encontrada foi a de salvar apenas dois dígitos fazendo com que o
número “19” estivesse presente automaticamente nos registros de data. O que resultou no se-
guinte: 1º de junho de 1967 seria automaticamente reduzido para 010667 ao invés de 01041964,
essa medida mínima representou na época uma expressiva economia.
Por décadas tal estratégia se mostrou eficiente, no entanto, com a virada do século que se
aproximava, especialistas apontaram a possibilidade dos dígitos 1 e 9 não serem substituídos
pelos dígitos 2 e 0, ou seja, os sistemas retornariam ao ano de 1900 automaticamente. Haveria
enorme confusão na arquitetura dos sistemas. Alguns afirmavam que as consequências po-
deriam ser gigantescas e haver colapsos no sistema bancário, usinas nucleares, sistemas de
aviação e na automatização de empresas. Mas o único evento relevante referente ao bug do
milênio aconteceu em uma usina nuclear japonesa, houve uma falha no sistema de segurança,
porém um acidente maior foi evitado pelos sistemas secundários.
Atenção!
Aparentemente, o risco ainda existe. Ao que tudo indica, um novo esforço,
não tão intenso quanto o anterior, já está sendo realizado. Nos sistemas de
32-bit baseados na linguagem C, o registro de tempo está configurado para
encerrar no dia 19 de janeiro de 2038, às 01:14:07, pelo horário de Brasília,
chamado de Y2K38.
As operações para sanar eventuais problemas já estão em curso (GAMEHALL, 2017).
16
5 Momento atual dos dados
Para começar, abordaremos a diferença entre dados, informação e conhecimento. Existe
uma ordem ou hierarquia entre esses três elementos:
• dados podem ser considerados como registros mais básicos e nucleares;
• informações são dados já trabalhados, submetidos a um processo de organização;
• conhecimento trata de informação devidamente compilada e absorvida, pronta para
ser posta em prática.
Em um primeiro momento, podemos afirmar que dados e informações estão em toda parte:
textos escritos, registros digitais, eletrônicos, na linguagem falada etc. (LAUDON; LAUDON,
2010). Tomemos aqui um exemplo: vamos utilizar os números 28 29 e 30. Isoladamente, esta-
mos falando de dados que por si só têm muito pouco a nos dizer, no entanto, se associarmos
esses dados a outros, como por exemplo, todos os dias 28, 29 e 30 de cada mês, e buscarmos
a presença de chuva, temos então informação, e ainda mais, se aumentarmos esse leque e
colocarmos essas mesmas datas todos os meses durante 10 anos. Certamente, poderemos
daí estabelecer um padrão de comportamento da chuva, teremos então conhecimento. As-
sim, será possível descobrir em quais períodos do ano existe maior possibilidade de presença
da chuva nesses dias, orientando ações preventivas para essas ocasiões.
5.1 Dados estruturados
Quando falamos de dados estruturados, normalmente nos referimos aos dadosque possuem
formato e comprimento definidos, nesse caso incluem-se números, datas, grupos de pala-
vras, endereços e afins. É de consenso dos especialistas que aproximadamente 20% dos da-
dos existentes na internet são dessa natureza, normalmente dispostos em bases de dados e
passíveis de consulta através de algum tipo de linguagem estruturada como a SQL (HURWITZ
et al., 2015). Esse tipo de dado é coletado por empresas quando usuários preenchem cadas-
tros, por exemplo, mas também podem ser gerados por máquinas. No quadro abaixo, pode-
mos verificar essas diferenças:
17
Quadro 5 – tipos de dados estruturados
Dados gerados por humanos Dados gerados por máquinas
Dados de entrada: qualquer tipo de dado que
uma pessoa possa colocar em um computa-
dor, nome, idade, renda, respostas a pesqui-
sas, etc.
Dados de sensores: etiquetas de radiofre-
quência, medidores, dispositivos médicos,
dados de GPS.
Dados de fluxo de clique: registrados toda
vez que o usuário clica em um link em um
website.
Dados de web log: servidores, aplicativos,
interações em rede e outros dispositivos que
capturam dados e atividades de usuários.
Dados relacionados a jogos: cada movimento
realizado em um jogo virtual pode ser regis-
trado. Isso é bastante útil para que se enten-
da como usuários se movem através de uma
tela em uma situação de jogo.
Dados de ponto de venda: através de có-
digo de barras, nesse caso todos os da-
dos associados ao produto são gerados e
armazenados.
Dados financeiros: gerados e armazenados
através da automatização de processos. Sis-
temas financeiros registram interações ge-
radas por máquinas e em parte por humanos.
FONTE: Adaptado de NUGENT et al. (2015, p. 60)
FIGURA 5 – BIG DATA
FONTE : Freepik (2021)
18
5.2 Dados não estruturados
Os dados não estruturados não seguem um formato específico. Como já citamos em nosso
estudo, são cerca de 80% dos dados na internet. Esse tipo de dado está por toda parte e, as-
sim como os dados estruturados, também são gerados por máquinas ou por humanos. Veja-
mos no quadro a seguir alguns exemplos:
Quadro 6 – tipos de dados não estruturados
Dados gerados por humanos Dados gerados por máquinas
Textos institucionais: textos contidos em do-
cumentos, registros, resultados de pesquisa
ou e-mails enviados. Todo tipo de informação
de caráter empresarial e textual.
Imagens via satélite: são informações de
tempo ou vigilância através de satélites. O
Google Earth é um exemplo.
Dados de mídias sociais: são diversos e ge-
rados a partir de plataformas sociais como
YouTube, Facebook, Linkedin, Tik Tok etc.
Dados científicos: registros sobre variações
energéticas, dados atmosféricos ou monito-
ramento de rotinas sísmicas.
Dados móveis: contém todo tipo de elemento
como informações de localização, mensa-
gens de texto e arquivos diversos trocados
entre dispositivos móveis.
Fotos e vídeos: dados que podem vir de
vídeos de segurança, vigilância e tráfego,
acompanhamentos por drones, câmeras do
sistema bancário etc.
Conteúdos de website: vindos de qualquer
site na internet que entrega conteúdo deses-
truturado como YouTube, Flickr, Instagram e
qualquer outra plataforma com alta geração
de conteúdo.
Registros de radar ou sonar: acompanha-
mento de sistemas veiculares, oceanográfi-
cos, meteorológicos etc.
FONTE: Adaptado de NUGENT et al. (2015, p. 62)
Há, ainda, os dados semiestruturados, tipo de dado contido justamente entre dados estrutu-
rados e dados desestruturados. Na maior parte do tempo contêm características de ambos,
podendo contar com uma estrutura padrão que os torna estruturados, mas como uma organi-
zação interna mais caótica que lhe confere uma desestrutura.
5.3 Análise de dados e análise preditiva
Processos de análise de dados dizem respeito à aplicação de técnicas de caráter estático e
lógico que avaliam informações a partir da coleta de dados presentes nos bancos informacio-
nais do Big Data. Objetiva a extração de informações úteis, decisões são tomadas de forma
mais assertiva e orientadas para resultados efetivos (LAUDON; LAUDON, 2010).
19
Atenção!
Algumas vantagens que podem ser obtidas são a antecipação de trabalho,
tornando-o mais proativo e menos reativo, a criação de estratégias ou de
serviços mais efetivos, redução de riscos e de taxa de retrabalho e uma me-
lhor experiência para o cliente.
Existem quatro formas de análise de dados:
• Análise descritiva: baseada em fatos ocorridos, ou seja, é um estilo de avaliação a
partir de resultados obtidos. É possível destacar a geração de relatórios, controle e
segmentação de público-alvo, análises de oportunidades de negócio, aplicação de
métricas e avaliação de resultados obtidos.
• Análise preditiva: atualmente é a forma mais popular de análise devido ao enorme
volume de dados disponíveis, que propiciam o modelo preditivo, essencialmente. Tal
modalidade se ancora na previsão de possibilidades e cenários futuros. Ressalte-se
que em uma análise de caráter preditivo as possibilidades se dão dentro de deter-
minadas condições. Busca determinar a confirmação de uma tendência, uma causa,
uma correlação ou probabilidade.
• Análise prescritiva: normalmente empreendida após a coleta de resultados de uma
avaliação preditiva, prescreve uma ação ou recomendação a algum acontecimento
potencial. Nesse caso, a melhor forma de se obter uma análise prescritiva é através
da realização de projeções ou predições. Por seu caráter mutante; uma vez que está
condicionada às previsões; modelos de análise prescritiva estão fortemente apoia-
dos nas tecnologias da inteligência artificial, do machine learning e dos algoritmos;
• Análise diagnóstica: tal como a análise descritiva, também se baseia em fatos ocor-
ridos, no entanto diferencia-se dessa por objetivar encontrar relações de causa e
efeito. O processo é baseado em probabilidades, e a partir de então determina-se um
diagnóstico da situação analisada.
5.4 Data science e Data analitycs
Não faz tanto tempo que tais nomenclaturas se popularizaram no meio corporativo, a ciência
de dados (data science) e a análise de dados (data analitycs) também, a cada dia, estreitam sua
ligação com Big Data (LAUDON; LAUDON, 2010). No quadro a seguir podemos verificar suas
principais características:
20
Quadro 7 – data science e data analitycs
Data science Data analitycs
Campo que une estatística, matemá-
tica, programação e atua na extração,
triagem e preparação de dados. Busca
padrões em dados estruturados e não
estruturados.
Analisa dados brutos em busca de pa-
drões e usa algoritmos para isso. Pro-
cura correlações significativas entre
dados de uma base.
FONTE: Elaborado pelo autor (2021).
FIGURA 6 – DATA SCIENCE E DATA ANALITYCS
FONTE : Freepik (2021)
5.5 Coletando dados
Já sabemos que qualquer projeto que envolva Big Data trabalhará com extensa coleta de da-
dos. Mas de onde vêm esses dados? Como eles são coletados? Quais os pontos centrais des-
sas atividades de coleta de dados?
Nos tópicos sobre dados estruturados e dados não estruturados já vislumbramos parte desse
processo, mas para maior entendimento, vamos nos centrar em um objetivo de marketing.
Pensemos aqui que uma empresa qualquer, ao executar uma campanha de marketing, preci-
sa coletar dados referentes aos usuários que interajam com os elementos de tal campanha,
como anúncios em redes sociais, mídia display, links patrocinados e afins. Para tanto, uma es-
trutura de e-commerce devidamente programada estará ligada aos implementos já citados, e
pode realizar essa coleta através de cliques de usuários em anúncios, visualizações, comen-
tários e compartilhamentos, ou ainda com o preenchimento de um formulário. Não esque-
21
çamos também a coleta de dados através de máquinas, mas nesse momento enfatizaremos
dados de interação daquele que utiliza a internet voluntariamente.
Esses dados primários dos usuários são registrados, e com eles uma ‘espionagem’ maior aca-
ba sendo efetivada, pois são coletados mais dados, como o dispositivoutilizado (smartphone,
PC, tablet, notebook etc), o sistema operacional que está rodando nesses dispositivos, horá-
rio, localização geográfica, endereço de IP, endereços de e-mail e até mesmo seu histórico
de buscas, logins e senhas, mapas de calor, entre outros. Lembrando que na estrutura de um
e-commerce (como de qualquer site devidamente programado para isso) ainda temos o histó-
rico de navegação e compras. Todos esses dados coletados passam por um processo de mi-
neração, que nada mais é que a procura por padrões dos usuários dentro de uma estrutura di-
gital qualquer. É nesse momento que tecnologias que já citamos, como a inteligência artificial
e a ciência de dados, dentre outras, entram em ação. Nessa fase, dados gerados dão origem a
mapas comportamentais de extratos definidos de usuários e consumidores.
Através de um complexo sistema de protocolos presentes na internet, é possível que cada
passo de um usuário seja rastreado, esses protocolos registram toda vez que um usuário
acessa a internet, quantos cliques ele deu em uma foto ou link, quais áreas da rede mais aces-
sa e quanto tempo ficou on-line nesses locais. O ambiente digital está permeado de mecanis-
mos de rastreamento e são esses mecanismos que fornecem continuamente os dados que
são diariamente aproveitados pelo Big Data (AMARAL, 2016).
6 Quarta revolução
industrial, Big Data e o
impacto no mercado
A essa altura de nosso estudo, já pudemos perceber o enorme impacto que o Big Data e as
tecnologias de lhe dão suporte causaram no dia a dia do mercado, mas é chegado o momento
de nos debruçarmos mais assertivamente sobre esse tópico. Sabe-se que 59% dos habitantes
do globo é de usuários ativos da rede (E-COMMERCE BRASIL, 2020), a internet como canal de
negócios é uma incontestável realidade e faz parte de linha histórica que trouxe mudanças
fundamentais nas formas de organização social e modelos econômicos, interferindo nos as-
pectos da vida comum (AMARAL, 2016).
Historicamente, a primeira revolução lançou mão de água e vapor, trouxe a mecanização da
produção; na segunda revolução, a energia elétrica incrementou e ampliou muito a produção
em massa; na terceira revolução, a eletrônica e a tecnologia da informação aumentaram as
possibilidades ao promoverem a automatização da produção.
https://www.ecommercebrasil.com.br/author/redacaoecb/feed/
22
Atenção!
Neste momento, atravessamos a quarta Revolução Industrial. Seu maior
atributo é um amálgama de tecnologias que interagem entre si: computado-
res pessoais, smartphones, smart TVs, e-mails, redes sociais, e-commerce,
o emergir das Startups, bancos on-line, a transformação digital e o cloud
computing.
6.1 Big Data no varejo
Imaginemos todo esse mar de informações e seu uso no varejo. A força do Big Data nesse seg-
mento está centrada na análise e determinação de padrões e tendências de consumo. É es-
tatisticamente mensurável toda a movimentação do usuário em rede, que indica preferências
através de seus hábitos de navegação e compra em ambientes digitais. Isso permite ao varejo
o planejamento de ações mais certeiras na captura e fidelização de clientes. O varejo é um dos
setores que utiliza o Big Data, principalmente o comércio eletrônico.
Os já citados hábitos de navegação e consumo dos usuários são coletados para estratégias
diversas como o lançamento de novos produtos, determinação de seu ciclo de vida, distribui-
ção geográfica por demanda, ou ainda a identificação de falhas no processo de atendimento,
gargalos logísticos e afins. No que tange à logística, o Big Data é uma excelente ferramenta
de controle que impacta diretamente na performance do varejo eletrônico (AMARAL, 2016). O
trabalho de fidelização de clientes não passa somente pela elaboração de mensagens efica-
zes de marketing, mas também por toda uma cadeia de produção, atendimento e pós-venda,
permite a adequação de preços de acordo com cada segmento com base nos dados deixados
pelos consumidores.
Essas informações impactam até mesmo em mudanças no design das lojas, que vão se
adaptando a tendências indicadas pelo usuário, personalização de ofertas para clientes
distintos, administração de escalabilidade de vendas e consequente redução de custos.
Através da mineração de dados, o varejo pode trabalhar com muito mais precisão e rápida
atualização através de ferramentas de análise como o Google Analytics, Google Tag Mana-
ger, Search Console e tantas outras que monitoram dados em tempo real da movimentação
de usuários em ambientes digitais de varejo. Isso é controle, o que gera estabilidade e pla-
nejamento (DAVENPORT, 2014).
23
6.2 Big data na indústria de transformação
O Big Data possui aplicação em praticamente todos os setores e a indústria de transforma-
ção certamente não ficaria de fora desse paradigma. Nesse segmento, os dados coletados
têm contribuído significativamente na redução de falhas e diminuição de taxas de retrabalho,
aumentado a qualidade da produção e eficiência, otimização de tempo e dinheiro. Alguns tó-
picos relevantes que têm sido destacados em pesquisas são o aumento da qualidade do pro-
duto e a rápida determinação das causas que geram defeitos de fabricação, proporcionam
um planejamento preciso da cadeia de suprimentos, maior monitoramento em processos de
fabricação, controle de prazos e relacionamento com fornecedores, previsões de entrada e
saída de mercadorias e matéria-prima, eficiência energética, prototipação mais rápida de no-
vos produtos e personalização massificada.
Outro fator se debruça nas análises preditivas do data science, a indústria de transformação
busca indicações nos dados de oportunidades e tendências futuras, seja no desenvolvimento
de novos materiais, processos, paradigmas, otimização e afins. A personalização é um grande
exemplo disso, as movimentações de usuários em rede revelaram ao mercado fortes segmen-
tos que antes passavam despercebidos, como por exemplo, o mercado vegano, a sustentabi-
lidade ou as representações étnicas e culturais. A indústria percebeu que em grande medida
produtos, embalagens e afins não poderiam mais ser homogêneos, existe a necessidade de
buscar identificação com segmentos distintos e seus interesses. Esses segmentos deixam
claras suas preferências nos dados do Big Data.
O impacto do Big Data pode ser medido em todas as esferas de convivência, tanto pessoal
quanto mercadológica. A humanidade, sem dúvida, vive na contemporaneidade sua mais
massiva quantidade de dados criados e registrados em nível pessoal e profissional, o aces-
so cada vez mais facilitado às mídias digitais abarrotam as nuvens virtuais. A comunicação e
interação entre dispositivos aumenta exponencialmente (JENKINS; FORD; GREENE, 2014), as
informações necessárias para a criação de verdadeiros mapas comportamentais de consu-
midores, bem como diversos outros processos mercadológicos estão na pauta do dia. Exis-
tem plataformas com capacidade de processamento e administração de dados que suportam
massas gigantescas de arquivos.
A automatização da indústria utiliza máquinas inteligentes que decidem ações de forma autô-
noma e descentralizada em sistemas que interagem e colaboram mutuamente. O advento da
fibra ótica, o desenvolvimento dos computadores e a abrangência dos smartphones impulsio-
nam a revolução digital, a erupção dos dados na quarta Revolução Industrial (AMARAL, 2016).
Assim, quando alcançarmos a consolidação desses processos, teremos um grau de eficiência
nunca antes visto. Obviamente a tecnologia apenas não é suficiente, é necessária a maturida-
de digital nas organizações e corporações, com mão de obra especializada e visão estratégica
para tirar o maior proveito da enorme quantidade de dados presente no Big Data.
24
Resumo do curso
Neste curso, você aprendeu que o Big Data, com as premissas da exploração de dados, é vi-
tal para o presente e futuro dos negócios. Buscar novas formas de lidar com a informação é
a palavra de ordem, ter estratégia e novas perspectivas de gestão nosimpulsionam em uma
maior competitividade e resultados mais promissores.
A esfera do Big Data também se presta na determinação de modelos preditivos de proteção a
fraudes, possibilitando processos de alerta que possam garantir respostas oportunas quan-
do dados de natureza incomum são reconhecidos. Com a emergência dos dados, cria-se um
olhar abrangente e analítico para todo tipo de operação a ser executada dentro do ambiente
corporativo. À medida que as empresas compreendem isso, mais promissores serão seus re-
sultados no caminho da competitividade e diferenciação no mercado.
25
Referências
AGRAWAL, D. Analytics based decision making. Journal of Indian Business Research, v. 6, n. 4, p. 332-
340, 2014.
AMARAL, F. Big Data: uma visão gerencial. São Paulo: Polo Books, 2016.
CHEN, C. P.; ZHANG, C. Y. Data-intensive applications, challenges, techniques and technolo-
gies: a survey on Big Data. Information Sciences, 275, 314–347, 2014.
CHEN, H.; CHIANG, R. H. L.; STOREY, V. C. Business intelligence and analytics: from Big Data to
big impact. MIS quarterly, v. 36, n. 4, p.1165-1188, 2012.
_____. Big data: a survey. Mobile networks and applications, v. 19, n. 2, 171–209, 2014.
DAVENPORT, T. H. Big Data no trabalho: derrubando mitos e descobrindo oportunidades. Rio
de Janeiro: Elsevier, 2014.
E-COMMERCE BRASIL. Gonçalves, D. Big Data: o que é, como funciona e como usar a favor da
minha empresa? Disponível em: https://www.ecommercebrasil.com.br/artigos/big-data-o-
-que-e-como-funciona-e-como-usar-a-favor-da-minha-empresa/. Acesso em: 30 ago. 2021.
EPOCA NEGOCIOS. Conheça 6 aplicações da internet das coisas que já estão tornando o mun-
do melhor. Disponível em: https://epocanegocios.globo.com/Tecnologia/noticia/2019/03/co-
nheca-6-aplicacoes-da-internet-das-coisas-que-ja-estao-tornando-o-mundo-melhor.html.
Acesso em:12/08/2021.
GAMEHALL, V. Apocalipse ou enganação: o que foi o Bug do Milênio? 2017. Disponível em: ht-
tps://www.uol.com.br/tilt/noticias/redacao/2017/08/20/apocalipse-ou-enganacao-o-que-
-foi-o-bug-do-milenio.htm. Acesso em: 30 ago. 2021.
GOLDMAN, A. et al. Apache Hadoop: conceitos teóricos e práticos, evolução e novas possibili-
dades. XXXI Jornadas de atualizações em informática, 2012.
HURWITZ, J. et al. Big Data para leigos. Rio de Janeiro: Alta Books, 2015.
JENKINS, H.; FORD, S.; GREENE, J. Cultura da conexão. São Paulo: Aleph, 2014.
LAUDON, K.; LAUDON, J. Sistemas de informação gerenciais. 9. ed. São Paulo: Pearson Pren-
tice Hall, 2010.
NUGENT, A. et al. Data science and Big Data computing: frameworks and Methodologies.
Springer International Publishing, 2015.
SANTO DIGITAL. 4 cases para você entender o impacto do Big Data na prática. Disponível em:
https://santodigital.com.br/4-cases-para-voce-entender-o-impacto-big-data-na-pratica/.
Acesso em: 30 ago. 2021.
https://www.ecommercebrasil.com.br/artigos/big-data-o-que-e-como-funciona-e-como-usar-a-favor-da-minha-empresa/
https://www.ecommercebrasil.com.br/artigos/big-data-o-que-e-como-funciona-e-como-usar-a-favor-da-minha-empresa/
https://epocanegocios.globo.com/Tecnologia/noticia/2019/03/conheca-6-aplicacoes-da-internet-das-coisas-que-ja-estao-tornando-o-mundo-melhor.html
https://epocanegocios.globo.com/Tecnologia/noticia/2019/03/conheca-6-aplicacoes-da-internet-das-coisas-que-ja-estao-tornando-o-mundo-melhor.html
26
SOUSA, F. R.C.; MOREIRA, L. O.; MACHADO, J. C. Computação em nuvem: conceitos, tecnolo-
gias, aplicações e desafios. II Escola Regional de Computação Ceará, Maranhão e Piauí (ERCE-
MAPI), p. 150-175, 2009.
SILVEIRA, M.; MARCOLIN, C.; FREITAS, H. O Big Data e seu uso corporativo: uma revisão de li-
teratura, 2015. Disponível em: https://singep.org.br/4singep/resultado/245.pdf. Acesso em: 30
ago. 2021.
TAURION, C. Cloudcomputing-computação em nuvem. Brasport, 2009.
_____. Big Data. Brasport, 2013.
VEJA. Demasiado humano: há 20 anos, Kasparov era esmagado por Deep Blue. Disponível em:
https://veja.abril.com.br/blog/reveja/demasiado-humano-ha-20-anos-kasparov-era-esma-
gado-por-deep-blue/. Acesso em: 30 ago. 2021.
ZARDO, P. As tecnologias digitais e o processo de projeto contemporâneo. Dissertação Mes-
trado em Arquitetura e Urbanismo. Faculdade IMED, 2018. Disponível em: https://www.pas-
seidireto.com/arquivo/89606659/mes-zardo-2018-as-tecnologias-digitais-e-o-processo-de-
-projeto-contemporaneo. Acesso em: 30 ago. 2021.
1 Introdução
2 O que é Big Data?
2.1 Big Data no cotidiano do mercado
3 Tecnologias parceiras do Big Data
3.1 Cloud computing
3.1.1 Cloud computing no cotidiano do mercado
3.2 Inteligência artificial
3.2.2 Inteligência artificial no cotidiano do mercado
3.3 Machine learning
3.4 Internet das coisas (iot)
3.4.1 Internet das coisas no cotidiano do mercado
4 Big Data: um histórico
4.1 Bug do milênio
5 Momento atual dos dados
5.1 Dados estruturados
5.2 Dados não estruturados
5.3 Análise de dados e análise preditiva
5.4 Data science e Data analitycs
5.5 Coletando dados
6 Quarta revolução industrial, Big Data e o impacto no mercado
6.1 Big Data no varejo
6.2 Big data na indústria de transformação
Resumo do curso
Referências