Buscar

Conteúdo Interativo2

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 11 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 11 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 11 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Disciplina: Banco de Dados Avançado
Aula 1: Fundamentos do Big Data
Apresentação
Nesta aula, compreenderemos os fundamentos da área de Ciência de Dados. Essa é a área mais recente dentro de Banco de
Dados. Conceitos de muitas áreas distintas são necessários para o trabalho do pro�ssional da área, que é o analista de
dados ou cientista de dados. O objetivo da aplicação das técnicas sobre os dados é gerar conhecimento para tomadas de
decisões.
O segundo tópico da aula aborda o motivo do surgimento da tecnologia Big Data, não tendo ela apenas a �nalidade de
armazenar mais dados, pois o simples armazenamento não possibilita o conhecimento necessário planejado e necessário
aos tomadores de decisão. A tecnologia Big Data também possui técnicas para agilizar a análise e levantamento de
possíveis padrões sobre os dados. Serão discutidos também os tipos de usos do Big Data nas empresas.
Objetivos
Identi�car a tecnologia Big Data;
Reconhecer as propriedades que caracterizam as dimensões da tecnologia Big Data;
Analisar os tipos de aplicações e a utilização da tecnologia nas empresas.
Premissa
A disponibilização de hardwares avançados e recursos de redes como a internet tem possibilitado o armazenamento de dados
em diferentes formatos, dentre eles:
Textos Vídeos Músicas Imagens
 
 
Como consequência, o volume de dados disponível para uso da sociedade e empresas
não para de crescer.
 
 
Porém, mesmo com esses dados disponíveis, é possível fazer uso deles de uma forma rápida, analisando-se realmente o que é
relevante para cada consumidor?
Outra questão é: humanos podem processar dados da mesma forma como faziam em décadas anteriores?
Essas são perguntas que motivaram o desenvolvimento de pesquisas na busca de soluções e�cientes para o armazenamento e
processamento de dados massivos ou em grandes volumes.
Fundamentos de Ciência de Dados
A Ciência de Dados é conjunto de técnicas de banco de dados, estatística, algoritmos
de mineração de dados, inteligência arti�cial, linguagens de script, programação e Big
Data para extrair informações relevantes a partir dos dados brutos ou originais.
O pro�ssional dessa área executa o processamento de
grandes quantidades de dados, tanto nos dados das empresas
onde trabalham como nos dados disponíveis na nuvem.
Assim, o cientista de dados deve possuir competência para
capturar e analisar a qualidade de dados, padronizar e
organizar, para depois analisar os dados, extraindo padrões
que possam ser analisados por especialistas ou
compreendidos para uso em processo de tomada de decisão
nas organizações.
 (Fonte: Monkey Business Images / Shutterstock).
Importância do Big Data
Em termos de importância, Big Data descreve os grandes volumes de dados, incluindo os dados estruturados e os não
estruturados. Tais dados são gerados e armazenados nas empresas diariamente, além de sobrecarregá-las em relação à
necessidade de espaço para armazenamento e às di�culdades para a geração de conhecimento.
É importante destacar que tais grandes volumes de dados excedem o volume
tradicionalmente tratado pelos sistemas gerenciadores de bancos de dados relacionais. Mas
não é a quantidade de dados disponível o que mais importa. O importante é o que pode ser
feito com esses dados.
Com a aplicação da tecnologia, algumas vantagens podem ser obtidas. Destacam-se:
 (Fonte: mamanamsai / Shutterstock)
Redução do total de custos de
investimento
Para aumentar o valor do patrimônio e o consequente
faturamento da empresa, é de vital importância saber como
usar os recursos �nanceiros de uma forma inteligente. As
análises realizadas com Big Data podem facilitar a observação
dos maiores gastos, comparando-se com os lucros obtidos.
 (Fonte: Bakhtiar Zein / Shutterstock)
Economia de tempo em
marketing
A ampliação da carteira de novos clientes também se torna
mais rápida e precisa. Com a aplicação de algoritmos sobre
grandes bases de dados, pode-se identi�car o per�l de
consumidores e desenvolver ações direcionadas para atingir
determinado nicho de clientes.
Assim, os custos serão menores e é mais e�caz o impacto no
aumento do número de vendas, ou seja, pode-se garantir ao
mesmo tempo maior retorno e também uma maior economia.
 (Fonte: Vetreno / Shutterstock)
Economia nos custos
operacionais da empresa
É comum com a economia gerada pela redução de custos nos
setores da empresa, a partir do nível de chão de fábrica até os
níveis mais altos, como o operacional e o nível executivo, que
se possa obter uma redução nos custos operacionais da
empresa através da identi�cação dos pontos que consomem
mais tempo e necessitam de mais pessoal para o trabalho na
linha de produção. Em consequência, há uma melhora no
controle dos gastos da empresa.
A tecnologia passou a ser muito conhecida por especialistas e
pela sociedade como um todo.
 (Fonte: Macrovector / Shutterstock)
Tomada de decisões mais
inteligentes
Há vantagens de se utilizar Big Data para tomar decisões
assertivas, quando se trata de custos operacionais, entre elas
a diminuição do custo de aquisição do cliente (CAC).
Tipos de usos do Big Data nas empresas
O Big Data, combinado com Inteligência Analítica, permite a realização de análises avançadas e que muito podem contribuir para
o sucesso de um negócio. Alguns tipos de usos possibilitados por essa combinação são:
Aproximadamente 10% das solicitações de pagamentos de seguros as companhias do setor são fraudulentas.
Números impressionantes de até trilhões de dólares estão envolvidos nessas fraudes. A análise de dados realizada
com Big Data pode ser usada para detectar essas tentativas. Dados históricos como o tempo das apólices, as
solicitações médicas, os honorários pagos aos advogados, os dados demográ�cos, as gravações de call centers,
entre outros, permitem uma melhor condição para a realização das análises e previsão de comportamentos
suspeitos.
Detectar tentativas de fraudes
A construção e o uso de grandes bases de dados por parte do governo em seus diversos níveis abrem um campo
amplo de uso e aplicações de inteligência analítica com base em Big Data. Isso permite um avanço signi�cativo em
relação ao modo de gestão dos serviços públicos. Com o “governo digital” e o processamento eletrônico de
documentos, pois os órgãos de �scalização podem acompanhar automaticamente, identi�cando, assim, atividades
suspeitas que indiquem indícios de atos de corrupção, lidando com mais recursos legais para sua atuação e posterior
autuação. Mas, ainda que o uso do Big Data traga muitas vantagens, os órgãos governamentais também devem lidar
com questões de transparência de dados e se preocupar com a privacidade de dados dos contribuintes.
Órgãos Governamentais
A construção de relacionamentos com os clientes é fundamental para o sucesso do setor de varejista. Uma forma de
melhorar o gerenciamento é através da tecnologia baseada no Big Data. Para tal, os varejistas necessitam identi�car
a melhor forma de abordar os clientes, o modo mais e�caz de lidar com transações e o modo mais estratégico,
visando o aumento do número de negócios gerado. O Big Data é a tecnologia adequada para essa necessidade.
Setor de varejo
Os dados produzidos pelos sensores de calor, volume, umidade, entre outros, podem ser usados para prevenir falhas
em equipamentos ou estruturas. Como o volume de dados gerado é normalmente elevado, a tecnologia Big Data
agiliza a análise dos dados históricos, prevenindo ações com base nas ocorrências anteriores.
Determinar a causa de falhas, problemas e defeitos em
tempo real
A partir dos dados que o Big Data pode fornecer, o setor da indústria manufatureira pode aumentar a qualidade e a
quantidade de seus produtos ao mesmo tempo que diminui o desperdício de tempo e material. Os processos têm
que ser constantemente avaliados e revisados para um mercado altamente competitivo de hoje. Mais e mais
fabricantes estão trabalhando em uma cultura baseada em inteligência analítica. Isso signi�ca que eles podem
resolver problemas mais rapidamente e tomar decisões denegócio mais ágeis, saindo na frente de seus
concorrentes.
Indústria manufatureira
Algumas empresas que usam a velocidade do Big Data oferecem produtos, presencialmente ou pela rede, para seus
clientes de acordo com seu histórico de compras anteriores.
Geração de descontos nos pontos de venda para clientes
cadastrados com base em hábitos de compra
Com grandes quantidades de dados sendo enviadas e recebidas de diversas fontes, os sistemas bancários podem
ter maiores condições de encontrar novas formas de gerenciar seus bancos de dados com Big Data, considerando a
importância do atendimento aos clientes e buscando aumentar o seu nível de satisfação. O banco, por sua vez,
precisa diminuir os riscos e fraudes, como conceder um limite de crédito para um cliente com um histórico regular.
Assim, pode recalcular carteiras de riscos completas dos clientes de uma forma rápida, podendo ainda acompanhar
a legislação com a preocupação de manter suas atividades de acordo com a conformidade regulatória.
Setor Bancário
O Big Data pode ser usado em análise para a obtenção de conhecimento que podem levar a
tomadas de decisões e formulação de melhores e ações estratégicas de negócio.
O conceito ganhou força em 2001, quando o pesquisador Doug Laney articulou a de�nição da tecnologia em três propriedades ou
dimensões, ou simplesmente “3 Vs”:
Ao especi�car cada uma dessas dimensões, temos:
VOLUME
Dimensão em que as organizações buscam, selecionam e armazenam dados de diferentes fontes, como transações bancárias,
mídias de entretenimento e sociais, dados de sensores ou internet das coisas.
Tecnologias como Hadoop permitem a implementação e o gerenciamento da estrutura necessária para a resolução do trabalho
com tal quantidade de dados. Considera-se que os limites de volumes de dados trabalhos em Big Data sejam entre terabytes
(1012 bytes) ou petabytes (1015 bytes) até exabytes (1018 bytes).
Além disso, não podemos esquecer que a quantidade de dados aumentou muito graças aos
dispositivos móveis (smartphones) e pelo uso de mensagens de texto em vez de ligações
telefônicas. Outros exemplos são os sites de streaming de música.
Exemplo
Veja um exemplo <galeria/aula1/anexo/a01_13_01.pdf> que mostra a dimensão volume e sua aplicação.
VELOCIDADE
Dimensão em que a integração entre as aplicações e a velocidade de transmissão (banda) permite o �uxo constante de dados.
Exemplos de aplicações são os sensores de dados e medições automáticas, que provocam a necessidade do tratamento de
dados praticamente em tempo real. Processos de ETL (extração, transformação e carga) necessitam ser automáticos e voltadas
para grandes quantidades de dados. Não podem ser realizados como eram nas tecnologias anteriores, que envolviam bancos de
dados.
VARIEDADE
Dimensão formada por uma variedade de formatos para os dados que são armazenados nos bancos de dados — de modo que
possam ser usados dados estruturados, como os mantidos nos bancos de dados relacionais, e os dados não estruturados
(documentos de texto, e-mail, vídeo, sons em seus diversos formatos etc.). A tecnologia deve permitir o trabalho
independentemente do formato submetido ao sistema gerenciador.
Atenção
http://estacio.webaula.com.br/cursos/go0098/galeria/aula1/anexo/a01_13_01.pdf
Com a evolução do uso do Big Data, outros “Vs” além de Volume, Velocidade e Variedade, descritos anteriormente, foram
surgindo para melhor caracterizar a tecnologia ou atualizar seus conceitos.
Podem ser listadas mais duas dimensões:
VARIABILIDADE
Além das crescentes velocidade e variedade dos dados, seus �uxos podem ser altamente inconsistentes com picos de período
em período.
Por exemplo, o acompanhamento das redes sociais permite a previsão de novos fatos relevantes para a sociedade, como nas
eleições. Porém, acompanhar de uma forma tradicional pode ser uma tarefa difícil, pois, todos os dias, novos dados são gerados
por eventos particulares em diferentes formatos, como os dados não estruturados.
COMPLEXIDADE
Os dados de hoje vêm de múltiplas fontes, o que torna difícil a criação de um relacionamento entres essas fontes, como combinar
os dados, efetuar a limpeza dos dados, sua padronização e a posterior formatação de acordo com os padrões dos sistemas.
Embora essa atividade seja comum, há a necessidade de se criar uma conexão e correlacionar relações, hierarquias e seus
múltiplos relacionamentos. Essa pode ser uma tarefa complexa, mas que pode ser facilitada com o uso das ferramentas
presentes na tecnologia Big Data.
Atividade
1. Assista ao vídeo Big Data e análise de dados: como são aplicados e porque são o futuro (veja em “referências”) disponível e
analise as vantagens obtidas com a implementação da solução baseada no Big Data. Em seguida, descreva de forma sucinta
como o Big Data pode ser utilizado.
2. Cite e descreva de forma resumida as propriedades ou dimensões que caracterizam as dimensões da tecnologia Big Data,
começando pelos mais comuns ou iniciais.
3. Faça uma pesquisa sobre o caso de uso de aplicação de Big Data na UPS. Procure pelo título do estudo “Big Data Delivers Big
Results at UPS - UPS Pressroom” <https://pressroom.ups.com/pressroom/ContentDetailsViewer.page?
ConceptType=Speeches&id=1426415450350-355> e solicite a tradução da página para o português, se necessário. Avalie, de
forma sucinta, como a tecnologia Big Data ajudou na solução do problema.
Referências
BENGFOR, B.; KIM, J. Analítica de dados com Hadoop: uma introdução para cientistas de dados. 1. ed. São Paulo: Novatec, 2016.
HURWITZ,J.; NUGENT,A.; HALPER,D. ; KAUFMAN, M. Big Data para leigos. Col. Para Leigos. 1. ed. Rio de Janeiro: Alta Book, 2015.
https://pressroom.ups.com/pressroom/ContentDetailsViewer.page?ConceptType=Speeches&id=1426415450350-355
ELMASRI,R.; NAVATHE. Sistemas de banco de dados. 6 ed. São Paulo: Pearson Education, 2012.
Próxima aula
Principais tecnologias para a aplicação de Big Data;
Características do framework MapReduce / Hadoop;
Arquitetura e vantagens da tecnologia Hadoop.
Explore mais
Assista aos vídeos:
Big Data e análise de dados: como são aplicados e por que são o futuro
<https://www.infomoney.com.br/negocios/inovacao/noticia/7403487/big-data-analise-dados-como-sao-aplicados-porque-
sao-futuro> ;
EMC – o big data transforma os negócios. <https://brazil.emc.com/collateral/demos/microsites/mediaplayer-video/big-
data-transform-business.htm>
https://www.infomoney.com.br/negocios/inovacao/noticia/7403487/big-data-analise-dados-como-sao-aplicados-porque-sao-futuro
https://brazil.emc.com/collateral/demos/microsites/mediaplayer-video/big-data-transform-business.htm

Outros materiais