Baixe o app para aproveitar ainda mais
Prévia do material em texto
Interações entre Big Data e Cloud Computing Computação em nuvem (Cloud Computing) Bloco 1 Aimar Martins Lopes Introdução • Compreender os fundamentos do Cloud Computing. • Capacitar a analisar os modelos de serviços e implanção de nuvem. • Descrever a relação da computação em nuvem com o Big Data. • Os desafios do Big Data na nuvem. Computação em nuvem (Cloud Computing) • Tudo que pode ser conectado dinamicamente a web service (serviços de web). • Acesso global, mobilidade, infraestrutura, plataforma padronizada, escalabilidade e gerenciamento de serviços. • Um modelo de negócio baseado em tecnologia da informação, que provê serviço pela internet com o uso de hardware e software independente do dispositivo de acesso, localização, escala, etc. Computação em nuvem Fonte: Yuriy Bucharskiy /iStock.com. Figura 1 – Computação em nuvem Modelos de serviços de computação em nuvem • SaaS – Software as a Service, fornecimento de software (aplicações) e dados como serviço na internet. • PaaS – Platform as a Service, fornecimento de plataforma como serviço, estruturas de desenvolvimento de aplicações são disponibilizadas para desenvolvedores construírem novas aplicações. • IaaS – Infrastructure as a Service, os fornecedores, chamados de provedores disponibilizam recursos computacionais, tais como, servidores, armazenamento, software, rede e espaços físicos, que são pagos de acordo com a demanda. Big Data e seus caminhos Fonte: <https://www.lastline.com/blog/how-cloud-computing-enables-and- threatens-organizations-digital-transformation/>. Acesso em: 30 maio 2019. Figura 2 – Computação em nuvem. Diferentes modelos de serviços https://www.lastline.com/blog/how-cloud-computing-enables-and-threatens-organizations-digital-transformation/ Modelos de implantação na nuvem • Nuvem Privada – Infraestrutura instalada remotamente ou local; pode ser alugada ou proprietária, e pode ser gerenciada por terceiros. Toda a infraestrutura é dedicada para uma única organização. • Nuvem Pública – A infraestrutura pertence a quem provêm os serviços para o público em geral, são ofertados por rede pública de comunicação de dados, geralmente internet. MS Azure, serviços de e-mail, Google, AWS – Amazon, etc. • Nuvem Híbrida – Nuvem privada em combinação com a pública, possibilitando um ambiente de vantagem de ambas opções. A relação da computação em nuvem com o Big Data As características do Big Data depende da computação em nuvem. • O Big Data para cumprir seus objetivos requer recursos poderosos, como: • Servidores. • Banco de dados. • Ferramentas de coleta e classificação. • Processo de grande volume. • Variedade de dados em formatos diferentes. • Alta velocidade. As classes do Big Data Figura 3 – As 5 classes do Big Data Fonte: elaborada pelo autor. Fontes de dados Formatos de conteúdo Armazenamento de dados Processamento de dados • Banco de dados local. • Sensores. • IoT. Aprimoramento de dados • Web e rede social. • Transações. • Estruturado. • Não estruturado. • Semiestruturado. • Orientado a coluna. • Orientado a documento. • Chave de valor. • Limpeza. • Processamento / transformação. • Tempo real. • Em lote (batch). • Gráfico. • Normalização. • Armazenamento. Desafios do Big Data • Disponibilidade de recurso. • Escalabilidade. • Privacidade. • Qualidade dos dados. • Variedade dos dados. • Preparação de dados. • Análise de Big Data. • Segurança. Computação em nuvem (Cloud Computing) Bloco 2 Aimar Martins Lopes Computação em nuvem Modelo de computação em nuvem: • IaaS. • PaaS. • SaaS. Implantação: • Nuvem privada. • Nuvem pública. • Nuvem híbrida. Computação em nuvem (Cloud Computing, em inglês), ou simplesmente cloud. Tudo que pode ser conectado dinamicamente de forma onipresente na internet. Computação em nuvem e Big Data O Big Data para cumprir seus objetivos requer uma gama de recursos poderosos, servidores, banco de dados, ferramentas que coletam, classificam e processam grande volume e variedade de dados em formatos diferentes com alta velocidade. Esses recursos são encontrados na computação em nuvem. Figura 4 – As 5 classes do Big Data Fonte: elaborada pelo autor. Fontes de dados Formatos de conteúdo Armazenamento de dados Processamento de dados • Banco de dados local. • Sensores. • IoT. Aprimoramento de dados • Web e rede social. • Transações. • Estruturado. • Não estruturado. • Semiestruturado. • Orientado a coluna. • Orientado a documento. • Chave de valor. • Limpeza. • Processamento / transformação. • Tempo real. • Em lote (batch). • Gráfico. • Normalização. • Armazenamento. Teoria em prática Bloco 3 Aimar Martins Lopes Mineração de dados no Twitter O algoritmo Page Rank foi usado obter rankings de usuários da base do Twitter. Fase 1: rastreamento dos dados nas bases do Twitter. Foi gerado 50 milhões de nós e 1,8 bilhões de bordas. Fase 2: processamento com Page Rank, análise dos dados coletados. Esse é um exemplo de solução relativamente barata para aquisição e análise de dados com o uso de uma infraestrutura de nuvem (HASHEM et al., 2014). Como funciona o Page Rank? Dica do Professor Bloco 4 Aimar Martins Lopes Indicação de filme • Her (EUA, 2013, 126 min). Diretor: Spike Jonze. Aborda uma relação entre seres humanos e robôs. Um homem solitário desenvolve uma relação emocional e pessoal com um sistema de computação, uma assistente virtual. Indicação de artigo Em artigo publicado em 2015 na revista Information Systems, os autores descrevem a relação entre computação em nuvem e Big Data. A força da tecnologia cloud com desempenho escalar e complexo juntamente com o massivo crescimento do Big Data. Referências HASHEM, I. A. T. et al. The rise of “big data” on cloud computing: review and open research issues. Information Systems, n. 47, p. 98-115, 2015. Número do slide 1 Número do slide 2 Introdução Computação em nuvem (Cloud Computing) Computação em nuvem Modelos de serviços de computação em nuvem Big Data e seus caminhos Modelos de implantação na nuvem A relação da computação em nuvem com o Big Data As classes do Big Data Desafios do Big Data Número do slide 12 Computação em nuvem Computação em nuvem e Big Data Número do slide 15 Mineração de dados no Twitter Número do slide 17 Indicação de filme Indicação de artigo Referências Número do slide 21
Compartilhar