Logo Passei Direto
Buscar
Material
páginas com resultados encontrados.
páginas com resultados encontrados.

Prévia do material em texto

Tema 50: Big DataBig DataBig Data refere-se ao conjunto de dados tão grandes, complexos e 
volumosos que não podem ser processados por métodos tradicionais de gerenciamento de 
dados. Esses dados podem vir de diversas fontes, como transações financeiras, redes sociais, 
dispositivos IoT (Internet das Coisas), registros médicos, entre outros. A análise de Big Data 
permite às empresas e organizações extrair informações valiosas, descobrir padrões e tomar 
decisões mais informadas.Características de Big Data (As 3 Vs)VolumeO volume refere-se à 
quantidade de dados gerados e armazenados. Com o avanço da tecnologia e o aumento do 
número de dispositivos conectados à internet, a quantidade de dados disponíveis cresce 
exponencialmente. 
Exemplo: Grandes empresas como Amazon e Google coletam e processamterabytes de dados a 
cada minuto, de transações de usuários, interações e pesquisas realizadas.VelocidadeA 
velocidade refere-se à rapidez com que os dados são gerados e precisam ser processados. Em 
muitas situações, como transações financeiras e informações de sensores em tempo real, a 
análise deve ocorrer rapidamente para garantir decisões ágeis. Exemplo: Em um mercado 
financeiro, é fundamental processar e analisar dados em tempo real para identificar tendências e 
responder a mudanças de forma rápida. 
VariedadeA variedade diz respeito aos diferentes tipos de dados que podem ser analisados. Isso 
inclui dados estruturados (como tabelas de banco de dados) e não estruturados (como vídeos, 
posts em redes sociais, imagens e textos).Exemplo: Dados de uma campanha de marketing 
podem incluir registros de vendas (dados estruturados) e também interações nas redes sociais 
(dados não estruturados). Tecnologias e Ferramentas Usadas em Big Data 
HadoopO Hadoop é uma estrutura de software de código aberto que permite o processamento e 
armazenamento de grandes volumes de dados distribuídos. Ele utiliza a arquitetura de "map-
reduce", dividindo os dados em blocos menores para processamento paralelo. 
Exemplo: O Hadoop é amplamente utilizado por empresas como Yahoo, Facebook e LinkedIn 
para armazenar e processar grandes quantidades de dadosSparkO Apache Spark é uma 
plataforma de processamento de dados em grande escala que oferece processamento em 
memória, o que torna os processos muito mais rápidos em comparação com o Hadoop. Ele é 
ideal para análise de dados em tempo real.Exemplo: O Spark é usado por empresas como Uber 
e Netflix para analisar dados em tempo real e fornecer recomendações aos usuários. 
Questões de múltipla escolha sobre Big Data 
1. Qual das características de Big Data se refere à quantidade de dados gerados e 
armazenados? 
A) Velocidade 
B) Variedade 
x C) Volume 
D) Vantagem 
2. Qual ferramenta de Big Data permite o processamento e armazenamento de grandes 
volumes de dados distribuídos? 
A) Spark 
B) SQL 
x C) Hadoop 
D) Excel

Mais conteúdos dessa disciplina