Logo Passei Direto
Buscar

integração de dados e data lake

Ferramentas de estudo

Questões resolvidas

Material

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Questões resolvidas

Prévia do material em texto

1 Q3517265 Certa Comumente, costumamos classificar dados por seu tipo ou formato. Especificamente falando em classificação por tipo, podemos dizer que dados podem ser classificados como estruturados, semiestruturados e não-estruturados. No caso dos dados estruturados, assinale a alternativa verdadeira. A Dados estruturados possuem formatos variados e não podem ser organizados em tabelas. Dados estruturados têm uma estrutura rígida e não podem ser facilmente adaptados a diferentes necessidades. SUA RESPOSTA Dados estruturados são altamente organizados em formatos tabulares e podem ser eficientemente armazenados em bancos de dados relacionais. D Dados estruturados são tipicamente desprovidos de metadados, tornando difícil a sua interpretação e análise. E Dados estruturados não podem ser consultados usando linguagens de consulta como SQL, pois não possuem uma organização pré-definida. 2 Q3517267 Certa Dados não estruturados não possuem um formato predefinido e podem incluir uma ampla gama de informações. Quais dos seguintes exemplos são representativos de dados não estruturados? A Uma planilha contendo informações de vendas mensais, organizada em colunas de data, produto e valor. Um banco de dados de estudantes, com informações de nome, idade, endereço e notas em disciplinas. SUA RESPOSTA Um arquivo de áudio contendo uma gravação de uma entrevista com um cliente sobre suas preferências de produto. Um conjunto de registros de transações financeiras em um formato tabular, incluindo datas, valores e categorias. E Uma tabela de dados climáticos, incluindo datas, temperaturas mínimas e máximas e níveis de precipitação. 3 Q3517269 Certa Dados semiestruturados são aqueles que possuem alguma forma de organização, mas não seguem uma estrutura rígida de tabelas como nos dados estruturados. Qual dos seguintes exemplos melhor representa um dado semiestruturado? A Um arquivo de texto contendo uma lista de nomes de clientes e suas compras, organizados em colunas. Um banco de dados de estudantes, com informações de nome, idade, endereço e notas em disciplinas. Um conjunto de registros de transações financeiras em um formato tabular, incluindo datas, valores e categorias. SUA RESPOSTA D Um documento XML contendo informações sobre produtos, incluindo detalhes de descrição, preço e disponibilidade. E Um arquivo de áudio contendo uma gravação de uma reunião de equipe, com falas dos participantes. 4 Q3517310 Certa Basicamente existem dois tipos de pipelines, os de fluxo e de lote. Qual das seguintes afirmações é verdadeira em relação às diferenças entre pipelines de fluxo e de processamento em lote? Pipelines de fluxo são mais adequados para processar grandes volumes de dados de uma vez, enquanto pipelines de processamento em lote são mais eficazes A para dados em tempo real. Pipelines de processamento em lote processam dados de forma contínua e em tempo real, enquanto pipelines de fluxo processam dados em lotes periódicos. Pipelines de fluxo e de processamento em lote são termos intercambiáveis, referindo-se ao mesmo tipo de processamento de dados. Pipelines de fluxo envolvem processamento de dados em tempo real, à medida que são gerados, enquanto pipelines de processamento em lote processam D dados em intervalos definidos. Pipelines de processamento em lote são mais indicados para cenários onde a latência é crítica, enquanto pipelines de fluxo são mais adequados para análises E complexas de dados históricos.5 Q3517357 Errada Um Pipeline de Dados pode ser dividido em 5 partes. Assinale a alternativa que não integra esse fluxo de dados. A Ingestão SUA RESPOSTA Seleção de data sources RESPOSTA CORRETA D Implementação de segurança dos dados E Visualização de dados 6 Q3517358 Certa Qual é a principal vantagem do uso de um Data Lake em comparação com um Data Warehouse? A Data Lakes oferecem melhor desempenho para consultas complexas. Data Lakes armazenam dados estruturados de maneira mais eficaz. Data Lakes exigem menos recursos de armazenamento em nuvem. SUA RESPOSTA D Data Lakes não requerem configuração prévia ou gerenciamento de esquemas. E Data Lakes são mais adequados para análise em tempo real. 7 Q3517360 Certa A governança envolve a definição de diretrizes para gerenciar e proteger dados ao longo de todo O ciclo de vida, desde a coleta até descarte. Quando se trata da governança de dados, qual é um desafio comum associado a Data Lakes? A Data Lakes oferecem esquemas fixos e rígidos para todos tipos de dados. Data Lakes não suportam metadados ou catalogação de informações. Data Lakes frequentemente armazenam apenas dados estruturados. SUA RESPOSTA D Data Lakes podem resultar em falta de controle sobre a qualidade e a origem dos E Data Lakes são mais suscetíveis a falhas de segurança do que Data Warehouses. 8 Q3517362 Certa Analise as afirmações abaixo e marque a correta em relação às características dos Metadados. A Metadados são dados não estruturados armazenados em um Data Lake. SUA RESPOSTA Metadados são as informações sobre dados, como origem, significado e estrutura. Metadados são transformações automáticas aplicadas aos dados antes de serem armazenados. D Metadados são estruturas de dados apenas relevantes para Data Warehouses, não para Data Lakes. E Metadados referem-se a dados duplicados armazenados em um Data Lake.9 Q3517365 Certa As regulamentações em torno dos dados representam um importante ponto de atenção quando trabalhamos com Big Data. Sobre a importância da LGPD (Lei Geral de Proteção de Dados) em relação aos Data Lakes, assinale a questão verdadeira. A A LGPD não se aplica a Data Lakes, apenas a Data A LGPD exige que todos dados em um Data Lake sejam tornados públicos. A LGPD não tem relação com a proteção de dados em ambientes de Data SUA RESPOSTA D A LGPD é importante para garantir a privacidade e a segurança dos dados pessoais armazenados em um Data Lake. E A LGPD é uma regulamentação que incentiva compartilhamento indiscriminado de dados em Data Lakes. 10 Q3517368 Errada Quais são as principais diferenças entre as estratégias Schema-on-Read (Esquema na Leitura) e Schema-on-Write (Esquema na Escrita) em relação ao processamento de dados? requer que dados sejam transformados e estruturados antes de serem armazenados, enquanto Schema-on-Write permite armazenar A dados em seu formato original. Schema-on-Read é ideal para armazenar dados em Data Warehouses, enquanto Schema-on-Write é mais adequado para Data Lakes. RESPOSTA CORRETA requer que dados sejam armazenados sem nenhuma estrutura prévia, enquanto Schema-on-Write exige a definição de esquemas rígidos antes da ingestão de Schema-on-Read é uma estratégia de processamento que não requer a definição de metadados, enquanto Schema-on-Write depende fortemente de D metadados. SUA RESPOSTA E Schema-on-Read é mais rápido e eficiente, enquanto Schema-on-Write oferece maior flexibilidade para análises posteriores.

Mais conteúdos dessa disciplina