Baixe o app para aproveitar ainda mais
Prévia do material em texto
1Q3033265 Certa Os 5Vs do Big Data referem-se às características que o conceito essencialmente aborda. Qual dos seguintes aspectos representa um dos 5Vs do Big Data? • A Vazão • B Volume • C Variabilidade • D Validade • E Vantagem 2Q3033269 Certa Em relação ao tempo de resposta, o que caracteriza o conceito de latência baixa? • A A quantidade de atraso de tempo que permite a execução de um serviço em um ambiente. • B O suporte tanto de fluxos de dados estruturados quanto de desestruturados. • C A capacidade de transformar dados. • D A capacidade de interpretar os metadados. • E A capacidade de sustentar certo nível de desempenho, mesmo sob cargas crescentes. 3Q3033266 Certa Antes mesmo de serem definidos os 5Vs do Big Data, o conceito foi caracterizado por 3Vs, que eram: • A Volume, Velocidade e Variedade • B Vazão, Verdade e Velocidade • C Verdade, Variabilidade e Volume • D Veracidade, Valor e Velocidade • E Variedade, Veracidade e Valor 4Q3033268 Certa A característica que faz com que o Big Data tenha grande potencial de crescimento, lidando com o aumento exponencial no volume de dados é chamada de: • A Complexidade • B Privacidade • C Acessibilidade • D Diversidade • E Escalabilidade 5Q3033267 Certa Sobre os tipos de Big Data, são exemplos de dados não-estruturados: • A Bancos de dados SQL • B Vídeos • C E-mail • D Tabelas • E Arquivos XML 1Q3033277 Certa O Hive é uma interface de programa de dados para consulta e análise de grandes conjuntos de dados construídos sobre o Apache Hadoop. Assinale a alternativa que aborda uma de suas principais características. • A O Apache Hive é uma ferramenta de monitoramento e análise de desempenho de servidores em ambientes distribuídos de processamento de dados. • B O Apache Hive é uma infraestrutura de armazenamento e consulta de dados, que permite o processamento e análise de dados estruturados armazenados em um sistema distribuído. • C O Apache Hive é um sistema de gerenciamento de bancos de dados NoSQL, otimizado para consultas complexas em grandes volumes de dados em tempo real. • D O Apache Hive é uma linguagem de programação de alto nível, voltada para a análise e visualização de dados em tempo real. • E O Apache Hive é uma biblioteca de algoritmos de aprendizado de máquina, utilizada para treinar modelos em grandes conjuntos de dados distribuídos. 2Q3033279 Certa Os bancos de dados NoSQL surgiram como uma resposta inovadora para lidar com os crescentes desafios de armazenamento e processamento de dados que passaram a existir após a explosão da internet, aplicativos e redes sociais, que demandam cada vez mais tempo de resposta. Assinale a alternativa que apresenta um modelo de dados que faz parte do conceito NoSQL. • A Hierárquico • B Chave-Valor • C Objeto Relacional • D Orientado a Objeto • E Relacional 3Q3033276 Certa O HDFS é otimizado para aplicativos de leitura e gravação de acesso pesado e para tolerância a falhas em ambientes de computação distribuída. Assim, como funciona a sua arquitetura de dados? • A Ela converte os dados não-relacionais em relacionais. • B Ela cria índice de dados e os armazena em bancos de dados relacionais. • C Ela cria metadados para melhor gerenciar os dados. • D Ela divide os dados em blocos e os distribui em diferentes nós de um cluster. • E Ela transforma os dados em pares chave-valor, depois os reagrupam com base na chave para gerar resultados finais. 4Q3033278 Certa Em relação ao Apache Hive, assinale a alternativa que representa um benefício de sua aplicação em um ambiente Big Data. • A Familiaridade com SQL • B Aplicações OLTP com baixa latência • C Processos em SQL altamente complexos • D Dados altamente normalizados • E Consultas realizadas através de alto conhecimento de programação 5Q3033275 Certa Em Big Data, costumamos nos referir a ecossistema como: • A o conjunto de regras que devem ser cumpridas para que a organização seja certificada como uma empresa TI Verde. • B o conjunto de bancos de dados NoSQL disponível na organização. • C os sistemas de informação resultantes de uma arquitetura de tecnologia da informação. • D o conjunto de tecnologias, ferramentas e processos que permitem às organizações manter uma arquitetura de Big Data. • E o conjunto de hardware necessário para fazer uma arquitetura funcionar. 1Q3033274 Certa No processo de gerenciamento de dados uma atividade importante é chamada de expurgo. Na prática, expurgar dados significa: • A Apagar dados obsoletos. • B Transformar dados não relacionais em relacionais para dar carga nos repositórios importantes do Big Data. • C Modificar a tecnologia de armazenamento. • D Realizar importação de dados obsoletos para a base principal de dados. • E Arquivar temporariamente os dados. 2Q3033271 Certa Foi dito que determinada base de dados era composta apenas por dados semiestruturados. Quais são os tipos de arquivos que provavelmente vamos encontrar nela? • A XML, HTML e JSON • B CSV, BSON e Áudios • C Tabelas, planilhas e textos • D Arquivos de bancos de dados NoSQL • E Textos, imagens e vídeos 3Q3033272 Certa Sobre o processo de transformação de dados, está correto afirmar que: • A Pipeline e ETL são processos diferentes. • B O Databricks é uma ferramenta de armazenamento de dados. • C ETL e ELT funcionam do mesmo jeito. • D O Pipeline de dados tem a ver exclusivamente com o descarte dos dados. • E O ETL não está presente em um ecossistema de BI. 4Q3033270 Certa Suponhamos que um analista recebeu a tarefa de carregar uma base de dados com imagens, vídeos e áudios em um Big Data. Nesse caso, estamos falando de dados do tipo: • A Não Relacionais • B Estruturados • C Não Estruturados • D Relacionais • E Semiestruturados 5Q3033273 Certa Qual é a principal diferença entre ETL e ELT? • A O ELT é preferencialmente usado para a construção de Data Warehouse, e não para Big Data. • B O ETL trabalha com dados não relacionais, o ETL com dados relacionais. • C O ETL é o nome em inglês, o ELT é o nome em português. • D O ETL é usado exclusivamente em ecossistemas de Big Data. • E No ETL, transformamos os dados antes de carregar, no ELT, carregamos antes de transformar. 1Q3033281 Certa Qual é a principal vantagem de um Data Lake em comparação com um Data Warehouse? • A Flexibilidade para armazenar dados brutos de vários tipos e sem transformação. • B Suporte apenas a dados numéricos. • C Armazenamento exclusivo de dados estruturados. • D Melhor desempenho de consultas. • E Requer menos espaço de armazenamento. 2Q3033282 Certa Qual é a tecnologia frequentemente usada para processar e analisar dados em um Data Lake? • A Hadoop e Spark. • B Linguagem de consulta SQL padrão. • C Sistemas de gerenciamento de bancos de dados relacionais. • D Bancos de dados não-relacionais. • E Big Data. 3Q3033283 Certa Quais são as principais camadas do Data Lake? • A Camada de acesso e camada de segurança. • B Camada de ingestão e camada de armazenamento. • C Camada de imagens e vídeos. • D Camada física e camada virtual. • E Camada de transformação e camada de análise. 4Q3033280 Certa Uma das estruturas fundamentais de um Big Data é o Data Lake. Assinale a alternativa que o define. • A Uma técnica de processamento de dados. • B Um software específico para análise de dados. • C Um software para armazenamento de dados transacionais. • D Uma API que fornece dados não-relacionais.• E Um repositório de dados estruturados e não estruturados em grande escala. 5Q3033284 Certa Em termos de estratégias na construção de um Data Lake, existem as estratégias conhecidas por Schema-on-Read e Schema-on-Write. Comparando uma abordagem à outra, em que contexto o Schema-on-Read é mais vantajoso? • A Quando precisamos detectar logo os erros. • B Quando precisamos de rapidez na carga dos dados. • C Quando necessitamos de performance em todo o processo. • D Quando precisamos reduzir custos iniciais. • E Quando temos um ambiente complexo.
Compartilhar