Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
Prova Impressa GABARITO | Avaliação II - Individual (Cod.:1526003) Peso da Avaliação 2,00 Prova 109452529 Qtd. de Questões 10 Acertos/Erros 9/1 Nota 9,00 Os bancos de dados orientados a grafos são projetados para modelar e explorar relacionamentos complexos entre entidades, utilizando uma estrutura de nós e arestas. Esse modelo é especialmente eficaz em aplicações que requerem uma compreensão profunda das conexões entre dados, como redes sociais, sistemas de recomendação e análise de redes. A escalabilidade e a eficiência na navegação pelas relações tornam esse tipo de banco de dados ideal para cenários em que a análise de conexões é central.Com base nas características dos bancos de dados orientados a grafos, assinale a alternativa correta: A Bancos de dados orientados a grafos são aplicáveis apenas a dados estruturados, como planilhas e tabelas. B Bancos de dados orientados a grafos utilizam uma estrutura em tabelas, similar ao modelo relacional, para representar conexões entre dados. C A escalabilidade é limitada em bancos de dados orientados a grafos, o que os torna inadequados para grandes conjuntos de dados interconectados. D Em bancos de dados orientados a grafos, apenas nós representam entidades, enquanto arestas não desempenham nenhum papel na modelagem. E A linguagem Cypher é usada em bancos de dados orientados a grafos para facilitar a expressão de consultas que exploram relações complexas entre entidades. No cenário de processamento de Big Data, em que volumes massivos de informações precisam ser analisados de forma eficiente, o MapReduce surge como um paradigma de programação fundamental. Criado pelo Google, esse modelo simplifica o desenvolvimento de aplicações distribuídas, permitindo o processamento paralelo de grandes conjuntos de dados em clusters de computadores.Considerando o algoritmo de MapReduce, avalie as asserções a seguir e a relação proposta entre elas:I. No processamento paralelo e distribuído tradicional, o conjunto de dados era dividido em partes menores para que fossem armazenados em máquinas diferentes. Essa abordagem gerava desafios que foram superados pelo MapReduce. PORQUE II. Com o MapReduce, esses desafios são superados, tendo em vista que ele permite computação paralela e distribuída sem a necessidade de cuidar de problemas como confiabilidade, tolerância a falhas.A respeito dessas asserções, assinale a opção correta: A As asserções I e II são verdadeiras, e a II é uma justificativa correta da I. B A asserção I é uma proposição verdadeira, e a II é uma proposição falsa. C As asserções I e II são falsas. D As asserções I e II são verdadeiras, mas a II não é uma justificativa correta da I. VOLTAR A+ Alterar modo de visualização 1 2 14/11/2025, 09:45 Avaliação II - Individual about:blank 1/5 E A asserção I é uma proposição falsa, e a II é uma proposição verdadeira. O Big Data é definido por seus principais componentes, conhecidos como as três dimensões "V": volume, relacionado à escala massiva de dados gerados diariamente; velocidade, que reflete a taxa em que os dados são gerados e processados em tempo real; e variedade, que destaca a diversidade de formatos e tipos de dados. Além dessas dimensões, conceitos como veracidade (confiabilidade dos dados) e valor (extração de insights) são fundamentais para explorar o potencial transformador do Big Data em diferentes setores.Com base no texto, sobre os componentes do Big Data, analise as afirmativas a seguir:I. O componente de volume está relacionado à confiabilidade dos dados em sistemas computacionais. II. A velocidade no Big Data refere-se à taxa de geração e processamento de dados, permitindo decisões em tempo real. III. A variedade destaca a diversidade de formatos e tipos de dados, incluindo texto, imagens e vídeos. IV. Veracidade e valor são dimensões complementares que destacam a confiabilidade dos dados e a extração de insights significativos.É correto o que se afirma em: A I e II, apenas. B I, II e III, apenas. C I, III e IV, apenas. D II e III, apenas. E III e IV, apenas. O particionamento de dados é uma técnica elementar que visa quebrar um vasto volume de informações em segmentos menores e mais fáceis de administrar, conhecidos como partições. Essa abordagem não só acelera a execução de consultas, mas também simplifica a dispersão dos dados por diversos servidores, resultando em uma utilização mais eficiente dos recursos e uma maior robustez do sistema.Considerando os tipos de particionamento, qual deles cria subtabelas derivadas de uma central? A Particionamento dimensional. B Particionamento lateral. C Particionamento funcional. D Particionamento vertical. E Particionamento horizontal. Para superar os desafios inerentes ao gerenciamento de grandes volumes de dados e otimizar o desempenho de sistemas distribuídos, diversas estratégias de particionamento foram desenvolvidas. A escolha da estratégia correta é fundamental e depende de fatores como o padrão de acesso aos dados, 3 4 Revisar Conteúdo do Livro 5 14/11/2025, 09:45 Avaliação II - Individual about:blank 2/5 os requisitos de escalabilidade e as características específicas da aplicação.Considerando as estratégias de partição, avalie as asserções a seguir e a relação proposta entre elas:I. A estratégia de intervalos de particionamento utiliza-se de algoritmos de hash, e pode ter como exemplo uma lista de pedidos ordenada por país. PORQUE II. A estratégia de lista de particionamento utiliza-se de intervalos consecutivos de valores, e pode ter como exemplo um intervalo de uma tabela particionada por data.A respeito dessas asserções, assinale a opção correta: A A asserção I é uma proposição falsa, e a II é uma proposição verdadeira. B As asserções I e II são verdadeiras, e a II é uma justificativa correta da I. C As asserções I e II são verdadeiras, mas a II não é uma justificativa correta da I. D A asserção I é uma proposição verdadeira, e a II é uma proposição falsa. E As asserções I e II são falsas. O MapReduce é um modelo de programação projetado para processar grandes conjuntos de dados em paralelo, distribuindo o trabalho por um cluster de computadores. Sua força reside na simplicidade de duas funções principais: Map e Reduce, que trabalham em conjunto para transformar e agregar dados de forma eficiente.Fonte: COULOURIS, G. et al. Sistemas distribuídos. 5. ed. Porto Alegre: Bookman, 2013.Considerando as funções principais (Map e Reduce), sobre o funcionamento de uma delas, assinale a alternativa correta: A Na função reduce(), os valores são classificados utilizando uma tabela-padrão com todos os resultados finais ordenados pela chave aleatória e que sejam agrupados. B A função map() é responsável por receber um conjunto de pares chave-valor como entrada e produzir um conjunto de pares chave-valor intermediários como saída. C A função reduce() é responsável por receber um conjunto de pares chave-valor como entrada e produzir uma tabela associativa como saída. D A função reduce() tem como responsabilidade realizar o processamento de uma tabela de entradas para produzir uma lista de valores, de forma que fiquem prontos para serem combinados em fusão. E A função map() é responsável por receber um conjunto de pares chave-valor como entrada e produzir uma tabela associativa como saída. Os bancos de dados orientados a colunas oferecem uma abordagem diferenciada para o armazenamento e recuperação de grandes volumes de dados, organizando as informações em colunas ao invés de linhas. Esse tipo de estrutura favorece o processamento de consultas analíticas, particularmente em ambientes de Big Data. Além disso, alguns bancos de dados orientados a colunas, como o Apache Cassandra, são conhecidos por suas características específicas, como a capacidade de operar de forma distribuída e a adaptação a grandes volumes de dados, o que os torna ideais para aplicações que exigem alta disponibilidade e flexibilidade.Fonte: SILVA, L. F. C. et al. Banco de dados não relacional. Porto Alegre: SAGAH, 2021Sobre bancos de dados orientados a colunas e o Apache Cassandra, analise as afirmativas a seguir:I. Bancos de dados orientados a colunas são mais indicados para análises de grandes volumes de dados, pois permitem a recuperação rápida de subconjuntos específicos em vez de linhas inteiras. II. O Apache Cassandra foi projetado para garantir a escalabilidade horizontal e alta disponibilidade 6 7 14/11/2025, 09:45 Avaliação II - Individual about:blank 3/5 em ambientes distribuídos, facilitando a recuperação de dados mesmo em cenários de falha. III. Bancos de dados orientados a colunas limitam a capacidade de adaptar o esquema, pois cada linha deve ter o mesmo conjunto de colunas, o que é diferente dos bancos relacionais. IV. A arquitetura do Apache Cassandra garante uma estrutura centralizada, focada em um ponto único de falha, para melhorar o desempenho em grandes plataformas on-line.É correto o que se afirma em: A I, II, III e IV. B III e IV, apenas. C I, II e III, apenas. D I e II, apenas. E II e IV, apenas. O armazenamento de grandes volumes de dados, conhecido como Big Data, envolve a gestão eficiente de quantidades massivas de informações, que variam em tipos e exigem processamento ágil. O Big Data é caracterizado por múltiplos componentes que influenciam a forma como os dados são armazenados, processados e utilizados. Esses componentes abordam tanto a escala e a diversidade dos dados quanto a velocidade com que são gerados e analisados. O objetivo final é possibilitar o uso desses dados para gerar insights valiosos, otimizando processos de decisão e inovação.Fonte: SILBERSCHATZ, A. Sistema de banco de dados. Rio de Janeiro: GEN; LTC, 2020.Com base nos fundamentos do Big Data, assinale a alternativa correta: A A variedade no Big Data limita-se ao armazenamento de dados exclusivamente estruturados, como tabelas e planilhas. B O conceito de Big Data refere-se apenas à capacidade de armazenar dados estruturados em grandes volumes, com baixa diversidade de formatos. C O conceito de valor no Big Data significa que todos os dados gerados têm um impacto significativo e devem ser armazenados e processados. D Velocidade no contexto do Big Data indica a necessidade de uma taxa alta de transmissão e análise de dados, como ocorre em sistemas em tempo real. E Veracidade no Big Data refere-se à quantidade total de dados armazenados, sem considerar sua confiabilidade. O particionamento de dados é uma técnica bastante utilizada para unificar recursos distribuídos, garantindo consistência em bases de dados que estão divididas entre diferentes dispositivos físicos.Considerando o uso do particionamento de dados, sobre os benefícios do uso, analise as afirmativas a seguir:I. Melhorar o desempenho do acesso aos dados. II. Fazer correspondência de diferentes repositórios de dados sem definir padrão. III. Regredir a escalabilidade. IV. Fornecer flexibilidade operacional. V. Minimizar a disponibilidade dos dados em uma organização.É correto o que se afirma em: A I e II, apenas. B IV e V, apenas. 8 9 14/11/2025, 09:45 Avaliação II - Individual about:blank 4/5 C III e V, apenas. D I e IV, apenas. E II e III, apenas. Ferramentas como o Apache Hadoop desempenham um papel crucial na era do Big Data, oferecendo soluções para o processamento de grandes volumes de dados em ambientes distribuídos. Utilizando o modelo MapReduce, desenvolvido pela Google, o Hadoop divide tarefas complexas em operações menores, distribuindo-as em clusters de computadores. O MapReduce consiste em duas etapas principais: a função "Map", que transforma dados em pares chave-valor intermediários, e a função "Reduce", que combina esses pares com base em suas chaves, simplificando o processamento paralelo em grandes volumes de dados.Sobre o modelo de programação MapReduce, assinale a alternativa correta: A Consiste apenas na etapa de combinação de resultados intermediários, conhecida como "Reduce". B Realiza o processamento distribuído apenas em pequenos volumes de dados. C É aplicado exclusivamente no Apache Hadoop, sem utilidade em outras ferramentas ou sistemas. D Divide tarefas complexas em operações menores que podem ser executadas em paralelo em clusters de servidores. E É um modelo proprietário da Google, exclusivo para indexação de motores de busca. 10 Imprimir 14/11/2025, 09:45 Avaliação II - Individual about:blank 5/5