Buscar

REVISÃO_AV1_BANCO_DE_DADOS_AVANÇADO

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 45 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 45 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 45 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

1a Questão 
 
Marque a opção que apresenta o conjunto correto de dimensões Big Data: 
 
 
Volume, variedade, estabilidade e complexidade 
 
Velocidade, variedade, variabilidade e simplicidade 
 
Estabilidade, velocidade, variedade e complexidade 
 
Volume, velocidade, variedade, previsibilidade e simplicidade 
 Volume, velocidade, variedade, variabilidade e complexidade 
Respondido em 05/09/2019 10:38:04 
 
 
Explicação: 
Com a evolução do uso do Big Data, outros ¿Vs¿ além do Volume, Velocidade e Variedade 
descritos anteriormente, foram surgindo para melhor caracterizar a tecnologia ou atualizar 
seus conceitos. Podem ser listadas mais duas dimensões a Variabilidade e a Complexidade. 
 
 
 
 
 2a Questão 
 
Em relação ao volume de dados trabalhado em Big Data, em termos de medidas, o 
intervalo pode variar de: 
 
 
Gigabytes - Terabytes 
 
Petabytes - Exabytes 
 Terabytes - Exabytes 
 
Megabytes - Gigabytes 
 
Acima de exabytes, somente 
Respondido em 05/09/2019 10:38:16 
 
 
Explicação: 
Considera-se que os limites de volumes de dados trabalhados em Big Data sejam entre 
terabytes (1012 bytes) ou petabytes (1015 bytes) até exabytes (1018 bytes). 
 
 
 
 
 3a Questão 
 
Assinale a alternativa que apresenta uma opção que justifica o aumento da quantidade de 
dados na sociedade, exceto: 
 
 
Bancos de vídeos 
 
Disponibilização de hardwares avançados 
 
Sistemas de músicas on-line 
 
Bases de imagens 
 Todas as opções estão corretas 
Respondido em 05/09/2019 10:39:21 
 
 
Explicação: 
A disponibilização de hardwares avançados e recursos de redes como a internet, tem 
possibilitado o armazenamento de dados em diferentes formatos: textos, vídeos, músicas, 
imagens, etc. Como consequência, o volume de dados disponível para uso da sociedade e 
empresas não para de crescer. 
 
 
 
 
 4a Questão 
 
Marque a opção que apresenta técnicas usadas pela Ciência de Dados: 
 
 
Banco de dados, estatística, algoritmos de mineração de dados, inteligência 
artificial, linguagens de script e programação 
 
Banco de dados, Mineração de dados, inteligência artificial, linguagens de script, 
programação e Big Data 
 
Estatística, algoritmos de mineração de dados, inteligência artificial, linguagens de 
script, programação e Big Data 
 
Banco de dados, algoritmos de mineração de dados, inteligência artificial, 
linguagens de script, programação e Big Data 
 Banco de dados, estatística, algoritmos de mineração de dados, inteligência 
artificial, linguagens de script, programação e Big Data 
Respondido em 05/09/2019 10:39:42 
 
 
Explicação: 
 
A Ciência de Dados é a expressão usada o trabalho que usa um conjunto de 
técnicas de banco de dados, estatística, algoritmos de mineração de dados, inteligência 
artificial, linguagens de script, programação e Big Data para extrair informações relevantes 
a partir dos dados brutos ou originais. 
 
 
 
 
 
 5a Questão 
 
São tipos de uso do Big Data nas empresas, exceto: 
 
 
Gerenciamento do relacionamento com clientes no setor de varejo 
 
Acompanhamento do processamento eletrônico de documentos em órgãos do 
governo 
 
Identificação de tentativas de fraudes 
 
Geração de descontos em pontos de vendas para clientes cadastrados com base em 
hábitos de compra 
 Para gerenciar transações baseadas em bancos de dados relacionais 
Respondido em 05/09/2019 10:39:59 
 
 
Explicação: 
É importante destacar que tal volume de dados excede o volume tradicionalmente tratado 
pelos sistemas gerenciadores de bancos de dados relacionais. 
 
 
 
 
 6a Questão 
 
São vantagens do Big Data, exceto: 
 
 
Promove a tomada de decisões com mais inteligência 
 
Economia nos custos operacionais da empresa 
 
Redução do total de custos de investimento 
 
Economia de tempo de marketing 
 Não é adequado para uso em órgãos governamentais, mesmo com o projeto de 
implantação do "governo digital" 
 
1a Questão 
 
Marque a opção que apresenta 2 vantagens do Hadoop: 
 
 Processa grandes volumes de dados em ambiente paralelo / Facilita a execução de 
agregação de grandes bancos de dados por meio do Reduce 
 
É usado mesmo quando o processamento não é paralelo / Facilita operações ETL 
em larga escala 
 
Permite o trabalho com uma variedade de tipos de dados / É bom mesmo com 
lotes de dados pequenos 
 
Rápido acesso aos dados / Aumento linear da escalabilidade 
 
Permite o processamento de grandes datasets em paralelo / É bom para o 
processamento transacional 
Respondido em 05/09/2019 10:42:08 
 
 
Explicação: 
Duas das prinicipais vantagens do Hadoo são o processamento massivo de grandes 
volumes de dados e a agregação de grandes bancos de dados com o uso da função Reduce 
 
 
 
 
 2a Questão 
 
Marque a opção que apresenta a composição inicial do Hadoop: 
 
 
HDFS e Hive 
 MapReduce e HDFS 
 
YARN e HDFS 
 
MapReduce e YARN 
 
HDFS e HBase 
Respondido em 05/09/2019 10:42:21 
 
 
Explicação: 
O Hadoop tem em sua composição inicial o MapReduce e o HDFS, porém necessita de mais 
ferramentas para atender as necessidades do trabalho com Big Data 
 
 
 
 
 3a Questão 
 
Sobre o MapReduce podemos afirmar que: 
 
 
Usou recursos das linguagens funcionais: Map, Reduce e C 
 É um modelo genérico de programação 
 
Combina recursos existentes nas linguagens procedurais das quais se originou 
 
Permite a distribuição do processamento, mas não a junção dos resultados 
 
A função Reduce é a responsável pelo processamento a partir das buscas em 
paralelo 
Respondido em 05/09/2019 11:27:45 
 
 
Explicação: 
 
O MapReduce é um modelo genérico de programação. Ele recebeu esse nome por 
conta da combinação entre os recursos existentes das linguagens funcionais que foram 
usadas, sendo eles o Map e o Reduce. 
 
 
 
 
 
 4a Questão 
 
São justificativas para o uso do Big Data em ambinete de computação distribuída, exceto: 
 
 
Processamento de grandes massas de dados 
 
Uso do paralelismo no processamento de consultas 
 
Eliminação do ponto único de falha 
 
Flexibilidade quanto ao uso do processamento das aplicações de acordo com a real 
necessidade 
 Facilidade no gerenciamento dos recursos computacionais 
Respondido em 05/09/2019 11:28:41 
 
 
Explicação: 
Há um aumento da complexidade no gerenciamento dos recursos computacionais, mas a 
desvantagem é superada em muito pelas vantagens obtidas pelo uso da computação 
distribuída 
 
 
 
 
 5a Questão 
 
O Hadoop é? 
 
 Engloba um conjunto de produtos que permite o processamento de aplicações Big 
Data 
 
É um banco de dados NOSQL amplamente usado em Big Data 
 
É um projeto administrado atualmente pelo Google 
 
Um banco de dados orientado a objetos 
 
O projeto está apoiado em dois componentes principais: o Map e o Reduce 
Respondido em 05/09/2019 11:28:44 
 
 
Explicação: 
O Hadoop engloba um conjunto de produtos que permite processar o Big Data, por meio 
de um processamento de dados paralelo nos nós de computação, com uma aceleração no 
processamento, com diminuição da latência e altamente escalável. 
 
 
 
 
 
 6a Questão 
 
Assinale a alternativa que NÃO apresenta 2 ferramentas ou componentes usados no 
framework Hadoop: 
 
 
Pig e Hive 
 Hive e Neo4J 
 
ZooKeeper e Chukwa 
 
MapReduce e HDFS 
 
Ambari e Mahout 
Respondido em 05/09/2019 11:32:41 
 
 
Explicação: 
O Neo4J é um banco de dados NOSQL baseado emgrafos 
 
1a Questão 
 
Não é um exemplo de dados não estruturado: 
 
 Dados financeiros e cadastros diversos 
 
Dados de sites 
 
Redes sociais 
 
Dados móveis (smartphones) 
 
Dados multimídia 
Respondido em 05/09/2019 11:33:39 
 
 
Explicação: 
Algumas fontes de dados estruturados são: os sistemas de relacionamento de clientes 
(CRM), dados financeiros e cadastros diversos, entre outros. 
 
 
 
 
 2a Questão 
 
São exemplos de dados gerados com intervenção humana, exceto: 
 
 
Dados obtidos via jogos 
 Web log data 
 
Dados de fluxo de cliques 
 
Dados empresariais 
 
Dados de preenchimento de formulários de sistemas de informação 
Respondido em 05/09/2019 11:33:52 
 
 
Explicação: 
Web log data: quando servidores, aplicativos, redes e outros operam, eles capturam 
todos os tipos de dados sobre suas atividades. Isso normalmente produz enormes volumes 
de dados que podem ser usadas posteriormente para análises, como por exemplo, verificar 
o andamento de contratos de nível de serviço ou avaliar violações de segurança. 
 
 
 
 
 
 3a Questão 
 
São exemplos de dados gerados sem intervenção humana, exceto: 
 
 
Medidores inteligentes 
 
Etiquetas Radio Frequency ID (RFID) 
 
Dispositivos médicos 
 
Dados gerados por GPS 
 Dados obtidos via jogos 
Respondido em 05/09/2019 11:34:21 
 
 
Explicação: 
Dados obtidos via jogos: os movimentos realizados em um jogo podem ser gravados. Esses 
dados podem ser analisados para avaliar a eficiência dos jogos de acordo com o nível do 
jogador 
 
 
 
 
 4a Questão 
 
Assinale a afirmativa que não apresenta uma característica do HBase: 
 
 
Divisão e redistribuição automática do conteúdo 
 
Alta disponibilidade 
 
Alta velocidade 
 Suporte ACID 
 
Alta taxa de trocas de dados 
Respondido em 05/09/2019 11:35:02 
 
 
Explicação: 
Embora não seja uma implementação ¿ACID¿, o HBase oferece leituras e gravações muito 
consistentes 
 
 
 
 
 5a Questão 
 
Sobre o HDFS podemos afirmar que: 
 
 
O Namenode rastreia o local onde os dados estão fisicamente 
 
O sistema de arquivos inclui um serviço denominado "namenode" e vários nós de 
dados ou "datanodes" 
 A coleção completa de todos os arquivos no cluster é denominada de Namenode 
 
É um cluster tolerantes a falhas e direcionado para o gerenciamento de arquivos 
para Big Data 
 
Funciona divindo arquivos grandes em pedaços menores denominados blocos 
Respondido em 05/09/2019 11:35:15 
 
 
Explicação: 
O NameNode também atua como um semáforo, gerenciando por completo o acesso aos 
arquivos por meio de tarefas como leituras, gravações, criação, exclusão e replicação dos 
blocos de dados nesses nós de dados. A coleção completa de todos os arquivos no cluster é 
chamada de namespace do sistema de arquivos 
 
 
 
 
 6a Questão 
 
Marque a opção que apresenta um exemplo de formato semiestruturado: 
 
 
CSV 
 
SQL 
 JSON 
 
XLS 
 
HTML 5 
Respondido em 05/09/2019 11:35:32 
 
 
Explicação: 
O arquivo JSON (JavaScript Object Notation) também é formado por dados 
semiestruturados e possui um formato leve para o tráfego de dados, necessitando de 
menos bytes que o arquivo XML, o que é importante quando é necessário o tráfego de 
grandes quantidades de dados. 
 
1a Questão 
 
Como fatores positivos desse modelo surge a maior consistência pois as leituras paralelas 
são executadas por processos paralelizados na ordem sequencial. O modelo NOSQL em 
questão é? 
 
 
Chave-valor 
 
Baseado em grafos 
 
Orientado a documentos 
 
Baseado em linhas 
 Colunar 
Respondido em 05/09/2019 11:36:07 
 
 
Explicação: 
É um avanço do modelo baseado em chave-valor, observando que na hipótese de se ter 
um conjunto de pares chave sem um critério organizacional pequeno o suficiente, pode 
acarretar problemas. Assim, para agrupar os pares, foi definido que pares chave-valor 
poderiam ser agrupados horizontalmente. Nesse contexto, aparece também a definição de 
superfamília de colunas que é o par chave-valor composto por um id (identificador) e um 
grupo de colunas. Como fatores positivos do modelo surge a maior consistência pois as 
leituras paralelas são executadas por processos paralelizados na ordem sequencial. 
 
 
 
 
 
 2a Questão 
 
Sobre o conceito Schemaless (sem esquema) podemos afirmar que: 
 
 
O banco de dados não necessida de um projeto físico 
 Indica que a base de dados não possui uma estrutura fixa, ou seja, os dados não 
tem estrutura pré-definida 
 
O recurso é aplicado apenas nos bancos de dados baseados em grafos 
 
O banco de dados não precisa de um esquema conceitual 
 
O armazenamento dos dados não precisa de uma estrutura pré-definida, mas 
precisa ser normalizado 
Respondido em 05/09/2019 11:36:21 
 
 
Explicação: 
Esquema livre (schema free) indica que a base de dados não possui uma estrutura fixa, ou 
seja, os dados não têm estrutura pré-definida. 
 
 
 
 
 3a Questão 
 
A afirmativa faz referência a que modelo NOSQL? "Os documentos são compostos por um 
identificador e um valor" 
 
 
Chave-valor 
 
Colunar 
 
Baseado em grafos 
 Orientado a documentos 
 
Relacional-objeto 
Respondido em 05/09/2019 11:36:34 
 
 
Explicação: 
Um registro na base de dados faz relação com um documento. Em sua composição, os 
documentos normalmente são compostos por um identificador e um valor. No valor é 
pode-se introduzir outros identificadores acompanhados de valores. As vantagens deste 
modelo podem ser listadas como a capacidade de suportar conjuntos de conjuntos de 
pares chave-valor. 
 
 
 
 
 
 4a Questão 
 
Nesse modelo NOSQL comparando-o ao relacional, um registro ou linha é formada por um 
grupo de pares no formato chave-valor: 
 
 
Orientado a colunas 
 
Orientado a documentos 
 
Baseado em grafos 
 Modelo chave-valor 
 
Baseado em objetos 
Respondido em 05/09/2019 11:36:55 
 
 
Explicação: 
Comparativamente, no banco de dados relacional, uma linha da tabela possuir um número 
determinado de atributos, mas agora um registro ou linha é formada por um grupo de 
pares no formato chave-valor, que necessariamente não precisam ter os mesmos pares. A 
grande vantagem do modelo é o fato de ser simples quanto ao uso e codificação, pois uma 
coleção de chaves tem um valor único. 
 
 
 
 
 
 5a Questão 
 
Assinale a alternativa errada sobre bancos de dados NOSQL: 
 
 
É schemaless ou schema free 
 
Pode ser usado com o PostgreSQL 
 
São baseados no Teorema CAP 
 Há a necessidade de que os dados tenham uma estrutura pré-definida 
 
Pode ser usado para armazenar dados de documentos 
Respondido em 05/09/2019 11:37:04 
 
 
Explicação: 
Esquema livre (schema free) indica que a base de dados não possui uma estrutura fixa, ou 
seja, os dados não têm estrutura pré-definida. 
 
 
 
 
 6a Questão 
 
Marque a opção que apresenta as categorias de bases de dados no modelo NOSQL: 
 
 
Orientado a linhas, colunas, grafos e documentos 
 Chave-valor, orientado a documentos, grafos e colunas 
 
Baseado em grafos, colunas, objetos e documentos 
 
JSON, XML, grafos e colunas 
 
Orientado a objetos, documentos, colunas e chaves de valores 
Respondido em 05/09/2019 11:39:24 
 
 
Explicação: 
Podemos avaliar que os bancos de dados relacionais representam dados no formato de 
tabelas que consistem em um número de linhas para seus registros, no entanto os bancos 
NOSQLsão coleções de pares chave-valor, bancos de dados em grafos, documentos ou 
ainda armazenamentos em coluna e, que não necessitam de esquemas para o seus 
projetos. 
 
1a Questão 
 
Assinale a afirmativa incorreta em relação as características principais do MongoDb: 
 
 
Os valores dos campos podem incluir outros documentos, matrizes e matrizes de 
documentos 
 
Possui fácil escalonamento 
 
Seu uso é adequado para aplicações que gerenciam redes sociais 
 
Não tem suporte a transações como no BD relacional 
 Seu uso é adequado para aplicações de bancos de dados colunares 
Respondido em 05/09/2019 11:39:54 
 
 
Explicação: 
O SGBD NoSQL MongoDB é um sistema de gerenciamento de bancos de dados orientados a 
documentos, de esquema flexível e de código livre, desenvolvido na linguagem C++, que 
tem como características a velocidade, a eficiência e a escalabilidade. 
 
 
 
 
 2a Questão 
 
Entre as vantagens no uso do formato de dados como documentos temos, exceto: 
 
 Tem uma estrutura pré-definida 
 
Correspondem a tipos de dados nativos em muitas linguagens de programação 
 
Documentos e matrizes incorporados reduzem a necessidade de junções custosas 
 
O banco de dados não necessita de um esquema 
 
Possui esquema dinâmico que suporta o polimorfismo 
Respondido em 05/09/2019 11:40:00 
 
 
Explicação: 
Um documento não precisa de uma estrutura pré-definida ou o banco de dados não 
necessita de um esquema, eles são considerados como auto descritivos. 
 
 
 
 
 3a Questão 
 
A unidade de armazenamento em um BD orientado a documentos, que é similar ao 
documento no modelo relacional é? 
 
 Registro 
 
Array 
 
Coluna 
 
Tabela 
 
Atributo 
Respondido em 05/09/2019 11:40:11 
 
 
Explicação: 
Dessa forma, documento representa a unidade de armazenamento de dados, que nos 
sistemas gerenciadores de bancos de dados relacionais seriam chamados de registros ou 
linhas. 
 
 
 
 
 4a Questão 
 
São características do MongoDB, com exceção de: 
 
 
É eficaz para aplicações de análise em tempo real 
 
É multiplataforma e também funciona no Windows 
 Não trabalha com o MapReduce para a agregação de coleções 
 
Usa um recurso chamado de cursor que funciona como um ponteiro para os dados 
 
A replicação de dados é garantida através de bloqueios e pelo modelo mestre-
escravo assíncrono 
Respondido em 05/09/2019 11:40:21 
 
 
Explicação: 
O MongoDB também é um ecossistema que consiste nos seguintes elementos: 
• Serviços de alta disponibilidade e replicação para escalonamento em redes locais e 
de longa distância; 
• Um sistema de arquivos baseado em grid, permitindo o armazenamento de objetos 
grandes dividindo-os entre vários documentos. 
• MapReduce para suportar análises e agregação de diferentes coleções / 
documentos. 
 
 
 
 
 5a Questão 
 
Sobre os bancos de dados orientados a documentos podemos afirmar que, exceto: 
 
 
Os documentos devem ser organizados em coleções de documentos semelhantes 
 
Não há restrições quanto ao número de campos no documento 
 Entre os formatos para um documento podemos ter o XML e o JSON, apenas 
 
Entre os formatos para um documento podemos ter o XML, JSON, BSON e o YAML 
 
São exemplos desses bancos de dados o MongoDB, o RavenDB e o CouchDB 
Respondido em 05/09/2019 11:40:34 
 
 
Explicação: 
Quanto ao formato de um documento, esses podem ser codificados de diferentes 
formatos, como: XML, JSON, BSON, YAML ou ainda com textos simples. 
 
 
 
 
 6a Questão 
 
São exemplos de SGBDs orientados a documentos, exceto: 
 
 
RavenDB 
 
MongoDB 
 
CouchDB 
 HBase 
 
NEO4J 
Respondido em 05/09/2019 11:40:43 
 
 
Explicação: 
Como exemplos desses bancos de dados podemos citar o MongoDB, RavenDB e o 
CouchDB, todos orientados a documentos 
 
1a Questão 
 
Marque a opção que apresenta o conjunto correto de dimensões Big Data: 
 
 
Estabilidade, velocidade, variedade e complexidade 
 Volume, velocidade, variedade, variabilidade e complexidade 
 
Volume, variedade, estabilidade e complexidade 
 
Volume, velocidade, variedade, previsibilidade e simplicidade 
 
Velocidade, variedade, variabilidade e simplicidade 
Respondido em 05/09/2019 13:43:35 
 
 
Explicação: 
Com a evolução do uso do Big Data, outros ¿Vs¿ além do Volume, Velocidade e Variedade 
descritos anteriormente, foram surgindo para melhor caracterizar a tecnologia ou atualizar 
seus conceitos. Podem ser listadas mais duas dimensões a Variabilidade e a Complexidade. 
 
 
 
 
 2a Questão 
 
Em relação ao volume de dados trabalhado em Big Data, em termos de medidas, o 
intervalo pode variar de: 
 
 
Petabytes - Exabytes 
 
Acima de exabytes, somente 
 
Megabytes - Gigabytes 
 Terabytes - Exabytes 
 
Gigabytes - Terabytes 
Respondido em 05/09/2019 13:44:25 
 
 
Explicação: 
Considera-se que os limites de volumes de dados trabalhados em Big Data sejam entre 
terabytes (1012 bytes) ou petabytes (1015 bytes) até exabytes (1018 bytes). 
 
 
 
 
 3a Questão 
 
Assinale a alternativa que apresenta uma opção que justifica o aumento da quantidade de 
dados na sociedade, exceto: 
 
 Todas as opções estão corretas 
 
Bancos de vídeos 
 
Bases de imagens 
 
Disponibilização de hardwares avançados 
 
Sistemas de músicas on-line 
Respondido em 05/09/2019 13:45:25 
 
 
Explicação: 
A disponibilização de hardwares avançados e recursos de redes como a internet, tem 
possibilitado o armazenamento de dados em diferentes formatos: textos, vídeos, músicas, 
imagens, etc. Como consequência, o volume de dados disponível para uso da sociedade e 
empresas não para de crescer. 
 
 
 
 
 4a Questão 
 
Marque a opção que apresenta técnicas usadas pela Ciência de Dados: 
 
 
Banco de dados, algoritmos de mineração de dados, inteligência artificial, 
linguagens de script, programação e Big Data 
 
Banco de dados, Mineração de dados, inteligência artificial, linguagens de script, 
programação e Big Data 
 Banco de dados, estatística, algoritmos de mineração de dados, inteligência 
artificial, linguagens de script, programação e Big Data 
 
Banco de dados, estatística, algoritmos de mineração de dados, inteligência 
artificial, linguagens de script e programação 
 
Estatística, algoritmos de mineração de dados, inteligência artificial, linguagens de 
script, programação e Big Data 
Respondido em 05/09/2019 13:45:32 
 
 
Explicação: 
 
A Ciência de Dados é a expressão usada o trabalho que usa um conjunto de 
técnicas de banco de dados, estatística, algoritmos de mineração de dados, inteligência 
artificial, linguagens de script, programação e Big Data para extrair informações relevantes 
a partir dos dados brutos ou originais. 
 
 
 
 
 
 5a Questão 
 
São tipos de uso do Big Data nas empresas, exceto: 
 
 Para gerenciar transações baseadas em bancos de dados relacionais 
 
Geração de descontos em pontos de vendas para clientes cadastrados com base em 
hábitos de compra 
 
Identificação de tentativas de fraudes 
 
Gerenciamento do relacionamento com clientes no setor de varejo 
 
Acompanhamento do processamento eletrônico de documentos em órgãos do 
governo 
Respondido em 05/09/2019 13:45:45 
 
 
Explicação: 
É importante destacar que tal volume de dados excede o volume tradicionalmente tratado 
pelos sistemas gerenciadores de bancos de dados relacionais. 
 
 
 
 
 6a Questão 
 
São vantagens do Big Data, exceto:Promove a tomada de decisões com mais inteligência 
 
Economia nos custos operacionais da empresa 
 
Economia de tempo de marketing 
 Não é adequado para uso em órgãos governamentais, mesmo com o projeto de 
implantação do "governo digital" 
 
Redução do total de custos de investimento 
Respondido em 05/09/2019 13:46:15 
 
 
Explicação: 
Big Data permite um avanço significativo em relação ao modo de gestão dos serviços 
públicos. Com o ¿governo digital¿ e o processamento eletrônico de documentos, os órgãos 
de fiscalização podem acompanhar automaticamente identificando assim, atividades 
suspeitas que indiquem indícios de atos de corrupção, lidando com mais recursos legais 
para sua atuação e posterior autuação. 
 
1a Questão 
 
Marque a opção que apresenta 2 vantagens do Hadoop: 
 
 
Permite o trabalho com uma variedade de tipos de dados / É bom mesmo com lotes 
de dados pequenos 
 
Permite o processamento de grandes datasets em paralelo / É bom para o 
processamento transacional 
 Processa grandes volumes de dados em ambiente paralelo / Facilita a execução de 
agregação de grandes bancos de dados por meio do Reduce 
 
É usado mesmo quando o processamento não é paralelo / Facilita operações ETL 
em larga escala 
 
Rápido acesso aos dados / Aumento linear da escalabilidade 
Respondido em 05/09/2019 13:46:45 
 
 
Explicação: 
Duas das prinicipais vantagens do Hadoo são o processamento massivo de grandes 
volumes de dados e a agregação de grandes bancos de dados com o uso da função Reduce 
 
 
 
 
 2a Questão 
 
Marque a opção que apresenta a composição inicial do Hadoop: 
 
 
YARN e HDFS 
 
MapReduce e YARN 
 
HDFS e HBase 
 
HDFS e Hive 
 MapReduce e HDFS 
Respondido em 05/09/2019 13:46:51 
 
 
Explicação: 
O Hadoop tem em sua composição inicial o MapReduce e o HDFS, porém necessita de mais 
ferramentas para atender as necessidades do trabalho com Big Data 
 
 
 
 
 3a Questão 
 
Sobre o MapReduce podemos afirmar que: 
 
 
Combina recursos existentes nas linguagens procedurais das quais se originou 
 É um modelo genérico de programação 
 
Permite a distribuição do processamento, mas não a junção dos resultados 
 
Usou recursos das linguagens funcionais: Map, Reduce e C 
 
A função Reduce é a responsável pelo processamento a partir das buscas em 
paralelo 
Respondido em 05/09/2019 13:46:59 
 
 
Explicação: 
 
O MapReduce é um modelo genérico de programação. Ele recebeu esse nome por 
conta da combinação entre os recursos existentes das linguagens funcionais que foram 
usadas, sendo eles o Map e o Reduce. 
 
 
 
 
 
 4a Questão 
 
São justificativas para o uso do Big Data em ambinete de computação distribuída, exceto: 
 
 
Uso do paralelismo no processamento de consultas 
 
Processamento de grandes massas de dados 
 Facilidade no gerenciamento dos recursos computacionais 
 
Eliminação do ponto único de falha 
 
Flexibilidade quanto ao uso do processamento das aplicações de acordo com a real 
necessidade 
Respondido em 05/09/2019 13:47:18 
 
 
Explicação: 
Há um aumento da complexidade no gerenciamento dos recursos computacionais, mas a 
desvantagem é superada em muito pelas vantagens obtidas pelo uso da computação 
distribuída 
 
 
 
 
 5a Questão 
 
O Hadoop é? 
 
 
É um projeto administrado atualmente pelo Google 
 
Um banco de dados orientado a objetos 
 
É um banco de dados NOSQL amplamente usado em Big Data 
 
O projeto está apoiado em dois componentes principais: o Map e o Reduce 
 Engloba um conjunto de produtos que permite o processamento de aplicações Big 
Data 
Respondido em 05/09/2019 13:47:42 
 
 
Explicação: 
O Hadoop engloba um conjunto de produtos que permite processar o Big Data, por meio 
de um processamento de dados paralelo nos nós de computação, com uma aceleração no 
processamento, com diminuição da latência e altamente escalável. 
 
 
 
 
 
 6a Questão 
 
Assinale a alternativa que NÃO apresenta 2 ferramentas ou componentes usados no 
framework Hadoop: 
 
 
Ambari e Mahout 
 
ZooKeeper e Chukwa 
 
MapReduce e HDFS 
 
Pig e Hive 
 Hive e Neo4J 
Respondido em 05/09/2019 13:48:30 
 
 
Explicação: 
O Neo4J é um banco de dados NOSQL baseado em grafos 
 
1a Questão 
 
Não é um exemplo de dados não estruturado: 
 
 
Dados móveis (smartphones) 
 
Redes sociais 
 Dados financeiros e cadastros diversos 
 
Dados de sites 
 
Dados multimídia 
Respondido em 05/09/2019 13:49:06 
 
 
Explicação: 
Algumas fontes de dados estruturados são: os sistemas de relacionamento de clientes 
(CRM), dados financeiros e cadastros diversos, entre outros. 
 
 
 
 
 2a Questão 
 
São exemplos de dados gerados com intervenção humana, exceto: 
 
 
Dados de fluxo de cliques 
 Web log data 
 
Dados de preenchimento de formulários de sistemas de informação 
 
Dados obtidos via jogos 
 
Dados empresariais 
Respondido em 05/09/2019 13:49:20 
 
 
Explicação: 
Web log data: quando servidores, aplicativos, redes e outros operam, eles capturam 
todos os tipos de dados sobre suas atividades. Isso normalmente produz enormes volumes 
de dados que podem ser usadas posteriormente para análises, como por exemplo, verificar 
o andamento de contratos de nível de serviço ou avaliar violações de segurança. 
 
 
 
 
 
 3a Questão 
 
São exemplos de dados gerados sem intervenção humana, exceto: 
 
 
Medidores inteligentes 
 Dados obtidos via jogos 
 
Dados gerados por GPS 
 
Etiquetas Radio Frequency ID (RFID) 
 
Dispositivos médicos 
Respondido em 05/09/2019 13:49:28 
 
 
Explicação: 
Dados obtidos via jogos: os movimentos realizados em um jogo podem ser gravados. Esses 
dados podem ser analisados para avaliar a eficiência dos jogos de acordo com o nível do 
jogador 
 
 
 
 
 4a Questão 
 
Assinale a afirmativa que não apresenta uma característica do HBase: 
 
 
Divisão e redistribuição automática do conteúdo 
 
Alta taxa de trocas de dados 
 Suporte ACID 
 
Alta velocidade 
 
Alta disponibilidade 
Respondido em 05/09/2019 13:50:34 
 
 
Explicação: 
Embora não seja uma implementação ¿ACID¿, o HBase oferece leituras e gravações muito 
consistentes 
 
 
 
 
 5a Questão 
 
Sobre o HDFS podemos afirmar que: 
 
 
É um cluster tolerantes a falhas e direcionado para o gerenciamento de arquivos 
para Big Data 
 
Funciona divindo arquivos grandes em pedaços menores denominados blocos 
 
O Namenode rastreia o local onde os dados estão fisicamente 
 A coleção completa de todos os arquivos no cluster é denominada de Namenode 
 
O sistema de arquivos inclui um serviço denominado "namenode" e vários nós de 
dados ou "datanodes" 
Respondido em 05/09/2019 13:50:51 
 
 
Explicação: 
O NameNode também atua como um semáforo, gerenciando por completo o acesso aos 
arquivos por meio de tarefas como leituras, gravações, criação, exclusão e replicação dos 
blocos de dados nesses nós de dados. A coleção completa de todos os arquivos no cluster é 
chamada de namespace do sistema de arquivos 
 
 
 
 
 6a Questão 
 
Marque a opção que apresenta um exemplo de formato semiestruturado: 
 
 
XLS 
 
CSV 
 JSON 
 
HTML 5 
 
SQL 
Respondido em 05/09/2019 13:51:05 
 
 
Explicação: 
O arquivo JSON (JavaScript Object Notation) também é formado por dados 
semiestruturados e possui um formato leve para o tráfego de dados, necessitando de 
menosbytes que o arquivo XML, o que é importante quando é necessário o tráfego de 
grandes quantidades de dados. 
 
1a Questão 
 
Como fatores positivos desse modelo surge a maior consistência pois as leituras paralelas 
são executadas por processos paralelizados na ordem sequencial. O modelo NOSQL em 
questão é? 
 
 
Baseado em linhas 
 
Chave-valor 
 Colunar 
 
Baseado em grafos 
 
Orientado a documentos 
Respondido em 05/09/2019 13:51:32 
 
 
Explicação: 
É um avanço do modelo baseado em chave-valor, observando que na hipótese de se ter 
um conjunto de pares chave sem um critério organizacional pequeno o suficiente, pode 
acarretar problemas. Assim, para agrupar os pares, foi definido que pares chave-valor 
poderiam ser agrupados horizontalmente. Nesse contexto, aparece também a definição de 
superfamília de colunas que é o par chave-valor composto por um id (identificador) e um 
grupo de colunas. Como fatores positivos do modelo surge a maior consistência pois as 
leituras paralelas são executadas por processos paralelizados na ordem sequencial. 
 
 
 
 
 
 2a Questão 
 
Sobre o conceito Schemaless (sem esquema) podemos afirmar que: 
 
 
O armazenamento dos dados não precisa de uma estrutura pré-definida, mas 
precisa ser normalizado 
 
O banco de dados não necessida de um projeto físico 
 
O recurso é aplicado apenas nos bancos de dados baseados em grafos 
 Indica que a base de dados não possui uma estrutura fixa, ou seja, os dados não 
tem estrutura pré-definida 
 
O banco de dados não precisa de um esquema conceitual 
Respondido em 05/09/2019 13:51:42 
 
 
Explicação: 
Esquema livre (schema free) indica que a base de dados não possui uma estrutura fixa, ou 
seja, os dados não têm estrutura pré-definida. 
 
 
 
 
 3a Questão 
 
A afirmativa faz referência a que modelo NOSQL? "Os documentos são compostos por um 
identificador e um valor" 
 
 
Colunar 
 
Baseado em grafos 
 Orientado a documentos 
 
Chave-valor 
 
Relacional-objeto 
Respondido em 05/09/2019 13:52:02 
 
 
Explicação: 
Um registro na base de dados faz relação com um documento. Em sua composição, os 
documentos normalmente são compostos por um identificador e um valor. No valor é 
pode-se introduzir outros identificadores acompanhados de valores. As vantagens deste 
modelo podem ser listadas como a capacidade de suportar conjuntos de conjuntos de 
pares chave-valor. 
 
 
 
 
 
 4a Questão 
 
Nesse modelo NOSQL comparando-o ao relacional, um registro ou linha é formada por um 
grupo de pares no formato chave-valor: 
 
 
Baseado em grafos 
 
Baseado em objetos 
 
Orientado a colunas 
 
Orientado a documentos 
 Modelo chave-valor 
Respondido em 05/09/2019 13:52:15 
 
 
Explicação: 
Comparativamente, no banco de dados relacional, uma linha da tabela possuir um número 
determinado de atributos, mas agora um registro ou linha é formada por um grupo de 
pares no formato chave-valor, que necessariamente não precisam ter os mesmos pares. A 
grande vantagem do modelo é o fato de ser simples quanto ao uso e codificação, pois uma 
coleção de chaves tem um valor único. 
 
 
 
 
 
 5a Questão 
 
Assinale a alternativa errada sobre bancos de dados NOSQL: 
 
 
São baseados no Teorema CAP 
 
É schemaless ou schema free 
 
Pode ser usado com o PostgreSQL 
 
Pode ser usado para armazenar dados de documentos 
 Há a necessidade de que os dados tenham uma estrutura pré-definida 
Respondido em 05/09/2019 13:52:51 
 
 
Explicação: 
Esquema livre (schema free) indica que a base de dados não possui uma estrutura fixa, ou 
seja, os dados não têm estrutura pré-definida. 
 
 
 
 
 6a Questão 
 
Marque a opção que apresenta as categorias de bases de dados no modelo NOSQL: 
 
 
Baseado em grafos, colunas, objetos e documentos 
 
Orientado a objetos, documentos, colunas e chaves de valores 
 Chave-valor, orientado a documentos, grafos e colunas 
 
JSON, XML, grafos e colunas 
 
Orientado a linhas, colunas, grafos e documentos 
Respondido em 05/09/2019 13:53:12 
 
 
Explicação: 
Podemos avaliar que os bancos de dados relacionais representam dados no formato de 
tabelas que consistem em um número de linhas para seus registros, no entanto os bancos 
NOSQL são coleções de pares chave-valor, bancos de dados em grafos, documentos ou 
ainda armazenamentos em coluna e, que não necessitam de esquemas para o seus 
projetos. 
 
1a Questão 
 
Assinale a afirmativa incorreta em relação as características principais do MongoDb: 
 
 
Os valores dos campos podem incluir outros documentos, matrizes e matrizes de 
documentos 
 Seu uso é adequado para aplicações de bancos de dados colunares 
 
Seu uso é adequado para aplicações que gerenciam redes sociais 
 
Não tem suporte a transações como no BD relacional 
 
Possui fácil escalonamento 
Respondido em 05/09/2019 13:54:22 
 
 
Explicação: 
O SGBD NoSQL MongoDB é um sistema de gerenciamento de bancos de dados orientados a 
documentos, de esquema flexível e de código livre, desenvolvido na linguagem C++, que 
tem como características a velocidade, a eficiência e a escalabilidade. 
 
 
 
 
 2a Questão 
 
Entre as vantagens no uso do formato de dados como documentos temos, exceto: 
 
 Tem uma estrutura pré-definida 
 
Documentos e matrizes incorporados reduzem a necessidade de junções custosas 
 
O banco de dados não necessita de um esquema 
 
Correspondem a tipos de dados nativos em muitas linguagens de programação 
 
Possui esquema dinâmico que suporta o polimorfismo 
Respondido em 05/09/2019 13:54:38 
 
 
Explicação: 
Um documento não precisa de uma estrutura pré-definida ou o banco de dados não 
necessita de um esquema, eles são considerados como auto descritivos. 
 
 
 
 
 3a Questão 
 
A unidade de armazenamento em um BD orientado a documentos, que é similar ao 
documento no modelo relacional é? 
 
 
Coluna 
 
Tabela 
 
Atributo 
 
Array 
 Registro 
Respondido em 05/09/2019 13:54:50 
 
 
Explicação: 
Dessa forma, documento representa a unidade de armazenamento de dados, que nos 
sistemas gerenciadores de bancos de dados relacionais seriam chamados de registros ou 
linhas. 
 
 
 
 
 4a Questão 
 
São características do MongoDB, com exceção de: 
 
 
Usa um recurso chamado de cursor que funciona como um ponteiro para os dados 
 
É multiplataforma e também funciona no Windows 
 
A replicação de dados é garantida através de bloqueios e pelo modelo mestre-
escravo assíncrono 
 Não trabalha com o MapReduce para a agregação de coleções 
 
É eficaz para aplicações de análise em tempo real 
Respondido em 05/09/2019 13:55:56 
 
 
Explicação: 
O MongoDB também é um ecossistema que consiste nos seguintes elementos: 
• Serviços de alta disponibilidade e replicação para escalonamento em redes locais e 
de longa distância; 
• Um sistema de arquivos baseado em grid, permitindo o armazenamento de objetos 
grandes dividindo-os entre vários documentos. 
• MapReduce para suportar análises e agregação de diferentes coleções / 
documentos. 
 
 
 
 
 5a Questão 
 
Sobre os bancos de dados orientados a documentos podemos afirmar que, exceto: 
 
 
Entre os formatos para um documento podemos ter o XML, JSON, BSON e o YAML 
 
Não há restrições quanto ao número de campos no documento 
 Entre os formatos para um documento podemos ter o XML e o JSON, apenas 
 
Os documentos devem ser organizados em coleções de documentos semelhantes 
 
São exemplosdesses bancos de dados o MongoDB, o RavenDB e o CouchDB 
Respondido em 05/09/2019 13:56:22 
 
 
Explicação: 
Quanto ao formato de um documento, esses podem ser codificados de diferentes 
formatos, como: XML, JSON, BSON, YAML ou ainda com textos simples. 
 
 
 
 
 6a Questão 
 
São exemplos de SGBDs orientados a documentos, exceto: 
 
 
MongoDB 
 
CouchDB 
 HBase 
 
NEO4J 
 
RavenDB 
Respondido em 05/09/2019 13:56:30 
 
 
Explicação: 
Como exemplos desses bancos de dados podemos citar o MongoDB, RavenDB e o 
CouchDB, todos orientados a documentos 
 
1a Questão 
 
Marque a opção que apresenta o conjunto correto de dimensões Big Data: 
 
 
Volume, velocidade, variedade, previsibilidade e simplicidade 
 
Estabilidade, velocidade, variedade e complexidade 
 
Velocidade, variedade, variabilidade e simplicidade 
 
Volume, variedade, estabilidade e complexidade 
 Volume, velocidade, variedade, variabilidade e complexidade 
Respondido em 05/09/2019 18:21:58 
 
 
Explicação: 
Com a evolução do uso do Big Data, outros ¿Vs¿ além do Volume, Velocidade e Variedade 
descritos anteriormente, foram surgindo para melhor caracterizar a tecnologia ou atualizar 
seus conceitos. Podem ser listadas mais duas dimensões a Variabilidade e a Complexidade. 
 
 
 
 
 2a Questão 
 
Em relação ao volume de dados trabalhado em Big Data, em termos de medidas, o 
intervalo pode variar de: 
 
 
Petabytes - Exabytes 
 
Gigabytes - Terabytes 
 Terabytes - Exabytes 
 
Acima de exabytes, somente 
 
Megabytes - Gigabytes 
Respondido em 05/09/2019 18:22:32 
 
 
Explicação: 
Considera-se que os limites de volumes de dados trabalhados em Big Data sejam entre 
terabytes (1012 bytes) ou petabytes (1015 bytes) até exabytes (1018 bytes). 
 
 
 
 
 3a Questão 
 
Assinale a alternativa que apresenta uma opção que justifica o aumento da quantidade de 
dados na sociedade, exceto: 
 
 Todas as opções estão corretas 
 
Bases de imagens 
 
Bancos de vídeos 
 
Sistemas de músicas on-line 
 
Disponibilização de hardwares avançados 
Respondido em 05/09/2019 18:22:37 
 
 
Explicação: 
A disponibilização de hardwares avançados e recursos de redes como a internet, tem 
possibilitado o armazenamento de dados em diferentes formatos: textos, vídeos, músicas, 
imagens, etc. Como consequência, o volume de dados disponível para uso da sociedade e 
empresas não para de crescer. 
 
 
 
 
 4a Questão 
 
Marque a opção que apresenta técnicas usadas pela Ciência de Dados: 
 
 
Banco de dados, estatística, algoritmos de mineração de dados, inteligência 
artificial, linguagens de script e programação 
 
Banco de dados, algoritmos de mineração de dados, inteligência artificial, 
linguagens de script, programação e Big Data 
 
Estatística, algoritmos de mineração de dados, inteligência artificial, linguagens de 
script, programação e Big Data 
 
Banco de dados, Mineração de dados, inteligência artificial, linguagens de script, 
programação e Big Data 
 Banco de dados, estatística, algoritmos de mineração de dados, inteligência 
artificial, linguagens de script, programação e Big Data 
Respondido em 05/09/2019 18:22:43 
 
 
Explicação: 
 
A Ciência de Dados é a expressão usada o trabalho que usa um conjunto de 
técnicas de banco de dados, estatística, algoritmos de mineração de dados, inteligência 
artificial, linguagens de script, programação e Big Data para extrair informações relevantes 
a partir dos dados brutos ou originais. 
 
 
 
 
 
 5a Questão 
 
São tipos de uso do Big Data nas empresas, exceto: 
 
 Para gerenciar transações baseadas em bancos de dados relacionais 
 
Acompanhamento do processamento eletrônico de documentos em órgãos do 
governo 
 
Identificação de tentativas de fraudes 
 
Gerenciamento do relacionamento com clientes no setor de varejo 
 
Geração de descontos em pontos de vendas para clientes cadastrados com base em 
hábitos de compra 
Respondido em 05/09/2019 18:23:48 
 
 
Explicação: 
É importante destacar que tal volume de dados excede o volume tradicionalmente tratado 
pelos sistemas gerenciadores de bancos de dados relacionais. 
 
 
 
 
 6a Questão 
 
São vantagens do Big Data, exceto: 
 
 
Promove a tomada de decisões com mais inteligência 
 
Economia de tempo de marketing 
 
Economia nos custos operacionais da empresa 
 Não é adequado para uso em órgãos governamentais, mesmo com o projeto de 
implantação do "governo digital" 
 
Redução do total de custos de investimento 
Respondido em 05/09/2019 18:23:54 
 
 
Explicação: 
Big Data permite um avanço significativo em relação ao modo de gestão dos serviços 
públicos. Com o ¿governo digital¿ e o processamento eletrônico de documentos, os órgãos 
de fiscalização podem acompanhar automaticamente identificando assim, atividades 
suspeitas que indiquem indícios de atos de corrupção, lidando com mais recursos legais 
para sua atuação e posterior autuação. 
 
1a Questão 
 
Marque a opção que apresenta 2 vantagens do Hadoop: 
 
 Processa grandes volumes de dados em ambiente paralelo / Facilita a execução de 
agregação de grandes bancos de dados por meio do Reduce 
 
É usado mesmo quando o processamento não é paralelo / Facilita operações ETL 
em larga escala 
 
Permite o trabalho com uma variedade de tipos de dados / É bom mesmo com 
lotes de dados pequenos 
 
Rápido acesso aos dados / Aumento linear da escalabilidade 
 
Permite o processamento de grandes datasets em paralelo / É bom para o 
processamento transacional 
Respondido em 05/09/2019 18:18:01 
 
 
Explicação: 
Duas das prinicipais vantagens do Hadoo são o processamento massivo de grandes 
volumes de dados e a agregação de grandes bancos de dados com o uso da função Reduce 
 
 
 
 
 2a Questão 
 
Marque a opção que apresenta a composição inicial do Hadoop: 
 
 
HDFS e Hive 
 
YARN e HDFS 
 
HDFS e HBase 
 
MapReduce e YARN 
 MapReduce e HDFS 
Respondido em 05/09/2019 18:18:07 
 
 
Explicação: 
O Hadoop tem em sua composição inicial o MapReduce e o HDFS, porém necessita de mais 
ferramentas para atender as necessidades do trabalho com Big Data 
 
 
 
 
 3a Questão 
 
Sobre o MapReduce podemos afirmar que: 
 
 
A função Reduce é a responsável pelo processamento a partir das buscas em 
paralelo 
 É um modelo genérico de programação 
 
Usou recursos das linguagens funcionais: Map, Reduce e C 
 
Permite a distribuição do processamento, mas não a junção dos resultados 
 
Combina recursos existentes nas linguagens procedurais das quais se originou 
Respondido em 05/09/2019 18:18:14 
 
 
Explicação: 
 
O MapReduce é um modelo genérico de programação. Ele recebeu esse nome por 
conta da combinação entre os recursos existentes das linguagens funcionais que foram 
usadas, sendo eles o Map e o Reduce. 
 
 
 
 
 
 4a Questão 
 
São justificativas para o uso do Big Data em ambinete de computação distribuída, exceto: 
 
 
Flexibilidade quanto ao uso do processamento das aplicações de acordo com a real 
necessidade 
 
Eliminação do ponto único de falha 
 Facilidade no gerenciamento dos recursos computacionais 
 
Processamento de grandes massas de dados 
 
Uso do paralelismo no processamento de consultas 
Respondido em 05/09/2019 18:18:19 
 
 
Explicação: 
Há um aumento da complexidade no gerenciamento dos recursos computacionais, mas a 
desvantagem é superada em muito pelas vantagens obtidas pelo uso da computação 
distribuída5a Questão 
 
O Hadoop é? 
 
 Engloba um conjunto de produtos que permite o processamento de aplicações Big 
Data 
 
O projeto está apoiado em dois componentes principais: o Map e o Reduce 
 
Um banco de dados orientado a objetos 
 
É um projeto administrado atualmente pelo Google 
 
É um banco de dados NOSQL amplamente usado em Big Data 
Respondido em 05/09/2019 18:18:29 
 
 
Explicação: 
O Hadoop engloba um conjunto de produtos que permite processar o Big Data, por meio 
de um processamento de dados paralelo nos nós de computação, com uma aceleração no 
processamento, com diminuição da latência e altamente escalável. 
 
 
 
 
 
 6a Questão 
 
Assinale a alternativa que NÃO apresenta 2 ferramentas ou componentes usados no 
framework Hadoop: 
 
 
Ambari e Mahout 
 Hive e Neo4J 
 
ZooKeeper e Chukwa 
 
Pig e Hive 
 
MapReduce e HDFS 
Respondido em 05/09/2019 18:18:33 
 
 
Explicação: 
O Neo4J é um banco de dados NOSQL baseado em grafos 
 
1a Questão 
 
Não é um exemplo de dados não estruturado: 
 
 
Dados móveis (smartphones) 
 
Dados multimídia 
 Dados financeiros e cadastros diversos 
 
Redes sociais 
 
Dados de sites 
Respondido em 05/09/2019 18:09:11 
 
 
Explicação: 
Algumas fontes de dados estruturados são: os sistemas de relacionamento de clientes 
(CRM), dados financeiros e cadastros diversos, entre outros. 
 
 
 
 
 2a Questão 
 
São exemplos de dados gerados com intervenção humana, exceto: 
 
 
Dados obtidos via jogos 
 
Dados de preenchimento de formulários de sistemas de informação 
 
Dados de fluxo de cliques 
 Web log data 
 
Dados empresariais 
Respondido em 05/09/2019 18:09:19 
 
 
Explicação: 
Web log data: quando servidores, aplicativos, redes e outros operam, eles capturam 
todos os tipos de dados sobre suas atividades. Isso normalmente produz enormes volumes 
de dados que podem ser usadas posteriormente para análises, como por exemplo, verificar 
o andamento de contratos de nível de serviço ou avaliar violações de segurança. 
 
 
 
 
 
 3a Questão 
 
São exemplos de dados gerados sem intervenção humana, exceto: 
 
 
Etiquetas Radio Frequency ID (RFID) 
 Dados obtidos via jogos 
 
Dispositivos médicos 
 
Medidores inteligentes 
 
Dados gerados por GPS 
Respondido em 05/09/2019 18:10:29 
 
 
Explicação: 
Dados obtidos via jogos: os movimentos realizados em um jogo podem ser gravados. Esses 
dados podem ser analisados para avaliar a eficiência dos jogos de acordo com o nível do 
jogador 
 
 
 
 
 4a Questão 
 
Assinale a afirmativa que não apresenta uma característica do HBase: 
 
 
Alta velocidade 
 Suporte ACID 
 
Alta disponibilidade 
 
Divisão e redistribuição automática do conteúdo 
 
Alta taxa de trocas de dados 
Respondido em 05/09/2019 18:11:10 
 
 
Explicação: 
Embora não seja uma implementação ¿ACID¿, o HBase oferece leituras e gravações muito 
consistentes 
 
 
 
 
 5a Questão 
 
Sobre o HDFS podemos afirmar que: 
 
 A coleção completa de todos os arquivos no cluster é denominada de Namenode 
 
O sistema de arquivos inclui um serviço denominado "namenode" e vários nós de 
dados ou "datanodes" 
 
O Namenode rastreia o local onde os dados estão fisicamente 
 
Funciona divindo arquivos grandes em pedaços menores denominados blocos 
 
É um cluster tolerantes a falhas e direcionado para o gerenciamento de arquivos 
para Big Data 
Respondido em 05/09/2019 18:11:31 
 
 
Explicação: 
O NameNode também atua como um semáforo, gerenciando por completo o acesso aos 
arquivos por meio de tarefas como leituras, gravações, criação, exclusão e replicação dos 
blocos de dados nesses nós de dados. A coleção completa de todos os arquivos no cluster é 
chamada de namespace do sistema de arquivos 
 
 
 
 
 6a Questão 
 
Marque a opção que apresenta um exemplo de formato semiestruturado: 
 
 JSON 
 
HTML 5 
 
XLS 
 
SQL 
 
CSV 
Respondido em 05/09/2019 18:11:34 
 
 
Explicação: 
O arquivo JSON (JavaScript Object Notation) também é formado por dados 
semiestruturados e possui um formato leve para o tráfego de dados, necessitando de 
menos bytes que o arquivo XML, o que é importante quando é necessário o tráfego de 
grandes quantidades de dados. 
 
 1a Questão 
 
Como fatores positivos desse modelo surge a maior consistência pois as leituras paralelas 
são executadas por processos paralelizados na ordem sequencial. O modelo NOSQL em 
questão é? 
 
 
Orientado a documentos 
 
Baseado em grafos 
 
Baseado em linhas 
 
Chave-valor 
 Colunar 
Respondido em 05/09/2019 18:02:05 
 
 
Explicação: 
É um avanço do modelo baseado em chave-valor, observando que na hipótese de se ter 
um conjunto de pares chave sem um critério organizacional pequeno o suficiente, pode 
acarretar problemas. Assim, para agrupar os pares, foi definido que pares chave-valor 
poderiam ser agrupados horizontalmente. Nesse contexto, aparece também a definição de 
superfamília de colunas que é o par chave-valor composto por um id (identificador) e um 
grupo de colunas. Como fatores positivos do modelo surge a maior consistência pois as 
leituras paralelas são executadas por processos paralelizados na ordem sequencial. 
 
 
 
 
 
 2a Questão 
 
Sobre o conceito Schemaless (sem esquema) podemos afirmar que: 
 
 
O recurso é aplicado apenas nos bancos de dados baseados em grafos 
 
O armazenamento dos dados não precisa de uma estrutura pré-definida, mas 
precisa ser normalizado 
 Indica que a base de dados não possui uma estrutura fixa, ou seja, os dados não 
tem estrutura pré-definida 
 
O banco de dados não precisa de um esquema conceitual 
 
O banco de dados não necessida de um projeto físico 
Respondido em 05/09/2019 18:02:18 
 
 
Explicação: 
Esquema livre (schema free) indica que a base de dados não possui uma estrutura fixa, ou 
seja, os dados não têm estrutura pré-definida. 
 
 
 
 
 3a Questão 
 
A afirmativa faz referência a que modelo NOSQL? "Os documentos são compostos por um 
identificador e um valor" 
 
 
Relacional-objeto 
 
Chave-valor 
 Orientado a documentos 
 
Baseado em grafos 
 
Colunar 
Respondido em 05/09/2019 18:02:29 
 
 
Explicação: 
Um registro na base de dados faz relação com um documento. Em sua composição, os 
documentos normalmente são compostos por um identificador e um valor. No valor é 
pode-se introduzir outros identificadores acompanhados de valores. As vantagens deste 
modelo podem ser listadas como a capacidade de suportar conjuntos de conjuntos de 
pares chave-valor. 
 
 
 
 
 
 4a Questão 
 
Nesse modelo NOSQL comparando-o ao relacional, um registro ou linha é formada por um 
grupo de pares no formato chave-valor: 
 
 
Orientado a colunas 
 
Baseado em grafos 
 
Baseado em objetos 
 
Orientado a documentos 
 Modelo chave-valor 
Respondido em 05/09/2019 18:02:33 
 
 
Explicação: 
Comparativamente, no banco de dados relacional, uma linha da tabela possuir um número 
determinado de atributos, mas agora um registro ou linha é formada por um grupo de 
pares no formato chave-valor, que necessariamente não precisam ter os mesmos pares. A 
grande vantagem do modelo é o fato de ser simples quanto ao uso e codificação, pois uma 
coleção de chaves tem um valor único. 
 
 
 
 
 
 5a Questão 
 
Assinale a alternativa errada sobre bancos de dados NOSQL: 
 
 
Pode ser usado com o PostgreSQL 
 Há a necessidadede que os dados tenham uma estrutura pré-definida 
 
É schemaless ou schema free 
 
Pode ser usado para armazenar dados de documentos 
 
São baseados no Teorema CAP 
Respondido em 05/09/2019 18:03:01 
 
 
Explicação: 
Esquema livre (schema free) indica que a base de dados não possui uma estrutura fixa, ou 
seja, os dados não têm estrutura pré-definida. 
 
 
 
 
 6a Questão 
 
Marque a opção que apresenta as categorias de bases de dados no modelo NOSQL: 
 
 
JSON, XML, grafos e colunas 
 Chave-valor, orientado a documentos, grafos e colunas 
 
Orientado a objetos, documentos, colunas e chaves de valores 
 
Orientado a linhas, colunas, grafos e documentos 
 
Baseado em grafos, colunas, objetos e documentos 
Respondido em 05/09/2019 18:03:08 
 
 
Explicação: 
Podemos avaliar que os bancos de dados relacionais representam dados no formato de 
tabelas que consistem em um número de linhas para seus registros, no entanto os bancos 
NOSQL são coleções de pares chave-valor, bancos de dados em grafos, documentos ou 
ainda armazenamentos em coluna e, que não necessitam de esquemas para o seus 
projetos. 
 
1a Questão 
 
Assinale a afirmativa incorreta em relação as características principais do MongoDb: 
 
 
Os valores dos campos podem incluir outros documentos, matrizes e matrizes de 
documentos 
 
Não tem suporte a transações como no BD relacional 
 
Possui fácil escalonamento 
 
Seu uso é adequado para aplicações que gerenciam redes sociais 
 Seu uso é adequado para aplicações de bancos de dados colunares 
Respondido em 05/09/2019 14:00:33 
 
 
Explicação: 
O SGBD NoSQL MongoDB é um sistema de gerenciamento de bancos de dados orientados a 
documentos, de esquema flexível e de código livre, desenvolvido na linguagem C++, que 
tem como características a velocidade, a eficiência e a escalabilidade. 
 
 
 
 
 2a Questão 
 
Entre as vantagens no uso do formato de dados como documentos temos, exceto: 
 
 
Correspondem a tipos de dados nativos em muitas linguagens de programação 
 
Possui esquema dinâmico que suporta o polimorfismo 
 
Documentos e matrizes incorporados reduzem a necessidade de junções custosas 
 Tem uma estrutura pré-definida 
 
O banco de dados não necessita de um esquema 
Respondido em 05/09/2019 14:00:42 
 
 
Explicação: 
Um documento não precisa de uma estrutura pré-definida ou o banco de dados não 
necessita de um esquema, eles são considerados como auto descritivos. 
 
 
 
 
 3a Questão 
 
A unidade de armazenamento em um BD orientado a documentos, que é similar ao 
documento no modelo relacional é? 
 
 
Coluna 
 
Tabela 
 
Atributo 
 
Array 
 Registro 
Respondido em 05/09/2019 14:00:48 
 
 
Explicação: 
Dessa forma, documento representa a unidade de armazenamento de dados, que nos 
sistemas gerenciadores de bancos de dados relacionais seriam chamados de registros ou 
linhas. 
 
 
 
 
 4a Questão 
 
São características do MongoDB, com exceção de: 
 
 
É multiplataforma e também funciona no Windows 
 Não trabalha com o MapReduce para a agregação de coleções 
 
É eficaz para aplicações de análise em tempo real 
 
Usa um recurso chamado de cursor que funciona como um ponteiro para os dados 
 
A replicação de dados é garantida através de bloqueios e pelo modelo mestre-
escravo assíncrono 
Respondido em 05/09/2019 14:01:04 
 
 
Explicação: 
O MongoDB também é um ecossistema que consiste nos seguintes elementos: 
• Serviços de alta disponibilidade e replicação para escalonamento em redes locais e 
de longa distância; 
• Um sistema de arquivos baseado em grid, permitindo o armazenamento de objetos 
grandes dividindo-os entre vários documentos. 
• MapReduce para suportar análises e agregação de diferentes coleções / 
documentos. 
 
 
 
 
 5a Questão 
 
Sobre os bancos de dados orientados a documentos podemos afirmar que, exceto: 
 
 
Entre os formatos para um documento podemos ter o XML, JSON, BSON e o YAML 
 
São exemplos desses bancos de dados o MongoDB, o RavenDB e o CouchDB 
 
Os documentos devem ser organizados em coleções de documentos semelhantes 
 Entre os formatos para um documento podemos ter o XML e o JSON, apenas 
 
Não há restrições quanto ao número de campos no documento 
Respondido em 05/09/2019 14:01:13 
 
 
Explicação: 
Quanto ao formato de um documento, esses podem ser codificados de diferentes 
formatos, como: XML, JSON, BSON, YAML ou ainda com textos simples. 
 
 
 
 
 6a Questão 
 
São exemplos de SGBDs orientados a documentos, exceto: 
 
 
NEO4J 
 
RavenDB 
 HBase 
 
CouchDB 
 
MongoDB 
Respondido em 05/09/2019 14:01:18 
 
 
Explicação: 
Como exemplos desses bancos de dados podemos citar o MongoDB, RavenDB e o 
CouchDB, todos orientados a documentos

Continue navegando