Baixe o app para aproveitar ainda mais
Prévia do material em texto
1a Questão Marque a opção que apresenta o conjunto correto de dimensões Big Data: Volume, variedade, estabilidade e complexidade Velocidade, variedade, variabilidade e simplicidade Volume, velocidade, variedade, variabilidade e complexidade Estabilidade, velocidade, variedade e complexidade Volume, velocidade, variedade, previsibilidade e simplicidade Respondido em 16/03/2020 22:02:27 Explicação: Com a evolução do uso do Big Data, outros ¿Vs¿ além do Volume, Velocidade e Variedade descritos anteriormente, foram surgindo para melhor caracterizar a tecnologia ou atualizar seus conceitos. Podem ser listadas mais duas dimensões a Variabilidade e a Complexidade. 2a Questão Em relação ao volume de dados trabalhado em Big Data, em termos de medidas, o intervalo pode variar de: Terabytes - Exabytes Petabytes - Exabytes Gigabytes - Terabytes Megabytes - Gigabytes Acima de exabytes, somente Respondido em 16/03/2020 22:01:45 Explicação: Considera-se que os limites de volumes de dados trabalhados em Big Data sejam entre terabytes (1012 bytes) ou petabytes (1015 bytes) até exabytes (1018 bytes). 3a Questão Assinale a alternativa que apresenta uma opção que justifica o aumento da quantidade de dados na sociedade, exceto: Sistemas de músicas on-line Todas as opções estão corretas Bancos de vídeos Disponibilização de hardwares avançados Bases de imagens Respondido em 16/03/2020 22:02:39 Explicação: A disponibilização de hardwares avançados e recursos de redes como a internet, tem possibilitado o armazenamento de dados em diferentes formatos: textos, vídeos, músicas, imagens, etc. Como consequência, o volume de dados disponível para uso da sociedade e empresas não para de crescer. 4a Questão Marque a opção que apresenta técnicas usadas pela Ciência de Dados: Banco de dados, algoritmos de mineração de dados, inteligência artificial, linguagens de script, programação e Big Data Banco de dados, estatística, algoritmos de mineração de dados, inteligência artificial, linguagens de script e programação Estatística, algoritmos de mineração de dados, inteligência artificial, linguagens de script, programação e Big Data Banco de dados, Mineração de dados, inteligência artificial, linguagens de script, programação e Big Data Banco de dados, estatística, algoritmos de mineração de dados, inteligência artificial, linguagens de script, programação e Big Data Respondido em 16/03/2020 22:04:22 Explicação: A Ciência de Dados é a expressão usada o trabalho que usa um conjunto de técnicas de banco de dados, estatística, algoritmos de mineração de dados, inteligência artificial, linguagens de script, programação e Big Data para extrair informações relevantes a partir dos dados brutos ou originais. 5a Questão São tipos de uso do Big Data nas empresas, exceto: Identificação de tentativas de fraudes Geração de descontos em pontos de vendas para clientes cadastrados com base em hábitos de compra Acompanhamento do processamento eletrônico de documentos em órgãos do governo Gerenciamento do relacionamento com clientes no setor de varejo Para gerenciar transações baseadas em bancos de dados relacionais Respondido em 16/03/2020 22:03:15 Explicação: É importante destacar que tal volume de dados excede o volume tradicionalmente tratado pelos sistemas gerenciadores de bancos de dados relacionais. 6a Questão São vantagens do Big Data, exceto: Não é adequado para uso em órgãos governamentais, mesmo com o projeto de implantação do "governo digital" Economia de tempo de marketing Promove a tomada de decisões com mais inteligência Redução do total de custos de investimento Economia nos custos operacionais da empresa Sobre o big data, é correto o que se afirma em: Descreve apenas dados não estruturados Concentra-se no que pode ser feito com os dados. Cuida apenas de pequenas quantidades de dados. Concentra-se na quantidade de dados armazenados. Descreve apenas dados estruturados. Explicação: O big data descreve os grandes volumes de dados, incluindo os dados estruturados e os não estruturados. Tais dados são gerados e armazenados nas empresas diariamente, além de sobrecarregá- las em relação à necessidade de espaço para armazenamento e às dificuldades para a geração de conhecimento. Grandes volumes de dados excedem o volume tradicionalmente tratado pelos sistemas gerenciadores de bancos de dados relacionais. Mas não é a quantidade de dados disponível o que mais importa. O importante é o que pode ser feito com esses dados. 2. Dentre as opções abaixo, selecione a verdadeira em relação ao trabalho de um cientista de dados. Cria novos tipos de dados para linguagens de programação. Preocupa-se com o armazenamento de dados, não com sua qualidade. Não trabalha com dados brutos, apenas informações já processadas. Deve se preocupar apenas com os dados de sua empresa. Cuida do processamento de grandes quantidades de dados. Explicação: O cientista de dados executa o processamento de grandes quantidades de dados, tanto nos dados das empresas onde trabalham como nos dados disponíveis na nuvem. Assim, o cientista de dados deve possuir competência para capturar e analisar a qualidade de dados, padronizar e organizar, para depois analisar os dados, extraindo padrões que possam ser analisados por especialistas ou compreendidos para uso em processo de tomada de decisão nas organizações. http://simulado.estacio.br/bdq_simulados_exercicio.asp 3. São vantagens do Big Data, exceto: Promove a tomada de decisões com mais inteligência Economia nos custos operacionais da empresa Economia de tempo de marketing Não é adequado para uso em órgãos governamentais, mesmo com o projeto de implantação do "governo digital" Redução do total de custos de investimento Explicação: Big Data permite um avanço significativo em relação ao modo de gestão dos serviços públicos. Com o ¿governo digital¿ e o processamento eletrônico de documentos, os órgãos de fiscalização podem acompanhar automaticamente identificando assim, atividades suspeitas que indiquem indícios de atos de corrupção, lidando com mais recursos legais para sua atuação e posterior autuação. 4. Marque a opção que apresenta o conjunto correto de dimensões Big Data: Velocidade, variedade, variabilidade e simplicidade Volume, variedade, estabilidade e complexidade Volume, velocidade, variedade, variabilidade e complexidade Volume, velocidade, variedade, previsibilidade e simplicidade Estabilidade, velocidade, variedade e complexidade Explicação: Com a evolução do uso do Big Data, outros ¿Vs¿ além do Volume, Velocidade e Variedade descritos anteriormente, foram surgindo para melhor caracterizar a tecnologia ou atualizar seus conceitos. Podem ser listadas mais duas dimensões a Variabilidade e a Complexidade. 5. Assinale a alternativa que apresenta uma opção que justifica o aumento da quantidade de dados na sociedade, exceto: Todas as opções estão corretas http://simulado.estacio.br/bdq_simulados_exercicio.asp http://simulado.estacio.br/bdq_simulados_exercicio.asp http://simulado.estacio.br/bdq_simulados_exercicio.asp Sistemas de músicas on-line Bancos de vídeos Disponibilização de hardwares avançados Bases de imagens Explicação: A disponibilização de hardwares avançados e recursos de redes como a internet, tem possibilitado o armazenamentode dados em diferentes formatos: textos, vídeos, músicas, imagens, etc. Como consequência, o volume de dados disponível para uso da sociedade e empresas não para de crescer. 6. Como o volume de dados gerado é normalmente elevado, a tecnologia Big Data agiliza a análise dos dados históricos, prevenindo ações com base nas ocorrências anteriores. A afirmação acima refere-se a utilização do big data para: Utilização por órgãos governamentais. Determinar a causa de falhas, problemas e defeitos em tempo real. Geração de descontos nos pontos de venda para clientes cadastrados com base em hábitos de compra. Armazenamento de arquivos de vídeo. Aplicação no setor de varejo. Explicação: Os dados produzidos pelos sensores de calor, volume, umidade, entre outros, podem ser usados para prevenir falhas em equipamentos ou estruturas. Como o volume de dados gerado é normalmente elevado, a tecnologia Big Data agiliza a análise dos dados históricos, prevenindo ações com base nas ocorrências anteriores. http://simulado.estacio.br/bdq_simulados_exercicio.asp Sobre o big data, é correto o que se afirma em: Descreve apenas dados não estruturados Concentra-se no que pode ser feito com os dados. Cuida apenas de pequenas quantidades de dados. Descreve apenas dados estruturados. Concentra-se na quantidade de dados armazenados. Explicação: O big data descreve os grandes volumes de dados, incluindo os dados estruturados e os não estruturados. Tais dados são gerados e armazenados nas empresas diariamente, além de sobrecarregá- las em relação à necessidade de espaço para armazenamento e às dificuldades para a geração de conhecimento. Grandes volumes de dados excedem o volume tradicionalmente tratado pelos sistemas gerenciadores de bancos de dados relacionais. Mas não é a quantidade de dados disponível o que mais importa. O importante é o que pode ser feito com esses dados. 2. Dentre as opções abaixo, selecione a verdadeira em relação ao trabalho de um cientista de dados. Cria novos tipos de dados para linguagens de programação. Cuida do processamento de grandes quantidades de dados. Deve se preocupar apenas com os dados de sua empresa. Preocupa-se com o armazenamento de dados, não com sua qualidade. Não trabalha com dados brutos, apenas informações já processadas. Explicação: O cientista de dados executa o processamento de grandes quantidades de dados, tanto nos dados das empresas onde trabalham como nos dados disponíveis na nuvem. Assim, o cientista de dados deve possuir competência para capturar e analisar a qualidade de dados, padronizar e organizar, para depois analisar os dados, extraindo padrões que possam ser analisados por especialistas ou compreendidos para uso em processo de tomada de decisão nas organizações. http://simulado.estacio.br/bdq_simulados_exercicio.asp 3. Como o volume de dados gerado é normalmente elevado, a tecnologia Big Data agiliza a análise dos dados históricos, prevenindo ações com base nas ocorrências anteriores. A afirmação acima refere-se a utilização do big data para: Geração de descontos nos pontos de venda para clientes cadastrados com base em hábitos de compra. Aplicação no setor de varejo. Utilização por órgãos governamentais. Armazenamento de arquivos de vídeo. Determinar a causa de falhas, problemas e defeitos em tempo real. Explicação: Os dados produzidos pelos sensores de calor, volume, umidade, entre outros, podem ser usados para prevenir falhas em equipamentos ou estruturas. Como o volume de dados gerado é normalmente elevado, a tecnologia Big Data agiliza a análise dos dados históricos, prevenindo ações com base nas ocorrências anteriores. 4. São vantagens do Big Data, exceto: Não é adequado para uso em órgãos governamentais, mesmo com o projeto de implantação do "governo digital" Economia de tempo de marketing Redução do total de custos de investimento Economia nos custos operacionais da empresa Promove a tomada de decisões com mais inteligência Explicação: Big Data permite um avanço significativo em relação ao modo de gestão dos serviços públicos. Com o ¿governo digital¿ e o processamento eletrônico de documentos, os órgãos de fiscalização podem acompanhar automaticamente identificando assim, atividades suspeitas que indiquem indícios de atos de corrupção, lidando com mais recursos legais para sua atuação e posterior autuação. http://simulado.estacio.br/bdq_simulados_exercicio.asp http://simulado.estacio.br/bdq_simulados_exercicio.asp 5. Assinale a alternativa que apresenta uma opção que justifica o aumento da quantidade de dados na sociedade, exceto: Disponibilização de hardwares avançados Todas as opções estão corretas Sistemas de músicas on-line Bases de imagens Bancos de vídeos Explicação: A disponibilização de hardwares avançados e recursos de redes como a internet, tem possibilitado o armazenamento de dados em diferentes formatos: textos, vídeos, músicas, imagens, etc. Como consequência, o volume de dados disponível para uso da sociedade e empresas não para de crescer. 6. Marque a opção que apresenta o conjunto correto de dimensões Big Data: Velocidade, variedade, variabilidade e simplicidade Volume, velocidade, variedade, previsibilidade e simplicidade Estabilidade, velocidade, variedade e complexidade Volume, velocidade, variedade, variabilidade e complexidade Volume, variedade, estabilidade e complexidade Explicação: Com a evolução do uso do Big Data, outros ¿Vs¿ além do Volume, Velocidade e Variedade descritos anteriormente, foram surgindo para melhor caracterizar a tecnologia ou atualizar seus conceitos. Podem ser listadas mais duas dimensões a Variabilidade e a Complexidade. http://simulado.estacio.br/bdq_simulados_exercicio.asp http://simulado.estacio.br/bdq_simulados_exercicio.asp Marque a opção que apresenta 2 vantagens do Hadoop: Rápido acesso aos dados / Aumento linear da escalabilidade Processa grandes volumes de dados em ambiente paralelo / Facilita a execução de agregação de grandes bancos de dados por meio do Reduce É usado mesmo quando o processamento não é paralelo / Facilita operações ETL em larga escala Permite o processamento de grandes datasets em paralelo / É bom para o processamento transacional Permite o trabalho com uma variedade de tipos de dados / É bom mesmo com lotes de dados pequenos Respondido em 24/05/2020 15:52:44 Explicação: Duas das prinicipais vantagens do Hadoo são o processamento massivo de grandes volumes de dados e a agregação de grandes bancos de dados com o uso da função Reduce 2a Questão O MapReduce possibilita o processamento de grandes massas baseando-se: Na expansão da capacidade de armazenamento. Na velocidade dos novos processadores. No talento dos programadores. Na capacidade de processamento de dados em paralelo. No processamento centralizado dos dados. Respondido em 24/05/2020 15:53:25 Explicação: O MapReduce surgiu, permitindo que desenvolvedores pudessem escrever seus programas para o processamento de grandes massas de dados em paralelo, com o uso de conjuntos distribuídos de processadores, não somente por meio de clusters, mas também para execução com aplicações sendo processadas no ambiente de computação em nuvem. 3a Questão Marque a opção que apresenta a composição inicial do Hadoop: MapReduce e YARN HDFS e Hive YARN e HDFS HDFS e HBase MapReduce e HDFS Respondido em24/05/2020 15:53:52 Explicação: O Hadoop tem em sua composição inicial o MapReduce e o HDFS, porém necessita de mais ferramentas para atender as necessidades do trabalho com Big Data 4a Questão É uma desvantagem do Hadoop: Manipula dados estruturados, não estruturados ou semiestruturados. Não é bom para processamento de pequenos lotes de dados. Requer hardware caro e robusto. Processamento massivo de dados. Escalabilidade linear para tender volumes maiores. Respondido em 24/05/2020 15:54:20 Explicação: Vantagens do Hadoop: Processamento massivo de grandes volumes de dados com paralelismo. Muitos arquivos que são pequenos com menos de 100 MB devem ser evitados. O MapReduce funciona melhor com um número menor de arquivos grandes; A velocidade de transferência é um recurso que vem aumentando, permitindo o uso da tecnologia; A taxa de busca em disco é um fator limitante em sistemas que tratam de grandes bancos de dados, pois a velocidade depende da estrutura mecânica do disco; Manipular uma variedade de tipos de dados (estruturados, não estruturados ou semiestruturados) e no formato chave-valor com mais facilidade; Uso de hardware de baixo custo; Execução de agregação em grandes bancos de dados: o Reduce é muito útil nessa tarefa; Operações de ETL em larga escala (Extract, Transform and Load); Aumento linear da escalabilidade para atender a maiores volumes de dados, se necessário; Permite o processamento de grandes datasets em paralelo. Desvantagens do Hadoop: Processamento transacional (acesso randômico); Quando o trabalho não pode ser paralelizado; Acesso rápido aos dados; Processamento de lotes de dados pequenos; Cálculos intensos aplicados em pequenas quantidades de dados. 5a Questão Sobre o MapReduce podemos afirmar que: Combina recursos existentes nas linguagens procedurais das quais se originou É um modelo genérico de programação Permite a distribuição do processamento, mas não a junção dos resultados Usou recursos das linguagens funcionais: Map, Reduce e C A função Reduce é a responsável pelo processamento a partir das buscas em paralelo Respondido em 24/05/2020 15:54:34 Explicação: O MapReduce é um modelo genérico de programação. Ele recebeu esse nome por conta da combinação entre os recursos existentes das linguagens funcionais que foram usadas, sendo eles o Map e o Reduce. 6a Questão São justificativas para o uso do Big Data em ambinete de computação distribuída, exceto: Flexibilidade quanto ao uso do processamento das aplicações de acordo com a real necessidade Eliminação do ponto único de falha Facilidade no gerenciamento dos recursos computacionais Uso do paralelismo no processamento de consultas Processamento de grandes massas de dados Respondido em 24/05/2020 15:54:31 Explicação: Há um aumento da complexidade no gerenciamento dos recursos computacionais, mas a desvantagem é superada em muito pelas vantagens obtidas pelo uso da computação distribuída 7a Questão O Hadoop é? Engloba um conjunto de produtos que permite o processamento de aplicações Big Data É um banco de dados NOSQL amplamente usado em Big Data O projeto está apoiado em dois componentes principais: o Map e o Reduce É um projeto administrado atualmente pelo Google Um banco de dados orientado a objetos Respondido em 24/05/2020 15:54:25 Explicação: O Hadoop engloba um conjunto de produtos que permite processar o Big Data, por meio de um processamento de dados paralelo nos nós de computação, com uma aceleração no processamento, com diminuição da latência e altamente escalável. 8a Questão Assinale a alternativa que NÃO apresenta 2 ferramentas ou componentes usados no framework Hadoop: MapReduce e HDFS Hive e Neo4J Ambari e Mahout ZooKeeper e Chukwa Pig e Hive Respondido em 24/05/2020 15:55:14 Explicação: O Neo4J é um banco de dados NOSQL baseado em grafos Marque a opção que apresenta a composição inicial do Hadoop: HDFS e Hive YARN e HDFS MapReduce e YARN HDFS e HBase MapReduce e HDFS Explicação: O Hadoop tem em sua composição inicial o MapReduce e o HDFS, porém necessita de mais ferramentas para atender as necessidades do trabalho com Big Data 2. Marque a opção que apresenta 2 vantagens do Hadoop: Permite o trabalho com uma variedade de tipos de dados / É bom mesmo com lotes de dados pequenos É usado mesmo quando o processamento não é paralelo / Facilita operações ETL em larga escala Permite o processamento de grandes datasets em paralelo / É bom para o processamento transacional Rápido acesso aos dados / Aumento linear da escalabilidade Processa grandes volumes de dados em ambiente paralelo / Facilita a execução de agregação de grandes bancos de dados por meio do Reduce Explicação: Duas das prinicipais vantagens do Hadoo são o processamento massivo de grandes volumes de dados e a agregação de grandes bancos de dados com o uso da função Reduce 3. O Hadoop é? O projeto está apoiado em dois componentes principais: o Map e o Reduce É um banco de dados NOSQL amplamente usado em Big Data http://simulado.estacio.br/bdq_simulados_exercicio.asp http://simulado.estacio.br/bdq_simulados_exercicio.asp É um projeto administrado atualmente pelo Google Engloba um conjunto de produtos que permite o processamento de aplicações Big Data Um banco de dados orientado a objetos Explicação: O Hadoop engloba um conjunto de produtos que permite processar o Big Data, por meio de um processamento de dados paralelo nos nós de computação, com uma aceleração no processamento, com diminuição da latência e altamente escalável. 4. O MapReduce é baseado no paradigma funcional porque: Realiza as operações de busca sequencialmente. As operações nos dados são dependentes umas das outras. Possibilita o processamento centralizado dos dados. A ordem do processamento não é fundamental. É a nova tendência de programação. Explicação: No paradigma funcional, a ordem do processamento não é fundamental, por causa da independência entre as operações. Com isso, é possível efetuar a distribuição de processamento e a posterior junção dos resultados (Reduce). 5. O MapReduce possibilita o processamento de grandes massas baseando-se: Na expansão da capacidade de armazenamento. No talento dos programadores. Na capacidade de processamento de dados em paralelo. No processamento centralizado dos dados. http://simulado.estacio.br/bdq_simulados_exercicio.asp http://simulado.estacio.br/bdq_simulados_exercicio.asp Na velocidade dos novos processadores. Explicação: O MapReduce surgiu, permitindo que desenvolvedores pudessem escrever seus programas para o processamento de grandes massas de dados em paralelo, com o uso de conjuntos distribuídos de processadores, não somente por meio de clusters, mas também para execução com aplicações sendo processadas no ambiente de computação em nuvem. 6. É uma desvantagem do Hadoop: Manipula dados estruturados, não estruturados ou semiestruturados. Requer hardware caro e robusto. Escalabilidade linear para tender volumes maiores. Não é bom para processamento de pequenos lotes de dados. Processamento massivo de dados. Explicação: Vantagens do Hadoop: Processamento massivo de grandes volumes de dados com paralelismo. Muitos arquivos que são pequenos com menosde 100 MB devem ser evitados. O MapReduce funciona melhor com um número menor de arquivos grandes; A velocidade de transferência é um recurso que vem aumentando, permitindo o uso da tecnologia; A taxa de busca em disco é um fator limitante em sistemas que tratam de grandes bancos de dados, pois a velocidade depende da estrutura mecânica do disco; Manipular uma variedade de tipos de dados (estruturados, não estruturados ou semiestruturados) e no formato chave-valor com mais facilidade; Uso de hardware de baixo custo; Execução de agregação em grandes bancos de dados: o Reduce é muito útil nessa tarefa; Operações de ETL em larga escala (Extract, Transform and Load); Aumento linear da escalabilidade para atender a maiores volumes de dados, se necessário; Permite o processamento de grandes datasets em paralelo. Desvantagens do Hadoop: Processamento transacional (acesso randômico); Quando o trabalho não pode ser paralelizado; Acesso rápido aos dados; Processamento de lotes de dados pequenos; Cálculos intensos aplicados em pequenas quantidades de dados. http://simulado.estacio.br/bdq_simulados_exercicio.asp Marque a opção que apresenta um exemplo de formato semiestruturado: XLS HTML 5 CSV SQL JSON Explicação: O arquivo JSON (JavaScript Object Notation) também é formado por dados semiestruturados e possui um formato leve para o tráfego de dados, necessitando de menos bytes que o arquivo XML, o que é importante quando é necessário o tráfego de grandes quantidades de dados. 2. É exemplo de dado estruturado: Arquivo XML. Mensagem de texto. Arquivo de vídeo. Catálogo de clientes. Conteúdo da Web. Explicação: O formato para o armazenamento de dados nos modelos de dados iniciais foi desenvolvido baseados em dados estruturados. Tais termos possuem tamanho e formato definidos. 3. Assinale a afirmativa que não apresenta uma característica do HBase: Alta taxa de trocas de dados http://simulado.estacio.br/bdq_simulados_exercicio.asp http://simulado.estacio.br/bdq_simulados_exercicio.asp Alta disponibilidade Suporte ACID Divisão e redistribuição automática do conteúdo Alta velocidade Explicação: Embora não seja uma implementação ¿ACID¿, o HBase oferece leituras e gravações muito consistentes 4. O HBASE é um banco de dados: Relacional. XML. Orientado a colunas. JSON. Orientado a tabelas. Explicação: O HBase é um banco de dados orientado por colunas e usa o arquivo MapReduce do Hadoop. O mapeamento do banco é indexado por uma chave de linha, uma chave de coluna e um registro de data e hora. 5. São exemplos de dados gerados sem intervenção humana, exceto: Dados obtidos via jogos Dispositivos médicos Etiquetas Radio Frequency ID (RFID) Medidores inteligentes Dados gerados por GPS http://simulado.estacio.br/bdq_simulados_exercicio.asp http://simulado.estacio.br/bdq_simulados_exercicio.asp Explicação: Dados obtidos via jogos: os movimentos realizados em um jogo podem ser gravados. Esses dados podem ser analisados para avaliar a eficiência dos jogos de acordo com o nível do jogador 6. Sobre o HDFS podemos afirmar que: A coleção completa de todos os arquivos no cluster é denominada de Namenode O Namenode rastreia o local onde os dados estão fisicamente É um cluster tolerantes a falhas e direcionado para o gerenciamento de arquivos para Big Data Funciona divindo arquivos grandes em pedaços menores denominados blocos O sistema de arquivos inclui um serviço denominado "namenode" e vários nós de dados ou "datanodes" Explicação: O NameNode também atua como um semáforo, gerenciando por completo o acesso aos arquivos por meio de tarefas como leituras, gravações, criação, exclusão e replicação dos blocos de dados nesses nós de dados. A coleção completa de todos os arquivos no cluster é chamada de namespace do sistema de arquivos 7. São exemplos de dados gerados com intervenção humana, exceto: Dados obtidos via jogos Web log data Dados de fluxo de cliques Dados empresariais Dados de preenchimento de formulários de sistemas de informação Explicação: http://simulado.estacio.br/bdq_simulados_exercicio.asp http://simulado.estacio.br/bdq_simulados_exercicio.asp Web log data: quando servidores, aplicativos, redes e outros operam, eles capturam todos os tipos de dados sobre suas atividades. Isso normalmente produz enormes volumes de dados que podem ser usadas posteriormente para análises, como por exemplo, verificar o andamento de contratos de nível de serviço ou avaliar violações de segurança. 8. Não é um exemplo de dados não estruturado: Dados móveis (smartphones) Dados de sites Dados multimídia Redes sociais Dados financeiros e cadastros diversos Explicação: Algumas fontes de dados estruturados são: os sistemas de relacionamento de clientes (CRM), dados financeiros e cadastros diversos, entre outros. http://simulado.estacio.br/bdq_simulados_exercicio.asp Não é um exemplo de dados não estruturado: Dados financeiros e cadastros diversos Dados multimídia Redes sociais Dados móveis (smartphones) Dados de sites Explicação: Algumas fontes de dados estruturados são: os sistemas de relacionamento de clientes (CRM), dados financeiros e cadastros diversos, entre outros. 2. Marque a opção que apresenta um exemplo de formato semiestruturado: HTML 5 SQL JSON XLS CSV Explicação: O arquivo JSON (JavaScript Object Notation) também é formado por dados semiestruturados e possui um formato leve para o tráfego de dados, necessitando de menos bytes que o arquivo XML, o que é importante quando é necessário o tráfego de grandes quantidades de dados. 3. Assinale a afirmativa que não apresenta uma característica do HBase: Divisão e redistribuição automática do conteúdo http://simulado.estacio.br/bdq_simulados_exercicio.asp http://simulado.estacio.br/bdq_simulados_exercicio.asp Alta disponibilidade Alta taxa de trocas de dados Alta velocidade Suporte ACID Explicação: Embora não seja uma implementação ¿ACID¿, o HBase oferece leituras e gravações muito consistentes 4. Sobre o HDFS (Hadoop Distributed File System), assinale a afirmativa FALSA: Voltado para edição concorrente os arquivos por diferentes usuários. É um sistema de arquivos distribuído. É um cluster tolerante a falhas. Voltado para o gerenciamento de arquivos big data. Projetado para trabalhar com dados que são gravados apenas uma vez e lidos várias vezes. Explicação: O HDFS é um cluster com versatilidade, tolerante a falhas e direcionado para o gerenciamento de arquivos voltados para o Big Data. Esse sistema de arquivos apresenta um conjunto de recursos apropriados quando se tem grandes volumes de dados e quando são necessárias altas velocidades no seu manuseio. O sistema foi projetado para trabalhar com dados que são gravados apenas uma vez e, em seguida, efetuadas várias leituras, em vez das leituras e gravações frequentes a partir de outros sistemas de arquivos. 5. É exemplo de dado estruturado: Catálogo de clientes. Mensagem de texto. http://simulado.estacio.br/bdq_simulados_exercicio.asp http://simulado.estacio.br/bdq_simulados_exercicio.aspConteúdo da Web. Arquivo XML. Arquivo de vídeo. Explicação: O formato para o armazenamento de dados nos modelos de dados iniciais foi desenvolvido baseados em dados estruturados. Tais termos possuem tamanho e formato definidos. 6. O HBASE é um banco de dados: JSON. Relacional. XML. Orientado a tabelas. Orientado a colunas. Explicação: O HBase é um banco de dados orientado por colunas e usa o arquivo MapReduce do Hadoop. O mapeamento do banco é indexado por uma chave de linha, uma chave de coluna e um registro de data e hora. http://simulado.estacio.br/bdq_simulados_exercicio.asp É exemplo de dado estruturado: Arquivo de vídeo. Catálogo de clientes. Mensagem de texto. Arquivo XML. Conteúdo da Web. Explicação: O formato para o armazenamento de dados nos modelos de dados iniciais foi desenvolvido baseados em dados estruturados. Tais termos possuem tamanho e formato definidos. 2. O HBASE é um banco de dados: Orientado a colunas. Relacional. JSON. XML. Orientado a tabelas. Explicação: O HBase é um banco de dados orientado por colunas e usa o arquivo MapReduce do Hadoop. O mapeamento do banco é indexado por uma chave de linha, uma chave de coluna e um registro de data e hora. 3. Não é um exemplo de dados não estruturado: Redes sociais Dados de sites http://simulado.estacio.br/bdq_simulados_exercicio.asp http://simulado.estacio.br/bdq_simulados_exercicio.asp Dados financeiros e cadastros diversos Dados móveis (smartphones) Dados multimídia Explicação: Algumas fontes de dados estruturados são: os sistemas de relacionamento de clientes (CRM), dados financeiros e cadastros diversos, entre outros. 4. Marque a opção que apresenta um exemplo de formato semiestruturado: JSON HTML 5 CSV XLS SQL Explicação: O arquivo JSON (JavaScript Object Notation) também é formado por dados semiestruturados e possui um formato leve para o tráfego de dados, necessitando de menos bytes que o arquivo XML, o que é importante quando é necessário o tráfego de grandes quantidades de dados. 5. Assinale a afirmativa que não apresenta uma característica do HBase: Alta disponibilidade Divisão e redistribuição automática do conteúdo Suporte ACID Alta velocidade http://simulado.estacio.br/bdq_simulados_exercicio.asp http://simulado.estacio.br/bdq_simulados_exercicio.asp Alta taxa de trocas de dados Explicação: Embora não seja uma implementação ¿ACID¿, o HBase oferece leituras e gravações muito consistentes 6. Sobre o HDFS (Hadoop Distributed File System), assinale a afirmativa FALSA: É um sistema de arquivos distribuído. É um cluster tolerante a falhas. Voltado para o gerenciamento de arquivos big data. Voltado para edição concorrente os arquivos por diferentes usuários. Projetado para trabalhar com dados que são gravados apenas uma vez e lidos várias vezes. Explicação: O HDFS é um cluster com versatilidade, tolerante a falhas e direcionado para o gerenciamento de arquivos voltados para o Big Data. Esse sistema de arquivos apresenta um conjunto de recursos apropriados quando se tem grandes volumes de dados e quando são necessárias altas velocidades no seu manuseio. O sistema foi projetado para trabalhar com dados que são gravados apenas uma vez e, em seguida, efetuadas várias leituras, em vez das leituras e gravações frequentes a partir de outros sistemas de arquivos. http://simulado.estacio.br/bdq_simulados_exercicio.asp Sobre o conceito Schemaless (sem esquema) podemos afirmar que: Indica que a base de dados não possui uma estrutura fixa, ou seja, os dados não tem estrutura pré-definida O banco de dados não necessida de um projeto físico O banco de dados não precisa de um esquema conceitual O recurso é aplicado apenas nos bancos de dados baseados em grafos O armazenamento dos dados não precisa de uma estrutura pré-definida, mas precisa ser normalizado Explicação: Esquema livre (schema free) indica que a base de dados não possui uma estrutura fixa, ou seja, os dados não têm estrutura pré-definida. 2. Marque a opção que apresenta as categorias de bases de dados no modelo NOSQL: Baseado em grafos, colunas, objetos e documentos Chave-valor, orientado a documentos, grafos e colunas JSON, XML, grafos e colunas Orientado a objetos, documentos, colunas e chaves de valores Orientado a linhas, colunas, grafos e documentos Explicação: Podemos avaliar que os bancos de dados relacionais representam dados no formato de tabelas que consistem em um número de linhas para seus registros, no entanto os bancos NOSQL são coleções de pares chave-valor, bancos de dados em grafos, documentos ou ainda armazenamentos em coluna e, que não necessitam de esquemas para o seus projetos. 3. A base de dados NoSQL possui modelo de dados em grafos. Esse modelo caracteriza-se por utilizar como componentes para representação de dados: Um array de pares chave-valor. http://simulado.estacio.br/bdq_simulados_exercicio.asp http://simulado.estacio.br/bdq_simulados_exercicio.asp Esquema relacional de dados. Pares chave-valor agrupados horizontalmente. Um identificador e um valor. Conjunto de vértices e ramos. Explicação: É um modelo baseado Teoria dos Grafos. Utiliza-se como componentes um conjunto de vértices e ramos na representação dos dados, em vez de tabelas ou pares chave‐valor. Entre as vantagens destaca-se comparadas aos bancos de dados relacionais, apresenta estrutura em grafo que facilita a representação de objetos e de suas propriedades. 4. Assinale a alternativa errada sobre bancos de dados NOSQL: Pode ser usado com o PostgreSQL Pode ser usado para armazenar dados de documentos São baseados no Teorema CAP É schemaless ou schema free Há a necessidade de que os dados tenham uma estrutura pré-definida Explicação: Esquema livre (schema free) indica que a base de dados não possui uma estrutura fixa, ou seja, os dados não têm estrutura pré-definida. 5. Dadas as características abaixo: 1. Esquema dinâmico para dados não estruturados. 2. São adequados para o ambiente com consultas complexas. 3. Segue o modo de pares de chave-valor para armazenar dados. http://simulado.estacio.br/bdq_simulados_exercicio.asp http://simulado.estacio.br/bdq_simulados_exercicio.asp Marque dentre as opções abaixo aquela que representa as características do NoSQL. Somente 1 e 2. Somente 2 e 3. Somente 1. 1, 2 e 3. Somente 1 e 3. Explicação: Algumas características do NoSQL: Esquema dinâmico para dados não estruturados. O NoSQL não tem interfaces específicas para executar consultas complexas, e as próprias consultas no NoSQL não são tão eficientes quanto a linguagem de consulta SQL. Baseiam-se em documentos, pares de chave-valor, bancos de dados em grafos ou armazenamentos em colunas. 6. É um exemplo de banco de dados NoSQL: PostgreSQL SQL Server MySql MongoDB Oracle Explicação: Os principais bancos de dados NoSQL são: BigTable Redis MongoDB Hbase Neo4j Cassandra CouchDb http://simulado.estacio.br/bdq_simulados_exercicio.asp Exemplos de bancos de dados relacionais: PostgreSQL MySql Oracle SQL Server São exemplos de SGBDs orientados a documentos, exceto: MongoDB HBase RavenDB NEO4J CouchDB Explicação: Como exemplos desses bancos de dados podemos citar o MongoDB, RavenDB e o CouchDB, todos orientados a documentos 2. Quando um documento não precisa de uma estrutura pré-definida dizemos que: Ele é simples. Ele possui esquema. Ele é autodescritivo. Ele é composto. Ele possui outros documentos embutidos. Explicação: Quando um documento não precisa de uma estrutura pré-definida ou o banco de dados não necessita de um esquema, eles são considerados como autodescritivos. 3. São características do MongoDB, com exceção de: É eficaz para aplicações de análise em tempo real A replicação de dados é garantida através de bloqueios e pelo modelo mestre-escravo assíncrono http://simulado.estacio.br/bdq_simulados_exercicio.asp http://simulado.estacio.br/bdq_simulados_exercicio.asp É multiplataforma e também funciona no Windows Não trabalha com o MapReduce para a agregação de coleções Usa um recurso chamado de cursor que funciona como um ponteiro para os dados Explicação: O MongoDB também é um ecossistema que consiste nos seguintes elementos: Serviços de alta disponibilidade e replicação para escalonamento em redes locais e de longa distância; Um sistema de arquivos baseado em grid, permitindo o armazenamento de objetos grandes dividindo-os entre vários documentos. MapReduce para suportar análises e agregação de diferentes coleções / documentos. 4. Comando utilizado para colocar um item em um bando de dados MongoDB. db.frutas.findOne( {item: "banana", cor: "amarelo"} ) db.frutas.insertOne( {item: "banana", cor: "amarelo"} ) db.frutas.addOne( {item: "banana", cor: "amarelo"} ) db.frutas.createOne( {item: "banana", cor: "amarelo"} ) db.frutas.updateOne( {item: "banana", cor: "amarelo"} ) Explicação: O banco de dados MongoDB permite a inclusão de documento em coleções de duas maneiras: 1ª maneira: db.collection.insertOne() - tem por objetivo incluir em uma coleção simples. 2ª maneira: db.collection.insertMany() - comando usado para incluir muitos documentos de uma só vez. http://simulado.estacio.br/bdq_simulados_exercicio.asp 5. A unidade de armazenamento em um BD orientado a documentos, que é similar ao documento no modelo relacional é? Tabela Coluna Array Registro Atributo Explicação: Dessa forma, documento representa a unidade de armazenamento de dados, que nos sistemas gerenciadores de bancos de dados relacionais seriam chamados de registros ou linhas. 6. Sobre os bancos de dados orientados a documentos podemos afirmar que, exceto: Entre os formatos para um documento podemos ter o XML e o JSON, apenas Entre os formatos para um documento podemos ter o XML, JSON, BSON e o YAML Não há restrições quanto ao número de campos no documento São exemplos desses bancos de dados o MongoDB, o RavenDB e o CouchDB Os documentos devem ser organizados em coleções de documentos semelhantes Explicação: Quanto ao formato de um documento, esses podem ser codificados de diferentes formatos, como: XML, JSON, BSON, YAML ou ainda com textos simples. 7. Entre as vantagens no uso do formato de dados como documentos temos, exceto: Correspondem a tipos de dados nativos em muitas linguagens de programação http://simulado.estacio.br/bdq_simulados_exercicio.asp http://simulado.estacio.br/bdq_simulados_exercicio.asp http://simulado.estacio.br/bdq_simulados_exercicio.asp Possui esquema dinâmico que suporta o polimorfismo O banco de dados não necessita de um esquema Tem uma estrutura pré-definida Documentos e matrizes incorporados reduzem a necessidade de junções custosas Explicação: Um documento não precisa de uma estrutura pré-definida ou o banco de dados não necessita de um esquema, eles são considerados como auto descritivos. 8. Assinale a afirmativa incorreta em relação as características principais do MongoDb: Os valores dos campos podem incluir outros documentos, matrizes e matrizes de documentos Seu uso é adequado para aplicações de bancos de dados colunares Possui fácil escalonamento Seu uso é adequado para aplicações que gerenciam redes sociais Não tem suporte a transações como no BD relacional Explicação: O SGBD NoSQL MongoDB é um sistema de gerenciamento de bancos de dados orientados a documentos, de esquema flexível e de código livre, desenvolvido na linguagem C++, que tem como características a velocidade, a eficiência e a escalabilidade. http://simulado.estacio.br/bdq_simulados_exercicio.asp Entre as vantagens no uso do formato de dados como documentos temos, exceto: Tem uma estrutura pré-definida O banco de dados não necessita de um esquema Documentos e matrizes incorporados reduzem a necessidade de junções custosas Possui esquema dinâmico que suporta o polimorfismo Correspondem a tipos de dados nativos em muitas linguagens de programação Explicação: Um documento não precisa de uma estrutura pré-definida ou o banco de dados não necessita de um esquema, eles são considerados como auto descritivos. 2. São características do MongoDB, com exceção de: É eficaz para aplicações de análise em tempo real É multiplataforma e também funciona no Windows Não trabalha com o MapReduce para a agregação de coleções Usa um recurso chamado de cursor que funciona como um ponteiro para os dados A replicação de dados é garantida através de bloqueios e pelo modelo mestre-escravo assíncrono Explicação: O MongoDB também é um ecossistema que consiste nos seguintes elementos: Serviços de alta disponibilidade e replicação para escalonamento em redes locais e de longa distância; Um sistema de arquivos baseado em grid, permitindo o armazenamento de objetos grandes dividindo-os entre vários documentos. MapReduce para suportar análises e agregação de diferentes coleções / documentos. http://simulado.estacio.br/bdq_simulados_exercicio.asp 3. Sobre os bancos de dados orientados a documentos podemos afirmar que, exceto: Os documentos devem ser organizados em coleções de documentos semelhantes São exemplos desses bancos de dados o MongoDB, o RavenDB e o CouchDB Não há restrições quanto ao número de campos no documento Entre os formatos para um documento podemos ter o XML e o JSON, apenas Entre os formatos para um documento podemos ter o XML, JSON, BSON e o YAML Explicação: Quanto ao formato de um documento, esses podem ser codificados de diferentes formatos, como: XML, JSON, BSON, YAML ou ainda com textos simples. 4. Dentre as opções abaixo, selecione aquela que representa uma codificação que NÃO foi desenvolvida para descrever dados. HTML YAML JASON XML BSON Explicação: HTML é uma linguagem de marcação utilizada na construção de páginas na Web. Documentos HTML podem ser interpretados por navegadores. 5. Quando um documento não precisa de uma estrutura pré-definida dizemos que: http://simulado.estacio.br/bdq_simulados_exercicio.asp http://simulado.estacio.br/bdq_simulados_exercicio.asp http://simulado.estacio.br/bdq_simulados_exercicio.asp Ele possui esquema. Ele possui outros documentos embutidos. Ele é simples.Ele é autodescritivo. Ele é composto. Explicação: Quando um documento não precisa de uma estrutura pré-definida ou o banco de dados não necessita de um esquema, eles são considerados como autodescritivos. 6. Comando utilizado para colocar um item em um bando de dados MongoDB. db.frutas.addOne( {item: "banana", cor: "amarelo"} ) db.frutas.updateOne( {item: "banana", cor: "amarelo"} ) db.frutas.findOne( {item: "banana", cor: "amarelo"} ) db.frutas.createOne( {item: "banana", cor: "amarelo"} ) db.frutas.insertOne( {item: "banana", cor: "amarelo"} ) Explicação: O banco de dados MongoDB permite a inclusão de documento em coleções de duas maneiras: 1ª maneira: db.collection.insertOne() - tem por objetivo incluir em uma coleção simples. 2ª maneira: db.collection.insertMany() - comando usado para incluir muitos documentos de uma só vez. 2. Entre as vantagens no uso do formato de dados como documentos temos, exceto: Possui esquema dinâmico que suporta o polimorfismo Documentos e matrizes incorporados reduzem a necessidade de junções custosas O banco de dados não necessita de um esquema http://simulado.estacio.br/bdq_simulados_exercicio.asp http://simulado.estacio.br/bdq_simulados_exercicio.asp Correspondem a tipos de dados nativos em muitas linguagens de programação Tem uma estrutura pré-definida Explicação: Um documento não precisa de uma estrutura pré-definida ou o banco de dados não necessita de um esquema, eles são considerados como auto descritivos. NÃO é uma vantagem do DynamoDB Processamento de dados em temo real Escalabilidade Velocidade Consultas complexas em SQL Backup rápido Explicação: O DynamoDB é um banco de dados NoSQL, portanto não realiza consultas por intermédio da linguagem SQL. 2. São exemplos de aplicações indicadas para o uso do modelo NOSQL chave-valor, exceto: Internet das Coisas (IoT) Sensores de dados ou via streaming Aplicações de bolsas de valores Aplicações transacionais Jogos on-line Explicação: O modelo chave-valor é particularmente eficaz em aplicações do tipo: ¿ Na análise em tempo real dos serviços financeiros, caracterizado por um alto volume de dados gerados. Como exemplo, podemos citar as aplicações de setores bancários e bolsas de valores; ¿ Dados dos usuários produzidos para redes sociais, comunidades específicas, jogos on-line ou Internet das Coisas (IoT); ¿ Armazenamento de dados em grande volume originados de aplicações como sensores de dados ou via streaming; ¿ Aplicações móveis que exigem flexibilidade e confiabilidade, como por exemplo a coleta de dados de logs de telefones celulares http://simulado.estacio.br/bdq_simulados_exercicio.asp 3. Marque a opção que não contém um SGBD NOSQL baseado em chave-valor: Cassandra DynamoDB Riak HBase Redis Explicação: Além do DynamoDB, Existem outros bancos de dados no modelo chave-valor, como o Cassandra , o Riak e o Redis 4. Quanto ao formato de dados chave-valor podemos afirmar, exceto: O uso do modelo chave-valor em aplicações web e dispositivos móveis A chave (key) pode ser usada de formas diversas O valor pode ser uma lista ou outro par chave-valor encapsulado em um outro objeto A chave não precisa seguir uma convenção pré-estabelecida para manter uma consistência Um formato usado é o formato de intercâmbio JSON Explicação: Em qualquer caso, a chave deve seguir uma convenção acordada para manter uma consistência 5. O DynamoDB é um exemplo de um baco de dados: http://simulado.estacio.br/bdq_simulados_exercicio.asp http://simulado.estacio.br/bdq_simulados_exercicio.asp http://simulado.estacio.br/bdq_simulados_exercicio.asp Documento Relacional SQL Centralizado Chave-valor Explicação: O DynamoDB é um serviço de banco de dados chave-valor totalmente gerenciado na nuvem no modelo NoSQL e que foi lançado em 2012 pela Amazon. 6. Nos bancos de dados chave-valor deve-se utilizar uma chave muito longa por motivos de: facilidade esquema desempenho limitação do servidor clareza Explicação: Em teoria, em bancos de dados chave-valor a chave pode ser usada de formas diversas. Mas isso pode depender do SGBD, pois o SGBD pode impor limitações. No entanto, por motivos de desempenho, deve- se evitar o uso de uma chave muito longa. . Quanto ao formato de dados chave-valor podemos afirmar, exceto: Um formato usado é o formato de intercâmbio JSON A chave não precisa seguir uma convenção pré-estabelecida para manter uma consistência O uso do modelo chave-valor em aplicações web e dispositivos móveis O valor pode ser uma lista ou outro par chave-valor encapsulado em um outro objeto A chave (key) pode ser usada de formas diversas http://simulado.estacio.br/bdq_simulados_exercicio.asp http://simulado.estacio.br/bdq_simulados_exercicio.asp Explicação: Em qualquer caso, a chave deve seguir uma convenção acordada para manter uma consistência Uma vantagem de um banco de dados colunar em relação a um banco de dados relacional é: Operações de entrada e saída extremamente rápidas. Utilização de esquemas rígidos para formatos de dados. Utiliza a linguagem de consulta SQL. Todo o processamento é realizado em um servidor centralizado. Dados predominantemente armazenados como par chave-valor. Explicação: Os bancos de dados colunares armazenam dados de forma eficiente em colunas, em vez de linhas, como nos bancos de dados relacionais. Essa abordagem leva a um desempenho mais rápido porque as operações de entrada e de saída tornam-se extremamente rápidas. 2. O banco de dados Cassandra é adequado para projetos do Big Data. Ele é excelente em operações de leitura em um número limitado de: consultas colunas dados linhas documentos Explicação: Um banco de dados orientado por colunas será excelente em operações de leitura em um número limitado de colunas. 3. Assinale o comando que existe no modelo orientado a colunas e não existe no relacional: Delete http://simulado.estacio.br/bdq_simulados_exercicio.asp http://simulado.estacio.br/bdq_simulados_exercicio.asp Select Keyspace Insert Update Explicação: O Cassandra possui uma linguagem própria de consultas denominada de Cassandra Query Language (CQL) 4. São características do banco de dados Cassandra com exceção de: Fácil distribuição de dados Escalabilidade elástica Armazenamento de dados flexível Tem suporte a transações As consultas são escritas em SQL Explicação: O Cassandra possui uma linguagem própria de consultas denominada de Cassandra Query Language (CQL). 5. São exemplos de aplicações indicadas para o uso do modelo NOSQL orientado a colunas: Acompanhamento de status de pedidos de compra Armazenamento de dados de logs de sistemas ou de equipamentos Internet of Things (IoT) para veículos e dispositivos Registro de transações como compras Todas as anteriores estão corretas http://simulado.estacio.br/bdq_simulados_exercicio.asp http://simulado.estacio.br/bdq_simulados_exercicio.asp Explicação: Outro tipo de aplicação beneficiado pelos bancos de dados colunares são os usados em aplicações OLAP (OnlineAnalytical Processing), enquanto orientados a linhas são usados para material OLTP (Online Transaction Processing). Alguns outros exemplos de casos de uso usando o Cassandra são: ¿ Registro de transações como compras, resultados de aplicações de testes, avaliações de filmes assistidos e o local de exibição do filme; ¿ Armazenamento de dados de séries temporais ou o resultado de logs de sistemas; ¿ Acompanhamento de status de pedidos de compras, entregas de pacotes, etc.; ¿ Armazenamento de dados de logs de sistemas ou de equipamentos; ¿ Histórico de sistemas meteorológicos, como pontos mínimos e máximos de temperaturas; ¿ Histórico de eventos realizados; ¿ Telemática: Internet of Things (IoT) para veículos e dispositivos 6. O Cassandra é um exemplo de um banco de dados: chave-valor em grafo SQL colunar relacional Explicação: O Apache Cassandra é um sistema gerenciador de banco de dados baseado em colunas de código aberto, especificado para uso em ambiente distribuído, pronto para o gerenciamento de grandes quantidades de dados estruturados. O sistema também é caracterizado por fornecer um serviço de alta disponibilidade. Foi desenvolvido pelo Facebook e teve seu código aberto em 2008. Foi tornado um projeto da Fundação Apache em 2010. 2. O banco de dados Cassandra é adequado para projetos do Big Data. Ele é excelente em operações de leitura em um número limitado de: documentos consultas linhas http://simulado.estacio.br/bdq_simulados_exercicio.asp http://simulado.estacio.br/bdq_simulados_exercicio.asp dados colunas Explicação: Um banco de dados orientado por colunas será excelente em operações de leitura em um número limitado de colunas. Como os bancos de dados que utilizavam a linguagem SQL fizeram para trabalhar com a incorporação de tipos de dados não estruturados? Incorporaram apenas tipos já previstos pela linguagem SQL. Modelaram os novos tipos de dados para poderem ser manipulados pela SQL. Adicionaram construções à linguagem SQL. Mantiveram a linguagem SQL, que não necessitou ser alterada. Substituíram a linguagem SQL pela linguagem NoSQL. Explicação: Por ele foram adicionadas construções às linguagens de consultas relacionais (SQL), para manipular os novos tipos de dados adicionados. Tais extensões tentam preservar os fundamentos relacionais, enquanto estendem o poder de modelagem dos dados, como é o caso de atributos multivalorados (arrays), criação de tipos e herança. 2. Em que se baseia a ideia do modelo objeto-relacional? Estender o modelo relacional incluindo características de orientação a objetos. Integrar bancos de dados relacionais às linguagens orientadas a objetos. Substituir bancos de dados relacionais por bancos de dados orientados a objetos. Estender o modelo de objetos incluindo características relacionais. Migrar gradativamente bases de dados relacionais para bases orientadas a objetos. Explicação: O modelo objeto-relacional é baseado na ideia de estender o modelo relacional, fornecendo um sistema com maior possibilidade de uso e flexibilidade por meio da inclusão de características de orientação a objetos. 3. Qual o nome do recurso do PostgreSQL usado para o armazenamento chave-valor? Contrib http://simulado.estacio.br/bdq_simulados_exercicio.asp http://simulado.estacio.br/bdq_simulados_exercicio.asp Cstore Hstore JSON JSONB Explicação: O recurso Hstore fornece um armazenamento de chave-valor 4. O código abaixo apresenta uma tabela criada no PostgreSQL que: CREATE TABLE livros (nr serial primary key,titulo VARCHAR (255),atrib hstore) Um campo numérico, um campo texto e um do tipo documento Um campo numérico, um campo texto e um multivalorado Um campo auto incremento, um campo texto e um do tipo JSON Um campo serial, um campo texto e um do tipo atribr Um campo numérico, um campo texto e um do tipo hstore (chave-valor) Explicação: O campo atrib é um campo do tipo de dados Hstore 5. Assinale a afirmativa correta: Os fabricantes de bancos de dados relacionais não adaptaram seus SGBDs para uso no modelo NOSQL O Oracle foi adaptado para uso como NOSQL, mas não com JSON O PostgreSQL é um banco de dados apenas relacional O SQL Server funciona orientado a documentos, mas sem usar JSON http://simulado.estacio.br/bdq_simulados_exercicio.asp http://simulado.estacio.br/bdq_simulados_exercicio.asp Os fabricantes de bancos de dados relacionais adaptaram seus SGBDs para uso no modelo NOSQL Explicação: Os grandes fabrincantes de SGBDs adaptaram seus sistemas para uso no modelo NOSQL e trabalham com o formato JSON 6. O que fabricantes de SGBDs relacionais como Oracle, SQL Server e PostgreSQL fizeram em ralação aos bancos de dados NoSQL? Criaram tipos de dados fortemente estruturados. Passaram a utilizar o SQL como linguagem de consulta. Estenderam seus produtos para armazenamento de dados não-estruturados. Criaram novos SGBDs puramente NoSQL. Mantiveram seus produtos como estavam, pois são tecnologias diferentes. Explicação: O Oracle NOSQL fornece recursos críticos como escalabilidade elástica on-line e dimensionamento automático, suporte a vários modelos de dados: chave-valor, documentos e grafos. O sistema ainda mantém as outras importantes características como SQL, pesquisa textual, controle de autenticação e recuperação de desastres de vários datacenters. O SQL Server tem funções nativas do JSON que permitem manipular documentos nesse formato por meio da própria linguagem SQL. As soluções permitem trabalhar com tabelas grandes e formato orientado a colunas, também trabalha com o formato orientado a documentos. O PostgreSQL desde 2008 foi atualizado para receber recursos para o funcionamento no modelo NOSQL. Com o recurso JSONB, uma versão binária de armazenamento JSON que suporta indexação e um grande número de operadores, o PostgreSQL passou a ser um banco de dados orientado a documentos também. Sua proposta consiste em ser útil para armazenar conjuntos de dados compostos por chave e valor e que sejam armazenados em uma única coluna de uma tabela, conforme a proposta schemaless de produtos, como o MongoDB e o Cassandra. http://simulado.estacio.br/bdq_simulados_exercicio.asp Marque a opção que apresenta características do Neo4J: Todas as anteriores são verdadeiras Permite a integração com outros bancos de dados Permite uma modelagem simples Permite sincronização em lote ou batch Suporta uma linguagem declarativa chamada Cypher Explicação: A seguir são apresentadas características importantes do Neo4J: ¿ Integração com outros bancos de dados: O Neo4J suporta o gerenciamento de transações em duplo sentido ou com reversão, permitindo assim a interoperabilidade contínua com armazenamentos de dados mesmo sem o uso de grafos; ¿ Serviços de sincronização: o Neo4J suporta comportamentos orientados a eventos por meio de um barramento de eventos, sincronização periódica usando a si mesmo ou um sistema gerenciador de banco de dados relacional como mestre, além de uma sincronização em lote ou batch; ¿ Modelagem simples: o modelo baseado em grafos permite uma modelagem simples, no qual os dados são organizados como nós, relacionamentos e propriedades (dados armazenados nos nós ou relacionamentos); ¿ Linguagem de consulta: o Neo4J suporta uma linguagem declarativa chamada Cypher, projetada especificamente para consultar gráficos e seus componentes. Os comandosCypher são pouco semelhantes à linguagem SQL e são destinadas as consultas aos dados em grafos. O uso dessa linguagem e a geração do grafo permite uma melhor visualização ou interpretação da consulta por parte do usuário. 2. Em um banco de dados baseado em grafo, os vértices: Contém atributos do tipo chave-valor. Representam os relacionamentos entre os nós. Representam um atributo. Não possuem atributos. Podem se relacionar com no máximo um outro vértice. Explicação: Grafo é uma estrutura composta por dois tipos de elementos, os vértices e as arestas. Os vértices são também chamados de nós e, em muitos casos, são utilizados para a representação de pessoas, lugares, coisas, categorias etc. As arestas são conexões entre pontos que representam relacionamentos entre vértices, que são ligados pelas arestas. http://simulado.estacio.br/bdq_simulados_exercicio.asp Nós são as entidades no gráfico. Eles podem conter qualquer número de atributos (pares de chave- valor), chamados de propriedades. Os nós podem ser sinalizados com marcadores, representando suas diferentes funções no seu domínio. 3. Marque a opção que apresenta um banco de dados baseado em grafos: Datasax Todas as anteriores são verdadeiras Virtuoso Amazon Neptune Microsoft Azure Cosmos Explicação: Outros exemplos de bancos de dados orientados a grafos são: Microsoft Azure Cosmos , Datasax , OrientDB , ArangoDB , Virtuoso e Amazon Neptune , entre outros. 4. Sobre os relacionamentos de um banco de dados baseado em grafo, assinale a alternativa correta. Sempre podem ser navegados em qualquer direção. Fornecem conexões bidirecionais. Relacionam uma quantidade arbitrária de nós. Não possuem propriedades. Não possuem nomes. Explicação: Os relacionamentos fornecem conexões dirigidas, nomeadas semanticamente entre duas entidades do nó (por exemplo, Empregado trabalha_para Companhia). Um relacionamento sempre tem uma direção, um tipo, um nó inicial e um nó final. Como os nós, os relacionamentos também podem ter propriedades. http://simulado.estacio.br/bdq_simulados_exercicio.asp http://simulado.estacio.br/bdq_simulados_exercicio.asp Na maioria dos casos, os relacionamentos têm propriedades quantitativas, como pesos, custos, distâncias, classificações, intervalos de tempo ou intensidades. Devido à forma eficiente como os relacionamentos são armazenados, dois nós podem compartilhar qualquer número ou tipo de relacionamento sem sacrificar o desempenho. Embora sejam armazenados em uma direção específica, os relacionamentos sempre podem ser navegados eficientemente em qualquer direção. 5. O tipo e banco de dados que trata os relacionamentos entre os dados com a mesma importância que é dada aos dados propriamente ditos é: chave-valor colunar relacional baseado em documentos baseado em grafos Explicação: Podemos compreender um banco de dados baseado em grafos como um banco de dados projetado para tratar os relacionamentos entre os dados com a mesma importância que se é dada aos dados propriamente ditos. 6. Qual o nome da linguagem de consulta utilizada no Neo4J? PL/pgSQL Cypher SQL PL/SQL CQL Explicação: Linguagem de consulta: o Neo4J suporta uma linguagem declarativa chamada Cypher, projetada especificamente para consultar gráficos e seus componentes http://simulado.estacio.br/bdq_simulados_exercicio.asp http://simulado.estacio.br/bdq_simulados_exercicio.asp Marque a opção que apresenta uma possibilidade de uso de Big data em aplicações de tempo real, exceto: Todas as anteriores estão corretas Comportamento anormal no fluxo de dados, como uma sequência suspeita de cliques em um site Geolocalização de dispositivos (smartphones) Monitoramento de servidores Cliques em websites Explicação: Análise de dados em tempo real: fornecimento de atividade como o monitoramento de servidores, geolocalização de dispositivos (smartphones); cliques em websites como uma fonte de notícias pode analisar os registros dos cliques e modificar o conteúdo considerando dados demográficas e geográficos para veicular artigos relevantes para o público- alvo; Um site de comércio eletrônico que transmite registros de sequência de cliques para encontrar um comportamento anormal no fluxo de dados e gera um alerta de segurança se o fluxo de cliques mostrar um comportamento anormal. 2. É um exemplo de streaming de dados: Consulta a uma base de dados. Levantamento dos dados relevantes ao negócio. A atualização de um campo em uma tabela. Definição de um esquema de dados. Informações de sensoriamento remoto. Explicação: Dados em streaming são dados gerados continuamente por várias de fontes de dados, que geralmente enviam os registros de dados simultaneamente, em tamanhos pequenos. http://simulado.estacio.br/bdq_simulados_exercicio.asp 3. Uma das aplicações para Big Data é o Amazon Kinesis Streams, que é utilizado pela Netflix para: Compactar os dados enviados aos clientes. Monitorar as comunicações entre todos os aplicativos. Enviar os streams de vídeos para seus clientes. Inserir propagandas voltadas do perfil do cliente. Fazer log de todos os eventos. Explicação: O Amazon Kinesis Streams é utilizado para monitorar as comunicações entre todos os aplicativos, com o objetivo de detectar e corrigir problemas com rapidez, garantindo um serviço com alta disponibilidade aos seus clientes. 4. São fatores que justificam o uso de Big data em nuvem: Todas as anteriores estão corretas Velocidade Virtualização Confiabilidade Maior custo-benefício Explicação: Nas aplicações do tipo Big data, agora é possível virtualizar os dados para que possam ser armazenados de forma eficiente e, utilizando o armazenamento baseado em nuvem, obtendo-se assim um maior custo-benefício. Podemos ainda considerar as melhorias na velocidade e confiabilidade da rede no sentido de eliminar outras limitações físicas, permitindo o gerenciamento de grandes quantidades de dados em um ritmo muito mais profissional. 5. Sobre o uso de Big Data na nuvem podemos afirmar que: http://simulado.estacio.br/bdq_simulados_exercicio.asp http://simulado.estacio.br/bdq_simulados_exercicio.asp http://simulado.estacio.br/bdq_simulados_exercicio.asp Todas as anteriores estão corretas cenário SaaS fornece uma plataforma para a análise e dados, como por exemplo, das mídias sociais. No cenário IaaS utiliza-se a infraestrutura do provedor de nuvem para seus serviços de Big data. No cenário IaaS pode-se selecionar o sistema operacional, obtendo-se também flexibilidade no dimensionamento dinâmico do ambiente para atender as necessidades. O cenário PaaS pode ser usado para projetar, implementar e implantar aplicativos e serviços em um ambiente de nuvem pública ou privada. Explicação: IaaS: nesse cenário, a utiliza-se a infraestrutura do provedor de nuvem para seus serviços de Big data. IaaS pode máquinas virtuais com armazenamento quase ilimitado e capacidade de processamento. Pode-se ainda selecionar o sistema operacional, obtendo-se também flexibilidade no dimensionamento dinâmico do ambiente para atender as necessidades; PaaS: PaaS é uma infraestrutura inteira que pode ser usada para projetar, implementar e implantar aplicativos e serviços em um ambiente de nuvem pública ou privada. Ela permite que uma organizaçãopossa trabalhar sem ter que lidar com as complexidades de gerenciamento hardware e software. Os fornecedores de PaaS usam tecnologias de Big data como Hadoop e MapReduce. Por exemplo, você pode querer construir um aplicativo especializado para analisar quantidades de dados médicos; SaaS: SaaS fornece uma plataforma para a análise e dados, como por exemplo, das mídias sociais. Muitas empresas perceberam que uma das fontes de dados mais importantes é o que o cliente diz sobre a empresa, seus produtos e seus serviços. Obter acesso à voz dos dados do cliente pode fornecer insights importantes sobre comportamentos e ações. Além disso, você pode utilizar os dados do CRM corporativo em seu ambiente de nuvem privada para inclusão na análise. 6. Dentre as opções abaixo, seleciona aquela que NÃO representa um problema enfrentado por empresas para lidar com seus dados nas últimas décadas. Gerenciamento de grandes bases de dados. Complexidade na tarefa de manter os dados atualizados. Obtenção de dados de seus processos. Programar sistemas para manter e consultar os dados. Gasto na aquisição de unidades de armazenamento. Explicação: As empresas encontraram diversos problemas ao longo das últimas décadas para lidar com seus dados, tais como: Gasto na aquisição de unidades de armazenamento; Dificuldade no gerenciamento de grandes bases de dados; http://simulado.estacio.br/bdq_simulados_exercicio.asp Tecnologia incipiente para manusear variedade de tipos de dados; Dificuldade de programar sistemas para manter e consultar os dados; Aumento da complexidade na tarefa de manter os dados atualizados. Uma das aplicações para Big Data é o Amazon Kinesis Streams, que é utilizado pela Netflix para: Fazer log de todos os eventos. Enviar os streams de vídeos para seus clientes. Monitorar as comunicações entre todos os aplicativos. Inserir propagandas voltadas do perfil do cliente. Compactar os dados enviados aos clientes. Explicação: O Amazon Kinesis Streams é utilizado para monitorar as comunicações entre todos os aplicativos, com o objetivo de detectar e corrigir problemas com rapidez, garantindo um serviço com alta disponibilidade aos seus clientes. 2. Dentre as opções abaixo, seleciona aquela que NÃO representa um problema enfrentado por empresas para lidar com seus dados nas últimas décadas. Obtenção de dados de seus processos. Programar sistemas para manter e consultar os dados. Complexidade na tarefa de manter os dados atualizados. Gerenciamento de grandes bases de dados. Gasto na aquisição de unidades de armazenamento. Explicação: As empresas encontraram diversos problemas ao longo das últimas décadas para lidar com seus dados, tais como: Gasto na aquisição de unidades de armazenamento; Dificuldade no gerenciamento de grandes bases de dados; Tecnologia incipiente para manusear variedade de tipos de dados; Dificuldade de programar sistemas para manter e consultar os dados; Aumento da complexidade na tarefa de manter os dados atualizados. http://simulado.estacio.br/bdq_simulados_exercicio.asp 3. Marque a opção que apresenta uma possibilidade de uso de Big data em aplicações de tempo real, exceto: Comportamento anormal no fluxo de dados, como uma sequência suspeita de cliques em um site Geolocalização de dispositivos (smartphones) Cliques em websites Monitoramento de servidores Todas as anteriores estão corretas Explicação: Análise de dados em tempo real: fornecimento de atividade como o monitoramento de servidores, geolocalização de dispositivos (smartphones); cliques em websites como uma fonte de notícias pode analisar os registros dos cliques e modificar o conteúdo considerando dados demográficas e geográficos para veicular artigos relevantes para o público- alvo; Um site de comércio eletrônico que transmite registros de sequência de cliques para encontrar um comportamento anormal no fluxo de dados e gera um alerta de segurança se o fluxo de cliques mostrar um comportamento anormal. 4. Sobre o uso de Big Data na nuvem podemos afirmar que: Todas as anteriores estão corretas cenário SaaS fornece uma plataforma para a análise e dados, como por exemplo, das mídias sociais. O cenário PaaS pode ser usado para projetar, implementar e implantar aplicativos e serviços em um ambiente de nuvem pública ou privada. No cenário IaaS pode-se selecionar o sistema operacional, obtendo-se também flexibilidade no dimensionamento dinâmico do ambiente para atender as necessidades. No cenário IaaS utiliza-se a infraestrutura do provedor de nuvem para seus serviços de Big data. Explicação: IaaS: nesse cenário, a utiliza-se a infraestrutura do provedor de nuvem para seus serviços de Big data. IaaS pode máquinas virtuais com armazenamento quase ilimitado e capacidade de processamento. Pode-se ainda selecionar o sistema operacional, obtendo-se também flexibilidade no dimensionamento dinâmico do ambiente para atender as necessidades; PaaS: PaaS é uma infraestrutura inteira que pode ser usada para projetar, implementar e implantar aplicativos e serviços em um ambiente de nuvem pública ou privada. Ela permite que uma organização possa trabalhar sem ter que lidar com as complexidades de gerenciamento hardware e software. Os fornecedores de PaaS usam tecnologias de Big data como Hadoop e MapReduce. Por exemplo, você pode querer construir um aplicativo especializado para analisar quantidades de dados médicos; http://simulado.estacio.br/bdq_simulados_exercicio.asp http://simulado.estacio.br/bdq_simulados_exercicio.asp SaaS: SaaS fornece uma plataforma para a análise e dados, como por exemplo, das mídias sociais. Muitas empresas perceberam que uma das fontes de dados mais importantes é o que o cliente diz sobre a empresa, seus produtos e seus serviços. Obter acesso à voz dos dados do cliente pode fornecer insights importantes sobre comportamentos e ações. Além disso, você pode utilizar os dados do CRM corporativo em seu ambiente de nuvem privada para inclusão na análise. 5. São fatores que justificam o uso de Big data em nuvem: Virtualização Confiabilidade Todas as anteriores estão corretas Maior custo-benefício Velocidade Explicação: Nas aplicações do tipo Big data, agora é possível virtualizar os dados para que possam ser armazenados de forma eficiente e, utilizando o armazenamento baseado em nuvem, obtendo-se assim um maior custo-benefício. Podemos ainda considerar as melhorias na velocidade e confiabilidade da rede no sentido de eliminar outras limitações físicas, permitindo o gerenciamento de grandes quantidades de dados em um ritmo muito mais profissional. 6. É um exemplo de streaming de dados: Levantamento dos dados relevantes ao negócio. Informações de sensoriamento remoto. Definição de um esquema de dados. Consulta a uma base de dados. A atualização de um campo em uma tabela. Explicação: http://simulado.estacio.br/bdq_simulados_exercicio.asp http://simulado.estacio.br/bdq_simulados_exercicio.asp Dados em streaming são dados gerados continuamente por várias de fontes de dados, que geralmente enviam os registros de dados simultaneamente, em tamanhos pequenos. Marque a opção que apresenta uma possibilidade de uso de Big data em aplicações de tempo real, exceto: Comportamento anormal no fluxo de dados, como uma sequência suspeita de cliques em um site Cliques em websites Geolocalização de dispositivos (smartphones) Todas as anteriores estão corretas
Compartilhar