Prévia do material em texto
Você acertou 10 de 10 questões Verifique o seu desempenho e continue treinando! Você pode refazer o exercício quantas vezes quiser. Verificar Desempenho A B C D E 1 Marcar para revisão Em relação ao Hadoop, julgue os itens a seguir. I - O Hadoop pode ser considerado como a combinação de dois projetos: Hadoop MapReduce e Hadoop Distributed File System. II - O Hadoop MapReduce (HMR) é um sistema de arquivos distribuídos. III - O HDFS é um spin-off do MapReduce, como o software da Google que é usado para acelerar as pesquisas endereçadas ao buscador. IV - O HMR processa os dados que estão armazenados no HDFS. Estão certos apenas os itens: Os itens I - II - III - IV estão corretos. Apenas o item I está correto. Apenas o item III está correto. Apenas os itens II e III estão corretos. Apenas os itens I e IV estão corretos. Resposta correta Parabéns, você selecionou a alternativa correta. Confira o gabarito comentado! Gabarito Comentado O Hadoop é, de fato, uma combinação de dois projetos: o Hadoop MapReduce (HMR) e o Hadoop Distributed File System (HDFS). O HMR, no entanto, não é um sistema de arquivos distribuídos, como mencionado no item II, mas sim um framework de processamento distribuído. O HDFS, por sua vez, não é um spin-off do MapReduce, como afirmado no item III, mas sim um sistema de arquivos distribuídos, otimizado para lidar com dados não estruturados. Este sistema é baseado na tecnologia do Google File System. O item IV está correto, pois para que o HMR processe os dados, eles devem estar armazenados no HDFS. A B C D E 2 Marcar para revisão Big Data surgiu a partir da necessidade de manipular um grande volume de dados e, com isso, novos conceitos foram introduzidos, como o Data Lake, que: é depósito de dados relacionados, porém orientado por assunto e por coluna. é um aplicativo para armazenamento de bases de dados relacionais com esquemas de tabelas relacionadas entre si. é um ambiente de manipulação de dados, com a função de visualização dos dados através de relatórios e dashboards de maneira amigável para os analistas de negócio e não desenvolvedores. é um tipo de repositório que armazena conjuntos grandes e variados de dados brutos em formato nativo. é uma espécie de lago de dados não estruturados, porém armazenando somente texto e fotos. Resposta correta Parabéns, você selecionou a alternativa correta. Confira o gabarito comentado! Gabarito Comentado Um data lake ou na tradução lago de dados é um sistema ou repositório de dados armazenados em seu formato natural / bruto, geralmente objetos blobs (objetos de imagem, áudio ou outros objetos multimídia) ou arquivos. A alternativa "é depósito de dados relacionados, porém orientado por assunto e por coluna" está errado porque os dados não precisam estar relacionados e, portanto, não é orientado por assunto. A alternativa "é um aplicativo para armazenamento de bases de dados relacionais com esquemas de tabelas relacionadas entre si" está errado porque não é um conjunto de dados relacionais e não precisa haver relacionamentos entre tabelas de diferentes esquemas - os dados são de diversos formatos e de diversas fontes. A alternativa "é um ambiente de manipulação de dados, com a função de visualização dos dados através de relatórios e dashboards de maneira amigável para os analistas de negócio e não desenvolvedores" está errado porque não é o resultado de operações de mineração de dados - são dados brutos sem tratamento e da maneira que foram capturados. 3 Marcar para revisão (INSTITUTO AOCP - 2018 - PRODEB - Especialista de TIC - B.I) Big Data requer clusters de servidores de apoio às ferramentas que processam grandes volumes, alta velocidade e formatos variados de Big Data. Nesse sentido, é correto afirmar que Hadoop refere-se a: A B C D E A B C D E Um sistema de armazenamento e processamento de dados massivamente escalável - não é um banco de dados. Uma estratégia baseada em tecnologia que permite a coleta de insights mais profundos e relevantes dos clientes, parceiros e sobre o negócio. Um banco de dados com capacidade melhorada. Um equipamento de hardware que permite que sistemas administrem crescentes cargas de processamento. Um banco de dados com tecnologia de virtualização. Resposta correta Parabéns, você selecionou a alternativa correta. Confira o gabarito comentado! Gabarito Comentado O Hadoop é um sistema de armazenamento compartilhado, distribuído e altamente confiável para processamento de grandes volumes de dados, sejam eles estruturados ou não, através de clusters de computadores. Em outras palavras, o Hadoop é um framework que facilita o funcionamento de diversos computadores, com o objetivo de analisar grandes volumes de dados. 4 Marcar para revisão Em relação aos objetivos estratégicos em se implantar as tecnologias de Big Data nas empresas, assinale a alternativa correta: Tomar decisões mais operacionais e menos inteligentes sobre seu negócio. Gerar preços e ofertas com base em hábitos reais de compra dos clientes. Desenvolver produtos e ofertas com pouca assertividade. Aumentar tempo com prospecção de clientes. Traçar estratégias de marketing digital não se baseando em dados reais, somente dados futurísticos. Resposta correta A B C D E Parabéns, você selecionou a alternativa correta. Confira o gabarito comentado! Gabarito Comentado A tecnologia de Big Data tem sido estrategicamente adotada por empresas com o objetivo de otimizar suas operações e melhorar a tomada de decisões. Uma das principais vantagens do uso de Big Data é a capacidade de analisar grandes volumes de informações, o que permite às empresas entenderem melhor o comportamento de seus clientes. Com base nesses dados, as empresas podem gerar preços e ofertas que correspondem aos hábitos reais de compra dos clientes. Isso torna a tomada de decisões mais inteligente e as ofertas de produtos mais assertivas. Além disso, a utilização de Big Data reduz a necessidade de gastar tempo com a prospecção de clientes, pois as estratégias de marketing digital podem ser baseadas em dados reais, tornando-as mais eficazes. 5 Marcar para revisão O Big Data é uma tecnologia que tem sido implantada nas empresas como uma estratégia de levantamento de informação através da coleta e processamento de dados. Sendo assim, identifique nos itens os passos necessários para a implantação de Big Data nas empresas. I - Primeiramente, precisamos identificar os desafios da empresa e priorizar os problemas de negócio. II - A escolha da ferramenta que irá manipular o Big Data é um passo importante, devemos dar preferência a ferramentas inteligentes. III - A relevância dos dados não é algo importante, para a tomada de decisão a relevância dos dados não tem importância. IV - Um passo importante e desejável é a utilização de dados internos, os dados externos não afetam a tomada de decisão e se tornam relevantes na implantação do Big Data. Estão certos apenas os itens: Os itens I - II - III - IV estão corretos. Apenas o item I está correto. Apenas o item III está correto. Apenas os itens II e III estão corretos. Apenas os itens I e II estão corretos. Resposta correta Parabéns, você selecionou a alternativa correta. Confira o gabarito comentado! Gabarito Comentado O Big Data tem revolucionado a forma como as empresas desenvolvem suas estratégias de mercado, avaliam a recepção do público aos seus produtos e serviços e identificam as principais tendências do seu setor. Para implementar o Big Data, existem A B C D E alguns passos cruciais a serem seguidos, tais como: Identificar os desafios da empresa e priorizar os problemas de negócio. Escolher a ferramenta adequada para manipular o Big Data, dando preferência a ferramentas inteligentes que possam ser aplicadas em processos extremamente importantes para a coleta, processamento, análise e armazenamento dos dados. Reconhecer a relevância dos dados para a tomada de decisão. Utilizar tanto dados internos quanto externos, pois ambos podem afetar a tomada de decisãoe são relevantes na implantação do Big Data. Portanto, apenas os itens I e II estão corretos, pois a relevância dos dados (item III) é sim importante para a tomada de decisão e tanto os dados internos quanto externos (item IV) são relevantes na implantação do Big Data. 6 Marcar para revisão (CESPE - 2017 - TCE-PE - Auditor de Controle Externo - Auditoria de Contas Públicas - questão adaptada) Com relação a fundamentos e conceitos de Big Data, julgue os itens a seguir. I - Além de estar relacionado à grande quantidade de informações a serem analisadas, o Big Data considera o volume, a velocidade e a variedade dos dados estruturados - dos quais se conhece a estrutura de armazenamento - bem como dos não estruturados, como imagens, vídeos, áudios e documentos. II - Big Data refere-se a uma nova geração de tecnologias e arquiteturas projetadas para processar volumes muito grandes e com grande variedade de dados, permitindo alta velocidade de captura, descoberta e análise. III - De maneira geral, Big Data não se refere apenas aos dados, mas também às soluções tecnológicas criadas para lidar com dados em volume, variedade e velocidade significativos. Estão certos apenas os itens: Os itens I - II - III estão corretos. Apenas o item I está correto. Apenas o item III está correto. Apenas os itens II e III estão corretos. Apenas os itens I e III estão corretos. Resposta correta Parabéns, você selecionou a alternativa correta. Confira o gabarito comentado! Gabarito Comentado Big Data é um conceito que se refere ao grande volume de dados, tanto estruturados quanto não estruturados, que impactam as empresas diariamente. Os dados estruturados são aqueles que possuem uma estrutura predefinida, com categorias e definições claras, como localização, vendas e informações sobre o perfil de clientes, contatos, entre outros. Já os dados não estruturados são dados de mídias sociais, como YouTube, Facebook, portais de notícias, etc. Além disso, o Big Data não se refere apenas A B C D E aos dados em si, mas também às soluções tecnológicas desenvolvidas para lidar com esses dados em grande volume, variedade e velocidade. Portanto, todos os itens I, II e III estão corretos. 7 Marcar para revisão ( FAURGS - 2018 - TJ-RS - Administrador de Banco de Dados) Os dados _______ são armazenados em ________. Os dados ________ misturam nomes de tipos de dados e valores de dados, mas nem todos eles precisam seguir uma estrutura predefinida fixa. Os dados ________ referem-se à informação exibida na Web, caso em que a informação sobre os tipos dos itens de dados não existe. Assinale a alternativa que completa, correta e respectivamente, as lacunas do texto acima. semiestruturados / banco de dados tradicionais / estruturados / não estruturados não estruturados / XML / semiestruturados / estruturados estruturados / HTML / não estruturados / semiestruturados estruturados / bancos de dados tradicionais / semiestruturados / não estruturados semiestruturados / web / estruturados / não estruturados Resposta correta Parabéns, você selecionou a alternativa correta. Confira o gabarito comentado! Gabarito Comentado Os dados podem ser divididos em três categorias, como Dados estruturados, Dados semiestruturas e Dados não estruturados. Os Dados estruturados são organizados e representados por uma estrutura rígida e previamente planejada para armazená-los. Os Dados não estruturados são o oposto dos dados estruturados. Nos dados não estruturados temos uma estrutura flexível e dinâmica ou até sem estrutura. Os dados semiestruturados estão no meio termo entre os dados estruturados e os dados não estruturados. Um dado semiestruturado possui estrutura, porém ela é mais flexível. 8 Marcar para revisão (CESPE - 2018 - TCE-PB - Auditor de Contas Públicas - Demais Áreas) Com relação a dados estruturados e não estruturados, assinale a opção correta. A B C D E A B C Dados não estruturados podem ser caracterizados por arquivos de diversos tipos - textos, imagens, vídeos, entre outros -, cujas estruturas não são descritas implicitamente. Por padrão, documentos do tipo XML (eXtensible Markup Language) são estruturados. Dados não estruturados de um mesmo grupo possuem as mesmas descrições e, consequentemente, os mesmos atributos. Por padrão, dados não estruturados são organizados em blocos semânticos. A alta heterogeneidade facilita as consultas aos dados não estruturados, desde que estes estejam ligados por ponteiros. Resposta correta Parabéns, você selecionou a alternativa correta. Confira o gabarito comentado! Gabarito Comentado Os dados estruturados possuem uma estrutura de representação previamente projetada, são organizados e armazenados em bancos de dados relacionais e em blocos semânticos iguais. Por outro lado, os dados não estruturados não possuem uma estrutura definida, podendo ser representados por textos, vídeos e imagens. Na internet, a grande maioria dos dados é não estruturada. Os dados semiestruturados, embora não sejam mantidos em bancos de dados, possuem uma organização bastante heterogênea, como é o caso dos arquivos XML, RDF e OWL. 9 Marcar para revisão Em relação ao Ecossistema Hadoop, julgue os itens a seguir: I - O Yarn é um gerenciador de pacotes para aplicar comandos prontos ao código de uma aplicação. II - O Pig é uma plataforma que facilita a manipulação de dados e a realização de consultas em um ambiente de Big Data. III - HBase, Cassandra e MongoDB são exemplos de banco de dados distribuídos NoSQL. IV - O Hive é um sistema de data warehouse para Apache Hadoop. O Hive permite o resumo de dados, consultas e análise de dados. Estão certos apenas os itens: Os itens I - II - III - IV estão corretos. Apenas os itens I e II estão corretos. Apenas o item III está correto. D E A B C D E Apenas os itens I, II e III estão corretos. Apenas os itens II, III e IV estão corretos. Resposta correta Parabéns, você selecionou a alternativa correta. Confira o gabarito comentado! Gabarito Comentado O Ecossistema Hadoop é composto por diversos aplicativos, cada um com funções específicas. Entre eles, temos o Yarn, que é um gerenciador de recursos e agendamento de serviços, e o Pig, que facilita a manipulação de grandes volumes de dados em ambientes de Big Data. Além disso, o Hadoop também conta com bancos de dados NoSQL, como o HBase, Cassandra e MongoDB, que são utilizados para armazenar dados não estruturados. Por fim, o Hive é um sistema de data warehouse que permite o resumo, consulta e análise de dados. Portanto, todos os itens (I, II, III e IV) estão corretos. 10 Marcar para revisão (INSTITUTO AOCP - 2019 - UFFS - Analista de Tecnologia da Informação) Bancos de Dados não relacionais, também conhecidos como NoSQL, surgiram para armazenar dados não estruturados, usando modelos de armazenamento específicos para os tipos de dados que são armazenados, usualmente, fugindo do padrão de armazenamento de linhas e colunas dos bancos de dados tradicionais. Em relação ao Banco de Dados NoSQL, quais são as categorias consideradas para esse tipo de armazenamento? Armazéns chave-valor; Banco de dados orientados a documentos; Banco de dados de grafos. Primeira forma normal; Banco de dados orientados a documentos; Normalização. Armazéns chave-valor; Normalização; Banco de dados orientados a coluna. Banco de dados de grafos; Banco de dados orientados a linha; Formas normais de armazenamento. Banco de dados orientados a linha; Normalização; Banco de dados orientados a coluna. Resposta correta Parabéns, você selecionou a alternativa correta. Confira o gabarito comentado! Gabarito Comentado Os Bancos de Dados NoSQL são uma alternativa aos bancos de dados relacionais tradicionais e são projetados para lidar com dados não estruturados. Eles são categorizados em quatro tipos principais: armazéns chave-valor, bancos de dados orientados a documentos, bancos de dados de grafos e bancos de dados orientados a coluna. A alternativa a correta é que menciona três dessas categorias: armazéns chave-valor,bancos de dados orientados a documentos e bancos de dados de grafos. As outras alternativas mencionam conceitos que são mais aplicáveis a bancos de dados relacionais, como normalização e formas normais, que não são categorias de bancos de dados NoSQL.