Prévia do material em texto
Você acertou 9 de 10 questões Verifique o seu desempenho e continue treinando! Você pode refazer o exercício quantas vezes quiser. Verificar Desempenho 1 Marcar para revisão O Big Data é uma tecnologia que tem sido implantada nas empresas como uma estratégia de levantamento de informação através da coleta e processamento de dados. Sendo assim, identifique nos itens os passos necessários para a implantação de Big Data nas empresas. I - Primeiramente, precisamos identificar os desafios da empresa e priorizar os problemas de negócio. II - A escolha da ferramenta que irá manipular o Big Data é um passo importante, devemos dar preferência a ferramentas inteligentes. III - A relevância dos dados não é algo importante, para a tomada de decisão a relevância dos dados não tem importância. IV - Um passo importante e desejável é a utilização de dados internos, os dados externos não afetam a tomada de decisão e se tornam relevantes na implantação do Big Data. Estão certos apenas os itens: Feedback A B C D E Os itens I - II - III - IV estão corretos. Apenas o item I está correto. Apenas o item III está correto. Apenas os itens II e III estão corretos. Apenas os itens I e II estão corretos. Resposta correta Parabéns, você selecionou a alternativa correta. Confira o gabarito comentado! Gabarito Comentado O Big Data tem revolucionado a forma como as empresas desenvolvem suas estratégias de mercado, avaliam a recepção do público aos seus produtos e serviços e identificam as principais tendências do seu setor. Para implementar o Big Data, existem alguns passos cruciais a serem seguidos, tais como: Identificar os desafios da empresa e priorizar os problemas de negócio. Escolher a ferramenta adequada para manipular o Big Data, dando preferência a ferramentas inteligentes que possam ser aplicadas em processos extremamente importantes para a coleta, processamento, análise e armazenamento dos dados. Reconhecer a relevância dos dados para a tomada de decisão. A B Utilizar tanto dados internos quanto externos, pois ambos podem afetar a tomada de decisão e são relevantes na implantação do Big Data. Portanto, apenas os itens I e II estão corretos, pois a relevância dos dados (item III) é sim importante para a tomada de decisão e tanto os dados internos quanto externos (item IV) são relevantes na implantação do Big Data. 2 Marcar para revisão (INSTITUTO AOCP - 2019 - UFFS - Analista de Tecnologia da Informação) Bancos de Dados não relacionais, também conhecidos como NoSQL, surgiram para armazenar dados não estruturados, usando modelos de armazenamento específicos para os tipos de dados que são armazenados, usualmente, fugindo do padrão de armazenamento de linhas e colunas dos bancos de dados tradicionais. Em relação ao Banco de Dados NoSQL, quais são as categorias consideradas para esse tipo de armazenamento? Armazéns chave-valor; Banco de dados orientados a documentos; Banco de dados de grafos. Primeira forma normal; Banco de dados orientados a documentos; Normalização. C D E Armazéns chave-valor; Normalização; Banco de dados orientados a coluna. Banco de dados de grafos; Banco de dados orientados a linha; Formas normais de armazenamento. Banco de dados orientados a linha; Normalização; Banco de dados orientados a coluna. Resposta correta Parabéns, você selecionou a alternativa correta. Confira o gabarito comentado! Gabarito Comentado Os Bancos de Dados NoSQL são uma alternativa aos bancos de dados relacionais tradicionais e são projetados para lidar com dados não estruturados. Eles são categorizados em quatro tipos principais: armazéns chave-valor, bancos de dados orientados a documentos, bancos de dados de grafos e bancos de dados orientados a coluna. A alternativa a correta é que menciona três dessas categorias: armazéns chave-valor, bancos de dados orientados a documentos e bancos de dados de grafos. As outras alternativas mencionam conceitos que são mais aplicáveis a bancos de dados relacionais, como normalização e formas normais, que não são categorias de bancos de dados NoSQL. A B C D E 3 Marcar para revisão (ESAF - 2015 - ESAF - Gestão e Desenvolvimento de Sistemas) Em relação a Big Data e NoSQL, é correto afirmar que: os "3 Vs" principais do Big Data referem-se a Volume, Velocidade e Versatilidade de dados. na era do Big Data, as únicas estratégias eficientes para garantir a privacidade são consentimento individual, opção de exclusão e anonimização. o Hadoop, o mais conhecido e popular sistema para gestão de Big Data, foi criado pela IBM, a partir de sua ferramenta de Data Mining WEKA. o NoSQL é um sistema relacional, distribuído, em larga escala, muito eficaz na organização e análise de grande quantidade de dados. o Cassandra é um sistema de banco de dados baseado na abordagem NoSQL, originalmente criado pelo Facebook, no qual os dados são identificados por meio de uma chave. Resposta correta Parabéns, você selecionou a alternativa correta. Confira o gabarito comentado! Gabarito Comentado Cassandra é um banco NoSQL do tipo chave-valor. Os 5 Vs do Big Data são: Volume, Velocidade, Variedade, Veracidade e Valor. Não existe nada relacionado com Versatilidade. Há diversas alternativas para gerar privacidade, inclusive há uma lei específica que trata desse assunto, a Lei Geral de Proteção de Dados (13.709/2018). O Hadoop foi criado pelo projeto Apache, e não pela IBM. E o NoSQL é um termo genérico para banco de dados não relacionais. Não significa sem SQL, na verdade ele inclui o SQL. NoSQL é Not Only SQL (não somente SQL). 4 Marcar para revisão Em relação ao Ecossistema Hadoop, julgue os itens a seguir: I. O Yarn é um gerenciador de pacotes para aplicar comandos prontos ao código de uma aplicação. II. O Pig é uma plataforma que facilita a manipulação de dados e a realização de consultas em um ambiente de Big Data. III. HBase, Cassandra e MongoDB são exemplos de banco de dados distribuídos NoSQL. IV. O Hive é um sistema de data warehouse para Apache Hadoop. O Hive permite o resumo de dados, consultas e análise de dados. A B C D E Estão certos apenas os itens: Os itens I - II - III - IV estão corretos. Apenas os itens I e II estão corretos. Apenas o item III está correto. Apenas os itens I, II e III estão corretos. Apenas os itens II, III e IV estão corretos. Resposta incorreta Opa! A alternativa correta é a letra E. Confira o gabarito comentado! Gabarito Comentado O Ecossistema Hadopp é formado por vários aplicativos com funções diferentes. Dentre eles o Yarn, o Pig, o HBase e o Hive. Os aplicativos possuem as funções de gerenciamento de recursos e agendamento de serviços, além de fornecer uma facilidade na manipulação de grandes volumes de dados. Dentre os aplicativos, existem bancos de dados para armazenamento de dados não estruturados, os bancos de dados NoSQL, como HBase, Cassandra e MongoDB. Mas também é previsto na plataforma aplicativos para manipulação de dados estruturados como um Data Warehouse, facilitando a manipulação de grandes Questão 4 de 10 Corretas (9) Incorretas (1) Em branco (0) 1 2 3 4 5 6 7 8 9 10 Lista de exercícios Bigdata e o… Sair A B C volumes de dados (datasets) em ambientes de armazenamento paralelo. Porém, no contexto do Hadoop, o Yarn não é um gerenciador de pacotes como afirmado na afirmativa I. Sendo assim, apenas as afirmativas II, III e IV estão corretas. 5 Marcar para revisão Big Data surgiu a partir da necessidade de manipular um grande volume de dados e, com isso, novos conceitos foram introduzidos, como o Data Lake, que: é depósito de dados relacionados, porém orientado por assunto e por coluna. é um aplicativo para armazenamento de bases de dados relacionais com esquemas de tabelas relacionadas entre si. é um ambiente de manipulação de dados, com a função de visualização dos dados através de relatórios e dashboardsde maneira amigável para os analistas de negócio e não desenvolvedores. D E é um tipo de repositório que armazena conjuntos grandes e variados de dados brutos em formato nativo. é uma espécie de lago de dados não estruturados, porém armazenando somente texto e fotos. Resposta correta Parabéns, você selecionou a alternativa correta. Confira o gabarito comentado! Gabarito Comentado Um data lake ou na tradução lago de dados é um sistema ou repositório de dados armazenados em seu formato natural / bruto, geralmente objetos blobs (objetos de imagem, áudio ou outros objetos multimídia) ou arquivos. A alternativa "é depósito de dados relacionados, porém orientado por assunto e por coluna" está errado porque os dados não precisam estar relacionados e, portanto, não é orientado por assunto. A alternativa "é um aplicativo para armazenamento de bases de dados relacionais com esquemas de tabelas relacionadas entre si" está errado porque não é um conjunto de dados relacionais e não precisa haver relacionamentos entre tabelas de diferentes esquemas - os dados são de diversos formatos e de diversas fontes. A alternativa "é um ambiente de manipulação de dados, com a função de visualização dos dados através de relatórios e dashboards de maneira amigável para os analistas de negócio e não desenvolvedores" está errado porque não é o resultado de operações de mineração de dados - são dados brutos A B C D E sem tratamento e da maneira que foram capturados. 6 Marcar para revisão ( FAURGS - 2018 - TJ-RS - Administrador de Banco de Dados) Os dados _______ são armazenados em ________. Os dados ________ misturam nomes de tipos de dados e valores de dados, mas nem todos eles precisam seguir uma estrutura predefinida fixa. Os dados ________ referem-se à informação exibida na Web, caso em que a informação sobre os tipos dos itens de dados não existe. Assinale a alternativa que completa, correta e respectivamente, as lacunas do texto acima. semiestruturados / banco de dados tradicionais / estruturados / não estruturados não estruturados / XML / semiestruturados / estruturados estruturados / HTML / não estruturados / semiestruturados estruturados / bancos de dados tradicionais / semiestruturados / não estruturados semiestruturados / web / estruturados / não estruturados Resposta correta Parabéns, você selecionou a alternativa correta. Confira o gabarito comentado! Gabarito Comentado Os dados podem ser divididos em três categorias, como Dados estruturados, Dados semiestruturas e Dados não estruturados. Os Dados estruturados são organizados e representados por uma estrutura rígida e previamente planejada para armazená-los. Os Dados não estruturados são o oposto dos dados estruturados. Nos dados não estruturados temos uma estrutura flexível e dinâmica ou até sem estrutura. Os dados semiestruturados estão no meio termo entre os dados estruturados e os dados não estruturados. Um dado semiestruturado possui estrutura, porém ela é mais flexível. 7 Marcar para revisão (INSTITUTO AOCP - 2018 - PRODEB - Especialista de TIC - B.I) Big Data requer clusters de servidores de apoio às ferramentas que processam grandes volumes, alta velocidade e formatos variados de Big Data. Nesse sentido, é correto afirmar que Hadoop refere-se a: A B C D E Um sistema de armazenamento e processamento de dados massivamente escalável - não é um banco de dados. Uma estratégia baseada em tecnologia que permite a coleta de insights mais profundos e relevantes dos clientes, parceiros e sobre o negócio. Um banco de dados com capacidade melhorada. Um equipamento de hardware que permite que sistemas administrem crescentes cargas de processamento. Um banco de dados com tecnologia de virtualização. Resposta correta Parabéns, você selecionou a alternativa correta. Confira o gabarito comentado! Gabarito Comentado O Hadoop é um sistema de armazenamento compartilhado, distribuído e altamente confiável para processamento de grandes volumes de dados, sejam eles estruturados ou não, através de clusters de computadores. Em outras palavras, o Hadoop é um framework que facilita o funcionamento de diversos computadores, A B C D E com o objetivo de analisar grandes volumes de dados. 8 Marcar para revisão (CESPE - 2018 - TCE-PB - Auditor de Contas Públicas - Demais Áreas) Com relação a dados estruturados e não estruturados, assinale a opção correta. Dados não estruturados podem ser caracterizados por arquivos de diversos tipos - textos, imagens, vídeos, entre outros -, cujas estruturas não são descritas implicitamente. Por padrão, documentos do tipo XML (eXtensible Markup Language) são estruturados. Dados não estruturados de um mesmo grupo possuem as mesmas descrições e, consequentemente, os mesmos atributos. Por padrão, dados não estruturados são organizados em blocos semânticos. A alta heterogeneidade facilita as consultas aos dados não estruturados, desde que estes estejam ligados por ponteiros. Resposta correta Parabéns, você selecionou a alternativa correta. Confira o gabarito comentado! Gabarito Comentado Os dados estruturados possuem uma estrutura de representação previamente projetada, são organizados e armazenados em bancos de dados relacionais e em blocos semânticos iguais. Por outro lado, os dados não estruturados não possuem uma estrutura definida, podendo ser representados por textos, vídeos e imagens. Na internet, a grande maioria dos dados é não estruturada. Os dados semiestruturados, embora não sejam mantidos em bancos de dados, possuem uma organização bastante heterogênea, como é o caso dos arquivos XML, RDF e OWL. 9 Marcar para revisão Sobre a Estratégia de implantação de Big Data nas empresas, julgue os itens: I - A implantação de Big Data eleva os custos não sendo uma opção viável para as grandes organizações. II - No planejamento da implantação de Big Data nas empresas, a área de Marketing Digital é a única que não se beneficia. III - O diferencial do Big Data está em adquirir conhecimento profundo sobre a audiência, os concorrentes e o mercado. Estão certos apenas os itens: A B C D E Os itens I, II e III estão corretos. Os itens I e II estão corretos. Apenas o item III está correto. Apenas o item I está correto. Os itens I e III estão corretos. Resposta correta Parabéns, você selecionou a alternativa correta. Confira o gabarito comentado! Gabarito Comentado A implantação de Big Data, ao contrário do que é afirmado no item I, é uma estratégia que pode reduzir custos e agregar valor ao negócio, tornando-se uma opção viável para organizações de todos os tamanhos. O item II também é incorreto, pois a área de Marketing Digital é uma das que mais se beneficia com a implantação de Big Data, através da análise de dados que permite uma compreensão mais profunda do comportamento do consumidor. O item III está correto, pois o diferencial do Big Data realmente está em adquirir conhecimento profundo sobre a audiência, os concorrentes e o mercado, permitindo que as empresas tomem decisões mais informadas e estratégicas. A B C D E 10 Marcar para revisão (CESPE - 2017 - TCE-PE - Auditor de Controle Externo - Auditoria de Contas Públicas - questão adaptada) Com relação a fundamentos e conceitos de Big Data, julgue os itens a seguir. I - Além de estar relacionado à grande quantidade de informações a serem analisadas, o Big Data considera o volume, a velocidade e a variedade dos dados estruturados - dos quais se conhece a estrutura de armazenamento - bem como dos não estruturados, como imagens, vídeos, áudios e documentos. II - Big Data refere-se a uma nova geração de tecnologias e arquiteturas projetadas para processar volumes muito grandes e com grande variedade de dados, permitindo alta velocidade de captura, descoberta e análise. III - De maneira geral, Big Data não se refere apenas aos dados, mas tambémàs soluções tecnológicas criadas para lidar com dados em volume, variedade e velocidade significativos. Estão certos apenas os itens: Os itens I - II - III estão corretos. Apenas o item I está correto. Apenas o item III está correto. Apenas os itens II e III estão corretos. Apenas os itens I e III estão corretos. Resposta correta Parabéns, você selecionou a alternativa correta. Confira o gabarito comentado! Gabarito Comentado Big Data é um conceito que se refere ao grande volume de dados, tanto estruturados quanto não estruturados, que impactam as empresas diariamente. Os dados estruturados são aqueles que possuem uma estrutura predefinida, com categorias e definições claras, como localização, vendas e informações sobre o perfil de clientes, contatos, entre outros. Já os dados não estruturados são dados de mídias sociais, como YouTube, Facebook, portais de notícias, etc. Além disso, o Big Data não se refere apenas aos dados em si, mas também às soluções tecnológicas desenvolvidas para lidar com esses dados em grande volume, variedade e velocidade. Portanto, todos os itens I, II e III estão corretos.