Prévia do material em texto
Prova Impressa GABARITO | Avaliação da Disciplina (Cod.:645438) Peso da Avaliação 10,00 Prova 90838169 Qtd. de Questões 20 Nota 10,00 Os Data Warehouses têm sido amplamente utilizados para armazenamento de dados em larga escala, principalmente quando oriundos de diversas fontes. O conceito de Data Warehouse permeia o meio acadêmico desde os anos 80, sendo um dos principais elementos na análise de dados. O conceito de Data Warehouse tem a paternidade dividida entre Ralph Kimball e Bill Imnon. Sobre o conceito de Data Warehouse selecione a alternativa correta: A Um Data Warehouse pode ser compreendido como um banco de dados com ênfase em transação, alimentado por diversas fontes. B Um Data Warehouse é um banco de dados NoSQL. C Não há diferença entre um Data Warehouse e um banco de dados transacional. D Um Data Warehouse pode ser compreendido como um banco de dados com ênfase em análise, alimentado por diversas fontes. Na mais tradicional definição do conceito de um Data Warehouse, Inmon (2005) nos traz que as principais características de um Data Warehouse é uma coleção de dados: ● orientado a um assunto; ● integrado; ● com tempo variável; ● não volátil. No contexto de tal definição, assinale a alternativa correta sobre o que significa orientado a um assunto. VOLTAR A+ Alterar modo de visualização 1 2 A O assunto se refere a qual fonte de dados é mais importante para ser utilizada. B O assunto e refere a um tema de análise, ou seja sob qual assunto as análises irão convergir. C O assunto se refere a qual ferramenta será utilizada, uma vez escolhida esta será a ferramenta. D O termo assunto se refere ao fato de que sempre há mudanças nos dados e isso deve ser considerado em um Data Warehouse. No modelo relacional, os dados são organizados em tabelas e cada dado armazenado tem um determinado tipo de dados associado. Por exemplo, se um dado é um nome será do tipo VARCHAR (que representa textos), se for um valor em reais R$ será do tipo DOUBLE (que representa números com casas decimais. São diversos os tipos de dados e isto pode variar da tecnologia que seu banco de dados, seja relacional ou multidimensional será implementado, para ter uma visão geral. Na construção de um modelo de dados, as formas normais são de importante função para garantir a integridade dos dados. Selecione a alternativa CORRETA sobre a 1FN: A A primeira forma normal está relacionada à dependência funcional da chave primária. B A primeira forma normal trata da atomicidade dos atributos, proibindo atributos compostos, multivalorados e relações aninhadas. C A primeira forma normal é onde estão todas as outras formas normais. D A primeira forma normal está relacionada à chamada dependência transitiva, ou seja, um campo não deve depender de um outro campo “não chave”. As tecnologias em cloud têm dominado a rotina de todos nós. Tais plataformas que antes serviam apenas para armazenar arquivos na internet, permitem o armazenamento de dados e principalmente um conjunto de recursos para analisá-los. 3 4 Selecione a alternativa correta que contenha as ferramentas de cloud computing que permitem a criação de dashboards. A Pentaho Business, Pentaho Data Integration e PostgreSQL. B IBM Cognos Analytics, Amazon QuickSight, Google Data Studio. C Pentaho Data Integration, Tableau, Power Bi, ETL. D Pentaho Business, Tableau, Power Bi, Qlik. O mundo em que vivemos está a mudar de forma drástica e constante. Novas tecnologias como a Inteligência Artificial (IA), a Internet das Coisas (IoT), ou a análise de dados, estão a transformar a forma como as organizações gerem os seus negócios, o modo como se relacionam com os seus clientes e gerem o aumento dos seus níveis de produtividade para gerar lucro. Assinale a alternativa CORRETA que contenha o outro nome para o Analista de Dados: A Analista de Data Centers. B Analista de Sistemas. C Analista de Data Lake. D Analista de Business Intelligence. Quando tratamos de análise de dados, é muito difícil que o termo business intelligence não apareça, afinal, faz parte do coração da análise de informações. No que se refere ao business intelligence, assinale a alternativa correta: 5 6 A Business Intelligence, ou Inteligência de Negócio, é uma ferramenta que tem origem na administração de empresas a partir de análise SWOT. B Business Intelligence é uma ferramenta, um software utilizado para que gestores tomem decisões baseado em tomada de decisão. C Business Intelligence é uma metodologia pela qual se estabelecem ferramentas para obter, organizar, analisar e prover acesso às informações necessárias aos tomadores de decisão das empresas para analisarem os fenômenos acerca de seus negócios D Business Intelligence compõe a etapa de ETL de um Data Warehouse, sendo uma importante ferramenta para isso. As métricas são as medidas brutas, atômicas e de simples composição. Em uma estrutura de data warehouse são armazenados na tabela Fato e medem os descritivos salvos nas dimensões. Valores e quantidades são exemplos de formatos das métricas. Os indicadores de desempenho são medidas calculadas e são compostos pelas métricas. Estão um nível acima das métricas, pois possuem uma visão mais ampla e direcionada da realidade observada. Selecione a alternativa correta que contenha um exemplo de indicador de desempenho A Percentual de itens. B Quantidade de Vendas. C Quantidade de itens X. D Percentual de itens X vendidos em março de 2014. Segundo Farobi (2017), o dashboard é um painel de bordo com as principais informações financeiras, comerciais, recursos humanos, logísticas e processos de manutenção da sua empresa. Ou seja: é uma consolidação dos dados mais relevantes para o seu negócio. As informações mais importantes da sua organização devem estar sempre disponíveis de forma rápida e prática. Com uma boa ferramenta de business intelligence, é possível visualizar claramente as demandas problemáticas para o seu negócio. 7 8 Selecione a alternativa correta que contenha os tipos de Dashboards. A Dashboards operacionais, dashboards estratégicos, dashboards analíticos. B Dashboards de extração, dashboards de transformação, dashboards de carga. C Dashboards OLAP e dashboards OLTP. D Business intelligence dashboards e data warehouse dashboards. A arquitetura de um Data Warehouse é composta pela estratégia de coleta, pré-processamento e análise dos dados. São diversas as arquiteturas propostas na literatura, as variações acontecem principalmente pelo fato de existirem variações nas formas e formatos de dados. As arquiteturas de Data Warehouse geralmente são compostas por: fontes provedoras, área de trabalho, área de apresentação de dados e ferramentas de acesso aos dados. Selecione a alternativa CORRETA sobre a área de trabalho de um ambiente de Data Warehouse. A Um ambiente de Data Warehouse tem como características a integração entre os dados, ou seja, eles são oriundos de diversas fontes. Esta camada contém todos os dados possíveis de serem armazenados no Data Warehouse (relacional, orientado a objetos, não estruturados, textual, web etc.) que possam ajudar a cumprir as tarefas de análise. B Esta é a camada em que as ferramentas de visualização fazendo uso do servidor OLAP submetem requisições de acesso aos dados armazenados. No que se refere ao objetivo do nosso livro, será nesta camada que os dados estarão prontos e as ferramentas de construção de Dashboards serão conectadas aos dados, permitindo a exploração e análises multidimensionais. C Esta trata de um Data Warehouse em si, em que os dados já coletados e transformados serão armazenados em um banco de dados projetado a partir de um modelo multidimensional. D Nesta camada são realizados os processos de integração das fontes de dados, bem como as transformações necessárias para armazenar os dados de acordo com o modelo definido para Data Warehouse. Nesta camada são realizadosos principais procedimentos da chamada ETL (Extract, Transform and Load). 9 De acordo com o especialista, estima-se que o número de aparelhos ligados à internet, em 2017, atinja os 8,4 mil milhões, o que representa um crescimento de 31% em relação a 2016, número que poderá chegar aos 20 mil milhões em 2020. Selecione a alternativa CORRETA sobre o tipo de dados de um sistema gerenciador de bancos de dados relacionais. A Dados não estruturados. B Dados semiestruturados. C Dados estruturados. D Dados do tipo NoSQL. Segundo Date (2004), “Data Warehouse é um depósito de dados orientado por assunto, integrado, não volátil, variável com o tempo. No contexto de tal definição, assinale a alternativa correta sobre o que significa integrado. A O termo integrado se refere ao fato de que todo dado armazenado em um Data Warehouse não será excluído, e sim armazenado em decorrer do tempo. Em caso de exclusões na fonte, o mesmo não acontece em um Data Warehouse. B Um Data Warehouse pode integrar vários sistemas internos que usam SGBD e ao mesmo tempo integrar com redes sociais via JSON, fazendo dessa dinâmica nas fontes de dados sua principal característica, bem como um dos principais desafios. C O Termo integrado l se refere às fontes de dados diversas e com baixa volatilidade. D O termo integrado l se refere a não poder haver alteração nas fontes de dados utilizadas para alimentar um data warehouse. 10 11 Saber formular perguntas pode parecer simples, mas é uma habilidade complexa que exige discernimento e flexibilidade, conforme o conteúdo, a forma e a função da pergunta. Nesse contexto, quanto às formas de perguntas, associe os itens que seguem: I – Abertas. II – Fechadas. III – Difusas. IV – Dirigidas. ( ) São caracterizadas por garantirem a fonte de informação desejada. ( ) São caracterizadas por incentivarem indivíduos com habilidades verbais. ( ) São caracterizadas por produzirem maior quantidade de informações. ( ) São caracterizadas por suscitarem respostas objetivas e precisas. Assinale a alternativa que apresenta a sequência correta de respostas: A IV – III – I – II. B IV – III – II – I. C III – II – IV – I. D II – III – I – IV. PostgreSQL começou a ser desenvolvido em 1986 e tem ganhado bastante destaque nos últimos anos, como o banco de dados que mais cresce no mercado. No encontro, ele mostrou as vantagens e desvantagens de utilizar o banco de dados Open Source, que ele considera o mais avançado do mundo. O PostgreSQL é um sistema gerenciador de banco de dados objeto relacional (SGBD), desenvolvido como projeto de código aberto. Assinale a alternativa CORRETA, que contenha a definição correta de SGBD: 12 13 A São fatos e números que transmitem algo específico, mas que não são organizados de maneira formal. Assim não têm contexto, de modo geral, pode-se dizer que dados são a informação de uma maneira bruta. B São documentos XML utilizados para armazenar informação. C Sistemas Gerenciadores de Bancos de Dados, ou Sistemas Gerenciadores de Bancos de Dados Relacionais são, de maneira simples, um software que é responsável por gerenciar o acesso aos dados. O SGBD é responsável por fazer a interface entre os dados com aplicações e usuários, encapsulando-os, garantindo sua segurança e integridade. D Para que os SGBDS se tornem informação , eles devem ser contextualizados, categorizados, calculados e condensados, deste modo a informação são os dados organizados. De um modo geral, pode-se dizer que o conhecimento é quando se traz um sentido ao dado. A competência para elogiar consiste em um elemento relevante para a obtenção e manutenção da qualidade das relações interpessoais. Essa competência pode ser compreendida como... Assinale a alternativa que completa corretamente a frase: A Uma habilidade eficaz em decodificar, interpretar e responder determinadas mensagens. B Um conhecimento aprimorado sobre nossas emoções, pensamentos e comportamentos. C Uma habilidade essencial para controlar nossos desempenhos e dos indivíduos com quem convivemos. D Um comentário positivo direcionado ao indivíduo, sobre ele mesmo ou algo realizado por ele. A habilidade de dar e receber feedback é essencial para moldar o desempenho e a atuação nos relacionamentos interpessoais, mantendo, consequentemente, a qualidade deles. Nesse contexto, assinale V para verdadeiro e F para falso acerca das características do feedback: ( ) Caracteriza-se pela descrição verbal ou escrita do desempenho de um indivíduo. 14 15 ( ) Contribui para mudanças comportamentais dos indivíduos. ( ) Permite que o indivíduo compreenda como seu comportamento afeta o outro. Assinale a alternativa que apresenta a sequência correta de respostas: A V – V – V. B F – V – V. C V – V – F. D V – F – V. O IDC (International Data Corporation) realizou um estudo intitulado “O universo digital das oportunidades: riquezas de dados e valor crescente da internet das coisas”, com pesquisa e análise da IDC, foi reportado que no ano de 2013 havia um conjunto composto por 4,4 trilhões de gigabytes (ou 4,4 zettabytes) de informação. Utilizando diversos conjuntos de métricas e análises, o instituto realizou uma previsão que o mundo saltará para 44 trilhões de gigabytes (44 zettabytes) em 2020 e que 10% desse volume de dados corresponderá à internet das coisas. Sobre o volume de informações, analise as assertivas a seguir: ( ) Nesse contexto não é necessário se preocupar com armazenamento de dados. ( ) O grande desafio é buscar alternativas para armazenar e processar estes dados, gerando informação e conhecimento. ( ) Para resolver os problemas de dados em excesso, basta aumentar o tamanho do disco. ( ) O caso mais conhecido da análise de dados e geração de conhecimento para a tomada de decisão é o caso da fralda e da cerveja. A V, V, F, F. B F, V, F, V. 16 C V, V, V, V. D V, V, V, F. Comunicação é o processo de transmissão de informação de uma pessoa para outra e compartilhada por ambas. Para que haja comunicação é necessário que o destinatário da informação a receba e a compreenda. A informação simplesmente transmitida, mas não recebida ou compreendida, não foi comunicada. MARCONDES FILHO, C. Para entender a comunicação: contatos antecipados com a nova teoria. São Paulo: Paulus, 2008. Nesse contexto, assinale V para verdadeiro e F para falso acerca das características da comunicação verbal e não verbal: ( ) A comunicação verbal depende do domínio da língua. ( ) A comunicação não verbal consiste em posturas, expressões faciais e corporais. ( ) A comunicação não verbal pode se opor à comunicação verbal. Assinale a alternativa que apresenta a sequência correta de respostas: A V - V - F B F - V - V C V - V - V D V - F - V 17 JSON (JavaScript object Notation) é uma forma de armazenamento e transmissão de dados em formato de texto. Sua forma simples e compacta de estruturar informações tem ganhado espaço em aplicações em que o formato XML reinava até então como em aplicações web, por exemplo. A Google é uma das empresas que se destaca na utilização de JSON, tendo inclusive desenvolvido a biblioteca Gson, inicialmente para fins internos, que tem como finalidade a conversão de objetos Java em JSON. Selecione a alternativa CORRETA sobre o tipo de dados de um documento JSON. A Dados semiestruturados. B Dados estruturados. C Dados do tipo NoSQL. D Dados não estruturados. O Pentaho Data Integration é o componente da suíte Pentaho usado para criar processos ETL que alimentam o banco de dados, o Pentaho é a suite mais madura da ferramenta e já possui mais de 10 anos de existência. Sua principal vantagem é a fácil integração a diferentes programas. Por ter código aberto, pode ser customizado de acordo com as necessidades de cada usuário. Para ficar ainda melhor, a aquisição ou licenciamento da sua versão Community é grátis, o que faz deste software uma dassoluções mais viáveis do mercado, aliando baixo custo e bons resultados. Sobre a suite pentaho selecione a alternativa CORRETA com componentes do Pentaho: A Cloudera e Hortonworks. B Spoon, Jobs, Pan, Kitchen. C Hadoop e Spark. 18 19 D Google, IBM e Azure. A startup do Data Warehouse, Yellowbrick Data, levantou US $ 81 milhões em uma série C de financiamento liderado pela DFJ Growth, com a participação do braço de VC da Alphabet, Menlo Ventures, Third Point Ventures, DFJ Growth, BMW i Ventures, IVP, Next47 e Threshold Ventures. O mercado mundial de data warehousing teria gerado mais de US $ 18 bilhões em 2017, um número que deve crescer para quase US $ 35 bilhões até 2025, segundo a Allied Market Research. Isso parece estar impulsionando o recente aumento nos investimentos em data warehousing. Sobre Data Warehouse, selecione a alternativa CORRETA: A Surgiram nos anos 2000, a partir da ascensão de grandes empresas da internet como Amazon e Google, que cada vez mais produziam dados gradativamente, tendo a necessidade de escalabilidade em escrita e principalmente leitura de dados após o aumento de tecnologias voltadas à nuvem. B São, de maneira simples, um software que é responsável por gerenciar o acesso aos dados. O DW é responsável por fazer a interface entre os dados com aplicações e usuários, encapsulando- os, garantindo sua segurança e integridade. C São bancos de dados analíticos, projetados para armazenar os dados de fontes diversas, já transformados e preparados para serem explorados por aplicações de tomada de decisão. D São fatos e números que transmitem algo específico, mas que não são organizados de maneira formal. Assim não têm contexto, de modo geral, pode-se dizer que dados são a informação de uma maneira bruta. 20 Imprimir