Prévia do material em texto
Data Discovery, Olap e visualização de dados Professor(a): Washington Henrique Carvalho Almeida (Mestrado acadêmico) 1) 2) Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final. Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas. Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir o prazo estabelecido. Boa prova! Sobre OLAP e conceitos associados, avalie as afirmativas a seguir e classifique com (V) se verdadeira e (F) se falsa. ( ) OLAP e data warehouse são conceitos que caminham juntos, porque não se pode falar de um sem falar do outro. ( ) Cubo OLAP são formas de relacionamento entre o data warehouse e o usuário. ( ) A visão multidimensional de dados só permite a visualização de dados. ( ) A dimensão de visualização de dados via OLAP é a mesma de recursos data mining. ( ) A multidimensionalidade dos dados se dá porque os dados podem ser observados em diversas faces. Assinale a alternativa que contenha a sequência correta: Alternativas: V – V – F – V – F. F – F – F – F – F. V – V – V – V – V. V – V – F – F – V. CORRETO F – V – F – V – F. Código da questão: 43783 É certo que não há um consenso para definir Big Data. No entanto, os conceitos são parecidos entre si, pelo menos, os mais conhecidos e importantes. Considere o conceito de Big Data apresentado por Gartner para completar as lacunas da afirmativa a seguir. Big Data é o termo adotado pelo ____________ para descrever ____________ no gerenciamento e processamento de informações extremas as quais excedem a capacidade das ____________ de informações tradicionais ao longo de uma ou várias dimensões. Assinale a alternativa que completa adequadamente as lacunas acima: Alternativas: Gartner; problemas; máquinas. Gartner; situações; máquinas. mundo; situações; tecnologias. mercado; problemas; tecnologias. CORRETO mundo; problemas; fontes. Resolução comentada: OLAP e data warehouse são conceitos que caminham juntos, porque não se pode falar de um sem falar do outro. Cubo OLAP são formas de relacionamento entre o data warehouse e o usuário. A dimensão de visualização de dados via OLAP não é a mesma de recursos data mining, pois OLAP permite visualização multidimensional e data mining permite visualização unidimensional. A multidimensionalidade dos dados se dá porque os dados podem ser observados em diversas faces. Resolução comentada: Big Data é o termo adotado pelo mercado para descrever problemas no gerenciamento e processamento de informações extremas as quais excedem a capacidade das tecnologias de informações tradicionais ao longo de uma ou várias dimensões. 3) 4) 5) Código da questão: 43766 Apresentar resultados de análise de dados com imagens requer cuidado com o tipo de gráfico a se utilizar. Considerando esta afirmação, avalie as asserções a seguir. Visualizações gráficas que possuem uma escala de grandeza ordenada são mais rapidamente interpretadas pelo cérebro humano, PORQUE a escolha da visualização adequada não depende do tipo de gráfico escolhido para apresentar uma visualização. Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas: Alternativas: A primeira asserção está correta e a segunda está incorreta. CORRETO A duas asserções estão corretas e a segunda justifica a primeira. A primeira asserção está incorreta e a segunda está correta. As duas asserções estão corretas, mas a segunda não justifica a primeira. As duas asserções estão incorretas. Código da questão: 43769 Em se tratando do conceito OLAP, além da possibilidade de visualização multidimensional e da exploração de dados, existem outras atividades associadas. Com respeito a isto, avalie a afirmativa a seguir para completar suas lacunas apropriadamente. Dentre as atividades que envolvem o conceito OLAP está o ____________ de dados, que também é conhecido como ____________ ou como ____________ de dados digitais. Assinale a alternativa que completa adequadamente as lacunas acima: Alternativas: Armazenamento; data warehouse; visualização. Armazenamento; data warehouse; depósito. CORRETO Tratamento; análise de dados; visualização. Armazenamento; OLAP; depósito. Tratamento; análise de dados; depósito. Código da questão: 43781 Sobre a biblioteca Leaflet, analise a afirmativa a seguir para completar suas lacunas corretamente. A biblioteca Leaflet pode ser executada dentro do ____________ através do __________ Leaflet e tem como principal vantagem ser utilizada desta forma que não exige conhecimento em ______________. Assinale a alternativa que preenche corretamente as lacunas. Alternativas: RStudio; pacote; programação. Resolução comentada: Visualizações gráficas que possuem uma escala de grandeza ordenada são mais rapidamente interpretadas pelo cérebro humano, porque são mais fáceis de enxergar as diferenças existentes. Portanto, é importante o tipo gráfico escolhido para a apresentação de uma visualização. Resolução comentada: A etapa do armazenamento de dados está mais vinculada a um outro conceito conhecido como data warehouse, que em uma tradução literal significa depósito de dados digitais. 6) 7) JavaScript; programa; programação. JavaScript; pacote; programação. RStudio; programa; JavaScript. RStudio; pacote; JavaScript. CORRETO Código da questão: 43791 Considerando as três ferramentas de visualização e análise de dados, R, Python e Qlik Sense, avalie as afirmativas a seguir e assinale (V) se verdadeira e (F) se falsa. ( ) Uma das vantagens de utilizar a interface gráfica RStudio é não precisar escrever linhas de comando de linguagem R. ( ) Uma das vantagens do Qlik Sense é que ele não exige conhecimento de programação. ( ) A linguagem de programação Python foi criada em 1989, mas sua primeira versão só foi distribuída em 1991. ( ) No Python, a biblioteca mais utilizada para gerar visualização de dados é a matplotlib. ( ) A empresa Qlik, que criou a ferramenta Qlik Sense, é uma empresa que foi criada nos Estados Unidos. Assinale a alternativa que contenha a sequência CORRETA: Alternativas: V – V – V – V – V. V – V – F – V – F. F – F – F – F – F. F – V – F – F – F. F – V – V – V – F. CORRETO Código da questão: 43778 Estamos em tempos de massiva produção de dados. Por causa disso, existe uma intensa corrida tecnológica em busca de ferramentas adequadas para o armazenamento e tratamento analítico desses dados para transformá-los em informação útil para a sociedade. Existe um conceito que denomina essa produção intensa de dados. Qual o nome atribuído para esta situação? Assinale a alternativa CORRETA. Alternativas: Visualização. Análise exploratória. Estatísticas. Big Data. CORRETO Dados qualitativos. Resolução comentada: A biblioteca Leaflet pode ser executada dentro do RStudio através do pacote Leaflet e tem como principal vantagem ser utilizada desta forma que não exige conhecimento em JavaScript. Resolução comentada: Mesmo utilizando a interface gráfica RStudio é necessário escrever linhas de comando para realizar a análise de dados e produção de gráficos. A linguagem Python foi criada em 1989, mas só teve a sua primeira versão distribuída em 1991. A biblioteca mais utilizada para produção de visualizações no Python é a Matplolib. A empresa Qlik, fabricante da ferramenta Qlik Sense, foi criada na Suécia. Resolução comentada: O movimento de intensa geração de dados que exige ferramentas apropriadas para armazenamento e tratamento dos mesmos é conhecido com Big Data. 8) 9) 10) Código da questão: 43760 Dentre as diversas ferramentas de visualização de dados estão o R, o Python e o Qlik Sense. O R é um programa que trabalha com linhas de comandos para a produção de resultados, tanto estatísticos quanto de gráficos. Como se chamam os conjuntos de funções que compõem o R? Assinale a alternativa CORRETA. Alternativas: Conjunto. Funções. Linhas de comando.Programas. Pacotes. CORRETO Código da questão: 43775 Muitos especialistas afirmam que há uma relação direta entre business intelligence (BI) e data discovery. A respeito disto, avalie as afirmações a seguir. I. BI trabalha unicamente com dados internos, como ERP e CRM. II. BI é considerado o processo tradicional de tomada de decisões. III. BI necessariamente tem relação direta com um data warehouse. IV. Data Discovery também tem relação única com data warehouse. V. Data Discovery só pode ser realizado com perguntas pré-determinadas. Assinale a alternativa que contém as alternativas VERDADEIRAS. Alternativas: I, II e III. CORRETO I, II e IV. III e IV. IV e V. II, III e IV. Código da questão: 43787 Os métodos de visualização de dados são métodos que ajudam na divulgação de resultados obtidos através do tratamento analítico aplicado a conjuntos de dados. Considerando esta informação, avalie as afirmativas a seguir. I. A divulgação visual de resultados pode ser realizada através de imagens e gráficos, ícones e símbolos. II. A produção massiva de dados requer métodos de armazenamentos eficientes. III. Uma planilha de dados pode ser utilizada para a produção de resultados analíticos e também visual. IV. O termo Big Data se refere apenas a grandes conjuntos de dados. V. O termo Business Intelligence (BI) está relacionado com ferramentas que integram e analisam dados, além de produzir apresentação de resultados. Estão CORRETAS as afirmações: Resolução comentada: Os conjuntos de funções que compõem a linguagem de programação R são chamados de pacotes. Resolução comentada: BI é o método tradicional de lidar com métodos analíticos e data Discovery é um conceito mais avançado, que pode ser realizado sem perguntas pré-determinadas. Alternativas: II, III, IV e V. I, II e IV. I, II, III e V. CORRETO III, IV e V. II, III e V. Código da questão: 43762 Resolução comentada: Quando se fala de divulgação visual de resultados, basicamente se fala de divulgação por imagens e gráficos. A produção massiva de dados exige dos técnicos especializados, métodos eficientes de armazenamento. Apesar de nem sempre atender à demanda em tempos de produção de grandes bases de dados, ainda se utiliza planilhas como o Excel para tratamento analítico e produção de visualização de resultados. O termo Big Data é um conceito muito mais amplo do que apenas o significado de grandes conjuntos de dados. Já o termo BI está relacionado com ferramentas que integram e analisam dados, além de produzir apresentação de resultados. Arquivos e Links