Buscar

A2 - Análise de dados e Big Data

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 11 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 11 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 11 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

A2: ANÁLISE DE DADOS E BIG DATA
1 - A partir do conceito de Business Intelligence (Inteligência nos negócios), em cada fragmento de um Data warehouse, de um cubo de dados ou Data mart, apresenta-se um conjunto de informações multidimensional que podem ser ingeridas a partir de Big Data ou de outras fontes de dados de estruturas de dados diversas.
Considerando as informações do texto, os Data marts são:
a) as ferramentas para a busca de padrões e tendências para as tomadas de decisões em todos os níveis organizacionais.
b) as ferramentas que possuem características transacionais e trabalham com os sistemas gerenciadores de banco de dados.
c) as bases de dados distribuídas ou sistemas de armazenamento distribuídos com funcionalidades focadas no armazenamento de dados semiestruturados.
d)as ferramentas definidas de maneira diferenciada para propiciar abrangentes pesquisas por assuntos específicos.
e) as bases de armazenamento que processam e manipulam somente dados do tipo não estruturados ou semiestruturados.
2 - Leia o excerto a seguir:
“O particionamento de dados é a forma de fragmentar ou particionar em diferentes meios físicos. A forma de armazenamento de dados utilizando sistemas distribuídos é um formato comumente utilizado quando se trata de Big Data. O particionamento permite que tabelas e índices de um banco de dados sejam subdivididos em partes menores individuais. Cada parte do projeto é chamada de partição. Uma partição tem o seu próprio nome e pode ter suas próprias características de armazenamento”.
PEREIRA, M. J. et al. Framework de Big Data. Porto Alegre: SAGAH, 2019. p. 17.
Com base no excerto apresentado, avalie as afirmações a seguir:
I. Do ponto de vista de um especialista de banco de dados, um objeto fragmentado dispõe de várias divisões que conseguem ser administradas coletivamente ou individualmente.
II. Por meio do particionamento, uma tabela fragmentada pode ser acessada por uma ferramenta, pois seus vínculos serão perdidos.
III. A fragmentação pode diminuir muito o gasto total em níveis para conservar as informações importantes.
IV. A ideia da fragmentação de objetos em uma base de dados ou Big Data, como tabelas, é dispor de uma chave fragmentada.
É correto o que se afirma em:
a) II e III, apenas.
b) I, III e IV, apenas.
c) I e II, apenas.
d) II, III e IV, apenas.
e) I e IV, apenas.
3 - Leia o trecho a seguir:
“Atualmente é possível encontrar inúmeras ferramentas no mercado, que podem ser utilizadas para o desenvolvimento de visualizações, desde soluções de planilha, como MS Excel e Google Sheets até ferramentas com maior foco em visualização de dados, como o Tableau. Elas têm sido amplamente utilizadas por profissionais que não necessariamente exercem oficialmente a função de analista de dados ou cientista de dados, pois, além de oferecerem muitas opções de técnicas de visualização de dados, não requerem conhecimento de linguagens de programação.”
PEREIRA, M. A. et al. Framework de Big Data. SAGAH: Grupo A, 2020.Disponível em: Minha Biblioteca. Acesso em: 13 fev. 2023.
Com base no excerto apresentado, avalie as afirmações a seguir:
I. O Tableau é uma ferramenta de visualização multiplataforma, com possibilidade de ser executada em versão desktop, web e mobile. 
II. O Tableau oferece conexão com arquivos de vários formatos e origens, incluindo Microsoft Excel, arquivo de texto, arquivo JSON, arquivo PDF, entre outros.
III. O Tableau é um framework para o desenvolvimento de aplicações de processamento de dados executadas em um ambiente computacional distribuído.
IV. O Tableau possui uma funcionalidade que permite que o usuário execute um teste na ferramenta com dados já carregados, ou seja, pode realizar um ELT.
É correto o que se afirma em:
a) III e IV, apenas.
b) I e III, apenas.
c) I e II, apenas.
d) I, II e IV, apenas.
e) II, III e IV, apenas
4 - Leia o trecho a seguir.
“A Application Programming Interface (API; ou Interface de Programação de Aplicações, em português) é utilizada para integrar sistemas, garantindo a segurança dos dados e permitindo que eles possam ser tratados nos dois ambientes — público e privado — utilizando linguagens de programação diferentes. Portanto, a API facilita o intercâmbio entre o acesso dos dados em uma plataforma e outra, por isso, é aplicada na nuvem, principalmente na nuvem híbrida, formada por dois ambientes com características distintas”.
SILVA, Fernanda R. et al. Cloud Computing. SAGAH: Grupo A, 2020. Disponível em: Minha Biblioteca. Acesso em: 13 fev. 2023.
Com base no texto apresentado, analise as asserções a seguir e a relação proposta entre elas.
I. Os bancos de dados não relacionais, de chave-valor, utilizam funcionalidades APIs (Interfaces de programação de aplicações, em português), desenvolvidas para facilitar a busca de informações entre dois sistemas diferentes.
PORQUE
II. Em uma API, os usuários não necessariamente precisam saber como é o funcionamento dos seus serviços.
A respeito dessas asserções, assinale a opção correta.
a) A asserção I é uma proposição falsa, e a II é uma proposição verdadeira.
b) As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa correta da I.
c) As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I.
d) As asserções I e II são proposições falsas.
e) A asserção I é uma proposição verdadeira, e a II é uma proposição falsa.
5 - Leia o excerto a seguir.
“Com o alto volume de dados de hoje em dia, as técnicas de aquisição de dados do ambiente cliente/servidor devem coordenar as operações de teste, filtragem, rotinas de limpeza, transformação e técnicas para carregar os dados, além de fazer a cooperação com a tecnologia de rede para popular o data warehouse e armazenamento de dados operacionais (ODS).”
“É muito importante que os dados de origem, depois de retirados das mais variadas fontes, sejam limpos, extraídos, transformados e integrados adequadamente, para que a consulta (que é o mais importante) do data warehouse não seja prejudicada. [...] Dessa forma, temos um conjunto completo de operações ETL, que deve se combinar em um sistema integrado e coeso.”
VIDA, E. da S. et al. Data warehouse. Porto Alegre: Grupo A, 2021. p. 162-163. (Disponível em Minha biblioteca).
Diante do excerto apresentado, uma característica do ETL seria:
a) realizar a extração, a transformação e a carga em uma grande quantidade de dados.
b) carregar os dados diretamente no sistema e bases de dados de destino.
c) realizar a extração, carregamento e transformação na ordem dos eventos.
d) efetuar a implementação com pouca ou nenhuma habilidade específica.
e) efetuar a extração, a transformação e a carga para dados locais, relacionais e estruturados.
6 - Leia o excerto a seguir.
“Poucas empresas dependem de um único tipo ou sistema de dados. A grande maioria delas faz o gerenciamento de dados de uma variedade de fontes e usa várias ferramentas para analisá-los e produzir BI. Para fazer uma estratégia de dados complexa como essa funcionar, os dados devem ser capazes de viajar livremente entre sistemas e aplicações. Antes mesmo que sejam transportados para um novo destino, eles devem ser extraídos de sua origem.”
VIDA, E. da S. et al. Data warehouse. Porto Alegre: Grupo A, 2021. p.164. (Disponível em Minha biblioteca). 
Considerando o texto apresentado, avalie as afirmações a seguir.
I. Na etapa de carga, os dados recém-transformados são transportados diretamente dos sistemas para o Data Warehouse de destino, assim os dados podem ser carregados todos de uma vez.
II. Na etapa de extração, os dados são copiados ou exportados dos locais de origens diversas para uma área intermediária, denominada de stating area, para fazer toda a preparação.
III. Na etapa de extração, os dados brutos podem ser extraídos de uma ampla variedade de fontes, como os sistemas de gestão de relacionamento com o cliente e os gerenciadores de banco de dados relacional.
IV. Na etapa de transformação, todas as transformações devem ocorrer na área intermediária, para evitar impactar diretamenteo desempenho nos sistemas de origem. 
É correto o que se afirma em:
a) III e IV, apenas.
b) I e III, apenas.
c) I e II, apenas.
d) I, II e IV, apenas.
e) II, III e IV, apenas.
7 - As decisões que tomamos como cidadãos, consumidores ou agentes de negócios implicam que os dados e as informações devem estar disponibilizados para uso imediato ou posterior, resultado do armazenamento em dispositivos não voláteis. O gerenciamento dessas informações nesses dispositivos é realizado pelo sistema gerenciador de banco de dados relacional (SGBDs ou do acrônimo em inglês DBMS – Database Management Systems). Os bancos de dados e seus sistemas gerenciadores são tipos de software que estão disponíveis como banco de dados pessoal ou empresarial conectados a poderosas soluções de mercado para fins diversos até soluções estratégicas, em geral utilizados por organizações de todo o tipo e por profissionais.
Considerando o texto apresentado, avalie as asserções a seguir e a relação proposta entre elas.
I. É possível que, além de dados, os computadores processem informações por meio de modelos matemáticos e seus algoritmos computacionais. As máquinas recebem informações dos usuários e realizam o processamento necessário.
PORQUE
II. O processamento de modelos matemáticos utiliza-se rigorosamente de uma “base de conhecimento” composta de “conhecimentos de regras” e “fatos” dos especialistas da empresa, que representa um conjunto de informações específicas de uma determinada área do conhecimento. 
A respeito dessas asserções, assinale a opção correta.
a) A asserção I é uma proposição falsa, e a II é uma proposição verdadeira.
b) As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa correta da I.
c) As asserções I e II são proposições falsas.
d) As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I.
e) A asserção I é uma proposição verdadeira, e a II é uma proposição falsa.
8 - Leia o excerto a seguir.
O Big Data pode ser caracterizado por seu volume, em que são gerados petabytes de dados a cada dia; estima-se que esse volume dobre a cada 18 meses. Também pode ser caracterizado por variedade também, pois esses dados vêm de sistemas estruturados (hoje são a minoria) e não estruturados (a imensa maioria) gerados por e-mail, mídias sociais (Facebook, Twitter, YouTube e outros), documentos eletrônicos, apresentações estilo powerpoint, imagens instantâneas, sensores, etiquetas RFID, câmeras de vídeos etc. 
TAURION, C. Big Data. Rio de Janeiro: Brasport, 2019
Nesse sentido, devido a uma grande gama de fontes de dados, o projeto de um Big Data pode despender um alto custo, relacionada a sensores e a transformação de dados, contudo reflete um fornecimento de informações de importância estratégica empresarial. Esse procedimento pode ser solucionado por meio de:
a) data warehouse.
b) sistemas transacionais.
c) planilhas eletrônicas.
d) sistemas de informações operacionais.
e) sistemas de apoio à decisão.
9 - A Internet das Coisas (IoT, do inglês Internet of Things) inclui dispositivos que permitem tecnologias de comunicação sem fio capazes de se conectar e controlar recursos com o uso da internet. O potencial dessas tecnologias atrai cada vez mais investidores com interesse de aplicá-las em novas soluções empresariais, pessoais e governamentais.
MASCHIETTO, L. G. et al. Arquitetura e Infraestrutura de IoT. SAGAH: Grupo A, 2021. Disponível em: Minha Biblioteca. Acesso em: 17 fev. 2023.
 Considerando o texto apresentado, avalie as asserções a seguir e a relação proposta entre elas.
I. A Internet das Coisas (IoT) é uma expressão utilizada na comunicação entre máquinas e dispositivos conectados à internet de forma hiperconectada. 
PORQUE
II. A Internet das Coisas mostra, em sua arquitetura, amplas tecnologias para a mobilidade e a administração de um enorme volume de dados, efetuando uma hiperconexão entre dispositivos.
A respeito dessas asserções, assinale a opção correta.
a) A asserção I é uma proposição falsa, e a II é uma proposição verdadeira.
b) As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa correta da I.
c) As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I.
d) As asserções I e II são proposições falsas.
e) A asserção I é uma proposição verdadeira, e a II é uma proposição falsa.
10 - “Um data warehouse pode ser conceituado como um repositório analítico capaz de oferecer um conjunto de consultas agregadas, sumarizadas e derivadas, de forma rápida e compactada. [...] Essa coleção de dados orientados por assunto, composta de dados não voláteis, integrados e que variam no tempo. Essa coleção é representada por dois tipos de dados: os indicadores, também conhecidos como medidas, que representam o assunto em si; e os dados de apoio a esses indicadores, também conhecidos como dimensões. [...] A modelagem desses dados analíticos pode ser construída considerando a forma como eles são representados e armazenados. Dependendo da tecnologia, podemos armazenar dados em um formato considerado array multidimensional, ou seja, por meio do cruzamento de linhas e colunas”. 
VIDA, E. da S. et al. Data warehouse. Porto Alegre: Sagah, 2021. p. 173. (Disponível na Minha Biblioteca).
Diante do excerto apresentado, assinale a alternativa que corresponde ao formato somente multidimensional.
a) MOLAP.
b) SGBD.
c) ROLAP.
d) HOLAP.
e) OLTP.
11 - Para atender às interconexões entre os processos, os sistemas interfuncionais ou multifuncionais são considerados apropriados na integração das informações entre as áreas funcionais. As empresas possuem diferentes sistemas para apoio às necessidades de tomadas de decisão para a gestão.
LAUDON, K.; LAUDON, J. Sistemas de informações gerenciais. 9. ed. São Paulo: Pearson Prentice Hall, 2010. 
Com base no texto apresentado, analise as asserções a seguir e a relação proposta entre elas.
I. Existem diversos fatores que podem dificultar a implantação do Planejamento de Recursos Empresariais — Enterprise Resource Planning (ERP) em uma organização. Um deles é um fator crítico relacionado às questões de alto custo dos módulos e funcionalidades do sistema que não atendem ao negócio, favorecendo a integração com os sistemas legados.
PORQUE
II. Uma das maiores dificuldades na implantação de um ERP é a possibilidade de não atender ao negócio na sua plenitude ou, ainda, a necessidade de integrá-lo aos sistemas legados ou utilizar uma grande quantidade de customizações, por meio de análise e alinhamento dos processos organizacionais e sistêmicos.
A respeito dessas asserções, assinale a opção correta.
a) A asserção I é uma proposição falsa, e a II é uma proposição verdadeira.
b) As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa correta da I.
c) As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I.
d) As asserções I e II são proposições falsas.
e) A asserção I é uma proposição verdadeira, e a II é uma proposição falsa.
12 - Leia o trecho a seguir.
“O Power BI (Business Intelligence) pertence a Microsoft e é um serviço sobre análises de negócios, cujo objetivo é trabalhar com diversos tipos de situações. O Power BI tem uma interface muito simples e cria relatórios com dados agrupados de forma rápida, trabalha também com o conceito Dashboard, com diversos tipos de indicadores, composto por tabela, matrizes, gráficos, mapas e símbolos, entre outros.”
FERREIRA, Maria C. Power BI® 2019: aprenda de forma rápida. São Paulo: Saraiva, 2020. Disponível em: Minha Biblioteca. Acesso em: 12 fev. 2023. p.8.
Considerando as informações do texto, uma interface gráfica, com diversos indicadores de desempenho, utilizando, também, painel de relatórios denominado dashboard, tem a seguinte característica:
a) um painel relacionado à segmentação de dados que realiza a formatação condicional de informações como atributos e métricas.
b) um painel que apresenta relatórios com suas devidas progressões presentes na aplicação Power BI e os exibecom visualizações gráficas e indicadores.
c) um painel modelo no qual é apresentada a ligação entre as tabelas ou relacionamentos, de forma gráfica, na qual as tabelas se conectam por meio de linhas.
d) uma janela da aplicação que realiza o tratamento e a filtragem de dados por meio de um suplemento específico do Excel.
e) uma janela principal do Power BI, sendo composta pelas guias: Arquivo, Página Inicial, Inserir, Modelagem, Exibição e Ajuda.
13 - O SQL é uma linguagem de programação específica dos sistemas gerenciadores de banco de dados (SGBDs). O SQL sempre estará operando de forma agregada com a linguagem de programação de paradigmas diversos, como as linguagens Python, C++ ou PHP, por exemplo. Assim a linguagem SQL é uma linguagem global para a conversação com SGBDs, de forma que as aplicações são implementadas com interfaces de apoio por meio das linguagens de programação e codificação do CRUD (create-read-update-delete) para a manipulação dos dados é implementada com complementos SQL.
Considerando o texto apresentado, avalie as afirmações a seguir.
I. A linguagem SQL é como as outras linguagens de programação que sofrem alterações no transcurso do ciclo de vida do software, sendo que necessita de uma compreensão teórica e prática contínua para confirmar uma habilidade ao longo do tempo.
II.As aplicações que usam o banco de dados não só funcionam como armazenadoras de dados mas também como um subnível da aplicação, onde são utilizados para manipulação dos dados, além da integridade e validação dos dados.
III. Os bancos de dados quando utilizam queries (consultas SQL) mal definidas, sem uma análise cuidadosa por um especialista, caracterizam o maior impedimento de desempenho em uma aplicação, consumindo recursos computacionais em demasia.
IV. SQL é utilizado somente por desenvolvedores de aplicações que armazenam, manipulam e validam dados, devido à necessidade do conhecimento de programação lógica, operações relacionais, sistemas gerenciadores de banco de dados.
É correto o que se afirma em:
a) III e IV, apenas.
b) I e III, apenas.
c) I e II, apenas.
d) I, II e IV, apenas.
e) II e III, apenas.
14 - Em virtude do crescimento dos sistemas para a internet, foi necessária a implementação de soluções inovadoras para atender ao crescente volume de dados a ser analisado e armazenado. Lideradas por grandes empresas, essas inovações levaram à criação de uma série de bancos de dados dos mais diversos tipos e com variadas características, os quais, hoje, são conhecidos como bancos de dados não relacionais (NoSQL).
SILVA, L. F C. et al. Banco de dados não relacional. SAGAH: Grupo A, 2021. (Disponível na Minha Biblioteca). 
Com base no texto apresentado, analise as asserções a seguir e a relação proposta entre elas.
I. O desafio de armazenar e processar grandes volumes de dados com formatos diversos levou ao surgimento de bancos de dados NoSQL. Para conseguir atender a essas demandas, foi necessário abrir mão de características existentes em bancos de dados relacionais, a fim de dar lugar a outras características mais flexíveis.
PORQUE
II. Os databases NOSQL são aplicados na administração de dados semiestruturados, no exame de dados simultâneo, em arquivos de registo de dados de extremo desempenho e alto desprendimento. Contudo os databases NOSQL não são indicados para aplicações que utilizam dados transacionais. 
A respeito dessas asserções, assinale a opção correta.
a) A asserção I é uma proposição falsa, e a II é uma proposição verdadeira.
b) As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa correta da I.
c) As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I.
d) As asserções I e II são proposições falsas.
e) A asserção I é uma proposição verdadeira, e a II é uma proposição falsa.
15 - Data warehouse é um armazenamento de dados desenhado com o objetivo de agrupar e acumular grandes volumes de dados importantes derivados de diversas fontes, com fins de fornecer um ambiente rico para a realização de análises complexas de Business Intelligence (BI). Isso permite que as empresas obtenham informações estratégicas sobre seus negócios em diferentes setores, como marketing, administração, recursos humanos, bancos etc. Assim conseguem aprimorar as decisões que precisam ser tomadas sobre os negócios.
SINGH, H. S. Data Warehouse: conceitos, tecnologias, implementação e gerenciamento. São Paulo: Makron Books, 2001.
VIDA, E. da S. et al. Data warehouse. Porto Alegre: Grupo A, 2021. (Disponível em Minha biblioteca). 
Diante do excerto apresentado, para que o Data Warehouse consiga apresentar análises complexas de inteligência de negócios, é preciso em um projeto, em um primeiro momento, realizar:
a) a execução do ETL, despejando os dados em um local chamado área de preparação ou intermediária (staging area).
b) a definição dos tipos de dados estruturados e transacionais que serão carregados pela ferramenta ETL.
c) a carga direta da base de dados para que facilite a realização de análises de negócios.
d) a remodelagem dos dados relevantes dos sistemas de origem em informações úteis para serem armazenadas no Data Warehouse.
e) a integração, a reorganização e a consolidação de grandes volumes de dados em muitos sistemas.

Continue navegando