Baixe o app para aproveitar ainda mais
Prévia do material em texto
28/12/2022 21:25 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2686603/4996104 1/5 Projeto em ciência de dados com soluções para processamento paralelo e distribuído de dados Professor(a): Yuri Vasconcelos de Almeida Sá (Especialização) 1) 2) Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final. Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas. Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir o prazo estabelecido. Boa prova! A respeito do processo da descoberta do conhecimento por meio dos dados, avalie as asserções a seguir e a relação existente entre elas. I. Para Loh (2014, n.p.) “o processo da descoberta do conhecimento é iterativo e interativo”. PORQUE II. O autor explica que ser iterativo (ou cíclico) indica que, em muitas situações, o processo pode precisar ser executado diversas vezes, com amostras diferentes ou, até mesmo, com técnicas distintas. O uso do termo interativo, ainda segundo o autor, justifica-se devido à necessidade de intervenção humana ao longo de todo o processo. Referência: LOH, S. BI na era do big data para cientistas de dados: indo além de cubos e dashboards na busca pelos porquês, explicações e padrões. Porto Alegre. Edição do Kindle. 2014. Não paginado. Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas. Alternativas: As asserções I e II estão corretas e a asserção II justifica a I. CORRETO A asserção I está correta, e a asserção II está incorreta. As asserções I e II estão incorretas. A asserção I está incorreta, e a asserção II está correta. As asserções I e II estão corretas, mas a asserção II não justifica a I. Código da questão: 50734 Sobre processamentos paralelo e distribuído de dados, avalie as afirmativas a seguir. I. A heterogeneidade é uma característica de sistemas distribuídos em cluster. II. O nó de um sistema distribuído em cluster pode ser um computador ou um conjunto deles. III. A arquitetura de computadores em cluster surgiu nos anos 1980. IV. Sistemas de computação em grid podem agregar vários clusters. V. O CineGrid Brasil é uma comunidade interdisciplinar que se comunica por meio de comunicação em grid. São verdadeiras: Alternativas: I, IV e V, apenas. II, IV e V, apenas. CORRETO I, II e III, apenas. II e III, apenas. IV e V, apenas. Resolução comentada: Para Loh (2014, n.p.) “o processo da descoberta do conhecimento é iterativo e interativo”. O autor explica que ser iterativo (ou cíclico) indica que, em muitas situações, o processo pode precisar ser executado diversas vezes, com amostras diferentes ou, até mesmo, com técnicas distintas. O uso do termo interativo, ainda segundo o autor, justifica-se devido à necessidade de intervenção humana ao longo de todo o processo. Resolução comentada: 28/12/2022 21:25 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2686603/4996104 2/5 3) 4) 5) Código da questão: 50702 Business Intelligence é um conceito associado à definição de data warehouse. O propósito daquele é permitir um tipo de tomada de decisão. Que tipo é este? Assinale a alternativa CORRETA. Alternativas: Investigativa. Responsiva. Descritiva. Qualitativa. Proativa. CORRETO Código da questão: 50715 A respeito de um data warehouse, avalie as asserções a seguir e a relação existente entre elas. I. A necessidade de uma flexibilidade mínima para um data warehouse se faz necessária. PORQUE II. Um data warehouse inflexível implica em restrição aos usuários a realizarem apenas consultas e análises com motivações vigentes, sem sequer permitir que novos insights sejam implementados (VERZOLA, 201-?). Referência: VERZOLA, I. Data warehouse. [201-?]. Barueri: Pontes Computadores e Serviços Ltda. Disponível em: http://www.pontes.inf.br/docs/datawarehouse.pdf. Acesso em: 7 nov. 2019. Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas: Alternativas: As duas asserções estão incorretas. A primeira asserção está correta, e a segunda asserção está incorreta. A primeira e a segunda asserção estão corretas e a segunda justifica a primeira. CORRETO A primeira e a segunda asserção estão corretas, mas a segunda não é justificativa da primeira. A primeira asserção está incorreta, e a segunda asserção está correta.) Código da questão: 50719 Um dashboard possui informações de métricas e indicadores de interesse de um determinado público. Por isso, as diferentes classificações criadas pelos estudiosos do assunto se baseiam, basicamente, no destinatário das informações. Se o destinatário for um A heterogeneidade é uma característica de sistemas distribuídos em grids. O nó de um sistema distribuído em cluster pode ser um computador ou um conjunto deles. A arquitetura de computadores em cluster surgiu nos anos 90. Sistemas de computação em grid podem agregar vários clusters. O CineGrid Brasil é uma comunidade interdisciplinar que se comunica por meio de comunicação em grid. Resolução comentada: O propósito do Business Intelligence é permitir a tomada de decisões proativas. Resolução comentada: A necessidade de uma flexibilidade mínima para um data warehouse se faz necessária porque um data warehouse inflexível implica em restrição aos usuários a realizarem apenas consultas e análises com motivações vigentes, sem sequer permitir que novos insights sejam implementados (VERZOLA, 201-?). 28/12/2022 21:25 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2686603/4996104 3/5 6) 7) grupo de gestores e/ou executivos da uma corporação, qual a classificação apropriada para o dashboard em questão? Assinale a alternativa CORRETA. Alternativas: Métrico. Executivo. Tático. CORRETO Estratégico. Descritivo. Código da questão: 50730 Sobre os métodos de depuração e análise de desempenho de programas paralelos, avalie as afirmativas a seguir. I. A busca por grande capacidade de processamento numérico pode ser considerada como a principal motivação para a criação de sistemas paralelos. II. A análise de desempenho de sistemas paralelos é útil para identificar os pontos fortes do sistema. III. A análise de desempenho é usualmente iniciada logo após a instalação do sistema paralelo. IV. A análise de desempenho se manifesta de forma cíclica, pois o desenvolvedor precisa realizar execuções experimentais do programa. V. A amostragem é uma técnica de coleta e registros da abordagem offline de uma análise de desempenho. Assinale a alternativa com contém as afirmativas CORRETAS: Alternativas: III - IV. II - III. I - IV - V. CORRETO IV - V. I - II - III. Código da questão: 50707 O conceito de big data vai além de grande volume de dados. Por exemplo, Taurion (2013) complementa que o conceito tem relação com uma variável que avalia a importância/significância dos dados. A qual variável o autor se refere? Assinale a alternativa CORRETA. Referência: TAURION, C. Big Data. Rio de Janeiro: Brasport, 2013. EPUB. Não paginado. Disponível em: https://bv4.digitalpages.com.br/#/legacy/epub/160676. Acesso em: 9 jul. 2019. Resolução comentada: Dashboards táticos são painéis compostos por informações que conseguem permitir que os gestores direcionem recursos para que os objetivos previamente estabelecidos possam ser alcançados em médio prazo. Seu público-alvo principal são as gerências departamentais dos negócios de uma empresa. Resolução comentada: Estão corretas as afirmativas I, IV e V. II. Segundo Schnorr (2014, p. 1), “o objetivo da análise de desempenho de aplicações paralelas é a identificação de regiões do programa que tem uma baixa exploração dos recursos computacionais”. III. É usual partir para a análise de desempenho de programas paralelos após a sua implementação, livre de qualquer possível erro, momento em que o desenvolvedor ou administrador do banco de dados está aptopara realizar esta etapa do trabalho. 28/12/2022 21:25 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2686603/4996104 4/5 8) 9) Alternativas: Velocidade de produção de dados. Veracidade dos dados. CORRETO Armazenamento dos dados. Cópia dos dados. Custo dos dados. Código da questão: 50720 A respeito dos conceitos associados a um data warehouse, avalie as afirmativas a seguir. I. Nem todo dado precisa de armazenamento em um data warehouse. II. Um data warehouse é apropriado para um processamento de consulta. III. Um data warehouse é considerado como um conjunto de dados não volátil. IV. Um data warehouse pode ser composto por um conjunto de programas computacionais. V. Um data warehouse pode realizar processamentos de transações. São verdadeiras: Alternativas: I - II - III - IV. CORRETO II - III - V. I II - IV. II - III - IV - V. II - III. Código da questão: 50717 O termo big data vai além do significado de grande massa de dados. A esse respeito, avalie as afirmativas a seguir. I. O armazenamento digital de dados no final da segunda década dos anos 2000 é de, praticamente, 90%. II. No contexto big data, agregar valor representa o retorno esperado do investimento. III. No contexto de big data, o termo analytics significa o processo de extração de dados. IV. O conceito de big data analytics é uma combinação de sistemas capazes de tratar dados estruturados e não estruturados. V. Há um conjunto de letras V’s que representam o conceito de big data. São verdadeiras: Alternativas: II - III - IV. I - II. II - IV - V. CORRETO I - II - IV. I - III - V. Resolução comentada: A veracidade dos dados é uma variável importante para o conceito de big data. Ela avalia a significância dos dados. Resolução comentada: Nem todo dado precisa de armazenamento em um data warehouse. Um data warehouse é apropriado para um processamento de consulta, e não de transações. Um data warehouse é considerado como um conjunto de dados não volátil. Um data warehouse pode ser composto por um conjunto de programas computacionais. Resolução comentada: 28/12/2022 21:25 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2686603/4996104 5/5 10) Código da questão: 50722 Apesar da tradução ser “armazém de dados”, o conceito de data warehouse vai além disso. Machado (2004, p. 22 apud Gura e Benck, 2011, p. 21) faz afirmações a esse respeito, as quais encontram-se a seguir. Avalie a afirmativa para completar suas lacunas corretamente. Data warehouse representa uma grande base de dados capaz de ____________, de forma concisa e confiável, as informações de interesse que se encontram espalhadas pelos ____________ operacionais e em fontes ____________, para posterior utilização nos sistemas de apoio à decisão. Referência: GURA, E. F.; BENCK, L. L. N. Construção de um data warehouse, aliado a uma ferramenta open source ireport na geração de informações para tomada de decisão. 2011. 89 f. Trabalho de conclusão de curso (Curso de Tecnologia em análise e desenvolvimento de sistemas) – Coordenação de Informática, Universidade Tecnológica Federal do Paraná, Ponta Grosa, 2011. Disponível em: http://repositorio.roca.utfpr.edu.br/jspui/bitstream/1/6449/1/PG_COADS_2011_2_05.pdf. Acesso em: 7 nov. 2019. Assinale a alternativa que completa adequadamente as lacunas acima. Alternativas: Separar; sistemas; diversas. Integrar; computadores; externas. Separar; computadores; diversas. Separar; computadores; externas. Integrar; sistemas; externas. CORRETO Código da questão: 50716 O armazenamento digital de dados no final da segunda década dos anos 2000 é de, praticamente, 100%. No contexto big data, agregar valor representa o retorno esperado do investimento. No contexto de big data, o termo analytics significa além do processo de extração de dados, pois também cria informações. O conceito de big data analytics é uma combinação de sistemas capazes de tratar dados estruturados e não estruturados. Há um conjunto de letras V’s que representam o conceito de big data, volume, variedade, velocidade, veracidade e valor agregado. Resolução comentada: Data warehouse representa uma grande base de dados capaz de integrar, de forma concisa e confiável, as informações de interesse que se encontram espalhadas pelos sistemas operacionais e em fontes externas, para posterior utilização nos sistemas de apoio à decisão. Arquivos e Links
Compartilhar