Baixe o app para aproveitar ainda mais
Prévia do material em texto
18/08/2021 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2322484/2343532 1/7 Projeto em ciência de dados com soluções para processamento paralelo e distribuído de dados Professor(a): Marcelo Tavares De Lima (Mestrado acadêmico) 1) 2) Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final. Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas. Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir o prazo estabelecido. Boa prova! O conceito de big data vai além de grande volume de dados. Por exemplo, Taurion (2013) complementa que o conceito tem relação com uma variável que avalia a importância/significância dos dados. A qual variável o autor se refere? Assinale a alternativa CORRETA. Referência: TAURION, C. Big Data. Rio de Janeiro: Brasport, 2013. EPUB. Não paginado. Disponível em: https://bv4.digitalpages.com.br/#/legacy/epub/160676. Acesso em: 9 jul. 2019. Alternativas: Velocidade de produção de dados. Armazenamento dos dados. Custo dos dados. Veracidade dos dados. Cópia dos dados. Código da questão: 50720 A análise de desempenho de sistemas paralelos é importante por uma série de justificativas que podem ser elencadas. Sobre as características da análise de desempenho com abordagem online, avalie as afirmativas a seguir e assinale V para verdadeira e F para falsa. ( ) A abordagem online também é conhecida como abordagem post- mortem. ( ) A ausência de custo de manutenção de dados é uma das principais características. ( ) O custo de manutenção de dados é uma vantagem, porque há a necessidade de armazenamento de dados em disco. ( ) A falta de escalabilidade é uma de suas principais desvantagens. ( ) Uma de suas características é a necessidade de gravação de informações durante a execução. Assinale a alternativa que contenha a sequência CORRETA Resolução comentada: A veracidade dos dados é uma variável importante para o conceito de big data. Ela avalia a significância dos dados. 18/08/2021 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2322484/2343532 2/7 3) Alternativas: V – V – F – V – F. F – V – F – V – F. V – V – V – V – V. F – F – F – F – F. V – F – V – F – V. Código da questão: 50708 A respeito do processo da descoberta do conhecimento por meio dos dados, avalie as asserções a seguir e a relação existente entre elas. I. Para Loh (2014, n.p.) “o processo da descoberta do conhecimento é iterativo e interativo”. PORQUE II. O autor explica que ser iterativo (ou cíclico) indica que, em muitas situações, o processo pode precisar ser executado diversas vezes, com amostras diferentes ou, até mesmo, com técnicas distintas. O uso do termo interativo, ainda segundo o autor, justifica-se devido à necessidade de intervenção humana ao longo de todo o processo. Referência: LOH, S. BI na era do big data para cientistas de dados: indo além de cubos e dashboards na busca pelos porquês, explicações e padrões. Porto Alegre. Edição do Kindle. 2014. Não paginado. Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas. Alternativas: As asserções I e II estão incorretas. A asserção I está incorreta, e a asserção II está correta. A asserção I está correta, e a asserção II está incorreta. As asserções I e II estão corretas, mas a asserção II não justifica a I. As asserções I e II estão corretas e a asserção II justifica a I. Resolução comentada: A abordagem online não é conhecida como abordagem post- mortem, esse termo se refere à abordagem offline. A ausência de custo de manutenção de dados é uma das principais características. O custo de manutenção de dados é uma vantagem porque NÃO há a necessidade de armazenamento de dados em disco. A falta de escalabilidade é uma de suas principais desvantagens. Uma de suas características é a AUSÊNCIA da necessidade de gravação de informações durante a execução. Resolução comentada: Para Loh (2014, n.p.) “o processo da descoberta do conhecimento é iterativo e interativo”. O autor explica que ser iterativo (ou cíclico) indica que, em muitas situações, o processo pode precisar ser executado diversas vezes, com amostras diferentes ou, até 18/08/2021 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2322484/2343532 3/7 4) 5) Código da questão: 50734 Sobre o processamento paralelo, avalie a afirmativa a seguir para completar corretamente suas lacunas. Em um processamento paralelo, a maneira como os processadores e dispositivos de memória realizam comunicação entre si é o que define a(o) ____________ de máquinas paralelas (MEYER, 2006). Segundo o autor, os principais modelos de ____________ são ____________ e ____________. Referência: MEYER, L. A. V. C. Uma visão geral dos sistemas distribuídos de cluster e grid e suas ferramentas para o processamento paralelo de dados. 2006. IBGE [s.d.]. Disponível em https://www.censo.gov.br/confe... . Acesso em: 17 set. 2019. Assinale a alternativa que completa adequadamente as lacunas. Alternativas: Processamento; processamento; compartilhado; distribuído. Arquitetura; memória; compartilhado; distribuído. Arquitetura; memória; paralelo; distribuído. Arquitetura; memória; compartilhado; desempenho. Processamento; processamento; paralelo; desempenho. Código da questão: 50701 Existem diversos aplicativos que foram elaborados com arquitetura em redes P2P. Sobre um desses aplicativos, avalie as asserções a seguir e a relação entre elas. I. Um exemplo de rede descentralizada bastante noticiada nos últimos anos é o sistema econômico alternativo Bitcoin (BTC ou XBT), o qual, segundo define Melo (2019, p. 30), “é uma moeda digital do tipo criptomoeda descentralizada e, também, um sistema econômico alternativo (peer-to-peer electronic cash system)”. PORQUE II. Melo (2019, p.30) afirma que “o Bitcoin permite transações financeiras sem intermediários, mas verificadas por todos os usuários da rede (nós da rede) Bitcoin, que são gravadas em um banco de dados distribuídos, mesmo, com técnicas distintas. O uso do termo interativo, ainda segundo o autor, justifica-se devido à necessidade de intervenção humana ao longo de todo o processo. Resolução comentada: Em um processamento paralelo, a maneira como os processadores e dispositivos de memória realizam comunicação entre si é o que define a arquitetura de máquinas paralelas (MEYER, 2006). Segundo o autor, os principais modelos de memória são compartilhado e distribuído. https://www.censo.gov.br/confest_e_confege/pesquisa_trabalhos/CD/palestras/368-1.pdf 18/08/2021 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2322484/2343532 4/7 6) chamado de blockchain”. Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas: Alternativas: A primeira asserção está correta, e a segunda está incorreta. A primeira asserção está incorreta, e a segunda asserção está correta. A primeira e a segunda asserção estão incorretas. A primeira e a segunda asserção estão corretas, mas a segunda não é justificativa da primeira. A primeira e a segunda asserção estão corretas e a segunda justifica a primeira. Código da questão: 50714 Sobre o conceito de data lake, avalie as asserções a seguir e a relação existente entre elas. I. Se necessário, o Data Lake pode ser dividido em três camadas separadas: uma para dados brutos, outra para conjuntos de dados alimentados diariamente e outro para informações de terceiros. PORQUE II. Outra abordagem possível seria dividir o Data Lake em três partições de acordo com sua vida útil: dados com menos de seis meses; dados mais antigos, mas ainda ativos, e dados arquivados não mais usados, mas que precisam ser retidos (esses dados obsoletos podem removidos para outras mídias) (MILOSLAVSKAYA; TOLSTOY, 2016). Referência: MILOSLAVSKAYA, N.; TOLSTOY, A. Bigdata, fast data and data lake concepts. Procedia Engineering, 88(2016), 300–305. Disponível em: https://www.sciencedirect.com/science/article/pii/S1877050916316957. Acesso em: 29 nov. 2019. Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas: Alternativas: A asserção I está correta, e a asserção II está incorreta. As asserções I e II estão incorretas. As asserções I e II estão corretas, mas a asserção II não justifica a I. A asserção I está incorreta, e a asserção II está correta. As asserções I e II estão corretas e a II justifica a I. Resolução comentada: Bitcoin é um exemplo de rede P2P, pois possui muitas características desse tipo de rede. Resolução comentada: 18/08/2021 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2322484/2343532 5/7 7) 8) Código da questão: 50729 Sobre as ferramentas OLAP (processo analítico online), avalie as afirmativas a seguir. I. A primeira vez que falou no termo OLAP foi em 1992. II. A linguagem OLAP de definição de dados (DDL) pode remover uma estrutura de dados. III. A estrutura principal de dados de um data warehouse é conhecida como fatos. IV. Uma estrutura de dados de um data warehouse, quando pensada como um cubo, se tiver mais de três dimensões é conhecida como hipercubo. V. As estruturas auxiliares de um data warehouse são conhecidas como tabelas. São verdadeiras: Alternativas: IV - V. II - III - V. II - III - IV. I - II - IV. III - IV - V. Código da questão: 50732 Um dashboard possui informações de métricas e indicadores de interesse de um determinado público. Por isso, as diferentes classificações criadas pelos estudiosos do assunto se baseiam, basicamente, no destinatário das informações. Se o destinatário for um Se necessário, o Data Lake pode ser dividido em três camadas separadas: uma para dados brutos, outra para conjuntos de dados alimentados diariamente e outro para informações de terceiros. Outra abordagem possível seria dividir o Data Lake em três partições de acordo com sua vida útil: dados com menos de seis meses; dados mais antigos, mas ainda ativos, e dados arquivados não mais usados, mas que precisam ser retidos (esses dados obsoletos podem removidos para outras mídias). Resolução comentada: A primeira vez que se falou no termo OLAP foi em 1962. A linguagem OLAP de definição de dados (DDL) pode remover uma estrutura de dados. A estrutura principal de dados de um data warehouse é conhecida como fatos. Uma estrutura de dados de um data warehouse quando pensada como um cubo, se tiver mais de três dimensões é conhecida como hipercubo. As estruturas auxiliares de um data warehouse são conhecidas como tabelas. 18/08/2021 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2322484/2343532 6/7 9) grupo de gestores e/ou executivos da uma corporação, qual a classificação apropriada para o dashboard em questão? Assinale a alternativa CORRETA. Alternativas: Métrico. Executivo. Estratégico. Descritivo. Tático. Código da questão: 50730 O termo big data vai além do significado de grande massa de dados. A esse respeito, avalie as afirmativas a seguir. I. O armazenamento digital de dados no final da segunda década dos anos 2000 é de, praticamente, 90%. II. No contexto big data, agregar valor representa o retorno esperado do investimento. III. No contexto de big data, o termo analytics significa o processo de extração de dados. IV. O conceito de big data analytics é uma combinação de sistemas capazes de tratar dados estruturados e não estruturados. V. Há um conjunto de letras V’s que representam o conceito de big data. São verdadeiras: Alternativas: I - III - V. II - IV - V. I - II - IV. I - II. II - III - IV. Resolução comentada: Dashboards táticos são painéis compostos por informações que conseguem permitir que os gestores direcionem recursos para que os objetivos previamente estabelecidos possam ser alcançados em médio prazo. Seu público-alvo principal são as gerências departamentais dos negócios de uma empresa. Resolução comentada: O armazenamento digital de dados no final da segunda década dos anos 2000 é de, praticamente, 100%. No contexto big data, agregar valor representa o retorno esperado do investimento. No contexto de big data, o termo analytics significa além do processo de extração de dados, pois também cria informações. O conceito de big data analytics é uma combinação de sistemas 18/08/2021 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2322484/2343532 7/7 10) Código da questão: 50722 Apesar da tradução ser “armazém de dados”, o conceito de data warehouse vai além disso. Machado (2004, p. 22 apud Gura e Benck, 2011, p. 21) faz afirmações a esse respeito, as quais encontram-se a seguir. Avalie a afirmativa para completar suas lacunas corretamente. Data warehouse representa uma grande base de dados capaz de ____________, de forma concisa e confiável, as informações de interesse que se encontram espalhadas pelos ____________ operacionais e em fontes ____________, para posterior utilização nos sistemas de apoio à decisão. Referência: GURA, E. F.; BENCK, L. L. N. Construção de um data warehouse, aliado a uma ferramenta open source ireport na geração de informações para tomada de decisão. 2011. 89 f. Trabalho de conclusão de curso (Curso de Tecnologia em análise e desenvolvimento de sistemas) – Coordenação de Informática, Universidade Tecnológica Federal do Paraná, Ponta Grosa, 2011. Disponível em: http://repositorio.roca.utfpr.edu.br/jspui/bitstream/1/6449/1/PG_COADS_2011_2_05.pdf. Acesso em: 7 nov. 2019. Assinale a alternativa que completa adequadamente as lacunas acima. Alternativas: Integrar; computadores; externas. Separar; computadores; diversas. Separar; sistemas; diversas. Integrar; sistemas; externas. Separar; computadores; externas. Código da questão: 50716 capazes de tratar dados estruturados e não estruturados. Há um conjunto de letras V’s que representam o conceito de big data, volume, variedade, velocidade, veracidade e valor agregado. Resolução comentada: Data warehouse representa uma grande base de dados capaz de integrar, de forma concisa e confiável, as informações de interesse que se encontram espalhadas pelos sistemas operacionais e em fontes externas, para posterior utilização nos sistemas de apoio à decisão. Arquivos e Links
Compartilhar