Baixe o app para aproveitar ainda mais
Prévia do material em texto
Projeto em ciência de dados com soluções para processamento paralelo e distribuído de dados Professor(a): Yuri Vasconcelos de Almeida Sá (Especialização) 1) 2) Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A Avaliação Virtual (AV) é composta objetivas e corresponde a 100% da média final. Você tem até cinco tentativas para “Enviar” as questões, que são automati corrigidas. Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir o prazo estabe prova! Sobre o uso de linguagem Python para tratamento de big data, avalie as afirmativas a seguir e classifique com (V) se verdadeira e (F) se falsa. ( ) A linguagem Python foi criada em 1999. ( ) A compilação da linguagem Python precisa de um interpretador interno à máquina onde é executada. ( ) A linguagem Python utiliza o recurso de indentação para eliminar o uso excessivo de parênteses. ( ) O recurso de indentação serve para definir ou destacar a estrutura de um algoritmo. ( ) Um comentário escrito em um script de linguagem Python pode ser escrito entre aspas simples. Assinale a alternativa que contenha a sequência correta. Alternativas: F – V – F – V – F. V – V – F – V – F. V – V – V – V – V. F – V – V – V – F. CORRETO V – F – F – F – V. Código da questão: 50723 Sobre a linguagem de programação R e suas características, avalie as afirmativas a seguir. I. A linguagem R tem em sua construção estrutural semelhanças com a linguagem S. II. A linguagem R é composta por vários pacotes ou bibliotecas. III. A linguagem R não tem a capacidade de dialogar com outras linguagens de programação. IV. A IDE mais popular da linguagem R é o Anaconda Spyder. V. A otimização de programação em linguagem R pode ser realizada com uma função “aplly”. São verdadeiras: Resolução comentada: A linguagem Python foi criada em 1989. A compilação da linguagem Python precisa de um interpretador interno à má onde é executada. A linguagem Python utiliza o recurso de indentação para eliminar o uso excessivo de parênteses. recurso de indentação serve para definir ou destacar a estrutura de um algoritmo. Um comentário escrito em um scri linguagem Python pode ser escrito entre três aspas simples. Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/inde... 1 of 6 21/02/2023 13:48 3) 4) Alternativas: III - IV - V. III - V. I II - V. CORRETO I - II - IV. II - IV. Código da questão: 50727 O uso otimizado da linguagem de programação R pode ser feito a partir da vetorização de funções em seu ambiente. dessas funções realiza a pré-alocação de memória com o uso de estruturas de dados mais simplificados. Qual o nome d função? Assinale a alternativa CORRETA. Alternativas: glm. apply. CORRETO cbind. rbind. matrix. Código da questão: 50725 A respeito dos sistemas distribuídos, avalie as asserções a seguir e a relação existente entre elas. I. Falhas independentes se referem à capacidade que cada componente do sistema distribuído tem em poder falhar independentemente, sendo que outros componentes podem permanecer em plena atividade. PORQUE II. Em sistemas distribuídos, as falhas resultam em isolamento do componente que falhou, ou seja, os componentes que ficam isolados da rede, podendo não parar de funcionar, apenas ficarem isolados. Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas. Resolução comentada: A linguagem R tem em sua construção estrutural semelhanças com a linguagem S, e é composta por vários pacotes/bibliotecas. Ela tem capacidade de dialogar com diversas outras linguagens de programação. A IDE mais po da linguagem R é o RStudio. A otimização de programação em linguagem R pode ser realizada com uma função “ap Resolução comentada: O uso otimizado da linguagem de programação R pode ser feito a partir da vetorização de funções em seu ambiente por exemplo, pela função apply. Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/inde... 2 of 6 21/02/2023 13:48 5) Alternativas: As asserções I e II estão corretas, mas a segunda não justifica a primeira. A asserção I está correta, e a asserção II está incorreta. As asserções I e II estão corretas e, a segunda justifica a primeira. CORRETO As asserções I e II estão incorretas. A asserção I está incorreta, e a asserção II está correta. Código da questão: 50704 A análise de desempenho de sistemas paralelos é importante por uma série de justificativas que podem ser elencada as características da análise de desempenho com abordagem online, avalie as afirmativas a seguir e assinale V para ve F para falsa. ( ) A abordagem online também é conhecida como abordagem post-mortem. ( ) A ausência de custo de manutenção de dados é uma das principais características. ( ) O custo de manutenção de dados é uma vantagem, porque há a necessidade de armazenamento de dados em disco ( ) A falta de escalabilidade é uma de suas principais desvantagens. ( ) Uma de suas características é a necessidade de gravação de informações durante a execução. Assinale a alternativa que contenha a sequência CORRETA Alternativas: V – V – F – V – F. F – V – F – V – F. CORRETO F – F – F – F – F. V – V – V – V – V. V – F – V – F – V. Código da questão: 50708 Resolução comentada: Falhas independentes se referem à capacidade que cada componente do sistema distribuído tem em poder falhar independentemente, sendo que outros componentes podem permanecer em plena atividade porque em sistemas distribuídos as falhas resultam em isolamento do componente que falhou, ou seja, os componentes que falham ficam isolados da rede, podendo não parar de funcionar, apenas ficarem isolados. Resolução comentada: A abordagem online não é conhecida como abordagem post-mortem, esse termo se refere à abordagem offline. A au de custo de manutenção de dados é uma das principais características. O custo de manutenção de dados é uma van porque NÃO há a necessidade de armazenamento de dados em disco. A falta de escalabilidade é uma de suas princ desvantagens. Uma de suas características é a AUSÊNCIA da necessidade de gravação de informações durante a execução. Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/inde... 3 of 6 21/02/2023 13:48 6) 7) O termo big data vai além do significado de grande massa de dados. A esse respeito, avalie as afirmativas a seguir. I. O armazenamento digital de dados no final da segunda década dos anos 2000 é de, praticamente, 90%. II. No contexto big data, agregar valor representa o retorno esperado do investimento. III. No contexto de big data, o termo analytics significa o processo de extração de dados. IV. O conceito de big data analytics é uma combinação de sistemas capazes de tratar dados estruturados e não estrutur V. Há um conjunto de letras V’s que representam o conceito de big data. São verdadeiras: Alternativas: II - III - IV. I - III - V. II - IV - V. CORRETO I - II - IV. I - II. Código da questão: 50722 Sobre as ferramentas OLAP (processo analítico online), avalie as afirmativas a seguir. I. A primeira vez que falou no termo OLAP foi em 1992. II. A linguagem OLAP de definição de dados (DDL) pode remover uma estrutura de dados. III. A estrutura principal de dados de um data warehouse é conhecida como fatos. IV. Uma estrutura de dados de um data warehouse, quando pensada como um cubo, se tiver mais de três dimensões é como hipercubo. V. As estruturas auxiliares de um data warehouse são conhecidas como tabelas. São verdadeiras: Alternativas: I - II - IV. II - III - V. II - III - IV. CORRETO III - IV - V. IV - V. Resolução comentada: O armazenamento digital de dados no final da segunda década dos anos 2000 é de, praticamente, 100%. No contex data, agregar valor representa o retorno esperado do investimento. No contexto de big data, o termo analytics signific do processo de extração de dados, pois também cria informações. O conceito de big data analytics é uma combinaçãsistemas capazes de tratar dados estruturados e não estruturados. Há um conjunto de letras V’s que representam o conceito de big data, volume, variedade, velocidade, veracidade e valor agregado. Resolução comentada: Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/inde... 4 of 6 21/02/2023 13:48 8) 9) Código da questão: 50732 A respeito de um data warehouse, avalie as asserções a seguir e a relação existente entre elas. I. A necessidade de uma flexibilidade mínima para um data warehouse se faz necessária. PORQUE II. Um data warehouse inflexível implica em restrição aos usuários a realizarem apenas consultas e análises com motiva vigentes, sem sequer permitir que novos insights sejam implementados (VERZOLA, 201-?). Referência: VERZOLA, I. Data warehouse. [201-?]. Barueri: Pontes Computadores e Serviços Ltda. Disponível em: http://www.pontes.inf.br/docs/datawarehouse.pdf. Acesso em: 7 nov. 2019. Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas: Alternativas: A primeira e a segunda asserção estão corretas, mas a segunda não é justificativa da primeira. As duas asserções estão incorretas. A primeira e a segunda asserção estão corretas e a segunda justifica a primeira. CORRETO A primeira asserção está incorreta, e a segunda asserção está correta.) A primeira asserção está correta, e a segunda asserção está incorreta. Código da questão: 50719 A respeito de otimização de programação R, avalie a afirmativa a seguir para completar suas lacunas corretamente. Em se tratando de otimização da linguagem R em ____________, estudiosos do assunto afirmam que esta é uma ques ____________, pois, em muitas situações, os programas podem demorar um longo período de tempo para realizar ____________ de algumas tarefas (HÖLBIG; MAZZONETTO; PAVAN, 2017). Por isso, dá-se à otimização uma ampla a com a intenção de produzir scripts apropriados, que possam otimizar o desempenho computacional do processo. Referência: HÖLBIG, C. A.; MAZZONETTO, A.; PAVAN, W. Computação paralela com a linguagem R: técnicas, ferrame aplicações. Minicurso. 17ª Escola Regional de Alto Desempenho do Estado do Rio Grande do Sul. Anais, p. 25-42. Ijuí: Disponível em: http://www.lbd.dcc.ufmg.br/colecoes/erad/2017/003.pdf. Acesso em: 29 nov. 2019. Assinale a alternativa que completa adequadamente as lacunas acima. Alternativas: A primeira vez que se falou no termo OLAP foi em 1962. A linguagem OLAP de definição de dados (DDL) pode remo uma estrutura de dados. A estrutura principal de dados de um data warehouse é conhecida como fatos. Uma estrutu dados de um data warehouse quando pensada como um cubo, se tiver mais de três dimensões é conhecida como hipercubo. As estruturas auxiliares de um data warehouse são conhecidas como tabelas. Resolução comentada: A necessidade de uma flexibilidade mínima para um data warehouse se faz necessária porque um data warehouse inflexível implica em restrição aos usuários a realizarem apenas consultas e análises com motivações vigentes, sem permitir que novos insights sejam implementados (VERZOLA, 201-?). Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/inde... 5 of 6 21/02/2023 13:48 10) Computadores; fácil; programas. Processos; fácil; programas. Computadores; crítica; execução. Processos; crítica; execução. CORRETO Computadores; fácil; execução. Código da questão: 50726 O uso do processamento paralelo permite que vários processadores sejam utilizados para resolver o mesmo proble processador resolve uma parte distinta. Os autores Navaux, De Rose e Pilla (2011) listaram uma série de vantagens do processamento paralelo. Uma das vantagens surge com a redução do tempo de execução. Qual o nome desta caracter Referência: NAVAUX, P. O. A.; De ROSE, C. A. F.; PILLA, L. L. Fundamentos das arquiteturas para processamento para distribuído. 2011. Laboratório de Banco de Dados. Departamento de Ciência da Computação – UFMG. Disponível em: http://www.lbd.dcc.ufmg.br/colecoes/erad-rs/2011/003.pdf. Acesso em: 17 set. 2019. Assinale a alternativa CORRETA. Alternativas: Crescimento linear. Modelagem. Tolerância a falhas. Desempenho. CORRETO Aceleração linear. Código da questão: 50700 Resolução comentada: Em se tratando de otimização da linguagem R em processos, estudiosos do assunto afirmam que esta é uma questã crítica, pois, em muitas situações, os programas podem demorar um longo período de tempo para realizar execução algumas tarefas. Resolução comentada: Navaux, De Rose e Pilla (2011) listam o desempenho como vantagem do uso do processamento paralelo, o qual traz consequência a redução do tempo de processamento e execução de problemas. Arquivos e Links Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/inde... 6 of 6 21/02/2023 13:48
Compartilhar