Prévia do material em texto
Prova Impressa GABARITO | Avaliação da Disciplina (Cod.:645387) Peso da Avaliação 10,00 Prova 93385550 Qtd. de Questões 20 Nota 10,00 A inovação radical é um produto, processo ou serviço que apresenta características de desempenho sem precedentes. Sabendo disso, assinale a alternativa que apresenta uma definição correta de inovação radical: A Trata-se da implementação de melhorias em um produto, serviço, sistema de gestão ou método de produção existentes. B Trata-se da modificação, aperfeiçoamento, simplificação, consolidação e melhoria de sistemas existentes. C Trata-se da implementação de um produto, serviço, sistema de gestão ou método de produção, que até então não existia no mercado. D Trata-se da melhoria de sistemas existentes, tornando-os mais baratos, melhores e mais rápidos. Em épocas passadas as empresas conviviam com certas limitações, em termos de tecnologia, para que pudessem analisar seus dados. Por outro lado, nos dias atuais, as tecnologias possibilitaram e estimularam a produção de conteúdo. Tendo isso em mente, classifique V para as sentenças verdadeiras e F para as falsas: ( ) As empresas precisam lidar com o alto volume e variedade de dados digitais propondo soluções automáticas de análise a fim de se manterem competitivas. ( ) As empresas orientadas a dados têm à disposição uma massiva quantidade de dados, porém, em muitos casos não sabem como gerenciá-los. ( ) A elevada produção de conteúdo implica em um problema de sobrecarga de informação, evidenciando as limitações da ação humana para lidar com isso. Assinale a alternativa correta: A V – V – V. B V – F – F. C V – F – V. D F – V – V. O radar da inovação permite avaliar o grau de maturidade inovadora das empresas, uma vez que considera a inovação um elemento fundamental no âmbito competitivo. Dito isso, assinale a alternativa que apresenta as treze dimensões que compõem a metodologia do radar da inovação: VOLTAR A+ Alterar modo de visualização 1 2 3 08/01/2025, 11:38 Avaliação da Disciplina about:blank 1/8 A Incremento, radical, parcial, gestão, comércio, serviços, financeiro, processos, marca, colaboradores, sistemas, certificações e patentes. B Oferta, plataforma, marca, clientes, soluções, relacionamento, agregação de valor, processos, organização, cadeia de fornecimento, presença, rede e ambiente inovador. C Organização, gestão, cadeia de fornecedores, planilha, rede de investimentos, estratégia, design, marca, serviços, tecnologia, conhecimento, diferencial e qualidade. D Venda, oferta, financeiro, clientes, alternativas, dimensão, radical, parcial, rede, processos, produtos, serviços e incremento. Benchmarking é o processo contínuo de comparação de produtos, serviços e práticas empresariais similares que são executadas eficientemente em determinada organização. Sabendo disso, assinale a alternativa que traduz corretamente as fases do processo Benchmarking: A Pensar, sentir, ouvir, ver, falar e fazer. B Entender, observar, definir, idealizar, prototipar e testar. C Planejamento, coleta/análise interna de informações, coleta/análise externa de informações, melhoria do desempenho e melhoria contínua. D Observar, planejar, entender, definir, pensar, ouvir, falar, testar, idealizar, sentir e coletar/analisar informações externas. Inovar significa buscar resultados por meio de novas estratégias, novas ideias e novas ações, gerenciando estas de forma sistemática e contínua. SCHERER, F. O.; CARLOMAGNO S. M. A gestão da inovação na prática: como aplicar conceitos para alancar a inovação. São Paulo: Atlas, 2009 (adaptado). Assinale a alternativa que corresponde ao conceito expresso no enunciado: A Modelos de negócios inovadores. B Gestão da inovação. C Business Model Canvas. D Gerenciamento de processos. As técnicas de Multi Machine Clustering surgiram para otimizar e melhorar a escalabilidade e o desempenho das análises em cluster para atender às demandas do Big Data. Em relação às técnicas de Multi Machine Clustering, o que é possível afirmar? A partir das alternativas abaixo, assinale a CORRETA: A É constituída pelas técnicas de clusterização paralela e baseada em MapReduce que tornam o processo de paralelização menos complexo para o desenvolvedor. 4 5 6 08/01/2025, 11:38 Avaliação da Disciplina about:blank 2/8 B São mais velozes que as abordagens tradicionais de agrupamento, no entanto, a alta complexidade de implementação inviabiliza projetos de análises mais amplos. C É composta pela clusterização paralela e pela clusterização baseada em MapReduce. A segunda, inclusive, torna o processo de paralelização mais transparente para o desenvolvedor. D Apresentam como grande característica o alto poder de processamento com implementação de baixa complexidade e algoritmos como PAM, DBSCAN e PIRBICH. A transição da Web representou um importante mecanismo para a revolução dos dados e expôs um novo cenário de explosão e novos formatos para análise de dados nos meios digitais. Nesse sentido, dentre as três fases da web, qual destas representou a gênese para explosão dos dados? A partir das alternativas abaixo, assinale a CORRETA: A Entre a Web 1.0 e Web 2.0 com o surgimento das primeiras redes sociais. B Na Web 3.0 a partir da geração de conteúdo por parte do usuário e a compreensão semântica de suas atividades na rede. C Na Web 1.0 que representou o primeiro contato dos usuários em relação à web. D Na Web 2.0 onde os usuários passaram a gerar conteúdo a partir de sistemas dinâmicos. Apesar do grande crescimento, o Big Data é um conceito amplo que se refere à forma como lidamos com a grande quantidade de dados disponível para uso. Além disso, a empresa precisa construir uma infraestrutura para lidar com uma infinidade de fontes e processá-las em um tempo razoável. Diante disso, em qual cenário uma empresa pode estar diante de um Big Data? A partir das alternativas abaixo, assinale a CORRETA: A Quando o conjunto de dados ultrapassar a casa dos 1PB e a empresa precise lidar com dados estruturados, semiestruturados e/ou não estruturados. B Quando a análise de dados tradicional não estiver mais trazendo real valor para a organização, o que poderia indicar a possibilidade de trazer inovação com novas formas de analisar os dados. C Em circunstâncias onde o volume de dados da organização aumente significativamente, tornando-se possível comprar novos servidores, o que poderia diminuir os custos com armazenamento. D Em situações onde a infraestrutura de dados da empresa apresenta elevada taxa de latência e/ou inviabilidade para análises de dados de grande volume e em diferentes formatos e estruturas. As métricas de segmentação representam outra classe de medidas para análise de redes sociais. Em relação a essas métricas, associe os itens, conforme o código abaixo: I – Coeficiente de agrupamento. II – Coesão. III – Clique. ( ) É uma medida que representa o grau de ligação existente entre dois vértices. ( ) É uma medida que indica a probabilidade de formação de clusters entre os vértices. 7 8 9 08/01/2025, 11:38 Avaliação da Disciplina about:blank 3/8 ( ) Quando um determinado vértice está diretamente conectado a todos os outros vértices. A partir das alternativas abaixo, assinale a CORRETA: A I – II – III. B III – II – I. C II – III – I. D II – I – III. Os métodos tradicionais de agrupamento (clustering) podem ser implementados por uma diversidade de algoritmos. Relacione a classe de algoritmos com os métodos, associando os itens, conforme o código abaixo: I – Algoritmos DIANA, ROCK.II – Algoritmos DBSCAN, OPTICS. III – Algoritmos Expectation-Maximization (EM), Self-Organization Map (SOM) IV – Algoritmos K-Means, CLARANS.V – Algoritmos STING, WAVECLUSTER. ( ) Métodos hierárquicos.( ) Métodos baseados em grid.( ) Métodos de particionamento. ( ) Métodos baseados em modelos.( ) Métodos baseados em densidade. Assinale a alternativa que apresenta a sequência CORRETA:A III – IV – II – I – V. B II – V – III – IV – I. C I – IV – V – II – III. D I – V – IV – III – II. A clusterização é uma técnica de aprendizagem não supervisionada que visa classificar um conjunto de dados semelhantes em um mesmo grupo. No que se refere à clusterização é CORRETO afirmar que: A Dados que fazem parte do mesmo grupo apresentam um grau de similaridade ou dissimilaridade elevado. B É útil para classificar um grupo de objetos com classes já definidas, por exemplo, prever a média de vendas de casas em uma determinada região. C É empregada em situações onde não há conhecimento prévio de uma classe. A classificação é feita mediante agrupamento através de alguma medida de distância. D Composto por várias medidas de distância, entre estas a distância Euclidiana que, devido à sua popularidade, pode se aplicar a praticamente todas as classes de problemas. 10 11 08/01/2025, 11:38 Avaliação da Disciplina about:blank 4/8 Empresas de muitos ramos têm investido em tecnologias e análise de dados para expandirem seus negócios. Em geral, que circunstâncias-chave tem incentivado empresas a investirem parte de seus recursos em análise de dados? A partir das alternativas abaixo, assinale a CORRETA: A Mensurar retorno de investimentos, incentivos governamentais e garantia de lucro. B Algoritmos cada vez mais inteligentes, redução de mão de obra e incremento tecnológico. C Automatização de processos, incentivos fiscais e mão de obra barata. D Melhoria dos processos de negócio, aumento de competitividade e o valor que pode ser obtido. Os métodos tradicionais de agrupamento (clustering) podem ser implementados por uma diversidade de algoritmos. Relacione a classe de algoritmos com os métodos, associando os itens, conforme o código abaixo: I – Algoritmos DIANA, ROCK. II – Algoritmos DBSCAN, OPTICS. III – Algoritmos Expectation-Maximization (EM), Self-Organization Map (SOM) IV – Algoritmos K-Means, CLARANS. V – Algoritmos STING, WAVECLUSTER. ( ) Métodos hierárquicos. ( ) Métodos baseados em grid. ( ) Métodos de particionamento. ( ) Métodos baseados em modelos. ( ) Métodos baseados em densidade. Assinale a alternativa que apresenta a sequência CORRETA: A I – IV – V – II – III. B III – IV – II – I – V. C II – V – III – IV – I. D I – V – IV – III – II. Uma das principais vantagens da clusterização baseada em MapReduce é, sem dúvida, a transparência de toda complexidade de implementação envolvida com a distribuição dos dados entre os clusters ou mesmo a capacidade para detectar e corrigir falhas que eventualmente possam ocorrer durante o processo. Relacione as técnicas com os algoritmos que as compõem, associando os itens, conforme o código abaixo: I – Clusterização Paralela. II – Clusterização baseada em MapReduce. ( ) GPMR. ( ) PBIRCH. ( ) MR-DBSCAN. ( ) G-DBSCAN. A partir das alternativas abaixo, assinale a CORRETA: A I – II – II – I. B I – II – I – II. C II – I – I – II. 12 13 14 08/01/2025, 11:38 Avaliação da Disciplina about:blank 5/8 D II – I – II – I. Os meios digitais consistem em um grande potencial para geração e análise dos dados. Nos dias de hoje as empresas têm investido nesses meios para compreender melhor como seus clientes atuam nestas redes. Em relação à análise digital é correto afirmar que: A Conhecida hoje como “Web Analytics” e compreende todas as páginas de um website. A análise de dados nos websites é feita observando as diferentes métricas de ferramentas como Google Analytics para avaliar o comportamento virtual do usuário dentro da página. B Está relacionada a um conjunto de métricas e indicadores para avaliar o comportamento digital de um usuário, como cliques de mouse, posts nas redes sociais, tempo de sessão e assim por diante. Por ser uma área recente, ainda não possui ferramentas com recursos suficientes para análise de grande volume de dados. C Antigamente restringia-se apenas ao termo “web”, mas nos dias de hoje o termo digital expande a todos os dispositivos capazes de conectar a web. A base dessas análises está relacionada a indicadores ou métricas específicas, como: taxa de rejeição, usuários ativos por hora, informações demográficas, etc. D Possui uma diversidade de APIs para acesso e exploração dos dados digitais. São dados como: origens do tráfego, sites mais visitados, registros de compras em um site de vendas e assim por diante. Apesar de todo o potencial, a complexidade e o custo para extrair esses dados impedem o amplo uso desses recursos digitais. O HDFS é um sistema de arquivos do Hadoop que permite armazenar grandes volumes de dados e possui uma arquitetura que apresenta alguns componentes importantes. Dentre os componentes principais da arquitetura do HDFS, assinale a alternativa CORRETA. A O HDFS é formado pelo NameNode e DataNode. O primeiro é considerado vital, pois gerencia todos os dados que chegam ao sistema e notifica aos escravos (Data Node) em caso de falha. Estes apenas executam as tarefas solicitadas. B O HDFS é formado pelo NameNode e DataNode. O primeiro é considerado mestre porque controla todas as atividades relacionadas ao armazenamento físico dos dados em cada nó, enquanto o segundo processa os dados e comunica ao mestre. C O HDFS é formado pelo JobTracker e o TaskTrack. O primeiro está relacionado ao armazenamento e processamento dos dados diretamente no cluster “pai”, enquanto que o segundo apenas obedece às instruções do pai e o notifica quando for o caso. D O HDFS é formado pelo JobTracker e o TaskTrack. O primeiro é responsável por agendar e gerenciar as tarefas de armazenamento, enquanto que o segundo realiza as atividades diretamente nas máquinas destino. O Apache Spark oferece não somente a capacidade de processamento, como também a possibilidade de realizar análises mais avançadas através de um conjunto de bibliotecas. Considerando isso, associe os itens, conforme o código abaixo: I – Spark SQL.II – Spark Streaming.III – Spark MLlib.IV – Spark GraphX. 15 16 17 08/01/2025, 11:38 Avaliação da Disciplina about:blank 6/8 ( ) Contém um conjunto de algoritmos otimizados de Machine Learning projetados para trabalharem em paralelo. ( ) Projetadas para processar estruturas em rede de forma otimizada e com elevada eficiência. ( ) É possível realizar consultas e processar dados estruturados em ambiente Big Data de forma ágil. ( ) Útil para manipular e processar dados de tempo real, analisando microbacths de dados de tempos em tempos. A partir das alternativas abaixo, assinale a CORRETA: A IV – III – I – II. B III – II – I – IV. C III – IV – I – II. D II – III – IV – I. A demanda por profissionais de análise de dados ampliou o escopo de exigências destes profissionais. As empresas estão interessadas em profissionais capacitados e que tenham habilidades em trabalhar com dados. Tendo isso em mente, quais são as principais habilidades requeridas para um profissional de dados? A partir das alternativas abaixo, assinale a CORRETA: A Raciocínio lógico apurado, capacidade para extrair insights de dados não estruturados, experiência prévia em aprendizagem de máquina e pouco conhecimento do conceito de Big Data. B Domínio de técnicas de aprendizagem de máquina, amplo conhecimento em matemática, experiência com todos os tipos de dados ou banco de dados (extração e manipulação) e amplo conhecimento do negócio. C Capacidade para manipulação de dados, conhecimentos em estatística e aprendizado de máquina, habilidades com ferramentas e/ou linguagens de programação e capacidade para transmitir resultados. D Forte capacidade analítica, amplo conhecimento em ferramentas de visualização de dados e frameworks de Big Data como Apache Spark e PowerBI e domínio de bancos de dados não relacionais. O Apache Hadoop contém uma série de componentes que podem ser integrados ao framework. Esses componentes podem ser úteis para as mais diversas finalidades, como armazenamento,transferência de grandes volumes de dados ou até mesmo aplicação de algoritmos preditivos. A partir das opções abaixo, classifique V para as sentenças verdadeiras e F para as falsas: ( ) O Apache Hive é um componente que pode ser integrado ao Hadoop para coletar dados de fontes estruturadas. ( ) O Apache HBase é um banco de dados não relacional propício a ambientes Big Data, uma vez que suporta um grande volume de dados mantendo alto desempenho. ( ) O Apache Sqoop permite mover grandes volumes de dados das fontes para o HDFS. ( ) O Apache Mahout é um componente responsável por trabalhar diretamente com os dados da fonte: extraindo e coletando dados tanto para processamento em lote como em tempo real. A partir das alternativas abaixo, assinale a CORRETA: A F – F – V – V. 18 19 08/01/2025, 11:38 Avaliação da Disciplina about:blank 7/8 B V – V – F – F. C V – V – V – F. D F – V – F – V. Existem diversos métodos tradicionais que podem ser empregados para análise em cluster e são potencialmente interessantes em cenários de baixa complexidade - com quantidade de dados reduzida. Em relação aos métodos hierárquicos é CORRETO afirmar que: A Divide o cluster através de níveis, onde os objetos alocados nos níveis superiores da árvore são mais próximos entre si. B Define aleatoriamente um ponto de partida para o parâmetro K e assim tenta otimizar o resultado ao longo das iterações. C Agrupa um conjunto de pontos de dados em uma estrutura de árvore (dendograma) e fornece boa capacidade para comunicação dos resultados. D Apresenta como vantagem a simplicidade e o fato de ser eficiente, mesmo em situações onde o conjunto de dados é significativo. 20 Imprimir 08/01/2025, 11:38 Avaliação da Disciplina about:blank 8/8