Baixe o app para aproveitar ainda mais
Prévia do material em texto
Avaliação: NPG2059_AV_201905016841 » TEORIAS ANALÍTICAS AVANÇADAS Tipo de Avaliação: AV Aluno: 201905016841 - VIVIANE PEREIRA RODRIGUES LOPES Professor: DENIS GONCALVES COPLE Turma: 9001/AA Nota da Prova: 5,4 Nota de Partic.: 1 Av. Parcial 0 Data: 07/09/2019 21:13:08 1a Questão (Ref.: 201907996137) Pontos: 0,0 / 0,6 Ao adotarmos um balanceamento de cargas numa configuração em cluster, estamos querendo que o comportamento do ambiente se comporte da seguinte maneira: Queremos que seu funcionamento seja pleno e seu foco é obter muita performance, ou seja, não há degradação de recursos e nem perda de desempenho; As tarefas são processadas unicamente num nó deixando os demais disponíveis para as aplicações executarem suas rotinas livremente; As tarefas são distribuídas o mais uniformemente possível entre os nós. O objetivo é fazer que cada computador receba e atenda a uma requisição e não, ou seja, que a tarefa seja dividida entre os nós. Queremos que seu funcionamento seja pleno e seu foco é obter muita disponibilidade ou seja, não é aceitável que o sistema pare de funcionar; As tarefas são processadas separadamente e depois são agrupadas num único nó; 2a Questão (Ref.: 201906015647) Pontos: 0,6 / 0,6 Quais os tipos de clusterização mais utilizados na TI: Por métodos ambíguos de algoritmos. Alto armazenamento de dados, alta funcionalidade de recursos e balanceamento de memória; Por particionamento, por agrupamento e por aglutinação; Alto desempenho, alta disponibilidade e balanceamento de carga; Por compartilhamento de recursos, por segregação de processamento e por abstração de dados; 3a Questão (Ref.: 201906015646) Pontos: 0,6 / 0,6 O que vem a ser um algoritmo de clusterização K-Means? É um recurso computacional que oferece um ambiente completo e similar a um ambiente real para o processamento de um Big Data; São processamentos paralelos que atingem médias de resultados para compor uma pesquisa; São virtualizações entre sistemas operacionais, discos e outros meios físicos que auxiliam no processamento de um Big Data. É uma técnica baseada em médias interativa e muito simples e poderosa para particionar um conjunto de dados em grupos separados, sendo este obtendo um valor incógnito determinado; É um sistema que relaciona dois ou mais computadores para que estes trabalham em maneira conjunta no intuito de processar uma tarefa; 4a Questão (Ref.: 201906070407) Pontos: 0,6 / 0,6 Implementações RIAK são agrupamentos de nós físicos ou virtuais dispostos em pares. Qual das opções seguintes NÃO pode ser considerada uma característica do RIAK? Tolerância a falhas Pesquisas Linhas em link walking Processamento sequencial Índices secundários 5a Questão (Ref.: 201906015630) Pontos: 0,6 / 0,6 Como se identifica dados "sujos" num processo de análise em Big Data: São dados captados em tempo real; São dados desestruturados; São agregações de dados de várias fontes; São dados coletados de bases heterogêneas; São dados imprecisos, incompletos ou errôneos que podem incluir erros de caligrafia ou sensor quebrado. 6a Questão (Ref.: 201906015604) Pontos: 0,6 / 0,6 As pilhas de infraestrutura que devem ser levadas em consideração num processo de Big Data são: Datacenter, Link de acesso remoto e Storage distribuído; Sistema de Arrefecimento interno e externo, Sistema de Iluminação e refrigeração; Infraestrutura física redundante, de segurança, Base de Dados Operacionais, Serviços de Organização de Dados e Ferramentas e Armazém de Dados Analíticos. Infraestrutura segregada e compartilhada e armazenamento semântico; Conjunto de Servidores interligados a Gigabits, Racks inteligentes e monitoráveis remotos; 7a Questão (Ref.: 201906124790) Pontos: 0,6 / 0,6 Existem centenas de algoritmos para clusterização para Big Data, e muitos são utilizáveis, mas nenhum é realmente ótimo. Um destes algoritmos classifica objetos com base em exemplos de treinamento que estão mais próximos no espaço de características. Identifique o algoritmo descrito: GMM Shuffle kNN Kernel K-Means K-Means 8a Questão (Ref.: 201906015603) Pontos: 0,6 / 0,6 Um processo de Big Data requer as mesmas seguranças que outros demais processos de TI ou sistemas convencionais. Exposto isso, quais as ações que devem ser tomadas quanto a questão de segurança dessa infraestrutura? Garantir segurança quanto ao acesso aos dados, liberação total do firewall e Detecção de Incidentes; Garantir o desempenho, estabilidade e funcionalidade do processo de coleta e gestão dos dados; Garantir unicidade e velocidade nos processos de TI; Estabelecer segurança transversal e universal nas integrações entre os ambientes heterogêneos. Garantir segurança quanto ao acesso aos dados e a aplicativos, Criptografia de dados e Detecção de Ameaças; 9a Questão (Ref.: 201906015609) Pontos: 0,6 / 0,6 Em que momento as bases de dados documentacionais são úteis: Quando há a necessidade de produzir muitos relatórios e eles precisam ser montados dinamicamente a partir de elementos que mudam com frequência; Num processo de OLAP os registros documentacionais são relevantes para se apurar momentos de compra em tempo real; Quando há a necessidade de explorar dados relacionais em tabelas dinâmicas; Quando se deseja registrar a nacionalidade dos visitantes e colaboradores dos sites visitados; Para obter dados pertinentes ao estilo de vida de um indivíduo. 10a Questão (Ref.: 201906015660) Pontos: 0,6 / 0,6 Como você responderia sobre os fundamentos do HBase: É um sistema de arquivos baseados em pastas escalonáveis e complexas. É um sistema de gerenciamento de discos capaz de mapear pequenos volumes de mídias sociais; É um sistema operacional de banco de dados de mapa classificado multidimensional distribuído que é executado sobre um sistema distribuído que armazena grandes volumes e fornece rápidas consultas; É um sistema operacional baseado em 64 bits com alto desempenho e disponibilidade; É um SGBD não estrutural complexo que retorna informações precisas ao processo de Big Data;
Compartilhar