Buscar

AV_Big_Data

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 3 páginas

Prévia do material em texto

BIG DATA 
 
 
 1. Ref.: 5169524 Pontos: 1,00 / 1,00 
 
ANAC 2016 - ANALISTA ADMINISTRATIVO - ANÁLISE DE SISTEMAS /ESAF) Big Data é: 
 
 
Dimensão + variedade + otimização + veracidade, tudo agregando + agilidade 
 
Volume + oportunidade + segurança + veracidade, tudo agregando + valor 
 
 
Volume + disponibilidade + velocidade + portabilidade, tudo requerendo ¿ valor 
 Volume + variedade + velocidade + veracidade, tudo agregando + valor 
 
Volume + variedade + agilidade + efetividade, tudo agregando + valor + atualidade 
 
 
 2. Ref.: 5172492 Pontos: 1,00 / 1,00 
 
(INSTITUTO AOCP - 2018 - PRODEB - Especialista de TIC - B.I) Big Data requer clusters de servidores de apoio às 
ferramentas que processam grandes volumes, alta velocidade e formatos variados de Big Data. Nesse sentido, é correto 
afirmar que Hadoop refere-se a: 
 
 
 
Uma estratégia baseada em tecnologia que permite a coleta de insights mais profundos e relevantes dos clientes, 
parceiros e sobre o negócio. 
 
Um banco de dados com capacidade melhorada. 
 
Um banco de dados com tecnologia de virtualização. 
 Um sistema de armazenamento e processamento de dados massivamente escalável - não é um banco de dados. 
 
Um equipamento de hardware que permite que sistemas administrem crescentes cargas de processamento. 
 
 
 
 3. Ref.: 5190772 Pontos: 1,00 / 1,00 
 
(INSTITUTO AOCP - 2018 - PRODEB - Analista de TIC I - Construção de Software) 
Sobre Banco de Dados Relacional, é correto afirmar que 
 
 os dados são representados como uma coleção de tabelas. 
 
uma chave primária pode ser nula, desde que sua chave secundária esteja preenchida. 
 
todos os valores de uma coluna não precisam ser do mesmo tipo de dados. 
 
em sua terminologia, uma tabela é chamada de atributo. 
 
cada tabela do banco de dados terá um nome, que pode se repetir, desde que suas tuplas sejam diferentes. 
 
 
 4. Ref.: 5187729 Pontos: 0,00 / 1,00 
 
O tipo de escalonamento que agrega diversos computadores, cada um funcionando sozinho, mas todos operando em 
conjunto, denomina-se 
 
 
Vertical 
 Horizontal 
 
Irregular 
 Paralela 
 
Linear 
 
 
 5. Ref.: 5187730 Pontos: 0,00 / 1,00 
 
Marque a opção que apresentam ferramentas que conseguem interoperar com as ferramentas R e Python. 
 
 
Spark mllib e InfoGrid 
 Spark mllib e Weka 
 
Apache mahout e Cassandra 
 
Weka e Apache mahout 
 Couchbase e RStudio 
 
 
 6. Ref.: 5196342 Pontos: 1,00 / 1,00 
 
O volume e variedade dos dados de Big Data trouxe uma maior complexidade para o processo de compreensão dos dados 
analisados, tornando a visualização uma abordagem cada vez mais essencial em um projeto de Big Data. Assinale a opção 
que melhor representa a importância da visualização dos dados. 
 
 
Manter o projeto de Big Data em constante mudança. 
 
Identificar pontos de melhoria no processo. 
 
Ganhar credibilidade para realização de novas análises. 
 Facilitar a apresentação dos resultados obtidos nas análises. 
 
 
Prover uma interface bonita para apresentar os dados. 
 
 
 7. Ref.: 5196347 Pontos: 1,00 / 1,00 
 
(ANAC 2016 ¿ Analista Administrativo ¿ Análise de Sistemas) Para o processamento de grandes massas de dados, no 
contexto de Big Data, é muito utilizada uma plataforma de software em Java, de computação distribuída, voltada para 
clusters, inspirada no MapReduce e no GoogleFS. Esta plataforma é o(a) 
 
 
GoogleCrush 
 
Yam Common 
 
MapFix 
 Hadoop 
 
EMRx 
 
 
 8. Ref.: 5193453 Pontos: 1,00 / 1,00 
 
O sistema Apache Hive acessa diretamente os arquivos armazenados no HDFS e os consulta através de uma interface 
semelhante ao SQL. Isso tem possibilitado aos desenvolvedores fluentes em SQL tirar proveito dos benefícios do Hadoop 
sem exigir que eles aprendam Java ou conheçam a API nativa do MapReduce. O nome dessa interface é: 
 
 
Hive Analise Language 
 
Hive Manipulation Language 
 
Complex Query Language 
 Hive Query Language 
 
Simple Hive Language 
 
 
 9. Ref.: 5187740 Pontos: 1,00 / 1,00 
 
(FUNCAB 2008) A técnica RAID (Redundant Arrays of Inexpensive Disk) é usada: 
 
 
 
no armazenamento de informação ECC (error correcting code), que é a informação de controle de erros; 
 
na alocação dinâmica de memória RAM; 
 em gerenciamento de disco para otimizar as operações de E/S e implementar redundância e proteção de dados; 
 
na otimização das interfaces IDE. 
 
na conexão à rede padrão ethernet; 
 
 
 10. Ref.: 5193463 Pontos: 0,00 / 1,00 
 
A biblioteca MLlib oferece: 
 
 Recursos para preparação de dados, vários tipos de algoritmos de aprendizado de máquina e utilitários de 
persistência; 
 
Exclusivamente recursos para extração, transformação e carga de dados 
 
Utilitários de persistência, recursos para preparação de dados e manipulação de dados estruturados; 
 Algoritmos de aprendizado de máquina e recursos de processamento de grafo; 
 
Algoritmos de aprendizado de máquina e para processamento em tempo real;

Continue navegando