Baixe o app para aproveitar ainda mais
Prévia do material em texto
1a Questão Acerto: 1,0 / 1,0 Big Data se refere ao imenso volume de conjuntos de dados que alcançam elevadas ordens de magnitude. O valor real do Big Data está no insight que ele produz quando analisado ¿ buscando padrões, derivando significado, tomando decisões e, por fim, respondendo ao mundo com inteligência. Referente ao Big Data, é correto afirmar que o termo variedade refere-se: Aos data centers físicos que transformam os dados em informações pertinentes ao negócio Ao controle de dados semiestruturados de formatos definidos como texto e números A um conjunto de dados mais diversos, incluindo dados estruturados, semiestruturados e não estruturados. É heterogêneo e vem em muitos formatos, incluindo texto, documento, imagem, vídeo e outros Ao banco de dados homogêneo que trata de informações do mesmo tipo definindo padrões de segurança A um conjunto de dados que são gerados em tempo real, o que requer a oferta imediata de informações úteis Respondido em 17/12/2021 14:07:44 2a Questão Acerto: 1,0 / 1,0 (FCC - 2020 - AL-AP - Analista Legislativo - Desenvolvedor de Banco de Dados) Atualmente, diversos dados são coletados pelos sistemas digitais de empresas na internet para constituir Big Data com conteúdo sobre os resultados alcançados por seus produtos e serviços, prestígio da imagem da organização e seus representantes. Porém, parte desses dados pode ser falsa ou manipulada por internautas. O tratamento dos dados, a fim de qualificá-los antes de disponibilizá-los para a tomada de decisão na empresa, segundo o conceito das cinco dimensões ¿V¿ de avaliação de um Big Data, se refere: À veracidade À variedade Ao valor Ao volume À velocidade Respondido em 17/12/2021 14:08:18 Explicação: O V de Veracidade é sobre as fontes e a qualidade dos dados, pois eles devem ser confiáveis 3a Questão Acerto: 1,0 / 1,0 (FUNDATEC - 2017 - CREMERS - Técnico em Informática) Analisando uma tabela em um banco de dados relacional, qual seria o conceito de chave primária? Uma coluna que permita a inserção de um valor de documento válido. Uma coluna ou combinação de colunas cujos valores distinguem uma linha das demais, dentro da mesma tabela. Apenas uma coluna que possua valor numérico e autoincremental. Uma coluna que permita a inserção de um valor de documento inválido. Apenas uma coluna que possua valor numérico e não autoincremental. Respondido em 17/12/2021 14:09:09 Explicação: Uma coluna ou combinação de colunas cujos valores distinguem uma linha das demais, dentro da mesma tabela. 4a Questão Acerto: 1,0 / 1,0 O conceito de computação em nuvem (em inglês, cloud computing) refere-se: Ao armazenamento de dados feito em serviços que poderão ser acessados de qualquer lugar do mundo, a qualquer hora, havendo necessidade de instalação de programas ou, por vezes, de armazenar dados À tecnologia de comunicação de dados que permite uma transmissão de dados mais rápida através de linhas de telefone do que um modem convencional pode oferecer, sendo os dados transmitidos mais rapidamente em uma direção do que na outra, assimetricamente À utilização da memória e da capacidade de armazenamento e cálculo de computadores e servidores compartilhados e interligados por meio da Internet, seguindo o princípio da computação em grade Ao protocolo de comunicação da comada de aplicação utilizado para sistemas de informação de hipermídia, distribuídos e colaborativos, representando a base para a comunicação de dados da World Wide Web Ao programa que habilita seus usuários a interagirem com documentos HTML hospedados em um servidor da rede, destacando-se na era da web 2.0, uma vez que quase tudo do que se necessita está online Respondido em 17/12/2021 14:11:29 5a Questão Acerto: 1,0 / 1,0 Marque a opção que apresenta SOMENTE ferramentas utilizadas para análise de dados. R e Apache Spark Apache mahout e Spark mllib HBase e Python MarkLogic e Weka Hadoop MapReduce e Apache mahout Respondido em 17/12/2021 14:12:35 6a Questão Acerto: 1,0 / 1,0 Visualização de dados é importante para comunicar a mensagem de forma rápida e eficiente. Marque a opção que representa o tipo de visualização que tem como objetivo representar a frequência de ocorrência de cada palavra existente em uma base de dados textual. Barra Word cloud Linha Rain of words Jogo de palavras Respondido em 17/12/2021 14:13:07 7a Questão Acerto: 1,0 / 1,0 São componentes do método do MapReduce: Computador mestre e computador escravo Computador principal e computador secundário Nó gestor e nó operário Nó principal e nó secundário Nó mestre e nó escravo Respondido em 17/12/2021 14:15:57 Explicação: Nó mestre e nó escravo 8a Questão Acerto: 1,0 / 1,0 O ecossistema do Hadoop possui um conjunto de ferramentas de alto nível para facilitar a manipulação dos dados em sistemas distribuídos. Marque a opção que apresenta a ferramenta projetada para transferir dados entre o Hadoop e um banco de dados relacional. Hive Mahout Sqoop Cassandra HBase Respondido em 17/12/2021 14:16:55 9a Questão Acerto: 1,0 / 1,0 (FUNCAB 2008) A técnica RAID (Redundant Arrays of Inexpensive Disk) é usada: em gerenciamento de disco para otimizar as operações de E/S e implementar redundância e proteção de dados; na conexão à rede padrão ethernet; no armazenamento de informação ECC (error correcting code), que é a informação de controle de erros; na alocação dinâmica de memória RAM; na otimização das interfaces IDE. Respondido em 17/12/2021 14:17:56 Explicação: Em gerenciamento de disco para otimizar as operações de E/S e implementar redundância e proteção de dados; 10a Questão Acerto: 1,0 / 1,0 O Apache Spark é um mecanismo de análise unificado para processamento de dados em grande escala com várias vantagens. Marque a opção que NÃO representa uma dessas vantagens. O Spark tem um gerenciador de recursos do cluster próprio responsável por alocar e monitorar os recursos disponíveis no cluster para todas as aplicações O Spark é tem a flexibilidade para processar dados em HDFS, HBase, Cassandra, Hive e qualquer outro formato de entrada aceito pelo Hadoop No Spark as aplicações têm possibilidade de serem escritas em Java, Scala, Python ou R O Spark tem um rico conjunto de bibliotecas para implementar processamentos em estilo SQL, processamento de streaming, algoritmos de grafos e aprendizado de máquina A combinação de DAG e RDD ajudam ao Spark realizar o processamento paralelo extremamente rápido, em particular quando o cluster é grande o suficiente para armazenar todos os dados em memória Respondido em 17/12/2021 14:19:01 javascript:abre_colabore('38403','276013569','5097882878');
Compartilhar