Buscar

ECOSISTEMA HADOOP

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 16 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 16 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 16 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Questão 1
Para identificar os dados que fornecem valor para as empresas, podemos:
· a) Explorar o meio digital constantemente.
· b) Determinar a variedade das informações.
· c) Utilizar ferramentas de análise de dados.
· d) Aprender a trabalhar com grandes volumes de dados.
· e) N.R.A.
Quais são as dimensões do Big Data com as quais trabalhamos na comunicação estratégica?
· a) Veracidade e Velocidade.
· b) Volume, Variedade e Valor.
· c) Velocidade, Valor e Decisão.
· d) Velocidade, Volume e Variedade.
· e) Volume, Decisão e Transformação.
Na tomada de decisão, a comunicação estratégica é importante porque:
· a) Auxilia a visão geral dos dados.
· b) Possibilita o retorno dos clientes.
· c) Simplifica o diálogo com os clientes.
· d) Facilita o relacionamento com clientes e parceiros.
· e) Permite o retorno imediato de clientes e parceiros.
Para os gestores, trabalhar com um grande número de informações significa trabalhar com dados que:
· a) Não são precisos.
· b) Podem não ser úteis.
· c) Exigem velocidade de análise.
· d) Podem ser úteis para incrementar os resultados dos processos.
· e) N.R.A.
O processo de visualização de dados em Big Data é importante, devido:
· a) Aos valores dos dados.
· b) À semelhança com os relatórios.
· c) Ao número de ferramentas existentes.
· d) À necessidade de melhor representação dos dados dentro da organização.
· e) N.R.A.
É recomendável utilizar gráficos para visualizar insights?
· a) Não, pois utilizamos gráficos para qualquer tipo de informação.
· b) Não, pois os gráficos não nos apresentam os melhores resultados.
· c) Sim, pois os gráficos nos apresentam os insights acidentais somente.
· d) Não, pois os gráficos não nos revelam a melhor exploração de dados.
· e) Sim, pois é através da exploração de dados que obtemos insights inesperados.
Leia a seguinte afirmação:
“Ao analisar dados dispostos em formato visual, fica mais fácil identificar as variações, os problemas e as melhorias que precisam ser feitas na estratégia ou mesmo nos produtos.”
De acordo com o que estudamos, essa ideia está CORRETA?
· a) Não, pois precisamos comparar os dados com os relatórios.
· b) Sim, mas só por meio da comparação desses dados com os relatórios.
· c) Sim, pois é através da visualização de dados que tomamos as decisões mais rápidas.
· d) Não, pois é mais difícil tomarmos decisões com a visualização de dados em gráficos.
· e) N.R.A.
Sobre a representação gráfica, assinale a opção CORRETA:
· a) Um gráfico em si representa tudo o que foi solicitado.
· b) Um gráfico em si nada representa – ele precisa ser interpretado.
· c) Um gráfico, por si só, apresenta o que foi solicitado, sem a necessidade de complementação.
· d) Um gráfico representa tudo o que foi solicitado, mas precisa de outro formato para ser melhor compreendido.
Uma das maneiras de descobrirmos os dados que agregam valor à organização é:
· a) Trabalhar somente com aqueles das redes sociais.
· b) Trabalhar somente com aqueles de bases estruturadas.
· c) Trabalhar com todos aqueles que obtivermos das fontes existentes.
· d) Extrair conhecimento desse volume de dados, fazer correlações, identificar padrões e descobrir tendências entre eles.
· e) N.R.A.
A descoberta de dados proporciona:
· a) O aumento da produtividade.
· b) A identificação dos melhores clientes.
· c) A análise dos dados não estruturados.
· d) A análise dos dados das bases existentes.
· e) N.R.A.
A mineração de dados serve para:
· a) Identificar esses dados.
· b) Alcançar os melhores clientes.
· c) Utilizar esses dados nas tomadas de decisões.
· d) Identificar os dados oriundos das redes sociais.
· e) Identificar insights, aumentar a fidelidade do público e reduzir a rotatividade de clientes.
Um dos métodos da técnica de mineração de dados é o (a):
· a) Mineração.
· b) Numeração.
· c) Classificação.
· d) Clusterização.
· e) Agrupamento
O projeto de Big Data refere-se ao desenvolvimento de projetos ágeis. Uma de suas premissas afirma que:
· a) Não precisamos nos preocupar com os dados.
· b) Não precisamos nos preocupar com as tarefas definidas.
· c) O escopo desse tipo de projeto é definido uma única vez.
· d) As mudanças podem acontecer, mas devem ser monitoradas.
· e) O projeto pode sofrer grandes mudanças sem muito impacto.
Assinale a opção que apresenta item(ns) importante(s) para o projeto de Big Data:
· a) Gestão.
· b) Pessoas.
· c) Patrocínio.
· d) Retorno de investimento e gestão.
· e) Riscos, pessoas, patrocínio, adequação de valor ao negócio e retorno sobre o investimento.
No gerenciamento de projetos de Big Data, qual é a etapa mais importante dentro daquelas apresentadas pelo Project Management Institute (PMI)?
· a) Escopo.
· b) Aquisição.
· c) Integração.
· d) Comunicação.
· e) Gestão de risco.
Um desafio para implantarmos um projeto de Big Data pode ser:
· a) De dados.
· b) Numérico.
· c) Estrutural.
· d) Em grupos.
· e) N.R.A.
Quando adotamos projetos de Big Data, trabalhamos com:
· a) Bases de dados convencionais.
· b) Fontes de dados da organização.
· c) Qualquer projeto de Tecnologia da Informação (TI).
· d) Dados não estruturados e bases de dados NoSQL.
· e) N.R.A.
A implementação de projetos de Big Data altera a maneira de os gestores tomarem decisões, porque:
· a) Se baseia sempre em intuições.
· b) Se baseia em fatos, não em intuições.
· c) Atua na área operacional da empresa.
· d) Trabalha com fonte de dados operacionais da empresa.
· e) N.R.A.
A forma de processar e armazenar os dados nos projetos de Big Data é importante para garantir:
· a) O espaço em disco.
· b) A utilização do software.
· c) As necessidades do gestor.
· d) A velocidade de acesso à informação.
· e) A eficiência das análises da informação.
A forma de processar e armazenar os dados nos projetos de Big Data é importante para garantir:
· a) O espaço em disco.
· b) A utilização do software.
· c) As necessidades do gestor.
· d) A velocidade de acesso à informação.
· e) A eficiência das análises da informação.
Há grande dificuldade em armazenar dados não estruturados, devido:
· a) À análise simples dos dados.
· b) Ao pequeno volume de dados.
· c) À agilidade da chegada das informações aos gestores.
· d) À facilidade de trabalho com esses tipos de dados por parte dos bancos atuais.
· e) N.R.A.
Não podemos trabalhar com bancos de dados convencionais em projetos de Big Data, porque eles usam:
· a) Histórico de dados.
· b) Dados estruturados.
· c) Quaisquer tipos de dados.
· d) Dados cujo processamento é rápido.
· e) N.R.A.
Os clusters são utilizados no tratamento de dados em Big Data para:
· a) Definir espaço em disco.
· b) Ajudar nas análises dos dados.
· c) Atender às necessidades do gestor.
· d) Possibilitar melhor análise em grupamentos.
· e) Permitir a distribuição das tarefas e o processamento paralelo dos dados.
Entre os desafios do processamento de grandes volumes de dados, estão:
· a) Trabalhar com clusters e servidores individuais.
· b) Atuar com bancos de dados convencionais e clusters.
· c) Trabalhar com iterações e com servidores individuais.
· d) Lidar com a agilidade no processamento e no tratamento dos dados.
· e) Lidar com o armazenamento na memória principal e com frequentes falhas.
De acordo com o que estudamos, o mecanismo de processamento de dados Spark:
· a) Não trabalha com dados em memória.
· b) Possui as mesmas funções que o MapReduce.
· c) Armazena o maior número de dados em memória.
· d) Trabalha de modo semelhante à plataforma Hadoop.
· e) N.R.A.
O MapReduce ajuda no processamento de grande volume de dados, porque trabalha com:
· a) Maior velocidade.
· b) Dados estruturados.
· c) Processamento serial.
· d) Armazenamento paralelo.
· e) Grande número de dados em clusters.
Trabalhar com clusters poderá nos trazer problema quando tivermos de:
· a) Reutilizar dados.
· b)Usar grande volume de dados.
· c) Realizar processamento paralelo.
· d) Analisar grande variedade de dados.
· e) N.R.A.
O Spark nos apresentou o conceito de Resilient Distributed Datasets (RDDs), que significa trabalhar com:
· a) Clusters.
· b) Armazenamento na memória principal.
· c) Estruturas de dados em paralelo, tolerantes à falha.
· d) Agilidade no processamento e tratamento dos dados.
· e) N.R.A.
O Spark pode ser até 100 vezes mais rápido que o processamento in-memory, porque:
· a) Não lê os dados do cluster.
· b) Não escreve dados no cluster.
· c) Armazena os dados do cluster.
· d) Lê os dados do cluster, realiza todas as operações analíticas necessárias e escreve os resultados no cluster.
A solução para a disponibilização imediata de grande volume de dados baseia-se no:
· a) Trabalho com clusters.
· b) Trabalho com MapReduce.
· c) Conceito de in-memory computing.
· d) Processamento paralelo de dados.
· e) N.R.A.
Na solução in-memory:
· a) O processamento de dados é paralelo.
· b) A memória do servidor não é utilizada.
· c) O trabalho é realizado com clusters somente.
· d) Os dados não são armazenados em discos rígidos.
· e) A informação é inicialmente armazenada em discos rígidos convencionais e, então, totalmente carregada na memória do servidor.
O fator fundamental na computação in-memory é:
· a) A estrutura dos dados.
· b) A facilidade do trabalho em memória.
· c) A quantidade de memória RAM do servidor.
· d) A durabilidade, pois a memória principal é volátil.
· e) A quantidade de servidores (hardware) utilizados.
A tecnologia in-memory reduz custos?
· a) Sim, pois existe um único servidor.
· b) Não, pois trabalhamos com replicações.
· c) Sim, pois podemos trabalhar em nuvem.
· d) Não, pois precisamos de vários servidores.
· e) Sim, principalmente com Tecnologia da Informação (TI), uma vez que sua utilização não depende de investimentos em hardware.

Continue navegando