Compilado todas AS - BIG DATA

UP

Marcos A. Cardoso

em 05/12/2021

Conteúdos escolhidos para você

9 pág.

Projeto em ciência de dados com soluções para processamento paralelo e distribuído de dados

Anhanguera

15 pág.

Perguntas dessa disciplina

Data Warehouse é um sistema de gerenciamento de dados utilizado para consultas e análises de dados avançadas, contendo de forma geral grande quantidad

Pergunta 1 Os sistemas de informação desempenham um papel crucial nas operações e no sucesso das empresas modernas. Eles são essenciais para diversas

A utilização de estatística e métodos de aprendizado de máquina em aplicações de Big Data é cada vez mais comum. Um dos fatores que influencia para...

Princípio de Big Data Desafio 1 Você foi recentemente contratado por uma empresa de análise de dados como analista de Big Data. Durante uma reunião co

ESTÁCIO

Hoje em dia, estamos cercados pela Inteligência Artificial em praticamente tudo o que fazemos. Um bom exemplo são os algoritmos de recomendação que...

Material

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Conteúdos escolhidos para você

9 pág.

Projeto em ciência de dados com soluções para processamento paralelo e distribuído de dados

Anhanguera

15 pág.

Perguntas dessa disciplina

Data Warehouse é um sistema de gerenciamento de dados utilizado para consultas e análises de dados avançadas, contendo de forma geral grande quantidad

Pergunta 1 Os sistemas de informação desempenham um papel crucial nas operações e no sucesso das empresas modernas. Eles são essenciais para diversas

A utilização de estatística e métodos de aprendizado de máquina em aplicações de Big Data é cada vez mais comum. Um dos fatores que influencia para...

Princípio de Big Data Desafio 1 Você foi recentemente contratado por uma empresa de análise de dados como analista de Big Data. Durante uma reunião co

ESTÁCIO

Hoje em dia, estamos cercados pela Inteligência Artificial em praticamente tudo o que fazemos. Um bom exemplo são os algoritmos de recomendação que...

Prévia do material em texto

Fazer teste: AS I

PERGUNTA 1
Assinale a alternativa que não traz uma correta afirmação para o V de volume no contexto de
Big Data.

c. Os sistemas tradicionais têm dificuldades para armazenar, processar e
compreender esses tipos de dados. (variedade de dados)

PERGUNTA 2
Assinale alternativa que não traz uma definição para Big Data.

e. São sistemas que armazenam os dados por meio do processo de
modelagem de Entidade e Relacionamento (ER).

PERGUNTA 3
Assinale a alternativa que traz uma definição para Big Data.

d. refere-se a grandes conjuntos de dados que são difíceis de armazenar,
pesquisar, visualizar e analisar.

PERGUNTA 4
Assinale a alternativa que traz uma correta afirmação para o V de variedade no contexto de Big
Data.

c. Os sistemas tradicionais têm dificuldades para armazenar, processar e
compreender esses tipos de dados.

PERGUN TA 5
Analise as afirmativas e selecione a alternativa correta.
I - É verdade que os sistemas tradicionais têm dificuldades para armazenar, processar e
compreender esses tipos de dados.
II - É verdade que a atual quantidade de dados disponíveis para as organizações está em
ascensão, enquanto o percentual de dados que essas podem analisar está em declínio.
III -É verdade que a afirmativa I está relacionada à variedade de dados, enquanto que a
afirmativa II está relacionada ao volume.

a. I - Verdadeiro, II – Verdadeiro, III – Verdadeiro.

Fazer teste: AS II

PERGUNTA 1
Assinale a alternativa que não traz um exemplo de dado não estruturado.

e. videos

PERGUNTA 2
Assinale alternativa traz a correta definição para o V de veracidade no contexto de Big Data.

a. Está relacionado à confiabilidade dos dados.

PERGUNTA 3
Assinale a alternativa que não condiz com a característica de veracidade dos dados no
contexto de Big Data.

d. os dados que são produzidos possuem uma vida útil muito curta , por
isso as organizações devem ser capazes de analisa-los quase em tempo
real, se eles esperam encontrar ideias e oportunidades nestes dados.

PERGUNTA 4
Analise as afirmativas e selecione a alternativa correta:
I - Os dados que são produzidos possuem uma vida útil maior e tem aumentado;
II – A validação dos dados oriundos de diversos sistemas, mídias ou redes sociais, trazem uma
complexidade grande para a escolha, transformação, processamento, análise e validação dos
resultados e informações geradas.
III – As empresas que investem em análise de dados como um ativo para a tomada de decisão
são mais bem sucedidas.

b. I – Falso, II- Verdadeiro, III – Verdadeiro;

PERGUNTA 5
Analise as afirmativas e assinale a alternativa correta.
I – Os dados de fluxo são uma categoria especial de Big data, ao invés de ser um formato é um
tipo especial de processamento.
II - Dados gerados por máquinas constituem uma grande variedade de dispositivos porém não
podem ser encarados como uma fonte ou origem de dados para Big Data;
III - aplicações de fluxo contínuo incluem detecção de fraude, segurança física, monitoramento
de tráfego, monitoramento veicular ou monitoramento médico.

d. I – Verdadeiro, II- Falso, III – Verdadeiro;
PERGUN TA 6
Analise as afirmativas e selecione a alternativa correta.
I - Soluções de Big Data são ideais para analisar apenas os dados estruturados.
II - Soluções de Big Data são ideais para analisar não apenas os dados estruturados.
III - Soluções de Big Data são ideais para analisar os dados estruturados, não estruturados e
semiestruturados.

b. I – Falso, II- Verdadeiro, III – Verdadeiro;

Fazer teste: AS III

PERGUNTA 1
Analise a afirmativa e assinale a alternativa que traz a dada característica presente na
computação em nuvem:
I – Os consumidores usam um portal de auto-serviço baseado na web para visualizar um catálogo
de serviços e solicitar serviços em nuvem. Isso permite aos consumidores o provisionamento de
serviços em nuvem de uma forma simples e flexível e reduz o tempo necessário implantação de
novos ou recursos de TI adicionais.

b. On-demand Self-service.

PERGUNTA 2
Analise a afirmativa e assinale a alternativa que traz a dada característica presente na
computação em nuvem:
I – Permite aos provedores de modo a melhorar a utilização de recursos e à prestação de serviços
de forma flexível, recuperar recursos de computação, que estão reunidos para servir a múltiplos
clientes, usando um modelo multi-tenant, com diferentes recursos físicos e virtuais atribuídas e
realocados dinamicamente de acordo com a demanda do cliente. Há um senso de
independência local em que o cliente geralmente não tem controle ou conhecimento sobre a
localização exata dos recursos disponibilizados, mas pode ser capaz de especificar o local em um
nível mais alto de abstração (por exemplo, país, estado, ou datacenter).
Exemplos de recursos incluem armazenamento, processamento, memória e largura de banda
de rede.

c. Pooling de Recursos.

PERGUNTA 3
Assinale a alternativa que não traz um benefício apontado da computação em nuvem.

c. Baixa disponibilidade.

PERGUNTA 4
Assinale a alternativa que não traz uma característica da computação em nuvem.

d. Serviço não mensurado.
PERGUN TA 5
1. Analise a afirmativa e assinale a alternativa que traz a dada característica presente na
computação em nuvem:
I – os consumidores podem se adaptar a variações em cargas de trabalho e manter os níveis de
desempenho requeridos. Os clientes podem ser capazes de evitar custos excessivos, ou excesso
de provisionamento de recursos, pois esses recursos podem ser elasticamente provisionados e
liberados, em alguns casos, automaticamente, para escalar rapidamente recursos mensuráveis
de acordo com a demanda. Para o consumidor, os recursos disponíveis para realizar o
provisionamento muitas vezes parecem ser ilimitados e pode selecionado ou provisionado em
qualquer quantidade a qualquer momento.

d. Elasticidade rápida.

Fazer teste: AS IV
PERGUNTA 1
Analise as afirmativas:
I. Apache Pig é uma plataforma para análise de grandes conjuntos de dados que consiste em
uma linguagem de alto nível para expressar programas de análise de dados;
II. Uma estrutura para armazenamento de dados em cima do Hadoop, o Zoopkeeper cresceu a
partir de uma necessidade de gerenciar e aprender com os grandes volumes de dados que o
Facebook estava produzindo todos os dias a partir de sua crescente rede social.;
III. HBase é um banco de dados distribuído construído sob o HDFS. É a aplicação Hadoop para
usar quando você precisa em tempo real de leitura/gravação de acesso aleatório para grandes
conjuntos de dados;

c. I – correta, II – incorreta e III - correta.

PERGUNTA 2
Analise a definição: é um sistema de arquivos projetado para armazenar arquivos extremamente
grandes com um padrão de fluxo de acesso, executar sob clusters de computadores pessoais ou
plataformas de hardware comuns (WHITE, 2015).
Selecione a alternativa a qual a definição se refere.

d. HDFS.

PERGUNTA 3
Assinale a alternativa que traz a definição de coisas no contexto de internet das coisas.

e. A aplicação do termo Coisas, inclui substâncias e produtos que são
bases da sobrevivência humana e que existem em grandes quantidades e
de diferentes tipos.

PERGUNTA 4
Analise a definição: é o termo usado para se referir a uma família de projetos relacionados,
que compõe a infraestrutura para computação distribuída e de larga escala de processamento,
que usa o conceito de Big Data.
Selecione a alternativa a qual a definição se refere.

b. Hadoop.

PERGUNTA 5
Analise as afirmativas:
I - MapReduce é o termo usado para se referir a uma família de projetos relacionados, que
compõe a infraestrutura para computação distribuída e de larga escala de processamento, que
usa o conceito de Big Data;
II - Modelo de MapReducedivide o processamento em mapas e o divide em fases, cada fase se
baseia em um par de chave/valor usado como entrada e saída para o processo;
III - A biblioteca de software Apache Hadoop é um framework que permite o processamento
distribuído de grandes conjuntos de dados em clusters de computadores que utilizam modelos
de programação simples;
Selecione a correta alternativa quanto às afirmativas:

a. I – correta, II – correta e III - correta.

PERGUNTA 6
Analise as afirmativas com relação à IoT e assinale a alternativa correta:
I - A IoT envolve uma grande quantidade de nós.
II - A utilização de IoT produzirá um pequeno volume de dados.
III - O As informações geradas pelos diferentes dispositivos deverão ser processadas ou
guardadas para um posterior processamento.

c. I – Verdadeiro, II – Falso, III - Verdadeiro.
Fazer teste: AS V

PERGUNTA 1
Analise as afirmativas:
I. O Resilient Distributed Datasets (RDD) é o conceito central da plataforma Spark. Foi
desenvolvido para suportar o armazenamento de dados na memória e distribuído ou em um
cluster, que implementa sua tolerância a falhas, devido, em parte, ao seu rastreamento de dados
brutos ou processamentos.;
II. O RDD é uma funcionalidade permite que usuários da plataforma ou software R utilizem
funções ou funcionalidades Spark de maneira mais usual.;
III. Spark Streaming aproveita a capacidade de processamento rápido da Spark Core para
executar os processamentos. Permite a execução e transformações RDD (Solids Distributed
Datasets) nesses pedações menores de dados e lotes de processamento.;
Selecione a correta alternativa quanto às afirmativas:

c. I – correta, II – incorreta e III - correta.

PERGUNTA 2
Analise as afirmativas:
I. O Spark Core é a plataforma principal de execução que possibilita é base para todas as outras
funcionalidades. Ela fornece a execução em memória e faz referência a conjuntos de dados em
sistemas de armazenamento externos e distribuídos;
II. O framework Spark necessita, para sua execução básica, da linguagem Java, a linguagem Scala
e a linguagem Python instaladas no sistema operacional;
III. MLlib é uma biblioteca de aprendizagem por máquina distribuída que roda sobre a
arquitetura de Spark baseada em memória distribuída;
Selecione a correta alternativa quanto às afirmativas:

c. I – correta, II – incorreta e III - correta.

PERGUNTA 3
Analise a definição: é um projeto de código livre da fundação Apache que possui uma
biblioteca de implementação de algoritmos para aprendizagem de máquina. Selecione a
alternativa que traz o nome da ferramenta ou projeto a qual a definição se refere:

c. Mahout.

PERGUNTA 4
Analise as afirmativas:
I. O Mahout é uma ferramenta desenvolvida em linguagem de programação Java dentro do
projeto de computação distribuída Hadoop;
II. O projeto Mahout possui implementações de diversos algoritmos em sua execução direta no
Hadoop com o Mapreduce;
III. O projeto Mahout não permite integração e implementações de algoritmo usando o Spark;
Selecione a correta alternativa quanto às afirmativas:

d. I – correta, II – correta e III - incorreta.

PERGUNTA 5
Analise o comando: hadoopfs - copyFromLocal C50 /
Analise as afirmativas quanto ao comando:

I. -copyFromLocal serve para copiar algo para o HDFS;
II. C50 é a pasta ou arquivo de origem a ser copiado;
III. / serve para formatar a pasta de destino;
Selecione a correta alternativa quanto às afirmativas:

d. I – correta, II – correta e III - incorreta.

Compilado todas AS - BIG DATA

UP

Ferramentas de estudo

Conteúdos escolhidos para você

Avaliação da Disciplina

Projeto em ciência de dados com soluções para processamento paralelo e distribuído de dados

Avaliação da Disciplina

Segurança em Data Centers

QUESTÕES

Perguntas dessa disciplina

Data Warehouse é um sistema de gerenciamento de dados utilizado para consultas e análises de dados avançadas, contendo de forma geral grande quantidad

Pergunta 1 Os sistemas de informação desempenham um papel crucial nas operações e no sucesso das empresas modernas. Eles são essenciais para diversas

A utilização de estatística e métodos de aprendizado de máquina em aplicações de Big Data é cada vez mais comum. Um dos fatores que influencia para...

Princípio de Big Data Desafio 1 Você foi recentemente contratado por uma empresa de análise de dados como analista de Big Data. Durante uma reunião co

Hoje em dia, estamos cercados pela Inteligência Artificial em praticamente tudo o que fazemos. Um bom exemplo são os algoritmos de recomendação que...

Crie sua conta grátis para liberar esse material. 🤩

Crie sua conta grátis para liberar esse material. 🤩

Crie sua conta grátis para liberar esse material. 🤩

Crie sua conta grátis para liberar esse material. 🤩

Crie sua conta grátis para liberar esse material. 🤩

Conteúdos escolhidos para você

Avaliação da Disciplina

Projeto em ciência de dados com soluções para processamento paralelo e distribuído de dados

Avaliação da Disciplina

Segurança em Data Centers

QUESTÕES

Perguntas dessa disciplina

Data Warehouse é um sistema de gerenciamento de dados utilizado para consultas e análises de dados avançadas, contendo de forma geral grande quantidad

Pergunta 1 Os sistemas de informação desempenham um papel crucial nas operações e no sucesso das empresas modernas. Eles são essenciais para diversas

A utilização de estatística e métodos de aprendizado de máquina em aplicações de Big Data é cada vez mais comum. Um dos fatores que influencia para...

Princípio de Big Data Desafio 1 Você foi recentemente contratado por uma empresa de análise de dados como analista de Big Data. Durante uma reunião co

Hoje em dia, estamos cercados pela Inteligência Artificial em praticamente tudo o que fazemos. Um bom exemplo são os algoritmos de recomendação que...

Mais conteúdos dessa disciplina