TÓPICOS DE BIG DATA EM PYTHON AV2

•

ESTÁCIO EAD

Lucas Angelo

02/05/2022

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Disc.: TÓPICOS DE BIG DATA EM PYTHON

Acertos: 10,0 de 10,0
02/05/2022
1a
Questão
Acerto: 1,0 / 1,0

Selecione a opção correta com a medida de volume de dados que normalmente é usada para se referenciar a projetos de Big Data.

Zetabytes

Gigabytes
Petabytes

Terabytes

Exabytes
Respondido em 02/05/2022 13:18:46

Explicação:
As aplicações que possuem ordem de grandeza de petabytes de volume de dados são consideradas de Big Data. As alternativas da questão podem ser vistas em ordem crescente de grandeza das unidades de medida de armazenamento: Gigabytes, Terabytes, Petabytes, Exabytes e Zetabytes.

2a
Questão
Acerto: 1,0 / 1,0

Em relação ao formato dos dados, selecione a opção correta que corresponde ao formato dos dados de transações bancárias.

dados semiestruturados

dados não estruturados

dados de Big Data
dados estruturados

dados de Internet das Coisas
Respondido em 02/05/2022 13:19:05

Explicação:
Os dados de transações bancárias são salvos em tabelas e, portanto, correspondem a dados estruturados, que são típicos de sistemas de transações on line armazenados em banco de dados. As demais alternativas tratam de dados não convencionais que não são armazenados em bancos de dados tradicionais.

3a
Questão
Acerto: 1,0 / 1,0

Em relação aos arquivos de configuração do Hadoop, selecione a opção correta que contém o arquivo que trata das configurações do HDFS.

core-site.xml

hadoop-env.cmd
hdfs-site.xml

yarn-site.xml

mapred-site.xml
Respondido em 02/05/2022 13:20:12

Explicação:
O arquivo de configuração hdfs-site.xml é o responsável pela definição de configuração para processos do HDFS. Ele também é responsável por fazer a especificação da replicação de bloco padrão e verificação de permissão no HDFS.

4a
Questão
Acerto: 1,0 / 1,0

Em relação as fases do Hadoop, selecione a opção correta que apresenta o componente responsável pela geração de pares intermediários de valor e chave.

Agrupamento

Combinação
Embaralhamento

Redução

Gravação da saída
Respondido em 02/05/2022 13:21:44

Explicação:
Através do processo de embaralhamento, também conhecido pelo termo em inglês "shuffling", o mecanismo MapReduce faz a geração de pares intermediários de valor e chave que são transferidos para a fase de redução, o que é realizado em paralelo com outras tarefas da fase de mapeamento.

5a
Questão
Acerto: 1,0 / 1,0

Os componentes do Spark têm como objetivo facilitar o desenvolvimento de projetos com finalidades específicas. Selecione a opção que contém o componente do ecossistema do Spark especializado em aplicações de aprendizado de máquina.

RDDs

MLSpark
MLlib

GraphX Learning

Spark Learning
Respondido em 02/05/2022 13:22:30

Explicação:
Gabarito: MLlib
Justificativa: O componente MLlib é o componente do ecossistema do Spark usado para implementar algoritmos estatísticos e de aprendizado de máquina para simplificar pipelines de aprendizado de máquina em projetos de big data. As opções Spark Learning, GraphX Learning e MLSpark não são componentes válidos do Spark. Os RDDs são componentes para conjunto de dados resilientes.

6a
Questão
Acerto: 1,0 / 1,0

O Spark é uma ferramenta computacional voltada para aplicações de Big Data. Selecione a opção correta a respeito do componente que pode ser tratado com o Spark SQL.

RDD

Work Node

DAG

Executor

Tasks
Respondido em 02/05/2022 13:22:41

Explicação:
Gabarito: RDD
Justificativa: O componente Spark SQL do ecossistema do Spark fornece suporte à linguagem SQL para manipular RDDs. DAGs correspondem a abstrações sobre as execuções dos processos. O Executor é responsável pela execução de tarefas individuais, enquanto o Work Node corresponde ao conjunto de máquinas que executam as tarefas que são as Tasks, ou seja, subdivisões do processo.

7a
Questão
Acerto: 1,0 / 1,0

A visualização dos dados é fundamental no processo de análise e interpretação. Qual o tipo de visualização de dados mais indicada para dados temporais?

Gráfico de Linha.

Gráfico de Barra.

Gráfico de Estrela.

Gráfico de Faces de Chernoff.

Gráfico de Matriz de Dispersão.
Respondido em 02/05/2022 13:23:19

Explicação:
O gráfico de linhas passa a visualização de cronologia, acompanhando a linha de vida do dado, mostrando através das inclinações ou gradientes, o crescimento ou decrescimento do dado. As demais alternativas indicam tipos de visualização inadequados para dados temporais.

8a
Questão
Acerto: 1,0 / 1,0

A linguagem Python se destaca como intuitiva e de fácil aprendizagem. Analise o código abaixo que apresenta laços condicionais e instruções de repetição.
for i in range(10):
if (i%2==0):
print(i)
Qual a saída esperada após a execução do programa?

Serão impressos no console os números racionais entre 0 e 9.

Serão impressos no console os números pares entre 1 e 10.

Serão impressos no console os números ímpares entre 0 e 10.
Serão impressos no console os números pares entre 0 e 9.

Serão impressos no console os números ímpares entre 0 e 9.
Respondido em 02/05/2022 13:23:48

Explicação:
O constructo de laço que itera sobre uma sequência dos números reais de 0 a 9, e cujo condicional dentro do laço escolhe apenas os números cujo resto de sua divisão por 2 seja 0, condição lógica que define se um número é par ou não.

9a
Questão
Acerto: 1,0 / 1,0

As técnicas de aprendizado de máquina para aprendizado supervisionado são:
I - Classificação
II - Agrupamento
III - Regressão

Apenas I

Apenas I e II
Apenas I e III

Apenas II e III

Apenas II
Respondido em 02/05/2022 13:20:43

Explicação:
O aprendizado supervisionado contempla duas técnicas que são a de classificação, em que o modelo tenta aprender a categorizar observações, e a regressão, que tenta aferir um valor numérico para novos registros, baseado no registro histórico e suas características.

10a
Questão
Acerto: 1,0 / 1,0

Alfredo começou em um laboratório de pesquisa e inovação no começo deste ano. Este laboratório investiga a relação entre trocas de mensagens em redes sociais e variações na bolsa de valores, dependendo principalmente de modelos de redes neurais recorrentes. Com qual tipo de IA Alfredo está lidando?

IA Pura

IA Biológica

IA Quântica
IA SubSimbólica

IA Simbólica
Respondido em 02/05/2022 13:24:44

Explicação:
As redes neurais são modelos conexionistas ou subsimbólicas, pois encontram conhecimento nos dados a partir de inferências estatísticas sem requerer regras pré-definidas, sendo essa a sua maior diferença dos modelos simbólicos, e sua vantagem sobre aqueles é a capacidade de atingir melhores predições por exatidão.