TÓPICOS DE BIG DATA EM PYTHON

•

ESTÁCIO

7

1

7

1

4

leonardo Barcellos

21/05/2022

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 3 páginas

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Big Data

6.073 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Disc.: TÓPICOS DE BIG DATA EM PYTHON

Acertos: 10,0 de 10,0

1a
Questão
Acerto: 1,0 / 1,0

Selecione a opção correta com a medida de volume de dados que normalmente é usada
para se referenciar a projetos de Big Data.

Gigabytes

Exabytes

Zetabytes

Terabytes
Petabytes

2a
Questão
Acerto: 1,0 / 1,0

Em relação às plataformas para Internet das Coisas, selecione a opção correta sobre o
Arduino.

É o outro nome para Raspberry PI

É um programa

É um protocolo de internet das coisas
É um ecossistema que envolve software e hardware

É uma placa de hardware

3a
Questão
Acerto: 1,0 / 1,0

Reconhecer os conceitos de Data Lake é fundamental para o profissional de Tecnologia
da Informação. Selecione a opção correta que define resumidamente o que é o Data
Lake.

É uma tecnologia de armazenamento e processamento de dados.

É um repositório para tratamento dos dados.
É um repositório centralizado para armazenamento de dados.

Trata-se de um componente do HDFS responsável pela implementação do
mecanismo MapReduce para fazer o gerenciamento dos dados.

É um ambiente para tratamento e armazenamento apenas de dados
relacionais.

4a
Questão
Acerto: 1,0 / 1,0

Reconhecer os conceitos de Data Lake é fundamental para o profissional de Tecnologia
da Informação. Selecione a opção correta a respeito do Data Lake.

Possui alta latência para acesso dos dados.
Armazenam os dados de modo eficiente.

Demandam por equipamentos especiais.

Aplicam processos de tratamento nos dados.

São exclusivos da distribuição Hadoop Apache.

5a
Questão
Acerto: 1,0 / 1,0

Atualmente, o Apache Spark, é o mais bem-sucedido framework para Big Data.
Selecione a opção correta que contenha apenas funções que podem ser categorizadas
como transformações no Spark.

map, filter e union.

count, collect e take.

map, take e reduce.

map, sample e collect.

reduce, first e map.

6a
Questão
Acerto: 1,0 / 1,0

O Spark é uma ferramenta computacional voltada para aplicações de Big Data.
Selecione a opção correta a respeito do componente que pode ser tratado com o Spark
SQL.

RDD

Work Node

DAG

Tasks

Executor

7a
Questão
Acerto: 1,0 / 1,0

Luis planeja começar um projeto particular visando construir um módulo de análise de
dados. Primeiramente ele deseja começar por um módulo de coleta de dados. Para que
ele possa obter um padrão organizado de criação de projeto, qual a sequência
desejável de passos que esperamos que Luis siga?

Criar uma pasta para acomodar seu projeto; Instalar as dependências com as
quais ele quer trabalhar através do pip install; criar uma pasta para o módulo de
coleta e dentro dela criar um arquivo __init__.py em branco e outro para a lógica
do módulo.

Criar uma pasta para acomodar seu projeto; Levantar um virtualenv através do
venv; Instalar as dependências com as quais ele quer trabalhar através do pip
install; congelar as mesmas no requirements.txt através do pip freeze; criar uma
pasta para o módulo de coleta e dentro dela criar um arquivo __init__.py com a
lógica do módulo.
Criar uma pasta para acomodar seu projeto; Levantar um virtualenv através do
venv; Instalar as dependências com as quais ele quer trabalhar através do pip
install; congelar as mesmas no requirements.txt através do pip freeze; criar uma
pasta para o módulo de coleta e dentro dela criar um arquivo __init__.py em
branco e outro para a lógica do módulo.

Criar uma pasta para acomodar seu projeto; Instalar as dependências com as
quais ele quer trabalhar através do pip install; congelar as mesmas no
requirements.txt através do pip freeze; criar uma pasta para o módulo de coleta
e dentro dela criar um arquivo __init__.py em branco e outro para a lógica do
módulo.

Criar uma pasta para acomodar seu projeto; Levantar um virtualenv através do
venv; Instalar as dependências com as quais ele quer trabalhar através do pip
install; congelar as mesmas no requirements.txt através do pip freeze; criar uma
pasta para o módulo de coleta e dentro dela criar um para a lógica do módulo.

8a
Questão
Acerto: 1,0 / 1,0

Compreender a análise de dados em Python é fundamental para o cientista de dados.
Qual o papel do sistema pip da linguagem Python?

Gerenciador de espaços virtuais do Python.

Biblioteca de Processamento de Linguagem Natural.
Gerenciador de Pacotes do Python.

Gerenciador de memória do Python.

Motor de Busca da IDE do Python.

9a
Questão
Acerto: 1,0 / 1,0

Como podemos checar as métricas de classificação do modelo neural da biblioteca
Scikit-Learn?

Classification Report

Regressão Linear

Plotly

Gráfico de Histograma