Buscar

TÓPICOS DE BIG DATA EM PYTHON

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 3 páginas

Prévia do material em texto

Disc.: TÓPICOS DE BIG DATA EM PYTHON 
 
Acertos: 10,0 de 10,0 
 
 
 
1a 
 Questão 
Acerto: 1,0 / 1,0 
 
Selecione a opção correta com a medida de volume de dados que normalmente é usada 
para se referenciar a projetos de Big Data. 
 
 
Gigabytes 
 
Exabytes 
 
Zetabytes 
 
Terabytes 
 Petabytes 
 
2a 
 Questão 
Acerto: 1,0 / 1,0 
 
Em relação às plataformas para Internet das Coisas, selecione a opção correta sobre o 
Arduino. 
 
 
É o outro nome para Raspberry PI 
 
É um programa 
 
É um protocolo de internet das coisas 
 É um ecossistema que envolve software e hardware 
 
É uma placa de hardware 
 
3a 
 Questão 
Acerto: 1,0 / 1,0 
 
Reconhecer os conceitos de Data Lake é fundamental para o profissional de Tecnologia 
da Informação. Selecione a opção correta que define resumidamente o que é o Data 
Lake. 
 
 
É uma tecnologia de armazenamento e processamento de dados. 
 
É um repositório para tratamento dos dados. 
 É um repositório centralizado para armazenamento de dados. 
 
Trata-se de um componente do HDFS responsável pela implementação do 
mecanismo MapReduce para fazer o gerenciamento dos dados. 
 
É um ambiente para tratamento e armazenamento apenas de dados 
relacionais. 
 
4a 
 Questão 
Acerto: 1,0 / 1,0 
 
Reconhecer os conceitos de Data Lake é fundamental para o profissional de Tecnologia 
da Informação. Selecione a opção correta a respeito do Data Lake. 
 
 
Possui alta latência para acesso dos dados. 
 Armazenam os dados de modo eficiente. 
 
Demandam por equipamentos especiais. 
 
Aplicam processos de tratamento nos dados. 
 
São exclusivos da distribuição Hadoop Apache. 
 
5a 
 Questão 
Acerto: 1,0 / 1,0 
 
Atualmente, o Apache Spark, é o mais bem-sucedido framework para Big Data. 
Selecione a opção correta que contenha apenas funções que podem ser categorizadas 
como transformações no Spark. 
 
 map, filter e union. 
 
count, collect e take. 
 
map, take e reduce. 
 
map, sample e collect. 
 
reduce, first e map. 
 
6a 
 Questão 
Acerto: 1,0 / 1,0 
 
O Spark é uma ferramenta computacional voltada para aplicações de Big Data. 
Selecione a opção correta a respeito do componente que pode ser tratado com o Spark 
SQL. 
 
 RDD 
 
Work Node 
 
DAG 
 
Tasks 
 
Executor 
 
7a 
 Questão 
Acerto: 1,0 / 1,0 
 
Luis planeja começar um projeto particular visando construir um módulo de análise de 
dados. Primeiramente ele deseja começar por um módulo de coleta de dados. Para que 
ele possa obter um padrão organizado de criação de projeto, qual a sequência 
desejável de passos que esperamos que Luis siga? 
 
 
Criar uma pasta para acomodar seu projeto; Instalar as dependências com as 
quais ele quer trabalhar através do pip install; criar uma pasta para o módulo de 
coleta e dentro dela criar um arquivo __init__.py em branco e outro para a lógica 
do módulo. 
 
Criar uma pasta para acomodar seu projeto; Levantar um virtualenv através do 
venv; Instalar as dependências com as quais ele quer trabalhar através do pip 
install; congelar as mesmas no requirements.txt através do pip freeze; criar uma 
pasta para o módulo de coleta e dentro dela criar um arquivo __init__.py com a 
lógica do módulo. 
 Criar uma pasta para acomodar seu projeto; Levantar um virtualenv através do 
venv; Instalar as dependências com as quais ele quer trabalhar através do pip 
install; congelar as mesmas no requirements.txt através do pip freeze; criar uma 
pasta para o módulo de coleta e dentro dela criar um arquivo __init__.py em 
branco e outro para a lógica do módulo. 
 
Criar uma pasta para acomodar seu projeto; Instalar as dependências com as 
quais ele quer trabalhar através do pip install; congelar as mesmas no 
requirements.txt através do pip freeze; criar uma pasta para o módulo de coleta 
e dentro dela criar um arquivo __init__.py em branco e outro para a lógica do 
módulo. 
 
Criar uma pasta para acomodar seu projeto; Levantar um virtualenv através do 
venv; Instalar as dependências com as quais ele quer trabalhar através do pip 
install; congelar as mesmas no requirements.txt através do pip freeze; criar uma 
pasta para o módulo de coleta e dentro dela criar um para a lógica do módulo. 
 
 
8a 
 Questão 
Acerto: 1,0 / 1,0 
 
Compreender a análise de dados em Python é fundamental para o cientista de dados. 
Qual o papel do sistema pip da linguagem Python? 
 
 
Gerenciador de espaços virtuais do Python. 
 
Biblioteca de Processamento de Linguagem Natural. 
 Gerenciador de Pacotes do Python. 
 
Gerenciador de memória do Python. 
 
Motor de Busca da IDE do Python. 
 
9a 
 Questão 
Acerto: 1,0 / 1,0 
 
Como podemos checar as métricas de classificação do modelo neural da biblioteca 
Scikit-Learn? 
 
 Classification Report 
 
Regressão Linear 
 
Plotly 
 
Gráfico de Histograma 
 
Gráfico de Matriz de Dispersão 
 
10a 
 Questão 
Acerto: 1,0 / 1,0 
 
A qual técnica de Aprendizado de Máquina o Algoritmo de Árvore de Decisão 
Classificadora pertence? 
 
 
Q-Learning 
 
Regressão 
 Classificação 
 
Agrupamento 
 
Modelos Generativos

Continue navegando

Outros materiais