Logo Passei Direto
Buscar

PROVABIGDATA 1

Ferramentas de estudo

Questões resolvidas

Existem diversos motivos que justificam o uso da computação em nuvem, apesar disso, existe um conceito que é essencial para computação em nuvem. Selecione a opção correta que contenha esse conceito.
confiabilidade
abstração
disponibilidade
produtividade
segurança

Em relação aos modelos de serviço de nuvem, selecione a opção correta com o modelo de serviço focado no hardware: HaaS


PaaS


CaaS


IaaS


MaaS

Em relação aos RDBMS, selecione a opção que apresenta a característica que trata as transações em um banco de dados como uma unidade indivisível.
Atomicidade.
Indivisibilidade.
Consistência.
Isolamento.
Durabilidade.

O sistema de arquivos distribuídos do Hadoop, conhecido como HDFS, foi idealizado para trabalhar com grandes volumes de dados. Selecione a opção correta que apresenta o paradigma como o HDFS funciona.
Centralizado e centralizado.
Distribuído e centralizado.
Distribuído e distribuído.
Centralizado e distribuído.
Mestre e escravo.

Observe o trecho de código abaixo import numpy as np x = np.array([1, 5, 1, 6, 4, 7, 7]) função_teste = lambda x: x+x print(função_teste(x)) Selecione a opção correta a respeito dele.
O programa ficará sintaticamente correto se for acrescentado o 'SparkContext' para executar o MapReduce.
A saída do programa é [2].
O programa produz a saída 31.
O programa vai gerar um erro.
O programa vai gerar e imprimir [2 10 2 12 8 14 14].

Luís foi contratado recentemente para trabalhar em uma empresa de consultoria de análise de dados. O projeto no qual foi alocado já havia começado, e os colegas de Luís lhe disseram que estavam preparando o conjunto de dados para poder passar os mesmos por um modelo de árvore de decisão. Já que especificamente os colegas de Luís estão removendo dados faltantes, em qual etapa do processo de KDD, Luís se encontra:
Coleta de Dados.
Descoberta de Padrões.
Pré-Processamento.
Avaliação.
Transformação de Dados.

Material
páginas com resultados encontrados.
páginas com resultados encontrados.
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Questões resolvidas

Existem diversos motivos que justificam o uso da computação em nuvem, apesar disso, existe um conceito que é essencial para computação em nuvem. Selecione a opção correta que contenha esse conceito.
confiabilidade
abstração
disponibilidade
produtividade
segurança

Em relação aos modelos de serviço de nuvem, selecione a opção correta com o modelo de serviço focado no hardware: HaaS


PaaS


CaaS


IaaS


MaaS

Em relação aos RDBMS, selecione a opção que apresenta a característica que trata as transações em um banco de dados como uma unidade indivisível.
Atomicidade.
Indivisibilidade.
Consistência.
Isolamento.
Durabilidade.

O sistema de arquivos distribuídos do Hadoop, conhecido como HDFS, foi idealizado para trabalhar com grandes volumes de dados. Selecione a opção correta que apresenta o paradigma como o HDFS funciona.
Centralizado e centralizado.
Distribuído e centralizado.
Distribuído e distribuído.
Centralizado e distribuído.
Mestre e escravo.

Observe o trecho de código abaixo import numpy as np x = np.array([1, 5, 1, 6, 4, 7, 7]) função_teste = lambda x: x+x print(função_teste(x)) Selecione a opção correta a respeito dele.
O programa ficará sintaticamente correto se for acrescentado o 'SparkContext' para executar o MapReduce.
A saída do programa é [2].
O programa produz a saída 31.
O programa vai gerar um erro.
O programa vai gerar e imprimir [2 10 2 12 8 14 14].

Luís foi contratado recentemente para trabalhar em uma empresa de consultoria de análise de dados. O projeto no qual foi alocado já havia começado, e os colegas de Luís lhe disseram que estavam preparando o conjunto de dados para poder passar os mesmos por um modelo de árvore de decisão. Já que especificamente os colegas de Luís estão removendo dados faltantes, em qual etapa do processo de KDD, Luís se encontra:
Coleta de Dados.
Descoberta de Padrões.
Pré-Processamento.
Avaliação.
Transformação de Dados.

Prévia do material em texto

Disc.: EEX0174 - TÓP BIG EM PYT Período: 2022.1 EAD (GT) / AV 
 
 
Prezado(a) Aluno(a), 
Responda a todas as questões com atenção. Somente clique no botão FINALIZAR PROVA ao ter 
certeza de que respondeu a todas as questões e que não precisará mais alterá-las. 
 
A prova será SEM consulta. O aluno poderá fazer uso, durante a prova, de uma folha em branco, 
para rascunho. Nesta folha não será permitido qualquer tipo de anotação prévia, cabendo ao aplicador, 
nestes casos, recolher a folha de rascunho do aluno. 
Valor da prova: 10 pontos. 
 
 
1 ponto 
 
1. 
 
 
Existem diversos motivos que justificam o uso da computação em nuvem, apesar disso, 
existe um conceito que é essencial para computação em nuvem. Selecione a opção 
correta que contenha esse conceito. 
 
 
confiabilidade 
 
 
abstração 
 
 
disponibilidade 
 
 
produtividade 
 
 
segurança 
 
 
 
1 ponto 
 
2. 
 
 
Em relação aos modelos de serviço de nuvem, selecione a opção correta com o modelo 
de serviço focado no hardware. 
 
 
MaaS 
 
 
CaaS 
 
 
HaaS 
 
 
IaaS 
 
 
PaaS 
 
 
 
1 ponto 
 
3. 
 
 
Em relação aos RDBMS, selecione a opção que apresenta a característica que trata as 
transações em um banco de dados como uma unidade indivisível. 
 
 
Atomicidade. 
 
 
Durabilidade. 
 
 
Indivisibilidade. 
 
 
Consistência. 
 
 
Isolamento. 
 
 
 
1 ponto 
 
4. 
 
 
O sistema de arquivos distribuídos do Hadoop, conhecido como HDFS, foi idealizado 
para trabalhar com grandes volumes de dados. Selecione a opção correta que 
apresenta o paradigma como o HDFS funciona. 
 
 
Distribuído e distribuído. 
 
 
Centralizado e distribuído. 
 
 
Centralizado e centralizado. 
 
 
Mestre e escravo. 
 
 
Distribuído e centralizado. 
 
 
 
1 ponto 
 
5. 
 
 
Observe o trecho de código abaixo 
import numpy as np 
x = np.array([1, 5, 1, 6, 4, 7, 7]) 
função_teste = lambda x: x+x 
print(função_teste(x)) 
Selecione a opção correta a respeito dele. 
 
 
O programa produz a saída 31. 
 
 
A saída do programa é [2]. 
 
 
O programa vai gerar e imprimir [2 10 2 12 8 14 14]. 
 
 
O programa ficará sintaticamente correto se for acrescentado o "SparkContext" para 
executar o MapReduce. 
 
 
O programa vai gerar um erro. 
 
 
 
1 ponto 
 
6. 
 
 
O Apache Spark é um framework de código aberto aplicado para projetos de Big Data. 
Selecione a opção correta que contenha apenas funções que podem ser categorizadas 
como ações no Spark. 
 
 
count, collect e map. 
 
 
first, take e reduce. 
 
 
reduce, map e filter. 
 
 
take, filter e sample. 
 
 
collect, flatMap e sample. 
 
 
 
1 ponto 
 
7. 
 
A biblioteca pandas é poderosa e de grande valia para a vida de um cientista de dados. 
Sobre ela podemos afirmar que: 
I - O nome Pandas se refere a dados em painel ou panel data 
II - O DataFrame é o coletivo de listas (lists) 
 
III - É possível criarmos DataFrames a partir de praticamente qualquer estrutura de 
dados, principalmente CSVs, Excels, e JSONsAnalise as frases listadas e assinale a 
alternativa correta. 
 
 
Apenas II. 
 
 
Apenas I e II. 
 
 
Apenas I. 
 
 
Apenas I e III. 
 
 
Apenas II e III. 
 
 
 
1 ponto 
 
8. 
 
 
Os dados que, por alguma razão, normalmente interferência humana, não chegam com 
todos os atributos esperados durante a coleta de dados, são conhecidos como: 
 
 
Embaralhados. 
 
 
Nulos. 
 
 
Faltantes. 
 
 
Corrompidos. 
 
 
Enviesados. 
 
 
 
1 ponto 
 
9. 
 
 
Luís foi contratado recentemente para trabalhar em uma empresa de consultoria de 
análise de dados. O projeto no qual foi alocado já havia começado, e os colegas de Luís 
lhe disseram que estavam preparando o conjunto de dados para poder passar os mesmos 
por um modelo de árvore de decisão. Já que especificamente os colegas de Luís estão 
removendo dados faltantes, em qual etapa do processo de KDD, Luís se encontra: 
 
 
Transformação de Dados. 
 
 
Coleta de Dados. 
 
 
Pré-Processamento . 
 
 
Descoberta de Padrões. 
 
 
Avaliação. 
 
 
 
1 ponto 
 
10. 
 
 
Os modelos simbólicos são aqueles que: 
 
 
 
Se baseiam em lógica e regras de inferência para aprender e raciocinar 
 
 
Se baseiam em táticas de agrupamento por similaridade 
 
 
São aqueles que lidam apenas com problemas numéricos 
 
 
Se baseiam estritamente em dados e inferências estatísticas em cima deles 
 
 
São aqueles que só lidam com problemas categóricos

Mais conteúdos dessa disciplina