Buscar

TOPICOS DE BIG DATA EM PYTHON

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 3 páginas

Prévia do material em texto

VANDECIR FREIRE FILHO
202003370789
 
Disciplina: TÓPICOS DE BIG DATA EM PYTHON AV
Aluno: VANDECIR FREIRE FILHO 202003370789
Professor: ROBSON LORBIESKI
 Turma: 9001
EEX0174_AV_202003370789 (AG) 18/05/2022 09:26:25 (F) 
Avaliação:
2,0
Nota SIA:
2,0 pts
O aproveitamento da Avaliação Parcial será considerado apenas para as provas com nota maior ou igual a 4,0.
 
02260 - ANÁLISE DE DADOS EM PYTHON COM PANDAS 
 
 1. Ref.: 6076630 Pontos: 0,00 / 1,00
No contexto de Coleta de Dados, o que podemos afirmar sobre Dados Primários:
I - São dados obtidos em primeira mão pelo cientista de dados ou pelo analista de dados
II - São dados que precisam ser pré-processados para análise, e serão feitos exclusivamente no primeiro
momento pelo dono dos dados, o analista em questão
III - São obtidos através de softwares de monitoramento de logs, surveys, e bancos de dados
Analise as frases listadas e assinale a alternativa correta.
Apenas as opções I e III.
Apenas a opção II.
 Apenas as opções II e III.
Apenas a opção I.
 As opções I, II, e III estão corretas.
 2. Ref.: 6076628 Pontos: 1,00 / 1,00
O seguinte constructo da linguagem Python representa o condicional simples:
with
while
 if
for
else
 
02318 - BIG DATA ANALYTICS 
 
 3. Ref.: 6075832 Pontos: 0,00 / 1,00Educational Performace Solution EPS ® - Alunos 
javascript:voltar();
javascript:alert('C%C3%B3digo da quest%C3%A3o: 6076630.');
javascript:alert('C%C3%B3digo da quest%C3%A3o: 6076628.');
javascript:alert('C%C3%B3digo da quest%C3%A3o: 6075832.');
javascript:alert('Educational Performace Solution\n\nEPS: M%C3%B3dulo do Aluno\n\nAxiom Consultoria em Tecnologia da Informa%C3%A7%C3%A3o Ltda.')
Luís foi contratado recentemente para trabalhar em uma empresa de consultoria de análise de dados. O projeto
no qual foi alocado já havia começado, e os colegas de Luís lhe disseram que estavam preparando o conjunto de
dados para poder passar os mesmos por um modelo de árvore de decisão. Já que especificamente os colegas de
Luís estão removendo dados faltantes, em qual etapa do processo de KDD, Luís se encontra:
Avaliação.
 Coleta de Dados.
Descoberta de Padrões.
Transformação de Dados.
 Pré-Processamento . 
 4. Ref.: 6075828 Pontos: 0,00 / 1,00
Os modelos simbólicos são aqueles que:
Se baseiam em táticas de agrupamento por similaridade
 Se baseiam estritamente em dados e inferências estatísticas em cima deles
São aqueles que só lidam com problemas categóricos
 Se baseiam em lógica e regras de inferência para aprender e raciocinar
São aqueles que lidam apenas com problemas numéricos
 
02508 - HADOOP E ARMAZENAMENTO DE DADOS 
 
 5. Ref.: 6075861 Pontos: 0,00 / 1,00
Ser capaz de gerenciar uma infraestrutura complexa é uma habilidade fundamental para o profissional de
Tecnologia da Informação. Sendo assim, analise as alternativas e selecione a opção que apresenta o componente
responsável por desempenhar o papel de mestre na arquitetura do Hadoop.
 NameNode
 HServerMap
DataNode
Replicador
Bloco de dados
 6. Ref.: 6076199 Pontos: 0,00 / 1,00
O sistema de arquivos distribuídos do Hadoop, conhecido como HDFS, foi idealizado para trabalhar com
grandes volumes de dados. Selecione a opção correta que apresenta o paradigma como o HDFS funciona.
Distribuído e centralizado.
Centralizado e centralizado.
 Distribuído e distribuído.
 Mestre e escravo.
Centralizado e distribuído.
 
02727 - PRINCÍPIOS DE BIG DATA 
 
 7. Ref.: 6067461 Pontos: 1,00 / 1,00
Selecione a opção correta a respeito do processamento e streaming de dados.
Os dados são caracterizados também são denominados de lotes estáticos.Educational Performace Solution EPS ® - Alunos 
javascript:alert('C%C3%B3digo da quest%C3%A3o: 6075828.');
javascript:alert('C%C3%B3digo da quest%C3%A3o: 6075861.');
javascript:alert('C%C3%B3digo da quest%C3%A3o: 6076199.');
javascript:alert('C%C3%B3digo da quest%C3%A3o: 6067461.');
javascript:alert('Educational Performace Solution\n\nEPS: M%C3%B3dulo do Aluno\n\nAxiom Consultoria em Tecnologia da Informa%C3%A7%C3%A3o Ltda.')
 Os dados podem vir de várias fontes
Os dados sempre estão no mesmo formato
Os dados sempre são provenientes de aplicações transacionais
Caracterizam-se pelo envio do mesmo dado por várias fontes
 8. Ref.: 6067207 Pontos: 0,00 / 1,00
Em relação às características do processamento de fluxo de dados, selecione a opção correta.
 Representam o estado de um sistema em um dado momento
 O fluxo de dados é intermitente
Sempre são do mesmo tipo
São invariáveis no tempo
São relacionados à aplicações de internet das coisas
 
02729 - PRINCIPIOS DE DESENVOLVIMENTO DE SPARK COM PYTHON 
 
 9. Ref.: 6082364 Pontos: 0,00 / 1,00
Observe o trecho de código abaixo
import numpy as np 
x = np.array([1, 5, 1, 6, 4, 7, 7]) 
função_teste = lambda x: x+x 
print(função_teste(x))
Selecione a opção correta a respeito dele.
 O programa vai gerar um erro.
A saída do programa é [2].
O programa ficará sintaticamente correto se for acrescentado o "SparkContext" para executar o
MapReduce.
 O programa vai gerar e imprimir [2 10 2 12 8 14 14].
O programa produz a saída 31.
 10. Ref.: 6082368 Pontos: 0,00 / 1,00
O Apache Spark é um framework de código aberto aplicado para projetos de Big Data. Selecione a opção correta
que contenha apenas funções que podem ser categorizadas como ações no Spark.
 first, take e reduce.
collect, flatMap e sample.
count, collect e map.
reduce, map e filter.
 take, filter e sample.
Educational Performace Solution EPS ® - Alunos 
javascript:alert('C%C3%B3digo da quest%C3%A3o: 6067207.');
javascript:alert('C%C3%B3digo da quest%C3%A3o: 6082364.');
javascript:alert('C%C3%B3digo da quest%C3%A3o: 6082368.');
javascript:alert('Educational Performace Solution\n\nEPS: M%C3%B3dulo do Aluno\n\nAxiom Consultoria em Tecnologia da Informa%C3%A7%C3%A3o Ltda.')

Outros materiais