Baixe o app para aproveitar ainda mais
Prévia do material em texto
VANDECIR FREIRE FILHO 202003370789 Disciplina: TÓPICOS DE BIG DATA EM PYTHON AV Aluno: VANDECIR FREIRE FILHO 202003370789 Professor: ROBSON LORBIESKI Turma: 9001 EEX0174_AV_202003370789 (AG) 18/05/2022 09:26:25 (F) Avaliação: 2,0 Nota SIA: 2,0 pts O aproveitamento da Avaliação Parcial será considerado apenas para as provas com nota maior ou igual a 4,0. 02260 - ANÁLISE DE DADOS EM PYTHON COM PANDAS 1. Ref.: 6076630 Pontos: 0,00 / 1,00 No contexto de Coleta de Dados, o que podemos afirmar sobre Dados Primários: I - São dados obtidos em primeira mão pelo cientista de dados ou pelo analista de dados II - São dados que precisam ser pré-processados para análise, e serão feitos exclusivamente no primeiro momento pelo dono dos dados, o analista em questão III - São obtidos através de softwares de monitoramento de logs, surveys, e bancos de dados Analise as frases listadas e assinale a alternativa correta. Apenas as opções I e III. Apenas a opção II. Apenas as opções II e III. Apenas a opção I. As opções I, II, e III estão corretas. 2. Ref.: 6076628 Pontos: 1,00 / 1,00 O seguinte constructo da linguagem Python representa o condicional simples: with while if for else 02318 - BIG DATA ANALYTICS 3. Ref.: 6075832 Pontos: 0,00 / 1,00Educational Performace Solution EPS ® - Alunos javascript:voltar(); javascript:alert('C%C3%B3digo da quest%C3%A3o: 6076630.'); javascript:alert('C%C3%B3digo da quest%C3%A3o: 6076628.'); javascript:alert('C%C3%B3digo da quest%C3%A3o: 6075832.'); javascript:alert('Educational Performace Solution\n\nEPS: M%C3%B3dulo do Aluno\n\nAxiom Consultoria em Tecnologia da Informa%C3%A7%C3%A3o Ltda.') Luís foi contratado recentemente para trabalhar em uma empresa de consultoria de análise de dados. O projeto no qual foi alocado já havia começado, e os colegas de Luís lhe disseram que estavam preparando o conjunto de dados para poder passar os mesmos por um modelo de árvore de decisão. Já que especificamente os colegas de Luís estão removendo dados faltantes, em qual etapa do processo de KDD, Luís se encontra: Avaliação. Coleta de Dados. Descoberta de Padrões. Transformação de Dados. Pré-Processamento . 4. Ref.: 6075828 Pontos: 0,00 / 1,00 Os modelos simbólicos são aqueles que: Se baseiam em táticas de agrupamento por similaridade Se baseiam estritamente em dados e inferências estatísticas em cima deles São aqueles que só lidam com problemas categóricos Se baseiam em lógica e regras de inferência para aprender e raciocinar São aqueles que lidam apenas com problemas numéricos 02508 - HADOOP E ARMAZENAMENTO DE DADOS 5. Ref.: 6075861 Pontos: 0,00 / 1,00 Ser capaz de gerenciar uma infraestrutura complexa é uma habilidade fundamental para o profissional de Tecnologia da Informação. Sendo assim, analise as alternativas e selecione a opção que apresenta o componente responsável por desempenhar o papel de mestre na arquitetura do Hadoop. NameNode HServerMap DataNode Replicador Bloco de dados 6. Ref.: 6076199 Pontos: 0,00 / 1,00 O sistema de arquivos distribuídos do Hadoop, conhecido como HDFS, foi idealizado para trabalhar com grandes volumes de dados. Selecione a opção correta que apresenta o paradigma como o HDFS funciona. Distribuído e centralizado. Centralizado e centralizado. Distribuído e distribuído. Mestre e escravo. Centralizado e distribuído. 02727 - PRINCÍPIOS DE BIG DATA 7. Ref.: 6067461 Pontos: 1,00 / 1,00 Selecione a opção correta a respeito do processamento e streaming de dados. Os dados são caracterizados também são denominados de lotes estáticos.Educational Performace Solution EPS ® - Alunos javascript:alert('C%C3%B3digo da quest%C3%A3o: 6075828.'); javascript:alert('C%C3%B3digo da quest%C3%A3o: 6075861.'); javascript:alert('C%C3%B3digo da quest%C3%A3o: 6076199.'); javascript:alert('C%C3%B3digo da quest%C3%A3o: 6067461.'); javascript:alert('Educational Performace Solution\n\nEPS: M%C3%B3dulo do Aluno\n\nAxiom Consultoria em Tecnologia da Informa%C3%A7%C3%A3o Ltda.') Os dados podem vir de várias fontes Os dados sempre estão no mesmo formato Os dados sempre são provenientes de aplicações transacionais Caracterizam-se pelo envio do mesmo dado por várias fontes 8. Ref.: 6067207 Pontos: 0,00 / 1,00 Em relação às características do processamento de fluxo de dados, selecione a opção correta. Representam o estado de um sistema em um dado momento O fluxo de dados é intermitente Sempre são do mesmo tipo São invariáveis no tempo São relacionados à aplicações de internet das coisas 02729 - PRINCIPIOS DE DESENVOLVIMENTO DE SPARK COM PYTHON 9. Ref.: 6082364 Pontos: 0,00 / 1,00 Observe o trecho de código abaixo import numpy as np x = np.array([1, 5, 1, 6, 4, 7, 7]) função_teste = lambda x: x+x print(função_teste(x)) Selecione a opção correta a respeito dele. O programa vai gerar um erro. A saída do programa é [2]. O programa ficará sintaticamente correto se for acrescentado o "SparkContext" para executar o MapReduce. O programa vai gerar e imprimir [2 10 2 12 8 14 14]. O programa produz a saída 31. 10. Ref.: 6082368 Pontos: 0,00 / 1,00 O Apache Spark é um framework de código aberto aplicado para projetos de Big Data. Selecione a opção correta que contenha apenas funções que podem ser categorizadas como ações no Spark. first, take e reduce. collect, flatMap e sample. count, collect e map. reduce, map e filter. take, filter e sample. Educational Performace Solution EPS ® - Alunos javascript:alert('C%C3%B3digo da quest%C3%A3o: 6067207.'); javascript:alert('C%C3%B3digo da quest%C3%A3o: 6082364.'); javascript:alert('C%C3%B3digo da quest%C3%A3o: 6082368.'); javascript:alert('Educational Performace Solution\n\nEPS: M%C3%B3dulo do Aluno\n\nAxiom Consultoria em Tecnologia da Informa%C3%A7%C3%A3o Ltda.')
Compartilhar