Baixe o app para aproveitar ainda mais
Prévia do material em texto
Disciplina: TÓPICOS DE BIG DATA EM PYTHON AVS Aluno: VALEIRO ANTONIO DE FIGUEIREDO 202104489064 Turma: 9001 DGT0134_AVS_202104489064 (AG) 19/03/2023 06:01:42 (F) Avaliação: 8,00 pts Nota SIA: 10,00 pts 02260 - ANÁLISE DE DADOS EM PYTHON COM PANDAS 1. Ref.: 6076630 Pontos: 0,00 / 1,00 No contexto de Coleta de Dados, o que podemos a�rmar sobre Dados Primários: I - São dados obtidos em primeira mão pelo cientista de dados ou pelo analista de dados II - São dados que precisam ser pré-processados para análise, e serão feitos exclusivamente no primeiro momento pelo dono dos dados, o analista em questão III - São obtidos através de softwares de monitoramento de logs, surveys, e bancos de dados Analise as frases listadas e assinale a alternativa correta. Apenas as opções II e III. Apenas as opções I e III. Apenas a opção II. As opções I, II, e III estão corretas. Apenas a opção I. 2. Ref.: 6076764 Pontos: 1,00 / 1,00 A biblioteca pandas é poderosa e de grande valia para a vida de um cientista de dados. Sobre ela podemos a�rmar que: I - O nome Pandas se refere a dados em painel ou panel data II - O DataFrame é o coletivo de listas (lists) III - É possível criarmos DataFrames a partir de praticamente qualquer estrutura de dados, principalmente CSVs, Excels, e JSONsAnalise as frases listadas e assinale a alternativa correta. Apenas I e II. Apenas I. Apenas II. Apenas I e III. Apenas II e III. 02318 - BIG DATA ANALYTICS 3. Ref.: 6075827 Pontos: 1,00 / 1,00 Quais os métodos de aprendizado de máquina que existem? Aprendizado Supersticioso, Não-Supervisionado, Por Reforço, e Semisupervisionado Aprendizado Supervisionado, Não-Supervisionado, Por Reforço, e Semisupervisionado Aprendizado Supervisionado, Não-Supervisionado, Por Força Bruta, e Semisupervisionado Aprendizado Supervisionado, Não-Supervisionado, Por Reforço, e Aleatório Aprendizado Supervisionado, Escondido, Por Reforço, e Semisupervisionado javascript:alert('C%C3%B3digo da quest%C3%A3o: 6076630.'); javascript:alert('C%C3%B3digo da quest%C3%A3o: 6076764.'); javascript:alert('C%C3%B3digo da quest%C3%A3o: 6075827.'); 4. Ref.: 6075831 Pontos: 1,00 / 1,00 Qual o processo irmão do KDD que é utilizado comumente no âmbito industrial? KDD-DM. SIGKDD. SIGM. CRISP-DM. KDM. 02508 - HADOOP E ARMAZENAMENTO DE DADOS 5. Ref.: 6076197 Pontos: 1,00 / 1,00 A respeito dos componentes do ecossistema do Hadoop, selecione a opção correta que apresenta o componente responsável pelo gerenciamento dos clusters. HCluster Spark HBase Flume Zookeeper 6. Ref.: 6076196 Pontos: 1,00 / 1,00 Compreender a tecnologia Hadoop e os aspectos fundamentais do seu ecossistema é fundamental para o pro�ssional de Tecnologia da Informação. Sendo assim, selecione a opção correta sobre o Hadoop. O Hadoop tem apenas uma única distribuição. O Hadoop utiliza o HDFS para armazenar dados. Hadoop é um ambiente ideal para extrair e transformar pequenos volumes de dados. A estrutura de desenvolvimento no Hadoop é sequencial. O Hadoop não funciona com pequenos volumes de dados. 02727 - PRINCÍPIOS DE BIG DATA 7. Ref.: 6067206 Pontos: 1,00 / 1,00 A respeito das aplicações de �uxos de dados, selecione a opção correta. Reapresentação de programas de televisão. Serviços de compras online Transações bancárias, como o serviço de PIX. Serviço de correio eletrônico Serviços sob demanda, como serviços de �lme online. 8. Ref.: 6067461 Pontos: 0,00 / 1,00 Selecione a opção correta a respeito do processamento e streaming de dados. javascript:alert('C%C3%B3digo da quest%C3%A3o: 6075831.'); javascript:alert('C%C3%B3digo da quest%C3%A3o: 6076197.'); javascript:alert('C%C3%B3digo da quest%C3%A3o: 6076196.'); javascript:alert('C%C3%B3digo da quest%C3%A3o: 6067206.'); javascript:alert('C%C3%B3digo da quest%C3%A3o: 6067461.'); Os dados sempre estão no mesmo formato Caracterizam-se pelo envio do mesmo dado por várias fontes Os dados sempre são provenientes de aplicações transacionais Os dados são caracterizados também são denominados de lotes estáticos. Os dados podem vir de várias fontes 02729 - PRINCIPIOS DE DESENVOLVIMENTO DE SPARK COM PYTHON 9. Ref.: 6076009 Pontos: 1,00 / 1,00 A biblioteca Pandas é amplamente utilizada para manipular dados heterogêneos, situação recorrente para aplicações de Big Data. Nesse sentido, selecione a opção que contém a estrutura de dados que possibilita o Cientista de dados atribuir nome para as colunas. PySpark numpy.array DataFrame RDD SQL 10. Ref.: 6082368 Pontos: 1,00 / 1,00 O Apache Spark é um framework de código aberto aplicado para projetos de Big Data. Selecione a opção correta que contenha apenas funções que podem ser categorizadas como ações no Spark. take, �lter e sample. �rst, take e reduce. count, collect e map. collect, �atMap e sample. reduce, map e �lter. javascript:alert('C%C3%B3digo da quest%C3%A3o: 6076009.'); javascript:alert('C%C3%B3digo da quest%C3%A3o: 6082368.');
Compartilhar