Buscar

TÓPICOS DE BIG DATA EM PYTHON - DGT0134_AVS_(AG)

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 3 páginas

Prévia do material em texto

Disciplina: TÓPICOS DE BIG DATA EM PYTHON  AVS
Aluno: VALEIRO ANTONIO DE FIGUEIREDO 202104489064
Turma: 9001
DGT0134_AVS_202104489064 (AG)   19/03/2023 06:01:42 (F) 
Avaliação: 8,00 pts Nota SIA: 10,00 pts
 
02260 - ANÁLISE DE DADOS EM PYTHON COM PANDAS  
 
 1. Ref.: 6076630 Pontos: 0,00  / 1,00
No contexto de Coleta de Dados, o que podemos a�rmar sobre Dados Primários:
I - São dados obtidos em primeira mão pelo cientista de dados ou pelo analista de dados
II - São dados que precisam ser pré-processados para análise, e serão feitos exclusivamente no primeiro momento pelo dono dos
dados, o analista em questão
III - São obtidos através de softwares de monitoramento de logs, surveys, e bancos de dados
Analise as frases listadas e assinale a alternativa correta.
Apenas as opções II e III.
 Apenas as opções I e III.
Apenas a opção II.
 As opções I, II, e III estão corretas.
Apenas a opção I.
 2. Ref.: 6076764 Pontos: 1,00  / 1,00
A biblioteca pandas é poderosa e de grande valia para a vida de um cientista de dados. Sobre ela podemos a�rmar que:
I - O nome Pandas se refere a dados em painel ou panel data
II - O DataFrame é o coletivo de listas (lists)
III - É possível criarmos DataFrames a partir de praticamente qualquer estrutura de dados, principalmente CSVs, Excels, e
JSONsAnalise as frases listadas e assinale a alternativa correta.
Apenas I e II.
Apenas I.
Apenas II.
 Apenas I e III.
Apenas II e III.
 
02318 - BIG DATA ANALYTICS  
 
 3. Ref.: 6075827 Pontos: 1,00  / 1,00
Quais os métodos de aprendizado de máquina que existem?
Aprendizado Supersticioso, Não-Supervisionado, Por Reforço, e Semisupervisionado
 Aprendizado Supervisionado, Não-Supervisionado, Por Reforço, e Semisupervisionado
Aprendizado Supervisionado, Não-Supervisionado, Por Força Bruta, e Semisupervisionado
Aprendizado Supervisionado, Não-Supervisionado, Por Reforço, e Aleatório
Aprendizado Supervisionado, Escondido, Por Reforço, e Semisupervisionado
javascript:alert('C%C3%B3digo da quest%C3%A3o: 6076630.');
javascript:alert('C%C3%B3digo da quest%C3%A3o: 6076764.');
javascript:alert('C%C3%B3digo da quest%C3%A3o: 6075827.');
 4. Ref.: 6075831 Pontos: 1,00  / 1,00
Qual o processo irmão do KDD que é utilizado comumente no âmbito industrial?
KDD-DM.
SIGKDD.
SIGM.
 CRISP-DM.
KDM.
 
02508 - HADOOP E ARMAZENAMENTO DE DADOS  
 
 5. Ref.: 6076197 Pontos: 1,00  / 1,00
A respeito dos componentes do ecossistema do Hadoop, selecione a opção correta que apresenta o componente
responsável pelo gerenciamento dos clusters.
HCluster
Spark
HBase
Flume
 Zookeeper
 6. Ref.: 6076196 Pontos: 1,00  / 1,00
Compreender a tecnologia Hadoop e os aspectos fundamentais do seu ecossistema é fundamental para o pro�ssional de
Tecnologia da Informação. Sendo assim, selecione a opção correta sobre o Hadoop.
O Hadoop tem apenas uma única distribuição.
 O Hadoop utiliza o HDFS para armazenar dados.
Hadoop é um ambiente ideal para extrair e transformar pequenos volumes de dados.
A estrutura de desenvolvimento no Hadoop é sequencial.
O Hadoop não funciona com pequenos volumes de dados.
 
02727 - PRINCÍPIOS DE BIG DATA  
 
 7. Ref.: 6067206 Pontos: 1,00  / 1,00
A respeito das aplicações de �uxos de dados, selecione a opção correta.
Reapresentação de programas de televisão.
Serviços de compras online
Transações bancárias, como o serviço de PIX.
Serviço de correio eletrônico
 Serviços sob demanda, como serviços de �lme online.
 8. Ref.: 6067461 Pontos: 0,00  / 1,00
Selecione a opção correta a respeito do processamento e streaming de dados.
javascript:alert('C%C3%B3digo da quest%C3%A3o: 6075831.');
javascript:alert('C%C3%B3digo da quest%C3%A3o: 6076197.');
javascript:alert('C%C3%B3digo da quest%C3%A3o: 6076196.');
javascript:alert('C%C3%B3digo da quest%C3%A3o: 6067206.');
javascript:alert('C%C3%B3digo da quest%C3%A3o: 6067461.');
Os dados sempre estão no mesmo formato
 Caracterizam-se pelo envio do mesmo dado por várias fontes
Os dados sempre são provenientes de aplicações transacionais
Os dados são caracterizados também são denominados de lotes estáticos.
 Os dados podem vir de várias fontes
 
02729 - PRINCIPIOS DE DESENVOLVIMENTO DE SPARK COM PYTHON  
 
 9. Ref.: 6076009 Pontos: 1,00  / 1,00
A biblioteca Pandas é amplamente utilizada para manipular dados heterogêneos, situação recorrente para aplicações de Big
Data. Nesse sentido, selecione a opção que contém a estrutura de dados que possibilita o Cientista de dados atribuir nome para
as colunas.
PySpark
numpy.array
 DataFrame
RDD
SQL
 10. Ref.: 6082368 Pontos: 1,00  / 1,00
O Apache Spark é um framework de código aberto aplicado para projetos de Big Data. Selecione a opção correta que contenha
apenas funções que podem ser categorizadas como ações no Spark.
take, �lter e sample.
 �rst, take e reduce.
count, collect e map.
collect, �atMap e sample.
reduce, map e �lter.
javascript:alert('C%C3%B3digo da quest%C3%A3o: 6076009.');
javascript:alert('C%C3%B3digo da quest%C3%A3o: 6082368.');

Continue navegando