TÓPICOS DE BIG DATA EM PYTHON

•

ESTÁCIO EAD

1

0

1

0

ArcadeeJ 1

19/06/2022

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 6 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 6 páginas

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Big Data

5.801 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

02260 - ANÁLISE DE DADOS EM PYTHON COM PANDAS
1.
Ref.: 6076630
Pontos: 0,00 / 1,00

No contexto de Coleta de Dados, o que podemos afirmar sobre Dados Primários:
I - São dados obtidos em primeira mão pelo cientista de dados ou pelo analista de dados
II - São dados que precisam ser pré-processados para análise, e serão feitos exclusivamente no primeiro momento pelo dono dos dados, o analista em questão
III - São obtidos através de softwares de monitoramento de logs, surveys, e bancos de dados
Analise as frases listadas e assinale a alternativa correta.

As opções I, II, e III estão corretas.

Apenas as opções II e III.

Apenas a opção II.
Apenas as opções I e III.

Apenas a opção I.

2.
Ref.: 6076628
Pontos: 0,00 / 1,00

O seguinte constructo da linguagem Python representa o condicional simples:

while
with

else
if

for

02318 - BIG DATA ANALYTICS
3.
Ref.: 6076113
Pontos: 1,00 / 1,00

Qual o tipo de método nos permite visualizar a árvore de decisão na biblioteca Scikit-Learn?

cout
plot_tree

printf

print

console.log

4.
Ref.: 6075830
Pontos: 0,00 / 1,00

O boom da IA se deve ao surgimento de novas tecnologias e dispositivos que por estarem sempre conectados produzem uma quantidade enorme de dados. Estes dados que alimentam os modelos de aprendizado de máquina também são conhecidos como:

Informações.

Dados Faltantes.
Big Data.

Conhecimento.

Observações.

02508 - HADOOP E ARMAZENAMENTO DE DADOS
5.
Ref.: 6076197
Pontos: 0,00 / 1,00

A respeito dos componentes do ecossistema do Hadoop, selecione a opção correta que apresenta o componente responsável pelo gerenciamento dos clusters.

Zookeeper

HBase
Spark

Flume

HCluster

6.
Ref.: 6075861
Pontos: 0,00 / 1,00

Ser capaz de gerenciar uma infraestrutura complexa é uma habilidade fundamental para o profissional de Tecnologia da Informação. Sendo assim, analise as alternativas e selecione a opção que apresenta o componente responsável por desempenhar o papel de mestre na arquitetura do Hadoop.

DataNode

Bloco de dados

HServerMap

Replicador
NameNode

02727 - PRINCÍPIOS DE BIG DATA
7.
Ref.: 6067386
Pontos: 1,00 / 1,00

Em relação aos formatos que os dados de Big Data, selecione a opção que corresponde a quantidade de formas que podem ser encontrados.

5

2
3

6

4

8.
Ref.: 6067203
Pontos: 0,00 / 1,00

Selecione a opção correta sobre o uso de Big Data.

Com projetos de Big Data é sempre possível detectar fraudes em operações financeiras.
Projetos de big de Big Data são uma forma de organizar tabelas normalizadas com grande volume de dados.
O volume e diversidade dos dados podem dar uma visão realística do que está sendo observado.

É impossível não utilizar aplicações de Big Data para gerenciar projetos de internet das coisas.

Grandes volumes de dados são úteis para testar a capacidade dos servidores de gerenciamento de dados.

02729 - PRINCIPIOS DE DESENVOLVIMENTO DE SPARK COM PYTHON
9.
Ref.: 6075911
Pontos: 0,00 / 1,00

O Spark é um framework de alto desempenho usado para aplicações de Big Data. Em relação à arquitetura do Spark, selecione a opção correta.

O gerenciador de cluster do Spark oferece suporte a Hadoop YARN.

O Executor e os Worker Nodes desempenham papeis equivalentes na arquitetura do Spark.
O gerenciador de cluster do Spark faz o gerenciamento da execução das tarefas.

Os Worker Nodes da arquitetura Spark são responsáveis pelo gerenciamento das máquinas que executarão como escravos.

O Executor corresponde ao conjunto de máquina que executam como escravos.

10.
Ref.: 6076009
Pontos: 0,00 / 1,00

A biblioteca Pandas é amplamente utilizada para manipular dados heterogêneos, situação recorrente para aplicações de Big Data. Nesse sentido, selecione a opção que contém a estrutura de dados que possibilita o Cientista de dados atribuir nome para as colunas.

RDD

numpy.array
DataFrame

PySpark

SQL