TÓPICOS DE BIG DATA EM PYTHON

•

ESTÁCIO

5

0

5

0

Alessandro Mangueira

18/06/2022

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 6 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 6 páginas

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Gestão da Tecnologia da Informação

12.195 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Disciplina: EEX0174 - TÓPICOS DE BIG DATA EM PYTHON
Período: 2022.1 EAD (GT) / AVS
Aluno:
Matrícula:
Data: 17/06/2022 21:13:59
Turma: 9001

ATENÇÃO
1. Veja abaixo, todas as suas respostas gravadas no nosso banco de dados.
2. Caso você queira voltar à prova clique no botão "Retornar à Avaliação".

1a Questão (Ref.: 202010349708)
Em relação à Internet das coisas, selecione a opção correta que relaciona os dispositivos com aos servidores de aplicação.

Servidores de banco de dados

Tecnologia proprietária

Redes locais

Nuvem

Dispositivos de recepção

2a Questão (Ref.: 202010349802)
Em relação aos formatos que os dados de Big Data, selecione a opção que corresponde a quantidade de formas que podem ser encontrados.

3

4

5

2

6

3a Questão (Ref.: 202010358613)
A respeito dos componentes do ecossistema do Hadoop, selecione a opção correta que apresenta o componente responsável pelo gerenciamento dos clusters.

HBase

Zookeeper

Spark

Flume

HCluster

4a Questão (Ref.: 202010358554)
Em relação aos RDBMS, selecione a opção que apresenta a característica que trata as transações em um banco de dados como uma unidade indivisível.

Indivisibilidade.

Isolamento.

Durabilidade.

Atomicidade.

Consistência.

5a Questão (Ref.: 202010358427)
A escolha adequada de uma linguagem de programação é fundamental para a maximização dos resultados almejados. Nesse sentido, selecione a opção que contém a linguagem de programação mais adequada para desenvolver aplicações para o Spark.

Python

Scala

Java Script

R

Java

6a Questão (Ref.: 202010358419)
Compreender os conceitos e princípios do framework Apache Spark é fundamental para o cientista de dados. Selecione a opção correta que contém o componente do ecossistema Spark responsável por dar suporte para tratar fluxo de dados típicos de aplicações de tempo real.

Spark Streaming

Spark Core

RDDs

Spark SQL

Spark Hadoop

7a Questão (Ref.: 202010359046)
No contexto de Coleta de Dados, o que podemos afirmar sobre Dados Primários:
I - São dados obtidos em primeira mão pelo cientista de dados ou pelo analista de dados
II - São dados que precisam ser pré-processados para análise, e serão feitos exclusivamente no primeiro momento pelo dono dos dados, o analista em questão
III - São obtidos através de softwares de monitoramento de logs, surveys, e bancos de dados
Analise as frases listadas e assinale a alternativa correta.

Apenas a opção I.

As opções I, II, e III estão corretas.

Apenas as opções I e III.

Apenas as opções II e III.

Apenas a opção II.

8a Questão (Ref.: 202010359180)
A biblioteca pandas é poderosa e de grande valia para a vida de um cientista de dados. Sobre ela podemos afirmar que:
I - O nome Pandas se refere a dados em painel ou panel data
II - O DataFrame é o coletivo de listas (lists)
III - É possível criarmos DataFrames a partir de praticamente qualquer estrutura de dados, principalmente CSVs, Excels, e JSONsAnalise as frases listadas e assinale a alternativa correta.

Apenas I.

Apenas I e II.

Apenas II.

Apenas I e III.

Apenas II e III.

9a Questão (Ref.: 202010358248)
Luís foi contratado recentemente para trabalhar em uma empresa de consultoria de análise de dados. O projeto no qual foi alocado já havia começado, e os colegas de Luís lhe disseram que estavam preparando o conjunto de dados para poder passar os mesmos por um modelo de árvore de decisão. Já que especificamente os colegas de Luís estão removendo dados faltantes, em qual etapa do processo de KDD, Luís se encontra:

Avaliação.

Coleta de Dados.

Descoberta de Padrões.

Pré-Processamento .

Transformação de Dados.

10a Questão (Ref.: 202010358244)
Os modelos simbólicos são aqueles que:

São aqueles que só lidam com problemas categóricos

Se baseiam em lógica e regras de inferência para aprender e raciocinar

São aqueles que lidam apenas com problemas numéricos

Se baseiam estritamente em dados e inferências estatísticas em cima deles

Se baseiam em táticas de agrupamento por similaridade