Logo Passei Direto
Buscar

Modelagem de Dados

Colégio Objetivo
As bibliotecas são coleções de subprogramas utilizados no desenvolvimento de softwares. Selecione a opção correta que contém o componente do ecossistema do Spark responsável por realizar operações paralelas em grafos.


a) MLlib
b) RDDs
c) Spark Streaming
d) Spark Core
e) GraphX
User badge image
Estudando com Questões

há 2 anos

Respostas

User badge image

Ed Verified user icon

há 2 anos

A opção correta é a letra "e) GraphX". O GraphX é o componente do ecossistema do Spark responsável por realizar operações paralelas em grafos. As outras opções são: a) MLlib é uma biblioteca de aprendizado de máquina, b) RDDs é uma abstração de dados distribuídos, c) Spark Streaming é um componente para processamento de fluxos de dados em tempo real e d) Spark Core é o componente principal do Spark que fornece a funcionalidade básica para o processamento distribuído de dados.

Essa resposta te ajudou?

0
Dislike0
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar essa resposta. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

User badge image

Marcos Martins Arruda

ano passado

a respota correta seria: GraphX

Essa resposta te ajudou?

0
Dislike0

Ainda com dúvidas?

Envie uma pergunta e tenha sua dúvida de estudo respondida!

Essa pergunta também está no material:

Mais perguntas desse material

Em relação às redes de Internet das coisas, selecione a opção correta que relaciona os dispositivos entre si.

São redes locais
É uma conexão rede a rede
São um relacionamento máquina a máquina
São interconectados entre si
São um conjunto de sinais
a) 1 e 2 estão corretas.
b) 2 e 3 estão corretas.
c) 3 e 4 estão corretas.
d) 4 e 5 estão corretas.
e) 1 e 5 estão corretas.

A respeito das aplicações de fluxos de dados, selecione a opção correta.


a) Serviços de compras online
b) Reapresentação de programas de televisão.
c) Serviços sob demanda, como serviços de filme online.
d) Serviço de correio eletrônico
e) Transações bancárias, como o serviço de PIX.

A biblioteca pandas é poderosa e de grande valia para a vida de um cientista de dados. Sobre ela podemos afirmar que:

O nome Pandas se refere a dados em painel ou panel data
O DataFrame é o coletivo de listas (lists)
É possível criarmos DataFrames a partir de praticamente qualquer estrutura de dados, principalmente CSVs, Excels, e JSONs
a) Apenas I e III.
b) Apenas II e III.
c) Apenas II.
d) Apenas I.
e) Apenas I e II.

Os dados que, por alguma razão, normalmente interferência humana, não chegam com todos os atributos esperados durante a coleta de dados, são conhecidos como:


a) Nulos.
b) Faltantes.
c) Embaralhados.
d) Enviesados.
e) Corrompidos.

Qual o processo irmão do KDD que é utilizado comum

Mais conteúdos dessa disciplina