PUC_MINAS_Atividade Objetiva 04_ 07 Soluções para Processamento Paralelo e Distribuído de Dados (2019)

•

PUC-MINAS

0

KaLe Technology

03/12/2021

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 4 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Big Data

5.826 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

03/12/2021 15:37 Atividade Objetiva 04: 07. Soluções para Processamento Paralelo e Distribuído de Dados (2019)
https://pucminas.instructure.com/courses/1761/quizzes/23898 1/4
Atividade Objetiva 04
Entrega Sem prazo Pontos 10 Perguntas 5 Limite de tempo Nenhum
Tentativas permitidas Sem limite
Histórico de tentativas
Tentativa Tempo Pontuação
MANTIDO Tentativa 3 2 minutos 10 de 10
MAIS RECENTE Tentativa 3 2 minutos 10 de 10
Tentativa 2 2 minutos 8 de 10
Tentativa 1 2 minutos 2 de 10
 As respostas corretas estão ocultas.
Pontuação desta tentativa: 10 de 10
Enviado 3 dez em 15:37
Esta tentativa levou 2 minutos.
Fazer o teste novamente
2 / 2 ptsPergunta 1
São características do Dataframe.
Selecione qual afirmação está incorreta:
 Utiliza o mesmo mecanismo de execução do Spark SQL; 
 Apresenta métodos para obtenção de estatísticas descritivas básicas; 
 Permite que RDD´s padrões sejam transformados para DataFrame; 
 O Dataframe pode possuir desempenho inferior ao Spark SQL; 
https://pucminas.instructure.com/courses/1761/quizzes/23898/history?version=3
https://pucminas.instructure.com/courses/1761/quizzes/23898/history?version=3
https://pucminas.instructure.com/courses/1761/quizzes/23898/history?version=2
https://pucminas.instructure.com/courses/1761/quizzes/23898/history?version=1
https://pucminas.instructure.com/courses/1761/quizzes/23898/take?user_id=46471
03/12/2021 15:37 Atividade Objetiva 04: 07. Soluções para Processamento Paralelo e Distribuído de Dados (2019)
https://pucminas.instructure.com/courses/1761/quizzes/23898 2/4
Letra: d
Justificativa: De acordo as Notas de aula:
Veja que o DataFrame executa no mesmo mecanismo que o SQL
executa
2 / 2 ptsPergunta 2
Considerando transformações no Spark
Selecione a afirmação que está incorreta:
 Toda transformação gera como resultado um RDD; 
 São exemplos de transformações: Map,Distinct,paralellize ; 
 São executadas pelo programa driver; 
 É comum passar funções para as transformações do Spark 
Letra: c
Justificativa: De acordo com Notas de aula:
O programa driver não executar as transformações, ele é responsável
pela gestão das mesmas
2 / 2 ptsPergunta 3
Considerando ações no Spark
Selecione a afirmação que está incorreta:
 Possui componente para importação de dados; 
03/12/2021 15:37 Atividade Objetiva 04: 07. Soluções para Processamento Paralelo e Distribuído de Dados (2019)
https://pucminas.instructure.com/courses/1761/quizzes/23898 3/4
 São retornadas para o programa driver; 
 São exemplos de ações: count, first, reduce, take; 
 Podem ser chamadas em Java, Scala e Python, por exemplo; 
Letra: a
A importação de dados fica por conta das transformações, visto que
elas devem gerar RDD´s.
2 / 2 ptsPergunta 4
São características do Spark SQL.
Selecione qual afirmação está incorreta:
 Utiliza SQL padrão (ANSI, por exemplo); 
 
A estruturas das tabelas no Spark SQL não são divididas em linhas e colunas; 
 Os dados carregados em tabelas ainda são RDD´s; 
 Pode ser acessado via JDBC ou ODBC; 
Letra b:
São similares a tabelas em bancos de dados relacionais;
Os resultados das operações de carga dos dados ou SQL retornam
Schema RDD´s;
Internamente os SchemaRDD´s são um conjunto de objetos do tipo
Row;
Cada objeto do tipo Row é uma especie de vetor com campos
definidos pelo Schema;
03/12/2021 15:37 Atividade Objetiva 04: 07. Soluções para Processamento Paralelo e Distribuído de Dados (2019)
https://pucminas.instructure.com/courses/1761/quizzes/23898 4/4
2 / 2 ptsPergunta 5
São características do caching do Spark SQL.
Selecione qual afirmação está incorreta:
 
As tabelas não podem ser armazenadas na memória por comandos SQL/HQL; 
 
É possível deixar os dados na memória durante toda a execução das aplicação
Spark;
 
Caso haja reutilização da mesma estrutura, manter os dados em cache é muito
vantajoso;
 
Para as tabelas que possuem definições de schema, o processo de carregar os
dados para a memória é mais otimizado;
Letra: a
Justificativa: De acordo com o Guia de aula:
De forma geral:
● - As tabelas também pode ser armazenadas na memória por
comandos HIVE QL
Pontuação do teste: 10 de 10