Buscar

Projeto em ciência de dados com soluções para processamento paralelo e distribuído de dados

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

28/12/2022 21:25 Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2686603/4996104 1/5
Projeto em ciência de dados com soluções para processamento
paralelo e distribuído de dados
Professor(a): Yuri Vasconcelos de Almeida Sá (Especialização)
1)
2)
Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A
Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final.
Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas.
Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir
o prazo estabelecido. Boa prova!
A respeito do processo da descoberta do conhecimento por meio dos dados, avalie as
asserções a seguir e a relação existente entre elas.
I. Para Loh (2014, n.p.) “o processo da descoberta do conhecimento é iterativo e interativo”.
PORQUE
II. O autor explica que ser iterativo (ou cíclico) indica que, em muitas situações, o processo
pode precisar ser executado diversas vezes, com amostras diferentes ou, até mesmo, com
técnicas distintas. O uso do termo interativo, ainda segundo o autor, justifica-se devido à
necessidade de intervenção humana ao longo de todo o processo.
Referência: LOH, S. BI na era do big data para cientistas de dados: indo além de cubos e
dashboards na busca pelos porquês, explicações e padrões. Porto Alegre. Edição do Kindle.
2014. Não paginado.
Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas.
Alternativas:
As asserções I e II estão corretas e a asserção II justifica a I.  CORRETO
A asserção I está correta, e a asserção II está incorreta.
As asserções I e II estão incorretas.
A asserção I está incorreta, e a asserção II está correta.
As asserções I e II estão corretas, mas a asserção II não justifica a I.
Código da questão: 50734
Sobre processamentos paralelo e distribuído de dados, avalie as afirmativas a seguir.
I. A heterogeneidade é uma característica de sistemas distribuídos em cluster.
II. O nó de um sistema distribuído em cluster pode ser um computador ou um conjunto
deles.
III. A arquitetura de computadores em cluster surgiu nos anos 1980.
IV. Sistemas de computação em grid podem agregar vários clusters.
V. O CineGrid Brasil é uma comunidade interdisciplinar que se comunica por meio de
comunicação em grid.
São verdadeiras:
Alternativas:
I, IV e V, apenas.
II, IV e V, apenas.  CORRETO
I, II e III, apenas.
II e III, apenas.
IV e V, apenas.
Resolução comentada:
Para Loh (2014, n.p.) “o processo da descoberta do conhecimento é iterativo e
interativo”. O autor explica que ser iterativo (ou cíclico) indica que, em muitas
situações, o processo pode precisar ser executado diversas vezes, com amostras
diferentes ou, até mesmo, com técnicas distintas. O uso do termo interativo, ainda
segundo o autor, justifica-se devido à necessidade de intervenção humana ao longo
de todo o processo.
Resolução comentada:
28/12/2022 21:25 Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2686603/4996104 2/5
3)
4)
5)
Código da questão: 50702
Business Intelligence é um conceito associado à definição de data warehouse. O
propósito daquele é permitir um tipo de tomada de decisão. Que tipo é este?
Assinale a alternativa CORRETA.
Alternativas:
Investigativa.
Responsiva.
Descritiva.
Qualitativa.
Proativa.  CORRETO
Código da questão: 50715
A respeito de um data warehouse, avalie as asserções a seguir e a relação existente entre
elas.
I. A necessidade de uma flexibilidade mínima para um data warehouse se faz necessária.
PORQUE
II. Um data warehouse inflexível implica em restrição aos usuários a realizarem apenas
consultas e análises com motivações vigentes, sem sequer permitir que novos insights
sejam implementados (VERZOLA, 201-?).
Referência: VERZOLA, I. Data warehouse. [201-?]. Barueri: Pontes Computadores e Serviços
Ltda. Disponível em: http://www.pontes.inf.br/docs/datawarehouse.pdf. Acesso em: 7 nov.
2019.
Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas:
Alternativas:
As duas asserções estão incorretas.
A primeira asserção está correta, e a segunda asserção está incorreta.
A primeira e a segunda asserção estão corretas e a segunda justifica a primeira. 
CORRETO
A primeira e a segunda asserção estão corretas, mas a segunda não é justificativa da
primeira.
A primeira asserção está incorreta, e a segunda asserção está correta.)
Código da questão: 50719
Um dashboard possui informações de métricas e indicadores de interesse de um
determinado público. Por isso, as diferentes classificações criadas pelos estudiosos do
assunto se baseiam, basicamente, no destinatário das informações. Se o destinatário for um
A heterogeneidade é uma característica de sistemas distribuídos em grids. O nó de
um sistema distribuído em cluster pode ser um computador ou um conjunto deles. A
arquitetura de computadores em cluster surgiu nos anos 90. Sistemas de
computação em grid podem agregar vários clusters. O CineGrid Brasil é uma
comunidade interdisciplinar que se comunica por meio de comunicação em grid.
Resolução comentada:
O propósito do Business Intelligence é permitir a tomada de decisões proativas.
Resolução comentada:
A necessidade de uma flexibilidade mínima para um data warehouse se faz
necessária porque um data warehouse inflexível implica em restrição aos usuários a
realizarem apenas consultas e análises com motivações vigentes, sem sequer
permitir que novos insights sejam implementados (VERZOLA, 201-?).
28/12/2022 21:25 Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2686603/4996104 3/5
6)
7)
grupo de gestores e/ou executivos da uma corporação, qual a classificação apropriada para
o dashboard em questão?
Assinale a alternativa CORRETA.
Alternativas:
Métrico.
Executivo.
Tático.  CORRETO
Estratégico.
Descritivo.
Código da questão: 50730
Sobre os métodos de depuração e análise de desempenho de programas paralelos,
avalie as afirmativas a seguir.
I. A busca por grande capacidade de processamento numérico pode ser considerada como
a principal motivação para a criação de sistemas paralelos.
II. A análise de desempenho de sistemas paralelos é útil para identificar os pontos fortes do
sistema.
III. A análise de desempenho é usualmente iniciada logo após a instalação do sistema
paralelo.
IV. A análise de desempenho se manifesta de forma cíclica, pois o desenvolvedor precisa
realizar execuções experimentais do programa.
V. A amostragem é uma técnica de coleta e registros da abordagem offline de uma análise
de desempenho.
Assinale a alternativa com contém as afirmativas CORRETAS:
Alternativas:
III - IV.
II - III.
I - IV - V.  CORRETO
IV - V.
I - II - III.
Código da questão: 50707
O conceito de big data vai além de grande volume de dados. Por exemplo, Taurion
(2013) complementa que o conceito tem relação com uma variável que avalia a
importância/significância dos dados. A qual variável o autor se refere?
Assinale a alternativa CORRETA.
Referência: TAURION, C. Big Data. Rio de Janeiro: Brasport, 2013. EPUB. Não paginado.
Disponível em: https://bv4.digitalpages.com.br/#/legacy/epub/160676. Acesso em: 9 jul.
2019.
Resolução comentada:
Dashboards táticos são painéis compostos por informações que conseguem permitir
que os gestores direcionem recursos para que os objetivos previamente
estabelecidos possam ser alcançados em médio prazo. Seu público-alvo principal
são as gerências departamentais dos negócios de uma empresa.
Resolução comentada:
Estão corretas as afirmativas I, IV e V.
II. Segundo Schnorr (2014, p. 1), “o objetivo da análise de desempenho de aplicações
paralelas é a identificação de regiões do programa que tem uma baixa exploração
dos recursos computacionais”.
III. É usual partir para a análise de desempenho de programas paralelos após a sua
implementação, livre de qualquer possível erro, momento em que o desenvolvedor
ou administrador do banco de dados está aptopara realizar esta etapa do trabalho.
28/12/2022 21:25 Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2686603/4996104 4/5
8)
9)
Alternativas:
Velocidade de produção de dados.
Veracidade dos dados.  CORRETO
Armazenamento dos dados.
Cópia dos dados.
Custo dos dados.
Código da questão: 50720
A respeito dos conceitos associados a um data warehouse, avalie as afirmativas a seguir.
I. Nem todo dado precisa de armazenamento em um data warehouse.
II. Um data warehouse é apropriado para um processamento de consulta.
III. Um data warehouse é considerado como um conjunto de dados não volátil.
IV. Um data warehouse pode ser composto por um conjunto de programas
computacionais.
V. Um data warehouse pode realizar processamentos de transações.
São verdadeiras:
Alternativas:
I - II - III - IV.  CORRETO
II - III - V.
I II - IV.
II - III - IV - V.
II - III.
Código da questão: 50717
O termo big data vai além do significado de grande massa de dados. A esse respeito,
avalie as afirmativas a seguir.
I. O armazenamento digital de dados no final da segunda década dos anos 2000 é de,
praticamente, 90%.
II. No contexto big data, agregar valor representa o retorno esperado do investimento.
III. No contexto de big data, o termo analytics significa o processo de extração de dados.
IV. O conceito de big data analytics é uma combinação de sistemas capazes de tratar dados
estruturados e não estruturados.
V. Há um conjunto de letras V’s que representam o conceito de big data.
São verdadeiras:
Alternativas:
II - III - IV.
I - II.
II - IV - V.  CORRETO
I - II - IV.
I - III - V.
Resolução comentada:
A veracidade dos dados é uma variável importante para o conceito de big data. Ela
avalia a significância dos dados.
Resolução comentada:
Nem todo dado precisa de armazenamento em um data warehouse. Um data
warehouse é apropriado para um processamento de consulta, e não de transações.
Um data warehouse é considerado como um conjunto de dados não volátil. Um data
warehouse pode ser composto por um conjunto de programas computacionais.
Resolução comentada:
28/12/2022 21:25 Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2686603/4996104 5/5
10)
Código da questão: 50722
Apesar da tradução ser “armazém de dados”, o conceito de data warehouse vai além
disso. Machado (2004, p. 22 apud Gura e Benck, 2011, p. 21) faz afirmações a esse respeito,
as quais encontram-se a seguir. Avalie a afirmativa para completar suas lacunas
corretamente.
Data warehouse representa uma grande base de dados capaz de ____________, de forma
concisa e confiável, as informações de interesse que se encontram espalhadas pelos
____________ operacionais e em fontes ____________, para posterior utilização nos sistemas de
apoio à decisão.
Referência: GURA, E. F.; BENCK, L. L. N. Construção de um data warehouse, aliado a uma
ferramenta open source ireport na geração de informações para tomada de decisão. 2011.
89 f. Trabalho de conclusão de curso (Curso de Tecnologia em análise e desenvolvimento
de sistemas) – Coordenação de Informática, Universidade Tecnológica Federal do Paraná,
Ponta Grosa, 2011. Disponível em:
http://repositorio.roca.utfpr.edu.br/jspui/bitstream/1/6449/1/PG_COADS_2011_2_05.pdf.
Acesso em: 7 nov. 2019.
Assinale a alternativa que completa adequadamente as lacunas acima.
Alternativas:
Separar; sistemas; diversas.
Integrar; computadores; externas.
Separar; computadores; diversas.
Separar; computadores; externas.
Integrar; sistemas; externas.  CORRETO
Código da questão: 50716
O armazenamento digital de dados no final da segunda década dos anos 2000 é de,
praticamente, 100%. No contexto big data, agregar valor representa o retorno
esperado do investimento. No contexto de big data, o termo analytics significa além
do processo de extração de dados, pois também cria informações. O conceito de big
data analytics é uma combinação de sistemas capazes de tratar dados estruturados e
não estruturados. Há um conjunto de letras V’s que representam o conceito de big
data, volume, variedade, velocidade, veracidade e valor agregado.
Resolução comentada:
Data warehouse representa uma grande base de dados capaz de integrar, de forma
concisa e confiável, as informações de interesse que se encontram espalhadas pelos
sistemas operacionais e em fontes externas, para posterior utilização nos sistemas de
apoio à decisão.
Arquivos e Links

Outros materiais